AMD הורסת את Nvidia בכריית ביטקוין, האם אי פעם ניתן לגשר על הפער?

לוגו של Nvidia

אם אתה בדרך כלל עוקב אחר ביצועי GPU כפי שהוא קשור למשחקים אך הפכת סקרן לגבי כריית ביטקוין, כנראה שמת לב והופתעת מהעובדה כי GPUs של AMD הם מובילי הביצועים הבלתי מעורערים בשוק. זה בניגוד מוחלט לעסקי הגרפיקה למחשבים אישיים, שם סדרת HD 7000 של AMD שיחקה משחק הגנתי מול משפחת המוצרים GK104 / GeForce 600 של Nvidia. בכריית ביטקוין המצב הפוך כמעט לחלוטין - ה- Radeon 7970 מסוגל ל -550 MHash / שנייה, בעוד ה- GTX 680 מהיר בערך 1/5.

יש מאמר ב- Bitcoin Wiki כי ניסיונות להסביר ההבדל, אך היצירה המקורית נכתבה בשנים 2010-2011 ומאז לא עודכנה. הכוונה היא לארכיטקטורות ה- VLIW של פרמי ו- AMD ומרמזת כי הביצועים הטובים יותר של AMD נובעים מכך שיש הרבה יותר ליבות צלליות מכרטיסי Nvidia המקבילים. זה לא ממש מדויק, וזה לא מסביר מדוע ה- GTX 680 למעשה איטי יותר מ- GTX 580 בכריית BTC, למרות שיש הרבה יותר ליבות. מאמר זה עתיד להסביר את ההבדל, להתייחס האם כורי CUDA טובים יותר או ישנו באופן דרמטי את דלתא הביצועים בין AMD ל- Nvidia, וייגעו אם ביצועי GPGPU של Nvidia בדרך כלל דומים לביצועים של AMD בימינו.



נושאים לֹא הנדון כאן כולל:



  • בועות
  • הזדמנות השקעה
  • בין אם הם ASIC או לא, כאשר הם מגיעים חודש הבא, הקיץ הזה, בעתיד יהרוס את שוק הכרייה של GPU.

אלו שאלות חשובות, אך הן אינן מוקד המאמר. אָנוּ רָצוֹן לדון ביעילות הספק ו Mhash / וואט במידה מסוימת, מכיוון שלגורמים אלה יש השפעה על השוואת ביצועי הכרייה של AMD לעומת Nvidia.

המכניקה של הכרייה

כריית ביטקוין היא יישום ספציפי של אלגוריתם SHA2-256. אחת הסיבות לכך שכרטיסי AMD מצטיינים בכרייה היא מכיוון של- GPU של החברה יש מספר תכונות המשפרות את ביצועי המספרים השלמים שלהם. זה בעצם משהו מוזר; עומסי עבודה של GPU היו מבחינה היסטורית כבדים של נקודה צפה מכיוון שמרקמים מאוחסנים בדיוק (FP16) או דיוק מלא (FP32).



הנושא נעשה מבלבל יותר מכיוון שכאשר Nvidia החלה לדחוף את CUDA, היא הדגישה את פיצוח הסיסמאות ככוח עיקרי בכרטיסיו. נכון ש- GPUs של GeForce, החל מ- G80, הציעו ביצועים קריפטוגרפיים גבוהים משמעותית בהשוואה למעבדים - אך החומרה של AMD מפוצצת כעת את זה של Nvidia. מחוץ למים.

הסיבה הראשונה לכך שכרטיסי AMD עולים על עמיתיהם ל- Nvidia בכריית BTC (והערך הנוכחי של Bitcoin עושה זאת לכסות את זה) בגלל האלגוריתם SHA-256 משתמש בפעולת סיבוב ימני שלם של 32 סיביות. פירוש הדבר שערך המספר השלם מוסט (הסבר כאן), אך החלקים החסרים נקשרים שוב לערך. בסיבוב ימינה, ביטים הנופלים מימין מחוברים שוב משמאל. GPUs של AMD יכולים לבצע פעולה זו בצעד אחד. לפני ההשקה של ה- GTX Titan, Nvidia GPUs נדרשו לשלושה שלבים - שתי משמרות ותוספת.

אנו אומרים 'לפני טיטאן', מכיוון שאחת התכונות ש- Nvidia הציגה עם יכולת מחשוב 3.5 (נתמכת רק ב- GTX Titan וב- Tesla K20 / K20X) היא מחליף משפך. מחליף המשפך יכול לשלב פעולות, ומכווץ את העונש בן 3 המחזורים Nvidia באופן משמעותי. נבדוק כמה ביצועים משתפרים לרגע, מכיוון שזה לא השיפור היחיד של GK110 לעומת GK104. GK110 מסוגל גם עד 64 משמרות שלמות של 32 סיביות לכל SMX (לטיטאן יש 14 SMX). לעומת זאת, GK104 יכול היה להתמודד עם 32 משמרות שלמות בלבד לכל SMX והיה לו רק שמונה חסימות SMX.



יכולת הדרכה של קפלר

הדגשנו את הבדל יכולת ההחלפה של מספר 32 סיביות בין CC 3.0 ל- CC 3.5.

AMD משחקת דברים קרוב לחזה כשמדובר ביכולות השלמות של 32 סיביות של Graphics Core Next (GCN), אך החברה אישרה כי GCN מבצעת קוד INT32 באותו קצב כמו נקודה צפה של דיוק כפול. זה מרמז על קצב שיגור שיא int32 תיאורטי של 64 לשעון לכל CU - קצב בסיס כפול של GK104. היתרון הנוסף של AMD, לעומת זאת, הוא המספר העצום של יחידות מחשוב (CU) המרכיבות GPU אחד. לטיטאן, כפי שאמרנו, יש 14 SMX, לעומת 32 CU של HD 7970. יחידות מחשוב / SMX יכולות להיות חשובות בהרבה ממספר הליבות הכולל בהקשרים אלה.

Copyright © כל הזכויות שמורות | 2007es.com