Titan V vs 1080 Ti - معركة مباشرة لأفضل وحدات معالجة الرسومات على سطح المكتب على شبكات CNN. هل Titan V يستحق كل هذا العناء؟ 110 TFLOPS! لا التفكير ، أليس كذلك؟

يعد Titan V من NVIDIA هو أحدث GPU "لسطح المكتب" مبني على بنية Volta التي تضم 110 TFLOPS "التعلم العميق" في ورقة المواصفات. هذا رقم لا يصدق. قارن ذلك مع 1080 Ti ، وهو الملك الحالي لجرافيك GPU "المكتبي" ، الذي يضع 11 TFLOPS "طبيعية" مع ذاكرة GDDR5 بسعة 11 جيجابايت بسعر معقول للغاية يبلغ 699 دولارًا.

على الرغم من أن وعد Titan V يبدو مثيرًا للغاية ، إلا أن السعر الذي يبلغ 2999 دولارًا يصعب ابتلاعه. ولكن مع 10x TFLOPS ، هل يجب عليك شراء Titan V بدلاً من ذلك؟ هل هذا مثل الحصول على 10 1080 تي؟ أم أنك أفضل حالًا في شراء 4 1080 Ti لنفس المال؟

في ملاحظة جانبية ، يتم بيع محطة DGX حاليًا مقابل 49900 دولار (عادةً ما يكون سعرها 69900 دولارًا). يأتي مزودًا بـ 4 Tesla V100 من فئة خوادم مائية ، وهي أفضل قليلاً من تيتان V (سطح المكتب) (على الرغم من أن البرج يبدو BOSS وأنا أظن أنه يأتي مع دعم و SLA). لكن معظمنا (راجع ، أراهن أن الكثير من مختبرات الأبحاث الجامعية والجامعة الأمريكية) لا تملك هذا النوع من المال للتخلص منه. حتى لو فعلت ذلك ، لست متأكداً إذا كان من المنطقي الكثير من الناحية الاقتصادية. راجع للشغل ، إذا كنت تقوم بتشغيل مركز بيانات ، فقد قامت NVIDIA مؤخرًا بتحديث EULA الخاص بها لمنع استخدام وحدات معالجة الرسومات GeForce و Titan GPU من فئة "سطح المكتب" في مراكز البيانات.

لذا فإن السؤال هو ، هل يستحق Titan V إذا كنت تبحث عن بناء وحدة معالجة الرسومات الخاصة بك؟

اسمحوا لي أن أبدأ بالقول إن Titan V وأخوه الكبير في الخادم - Tesla V100 - جديدان جدًا. تم إصدار V100 في مايو 2017 ، وخرجت Titan V للتو هذا الشهر (ديسمبر 2017). لقد سارعت معظم أطر التعلم العميق لإضافة دعم Volta للتأكد من إمكانية استغلال جميع الأداء المحتمل.

على سبيل المثال ، لم تصدر PyTorch مؤخرًا سوى الإصدار 0.3.0 الذي يضيف دعمًا إلى CUDA 9 و Volta GPUs. لقد كنت ألعب مع هذا الإعداد وكان مجتمع PyTorch رائعًا (خاصةً Soumith Chintala - شكرًا يا صديق!) على مساعدتي. الآن وبعد أن أصبح بإمكاني تشغيل PyTorch على Titan V ، كتبت بعض الرموز المرجعية لإظهار الاختلافات في الأداء. حتى الآن ، تتضمن النتائج نتائج PyTorch 0.3.0 فقط ، لكني أخطط لإضافة نتائج لأطر أخرى أيضًا (EDIT: تحتوي النتائج المرجعية الآن على أرقام من TensorFlow 1.4.0 و Caffe2 0.8.1 أيضًا - راجع الرابط لمزيد من التفاصيل) ، كل ذلك على CUDA 9.0.176 و CuDNN 7.0.0.5 ، حتى خارج الملعب.

مقارنة أداء Titan V vs 1080 Ti

لذلك دعونا تحقق من النتائج أعلاه.
تمت مقارنة Titan V و 1080 Ti وجهاً لوجه مقابل نفس الإعدادات (بالإضافة إلى ذلك ، توجد هذه البطاقات على فتحات PCIE 16x على نفس الكمبيوتر.)

أرقام التوقيت الموضحة أعلاه هي للمرور الأمامي عبر CNN ("eval") وتمرير للأمام والخلف ("القطار") ، ويقاس بالميلي ثانية. هذه هي متوسط ​​الأعداد المحسوبة على 20 تمريرة بعد بعض الاحماء. لقد قمت بتشغيل هذا عدة مرات ، وهذه الأرقام مستقرة إلى حد ما.

نقاط مثيرة للاهتمام لملاحظة:

  • من الواضح أن Titan V أسرع من 1080 Ti. ومع ذلك ، إذا قارنت ببساطة بين الدقة "أحادية" ذات 32 بت ، فإن Titan V يكون أسرع بنسبة 20٪ فقط من 1080 Ti.
  • يتم تشغيل تيتان V (16 "دقة (نصف") بشكل أسرع من نظيره في نظيره 32 بت. استفاد 1080 Ti من الانتقال نصف الدقة ، ولكن مكاسب الأداء كانت متواضعة جدًا مقارنة بـ Titan V.

هذه الأرقام لا تصرخ حقًا "يا صديقي TITAN V ليس عاقلًا".

هل كذب NVIDIA حول 10x TFLOPS؟ أنا متأكد من أن الناس في التسويق هم أشخاص صادقون جيدون ، ولكن هناك عوامل متعددة تلعبها هنا. أولاً ، أنا متأكد من أنه لا يزال هناك مجال للتحسين من جانب البرنامج لاستخراج كل جزء من قلب Tensor فائق السرعة من Volta. ولكن رغم ذلك ، إذا لم تتوافق معظم مسارات الشفرة مع الشروط التي تسمح بأداء نظري قصوى (انظر A FUL RULES في "برمجة Tensor Cores في CUDA 9 بواسطة NVIDIA) ، فهناك الكثير مما يمكنك القيام به. سيحدد الوقت مقدار التحسينات التي سنراها على مستوى الإطار / CUDA / CuDNN لاستغلال إمكانات وحدة معالجة الرسومات Volta قدر الإمكان ، لكن الأرقام الأولية التي لاحظتها على CNN الشهيرة (أعمل في الغالب من وجهة نظري الخاصة برؤية الكمبيوتر) على CNN) لا يبدو أن هناك ما يبرر الحصول على Titan V ، خاصة إذا كنت ترغب في الحصول على واحدة الآن أثناء تشغيل البرنامج.

على الرغم من أنه من الممتع اللعب بأحدث التقنيات وأن تكون من أوائل المتبنيين ، إذا كنت تركز على إجراء أبحاث AI أو بناء منتجات على جهاز GPU الشخصي الخاص بك اقتصاديًا ، إلا أنني أقترح شراء 1080 Ti حتى كتابة هذه السطور (حتى تخرج NVIDIA مع وجود بديل أفضل في المستقبل القريب ؛ فهم يميلون إلى مفاجأتنا بإصدارات جديدة.) ضع في اعتبارك أيضًا أن Titan V واحد هو فقط 12 جيجابايت من الذاكرة بينما 1080 Ti به ذاكرة أصغر قليلاً عند 11GB. ولكن إذا اشتريت 4 منها مقابل نفس المال (على الأقل على وحدات معالجة الرسومات ... فأنت بحاجة أيضًا إلى مصدر طاقة أفضل ، ولوحات رئيسية يمكنها دعم 4 وحدات معالجة رسومات ، ومزيد من ذاكرة الوصول العشوائي ، وتبريد أفضل) ، ستنتهي في النهاية بمزيد من وحدات معالجة الرسومات الذاكرة (44 جيجابايت مقابل 12 جيجابايت.) بعد أن قلت أنني أعتقد أن هناك شيءًا عمليًا أكثر ، إذا كنت ترغب في الحصول على أكثر من وحدة معالجة الرسومات ، فهو الحصول على 2 × 1080 تي. وبهذه الطريقة ، لا يتعين تكديس وحدات معالجة الرسومات (GPU) مباشرة فوق أخرى (مزيد من تدفق الهواء للتبريد - عندما تخنق هذه البطاقات الخانق الحراري ، قد تفقد الأداء بشكل كبير ... يمكنك القيام بتبريد الماء ولكن هذا يضيف إلى التكلفة والجهد والفعالية بعض المخاطرة.) أيضًا مع بطاقتين فقط ، يكون سحب الطاقة 250 واط × 2 من وحدات معالجة الرسومات حتى تتمكن من الحصول على مصدر طاقة أرخص. على أي حال ، أجد أنه من المفيد للغاية الحصول على وحدات معالجة رسومات متعددة وتقسيم التجارب عليها حتى أتمكن من تكرارها بسرعة ، لذلك هذا هو ما أوصي به كحل وسط جيد.
هناك خيار آخر لمعالجة مشكلة الحرارة المتمثلة في وحدات معالجة الرسومات المكدسة والمبردة بالهواء ، إذا كان يجب أن يكون لديك من 3 إلى 4 منهم ، لا تريد أن تبرد ، ولا تهتم بالجمالية أو الضوضاء ، هو الحصول على بعض موسعات PCIE / الناهضون والقيام بما فعله هذا Kaggler الفائز:

جهاز 4 × 1080 Ti لفلاديمير إيجلوفكوف ، أحد أعضاء الفريق الفائز في تحدي قناع الصور في كارفانا

أتمنى أن تجد هذا المنشور مفيدا. واسمحوا لي أن أعرف ما إذا كانت هناك أي نتائج معينة ترغب في رؤيتها على Titan V أو 1080 Ti. شكرا لقرائتك!