أفضل الأشياء في الحياة لا تحتوي على مقياس

ستفشل أكبر عدد من الكلمات الطنانة في التكنولوجيا لأنها لا تتسع فقط.

نظرًا لأننا نبتكر بسرعة باستخدام تقنية جديدة ، علينا أن نضع في اعتبارنا ما إذا كانت ابتكاراتنا عملية وممكنة. في عالم نحسب فيه المستخدمين بالآلاف ووقت التشغيل بالميللي ثانية ، من المهم أكثر من أي وقت مضى ضمان موازين تقنية جديدة.

هذا هو السبب في أنه من المفزع أن تفشل الكلمات الثلاث الأكبر في التكنولوجيا تمامًا في التوسع.

بالطبع ، أنا أتحدث عن الفئات الثلاث التي يبدو أن كل جزء من أخبار التكنولوجيا تندرج في هذه الأيام:

  1. الذكاء الاصطناعي
  2. Blockchain
  3. واقع مختلط (XR ، AR / VR)

يبدو أن كل شيء تقريبًا يستخدم هذه الميزات أو يضيفها ، إلا أنه من الجنون كم هو مؤلم (ومستحيل تمامًا) توسيع نطاق هذه الخدمات.

نحن بحاجة إلى المزيد من الأجهزة

القصور الأول والأهم يبقى الأجهزة. ليس سراً أن متطلبات الأجهزة للتكنولوجيا تزداد باطراد عاماً بعد عام ، من حيث السعر والمواصفات. لقد أصبح هذا بشكل فعال عاملاً مانعًا في التبني على نطاق واسع ، وفي حالة blockchain ، إنه قاتل.

تعتمد Blockchain عادةً على "عمال المناجم" الذين يقومون بحظر "الألغام" ويسمحون للشبكة بتنفيذ أبسط المهام (أي التحقق من المعاملات). إن عملية "التعدين" هي شيء لن أخوض فيه بعمق ، ولكنها تنطوي على تنفيذ وظائف تشفير كبيرة ، وهي عملية تُعرف باسم "التجزئة".

مشكلة التجزئة هي أنها تتطلب قدرا كبيرا من القدرة الحاسوبية ؛ في الواقع ، تتطلب هذه الكمية الكبيرة التي تستخرج بفعالية على blockchain أجهزة خاصة ، إما GPU أو ASIC. لكي تكون أصغر عامل منجم ، ستحتاج إلى وحدة معالجة رسومات عالية المواصفات (دعنا نكون حقيقيين ، Intel HD Graphics هي معيار المستهلك في الوقت الحالي ، لذلك كل وحدة معالجة الرسومات أعلاه أعلى من المواصفات العالية) أو ASIC مخصصة. يؤدي هذا إلى زيادة فاتورة كبيرة جدًا ، حيث تسعير معظم الأجهزة بمئات إلى آلاف الدولارات لكل وحدة ، دون حساب الاستخدام الكبير للكهرباء التي تعتبر تكلفة تشغيل.

النقص الكبير في GPU لعام 2018

لقد تبين أن هذا عامل مهم ومعرقل في اعتماد blockchain. في الواقع ، وبسبب هذا السبب بالذات ، ارتفعت أسعار GPU ، واختفت الأسهم تقريبًا ، تاركة عمال المناجم المحتملين بدون أي أدوات ، مما أدى إلى انهيار صناعة ألعاب الكمبيوتر ومنع الباحثين من الوصول إلى الأجهزة المتطورة. حتى مصنعي الجرافيك مثل Nvidia الذين استفادوا من الارتفاع تحدثوا في النهاية عن النقص الحاد كسبب مباشر لسلسلة بلوكشين.

بعد مرور عام ، اختفت معظم تقنيات blockchain ، وانخفضت أسعار العملات المشفرة الرئيسية إلى ربع تقييمها. إن أكثر ما يثير الاهتمام على نطاق واسع مع blockchain هو فشلها في التوسع ، وتبقى الأجهزة (وستظل) عاملاً مانعًا في توسيع نطاق تكنولوجيا blockchain.

هذه المشكلة لا تقتصر على blockchain ، ولكن. تعتمد الذكاء الاصطناعي على نفس الأجهزة (GPUs) ، وهذا أصبح عاملاً مانعًا في هذا المجال ؛ لا تستطيع معظم الشركات الناشئة القادمة بناء مزرعة GPU هائلة مثل Google ، وتأتي القوة الشرائية للحوسبة من مزودي الخدمات السحابية مثل AWS برفع الأسعار بمقدار 4 أضعاف مما يؤدي إلى زيادة فاتورة الخادم الكبيرة.

مع XR ، المشكلة أكثر غضبًا. لتشغيل هذه التجارب ، يتعين على المستهلكين تقديم الصور المرئية ، وعلى جهاز المستهلك معالجة المدخلات الحسية. هذا يضع العبء في الغالب على المستهلك ، وهو أمر يبدو رائعًا للشركات التي تتطلع إلى الدخول في مساحة XR ولكنه يسبب مشكلة كبيرة في التوسع.

على سبيل المثال ، لنأخذ Oculus VR. كانت Oculus واحدة من أوائل سماعات الرأس VR التي تطلق وتظل اسمًا مشهورًا في هذا المجال ، حيث استحوذت عليها Facebook منذ ذلك الحين وعززت مكانها في السوق.

لسوء الحظ ، تعمل Oculus بشكل حصري تقريبًا على أجهزة الكمبيوتر المكتبية ، علاوة على ذلك تتطلب مواصفات GPU عالية. تواجه نفس المزالق مثل blockchain و AI ، ولكن مع مخاوف أكبر بكثير: في حين أن AI يمكن لرجال الأعمال فقط رمي الأموال على بنيتهم ​​التحتية لحل المشكلة بشكل مؤقت ، مع XR يقع العبء على المستهلكين. تعتمد دورة اعتماد AR / VR على وحدات معالجة الرسوم البيانية للمستهلكين لتصبح مواصفات أكثر انتشارًا وأعلى ، بالإضافة إلى انتظار انخفاض الأسعار إلى مستويات تكون في متناول المستخدم العادي. إنها عملية قد تستغرق عقودًا - بينما يعلن جينسين هوانغ الرئيس التنفيذي لشركة نفيديا أن قانون مور يفضل وحدات معالجة الرسومات ، وهو الوقت اللازم للتطور الكافي اللازم لرفع المواصفات بينما يظل خفض الأسعار يصل إلى عدة سنوات.

بالنسبة لأكبر ثلاث كلمات طنانة في مجال التكنولوجيا ، إنها جملة ملعون.

وقت التشغيل

عندما نتحدث عن وقت التنفيذ في الحوسبة ، فإننا نعني بشكل عام بالميللي ثانية ، حيث نما المستخدمون لتوقعوا تفاعلات فورية.

لسوء الحظ ، ليس هذا هو الحال على الإطلاق مع جميع التقنيات الثلاثة المذكورة أعلاه.

مع blockchain ، يستغرق التعدين كتلة واحدة أطول وأطول مع مرور الوقت. لقد وصل الأمر إلى درجة أنه لم يعد مربحًا للأفراد في استخراج العملات المشفرة الكبيرة ، وبدأت مجمعات التعدين في استدعاء اللقطات على الشبكة. بالنسبة للتكنولوجيا "اللامركزية" ، فإنها تفضل الكثير من المركزية.

كما أنه يعبِّر أيضًا عن نبرة أكبر قضية استخدام لـ blockchain: (cryptocurrency). تزدهر Cryptocurrency على المعاملات السريعة ، دون وجود سلطات مركزية ، وعبر الحدود ، وبدون رسوم كبيرة.

ومع ذلك ، مع فشل كتلة blockchain في الحجم ومقدار الوقت (الوقت = الكهرباء) المطلوب لإزالة الألغام ، ارتفعت الرسوم المرتبطة بالمعاملات إلى مستويات قياسية ؛ في ذروتها ، وصلت Bitcoin إلى نقطة تكون فيها الرسوم المرتبطة بمعظم المعاملات الصغيرة أكبر من تكلفة المعاملة الفعلية ، مما يجعلها عديمة الفائدة تمامًا وفشلًا تامًا للمستهلكين العاديين. بدأت المعاملات تستغرق ساعات ، والتنظيم بسبب الهاربين ، جعل ارتفاع سعر البيتكوين من الصعب نقل البيتكوين عبر الحدود.

أصبحت Cryptocurrency كل شيء وعدت بتدميره.

مع الذكاء الاصطناعي ، هناك قضية مختلفة للغاية تنشأ. يستغرق وقت الاستدلال للعديد من الموديلات كبيرة الحجم عدة ثوان ، الأمر الذي يبدو وكأنه فترة صغيرة من الوقت ولكنه يبدأ في الظهور ويصبح رمزًا محظورًا عند مناقشة قواعد المستخدمين التي يبلغ عددها الآلاف.

علاوة على ذلك ، فإن الأرقام المستشهد بها في وقت الاستدلال من معظم الطرز هي خادعة - عليك أن تقرأ بين السطور ، أو بالأحرى إلى السطر التالي الذي عادةً ما يكون نصه "كما هو موجود على مكدس XYZ GPU" ، حيث "XYZ GPU stack" تكاليف عدة آلاف من الدولارات ويجب أن تكون مخصصة بالكامل لتلك المهمة الاستدلال واحدة.

مكدس TPU من Google والذي يستخدم غالبًا لتدريب نماذجهم

بالطبع ، يجري البحث هنا ، لكن البحث الذي يتم إجراؤه يركز بالكامل تقريبًا على وقت التدريب ، وهو ما يمكنني القول إنه ليس مهمًا للغاية. بالنسبة للتدريب ، لا يمثل الأسبوع مشكلة كبيرة - يمكن لأي شركة ناشئة أن تدخر أسبوعًا لتدريب نموذج سيصبح حجر الزاوية في أعمالهم.

المشكلة الأكبر تكمن في الاستدلال. على مستوى الجذر ، يتطلب التدريب الاستدلال - عادة ما يتم الاستشهاد بالاستدلال باعتباره المرحلة "الأمامية" للشبكة ، ويجب أن يحدث ذلك في التدريب قبل إجراء الخلفية. ومع ذلك ، في التدريب ، جميع البيانات التي يجب استنتاجها متوفرة في البداية.

بمعنى آخر ، يمكن معالجة الدُفعة بأكملها في وقت واحد (أي ، 100 صورة من الصور في نفس الوقت) ، بسبب تحجيم الرياضيات - ضرب مصفوفة أكبر من عدة مصفوفات أكثر فعالية من ضرب عدة مصفوفات من مصفوفة واحدة (بمعنى آخر ، أكثر فعالية في فعل المزيد في وقت واحد). يرتفع هذا إلى حد ما ، على غرار فكرة تناقص العوائد في الاقتصاد ، لكن يبقى أن التدريب التجميعي يسمح لنا بزيادة الاستدلال على كميات كبيرة من البيانات.

لسوء الحظ ، بمعنى عملي ، نادراً ما تكون معالجة الدُفعات هي الحالة.

من النادر أن يعمل النموذج على الاستدلال على 200 صورة دفعة واحدة ؛ من المحتمل أن يتم تقديم 200 صورة للاستنتاج في دقيقة واحدة. سيكون هناك عنق الزجاجة الصعب في وقت الاستدلال لكل صورة ؛ حتى وقت الاستدلال في القول ، فإن ثلث الثانية (وهو سريع الجنون - تلك هي الأوقات التي يتباهى بها أسرع الموديلات ، مثل نموذج تنبؤ الجملة الأمثل من Gmail) سيؤدي فقط إلى 180 من تلك الصور قيد المعالجة في اللحظة. حتى في الحمل الصغير البالغ 200 / دقيقة ، فشل النموذج في القياس ، ولتقييم الأعمال المتراكمة المتزايدة ، يجب أن يتم إنشاء مثيل ثانٍ لتحقيق التوازن.

من الصعب ابتلاعها في عالم تكون فيه الأحمال كبيرة ؛ في الواقع ، تعرضت Node’s Express للنقد من قبل لدعمها فقط آلاف الاتصالات / ثانية ، على غرار قواعد بيانات NoSQL الشائعة التي يتم انتقادها بسبب اختناقها في عدة آلاف من المعاملات / الثانية.

سد مضمون للانفجار

إنه رقم لم يسمع به أحد في عالم الذكاء الاصطناعى ، والذي يصادف عنق الزجاجة الصعب بمعدل بضع مئات في الثانية من حيث الاستدلالات المنفصلة في مثيل واحد من نموذج ، حتى مع التحسينات الأكثر تقدماً التي يمكنك إجراؤها.

مع XR ، هناك مشكلة مختلفة تمامًا في متناول اليد. تكمن المشكلة في الغمر - من أجل الانغماس وتجنب الوادي الخارق ، يجب أن تحدث التفاعلات ، ويتعين على العارض أن يتكيف بشكل أسرع مما يمكن للإنسان إدراكه. بمعنى آخر ، بضع مئات من المللي ثانية ليست بالسرعة الكافية.

مع XR ، نقيس الأشياء بكميات صغيرة من المللي ثانية. نقيس الكمون المقبول على النحو التالي ~ 20ms (هذا الرقم الذي لا يوافق عليه العديد من اللاعبين ، حيث أن 100+ fps وتحت سن عشرة ping تعتبر طبيعية بالنسبة لمعظم الحفارات).

إنه رقم يظل عنق الزجاجة وهو شخص لا نقترب منه ؛ بينما تركز XR tech بشكل مكثف على هذا وقد تحقق العديد من الاختراقات في هذا المجال من حيث المدخلات الحسية والعرضية ، لا نزال نواجه مشكلات من حيث التفاعل ؛ على وجه التحديد ، يفتح XR مجموعة جديدة تمامًا من إمكانيات التفاعل التي لا يمكن لمعالجتها معالجتها بسرعة كبيرة جدًا.

محرك ARCore للصور المعززة كما تم عرضه في Google I / O 2018

علاوة على ذلك ، لتشغيل تكبير الصورة مع أي شيء أكثر تعقيدًا من التماثل ، يعد الكمون مرتفعًا جدًا بحيث لا يمكن اعتباره "مقبولًا" في معظم التجارب. أسرع اختبار قمنا به حتى الآن هو Google ARCore Augmented Images ، والذي يستخدم التماثلات (هناك أيضًا عرض توضيحي للوجوه المضاف إليها أبطأ قليلاً وله زمن استراحة / تأخر ملحوظ).

ARCore المعقم وجوه التجريبي

إنها مشكلة كبيرة

في العامين الماضيين وحدهما ، كان عدد التطورات في هذه المجالات الثلاثة لا يمكن التغلب عليه.

في الذكاء الاصطناعى ، رأينا جيل اللغة الطبيعية يقفز إلى الأمام مع GPT-2 ، التي تكتسب سمعتها باسم Imagenet of NLP. إنه يفتح عالما جديدا من الاحتمالات مع معالجة النصوص. لقد رأينا أيضًا الشبكات التلافيفية وشبكات GAN تنمو لتبني صورًا بحجم 4 كيلو بايت ، ونحن ندخل حقبة يمكن فيها لمنظمة العفو الدولية محاكاة الصور عالية الدقة وإنشاء محتوى يبدو مقبولًا للعين البشرية.

مع blockchain ، أصبح الحقل أقل تشويشًا ، مع نفاد العديد من عمليات الاستيلاء على النقود وإتاحة مجال أكبر للتعرض مع المنصات الحالية. نمت Steam بشكل ملحوظ في العام الماضي ، إلى جانب Stellar واستخدام blockchain في التكنولوجيا العادية. أعلنت كل من JPMorgan و BofA و Facebook جميعها أن blockchain الخاصة بها وشهدت blockchain المطبقة طفرة مع منصات مثل DLive التي بدأت في الاتجاه السائد (شكلت DLive مؤخرًا شراكة مع أكبر شخصية في Youtube مع نظامها المبدع الأول).

في XR ، رأينا مستوى الهاتف XR و AR حقيقة واقعة مع العديد من التحسينات على ARCore. أصبح من الممكن دمج الذكاء الاصطناعي في XR وتطوير تجارب تسمح بمستوى معين من التفاعل البشري (لسنا على اتصال جسدي بعد ، ولكن هناك مشاريع تسمح بتفاعلات أخرى ، مثل Fiddler AR).

هذه كلها مجالات لها تأثير كبير وهام على مستقبل التكنولوجيا ، وحيث تسير الحضارة الإنسانية ككل. هذه تقنيات لا تؤثر على الاقتصاد ؛ يعيدون تعريفه ؛ لا تؤثر على المجتمع والتفاعل ؛ انهم تنشيطه. إنه يجعل الإصلاح الشامل ممكن لثقافتنا بأكملها ، وعلى مستوى الجذر ، يطلق عليه ثورة صناعية أخرى.

بالنسبة للحركة التي لها تأثير كبير على الجمهور الواسع الانتشار ، من المهم للغاية أن تتمكن من توسيع نطاق دعم الجمهور بسهولة. إلى أن يتم تنفيذ ذلك ، فإنه يعيق التبني ويشكل حاجزًا شديد الصعوبة أمام الدخول فيما يتعلق بالابتكار خارج الشركات الكبرى.

آمل أن أرى المزيد من الابتكار في توسيع نطاق هذه التقنيات. في Epic.ai ، نركز على تطوير التطبيقات التي تعتمد بشكل كبير على الذكاء الاصطناعى و blockchain - نحن جميعًا على دراية بقيود التوسع ؛ إنها مشكلة سنعمل عليها بشدة خلال السنوات القليلة المقبلة ، وهي مشكلة نأمل أن تتضافر الصناعة لحلها.

مهلا! أنا تومر ، رجل أعمال ، وصانع. ربما تعرفني من Mevee و Crane و Shots و Slides و investorintelligence.io من بين المنتجات الأخرى التي أطلقتها! هذا المقال جزء من سلسلة أكثر اتساعًا أكتبها استنادًا إلى تجربتي وهي مصنوعة أساسًا من رأيي وآراء فريقي.

آمل أن يكون هذا يساعدك على تجنب ارتكاب نفس الأخطاء التي ارتكبت ، وتذكر أن تستمر في الشحن!

يرجى التصفيق إذا وجدت هذا الأمر ذا قيمة ، وتابعني لمزيد من الكتابة مثل هذا عندما أشارك قصصًا حول شكل تطوير البرمجيات وريادة الأعمال في الحياة الواقعية.

تم نشر هذه القصة في The Startup ، أكبر منشور لريادة الأعمال في Medium ، يليه + 442،678 شخصًا.

اشترك لتلقي أهم الأخبار هنا.