المؤلف: دوج بيتكانيكس، الرئيس التنفيذي لشركة Livepeer؛ الترجمة: 0xxz@金财经
مقدمة
عندما اكتشف الأشخاص أن شبكة Livepeer تحتوي على آلاف وحدات معالجة الرسومات المستخدمة بشكل نشط لتحويل الترميز أسبوعيًا، عند النظر إلى ملايين الدقائق من الفيديو، فإن أحد الأسئلة الأكثر شيوعًا هو ما إذا كان من الممكن استخدام وحدات معالجة الرسومات هذه لإجراء أنواع أخرى من العمليات الحسابية. على وجه الخصوص، مع ظهور الذكاء الاصطناعي في عام 2023 وما يرتبط به من زيادة في الطلب على وحدات معالجة الرسومات (الأجهزة المستخدمة لأداء التدريب على الذكاء الاصطناعي والاستدلال)، قد يعتقد المرء بطبيعة الحال أن شبكة Livepeer يمكن أن تستخدم قوتها الحاسوبية للانتقال إلى البنية التحتية للذكاء الاصطناعي .. البنية التحتية للذكاء الاصطناعي تكلف مليارات الدولارات. وشهدت أعمال مراكز البيانات التابعة لشركة NVidia، والتي توفر وحدات معالجة الرسومات لحوسبة الذكاء الاصطناعي، نموًا في الإيرادات قدره 14 مليار دولار في الربع الأخير وحده، ارتفاعًا من 4 مليارات دولار في العام السابق.

المصدر: تقرير NVidia ربع السنوي عبر @Thomas_Woodside على X
أولئك الذين وضعوا هذه الافتراضات على حق - من المؤكد أن شبكة Livepeer يمكن استخدامها من قبل أولئك الذين يبحثون عن معالجة الذكاء الاصطناعي التخريبية والفعالة من حيث التكلفة. مع النمو في استخدام فيديو Livepeer من خلال Livepeer Studi في الأشهر الأخيرة وإطلاق خزائن Livepeer الجديدة التي يديرها المجتمع مما يضع الأساس، فقد حان الوقت الآن لجلب إمكانات حوسبة الفيديو المدعومة بالذكاء الاصطناعي إلى Livepeer.
ستشرح الأقسام التالية من هذه المقالة كيفية تقديم حوسبة الفيديو بالذكاء الاصطناعي على شبكة Livepeer، بالإضافة إلى الخطط والاستراتيجيات والجداول الزمنية لجعلها حقيقة واقعة.
تحديد موضع المهمة - فلاتر الفيديو
خلفية عن مهمة Livepeer والتزامها
يظل Livepeer ملتزمًا بمهمته: بناء البنية التحتية للفيديو المفتوح في العالم. تحاول منصات الحوسبة الأخرى أن تصبح سوقًا للأغراض العامة من نوع "AWS on blockchain" أو "تشغيل أي نوع من مهام الحوسبة"، ولكن هذا يخلق تحديات عند دخول السوق بسبب نقص القدرات اللازمة للحلول الخاصة بالصناعة. بدلاً من ذلك، يركز Livepeer على حوسبة الفيديو من خلال تحويل الترميز وهو قادر على إنشاء منتجات مستهدفة وGTMs لصناعات محددة (سوق بث الفيديو الذي تبلغ قيمته أكثر من 100 مليار دولار) لمعالجة حالات الاستخدام الحقيقي والاستفادة من الاحتياجات الحالية، بدلاً من التسويق لأحد الحلول المجردة العامة المرغوبة .
إن التركيز على الفيديو يعني أن Livepeer يتجنب المبالغة في رد الفعل والتحول إلى أحدث الاتجاهات الشائعة مثل ICOs أو NFTs أو DeFi، وبدلاً من ذلك يسأل دائمًا عن كيفية تطبيق هذه الابتكارات على الفيديو. لم تكن الارتفاعات مرتفعة إلى هذا الحد، ولكن الأهم من ذلك، أن أدنى مستوياتها لم تكن منخفضة أيضًا. يجذب هذا أيضًا فريقًا يركز على المهمة ومجتمعًا يتمتع بخبرة عميقة في مجال الفيديو، وهم متحمسون لما نقوم به على مدار فترة طويلة من الزمن، بدلاً من المغادرة عندما يفقد اتجاه هذا الشهر قوته.
في الوقت الحالي، لا يوجد اتجاه أكثر سخونة من الصعود السريع للذكاء الاصطناعي. ولكن على عكس العديد من فرق ومشاريع العملات المشفرة، فإن Livepeer لا يتخلى عن مهمته و"التمحور حول الذكاء الاصطناعي". وبدلاً من ذلك، طرحنا السؤال التالي: كيف سيؤثر الذكاء الاصطناعي على مستقبل الفيديو؟ لقد ساهم الذكاء الاصطناعي في خفض الحواجز التي تحول دون دخول منشئي الفيديو بعدة طرق. هناك عاملان مهمان هما تقليل وقت وتكلفة الإنشاء في المقام الأول، وتقليل الوقت والتكلفة والخبرة في إنتاج وإخراج مقاطع فيديو عالية الجودة.
على الجانب الإبداعي، يمكن استخدام الذكاء الاصطناعي التوليدي لإنشاء مقاطع فيديو بناءً على مطالبات النص أو الصورة. بينما في الماضي، كان إعداد المشهد يتطلب طاقمًا ومجموعات وكاميرات ونصوصًا وممثلين ومحررين وما إلى ذلك، أما الآن فقد يتطلب الأمر ببساطة من المستخدم إدخال مطالبة نصية على لوحة المفاتيح ثم الانتظار بضع دقائق حتى تصل وحدة معالجة الرسومات لتوليد عينة من النتائج المحتملة. لن يحل إنشاء الفيديو محل العمل عالي الجودة، ولكنه يمكن أن يوفر توفيرًا كبيرًا في التكاليف في مراحل مختلفة من العملية.
فيما يتعلق بالإنتاج، سواء تم إنشاؤه بواسطة الذكاء الاصطناعي أو تم تقديمه بواسطة منشئي المحتوى، يمكن لوظائف مثل رفع المستوى واستيفاء الإطارات وإنشاء الترجمة أن تحسن جودة محتوى الفيديو وسهولة استخدامه بسرعة . إمكانية الوصول. يمكن تمكين الميزات المتقدمة مثل التفاعل في الفيديو من خلال الكشف التلقائي عن الكائنات والإخفاء وتصنيف نوع المشهد.
يعد توقيت Livepeer للاستفادة من مجموعة ميزات الذكاء الاصطناعي أمرًا مثيرًا نظرًا للإصدار الأخير من النماذج الأساسية مفتوحة المصدر بما في ذلك Stable Video Diffusion وESRGAN وFAST والمزيد. بالتزامن مع نماذج الملكية مغلقة المصدر. الهدف هو أن تدعم البنية التحتية للفيديو المفتوح في العالم تشغيل نماذج مفتوحة المصدر يمكن للجميع الوصول إليها، والموجودة بالفعل اليوم وتتحسن بسرعة بفضل الابتكار من مجتمع الذكاء الاصطناعي مفتوح المصدر.
خلفية الذكاء الاصطناعي - المكان المناسب لـ Livepeer
التدريب والضبط والاستدلال
هناك مراحل عديدة في دورة حياة الذكاء الاصطناعي، ولكن عادةً ما تكون هناك ثلاث مراحل تتطلب الكثير من قوة الحوسبة. المراحل هي التدريب والضبط والاستدلال. باختصار:
يتطلب التدريب إنشاء نماذج وإجراء عمليات حسابية على مجموعات بيانات كبيرة جدًا. في بعض الأحيان يتطلب ذلك عمليات حسابية بقيمة آلاف أو مئات الملايين من الدولارات لتدريب نموذج أساسي، مثل النموذج الذي تم تدريبه من خلال OpenAI أو Google.
يعد الضبط الدقيق أكثر فعالية من حيث التكلفة ويأخذ نموذجًا أساسيًا موجودًا ولكنه يضبط الأوزان بناءً على مجموعة محددة من المدخلات لمهمة محددة.
الاستدلال هو عملية أخذ نموذج مدرب ومضبوط والسماح له بإنتاج مخرجات أو عمل تنبؤات بناءً على مجموعة مدخلات. بالنسبة لوظيفة الاستدلال، غالبًا ما يكون هذا رخيصًا من الناحية الحسابية مقارنة بالمرحلتين الأوليين، ولكن غالبًا ما يتم إجراؤه مرارًا وتكرارًا ملايين المرات، وبالتالي فإن تكلفة الاستدلال تتجاوز تكلفة التدريب، مما يبرر الاستثمار في التدريب.
يتطلب التدريب والضبط الدقيق الوصول إلى مجموعات كبيرة من البيانات ووحدات معالجة الرسومات المتصلة بالشبكة بشكل كثيف حتى يتمكنوا من التواصل مع بعضهم البعض ومشاركة المعلومات بسرعة. الشبكات مثل Livepeer ليست مناسبة تمامًا للتدريب خارج الصندوق وتتطلب تحديثات مهمة لإنجاز المهمة. في حين أن الشبكات اللامركزية جذابة للتدريب كبديل لسحابات التدريب الفني المملوكة واسعة النطاق، إلا أنها ليست قادرة على المنافسة من منظور التكلفة بسبب الحمل الزائد للشبكة وعدم الكفاءة في تدريب النماذج الأساسية. والقوة مشكوك فيها.
من ناحية أخرى، فإن الاستدلال هو المكان الذي يمكن أن تلعب فيه الشبكات اللامركزية مثل Livepeer. يمكن لكل مشغل عقدة اختيار تحميل نموذج معين على وحدة معالجة الرسومات الخاصة به ويمكنه التنافس على التكلفة لتنفيذ مهام الاستدلال بناءً على إدخال المستخدم. تمامًا كما هو الحال في شبكة تحويل ترميز Livepeer، يمكن للمستخدمين إرسال المهام إلى شبكة Livepeer لإجراء استدلال الذكاء الاصطناعي وينبغي عليهم جني فوائد الأسعار التنافسية في السوق المفتوحة، مع الاستفادة من قوة وحدة معالجة الرسومات الخاملة حاليًا وبالتالي رؤية فوائد التكلفة.
تُعد وحدات معالجة الرسومات بمثابة شريان الحياة لازدهار الذكاء الاصطناعي. لقد نمت أعمال مراكز بيانات NVidia، المبنية على الطلب على وحدات معالجة الرسومات، بشكل كبير خلال العام الماضي. قال إيلون ماسك مازحًا إن شراء وحدات معالجة الرسوميات أصعب من شراء الأدوية. ومع ذلك، أظهرت شبكات DePIN مثل Livepeer أنه من خلال ديناميكيات السوق المفتوحة الخاصة بها، ومن خلال توجيه الحوافز من خلال مكافآت الرموز التضخمية، يمكنها جذب عرض GPU العالمي قبل الطلب، وبالتالي دعم نمو المستخدمين والتطبيقات الجديدة بشكل مرن. بالقرب من سعة الدفع غير المحدودة أولاً بأول. لم يعد المطورون بحاجة إلى حجز الأجهزة مقدمًا بسعر مرتفع يظل خاملاً عندما لا يكون قيد الاستخدام، ولكن يمكنهم بدلاً من ذلك دفع أقل سعر ممكن في السوق. هذه فرصة كبيرة للشبكات اللامركزية لتحفيز طفرة في الذكاء الاصطناعي.
فرصة النظير المباشر - أرسل مهام استنتاج الذكاء الاصطناعي إلى الشبكة بدلاً من وحدة معالجة الرسومات

دع 1000 وحدة معالجة رسومات متصلة بـ Livepeer تعمل / span>
يسمح لك موفرو السحابة مثل GCP أو AWS "بحجز خوادم GPU" على سحابات المؤسسة الخاصة بهم. الشبكات المفتوحة مثل Akash تذهب إلى أبعد من ذلك وتسمح لك باستئجار خوادم عند الطلب من أحد مقدمي الخدمة اللامركزيين العديدين حول العالم. ولكن بغض النظر عن الخيارات المذكورة أعلاه، سيتعين عليك إدارة الخادم المستأجر لتشغيل النموذج وتنفيذ المهام. إذا كنت ترغب في إنشاء تطبيق يمكنه أداء مهام متعددة في وقت واحد، فيجب عليك توسيع نطاقه. يجب عليك ربط سير العمل معًا.
يلخص Livepeer الأشياء إلى "وظائف" يمكنك إرسالها إلى الشبكة وتثق في أنها ستكتمل. يقوم Livepeer بذلك بالفعل من خلال تحويل ترميز الفيديو، والذي يعمل عن طريق إرسال مقطع فيديو مدته ثانيتان لتحويل الترميز. ما عليك سوى إرسال مهمة إلى الشبكة ويمكنك أن تكون واثقًا من أن عقد البث الخاصة بك ستكمل المهمة بشكل موثوق، مع الاهتمام باختيار عقدة العامل وتجاوز الفشل والتكرار.
بالنسبة لمهام حوسبة الفيديو باستخدام الذكاء الاصطناعي، يمكن أن تعمل بنفس الطريقة. قد تكون هناك مهمة "إنشاء فيديو من النص". يمكنك أن تثق في أن العقدة الخاصة بك ستقوم بالمهمة، ويمكنك توسيع نطاق ذلك إلى أي عدد من المهام التي تريد إرسالها في وقت واحد عبر عقدة واحدة يمكنها الاستفادة من شبكة مكونة من آلاف وحدات معالجة الرسومات لإجراء الحساب الفعلي. اتخاذ خطوة للأمام - لا يزال هذا في مرحلة التصميم - يمكنك إرسال سير عمل كامل، على سبيل المثال
يمكن أن تقوم الشبكات بذلك نيابةً عنك دون الحاجة إلى نشر نماذج منفصلة لأجهزة منفصلة، وإدارة الإدخال/الإخراج، والتخزين المشترك، وما إلى ذلك. لا مزيد من إدارة الخوادم، وتوسيع نطاق الخوادم، والقيام بعمليات تجاوز الفشل، وما إلى ذلك. Livepeer عبارة عن بنية تحتية قابلة للتطوير تتميز بأقصى قدر من الفعالية من حيث التكلفة والموثوقية العالية. إذا تمكنت الشبكة من الوفاء بهذه الوعود الخاصة بحوسبة الفيديو بالذكاء الاصطناعي، كما فعلت مع جهود تحويل ترميز الفيديو، فإنها ستوفر مستوى جديدًا من تجربة المطورين وخفض التكلفة لم نشهده بعد في عالم الذكاء الاصطناعي المفتوح.
التخطيط لتقديم حوسبة فيديو الذكاء الاصطناعي بسرعة والتحقق من فعالية تكلفة الشبكة
شبكة فيديو فرعية تعمل بالذكاء الاصطناعي
تماشيًا مع رحلة Livepeer على مدار السنوات السبع الماضية ، سيقوم هذا المشروع بإظهار قدرات البرامج والشبكات الحقيقية والقابلة للاستخدام والوظيفية ومفتوحة المصدر، ثم الترويج لـ "Livepeer has this". فيما يلي نسخة قصيرة من الخطة لتحقيق ذلك:
اختر حالات استخدام أولية محددة لأنواع المهام الأخرى، وليس فقط تحويل ترميز الفيديو: فيديو تم إنشاؤه استنادًا إلى الذكاء الاصطناعي، مدعومًا بترقية الذكاء الاصطناعي واستيفاء الإطارات. النماذج المفتوحة الرائعة، مثل Stable Video Diffusion، تنمو كل يوم في هذا المجال.
تحرك بسرعة من خلال البناء داخل الشوكات/الارتفاعات في برنامج العقدة لإضافة هذه الميزات إلى عقد المنسق (جانب العرض) وعقدة المذيعين (جانب الطلب). يجب أن يدعم Catalyst، وهو خادم الوسائط المفتوحة الخاص بـ Livepeer، واجهة لطلب واستخدام مهام إنشاء الفيديو هذه.
سيشكل المستخدمون الذين يقومون بتشغيل هذا الارتفاع نوعًا من الشبكة الفرعية على Livepeer، لكنهم سيستخدمون بروتوكول Livepeer لاكتشاف ودفع العقد التي تقوم بتشغيل هذه الميزة الجديدة من خلال شبكة Livepeer الرئيسية.
اعمل مع تطبيقات الواجهة الأمامية التي تواجه المستهلك للاستفادة من شبكة الحوسبة المفتوحة الفعالة من حيث التكلفة من Livepeer والتقاط وتقديم البيانات التي تتحقق من فعالية Livepeer من حيث التكلفة مقارنة بالسحابة العامة.
بينما نتحقق من ذلك، قم بالدمج في عميل Livepeer الأساسي، وإضافة أنواع وظائف إضافية، وتنمية النظام البيئي حول الاستفادة من الأشكال الأخرى لحوسبة الفيديو القائمة على الذكاء الاصطناعي.

تعمل عقدة شبكة الفيديو الفرعية AI جنبًا إلى جنب مع عقدة تحويل الشفرة، أثناء استخدام شبكة Livepeer الرئيسية للدفع .
AI Video SPE
قدم Livepeer مؤخرًا مجتمعًا مُدارًا على السلسلة إلى البروتوكول من خلال ترقية Delta الخاصة به، وكان يستخدم LPT لعدة أشهر لتمويل القطاع العام برامج السلع. يوجد بالفعل اقتراح مسبق قيد المناقشة ويقترب من التصويت لتمويل كيان ذو غرض خاص (أو SPE) مخصص لجعل الوعد بحوسبة الفيديو بالذكاء الاصطناعي حقيقة واقعة. يهدف الاقتراح الأول إلى تحقيق التطوير الأساسي لإكمال المهام الأربع الأولى المذكورة أعلاه، بما في ذلك:
تطوير قدرات الذكاء الاصطناعي هذه وتكوين عقد Livepeer p>
يمكن لمشغلي العقد تشكيل شبكة فرعية وتنفيذ هذه المهام عن طريق الدفع على شبكة Livepeer الرئيسية.
تطبيق أمامي يعرض هذه الإمكانات للمستهلكين.
مجموعة من المعايير والبيانات التي توضح فعالية شبكة Livepeer من حيث التكلفة لإجراء استدلال الذكاء الاصطناعي على نطاق واسع.
كما أنه يثير معالم التمويل المستقبلية المحتملة لتوفير اعتمادات البنية التحتية من الخزانات لتغطية التكلفة الأولية لاستخدام المستهلك خلال فترة جمع البيانات هذه.
أصبحت قناة #ai-video في Livepeer Discord نقطة ساخنة للمناقشة والتعاون حول المبادرة، ويجب على أي شخص يؤمن بالبنية التحتية المفتوحة للذكاء الاصطناعي ومستقبل حوسبة الفيديو بالذكاء الاصطناعي أن يمر بها، على سبيل المثال. مرحبا، والمشاركة. بدأ مشغلو العقد في قياس أداء الأجهزة المختلفة، والتعرف على تشغيل نماذج الفيديو المفتوحة هذه، ومعالجة تحديات الانتقال من خبرة تحويل ترميز الفيديو إلى أنواع المهام الأخرى الخاصة بالفيديو. إنه وقت ممتع أن تكون جزءًا من فريق مشروع سريع النمو.
المستقبل
على الرغم من أن هذا الإنجاز الأولي يمكن أن يُظهر أن Livepeer فعال من حيث التكلفة بالنسبة لأشكال معينة من حوسبة فيديو الذكاء الاصطناعي التي يدعمها، فإن القوة النهائية الحقيقية تكمن في قدرة مطوري الذكاء الاصطناعي إلى نماذج BYO، يعتمد وزن BYO، وضبط BYO أو نشر LoRA المخصص على النموذج الأساسي الحالي للشبكة.
سيؤدي دعم هذه القدرات الأولية، عبر مجموعة متنوعة من النماذج وطرائق الحوسبة، إلى تطوير سريع لعمليات العقدة، وتحميل/تفريغ النموذج على وحدة معالجة الرسومات، واكتشاف العقدة والتفاوض بشأنها، وتجاوز الفشل، والمدفوعات، والتحقق من الصحة، والمزيد تعلم عندما يتعلق الأمر بحوسبة الفيديو باستخدام الذكاء الاصطناعي. ومن هناك، يمكننا تقييم المعالم المستقبلية لإنتاج ودعم أنواع مهام حوسبة الفيديو العشوائية التي تعمل بالذكاء الاصطناعي على شبكة Livepeer.
في وقت مبكر، أتاحت الأنظمة الأساسية الخاصة بالفيديو مثل Livepeer Studio لمطوري الفيديو إنشاء واجهات برمجة التطبيقات والمنتجات للاستفادة من النماذج المدعومة. يمكن لتطبيقات المستهلك، مثل تلك المقترحة في AI Video SPE، استخدام هذه الإمكانات مباشرة على شبكة Livepeer من خلال عقد Catalyst. ولكن مع توسع هذه القدرات، يمكن لشركات الذكاء الاصطناعي الجديدة التي تركز على المبدعين تشكيل شبكة GPU العالمية الخاصة بـ Livepeer والاستفادة منها لبناء تجارب مخصصة بتكلفة منخفضة دون الاعتماد على سحابات التكنولوجيا الكبيرة باهظة الثمن ونماذج الملكية الخاصة بها باعتبارها العمود الفقري للأعمال.
هذا طريق مثير يتطلب الجري للوصول إليه. ليس هناك شك في أن الذكاء الاصطناعي سيغير عالم الفيديو بشكل أسرع مما يمكننا أن نتخيله في السنوات المقبلة، ونتوقع أن تصبح البنية التحتية للفيديو المفتوحة في العالم المستقبل الأكثر فعالية من حيث التكلفة ويمكن الوصول إليها لجميع الحوسبة المطلوبة لتمكين هذا الجريء تكنولوجيا جديدة وقابلة للتطوير وموثوقة. ص>