المصدر: Quantum
استغرق الأمر حوالي شهر حتى بدأ المجتمع المالي في الذعر بشأن DeepSeek، ولكن عندما بدأ الذعر حقًا، تقلصت القيمة السوقية لشركة Nvidia بأكثر من 500 مليار دولار (حوالي 3.6 تريليون دولار). يوان صيني، أي ما يعادل بوابة النجوم بأكملها. لا يقتصر الأمر على شركة إنفيديا، فقد انخفضت القيمة السوقية لشركات تيسلا وجوجل وأمازون ومايكروسوفت.
وفقًا لألكسندر وانج، الرئيس التنفيذي لشركة Scale AI، فإن نموذجي الذكاء الاصطناعي اللذين أصدرتهما DeepSeek قابلان للمقارنة بأفضل النماذج من المختبرات الأمريكية. ويبدو أن DeepSeek يعمل في ظل ظروف محدودة، مما يعني أن تدريبه سيكون أرخص بكثير من نظيراته الأمريكية. ويقال إن التكلفة النهائية للتدريب لأحد أحدث نماذجها كانت 5.6 مليون دولار أميركي فقط (حوالي 40.6 مليون يوان صيني)، وهو ما يعادل تقريبا راتب خبراء الذكاء الاصطناعي الأميركيين. وفي العام الماضي، قال الرئيس التنفيذي لشركة أنثروبيك داريو أمودي إن تكلفة تدريب نموذج تتراوح من 100 مليون دولار (حوالي 725 مليون يوان) إلى مليار دولار (حوالي 7.251 مليار يوان). وقال الرئيس التنفيذي لشركة OpenAI سام ألتمان، إن تكلفة GPT-4 الخاصة بشركة OpenAI تجاوزت 100 مليون دولار (حوالي 725 مليون يوان). يبدو أن DeepSeek يغير تصورنا لتكلفة الذكاء الاصطناعي ويمكن أن يكون له آثار ضخمة على الصناعة ككل. لقد حدث كل هذا في بضعة أسابيع فقط. في يوم عيد الميلاد، أصدرت DeepSeek نموذج استنتاج (v3)، والذي جذب اهتمامًا واسع النطاق. تم إطلاق نموذجها الثاني، R1، في الأسبوع الماضي، ووصفه رجل الأعمال الاستثماري ومستشار الرئيس ترامب، مارك أندريسن، بأنه "أحد أكثر الاختراقات المذهلة التي رأيتها على الإطلاق". وقال ديفيد ساكس، خبير الذكاء الاصطناعي والتشفير في إدارة ترامب، إن التقدم الذي أحرزه نموذج DeepSeek يظهر أن "سباق الذكاء الاصطناعي سيكون مكثفا للغاية". كلا النموذجين مفتوحان المصدر جزئيًا، باستثناء بيانات التدريب. ويثير نجاح DeepSeek تساؤلات حول ما إذا كانت هناك حاجة حقيقية إلى مليارات الدولارات من قوة الحوسبة للفوز بسباق الذكاء الاصطناعي. لقد كان الاعتقاد السائد منذ فترة طويلة أن شركات التكنولوجيا الكبرى سوف تهيمن على مجال الذكاء الاصطناعي، وذلك ببساطة لأنها تمتلك الأموال الإضافية لملاحقة التقدم. والآن يبدو الأمر كما لو أن شركات التكنولوجيا الكبرى تحرق الأموال فحسب. إن حساب التكلفة الفعلية لهذه النماذج أمر صعب بعض الشيء لأنه، كما يشير وانج من شركة Scale AI، قد لا تكون شركة DeepSeek قادرة على أن تكون صادقة بشأن نوع وعدد وحدات معالجة الرسومات التي تمتلكها بسبب العقوبات. قال لياندرو فون فيرا، رئيس قسم الأبحاث في Hugging Face، إنه حتى لو كان المنتقدون على حق، فإن DeepSeek لم تكن صادقة بشأن عدد وحدات معالجة الرسوميات التي تمتلكها (تشير الحسابات البسيطة إلى أنهم يستخدمون تقنيات تحسين لا يمكن التنبؤ بها). وهذا يعني أنهم يقولون الحقيقة، ولن يستغرق الأمر وقتًا طويلاً حتى يكتشف مجتمع المصدر المفتوح ذلك. بدأ فريقه في تكرار وصفة R1 وجعلها مفتوحة المصدر في نهاية الأسبوع الماضي، وبمجرد أن يتمكن الباحثون من إنشاء إصداراتهم الخاصة من النموذج، "سنكتشف بسرعة كبيرة ما إذا كانت الأرقام صحيحة". ما هو DeepSeek؟
تعد شركة DeepSeek، التي يبلغ عمرها عامين، والتي يقودها الرئيس التنفيذي ليانغ وينفينج، الشركة الناشئة الرائدة في مجال الذكاء الاصطناعي في الصين. وتتركز الشركة، التي انبثقت عن صندوق تحوط أسسه مهندسون من جامعة تشجيانغ، على "الابتكارات المعمارية والخوارزمية التي من المحتمل أن تغير قواعد اللعبة" لإنشاء الذكاء الاصطناعي العام (AGI) - على الأقل هذا ما يقوله ليانج وينفينج. وعلى عكس OpenAI، تدعي الشركة أيضًا أنها مربحة. في عام 2021، بدأ ليانج في شراء آلاف وحدات معالجة الرسوميات من شركة إنفيديا (قبل أن تفرض الولايات المتحدة عقوبات على الرقائق)، وفي عام 2023 أطلق DeepSeek، بهدف "استكشاف جوهر الذكاء الاصطناعي العام"، أي القدرة على أداء مهام مشابهة للبشر، تمامًا مثل الذكاء الاصطناعي. وعلى غرار الرئيس التنفيذي لشركة OpenAI ألتمان وغيره من قادة الصناعة، فإن ليانغ لديه الكثير من الحديث الكبير. وقال ليانغ في مقابلة: "هدفنا هو الذكاء الاصطناعي العام، مما يعني أننا بحاجة إلى البحث في هياكل نموذجية جديدة لتحقيق قدرات نموذجية أقوى بموارد محدودة". DeepSeek هي هذه الطريقة التي يتم بها الأمر. وقد اعتمد الفريق بعض الأساليب التقنية المبتكرة لتمكين نموذجه من العمل بكفاءة أكبر، ويزعم أن التكلفة النهائية للتدريب على R1 بلغت 5.6 مليون دولار أميركي (حوالي 406 مليار يوان صيني). وهذا يمثل انخفاضًا بنسبة 95% عن o1 الخاص بـ OpenAI. بدلاً من البدء من الصفر، قامت DeepSeek ببناء الذكاء الاصطناعي الخاص بها باستخدام نماذج مفتوحة المصدر موجودة كنقطة بداية - على وجه التحديد، استخدم الباحثون نموذج Meta’s Llama كأساس. في حين لم يتم الكشف عن مزيج بيانات التدريب الخاصة بالشركة، فقد ذكرت DeepSeek أنها تستخدم بيانات اصطناعية، أو معلومات تم إنشاؤها بشكل مصطنع (وهو شيء قد يصبح أكثر أهمية حيث يبدو أن مختبرات الذكاء الاصطناعي تواجه عنق زجاجة في البيانات).
بدون بيانات التدريب، من غير الواضح إلى أي مدى تكون هذه "نسخة" من o1 — هل استخدم DeepSeek o1 لتدريب R1؟ عندما نُشرت الورقة البحثية الأولى في ديسمبر/كانون الأول، كتب ألتمان أنه "من السهل (نسبيا) تكرار شيء تعرف أنه يعمل"، في حين أن "القيام بشيء جديد ومحفوف بالمخاطر وصعب عندما لا تعرف ما إذا كان يعمل أم لا ليس بالأمر السهل". "الأمور صعبة للغاية". لذا فإن حجة DeepSeek هي أنها لا تخلق نماذج جديدة متطورة؛ بل إنها فقط تنسخ النماذج القديمة. ويبدو أن المستثمر في OpenAI جوشوا كوشنر قال أيضًا إن DeepSeek "تم تدريبه على أساس النماذج المتطورة من وادي السيليكون". قال مايلز برونداج، وهو باحث سياسي سابق في OpenAI، إن R1 استخدمت تقنيتين رئيسيتين للتحسين: التدريب المسبق الأكثر كفاءة والتعلم المعزز لسلسلة التفكير. لقد وجدت شركة DeepSeek طريقة أكثر ذكاءً لتدريب الذكاء الاصطناعي باستخدام وحدات معالجة رسومية أرخص، وذلك بمساعدة جزئية من خلال استخدام تقنية أحدث تتطلب من الذكاء الاصطناعي "التفكير" في المشكلات خطوة بخطوة من خلال التجربة والخطأ (التعلم التعزيزي)، بدلاً من القيام بذلك واحدة تلو الأخرى. .تقليد البشر. يتيح هذا المزيج للنموذج تحقيق قدرات المستوى O1 مع استخدام طاقة حوسبة ومال أقل. قال برونداج: "إن DeepSeek v3، وDeepSeek v2 قبله، هما نفس النماذج بشكل أساسي مثل GPT-4، ولكن مع حيل هندسية ذكية للحصول على المزيد من الاستفادة مقابل المال على وحدة معالجة الرسوميات".
تجدر الإشارة إلى أن مختبرات أخرى اعتمدت أيضًا هذه التقنيات (يستخدم DeepSeek تقنية "مزيج من الخبراء" لتنشيط جزء فقط من ميزات النموذج لاستعلام محدد. يستخدم GPT-4 أيضًا هذا النهج) . يبتكر إصدار DeepSeek هذا المفهوم من خلال إنشاء فئات أكثر دقة من الخبراء وتطوير طرق أكثر فعالية للتواصل معهم، مما يجعل عملية التدريب نفسها أكثر كفاءة. كما قام فريق DeepSeek بتطوير تقنية تسمى DeepSeekMLA (العقل الباطن متعدد الرؤوس)، والتي تعمل على تقليل الذاكرة المطلوبة لتشغيل نماذج الذكاء الاصطناعي بشكل كبير عن طريق ضغط الطريقة التي تخزن بها النماذج المعلومات وتستردها.
ما صدم العالم لم يكن فقط بنية هذه النماذج، بل حقيقة أنها قادرة على تكرار إنجازات OpenAI بسرعة كبيرة في غضون بضعة أشهر، بدلاً من عام واحد أو أكثر المعتاد بين التطورات الكبرى في الذكاء الاصطناعي. وأضاف برونداج "لقد حان الوقت".
تضع OpenAI نفسها في موقف فريد من نوعه قادر على بناء الذكاء الاصطناعي المتقدم، وقد أكسبها هذا الملف العام للتو دعم المستثمرين لبناء أكبر بنية تحتية لمركز بيانات الذكاء الاصطناعي في العالم. ولكن التكرار السريع لشركة DeepSeek يشير إلى أن المزايا التكنولوجية لن تدوم طويلاً - حتى لو حاولت الشركة إبقاء أساليبها سرية.
"إلى حد ما، من الواضح أن هذه الشركات المغلقة تظل على قيد الحياة بفضل اعتقاد الناس بأنها تقوم بأعظم شيء، وهذه هي الطريقة التي تحافظ بها على قيمتها. ربما تحاول جمع المزيد من المال أو بناء المزيد من الشركات. إنه أمر مبالغ فيه بعض الشيء لأن وأضاف فون فيلا "هناك المزيد من المشاريع". "لا أحد يعلم ما إذا كانوا قد بالغوا في تقدير قوتهم الداخلية، ولكن من الواضح أن هذا في صالحهم."
الحديث عن المال
منذ عام 2022، OpenAI منذ مع إطلاق ChatGPT، بدأ مجتمع الاستثمار يحلم بالذكاء الاصطناعي. إن السؤال ليس ما إذا كنا في فقاعة الذكاء الاصطناعي، بل "هل الفقاعات شيء جيد حقًا؟" (كتبت شركة ديبووتر لإدارة الأصول في عام 2023: "لقد تم إعطاء الفقاعات دلالة سلبية بشكل غير عادل".) ليس من الواضح أن المستثمرين يفهمون إنهم لا يعرفون كيف تعمل الذكاء الاصطناعي، لكنهم يأملون أن يؤدي ذلك على الأقل إلى تحقيق وفورات واسعة النطاق في التكاليف. وأظهر تقرير نشرته شركة PwC في ديسمبر 2024 أن ثلثي المستثمرين الذين شملهم الاستطلاع يتوقعون أن تعمل الذكاء الاصطناعي على زيادة الإنتاجية، كما يتوقع عدد مماثل زيادة الأرباح.
كانت الشركة العامة التي استفادت أكثر من غيرها من دورة الضجيج هي شركة إنفيديا، التي تصنع شرائح متطورة تستخدمها شركات الذكاء الاصطناعي. يعتقد الناس أنه في ظل حمى الذكاء الاصطناعي، فإن شراء أسهم Nvidia هو بمثابة استثمار في الشركة التي تصنع المجارف. من سيسيطر على سباق الذكاء الاصطناعي سيحتاج إلى الكثير من شرائح Nvidia لتشغيل نماذجه. في 27 ديسمبر، أغلق سعر سهم إنفيديا عند 137.01 دولار (حوالي 993.42 يوان) - وهو ما يقرب من 10 أضعاف سعر سهم إنفيديا في أوائل يناير 2023.
إن نجاح DeepSeek يقلب نظرية الاستثمار التي دفعت أسهم Nvidia إلى الارتفاع. إذا كانت الشركة تستخدم الرقائق بالفعل بكفاءة أكبر (بدلاً من مجرد شراء المزيد منها)، فإن الشركات الأخرى سوف تبدأ في القيام بنفس الشيء. وقد يعني هذا صغر حجم السوق بالنسبة لشرائح إنفيديا الأكثر تقدماً، في ظل محاولات الشركات خفض الإنفاق. وقال نافين راو، نائب رئيس الذكاء الاصطناعي في شركة داتابريكس: "كانت توقعات نمو إنفيديا في الواقع "متفائلة" بعض الشيء، لذا أعتقد أن هذا كان رد فعل ضروري". "من غير المرجح أن تتعرض إيرادات إنفيديا الحالية للتهديد؛ ولكن النمو الحاد الذي شهدته الشركة خلال الأعوام القليلة الماضية قد يتأثر". إنفيديا ليست الشركة الوحيدة التي تعتمد على هذه الفلسفة الاستثمارية. في عام 2023، تفوقت الشركات السبع الكبرى وهي Nvidia وMeta وAmazon وTesla وApple وMicrosoft وAlphabet على بقية السوق، حيث زادت قيمتها بنسبة 75%. وواصلوا هذا الارتفاع المذهل في عام 2024، مع تفوق جميع الشركات، باستثناء مايكروسوفت، على مؤشر S&P 500. ومن بين الشركات، لم تتأثر Apple وMeta بحادثة DeepSeek.
ولم يقتصر الحماس على الأسواق العامة. ومع ضخ شركات رأس المال الاستثماري الأموال في هذا المجال، حققت شركات ناشئة مثل OpenAI وAnthropic تقييمات مذهلة بلغت 157 مليار دولار و60 مليار دولار على التوالي. (مليار يوان صيني). الربحية ليست قضية كبيرة. وتتوقع شركة OpenAI أن تخسر 5 مليارات دولار (حوالي 36.3 مليار يوان) في عام 2024، على الرغم من إيراداتها المتوقعة البالغة 3.7 مليار دولار (حوالي 26.8 مليار يوان).
يُظهِر نجاح DeepSeek أن مجرد إلقاء الكثير من الأموال على المشكلة لا يوفر الحماية كما يتصور العديد من الشركات والمستثمرين. ويشير ذلك إلى أن الشركات الناشئة الصغيرة يمكن أن تكون أكثر قدرة على المنافسة مع الشركات العملاقة - بل وحتى تعطيل الشركات الرائدة المعروفة من خلال الابتكار التكنولوجي. ورغم أن هذه أخبار سيئة بالنسبة للشركات العملاقة، فإنها قد تكون أخباراً جيدة لشركات الذكاء الاصطناعي الناشئة الأصغر حجماً، خاصة وأن نماذجها مفتوحة المصدر.
وبينما قد تكون هذه أخبارًا سيئة بالنسبة للشركات العملاقة، فإنها قد تكون أخبارًا جيدة لشركات الذكاء الاصطناعي الناشئة الأصغر حجمًا، خاصة وأن نماذجها مفتوحة المصدر. يزعم فون فيرا من شركة Hugging Face أن نماذج التدريب الأقل تكلفة لن تؤدي في الواقع إلى تقليل متطلبات وحدة معالجة الرسوميات. "إذا كان بإمكانك بناء نموذج قوي للغاية على نطاق أصغر، فلماذا لا تقوم بتوسيع نطاقه مرة أخرى؟" سأل. "ما تفعله بطبيعة الحال هو معرفة كيفية صنع شيء أرخص، فلماذا لا تقوم بتوسيع نطاقه وبناء نسخة أفضل تكلف أكثر."
التحسين ضروري
يُظهِر DeepSeek أنه على الرغم من قوة الحوسبة المحدودة، لا يزال بإمكانك الابتكار من خلال التحسين، بينما تراهن الولايات المتحدة بشكل كبير على الطاقة الخام - من شراكة ألتمان البالغة 500 مليار دولار مع ترامب (يتضح هذا من خلال مشروع "ستارغيت" والتي يبلغ إجمالي استثماراتها حوالي 362.54 مليار يوان صيني. قال برونداج: "تتطلب نماذج الاستدلال مثل R1 من DeepSeek عددًا كبيرًا من وحدات معالجة الرسوميات، وسرعان ما واجهت DeepSeek مشكلة في جعل التطبيق متاحًا لعدد أكبر من المستخدمين". "ونظرًا لهذا، وحقيقة أن توسيع نطاق التعلم التعزيزي سيجعل نماذج DeepSeek أكثر قوة مما هي عليه اليوم، فمن المهم أكثر من أي وقت مضى أن تفرض الولايات المتحدة ضوابط تصدير فعالة على وحدات معالجة الرسوميات." يشعر الناس بالقلق من أنه من المشكوك فيه أن DeepSeek يحقق ما هو موصوف. وقال المحلل في سيتي، عاطف مالك، في مذكرة بحثية: "نتساءل عما إذا كان إنجاز DeepSeek قد تحقق دون استخدام وحدات معالجة رسومية متقدمة للضبط الدقيق و/أو بناء نموذج اللغة الكبير الأساسي الذي يعتمد عليه النموذج النهائي". قالت المحللة ستايسي راسجون من شركة بيرنشتاين في مذكرتها الخاصة: "يبدو أن الادعاء بأن 'DeepSeek استنسخ OpenAI مقابل 5 ملايين دولار' خاطئ تمامًا ونعتقد أنه لا يستحق المناقشة بشكل أكبر". وبالنسبة للآخرين، يبدو أن ضوابط التصدير تؤدي إلى نتائج عكسية: فبدلاً من إبطاء التنمية في البلدان المنافسة، فإنها تجبرها على الابتكار. وفي حين فرضت الولايات المتحدة قيوداً على الوصول إلى الرقائق المتقدمة، فقد توصلت شركات مثل DeepSeek وTongyi Qianwen المملوكة لشركة Alibaba إلى حلول مبتكرة ــ تحسين تقنيات التدريب والاستفادة من تكنولوجيا المصدر المفتوح أثناء تطوير رقائقها الخاصة. لا شك أن البعض سيتساءل عما يعنيه هذا بالنسبة للذكاء الاصطناعي العام، والذي يعتقد خبراء الذكاء الاصطناعي الأكثر خبرة أنه مجرد قلعة في الهواء لجذب رأس المال. (في ديسمبر/كانون الأول الماضي، خفض ألتمان من شركة OpenAI بشكل ملحوظ سقف الذكاء الاصطناعي العام من شيء يمكن أن "يعزز الإنسانية" إلى شيء "أقل أهمية بكثير مما يعتقد الناس"). وبما أن الذكاء الاصطناعي الفائق لا يزال في الأساس خيالاً، فمن الصعب أن نتصوره. ولكن من الصعب أن نعرف ما إذا كان ذلك ممكناً أم لا ــ ناهيك عن أن DeepSeek يمثل خطوة معقولة في هذا الاتجاه. وبهذا المعنى، فإن شعار الحوت الخاص بالشركة هو في محله تماماً؛ فهذه صناعة مليئة بأمثال أهاب. لا يستطيع أحد التنبؤ بالنتيجة النهائية للذكاء الاصطناعي.
متطلبات قادة الذكاء الاصطناعي في المستقبل
لطالما كانت الذكاء الاصطناعي قصة تطور مفرط: تستهلك مراكز البيانات طاقة تعادل طاقة دولة صغيرة، وتكلف التدريب مليارات الدولارات من الدولارات، وشركات التكنولوجيا العملاقة فقط هي القادرة على لعب هذه اللعبة. ويبدو أن ظهور DeepSeek قد قلب هذا الرأي رأساً على عقب بالنسبة لكثير من الناس. في حين يبدو أن نماذج مثل DeepSeek قادرة على حل مشكلة الذكاء الاصطناعي المدمر للبيئة من خلال تقليل تكاليف التدريب، إلا أن الأمور للأسف ليست بهذه البساطة. يتفق كل من برونداج وفون فيلا على أن الموارد الأكثر كفاءة تعني أن الشركات يمكنها استخدام المزيد من قوة الحوسبة للحصول على نماذج أفضل. وأضاف فون فيرا أيضًا أن هذا يعني أن الشركات الناشئة والباحثين الأصغر حجمًا سيكون لديهم وصول أسهل إلى أفضل النماذج، وبالتالي فإن الطلب على الحوسبة سوف يزداد فقط. إن استخدام DeepSeek للبيانات الاصطناعية ليس ثوريًا أيضًا، ولكنه يُظهر أنه من الممكن لمختبرات الذكاء الاصطناعي إنشاء شيء مفيد دون تدمير الإنترنت بالكامل. لكن الضرر قد وقع بالفعل؛ إذ لم يعد هناك سوى شبكة إنترنت واحدة، وقد دربت بالفعل نماذج ستكون أساسية للجيل القادم. لا تحل البيانات الاصطناعية مشكلة العثور على المزيد من بيانات التدريب بشكل كامل، ولكنها نهج واعد.
الشيء الأكثر أهمية الذي يفعله DeepSeek هو: أنه أرخص. لا يتعين عليك أن تكون على دراية بالتكنولوجيا لفهم أن أدوات الذكاء الاصطناعي القوية قد تصبح أكثر تكلفة في المستقبل القريب. ووعد قادة الذكاء الاصطناعي بأن التقدم سيأتي قريبًا. أحد التغييرات المحتملة هو أن يتمكن الآن أي شخص من بناء نموذج Frontier في مرآبه. إن السباق نحو الذكاء الاصطناعي العام هو في معظمه مجرد خيال. لكن المال حقيقي. لقد أثبتت شركة DeepSeek بقوة أن المال وحده لا يمكن أن يمكّن الشركة من تولي زمام المبادرة في هذا المجال. ويمكن أن يؤدي التأثير طويل الأمد إلى إعادة تشكيل صناعة الذكاء الاصطناعي كما نعرفها.