المصدر: AI Technology Review
بعد عاصفة DeepSeek، ما هي التغييرات التي ستحدث في دائرة الشركات الناشئة ذات النماذج الكبيرة في الصين؟
في الأيام الأخيرة، ناقش المؤلف أيضًا مع العديد من الأشخاص في الصناعة ووجد أن هناك حاليًا طرفين متطرفين في دائرة النماذج الكبيرة المحلية: أحدهما متحمس للغاية، والآخر حذر للغاية.
الأولى تمثلها شركات تصنيع الطاقة الحاسوبية ومقدمو خدمات النماذج الذين يتبنون بنشاط نظام DeepSeek البيئي، فضلاً عن المستفيدين من المصادر المفتوحة الذين لم يتمكنوا في الأصل من المشاركة في "سباق التسلح" الكبير للنماذج، في حين أن الأخيرة تمثلها بشكل رئيسي شركات ناشئة صينية كبيرة أخرى (المعروفة باسم "النمور الستة الصغيرة للنماذج الكبيرة") ومشاريع رأس المال الاستثماري التي استثمرت في هذه الشركات في العامين الماضيين، مما يشكل وضعًا "ذو وجهين".
من المفهوم أن بعض فرق VC التي استثمرت في شركات نموذجية كبيرة ذات تقييمات من الدرجة الأولى في العامين الماضيين بدأت في الاستعداد/تقبل "Whippings" الداخلية ، مثلما تكون هناك عدد كبير من الزوايا. لقد استثمرنا مليارات الدولارات ولكن لا يمكننا فعل ذلك؟ uit من النماذج الكبيرة "بعد خروجهم، من سيستثمر في شركات النماذج الست الكبرى؟ وأي منها لديها أمل في الطرح العام؟ وإذا لم يكن الأمر كذلك، فهل يجب علينا إعادة الشراء أو الخروج بعد ذلك؟"
…
"لماذا لم تصبح DeepSeek" و"لماذا يوجد DeepSeek واحد فقط في الصين" هي أسئلة يطرحها جميع ممارسي النماذج الكبرى ومشاريع رأس المال الاستثماري منذ عيد الربيع. يغطي هذان السؤالان تقريبًا كل المخاوف الحالية في الصين بشأن ابتكار النماذج واسعة النطاق. وفقط من خلال مناقشة هاتين القضيتين بجدية يمكننا الإجابة على سؤال آخر أكثر أهمية: كيف نصبح DeepSeek؟
من منظور مقارنة ابتكارات الذكاء الاصطناعي بين الصين والولايات المتحدة، نحاول نقل رسالة إلى الصناعة: الذكاء الاصطناعي الصيني يحتاج إلى الفخر الوطني؛ وفي هذه المقالة، نأمل في الجمع بين تاريخ تطوير النماذج الكبيرة في الصين في السنوات الأربع الماضية لاستكشاف المزيد:
باعتبارنا حسابًا صناعيًا يتابع تقارير النماذج الكبيرة منذ اندلاع GPT-3 في عام 2020، فإن هذه المقالة لا تهدف إلى الإجابة على مثل هذا السؤال الكبير والعميق، ولكنها تقدم فقط بعض الحقائق أو الآراء التي قد تكون ذات صلة بالموضوع من منظور طرف ثالث.
1 الخلل المنهجي
قبل عام 2023، لم يكن هناك سوى 4 شركات نموذجية كبيرة في الصين: Zhipu وMianbi وShenyan وLingxin (استحوذت عليها Zhipu لاحقًا)، وكانت جميعها من جامعة تسينغهوا؛ بعد عام 2023، زاد عدد الشركات الناشئة النموذجية الكبيرة إلى أكثر من اثنتي عشرة شركة. من وجهة نظر فنية، كان السبب المباشر هو أن Llama كانت مفتوحة المصدر، ولكن السبب الأكثر جوهرية هو أن الجميع اعتقدوا في ذلك الوقت:
على الرغم من أن العتبة الفنية للنماذج الكبيرة عالية، إلا أنه ليس من المستحيل تقليدها. وبالنظر إلى النماذج الكبيرة مفتوحة المصدر الموجودة بشكل خاص، فإن الصعوبة التقنية قد تقلصت بشكل أكبر، وأصبحت الحجة القائلة بأن "التكنولوجيا لا يمكن أن تشكل حاجزًا تجاريًا" أكثر شيوعًا.
في ظل "قاعدة" هذا الإجماع الجماعي، نستعرض العديد من ديناميكيات القوة لريادة الأعمال النموذجية الكبيرة في الصين بعد انفجار ChatGPT في عام 2023، وليس من الصعب فهم الظاهرة المشوهة الحالية في منتصف مجال ريادة الأعمال النموذجية الكبيرة في الصين:
أولاً، مع ضعف رهبة السوق بالكامل من الابتكار التكنولوجي، بعد انفجار ChatGPT في عام 2023، من بين الدفعة الأولى من رواد تكنولوجيا النماذج الكبيرة في الصين، أصبحت Zhipu فقط هي المفضلة لدى رأس المال، وكانت أول من اخترق علامة التقييم البالغة 20 مليار يوان وانضم إلى الصف الأول من النماذج الكبيرة. (تأسست شركة Dark Side of the Moon بعد عام 2023، لذا فهي غير مدرجة في القائمة)
واجهت الشركتان الناشئتان الأخريان اللتان خرجتا من مختبر معالجة اللغة الطبيعية بجامعة تسينغهوا (THUNLP) الحائط وتحدثتا بعمق، وكانت أصواتهما في سوق رأس المال أقل بكثير من أصوات القوى الجديدة التي جاءت لاحقًا.
وخاصة شركة Mianbi Intelligence (لأن شنيان اختارت التركيز على المنتجات)، باعتبارها أول شركة في الصين تقترح صنع "نسخة مدنية من النموذج الكبير"، وهي الشركة ذات الرؤية الفنية واتجاه الابتكار الأكثر تشابهًا مع DeepSeek، وحتى أنها تأسست في وقت سابق من DeepSeek، لم تكمل تمويلًا بقيمة 300 مليون يوان صيني إلا في نهاية عام 2024، وكان تقييمها أقل من 3.5 مليار يوان صيني، وهو بعيد كل البعد عن عتبة 20 مليار يوان صيني للمستوى الأول. وفقًا للتبادلات بين Leifeng.com AI Technology Review وأكثر من 50 مستثمرًا كبيرًا في النموذج في العامين الماضيين، هناك العديد من الأسباب الرئيسية التي تجعل Zhipu وMenbi، اللتين نشأتا من جامعة تسينغهوا، تتمتعان بنفس ميزة المبادرة التكنولوجية والمواهب الفنية الشابة المتميزة، مختلفة جدًا: أولاً، تراهن المدرسة الأكاديمية في تسينغهوا التي تسعى إلى النموذج الأساسي على شركة واحدة فقط لأن "لديهم تحفظات بشأن قيام الأساتذة ببدء أعمالهم الخاصة"؛ ثانيًا، رؤية Zhipu أسهل في الفهم. عندما قالت "قياس معيار OpenAI" في تمويلها الخارجي المبكر، فهمها رأس المال الاستثماري على الفور. ومع ذلك، نظرًا لأن Menbi أكدت على تحسين كفاءة تدريب النموذج الأساسي منذ البداية، فقد اعتُبرت ذات يوم شركة "AI Infra" مماثلة لـ Luchen و Silicon Base في عام 2023 عندما كانت الأموال الساخنة أكثر. لم تتلق شركة Mianbi Intelligence الكثير من الأموال في عام 2023 ولم تتمكن من الاستثمار في نماذج أساسية كبيرة. من خلال التدريب باستخدام نماذج أساسية كبيرة مثل DeepSeek V3، يمكنها أن تستجيب بشكل حدسي لأهمية التدريب الفعال. في عام 2024، يمكنها فقط اختيار نماذج صغيرة الحجم، وتأثير التأييد الأخير على "التدريب الفعال" أسوأ بكثير من تأثير DeepSeek V3.
عند جمع الأموال في عامي 2022 و2023، استخدم ميانبي شعار "التدريب الفعال" لجمع الأموال، ولكن تم رفضه دائمًا تقريبًا من قبل شركات رأس المال الاستثماري.
ثانيًا، واستنادًا إلى فرضية عدم وجود رهبة من التكنولوجيا، بعد أن جاءت موجة النماذج الكبيرة في عام 2023، لم تستقر شركات رأس المال الاستثماري المتخصصة في تكنولوجيا الذكاء الاصطناعي في الصين على دراسة تكنولوجيا الذكاء الاصطناعي العام. بدلاً من ذلك، من أجل الوصول إلى الطاولة بسرعة، استثمروا الأموال في "رواد أعمال ناجحين متسلسلين فازوا بالمعارك"، حتى لو لم تكن هذه الفرق لديها خبرة في البحث والتطوير للنماذج الكبيرة من قبل.
ومن بين هؤلاء الممثلين الأكثر نموذجية هم Light Years Away لوانغ هوي وين وBaichuan Intelligence لوانغ شياوتشوان.
من بين شركات النماذج الكبيرة التي تبلغ قيمتها الحالية أكثر من 20 مليار يوان، فقط تانغ جيه من شركة Zhipu ويانغ تشيلين من شركة Dark Side of the Moon وآخرون بدأوا في استكشاف تكنولوجيا النماذج الكبيرة في عام 2020 عندما لم تكن النماذج الكبيرة قد أصبحت شائعة بعد. بدأت معظم فرق Baichuan Intelligence وMiniMax وStep Star بعد عام 2023.
على سبيل المثال، جاء يان جونجي، مؤسس شركة ميني ماكس، من خلفية في مجال الرؤية الحاسوبية، وكان النموذج الكبير يحل في البداية ذكاء اللغة (التعدد الوسائط هو فصل آخر). ومع ذلك، اكتسبت شركة MiniMax في البداية استحسان رأس المال من خلال الاعتماد على منتجها Glow بدلاً من تقنية النماذج واسعة النطاق الأساسية، لذا فهذا بُعد آخر، ويصفه جميع الأشخاص المقربين من يان جونجي بأنه "متقدم للغاية من الناحية التكنولوجية". كما بدأ فريق البحث والتطوير في DeepSeek في تعلم تقنية النماذج الكبيرة من الصفر، ودراسة الأوراق والعمل الجاد على التجارب، لذلك لا يوجد ما يشير إلى أن الفريق الذي لم يدرب نموذجًا كبيرًا من قبل لا يمكنه تعويض أوجه القصور الفنية من خلال العمل الجاد بعد عام 2023. ومع ذلك، بناءً على تطور الصناعة في العامين الماضيين، لم تقم Baichuan Intelligence بترقية نموذجها الأساسي بشكل متكرر، وتحول تركيزها إلى النماذج الكبيرة في الصناعة الطبية.
نظرًا لأنها لا تدرب نماذج كبيرة مثل مقاطع الفيديو، فإن تكاليف البحث والتطوير في Baichuan أقل من الشركات الأخرى وتدفقاتها النقدية وفيرة - ولكن هذا مفيد فقط لشركة Baichuan ولا يساهم في تطوير صناعة النماذج الكبيرة بأكملها.
إذا افترضنا أن الموارد محدودة، فإن الفريق الذي يفتقر إلى القدرات الفنية يستهلك قدرًا كبيرًا من موارد رأس المال، في حين لا يستطيع الفريق الذي يتمتع بالقدرات الفنية الحصول إلا على قدر ضئيل للغاية من موارد رأس المال. ومن المؤكد أن عدم التوافق المنهجي بين المال والموهبة لن يؤدي إلا إلى الندم وعدم وجود مستقبل.
إذا لم يكن لتكنولوجيا نموذج الذكاء الاصطناعي العام واسعة النطاق أي مجال للنمو وتم تسوية الحواجز التقنية لكل شركة تدريجياً، فإن استراتيجية التنافس على الموارد ورأس المال في عصر الإنترنت قد تكون قادرة على الحصول على القطعة الأخيرة من الكعكة. ومع ذلك، فإن رواد الأعمال الذين يخشون التكنولوجيا يظلون دائمًا في حالة ذهنية صافية ويمكنهم أن يروا أوجه القصور في الخوارزميات والهياكل الأساسية للنماذج الكبيرة الموجودة في التدريب والاستدلال. وهم يدركون أن الذكاء الاصطناعي العام لا يزال لديه العديد من المشاكل المحددة والصعبة التي يتعين حلها.
بعبارة أخرى، لا تزال قدرة الابتكار المستمر للتكنولوجيا الأساسية تشكل الخندق الذي تسلكه الشركات النموذجية الكبرى، ولا تنطبق منهجية الإنترنت الخاصة بالمنافسة على الموارد البحتة على التطور الحالي للنماذج الكبرى في الصين. ——لكن من غير المرجح أن تتعرف أغلب شركات رأس المال الاستثماري الصينية المتخصصة في التكنولوجيا على هذه الكلمات، لأن الاستثمارات الكبيرة في النماذج في عامي 2023 و2024 سوف تتبنى نهج "صفقة النادي"... ففي العامين الماضيين من تطوير النماذج الكبيرة، قد تكون شركة رأس المال الاستثماري التي لا ترغب في تعلم التكنولوجيا أكثر تدميراً من شركة البحث والتطوير التي لا ترغب في تعلم التكنولوجيا.
سوف تنتهي الفقاعة في نهاية المطاف. عندما ينحسر المد، سوف يتضح من يسبح عارياً.
2 من الصعب العثور على الذكاء الاصطناعي العام
وهناك تأثير آخر لعدم إعجاب السوق بالتكنولوجيا وهو أنه من أجل تلبية احتياجات السوق (وبالطبع اختراق حصار الشركات المصنعة الكبرى)، حولت الشركات الناشئة ذات النماذج واسعة النطاق في الصين على مدى العامين الماضيين تركيزها من الذكاء الاصطناعي العام الطويل الأجل إلى الاستحواذ التجاري قصير الأجل وصقل المنتجات.
ويرجع هذا التغيير في الاستراتيجية أيضًا إلى سوء تقدير الصناعة المذكورة أعلاه، والتي اعتقدت أن النموذج الكبير لم يعد لديه المزيد من الابتكار. يتعين على رواد الأعمال الذين يعتزمون متابعة الذكاء الاصطناعي العام أن يأخذوا في الاعتبار كلاً من الأعمال والتكنولوجيا. ويتعين على الفرق التي تشكك في الذكاء الاصطناعي العام أو التي تشعر بالارتباك الشديد إزاء صوت السوق أن تتخلى عن التدريب المسبق، أو تلجأ إلى تطبيقات C-end، أو ببساطة تعمل على ضبط النماذج الكبيرة في الصناعة بناءً على نماذج مفتوحة المصدر.
استغرق الأمر عامين ونصفًا من ظهور GPT-3 إلى ChatGPT، لكن السوق أظهر بشكل عام "قاعدة": استغرقت النماذج المحلية الكبيرة عامين فقط من التأسيس إلى التسويق التجاري. على الرغم من أن بعض شركات النماذج الكبيرة يمكنها الالتزام بخطوتي "L2" و"L4" في نفس الوقت، فلا يمكن لأي شركة أن تكون نقية مثل DeepSeek في استثمارها في المواهب وموارد البحث في مجال الذكاء الاصطناعي العام. عندما بدأت حرب التمويل للتو في النصف الأول من عام 2023، كان التحليل في الصناعة هو: بعد "معمودية" الجيل السابق من شركات الذكاء الاصطناعي، تم تقصير صبر شركات رأس المال الاستثماري الصينية على تسويق الشركات ذات النماذج الكبيرة من 5 إلى 8 سنوات إلى 3 سنوات فقط. ——ربما تكون هذه هي المعضلة المشتركة التي تواجهها الشركات النموذجية الكبيرة في الصين.
كما نعلم جميعًا: تركز DeepSeek على أبحاث الذكاء الاصطناعي العام وتعتمد على أموال الاحتياطي الأصلية الخاصة بـ Liang Wenfeng وHuanfang Quantitative، دون أي تمويل خارجي. "لدينا المال، لذلك لا نحتاج إلى الاستماع إلى الغرباء ويمكننا أن نفعل ما نريد" - وهذا أيضًا ما تحسده عليه العديد من الشركات النموذجية الكبيرة في DeepSeek.
في الآونة الأخيرة، غير تشو شياوهو، الذي انتقد الذكاء الاصطناعي العام في البداية، رأيه وقال إنه نظرًا لأن DeepSeek كانت على استعداد للاستثمار في الذكاء الاصطناعي العام، فيمكن القول إن DeepSeek غيرت وجهة نظر رأس المال الاستثماري بقوتها التقنية القوية. ومع ذلك، فإن الواقع الأكثر قسوة هو: قد يسقط عدد كبير من الفرق ذات القدرات الإبداعية القوية على أعتاب العصر لأنها لا تستطيع جمع الأموال.
لا ينعكس "التفكير التجاري" فقط في ظل بعض شركات رأس المال الاستثماري في مجال التكنولوجيا، بل أيضًا في اختيار المواهب في مجال البحث والتطوير.
وفقًا لتعليقات الباحثين عن المواهب، في عام 2024، ستكون شركة ByteDance بلا شك الشركة التي تنفق أكثر على المواهب في الصين. لقد تم بالفعل تشكيل التمييز بين الشركات الكبيرة والفرق الريادية، وأصبح تدفق المواهب النموذجية الكبيرة من الفرق الريادية إلى الشركات الكبيرة خيارًا شائعًا في العام الماضي. على سبيل المثال، وفقًا لمراجعة تقنية الذكاء الاصطناعي، اختارت العديد من المواهب المتميزة في معالجة اللغة الطبيعية والتعلم المتعدد الوسائط والتعلم المعزز التي كانت DeepSeek تبحث عنها لتطوير الذكاء الاصطناعي العام، شركة ByteDance بدلاً من DeepSeek. وفقًا لمسؤول توظيف خدم DeepSeek في الأيام الأولى، كانت DeepSeek تأمل أيضًا في توظيف أفضل المواهب من فرق خارجية مثل Google وMeta وOpenAI، لكن التقدم لم يكن سلسًا، لذلك كان عليها أن تكتفي بالثاني الأفضل وتدريب مواهبها الخاصة.
إن الاستثمار في الذكاء الاصطناعي العام لا يتطلب المال فحسب، بل يتطلب أيضًا الأشخاص، ومجموعة من المثاليين التقنيين المطلقين، وثقافة تنظيمية ممتازة. ربما لا يمكن تكرار نجاح DeepSeek، ولكن من V2، V3 إلى R1، R1-Zero، تعكس النتائج الفنية لشركة DeepSeek مزاياها في التمويل والمواهب/المثل والثقافة التنظيمية.
قبل DeepSeek، كان "Bei Jiukun وNan Huanfang" معروفين بالفعل في مجال البحث الكمي المالي، كما أن المتطلبات العالية لصناعة الكم للمواهب الفنية معروفة أيضًا. في الأساس، حجم الفريق صغير، لكن القدرات قوية للغاية، استنادًا إلى أفضل جامعتين وحائزين على الميداليات الذهبية في مسابقات المعلوماتية. وفقًا لـ AI Technology Review، في النصف الأول من عام 2024، كان حجم فريق DeepSeek يزيد عن 40 شخصًا فقط، وكان معظمهم من الخبراء الفنيين من Magic Square Top2 الأصلي.
استمرارًا لنمط Magic Square الأصلي، كانت عتبة التوظيف في DeepSeek دائمًا مرتفعة للغاية. على سبيل المثال، بدأوا في البحث عن خبراء تقنيين في مجالات التعلم المتعدد الوسائط والتعلم المعزز في منتصف عام 2024، ولكن بعد نصف عام من التوظيف، لا تزال الوظائف ذات الصلة شاغرة، لذلك يفضلون عدم وجود أحد بدلاً من توظيف الشخص الخطأ. بعد أن أصبح R1 شائعًا، زاد عدد السير الذاتية المقدمة بشكل كبير، ولكن وفقًا لأشخاص مطلعين على الأمر، "ليس هناك الكثير من السير الذاتية المناسبة".
الثقافة التنظيمية داخل DeepSeek مسطحة للغاية أيضًا. وفقًا لمجلة AI Technology Review، هناك رئيس واحد فقط في كل من بكين وهانغتشو: ليانغ وينفينغ، مؤسس DeepSeek. "تقريبًا جميع الأشخاص الذين يعملون تحت ليانغ ونفنغ هم عمال."
بالإضافة إلى ذلك، فإن أسلوب ليانغ ونفنغ الشخصي واضح جدًا أيضًا: فهو يؤمن إيمانًا قويًا بالتكنولوجيا، وهو فضولي للغاية ومتعطش للمعرفة حول الذكاء الاصطناعي العام، وهو مجتهد للغاية. وصف أحد المقربين من ليانغ ونفنغ أن ليانغ ونفنغ "يتحدث ببطء شديد، ويفكر لفترة طويلة جدًا قبل التعبير عن كل جملة، وتعبيراته موجزة للغاية. وعلى الرغم من كونها موجزة، إلا أن كلماته غالبًا ما تكون في صميم الموضوع".
تتشابه ثقافة فريق DeepSeek إلى حد كبير مع ثقافة شركات مثل Yushu وMomenta: فالشخص الأول المسؤول هو متحمس للتكنولوجيا لديه رهبة طبيعية وفضول تجاه التكنولوجيا؛ وفي الوقت نفسه، من الواضح أن أسلوب الإدارة مركزي والثقافة مسطحة، لذلك عندما تواجه صعوبات في الاستكشاف التكنولوجي، يمكن تنسيق الموارد من أعلى إلى أسفل لتحقيق تأثير التحميل والتنزيل بسرعة.
وفي الوقت نفسه، تمتلك كل من Yushu وDeepSeek أيضًا مجموعة معايير خاصة بهما عند التوظيف، والتي تختلف كثيرًا عن إجراءات المقابلات النمطية في السوق. يمكن للقراء المهتمين أن يذهبوا ويكتشفوا ذلك. بدأ ليانغ وينفنغ من شركة DeepSeek في استكشاف كيفية تدريب نماذج أقوى بتكلفة أقل في وقت مبكر جدًا، ولكن الصناعة بشكل عام لم تفهم ذلك في ذلك الوقت. وعلى نحو مماثل، بدأ وانج شينغ شينغ من شركة يوشو في تصنيع كلاب روبوتية رباعية الأرجل عندما كان الناس لا يزالون لا يفهمون ما هي الكلاب الروبوتية. كما بدأ كاو شو دونج من شركة مومينتا العمل على L2 وL4 في نفس الوقت الذي كانت فيه صناعة القيادة الذاتية لا تزال مهووسة بشكل عام بـ L4، التي تمشي على قدمين.
يحتاج فريق الشركات الناشئة الذي يجرؤ على الذهاب ضد التيار السائد إلى روح متمردة قوية. في التبادلات بين AI Technology Review والعديد من المستثمرين، يمكن تصنيف هذا النوع من "التمرد" بسهولة على أنه "شباب"، ولكن في رأيي، ثقة التمرد تأتي في نهاية المطاف من إدراك الفريق وحكمه وثقته التقنية في المشاكل الاجتماعية التي يريدون حلها، أي: الإيمان الراسخ بأن اتجاه تقدمهم هو المستقبل وسيحقق قيمة هائلة.
3 طعم الابتكار
بعد أن أثار V2 حرب أسعار، علق ليانج وينفينج على هذا الإنجاز التكنولوجي في مقابلة مع "Undercurrent": "من بين العديد من الابتكارات التي تحدث كل يوم في الولايات المتحدة، يعد هذا ابتكارًا عاديًا للغاية."
بعد V3 وR1، لم يتحدث ليانج وينفينج بعد، ولكن بالنسبة لـ DeepSeek وLiang Wenfeng، قبل التحقيق الكامل للذكاء الاصطناعي العام، ربما تكون ابتكارات V3 وR1 مجرد "ابتكارات عادية للغاية". ——هذا لا ينفي الإنجازات والمزايا التي حققها الأخيران، بل يهدف إلى تسليط الضوء على أن الفريق الذي يتمتع بطموحات عالية سيقول غالبًا إن شيئًا يستحق 100 نقطة يستحق 80 نقطة، وسيسعى دائمًا للحصول على نقاط إضافية.
بعد إصدار R1، قال أحد كبار علماء التعلم التعزيزي في الصناعة لمجلة AI Technology Review: "بعد استبدال نموذج RL+SFT بخوارزميات RL نقية، أعتقد أن الذكاء الاصطناعي العام سيتحقق في غضون ثلاث سنوات على أقصى تقدير".
قال سام ألتمان إن الذكاء الاصطناعي سيتفوق على البشر في عام 2025، وقال ماسك أيضًا إن الذكاء الاصطناعي العام يمكن أن يتحقق في عام 2026 على أقصى تقدير. ——في التنبؤات المختلفة لـ "نقاط وقت الذكاء الاصطناعي العام"، على الرغم من أنه من الصعب علينا الحكم على متى سيحدث ذلك بالضبط، إلا أننا نشعر بأن مثل هذا الاتجاه الرئيسي يحدث.
الاتجاه معروف، والاختراق الذي حققته شركة DeepSeek جعل الجميع يدركون حقيقتين على الأقل:أولاً، لم تصل تكنولوجيا الذكاء الاصطناعي العام إلى سقفها، وثانياً، إن فريق التكنولوجيا في الصين قادر على تقديم ابتكارات تقود العالم في مجال الذكاء الاصطناعي العام. وبالمقارنة بالهوس بفوز DeepSeek، فإن الأمر الأكثر أهمية هو كيفية تعزيز تطوير الذكاء الاصطناعي العام في الصين في المستقبل.
في النصف الشهري الماضي، جلبت عاصفة DeepSeek تغييرات جديدة في تصور تطوير الذكاء الاصطناعي العام بين الشركات الكبرى والشركات الناشئة ومصنعي الطاقة الحاسوبية والمستثمرين وما إلى ذلك. لقد حظيت بعض القضايا الضخمة التي تم تجاهلها في الماضي باهتمام متجدد، في حين تم إسقاط بعض وجهات النظر القديمة. لكن التغيير الثابت هو أن الجميع يدركون أنه في هذه المرحلة، لا يزال تحقيق الذكاء الاصطناعي العام يتطلب المثالية.
بدلاً من تخمين ما ستفعله OpenAI أو DeepSeek بعد ذلك، من المهم استنتاج المشكلات الفنية التي تحتاج AGI إلى حلها. بمعنى آخر، الابتكار أهم من التقليد.
في الواقع، وفقًا للمقابلات التي أجريت مع AI Technology Review على مدار العام الماضي، بالإضافة إلى DeepSeek، هناك أيضًا العديد من المواهب في مجال الذكاء الاصطناعي في الصين الذين يواصلون الابتكار والتوصل إلى حلول جديدة لحل المشكلات التي لم يتم حلها. ولذكر بعضها فقط:
أكّد البروفيسور ما يي، عميد معهد الحوسبة وعلوم البيانات في جامعة هونج كونج، خلال العامين الماضيين على أن النماذج الكبيرة التي يتم تدريبها حاليًا من خلال قوة حوسبة عالية تمتلك المعرفة، وليس الذكاء. على عكس طبيعة الصندوق الأسود للتعلم العميق، كان فريق ما يي ملتزمًا بالبحث في خوارزميات وإطارات الذكاء الاصطناعي القابلة للتفسير والتحكم (نظرية الصندوق الأبيض).
في مؤتمر CNCC 2024، ذكر تانغ جيه من شركة Zhipu التطور القادم لتكنولوجيا الوسائط المتعددة. منذ عام 2021، بدأ فريق Zhipu في استكشاف النماذج الكبيرة متعددة الوسائط. وبحسب فريق Zhipu، فقد واجهوا مشكلة مماثلة في استكشافهم المبكر: عندما تم إدخال بيانات متعددة الوسائط مثل النصوص والصور والصوت والفيديو في وقت واحد في نموذج تدريبي كبير، بدا أن بيانات أحد الوسائط تضعف المعرفة/الذكاء لنمط آخر. على الرغم من أن تعدد الوسائط يمثل اتجاهاً، إلا أنه لا يزال هناك مجال كبير للبحث حول كيفية تحسين محاذاة البيانات عبر الوسائط، وجمع البيانات عالية الجودة، وتعزيز الحس السليم وقدرات التفكير في النماذج متعددة الوسائط.
وفقًا للتواصل مع العديد من الأعضاء المؤسسين لفريق Wall-Facing Team في مارس 2024، فإن بنية النموذج السائدة الحالية واسعة النطاق غير قادرة في الواقع على حل العديد من المشكلات الرئيسية بشكل جيد، مما يجعل من الصعب التعامل مع الذكاء الاصطناعي العام: مثل التعلم من خلال التجربة والذاكرة المكانية. على سبيل المثال، يمكن للأشخاص أن يصبحوا أكثر كفاءة من خلال تعلم شيء واحد عدة مرات، أو أن يصبحوا على دراية سريعة ببيئة جديدة وينقلون بشكل فعال معرفة مشكلة أخرى إلى البيئة الجديدة. ليس من السهل التعبير عن هذه المشاكل باستخدام محول التيار.
مع تطور الذكاء المجسد، سيتم تقسيم الذكاء العام الاصطناعي بشكل طبيعي إلى الذكاء العام الاصطناعي القائم على السحابة والذكاء العام الاصطناعي القائم على الحافة. يشير مصطلح الذكاء الاصطناعي على جانب الحافة إلى نموذج يمكنه إدراك البيئة بشكل طبيعي وإجراء تفكير رفيع المستوى، ويمكنه اتخاذ قرارات معقدة متعددة الخطوات بناءً على التفكير رفيع المستوى. إن الدماغ المجسد والدماغ الشعبي يتطوران وفق هذا الاتجاه، ولا تزال هناك العديد من المشاكل التي يتعين حلها في هذا الاتجاه. ولحل هذه المشاكل، فإننا نحتاج بالإضافة إلى الموارد إلى قوة تقنية قوية ورؤية تقنية.
بعد إصدار o1، بدأت العديد من الدراسات في مجال النماذج الكبيرة تتجه نحو المنطق، ولكن وفقًا للشائعات: أكمل فريق Gemini التابع لشركة Google مؤخرًا جيلًا جديدًا من النماذج الأساسية وفتحه لعدد صغير من المستخدمين للاختبار. على الرغم من أن سعر سهم جوجل انخفض بشكل حاد في عام 2023 بسبب الضربة التي وجهتها OpenAI، إذا نظرنا إلى تقنية النموذج الكبير لشركة جوجل من يونيو 2020 إلى عام 2022، يمكننا أن نجد أن نهج النموذج الكبير لشركة جوجل هو بناء نظام من الأسفل إلى الأعلى، من قوة الحوسبة والهندسة المعمارية الأساسية إلى الخوارزميات ذات المستوى الأعلى. وقد يكون هذا أيضًا أحد الأسباب المهمة التي جعلت Google Gemini قادرًا على تحقيق تقدم كبير في وقت لاحق.
الشيء نفسه ينطبق على مسار DeepSeek. وفقًا للإفصاح الفني لشركة DeepSeek، فإن مسارها لبحث النماذج الكبيرة هو أيضًا المرور عبر مجموعة Wanka الأساسية وإطار عمل HAI للأعلى لبناء نظام فني متشابك.
لا يمكننا أن نقود هذا الاتجاه إلا من خلال البقاء يقظين ضد السلطة، والعمل دائمًا إلى الوراء من جوهر المشكلة، والابتكار بحزم. قد تذهب الأموال السريعة قصيرة الأجل إلى المحظوظين، ولكن الموارد طويلة الأجل يجب أن تذهب إلى تلك الفرق التي تتفوق في تطبيق الموارد على أفضل وجه. آمل أنه بحلول عام 2025 لن يكون هناك DeepSeek واحد فقط في الصين.