في خطوة رائدة، قدمت جوجل برنامج Gemini، وهو عبارة عن مجموعة من أدوات الذكاء الاصطناعي المصممة لكل من المستهلكين والشركات.
تتألف المجموعة من إصدارات Nano وPro وUltra، التي تدمج النصوص والصور والصوت والفيديو بسلاسة، مما يدفع حدود قدرات الذكاء الاصطناعي.
الكشف عن الجوزاء
تمثل سلسلة Gemini من Google قفزة كبيرة في الذكاء الاصطناعي متعدد الوسائط. على عكس منافسيها، يتضمن نهج Google استخدام "الوسائط المتعددة الأصلية" التدريب، مما يمكّن النموذج من معالجة أنواع البيانات المختلفة في وقت واحد.
حقق الإصدار الأكثر تقدمًا Gemini Ultra نتائج رائعة عبر المعايير، حيث طابق الأداء البشري أو تجاوزه في العديد من الحالات.
نهج التدريب الفريد
السمة المميزة لـ Gemini هي أنها "متعددة الوسائط أصلاً". منهجية التدريب، وتمييزها عن أنظمة الذكاء الاصطناعي متعددة الوسائط الحالية.
على عكس النماذج التي تجمع بين أوضاع ووحدات منفصلة لاحقًا في العملية، تم تصميم Gemini من الصفر لاستيعاب المدخلات المختلفة.
يهدف هذا النهج التدريبي الاستراتيجي إلى تعزيز فهم النموذج وقدراته على حل المشكلات.
الجوزاء مقابل المنافسين
يثير الكشف عن Gemini مقارنات مع ChatGPT من OpenAI، وهو نموذج ذكاء اصطناعي نال استحسانًا واسع النطاق. يتم وضع Gemini من Google كمنافس هائل، لا سيما الإصدار Pro، الذي يهدف إلى تحقيق التوازن بين السرعة والقدرة.
تشمل التحسينات التي تم الترويج لها في النموذج فهمًا أفضل لنية المستخدم وتعزيز الدقة الواقعية وتحسين الأداء العام.
بارد مدعوم من الجوزاء
يحقق برنامج الدردشة الآلي Bard من Google قفزة كبيرة للأمام من خلال تكامل Gemini. يهدف Bard الذي تم تشغيله حديثًا، والذي يقوم الآن بتشغيل Gemini Pro، إلى منافسة قدرات ChatGPT.
تصف سيسي هسياو، رئيسة Bard والمساعد في Google، برنامج Gemini بأنه "أكبر وأفضل ترقية حتى الآن". بالنسبة لبارد، يعد بتحسينات ملحوظة في المهام المختلفة، بدءًا من التلخيص وحتى العصف الذهني.
براعة الجوزاء المتعددة الوسائط
تكمن القوة الحقيقية لـ Gemini في إمكانيات الوسائط المتعددة الأصلية. يسلط ديميس هاسابيس، رئيس Google DeepMind، الضوء على التكامل السلس للنموذج والتفكير عبر الطرائق.
تشمل العروض التوضيحية مستخدم YouTube Mark Rober الذي يستخدم Bard لتصميم طائرة ورقية مع تعليقات الذكاء الاصطناعي المستندة إلى الصور وأولياء الأمور الذين يطلبون المساعدة في واجبات أطفالهم المنزلية من خلال تحميل الصور.
افاق المستقبل
تتصور Google مستقبلًا موسعًا لـ Gemini، مع خطط لإطلاق Bard Advanced، المدعوم من Gemini Ultra، في العام المقبل. يمتد تنوع الوسائط المتعددة في Gemini Ultra إلى ما هو أبعد من النص، مما يسمح بالتفاعل مع الصور والصوت والفيديو.
ويرى ساندر بيتشاي، الرئيس التنفيذي لشركة Google، أن هذا الإطلاق هو بداية عصر الجوزاء، مما يؤكد على إمكانات النموذج الجديد لمنافسة نظرائه الراسخين.
تأثير الجوزاء على مشهد الذكاء الاصطناعي
تبرز شركة Gemini من Google كأداة محتملة لتغيير قواعد اللعبة في مشهد الذكاء الاصطناعي، حيث تقدم إمكانات محلية متعددة الوسائط وتضع معايير جديدة في الأداء وتعدد الاستخدامات.
يشير الإصدار Pro من Gemini، الذي يعمل على تشغيل Bard، إلى نية Google في التنافس بشكل مباشر مع نماذج الذكاء الاصطناعي الراسخة، مما يعد المستخدمين بتجربة Chatbot أكثر كفاءة وقدرة.