كشف OpenAI عن GTBot، الخاص بهمأحدث بوت الزحف على شبكة الإنترنت ، أثار الترقب للإصدار القادم من GPT-5، كما أشارإيداع العلامات التجارية .
وعلى الرغم من أن هذه الخطوة تهدف إلى تعزيز التدريب على الذكاء الاصطناعي، إلا أنها أثارت مناقشات حول الموافقة والشفافية.
قدمت OpenAI برنامج GTBot لجمع مصادر بيانات أوسع لأنظمة الذكاء الاصطناعي من الجيل التالي.
تهدف الشركة إلى توسيع مجموعة البيانات الخاصة بها مع اتخاذ خطوات لمعالجة مخاوف الخصوصية وقضايا حقوق الطبع والنشر.
تم تصميم GTBot لجمع البيانات التي يمكن الوصول إليها بشكل عام من مواقع الويب، واعتماد نظام إلغاء الاشتراك مشابه لمحركات البحث الشائعة مثل Google وBing وYandex.
ويفترض أن البيانات قابلة للاستخدام ما لم يستخدم مالك موقع الويب خيار "عدم السماح" القاعدة في ملف الخادم لمنع الزاحف من الوصول إلى محتواه.
تؤكد OpenAI أن شركة GTBot ستقوم بفحص البيانات المجمعة بشكل استباقي لإزالة المعلومات الحساسة والمحتوى الذي ينتهك سياساتها.
يعرب بعض علماء أخلاقيات التكنولوجيا عن تحفظاتهم بشأن نهج إلغاء الاشتراك، مشيرين إلى التحديات المحتملة المتعلقة بالموافقة.
في حين أن بعض المستخدمين يدعمون حاجة OpenAI إلى بيانات شاملة، أعرب آخرون عن مخاوفهم بشأن الإسناد المناسب والشفافية، ومقارنة الممارسة بالأعمال المشتقة دون الاستشهاد.
طلب العلامة التجارية "GPT-5" يضيف وزنًا إلى الافتراض القائل بأن OpenAI تقوم بإعداد نموذج الذكاء الاصطناعي التالي الخاص بها للإصدار.
تشير هذه الخطوة إلى التحول نحو نهج أكثر اتساعًا لجمع البيانات، مع التركيز على أهمية بيانات التدريب المحدثة والمتنوعة.
يتميز ChatGPT بقاعدة واسعة من المستخدمين، حيث يجذب أكثر من 1.5 مليار مستخدم نشط شهريًا.
تقييد الوصول إلى GTBot
في حال كان أصحاب مواقع الويب يعتزمون تقييد وصول GTBot إلى موقعهم، فيمكنهم إجراء تعديلات على ملف robots.txt الخاص بهم.
إذا كانوا يرغبون في القيام بذلك، فيمكنهم منع دخول GTBot إلى موقعهم الإلكتروني بالكامل.
ومع ذلك، يمكن لأولئك الذين يريدون منح الوصول الجزئي القيام بذلك عن طريق تخصيص الدلائل التي يمكن لـ GTTBot الوصول إليها.
وللقيام بذلك، يتعين عليهم تعديل ملف robots.txt الخاص بهم.