تسجيل الدخول/ اشتراك

علم الذكاء الاصطناعي الباريدوليا: هل تستطيع الآلات رؤية الوجوه في الأشياء مثلما نفعل؟

٢٠٢٤/١٠/٠٣ ١٧:٣٢

يتبع

في عام 1994، ادعت مصممة المجوهرات في فلوريدا ديانا دويزر أنها رأت وجه العذراء مريم على شطيرة جبن مشوية - وهو الاكتشاف الذي باعت به مزادًا مقابل 28000 دولار. وبينما تصدرت الحادثة عناوين الأخبار، فقد لفتت الانتباه أيضًا إلى ظاهرة نفسية قديمة تُعرف باسم الباريدوليا، حيث يرى الناس وجوهًا أو أنماطًا في أشياء غير حية. ولكن ما الذي يحفز هذا الاتجاه بالضبط، وهل يمكن للآلات، مع قدراتها المتقدمة، أن تختبر الباريدوليا بنفس الطريقة التي يختبرها بها البشر؟
تهدف دراسة جديدة رائدة أجراها مختبر علوم الكمبيوتر والذكاء الاصطناعي التابع لمعهد ماساتشوستس للتكنولوجيا إلى الإجابة على هذه الأسئلة، وذلك من خلال تقديم مجموعة بيانات شاملة تضم 5000 صورة تحمل أسماء بشرية لوجوه وهمية. وقد سمحت هذه المجموعة من البيانات للباحثين بالتعمق في الفروق الدقيقة في كيفية معالجة البشر وأنظمة الذكاء الاصطناعي لهذه الوجوه الوهمية، وكشف النقاب عن رؤى غير متوقعة على طول الطريق.

أصول ظاهرة باريدوليا الوجه
وتستكشف الدراسة، التي قادها مارك هاملتون، طالب الدكتوراه في معهد ماساتشوستس للتكنولوجيا، الأصول العميقة لظاهرة باريدوليا الوجوه. ويوضح هاملتون: "لطالما أذهلت ظاهرة باريدوليا الوجوه علماء النفس، لكنها لم تُستكشف إلى حد كبير في مجتمع الرؤية الحاسوبية". وكان هدف الفريق هو سد هذه الفجوة والتحقيق في كيفية اكتشاف البشر والذكاء الاصطناعي للوجوه في أماكن لا وجود لها تقنيًا، مثل السحب أو المقابس الكهربائية أو حتى شطائر الجبن المشوي.

صراع الذكاء الاصطناعي للتعرف على الوجوه الباريدولية
كان أحد النتائج الرئيسية هو أن نماذج الذكاء الاصطناعي، في البداية، لم تتعرف على الوجوه الباريدولية بنفس الطريقة التي يتعرف بها البشر. في حين يمكن للبشر "رؤية" وجه على الفور في شيء يومي، مثل المصابيح الأمامية للسيارة أو نمط على الأرض، فإن الآلات تتطلب تدريبًا أكثر تعقيدًا. أظهر البحث أنه لم يتم ضبط الخوارزميات لاكتشاف وجوه الحيوانات حتى أصبحت أفضل بشكل ملحوظ في التعرف على الوجوه الباريدولية.
يشير هذا الارتباط المدهش بين التعرف على وجوه الحيوانات وإدراك الوجوه الوهمية إلى أصل تطوري محتمل للباريدوليا. ربما كان رصد الوجوه، وخاصة وجوه الحيوانات المفترسة أو الفرائس، آلية للبقاء لدى أسلافنا البعيدين. يقول هاملتون: "تشير هذه النتيجة إلى أن الباريدوليا ربما لا تنشأ من السلوك الاجتماعي البشري، بل من شيء أعمق: مثل رصد نمر كامن بسرعة أو تحديد الاتجاه الذي ينظر إليه الغزال حتى يتمكن أسلافنا الأوائل من الصيد".

منطقة جولديلوكس في باريدوليا
ومن بين الاكتشافات المهمة الأخرى التي توصلت إليها دراسة معهد ماساتشوستس للتكنولوجيا تحديد "منطقة جولديلوكس في باريدوليا". ويشير هذا المصطلح إلى نطاق محدد من التعقيد البصري حيث يكون من المرجح أن يدرك البشر والآلات الوجوه في الأشياء غير الوجوه. ووفقا لويليام تي فريمان، أستاذ معهد ماساتشوستس للتكنولوجيا والمحقق الرئيسي في المشروع، إذا كانت الصورة بسيطة للغاية، فلن تكون هناك تفاصيل كافية لتشكيل وجه، ولكن إذا كانت معقدة للغاية، فإنها تصبح ضوضاء بصرية.
ولنمذجة هذه الظاهرة، طور الباحثون صيغة تتنبأ بالمكان الذي من المرجح أن تحدث فيه ظاهرة الباريدوليا. ووجدوا أن احتمال اكتشاف الوجوه يبلغ ذروته ضمن نطاق معين من التعقيد، وهو ما أثبتوه من خلال الاختبارات التي أجريت على البشر وأنظمة الذكاء الاصطناعي. وتسلط هذه "الذروة الباريدولية" الضوء على التوازن الدقيق بين البساطة والتعقيد المطلوب لأدمغتنا ــ والآن الآلات ــ لإدراك الوجوه الوهمية.

بناء أكبر مجموعة بيانات باريدولية
كان أحد المكونات الرئيسية للدراسة هو إنشاء مجموعة بيانات تتفوق على المجموعات السابقة من المحفزات الباريدولية. قام فريق CSAIL بجمع حوالي 20000 صورة مرشحة من مجموعة بيانات LAION-5B، ووضع علامات عليها بدقة والحكم عليها بناءً على التصورات البشرية للوجوه. تم تقييم كل صورة على عوامل مختلفة، مثل العاطفة التي استحضرها الوجه، وعمرها، وما إذا كان الوجه يبدو عرضيًا أو متعمدًا. كانت هذه العملية، التي تضمنت ساعات من التعليقات البشرية، ضرورية لبناء مورد يمكن أن يعزز البحث في كل من الذكاء الاصطناعي والإدراك البشري.
ويعترف هاملتون مازحا بالجهد الشخصي الذي بُذل في هذه المهمة الضخمة: "الجزء الأكبر من مجموعة البيانات مدين بوجوده لأمي"، في إشارة إلى والدته، وهي مصرفية متقاعدة، ساعدت في وضع علامات على الصور.

تطبيقات تتجاوز الباريدوليا: من اكتشاف الوجه إلى تصميم المنتج
ورغم أن الدراسة تركز على الظاهرة الغريبة المعروفة باسم الباريدوليا، فإن تداعياتها تمتد إلى ما هو أبعد من ذلك بكثير. فالمعلومات المستقاة من البحث قد تعمل على تحسين أنظمة الكشف عن الوجوه القائمة على الذكاء الاصطناعي بشكل كبير، مما يقلل من الإيجابيات الكاذبة. وهذا له تطبيقات عملية في مجالات مثل السيارات ذاتية القيادة، حيث قد يؤدي الكشف الخاطئ عن الوجوه إلى أخطاء خطيرة، وفي مجالات مثل الروبوتات والتفاعل بين الإنسان والحاسوب، حيث قد يؤدي التعرف على الباريدوليا أو تجنبها إلى جعل التفاعل مع الآلات أكثر سلاسة.
وعلاوة على ذلك، فإن النتائج لها تطبيقات محتملة في تصميم المنتجات. ففهم ظاهرة الباريدوليا والتحكم فيها قد يساعد المصممين على ابتكار منتجات تبدو أكثر ودية وأقل ترويعًا. يقول هاملتون: "تخيل أنك قادر على تعديل تصميم سيارة أو لعبة طفل تلقائيًا بحيث تبدو أكثر ودية، أو ضمان عدم ظهور جهاز طبي بشكل مهدد عن غير قصد".

فجوة الإدراك بين الإنسان والآلة
وتثير الدراسة أيضًا أسئلة مثيرة للاهتمام حول الفرق بين الإدراك البشري والإدراك الآلي. فالبشر يفسرون غريزيًا الأشياء غير الحية ذات السمات البشرية، في حين لا تفعل خوارزميات الذكاء الاصطناعي ذلك. على سبيل المثال، قد يرى الناس مقبسًا كهربائيًا "يغني"، بل ويتخيلون "شفتيه المتحركتين"، لكن الذكاء الاصطناعي لا "يرى" هذه الوجوه الكرتونية.
"ما الذي يفسر هذا الاختلاف بين الإدراك البشري والتفسير الخوارزمي؟ هل الباريدوليا مفيدة أم ضارة؟" يتساءل هاملتون. تشكل هذه الأسئلة، إلى جانب العديد من الأسئلة الأخرى، الأساس للتحقيقات الجارية التي يجريها الفريق في هذه الظاهرة النفسية الكلاسيكية.

نظرة إلى المستقبل: نحو أنظمة الذكاء الاصطناعي الشبيهة بالإنسان
وبينما يستعد فريق CSAIL لمشاركة مجموعة البيانات الخاصة بهم مع المجتمع العلمي الأوسع، فإنهم يتطلعون بالفعل إلى المستقبل. وتشمل الخطوات التالية المحتملة تدريب أنظمة الذكاء الاصطناعي ليس فقط على اكتشاف الوجوه الباريدولية ولكن لفهمها ووصفها بطرق أكثر شبهاً بالإنسان. على سبيل المثال، يمكن تصميم نماذج الرؤية واللغة للتعامل مع المحفزات البصرية بطرق تتوافق بشكل أوثق مع التجارب البشرية.
"إن هذه الدراسة ممتعة للغاية! ومن الممتع قراءتها وتجعلني أفكر"، هكذا علق بييترو بيرونا، أستاذ في معهد كاليفورنيا للتكنولوجيا، والذي لم يشارك في الدراسة. وأضاف: "يطرح هاميلتون وزملاؤه سؤالاً مثيراً للاهتمام: لماذا نرى الوجوه في الأشياء؟".
في نهاية المطاف، قد لا تعمل الدراسة على تعزيز فهمنا للباريدوليا فحسب، بل إنها قد تلقي الضوء أيضًا على الآليات الأوسع للإدراك البشري والآلي. وبدعم من مؤسسة العلوم الوطنية، ومختبر أبحاث القوات الجوية الأمريكية، ومسرع الذكاء الاصطناعي التابع للقوات الجوية الأمريكية، يمهد هذا البحث الطريق لإنشاء أنظمة ذكاء اصطناعي قادرة على استيعاب التجارب والتفاعلات الشبيهة بالبشر بشكل أفضل.
مع استمرار تشكيل عالمنا بواسطة الذكاء الاصطناعي، فإن فهم الفجوة بين الحدس البشري والمنطق الخوارزمي أمر بالغ الأهمية. من خلال فحص ظاهرة غريبة مثل الباريدوليا، فتح باحثو معهد ماساتشوستس للتكنولوجيا الباب لفهم أعمق لكيفية قدرة الآلات على "رؤية" العالم بشكل أفضل - وربما تشارك يومًا ما في عجائب وجه في شطيرة جبن مشوية.

احصل على فهم أوسع لصناعة العملات المشفرة من خلال التقارير الإعلامية، وشارك في مناقشات متعمقة مع المؤلفين والقراء الآخرين ذوي التفكير المماثل. مرحبًا بك للانضمام إلينا في مجتمع Coinlive المتنامي:https://t.me/CoinliveSG

أضف تعليق

تسجيل الدخوللترك تعليقك الرائع ...

0 تعليقات

باكرا جدا

تحميل المزيد من التعليقات