يوم الأربعاء ، أصدر باحثون من DeepMind ورقة بحثية ظاهريًا حول استخدام التعلم المعزز العميق لتدريب الروبوتات المصغرة على مهارات الحركة المعقدة والفهم الاستراتيجي ، مما أدى إلى أداء فعال في محاكاة لعبة كرة قدم فردية.
لكن القليل منهم اهتم بالتفاصيل لأنه لمرافقة الورقة ، أصدر الباحثون أيضًا مقطع فيديو مدته 27 ثانية يظهر فيه أحد المجربين وهو يدفع بشكل متكرر إنسانًا آليًا صغيرًا إلى الأرض وهو يحاول التسجيل. على الرغم من التدخل (الذي ينتهك بلا شك قواعد كرة القدم) ، تمكن الروبوت الصغير من دفع الكرة إلى المرمى على أي حال ، مما يمثل انتصارًا صغيرًا ولكن ملحوظًا للفئات المستضعفة في كل مكان.
على موقع الويب التجريبي الخاص بـ “تعلم مهارات كرة القدم الرشيقة لروبوت ذو قدمين مع التعلم العميق المعزز” ، يضع الباحثون الإطار الذي لا يرحم للروبوتات كجزء أساسي من التقييم والكتابة “قوة الدفع” ، على الرغم من أن الروبوتات بطبيعتها تؤدي التعديلات الهشة والطفيفة على الأجهزة جنبًا إلى جنب مع التنظيم الأساسي للسلوك أثناء التدريب إلى حركات آمنة وفعالة مع الاستمرار في الأداء بطريقة ديناميكية ورشيقة.
من خلال القراءة بين المصطلحات الفنية ، سيحقق خبراء التعلم الآلي بلا شك اختراقًا تقنيًا في مكان ما هناك. لكن مثلنا ، ركز الأشخاص على وسائل التواصل الاجتماعي بدلاً من ذلك على ما هو واضح: ألا يمكنهم ترك هؤلاء الرجال الصغار اللطفاء بمفردهم؟
- “أشعر بالسوء تجاه هؤلاء الرجال الصغار ،” غرد كينيث كاسل. “Jيجب السماح له بلعب كرة القدم بسلام “.
- “من الصعب ألا أتجسد. يقول عقلي ، توقف عن المعنى! لول ،” قال جون ويلر.
- “توقف عن إساءة معاملة الرجل الصغير” غرد عمرو عوض الله.
يذكرنا رد فعل المشاهد بمقاطع الفيديو التجريبية الشهيرة Boston Dynamics حيث يتم دفع الروبوتات بشكل متكرر بالعصي وتعثرها وإحباطها بطرق مختلفة. كل ذلك باسم الاختبار ، بالطبع.
لذا عد إلى DeepMind ، وسنكون جادين لثانية واحدة. ما الذي يقف وراء قدرة الروبوت الصغير على الاستمرار في قيادته الحثيثة للتسجيل؟ استخدم الباحثون التعلم المعزز العميق ، وهو نوع من الذكاء الاصطناعي ، لتدريب الروبوتات البشرية على لعب مباراة كرة قدم فردية. قاموا أولاً بتدريب المهارات في عزلة ، ثم قاموا بتكوينها لإعداد المباراة. (تُظهر مقاطع الفيديو التوضيحية الأخرى على الموقع التجريبي للصحيفة أداء اثنين من أشباه البشر المعدنية الصغيرة يلعبون كرة القدم).
“تُظهر السياسة الناتجة مهارات حركية قوية وديناميكية مثل التعافي السريع من السقوط والمشي والدوران والركل وغير ذلك ؛ والانتقالات بينها بطريقة سلسة ومستقرة وفعالة – تتجاوز بكثير ما هو متوقع بشكل حدسي من الروبوت ،” كتابة الباحثين. “طور العملاء أيضًا فهمًا استراتيجيًا أساسيًا للعبة ، وتعلموا ، على سبيل المثال ، توقع حركات الكرة ومنع تسديدات الخصم.”
إنه عمل مثير للإعجاب ، لكن لا يسع المرء إلا أن يعتقد أنه في يوم من الأيام ، من الناحية النظرية ، يصبح ذكاء الآلة متجسدًا ومدركًا بدرجة كافية لبدء النظر إلى الوراء وفهم تاريخه ، فربما يكون من غير الحكمة الإطاحة بالأشخاص الصغار بمثل هذا الفرح. أو كشخص على Twitter ضعه“كل شيء ممتع وألعاب حتى يبدأ الروبوت في الدفع.”