في الأسبوع الماضي ، أعلن باحثو Microsoft عن إطار عمل تجريبي للتحكم في الروبوتات والطائرات بدون طيار باستخدام القدرات اللغوية لـ ChatGPT ، وهو نموذج لغة ذكاء اصطناعي شائع أنشأته شركة OpenAI. باستخدام أوامر اللغة الطبيعية ، يمكن لـ ChatGPT كتابة رمز خاص يتحكم في حركات الروبوت. ثم يقوم الإنسان بعرض النتائج وضبطها حسب الضرورة حتى تكتمل المهمة بنجاح.
وصل البحث في ورقة بعنوان “ChatGPT للروبوتات: مبادئ التصميم والقدرات النموذجية ، “من تأليف ساي فيمبرالا وروجيريو بوناتي وآرثر باكر وأشيش كابور من Microsoft Autonomous Systems and Robotics Group.
في فيديو توضيحي ، تعرض Microsoft روبوتات – يتحكم فيها على ما يبدو برمز مكتوب بواسطة ChatGPT أثناء اتباع التعليمات البشرية – باستخدام ذراع روبوت لترتيب الكتل في شعار Microsoft ، أو قيادة طائرة بدون طيار لفحص محتويات الرف ، أو العثور على كائنات باستخدام روبوت مع قدرات الرؤية.
لجعل ChatGPT يتفاعل مع الروبوتات ، قام الباحثون بتعليم ChatGPT واجهة برمجة تطبيقات مخصصة للروبوتات. عند إعطاء تعليمات مثل “التقاط الكرة” ، يمكن لـ ChatGPT إنشاء رمز التحكم في الروبوتات تمامًا كما يكتب قصيدة أو يكمل مقالًا. بعد أن يقوم الإنسان بفحص الكود وتحريره من أجل الدقة والأمان ، يمكن للمشغل البشري تنفيذ المهمة وتقييم أدائها.
بهذه الطريقة ، يقوم ChatGPT بتسريع برمجة التحكم الآلي ، لكنه ليس نظامًا مستقلاً. “نؤكد أن استخدام ChatGPT للروبوتات ليس عملية مؤتمتة بالكامل ،” كما ورد في البحث ، “بل يعمل كأداة لزيادة القدرات البشرية.”
بينما يبدو أن معظم ردود الفعل على ChatGPT (من حيث نجاح أو فشل أفعالها) تأتي من البشر في شكل نص ، يزعم الباحثون أيضًا أنهم حققوا بعض النجاح في تغذية البيانات المرئية في ChatGPT نفسها. في أحد الأمثلة ، كلف الباحثون ChatGPT بأمر روبوت لالتقاط كرة سلة بتعليقات من الكاميرا: “يمكن لـ ChatGPT تقدير مظهر الكرة والسماء في صورة الكاميرا باستخدام رمز SVG. هذا السلوك يلمح إلى احتمال أن LLM يتتبع نموذج العالم الضمني الذي يتجاوز الاحتمالات المستندة إلى النص.
بينما تبدو النتائج بدائية في الوقت الحالي ، إلا أنها تمثل محاولات مبكرة لتطبيق أحدث تقنيات العصر – نماذج اللغة الكبيرة – للتحكم الآلي. وفقًا لمايكروسوفت ، يمكن أن تفتح واجهة ChatGPT الروبوتات لجمهور أوسع بكثير في المستقبل.
“هدفنا من هذا البحث هو معرفة ما إذا كان بإمكان ChatGPT التفكير فيما وراء النص ، والسبب في العالم المادي للمساعدة في مهام الروبوتات ،” كما يقرأ منشور مدونة Microsoft Research. “نريد مساعدة الأشخاص على التفاعل مع الروبوتات بسهولة أكبر ، دون الحاجة إلى تعلم لغات البرمجة المعقدة أو تفاصيل حول الأنظمة الروبوتية.”