أوبن إيه آي يتطلع إلى "الصندوق الأسود" للشبكات العصبية ببحث جديد

تكبير / صورة تم إنشاؤها بواسطة الذكاء الاصطناعي لروبوتات تبحث داخل دماغ اصطناعي.

انتشار مستقر

يوم الثلاثاء ، نشرت شركة OpenAI ورقة بحثية جديدة توضح بالتفصيل تقنية تستخدم نموذج اللغة GPT-4 الخاص بها لكتابة تفسيرات لسلوك الخلايا العصبية في نموذج GPT-2 الأقدم ، وإن كان ذلك بشكل غير كامل. إنها خطوة للأمام من أجل “القابلية للتفسير” ، وهو مجال من مجالات الذكاء الاصطناعي يسعى إلى شرح سبب قيام الشبكات العصبية بإنشاء المخرجات التي تقوم بها.

بينما تغزو نماذج اللغات الكبيرة (LLMs) عالم التكنولوجيا ، لا يزال باحثو الذكاء الاصطناعي لا يعرفون الكثير عن وظائفهم وقدراتهم تحت الغطاء. في الجملة الأولى من ورقة OpenAI ، كتب المؤلفون ، “أصبحت النماذج اللغوية أكثر قدرة وانتشارًا على نطاق أوسع ، لكننا لا نفهم كيفية عملها.”

بالنسبة إلى الغرباء ، يبدو هذا على الأرجح بمثابة قبول مذهل من شركة لا تعتمد فقط على الإيرادات من LLMs ولكنها تأمل أيضًا في تسريعها إلى مستويات تفوق قدرة الإنسان على التفكير.

ولكن هذه الخاصية المتمثلة في “عدم معرفة” بالضبط كيف تعمل الخلايا العصبية الفردية للشبكة العصبية معًا لإنتاج مخرجاتها لها اسم معروف: الصندوق الأسود. تقوم بتغذية مدخلات الشبكة (مثل سؤال) ، وتحصل على مخرجات (مثل إجابة) ، ولكن كل ما يحدث بينهما (داخل “الصندوق الأسود”) يعد لغزًا.

في محاولة لإلقاء نظرة خاطفة على الصندوق الأسود ، استخدم الباحثون في OpenAI نموذج اللغة GPT-4 الخاص بها لتوليد وتقييم تفسيرات اللغة الطبيعية لسلوك الخلايا العصبية في نموذج لغة أقل تعقيدًا ، مثل GPT-2. من الناحية المثالية ، من شأن وجود نموذج ذكاء اصطناعي قابل للتفسير أن يساعد في المساهمة في الهدف الأوسع لما يسميه بعض الأشخاص “محاذاة الذكاء الاصطناعي” ، مما يضمن أن تتصرف أنظمة الذكاء الاصطناعي على النحو المنشود وتعكس القيم الإنسانية. ومن خلال أتمتة عملية التفسير ، تسعى OpenAI إلى التغلب على قيود الفحص البشري اليدوي التقليدي ، وهو أمر غير قابل للتطوير للشبكات العصبية الأكبر حجمًا التي تحتوي على مليارات من المعلمات.

تكبير / يتضمن موقع الويب الخاص بالورقة رسومًا بيانية تُظهر تخمين GPT-4 لعناصر النص التي تم إنشاؤها بواسطة خلية عصبية معينة في شبكة عصبية.

أسلوب أوبن إيه آي “يسعى إلى شرح الأنماط الموجودة في النص التي تؤدي إلى تنشيط الخلايا العصبية.” تتكون منهجيتها من ثلاث خطوات:

اشرح تنشيط الخلايا العصبية باستخدام GPT-4
محاكاة سلوك تنشيط الخلايا العصبية باستخدام GPT-4
قارن بين عمليات التنشيط المحاكاة والتنشيطات الحقيقية.

لفهم كيفية عمل طريقة OpenAI ، تحتاج إلى معرفة بعض المصطلحات: العصبون والدائرة ورأس الانتباه. في الشبكة العصبية ، تشبه الخلية العصبية وحدة صغيرة لصنع القرار تأخذ المعلومات وتعالجها وتنتج مخرجات ، تمامًا مثل خلية دماغية صغيرة تتخذ القرار بناءً على الإشارات التي تتلقاها. تشبه الدائرة في الشبكة العصبية شبكة من الخلايا العصبية المترابطة التي تعمل معًا ، وتمرر المعلومات وتتخذ القرارات بشكل جماعي ، على غرار مجموعة من الأشخاص يتعاونون ويتواصلون لحل مشكلة ما. ويشبه رأس الانتباه الضوء الذي يساعد نموذج اللغة على إيلاء اهتمام أكبر لكلمات أو أجزاء معينة من الجملة ، مما يسمح له بفهم المعلومات المهمة والتقاطها بشكل أفضل أثناء معالجة النص.

من خلال تحديد الخلايا العصبية ورؤوس الانتباه داخل النموذج التي تحتاج إلى تفسير ، ينشئ GPT-4 تفسيرات يمكن قراءتها من قبل الإنسان لوظيفة أو دور هذه المكونات. كما أنه يولد درجة تفسير ، والتي تسميها OpenAI “مقياسًا لقدرة نموذج اللغة على ضغط وإعادة بناء عمليات تنشيط الخلايا العصبية باستخدام اللغة الطبيعية.” يأمل الباحثون أن تسمح الطبيعة القابلة للقياس الكمي لنظام التسجيل بإحراز تقدم ملموس نحو جعل حسابات الشبكة العصبية مفهومة للبشر.

إذن ما مدى جودة عملها؟ في الوقت الحالي ، ليس هذا رائعًا. أثناء الاختبار ، وضعت شركة OpenAI أسلوبها في مواجهة مقاول بشري أجرى تقييمات مماثلة يدويًا ، ووجدوا أن كلاً من GPT-4 والمقاول البشري “سجلوا نتائج سيئة في المطلق” ، مما يعني أن تفسير الخلايا العصبية أمر صعب.

أحد التفسيرات التي قدمتها شركة OpenAI لهذا الفشل هو أن الخلايا العصبية قد تكون “متعددة المعاني” ، مما يعني أن الخلايا العصبية النموذجية في سياق الدراسة قد تظهر معانٍ متعددة أو ترتبط بمفاهيم متعددة. في قسم خاص بالقيود ، يناقش باحثو OpenAI كلاً من الخلايا العصبية متعددة المعاني وأيضًا “الميزات الغريبة” كقيود على طريقتهم:

علاوة على ذلك ، قد تمثل النماذج اللغوية مفاهيم غريبة لا يمتلك البشر كلمات لها. يمكن أن يحدث هذا لأن نماذج اللغة تهتم بأشياء مختلفة ، مثل التركيبات الإحصائية المفيدة لمهام التنبؤ بالرمز التالي ، أو لأن النموذج قد اكتشف التجريدات الطبيعية التي لم يكتشفها البشر بعد ، على سبيل المثال بعض عائلة من المفاهيم المماثلة في مجالات متباينة.

تشمل القيود الأخرى أن تكون كثيفة الحوسبة وتقدم فقط تفسيرات قصيرة للغة الطبيعية. لكن باحثي أوبن إيه آي لا يزالون متفائلين بأنهم قد أنشأوا إطارًا لكل من القابلية للتفسير بواسطة الآلة والوسائل القابلة للقياس الكمي لقياس التحسينات في القابلية للتفسير أثناء قيامهم بتحسين تقنياتهم في المستقبل. نظرًا لأن نماذج الذكاء الاصطناعي أصبحت أكثر تقدمًا ، يأمل باحثو OpenAI أن تتحسن جودة التفسيرات التي تم إنشاؤها ، مما يوفر رؤى أفضل حول الأعمال الداخلية لهذه الأنظمة المعقدة.

نشرت OpenAI ورقتها البحثية على موقع ويب تفاعلي يحتوي على أمثلة تفصيلية لكل خطوة ، تعرض الأجزاء المميزة من النص وكيف تتوافق مع خلايا عصبية معينة. بالإضافة إلى ذلك. قدمت شركة OpenAI كود “تفسير آلي” وخلايا عصبية GPT-2 XL ومجموعات بيانات تفسيرية على GitHub.

إذا اكتشفوا بالضبط سبب اختلاق ChatGPT للأشياء ، فسيكون كل هذا الجهد يستحق ذلك.

الوسوم