أخبار التقنية

هلوسة ChatGPT يمكن أن تمنعها من النجاح



لقد أبهرت ChatGPT العالم بعمق معرفتها وطلاقة استجاباتها ، لكن مشكلة واحدة أعاقت فائدتها: إنها تحافظ على الهلوسة.

نعم ، نماذج اللغة الكبيرة (LLMs) تهلوس ، وهو مفهوم روج له باحثو الذكاء الاصطناعي في Google في عام 2018. يشير الهلوسة في هذا السياق إلى أخطاء في النص معقولة لغويًا أو نحويًا ولكنها في الواقع غير صحيحة أو غير منطقية. باختصار ، لا يمكنك الوثوق بما تخبرك به الآلة.

لهذا السبب ، في حين أن برنامج OpenAI’s Codex أو Github’s Copilot يمكنه كتابة التعليمات البرمجية ، لا يزال يحتاج المبرمج المتمرس إلى مراجعة الإخراج – الموافقة عليه أو تصحيحه أو رفضه قبل السماح له بالانزلاق إلى قاعدة الرموز حيث قد يؤدي إلى إحداث فوضى.

معلمو المدرسة الثانوية يتعلمون نفس الشيء. قد يكون من السهل قراءة تقرير كتاب مكتوب من ChatGPT أو مقال تاريخي ، ولكن يمكن أن يحتوي بسهولة على حقائق خاطئة أن الطالب كان كسولًا جدًا بحيث لا يمكن استئصالها.

الهلوسة مشكلة خطيرة. اعتبر بيل جيتس أن ChatGPT أو النماذج اللغوية الكبيرة المماثلة يمكن أن تقدم يومًا ما المشورة الطبية للأشخاص الذين لا يمكنهم الوصول إلى الأطباء. لكن لا يمكنك الوثوق بالنصائح من آلة معرضة للهلوسة.

تعمل شركة OpenAI على إصلاح هلوسة ChatGPT

يقول إيليا سوتسكيفر ، كبير علماء OpenAI وأحد مؤسسي ChatGPT ، إنه واثق من أن المشكلة ستختفي بمرور الوقت حيث تتعلم النماذج اللغوية الكبيرة تثبيت استجاباتها في الواقع. ابتكرت شركة OpenAI تقنية لتشكيل سلوكيات نماذجها باستخدام شيء يسمى التعلم المعزز مع ردود الفعل البشرية (RLHF).

تم تطوير RLHF بواسطة OpenAI وفريق DeepMind من Google في عام 2017 كطريقة لتحسين التعلم المعزز عندما تتضمن المهمة أهدافًا معقدة أو غير محددة بشكل جيد ، مما يجعل من الصعب تصميم وظيفة مكافأة مناسبة. إن وجود شخص يقوم بفحص دوري لمخرجات نظام التعلم المعزز وإعطاء التغذية الراجعة يسمح لأنظمة التعلم المعزز بالتعلم حتى عندما تكون وظيفة المكافأة مخفية.

بالنسبة إلى ChatGPT ، تُستخدم البيانات التي تم جمعها أثناء تفاعلاتها لتدريب شبكة عصبية تعمل بمثابة “متنبئ بالمكافأة” ، ومراجعة مخرجات ChatGPT والتنبؤ بالنتيجة العددية التي تمثل مدى توافق هذه الإجراءات مع سلوك النظام المطلوب – في هذه الحالة ، الواقعية أو ردود دقيقة.

بشكل دوري ، يقوم المقيِّم البشري بفحص استجابات ChatGPT ويختار تلك التي تعكس السلوك المطلوب بشكل أفضل. يتم استخدام هذه التعليقات لضبط الشبكة العصبية لتوقع المكافأة ، ويتم استخدام الشبكة العصبية المحدثة لتوقع المكافأة لضبط سلوك نموذج الذكاء الاصطناعي. تتكرر هذه العملية في حلقة تكرارية ، مما يؤدي إلى تحسين السلوك. يعتقد Sutskever أن هذه العملية ستعلم ChatGPT في النهاية تحسين أدائها العام.

قال Sutskever ، “أنا آمل تمامًا أنه بمجرد تحسين التعلم التعزيزي اللاحق من خطوة ردود الفعل البشرية ، يمكننا تعليمه عدم الهلوسة” ، مشيرًا إلى أن قيود ChatGPT التي نراها اليوم سوف تتضاءل مع تحسن النموذج.

قد تكون الهلوسة متأصلة في نماذج اللغة الكبيرة

لكن Yann LeCun ، وهو رائد في التعلم العميق والتعلم تحت الإشراف الذاتي المستخدم في نماذج اللغة الكبيرة ، يعتقد أن هناك عيبًا أساسيًا يؤدي إلى الهلوسة.

قال: “النماذج اللغوية الكبيرة ليس لديها فكرة عن الواقع الأساسي الذي تصفه اللغة” ، مضيفًا أن معظم المعرفة البشرية ليست لغوية. “تولد هذه الأنظمة نصًا يبدو جيدًا ونحويًا ومعانيًا ، لكن ليس لديهم حقًا نوع من الهدف بخلاف مجرد إرضاء الاتساق الإحصائي مع الموجه.”

يعمل البشر على الكثير من المعرفة التي لا يتم تدوينها أبدًا ، مثل العادات أو المعتقدات أو الممارسات داخل المجتمع التي يتم اكتسابها من خلال الملاحظة أو الخبرة. وقد يكون لدى الحرفي الماهر معرفة ضمنية بمهنته لا يتم تدوينها أبدًا.

قال LeCun: “اللغة مبنية على قدر هائل من المعرفة الخلفية التي نشترك فيها جميعًا ، والتي نسميها الفطرة السليمة”. وهو يعتقد أن أجهزة الكمبيوتر تحتاج إلى التعلم عن طريق الملاحظة لاكتساب هذا النوع من المعرفة غير اللغوية.

قال LeCun: “هناك حد لمدى ذكاءهم ومدى دقتهم لأنهم لا يتمتعون بأي خبرة في العالم الحقيقي ، وهو في الحقيقة الواقع الكامن وراء اللغة”. معظم ما نتعلمه لا علاقة له باللغة.

قال جيف هينتون ، أحد رواد التعلم العميق: “نتعلم كيفية رمي كرة السلة بحيث تمر عبر الطوق”. نحن لا نتعلم ذلك باستخدام اللغة على الإطلاق. نتعلمها من التجربة والخطأ “.

لكن Sutskever يعتقد أن النص يعبر بالفعل عن العالم. قال: “إن نماذجنا المدربة مسبقًا تعرف بالفعل كل ما يحتاجون لمعرفته حول الواقع الأساسي” ، مضيفًا أن لديهم أيضًا معرفة عميقة حول العمليات التي تنتج اللغة.

في حين أن التعلم قد يكون أسرع من خلال الملاحظة المباشرة للرؤية ، كما جادل ، يمكن تعلم الأفكار المجردة من خلال النص نظرًا للحجم – بلايين الكلمات – المستخدم لتدريب LLMs مثل ChatGPT.

تمثل الشبكات العصبية الكلمات والجمل والمفاهيم من خلال تنسيق يمكن قراءته آليًا يسمى التضمين ، والذي يرسم المتجهات عالية الأبعاد – سلاسل طويلة من الأرقام التي تلتقط معناها الدلالي – إلى مساحة ذات أبعاد أقل – سلسلة أقصر من الأرقام – والتي أسهل في التحليل أو المعالجة.

أوضح سوتسكفر أنه من خلال النظر إلى سلاسل الأرقام هذه ، يمكن للباحثين معرفة كيف يربط النموذج مفهومًا بمفهوم آخر. قال إن النموذج يعرف أن المفهوم المجرد مثل اللون الأرجواني يشبه الأزرق أكثر من الأحمر ، ويعرف أن اللون البرتقالي يشبه الأحمر أكثر من اللون الأرجواني. قال: “إنها تعرف كل هذه الأشياء فقط من النص”. في حين أن مفهوم اللون أسهل في التعلم من الرؤية ، إلا أنه لا يزال من الممكن تعلمه من النص فقط ، ولكن ببطء أكبر.

ما إذا كان يمكن القضاء على المخرجات غير الدقيقة أم لا من خلال التعلم المعزز مع ردود الفعل البشرية يبقى أن نرى. في الوقت الحالي ، تظل فائدة النماذج اللغوية الكبيرة في توليد مخرجات دقيقة محدودة.

معظم ما نتعلمه لا علاقة له باللغة.

قال ماثيو لودج ، الرئيس التنفيذي لشركة Diffblue ، وهي شركة تستخدم التعلم المعزز لإنشاء اختبارات الوحدة تلقائيًا لرمز Java ، أن “أنظمة التعزيز وحدها هي جزء بسيط من تكلفة التشغيل ويمكن أن تكون أكثر دقة بكثير من LLMs ، إلى درجة أن يمكن أن يعمل البعض بأقل قدر من المراجعة البشرية “.

يقوم كل من Codex و Copilot ، وكلاهما يعتمد على GPT-3 ، بإنشاء اختبارات وحدة محتملة يجب على المبرمج المتمرس مراجعتها وتشغيلها قبل تحديد أيها مفيد. لكن منتج Diffblue يكتب اختبارات وحدة قابلة للتنفيذ دون تدخل بشري.

قال لودج: “إذا كان هدفك هو أتمتة المهام المعقدة والمعرضة للخطأ على نطاق واسع باستخدام الذكاء الاصطناعي – مثل كتابة 10000 وحدة اختبار لبرنامج لا يفهمه شخص واحد – فإن الدقة مهمة للغاية”. يوافق على أن LLM يمكن أن تكون رائعة للتفاعل الإبداعي الحر ، لكنه يحذر من أن العقد الماضي قد علمنا أن نماذج التعلم العميق الكبيرة لا يمكن التنبؤ بها إلى حد كبير ، وأن جعل النماذج أكبر وأكثر تعقيدًا لا يصلح ذلك. قال: “أفضل استخدام للـ LLM هو عندما لا تكون الأخطاء والهلوسة ذات تأثير كبير”.

ومع ذلك ، قال Sutskever إنه مع تحسن النماذج التوليدية ، “سيكون لديهم درجة مروعة من فهم العالم والعديد من أدق التفاصيل ، كما يُرى من خلال عدسة النص.”

من مقالات موقعك

مقالات ذات صلة حول الويب

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى