انسوا AGI - يحتفل Sam Altman بـ ChatGPT أخيرًا باتباع قواعد تنسيق شرطة em

عندما يحتفل ألتمان أخيرًا بحصوله على GPT لتجنب الشرطات، فإنه يحتفل حقًا بأن OpenAI قامت بضبط أحدث إصدار من GPT-5.1 (ربما من خلال التعلم المعزز أو الضبط الدقيق) لترجيح التعليمات المخصصة بشكل أكبر في حسابات الاحتمالات الخاصة بها.

هناك مفارقة فيما يتعلق بالتحكم هنا: نظرًا للطبيعة الاحتمالية للمشكلة، ليس هناك ضمان بأن المشكلة ستظل ثابتة. تقوم OpenAI بتحديث نماذجها بشكل مستمر خلف الكواليس، حتى ضمن نفس رقم الإصدار، وتعديل المخرجات بناءً على تعليقات المستخدمين وعمليات التدريب الجديدة. يصل كل تحديث بخصائص مخرجات مختلفة يمكنها التراجع عن ضبط السلوك السابق، وهي ظاهرة يطلق عليها الباحثون “ضريبة التوافق”.

إن ضبط سلوك الشبكة العصبية بدقة ليس علمًا دقيقًا بعد. وبما أن جميع المفاهيم المشفرة في الشبكة مترابطة بقيم تسمى الأوزان، فإن تعديل سلوك واحد يمكن أن يغير سلوكيات أخرى بطرق غير مقصودة. قم بإصلاح الإفراط في استخدام شرطة الاندفاع اليوم، وقد يؤدي تحديث الغد (الذي يهدف إلى تحسين قدرات البرمجة، على سبيل المثال) إلى إعادتها عن غير قصد، ليس لأن OpenAI تريدها هناك، ولكن لأن هذه هي طبيعة محاولة توجيه نظام إحصائي بملايين التأثيرات المتنافسة.

وهذا يصل إلى سؤال ضمني ذكرناه سابقًا. إذا كان التحكم في استخدام علامات الترقيم لا يزال يمثل صراعًا قد يظهر مرة أخرى في أي وقت، فإلى أي مدى نحن بعيدون عن الذكاء الاصطناعي العام؟ لا يمكننا أن نعرف على وجه اليقين، ولكن يبدو من المرجح بشكل متزايد أنها لن تنشأ من نموذج لغوي كبير وحده. وذلك لأن الذكاء الاصطناعي العام، وهي التكنولوجيا التي من شأنها تكرار قدرة التعلم العامة للإنسان، من المحتمل أن تتطلب فهمًا حقيقيًا وإجراءات مقصودة ذاتية الانعكاس، وليس مطابقة الأنماط الإحصائية التي تتوافق أحيانًا مع التعليمات إذا حالفك الحظ.

وبالحديث عن الحظ، لا يزال بعض المستخدمين غير محظوظين في التحكم في استخدام شرطة em خارج ميزة “التعليمات المخصصة”. عند إخبارك في الدردشة بعدم استخدام الشرطات الطويلة داخل الدردشة، قام ChatGPT بتحديث ذاكرة محفوظة وأجاب على أحد مستخدمي X، “فهمت – سألتزم تمامًا بالواصلات القصيرة من الآن فصاعدًا.”