ميدجورني / بنج إدواردز
إذا قمت بتغذية أهم وثيقة قانونية في أمريكا – دستور الولايات المتحدة – في أداة مصممة لاكتشاف النص المكتوب بواسطة نماذج الذكاء الاصطناعي مثل ChatGPT ، فسوف تخبرك أن الوثيقة تمت كتابتها بشكل شبه مؤكد بواسطة الذكاء الاصطناعي. لكن ما لم يكن جيمس ماديسون مسافرًا عبر الزمن ، فلا يمكن أن يكون هذا هو الحال. لماذا تعطي أدوات الكشف عن الكتابة بالذكاء الاصطناعي إيجابيات خاطئة؟ تحدثنا إلى العديد من الخبراء – ومنشئ كاشف الكتابة بالذكاء الاصطناعي GPTZero – لمعرفة ذلك.
من بين القصص الإخبارية للأساتذة المتحمسين الذين فشلوا في الفصل بأكمله بسبب الاشتباه في استخدام أداة الكتابة بالذكاء الاصطناعي واتهام الأطفال زوراً باستخدام ChatGPT ، فإن الذكاء الاصطناعي التوليدي لديه التعليم في حالة من الانفعال. يعتقد البعض أنها تمثل أزمة وجودية. كان المعلمون الذين يعتمدون على الأساليب التعليمية التي تم تطويرها خلال القرن الماضي يتدافعون لإيجاد طرق للحفاظ على الوضع الراهن – تقليد الاعتماد على المقالة كأداة لقياس إتقان الطالب لموضوع ما.
على الرغم من إغراء الاعتماد على أدوات الذكاء الاصطناعي لاكتشاف الكتابة التي تم إنشاؤها بواسطة الذكاء الاصطناعي ، فقد أظهرت الأدلة حتى الآن أنها غير موثوقة. نظرًا للإيجابيات الخاطئة ، لا يمكن الوثوق بأجهزة كشف الكتابة بالذكاء الاصطناعي مثل GPTZero و ZeroGPT و OpenAI’s Text Classifier لاكتشاف النص المكون من نماذج اللغات الكبيرة (LLMs) مثل ChatGPT.
-
لقطة شاشة سريعة الانتشار من أبريل 2023 تظهر GPTZero تقول ، “من المحتمل أن تتم كتابة نصك بالكامل بواسطة الذكاء الاصطناعي” عند إدخال جزء من دستور الولايات المتحدة.
آرس تكنيكا
-
عند تغذية جزء من دستور الولايات المتحدة ، تقول ZeroGPT ، “نصك من إنشاء AI / GPT.”
آرس تكنيكا
-
عند تغذية جزء من دستور الولايات المتحدة ، يقول مصنف النص الخاص بـ OpenAI ، “يعتبر المصنف أن النص قد تم مسحه إذا كان تم إنشاؤه بواسطة الذكاء الاصطناعي.”
آرس تكنيكا
إذا قمت بتغذية GPTZero بجزء من دستور الولايات المتحدة ، فإنها تقول إن النص “من المحتمل أن تتم كتابته بالكامل بواسطة الذكاء الاصطناعي.” عدة مرات خلال الأشهر الستة الماضية ، أظهرت لقطات شاشة لكاشفات الذكاء الاصطناعي الأخرى نتائج مماثلة انتقل الفيروس على وسائل التواصل الاجتماعي ، ملهمًا الارتباك والكثير من النكات حول الآباء المؤسسين كونهم روبوتات. اتضح أن نفس الشيء يحدث مع مختارات من الكتاب المقدس ، والتي تظهر أيضًا على أنها تم إنشاؤها بواسطة الذكاء الاصطناعي.
لشرح سبب ارتكاب هذه الأدوات لمثل هذه الأخطاء الواضحة (وإرجاعها غالبًا إيجابيات كاذبة) ، نحتاج أولاً إلى فهم كيفية عملها.
فهم المفاهيم الكامنة وراء اكتشاف الذكاء الاصطناعي
تستخدم كاشفات الكتابة المختلفة بالذكاء الاصطناعي طرقًا مختلفة قليلاً للكشف ولكن مع فرضية مماثلة: هناك نموذج ذكاء اصطناعي تم تدريبه على مجموعة كبيرة من النصوص (تتكون من ملايين الأمثلة الكتابية) ومجموعة من القواعد المتوقعة التي تحدد ما إذا كانت الكتابة من المحتمل أن تكون من صنع الإنسان أو الذكاء الاصطناعي.
على سبيل المثال ، في قلب GPTZero توجد شبكة عصبية مدربة على “مجموعة كبيرة ومتنوعة من النصوص المكتوبة بواسطة الإنسان والتي تم إنشاؤها بواسطة الذكاء الاصطناعي ، مع التركيز على النثر الإنجليزي ،” وفقًا للأسئلة الشائعة للخدمة. بعد ذلك ، يستخدم النظام خصائص مثل “الحيرة” والانفجار “لتقييم النص وتحديد تصنيفه.

بوني جاكوبس / جيتي إيماجيس
في التعلم الآلي ، الحيرة هي قياس مدى انحراف جزء من النص عما تعلمه نموذج الذكاء الاصطناعي أثناء تدريبه. كما قالت الدكتورة مارجريت ميتشل من شركة Hugging Face للذكاء الاصطناعي لـ Ars ، “الحيرة هي دالة على” مدى دهشة هذه اللغة بناءً على ما رأيته؟ “
لذا فإن التفكير وراء قياس الحيرة هو أنه عندما يكتبون نصًا ، فإن نماذج الذكاء الاصطناعي مثل ChatGPT ستصل بشكل طبيعي إلى ما يعرفونه بشكل أفضل ، والذي يأتي من بيانات التدريب الخاصة بهم. كلما اقترب المخرج من بيانات التدريب ، انخفض تصنيف الارتباك. البشر كتّاب أكثر فوضوية – أو على الأقل هذه هي النظرية – لكن البشر يمكنهم الكتابة بحيرة منخفضة أيضًا ، خاصة عند تقليد أسلوب رسمي مستخدم في القانون أو أنواع معينة من الكتابة الأكاديمية. أيضًا ، العديد من العبارات التي نستخدمها شائعة بشكل مدهش.
لنفترض أننا نخمن الكلمة التالية في العبارة “أريد كوبًا من _____”. كان معظم الناس يملأون الفراغ بـ “الماء” أو “القهوة” أو “الشاي”. نموذج اللغة الذي يتم تدريبه على الكثير من النصوص الإنجليزية سيفعل الشيء نفسه لأن هذه العبارات تحدث بشكل متكرر في الكتابة الإنجليزية. سيكون الارتباك الناتج عن أي من هذه النتائج الثلاث منخفضًا جدًا لأن التنبؤ مؤكد تمامًا.