في يوم الثلاثاء، أصدرت شركة Mistral AI الناشئة الفرنسية للذكاء الاصطناعي Devstral 2، وهو نموذج ترميز ذو أوزان مفتوحة يبلغ 123 مليار معلمة مصمم للعمل كجزء من وكيل هندسة برمجيات مستقل. حقق النموذج درجة 72.2 بالمائة في اختبار SWE-bench Verified، وهو معيار يحاول اختبار ما إذا كانت أنظمة الذكاء الاصطناعي يمكنها حل مشكلات GitHub الحقيقية، مما يضعها بين نماذج الأوزان المفتوحة الأفضل أداءً.
ولعل الأهم من ذلك هو أن ميسترال لم تقم فقط بإصدار نموذج للذكاء الاصطناعي، بل أصدرت تطبيق تطوير جديد يسمى ميسترال فايب. إنها واجهة سطر أوامر (CLI) تشبه Claude Code وOpenAI Codex وGemini CLI والتي تتيح للمطورين التفاعل مع نماذج Devstral مباشرة في أجهزتهم الطرفية. يمكن للأداة فحص بنيات الملفات وحالة Git للحفاظ على السياق عبر المشروع بأكمله، وإجراء تغييرات عبر ملفات متعددة، وتنفيذ أوامر shell بشكل مستقل. أصدرت ميسترال واجهة سطر الأوامر (CLI) بموجب ترخيص Apache 2.0.
من الحكمة دائمًا التعامل مع معايير الذكاء الاصطناعي بقدر كبير من الشك، لكننا سمعنا من موظفي شركات الذكاء الاصطناعي الكبرى أنهم يولون اهتمامًا وثيقًا لمدى جودة أداء النماذج في SWE-bench Verified، والذي يقدم نماذج الذكاء الاصطناعي مع 500 مشكلة حقيقية في هندسة البرمجيات تم سحبها من مشكلات GitHub في مستودعات Python الشهيرة. يجب على الذكاء الاصطناعي قراءة وصف المشكلة، والتنقل في قاعدة التعليمات البرمجية، وإنشاء تصحيح عمل يجتاز اختبارات الوحدة. في حين لاحظ بعض الباحثين في مجال الذكاء الاصطناعي أن حوالي 90 بالمائة من المهام في الاختبار المعياري تختبر إصلاحات أخطاء بسيطة نسبيًا يمكن للمهندسين ذوي الخبرة إكمالها في أقل من ساعة، إلا أنها إحدى الطرق الموحدة القليلة لمقارنة نماذج الترميز.
وفي الوقت نفسه مع نموذج ترميز الذكاء الاصطناعي الأكبر، أصدرت ميسترال أيضًا Devstral Small 2، وهو إصدار يحتوي على 24 مليار معلمة يسجل 68 بالمائة على نفس المعيار ويمكن تشغيله محليًا على أجهزة استهلاكية مثل الكمبيوتر المحمول دون الحاجة إلى اتصال بالإنترنت. يدعم كلا النموذجين نافذة سياق مكونة من 256000 رمز مميز، مما يسمح لهما بمعالجة قواعد التعليمات البرمجية الكبيرة إلى حد ما (على الرغم من أن ما إذا كنت تعتبرها كبيرة أو صغيرة أمر نسبي للغاية اعتمادًا على تعقيد المشروع بشكل عام). أصدرت الشركة Devstral 2 بموجب ترخيص MIT المعدل و Devstral Small 2 بموجب ترخيص Apache 2.0 الأكثر تساهلاً.




