يقدم Meta نموذج AI يمكنه عزل الكائنات وإخفائها داخل الصور

تكبير / مثال على اختيار SAM لمخطط فصيل كورجي في الصورة.

ميتا

أعلنت شركة Meta يوم الأربعاء عن نموذج ذكاء اصطناعي يسمى Segment Anything Model (SAM) يمكنه تحديد الكائنات الفردية في الصور ومقاطع الفيديو ، حتى تلك التي لم تتم مواجهتها أثناء التدريب ، وفقًا لتقارير رويترز.

وفقًا لمدونة من Meta ، فإن SAM هو نموذج تجزئة للصور يمكنه الاستجابة للمطالبات النصية أو نقرات المستخدم لعزل كائنات معينة داخل صورة. تجزئة الصورة هي عملية في رؤية الكمبيوتر تتضمن تقسيم الصورة إلى أجزاء أو مناطق متعددة ، يمثل كل منها كائنًا معينًا أو مجال اهتمام.

الغرض من تجزئة الصورة هو تسهيل تحليل الصورة أو معالجتها. ترى Meta أيضًا أن التكنولوجيا مفيدة لفهم محتوى صفحات الويب وتطبيقات الواقع المعزز وتحرير الصور والمساعدة في الدراسة العلمية عن طريق تعريب الحيوانات أو الكائنات تلقائيًا لتتبعها على الفيديو.

يقول ميتا إن إنشاء نموذج تجزئة دقيق عادةً “يتطلب عملاً متخصصًا للغاية من قبل خبراء تقنيين مع إمكانية الوصول إلى البنية التحتية للتدريب على الذكاء الاصطناعي وكميات كبيرة من البيانات الموضحة بعناية في المجال.” من خلال إنشاء SAM ، تأمل Meta في إضفاء الطابع الديمقراطي على هذه العملية من خلال تقليل الحاجة إلى التدريب والخبرة المتخصصة ، والتي تأمل في تعزيز المزيد من البحث في رؤية الكمبيوتر.

بالإضافة إلى SAM ، جمعت Meta مجموعة بيانات أطلق عليها “SA-1B” تتضمن 11 مليون صورة مرخصة من “شركة صور كبيرة” و 1.1 مليار قناع تجزئة أنتجها نموذج التجزئة الخاص بها. ستجعل Meta SAM ومجموعة بياناتها متاحة للأغراض البحثية بموجب ترخيص Apache 2.0.

حاليًا ، الكود (بدون الأوزان) متاح على GitHub ، وأنشأت Meta عرضًا تجريبيًا تفاعليًا مجانيًا لتقنية التجزئة الخاصة بها على موقع ويب خاص. باستخدام العرض التوضيحي ، يمكن للزوار تحميل صورة واستخدام “Hover & Click” (اختيار الكائنات بالماوس) ، أو “Box” (تحديد الكائنات داخل مربع التحديد) ، أو “كل شيء” (الذي يحاول تلقائيًا تحديد كل كائن في صورة).

لقطة شاشة لموقع ويب تجريبي لـ Meta Segment Anything ، معزول "كل شئ" في الصورة. — تكبير / لقطة شاشة لموقع ويب تجريبي لـ Meta Segment Anything ، يعزل “كل شيء” في الصورة.

بنج إدواردز / ميتا

في حين أن تقنية تجزئة الصور ليست جديدة ، فإن SAM جديرة بالملاحظة لقدرتها على تحديد الكائنات غير الموجودة في مجموعة بيانات التدريب الخاصة بها ونهجها المفتوح جزئيًا. أيضًا ، يمكن أن يكون إصدار نموذج SA-1B بمثابة شرارة لجيل جديد من تطبيقات الرؤية الحاسوبية ، على غرار الطريقة التي يلهم بها نموذج لغة Meta LLaMA بالفعل المشاريع الفرعية.

وفقًا لرويترز ، أكد مارك زوكربيرج ، الرئيس التنفيذي لشركة Meta ، على أهمية دمج الذكاء الاصطناعي التوليدي في تطبيقات الشركة هذا العام. على الرغم من أن Meta لم تصدر منتجًا تجاريًا باستخدام هذا النوع من الذكاء الاصطناعي حتى الآن ، فقد استخدمت سابقًا تقنية مشابهة لـ SAM داخليًا مع Facebook لوضع علامات على الصور وتعديل المحتوى وتحديد المنشورات الموصى بها على Facebook و Instagram.

يأتي إعلان Meta وسط منافسة شرسة بين شركات التكنولوجيا الكبرى للسيطرة على مجال الذكاء الاصطناعي. حظي نموذج لغة ChatGPT الخاص بـ OpenAI المدعوم من Microsoft باهتمام واسع النطاق في خريف عام 2022 ، مما أدى إلى موجة من الاستثمارات التي قد تحدد اتجاه الأعمال الرئيسي التالي في مجال التكنولوجيا بعيدًا عن وسائل التواصل الاجتماعي والهاتف الذكي.