أخبار التقنية

يذهل مقطع الفيديو الذي تم إنشاؤه بواسطة الذكاء الاصطناعي ويل سميث وهو يأكل السباغيتي بجمال رهيب


تكبير / لقطات من مقطع فيديو تم إنشاؤه بواسطة الذكاء الاصطناعي يظهر ويل سميث وهو يأكل السباغيتي التي تعمل على تسخين الإنترنت.

وسط الجدل الذي دار الأسبوع الماضي في مجال الذكاء الاصطناعي حول التنظيم ، والمخاوف من نهاية العالم ، وتعطيل الوظائف ، انفصلت الغيوم لفترة وجيزة. للحظة قصيرة ومشرقة ، يمكننا الاستمتاع بفيديو مثير للسخرية للغاية تم إنشاؤه بواسطة الذكاء الاصطناعي لـ Will Smith وهو يأكل السباغيتي التي تضيء حياتنا الآن بمجدها الرهيب.

يوم الإثنين ، قام مستخدم Reddit يُدعى “chaindrop” بمشاركة الفيديو الذي تم إنشاؤه بواسطة الذكاء الاصطناعي على r / StableDiffusion subreddit. هو – هي وسرعان ما انتشر إلى أشكال أخرى من وسائل التواصل الاجتماعي وقواعد مختلطة ملهمة في الصحافة. على سبيل المثال ، قال نائب الرئيس إن الفيديو “سيطاردك لبقية حياتك” ، بينما وصفه نادي AV بأنه “نقطة النهاية الطبيعية لتطوير الذكاء الاصطناعي.”

نحن في مكان ما بينهما. يتكون الفيديو الصامت الذي تبلغ مدته 20 ثانية من 10 مقاطع مدتها ثانيتان تم إنشاؤها بشكل مستقل ومدمجة معًا. يُظهر كل واحد زوايا مختلفة لمحاكاة ويل سميث (عند نقطة واحدة ، حتى اثنان من ويل سميث) يلتهم بشراهة السباغيتي. تم إنشاؤه بالكامل بواسطة الكمبيوتر ، بفضل الذكاء الاصطناعي.

وسترى ذلك الآن:

نحن نعلم ما تفكر فيه: “ألم أر هذا النوع من تقنية التزييف العميق المتقدمة في عام 1987هو الرجل الراكض؟ “لا ، كان هذا هو جيسي” The Body “Ventura الذي هزم أرنولد شوارزنيجر المزيف في مباراة قفص عرض لعبة بائسة ، تم تعيينها في مكان ما بين عامي 2017 و 2019. هنا في عام 2023 ، لدينا ويل سميث وهم يأكل السباغيتي.

هذا العمل الفذ ممكن بسبب أداة جديدة مفتوحة المصدر للذكاء الاصطناعي تسمى ModelScope ، تم إصدارها قبل بضعة أسابيع بواسطة DAMO Vision Intelligence Lab ، قسم الأبحاث في Alibaba. ModelScope هو نموذج نشر “text2video” تم تدريبه لإنشاء مقاطع فيديو جديدة من المطالبات من خلال تحليل ملايين الصور وآلاف مقاطع الفيديو التي تم تجميعها في مجموعات بيانات LAION5B و ImageNet و Webvid. يتضمن ذلك مقاطع فيديو من Shutterstock ، ومن هنا جاءت العلامة المائية “Shutterstock” الشبحية على إخراجها.

يستضيف مجتمع AI Community HuggingFace حاليًا عرضًا توضيحيًا عبر الإنترنت لـ ModelScope ، على الرغم من أنه يتطلب حسابًا ، وستحتاج إلى دفع وقت الحساب لتشغيله. حاولنا استخدامه لكنه كان مثقلًا ، ويرجع ذلك على الأرجح إلى هوس سميث معكرونة السباغيتي.

وفقًا لـ chaindrop ، كان سير العمل لإنشاء الفيديو بسيطًا إلى حد ما: أعط ModelScope موجهًا “ويل سميث يأكل السباغيتي” وقم بإنشائه بمعدل 24 إطارًا في الثانية (FPS). بعد ذلك ، استخدم chaindrop أداة الاستيفاء Flowframes لزيادة FPS من 24 إلى 48 ، ثم أبطأها إلى نصف السرعة ، مما أدى إلى فيديو أكثر سلاسة.

بالطبع ، فإن ModelScope ليست اللعبة الوحيدة في المدينة فيما يتعلق بالمجال الناشئ لـ text2video. في الآونة الأخيرة ، ظهر Runway لأول مرة “Gen-2” ، وقد غطينا سابقًا مشاريع بحثية باستخدام text2video مبكرة من Meta و Google.

منذ أن أصبح ويل سميث يأكل السباغيتي نجاحًا فيروسيًا ، تنعم الإنترنت بمتابعات مثل سكارلت جوهانسون وجو بايدن يأكل السباغيتي. حتى أن سميث يأكل كرات اللحم ، وهو مقطع فيديو ربما يكون مرعبًا حقًا. لكنه لا يزال رائعًا بطريقة ما – علفًا مثاليًا لميمات المستقبل.

بالطبع ، بمجرد أن تصبح مخرجات أدوات الفيديو النصي هذه واقعية للغاية ، سيكون لدينا مشكلات أخرى للتعامل معها — من المحتمل أن تكون هناك مشكلات اجتماعية وثقافية عميقة. ولكن في الوقت الحالي ، دعنا نستمتع بالمجد غير الكامل والرهيب لـ ModelScope. نعتذر مقدما.



مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى