يوم الخميس ، كشفت Midjourney النقاب عن الإصدار 5.2 من نموذج تركيب الصور المدعوم بالذكاء الاصطناعي ، والذي يتضمن ميزة “تصغير” جديدة تسمح بالحفاظ على صورة مركّبة مركزيًا أثناء إنشاء مشهد أكبر تلقائيًا حولها ، ومحاكاة التصغير باستخدام عدسة الكاميرا.
على غرار الرسم الخارجي – تقنية صور AI قدمتها شركة OpenAI’s DALL-E 2 في أغسطس 2022 – يمكن لميزة التصغير في Midjourney التقاط صورة تم إنشاؤها بواسطة AI وتوسيع حدودها مع الحفاظ على موضوعها الأصلي متمركزًا في الصورة الجديدة. ولكن بخلاف DALL-E وميزة التعبئة التوليدية في Photoshop ، لا يمكنك تحديد صورة مخصصة لتوسيعها. في الوقت الحالي ، لا يعمل تصغير v5.2 إلا على الصور التي تم إنشاؤها داخل Midjourney ، وهي خدمة إنشاء صور بالذكاء الاصطناعي بالاشتراك.
على خادم Midjourney Discord (لا تزال الواجهة الرسمية لـ Midjourney ، على الرغم من أن الخطط جارية لتغيير ذلك) ، يمكن للمستخدمين تجربة التصغير عن طريق إنشاء أي صورة v5.2 (الآن الافتراضي) ورفع مستوى النتيجة. بعد ذلك ، تظهر أزرار “Zoom” الخاصة أسفل الإخراج. يمكنك التصغير بعامل 1.5x ، أو 2x ، أو قيمة مخصصة بين 1 و 2. وسيؤدي زر آخر ، يسمى “Make Square” ، إلى إنشاء مادة حول الصورة الحالية بطريقة تؤدي إلى إنشاء نسبة عرض إلى ارتفاع مربعة 1: 1 .
أعلن David Holz ، مبتكر Midjourney ، عن ميزات وتحسينات v5.2 الجديدة على خادم Discord ليلة الخميس. بصرف النظر عن “التصغير” ، تشمل الإضافات الأكثر أهمية نظامًا جماليًا تم إصلاحه ، يعد بجودة صورة أفضل وأمر “أسلوب” أقوى يؤثر بشكل فعال على كيفية ظهور الصورة غير الواقعية. هناك أيضًا “وضع التباين العالي” الجديد ، الذي يتم تنشيطه افتراضيًا ، والذي يزيد من التنوع التركيبي بين أجيال الصور. بالإضافة إلى ذلك ، يتيح أمر “/ shorten” الجديد للمستخدمين تقييم المطالبات في محاولة لاقتطاع الكلمات غير الضرورية.
على الرغم من الطرح الفوري للإصدار v5.2 ، أكد هولز في إعلانه أن التغييرات قد تحدث دون سابق إنذار. لا تزال الإصدارات القديمة من طراز Midjourney متوفرة باستخدام الأمر “/ settings” أو وسيطة الأمر “-v 5.1” في السطر.
بالنسبة لمحبي هذا الشكل الفني الجديد لتركيب الصور والذي يطلق عليه أحيانًا مؤيدون مثل جولي ويلاند اسم “التركيب” ، فإن التغييرات في الإصدار 5.2 هي تغييرات مرحب بها ، حيث يطلق عليها بعض مستخدمي Midjourney “مدهشو العصف الذهني، “وهي ليست من صيغ التفضيل غير العادية في عالم الذكاء الاصطناعي الصديق للضجيج في الوقت الحالي. ولكن من المرجح أن يجادل المعجبون بأن التحسينات المرئية لـ Midjourney تبرر الذهول المذهل تفاعلات فيما بينها.
التحديث الأخير هو جزء من سلسلة من تحسينات الجودة منذ مارس 2022 ، عندما أنتج النموذج صورًا غير محددة نسبيًا تفتقر إلى التفاصيل. في الآونة الأخيرة ، قدمت Midjourney الإصدار v5.0 في مارس و v5.1 في مايو من هذا العام ، وكلاهما أدى إلى تحسين الواقعية وتفاصيل الصورة. سمحت مقدمة سلسلة نماذج v5 بإنشاء صور واقعية للبابا فرانسيس ودونالد ترامب والتي أثارت مخاوف بشأن التزييف العميق على وسائل التواصل الاجتماعي.
على الرغم من الإثارة حول الميزات الجديدة بين عشاق Midjourney ، لا يزال تركيب الصور مثيرًا للجدل بين بعض الفنانين نظرًا لكيفية تدريب أنظمة الذكاء الاصطناعي هذه ، باستخدام ملايين الصور المقطوعة من الويب دون استشارة الفنان أو الائتمان أو الإذن. لم تكشف Midjourney رسميًا أبدًا عن المحتويات الدقيقة لبيانات التدريب الخاصة بها. تحاول Adobe اتباع مسار أكثر أخلاقية للمضي قدمًا مع Firefly ، لكن Venture Beat ذكرت مؤخرًا أن موافقة الفنان النشطة لا تزال هامشية.
في الوقت الحالي ، من الصعب عدم تقدير التطورات التقنية التي افتتحت بها Midjourney بينما لا تزال تتساءل عما إذا كان هناك مسار أكثر أخلاقية للمضي قدمًا لهذه التكنولوجيا – مسار يرضي الفنانين ، سواء التقليديين أو الموسيقيين على حدٍ سواء.