يوم الأربعاء ، ميدجورني أعلن الإصدار 5 من خدمة تصنيع الصور التجارية بالذكاء الاصطناعي ، والتي يمكنها إنتاج صور واقعية بمستوى جودة يدعو إليه بعض محبي فنون الذكاء الاصطناعي مريب و “مثالية جدايتوفر Midjourney v5 الآن كاختبار ألفا للعملاء الذين يشتركون في خدمة Midjourney ، والتي تتوفر من خلال Discord.
قالت جولي ويلاند ، مصممة جرافيك غالبًا ما يشارك إبداعاتها Midjourney على تويتر. “فجأة ترى كل شيء بدقة 4K ، يبدو الأمر ساحقًا بشكل غريب ولكنه مذهل أيضًا.”
شاركت Wieland بعض أجيالها من Midjourney v5 مع Ars Technica (كما هو موضح أدناه في معرض وفي الصورة الرئيسية أعلاه) ، وهي تظهر بالتأكيد تقدمًا في تفاصيل الصورة منذ وصول Midjourney لأول مرة في مارس 2022. ظهر الإصدار 3 لأول مرة في أغسطس ، والنسخة 4 ظهر لأول مرة في نوفمبر. أضاف كل تكرار مزيدًا من التفاصيل إلى النتائج التي تم إنشاؤها ، كما توضح تجاربنا:
تعمل Midjourney بشكل مشابه لمصنعي الصور مثل Stable Diffusion و DALL-E من حيث أنها تولد صورًا بناءً على أوصاف نصية تسمى “المطالبات” باستخدام نموذج ذكاء اصطناعي تم تدريبه على ملايين الأعمال الفنية من صنع الإنسان. في الآونة الأخيرة ، كان Midjourney في قلب الجدل حول حقوق النشر فيما يتعلق بكتاب فكاهي يستخدم الإصدارات السابقة من الخدمة.
بعد تجربة v5 لمدة يوم واحد ، لاحظ ويلاند تحسينات تشمل ملمس بشرة “واقعي بشكل لا يصدق” وملامح وجه. إضاءة أكثر واقعية أو سينمائية ؛ انعكاسات ووهج وظلال أفضل ؛ زوايا أكثر تعبيرًا أو لمحات عامة عن مشهد ما ، و “عيون تكاد تكون مثالية وليست متزعزعة بعد الآن.”
وبالطبع اليدين.
مجرد تنبيه – يمكن للذكاء الاصطناعي في Midjourney الآن القيام بالأيدي بشكل صحيح. كن شديد النقد لأي صور سياسية (خاصة التصوير الفوتوغرافي) تراها على الإنترنت وتحاول إثارة رد فعل. pic.twitter.com/ebEagrQAQq
– ديل ووكر (TheCartelDel) 16 مارس 2023
على مدار العام الماضي ، أصبحت فكرة أن منشئي الذكاء الاصطناعي لا يستطيعون تقديم الأيدي بشكل صحيح شيئًا من مجاز ثقافي. والجدير بالذكر أن Midjourney v5 يمكنه إنتاج أيدي بشرية واقعية بشكل جيد إلى حد ما. قال ويلاند: “تكون الأيدي صحيحة في معظم الأوقات ، باستخدام 5 أصابع بدلاً من 7-10 في يد واحدة”.
في ملاحظات إصدار Discord للخدمة ، أشار Midjourney أيضًا إلى أن الإصدار 5 يستجيب الآن “بنطاق أسلوبي أوسع بكثير” من الإصدار 4 ، بينما يكون أيضًا أكثر حساسية للمطالبة ، ويولد نصًا أقل غير مرغوب فيه ، ويقدم زيادة 2x في دقة الصورة.
إذا كان هناك جانب سلبي مرئي لترقية Midjourney لعشاق الفن بالذكاء الاصطناعي ، فربما يأتي من الصور التي يمكن أن تكون واقعية و “مثالية” لدرجة أن دقة النموذج تزيل بعض التشويق من إنشاء صور ذكاء اصطناعي بشكل متكرر للعثور على نتيجة مناسبة ، ما قد يسمي المرء “تأثير آلة القمار”. على الرغم من أن أحد مستخدمي Twitter اسمه فيليب لينسن ذُكر“إذا كان لديك موضوع صورة معين في الاعتبار ، فإنه لا يزال يشبه اليانصيب إلى حد ما. ولكن مع فرص فوز أعلى من الإصدار 4.”