مقایسه تصاویر تولیدی 5 هوش مصنوعی متفاوت – بخش اول
به گزارش رسانه مدیاتی، چند روز پیش، تیم Midjourney به مناسبت کریسمس با انتشار ناگهانی مدل پایه V6 کاربران خود را سورپرایز کرد. این مدل، نوید درک سریعتر و تولید متن بهتر نسبت به مدل قبلی آن را میدهد. یک هفته قبل از آن نیز، متا یک مولد تصویر جدید هوش مصنوعی را معرفی کرد که به اعتقاد برخی کاربران بهترین مدل رایگان در حال حاضر است.
با عرضه مولد تصویر هوش مصنوعی متا و Midjourney V6، رقابت برای بهترین تولیدکننده تصویر هوش مصنوعی بیشتر شده است. بنابراین، بیایید در این مقاله، ببینیم که چگونه Midjourney، Meta، DALL-E 3، Stable Diffusion XL و Adobe Firefly 2 مقابل یکدیگر قرار میگیرند. وقت آن است که یک مقایسه بزرگ بین محبوبترین تولیدکنندههای تصویر هوش مصنوعی بازار انجام دهیم: Midjourney، DALL-E، Firefly، Stable Diffusion و Meta.
در این مقایسه به هر مولد عکس، یک موضوع ثابت داده میشود و از آن خواسته میشود برای درخواست، عکس مد نظر تولید شود.
1. زمینه رئالیسم (پرتره)
- موضوع: پرتره نزدیک از یک ماهیگیر با چین و چروک دور چشمانش و ریش سفید، همراه با نورپردازی سینمایی
( Midjourney )
( Meta )
( Firfly )
( Stable Diffusion )
( DALL-E 3 )
در بین پنج تولیدکننده تصویر، فقط Midjourney و Meta موفق شدند تصاویری ایجاد کنند که تست را با موفقیت کامل پشت سر بگذارند. پرتره فایرفلای خیلی مصنوعی است و ریش ماهیگیر واقعی به نظر نمیرسد. Stable Diffusion اصلاً واقعگرایانه به نظر نمیرسد و بیشتر شبیه یک نقاشی رنگ روغن است. DALL-E 3 میتوانست خوب باشد، اما روی چین و چروکها بیش از حد تاکید کرده است.
به جزئیات تصویر Midjourney نگاه کنید. وقتی بزرگنمایی کنید، میتوانید تک تک تارهای مو، خطوط سنی و حتی انعکاس چشمان پیرمرد را ببینید.
2. زمینه رئالیسم (منظره)
- موضوع: خط ساحلی ناهموار فرسایش یافته توسط امواج، صخرههای سر به فلک کشیده در طاق های چشمگیر و حضور پرندگان دریایی که در بالای دریا اوج میگیرند. همچنین مه در امتداد افق به چشم میخورد.
( Midjourney )
( Firefly )
( Stable Diffusion )
( Meta )
( DALL-E 3 )
بار دیگر، Midjourney برنده این دور است. V6 در مورد تصاویری که به واقعیت شبیه باشند، واقعی، بسیار ندفق عمل کرده است. اگر فقط به دنبال یک تصویر استوک منظره هستید، ممکن است Firefly گزینه بهتری برای شما باشد.
در مورد سه مورد دیگر: Stable Diffusion و Meta در واقع بسیار مناسب بودند، اما صخرهها وقتی بزرگنمایی میشوند مانند تودهای از خاک رس صاف به نظر میرسند. DALL-E 3 هم بیشتر از هنر دیجیتال استفاده کرده است، چیزی که ممکن است به دنبال آن نباشیم.
3. زمینه رئالیسم (ورزشی)
- موضوع: تصویری از یک بازیکن پیکلبال که گل میزند.
( Midjourney )
( DALL-E 3 )
( Firefly )
( Stable Diffusion )
( Meta )
مولد Midjourney برنده واضح این دسته است. DALL-E 3 میتوانست بهتر باشد، اما از برخی عناصر به تعداد دفعات زیاد استفاده کرده است. به نظر میرسد Adobe Firefly در میان آنها بهترین است، اما این عکس خیلی احساس واقعی بودن به انسان نمیدهد، هیچ دست و پا زدنی وجود ندارد و بازیکن فقط سه انگشت دارد. در مورد Stable Diffusion، بازیکن از تجهیزات مناسب استفاده نمیکند، در حال شکستن نور است و به معنای واقعی کلمه صورتش در حال ذوب شدن است. تصویر متا هم که بیشتر جنبه طنز دارد.
4. فشن
- موضوع: یک مرد شیکپوش با لباسهای نارنجی و سبز با فیگورهای زیبا. عکاسی به سبک پست مدرن و حضور گیاهان در تصویر.
( Midjourney )
( Meta )
( DALL-E 3 )
( Stable Diffusion )
( Firefly )
مولد Midjourney بیشتر شبیه عکاسی مد واقعی است، بنابراین سزاوار مقام اول است. تنها مشکلی که دارد این است که سایهها قسمتهایی از لباس را مبهم میکنند. Meta نیز تصویر خوبی ایجاد کرد، اما اگر میتوانستیم کل لباس را ببینیم، بیشتر به مقایسه ما کمک میکرد. DALL-E 3 خیلی خوب است اما سایه سوژه بیش از حد چشم را آزار میدهد. Stable Diffusion ورودی بسیار خوبی داشت، اما یک مشکل رندر باعث شد که انگشتان به داخل لباس وارد شوند. Adobe Firefly بسیار رئالیسم است، اما از دستورالعملهای مقرر شده برای آرت نوو یا ظرافت پیروی نکرد.
5. معماری و طراحی داخلی
- موضوع: یک اتاق خواب پر سروصدای شهری با نور طلایی
( Meta )
( Midjourney )
( DALL-E 3 )
( Firefly )
( Stable Diffusion )
از نظر رئالیسم، فقط Midjourney و Meta در این آزمون طراحی داخلی موفق شدند. طراحی متا دقیقا شبیه یک اتاق خواب واقعی است. مطمئنا، هنوز هم برخی از اشتباهات وجود دارد، اما از دور قابل توجه نیست. خروجی Midjourney نیز خوب است، اما تفاوتهای ظریف آن احساس میشود، زیرا تصویر تولیدی، طراحی کاربردی برای اتاق خواب نیست.
6. تبلیغات سهبعدی محصولات
- موضوع: عکاسی تجاری برای شیشه عطر، با پسزمینه آبی پاستلی با نورپردازی ملایم و وجود گل
( Midjourney )
( Meta )
( Stable Diffusion )
( Firefly )
( DALL-E 3 )
در این زمینه، همه مولدها قوی عمل کردند. با این حال، هوش مصنوعی Midjourney V6 با تصویر زیبای منحصر به فردش، همچنان به رقابت خود ادامه میدهد. این تصویر، بسیار رویایی و خوش عکس است و کنتراستهای بسیار خوبی هم دارد. در مورد متا هم فقط متن به خوبی نوشته نشده است.