مقایسه تصاویر تولیدی 5 هوش مصنوعی‌ متفاوت – بخش اول

مقایسه تصاویر تولیدی 5 هوش مصنوعی‌ متفاوت – بخش اول

به گزارش رسانه مدیاتی، چند روز پیش،  تیم Midjourney به مناسبت کریسمس با انتشار ناگهانی مدل پایه V6 کاربران خود را سورپرایز کرد. این مدل، نوید درک سریع‌تر و تولید متن بهتر نسبت به مدل قبلی آن را می‌دهد. یک هفته قبل از آن نیز، متا یک مولد تصویر جدید هوش مصنوعی را معرفی کرد که به اعتقاد برخی کاربران بهترین مدل رایگان در حال حاضر است.

با عرضه مولد تصویر هوش مصنوعی متا و Midjourney V6، رقابت برای بهترین تولید‌کننده تصویر هوش مصنوعی بیشتر شده است. بنابراین، بیایید در این مقاله، ببینیم که چگونه Midjourney، Meta، DALL-E 3، Stable Diffusion XL و Adobe Firefly 2 مقابل یکدیگر قرار می‌گیرند. وقت آن است که یک مقایسه بزرگ بین محبوب‌ترین تولیدکننده‌های تصویر هوش مصنوعی بازار انجام دهیم: Midjourney، DALL-E، Firefly، Stable Diffusion و Meta.

در این مقایسه به هر مولد عکس، یک موضوع ثابت داده می‌شود و از آن خواسته می‌شود برای درخواست، عکس مد نظر تولید شود.

 

1. زمینه رئالیسم (پرتره)

  • موضوع: پرتره نزدیک از یک ماهیگیر با چین و چروک دور چشمانش و ریش سفید، همراه با نورپردازی سینمایی

مولدهای تصاویر

( Midjourney )

 

مولدهای تصاویر

( Meta )

 

مولدهای تصاویر

( Firfly )

 

مولدهای تصاویر

( Stable Diffusion )

 

مولدهای تصاویر

( DALL-E 3 )

 

در بین پنج تولیدکننده تصویر، فقط Midjourney و Meta موفق شدند تصاویری ایجاد کنند که تست را با موفقیت کامل پشت سر بگذارند. پرتره فایرفلای خیلی مصنوعی است و ریش ماهیگیر واقعی به نظر نمی‌رسد. Stable Diffusion اصلاً واقع‌گرایانه به نظر نمی‌رسد و بیشتر شبیه یک نقاشی رنگ روغن است. DALL-E 3 می‌توانست خوب باشد، اما روی چین و چروک‌ها بیش از حد تاکید کرده است.

به جزئیات تصویر Midjourney نگاه کنید. وقتی بزرگنمایی کنید، می‌توانید تک تک تارهای مو، خطوط سنی و حتی انعکاس چشمان پیرمرد را ببینید.

 

2. زمینه رئالیسم (منظره)

  • موضوع: خط ساحلی ناهموار فرسایش یافته توسط امواج، صخره‌های سر به فلک کشیده در طاق های چشمگیر و حضور پرندگان دریایی که در  بالای دریا اوج می‌گیرند. همچنین مه در امتداد افق به چشم می‌خورد.

مولدهای تصاویر

( Midjourney )

 

مولدهای تصاویر

( Firefly )

 

مولدهای تصاویر

( Stable Diffusion )

 

مولدهای تصاویر

( Meta )

 

مولدهای تصاویر

( DALL-E 3 )

بار دیگر، Midjourney برنده این دور است. V6 در مورد تصاویری که به واقعیت شبیه باشند، واقعی، بسیار ندفق عمل کرده است. اگر فقط به دنبال یک تصویر استوک منظره هستید، ممکن است Firefly گزینه بهتری برای شما باشد.

در مورد سه مورد دیگر: Stable Diffusion و Meta در واقع بسیار مناسب بودند، اما صخره‌ها وقتی بزرگ‌نمایی می‌شوند مانند توده‌ای از خاک رس صاف به نظر می‌رسند. DALL-E 3 هم بیشتر از هنر دیجیتال استفاده کرده است، چیزی که ممکن است به دنبال آن نباشیم.

 

3. زمینه رئالیسم (ورزشی)

  • موضوع: تصویری از یک بازیکن پیکلبال که گل می‌زند.

مولدهای تصاویر

( Midjourney )

 

مولدهای تصاویر

( DALL-E 3 )

 

مولدهای تصاویر

( Firefly )

 

مولدهای تصاویر

( Stable Diffusion )

 

مولدهای تصاویر

( Meta )

 

مولد Midjourney برنده واضح این دسته است. DALL-E 3 می‌توانست بهتر باشد، اما از برخی عناصر به تعداد دفعات زیاد استفاده کرده است. به نظر می‌رسد Adobe Firefly در میان آنها بهترین است، اما این عکس خیلی احساس واقعی بودن به انسان نمی‌دهد، هیچ دست و پا زدنی وجود ندارد و بازیکن فقط سه انگشت دارد. در مورد Stable Diffusion، بازیکن از تجهیزات مناسب استفاده نمی‌کند، در حال شکستن نور است و به معنای واقعی کلمه صورتش در حال ذوب شدن است. تصویر متا هم که بیشتر جنبه طنز دارد.

 

4. فشن

  • موضوع: یک مرد شیک‌پوش با لباس‌های نارنجی و سبز با فیگورهای زیبا. عکاسی به سبک پست مدرن و حضور گیاهان در تصویر.

مولدهای تصاویر

( Midjourney )

 

مولدهای تصاویر

( Meta )

 

مولدهای تصاویر

( DALL-E 3 )

 

مولدهای تصاویر

( Stable Diffusion )

 

مولدهای تصاویر

( Firefly )

 

مولد Midjourney بیشتر شبیه عکاسی مد واقعی است، بنابراین سزاوار مقام اول است. تنها مشکلی که دارد این است که سایه‌ها قسمت‌هایی از لباس را مبهم می‌کنند. Meta نیز تصویر خوبی ایجاد کرد، اما اگر می‌توانستیم کل لباس را ببینیم، بیشتر به مقایسه ما کمک می‌کرد. DALL-E 3 خیلی خوب است اما سایه سوژه بیش از حد چشم را آزار می‌دهد. Stable Diffusion ورودی بسیار خوبی داشت، اما یک مشکل رندر باعث شد که انگشتان به داخل لباس وارد شوند. Adobe Firefly بسیار رئالیسم است، اما از دستورالعمل‌های مقرر شده برای آرت نوو یا ظرافت پیروی نکرد.

 

5. معماری و طراحی داخلی

  • موضوع: یک اتاق خواب پر سروصدای شهری با نور طلایی

مولدهای تصاویر

( Meta )

 

مولدهای تصاویر

( Midjourney )

 

مولدهای تصاویر

( DALL-E 3 )

 

مولدهای تصاویر

( Firefly )

 

مولدهای تصاویر

( Stable Diffusion )

از نظر رئالیسم، فقط Midjourney و Meta در این آزمون طراحی داخلی موفق شدند. طراحی متا دقیقا شبیه یک اتاق خواب واقعی است. مطمئنا، هنوز هم برخی از اشتباهات وجود دارد، اما از دور قابل توجه نیست. خروجی Midjourney نیز خوب است، اما تفاوت‌های ظریف آن احساس می‌شود، زیرا تصویر تولیدی، طراحی کاربردی برای اتاق خواب نیست.

 

6. تبلیغات سه‌بعدی محصولات

  • موضوع: عکاسی تجاری برای شیشه عطر، با پس‌زمینه آبی پاستلی با نورپردازی ملایم و وجود گل

مولدهای تصاویر

( Midjourney )

 

مولدهای تصاویر

( Meta )

 

مولدهای تصاویر

( Stable Diffusion )

 

مولدهای تصاویر

( Firefly )

 

DALL-E 3

( DALL-E 3 )

در این زمینه، همه مولدها قوی عمل کردند. با این حال، هوش مصنوعی Midjourney V6 با تصویر زیبای منحصر به فردش، همچنان به رقابت خود ادامه می‌دهد. این تصویر، بسیار رویایی و خوش عکس است و کنتراست‌های بسیار خوبی هم دارد. در مورد متا هم فقط متن به خوبی نوشته نشده است.

این مطلب را به اشتراک بگذارید

دیدگاهتان را بنویسید