گوگل Project Genie را معرفی کرد؛ خلق جهان‌های تعاملی با دستورات متنی

گوگل Project Genie را معرفی کرد؛ خلق جهان‌های تعاملی با دستورات متنی

به گزارش مدیاتی:گوگل با معرفی Project Genie، گامی تازه در دنیای هوش مصنوعی برداشته است؛ این فناوری جدید قادر است با دریافت دستورات متنی، جهان‌های تعاملی و مجازی خلق کند و تجربه‌ای تازه از تعامل با محیط‌های دیجیتال به کاربران ارائه دهد.

Project Genie؛ هوش مصنوعی جدید گوگل برای ساخت جهان‌های مجازی با متن

گوگل با معرفی Project Genie، گامی بلند در مسیر دستیابی به هوش مصنوعی جامع (AGI) برداشته است. این ابزار مبتنی‌بر هوش مصنوعی که فعلاً برای کاربران دارای اشتراک AI Ultra در آمریکا در دسترس است، امکان خلق جهان‌های تعاملی و قابل تجربه را تنها با نوشتن چند خط متن فراهم می‌کند.

Genie 3؛ مدل جهانی همه‌منظوره

Genie 3 در واقع یک «مدل جهانی» (World Model) است که محیط‌های متنوع و تعاملی را شبیه‌سازی می‌کند. برخلاف مدل‌های پیشین گوگل دیپ‌مایند که برای بازی‌های خاصی مانند شطرنج یا Go طراحی شده بودند، این مدل می‌تواند تنوع دنیای واقعی را درک کند و نحوه تکامل محیط را براساس اقدامات کاربر پیش‌بینی کند.

نحوه خلق جهان‌های تعاملی

در نسخه اولیه تحقیقاتی، کاربر ابتدا محیط دلخواه خود را توصیف می‌کند؛ برای مثال مشخص می‌کند که جهان را با پیاده‌روی، پرواز، رانندگی یا دیگر روش‌ها کاوش کند و زاویه دید اول‌شخص یا سوم‌شخص باشد.

سپس شخصیت موردنظر (انسان، حیوان یا حتی یک شیء) انتخاب می‌شود و مدل Nano Banana Pro یک طرح اولیه یا پیش‌نمایش از جهان ایجادشده ارائه می‌دهد. این امکان به کاربر اجازه می‌دهد پیش از ورود کامل، ظاهر جهان را بررسی و در صورت نیاز ویرایش کند. با تأیید، با انتخاب دکمه Create world، تجربه‌ای ۶۰ ثانیه‌ای آغاز می‌شود.

جهان‌های ساخته‌شده با کیفیت ۷۲۰p و نرخ فریم ۲۰ تا ۲۴ فریم بر ثانیه اجرا می‌شوند و نکته جالب اینکه Genie 3 مسیرهای بعدی جهان را به‌صورت زنده و براساس حرکت کاربر خلق می‌کند.

Remix Worlds و شخصی‌سازی جهان‌ها

Project Genie همچنین شامل ویژگی Remix Worlds است که امکان ویرایش و شخصی‌سازی جهان‌های موجود یا آثار دیگر کاربران را فراهم می‌کند. کاربران می‌توانند با تغییر دستورات (Prompts)، نسخه جدیدی از جهان‌ها بسازند و حتی ویدیوهای تولیدشده را دانلود کنند.

محدودیت‌ها و اهداف

گوگل تأکید کرده که محیط‌های تولیدشده همیشه واقع‌گرایانه نیستند و ممکن است برخی قوانین فیزیک رعایت نشود. کنترل شخصیت‌ها گاهی با تأخیر همراه است و هر جلسه فعلاً محدود به ۶۰ ثانیه است.

هدف اصلی گوگل از ارائه Project Genie، درک بهتر نحوه تعامل کاربران با مدل‌های جهانی در تحقیقات هوش مصنوعی است، اما در چشم‌انداز بزرگ‌تر، این فناوری بخشی از مأموریت گوگل دیپ‌مایند برای رسیدن به AGI به شمار می‌رود.

فعلاً دسترسی به این ابزار تنها برای کاربران بالای ۱۸ سال در ایالات متحده که اشتراک پریمیوم دارند امکان‌پذیر است، اما گوگل وعده داده به‌زودی آن را برای افراد بیشتری در دسترس قرار خواهد داد.

آیا این مطلب را دوست داشتید؟

دیدگاهتان را بنویسید