قابلیت پردازش ویدیوهای یک ساعته با Gemini 1.5 Pro گوگل
به گزارش رسانه مدیاتی، گوگل که هفته گذشته نام چتبات Bard خود را به Gemini تغییر داده بود، حالا از مدل Gemini 1.5 Pro رونمایی کرده است که بهعنوان جایگزین Gemini 1.0 Pro طراحی شده است. عملکرد Gemini 1.5 Pro در برخی زمینهها نسبت به نسل قبلی خود بهبود یافته است که احتمالاً مهمترین بهبود آن به میزان دادههایی مربوط میشود که میتواند پردازش کند.
براساس بیانیه گوگل، Gemini 1.5 Pro میتواند حدود 700 هزار کلمه یا 30 هزار خط کد بنویسد (35 برابر بیشتر از Gemini 1.0 Pro) و یک مدل چندوجهی است، به این معنی که عملکرد آن به متن محدود نمیشود. علاوه بر این، Gemini 1.5 Pro میتواند تا 11 ساعت صدا یا یک ساعت ویدیو به زبانهای مختلف را دریافت کند.
بیشتر بخوانید: ایربادهای Earbuds Ultra Open با طراحی جدید و قیمت 299 دلار
Gemini 1.5 Pro که از روز گذشته (بهعنوان نسخه پیشنمایش محدود) برای اکثر توسعهدهندگان و مشتریان در دسترس است، ابتدا فقط میتواند 100 هزار کلمه را بهطور همزمان پردازش کند. همچنین فقط توسعهدهندگان تأیید شده اجازه دارند تا از طریق ابزار توسعهدهنده GenAI AI Studio گوگل آن را آزمایش کنند. علاوه بر این، برخی مشتریان که از پلتفرم Vertex AI گوگل استفاده می کنند نیز به Gemini 1.5 Pro دسترسی دارند.
معاون تحقیقات Google DeepMind از این مدل بهعنوان یک دستاورد بزرگ یاد کرده است و میگوید:
«زمانی که شما با مدلهای GenAI تعامل میکنید، اطلاعاتی که وارد و دریافت میکنید به زمینه تبدیل میشوند و هرچه سوالات و تعاملات شما طولانیتر و پیچیدهتر باشد، زمینهای که مدل به آن نیاز دارد نیز طولانیتر میشود. ما امکان دسترسی به زمینه طولانی را به روشی بسیار گسترده فراهم کردهایم.»
زمینه یک مدل هوش مصنوعی به دادههای ورودی (مثلا متن) اشاره دارد که مدل قبل از تولید خروجی خود باید آنها را در نظر بگیرد. یک سوال ساده، مانند «چه کسی در انتخابات ریاست جمهوری 2020 آمریکا پیروز شد؟» یا حتی یک فیلمنامه، ایمیل یا کتاب الکترونیکی میتوانند بهعنوان یک زمینه عمل کنند.