رسانه مدیاتیرسانه مدیاتیرسانه مدیاتی
  • خانه
  • اخبار و رویدادها
    • بورس
  • فناوری
  • خودرو و حمل نقل
  • آموزش و راهنما
  • سلامت و پزشکی
  • نبض بازار
    • قیمت بیت کوین و ارزهای دیجیتال [لحظه ای]
    • قیمت دلار امروز
    • قیمت طلا و سکه
    • قیمت روز خودروهای داخلی امروز [بازار آزاد و کارخانه ای]
جستجو
در حال مطالعه: نحوه راه اندازی و دسترسی و استفاده رایگان از Gemini API
به اشتراک گذاری
اطلاع‌رسانی
Font ResizerAa
رسانه مدیاتیرسانه مدیاتی
Font ResizerAa
جستجو
  • خانه
  • اخبار و رویدادها
    • بورس
  • فناوری
  • خودرو و حمل نقل
  • آموزش و راهنما
  • سلامت و پزشکی
  • نبض بازار
    • قیمت بیت کوین و ارزهای دیجیتال [لحظه ای]
    • قیمت دلار امروز
    • قیمت طلا و سکه
    • قیمت روز خودروهای داخلی امروز [بازار آزاد و کارخانه ای]
ما را دنبال کنید
رسانه مدیاتی > آموزش و راهنما > نحوه راه اندازی و دسترسی و استفاده رایگان از Gemini API
آموزش و راهنماپیشنهاد سردبیرویژه

نحوه راه اندازی و دسترسی و استفاده رایگان از Gemini API

آخرین به‌روز رسانی در ۱۴۰۲/۱۰/۰۴
توسط زهرا صمدی
منتشر شده در دی ۴, ۱۴۰۲
به اشتراک گذاری
نحوه راه اندازی و دسترسی و استفاده رایگان از Gemini API
نحوه راه اندازی و دسترسی و استفاده رایگان از Gemini API
به اشتراک گذاری

نحوه راه اندازی و دسترسی و استفاده رایگان از Gemini API

به گزارش رسانه مدیاتی، Gemini مدل جدیدی است که توسط گوگل توسعه یافته است. با استفاده از Gemini، می‌توانید با ارائه تصاویر، صدا و متن برای سوالات خود پاسخ‌های تقریباً کاملی دریافت کنید. در این آموزش با Gemini API و نحوه راه‌اندازی آن روی دستگاه خود آشنا خواهید شد. ما همچنین توابع مختلف Python API از جمله تولید متن و درک تصویر را نیز بررسی خواهیم کرد.

آنچه خواهید خواند
نحوه راه اندازی و دسترسی و استفاده رایگان از Gemini APIمعرفی مدل‌های هوش مصنوعی Geminiراه‌اندازیاستفاده از Gemini Proپیکربندی پاسخپاسخ استریمینگاستفاده از Gemini Pro Visionجلسه گفتگوهای چتاستفاده از Embeddingsنتیجه

نحوه دسترسی و استفاده رایگان Gemini API

معرفی مدل‌های هوش مصنوعی Gemini

Gemini مدل جدیدی از هوش مصنوعی است که از طریق همکاری بین تیم‌های Google، از جمله Google Research و Google DeepMind ایجاد شده است. این مدل به طور خاص چندوجهی ساخته شده است، به این معنی که می‌تواند انواع مختلف داده‌ها مانند متن، کد، صدا، تصاویر و ویدئو را درک کند و با آن کار کند.

جمینی پیشرفته‌ترین و بزرگ‌ترین مدل هوش مصنوعی است که تا به امروز توسط گوگل توسعه یافته است. این ربات، به گونه‌ای طراحی شده است که بسیار انعطاف‌پذیر باشد به طوری که بتواند به طور موثر در طیف گسترده‌ای از سیستم‌ها، از مراکز داده گرفته تا دستگاه‌های تلفن همراه، کار کند. این به این معنی است که این پتانسیل را دارد که روشی را که کسب‌وکارها و توسعه‌دهندگان می‌توانند با آنها برنامه‌های هوش مصنوعی بسازند و مقیاس‌بندی کنند، متحول کند.

- تبلیغات -

در اینجا سه نسخه از مدل Gemini برای موارد استفاده‌های مختلف طراحی شده است:

  • Gemini Ultra: بزرگ‌ترین و پیشرفته‌ترین هوش مصنوعی که قادر به انجام کارهای پیچیده است.
  • Gemini Pro: مدل متعادلی که عملکرد و مقیاس‌پذیری خوبی دارد.
  • Gemini Nano: کارآمدترین برای دستگاه‌های تلفن همراه.

نحوه دسترسی و استفاده رایگان Gemini API

Gemini Ultra دارای عملکردی پیشرفته است که در چندین معیار، از عملکرد GPT-4 فراتر می‌رود. این اولین مدلی است که در معیار درک زبان، دانش جهانی و حل مسئله را در 57 موضوع مختلف آزمایش می‌کند و از متخصصان انسانی هم پیشی گرفته است.

 

راه‌اندازی

برای استفاده از API، ابتدا باید یک کلید API دریافت کنیم که می‌توانید از لینک زیر آن را دانلود کنید:

https://ai.google.dev/tutorials/setup

نحوه دسترسی و استفاده رایگان Gemini API

پس از آن روی دکمه Get an API key کلیک کنید و سپس روی Create API key in new project کلیک کنید.

نحوه دسترسی و استفاده رایگان Gemini API

کلید API را کپی کرده و آن را به عنوان متغیر محیطی تنظیم کنید. می‌توانید از Deepnote استفاده کنید. به integration بروید، به پایین بروید و environment variables را انتخاب کنید.

نحوه دسترسی و استفاده رایگان Gemini API

در مرحله بعد، API پایتون را با استفاده از PIP نصب کنید: pip install -q -U google-generativeai

پس از آن، کلید API را روی GenAI Google تنظیم کنید و کار را شروع کنید: import google.generativeai as genai import os

gemini_api_key = os.environ[“GEMINI_API_KEY”] genai.configure(api_key = gemini_api_key)

 

استفاده از Gemini Pro

پس از تنظیم کلید API، استفاده از مدل Gemini Pro برای تولید محتوا ساده است. یک فرمان برای تابع generate_content ارائه دهید و خروجی را به صورت Markdown نمایش دهید.

from IPython.display import Markdown model = genai.GenerativeModel(‘gemini-pro’) response = model.generate_content(“Who is the GOAT in the NBA?”) Markdown(response.text)

نحوه دسترسی و استفاده رایگان Gemini API

Gemini می‌تواند چندین پاسخ برای یک درخواست ایجاد کند. شما می‌توانید مناسب‌ترین پاسخ را انتخاب کنید.

response.candidates

نحوه دسترسی و استفاده رایگان Gemini API

برای آزمایش، از آن بخواهید که یک بازی ساده در پایتون انجام دهد.

response = model.generate_content(“Build a simple game in Python”) Markdown(response.text)

نتیجه ساده و دقیق است. اکثر LLMها به جای نوشتن کد پایتون، شروع به توضیح آن می‌کنند.

نحوه دسترسی و استفاده رایگان Gemini API

 

پیکربندی پاسخ

می‌توانید پاسخ خود را با استفاده از آرگومان ‘generation_config’ سفارشی کنید.

response = model.generate_content( ‘Write a short story about aliens.’, generation_config=genai.types.GenerationConfig( candidate_count=1, stop_sequences=[‘space’], max_output_tokens=200, temperature=0.7) ) Markdown(response.text)

نحوه دسترسی و استفاده رایگان Gemini API

 

پاسخ استریمینگ

همچنین می‌توانید از آرگومان «stream» برای پخش استریمینگ پاسخ استفاده کنید. این کار شبیه به Anthropic و OpenAI API است اما سریع‌تر از آن است.

model = genai.GenerativeModel(‘gemini-pro’) response = model.generate_content(“Write a Julia function for cleaning the data.”, stream=True) for chunk in response: print(chunk.text)

 

استفاده از Gemini Pro Vision

در این بخش، یک عکس را بارگیری می‌کنیم و از آن برای آزمایش چندوجهی بودن Gemini Pro Vision استفاده می‌کنیم.

تصاویر را در “PIL” بارگیری کرده و آن را نمایش دهید.

import PIL.Image img = PIL.Image.open(‘images/photo-1.jpg’) img

در زیر مشاهده می‌کنید که ما یک عکس باکیفیت از طاق روآ آگوستا داریم. بیایید مدل Gemini Pro Vision را بارگذاری کنیم و تصویر را در اختیار آن قرار دهیم.

نحوه دسترسی و استفاده رایگان Gemini API

model = genai.GenerativeModel(‘gemini-pro-vision’) response = model.generate_content(img) Markdown(response.text)

این مدل به طور دقیق کاخ را شناسایی کرد و اطلاعات بیشتری در مورد تاریخچه و معماری آن ارائه کرد.

نحوه دسترسی و استفاده رایگان Gemini API

اگر همان تصویر را به GPT-4 ارائه دهیم و از آن در مورد تصویر بپرسیم، هر دو مدل پاسخ‌های تقریبا مشابهی ارائه کرده‌اند. اما پاسخ GPT-4 کمی بهتر است.

نحوه دسترسی و استفاده رایگان Gemini API

اکنون متن و تصویر را به API ارائه می‌دهیم. ما از مدل خواسته‌ایم تا با استفاده از تصویر به عنوان مرجع، یک وبلاگ سفر بنویسد.

 

نحوه دسترسی و استفاده رایگان Gemini API

response = model.generate_content([“Write a travel blog post using the image as reference.”, img]) Markdown(response.text)

در مقایسه با GPT-4، مدل Gemini Pro Vision برای ایجاد یک وبلاگ با فرمت طولانی تلاش بیشتری کرده است.

نحوه دسترسی و استفاده رایگان Gemini API

 

جلسه گفتگوهای چت

می‌توانیم مدل را طوری تنظیم کنیم که یک جلسه گفتگوی دو طرفه داشته باشیم. به این ترتیب مدل، زمینه و پاسخ را با استفاده از مکالمات قبلی به خاطر می‌آورد.

در مورد زیر، از مدل درخواست شده که به کاربر کمک کند تا درباره بازی Dota 2 او را راهنمایی کند.

model = genai.GenerativeModel(‘gemini-pro’) chat = model.start_chat(history=[]) chat.send_message(“Can you please guide me on how to start playing Dota 2?”) chat.history

همانطور که می بینید، تاریخچه کاربر و حالت چت را ذخیره می‌کند. همچنین می‌توانید آنها را به سبک Markdown نمایش دهید.

نحوه دسترسی و استفاده رایگان Gemini API

for message in chat.history: display(Markdown(f'{message.role}: {message.parts[0].text}’))

نحوه دسترسی و استفاده رایگان Gemini API

بیایید سوال بعدی را بپرسیم.

chat.send_message(“Which Dota 2 heroes should I start with?”) for message in chat.history: display(Markdown(f'{message.role}: {message.parts[0].text}’))

می‌توانیم به پایین اسکرول کنیم و کل گفت‌وگو با مدل را ببینیم.

 

استفاده از Embeddings

مدل Gemini embedding-001 به کلمات، جملات یا کل اسناد اجازه می‌دهد تا به عنوان بردارهای متراکم که قابلیت رمزگذاری دارند، نمایش داده شوند. این نمایش برداری امکان مقایسه شباهت بین قطعات مختلف متن را با مقایسه بردارهای متناظر آنها فراهم می‌کند.

همچنین می‌توانید محتوا را به «embed_content» ارائه کنید.

output = genai.embed_content( model=”models/embedding-001″, content=”Can you please guide me on how to start playing Dota 2?”, task_type=”retrieval_document”, title=”Embedding of Dota 2 question”) print(output[’embedding’][0:10])

[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]

می‌توانید چندین تکه متن را با ارسال فهرستی از رشته‌ها به آرگومان content، به جاسازی‌ها تبدیل کنیم.

output = genai.embed_content( model=”models/embedding-001″, content=[ “Can you please guide me on how to start playing Dota 2?”, “Which Dota 2 heroes should I start with?”, ], task_type=”retrieval_document”, title=”Embedding of Dota 2 question”) for emb in output[’embedding’]: print(emb[:10])

[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664] [0.04775657, -0.044990525, -0.014886052, -0.08473655, 0.04060122, 0.035374347, 0.031866882, 0.071754575, 0.042207796, 0.04577447]

 

نتیجه

توابع پیشرفته بسیار زیادی وجود دارد که در این آموزش مقدماتی به آنها اشاره نکردیم. با رفتن به Gemini API: Quickstart with Python می‌توانید درباره Gemini API بیشتر بدانید. در این آموزش با Gemini و نحوه دسترسی به API پایتون برای تولید پاسخ آشنا شدید. به طور خاص، ما در مورد تولید متن، درک بصری، تاریخچه مکالمه و… صحبت کردیم. با این حال، این فقط بخش کوچکی از کاری است که Gemini می‌تواند انجام دهد.

منبعkdnuggets
به اشتراک گذاری این مطلب
فیسبوک لینکداین تلگرام ایمیل کپی لینک پرینت
به اشتراک گذاری
مطلب قبلی فرجی تهرانی فرجی تهرانی بر صندلی ریاست باقی ماند
مطلب بعدی هر 2 ثانیه یک تویوتا لندکروز مدل جدید فروخته شد! هر 2 ثانیه یک تویوتا لندکروز مدل جدید فروخته شد!
کامنت خود را ارسال کنید

دیدگاهتان را بنویسید لغو پاسخ

برای نوشتن دیدگاه باید وارد بشوید.

- تبلیغات -
Ad image

مطالب پیشنهادی

USB-C با قابلیت PD چیست و چه کاربردی دارد
USB-C با قابلیت PD چیست و چه کاربردی دارد
فناوری و دیجیتال
کاهش قیمت چشمگیر گلکسی Z Flip7 و S25 Ultra؛ موتورولا Razr Ultra 2025 معرفی شد
کاهش قیمت چشمگیر گلکسی Z Flip7 و S25 Ultra؛ موتورولا Razr Ultra 2025 معرفی شد
فناوری و دیجیتال موبایل
انقلاب هوش مصنوعی در رابط کاربری گوشی‌های وان‌پلاس: معرفی OxygenOS 16 با قابلیت‌های خیره‌کننده
انقلاب هوش مصنوعی در رابط کاربری گوشی‌های وان‌پلاس: معرفی OxygenOS 16 با قابلیت‌های خیره‌کننده
فناوری و دیجیتال
پرده‌برداری از گجت‌های جدید اوپو: معرفی تبلت قدرتمند Pad 5 با نمایشگر ۱۴۴ هرتزی و ساعت هوشمند Watch S
پرده‌برداری از گجت‌های جدید اوپو: معرفی تبلت قدرتمند Pad 5 با نمایشگر ۱۴۴ هرتزی و ساعت هوشمند Watch S
فناوری و دیجیتال
- تبلیغات -
Ad image

لینک‌های کاربردی

  • پیام ناشناس
  • سایت بو نده
  • فیدبک پرو

ممکنه به این مطالب هم علاقه داشته باشی

بیت کوین
اخبار و رویدادهاارز دیجیتالویژه

بیت کوین در مسیر ورود به کانال ۱۸ هزار دلاری

اسفند ۲۵, ۱۳۹۹
عرضه قابلیت‌های ویژه کسب‌وکارها توسط واتساپ
فناوری و دیجیتالویژه

چت با مخاطبان در واتساپ راحت‌تر می‌شود!

فروردین ۱۴, ۱۴۰۱
تولد نهنگ‌های جدید بیت‌کوین
ارز دیجیتالویژه

صعود بیت کوین برخلاف سایر ارزهای دیجیتال

اسفند ۲۵, ۱۳۹۹
اولین واکسن ایرانی کرونا وارد بازار مصرف می‌شود
سلامت و پزشکیویژه

اولین واکسن ایرانی کرونا وارد بازار مصرف می‌شود

خرداد ۳۰, ۱۴۰۰

لینک‌های کاربردی

  • پیام ناشناس
  • سایت بو نده
  • فیدبک پرو

محبوب‌های گذشته

اعتراض شدید به میزان افزایش حقوق بازنشستگان تامین اجتماعی
اعتراض شدید به میزان افزایش حقوق بازنشستگان تامین اجتماعی
اخبار و رویدادها
لپ‌ تاپ‌ هایی که نباید بخرید!
لپ‌ تاپ‌ هایی که نباید بخرید!
فناوری و دیجیتال
بهترین نرم‌ افزارهای آنتی ویروس سال 2023
بهترین نرم‌ افزارهای آنتی ویروس سال 2023
فناوری و دیجیتال

درباره رسانه مدیاتی

اگر به خبر فناوری و دنیای آی تی علاقه دارید، اگر به دنبال مرجع اخبار به روز هستید، رسانه مدیاتی مرجعی برای اخبار تکنولوژی است و روزانه مهم ترین خبرهای آیتی را

رسانه مدیاتی فعالیت خود را از مرداد 1399 آغاز کرد. هدف این رسانه افزایش سطح معلومات مخاطبان در کنار ارائۀ جدیدترین اخبار در زمینۀ آی تی و سایر حوزه‌های پر مخاطب است.

علاوه بر این می‌توانید قیمت و نرخ روز دلار ، قیمت روز سکه و طلا و همچنین قیمت روز خودرو را در رسانه مدیاتی دنبال کنید.

برای ارتباط با رسانه مدیاتی می‌توانید از طریق آدرس ایمیل info [a] mediat [dot] ir با ما ارتباط برقرار کنید.

مطالب تصادفی

ریلمی ۱۵ و ۱۵ پرو رسماً معرفی شدند؛ قدرت بیشتر، دوربین‌های ارتقاءیافته
ریلمی ۱۵ و ۱۵ پرو رسماً معرفی شدند؛ قدرت بیشتر، دوربین‌های ارتقاءیافته
فناوری و دیجیتال موبایل
Oppo K13 Turbo به‌زودی وارد هند می‌شود؛ زمان عرضه و مشخصات جذاب لو رفت
Oppo K13 Turbo به‌زودی وارد هند می‌شود؛ زمان عرضه و مشخصات جذاب لو رفت
فناوری و دیجیتال موبایل
رد مجیک ۱۶ پرو؛ لپ‌تاپ گیمینگ قدرتمند نوبیا رسماً معرفی شد
رد مجیک ۱۶ پرو؛ لپ‌تاپ گیمینگ قدرتمند نوبیا رسماً معرفی شد
فناوری و دیجیتال
ما را دنبال کنید
تمامی حقوق متعلق است به رسانۀ خبری مدیاتی است.