«تابناک با تو» - جمینی Gemini هوش مصنوعی گوگل است که گوگل آن را توانمندترین مدل هوش مصنوعی خود مینامد و برای تشخیص، درک و ترکیب انواع مختلف اطلاعات از جمله متن، تصاویر، صدا، ویدئو و کد آموزش دیده است.
مدل جدید هوش مصنوعی گوگل بهعنوان منعطفترین مدل تاکنون توصیف شده و میتواند روی وسایل موبایل مانند Google Pixel ۸ Pro و همچنین مراکز داده کامل و گجتهای دیگر اجرا شود. Gemini ۱.۰ سه نسخه دارد تا بتواند با این نیازهای مختلف مطابقت داشته باشد.
Ultra بزرگترین و تواناترین این مدلها است و برای کارهای بسیار پیچیده در نظر گرفته شده. این چیزی است که احتمالاً در مراکز داده از آن استفاده میشود.
Pro نسخه میانی است و باز برای طیف گستردهای از وظایف آمده است.
نسخه نانو جمینی گوگل برای اجرا بر روی دستگاههایی مانند گوشیهای هوشمند ساخته شده است.
گوگل میگوید: از درک طبیعی تصویر، صوت و ویدیو گرفته تا استدلال ریاضی، عملکرد Gemini Ultra در ۳۰ مورد از ۳۲ معیار آکادمیک پرکاربرد مورد استفاده در تحقیق و توسعه مدل زبان بزرگ (LLM) از نتایج پیشرفته فعلی فراتر رفته است.
با کسب امتیاز ۹۰ درصد، Gemini Ultra اولین مدلی است که در زمینه MMLU (درک زبان چندوظیفهای عظیم)، که از ترکیبی از ۵۷ موضوع مانند ریاضی، فیزیک، تاریخ، حقوق، پزشکی و اخلاق برای آزمایش استفاده میکند، بهتر از متخصصان انسانیدر زمینه دانش کلی و توانایی حل مسأله کار میکند.
گوگل میگوید که Gemini از مدلهای معمولی هوش مصنوعی پیشرفتهتر است، زیرا دیگر مدلها گرچه میتوانند در انجام وظایف خاص خوب باشند، اما در استدلال مفهومی و پیچیده خوب نیستند.
جمینی چندوجهی است، به این معنی که از ابتدا بر بر روی چندین مدل آموزش دیده است تا بر اساس ورودیهای مختلف بفهمد و استدلال کند.
«قابلیتهای استدلال چندوجهی پیچیده Gemini ۱.۰ میتواند به درک اطلاعات نوشتاری و بصری پیچیده کمک کند. گوگل ادعا میکند که این باعث میشود در کشف دانشی که تشخیص آن در میان حجم عظیمی از دادهها دشوار است مهارت منحصر به فردی داشته باشد.
توانایی قابل توجه آن در استخراج بینشی از میان صدها هزار سند از طریق خواندن، فیلتر کردن و درک اطلاعات منجر به پیشرفتهای بسیاری در زمینهها محتلف دانش تا امور مالی خواهد شد.
جمینی قادر به درک متن، تصاویر، صدا و موارد دیگر است و قادر است چندین نوع ورودی را به طور همزمان تجزیه و تحلیل کند تا بتواند متن و اطلاعات ظریف را بهتر درک کند.
جمینی امروز راهاندازی میشود و بلافاصله در Bard (Gemini Pro) و همچنین Google Pixel ۸ (Nano) استفاده میشود. در Bard، Gemini میتواند استدلال کند، برنامهریزی کند و دادههای بیشتری را درک کند و گوگل آن را بزرگترین بهروزرسانی Bard از زمان راهاندازی آن مینامد.
Gemini Ultra در اوایل سال آینده عرضه خواهد شد. Gemini در ۱۳ دسامبر در AI Studio گوگل و Cloud Vertex AI در دسترس خواهد بود.
دیگر بهروزرسانیهای در Pixel ۸ Pro
در Pixel ۸ Pro، جمینی به مجموعهای از بهروزرسانیهای جدید از جمله توانایی ضبط تایم لپس در شب که دیروز اعلام شد، میپیوندد. گوگل اسم این ویژگی را Video Boost نامیده. به کمک آن ویدیوهای ضبطشده روی موبایل در فضای ابری آپلود میشود، جایی که مدلهای محاسباتی رنگ، روشنایی، تثبیت و نویز را تنظیم میکنند تا فیلم را «واقعیتر» جلوه دهد.
بهبودی در نور پرتره در Google Photos، سایههای خشن روی عکسها را حذف میکند، حتی اگر در دستگاههای قدیمیتر گرفته شده باشند. Photo Unblur نیز ارتقا یافته است و در شارپ کردن تصاویر سگها و گربهها حتی اگر در حال حرکت باشند بهتر است.
این بهروزرسانی همچنین کیفیت تماس در رایانهها، پاکسازی اسناد در هنگام مخدوش شدن فیزیکی آنها، حالت تعمیر جدید که دادههای شخصی را در زمانی که دستگاه در دست کاربر نیست خصوصی نگه میدارد، بهبود میبخشد. همچنین در صورتی که کاربر مایل به پاسخگویی به تماس نباشد، از خود صفحه تماس میتواند پاسخ دهد.
البته Gemini Nano همه این تغییرات را ارتقا نمیدهد، اما به همراه آنها روی دستگاههای Pixel ۸ Pro ارائه میشود. گوگل بهطور خاص اعلام میکند که Gemini Nano ویژگیهای جدیدی مانند خلاصهکردن گفتار یا Summarize در برنامه Recorder و همچنین پاسخ هوشنتذ Smart Reply در Gboard را تقویت میکند. این ویژگی فوراً در واتس اپ در دسترس خواهد بود، اما سال آینده با سایر برنامهها نیز ادغام میشود.
منبع: یک پزشک