هوش مصنوعی جمنای چیست و چه مزیت رقابتی دارد؟

5 hours ago 1

کد خبر: ۳۲۱۳۵۰

تاریخ انتشار: ۱۱:۵۲ - ۲۹ مرداد ۱۴۰۴

در رویداد۲۴ بخوانید؛

جمنای یکی از مدرن‌ترین فناوری‌های هوش مصنوعی است که توسط Google DeepMind توسعه یافته و در دسامبر سال ۲۰۲۳ معرفی شد.

هوش مصنوعی جمنای

اقتصاد۲۴- «جمنای» (Gemini) خانواده‌ای از مدل‌های بزرگ هوش مصنوعی یا LLM (Large Language Models) است که توسط Google DeepMind توسعه یافته و در دسامبر سال ۲۰۲۳ معرفی شد. این مدل‌ها قرار بود جایگزین نسخه‌های پیشین مانند LaMDA و PaLM ۲ شوند و با تمرکز بر قابلیت‌های چندرسانه‌ای و استدلال پیشرفته، به یکی از مدرن‌ترین فناوری‌های هوش مصنوعی تبدیل شوند.

ساختار خانواده جمنای

جمنای در سه نسخه متناسب با نیاز‌های مختلف ارائه شده است: Ultra برای پردازش‌های پیچیده و سنگین، Pro برای اجرا در طیف وسیعی از کاربردها، و Nano برای اجرا در دستگاه‌های موبایل و با مصرف منابع کمتر. به‌روزرسانی‌هایی مانند نسخه Gemini ۱.۵ و حتی نسخه‌های آزمایشی اخیر ۲.۵ Pro، قابلیت‌های استدلالی، برنامه‌نویسی و چندرسانه‌ای این مدل را به سطح برتر رسانده‌اند.

بیشتر بخوانید: مایکروسافت کوپایلت چیست و چه مزیت رقابتی دارد؟

جمنای؛ چت‌بات هوشمند همه‌کاره

مدل جمنای اساس قدرت چت‌باتی به همین نام در گوگل است—چت‌باتی که از نسخه‌ای رایگان تا برجسته‌ترین گزینه‌های پولی با قابلیت‌هایی مانند تولید ویدیو، تولید محتوا، کدنویسی و موارد مشابه را ارائه می‌دهد.

چنین مدلی به عمق درک زبان طبیعی مجهز است، طوری که در تست‌های سوژه‌ای متعدد، در ۳۰ از ۳۲ معیار آزمایش‌های آکادمیک عملکردی سطح پیشرفته داشته است.

گسترش جمنای در اکوسیستم گوگل

جمنای به‌طور گسترده در محصولات گوگل به کار گرفته شده است: از سرچ هوشمند در Google Search، ادغام در Gmail، Docs و Android گرفته تا نسخه Nano که در گوشی‌های پیکسل نیز حضور دارد. این ادغام باعث شده تجربه AI در استفاده روزمره مانند نوشتن ایمیل، بهینه‌سازی متن، و تسک‌های متداول واقعی‌تر و مفیدتر شود.

حافظه هوشمند و حفظ حریم شخصی

یکی از ویژگی‌های برجستهٔ مدل‌های جدید، قابلیت «حافظه» (Memory) است؛ جایی که جمنای می‌تواند اطلاعات و مکالمات قبلی را بیاد بیاورد و تعاملات آینده را شخصی‌سازی کند. این قابلیت در نسخه ۲.۵ Pro فعال و قابل تنظیم است. کاربران می‌توانند «چت موقت» (Temporary Chat) را هم انتخاب کنند که پس از ۷۲ ساعت پاک می‌شود.

کاربرد‌های آموزشی و محتوایی

در آپدیت‌های تازه، Google چند ویژگی آموزشی ویژه اضافه کرده است: «یادگیری هدایت‌شده» (Guided Learning) برای کمک قدم‌به‌قدم به دانش‌آموزان با ترکیب عکس، نمودار، ویدیو و آزمون تعاملی؛ همچنین قابلیت «داستان‌سازی» (Storybook) که امکان تولید کتاب صوتی و تصویری از عکس‌ها و علایق شخصی کودک را فراهم می‌کند.

استفاده در خودرو، فضای ابری و ربات‌ها

شرکت Google، جمنای را در Android Auto نیز ادغام کرده تا رانندگان بتوانند با صدای طبیعی به ارسال پیام، جست‌و‌جو و تعامل صوتی بپردازند. همچنین در همکاری با Oracle، مدل جمنای برای توسعه‌دهندگان Oracle Cloud قابل دسترسی شده است، تا فرایند‌های تولید متن، صدا، تصویر و ویدیو را در فضای تجاری اجرا کنند.

در حوزه رباتیک، Gemini Robotics متولد شد؛ مدلی که به‌خصوص برای کنترل ربات‌ها طراحی شده و قابلیت درک و عملکرد در محیط‌های فیزیکی را دارد. این مدل با نام Gemini Robotics-ER (Embodied Reasoning) می‌تواند وظایف پیچیدهٔ دست‌کاری فیزیکی را با آموزش‌های کم اجرا کند.

ریسک‌ها، نقد‌ها و ملاحظات اخلاقی

گرچه جمنای در بسیاری از معیار‌ها موفق ظاهر شده، اما همواره با خطر «توهم» (Hallucination) یا تولید پاسخ‌های نادرست مواجه است—چالشی که در مدل‌های زبانی بزرگ رایج است. همچنین در زمینه تعصبات جنسیتی و محتوای حساس، برخی گزارش‌ها اقدام به بررسی و تحلیل کرده‌اند؛ مثلاً در نسخه Flash Experimental جمنای ۲٫۰، کاهش برخی تعصبات مشاهده شده، اما هم‌زمان مجوز‌های محتوایی نگران‌کننده‌ای نیز ثبت گردیده است.

برای افزایش مقاومت در برابر دستکاری‌های مخرب، تیم DeepMind مشغول توسعه شیوه‌هایی برای جلوگیری از ورود دستور‌های خطرناک در داده‌های ورودی است.

Read Entire Article