کد خبر: ۳۲۱۳۵۰
تاریخ انتشار: ۱۱:۵۲ - ۲۹ مرداد ۱۴۰۴
در رویداد۲۴ بخوانید؛
جمنای یکی از مدرنترین فناوریهای هوش مصنوعی است که توسط Google DeepMind توسعه یافته و در دسامبر سال ۲۰۲۳ معرفی شد.
اقتصاد۲۴- «جمنای» (Gemini) خانوادهای از مدلهای بزرگ هوش مصنوعی یا LLM (Large Language Models) است که توسط Google DeepMind توسعه یافته و در دسامبر سال ۲۰۲۳ معرفی شد. این مدلها قرار بود جایگزین نسخههای پیشین مانند LaMDA و PaLM ۲ شوند و با تمرکز بر قابلیتهای چندرسانهای و استدلال پیشرفته، به یکی از مدرنترین فناوریهای هوش مصنوعی تبدیل شوند.
ساختار خانواده جمنای
جمنای در سه نسخه متناسب با نیازهای مختلف ارائه شده است: Ultra برای پردازشهای پیچیده و سنگین، Pro برای اجرا در طیف وسیعی از کاربردها، و Nano برای اجرا در دستگاههای موبایل و با مصرف منابع کمتر. بهروزرسانیهایی مانند نسخه Gemini ۱.۵ و حتی نسخههای آزمایشی اخیر ۲.۵ Pro، قابلیتهای استدلالی، برنامهنویسی و چندرسانهای این مدل را به سطح برتر رساندهاند.
بیشتر بخوانید: مایکروسافت کوپایلت چیست و چه مزیت رقابتی دارد؟
جمنای؛ چتبات هوشمند همهکاره
مدل جمنای اساس قدرت چتباتی به همین نام در گوگل است—چتباتی که از نسخهای رایگان تا برجستهترین گزینههای پولی با قابلیتهایی مانند تولید ویدیو، تولید محتوا، کدنویسی و موارد مشابه را ارائه میدهد.
چنین مدلی به عمق درک زبان طبیعی مجهز است، طوری که در تستهای سوژهای متعدد، در ۳۰ از ۳۲ معیار آزمایشهای آکادمیک عملکردی سطح پیشرفته داشته است.
گسترش جمنای در اکوسیستم گوگل
جمنای بهطور گسترده در محصولات گوگل به کار گرفته شده است: از سرچ هوشمند در Google Search، ادغام در Gmail، Docs و Android گرفته تا نسخه Nano که در گوشیهای پیکسل نیز حضور دارد. این ادغام باعث شده تجربه AI در استفاده روزمره مانند نوشتن ایمیل، بهینهسازی متن، و تسکهای متداول واقعیتر و مفیدتر شود.
حافظه هوشمند و حفظ حریم شخصی
یکی از ویژگیهای برجستهٔ مدلهای جدید، قابلیت «حافظه» (Memory) است؛ جایی که جمنای میتواند اطلاعات و مکالمات قبلی را بیاد بیاورد و تعاملات آینده را شخصیسازی کند. این قابلیت در نسخه ۲.۵ Pro فعال و قابل تنظیم است. کاربران میتوانند «چت موقت» (Temporary Chat) را هم انتخاب کنند که پس از ۷۲ ساعت پاک میشود.
کاربردهای آموزشی و محتوایی
در آپدیتهای تازه، Google چند ویژگی آموزشی ویژه اضافه کرده است: «یادگیری هدایتشده» (Guided Learning) برای کمک قدمبهقدم به دانشآموزان با ترکیب عکس، نمودار، ویدیو و آزمون تعاملی؛ همچنین قابلیت «داستانسازی» (Storybook) که امکان تولید کتاب صوتی و تصویری از عکسها و علایق شخصی کودک را فراهم میکند.
استفاده در خودرو، فضای ابری و رباتها
شرکت Google، جمنای را در Android Auto نیز ادغام کرده تا رانندگان بتوانند با صدای طبیعی به ارسال پیام، جستوجو و تعامل صوتی بپردازند. همچنین در همکاری با Oracle، مدل جمنای برای توسعهدهندگان Oracle Cloud قابل دسترسی شده است، تا فرایندهای تولید متن، صدا، تصویر و ویدیو را در فضای تجاری اجرا کنند.
در حوزه رباتیک، Gemini Robotics متولد شد؛ مدلی که بهخصوص برای کنترل رباتها طراحی شده و قابلیت درک و عملکرد در محیطهای فیزیکی را دارد. این مدل با نام Gemini Robotics-ER (Embodied Reasoning) میتواند وظایف پیچیدهٔ دستکاری فیزیکی را با آموزشهای کم اجرا کند.
ریسکها، نقدها و ملاحظات اخلاقی
گرچه جمنای در بسیاری از معیارها موفق ظاهر شده، اما همواره با خطر «توهم» (Hallucination) یا تولید پاسخهای نادرست مواجه است—چالشی که در مدلهای زبانی بزرگ رایج است. همچنین در زمینه تعصبات جنسیتی و محتوای حساس، برخی گزارشها اقدام به بررسی و تحلیل کردهاند؛ مثلاً در نسخه Flash Experimental جمنای ۲٫۰، کاهش برخی تعصبات مشاهده شده، اما همزمان مجوزهای محتوایی نگرانکنندهای نیز ثبت گردیده است.
برای افزایش مقاومت در برابر دستکاریهای مخرب، تیم DeepMind مشغول توسعه شیوههایی برای جلوگیری از ورود دستورهای خطرناک در دادههای ورودی است.