به گزارش سرویس علم و فناوری تابناک، در یک رویداد علمی محرمانه در ایالت کالیفرنیا، 30 نفر از برجستهترین ریاضیدانان جهان توانایی مدل هوش مصنوعی جدید شرکت OpenAI به نام o4-mini را در حل مسائل بسیار دشوار ریاضی مورد ارزیابی قرار دادند.
نتیجه این آزمون، حیرت و تحسین متخصصان را برانگیخت؛ چرا که این مدل موفق به حل مسائل پیچیدهای شد که حتی برای پژوهشگران حرفهای نیز چالشبرانگیز بود.
این گردهمایی دو روزه، بخشی از پروژهای تحقیقاتی به نام FrontierMath بود که با همکاری سازمان غیرانتفاعی Epoch AI و با هدف سنجش توانایی واقعی هوش مصنوعی در استدلال و حل مسائل بدون تکیه بر دادههای اینترنتی برگزار شد.
برای جلوگیری از بروز هرگونه تقلب، تمامی ارتباطات میان شرکتکنندگان از طریق اپلیکیشن رمزنگاریشده «سیگنال» انجام میشد و شرکتکنندگان متعهد به حفظ محرمانگی کامل بودند.
در آغاز، ریاضیدانان تلاش کردند با طراحی پرسشهایی دشوار و سطح بالا مدل را به چالش بکشند. برای هر مسئلهای که مدل موفق به حل آن نمیشد، طراح پرسش جایزهای 7500 دلاری دریافت میکرد. اما روند آزمون بهسرعت تغییر کرد.
پاسخهایی فراتر از انتظار
یکی از چشمگیرترین لحظات این رویداد، توسط «کن اونو»، استاد برجسته ریاضی از دانشگاه ویرجینیا، رقم خورد. او یک مسئله حلنشده در حوزه نظریه اعداد را مطرح کرد. به گفته وی، مدل ابتدا چند دقیقه صرف مطالعه منابع مرتبط کرد، سپس نسخه سادهتری از مسئله را حل کرد و در کمتر از ده دقیقه راهحلی دقیق، کامل و «به طرز حیرتآوری جسورانه» ارائه داد.
مدل در پایان پاسخ خود نوشته بود: «نیازی نیست به جایی استناد کنم، چون این مسئله را خودم حل کردم.»
پروفسور اونو تأکید کرد: من همکارانی دارم که بهصراحت گفتند این مدلها دارند به سطح نبوغ ریاضی نزدیک میشوند.
مدلهای استدلالگر؛ گامی فراتر از LLMهای معمولی
مدل o4-mini برخلاف مدلهای زبانی رایج که صرفاً کلمه بعدی را پیشبینی میکنند، بهعنوان یک مدل «استدلالگر» طراحی شده است. این مدلها با آموزش عمیقتر، بازخورد انسانی و دادههای تخصصی توسعه یافتهاند و میتوانند روند حل مسئله را بهصورت گامبهگام و تحلیلی پیش ببرند.
کارشناسان معتقدند پیشرفت این مدلها میتواند آغازگر انقلابی در آموزش، پژوهش و حل مسائل علمی در سطح جهان باشد؛ انقلابی که ممکن است هوش مصنوعی را به یکی از ارکان اصلی توسعه دانش بشری تبدیل کند.