جمنای ۲٫۵ پرو معرفی شد؛ هوشمندترین هوش مصنوعی گوگل با توانایی فکر کردن

گوگل مدل هوش مصنوعی جمنای ۲٫۵ پرو را معرفی کرد؛ مدلی با توان پردازش بالا، استدلال پیشرفته و پشتیبانی از ایجنت‌های هوشمند

به گزارش پارسینه پلاس، به نقل از زومیت گوگل از مدل آزمایشی جدیدی با نام جمنای ۲٫۵ پرو (Gemini 2.5 Pro) رونمایی کرد؛ مدلی که به‌گفته‌ی این شرکت، پیشرفته‌ترین هوش مصنوعی آن در مجموعه‌ی جمنای تا امروز به‌شمار می‌رود. مدل جدید برای انجام وظایف پیچیده طراحی شده و با بهره‌گیری از قابلیت‌های استدلالی پیشرفته‌ای که گوگل آن را «تفکر درونی» (Thinking Built-in) می‌نامد، توسعه یافته است. کاربران و توسعه‌دهندگانی که از سرویس Gemini Advanced استفاده می‌کنند، هم‌اکنون به این مدل دسترسی دارند
به‌گفته‌ی گوگل، خانواده‌ی جمنای ۲٫۵ به‌صورت بومی (Native) از توانایی‌های استدلالی بهره می‌برد؛ قابلیتی که به مدل امکان می‌دهد داده‌ها را تحلیل کند، به نتایج منطقی برسد و با درک دقیق‌تری از زمینه، مسائل پیچیده را حل‌وفصل کند. این فرایند موسوم‌ به «تفکر درونی» (Internal Reasoning) در تمام مدل‌های فعلی و آینده‌ی مجموعه جای دارد، اما دیگر واژه‌ی «Thinking» به‌عنوان برچسب در نام مدل‌ها دیده نمی‌شود. کاربران می‌توانند با فعال‌سازی گزینه‌ی Show thinking در اپلیکیشن جمنای، این فرایند را در صورت تمایل مشاهده کنند.
مدل جمنای ۲٫۵ پرو با اسم رمز «nebula» و عنوان رسمی gemini-2.5-pro-exp-03-25، نخستین عضو از خانواده‌ی ۲٫۵ به‌شمار می‌رود و نسبت به نسخه‌های پیشین، جهشی چشم‌گیر در عملکرد دارد. به‌گفته‌ی گوگل، این مدل در رتبه‌بندی LMArena (پلتفرمی که بر اساس اینکه انسان‌ها کدام پاسخ را بهتر می‌دانند، مدل‌ها را رتبه‌بندی می‌کند) موفق شده است جایگاه نخست را به‌دست آورد.

همچنین، جمنای ۲٫۵ پرو در دو آزمون تخصصی یعنی AIME 2025 (مجموعه‌ای از پرسش‌های چالش‌برانگیز ریاضی در سطح رقابت‌های المپیاد) و GPQA diamond (سنجش توانایی مدل در استدلال علمی و پاسخ‌گویی به پرسش‌های مفهومی پیچیده) بالاترین امتیاز را کسب کرد؛ آن‌ هم بدون تکیه بر روش‌های پرهزینه‌ای مانند «رأی‌گیری اکثریت» (Majority Voting)؛ روشی که در آن چند پاسخ تولید می‌شود و پاسخ پرتکرار به‌عنوان نتیجه‌ی نهایی انتخاب می‌شود تا دقت مدل افزایش یابد.
در مجموعه‌داده‌ی Humanity’s Last Exam، مدل جمنای ۲٫۵ پرو بدون استفاده از ابزارهای خارجی به امتیاز ۱۸٫۸ درصد دست پیدا کرد. گوگل این عملکرد را، در میان مدل‌هایی که صرفاً با توانایی درونی خود و بدون تکیه بر ابزارهای کمکی مانند موتور جست‌وجو یا پلاگین‌ها ارزیابی می‌شوند، پیشرفته‌ترین نتیجه‌ی ثبت‌شده می‌داند.

Humanity’s Last Exam بنچمارکی مفهومی و گسترده محسوب می‌شود که با هدف ارزیابی دانش و استدلال در بیش از صد موضوع مختلف طراحی شده و این مجموعه شامل پرسش‌هایی چالش‌برانگیز و دقیق با پاسخ مشخص است که دامنه‌ی وسیعی از علوم انسانی، طبیعی و تحلیلی را در بر می‌گیرد.
عملکرد پیشرفته‌ی جمنای ۲٫۵ پرو حاصل ترکیبی از تغییرات بنیادین در معماری اصلی مدل و بهبودهای دقیق در مرحله‌ی آموزش پس از ساخت (Post-training) است. این مدل طوری طراحی شده که بتواند مسائل پیچیده‌تری را پردازش و از ایجنت‌هایی (Agents) پشتیبانی کند که برای انجام وظایف، نیاز به درک عمیق‌تری از متن و زمینه (Context) دارند.
مدل تازه‌ی گوگل در حوزه‌ی توسعه‌ی نرم‌افزار نیز به‌روزرسانی چشم‌گیری داشته است. به‌گفته‌ی گوگل، جمنای ۲٫۵ پرو در مقایسه با نسخه‌ی ۲٫۰ پیشرفت قابل توجهی در توانایی کدنویسی نشان می‌دهد و در وظایفی مانند ساخت اپلیکیشن‌های وب، طراحی ابزارهای کدنویسی مبتنی‌بر ایجنت (agent-driven code tools) و ویرایش یا بازنویسی کد، عملکرد دقیقی از خود ارائه می‌دهد؛ همچنین، این مدل در بنچمارک SWE-Bench Verified (یک معیار تخصصی برای ارزیابی توانایی مدل‌ها در تولید خودکار کد) با استفاده از ایجنتی با پیکربندی ویژه، به امتیاز ۶۳٫۸ درصد دست یافت.
مدل جمنای ۲٫۵ پرو از پنجره‌ی زمینه‌ای (Context Window) با ظرفیت یک میلیون توکن پشتیبانی می‌کند و به‌گفته‌ی گوگل، این میزان به‌زودی به دو میلیون توکن افزایش خواهد یافت. قابلیت مذکور به مدل اجازه می‌دهد حجم بسیار زیادی از داده‌ها، از جمله مخازن کامل کد را به‌صورت یکپارچه پردازش کند. افزون‌بر‌این، جمنای ۲٫۵ پرو توانایی تحلیل هم‌زمان داده‌هایی از قالب‌های گوناگون مانند متن، صدا، تصویر و ویدیو را نیز دارد.درحال‌حاضر، دسترسی به مدل جمنای ۲٫۵ پرو از طریق سرویس‌های Gemini Advanced و Google AI Studio فراهم شده است و انتظار می‌رود طی هفته‌های آینده به پلتفرم Vertex AI (پلتفرم ابری گوگل برای توسعه و استقرار مدل‌های هوش مصنوعی در سطح سازمانی) نیز اضافه شود. جزئیات مربوط‌ به قیمت‌گذاری و همچنین گزینه‌هایی برای افزایش سقف مصرف به‌منظور پشتیبانی از پروژه‌های در مقیاس بزرگ، به‌زودی از سوی گوگل اعلام خواهد شد.

دیدگاهتان را بنویسید لغو پاسخ