На конференции I/O 2024 компания Google анонсировала обновления для своих нейросетей Gemini 2.5 Pro и Flash, сделав их умнее, быстрее и эффективнее. Главной инновацией стал режим «Глубокое мышление» (Deep Think) для модели Pro, способный анализировать несколько гипотез перед ответом.
«Глубокое мышление»: прорыв в решении сложных задач
Как заявил Демис Хассабис, глава Google DeepMind, новая версия Gemini 2.5 Pro с контекстным окном в 1 млн токенов демонстрирует рекордные результаты в математике и программировании. Модель заняла первое место в тестах:
USAMO 2025 (олимпиада по математике);
LiveCodeBench (соревновательное программирование);
MMMU (мультимодальное понимание).
«Наша цель — создать ИИ, который будет персонализированным, проактивным и мощным», — подчеркнул Хассабис. Однако режим Deep Think пока доступен только избранным тестерам — Google проводит дополнительные проверки безопасности.
Обновления для Gemini 2.5 Flash: скорость и экономичность
Модель Flash, позиционируемая как «рабочая лошадка» для массовых задач, стала на 20–30% эффективнее по использованию токенов. Она улучшила показатели в тестах на логику, мультимодальность и длинный контекст, уступая только версии Pro. С июня Flash станет доступна в Google AI Studio, Vertex AI и приложении Gemini.
Новые функции для разработчиков и пользователей
Голосовое управление: настройка тона, акцента и стиля речи ИИ (например, «мелодраматичный» или «меланхоличный»);
Мультидиалоговый режим: поддержка 24+ языков, мгновенное переключение между диалектами;
Аффективный диалог: распознавание эмоций в голосе пользователя;
Мысленные сводки: структурированный вывод «рассуждений» модели для удобства отладки;
Лимиты на обработку (thinking budgets): контроль над количеством токенов, используемых для ответа.
Как отметили технические директора Google DeepMind, текстово-речевой синтез теперь передаёт даже шёпот и эмоциональные нюансы.
Заключение
«ИИ открывает удивительное будущее, и прогресс не останавливается», — резюмировал Хассабис. Судя по анонсам, Google фокусируется на создании ИИ-агентов, способных автономно действовать от имени пользователя — следующий шаг после чат-ботов.
0 комментариев