Компания Google объявила о выпуске Gemini 1.5 Flash, небольшой мультимодальной модели, созданной для масштабирования и решения узких высокочастотных задач.
Он имеет контекстное окно на миллион токенов и доступен сегодня в режиме публичного предварительного просмотра через API Gemini в Google AI Studio.
Однако это не единственная новость о Gemini. Gemini 1.5 Pro, дебютировавшая в феврале, получила увеличенное контекстное окно, расширенное до двух миллионов токенов с одного миллиона. Разработчики, заинтересованные в этом обновлении, должны будут записаться в список ожидания.Между Gemini 1.5 Flash и Gemini 1.5 Pro есть несколько заметных различий. Первая предназначена для тех, кому важна скорость вывода, а вторая имеет больший вес и по производительности аналогична большой модели Google 1.0 Ultra. Джош Вудворд, вице-президент Google Labs, отмечает, что разработчикам стоит использовать Gemini 1.5 Flash, если они хотят решать быстрые задачи, где важна низкая задержка. С другой стороны, он объясняет, что Gemini 1.5 Pro ориентирован на «более общие или сложные, часто многоэтапные задачи рассуждений».
Теперь у разработчиков есть более широкий выбор ИИ, из которого можно выбирать, в отличие от универсального подхода. Не всем приложениям требуются одни и те же данные и возможности ИИ, и наличие вариаций может существенно повлиять на восприятие пользователями сервиса, работающего на основе ИИ. Привлекательным может быть то, что Google нашла способ предоставить разработчикам самую современную модель ИИ, ускорив при этом ее работу. Возможно, самым большим недостатком является то, что она не обучена на достаточно больших наборах данных, которые могут понадобиться разработчикам. В таком случае следующим вариантом будет переход на Gemini 1.5 Pro.Google предлагает широкий спектр моделей: от самых легких Gemma и Gemma 2 до Gemini Nano, Gemini 1.5 Flash, Gemini 1.5 Pro и Gemini 1.0 Ultra. «Разработчики могут перемещаться между различными размерами в зависимости от конкретного случая использования. Поэтому они имеют те же возможности мультимодального ввода, тот же длинный контекст и, конечно, работают на том же бэкенде", - отмечает Вудворд.
Новая небольшая языковая модель появилась через 24 часа после того, как один из крупнейших конкурентов Google в области ИИ, OpenAI, представил GPT-4o, мультимодальную LLM, которая будет доступна для всех пользователей и включает в себя приложение для настольных компьютеров.
Обе модели Gemini 1.5 доступны в режиме публичного предварительного просмотра в более чем 200 странах и территориях по всему миру, включая Европейскую экономическую зону, Великобританию и Швейцарию.
Обновлено по состоянию на 14 мая в 12:06 по тихоокеанскому времени: исправлена информация о том, что только Gemini 1.5 Pro получит двухмиллионное контекстное окно, а не Gemini 1.5 Flash.
0 комментариев