Mistral, французский стартап, который в прошлом году произвел фурор, получив рекордную для Европы сумму начального финансирования, сегодня запустил ряд обновлений, включая новую крупную базовую модель под названием Pixtral Large.
Компания продолжает совершенствовать своего бесплатного веб-чат-бота Le Chat, добавляя в него функции генерации изображений, веб-поиска и интерактивного «холста», что позволяет ему соответствовать функциям ChatGPT от OpenAI и стать более серьезным и прямым конкурентом.Как написал в своем аккаунте в социальной сети X генеральный директор и соучредитель Mistral AI Артур Менш: «В Mistral мы осознали, что для создания лучшего опыта использования ИИ необходимо совместно проектировать модели и интерфейсы продуктов. Pixtral обучался с учетом высокоэффективных интерфейсных приложений и является хорошим примером этого».
Пользователям, желающим опробовать новые функции Le Chat, необходимо включить их в качестве бета-функций в веб-интерфейсе. Обратите внимание, что для доступа к Le Chat требуется бесплатная учетная запись Mistral, Google или Microsoft.
Pixtral Large — мультимодальный ИИ с открытым исходным кодом
Pixtral Large, новая модель Mistral со 124 миллиардами параметров, основана на своей предшественнице Mistral Large 2, представленной летом 2024 года, а также на своей первой мультимодальной модели Pixtral 12-B, выпущенной в сентябре.
Он включает в себя декодер с 123 миллиардами параметров и видеокодер с 1 миллиардом параметров, что позволяет ему преуспевать как в обработке текстовых, так и визуальных данных.
Параметры, как вы помните, относятся к числу настроек, которые управляют входами и выходами модели, причем большее количество параметров, как правило, подразумевает более эффективную, осведомленную и производительную модель.
Согласно сообщению руководителя отдела по связям с разработчиками Mistral Софии Янг в ее учетной записи X, Pixtral Large преуспевает в «многоязычном распознавании символов [оптическом распознавании символов], рассуждениях, понимании диаграмм и многом другом». Янг включила в Le Chat скриншот Pixtral Large, анализирующего чек, загруженный пользователем с помощью OCR, демонстрируя его возможности по приему и документированию расходов, а также, в данном случае, разделению счета с чаевыми,С контекстным окном в 128 000 токенов Pixtral Large может обрабатывать до 30 изображений высокого разрешения на вход или около 300-страничной книги, что опять же эквивалентно ведущим моделям серии OpenAI GPT.
Модель демонстрирует высочайшую производительность в различных тестах, включая MathVista, DocVQA и VQAv2, что делает ее идеальной для таких задач, как интерпретация диаграмм, анализ документов и понимание изображений.
Хотя модель и веса доступны для бесплатной загрузки на Hugging Face, они выпускаются по специальной лицензии Mistral AI Research License, которая определяет только некоммерческие, ориентированные на исследования приложения.
Те, кто хочет использовать ее в коммерческих целях, должны будут сделать это через API Mistral в ее управляемом веб-сервисе Le Platforme или получить отдельную лицензию у компании напрямую через контактную форму, что означает, что она на самом деле не является полностью открытым исходным кодом.
Тем не менее, предлагая Pixtral Large, Mistral AI позволяет исследователям и разработчикам использовать передовой мультимодальный ИИ, обеспечивая при этом ответственное и этичное использование.
Le Chat поставляется для ChatGPT с функциями сопоставления конкурентов
В центре инструментов ИИ Mistral находится Le Chat, бесплатная платформа, которая теперь улучшена новыми функциями на базе Pixtral Large.
Разработанная для различных вариантов использования, таких как исследования, генерация идей и автоматизация, Le Chat объединяет текст, визуализацию и интерактивные функции в бесперебойный опыт производительности.
Новые функции Le Chat:
1. Веб-поиск с цитатами: пользователи могут дополнять знания ИИ с помощью веб-поиска в реальном времени, дополненного ссылками на источники для прозрачности.
2. Холст для идей: этот инновационный интерфейс позволяет пользователям создавать, изменять и совместно работать над документами, презентациями и проектами в новом интерактивном пространстве, которое появляется слева от интерфейса чат-бота.
Как написал Ян об этом в X: Le Chat Canvas «отлично подходит для творческого формирования идей. Вы можете использовать Canvas для создания документов, презентаций, кода, макетов... список можно продолжать».
Это произошло всего через шесть недель после того, как OpenAI выпустила собственный интерактивный элемент боковой панели Canvas для ChatGPT, который многие рассматривали как функцию, призванную конкурировать с более ранним выпуском Artifacts от Anthropic для своего чат-бота Claude.
3. Расширенный анализ документов и изображений: с Pixtral Large Le Chat теперь может обрабатывать и суммировать сложные PDF-файлы, извлекая информацию из графиков, таблиц, уравнений и многого другого.
4. Генерация изображений: благодаря партнерству с отдельным стартапом по созданию моделей изображений Black Forest Labs Le Chat теперь включает возможности генерации изображений на основе модели Flux Pro, что позволяет пользователям создавать высококачественные визуальные эффекты непосредственно в интерфейсе чата. Это четкий ответ на интеграцию OpenAI DALL-E 3 в ChatGPT (обе модели из OpenAI, однако), а также вторая крупная интеграция новых моделей Black Forest Labs в предложения ведущего поставщика моделей AI Foundation, после его более раннего объединения с xAI Илона Маска для генерации изображений в чат-боте Grok-2 этой компании, доступном через X, социальную сеть, которой также владеет Маск.
5. Агенты задач для автоматизации: настраиваемые агенты автоматизируют повторяющиеся задачи, такие как подведение итогов встреч, обработка счетов или сканирование квитанций, экономя время и усилия пользователей.
Эти функции позиционируют Le Chat как универсального помощника ИИ, способного выполнять задачи, традиционно требующие нескольких инструментов.
Mistral AI подчеркивает всеобъемлющий набор функций Le Chat и его доступность по сравнению с такими платформами, как ChatGPT, Perplexity и Claude. В то время как конкуренты могут требовать премиум-подписки для аналогичных функций, Le Chat предоставляет интегрированный, мультимодальный опыт совершенно бесплатно на этапе бета-тестирования.
0 комментариев