бургерЛого хедера
Поиск
avatar

Mistral выпускает новый API оптического распознавания символов (OCR), заявляющий о наивысшей производительности в мире

Хорошо финансируемый французский стартап в области искусственного интеллекта Mistral удовлетворен тем, что идет своим путем

image

Хорошо финансируемый французский стартап в области искусственного интеллекта Mistral довольствуется тем, что идет своим путем.

В море конкурирующих моделей рассуждений компания представила Mistral OCR, новый API оптического распознавания символов (OCR), разработанный для предоставления расширенных возможностей понимания документов. API извлекает контент — включая рукописные заметки, печатный текст, изображения, таблицы и уравнения — из неструктурированных PDF-файлов и изображений с высокой точностью, представляя его в структурированном формате.

Структурированные данные — это информация, которая организована предопределенным образом, как правило, с использованием строк и столбцов, что упрощает поиск и анализ. Распространенными примерами являются имена, адреса и финансовые транзакции, хранящиеся в базах данных или электронных таблицах.

Напротив, неструктурированные данные не имеют определенного формата или структуры, что затрудняет их обработку и анализ. Эта категория охватывает широкий спектр типов данных, таких как электронные письма, сообщения в социальных сетях, видео, изображения и аудиофайлы. Поскольку неструктурированные данные не вписываются в традиционные базы данных, для извлечения значимых сведений часто используются специализированные инструменты и методы, такие как обработка естественного языка (NLP) и машинное обучение (ML).

Понимание различий между этими типами данных имеет решающее значение для компаний, стремящихся эффективно управлять и использовать свои информационные активы.

Благодаря многоязычной поддержке, высокой скорости обработки и интеграции с большими языковыми моделями (LLM) для понимания документов, Mistral OCR позиционируется как помощь организациям в подготовке их документации к ИИ.

Учитывая, что — согласно сообщению в блоге Mistral, анонсирующему новый API — 90% всей деловой информации неструктурированы, новый API должен стать огромным благом для организаций, стремящихся оцифровать и каталогизировать свои данные для использования в приложениях ИИ или внутренних/внешних базах знаний.

Mistral устанавливает новый золотой стандарт для OCR

Mistral OCR направлен на улучшение того, как организации обрабатывают и анализируют сложные документы.

В отличие от традиционных решений OCR, которые в первую очередь фокусируются на извлечении текста, Mistral OCR предназначен для интерпретации различных типографских элементов и символов документов, включая таблицы, математические выражения и чередующиеся изображения, при сохранении структурированных выходных данных.

По словам главного научного директора Mistral Гийома Лампле, эта технология представляет собой значительный шаг к более широкому внедрению ИИ на предприятиях, особенно для компаний, стремящихся упростить доступ к своей внутренней документации.

API уже интегрирован в Le Chat, который миллионы пользователей используют для обработки документов.

Теперь разработчики и компании могут получить доступ к модели через la Plateforme, пакет разработчика Mistral.

Ожидается, что API также станет доступным через партнеров по облачным вычислениям и выводам и будет предлагать локальное развертывание для организаций с высокими требованиями к безопасности.

Развитие ранней (70-летней) вычислительной технологии

Технология OCR играла значительную роль в автоматизации извлечения данных и оцифровки документов на протяжении десятилетий. Первая коммерческая машина OCR была разработана в 1950-х годах Дэвидом Шепардом и его коллегами Харви и Уильямом Лоулессом-младшими, которые основали Intelligent Machines Research Co. (IMR) для вывода технологии на рынок.

Система приобрела популярность, когда Reader’s Digest стала ее первым крупным клиентом, за которым последовали банки, телекоммуникационные компании, такие как AT&T, и крупные нефтяные компании.

В 1959 году IBM лицензировала патенты IMR и представила собственную машину OCR, формализовав этот термин как отраслевой стандарт.

С тех пор технология OCR продолжала развиваться, включая ИИ и МО для повышения точности, расширения языковой поддержки и обработки все более сложных форматов документов, и ее можно найти в таком ведущем корпоративном программном обеспечении, как программа для чтения PDF-файлов Adobe Acrobat.

Mistral OCR представляет собой следующий шаг в этой эволюции, поскольку она использует ИИ для улучшения понимания документов за пределами простого распознавания текста.

0 комментариев

Вас могут заинтересовать