CosmosDB, открытый DiskANN и борьба с разрозненностью
Красмонд, 6 июня 2025 г. – Microsoft продолжает усиливать свою унифицированную аналитическую платформу Fabric, добавляя поддержку критически важных баз данных и открывая ключевые технологии, чтобы помочь компаниям преодолеть сложности работы с данными для ИИ.
Преодоление наследия: От связанных систем к единому слою
Исторически вычислительные мощности и системы хранения данных в СУБД были жестко связаны, создавая проблемы с масштабируемостью и изолированными "островами данных". Представленная в 2023 году платформа Microsoft Fabric задумана как единый слой данных для инструментов анализа Microsoft. После добавления поддержки транзакционной СУБД Azure SQL в ноябре 2024 года, Fabric делает следующий значительный шаг.
CosmosDB — ключевая база для ИИ — теперь в Fabric
На конференции Build 2025 Microsoft объявила о главном нововведении: интеграции высокомасштабируемой NoSQL-базы данных CosmosDB в экосистему Fabric. CosmosDB играет ключевую роль в современных ИИ-решениях, являясь фундаментом для ChatGPT от OpenAI и многих других высоконагруженных систем, таких как интернет-магазин Walmart.
"CosmosDB стремительно становится базой данных номер один для мировых ИИ-нагрузок", — заявил Арун Улаг, корпоративный вице-президент Microsoft по платформе данных Azure. — "Ее интеграция в Fabric позволяет компаниям развертывать NoSQL без управления сложной инфраструктурой".
Решение проблемы производительности
Главный вызов разделения вычислений и хранения — обеспечение скорости без задержек. В Fabric решают эту задачу с помощью высокопроизводительного кеша и механизма синхронизации.
"Данные реплицируются в OneLake почти в реальном времени, обеспечивая миллисекундное время отклика, критичное для ИИ, при этом клиенту не нужно управлять инфраструктурой", — пояснил Улаг.
Открытые форматы как основа единства
Все данные в Fabric, независимо от источника (SQL, NoSQL, неструктурированные), по умолчанию хранятся в открытых форматах Apache Parquet и Delta Lake в едином "озере" OneLake.
"Это действительно единая платформа: с единой архитектурой, бизнес-моделью и данными в открытых форматах", — подчеркнул Улаг. Это позволяет сервисам Fabric (SQL, Power BI, CosmosDB) работать с одними и теми же данными без конвертации или дублирования, избегая потерь производительности.
Microsoft открывает код DiskANN: корпоративный векторный поиск для всех
Важным вкладом в развитие ИИ-экосистемы стало решение Microsoft открыть исходный код технологии векторного поиска DiskANN (Disk Approximate Nearest Neighbor). Эта высокопроизводительная разработка Microsoft Research используется в Bing, CosmosDB и Fabric.
DiskANN оптимизирован для работы с дисковыми хранилищами, что критично для сверхбольших векторных баз, не помещающихся в память. Теперь любой разработчик сможет использовать этот же инструмент, лежащий в основе ChatGPT, для создания систем с извлечением данных (RAG), где быстрый семантический поиск по корпоративным данным необходим для точности ответов ИИ.
"Мы открываем доступ к векторному хранилищу, которое используем сами", — сказал Улаг.
Другие обновления экосистемы данных Microsoft:
Microsoft Copilot интегрирован в платформу бизнес-аналитики Power BI.
Доступна предварительная версия SQL Server 2025.
Почему это важно для бизнеса?
Для компаний, внедряющих ИИ, эти обновления означают:
Устранение разрозненности: Fabric напрямую борется с главной проблемой — данными в разных форматах и системах.
Ускорение разработки ИИ: Уменьшение сложности интеграции позволяет ИТ-командам фокусироваться на создании приложений, а не на поддержке инфраструктуры.
Снижение рисков привязки: Использование открытых форматов данных минимизирует зависимость от проприетарных решений.
Конкурентное преимущество: Компании, использующие единую платформу, смогут быстрее внедрять инновации на базе ИИ.
"Разговаривая с заказчиками, я постоянно слышу: 'Объедините системы! Я ИТ-директор, а не Главный по Интеграции. Помогите превратить ИИ в наше конкурентное преимущество'", — привел пример Улаг. Рост Fabric впечатляет: платформой уже пользуются более 21 000 организаций по всему миру, включая 70% компаний из списка Fortune 500. "Она развивается очень, очень быстро", — заключил вице-президент.
0 комментариев