Будучи одной из крупнейших технологических компаний в мире, позиция Amazon в продолжающейся гонке за генеративный ИИ в основном сосредоточена на создании собственных инструментов и платформ для разработчиков, а также на предоставлении значительного финансирования стартапу Anthropic.
Но больше нет: как объявил сегодня генеральный директор Энди Джасси на ежегодной конференции Amazon Web Services (AWS) re:Invent, гигант электронной коммерции представляет совершенно новое семейство моделей ИИ под названием Nova, которое позволяет пользователям генерировать текст, изображения и видео, — сопоставляя его с такими, как OpenAI, Google и даже с его собственной инвестицией Anthropic. Несколько новых моделей, включая предложения текста, изображений и видео, уже доступны здесь, хотя для доступа к ним вам понадобится учетная запись Amazon Bedrock, а модель генерации аудиосигнала «речь в речь» должна появиться в 2025 году.
Super nova
Комплект Amazon Nova представляет несколько моделей, адаптированных под конкретные варианты использования, все из которых поддерживают более 200 языков:
• Amazon Nova Micro: текстовая модель, оптимизированная для ответов с малой задержкой и минимальными затратами.
• Amazon Nova Lite: мультимодальная модель, предлагающая быструю обработку текста, изображений и видео по очень низкой цене.
• Amazon Nova Pro: мультимодальная модель, сочетающая точность, скорость и экономичность, разработанная для широкого спектра задач.
• Amazon Nova Premier: самая продвинутая мультимодальная модель для сложных задач рассуждения и для создания пользовательских моделей (запуск в первом квартале 2025 г.).
• Amazon Nova Canvas: усовершенствованная модель генерации изображений для разработки креативного контента.
• Amazon Nova Reel: современная модель генерации видео, предлагающая динамические возможности.
Все модели поддерживают тонкую настройку и извлечение знаний, что позволяет клиентам адаптировать инструменты ИИ к своим собственным данным для повышения точности и производительности.
Эти модели отлично поддерживают Retrieval Augmented Generation (RAG), которая обосновывает выходные данные в конкретных организационных данных для повышения надежности.
Image Canvas и сложное управление камерой
Модели Nova Canvas и Reel подчеркивают стремление Amazon к созданию креативного контента:
• Nova Canvas: пользователи могут редактировать изображения с помощью текстовых подсказок на естественном языке и настраивать макеты или цветовые схемы. Встроенные меры безопасности, такие как водяные знаки и модерация контента, гарантируют ответственное использование ИИ.
• Nova Reel: эта модель генерации видео поддерживает расширенные функции, включая управление движением камеры, например панорамирование, масштабирование и повороты на 360 градусов. Она позволяет создавать динамичные шестисекундные видеоролики с дополнительными функциями, которые ожидаются в будущем.
0 комментариев