Главная IT-инновации Генератор искусственного интеллекта Whisk от Googl...

Генератор искусственного интеллекта Whisk от Google «перемешивает» загруженные вами изображения

Whisk — это «забавный» эксперимент Google с искусственным интеллектом, который использует изображения в качестве подсказок и не нуждается в словах.

Google анонсировала новый инструмент ИИ под названием Whisk, который позволяет вам генерировать изображения, используя другие изображения в качестве подсказок вместо того, чтобы требовать длинную текстовую подсказку.

С помощью Whisk вы можете предлагать изображения, чтобы предложить то, что вы хотели бы в качестве темы, сцены и стиля вашего сгенерированного ИИ изображения, и вы можете подсказать Whisk несколько изображений для каждой из этих трех вещей. (Если вы хотите, вы также можете заполнить текстовые подсказки.) Если у вас нет изображений под рукой, вы можете щелкнуть значок игральной кости, чтобы Google заполнил несколько изображений для подсказок (хотя эти изображения также кажутся сгенерированными ИИ). Вы также можете ввести текст в текстовое поле в конце процесса, если вы хотите добавить дополнительные сведения об изображении, которое вы ищете, но это не обязательно.

Затем Whisk сгенерирует изображения и текстовую подсказку для каждого изображения. Вы можете добавить изображение в избранное или загрузить его, если вы довольны результатами, или вы можете улучшить изображение, введя больше текста в текстовое поле или щелкнув изображение и отредактировав текстовую подсказку.В сообщении в блоге Google подчеркивает, что Whisk предназначен для «быстрого визуального исследования, а не пиксельного редактирования». Компания также говорит, что Whisk может «промахнуться», поэтому он позволяет вам редактировать основные подсказки.

За те несколько минут, что я использовал инструмент во время написания этой статьи, было забавно возиться с ним. Генерация изображений занимает несколько секунд, что раздражает, и хотя изображения были немного странными, все, что я сгенерировал, было весело итерировать.

Google говорит, что Whisk использует «последнюю» итерацию своей модели генерации изображений Imagen 3, которую она анонсировала сегодня. Google также представила Veo 2, следующую версию своей модели генерации видео, которая, по словам компании, понимает «уникальный язык кинематографии» и галлюцинирует такие вещи, как дополнительные пальцы, «реже», чем другие модели (одна из этих других моделей, вероятно, является Sora от OpenAI). Сначала Veo 2 появится в VideoFX от Google, который можно получить в списке ожидания Google Labs, а в следующем году он будет расширен до «других продуктов» YouTube Shorts.