бургерЛого хедера
Поиск
avatar

OpenAI представит легкое создание голосового помощника на мероприятии для разработчиков 2024

Альтман отходит от центра внимания и позволяет говорить о четырех основных дополнениях к API

image

В понедельник OpenAI начала свое ежегодное мероприятие DevDay в Сан-Франциско, представив четыре крупных обновления API для разработчиков, которые интегрируют модели искусственного интеллекта компании в свои продукты. В отличие от прошлогоднего мероприятия, проходившего в одном месте и включавшего в себя ключевой доклад генерального директора Сэма Альтмана, DevDay 2024 - это не просто один день, а глобальный подход: дополнительные мероприятия запланированы на 30 октября в Лондоне и 21 ноября в Сингапуре.

На мероприятии в Сан-Франциско, которое проводилось только по приглашениям и было закрыто для прессы, докладчики выступали на сцене с техническими презентациями. Возможно, наиболее заметной новой функцией API является Realtime API, который сейчас находится в публичной бета-версии и поддерживает разговор на языке речи с использованием шести предустановленных голосов, а также позволяет разработчикам встраивать в свои приложения функции, очень похожие на расширенный голосовой режим (AVM) ChatGPT.

OpenAI утверждает, что Realtime API упрощает процесс создания голосовых помощников. Раньше разработчикам приходилось использовать несколько моделей для распознавания речи, обработки текста и преобразования его в речь. Теперь же они могут управлять всем процессом с помощью одного вызова API.

В ближайшие несколько недель компания планирует добавить в API Chat Completions API возможности ввода и вывода звука, что позволит разработчикам вводить текст или аудио и получать ответы в любом формате.В отличие от прошлого года, DevDay не будет транслироваться в прямом эфире, хотя OpenAI планирует позже разместить контент на своем канале YouTube. Программа мероприятия включает в себя секционные заседания, выступления представителей сообщества и демонстрационные ролики. Но самым большим изменением с прошлого года стало отсутствие ключевого выступления генерального директора компании. В этом году ключевую речь вела команда разработчиков OpenAI.

На прошлогоднем DevDay, состоявшемся 6 ноября 2023 года, генеральный директор OpenAI Сэм Альтман выступил перед собравшимися разработчиками, сотрудниками OpenAI и прессой в стиле Стива Джобса. Во время выступления неожиданно появился генеральный директор Microsoft Сатья Наделла, который рассказал о партнерстве между компаниями.

Одиннадцать дней спустя совет директоров OpenAI уволил Альтмана, что вызвало недельную суматоху, в результате которой Альтман вернулся на пост генерального директора, а совет директоров был сформирован в новом составе. Сразу после увольнения Кара Свишер сообщила из инсайдерских источников, что выступление Альтмана на DevDay и введение магазина GPT стало одним из провоцирующих факторов увольнения (хотя и не ключевым) из-за некоторых внутренних разногласий по поводу более потребительского направления компании после запуска ChatGPT.

Учитывая эту историю, а также то, что на этом мероприятии основное внимание уделяется разработчикам, возможно, компания решила, что лучше отстранить Альтмана от ключевой речи и позволить технологии OpenAI стать главным фокусом мероприятия вместо него.

0 комментариев

Вас могут заинтересовать