Главная Технологическая индустрия Новые «рассуждающие» модели ИИ от OpenAI уже здесь

Новые «рассуждающие» модели ИИ от OpenAI уже здесь

Новая языковая модель o1 может решать сложные задачи итеративно, подсчитывая буквы R в слове «клубника».

В четверг компания OpenAI наконец-то представила свою языковую модель искусственного интеллекта «Клубника», заявив о значительном улучшении возможностей, которые она называет «рассуждениями» и решением проблем, по сравнению с предыдущими большими языковыми моделями (LLM). Официально названное «OpenAI o1», семейство моделей первоначально будет запущено в двух формах, o1-preview и o1-mini, доступных сегодня для ChatGPT Plus и некоторых пользователей API.

OpenAI утверждает, что o1-preview превосходит своего предшественника, GPT-4o, по нескольким показателям, включая соревновательное программирование, математику и «научные рассуждения». Однако люди, использовавшие эту модель, говорят, что она пока не превосходит GPT-4o по всем показателям. Другие пользователи критикуют задержку в получении ответа от модели из-за многоступенчатой обработки, происходящей за кулисами, прежде чем ответить на запрос.

В редких случаях менеджер по продуктам OpenAI Джоанн Джанг (Joanne Jang ) написала в твиттере: «В моей ленте много шумихи по поводу o1, и я беспокоюсь, что это может создать неправильные ожидания. Что такое o1: первая модель рассуждений, которая сияет в действительно сложных задачах, и она будет становиться только лучше. (Я лично в восторге от потенциала и траектории развития модели!) Чем o1 не является (пока!): чудо-моделью, которая делает все лучше, чем предыдущие модели. Вы можете быть разочарованы, если это ваши ожидания от сегодняшнего запуска - но мы работаем, чтобы достичь этого!»OpenAI сообщает, что o1-preview занял 89-е место в процентах по результатам конкурсных вопросов по программированию от Codeforces. В области математики он набрал 83 процента на отборочном экзамене к Международной математической олимпиаде, по сравнению с 13 процентами GPT-4o. OpenAI также утверждает, что, возможно, впоследствии, по мере изучения бенчмарков и проведения собственных оценок, o1 будет демонстрировать результаты, сравнимые с результатами аспирантов при выполнении конкретных задач по физике, химии и биологии. Меньшая модель o1-mini разработана специально для задач кодирования и стоит на 80 % меньше, чем o1-preview.