бургерЛого хедера
Поиск
avatar

Apple выпускает OpenELM: небольшие модели ИИ с открытым исходным кодом, предназначенные для работы на устройстве

Google, Samsung и Microsoft продолжают развивать свои усилия в области генеративного искусственного интеллекта на ПК и мобильных устройствах.

image

В то время как Google, Samsung и Microsoft продолжают продвигать свои усилия по созданию генеративного ИИ на ПК и мобильных устройствах, компания Apple присоединяется к этому процессу, представив OpenELM - новое семейство больших языковых моделей (LLM) с открытым исходным кодом, которые могут работать полностью на одном устройстве, не требуя подключения к облачным серверам.

Выпущенный несколько часов назад на сообществе ИИ-кода Hugging Face, OpenELM состоит из небольших моделей, предназначенных для эффективного выполнения задач по генерации текста.Всего существует восемь моделей OpenELM - четыре предварительно обученных и четыре настроенных по инструкции - с различными размерами параметров от 270 миллионов до 3 миллиардов (имеются в виду связи между искусственными нейронами в LLM, и большее количество параметров обычно означает большую производительность и больше возможностей, хотя и не всегда).

Хотя предварительное обучение - это способ заставить LLM выдавать связный и потенциально полезный текст, это в основном прогностическое упражнение, а настройка инструкций - это способ заставить ее отвечать более релевантными результатами на конкретные запросы пользователя. Предварительное обучение может привести к тому, что модель просто попытается дополнить запрос дополнительным текстом, например, ответит на запрос пользователя «научите меня печь хлеб» текстом «в домашней духовке», а не реальными пошаговыми инструкциями, последние из которых будут достигнуты скорее через настройку инструкций, как отмечается в этом полезном объяснении от IBM.Apple предлагает вес свои модели OpenELM по лицензии, которую она называет «лицензией на образец кода», вместе с различными контрольными точками обучения, статистикой работы моделей, а также инструкциями по предварительному обучению, оценке, настройке инструкций и тонкой настройке с учетом параметров.

Лицензия на использование образцов кода не запрещает коммерческое использование или модификацию, только требует, чтобы «если вы распространяете программное обеспечение Apple полностью и без изменений, вы должны сохранить это уведомление и следующий текст и отказ от ответственности во всех таких распространениях программного обеспечения Apple».

Далее компания отмечает, что модели «предоставляются без каких-либо гарантий безопасности. Следовательно, существует вероятность того, что эти модели будут выдавать неточные, вредные, необъективные или неприемлемые результаты в ответ на запросы пользователя».

Это последний случай в удивительной череде релизов моделей ИИ с открытым исходным кодом от Apple - печально известной секретной и обычно «закрытой» технологической компании, которая до сих пор публично не объявляла и не обсуждала свои усилия в этой области, кроме как выкладывала модели и документы в сеть. Еще в октябре компания попала в заголовки, выпустив Ferret, языковую модель с открытым исходным кодом и мультимодальными возможностями.

0 комментариев

Вас могут заинтересовать