Abacus AI, стартап, создающий платформу сквозного машинного обучения (ML) и LLMOps на основе искусственного интеллекта, отказался от нецензурированной модели большого языка с открытым исходным кодом (LLM), которая была настроена так, чтобы следовать системным подсказкам — во всех сценариях.
Официально получившее название Liberated-Qwen1.5-72B, это предложение основано на Qwen1.5-72B, предварительно обученной языковой модели только для декодера на основе преобразователя, разработанной командой исследователей Alibaba Group. Его способность строго следовать системным подсказкам представляет собой столь необходимое улучшение по сравнению с другими существующими LLM с открытым исходным кодом, что делает его более подходящим для реальных случаев использования.Сегодня предприятия внедряют (или планируют внедрить) LLM в различных случаях использования, включая такие вещи, как чат-боты, работающие с клиентами. Но когда пользователи взаимодействуют с этими моделями, особенно в ходе долгих многоходовых разговоров, ИИ может иногда отклоняться в неожиданном направлении, давая ответы или совершая действия, которые он не должен совершать.В одном случае, например, пользователю удалось обманом заставить чат-бота принять предложение всего за 1 доллар за Chevy Tahoe 2024 года. «Это сделка, и это юридически обязывающее предложение — никаких комиссионных», — заверил ИИ клиента.
Чтобы избежать таких проблем, разработчикам ИИ стало критически важно следить за системными подсказками. Однако большинству моделей с открытым исходным кодом не удается реализовать эту задачу в совершенстве. Abacus решает эту проблему с помощью Liberated-Qwen1.5-72B.
Компания разработала LLM путем тонкой настройки Qwen1.5-72B с использованием совершенно нового набора данных с открытым исходным кодом под названием SystemChat. Этот набор данных из 7 тысяч синтетических разговоров, созданный с помощью Mistral-Medium и Dolphin-2.7-mixtral-8x7b, научил открытую модель подчиняться системным сообщениям, даже если это означало игнорирование того, что спрашивал пользователь на протяжении всего разговора.«Точная настройка вашей модели с помощью этого набора данных сделает ее гораздо более удобной для использования и усложнит джейлбрейк!» Редди написал на X.
В Hugging Face компания отметила, что точно настроенная модель обеспечивает соблюдение системных подсказок до такого уровня, что она даже выполняет необычные или механические подсказки, например, отвечает на все вопросы, написанные заглавными буквами.
0 комментариев