28.03.2024
Подписывайтесь на Telegram-канал по ссылке

В открытый доступ выложен бесплатный аналог ChatGPT

Dolly 2.0

Компания Databricks выпустила новый чат-бот Dolly 2.0, похожий на ChatGPT, и выложила в открытый доступ его исходный код, а также набор данных, использованных для обучения. По словам разработчика, это первая полностью бесплатная большая языковая модель (LLM), обученная на базе данных, которая также является бесплатной. Ознакомиться с проектом можно по ссылке. Код выложен на GitHub.

Имея 12 миллиардов параметров Dolly 2.0 немного меньше своих конкурентов ChatGPT (175 миллиардов), LaMDA (137 миллиардов) или LLaMA (65 миллиардов). Этот новый искусственный интеллект основан на pythia-12b — бесплатной модели из 12 миллионов параметров. Первая версия Dolly 1.0 обучалась на наборе данных, который содержит данные из ChatGPT. Однако OpenAI запрещает любое использование данных, полученных его ИИ, для создания конкурирующего сервиса, что препятствует любому коммерческому использованию.

Чтобы сделать свой искусственный интеллект полностью бесплатным, разработчики создали собственный набор данных для его обучения, который состоит из 15 000 вопросов с оригинальными ответами. Для этого они устроили конкурс, открытый для всех 5 000 сотрудников Databricks, который занял неделю. Благодаря этому искусственный интеллект показывает лучшие результаты, чем другие недавно выпущенные языковые модели (такие, как Alpaca, Koala, GPT4All или Vicuna), обученные на ответах ChatGPT, включающих ошибки.