06.05.2024
Подписывайтесь на Telegram-канал по ссылке

Чат-боты могут научиться размышлять, прежде чем дать окончательный ответ

Quiet STaR алгоритм

Исследователи из Стэнфордского университета разработали алгоритм, который позволяет современным чат-ботам обдумывать возможные ответы на запрос, прежде чем дать окончательный ответ. Это приводит к небольшой задержке, но серьёзно повышает качество ответа. Алгоритм может быть подключён к любому чат-боту. Исследование опубликовано на arXiv.

Как отмечают учёные, общий подход современных чат-ботов заключается в формулировке ответа на запрос с использованием обучающих данных. Ни один из чат-ботов, используемых в настоящее время, не останавливается, чтобы обдумать несколько возможных ответов на запрос, прежде чем выдать тот, который, по его мнению, наиболее вероятен. Если бы человек ответил таким образом, мы бы сказали, что он выпалил первое, что в голову пришло. В этом новом исследовании группа дала чат-ботам возможность немного подумать, прежде чем ответить. Учёные считают, что предложенный способ позволит чат-ботам быть гораздо более точными и отвечать на вопросы немного по-человечески.

Алгоритм Quiet-STaR сначала просит чат-бота дать несколько ответов на заданный запрос. Затем он сравнивает ответы с исходным запросом, чтобы решить, какой из них окажется лучшим. Затем он предписывает чат-боту дать тот ответ пользователю, который выбрал алгоритм. Команда также дала алгоритму возможность учиться на собственном опыте, чтобы со временем улучшать его возможности анализа. Чтобы проверить свой алгоритм, исследователи добавили его в чат-бот Mistral 7B с открытым исходным кодом и протестировали его с помощью стандартного теста на рассуждения — он набрал 47,2%. Без алгоритма Mistral 7B набрал 36,3%. С добавленным алгоритмом Mistral 7B намного лучше справился с тестом по математике.