26.04.2024
Подписывайтесь на Telegram-канал по ссылке

OpenAI создала нейросеть, которая кратко пересказывает книги

Книги пересказывает нейросеть

В компании OpenAI представили нейросеть на основе GPT-3, которая способна генерировать краткие изложения книг. Разработчики отмечают, что подобные модели нужны для контролируемого масштабирования систем искусственного интеллекта. Данная нейросеть покажет, насколько она справляется с работой, которую обычно выполняют люди. Статья с описанием опубликована на arXiv.org.

В OpenAI отметили, что решение проблемы согласования должно работать с задачами, оценка результатов которых для людей затруднительна или отнимает много времени. Новая нейросеть работает, сначала суммируя небольшие разделы книги, а затем объединяя эти резюме в краткое изложение. Среднее качество пересказа получило оценку 6/7 от людей, которые читали книгу в 5 % случаев, и оценку 5/7 в 15 % случаев. Модель OpenAI показывает достойные результаты по набору данных BookSum для кратких изложений.

Исследователи говорят, что обычно большие предварительно обученные модели не очень подходят для резюмирования. Однако обучение модели с помощью обучения с подкреплением на основе отзывов людей помогло согласовать её сводные данные с человеческими предпочтениями. Для составления краткого изложения книги разработчики применили метод рекурсивной декомпозиции задач, разбив сложную задачу на более простые.

По сравнению с процедурой сквозного обучения рекурсивная декомпозиция задачи позволяет людям быстрее оценивать части резюме по каждому из отрывков книги, а также легче проследить процесс написания краткого изложения. Как обещают в OpenAI, данный метод может быть использован для подготовки резюме книг неограниченной длины.

Компания, однако, подчёркивает, что краткое изложение книги моделью недостаточно связно. Как правило, оно выглядит как список событий, а не связное резюме, которое мог бы написать человек. Кроме того, модели иногда генерируют неточные утверждения из-за отсутствия контекста. Исследователи предполагают, что проблемы можно частично решить, изучив процедуру декомпозиции, а не используя фиксированный алгоритм. Данная работа стала частью исследований компании по оценке работы передовых систем искусственного интеллекта, которые учатся выполнять всё более сложные задачи.