OpenAI создала нейросеть, которая кратко пересказывает книги

В компании OpenAI представили нейросеть на основе GPT-3, которая способна генерировать краткие изложения книг. Разработчики отмечают, что подобные модели нужны для контролируемого масштабирования систем искусственного интеллекта. Данная нейросеть покажет, насколько она справляется с работой, которую обычно выполняют люди. Статья с описанием опубликована на arXiv.org.

В OpenAI отметили, что решение проблемы согласования должно работать с задачами, оценка результатов которых для людей затруднительна или отнимает много времени. Новая нейросеть работает, сначала суммируя небольшие разделы книги, а затем объединяя эти резюме в краткое изложение. Среднее качество пересказа получило оценку 6/7 от людей, которые читали книгу в 5 % случаев, и оценку 5/7 в 15 % случаев. Модель OpenAI показывает достойные результаты по набору данных BookSum для кратких изложений.

Исследователи говорят, что обычно большие предварительно обученные модели не очень подходят для резюмирования. Однако обучение модели с помощью обучения с подкреплением на основе отзывов людей помогло согласовать её сводные данные с человеческими предпочтениями. Для составления краткого изложения книги разработчики применили метод рекурсивной декомпозиции задач, разбив сложную задачу на более простые.

По сравнению с процедурой сквозного обучения рекурсивная декомпозиция задачи позволяет людям быстрее оценивать части резюме по каждому из отрывков книги, а также легче проследить процесс написания краткого изложения. Как обещают в OpenAI, данный метод может быть использован для подготовки резюме книг неограниченной длины.

Компания, однако, подчёркивает, что краткое изложение книги моделью недостаточно связно. Как правило, оно выглядит как список событий, а не связное резюме, которое мог бы написать человек. Кроме того, модели иногда генерируют неточные утверждения из-за отсутствия контекста. Исследователи предполагают, что проблемы можно частично решить, изучив процедуру декомпозиции, а не используя фиксированный алгоритм. Данная работа стала частью исследований компании по оценке работы передовых систем искусственного интеллекта, которые учатся выполнять всё более сложные задачи.

Алексей Клёсов

Вам также может понравиться

Чемпионат по созданию навыков для голосового помощника Маруся

Искусственный интеллект смог распознать тревожные формулировки в сообщениях

Акселератор студенческих стартапов по искусственному интеллекту