19.04.2024
Подписывайтесь на Telegram-канал по ссылке

Компания Mail.ru запустила виртуальных ведущих новостей на базе искусственного интеллекта

Mail.ru запустил виртуальных ведущих новостей

В компании Mail.ru разработали платформу, позволяющую в несколько кликов создавать новостные и репортажные видео студийного качества. Новость зачитает виртуальный диктор, а видео можно дополнить изображениями, музыкой, титрами и даже поставить ссылку. Производить видеосюжеты в телевизионном формате смогут все игроки медиарынка — от крупных СМИ до блогеров.

Чтобы создать видео, достаточно загрузить в систему текст новости и виртуальный ведущий его зачитает. Дикторы выглядят и разговаривают, как живые люди: при чтении новостей они реалистично воспроизводят мимику, эмоционально реагируют и расставляют смысловые акценты. Внешность диктора выбирает пользователь: в Mail.ru создали несколько моделей цифровых ведущих, прототипами для которых послужили реальные люди. Также пользователи смогут менять дизайн студии — например, оформлять её в корпоративных цветах издания.

Платформа для создания видео будет полезна как крупным изданиям, которые активно экспериментируют с технологиями, так и нишевым медиа. Использование видеоредактора поможет медиаресурсам экономить на создании качественного видеоконтента и выпускать сюжеты в самые короткие сроки.

При создании виртуальных ведущих Mail.ru использовала собственные разработки в области искусственного интеллекта. Над синтезом речи на основе нейронных сетей работала команда голосового ассистента Маруси. Голосовой помощник от Mail.ru давно занимается озвучиванием новостей — этот навык появился у Маруси одним из первых. Кроме того, на проекте Новости Mail.ru можно попросить Марусю рассказать информационную картину дня. Маруся способна воспроизводить любой объём текста, разделяя смысловые отрезки и сохраняя связность повествования. Речевой движок Маруси настроен таким образом, чтобы соответствовать по тембральным акцентам реальному человеческому произношению. Поэтому речь цифрового диктора звучит максимально естественно.

Видеоизображение синхронизируется с речью в режиме реального времени. Системы компьютерного зрения Vision от Mail.ru обучались на реальных прототипах и видеозаписях, чтобы точно воспроизводить движение губ и выражение лица. Благодаря глубинному обучению, нейронные сети позволяют дикторам транслировать произвольную речь с подходящей мимикой и эмоциональностью.

Ссылка на источник.