25.04.2024
Подписывайтесь на Telegram-канал по ссылке

Открыт публичный доступ к платформе синтеза и распознавания речи SaluteSpeech

SaluteSpeech Сбер

Команда SberDevices сделала публичным доступ к своей платформе синтеза и распознавания речи SaluteSpeech для реализации некоммерческих проектов. Ранее получить доступ к платформе могли только юридические лица и индивидуальные предприниматели. Для некоммерческого использования речевых технологий платформы потребуется только регистрация на портале.

Открытый доступ к платформе SaluteSpeech поможет пользователям быстро и эффективно решать множество задач. Студенты могут транскрибировать лекции, блогеры — озвучивать ролики, авторы — создавать аудиокниги. Также есть сценарии использования публичной версии для бизнеса. Средний и малый бизнес может озвучить презентационные материалы либо транскрибировать аудиозаписи встреч или интервью для последующей работы с текстом. Крупный бизнес получает возможность оперативно протестировать технологию Сбера до принятия решения о дальнейшем сотрудничестве.

«Наша команда очень много выступает на мероприятиях перед студентами — мы рассказываем им о речевых технологиях, — и я очень рад, что теперь они могут полноценно их протестировать и создать свои первые проекты, которые, уверен, положат начало чему-то большому и важному в будущем. Также это отличный инструмент для людей, у которых возникает бытовая потребность в переводе текста в голос и наоборот. Отмечу, что таких немало. И, конечно, ещё одна важная задача этого проекта дать бизнесу возможность для тестирования платформы SaluteSpeech. Благодаря свободному доступу все желающие в удобный для них момент могут подключиться к платформе и оценить качество работы её технологий», — говорит Денис Афанасьев, директор дивизиона В2В-продуктов Салют SberDevices.

Публичный доступ к платформе доступен только для некоммерческого использования. Распознавание речи в этом формате для физических лиц ограничено 100 минутами в месяц. К примеру, продолжительность одной лекции — 60 минут, а деловая встреча в среднем длится от 40 до 60 минут. Синтезировать можно текст на 200 000 символов в месяц — этого достаточно, чтобы создать небольшую аудиокнигу примерно на 100 страниц.