02.05.2024
Подписывайтесь на Telegram-канал по ссылке

Выпущено нейросетевое приложение для транскрибации голосовых заметок

NotesGPT

Разработчики представили веб-приложение NotesGPT, предназначенное для транскрибации голосовых заметок с помощью нейросетей. Само приложение написано на TypeScript, а в качестве модели машинного обучения используется открытая Mixtral. Код проекта открыт и опубликован на GitHub, поэтому сторонние разработчики могут присоединиться к нему. В репозитории есть инструкция по развёртыванию NotesGPT на собственном сервисе.

Сейчас NotesGPT позволяет делать аудиозаписи, сохранять их и транскрибировать по запросу. Функция распознавания голоса реализована на базе нейросети Whisper. В будущем разработчики планируют добавить возможность приостанавливать запись и продолжать позже, а также хотят перейти на более быструю версию Whisper. Кроме того, команда проекта планирует реализовать PWA, мобильное приложение и интеграцию с Notion, чтобы транскрибированные записи можно было сохранять в виде документа.