24.04.2024
Подписывайтесь на Telegram-канал по ссылке

Нейросеть научилась по словам определять, есть ли у человека депрессия

Depression Recognition from Speech

Исследователи из Института перспективных исследований Цзиньхуа и Харбинского университета науки и технологий разработали алгоритм глубокого обучения, который может обнаруживать депрессию по речи человека. Эта модель, описанная в журнале Mobile Networks and Applications, была обучена распознавать эмоции в человеческой речи путём анализа различных соответствующих функций.

«Многоинформационная модель алгоритма совместного принятия решений создаётся посредством распознавания эмоций, — написали в своей статье учёные Хань Тянь, Чжан Чжу и Сюй Цзин. — Модель используется для анализа репрезентативных данных об испытуемых и для помощи в диагностике депрессии у испытуемых».

Исследователи обучили свою модель на наборе данных звуковых и трёхмерных выражений лиц пациентов с диагнозом депрессивное расстройство и людей без депрессии. Эти аудиозаписи и мимика были собраны во время интервью, проводимых виртуальным агентом, который задавал различные вопросы о настроении и жизни интервьюируемого. Чтобы извлечь важные функции из голосовых записей, модель команды использует OpenSmile (интерпретация речи и музыки с открытым исходным кодом путём извлечения большого пространства). Это набор инструментов, который часто используется учёными-компьютерщиками для извлечения признаков из аудиоклипов и классификации этих клипов.

«На основе изучения речевых характеристик людей с депрессивным расстройством в статье проводится углублённое исследование диагностики депрессии с помощью речи на основе речевых данных, — написали учёные в своём исследовании. — Во-первых, речевая информация предварительно обрабатывается, включая предварительное выделение речевого сигнала, кадрирование, обнаружение конечной точки, шумоподавление и т. д. Во-вторых, OpenSmile используется для извлечения характеристик речевых сигналов, и речевые характеристики, которые могут отражать функции, изучены и проанализированы глубоко».

Исследователи использовали OpenSmile для извлечения отдельных особенностей речи и их комбинаций, которые обычно встречаются в речи пациентов с диагнозом депрессия. Впоследствии они использовали технику, известную как анализ основных компонентов, чтобы сократить набор извлечённых признаков. Учёные оценили свою модель в серии тестов, в ходе которых они оценили её способность обнаруживать депрессивных и недепрессивных людей по записям их голоса. Их схема дала замечательные результаты, выявляя депрессию с точностью 87% у пациентов мужского пола и 87,5% у пациентов женского пола.

В будущем алгоритм глубокого обучения, разработанный этой группой исследователей, может стать дополнительным вспомогательным инструментом для психиатров и врачей наряду с другими хорошо зарекомендовавшими себя диагностическими инструментами. Кроме того, это исследование может вдохновить на разработку аналогичных инструментов искусственного интеллекта для выявления признаков психических расстройств по речи.