Ученые из Массачусетского технологического института (MIT) создали программу, которая на основе нейронной сети может диагностировать раннюю депрессию по разговору. Об этом сообщает профильный журнал Interspeech.
По данным Всемирной организации здравоохранения, на начало этого года депрессия остается одним из наиболее распространенных психических заболеваний во всем мире. От расстройства страдают в среднем около 300 миллионов человек, вместе с этим недуг провоцирует как минимум 800 000 суицидов каждый год.
При этом диагностика заболевания все еще остается проблемой для врачей и пациентов – тому причиной постоянно меняющаяся симптоматика. Ученые из Массачусетского технологического института нашли достойную альтернативу классическим методам – тестам, опросам и обследованиям. Исследователи создали нейронную сеть, которая может прогнозировать депрессию по речи человека и протоколу беседы с ним. В качестве материала использовались 142 интервью с пациентами.
На первом этапе ученые протестировали «независимую» точность прогнозирования – для этого команда собрала 279 аудио- и 100 текстовых сообщений и объединила все это в логистическую регрессионную модель с L1-регуляризацией. На второй фазе исследователи испытали эффективность прогнозов в контексте смысла и времени задаваемого вопроса. По итогу этой части исследования ученые смогли создать вопросам «вес» или «важность» для нейросети. На завершающем этапе исследователи смоделировали «временные изменения интервью» с помощью двунаправленной нейронной сети (Long Short-Term Memory).
По результатам работы научная группа сделала вывод о том, что программной модели при использовании аудио необходимо в четыре раза больше информации, нежели при работе с текстом. Ученые добавляют, что модель анализа текста и звука показала хорошие результаты. Именно за счет этого метод подойдет для прогнозирования депрессии. Это исследование становится важным шагом на пути к созданию универсального инструмента, который в будущем поможет врачам проводить раннюю диагностику психического расстройства.
Текст: Алексей Гоян
Detecting Depression with Audio/Text Sequence Modeling of Interviews by Tuka Alhanai, Mohammad Ghassemi and James Glass. Published in Interspeech 2018
DOI: 10.21437/Interspeech.2018-2522