Нейросеть обучили распознавать жалобы на лекарства в соцсетях

15 сентября 2018

Группа российских исследователей обучила нейронную сеть анализировать мнения пользователей соцсетей об эффектах лекарств. Основной целью ученых было преодолеть терминологический разрыв между пациентами и профессионалами в области здравоохранения. На примерах базы данных на английском языке нейронную сеть обучили превращать текст обычных людей в формальный медицинский язык. Результаты опубликованы в Journal of Biomedical Informatic. Работа поддержана грантом Российского научного фонда.

Сredit: МФТИ


Социальные сети — практически неисчерпаемый источник мнений по широкому кругу вопросов. Люди пишут о своей работе, отношениях и в том числе жалуются на проблемы со здоровьем. По сути, социальные сети предоставляют огромные наборы данных мнений вместе с демографической информацией и другими данными о пользователе.

Хотя ученые часто используют интеллектуальный анализ текстов (text mining) в социальных сетях для перепрофилирования лекарств и генерации гипотез, мало кто сопоставлял пользовательские фразы с профессиональными терминами. Задача сопоставления упомянутого пользователем заболевания с конкретным медицинским термином называется нормализацией медицинских концептов. Сложность в том, что профессиональная медицинская лексика редко совпадает с повседневной, которую используют люди в общении. Чтобы решить эту проблему, российские исследователи использовали последовательное обучение рекуррентных нейронных сетей и семантическое представление однословных и многословных выражений.

«Важность работы определяется постоянно растущей потребностью в анализе текстовых данных. Мы живем в условиях информационного взрыва, когда количество информации удваивается каждые несколько лет, и человек или даже коллектив людей уже не способен обработать все доступные данные, — говорит соавтор работы Елена Тутубалина из Казанского федерального университета. — В нашем проекте используются методы анализа текстов и машинное обучение для извлечения полезной информации из доступных данных, как, например, в этом случае, где мы извлекали упоминания о побочных лекарственных реакциях из сообщений, которые люди пишут в социальных сетях».

По мнению авторов работы, непрерывное развитие и улучшение точности интеллектуального анализа текстов сообщений пациентов в социальных сетях окажет значительное влияние на изучение влияния лекарств на организм, повторное назначение лекарств и понимание лекарственных эффектов в контексте других факторов, таких как одновременный прием разных препаратов, диета и образ жизни.


 

Journal of Biomedical Informatics

Volume 84, August 2018, Pages 93-102

Medical concept normalization in social media posts with recurrent neural networks