NLP диагностирует рак груди

Проблема рака груди – одна из самых остро стоящих проблем в медицине, и одна из самых известных. Каждый год в мире ставят около миллиона новых диагнозов, и считается, что после 40 лет женщина раз в год-два должна пройти маммографическое обследование – вне зависимости от того, есть ли у нее подозрения на новообразования, или нет. Однако здесь возникает большая проблема ложноположительного диагноза. Около семи процентов «бессимптомных» маммографий – это ложные положительные диагнозы, которые ведут к последующей «ненужной» биопсии и огромным психологическим проблемам у здоровых женщин.

mammogram-2_custom-601f3cb70c9bd4f413d2827731bad1daa9602842-s800-c85

Изображение: Lester Lefkowitz/Getty Images.

Учёные из Хьюстонского методистского исследовательского института (Houston Methodist Research Institutе) предложили основанный на искусственном интеллекте алгоритм, который диагностирует заболевание с точностью в 99 процентов. Согласитесь, 1% ложноположительных диагнозов лучше, чем 7%. Такой результат показал анализ данных 543 пациенток. Статья «методистского» коллектива опубликована в журнале Cancer.

Главным достоинством нового алгоритма стало то, что он не ограничивается только лишь маммографией.

 «Одной из самых сложных задач было научить алгоритм поиску информации в клинических отчетах, поскольку большинство таких документов находится в неструктурированной форме. Поэтому, если научиться выделять из таких текстов медицинскую информацию и создавать модель оценки риска, можно оценивать информацию и избегать ненужной биопсии»,

— говорит один из авторов Стефен Вонг.

 Так что новый метод умеет, помимо изучения снимков, обрабатывать текстовые клинические описания маммограм и всю историю болезни. Для этого используются алгоритмы NLP. Но не нейролингвистического программирования, как можно подумать, а направление развития искусственного интеллекта и математической лингвистики, которое получило название «обработка естественного языка», или natural language processing. Благодаря этому новая программа «понимает» врачебные записи, сопоставляет их с анализом маммограммы и ставит диагноз.

Текст: Алексей Паевский

Patel, T. A., Puppala, M., Ogunti, R. O., Ensor, J. E., He, T., Shewale, J. B., Ankerst, D. P., Kaklamani, V. G., Rodriguez, A. A., Wong, S. T. C. and Chang, J. C. (2016), Correlating mammographic and pathologic findings in clinical decision support using natural language processing and data mining methods. Cancer. doi:10.1002/cncr.30245