Составлена база движений глаз при чтении на русском языке

27 августа 2018

Ученые создали первую базу данных движений глаз при чтении на русском языке. Результаты выложены в открытый доступ, их могут использовать не только в лингвистике, но и, например, для диагностики и коррекции болезней, связанных с нарушениями речи. Исследование опубликовано в журнале Behavior Research Methods.

Сredit: Stockvault.net

При чтении глаза делают своеобразные скачки от слова к слову с короткими, около 220 мс, остановками. Во время таких остановок человек обрабатывает информацию, которую видит. Если слово короткое или предсказуемое, глаз распознает его с помощью бокового зрения. В алфавитных языках примерно 30% слов не фиксируются при чтении напрямую. Интересно, что в разных языках чтение предложений с одним и тем же смыслом занимает одинаковое время. Но, например, тексты на финском требуют много коротких фиксаций, а при чтении на китайском фиксаций меньше, но они длинные.

Согласно последним психолингвистическим исследованиям, у процесса чтения на разных языках нет принципиальных различий. Тем не менее ученым интересны особенности, характерные для того или иного языка. Специфику движения глаз при чтении на русском раньше никто не изучал.

«До сих пор о чтении на русском языке ничего известно не было, хотя это шестой язык в мире по численности говорящих. Поэтому мы сделали эту базовую, но нужную работу: взяли коллекцию разных предложений из существующих текстов и записали, как носители русского языка их читают, — рассказывает один из авторов исследования Анна Лауринавичюте, научный сотрудник Высшей школы экономики. — Это опора для сравнения, с одной стороны, с другими языками, а с другой — с детьми, которые только учатся читать; пожилыми людьми; пациентами с афазией (нарушения речи из-за инсульта или травмы головы); билингвами и носителями русского жестового языка».

Для эксперимента исследователи использовали установку, регистрирующую 1000 измерений движения глаз в секунду. 96 испытуемых читали один и тот же набор предложений, случайным образом выбранных из Национального корпуса русского языка. Это самая представительная электронная база текстов на русском языке, используемая лингвистами. Ученым было важно пронаблюдать, как меняется скорость чтения в зависимости от особенностей слова. Поэтому в предложениях было отмечено ударение, часть речи, многозначность, частотность употребления, длина и предсказуемость слов.

Также базу данных можно использовать для изучения особенностей восприятия информации, характерных для разных языков. Например, полученные результаты подтверждают гипотезу, что глаголы читаются медленнее, чем существительные. Причем в этом конкретном случае причина не в длине слов, их предсказуемости или других параметрах. Если при чтении существительного нужно только соотнести слово и предмет, то при чтении глаголов все сложнее. Во-первых, нужно понять, какое действие обозначает это слово. Во-вторых, вспомнить, кто или что это действие совершает. В-третьих, определить, есть ли у этого действия объект, и если да, то в какой именно падежной форме его употребляют.

Данные о движении глаз имеют большой потенциал использования. Зная, как обрабатывает информацию здоровый человек, можно создать систему диагностики и коррекции дислексии, а также восстановления речи после травм головы. Еще одно направление — определение уровня владения русским языком по движениям глаз при чтении. Такие проекты уже ведут зарубежные лингвисты.

Текст: пресс-служба ВШЭ

Russian Sentence Corpus (RSC) — Data and script for published analyses. Contributors: Anna Laurinavichyute, Svetlana Alexeeva, Irina Sekerina

Date created: 2017-11-16 07:00 PM | Last Updated: 2018-07-01 07:14 PM Identifiers: DOI 10.17605/OSF.IO/X5Q2R| ARK c7605/osf.io/x5q2r

Читайте материалы нашего сайта в Facebook, ВКонтакте, Яндекс-Дзен и канале в Telegram, а также следите за новыми картинками дня в Instagram.