Исследователи из Университета ИТМО смогли по данным о пользователях игровой онлайн-платформы предсказать пол игрока. Они одними из первых применили машинное обучение, чтобы проанализировать большой массив игровых данных. Такой подход в перспективе позволит улучшить систему персональных рекомендаций для подбора игр. Также его можно применить для выявления игровой зависимости. Результаты были представлены на конференции AAAI Conference on Artificial Intelligence.
Credit: Stockvault
До сих пор все исследования игровых данных проводились вручную на небольших выборках. Однако, чтобы делать статистически значимые выводы, необходимо анализировать большие массивы игровых данных. Ученые из Университета ИТМО вместе с коллегами из Университета Сингапура одними из первых применили для этого машинное обучение. С помощью собранного ими набора данных о поведении пользователей игровой платформы Steam и специально разработанной и обученной модели, они смогли на основе игрового поведения предсказывать пол игрока.
Базу данных для анализа исследователи собирали на основе сервиса Player.me, который позволяет сопоставить аккаунты пользователей Steam с их профилями в социальных сетях: Twitter, Facebook и Instagram. На основе этого сравнения исследователи искали связи между данными об игровом поведении и демографическими показателями. В итоге в основу модели легли такие признаки как: потраченное на игру время, полученные игровые достижения, предпочитаемые жанры игр, наличие внутриигровых платежей и т.д.
«Идея моего исследования в том, чтобы использовать игровые данные для изучения поведения человека в реальной жизни. Для этого сейчас пробуют использовать социальные сети, но там люди задумываются о своем поведении, выбирают, что постить, и фильтруют свои мысли. А в играх такого не происходит: там мы ведем себя так, как хотели бы в жизни. И на данном этапе работы мне удалось подтвердить, что игровые данные имеют отношение к реальным характеристикам людей»,— отмечает Иван Самборский, аспирант Университета ИТМО.
По словам ученых, анализ игровых данных позволяет оценить интересы, локацию и демографию пользователей, а также учесть, сколько времени человек готов тратить на игры. Исследователи будут работать над улучшением полученной модели, чтобы повысить точность предсказаний о пользователях. Также модель планируют адаптировать для определения игровой зависимости.
«В наших прошлых исследованиях мы использовали тексты, изображения и даже геолокацию. Однако поведение игроков описывается совершенно особым языком проведенных в играх часов и полученных достижений. Наше исследование показало, что даже этой информации хватает, чтобы предсказать пол игрока. Конечно, полом дело не ограничится, но сейчас мы просто показали, что игровое поведение можно анализировать и получать хорошие прогнозные значения. Помимо вездесущей персонализации рекламы, хорошие прогнозные модели можно использовать во многих прикладных исследованиях: социологических, психологических, спортивных и медицинских»,— комментирует Андрей Фильченков, руководитель группы машинного обучения лаборатории «Компьютерные технологии» Университета ИТМО.
Текст: ИТМО