Интернет-сервис переоценил статистику заболеваемости гриппом

Веб-сервис Google Flu Trends переоценивает количество больных, что может повлечь за собой неправильные действия со стороны медиков

Веб-сервис Google Flu Trends переоценивает количество больных, что может повлечь за собой неправильные действия со стороны медиков
(фото Andrés Nieto Porras/Flickr).

Ведущий автор исследования политолог Райан Кеннеди

Ведущий автор исследования политолог Райан Кеннеди
(фото University of Houston).

Веб-сервис Google Flu Trends переоценивает количество больных, что может повлечь за собой неправильные действия со стороны медиков
Ведущий автор исследования политолог Райан Кеннеди
Исследователи проанализировали крупную базу данных, собранную веб-сервисом Google Flu Trends, который по поисковым запросам пользователей собирает информацию о статистике заболеваемости гриппом. Оказалось, что сервис переоценил количество больных более чем в полтора раза.

С 2008 года существует сервис Google Flu Trends, который был создан специалистами для мониторинга заболеваемости населения Земли гриппом и предсказания крупных эпидемий. Алгоритм ориентируется на поисковые запросы пользователей и по ключевым словам составляет общую картину, по которой можно судить, сколько человек в стране или в мире страдает недугом в тот или иной временной период.

В рамках нового исследования, профинансированного Национальным научным фондом США (NSF), учёные определили, что огромная база данных, которой оперирует веб-сервис, далеко не всегда отражает реальную картину заболеваемости. Статья с результатами работы была опубликована в журнале Science.

"Сервис Google Flu Trends является поистине произведением инженерного искусства и очень полезным инструментом статистических исследований. Но это также отличный пример того, как анализ "больших данных" может дать неверные результаты", — говорит ведущий автор исследования Райан Кеннеди (Ryan Kennedy), профессор политологии из университета Хьюстона.

Учёные утверждают, что даже несмотря на многочисленные модификации в алгоритме Google Flu Trends, которые проводились за последние пять лет, сервис по-прежнему переоценивает вспышки гриппа. Ошибки были замечены как в данных о 2011-2012 годах, так и в период 2012-2013 годов. Новейшие результаты ещё отдельному анализу не подвергались.

"Многие источники "больших данных" создаются частными компаниями, такими как Google, а эти компании постоянно меняют свои сервисы в соответствии со своей бизнес-моделью. Нам необходимо лучше понимать, как эти изменения влияют на данные, производимые этими сервисами. В противном случае мы рискуем сделать неверные выводы и принять неправомерную политику при устранении проблемы", — пишет Кеннеди в пресс-релизе.

По результатам исследования, Google Flu Trends переоценил распространённость гриппа за сезон 2012-2013 годов и предыдущий сезон более чем на 50%. Кроме того, в период с августа 2011 года по сентябрь 2013-го сервис давал завышенные прогнозы о заболеваемости в течение 100 из 108 недель.

Говоря о решении этой проблемы, Кеннеди отметил, что наиболее точная и полная информация получается лишь при использовании сочетания различного рода информации и разных методик её анализа.

Учёные предложили использовать и более традиционные способы анализа данных, а для полноценной информационной картины подключать не только поисковые запросы, но и тексты пользователей в социальных сетях Facebook (запрещена в РФ) и Twitter.

Также по теме:
Видео: Предсказывать распространение вируса гриппа будут как погоду
Учёные выявляют побочные эффекты лекарств по поисковым запросам в Сети
Климатологи предложили создать систему раннего предупреждения эко-катастроф
ВОЗ предупреждает о грядущей волне онкологических заболеваний
Мобильное приложение оградит от венерических болезней
Свою историю болезней можно будет посмотреть в Интернете