В 2006 г. Эрик Хорвиц (Eric Horvitz) и Юре Лесковец (Jure Leskovec) из Microsoft Research провели анализ базы данных, содержавшей информацию о комуникации посредством программы Microsoft Messenger за один месяц (июнь 2006). Они проанализировали данные 30 млрд. разговоров между 240 мнл. человек.
Был построен коммуникационный граф, содержащий 180 млн. узлов (пользователи, участвовавшие хотя бы в одном разговоре за рассматриваемый период) и 1,3 млрд. ненаправленных ребер, (каждое из которых соединяет двух пользователей, обменивавшихся сообщениями друг с другом). На сегодняшний день это самая большая социальная сеть, которая когда-либо исследовалась.
В исследовании рассматривалось не содержание сообщений, а «структурные характеристики коммуникационного графа», а также связь между этими характеристиками и социально-демографическими признаками пользователей (пол, возраст, язык) и их географическим местонахождением.
В работе приводится большое количество информации об исследуемой сети, выделим некоторые из основных результатов исследования:
- 99% разговоров были между 2 людьми, лишь 1% – между большим количеством пользователей. 99,9% пользователей оказались связаны между собой цепочками разной длины.
- Люди чаще и дольше общаются с теми, кто близок им по социально-демографическим признакам (т.н. «гомофилия»). В наибольшей степени это касается языка пользователя, затем географического местоположения, затем возраста. Единственное исключение – пол: «люди имеют склонность чаще и дольше общаться с представителями противоположного пола».
- Сеть обладает высокой степенью кластеризации, т.е. процент петель, состоящих из трех пользователей, значительно выше, чем этого можно было ожидать исходя из предыдущих исследований сетей, «люди, имеющие общих друзей, имеют тенденцию быть связанными друг с другом».
- Средняя длина кратчайших цепочек, связывающих любых двух пользователей, составляет 6,6 (мода 6, медиана 7), что несколько превышает данные, полученные Милграмом. «Эффективный диаметр» сети, измеренный как длина кратчайшей цепочки 90%.
Анализ социальных сетей представляет собой эффективную систему для обнаружения и интерпретации общественных онлайн-связей. Они исследуются с помощью ряда аналитических техник, в пределах от простых показателей центральности до изощрённого многоуровневого моделирования.
Если раньше сбор данных был задачей, требующей больших усилий и временных затрат, то сегодня электронные сети эту задачу несколько упростили. Это произошло за счёт использования пассивных данных (таких как веб-страницы и данные почтовых хранилищ). Но увеличение эффективности привело к ограничению сбора данных. Из чего возникла необходимость определения критериев значимости отношений.
Решение этих проблем требует терпения и технических навыков высокого уровня, в частности, владения языками программирования или соответствующими программами и в некоторой степени опыта работы методом проб и ошибок. В результате, как видно из вышеупомянутых исследований, мы сможем понять устройство интерсубъективных структур, которые влияют на онлайн-присутствие пользователей и онлайн-жизнь в целом.
Кроме того, данные методы применимы вне онлайн-пространства, именно поэтому в названии статьи используется уточнение «в интернете».
Исследуемые структуры с одной стороны воспроизводят повседневную жизнь, а с другой стороны являются её частью.
То есть аналитика – это не просто пристальный взгляд на другой берег, это более кристаллизованное представление о «здесь и сейчас».