Margaret24.ru

Деньги в период кризиса
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Системно сетевой анализ

Азы социально-сетевого анализа (Social Network Analysis 101)

От переводчика. Автор этой публикации — Майкл Ву (Michael Wu), ведущий аналитик компании Lithium, специализирующийся в изучении социальных взаимодействий и онлайн-сообществ.

Чтобы понять, что такое «социально-сетевой анализ» (Social Network Analysis, SNA), нужно понимать, что такое «социальная сеть» и что такое «социальный граф». Говоря просто, социально-сетевой анализ — это способ изучения социальных сетей, а социальная сеть — это набор сущностей, между которыми есть определенные отношения. Социальные сети существуют с тех пор, как люди начали бродить по земле. По правде говоря, подобные структуры есть не только у людей, но и у социальных животных (например, у волков, львов, дельфинов, мышей и даже муравьев).

Безусловно, прежде всего нас интересуют такие сущности как люди, и такие отношения между ними как дружба (как на Facebook), совместная работа (как на LinkedIn), родство, общение и некоторые другие социальные взаимодействия. А в контексте SNA мы можем под социальным графом понимать просто визуализацию всего этого (я не собираюсь нагонять скуку формальным определением графа). В таком социальном графе каждая точка (или узел, или вершина) изображает человека, а ребро между двумя точками (людьми) изображает отношения между ними. А так как между людьми существует множество самых разных отношений, точно также существует множество разных социальных графов, изображающих эти отношения. Я покажу это на конкретном примере.

Репрезентативная социальная сеть и её социальный граф

Давайте предположим, что у меня, Майкла (Michael), очень маленькая социальная сеть, состоящая всего из семи друзей (смотри рис. 1). Предположим далее, что у меня очень простая жизнь, в которой я поддерживаю всего три типа социальных отношений: у меня есть коллеги по работе (обозначенные красными ребрами), собутыльники (синие ребра) и партнеры по бадминтону (зеленые ребра).

Что из себя представляет моя социальная жизнь? У меня есть коллеги по Литиуму (Фил и Джо, которые также являются коллегами друг для друга). А перед тем, как я пришел работать в Литиум, я работал с Джеком и Райаном в Калифорнийском университете в Беркли. А еще до этого я работал с Райаном и Доном в Национальной библиотеке Лос-Аламоса. Райан пришел в Беркли вместе со мной получать степень кандидата наук (PhD), таким образом мы с ним пересеклись на двух работах. Вот почему Райан также работал вместе с Джеком и Доном, но которые не являются коллегами друг для друга.

Другая часть моей социальной жизни связана с моими собутыльниками. Я часто ходил выпивать с Дагом, Адамом и Райаном во время аспирантуры. Однако Райан и Даг никогда не оставались друг с другом наедине и никогда никуда не ходили вместе. Когда я пришел в Литиум, я узнал, что Фил и Джек часто выпивают вместе, но я никогда ни с кем из них не делал этого.

Наконец, я люблю бадминтон. Везде, где я работал, я находил себе партнера по бадминтону. Я играл с Джо в Литиуме, с Джеком в Беркли, и с Доном в Лос-Аламосе. Райан тоже играет в бадминтон — с Филом и Дагом. Однако они играют гораздо лучше меня, поэтому я никогда ни с кем из них не играл.

Читать еще:  Анализ затрат на заработную плату

Если вообразить себе всех моих семерых друзей на Facebook, то наш граф дружбы выглядел бы так, как показано на рисунке 2a. Черные грани обозначают дружбу, а точнее людей, которые знакомы друг с другом. Но если вы захотите увидеть мою профессиональную сеть, тогда мой социальный граф будет выглядеть так, как показано на рисунке 2b. В этом случае, красные ребра обозначают мои взаимоотношения с коллегами по работе. Обратите внимание, что Адам и Даг не включены в мою профессиональную сеть (между нами нет красных ребер), потому что мы никогда не работали вместе.

Граф моих собутыльников показан на рисунке 2c (где синие ребра обозначают тот факт, что мы выпиваем вместе) и включает в себя Дага, Адама и Райана, так как я никогда не выпивал ни с кем из моих других друзей. И несмотря на то, что Джек и Фил выпивают вместе, я никогда не делал этого с ними, поэтому между нами нет синих ребер. Таким образом, Джек и Фил оказываются в абсолютно отдельной сети выпивох.

И наконец, граф моих партнеров по бадминтону показан на рисунке 2d, где зеленые грани обозначают взаимоотношения, основанные на совместной игре в бадминтон. Только Джек, Джо и Дон включены в мою бадминтонную сеть. У Райана же своя собственная сеть, состоящая из Фила и Дага, и никто из них не включен в мою сеть.

Чтение и интерпретация социального графа

Заметьте, мы построили четыре различных социальных графа из одной и той же социальной сети, состоящей из восьмерых человек. Задавая, что будут обозначать грани, мы получаем свой особый граф со своими особыми метриками. Например, если мы решим, что грани должны обозначать совместное веселое времяпрепровождение, мы построим еще один, совсем другой социальный граф, который будет выглядеть как пересечение моего графа собутыльников и графа партнеров по бадминтону (безусловно, работа в Литиуме тоже доставляет много веселья, но я сейчас всё упрощаю). Таким образом, благодаря тому, что между людьми существует много разных отношений, много разных социальных графов может быть построено.

Поэтому, самое важное, что надо сделать перед интерпретацией любого социального графа, это понять, какого типа отношения обозначают его грани. Это, пожалуй, даже более важно, чем понимание, что обозначают вершины. В SNA сущности, обозначаемые вершинами, обычно всегда будут людьми, а вот 99% всех метрик графа будут сильно зависеть от его граней. Поэтому, если изменяется измеряемое отношение, изображаемое гранями, метрики также будут меняться.

Например, простейшей метрикой графа является степень центральности (degree centrality), показывающая, сколько связей есть у вершины. Так, всего существует 7 черных граней (рисунок 2a), т.е. у меня есть 7 друзей. При этом красных граней всего 5 (рисунок 2b), т.е. у меня 5 коллег. Моя степень центральности на графе собутыльников равна 3 (рисунок 2c), у мня всего 3 собутыльника. Степень центральности может быть посчитана для всех людей на графе. Например, степень центральности Райана на графе партнеров по бадминтону равна 2 (рисунок 2d).

Читать еще:  Анализ использования рабочей силы

Интерпретация метрик графа также зависит от взаимосвязи граней. Так, мы не можем узнать о том, сколько у меня коллег, глядя на граф друзей (рисунок 2a), потому что отношения с коллегами по работе не отображаются на графе друзей. И даже если мы предположим, что каждый, с кем я работаю, становится моим другом, опираясь только на граф друзей, мы можем только сказать, что у меня может быть любое число коллег, от нуля до семи. Поэтому, никогда не делайте выводов или заключений о существующих отношениях, основываясь на графе, в котором эти отношения не выражены явным образом в его гранях. Поступая так, вы будете просто гадать по кофейной гуще или делать случайные предположения.

В следующих публикациях на примере конкретных живых данных мы попробуем применить методы социально-сетевого анализа для выявления и измерения социального влияния внутри социальных сетей.

Сетевой анализ: методы для решения актуальных задач

С 24 по 28 июля в Москве состоялась восьмая международная летняя школа «Теория и методы сетевого анализа», организованная Международной лабораторией прикладного сетевого анализа НИУ ВШЭ для студентов и исследователей. В ее работе принял участие научный руководитель лаборатории Стэнли Вассерман из Университета Индианы.

«Сетевой анализ отличается от обычной статистики тем, что не предполагает независимости между наблюдениями. Как раз наоборот, он позволяет найти взаимоотношения там, где обычная статистика бессильна — между как минимум парами взаимосвязанных наблюдений, — говорит заведующая Международной лабораторией прикладного сетевого анализа Валентина Кускова. — Мы не только анализируем единицы, на которых собраны данные, но и находим связи между ними. Именно поэтому сетевые методы сильнее, чем простая аналитика: они в себя включают возможность реляционного (то есть отношенческого) подхода к анализу данных и позволяют формировать более глубокую картину происходящего, будь то анализ влияния блогеров на своих подписчиков или восприятие в обществе новой инициативы государства».

В программу летней школы были включены три компонента: теоретический (сетевая теория и теория сетей), методологический (методы анализа и программное обеспечение для анализа сетевых данных) и прикладной. Знания теории и методологии тут же использовались для разработки исследовательских проектов в зависимости от научных интересов участников. Например, старший преподаватель факультета экономики Нижегородского кампуса ВШЭ Татьяна Николаева собирается применять сетевой анализ в исследованиях сферы туризма, аспирант того же факультета Анастасия Еремина — в исследованиях государственных и муниципальных закупок.

Стэнли Вассерман, научный руководитель Международной лаборатории прикладного сетевого анализа НИУ ВШЭ

«Участники школы работали над различными проектами, связанными с сетевыми измерениями, — рассказывает Стэнли Вассерман. — Например, один проект был посвящен анализу рынка труда и проблеме поиска работы с точки зрения сетевого влияния — проще говоря, знаете ли вы людей, которые могут помочь вам получить работу. Другой рассматривал сетевое влияние на беременных женщин в Африке и их пищевое поведение. Будут ли женщины правильно питаться и принимать витамины, чтобы иметь здоровых детей, из-за социального влияния, которое их друзья оказывают на них, или нет? Сетевая информация — это все про отношения».

Читать еще:  Анализ деятельности организации

«Это уже четвертая школа по сетевому анализу, в которой я участвую, — говорит доцент факультета социальных наук ВШЭ Дмитрий Зайцев. — Методы, о которых здесь шла речь, я применяю в политических исследованиях. В отличие от традиционных статистических методов, которые применяются в политологии, — регрессии, корреляции и других, — сетевой анализ не редуцирует сложность социальных явлений. В ряде случае для политологов, социологов и других исследователей это единственная возможность подтвердить или опровергнуть те или иные гипотезы».

«Сейчас я провожу исследование, посвященное медиа-эффектам, и возникла идея использовать в нем сетевой анализ, которым я раньше вообще не занималась, — рассказывает заместитель декана факультета социальных наук ВШЭ Айгуль Мавлетова. — Благодаря летней школе я поняла, как это можно сделать. Идея исследования в том, чтобы выявить влияние медиа на политические аттитюды и политическое поведение студентов, и не только напрямую, но и через социальные сети индивида, через его круг общения. Без сетевого анализа здесь не обойтись».

В этом году Международная лаборатория прикладного сетевого анализа впервые набирает студентов на англоязычную магистерскую программу «Прикладная статистика с методами сетевого анализа», созданную по подобию образовательной программы по прикладной статистике в Университете Индианы. Слушатели программы смогут получить комплексные знания в области статического анализа данных и сетевого анализа. Программа подходит для специалистов из разных областей знаний: социологии, менеджмента, политологии и многих других социальных областей, где специалисты хотели бы научиться применять анализ данных, в том числе сетевых, для решения актуальных задач.

«Часто бакалаврские программы по нематематическим дисциплинам не дают достаточного инструментария — только общее понимание статистики, которого в практической деятельности оказывается недостаточно, — говорит Валентина Кускова. — Программа подойдет и математикам, но не всем — тем, кто хочет углубить свои навыки в области машинного обучения, например, нужно идти на ФКН, тем есть отличные программы. Но математики, которые хотели бы научиться ставить правильно задачи для решения в области консалтинга, например, будут у нас очень успешны: математические программы подготовки не учат ставить исследовательский вопрос, и этот пробел мы поможем восполнить».

«Наша новая магистерская программа шире, чем просто сетевой анализ, и включает в том числе и традиционную статистику, — говорит Стэнли Вассерман. — Программа подойдет людям, которые хотели бы углубиться в статистический анализ для решения реальных проблем. Она позволит им выйти на качественно новый профессиональный уровень и откроет новые карьерные возможности. Спрос на специалистов по работе с количественными данными в современном мире продолжает расти».

Подать документы на программу можно по 16 августа включительно. Условия поступления можно найти на сайте программы.

Ссылка на основную публикацию
Adblock
detector