Сравнительный анализ мер центральности для выявления ключевых агентов в сети региональных маркетинговых сообществ

 
Аудио генерируется искусственным интеллектом
 113 мин. чтения

Резюме

В статье представлен сравнительный анализ базовых мер центральности (центральность степени, близости, промежуточности, собственного вектора, PageRank, центральность по Кацу) для определения влиятельных агентов в сети региональных маркетинговых сообществ. Исследование выполнено на основе данных маркетинговых сообществ г. Архангельска, собранных через API платформы «ВКонтакте». Анализ показал, что сеть обладает выраженной кластерной структурой и наличием узлов-хабов, обеспечивающих её связность. На основе распределений центральности проведена оценка устойчивости сети маркет-сообществ, выявлены группы ключевых узлов, играющих значимую роль в распространении информации.

Общая информация

Ключевые слова: социальное влияние, меры центральности, сетевой анализ, маркетинговые сообщества, анализ устойчивости сети

Рубрика издания: Анализ данных

Тип материала: научная статья

DOI: https://doi.org/10.17759/mda.2025150201

Поступила в редакцию 18.03.2025

Принята к публикации

Опубликована

Для цитаты: Антонов, А.В., Стирманова, Р.С. (2025). Сравнительный анализ мер центральности для выявления ключевых агентов в сети региональных маркетинговых сообществ. Моделирование и анализ данных, 15(2), 7–26. https://doi.org/10.17759/mda.2025150201

© Антонов А.В., Стирманова Р.С., 2025

Лицензия: CC BY-NC 4.0

Полный текст

Введение

В различных ситуациях, требующих принятия решений, выбор, осуществляемый индивидами, часто основывается на информации, поступающей от их окружения [Jackson]. Таким окружением может быть семья, сверстники, коллеги по работе, средства массовой информации и другие источники. Так, исследование [Гегель] показало, что 40% старшеклассников ориентируются на мнение семьи при выборе профессии, 22% – на школу, а 13% – на сверстников.

Влияние окружения распространяется и на другие сферы, например принятие решений о покупках. Отзывы друзей, рекомендации в соцсетях и лидеры мнений могут существенно повлиять на поведение потребителей [Berger; Chevalier; Iyengar]. Это особенно важно в маркетинге, где информация о брендах и акциях формирует потребительские предпочтения. Понимание этих механизмов необходимо для разработки эффективных стратегий продвижения.

Интересный пример влияния социальной группы на индивидуальное поведение был представлен в эксперименте, описанном в работе [Milgram], в ходе которого исследователи попросили группы испытуемых различного размера (от одного до пятнадцати человек) встать на улице и смотреть в небо. Эксперимент показал, что влияние группы на поведение усиливается с увеличением её размера: один человек, смотрящий в небо, почти не привлекал внимания, несколько человек – немного больше, а группа из 15 человек заставляла 45% прохожих остановиться и смотреть вверх.

Исследование [Padgett] показало, что центральное положение в социальной сети, как у семьи Медичи в эпоху Возрождения, способствует успеху в политике. Их доминирование стало возможным благодаря сети брачных и деловых связей, что подчеркивает важность социальных связей для достижения влияния и успеха.

Необходимость определения влиятельных (важных) узлов в сетях возникает в различных задачах: ранжирования поисковых запросов (например, алгоритм PageRank [Полякова], который был предложен Google в конце 1990-х годов, что вместе с развитием сети Интернет положило начало активному изучению мер центральности [Центральность в социальных] как эффективному инструменту для анализа структуры сетей), работы рекомендательных систем [Дьяконов], анализа распространения инфекций, слухов или мнений [Утакаева], а также оценки устойчивости информационных сетей [Волков].

В социальных сетях определение ключевых акторов имеет особое значение для понимания поведения системы и формирования эффективных стратегий взаимодействия. От этого зависит способность предсказать последствия различных действий, таких, как распространение информации, влияние на общественное мнение или реакции на маркетинговые кампании.

Целью данной работы является сравнительный анализ различных мер центральности для задачи обнаружения влиятельных агентов в сети региональных маркет-сообществ. Для достижения этой цели проводится обзор популярных метрик, таких как степень центральности, посредничество, близость, собственный вектор, PageRank и центральность по Кацу. Ожидается, что результаты анализа помогут выбрать наиболее эффективную меру центральности для выявления ключевых агентов, влияющих на распространение информации в маркет-сообществах.

Основная часть

Меры центральности

В литературе по сетевому анализу для оценки значимости узлов используются четыре базовые характеристики, каждая из которых отражает тот или иной аспект положения узла в сети [Jackson]:

− степень узла;

− близость узла;

− промежуточность узла;

− важность соседей узла.

Степень узла отражает, насколько связан узел с соседями, близость – насколько просто некоторому узлу добраться до других в сети, промежуточность – насколько связующим является узел в сети, а важность соседей узла – насколько важны (влиятельны) его соседи.

В анализе социальных сетей очень часто для обнаружения наиболее влиятельных акторов используются индексы (меры) центральности. Существуют более 400 различных индексов центральности [Центральность в социальных]. Некоторые из них требуют учета локальных характеристик узла для количественной оценки его важности, к таким мерам относится, например, центральность степени. Другие индексы используют глобальную информацию обо всей сети – это центральность близости, посредничества, собственного вектора, центральность по Кацу, PageRank и другие.

Центральность степени

Изначально степенная центральность возникла в теории графов. Степенью вершины в графе G называется количество ребер, инцидентных вершине v. Данная мера центральности является базовой и для ненаправленных невзвешенных сетей определяется как:

 

C D ( v ) = k v n 1

(1)

где k v – степень вершины v, n – количество узлов в графе, а 1 n 1 – нормировочный множитель. Условие нормировки позволяет сравнивать центральности узлов, принадлежащих к разным сетям, независимо от их размера.
Степенная центральность распространяется и на взвешенные сети. Для ее определения во взвешенных сетях используется понятие силы узла. Сила узла s v определяется как сумма весов ребер w vu инцидентных вершине v:

 

s v = u w vu

(2)

Во взвешенных сетях степенная центральность учитывает как силу узлов s v , так и их степень k v и определяется как [Opsahl]:

 

C D ( v ) = k v ( 1 α ) s v α

(3)

Параметр α ( 0 ,1 ) в данном определении позволяет придать большую значимость степени узла, а α > 1 придает большее значение силе. Выбор точного значения параметра зависит от конкретных требований и его определение может быть затруднено. Метод выбора оптимального значения параметра был предложен в статье [Wei].

Центральность близости

Центральность близости (closeness centrality) показывает, насколько удален данный узел сети от остальных. Данный индекс центральности является величиной, обратной среднему расстоянию от некоторого узла в сети до всех остальных. Для заданного узла v она определяется как [Freeman]:

 

C C ( v ) = n 1 u , u v d ( u , v )

(4)

где d – функция расстояния в графе (количество ребер на кратчайшем пути) между узлами u и v, n – количество узлов в сети, а множитель n-1 нормирует размер графа. Суммирование осуществляется по всем узлам сети u за исключением v. Поскольку путь между любыми двумя вершинами u и v существует только для связных графов, то и данное определение центральности применимо только к ним. Существует также расширение этого типа центральности на взвешенные сети. В них центральность узла v определяется как:

 

C C w ( v ) =

(5)

где v – вершина, для которой рассчитывается центральность, а d w ( u , v ) – кратчайшее взвешенное расстояния между узлами u и v.
Поскольку не существует пути между любой парой узлов из различных связных компонент графа, то и функция расстояния для узлов из различных компонент не определена, а значит для использования индекса (4) в контексте несвязных сетей можно изменить представление сети таким образом, чтобы расстояние между узлами из различных компонент было определенным. В статье [Latora] для описания сети помимо матрицы смежности ( a ij ) использовалась матрица расстояний ( l ij ) таким образом, чтобы для соответствующих элементов обоих матриц выполнялось равенство d ij l ij . Элементами матрицы ( l ij ) могут быть, например, географические расстояния между вершинами в случае транспортных сетей. В общем случае расстояния такой матрицы рассчитываются на основе дополнительной информации о той или иной предметной области, что может вызывать некоторые затруднения.

Центральность промежуточности

В основе центральности промежуточности (betweenness centrality) лежит предположение о том, что информация всегда проходит по кратчайшим путям между вершинами, а ее расчет основан на количестве таких кратчайших путей, на которых расположена вершина. Центральность промежуточности определяется как [Freeman]:

 

C B ( v ) = s v t σ st ( v ) σ st

(6)

где σ st ( v ) – обозначает количество кратчайших путей между вершинами s и t, проходящих через вершину v, а σ st – общее количество таких кратчайших путей между соответствующей парой вершин. Для нормализованного индекса центральности промежуточности будет выполняться соотношение:

 

C B ( v ) = 2 s v t σ st ( v ) σ st ( n 1 ) ( n 2 ) 2

(7)

где число в знаменателе – это максимальное количество путей в графе порядка n, проходящих через узел v.

Вычисление индекса промежуточности сопряжено с высокими вычислительными сложностями и требует времени порядка O ( n 3 ) , так как для каждой пары узлов s , t V в графе G требуется расчет общего количество кратчайших путей, проходящих через узел σ st ( v ) , v V . Более быстрый метод вычисления данного индекса был предложен в [Wei] и занимает время порядка O ( nm + n 2 log n ) и память порядка O ( n + m ) как для взвешенных, так и для невзвешенных сетей.

Центральности на основе собственного вектора (спектральные)

Центральность на основе собственного вектора является обобщением степенной центральности. При этом, если центральность степени назначает одинаковую важность соседям узла, что для измерения важности узлов в социальных сетях может оказаться недостаточным, то центральность собственного вектора назначает соседям узла различную значимость. Вследствие этого, узел, связанный с очень важными узлами, сам становится важным:

 

C E ( v ) = α u n ( v ) C E ( u )

(8)

где α – коэффициент пропорциональности, u , v V – узлы сети, n ( v ) – множество соседей узла v. В матричной форме данное определение вводится с использованием понятия собственного вектора [Newman]:

 

Ax = λx

(9)

где λ – наибольшее собственное значение, а x – ведущий собственный вектор матрицы смежности A. Согласно [Bonacich] центральность C E ( x i ) узла соответствует i-ому компоненту собственного вектора x.
В свою очередь, центральность по Кацу является расширением центральности собственного вектора, добавляя в выражение (10) параметр β , назначающий небольшое значение важности всем узлам:

 

C K ( v ) = α u n ( v ) C K ( u ) + β

(11)

 

Ax = λx

(12)

 

α 1 λ

(13)

где α – коэффициент затухания, обычно выбираемый меньше самого большого собственного значения λ матрицы смежности A (12), а β – константа смещения.

Еще одним примером данного типа центральностей является центральность PageRank. Данный тип центральности основан на модели случайного блуждания и определяется как:

 

C PR ( v ) = α j C PR ( v ) k out v + β

(14)

PageRank используется в библиометрии, анализе социальных и информационных сетей, дорожных сетей и во многих других приложениях.

Материалы и методы

В работе использовались данные сети маркет-сообществ города Архангельска с аудиторией от 500 человек до 100 тыс. человек, собранные посредством API онлайн-платформы «Вконтакте». Из-за ограничений поиска на количество возвращаемых результатов, для импорта данных было определено 14 категорий ключевых слов, представленных в таблице 1. Результирующий набор данных был агрегирован в единый csv-файл и очищен от дубликатов. Сеть региональных сообществ строилась на основе графа G ( V , E ) , где V – множество маркет-сообществ города Архангельска, E = { ( u , v ) : J ( u , v ) > 0.01 , u , v V } – связи между сообществами, оцененные с помощью коэффициента Жаккара J [Чижова], измеряющего общность подписчиков маркет-сообществ. Следует отметить, что аналогичные исследования авторы сейчас проводят и для других регионов, что позволяет выявить особенности и различия в структуре маркет-сообществ в зависимости от географического расположения и социально-экономической специфики регионов.

Таблица 1 / Table 1

Категории ключевых слов

Keyword categories

Ключевые слова / Keywords

Количество сообществ / Number of communities

1. Магазин, товары, продажа, купить, каталог, аксессуар, прайс, опт, розница, скидки, распродажа, интернет-магазин, заказ, доставка, услуги, мастер-класс, обучение, курсы, консультация, аренда, ремонт, красота, салон / 1. Shop, goods, sale, buy, catalog, accessory, price list, wholesale, retail, discounts, sale, online store, order, delivery, services, master class, training, courses, consultation, rent, repair, beauty, salon

3409

2. Одежда, обувь, аксессуары, стиль, мода, бренд, джинсы, футболки, шубы, пальто, сумки, рюкзаки, украшения, ювелирные изделия, часы, ремни, шарфы, перчатки, одежда больших размеров, секонд-хенд, винтаж / 2. Clothing, shoes, accessories, style, fashion, brand, jeans, T-shirts, fur coats, coats, bags, backpacks, jewelry, jewelry, watches, belts, scarves, gloves, plus-size clothing, second-hand, vintage

1529

3. Электроника, телефоны, смартфоны, планшеты, компьютеры, ноутбуки, бытовая техника, гаджеты, оргтехника, аксессуары для техники, наушники, телевизоры, видеокамеры, игровые консоли, игровые устройства, ремонт техники, Apple, Android / 3. Electronics, phones, smartphones, tablets, computers, laptops, household appliances, gadgets, office equipment, accessories for appliances, headphones, televisions, video cameras, game consoles, gaming devices, repair of appliances, Apple, Android

839

4. Мебель, декор, интерьер, посуда, текстиль, ковры, обои, шторы, лампы, осветительные приборы, кухонные принадлежности, бытовая химия, садовая техника, сад, огород, инструменты / 4. Furniture, decor, interior, tableware, textiles, carpets, wallpaper, curtains, lamps, lighting, kitchen utensils, household chemicals, gardening equipment, garden, vegetable garden, tools

684

5. Косметика, парикмахерская, уход, макияж, парфюмерия, уход за кожей, маникюр, педикюр, волосы, витамины, спорт, фитнес, массаж, SPA, йога, плавание, бассейн, здоровый образ жизни, медицинские услуги, диета, натуральные продукты, татуировки, пирсинг / 5. Cosmetics, hairdressing, grooming, makeup, perfumes, skin care, manicure, pedicure, hair, vitamins, sports, fitness, massage, SPA, yoga, swimming, pool, healthy lifestyle, medical services, diet, natural products, tattoos, piercing

1624

6. Игрушки, коляски, детская одежда, товары для малышей, детская мебель, конструкторы, настольные игры, рюкзаки для школы, книги для детей, обучение для детей, кружки, секции, репетиторы / 6. Toys, strollers, children's clothing, baby products, children's furniture, construction kits, board games, backpacks for school, books for children, education for children, clubs, sections, tutors

1387

7. Еда, продукты, напитки, доставка еды, фермерские продукты, экотовары, выпечка, кондитерские изделия, торты на заказ, пироги, рестораны, сеть ресторанов, кафе, сеть кафе, столовая, чай, кофе, конфеты, доставка обедов, здоровое питание, пекарня, хлеб, рыба / 7. Food, groceries, drinks, food delivery, farm products, eco-products, pastries, confectionery, cakes to order, pies, restaurants, restaurant chain, cafe, cafe chain, canteen, tea, coffee, sweets, lunch delivery, healthy food, bakery, bread, fish

1138

8. Рукоделие, handmade, DIY, вязание, вышивка, шитьё, рисование, творчество, арт, декупаж, скрапбукинг, фотография, видеосъёмка, музыка, танцы, мастер-класс, вокал / 8. Needlework, handmade, DIY, knitting, embroidery, sewing, drawing, creativity, art, decoupage, scrapbooking, photography, videography, music, dancing, master class, vocals

1322

9. Спорт, спортивное питание, снаряжение, бег, тренажёры, фитнес, плавание, бассейн, велоспорт, велосипед, туризм, кемпинг, альпинизм, охота, рыбалка, спортивное снаряжение, лыжи, сноуборд, активный отдых, теннис, яхта, яхтклуб, скалолазание, ролики, волейбол, каток, коньки, скейтборд, хоккей, футбол, баскетбол, турник, брусья, гимнастика, бокс, бодибилдинг, пауэрлифтинг, настольный теннис, большой теннис, физические упражнения, горнолыжный / 9. Sports, sports nutrition, equipment, running, fitness equipment, fitness, swimming, pool, cycling, cycling, hiking, camping, mountaineering, hunting, fishing, sports equipment, skiing, snowboarding, outdoor activities, tennis, yacht, yacht club, rock climbing, roller skates, volleyball, ice rink, ice skating, skateboard, hockey, football, basketball, horizontal bar, uneven bars, gymnastics, boxing, bodybuilding, powerlifting, table tennis, lawn tennis, physical exercises, skiing

1006

10. Авто, автомобили, автозапчасти, мотоциклы, велосипеды, аксессуары для авто, аренда авто, грузоперевозки, ремонт авто, тюнинг, электросамокаты, скутеры, запчасти / 10. Auto, cars, auto parts, motorcycles, bicycles, car accessories, car rental, cargo transportation, car repair, tuning, electric scooters, scooters, spare parts

585

11. Подарки, сувениры, цветы, праздничные услуги, организация мероприятий, воздушные шары, украшения, кейтеринг, фотограф, видеооператор, ведущий, тамада, фейерверк, салют, декор для праздников / 11. Gifts, souvenirs, flowers, holiday services, event management, balloons, decorations, catering, photographer, videographer, presenter, toastmaster, fireworks, fireworks, holiday decor

1009

12. Обучение, курсы, репетиторство, мастер-классы, вебинары, онлайн-школы, языковые курсы, повышение квалификации, подготовка к экзаменам, карьерное консультирование, тренинги, программирование / 12. Training, courses, tutoring, workshops, webinars, online schools, language courses, advanced training, exam preparation, career counseling, trainings, programming

770

13. Зоотовары, корм для животных, аквариумы, аквариумные рыбки, аксессуары для животных, одежда для собак, уход за животными, ветеринарные услуги, дрессировка, гостиницы для животных, кошки, собаки, питомцы / 13. Pet supplies, pet food, aquariums, aquarium fish, animal accessories, dog clothes, animal care, veterinary services, training, animal hotels, cats, dogs, pets

287

14. Кино, театры, концерты, билеты, квесты, экскурсии, парки, клубы, игровые центры, настольные игры, настолки, видеоигры, туризм, путешествия, квизы / 14. Movies, theaters, concerts, tickets, quests, excursions, parks, clubs, game centers, board games, board games, video games, tourism, travel, quizzes

628

Для обнаружения сообществ нами использовался лувенский метод. Меры центральности рассчитывались с использованием библиотеки NetworkX и языка программирования Python (версия 3.8). Визуализация сети и распределения мер центральности проводились с помощью matplotlib, seaborn и средств визуализации с открытым исходным кодом Gephi.

Результаты

Построенная нами сеть включает 2269 сообществ. Плотностью сети G ( V , E ) является величина E E E max , равная отношению количества фактических связей в исходной сети к полносвязной сети с тем же количеством узлов V . Плотность сети маркет-сообществ составляет 0.3211. Распределение весов ребер представлено на рис. 1.
 
Рис. 1

Рис. 1. Распределение весов ребер

Fig. 1. Distribution of edge weights

Высокая плотность сети обусловлена величиной коэффициента Жаккара J > 0.01 . Большая часть ребер имеет низкий коэффициент J. Влияние величины порога на изменение количества ребер в сети, порядка, плотности и количества сообществ в гигантской связной компоненте (ГСК) позволило определить его допустимые значения для сохранения целостности ГСК (рис. 2).
Рис. 2

Рис. 2. Влияние порога на структуру сети

Fig. 2. The effect of the threshold on the network structure

Отметим, что связной компонентой графа G называется максимальный связный подграф  H G графа G [Харари], гигантской связной компонентой – наибольший из таких подграфов H ^ = max g G ( g ) . Для определения допустимого порога использовалось 20 значений 0.01 t i 0.2 , t i + 1 = t i + 0.01 . По графикам (рис. 2) видно, что при увеличении от 0.01 t i 0.1 количество ребер уменьшается экспоненциально, порядок гигантской связной компоненты линейно, при этом на интервале t i ( 0.05 ; 0.1 ) плотность ГСК «выходит на плато». Количество сообществ, обнаруженных лувенским методом в ГСК при 0.025 t i 0.07 , сохраняется на одном уровне, а после 0.07 начинает быстро убывать. Плотность ГСК при значениях порога 0.125 < t i 0.2 начинает быстро возрастать, а количество сообществ – убывает.
В таблице 2 приведены основные статистические величины сети маркет-сообществ с J 0.07 . Результат обнаружения сообществ лувенским методом представлен на рис. 3. Для укладки графа использовался алгоритм ForceAtlas3D. Цвет узлов обозначает их принадлежность к обнаруженным кластерам, размер – количество подписчиков сообществ.

Таблица 2 / Table 2

Характеристики сети маркет-сообществ

Characteristics of a network of market communities

Характеристики сети / Network Characteristics

Значения / Values

Модулярность / Modularity

0.53

Количество узлов / Number of nodes

942

Количество ребер / Number of edges

10648

Средняя степень / The average degree

22.607

Средняя взвешенная степень / Weighted average degree

1.957

Плотность / Density

0.024

Количество треугольников / Number of triangles

95398

Коэффициент кластеризации / Clusterization coefficient

0.436

В таблице 3 отражены доли узлов в кластерах.

Таблица 3 / Table 3

Доли узлов в кластерах

Shares of nodes in clusters

Номер кластера / Cluster Number

1

2

3

4

5

Доля узлов, % / The proportion of nodes, %

27.39

22.51

16.45

14.12

11.46

Модулярность исследуемой сети составляет 0.53, что свидетельствует о наличии выраженной кластерной структуры. В сети 942 узла и 10648 рёбер. Средняя степень узлов равна 22.607, следовательно, каждое из маркет-сообществ имеет пересекающуюся аудиторию с более чем 22 другими. Средняя взвешенная степень составляет 1.957. Плотность сети, равная 0.024, говорит о её разреженности, поскольку из всех возможных связей реализована лишь малая их часть. Сеть характеризуется высокой степенью кластеризации: коэффициент кластеризации равен 0.436, количество треугольников в сети достигает 95398, что указывает на тенденцию к триадическому замыканию, типичному для социальных сетей с сильными внутренними связями. Средняя длина пути составляет 3.722, что свидетельствует о высокой связности сети, несмотря на ее разреженность.

 
Рис. 3

Рис. 3. Сеть маркет-сообществ

Fig. 3. Network of market communities

На рис. 4 представлены распределения значений центральности степени, собственного вектора, центральности по Кацу, промежуточности, близости и PageRank.

 
Рис. 4

Рис. 4. Распределения индексов центральности

Fig. 4. Distributions of centrality indices

По распределению степенной центральности видно, что большинство узлов обладают низкой степенью, в то время как небольшое количество узлов имеет высокие значения центральности. Это свидетельствует о наличии хабов, обеспечивающих связность сети. Для центральности близости распределение имеет форму с пиком в центральной части, близкую к графику нормального распределения. Это говорит о том, что узлы сети находятся в среднем на схожем расстоянии от других, что может указывать на относительную равномерность структуры без выраженной иерархии. Центральность собственного вектора характеризуется сильным перекосом распределения, где большинство узлов имеют низкие значения. Это указывает на то, что значимыми в сети являются лишь несколько узлов, которые связаны с другими высокоцентральными узлами. Такая структура характерна для сетей с выраженными лидерами. Распределение центральности по Кацу схоже с предыдущей метрикой и демонстрирует то, что влияние в сети сосредоточено вокруг небольшой группы узлов. Центральность промежуточности показывает крайне асимметричное распределение: подавляющее большинство узлов имеют нулевые или низкие значения, и лишь немногие выступают в роли «мостов» между различными частями сети. Наконец, центральность PageRank демонстрирует перекос, характерный для сетей с распределением с «тяжелыми хвостами».

В качестве примера наиболее центральных сообществ в таблице 4 представлены результаты по пяти сообществам наиболее центральными по Кацу и PageRank.

Таблица 4 / Table 4

Показатели мер центральностей

Indicators of centrality measures

Название группы / Group name

Количество подписчиков / Number of subscribers

Показатель / Indicator

Центральность по Кацу / Katz centrality

1

Ремонт ванных комнат в Архангельске «Уют Центр»

1471

0.174894

2

Фотограф Евгения Кожина Архангельск-Северодвинск

1376

0.141196

3

Superburg - бургеры, роллы, хот-доги, чиабатта

1495

0.138296

4

Натуральная косметика Savonry в Архангельске

857

0.136912

5

ТОРТ✿*♡MARy CAKe♡*✿ на заказ АРХАНГЕЛЬСК

4426

0.134763

PageRank

1

Ремонт ванных комнат в Архангельске «Уют Центр»

1471

0.008269

2

Кафе - кондитерская «Венский пекарь»

12556

0.005481

3

ТОРТ✿*♡MARy CAKe♡*✿ на заказ АРХАНГЕЛЬСК

4426

0.005430

4

Фотограф Евгения Кожина Архангельск-Северодвинск

1376

0.005309

5

Натуральная косметика Savonry в Архангельске

857

0.005221

По данным таблицы 4 прослеживается корреляция между различными индексами центральности. Корреляционная матрица (таблица 5) отражает взаимосвязь между индексами, используемыми при выявлении ключевых агентов.

Таблица 5 / Table 5

Корреляционная матрица индексов центральности

Correlation matrix of centrality indices

Центральность / Centrality

C D
C C
C B
C E
C PR
C K
C D

1

0.72086

0.61648

0.843130

0.95324

0.93246

C C

0.72086

1

0.47175

0.62388

0.61611

0.70260

C B

0.61648

0.47175

1

0.42489

0.69391

0.50089

C E

0.84313

0.62388

0.42489

1

0.71343

0.97634

C PR

0.95324

0.61611

0.69391

0.71343

1

0.81805

C K

0.93246

0.70260

0.50089

0.97634

0.81805

1

Высокая корреляция между центральностью собственного вектора, центральностью по Кацу и PageRank указывает на высокую глобальную значимость обнаруженных маркет-сообществ в структуре сети. Эти узлы, вероятно, имеют устойчивые связи с другими важными участниками и играют ключевую роль в формировании ядра сети. Низкие значения корреляции центральности промежуточности с другими мерами (0.42−0.69) отражают её уникальность: узлы, обнаруженные данной мерой, влияют на процессы распространения информации в сети.

На основе распределений центральности проведена оценка устойчивости сети при удалении наиболее центральных узлов по сравнению со случайным удалением (рис. 5). Поскольку исходная сеть совпадает с размером ГСК, то в начальный момент ее размер совпадает со всей сетью и равен 1.0.

 
Рис. 5

Рис. 5. Результат теста устойчивости сети маркет-сообществ

Fig. 5. The result of the stability test of the network of market communities

При рандомизированном выборе узлов для удаления – относительный размер гигантской связной компоненты линейно зависит от числа удаленных узлов. Напротив, при выборе наиболее центральных узлов сеть распадается (таблица 6).

Таблица 6 / Table 6

Устойчивость сети

Network stability

При удалении / When deleting

Network stability

C D
C C
C B
C E
C PR
C K

20% узлов / 20% of nodes

0.65393

0.66454

0.59660

0.68471

0.62314

0.64756

40% узлов / 40% of nodes

0.06794

0.16561

0.22399

0.38854

0.02447

0.19745

Сеть оказалась наиболее уязвимой при выборе центральных по PageRank узлов для удаления. Количество узлов в исходной сети составляло 952, а при удалении примерно 40% узлов в соответствии с центральностью степени и PageRank сеть стала почти фрагментированной. Удаление узлов в соответствии с центральностью собственного вектора меньше всего влияет на структуру сети (0.68 для 20% и 0.39 для 40%) по сравнению с остальными.

Устойчивость сети маркет-сообществ тесно связана с выбором стратегии удаления узлов. Наиболее критичными для её структуры являются более важные по PageRank узлы. Эти узлы, вероятно, играют ключевую роль в распространении информации через сеть, а их удаление значительно снижает её функциональность.

Обсуждение результатов

Ключевыми маркетинговыми сообществами, вовлеченными в распространение информации в сети, с точки зрения ее структуры оказались относительно небольшие (по количеству подписчиков) сообщества. Наиболее центральные сообщества преимущественно имеют праздничную тематику. Анализ устойчивости показал относительно высокую надежность сети (полная фрагментация достигается при удалении свыше 40% узлов), а при удалении 20% наиболее центральных узлов сохраняется от 0.59 (в случае центральности промежуточности) до 0.68 (в случае центральности собственного вектора).

Заключение

В статье проведен обзор базовых мер центральности, включающих центральность степени, близости, посредничества, собственного вектора, центральности по Кацу, PageRank. Построена сеть маркет-сообществ города Архангельска на основе данных онлайн-платформы социальных сетей ВКонтакте. Определены допустимые значения коэффициента Жаккара.

Анализ распределений центральности показал, что, как и в большинстве социальных сетей, в сети маркет-сообществ преобладают низкостепенные узлы и лишь небольшой процент узлов выступает в роли хабов. На основе распределений центральности, проведена оценка устойчивости сети маркет-сообществ. Показано, что данная сеть оказалась наименее устойчивой при использовании центральности PageRank, а наиболее устойчивой – при использовании центральности собственного вектора.

Полученные результаты подтверждают ключевую роль хабов в социальных сетях. Оценка устойчивости сети при использовании той или иной меры центральности может быть использована для измерения степени влияния в социальных сетях. В дальнейшем исследовании предполагается использование выявленных ключевых игроков для моделирования стратегического взаимодействия в задаче дележа сети как неоднородного ресурса.

Ограничения. В исследовании рассматриваются сообщества, предоставляющие данные о подписчиках, однако, существуют сообщества, в которых подписчики скрыты - такие сообщества не учтены в сети, что может несколько исказить реальную структуру сети. При фильтрации ребер использовалась простейшая эвристика на основе связности гигантской связной компоненты, в дальнейшем можно использовать более сложные методы (например, фильтр диспаритета).

Limitations. The research considers communities that provide data on subscribers, however, there are communities in which subscribers are hidden - such communities are not taken into account in the network, which can somewhat distort the real structure of the network. When filtering edges, the simplest heuristics based on the connectivity of a giant connected component were used, in the future, more complex methods can be used (for example, a disparity filter).

Литература

  1. Berger, J., Milkman, K. L. (2012). What Makes Online Content Viral? Journal of Marketing Research, 49, № 2, 192-205.
  2. Bonacich, P. F. (1987) Power and Centrality: A Family of Measures. American Journal of Sociology, Vol. 92, 1170-1182.
  3. Brandes, U. A (2001). Faster Algorithm for Betweenness Centrality. Journal of Mathematical Sociology, Vol. 25, № 2, 163-177.
  4. Chevalier, J. A., Mayzlin, D. (2006). The Effect of Word of Mouth on Sales: Online Book Reviews. Journal of Marketing Research, Vol. 43, № 3, 345-354.
  5. Freeman, L. C. (1978). Centrality in Social Networks Conceptual Clarification. Social Networks, Vol. 1, № 3, 215-239.
  6. Iyengar, R., Van den Bulte, C., Valente, T. W. (2011). Opinion Leadership and Social Contagion in New Product Diffusion. Marketing Science, Vol. 30, № 2, 195-212.
  7. Jackson, M. (2010). Social and Economic Networks. Princeton: Princeton University Press, 520 p.
  8. Latora, V., Marchiori, M. (2001). Efficient Behavior of Small-World Networks. Physical Review Letters, Vol. 87, № 19, 198701.
  9. Milgram, S., Bickman, L., Berkowitz, L. (1969). Note on the Drawing Power of Crowds of Different Size. Journal of Personality and Social Psychology, Vol. 13, № 2, 79-82.
  10. Newman, M. (2010). Networks. Oxford: Oxford University Press.
  11. Opsahl, T., Agneessens, F., Skvoretz, J. (2010). Node Centrality in Weighted Networks: Generalizing Degree and Shortest Paths. Social Networks, Vol. 32, № 3, 245-251.
  12. Padgett, J. F., Ansell, C. K. (1993). Robust Action and the Rise of the Medici, 1400–1434. American Journal of Sociology, Vol. 98, № 6, 1259-1319.
  13. Wei, D., Li, Y., Zhang, Y., Deng, Y. (2012). Degree Centrality Based on the Weighted Network. Control and Decision Conference (CCDC), IEEE, 3976-3979.
  14. Волков, Д. В., Саенко, И. Б., Старков А. М., Султанбеков, А. Т. (2018). Оценка устойчивости сети передачи данных в условиях деструктивных воздействий. Известия Тульского государственного университета. Технические науки, № 12, 358-363. 
    Volkov, D. V., Saenko, I. B., Starkov, A. M., Sultanbekov, A. T. (2018). Assessment of network resilience under destructive impacts. Izvestiya TulGU. Technical Sciences, No. 12, 358–363.
  15. Гегель, Л. А., Бабочкина, С. П. (2010). Влияние социальных факторов на выбор профессии учащихся старших классов общеобразовательных школ. Социально-гуманитарные знания, № 5, 79-85. 
    Gegel, L. A., Babochkina, S. P. Influence of social factors on career choice of high school students. Social and Humanitarian Knowledge, No. 5, 79–85.
  16. Дьяконов, А. Г. (2012). Алгоритмы для рекомендательной системы: технология LENKOR. Бизнес-информатика, № 1(19), 32-39. 
    Dyakonov, A. G. (2012). Algorithms for recommendation systems: LENKOR technology. Business Informatics, No. 1(19), 32–39.
  17. Полякова, О. С., Подлесный, А. О. (2013). PageRank. Алгоритм ссылочного ранжирования. Наука и современность, № 20, 154-157. 
    Polyakova, O. S., Podlesny, A. O. (2013). PageRank: Link ranking algorithm. Science and Modernity, No. 20, 154–157.
  18. Утакаева, И. Х. (2020). Моделирование распространения инфекционных заболеваний в социальных сетях. Самоуправление, Т. 2, № 2(119), 559-564. 
    Utakaeva, I. Kh. (2020). Modeling the spread of infectious diseases in social networks. Self-Governance, Vol. 2, No. 2(119), 559–564.
  19. Харари, Ф. (2003). Теория графов : пер. с англ.; ред. Гаврилов Г. П. ; пер. Козырев В. П. – 2-е изд. – М. : Едиториал УРСС, 300 с. : ил. – Библиогр.: с. 268-286. 
    Harary, F. (2003). Graph Theory : Transl. from English; by V. P. Kozyrev; edited by G. P. Gavrilov. – 2nd ed. – Moscow: Editorial URSS, 300 p. – Bibliography: Pp. 268–286.
  20. Чижова, Л.А., Тутыгин, А. Г., Стирманова, Р. С. (2024). Сетевые молодежные сообщества в социокультурном пространстве северного региона: методологические и эмпирические аспекты исследования. Вестник Российского университета дружбы народов. Серия: Социология, Т. 24, №4, 1033-1051.
    Chizhova, L.A., Tutygin, A.G., Stirmanova, R.S. (2024). Network Youth Communities in the Socio-Cultural Space of the Northern Region: Methodological and Empirical Aspects of the Study. Bulletin of the Russian University of Friendship of Peoples. Series: Sociology, Vol. 24, No. 4, 1033-1051.
  21. Центральность в социальных сетях [Электронный ресурс] // CentiServer. – URL: https://centiserver.ir/centrality/list/ (дата обращения: 20.12.2024).
    Centrality in Social Networks [Electronic resource] // CentiServer. – Available at: https://centiserver.ir/centrality/list/ (accessed: 20.12.2024).

Информация об авторах

Анатолий Владимирович Антонов, магистрант кафедры высшей и прикладной математики, Северный (Арктический) федеральный университет им. М.В. Ломоносова, Архангельск, Российская Федерация, ORCID: https://orcid.org/0009-0009-0187-2410, e-mail: s3519008@edu.narfu.ru

Раиса Станиславовна Стирманова, аспирант кафедры высшей и прикладной математики, Северный (Арктический) федеральный университет им. М.В. Ломоносова, Архангельск, Российская Федерация, ORCID: https://orcid.org/0000-0001-9819-0890, e-mail: r.s.stirmanova@gmail.com

Метрики

 Просмотров web

За все время: 141
В прошлом месяце: 43
В текущем месяце: 9

 Скачиваний PDF

За все время: 39
В прошлом месяце: 2
В текущем месяце: 0

 Всего

За все время: 180
В прошлом месяце: 45
В текущем месяце: 9