Анализ социальных сетей — это междисциплинарная практика, которая находится на стыке разных наук, в частности науки
об обществе, науки о сетевой анализ, теории графов, искусственного интеллекта, информационного поиска, маркетинга.
Сетевой анализ заключается в решении проблем сети, структуру которой можно объяснить с помощью теории графов.
Теория графов составляет собой набор абстрактных понятий и методов для анализа графов. Сочетание всех этих отраслей знаний.
с аналитическими методами и другими методами, разработанные для анализа и отображения анализа социальных сетей, представляют основу методов социального анализа в целом.
Изучение общества с точки зрения изучения индивидуума, находящегося в сетевых связях позволяет найти
логические объяснения поведения лиц, выявить закономерности, нельзя сделать при исследовании только одной человека. Благодаря развитию компьютерно-вычислительной техники и современных технологий, для анализа общества и общественных явлений открылись новые перспективы и возможности. Ряд вопросов, которые нельзя было решить раньше, стали доступными для изучения.
Сетевой анализ stickeroid нашел применение за пределами науки об обществе. Методы сетевого анализа позволили изучать Интернет-трафик, распространения информации. Например, в бизнесе анализ сетей используют для улучшение информационного потока, правоохранительные органы для выявления террористических сетей, социальные сети — для рекомендации потенциальных друзей и тому подобное.
Рассмотрим подробнее анализ социальных сетей таких, как Facebook, Twitter, LinkedIn, Google+, GitHub и тому подобное. при анализе данных социальных сетей возникает ряд проблем:
1. Конфиденциальность персональных данных.
2. Ограничение доступа и количества запросов.
3. Необходимость в структуризации данных.
По направлениям анализа социальных сетей, то можно выделить следующие:
1. Анализ текстовой информации.
2. Идентификация пользователя в различных сетях.
3. Рекомендации контента, товаров, услуг.
4. Прогнозирование поведения пользователя.
5. Поиск сообществ, списки друзей пользователя.
6. Установление скрытых атрибутов.
7. Определение ложных профилей и таких, которые несут угрозу обществу.
Социальные сети классифицируют на два типа: социоцентрические (полные) и эгоцентричны (личные). социоцентрические представляют собой связи всех элементов закрытой популяции, сфокусированные на рассмотрении больших групп людей, а эгоцентричны — связи отдельных личностей.
Рассмотрим основные метрики анализа социальных сетей.
Плотность — одна из метрик, который представляет собой отношение числа имеющихся ребр графа к максимально возможной количества ребр данного графа. Данный измерение часто используется для сравнения графов одного размера.
Коэффициент кластеризации — некоторая оценка фрагментированности сети.
Близость — это измерение, показывает скорость передачи информации от одного узла к другим, связанных с
ним, узлов.
Централизация — разница между количеством ссылок для каждого узла, деленная на максимально возможную сумму разниц.
Новизна данного проекта заключается в выявлении закономерностей в поведении пользователей социальных сетей, прогнозировании поведения на основе методов Data Mining. А также открытии новых гипотез о поведении пользователей, групп пользователей. Система должна базироваться на математических моделях и методах интеллектуального анализа и обрабатывать большие массивы данных. Дальнейшего исследования требует проблема сбора информации, построения моделей получения данных и использования методов, которые позволят установить связи, закономерности между большими массивами данных, получаемых из социальных сетей, построение алгоритмов для решения новых задач.
Благодаря визуальным средствам, информация становится более доступной для понимания. Важным является создание алгоритмов, сочетают в себе не только методы анализа, но и наглядно визуализируют информацию и улучшают понимание структуры и динамики сети.