Стукал Д.К., Филиппов И.Б., Беленков В.Е. Методы наук о данных в политических исследованиях: анализ протестной активности в социальных сетях = Data science methods in political science research: analyzing protest activity in social media

Рубрика: Состояние дисциплины

Авторы:
Стукал Д.К.
Филиппов И.Б.
Беленков В.Е.

Скачать полный текст

Загрузить номер целиком

Аннотация

Появление и рост популярности социальных сетей, а также растущая цифровизация, проникающая в разнообразные сферы экономики и общества, оказали существенное влияние на сферу политики в целом и на процессы политической мобилизации и коммуникации в частности. Методологический арсенал политической науки также оказался затронут указанными трансформационными процессами и начал пополняться новыми подходами и методами, предложенными в рамках недавно возникшей области знания, получившей название наук о данных. В статье предложен обзор ключевых инноваций в методологии исследований политической мобилизации в социальных сетях, которые были заимствованы из области наук о данных. Авторы подробно рассматривают методы обучения с учителем и без учителя и обсуждают их применимость для автоматизированного сбора данных в почти реальном времени и анализа собранных данных о протестной активности. В контексте методов обучения с учителем особое внимание уделяется методам преодоления переобучения с помощью регуляризации и выбору гиперпараметров с помощью кросс-валидации. В рамках обучения без учителя рассматриваются методы тематического моделирования и методы анализа социальных сетей. Преимущества и недостатки обсуждаемых методов иллюстрируются примерами из современных политических исследований, опубликованных в ведущих рецензируемых журналах. В заключение обсуждаются новейшие методные разработки наук о данных, до сих пор не получившие своего применения в исследованиях политической мобилизации, обладающие высоким аналитическим потенциалом (включая методы с частичным обучением, использование машинного обучения для каузального анализа и использование векторного представления текстов). 

Abstract

The advent of social media and increased digitization of social processes have had a dramatic impact on politics and, particularly, on political mobilization and communication. The political science methodology and toolkit have also adapted to these changes and absorbed a variety of new approaches and methods from the burgeoning field of data science. This paper provides an overview of some of the key methodological innovations to the political science toolkit drawn from data science and discusses the advantages and limitations of these new methods for studying protest activity and political mobilization in social media. We focus on supervised and unsupervised learning as two major groups of methods that can be applied to either facilitate data collection in almost real time or the analysis of big data on protest activity. We discuss overfitting, regularization, and hyperparameter selection via cross-validation in the context of supervised methods, and present topic modeling and social network analysis techniques within unsupervised methods. The strengths and weaknesses of these methods are illustrated with references to recent articles published in peerreviewed journals. We conclude the paper with a discussion of the emerging methods that have not been used in political mobilization research yet and are open for further exploration by political scientists. 

Ключевые слова

политическая мобилизация; протесты; социальные сети; машинное обучение; науки о данных; обучение с учителем; обучение без учителя; вычислительные социальные науки

Keywords

political mobilization; protest; social media; machine learning; data science; supervised learning; unsupervised learning; computational social sciences