Может ли алгоритм предсказать будущее политика, просто анализируя его твиты? | Карина Петрова, PsyPost Новая статистическая модель успешно распределила членов Конгресса США по различным политическим и законодательным группам, основываясь исключительно на их паттернах взаимодействия на платформе социальных медиа X. Опубликованное в Журнале вычислительной и графической статистики, исследование также выявило небольшое количество аутсайдеров, чье онлайн-поведение, похоже, сигнализировало о стремлении к более высоким должностям. Политики используют публичные платформы для передачи своих принципов и политических позиций избирателям. Помимо официальных заявлений, многие также формируют личный бренд через свои выборы в языке и стиле. Поскольку значительная часть политического общения теперь происходит в интернете, исследователи изучают, как избранные должностные лица позиционируют себя, стратегически ассоциируясь с другими в своей коалиции. Новое исследование было проведено Бенджамином Лейнвандом, доцентом математических наук в Институте технологий Стивенса, и Винсом Лизински, профессором математики в Университете Мэриленда. Они специализируются на сетевой науке, области, которая анализирует связи в сложных системах. Они стремились определить, может ли модель вывести основную структуру политической сети, наблюдая только за взаимодействиями, без предоставления какой-либо информации о политических принадлежностях или о том, к какой палате Конгресса принадлежит член. Чтобы понять социальный ландшафт Конгресса, исследователям нужен был инструмент, который мог бы картографировать сложную сеть онлайн-взаимодействий. В своей основе любая такая статистическая модель пытается вычислить простое значение для каждой пары индивидов: вероятность того, что они свяжутся. Это создает чертеж сети, показывающий, какие связи вероятны, а какие нет. Некоторые широко используемые сетевые модели подходят к этой задаче, комбинируя несколько ключевых факторов. Например, модель может оценить вероятность связи, умножая индивидуальный «социальный» балл человека на балл, представляющий, насколько интерактивна их группа. Этот метод хорошо работает во многих сценариях, но может дать сбой в сетях с экстремальными вариациями. Проблема возникает в плотно связанном сообществе, где несколько индивидов особенно активны. В таких случаях модель может присвоить очень высокие баллы «социальности» этим активным людям и высокий балл взаимодействия их группе. Когда эти высокие баллы умножаются, полученная вероятность может превышать 1 или 100 процентов. Это математическая невозможность, которая сигнализирует о том, что модель не может точно представить основные социальные динамики. Новая модель, разработанная Лейнвандом и Лизински, основана на другой математической основе, специально разработанной для избежания этой проблемы. Ее внутренние вычисления построены таким образом, чтобы гарантировать, что конечный результат для любой пары политиков всегда является действительной вероятностью, числом от 0 до 1. Это обеспечивает модели создание последовательной и логичной карты сети, даже в ее самых активных и сложных регионах. Помимо предотвращения ошибок, этот новый подход предлагает большую гибкость. Он не предполагает, что паттерны связи одинаковы по всей сети. Например, некоторые модели могут неявно предполагать, что наиболее социально активные члены одной группы с наибольшей вероятностью свяжутся с наиболее активными членами другой. Однако новая модель может обнаруживать более сложные паттерны. Она могла бы, например, обнаружить ситуацию, когда умеренные члены двух разных политических партий часто взаимодействуют, в то время как наиболее партийные члены этих же партий взаимодействуют очень мало. Она также может распознать, что склонность индивида к формированию связей может изменяться в зависимости от сообщества, с которым он взаимодействует, предоставляя более детальный и реалистичный портрет политической коммуникации. Используя эту модель, Лейнванд и Лизински проанализировали публичную активность 475 членов 117-го Конгресса США. Их набор данных включал каждого члена, который опубликовал как минимум 100 твитов в течение четырехмесячного периода с 9 февраля 2022 года по 9 июня 2022 года. Модель определила связь между любыми двумя политиками, если один из них твитнул или ретвитнул другого в этот период. «Мы называем двух людей «связанными», если один из пары твитнул другому или ретвитнул другого в этот период», - объяснил Лейнванд. Модель не была обеспечена никакой информацией о партии политика, их палате или их политических позициях. Ей было поручено распределить 475 индивидов по группам, основываясь только на сети их цифровых связей. Модель выявила три основные сообщества. Эти алгоритмически определенные группы располагались вдоль знакомых политических линий. Первая группа состояла почти полностью из сенаторов. Вторая община состояла в основном из демократических членов Палаты представителей, а третья в значительной степени состояла из республиканских членов Палаты. Анализ показал, что политики в этих трех группах, как правило, взаимодействовали чаще всего с членами своей собственной общины. «Республиканские конгрессмены много общались между собой, а демократические конгрессмены тоже много общались между собой, хотя демократические конгрессмены были несколько более склонны взаимодействовать с сенаторами, чем их республиканские коллеги», - сказал Лейнванд. Он предложил возможное объяснение этой модели. На момент наблюдения демократы имели большинство в Сенате. В результате «можно представить, что демократические конгрессмены могли быть мотивированы усиливать сообщения руководства Сената в дополнение к своим союзникам в Палате», - продолжил он. ...