Un algorithme peut-il prédire l'avenir d'un politicien simplement en analysant ses tweets ? | Karina Petrova, PsyPost Un nouveau modèle statistique a réussi à classer les membres du Congrès américain en groupes politiques et législatifs distincts uniquement sur la base de leurs schémas d'interaction sur la plateforme de médias sociaux X. Publiée dans le Journal of Computational and Graphical Statistics, l'étude a également identifié un petit nombre d'outliers dont le comportement en ligne semblait signaler des ambitions pour un poste plus élevé. Les politiciens utilisent des plateformes publiques pour communiquer leurs principes et leurs positions politiques aux électeurs. Au-delà des déclarations formelles, beaucoup cultivent également une image personnelle à travers leurs choix de langage et de style. Avec une grande partie des messages politiques se déroulant désormais en ligne, les chercheurs ont enquêté sur la manière dont les élus se positionnent en s'associant stratégiquement à d'autres membres de leur coalition. La nouvelle étude a été menée par Benjamin Leinwand, professeur adjoint de sciences mathématiques à l'Institut de technologie Stevens, et Vince Lyzinski, professeur de mathématiques à l'Université du Maryland. Ils se spécialisent dans la science des réseaux, un domaine qui analyse les connexions au sein de systèmes complexes. Ils ont cherché à déterminer si un modèle pouvait déduire la structure sous-jacente d'un réseau politique en observant uniquement les interactions, sans recevoir d'informations sur les affiliations politiques ou la chambre à laquelle appartient un membre du Congrès. Pour comprendre le paysage social du Congrès, les chercheurs avaient besoin d'un outil capable de cartographier le complexe réseau d'interactions en ligne. Au cœur de tout modèle statistique, on tente de calculer une valeur simple pour chaque paire d'individus : la probabilité qu'ils se connectent. Cela produit une carte du réseau, montrant quelles connexions sont probables et lesquelles ne le sont pas. Certains modèles de réseau largement utilisés abordent cette tâche en combinant quelques facteurs clés. Par exemple, un modèle pourrait estimer la probabilité d'une connexion en multipliant le score de "sociabilité" individuel d'une personne par un score représentant l'interactivité de son groupe. Cette méthode fonctionne bien dans de nombreux scénarios, mais elle peut échouer dans des réseaux avec des variations extrêmes. Le problème se pose dans des communautés densément connectées où quelques individus sont exceptionnellement actifs. Dans de tels cas, le modèle pourrait attribuer des scores de sociabilité très élevés à ces personnes actives et un score d'interaction élevé à leur groupe. Lorsque ces scores élevés sont multipliés ensemble, la probabilité résultante peut dépasser 1, ou 100 pour cent. C'est une impossibilité mathématique qui signale que le modèle ne parvient pas à représenter avec précision les dynamiques sociales sous-jacentes. Le nouveau modèle développé par Leinwand et Lyzinski est construit sur une base mathématique différente spécifiquement conçue pour éviter ce problème. Ses calculs internes sont construits de manière à garantir que la sortie finale pour toute paire de politiciens soit toujours une probabilité valide, un nombre compris entre 0 et 1. Cela garantit que le modèle produit une carte cohérente et logique du réseau, même dans ses régions les plus actives et complexes. Au-delà de la simple prévention des erreurs, cette nouvelle approche offre une plus grande flexibilité. Elle ne suppose pas que les schémas de connexion sont les mêmes dans l'ensemble du réseau. Par exemple, certains modèles pourraient supposer implicitement que les membres les plus socialement actifs d'un groupe sont les plus susceptibles de se connecter avec les membres les plus actifs d'un autre. Le nouveau modèle, cependant, peut détecter des schémas plus complexes. Il pourrait, par exemple, trouver une situation où des membres modérés de deux partis politiques différents interagissent fréquemment, tandis que les membres les plus partisans de ces mêmes partis interagissent très peu. Il peut également reconnaître que la tendance d'un individu à former des connexions peut changer en fonction de la communauté avec laquelle il interagit, fournissant un portrait plus détaillé et réaliste de la communication politique. En utilisant ce modèle, Leinwand et Lyzinski ont analysé l'activité publique de 475 membres du 117e Congrès américain. Leur ensemble de données comprenait chaque membre ayant posté au moins 100 tweets pendant une période de quatre mois, du 9 février 2022 au 9 juin 2022. Le modèle a défini une connexion entre deux politiciens si l'un d'eux a tweeté ou retweeté l'autre pendant cette période. "Nous appelons deux personnes 'connectées', si l'une d'elles a tweeté à l'autre ou retweeté l'autre pendant cette période," a expliqué Leinwand. Le modèle n'a pas reçu d'informations sur le parti d'un politicien, sa chambre ou ses positions politiques. Il avait pour tâche de trier les 475 individus en groupes uniquement sur la base du réseau de leurs connexions numériques. Le modèle a identifié trois communautés principales. Ces groupes définis par algorithme suivaient des lignes politiques familières. Le premier groupe était composé presque entièrement de sénateurs. La deuxième communauté était principalement constituée de membres démocrates de la Chambre des représentants, et la troisième était largement composée de membres républicains de la Chambre. L'analyse a montré que les politiciens au sein de ces trois groupes avaient tendance à interagir le plus fréquemment avec les membres de leur propre communauté. "Les congressistes républicains parlaient beaucoup entre eux, et les congressistes démocrates parlaient beaucoup entre eux, bien que les congressistes démocrates soient quelque peu plus susceptibles d'interagir avec les sénateurs que leurs homologues républicains," a déclaré Leinwand. Il a proposé une explication potentielle pour ce schéma. Au moment de l'observation, les démocrates détenaient la majorité au Sénat. Par conséquent, "on pourrait imaginer que les congressistes démocrates pourraient être incités à amplifier le message du leadership sénatorial en plus de leurs alliés à la Chambre," a-t-il poursuivi. ...