Kan een algoritme de toekomst van een politicus voorspellen alleen door hun tweets te analyseren? | Karina Petrova, PsyPost Een nieuw statistisch model heeft met succes leden van het Amerikaanse Congres ingedeeld in verschillende politieke en wetgevende groepen, uitsluitend op basis van hun interactiepatronen op het sociale mediaplatform X. Gepubliceerd in het Journal of Computational and Graphical Statistics, identificeerde de studie ook een klein aantal uitschieters wiens online gedrag leek te signaleren dat ze ambities voor hogere functies hadden. Politici gebruiken openbare platforms om hun principes en beleidsstandpunten aan kiezers te communiceren. Naast formele verklaringen cultiveren velen ook een persoonlijk merk door hun keuzes in taal en stijl. Aangezien een groot deel van de politieke communicatie nu online plaatsvindt, hebben onderzoekers onderzocht hoe gekozen functionarissen zich positioneren door strategisch associaties aan te gaan met anderen in hun coalitie. De nieuwe studie werd uitgevoerd door Benjamin Leinwand, een assistent-professor wiskundige wetenschappen aan het Stevens Institute of Technology, en Vince Lyzinski, een wiskundeprofessor aan de Universiteit van Maryland. Ze zijn gespecialiseerd in netwerkwetenschap, een veld dat de verbindingen binnen complexe systemen analyseert. Ze wilden bepalen of een model de onderliggende structuur van een politiek netwerk kon afleiden door alleen de interacties te observeren, zonder enige informatie over politieke affiliaties of bij welke kamer van het Congres een lid hoort. Om het sociale landschap van het Congres te begrijpen, hadden de onderzoekers een hulpmiddel nodig dat het complexe web van online interacties kon in kaart brengen. In wezen probeert elk dergelijk statistisch model een eenvoudige waarde te berekenen voor elk paar individuen: de kans dat ze met elkaar in contact komen. Dit produceert een blauwdruk van het netwerk, die laat zien welke verbindingen waarschijnlijk zijn en welke niet. Sommige veelgebruikte netwerkmodes benaderen deze taak door een paar belangrijke factoren te combineren. Een model kan bijvoorbeeld de kans op een verbinding schatten door de individuele "sociabiliteit" score van een persoon te vermenigvuldigen met een score die vertegenwoordigt hoe interactief hun groep is. Deze methode werkt goed in veel scenario's, maar kan falen in netwerken met extreme variaties. Het probleem doet zich voor in dicht verbonden gemeenschappen waar een paar individuen uitzonderlijk actief zijn. In dergelijke gevallen kan het model zeer hoge sociabiliteitsscores toekennen aan deze actieve mensen en een hoge interactiescore aan hun groep. Wanneer deze hoge scores met elkaar worden vermenigvuldigd, kan de resulterende kans 1 of 100 procent overschrijden. Dit is een wiskundige onmogelijkheid die aangeeft dat het model niet in staat is om de onderliggende sociale dynamiek nauwkeurig weer te geven. Het nieuwe model ontwikkeld door Leinwand en Lyzinski is gebaseerd op een andere wiskundige basis die specifiek is ontworpen om dit probleem te vermijden. De interne berekeningen zijn zo geconstrueerd dat de uiteindelijke output voor elk paar politici altijd een geldige kans is, een getal tussen 0 en 1. Dit zorgt ervoor dat het model een samenhangende en logische kaart van het netwerk produceert, zelfs in de meest actieve en complexe gebieden. Naast het voorkomen van fouten biedt deze nieuwe benadering meer flexibiliteit. Het gaat er niet van uit dat de patronen van verbindingen hetzelfde zijn in het hele netwerk. Sommige modellen kunnen bijvoorbeeld impliciet aannemen dat de meest sociaal actieve leden van de ene groep het meest waarschijnlijk contact hebben met de meest actieve leden van een andere. Het nieuwe model kan echter meer complexe patronen detecteren. Het zou bijvoorbeeld een situatie kunnen vinden waarin gematigde leden van twee verschillende politieke partijen vaak met elkaar omgaan, terwijl de meest partijdige leden van diezelfde partijen heel weinig interactie hebben. Het kan ook herkennen dat de neiging van een individu om verbindingen te vormen kan veranderen, afhankelijk van de gemeenschap waarmee ze interageren, wat een gedetailleerder en realistischer beeld van politieke communicatie biedt. Met dit model analyseerden Leinwand en Lyzinski de publieke activiteit van 475 leden van het 117e Amerikaanse Congres. Hun dataset omvatte elk lid dat gedurende een periode van vier maanden, van 9 februari 2022 tot 9 juni 2022, minstens 100 tweets had geplaatst. Het model definieerde een verbinding tussen twee politici als een van hen de ander had getweet of geretweet tijdens deze periode. "We noemen twee mensen 'verbonden', als een van de twee in het paar de ander heeft getweet of de ander heeft geretweet tijdens deze periode," legde Leinwand uit. Het model kreeg geen informatie over de partij van een politicus, hun kamer of hun beleidsposities. Het was de taak om de 475 individuen in groepen in te delen op basis van het web van hun digitale verbindingen. Het model identificeerde drie primaire gemeenschappen. Deze algoritmisch gedefinieerde groepen vielen langs bekende politieke lijnen. De eerste groep bestond bijna volledig uit senatoren. De tweede gemeenschap bestond voornamelijk uit Democratische leden van het Huis van Afgevaardigden, en de derde bestond grotendeels uit Republikeinse leden van het Huis. De analyse toonde aan dat politici binnen deze drie groepen de neiging hadden om het meest frequent te interageren met leden van hun eigen gemeenschap. "Republikeinse congresleden praatten veel onder elkaar, en Democratische congresleden praatten veel onder elkaar, hoewel Democratische congresleden iets waarschijnlijker waren om met senatoren te interageren dan hun Republikeinse tegenhangers," zei Leinwand. Hij bood een mogelijke verklaring voor dit patroon. Op het moment van de observatie hadden de Democraten de meerderheid in de Senaat. Als gevolg daarvan "zou men zich kunnen voorstellen dat Democratische congresleden mogelijk worden aangemoedigd om de boodschap van de senaatsleiding te versterken, naast hun bondgenoten in het Huis," vervolgde hij. ...