¿Puede un algoritmo predecir el futuro de un político solo analizando sus tweets? | Karina Petrova, PsyPost Un nuevo modelo estadístico ha clasificado con éxito a los miembros del Congreso de EE. UU. en distintos grupos políticos y legislativos basándose únicamente en sus patrones de interacción en la plataforma de redes sociales X. Publicado en el Journal of Computational and Graphical Statistics, el estudio también identificó un pequeño número de outliers cuyo comportamiento en línea parecía señalar ambiciones por un cargo más alto. Los políticos utilizan plataformas públicas para comunicar sus principios y posturas políticas a los votantes. Más allá de las declaraciones formales, muchos también cultivan una marca personal a través de sus elecciones en el lenguaje y el estilo. Con una gran parte de la comunicación política ocurriendo ahora en línea, los investigadores han estado investigando cómo los funcionarios electos se posicionan al asociarse estratégicamente con otros en su coalición. El nuevo estudio fue realizado por Benjamin Leinwand, profesor asistente de ciencias matemáticas en el Stevens Institute of Technology, y Vince Lyzinski, profesor de matemáticas en la Universidad de Maryland. Se especializan en ciencia de redes, un campo que analiza las conexiones dentro de sistemas complejos. Buscaban determinar si un modelo podría deducir la estructura subyacente de una red política observando solo las interacciones, sin recibir información sobre afiliaciones políticas o a qué cámara del Congreso pertenece un miembro. Para entender el paisaje social del Congreso, los investigadores necesitaban una herramienta que pudiera mapear la compleja red de interacciones en línea. En su núcleo, cualquier modelo estadístico intenta calcular un valor simple para cada par de individuos: la probabilidad de que se conecten. Esto produce un plano de la red, mostrando qué conexiones son probables y cuáles no. Algunos modelos de red ampliamente utilizados abordan esta tarea combinando algunos factores clave. Por ejemplo, un modelo podría estimar la probabilidad de una conexión multiplicando la puntuación de "sociabilidad" individual de una persona con una puntuación que representa cuán interactivo es su grupo. Este método funciona bien en muchos escenarios, pero puede fallar en redes con variaciones extremas. El problema surge en comunidades densamente conectadas donde unos pocos individuos son excepcionalmente activos. En tales casos, el modelo podría asignar puntuaciones de sociabilidad muy altas a estas personas activas y una alta puntuación de interacción a su grupo. Cuando estas altas puntuaciones se multiplican, la probabilidad resultante puede superar 1, o el 100 por ciento. Esta es una imposibilidad matemática que indica que el modelo no está logrando representar con precisión la dinámica social subyacente. El nuevo modelo desarrollado por Leinwand y Lyzinski se basa en una fundación matemática diferente diseñada específicamente para evitar este problema. Sus cálculos internos están construidos de tal manera que garantizan que la salida final para cualquier par de políticos sea siempre una probabilidad válida, un número entre 0 y 1. Esto asegura que el modelo produzca un mapa coherente y lógico de la red, incluso en sus regiones más activas y complejas. Más allá de solo prevenir errores, este nuevo enfoque ofrece mayor flexibilidad. No asume que los patrones de conexión son los mismos en toda la red. Por ejemplo, algunos modelos podrían asumir implícitamente que los miembros más socialmente activos de un grupo son los más propensos a conectarse con los miembros más activos de otro. Sin embargo, el nuevo modelo puede detectar patrones más intrincados. Podría, por ejemplo, encontrar una situación donde miembros moderados de dos partidos políticos diferentes interactúan con frecuencia, mientras que los miembros más partidistas de esos mismos partidos interactúan muy poco. También puede reconocer que la tendencia de un individuo a formar conexiones podría cambiar dependiendo de la comunidad con la que esté interactuando, proporcionando un retrato más detallado y realista de la comunicación política. Usando este modelo, Leinwand y Lyzinski analizaron la actividad pública de 475 miembros del 117º Congreso de EE. UU. Su conjunto de datos incluía a cada miembro que publicó al menos 100 tweets durante un período de cuatro meses, desde el 9 de febrero de 2022 hasta el 9 de junio de 2022. El modelo definió una conexión entre dos políticos si uno de ellos tuiteó o retuiteó al otro durante este período. "Llamamos a dos personas 'conectadas', si cualquiera de los dos en el par tuiteó al otro o retuiteó al otro durante este período", explicó Leinwand. El modelo no recibió ninguna información sobre el partido de un político, su cámara o sus posiciones políticas. Se le encargó clasificar a los 475 individuos en grupos basándose únicamente en la red de sus conexiones digitales. El modelo identificó tres comunidades principales. Estos grupos definidos algorítmicamente se alinearon a lo largo de líneas políticas familiares. El primer grupo estaba compuesto casi en su totalidad por senadores. La segunda comunidad consistía principalmente en miembros demócratas de la Cámara de Representantes, y el tercero estaba formado en gran parte por miembros republicanos de la Cámara. El análisis mostró que los políticos dentro de estos tres grupos tendían a interactuar con mayor frecuencia con miembros de su propia comunidad. "Los congresistas republicanos hablaban mucho entre ellos, y los congresistas demócratas hablaban mucho entre ellos, aunque los congresistas demócratas eran algo más propensos a interactuar con senadores que sus contrapartes republicanas", dijo Leinwand. Ofreció una posible explicación para este patrón. En el momento de la observación, los demócratas tenían la mayoría en el Senado. Como resultado, "uno podría imaginar que los congresistas demócratas podrían estar incentivados a amplificar el mensaje del liderazgo del Senado además de sus aliados en la Cámara", continuó. ...