¿Puede un algoritmo predecir el futuro de un político con solo analizar sus tweets? | Karina Petrova, PsyPost Un nuevo modelo estadístico ha clasificado con éxito a los miembros del Congreso de los Estados Unidos en distintos grupos políticos y legislativos basándose únicamente en sus patrones de interacción en la plataforma de redes sociales X. Publicado en el Journal of Computational and Graphical Statistics, el estudio también identificó un pequeño número de valores atípicos cuyo comportamiento en línea parecía indicar ambiciones de un cargo más alto. Los políticos utilizan plataformas públicas para comunicar sus principios y posturas políticas a los votantes. Más allá de las declaraciones formales, muchos también cultivan una marca personal a través de sus elecciones de lenguaje y estilo. Con una gran cantidad de mensajes políticos que ahora ocurren en línea, los investigadores han estado investigando cómo los funcionarios electos se posicionan al asociarse estratégicamente con otros en su coalición. El nuevo estudio fue realizado por Benjamin Leinwand, profesor asistente de ciencias matemáticas en el Instituto de Tecnología Stevens, y Vince Lyzinski, profesor de matemáticas en la Universidad de Maryland. Se especializan en ciencia de redes, un campo que analiza las conexiones dentro de sistemas complejos. Buscaron determinar si un modelo podría deducir la estructura subyacente de una red política observando solo las interacciones, sin recibir ninguna información sobre afiliaciones políticas o a qué cámara del Congreso pertenece un miembro. Para comprender el panorama social del Congreso, los investigadores necesitaban una herramienta que pudiera trazar la compleja red de interacciones en línea. En esencia, cualquier modelo estadístico de este tipo intenta calcular un valor simple para cada par de individuos: la probabilidad de que se conecten. Esto produce un plano de la red, que muestra qué conexiones son probables y cuáles no. Algunos modelos de red ampliamente utilizados abordan esta tarea combinando algunos factores clave. Por ejemplo, un modelo podría estimar la probabilidad de una conexión multiplicando el puntaje de "sociabilidad" individual de una persona por un puntaje que represente qué tan interactivo es su grupo. Este método funciona bien en muchos escenarios, pero puede fallar en redes con variaciones extremas. El problema surge en comunidades densamente conectadas donde unos pocos individuos son excepcionalmente activos. En tales casos, el modelo podría asignar puntuaciones de sociabilidad muy altas a estas personas activas y una puntuación de interacción alta a su grupo. Cuando estos puntajes altos se multiplican, la probabilidad resultante puede exceder 1 o 100 por ciento. Esta es una imposibilidad matemática que indica que el modelo no representa con precisión la dinámica social subyacente. El nuevo modelo desarrollado por Leinwand y Lyzinski se basa en una base matemática diferente diseñada específicamente para evitar este problema. Sus cálculos internos están construidos de una manera que garantiza que el resultado final para cualquier par de políticos sea siempre una probabilidad válida, un número entre 0 y 1. Esto garantiza que el modelo produzca un mapa coherente y lógico de la red, incluso en sus regiones más activas y complejas. Más allá de la prevención de errores, este nuevo enfoque ofrece una mayor flexibilidad. No asume que los patrones de conexión son los mismos en toda la red. Por ejemplo, algunos modelos pueden suponer implícitamente que los miembros más activos socialmente de un grupo tienen más probabilidades de conectarse con los miembros más activos de otro. El nuevo modelo, sin embargo, puede detectar patrones más intrincados. Podría, por ejemplo, encontrar una situación en la que los miembros moderados de dos partidos políticos diferentes interactúen con frecuencia, mientras que los miembros más partidistas de esos mismos partidos interactúan muy poco. También puede reconocer que la tendencia de un individuo a formar conexiones puede cambiar según la comunidad con la que interactúa, proporcionando un retrato más detallado y realista de la comunicación política. Usando este modelo, Leinwand y Lyzinski analizaron la actividad pública de 475 miembros del 117º Congreso de los Estados Unidos. Su conjunto de datos incluyó a todos los miembros que publicaron al menos 100 tweets durante un período de cuatro meses, desde el 9 de febrero de 2022 hasta el 9 de junio de 2022. El modelo definía una conexión entre dos políticos cualesquiera si uno de ellos tuiteaba o retuiteaba al otro durante este período de tiempo. "Llamamos a dos personas 'conectadas', si uno de los dos tuiteó al otro o retuiteó al otro durante este período", explicó Leinwand. El modelo no recibió ninguna información sobre el partido de un político, su cámara o sus posiciones políticas. Se le encomendó la tarea de clasificar a los 475 individuos en grupos basados únicamente en la red de sus conexiones digitales. El modelo identificó tres comunidades principales. Estos grupos definidos algorítmicamente seguían líneas políticas familiares. El primer grupo estaba compuesto casi en su totalidad por senadores. La segunda comunidad consistía principalmente en miembros demócratas de la Cámara de Representantes, y la tercera estaba compuesta en gran parte por miembros republicanos de la Cámara. El análisis mostró que los políticos dentro de estos tres grupos tendían a interactuar con mayor frecuencia con miembros de su propia comunidad. "Los congresistas republicanos hablaban mucho entre ellos, y los congresistas demócratas hablaban mucho entre ellos, aunque los congresistas demócratas eran algo más propensos a interactuar con los senadores que sus contrapartes republicanas", dijo Leinwand. Ofreció una posible explicación para este patrón. En el momento de la observación, los demócratas tenían la mayoría en el Senado. Como resultado, "uno podría imaginar que los congresistas demócratas podrían verse incentivados a amplificar los mensajes de liderazgo del Senado además de sus aliados en la Cámara", continuó. ...