Bisakah algoritma memprediksi masa depan seorang politisi hanya dengan menganalisis tweet mereka? | Karina Petrova, PsyPost Model statistik baru telah berhasil menyortir anggota Kongres AS ke dalam kelompok politik dan legislatif yang berbeda hanya berdasarkan pola interaksi mereka di platform media sosial X. Diterbitkan dalam Journal of Computational and Graphical Statistics, studi ini juga mengidentifikasi sejumlah kecil outlier yang perilaku onlinenya tampaknya menandakan ambisi untuk jabatan yang lebih tinggi. Politisi menggunakan platform publik untuk mengkomunikasikan prinsip dan sikap kebijakan mereka kepada pemilih. Di luar pernyataan formal, banyak juga yang menumbuhkan merek pribadi melalui pilihan bahasa dan gaya mereka. Dengan banyak pesan politik yang sekarang terjadi secara online, para peneliti telah menyelidiki bagaimana pejabat terpilih memposisikan diri mereka dengan berasosiasi secara strategis dengan orang lain dalam koalisi mereka. Studi baru ini dilakukan oleh Benjamin Leinwand, asisten profesor ilmu matematika di Stevens Institute of Technology, dan Vince Lyzinski, seorang profesor matematika di University of Maryland. Mereka mengkhususkan diri dalam ilmu jaringan, bidang yang menganalisis koneksi dalam sistem yang kompleks. Mereka berusaha untuk menentukan apakah sebuah model dapat menyimpulkan struktur yang mendasari jaringan politik dengan hanya mengamati interaksi, tanpa diberi informasi apa pun tentang afiliasi politik atau kamar Kongres mana yang dimiliki seorang anggota. Untuk memahami lanskap sosial Kongres, para peneliti membutuhkan alat yang dapat memetakan jaringan interaksi online yang kompleks. Pada intinya, model statistik semacam itu mencoba menghitung nilai sederhana untuk setiap pasangan individu: probabilitas bahwa mereka akan terhubung. Ini menghasilkan cetak biru jaringan, menunjukkan koneksi mana yang mungkin dan mana yang tidak. Beberapa model jaringan yang banyak digunakan mendekati tugas ini dengan menggabungkan beberapa faktor kunci. Misalnya, model mungkin memperkirakan probabilitas koneksi dengan mengalikan skor "sosialitas" individu seseorang dengan skor yang mewakili seberapa interaktif kelompok mereka. Metode ini bekerja dengan baik dalam banyak skenario, tetapi dapat rusak dalam jaringan dengan variasi ekstrem. Masalah ini muncul di komunitas yang terhubung padat di mana beberapa individu sangat aktif. Dalam kasus seperti itu, model mungkin memberikan skor sosialisasi yang sangat tinggi untuk orang-orang aktif ini dan skor interaksi yang tinggi untuk kelompok mereka. Ketika skor tinggi ini dikalikan bersama, probabilitas yang dihasilkan dapat melebihi 1, atau 100 persen. Ini adalah ketidakmungkinan matematis yang menandakan model gagal secara akurat mewakili dinamika sosial yang mendasarinya. Model baru yang dikembangkan oleh Leinwand dan Lyzinski dibangun di atas fondasi matematika berbeda yang dirancang khusus untuk menghindari masalah ini. Perhitungan internalnya dibangun sedemikian rupa yang menjamin hasil akhir untuk pasangan politisi mana pun selalu merupakan probabilitas yang valid, angka antara 0 dan 1. Ini memastikan model menghasilkan peta jaringan yang koheren dan logis, bahkan di wilayah yang paling aktif dan kompleks. Selain mencegah kesalahan, pendekatan baru ini menawarkan fleksibilitas yang lebih besar. Itu tidak mengasumsikan bahwa pola koneksi sama di seluruh jaringan. Misalnya, beberapa model mungkin secara implisit mengasumsikan bahwa anggota yang paling aktif secara sosial dari satu kelompok kemungkinan besar terhubung dengan anggota yang paling aktif dari kelompok lain. Model baru, bagaimanapun, dapat mendeteksi pola yang lebih rumit. Misalnya, ia dapat menemukan situasi di mana anggota moderat dari dua partai politik yang berbeda sering berinteraksi, sementara anggota yang paling partisan dari partai yang sama berinteraksi sangat sedikit. Itu juga dapat mengenali bahwa kecenderungan individu untuk membentuk koneksi dapat berubah tergantung pada komunitas yang berinteraksi dengan mereka, memberikan potret komunikasi politik yang lebih rinci dan realistis. Dengan menggunakan model ini, Leinwand dan Lyzinski menganalisis aktivitas publik 475 anggota Kongres AS ke-117. Himpunan data mereka mencakup setiap anggota yang memposting setidaknya 100 tweet selama periode empat bulan, dari 9 Februari 2022 hingga 9 Juni 2022. Model tersebut mendefinisikan hubungan antara dua politisi jika salah satu dari mereka men-tweet atau me-retweet yang lain selama jangka waktu ini. "Kami menyebut dua orang 'terhubung', jika salah satu dari pasangan itu men-tweet yang lain atau me-retweet yang lain selama periode ini," jelas Leinwand. Model tersebut tidak diberikan informasi apa pun tentang partai politisi, kamar mereka, atau posisi kebijakan mereka. Itu ditugaskan untuk menyortir 475 individu ke dalam kelompok hanya berdasarkan jaringan koneksi digital mereka. Model ini mengidentifikasi tiga komunitas utama. Kelompok-kelompok yang didefinisikan secara algoritmik ini berada di sepanjang garis politik yang sudah dikenal. Kelompok pertama hampir seluruhnya terdiri dari Senator. Komunitas kedua sebagian besar terdiri dari anggota Dewan Perwakilan Rakyat dari Partai Demokrat, dan yang ketiga sebagian besar terdiri dari anggota DPR dari Partai Republik. Analisis menunjukkan bahwa politisi dalam ketiga kelompok ini cenderung paling sering berinteraksi dengan anggota komunitas mereka sendiri. "Anggota kongres Partai Republik banyak berbicara di antara mereka sendiri, dan anggota kongres Demokrat banyak berbicara di antara mereka sendiri, meskipun anggota kongres Demokrat agak lebih mungkin berinteraksi dengan Senator daripada rekan-rekan Republik mereka," kata Leinwand. Dia menawarkan penjelasan potensial untuk pola ini. Pada saat pengamatan, Demokrat memegang mayoritas di Senat. Akibatnya, "orang dapat membayangkan bahwa anggota kongres Demokrat mungkin diberi insentif untuk memperkuat pesan kepemimpinan senat selain sekutu mereka di DPR," lanjutnya. ...