Twitter (X) mengalami gejolak selama dua tahun terakhir. Tahun lalu, Elon Musk membeli platform tersebut seharga $44 miliar dan kemudian merombak staf perusahaan, moderasi konten, model bisnis, dan budaya situs web. Perubahan ini mungkin lebih berkaitan dengan soft power Elon Musk, daripada keputusan kebijakan tertentu. Namun, di tengah tindakan kontroversial ini, sebuah fitur baru di Twitter dengan cepat menjadi penting dan tampaknya disukai oleh orang-orang dari berbagai spektrum politik: Catatan Komunitas.

Catatan Komunitas adalah alat pengecekan fakta yang terkadang menambahkan catatan kontekstual ke tweet, seperti tweet Elon Musk di atas, sebagai alat pengecekan fakta dan kontra-disinformasi. Awalnya bernama Birdwatch dan pertama kali diluncurkan sebagai proyek percontohan pada Januari 2021. Twitter secara bertahap berkembang sejak saat itu, dengan ekspansi paling pesatnya bertepatan dengan pengambilalihan Twitter oleh Elon Musk tahun lalu. Catatan Komunitas muncul secara teratur di antara tweet yang mendapat perhatian luas di Twitter akhir-akhir ini, termasuk tweet yang membahas topik politik kontroversial. Menurut pendapat saya, dan kesimpulan saya setelah berbicara dengan banyak orang dari berbagai spektrum politik, Catatan ini informatif dan berharga sebagaimana terlihat.

Namun, yang paling menarik bagi saya adalah Catatan Komunitas, yang meskipun bukan “proyek kripto” mungkin merupakan contoh terdekat dari “nilai kripto” yang pernah kita lihat di dunia arus utama. Catatan Komunitas tidak ditulis atau dikurasi oleh beberapa pakar yang dipilih secara terpusat, siapa pun dapat menulis dan memberikan suara, dan Catatan mana yang muncul atau tidak ditentukan sepenuhnya oleh algoritme sumber terbuka. Situs web Twitter memiliki panduan terperinci dan komprehensif yang menjelaskan cara kerja algoritme, dan Anda dapat mengunduh data berisi catatan dan jajak pendapat yang dipublikasikan, menjalankan algoritme secara lokal, dan memverifikasi bahwa keluarannya sesuai dengan apa yang terlihat di situs web Twitter. Meskipun tidak sempurna, hal ini ternyata mendekati idealitas netralitas yang dapat dipercaya dalam situasi yang cukup kontroversial, dan pada saat yang sama sangat berguna.

Bagaimana cara kerja algoritma Catatan Komunitas?

Siapa pun yang memiliki akun Twitter yang memenuhi kriteria tertentu (pada dasarnya: aktif lebih dari 6 bulan, tidak ada pelanggaran kebijakan, nomor ponsel terverifikasi) dapat mendaftar untuk berpartisipasi dalam Catatan Komunitas. Saat ini, peserta diterima secara perlahan dan acak, namun pada akhirnya rencananya adalah mengizinkan siapa saja yang memenuhi syarat untuk bergabung. Setelah diterima, Anda dapat berpartisipasi terlebih dahulu dalam memberi peringkat pada Catatan yang ada dan, setelah peringkat Anda cukup baik (diukur dengan melihat peringkat mana yang sesuai dengan hasil akhir Catatan tersebut), Anda juga dapat menulis Catatan Anda sendiri.

Saat Anda menulis Catatan, Catatan tersebut menerima skor berdasarkan ulasan anggota Catatan Komunitas lainnya. Ulasan ini dapat dianggap sebagai penilaian pada tiga tingkat yaitu "membantu", "agak membantu", dan "tidak membantu", namun ulasan juga dapat menyertakan label lain yang berperan dalam algoritme. Berdasarkan ulasan ini, Catatan diberi skor. Jika skor catatan melebihi 0,40, catatan tersebut akan ditampilkan; jika tidak, catatan tersebut tidak akan ditampilkan.

Yang unik dari algoritme ini adalah cara penghitungan skornya. Berbeda dengan algoritme sederhana, yang dirancang hanya untuk menghitung sejumlah atau rata-rata penilaian pengguna dan menggunakannya sebagai hasil akhir, algoritme pemeringkatan Catatan Komunitas secara eksplisit mencoba memprioritaskan catatan yang mendapat ulasan positif dari orang-orang dengan perspektif berbeda. Artinya, jika orang-orang yang biasanya tidak setuju dengan penilaian akhirnya menyetujui suatu Catatan tertentu, Catatan tersebut akan diberi peringkat tinggi.

Mari kita lihat lebih dekat cara kerjanya. Kami memiliki sekumpulan pengguna dan sekumpulan Catatan; kita dapat membuat matriks M di mana sel Mij mewakili bagaimana pengguna ke-i menilai Catatan ke-j.

Untuk Catatan tertentu, sebagian besar pengguna belum memberi peringkat pada Catatan tersebut, jadi sebagian besar entri dalam matriks akan bernilai nol, tapi tidak apa-apa. Tujuan dari algoritme ini adalah untuk membuat model pengguna dan Catatan empat kolom, menetapkan dua statistik untuk setiap pengguna, yang dapat kita sebut "keramahan" dan "polaritas", dan dua statistik untuk setiap Catatan, yang kita sebut "kegunaan " dan "polaritas". Model mencoba memprediksi matriks sebagai fungsi dari nilai-nilai tersebut, menggunakan rumus berikut:

Perhatikan bahwa di sini saya menyajikan terminologi yang digunakan dalam makalah Birdwatch, serta terminologi saya sendiri untuk memberikan pemahaman yang lebih intuitif tentang arti variabel tanpa melibatkan konsep matematika:

  • μ adalah parameter "sentimen publik" yang mengukur seberapa tinggi rating yang umumnya diberikan oleh pengguna.

  • iu adalah "keramahan" pengguna, yaitu seberapa besar kemungkinan pengguna cenderung memberikan rating tinggi.

  • di dalamnya adalah "kegunaan" dari Surat Utang tersebut, yaitu seberapa besar kemungkinan Surat Utang tersebut akan mendapat peringkat tinggi. Ini adalah variabel yang kami pedulikan.

  • fu atau fn adalah "polaritas" pengguna atau Catatan, yaitu posisi mereka pada poros dominan politik ekstrem. Dalam praktiknya, polaritas negatif secara kasar berarti "condong ke kiri" dan polaritas positif berarti "condong ke kanan", namun perlu diingat bahwa sumbu ekstrem diperoleh dengan menganalisis data pengguna dan Notes, dan konsep kiri dan kanan tidak dikodekan secara pasti.

Algoritme ini menggunakan model pembelajaran mesin yang cukup mendasar (penurunan gradien standar) untuk menemukan nilai variabel terbaik guna memprediksi nilai matriks. Kegunaan yang diberikan pada Catatan tertentu adalah skor akhir untuk Catatan tersebut. Catatan akan ditampilkan jika kegunaannya minimal +0,4.

Kecerdasan inti di sini adalah bahwa "polaritas" menyerap karakteristik sebuah catatan yang menyebabkannya disukai oleh sebagian pengguna dan tidak disukai oleh orang lain, sedangkan "kegunaan" hanya mengukur karakteristik sebuah catatan. Fitur-fitur ini menyebabkannya disukai oleh semua orang pengguna. Dengan demikian, pemilihan kegunaan akan mengidentifikasi Catatan yang didukung oleh berbagai suku dan mengecualikan Catatan yang disukai oleh satu suku namun tidak disukai oleh suku lain.

Penjelasan di atas hanya menjelaskan bagian inti dari algoritma. Faktanya, masih banyak mekanik tambahan yang ditambahkan di atasnya. Untungnya, hal tersebut dijelaskan dalam dokumentasi publik. Mekanisme tersebut antara lain sebagai berikut:

  • Algoritme ini dijalankan beberapa kali, setiap kali menambahkan beberapa "suara palsu" ekstrim yang dihasilkan secara acak ke dalam suara tersebut. Artinya, keluaran sebenarnya dari algoritme untuk setiap Catatan adalah rentang nilai, dan hasil akhirnya bergantung pada "keyakinan yang lebih rendah" yang diambil dari rentang tersebut dan dibandingkan dengan ambang batas 0,32.

  • Jika banyak pengguna (terutama yang memiliki polaritas Catatan) menilai Catatan sebagai "Tidak Berguna" dan mereka juga menetapkan "tag" yang sama (misalnya, "bahasa argumentatif atau bias", "sumber tidak biasa") "Catatan Dukungan") sebagai alasan pemeringkatan, maka ambang batas kegunaan yang diperlukan untuk menerbitkan Catatan akan meningkat dari 0,4 menjadi 0,5 (ini mungkin tampak kecil, tetapi dalam praktiknya sangat penting).

  • Jika suatu Catatan diterima, kegunaannya harus dikurangi menjadi 0,01 poin di bawah ambang batas yang diperlukan untuk menerima Catatan tersebut.

  • Algoritme ini menjalankan lebih banyak proses menggunakan beberapa model, terkadang meningkatkan Notes dengan skor kegunaan mentah antara 0,3 dan 0,4.

Secara keseluruhan, Anda mendapatkan beberapa kode Python yang cukup rumit dengan total 6282 baris yang tersebar di 22 file. Namun semuanya terbuka, dan Anda dapat mengunduh Catatan dan data penilaian dan menjalankannya sendiri untuk melihat apakah hasilnya sesuai dengan apa yang sebenarnya terjadi di Twitter.

Jadi seperti apa praktiknya?

Mungkin perbedaan terbesar antara algoritme ini dan sekadar mengambil skor rata-rata dari suara masyarakat adalah konsep yang saya sebut nilai "kutub". Dokumentasi algoritme menyebutnya sebagai fu dan fn, menggunakan f sebagai faktor karena kedua istilah tersebut saling mengalikan; terminologi yang lebih umum sebagian disebabkan oleh keinginan untuk menjadikan fu dan fn multidimensi.

Polaritas ditetapkan ke pengguna dan Catatan. Tautan antara ID pengguna dan akun Twitter yang mendasarinya sengaja dirahasiakan, namun Notes bersifat publik. Faktanya, setidaknya untuk kumpulan data bahasa Inggris, polaritas yang dihasilkan oleh algoritme berkorelasi sangat erat dengan kiri dan kanan.

Berikut beberapa contoh Notes dengan polaritas sekitar -0,8:

Perhatikan bahwa saya tidak memilih-milih di sini; ini sebenarnya adalah tiga baris pertama dalam spreadsheet scoring_notes.tsv yang saya hasilkan saat menjalankan algoritme secara lokal, dan skor polaritasnya (disebut coreNoteFactor1 dalam spreadsheet) kurang dari - 0,8.

Sekarang, berikut beberapa Note dengan polaritas sekitar +0,8. Ternyata banyak dari mereka adalah orang-orang yang berbicara tentang politik Brasil dalam bahasa Portugis atau penggemar Tesla yang dengan marah membantah kritik terhadap Tesla, jadi izinkan saya memilih sedikit dan menemukan beberapa Catatan yang tidak termasuk dalam kategori mana pun:

Sekali lagi, sebagai pengingat, "pembagian kiri vs. kanan" tidak dikodekan ke dalam algoritme dengan cara apa pun, melainkan ditemukan secara komputasi; Hal ini menunjukkan bahwa jika Anda menerapkan algoritme ini pada konteks budaya lain, maka secara otomatis dapat mendeteksi perpecahan politik utama mereka dan membangun jembatan di antara perpecahan tersebut.

Sedangkan Catatan untuk kegunaan maksimal tampilannya seperti ini. Kali ini, karena Notes benar-benar muncul di Twitter, saya cukup mengambil tangkapan layar:

Ada satu lagi:

Untuk Catatan kedua, lebih langsung membahas topik-topik politik yang sangat partisan, namun merupakan Catatan yang jelas, berkualitas, dan informatif, sehingga mendapat rating tinggi. Secara keseluruhan, algoritme tampaknya berfungsi, dan tampaknya layak untuk memverifikasi keluaran algoritme dengan menjalankan kode.

Apa pendapat saya tentang algoritma ini?

Yang paling mengejutkan saya ketika menganalisis algoritma ini adalah kompleksitasnya. Ada "versi makalah akademis" yang menggunakan penurunan gradien untuk menemukan persamaan vektor dan matriks lima suku yang paling cocok, dan kemudian ada versi sebenarnya, serangkaian eksekusi algoritma yang kompleks dengan banyak eksekusi berbeda dan banyak kesewenang-wenangan di sepanjang jalan. .koefisien.

Bahkan versi makalah akademis menyembunyikan kompleksitas yang mendasarinya. Persamaan yang dioptimalkan adalah derajat keempat negatif (karena terdapat suku fu*fn kuadrat dalam rumus prediksi dan fungsi biaya mengukur kuadrat kesalahan). Meskipun mengoptimalkan persamaan kuadrat dalam sejumlah variabel hampir selalu memiliki solusi unik, yang dapat Anda temukan dengan aljabar linier yang cukup mendasar, mengoptimalkan persamaan kuartik dalam banyak variabel biasanya memiliki banyak solusi, oleh karena itu diperlukan beberapa putaran algoritma penurunan gradien Jawaban yang berbeda mungkin dapat diperoleh. Perubahan masukan yang kecil dapat menyebabkan penurunan berpindah dari satu minimum lokal ke minimum lokal lainnya, sehingga mengubah hasil keluaran secara signifikan.

Perbedaan antara algoritma ini dan algoritma yang saya bantu kembangkan, seperti pembiayaan sekunder, bagi saya seperti perbedaan antara algoritma ekonom dan algoritma insinyur. Algoritme ekonom, dalam kasus terbaik, fokus pada kesederhanaan, relatif mudah untuk dianalisis, dan memiliki sifat matematika yang jelas, menunjukkan bahwa ini adalah yang terbaik (atau paling tidak buruk) untuk menyelesaikan tugas, dan idealnya juga dapat dibuktikan. Berapa banyak kerusakan yang dapat dilakukan seseorang ketika mencoba mengeksploitasinya. Algoritme seorang insinyur, di sisi lain, diperoleh melalui proses coba-coba yang berulang-ulang untuk melihat apa yang berhasil dan apa yang tidak berhasil di lingkungan operasi insinyur. Algoritme para insinyur bersifat pragmatis dan menyelesaikan pekerjaannya; algoritma para ekonom tidak sepenuhnya kehilangan kendali ketika dihadapkan pada situasi yang tidak terduga.

Atau, seperti yang dikatakan oleh filsuf internet terkemuka roon (alias tszzl) di topik terkait:

Tentu saja, saya akan mengatakan bahwa aspek "estetika teoretis" dari mata uang kripto diperlukan agar dapat secara akurat membedakan antara protokol-protokol yang benar-benar tidak dapat dipercaya dan protokol-protokol yang terlihat bagus dan bekerja dengan baik di permukaan namun sebenarnya memerlukan kepercayaan pada beberapa protokol terpusat. aktor, Atau lebih buruk lagi, itu bisa jadi penipuan total.

Pembelajaran mendalam efektif dalam keadaan normal, namun memiliki kelemahan yang tidak dapat dihindari dalam berbagai serangan pembelajaran mesin yang merugikan. Jika dilakukan dengan baik, jebakan teknis dan tangga abstraksi tingkat tinggi dapat melawan serangan ini. Jadi, saya punya pertanyaan: Bisakah kita mengubah Catatan Komunitas menjadi sesuatu yang lebih mirip algoritma ekonomi?

Untuk melihat apa artinya ini dalam praktiknya, mari kita jelajahi algoritme yang saya rancang beberapa tahun lalu untuk tujuan serupa: Pendanaan kuadrat terikat berpasangan.

Tujuan dari pendanaan kuadrat berpasangan adalah untuk mengisi celah dalam pendanaan kuadrat "biasa", sehingga bahkan jika dua peserta berkolusi satu sama lain, mereka dapat berkontribusi dalam jumlah yang sangat besar untuk proyek palsu, mengembalikan dana tersebut kepada mereka, dan menerima dana dalam jumlah besar. subsidi yang menguras seluruh modal. Dalam pendanaan kuadrat berpasangan terikat, kami mengalokasikan anggaran terbatas M untuk setiap pasangan aktor. Algoritme melakukan iterasi melalui semua kemungkinan pasangan aktor, dan jika algoritme memutuskan untuk menambahkan subsidi ke proyek P tertentu karena aktor A dan aktor B mendukungnya, maka subsidi ini dipotong dari anggaran yang dialokasikan untuk pasangan tersebut (A, B ) . Oleh karena itu, meskipun k peserta berkolusi, jumlah yang dapat mereka curi dari mekanisme tersebut paling banyak adalah k (k-1) M.

Bentuk algoritme ini tidak bekerja dengan baik dalam konteks Catatan Komunitas karena setiap pengguna hanya memberikan sejumlah kecil suara: rata-rata, jumlah suara yang sama antara dua pengguna adalah nol, jadi cukup dengan melihat masing-masing pasangan satu per satu. Pengguna, algoritma tidak dapat memahami polaritas pengguna. Tujuan dari model pembelajaran mesin adalah mencoba "mengisi" matriks dari sumber data yang sangat jarang yang tidak dapat dianalisis secara langsung dengan cara ini. Namun tantangan dari pendekatan ini adalah diperlukannya upaya ekstra untuk menghindari hasil yang sangat fluktuatif ketika menghadapi sejumlah kecil suara yang buruk.

Bisakah Catatan Komunitas benar-benar berdiri di sisi kiri dan kanan?

Kita dapat menganalisis apakah algoritme Catatan Komunitas benar-benar mampu melawan hal-hal ekstrem, yaitu apakah kinerjanya lebih baik daripada algoritme pemungutan suara yang naif. Algoritme pemungutan suara ini sudah menolak hal-hal ekstrem sampai batas tertentu: postingan dengan 200 suka dan 100 tidak suka akan berkinerja lebih buruk daripada postingan dengan hanya 200 suka. Namun apakah Catatan Komunitas lebih baik?

Dari perspektif algoritma abstrak, sulit untuk mengatakannya. Mengapa postingan polarisasi dengan rating rata-rata tinggi tidak memiliki polaritas yang kuat dan kegunaan yang tinggi? Idenya adalah jika suara-suara tersebut bertentangan, polaritas harus "menyerap" fitur-fitur yang menyebabkan postingan tersebut mendapat banyak suara, tetapi apakah itu benar-benar terjadi?

Untuk memeriksanya, saya menjalankan implementasi sederhana saya sendiri selama 100 putaran. Hasil rata-ratanya adalah sebagai berikut:

Dalam pengujian ini, Notes yang "baik" menerima peringkat +2 di antara pengguna dengan afiliasi politik yang sama dan peringkat +0 di antara pengguna dengan afiliasi politik yang berlawanan, dan Notes yang "baik tetapi lebih ekstrem" menerima peringkat +0 di antara pengguna dari afiliasi politik yang berbeda. afiliasi politik yang sama. Ia menerima peringkat +4 di antara pengguna dari faksi lawan dan peringkat -2 di antara pengguna dari faksi lawan. Meskipun skor rata-ratanya sama, namun polaritasnya berbeda. Faktanya, rata-rata kegunaan Notes yang "baik" tampaknya lebih tinggi dibandingkan dengan Notes yang "bagus namun cenderung ekstrim".

Memiliki algoritma yang lebih dekat dengan “Algoritma Ekonom” akan memiliki cerita yang lebih jelas tentang bagaimana algoritma tersebut memberikan hukuman yang ekstrim.

Seberapa berguna semua ini dalam situasi berisiko tinggi?

Kita dapat mempelajari sebagian dari hal ini dengan melihat situasi tertentu. Sekitar sebulan yang lalu, Ian Bremmer mengeluh bahwa Catatan Komunitas yang sangat kritis telah ditambahkan ke tweet tentang pejabat pemerintah Tiongkok, namun Catatan tersebut telah dihapus.

Ini adalah tugas yang sulit. Melakukan desain mekanisme di lingkungan komunitas Ethereum adalah satu hal di mana keluhan terbesar mungkin hanya berupa $20.000 yang ditujukan kepada influencer Twitter ekstrem. Situasinya benar-benar berbeda ketika menyangkut persoalan politik dan geopolitik yang berdampak pada jutaan orang, di mana setiap orang seringkali berasumsi mempunyai motif yang paling buruk. Namun, berinteraksi dengan lingkungan berisiko tinggi ini sangat penting jika perancang mekanik ingin memberikan dampak yang signifikan terhadap dunia.

Dalam kasus Twitter, ada alasan yang jelas untuk mencurigai manipulasi terpusat sebagai penyebab penghapusan Notes: Elon Musk memiliki banyak kepentingan bisnis di Tiongkok, jadi mungkin saja Elon Musk memaksa tim Community Notes untuk mengganggu keluaran algoritme dan hapus Catatan khusus ini.

Untungnya, algoritme ini bersifat open source dan dapat diverifikasi, sehingga kami dapat menggali lebih dalam! Ayo lakukan ini. URL tweet aslinya adalah https://twitter.com/MFA_China/status/1676157337109946369. Nomor 1676157337109946369 di akhir adalah ID tweet tersebut. Kita dapat mencari ID ini di data yang dapat diunduh dan mengidentifikasi baris tertentu di spreadsheet yang memiliki Catatan di atas:

Disini kita mendapatkan ID Notes itu sendiri, 1676391378815709184. Kami kemudian mencari ID tersebut di file scoring_notes.tsv dan note_status_history.tsv yang dihasilkan dengan menjalankan algoritme. Kami mendapat hasil sebagai berikut:

Kolom kedua pada keluaran pertama adalah peringkat terkini untuk Catatan tersebut. Output kedua menunjukkan riwayat Catatan: statusnya saat ini ada di kolom tujuh (NEEDS_MORE_RATINGS), dan status pertama yang diterima sebelumnya yang bukan NEEDS_MORE_RATINGS ada di kolom lima (CURRENTLY_RATED_HELPFUL). Jadi kita dapat melihat bahwa algoritme itu sendiri pertama-tama menampilkan catatan tersebut dan kemudian menghapusnya setelah peringkatnya turun sedikit - tampaknya tidak ada intervensi pusat yang terlibat.

Kita juga dapat melihat masalah ini dengan cara lain dengan melihat hasil pemungutan suara itu sendiri. Kami dapat memindai file rating-00000.tsv untuk mengisolasi semua rating untuk Catatan tersebut dan melihat berapa banyak yang diberi rating HELPFUL dan NOT_HELPFUL:

Namun, jika Anda mengurutkannya berdasarkan stempel waktu dan melihat 50 suara pertama, Anda akan melihat bahwa ada 40 suara MEMBANTU dan 9 suara TIDAK_HELPFUL. Jadi kami sampai pada kesimpulan yang sama: pemirsa awal Notes memberi peringkat pada Catatan dengan lebih positif, sedangkan pemirsa Catatan berikutnya memberi peringkat kurang baik, sehingga peringkatnya mulai lebih tinggi dan menurun seiring waktu.

Sayangnya, bagaimana tepatnya Notes mengubah status sulit untuk dijelaskan: ini bukan soal sederhana "sebelumnya diberi peringkat di atas 0,40, sekarang diberi peringkat di bawah 0,40, jadi dihapus". Sebaliknya, sejumlah besar balasan NOT_HELPFUL memicu salah satu kondisi pengecualian, sehingga meningkatkan skor kegunaan yang dibutuhkan Notes agar tetap berada di atas ambang batas.

Ini adalah kesempatan pembelajaran hebat lainnya yang memberikan kita sebuah pelajaran: membuat algoritma netral yang dapat dipercaya benar-benar dapat dipercaya memerlukan kesederhanaan. Jika suatu Catatan berubah dari diterima menjadi tidak diterima, harus ada cerita sederhana dan jelas yang menjelaskan mengapa hal ini terjadi.

Tentu saja, ada cara yang berbeda untuk memanipulasi pemungutan suara ini: Brigading. Seseorang yang melihat Catatan yang tidak mereka setujui dapat menghubungi komunitas yang sangat terlibat (atau lebih buruk lagi, banyak akun palsu) untuk menilainya TIDAK_BANTUAN, dan mungkin tidak memerlukan terlalu banyak suara untuk memindahkan Catatan dari " Berguna" menjadi "ekstrim". Diperlukan lebih banyak analisis dan upaya untuk mengurangi kerentanan algoritme terhadap serangan terkoordinasi tersebut. Peningkatan yang mungkin dilakukan adalah dengan tidak memperbolehkan pengguna mana pun untuk memberikan suara pada Catatan mana pun, melainkan secara acak menetapkan Catatan kepada penilai dengan cara yang direkomendasikan oleh algoritme "Untuk Anda", dan hanya mengizinkan penilai untuk menilai Catatan yang telah ditugaskan kepada mereka.

Apakah Catatan Komunitas tidak cukup “berani”?

Kritik utama yang saya lihat terhadap Catatan Komunitas pada dasarnya adalah bahwa hal itu tidak cukup. Saya melihat dua artikel terbaru yang menyebutkan hal ini. Mengutip salah satu artikel:

Program ini memiliki keterbatasan yang serius, yaitu agar Catatan Komunitas dapat dipublikasikan, program tersebut harus diterima secara universal oleh konsensus orang-orang dari berbagai spektrum politik.

“Harus ada konsensus ideologis,” katanya. "Itu berarti orang-orang di kiri dan di kanan harus setuju bahwa catatan itu harus dilampirkan ke tweet."

Pada dasarnya, katanya, hal ini memerlukan “kesepakatan lintas ideologi mengenai kebenaran, yang hampir mustahil dicapai dalam lingkungan yang semakin partisan.”

Ini pertanyaan yang sulit, tapi pada akhirnya saya cenderung berpikir bahwa lebih baik sepuluh tweet berisi misinformasi disebarkan secara bebas daripada satu tweet diberi keterangan yang tidak adil. Kita sudah bertahun-tahun melakukan pengecekan fakta, dan ini merupakan hal yang berani, dan ini dilakukan dari sudut pandang "sebenarnya kita tahu kebenarannya, kita tahu satu pihak lebih sering berbohong dibandingkan pihak lain." Apa hasilnya?

Sejujurnya, terdapat ketidakpercayaan yang cukup luas terhadap konsep pengecekan fakta. Berikut strategi yang berbunyi: Abaikan kritik, ingatlah bahwa para ahli pengecekan fakta benar-benar mengetahui fakta lebih baik dibandingkan sistem pemungutan suara mana pun, dan pertahankan prinsip tersebut. Namun menerapkan pendekatan ini secara menyeluruh tampaknya berisiko. Ada manfaatnya dalam membangun institusi antar suku yang dihormati oleh semua orang setidaknya sampai tingkat tertentu. Seperti pepatah William Blackstone dan pengadilan, saya merasa bahwa mempertahankan rasa hormat memerlukan sistem yang membuat kesalahan karena kelalaian, bukan secara proaktif. Jadi menurut saya ada manfaatnya setidaknya satu organisasi besar yang mengambil jalan berbeda ini dan memperlakukan rasa hormat lintas suku yang langka sebagai sumber daya yang berharga.

Alasan lain menurut saya tidak apa-apa jika Catatan Komunitas bersifat konservatif adalah karena menurut saya tidak setiap tweet misinformasi, atau bahkan sebagian besar tweet misinformasi, harus menerima catatan korektif. Meskipun kurang dari satu persen tweet misinformasi menerima anotasi yang memberikan konteks atau koreksi, Catatan Komunitas tetap memberikan layanan yang sangat berharga sebagai alat pendidikan. Tujuannya bukan untuk mengoreksi semuanya; melainkan, tujuannya adalah untuk mengingatkan orang-orang bahwa ada berbagai sudut pandang, bahwa beberapa postingan yang tampak meyakinkan dan menarik secara terpisah sebenarnya cukup salah, dan bahwa Anda, ya, biasanya dapat melakukan penelusuran internet dasar. untuk memverifikasi bahwa itu salah.

Catatan Komunitas tidak bisa dan tidak dimaksudkan untuk menjadi obat mujarab bagi semua permasalahan dalam epistemologi publik. Apa pun masalah yang belum terselesaikan, terdapat banyak ruang bagi mekanisme lain untuk mengisinya, baik itu gadget bermodel baru seperti pasar prediksi atau organisasi mapan yang mempekerjakan staf penuh waktu dengan keahlian domain yang dapat mencoba mengisi kesenjangan tersebut.

sebagai kesimpulan

Community Notes bukan hanya eksperimen media sosial yang menarik, namun juga merupakan contoh jenis desain mekanisme baru yang menarik: mekanisme yang secara sadar berupaya mengidentifikasi hal-hal ekstrem dan cenderung mendorong penyeberangan batas dibandingkan melanggengkan perpecahan.

Dua contoh lain dalam kategori ini yang saya ketahui adalah: (i) mekanisme pendanaan sekunder berpasangan yang digunakan dalam Gitcoin Grants, dan (ii) Polis, alat diskusi yang menggunakan algoritme pengelompokan untuk membantu komunitas mengidentifikasi pernyataan-pernyataan populer yang umum di kalangan masyarakat. yang seringkali mempunyai pandangan berbeda. Bidang desain mekanisme ini sangat berharga dan saya berharap kita melihat lebih banyak karya akademis di bidang ini.

Transparansi algoritmik yang disediakan oleh Community Notes tidak sama dengan media sosial yang sepenuhnya terdesentralisasi—jika Anda tidak setuju dengan cara kerja Community Notes, tidak ada cara untuk melihat konten yang sama melalui algoritma yang berbeda. Namun hal ini adalah hal yang paling mendekati yang akan dicapai oleh aplikasi hyperscale dalam beberapa tahun ke depan, dan kita dapat melihat bahwa hal ini telah memberikan banyak manfaat, baik dalam mencegah manipulasi terpusat dan memastikan bahwa platform yang tidak terlibat dalam manipulasi tersebut mendapatkan haknya .

Saya berharap dapat melihat Catatan Komunitas dan banyak algoritme serupa berkembang dan berkembang dalam dekade berikutnya.