Ostatnie dwa lata na Twitterze (X) były burzliwe. W zeszłym roku Elon Musk kupił platformę za 44 miliardy dolarów, a następnie dokonał przeglądu personelu, moderacji treści, modelu biznesowego i kultury internetowej firmy. Zmiany te mogą mieć więcej wspólnego z miękką siłą Elona Muska, a nie z konkretnymi decyzjami politycznymi. Jednak wśród tych kontrowersyjnych działań nowa funkcja na Twitterze szybko zyskała na znaczeniu i wydaje się być uwielbiana przez ludzi z całego spektrum politycznego: notatki społeczności.

Notatki społeczności to narzędzie do sprawdzania faktów, które czasami dołącza do tweetów notatki kontekstowe, takie jak powyższy tweet Elona Muska, jako narzędzie do sprawdzania faktów i przeciwdziałania dezinformacji. Pierwotnie nosił nazwę Birdwatch i po raz pierwszy został uruchomiony jako projekt pilotażowy w styczniu 2021 r. Od tego czasu stopniowo się rozwijał, a najszybszy rozwój zbiegł się z przejęciem Twittera przez Elona Muska w zeszłym roku. Notatki społeczności regularnie pojawiają się wśród tweetów, które cieszą się obecnie szerokim zainteresowaniem na Twitterze, w tym także tych dotyczących kontrowersyjnych tematów politycznych. W mojej opinii oraz na podstawie rozmów z wieloma osobami z całego spektrum politycznego te notatki mają charakter informacyjny i wartościowy, jak się wydają.

Jednak tym, co mnie najbardziej interesuje, są Community Notes, które choć nie są „projektem kryptograficznym”, są prawdopodobnie najbliższym przykładem „wartości kryptograficznych”, jaki widzieliśmy w głównym nurcie świata. Notatki społeczności nie są tworzone ani kuratorowane przez wybranych centralnie ekspertów; zamiast tego każdy może pisać i głosować, a to, które notatki się pojawią, a które nie, zależy wyłącznie od algorytmów open source. Witryna Twittera zawiera szczegółowy i kompleksowy przewodnik opisujący działanie algorytmu. Można pobrać dane zawierające opublikowane notatki i ankiety, uruchomić algorytm lokalnie i sprawdzić, czy dane wyjściowe odpowiadają temu, co jest widoczne w witrynie Twitter. Choć nie jest doskonały, zaskakująco zbliża się do ideału godnej zaufania neutralności w dość kontrowersyjnych sytuacjach, a jednocześnie jest bardzo przydatny.

Jak działa algorytm Community Notes?

Każdy, kto posiada konto na Twitterze, które spełnia określone kryteria (w zasadzie: aktywne od ponad 6 miesięcy, bez naruszeń zasad, zweryfikowany numer telefonu komórkowego) może zapisać się do udziału w Notatkach Społeczności. Obecnie uczestnicy są przyjmowani powoli i losowo, ale ostatecznie plan jest taki, aby umożliwić dołączenie każdemu, kto się kwalifikuje. Po zaakceptowaniu możesz najpierw wziąć udział w ocenianiu istniejących Notatek, a gdy Twoje oceny będą wystarczająco dobre (mierzone poprzez sprawdzenie, które oceny odpowiadają ostatecznym wynikom dla tej Notatki), możesz także napisać własne Notatki.

Kiedy napiszesz Notatkę, zostanie ona oceniona na podstawie recenzji dokonanej przez innych członków Notatek Społeczności. Recenzje te można traktować jako głosy na trzech poziomach: „przydatne”, „raczej pomocne” i „nieprzydatne”, ale recenzje mogą również zawierać inne etykiety, które odgrywają rolę w algorytmie. Na podstawie tych recenzji firmie Notes przypisuje się ocenę. Jeżeli wynik notatki przekroczy 0,40, zostanie ona wyświetlona; w przeciwnym razie notatka nie zostanie wyświetlona.

Wyjątkowość algorytmu polega na sposobie obliczania wyników. W przeciwieństwie do prostych algorytmów, które służą jedynie do obliczania sumy lub średniej ocen użytkowników i wykorzystywania ich jako wyniku końcowego, algorytm oceny Notatek Społeczności wyraźnie stara się nadać priorytet tym, które otrzymały pozytywne recenzje od osób o różnych perspektywach. Oznacza to, że jeśli ludzie, którzy zwykle nie zgadzają się co do ocen, ostatecznie zgodzą się na konkretną Notatkę, zostanie ona oceniona wysoko.

Przyjrzyjmy się bliżej, jak to działa. Mamy zbiór użytkowników i zbiór Notatek; możemy utworzyć macierz M, w której komórka Mij reprezentuje, jak i-ty użytkownik ocenił j-te Notatki.

Większość użytkowników nie oceniła żadnej notatki, więc większość wpisów w macierzy będzie wynosić zero, ale to jest w porządku. Celem algorytmu jest utworzenie czterokolumnowego modelu użytkowników i Notatek, przypisując każdemu użytkownikowi po dwie statystyki, które możemy nazwać „przyjaznością” i „polaryzacją”, oraz po dwie statystyki do każdej Notatki, które nazywamy „użytecznością” " i "biegunowość". Model próbuje przewidzieć macierz jako funkcję tych wartości, korzystając z następującego wzoru:

Należy pamiętać, że tutaj przedstawiam terminologię stosowaną w artykule Birdwatch, a także moją własną terminologię, aby zapewnić bardziej intuicyjne zrozumienie znaczenia zmiennych bez angażowania pojęć matematycznych:

  • μ to parametr „nastroju społecznego”, który mierzy, jak wysokie oceny wystawiają ogólnie użytkownicy.

  • iu to „przyjazność” użytkownika, tj. prawdopodobieństwo, że użytkownik będzie skłonny wystawiać wysokie oceny.

  • oznacza „przydatność” Obligacji, czyli prawdopodobieństwo, że Obligacje zostaną wysoko ocenione. To jest zmienna, na której nam zależy.

  • fu lub fn to „biegunowość” użytkownika lub Notatek, czyli ich pozycja na dominującej osi skrajności politycznych. W praktyce polaryzacja ujemna oznacza z grubsza „przechylenie w lewo”, a biegunowość dodatnia oznacza „przechylenie w prawo”, ale należy pamiętać, że skrajne osie wyznacza się na podstawie analizy danych użytkownika i programu Notes, a pojęcia lewicy i prawicy nie są zakodowane na stałe.

Algorytm wykorzystuje dość podstawowy model uczenia maszynowego (standardowe opadanie gradientowe) w celu znalezienia najlepszych wartości zmiennych w celu przewidzenia wartości macierzy. Przydatność przypisana do konkretnej Notatki jest ostateczną oceną tej Notatki. Notatka zostanie wyświetlona, ​​jeśli jej użyteczność będzie wynosić co najmniej +0,4.

Główną zaletą jest to, że „polaryzacja” pochłania cechy banknotu, które sprawiają, że niektórzy użytkownicy go lubią, a inni nie, podczas gdy „użyteczność” mierzy jedynie cechy banknotu. Te cechy sprawiają, że jest on lubiany przez wszystkich użytkownicy. W ten sposób wybranie użyteczności identyfikuje Notatki, które są popierane przez różne plemiona i wyklucza Notatki, które cieszą się uznaniem jednego plemienia, ale budzą urazę u innego.

Powyższe opisuje jedynie podstawową część algorytmu. W rzeczywistości dodano do tego wiele dodatkowych mechanizmów. Na szczęście są one opisane w dokumentacji publicznej. Mechanizmy te obejmują:

  • Algorytm jest uruchamiany wielokrotnie, za każdym razem dodając do głosowania losowo wygenerowane ekstremalne „fałszywe głosy”. Oznacza to, że prawdziwym wyjściem algorytmu dla każdej notatki jest zakres wartości, a ostateczny wynik zależy od „mniejszej pewności” wziętej z tego zakresu i porównanej z progiem 0,32.

  • Jeśli wielu użytkowników (zwłaszcza tych z polaryzacją Notatek) oceni Notatkę jako „Nieprzydatną” i przypisze jej ten sam „tag” (na przykład „język argumentacyjny lub stronniczy”, „nietypowe źródło”) „Notatki pomocy technicznej”), jak powód wystawienia oceny, wówczas próg przydatności wymagany do publikacji Notatek wzrośnie z 0,4 do 0,5 (może to wydawać się niewielkie, ale w praktyce ma ogromne znaczenie).

  • W przypadku przyjęcia Noty jej przydatność musi zostać obniżona do 0,01 punktu poniżej progu wymaganego do przyjęcia Noty.

  • Algorytm wykonuje więcej przebiegów, korzystając z wielu modeli, czasami zwiększając liczbę Notes o surowe wyniki użyteczności pomiędzy 0,3 a 0,4.

W sumie otrzymujesz dość złożony kod Pythona składający się z 6282 linii rozmieszczonych w 22 plikach. Wszystko jest jednak otwarte i możesz pobrać notatki oraz dane dotyczące punktacji i samodzielnie je uruchomić, aby sprawdzić, czy wyniki odpowiadają temu, co faktycznie dzieje się na Twitterze.

Jak więc to wygląda w praktyce?

Prawdopodobnie największą różnicą między tym algorytmem a zwykłym pobieraniem średniego wyniku z głosów ludzi jest koncepcja tego, co nazywam wartościami „polarnymi”. Dokumentacja algorytmu określa je jako fu i fn, używając f jako współczynnika, ponieważ te dwa terminy mnożą się nawzajem; bardziej ogólna terminologia wynika częściowo z ostatecznej chęci uczynienia fu i fn wielowymiarowymi.

Polaryzacja jest przypisana do użytkowników i notatek. Powiązanie między identyfikatorem użytkownika a kontem na Twitterze jest celowo utrzymywane w tajemnicy, ale Notatki są publiczne. W rzeczywistości, przynajmniej w przypadku angielskiego zbioru danych, polaryzacja generowana przez algorytm bardzo ściśle koreluje z lewą i prawą stroną.

Oto kilka przykładów Notes z polaryzacją około -0,8:

Zauważ, że nie będę tutaj selekcjonował; w rzeczywistości są to pierwsze trzy wiersze w arkuszu kalkulacyjnym score_notes.tsv, który wygenerowałem podczas lokalnego uruchamiania algorytmu, a ich wyniki polaryzacji (zwane w arkuszu kalkulacyjnym coreNoteFactor1) są mniejsze niż - 0,8.

Oto kilka notatek z polaryzacją około +0,8. Okazuje się, że wielu z nich to albo ludzie rozmawiający o brazylijskiej polityce po portugalsku, albo fani Tesli ze złością odpierający krytykę Tesli, więc pozwólcie, że wybiorę trochę i znajdę kilka uwag, które nie mieszczą się w żadnej kategorii:

Ponownie, dla przypomnienia, „podział na lewą i prawą stronę” nie jest w żaden sposób zakodowany w algorytmie, jest on wykrywany obliczeniowo; Sugeruje to, że jeśli zastosujesz ten algorytm do innych kontekstów kulturowych, może on automatycznie wykryć ich główne podziały polityczne i zbudować mosty między tymi podziałami.

Tymczasem Notatki dla maksymalnej użyteczności wyglądają tak. Tym razem, ponieważ Notatki faktycznie pojawiają się na Twitterze, mogę po prostu zrobić zrzut ekranu:

Jest jeszcze jeden:

W przypadku drugich Notatek porusza bardziej bezpośrednio stronnicze tematy polityczne, ale są to notatki jasne, wysokiej jakości i zawierające wiele informacji, dlatego uzyskują wysoką ocenę. Ogólnie rzecz biorąc, algorytm wydaje się działać i wydaje się możliwe sprawdzenie wyników algorytmu poprzez uruchomienie kodu.

Co sądzę o tym algorytmie?

To, co uderzyło mnie najbardziej podczas analizy tego algorytmu, to jego złożoność. Istnieje „wersja papierowa”, która wykorzystuje opadanie gradientowe w celu znalezienia najlepszego dopasowania pięcioczłonowych równań wektorowych i macierzowych, a także wersja prawdziwa, złożona seria wykonań algorytmu z wieloma różnymi wykonaniami i dużą dowolnością sposób.

Nawet akademicka wersja papierowa ukrywa podstawową złożoność. Równanie, które optymalizuje, jest ujemnego czwartego rzędu (ponieważ we wzorze predykcyjnym występuje kwadratowy składnik fu*fn, a funkcja kosztu mierzy kwadrat błędu). Podczas gdy optymalizacja równania kwadratowego dla dowolnej liczby zmiennych prawie zawsze będzie miała unikalne rozwiązanie, które można znaleźć za pomocą dość podstawowej algebry liniowej, optymalizacja równania kwadratowego dla wielu zmiennych zwykle ma wiele rozwiązań, stąd wiele rund algorytmów opadania gradientu. odpowiedzi mogą zostać osiągnięte. Niewielkie zmiany wejściowe mogą spowodować zmianę dipu z jednego lokalnego minimum na drugie, znacząco zmieniając wyniki wyjściowe.

Różnica między tym a algorytmami, które pomogłem opracować, np. finansowaniem wtórnym, jest dla mnie jak różnica między algorytmem ekonomisty a algorytmem inżyniera. Algorytmy ekonomistów w najlepszym przypadku skupiają się na prostocie, są stosunkowo łatwe do analizy i mają wyraźne właściwości matematyczne, wskazujące, że jest to najlepsze (lub najmniej złe) rozwiązanie zadania, a w idealnym przypadku można je również udowodnić Ile szkód może wyrządzić ktoś, próbując to wykorzystać. Z drugiej strony algorytm inżyniera jest tworzony w drodze iteracyjnego procesu prób i błędów, aby zobaczyć, co działa, a co nie w środowisku operacyjnym inżyniera. Algorytmy inżynierów są pragmatyczne i wykonują swoją pracę; algorytmy ekonomistów nie tracą całkowicie kontroli w obliczu nieoczekiwanych sytuacji.

Lub, jak szanowny filozof internetowy Roon (aka tszzl) umieszcza to w powiązanym wątku:

Oczywiście powiedziałbym, że aspekt „estetyki teoretycznej” kryptowalut jest niezbędny, aby móc dokładnie odróżnić protokoły, które są naprawdę pozbawione zaufania, od tych, które dobrze wyglądają i działają dobrze na powierzchni, ale w rzeczywistości wymagają zaufania do jakiegoś scentralizowanego aktora, Lub, co gorsza, może to być kompletne oszustwo.

Głębokie uczenie się jest skuteczne w normalnych okolicznościach, ale ma nieuniknione słabości w różnych atakach kontradyktoryjnego uczenia maszynowego. Jeśli zostanie to zrobione dobrze, pułapki techniczne i drabiny abstrakcji wysokiego poziomu mogą zwalczyć te ataki. Mam więc pytanie: czy możemy zamienić same notatki społeczności w coś bardziej przypominającego algorytm ekonomiczny?

Aby zobaczyć, co to oznacza w praktyce, przyjrzyjmy się algorytmowi, który opracowałem kilka lat temu w podobnym celu: finansowanie kwadratowe powiązane parami.

Celem finansowania kwadratowego powiązanego parami jest wypełnienie luki w „zwykłym” finansowaniu kwadratowym, zgodnie z którą nawet jeśli dwóch uczestników wchodzi w zmowę, mogą wpłacić bardzo duże kwoty na fałszywy projekt, zwrócić im środki i otrzymać duże kwoty dotacje, które wyczerpują całą pulę kapitału. W przypadku finansowania kwadratowego ograniczonego parami przydzielamy ograniczony budżet M każdej parze aktorów. Algorytm iteruje po wszystkich możliwych parach aktorów i jeśli algorytm zdecyduje się na dodanie dotacji do określonego projektu P, ponieważ wspierają go zarówno aktor A, jak i aktor B, to dotacja ta jest odejmowana od budżetu przeznaczonego na parę (A, B ) . Dlatego nawet jeśli k uczestników zmówi się, kwota, którą mogą ukraść z mechanizmu, wynosi co najwyżej k (k-1) M.

Ta forma algorytmu nie działa dobrze w kontekście notatek społecznościowych, ponieważ każdy użytkownik oddaje tylko niewielką liczbę głosów: średnio liczba głosów wspólnych pomiędzy dowolnymi dwoma użytkownikami wynosi zero, więc wystarczy spojrzeć na każdą parę z osobna Użytkownik, algorytm nie może zrozumieć polaryzacji użytkownika. Celem modelu uczenia maszynowego jest właśnie próba „wypełnienia” macierzy z bardzo rzadkich danych źródłowych, których nie można bezpośrednio analizować w ten sposób. Wyzwanie związane z tym podejściem polega jednak na tym, że wymagany jest dodatkowy wysiłek, aby uniknąć bardzo niestabilnych wyników w obliczu niewielkiej liczby złych głosów.

Czy notatki społeczności naprawdę mogą stawić czoła lewicy i prawicy?

Możemy przeanalizować, czy algorytm Community Notes rzeczywiście jest w stanie oprzeć się skrajnościom, czyli czy radzi sobie lepiej niż naiwny algorytm głosowania. Ten algorytm głosowania już w pewnym stopniu opiera się skrajnościom: post z 200 polubieniami i 100 antynegatywami będzie miał gorszą skuteczność niż post z zaledwie 200 polubieniami. Ale czy Notatki społeczności są lepsze?

Z perspektywy algorytmu abstrakcyjnego trudno powiedzieć. Dlaczego słupek polaryzacyjny o wysokiej średniej ocenie nie miałby mieć silnej polaryzacji i wysokiej użyteczności? Pomysł jest taki, że jeśli te głosy są sprzeczne, polaryzacja powinna „wchłonąć” cechy, które spowodowały, że post zdobył dużo głosów, ale czy faktycznie to robi?

Aby to sprawdzić, uruchomiłem własną uproszczoną implementację na 100 rund. Średnie wyniki przedstawiają się następująco:

W tym teście „dobry” Notes otrzymał ocenę +2 wśród użytkowników o tej samej orientacji politycznej i ocenę +0 wśród użytkowników o przeciwnej orientacji politycznej, natomiast „dobry, ale bardziej ekstremalny” Notes otrzymał ocenę +0 wśród użytkowników tej samej przynależności politycznej. Otrzymał ocenę +4 wśród użytkowników przeciwnej frakcji i ocenę -2 wśród użytkowników przeciwnej frakcji. Chociaż średnie wyniki są takie same, polaryzacja jest inna. I faktycznie, średnia użyteczność „dobrych” Notesów wydaje się być wyższa niż „dobrych, ale bardziej ekstremalnych” Notesów.

Posiadanie algorytmu bliższego „algorytmowi ekonomisty” pozwoli uzyskać jaśniejszy obraz tego, w jaki sposób algorytm karze skrajności.

Jak przydatne jest to wszystko w sytuacjach o wysoką stawkę?

Możemy się tego nauczyć, przyglądając się konkretnej sytuacji. Około miesiąc temu Ian Bremmer poskarżył się, że do tweeta na temat chińskiego urzędnika rządowego dodano bardzo krytyczną notatkę społeczności, która jednak została usunięta.

To trudne zadanie. Projektowanie mechanizmu w środowisku społeczności Ethereum, gdzie największą skargą może być po prostu kwota 20 000 dolarów przekazana ekstremalnemu wpływowi na Twitterze, to jedno. Zupełnie inaczej wygląda sytuacja, jeśli chodzi o kwestie polityczne i geopolityczne, które dotykają miliony ludzi, gdzie często każdy słusznie przyjmuje najgorsze motywy. Jednakże interakcja z tymi środowiskami, w których stawka jest wysoka, jest niezbędna, jeśli projektanci mechanicy chcą mieć znaczący wpływ na świat.

W przypadku Twittera istnieje oczywisty powód, aby podejrzewać scentralizowaną manipulację jako przyczynę usunięcia Notes: Elon Musk ma wiele interesów biznesowych w Chinach, więc możliwe jest, że Elon Musk zmusił zespół Community Notes do ingerencji w wyniki algorytmu i usuń go. To konkretne notatki.

Na szczęście algorytm jest open source i można go zweryfikować, więc możemy się w nim zagłębić! Zróbmy to. Adres URL oryginalnego tweeta to https://twitter.com/MFA_China/status/1676157337109946369. Liczba 1676157337109946369 na końcu to identyfikator tweeta. Możemy wyszukać ten identyfikator w danych do pobrania i zidentyfikować konkretny wiersz w arkuszu kalkulacyjnym, który zawiera powyższe uwagi:

Tutaj otrzymujemy identyfikator samego Notes, 1676391378815709184. Następnie szukamy tego identyfikatora w plikach score_notes.tsv i note_status_history.tsv wygenerowanych poprzez uruchomienie algorytmu. Otrzymaliśmy następujące wyniki:

Druga kolumna pierwszego wyniku to bieżąca ocena tych banknotów. Drugi wynik pokazuje historię notatek: jej bieżący status znajduje się w kolumnie siódmej (NEEDS_MORE_RATINGS), a pierwszy otrzymany wcześniej status, który nie brzmiał NEEDS_MORE_RATINGS, znajduje się w kolumnie piątej (CURRENTLY_RATED_HELPFUL). Widzimy więc, że sam algorytm najpierw pokazał notatkę, a następnie ją usunął, gdy jej ocena nieznacznie spadła – nie wydaje się, aby w grę wchodziła żadna centralna interwencja.

Możemy spojrzeć na tę kwestię także z innej strony, przyglądając się samemu głosowaniu. Możemy przeskanować plik ratings-00000.tsv, aby wyizolować wszystkie oceny dla tych notatek i sprawdzić, ile z nich ma oceny POMOCNE, a które NIE_POMOCNE:

Jeśli jednak posortujesz je według sygnatury czasowej i spojrzysz na pierwsze 50 głosów, zobaczysz, że jest 40 głosów POMOCNYCH i 9 głosów NIE_POMOCNYCH. Dochodzimy więc do tego samego wniosku: pierwsi odbiorcy Notes ocenili Notes bardziej pozytywnie, podczas gdy kolejni odbiorcy Notes ocenili go mniej przychylnie, więc jego oceny zaczynały się od wyższych i z czasem spadały.

Niestety, trudno wyjaśnić, w jaki sposób Notes zmienił status: nie jest to prosta sprawa: „poprzednio miał ocenę powyżej 0,40, teraz ma ocenę poniżej 0,40, więc został usunięty”. Zamiast tego duża liczba odpowiedzi NOT_HELPFUL uruchamia jeden z warunków wyjątku, zwiększając wynik przydatności, który program Notes musi utrzymać powyżej progu.

To kolejna świetna okazja do nauki, która daje nam lekcję: uczynienie godnego zaufania neutralnego algorytmu naprawdę godnym zaufania wymaga zachowania prostoty. Jeżeli Notatka zmienia się z zaakceptowanej na niezaakceptowaną, powinna istnieć prosta i jasna historia wyjaśniająca, dlaczego tak się dzieje.

Oczywiście istnieje zupełnie inny sposób manipulowania tym głosowaniem: brygadowanie. Osoba, która zobaczy Notatkę, której nie akceptuje, może poprosić bardzo zaangażowaną społeczność (lub, co gorsza, legion fałszywych kont), aby oceniła ją jako NIE_POMOCNA, a przeniesienie Notatek z „Przydatnych” do „ekstremalnych” może nie wymagać zbyt wielu głosów. Aby właściwie zmniejszyć podatność algorytmu na takie skoordynowane ataki, potrzeba więcej analiz i pracy. Możliwym ulepszeniem byłoby uniemożliwienie żadnemu użytkownikowi głosowania na jakiekolwiek Notatki, ale zamiast tego losowe przydzielanie Notatek oceniającym w sposób zalecany przez algorytm „Dla Ciebie” i pozwalanie oceniającym jedynie na ocenianie tych Notatek, do których zostali przydzieleni.

Czy Notatki Społeczności nie są wystarczająco „odważne”?

Główna krytyka, jaką widzę pod adresem Notatek społecznościowych, dotyczy tego, że nie wystarczają. Widziałem dwa ostatnie artykuły, które o tym wspominały. Cytując jeden z artykułów:

Program ma poważne ograniczenie, polegające na tym, że aby notatki społeczności były publiczne, muszą zostać powszechnie zaakceptowane w drodze konsensusu ludzi z całego spektrum politycznego.

„Musi istnieć konsensus ideologiczny” – powiedział. „Oznacza to, że ludzie po lewej i prawej stronie muszą zgodzić się, że notatka musi zostać dołączona do tweeta”.

Zasadniczo, powiedział, wymaga to „międzyideologicznego porozumienia co do prawdy, co jest prawie niemożliwe do osiągnięcia w coraz bardziej stronniczym środowisku”.

To trudne pytanie, ale ostatecznie jestem skłonny sądzić, że lepiej jest swobodnie rozpowszechniać dziesięć tweetów zawierających dezinformację, niż jeden tweet z nieuczciwymi adnotacjami. Przez lata sprawdzaliśmy fakty. Jest to odważne i prowadzone z perspektywy „właściwie znamy prawdę, wiemy, że jedna strona kłamie częściej niż druga”. Jaki będzie wynik?

Szczerze mówiąc, panuje dość powszechna nieufność do koncepcji sprawdzania faktów. Oto strategia, która mówi: ignoruj ​​krytykę, pamiętaj, że eksperci weryfikujący fakty naprawdę znają fakty lepiej niż jakikolwiek system głosowania i trzymaj się go. Jednak pójście na całość w ramach tego podejścia wydaje się ryzykowne. Budowanie instytucji międzyplemiennych, które będą szanowane przez wszystkich, przynajmniej w pewnym stopniu, ma wartość. Podobnie jak maksyma Williama Blackstone’a i sądy, uważam, że utrzymanie tego szacunku wymaga systemu, który popełnia błędy przez zaniechanie, a nie aktywnie. Wydaje mi się zatem, że warto, aby przynajmniej jedna duża organizacja wybrała inną ścieżkę i traktowała swój rzadki szacunek międzyplemienny jako cenny zasób.

Innym powodem, dla którego uważam, że notatki społeczności są w porządku, jeśli są konserwatywne, jest to, że nie sądzę, że każdy tweet wprowadzający w błąd, a nawet większość tweetów zawierających dezinformację, powinien otrzymać notatkę korygującą. Mimo że mniej niż jeden procent tweetów zawierających dezinformację otrzymuje adnotacje zawierające kontekst lub sprostowanie, Notatki społeczności nadal stanowią niezwykle cenną usługę jako narzędzie edukacyjne. Celem nie jest poprawianie wszystkiego; raczej przypomnienie ludziom, że istnieje wiele punktów widzenia, że ​​niektóre posty, które wydają się przekonujące i angażujące w pojedynkę, są w rzeczywistości całkowicie błędne i że tak, zazwyczaj możesz przeprowadzić podstawowe wyszukiwanie w Internecie aby sprawdzić, czy jest to błędne.

Notatki społecznościowe nie mogą być i nie mają być panaceum na wszystkie problemy epistemologii publicznej. Niezależnie od tego, jakich problemów nie rozwiąże, jest mnóstwo miejsca na inne mechanizmy, które mogą je wypełnić, niezależnie od tego, czy jest to nowomodny gadżet, taki jak rynek prognostyczny, czy też organizacja o ugruntowanej pozycji zatrudniająca pełnoetatowych pracowników ze specjalistyczną wiedzą dziedzinową, która może spróbować wypełnić luki.

podsumowując

Community Notes to nie tylko fascynujący eksperyment z mediami społecznościowymi, ale także przykład fascynującego, wyłaniającego się rodzaju konstrukcji mechanizmu: mechanizmów, które świadomie starają się identyfikować skrajności i mają tendencję do promowania przekraczania granic, a nie utrwalania podziałów.

Dwa inne przykłady w tej kategorii, o których wiem, to: (i) mechanizm wtórnego finansowania parami stosowany w grantach Gitcoin oraz (ii) Polis, narzędzie do dyskusji, które wykorzystuje algorytmy grupowania, aby pomóc społeczności zidentyfikować wspólne popularne stwierdzenia obejmujące ludzi którzy często mają odmienne poglądy. Ten obszar projektowania mechanizmów jest cenny i mam nadzieję, że zobaczymy więcej prac akademickich w tej dziedzinie.

Algorytmiczna przejrzystość zapewniana przez Community Notes nie jest dokładnie taka sama, jak w przypadku w pełni zdecentralizowanych mediów społecznościowych – jeśli nie zgadzasz się ze sposobem działania Community Notes, nie ma możliwości przeglądania tej samej treści za pomocą innego algorytmu. Jest to jednak najbliższy wynik, jaki aplikacje hiperskalowe osiągną w ciągu najbliższych kilku lat i widzimy, że już zapewnia to dużą wartość, zarówno w zakresie zapobiegania scentralizowanej manipulacji, jak i zapewniania, że ​​platformy, które nie angażują się w takie manipulacje, zostaną docenione .

Nie mogę się doczekać, aż Notatki społeczności i wiele algorytmów o podobnym duchu będą się rozwijać i rozwijać w ciągu następnej dekady.