Twitter (X) đã có hai năm đầy biến động. Năm ngoái, Elon Musk đã mua nền tảng này với giá 44 tỷ USD, sau đó đại tu lại đội ngũ nhân sự, kiểm duyệt nội dung, mô hình kinh doanh và văn hóa trang web của công ty. Những thay đổi này có thể liên quan nhiều đến quyền lực mềm của Elon Musk hơn là các quyết định chính sách cụ thể. Tuy nhiên, giữa những hành động gây tranh cãi này, một tính năng mới trên Twitter đã nhanh chóng trở nên quan trọng và dường như được mọi người trong các chính trường yêu thích: Ghi chú của cộng đồng.

Ghi chú cộng đồng là một công cụ kiểm tra tính xác thực, đôi khi thêm ghi chú theo ngữ cảnh vào các tweet, chẳng hạn như dòng tweet của Elon Musk ở trên, như một công cụ kiểm tra tính xác thực và chống lại thông tin sai lệch. Ban đầu nó được gọi là Birdwatch và ra mắt lần đầu tiên như một dự án thử nghiệm vào tháng 1 năm 2021. Kể từ đó, nó đã dần dần mở rộng, với tốc độ mở rộng nhanh nhất trùng với thời điểm Elon Musk tiếp quản Twitter vào năm ngoái. Ghi chú cộng đồng xuất hiện thường xuyên trong số các tweet nhận được sự chú ý rộng rãi trên Twitter những ngày này, bao gồm cả những tweet đề cập đến các chủ đề chính trị gây tranh cãi. Theo quan điểm của tôi và kết luận của tôi sau khi nói chuyện với nhiều người thuộc các chính trường khác nhau, những Ghi chú này mang tính thông tin và có giá trị khi chúng xuất hiện.

Tuy nhiên, điều khiến tôi quan tâm nhất là Ghi chú cộng đồng, mặc dù không phải là một "dự án tiền điện tử" nhưng có lẽ là ví dụ gần nhất về "giá trị tiền điện tử" mà chúng tôi từng thấy trong thế giới chính thống. Ghi chú Cộng đồng không được viết hoặc quản lý bởi một số chuyên gia được lựa chọn tập trung; thay vào đó, bất kỳ ai cũng có thể viết và bỏ phiếu, và Ghi chú nào xuất hiện hoặc không xuất hiện hoàn toàn được xác định bằng thuật toán nguồn mở. Trang web Twitter có hướng dẫn chi tiết và toàn diện mô tả cách hoạt động của thuật toán và bạn có thể tải xuống dữ liệu chứa các ghi chú và cuộc thăm dò đã xuất bản, chạy thuật toán cục bộ và xác minh rằng kết quả đầu ra khớp với những gì hiển thị trên trang web Twitter. Mặc dù không hoàn hảo nhưng nó gần với lý tưởng về tính trung lập đáng tin cậy trong những tình huống gây tranh cãi và đồng thời rất hữu ích.

Thuật toán Ghi chú cộng đồng hoạt động như thế nào?

Bất kỳ ai có tài khoản Twitter đáp ứng các tiêu chí nhất định (về cơ bản: hoạt động trên 6 tháng, không vi phạm chính sách, số điện thoại di động đã được xác minh) đều có thể đăng ký tham gia Ghi chú cộng đồng. Hiện tại, những người tham gia đang được chấp nhận dần dần và ngẫu nhiên, nhưng cuối cùng kế hoạch là cho phép bất kỳ ai đủ điều kiện tham gia. Sau khi được chấp nhận, trước tiên bạn có thể tham gia xếp hạng Ghi chú hiện có và khi xếp hạng của bạn đủ tốt (được đo bằng cách xem xếp hạng nào khớp với kết quả cuối cùng cho Ghi chú đó), bạn cũng có thể viết Ghi chú của riêng mình.

Khi bạn viết Ghi chú, Ghi chú sẽ nhận được điểm dựa trên đánh giá của các thành viên Ghi chú Cộng đồng khác. Những đánh giá này có thể được coi là các phiếu bầu theo ba cấp độ "hữu ích", "phần nào hữu ích" và "không hữu ích", nhưng các đánh giá cũng có thể bao gồm các nhãn khác đóng vai trò trong thuật toán. Dựa trên những đánh giá này, Notes sẽ được cho điểm. Nếu điểm của ghi chú vượt quá 0,40 thì ghi chú sẽ được hiển thị; nếu không, ghi chú sẽ không được hiển thị.

Điều độc đáo về thuật toán là cách tính điểm. Không giống như các thuật toán đơn giản, được thiết kế để chỉ tính toán một số loại tổng hoặc trung bình xếp hạng của người dùng và sử dụng kết quả đó làm kết quả cuối cùng, thuật toán xếp hạng Ghi chú cộng đồng cố gắng ưu tiên rõ ràng những người đã nhận được đánh giá tích cực từ những người có quan điểm khác nhau. Nghĩa là, nếu những người thường không đồng ý về xếp hạng cuối cùng lại đồng ý về một Ghi chú cụ thể thì Ghi chú đó sẽ được đánh giá cao.

Chúng ta hãy xem xét kỹ hơn cách nó hoạt động. Chúng ta có một tập hợp người dùng và một tập hợp Ghi chú; chúng ta có thể tạo ma trận M trong đó ô Mij thể hiện cách người dùng thứ i xếp hạng Ghi chú thứ j.

Đối với bất kỳ Ghi chú cụ thể nào, hầu hết người dùng đều chưa xếp hạng Ghi chú đó, vì vậy hầu hết các mục trong ma trận sẽ bằng 0, nhưng điều đó không sao cả. Mục tiêu của thuật toán là tạo mô hình bốn cột về người dùng và Ghi chú, chỉ định hai số liệu thống kê cho mỗi người dùng mà chúng tôi có thể gọi là "sự thân thiện" và "sự phân cực" và hai số liệu thống kê cho mỗi Ghi chú mà chúng tôi gọi là "sự hữu ích". " và "sự phân cực". Mô hình cố gắng dự đoán ma trận dưới dạng hàm của các giá trị này bằng cách sử dụng công thức sau:

Lưu ý rằng ở đây tôi trình bày thuật ngữ được sử dụng trong bài báo Birdwatch, cũng như thuật ngữ của riêng tôi để cung cấp sự hiểu biết trực quan hơn về ý nghĩa của các biến mà không liên quan đến các khái niệm toán học:

  • μ là thông số "cảm xúc của công chúng" đo lường mức độ xếp hạng chung của người dùng.

  • iu là "sự thân thiện" của người dùng, tức là khả năng người dùng có xu hướng đánh giá cao.

  • ở đây là "tính hữu dụng" của Notes, tức là khả năng Notes sẽ được đánh giá cao như thế nào. Đây là biến chúng tôi quan tâm.

  • fu hoặc fn là "phân cực" của người dùng hoặc Ghi chú, tức là vị trí của họ trên trục thống trị của các cực đoan chính trị. Trong thực tế, phân cực âm gần như có nghĩa là "nghiêng trái" và phân cực dương có nghĩa là "nghiêng sang phải", nhưng xin lưu ý rằng các trục cực trị được rút ra bằng cách phân tích dữ liệu người dùng và Ghi chú, đồng thời các khái niệm về trái và phải không được mã hóa cứng.

Thuật toán sử dụng mô hình học máy khá cơ bản (giảm độ dốc tiêu chuẩn) để tìm các giá trị biến tốt nhất để dự đoán giá trị ma trận. Tính hữu ích được gán cho một Ghi chú cụ thể là điểm cuối cùng cho Ghi chú đó. Một Ghi chú sẽ được hiển thị nếu mức độ hữu ích của nó ít nhất là +0,4.

Điểm thông minh cốt lõi ở đây là "sự phân cực" hấp thụ các đặc điểm của một chiếc Note khiến nó được một số người dùng thích và một số người khác không thích, trong khi "sự hữu ích" chỉ đo lường các đặc điểm của một chiếc Note khiến cho nó được tất cả mọi người thích. người dùng. Do đó, việc chọn tính hữu dụng sẽ xác định các Ghi chú được các bộ lạc tán thành và loại trừ các Ghi chú được bộ lạc này cổ vũ nhưng bị bộ tộc khác phẫn nộ.

Ở trên chỉ mô tả phần cốt lõi của thuật toán. Trên thực tế, có rất nhiều cơ chế bổ sung được thêm vào. May mắn thay, chúng được mô tả trong tài liệu công khai. Các cơ chế này bao gồm:

  • Thuật toán được chạy nhiều lần, mỗi lần thêm một số "phiếu giả" cực đoan được tạo ngẫu nhiên vào phiếu bầu. Điều này có nghĩa là đầu ra thực sự của thuật toán cho mỗi Ghi chú là một phạm vi giá trị và kết quả cuối cùng phụ thuộc vào "độ tin cậy thấp hơn" được lấy từ phạm vi đó và được so sánh với ngưỡng 0,32.

  • Nếu nhiều người dùng (đặc biệt là những người có tính phân cực Ghi chú) xếp hạng Ghi chú là "Không hữu ích" và họ cũng gán cùng một "thẻ" (ví dụ: "ngôn ngữ tranh luận hoặc thiên vị", "nguồn bất thường") thì "Ghi chú hỗ trợ") là lý do xếp hạng thì ngưỡng hữu ích cần thiết để Ghi chú được xuất bản sẽ tăng từ 0,4 lên 0,5 (điều này có vẻ nhỏ nhưng lại rất quan trọng trong thực tế).

  • Nếu một Ghi chú được chấp nhận, tính hữu dụng của nó phải giảm xuống 0,01 điểm dưới ngưỡng cần thiết để chấp nhận Ghi chú đó.

  • Thuật toán thực hiện nhiều lần chạy hơn bằng cách sử dụng nhiều mô hình, đôi khi tăng cường Ghi chú với điểm hữu ích thô trong khoảng từ 0,3 đến 0,4.

Nói chung, bạn nhận được một số mã Python khá phức tạp với tổng cộng 6282 dòng trải rộng trên 22 tệp. Nhưng tất cả đều mở và bạn có thể tải xuống Ghi chú cũng như dữ liệu tính điểm và tự chạy nó để xem liệu kết quả đầu ra có khớp với những gì thực sự xảy ra trên Twitter hay không.

Vậy điều này trông như thế nào trong thực tế?

Có lẽ sự khác biệt lớn nhất giữa thuật toán này và việc lấy điểm trung bình từ phiếu bầu của mọi người là khái niệm về cái mà tôi gọi là giá trị "cực". Tài liệu thuật toán gọi chúng là fu và fn, sử dụng f làm hệ số vì hai thuật ngữ này nhân với nhau; thuật ngữ tổng quát hơn một phần là do mong muốn cuối cùng làm cho fu và fn trở nên đa chiều.

Phân cực được gán cho người dùng và Ghi chú. Liên kết giữa ID người dùng và tài khoản Twitter cơ bản được cố ý giữ bí mật, nhưng Ghi chú là công khai. Trên thực tế, ít nhất là đối với tập dữ liệu tiếng Anh, độ phân cực do thuật toán tạo ra có mối tương quan rất chặt chẽ với bên trái và bên phải.

Dưới đây là một số ví dụ về Ghi chú có độ phân cực khoảng -0,8:

Lưu ý rằng tôi không chọn anh đào ở đây; đây thực sự là ba hàng đầu tiên trong bảng tính Scored_notes.tsv mà tôi đã tạo khi chạy thuật toán cục bộ và điểm phân cực của chúng (được gọi là coreNoteFactor1 trong bảng tính) nhỏ hơn - 0,8.

Bây giờ, đây là một số Ghi chú có độ phân cực khoảng +0,8. Hóa ra nhiều người trong số họ là những người đang nói về chính trị Brazil bằng tiếng Bồ Đào Nha hoặc những người hâm mộ Tesla đang giận dữ bác bỏ những lời chỉ trích về Tesla, vì vậy hãy để tôi chọn lọc một chút và tìm một số Ghi chú không thuộc cả hai loại:

Một lần nữa, xin nhắc lại, "sự phân chia trái và phải" không được mã hóa cứng vào thuật toán theo bất kỳ cách nào mà nó được phát hiện bằng tính toán. Điều này cho thấy rằng nếu bạn áp dụng thuật toán này cho các bối cảnh văn hóa khác, nó có thể tự động phát hiện sự chia rẽ chính trị chính của chúng và xây dựng cầu nối giữa những sự chia rẽ đó.

Trong khi đó, Ghi chú để có được sự hữu ích tối đa sẽ trông như thế này. Lần này, vì Ghi chú thực sự hiển thị trên Twitter nên tôi chỉ có thể chụp ảnh màn hình:

Có một cái khác:

Đối với Ghi chú thứ hai, nó đề cập trực tiếp hơn đến các chủ đề chính trị mang tính đảng phái cao, nhưng đây là Ghi chú rõ ràng, chất lượng cao và nhiều thông tin nên được đánh giá cao. Nhìn chung, thuật toán dường như hoạt động và có vẻ khả thi khi xác minh đầu ra của thuật toán bằng cách chạy mã.

Tôi nghĩ gì về thuật toán này?

Điều làm tôi ấn tượng nhất khi phân tích thuật toán này là độ phức tạp của nó. Có một "phiên bản giấy hàn lâm" sử dụng phương pháp giảm độ dốc để tìm ra phương trình vectơ và ma trận năm số hạng phù hợp nhất, sau đó là phiên bản thực, một chuỗi thực hiện phức tạp của thuật toán với nhiều cách thực hiện khác nhau và rất nhiều sự tùy ý. hệ số cách.

Ngay cả phiên bản bài báo học thuật cũng che giấu sự phức tạp tiềm ẩn. Phương trình mà nó tối ưu hóa là bậc bốn âm (vì có một số hạng bậc hai fu*fn trong công thức dự đoán và hàm chi phí đo bình phương của sai số). Mặc dù tối ưu hóa phương trình bậc hai với số lượng biến bất kỳ hầu như sẽ luôn có một nghiệm duy nhất mà bạn có thể tìm ra bằng đại số tuyến tính khá cơ bản, tối ưu hóa phương trình bậc bốn với nhiều biến thường có nhiều nghiệm, do đó có nhiều vòng thuật toán giảm độ dốc khác nhau có thể thu được câu trả lời. Những thay đổi đầu vào nhỏ có thể khiến mức giảm chuyển từ mức tối thiểu cục bộ này sang mức tối thiểu cục bộ khác, làm thay đổi đáng kể kết quả đầu ra.

Đối với tôi, sự khác biệt giữa điều này và các thuật toán mà tôi đã giúp phát triển, như tài chính thứ cấp, giống như sự khác biệt giữa thuật toán của nhà kinh tế và thuật toán của kỹ sư. Các thuật toán của các nhà kinh tế, trong trường hợp tốt nhất, tập trung vào sự đơn giản, tương đối dễ phân tích và có các tính chất toán học rõ ràng, chỉ ra rằng đó là cách tốt nhất (hoặc ít tệ nhất) để giải quyết vấn đề và lý tưởng nhất là nó cũng có thể được chứng minh. Ai đó có thể gây ra bao nhiêu thiệt hại khi cố gắng khai thác nó. Mặt khác, thuật toán của kỹ sư được hình thành thông qua quá trình thử và sai lặp đi lặp lại để xem điều gì hiệu quả và điều gì không hiệu quả trong môi trường hoạt động của kỹ sư. Các thuật toán của các kỹ sư rất thực dụng và hoàn thành công việc; các thuật toán của các nhà kinh tế không hoàn toàn mất kiểm soát khi gặp phải những tình huống bất ngờ.

Hoặc, như nhà triết học internet đáng kính roon (hay còn gọi là tszzl) đã đưa nó vào một chủ đề liên quan:

Tất nhiên, tôi sẽ nói rằng khía cạnh "thẩm mỹ lý thuyết" của tiền điện tử là cần thiết để có thể phân biệt chính xác giữa các giao thức thực sự không đáng tin cậy và những giao thức có vẻ tốt và hoạt động tốt trên bề mặt nhưng thực sự đòi hỏi sự tin tưởng vào một tác nhân tập trung nào đó, Hoặc thậm chí tệ hơn, nó có thể là một trò lừa đảo hoàn toàn.

Học sâu có hiệu quả trong các trường hợp bình thường, nhưng nó có những điểm yếu không thể tránh khỏi trong các cuộc tấn công học máy đối nghịch khác nhau. Nếu thực hiện tốt, các bẫy kỹ thuật và thang trừu tượng cấp cao có thể chống lại các cuộc tấn công này. Vì vậy, tôi có một câu hỏi: Liệu chúng ta có thể biến bản thân Ghi chú cộng đồng thành một thứ gì đó giống một thuật toán kinh tế hơn không?

Để xem điều này có ý nghĩa gì trong thực tế, hãy cùng khám phá một thuật toán mà tôi đã thiết kế cách đây vài năm với mục đích tương tự: Cấp vốn bậc hai giới hạn theo cặp.

Mục tiêu của việc cấp vốn bậc hai có giới hạn theo cặp là lấp đầy lỗ hổng trong cấp vốn bậc hai "thông thường", theo đó, ngay cả khi hai người tham gia thông đồng với nhau, họ vẫn có thể đóng góp số tiền rất cao cho một dự án giả, trả lại tiền cho họ và Nhận số tiền lớn. trợ cấp làm cạn kiệt toàn bộ nguồn vốn. Trong cấp vốn bậc hai giới hạn theo cặp, chúng tôi phân bổ ngân sách giới hạn M cho mỗi cặp tác nhân. Thuật toán lặp qua tất cả các cặp tác nhân có thể có và nếu thuật toán quyết định thêm trợ cấp cho một dự án P nhất định vì cả tác nhân A và tác nhân B đều hỗ trợ dự án đó, thì khoản trợ cấp này sẽ được khấu trừ khỏi ngân sách phân bổ cho cặp (A, B). ) . Do đó, ngay cả khi k người tham gia thông đồng thì số tiền họ có thể đánh cắp từ cơ chế tối đa là k(k-1)M.

Dạng thuật toán này không hoạt động tốt trong bối cảnh Ghi chú cộng đồng vì mỗi người dùng chỉ bỏ một số phiếu bầu nhỏ: trung bình, số phiếu bầu chung giữa hai người dùng bất kỳ là 0, vì vậy chỉ cần xem xét từng cặp riêng lẻ Người dùng, thuật toán không thể hiểu được sự phân cực của người dùng. Mục tiêu của mô hình học máy chính xác là cố gắng "điền vào" một ma trận từ dữ liệu nguồn rất thưa thớt không thể phân tích trực tiếp theo cách này. Nhưng thách thức với cách tiếp cận này là cần phải nỗ lực nhiều hơn để tránh những kết quả có tính biến động cao khi đối mặt với một số lượng nhỏ phiếu bầu không tốt.

Ghi chú cộng đồng có thể thực sự đứng về phía bên trái và bên phải không?

Chúng tôi có thể phân tích xem thuật toán Ghi chú cộng đồng có thực sự có khả năng chống lại các thái cực hay không, tức là liệu nó có hoạt động tốt hơn thuật toán bỏ phiếu đơn giản hay không. Thuật toán bỏ phiếu này đã chống lại các cực đoan ở một mức độ nhất định: một bài đăng có 200 lượt thích và 100 lượt không thích sẽ hoạt động kém hơn một bài đăng chỉ có 200 lượt thích. Nhưng Ghi chú cộng đồng có làm tốt hơn không?

Từ góc độ thuật toán trừu tượng, thật khó để nói. Tại sao một bài viết phân cực có xếp hạng trung bình cao lại không có tính phân cực mạnh mẽ và tính hữu ích cao? Ý tưởng là nếu những phiếu bầu đó xung đột nhau thì phe phân cực nên “tiếp thu” những đặc điểm khiến bài đăng nhận được nhiều phiếu bầu, nhưng thực tế nó có làm được điều đó không?

Để kiểm tra điều này, tôi đã chạy triển khai đơn giản hóa của riêng mình trong 100 vòng. Kết quả trung bình như sau:

Trong thử nghiệm này, Ghi chú "tốt" nhận được xếp hạng +2 trong số những người dùng có cùng đảng phái chính trị và xếp hạng +0 trong số những người dùng thuộc đảng phái chính trị đối lập và Ghi chú "tốt nhưng cực đoan hơn" nhận được xếp hạng +0 trong số những người dùng của cùng một đảng phái chính trị Nó nhận được xếp hạng +4 trong số những người dùng của phe đối lập và đánh giá -2 trong số những người dùng của phe đối lập. Mặc dù điểm trung bình là như nhau nhưng sự phân cực lại khác nhau. Và trên thực tế, mức độ hữu ích trung bình của Notes "tốt" dường như cao hơn so với Notes "tốt nhưng cực kỳ nghiêng".

Việc có một thuật toán gần hơn với “Thuật toán của nhà kinh tế” sẽ có câu chuyện rõ ràng hơn về cách thuật toán trừng phạt các thái cực.

Tất cả những điều này hữu ích như thế nào trong các tình huống rủi ro cao?

Chúng ta có thể học được một số điều này bằng cách xem xét một tình huống cụ thể. Khoảng một tháng trước, Ian Bremmer phàn nàn rằng một Ghi chú cộng đồng có tính chỉ trích cao đã được thêm vào một dòng tweet về một quan chức chính phủ Trung Quốc, nhưng Ghi chú đó đã bị xóa kể từ đó.

Đây là một nhiệm vụ khó khăn. Việc thiết kế cơ chế trong môi trường cộng đồng Ethereum là một việc, nơi khiếu nại lớn nhất có thể chỉ là 20.000 đô la dành cho một người có ảnh hưởng cực đoan trên Twitter. Tình hình hoàn toàn khác khi đề cập đến các vấn đề chính trị và địa chính trị ảnh hưởng đến hàng triệu người, nơi mọi người thường giả định một cách hợp lý những động cơ tồi tệ nhất. Tuy nhiên, việc tương tác với những môi trường có tính rủi ro cao này là điều cần thiết nếu các nhà thiết kế cơ khí muốn tạo ra tác động đáng kể đến thế giới.

Trong trường hợp của Twitter, có lý do rõ ràng để nghi ngờ thao túng tập trung là nguyên nhân khiến Notes bị xóa: Elon Musk có rất nhiều lợi ích kinh doanh ở Trung Quốc, nên có thể Elon Musk đã ép nhóm Community Notes can thiệp vào đầu ra của thuật toán và loại bỏ nó Ghi chú cụ thể này.

May mắn thay, thuật toán này là nguồn mở và có thể kiểm chứng được, vì vậy chúng tôi thực sự có thể tìm hiểu kỹ về nó! Làm thôi nào. URL của tweet gốc là https://twitter.com/MFA_China/status/1676157337109946369. Số 1676157337109946369 ở cuối là ID của tweet. Chúng ta có thể tìm kiếm ID này trong dữ liệu có thể tải xuống và xác định hàng cụ thể trong bảng tính có Ghi chú trên:

Ở đây chúng ta nhận được ID của Notes, 1676391378815709184. Sau đó, chúng tôi tìm kiếm ID đó trong các tệp Score_notes.tsv và note_status_history.tsv được tạo bằng cách chạy thuật toán. Chúng tôi đã nhận được kết quả sau:

Cột thứ hai ở đầu ra đầu tiên là xếp hạng hiện tại cho Ghi chú đó. Đầu ra thứ hai hiển thị lịch sử của Ghi chú: trạng thái hiện tại của nó nằm ở cột bảy (NEEDS_MORE_RATINGS) và trạng thái đầu tiên nó nhận được trước đó không phải là NEEDS_MORE_RATINGS nằm ở cột năm (CURRENTLY_RATED_HELPFUL). Vì vậy, chúng ta có thể thấy rằng bản thân thuật toán lần đầu tiên hiển thị ghi chú và sau đó xóa nó sau khi xếp hạng của nó giảm nhẹ - dường như không có bất kỳ sự can thiệp trung tâm nào liên quan.

Chúng ta cũng có thể nhìn vấn đề này theo một cách khác bằng cách nhìn vào chính cuộc bỏ phiếu. Chúng tôi có thể quét tệp rating-00000.tsv để tách biệt tất cả xếp hạng cho Ghi chú đó và xem có bao nhiêu được xếp hạng HỮU ÍCH và KHÔNG_HELPFUL:

Tuy nhiên, nếu bạn sắp xếp chúng theo dấu thời gian và nhìn vào 50 phiếu bầu đầu tiên, bạn sẽ thấy rằng có 40 phiếu bầu HỮU ÍCH và 9 phiếu KHÔNG HỖ TRỢ. Vì vậy, chúng tôi đi đến cùng một kết luận: Khán giả ban đầu của Notes đánh giá Notes tích cực hơn, trong khi những khán giả tiếp theo của Notes đánh giá phim kém ưu ái hơn, vì vậy xếp hạng của nó bắt đầu cao hơn và giảm dần theo thời gian.

Thật không may, thật khó để giải thích chính xác cách Notes thay đổi trạng thái: vấn đề không đơn giản là "trước đây nó được xếp hạng trên 0,40, bây giờ nó được xếp hạng dưới 0,40 nên đã bị xóa". Thay vào đó, một số lượng lớn câu trả lời NOT_HELPFUL sẽ kích hoạt một trong các điều kiện ngoại lệ, làm tăng điểm hữu dụng mà Ghi chú cần để duy trì trên ngưỡng.

Đây là một cơ hội học tập tuyệt vời khác dạy cho chúng ta một bài học: để tạo ra một thuật toán trung lập đáng tin cậy thực sự đáng tin cậy đòi hỏi phải giữ nó đơn giản. Nếu một Ghi chú chuyển từ được chấp nhận sang không được chấp nhận thì cần có một câu chuyện đơn giản và rõ ràng giải thích lý do tại sao lại như vậy.

Tất nhiên, có một cách hoàn toàn khác để thao túng cuộc bỏ phiếu này: Lữ đoàn. Ai đó nhìn thấy Ghi chú mà họ không chấp thuận có thể kêu gọi cộng đồng có mức độ tương tác cao (hoặc tệ hơn là vô số tài khoản giả mạo) đánh giá nó KHÔNG_HELPFUL và có thể không cần quá nhiều phiếu bầu để chuyển Ghi chú từ " Hữu ích" trở nên "cực đoan". Cần phải phân tích và làm việc nhiều hơn để giảm thiểu lỗ hổng của thuật toán trước các cuộc tấn công phối hợp như vậy một cách hợp lý. Một cải tiến có thể có là không cho phép bất kỳ người dùng nào bỏ phiếu cho bất kỳ Ghi chú nào mà thay vào đó chỉ định ngẫu nhiên Ghi chú cho người xếp hạng theo cách được thuật toán "Dành cho bạn" đề xuất và chỉ cho phép người xếp hạng xếp hạng những Ghi chú mà họ đã được chỉ định.

Ghi chú cộng đồng chưa đủ “dũng cảm”?

Những lời chỉ trích chính mà tôi thấy về Ghi chú cộng đồng về cơ bản là nó chưa đủ hiệu quả. Tôi thấy hai bài báo gần đây đề cập đến điều này. Để trích dẫn một trong những bài viết:

Chương trình này có một hạn chế nghiêm trọng, đó là để Ghi chú của Cộng đồng được công khai, nó phải được chấp nhận rộng rãi bởi sự đồng thuận của mọi người trong mọi lĩnh vực chính trị.

“Nó phải có sự đồng thuận về ý thức hệ,” ông nói. "Điều đó có nghĩa là những người ở bên trái và những người ở bên phải phải đồng ý rằng ghi chú phải được đính kèm với dòng tweet."

Ông nói, về cơ bản, nó đòi hỏi “sự đồng thuận giữa các hệ tư tưởng về sự thật, điều gần như không thể đạt được trong một môi trường ngày càng có nhiều đảng phái”.

Đó là một câu hỏi khó, nhưng cuối cùng tôi có xu hướng nghĩ rằng thà có mười dòng tweet chứa thông tin sai lệch được lan truyền một cách tự do còn hơn là có một dòng tweet được chú thích một cách không công bằng. Chúng ta đã chứng kiến ​​nhiều năm kiểm tra sự thật, và điều đó thật dũng cảm, và đó là từ quan điểm "thực sự chúng ta biết sự thật, chúng ta biết một bên nói dối thường xuyên hơn bên kia." Kết quả sẽ như thế nào?

Thành thật mà nói, có một sự nghi ngờ khá phổ biến đối với khái niệm xác minh sự thật. Đây là một chiến lược có nội dung: Bỏ qua những lời chỉ trích, hãy nhớ rằng các chuyên gia kiểm tra sự thật thực sự biết rõ sự thật hơn bất kỳ hệ thống bỏ phiếu nào và kiên trì với nó. Nhưng dốc toàn lực vào cách tiếp cận này có vẻ nguy hiểm. Có giá trị trong việc xây dựng các thể chế liên bộ lạc được tất cả mọi người tôn trọng ít nhất ở một mức độ nào đó. Giống như câu châm ngôn của William Blackstone và các tòa án, tôi cảm thấy rằng việc duy trì sự tôn trọng đó đòi hỏi một hệ thống mắc sai lầm do thiếu sót hơn là chủ động. Vì vậy, đối với tôi, có vẻ như có giá trị khi ít nhất một tổ chức lớn đi theo con đường khác biệt này và coi sự tôn trọng xuyên bộ lạc hiếm có của mình như một nguồn tài nguyên quý giá.

Một lý do khác khiến tôi nghĩ rằng Ghi chú cộng đồng nên thận trọng là không sao vì tôi không nghĩ mọi tweet có thông tin sai lệch hoặc thậm chí hầu hết các tweet có thông tin sai lệch đều sẽ nhận được ghi chú khắc phục. Mặc dù chưa đến 1% số tweet có thông tin sai lệch nhận được chú thích cung cấp ngữ cảnh hoặc chỉnh sửa, Community Notes vẫn cung cấp một dịch vụ cực kỳ có giá trị như một công cụ giáo dục. Mục đích không phải là sửa chữa mọi thứ; mà mục đích là để nhắc nhở mọi người rằng có nhiều quan điểm, rằng một số bài đăng có vẻ thuyết phục và thu hút một cách riêng lẻ thực sự khá sai và rằng bạn, vâng, bạn thường có thể thực hiện Tìm kiếm cơ bản trên internet để xác minh rằng nó sai.

Ghi chú của Cộng đồng không thể, cũng không nhằm mục đích trở thành một liều thuốc chữa bách bệnh cho mọi vấn đề trong nhận thức luận công cộng. Bất kể vấn đề nào nó không giải quyết được, vẫn có rất nhiều chỗ để các cơ chế khác giải quyết, cho dù đó là một tiện ích mới như thị trường dự đoán hay một tổ chức đã thành danh sử dụng nhân viên toàn thời gian có chuyên môn về lĩnh vực có thể cố gắng lấp đầy những khoảng trống.

Tóm lại là

Ghi chú của Cộng đồng không chỉ là một thử nghiệm truyền thông xã hội hấp dẫn mà còn là một ví dụ về một kiểu thiết kế cơ chế mới nổi hấp dẫn: các cơ chế tìm cách xác định các thái cực một cách có ý thức và có xu hướng thúc đẩy việc vượt qua ranh giới thay vì duy trì sự chia rẽ.

Hai ví dụ khác trong danh mục này mà tôi biết là: (i) cơ chế tài trợ thứ cấp theo cặp được sử dụng trong Gitcoin Grants và (ii) Polis, một công cụ thảo luận sử dụng thuật toán phân cụm để giúp cộng đồng xác định các tuyên bố phổ biến phổ biến dành cho mọi người những người thường có quan điểm khác nhau. Lĩnh vực thiết kế cơ chế này rất có giá trị và tôi hy vọng chúng ta sẽ thấy nhiều công trình học thuật hơn trong lĩnh vực này.

Tính minh bạch về thuật toán do Ghi chú cộng đồng cung cấp không hoàn toàn giống với phương tiện truyền thông xã hội phi tập trung hoàn toàn - nếu bạn không đồng ý với cách thức hoạt động của Ghi chú cộng đồng thì không có cách nào để xem cùng một nội dung thông qua một thuật toán khác. Nhưng đây là lần gần nhất mà các ứng dụng siêu quy mô sẽ có được trong vài năm tới và chúng ta có thể thấy rằng nó đã mang lại rất nhiều giá trị, cả trong việc ngăn chặn thao túng tập trung và đảm bảo rằng các nền tảng không tham gia vào thao túng như vậy sẽ được công nhận. .

Tôi mong muốn được thấy Ghi chú cộng đồng và nhiều thuật toán có tinh thần tương tự phát triển và tăng trưởng trong thập kỷ tới.