你無法管理你無法測量的事物。@OpenLedger 衡量一切,而區塊鏈永不遺忘。
我上週和一家金融公司的合規官聊過,她說了一句讓我印象深刻的話:"我們使用人工智能模型來做出關於信用、貸款和人類生活的決策。當我問供應商他們是如何運作時,我得到的只是一個PowerPoint和一個承諾。" 這就是我們在人工智能監督方面的現狀。我們建立了影響數十億決策的系統,而審計機制卻沒有跟上。
問題不是監管者不關心,而是他們無法驗證他們應該監督的內容。模型開發者可以告訴你他們的人工智能是公平的、可解釋的、無偏見的。但是你如何檢查呢?你需要訪問訓練數據、每個階段的確切權重、每個預處理決策、在不同條件下的驗證指標。大多數公司不會分享這些。有些無法分享,因爲數據可能是敏感的。還有些沒有基礎設施來展示這些數據。結果是一個以數十億美元計量的信任缺口,無法量化。
歐盟的人工智能法案要求公司證明他們的模型符合規定。他們要求的透明度在規模上還不存在。當我觀察監管環境時,我被需求的具體性所震撼。這不再是哲學問題。監管者提出了具體的問題:你能證明訓練數據沒有偏見嗎?你能展示模型性能何時下降嗎?你能追溯每個決策的輸入嗎?大多數人工智能團隊的回答仍然是不能。
區塊鏈在這裏的重要性不同於以前。它並不使人工智能更準確或更快。它所做的是創建一個無法重寫的審計軌跡。每個訓練步驟,每個數據樣本,每個驗證檢查都被記錄,並帶有時間戳。監管者、審計師、第三方可以獨立驗證。這不是表演。這是基礎。
想想模型訓練。你從數據開始。數據被清理、標準化,也許還會增強。特徵被選擇。模型經過數千次迭代進行訓練。權重發生變化。指標被記錄。然後是驗證。然後是部署。在任何時刻,某些東西都可能引入偏見,降低公平性,或隱藏缺陷。監管者想要一件事:證明以上所有在重要方面都沒有發生。

區塊鏈審計軌跡在每個階段記錄加密哈希(數字指紋)。你哈希訓練數據集。你在每個紀元後哈希模型權重。你哈希驗證結果。每個哈希鏈接到前一個。鏈是防篡改的。如果有人更改訓練數據或之後編輯性能指標,鏈就會斷裂。監管者查看你的賬本時會立即看到這一點。

與數據庫的區別在於去中心化。如果你將審計記錄保存在自己的系統中,你就控制了它們。監管者必須信任你的基礎設施、你的安全性、你的動機。使用區塊鏈,公司不擁有記錄。它分佈在網絡中。多個參與方獨立驗證同一鏈。這很重要。
這些數字是真實的。早期在金融服務領域的試點顯示,基於區塊鏈的審計記錄將合規驗證時間縮短了約40%,審計成本降低了大約30%。爲什麼?審計師不必請求數據,等待響應,驗證格式,手動交叉檢查來源。鏈提供以已經驗證的格式提供所有內容。一家機構將年終審計時間從8周縮短到5周。


當你試圖記錄一些真正有用的東西時,真正的摩擦出現了。原始模型權重是巨大的。一個語言模型有數十億個參數。你不能把所有這些都哈希並存儲在鏈上。所以你哈希壓縮的表示。你單獨存儲數據並記錄哈希。系統的可信度僅取決於哈希函數和存放工件的存儲。比沒有好,但不完美。
另一種壓力正在增加。隨着人工智能被融入招聘、信用、醫療,糟糕結果的法律責任在上升。如果一個模型做出有偏見的決策並被起訴,公司需要證明已採取合理步驟進行審計和驗證。法庭會開始詢問公司是否保持了可驗證的審計記錄。在這種環境中,區塊鏈記錄變得有防禦性。不擁有一個則變得有風險。
良好的基礎設施不會自我宣傳。專門的平臺正在出現,以處理特定要求。它們構建抽象,使數據科學家不必考慮區塊鏈機制。你將模型工件和指標推送到API。它處理哈希、鏈、驗證。開發者的體驗感覺正常。在底層,每一步都被記錄和驗證。
正在變化的是信任的紋理。不是突然轉向完全透明。是朝着通過可驗證記錄獲得穩定、應得的問責制的轉變。監管者看到更好的可視性。公司獲得法律保護。審計師工作更快。記錄是不可變和分佈式的,所以系統變得更難操縱。
有一些值得認真對待的反對論點。想要隱瞞某些事情的公司可以在上游做到這一點。不記錄某些步驟。在哈希之前操縱數據。保留多個訓練運行的版本並僅提交有利的那個。區塊鏈並不能解決人類的不誠實。它使不誠實在規模上更難隱藏。這很重要。這不是絕對保護。
另一個風險是不可變性本身。如果你記錄了某些東西,結果卻是錯誤的,你無法抹去它。你在永久記錄每一個錯誤,每一個失敗的實驗,每一個不成功的模型。一些公司可能不想要那種透明度,特別是在早期許多實驗失敗時。
勢頭是真實的。企業正在轉變,因爲監管者在施壓,責任在上升,審計記錄的成本在下降。問題不在於基於區塊鏈的人工智能審計是否發生,而在於它是否成爲默認,或者僅僅是高端客戶的合規工具。
我記住的是:我們構建人工智能的速度超過了監督它的機制。多年來這沒問題,因爲風險感覺抽象。現在它們變得具體。招聘決策。信用決策。醫療結果。我們所能構建的與我們能驗證的之間的差距已成爲一個負擔。基於區塊鏈的審計軌跡並不能完全填補這個差距。但它們改變了經濟學。它們使透明度比不透明性更便宜。
這就是悄然的革命。不是使人工智能更好的技術,而是使其可驗證的技術。在信任是限制的世界裏,這就足夠了。
@OpenLedger $OPEN #OpenLedger
