Kāpēc tava data jānodod par brīvu? Pagājušajā nedēļā es kafejnīcā dzirdēju divu cilvēku sarunu, no kuriem viens teica, ka nesen palīdz kādai AI kompānijai ar datu marķēšanu, katru dienu marķējot simtiem dialogu, un ienākumi bija no katra marķējuma, kas bija niecīgi. Turklāt viņš pat nezināja, kur šie dati tiek izmantoti. Es pamanīju, ka visā AI industrijas ķēdē, viszemāk esošie cilvēki iegulda vislielāko vērtību, taču pat neizprot, kur viņu dati tiek izmantoti.
Es, neskaidrību pilns, devos apskatīt OpenLedger baltās grāmatas, un jāteic, ka mana pirmā reakcija bija šaubas. AI + blokķēde šis kombinācija ir redzēta pārāk daudzos sliktajos projektos, kur baltās grāmatas ir rakstītas krāšņi, bet īstenībā nav nekā reāla.
Es atvēru OpenLedger viņu PoA tehniskos dokumentus ar šo attieksmi. Pirmais, kas mani apturēja, bija viņu pamatmehānisms - PoA. Es to saprotu tā: tu augšupielādē savus datus, kas tiek izmantoti modeļa apmācībai, modelis veic secinājumus, un sistēma var izsekot, kuri dati ietekmēja kādu rezultātu, un tad automātiski norēķinās proporcionāli. Baltajā grāmatā ir aprakstītas divas shēmas: mazais modelis izmanto ietekmes funkciju, lai tuvinātu aprēķinus, bet lielais modelis izmanto suffix array, lai veiktu token līmeņa salīdzināšanu kompresijas korpusā. Tas izklausās ļoti eleganti, bet pirmais jautājums, kas man radās, bija: kurš sedz šo on-chain atribūcijas aprēķinu gāzes izmaksas?
Es uzskatu, ka OpenLedger visreālākais dizains ir Datanets, kas organizē on-chain datu kopienas pa jomām – medicīnas dati paliek medicīnā, juridiskie dati paliek juridiskajos. Es saprotu, ka tas nav balstīts uz solījumiem, ko jūs dzirdat, bet gan uz protokola līmeņa automātiskiem norēķiniem, tiklīdz tavi dati tiek izmantoti modelī. Ja šī loģika tiešām var darboties, tad kafejnīcā strādājošajiem marķētājiem vismaz vairs nebūs jākrata galvas pie jautājuma "cik vērti ir tavi dati".
Es pats esmu izmēģinājis ModelFactory, bezkode fine-tune interfeisu, izvēloties pamata modeli, pielāgojot LoRA parametrus un skatoties apmācību līknes, tas bija labāk, nekā es gaidīju, un nebija nepieciešams zināt komandrindas. Bet es joprojām neesmu pārliecināts par OpenLoRA apgalvojumu, ka viens GPU var palaist tūkstošiem LoRA adapteru vienlaikus, tāpēc turēšos pie sava skeptiskā viedokļa. Es uzskatu, ka virziens ir pareizs, bet galvenais jautājums nav atrisināts – ja atribūcijas aprēķinu izmaksas nevar samazināt, visa motivācijas sistēma būs kā gaisa pils. Vai šie norēķini var tikt precīzi aprēķināti uz blokķēdes, es vēl gaidu atbildi.
坦白说,我一开始能不怀疑吗?AI+区块链,这组合听着太像前几年随便拼凑热词去圈钱的空气了。但OpenLedger它主打的那个 PoA机制Proof of Attribution,归因证明,倒真让我愣了一下。如果我提供了数据、模型或者AI代理,链上直接记录,只要AI输出时用了我的东西,系统就把$OPEN 打到我钱包里。
我进去OpenLedger网站研究了半宿,这项目还真把我这个老韭菜给看清醒了。它是个基于 OP Stack的EVM兼容L2,但这不重要,真正好玩的是它搞了个Datanets 概念。说白了,就是把我们手里这些闲置的数据集凑在一起,大家组团去训练专门的AI小模型SLMs。
我当时第一反应也是:我把辛辛苦苦存的数据传上去,最后怎么算账?万一被白嫖了呢?结果人家掏出了一个叫 Proof of Attribution的归属权证明。这玩意儿简直是个记账死心眼,把谁贡献了数据、模型怎么被影响的路径,全特么死死记在链上了。
我发现这样一来,链上的数据、模型还有 AI agents 变现分钱全部透明,谁也别想赖账。更绝的是,今天我看OpenLedger他们跟DGrid AI合作的计算网络都跑通了,那个用来构建 Al agents 的新产品OctoClaw竟然已经直接上线。现在市面上那些天天在推特大饼画满、进度为零的空气项目,真得过来给它磕一个。