本文為 SevenX 研究團(tuán)隊(duì)原創(chuàng),僅供交流學(xué)習(xí),不構(gòu)成任何投資參考。如需引用,請(qǐng)注明來(lái)源。
原版英文報(bào)告于 2023 年 5 月發(fā)表于 SevenX 的 Mirror 平臺(tái)。更多中文投研內(nèi)容,請(qǐng)關(guān)注公眾號(hào)【SevenXVentures】。
感謝 Brian Retford, SunYi, Jason Morton, Shumo, Feng Boyuan, Daniel, Aaron Greenblatt, Nick Matthew, Baz, Marcin, 和 Brent 對(duì)本文提供的寶貴見(jiàn)解、反饋和審閱。
作者:Grace&Hill
對(duì)于我們這些加密愛(ài)好者來(lái)說(shuō),人工智能已經(jīng)火了好一陣子。有趣的是,沒(méi)人愿意看到人工智能失控的情況。區(qū)塊鏈發(fā)明的初衷是防止美元失控,所以我們可能會(huì)嘗試一下防止人工智能的失控。此外,我們現(xiàn)在有了一種叫做零知識(shí)證明的新技術(shù),用于確保事情不會(huì)出錯(cuò)。然而,要駕馭人工智能這個(gè)野獸,我們必須了解它的工作原理。
人工智能已經(jīng)經(jīng)歷了幾個(gè)名字的變化,從“專家系統(tǒng)”到“神經(jīng)網(wǎng)絡(luò)”,然后是“圖形模型”,最后演變?yōu)椤皺C(jī)器學(xué)習(xí)”。所有這些都是“人工智能”的子集,人們給它起了不同的名字,我們對(duì)人工智能的了解也在不斷加深。讓我們稍微深入了解一下機(jī)器學(xué)習(xí),揭開機(jī)器學(xué)習(xí)的神秘面紗。
注:如今,大多數(shù)機(jī)器學(xué)習(xí)模型都是神經(jīng)網(wǎng)絡(luò),因?yàn)樗鼈冊(cè)谠S多任務(wù)中具有優(yōu)異的性能。我們主要將機(jī)器學(xué)習(xí)稱為神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)。
首先,讓我們快速了解一下機(jī)器學(xué)習(xí)的內(nèi)部運(yùn)作:
輸入數(shù)據(jù)預(yù)處理:輸入數(shù)據(jù)需要處理成可以作為模型輸入的格式。這通常涉及預(yù)處理和特征工程,以提取有用的信息并將數(shù)據(jù)轉(zhuǎn)換成合適的形式,如輸入矩陣或張量(高維矩陣)。這是專家系統(tǒng)方法。隨著深度學(xué)習(xí)的出現(xiàn),處理層自動(dòng)處理預(yù)處理。
設(shè)置初始模型參數(shù):初始模型參數(shù)包括多個(gè)層、激活函數(shù)、初始權(quán)重、偏置、學(xué)習(xí)率等。有些參數(shù)可以在訓(xùn)練過(guò)程中通過(guò)優(yōu)化算法進(jìn)行調(diào)整以提高模型的準(zhǔn)確性。
訓(xùn)練數(shù)據(jù):
輸入數(shù)據(jù)輸入到神經(jīng)網(wǎng)絡(luò)中,通常從一個(gè)或多個(gè)特征提取和關(guān)系建模層開始,如卷積層(CNN),循環(huán)層(RNN)或自注意力層。這些層學(xué)會(huì)從輸入數(shù)據(jù)中提取相關(guān)特征并建模這些特征之間的關(guān)系。
這些層的輸出然后傳遞給一個(gè)或多個(gè)額外的層,這些層對(duì)輸入數(shù)據(jù)執(zhí)行不同的計(jì)算和轉(zhuǎn)換。這些層通常主要涉及可學(xué)習(xí)權(quán)重矩陣的矩陣乘法和非線性激活函數(shù)的應(yīng)用,但也可能包括其他操作,如卷積神經(jīng)網(wǎng)絡(luò)中的卷積和池化,或者循環(huán)神經(jīng)網(wǎng)絡(luò)中的迭代。這些層的輸出作為模型中下一層的輸入,或者作為最終的預(yù)測(cè)輸出。
獲取模型的輸出:神經(jīng)網(wǎng)絡(luò)計(jì)算的輸出通常是一個(gè)向量或矩陣,表示圖像分類的概率、情感分析分?jǐn)?shù)或其他結(jié)果,具體取決于網(wǎng)絡(luò)的應(yīng)用。通常還有一個(gè)錯(cuò)誤評(píng)估和參數(shù)更新模塊,根據(jù)模型的目的自動(dòng)更新參數(shù)。
神經(jīng)網(wǎng)絡(luò)計(jì)算的輸出通常是一個(gè)向量或矩陣,表示圖像分類的概率、情感分析分?jǐn)?shù)或其他結(jié)果,具體取決于網(wǎng)絡(luò)的應(yīng)用。通常還有一個(gè)錯(cuò)誤評(píng)估和參數(shù)更新模塊,根據(jù)模型的目的自動(dòng)更新參數(shù)。如果上述解釋看起來(lái)太晦澀,可以參考以下使用 CNN 模型識(shí)別蘋果圖片的例子。
將圖像以像素值矩陣的形式加載到模型中。該矩陣可以表示為具有尺寸(高度、寬度、通道)的3D張量。
設(shè)置 CNN 模型的初始參數(shù)。
輸入圖像通過(guò) CNN 中的多個(gè)隱藏層,每個(gè)層應(yīng)用卷積濾波器從圖像中提取越來(lái)越復(fù)雜的特征。每層的輸出通過(guò)非線性激活函數(shù),然后進(jìn)行池化以減小特征圖的維數(shù)。最后一層通常是一個(gè)全連接層,根據(jù)提取的特征生成輸出預(yù)測(cè)。
CNN 的最終輸出是概率最高的類別。這是輸入圖像的預(yù)測(cè)標(biāo)簽。
輸入:原始數(shù)據(jù)需要進(jìn)行預(yù)處理,有時(shí)還需要保密。
完整性:輸入數(shù)據(jù)未被篡改,未被惡意輸入污染,并且正確地進(jìn)行了預(yù)處理。
隱私:如有需要,輸入數(shù)據(jù)不會(huì)泄露。
輸出:需要準(zhǔn)確生成和傳輸
完整性:輸出正確生成。
隱私:如有需要,輸出不會(huì)泄露。
模型類型/算法:模型應(yīng)正確計(jì)算
完整性:模型執(zhí)行正確。
隱私:如有需要,模型本身或計(jì)算不會(huì)泄露。
不同的神經(jīng)網(wǎng)絡(luò)模型具有不同的算法和層,適用于不同的用例和輸入。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)通常用于涉及網(wǎng)格狀數(shù)據(jù)的任務(wù),如圖像,其中局部模式和特征可以通過(guò)對(duì)小輸入?yún)^(qū)域應(yīng)用卷積操作來(lái)捕獲。
另一方面,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)非常適用于順序數(shù)據(jù),如時(shí)間序列或自然語(yǔ)言,其中隱藏狀態(tài)可以捕獲來(lái)自先前時(shí)間步的信息并建模時(shí)間依賴關(guān)系。
自注意力層對(duì)于捕獲輸入序列中元素之間的關(guān)系非常有用,使其對(duì)于諸如機(jī)器翻譯或摘要之類的任務(wù)非常有效,這些任務(wù)中長(zhǎng)程依賴關(guān)系至關(guān)重要。
還存在其他類型的模型,包括多層感知機(jī)(MLP)等。
模型參數(shù):在某些情況下,參數(shù)應(yīng)該透明或民主生成,但在所有情況下都不易被篡改。完整性:參數(shù)以正確的方式生成、維護(hù)和管理。隱私:模型所有者通常會(huì)對(duì)機(jī)器學(xué)習(xí)模型參數(shù)保密,以保護(hù)開發(fā)該模型的組織的知識(shí)產(chǎn)權(quán)和競(jìng)爭(zhēng)優(yōu)勢(shì)。這種現(xiàn)象只在變壓器模型變得瘋狂昂貴的訓(xùn)練前非常普遍,但對(duì)行業(yè)來(lái)說(shuō)仍然是一個(gè)主要問(wèn)題。
信任問(wèn)題長(zhǎng)期困擾著機(jī)器學(xué)習(xí),主要原因有兩個(gè):
隱私性質(zhì):如上所述,模型參數(shù)通常是私密的,而在某些情況下,模型輸入也需要保密,這自然會(huì)在模型所有者和模型用戶之間帶來(lái)一些信任問(wèn)題。
算法黑盒:機(jī)器學(xué)習(xí)模型有時(shí)被稱為“黑盒”,因?yàn)樗鼈冊(cè)谟?jì)算過(guò)程中涉及許多難以理解或解釋的自動(dòng)化步驟。這些步驟涉及復(fù)雜的算法和大量的數(shù)據(jù),帶來(lái)不確定性和有時(shí)隨機(jī)的輸出,使得算法容易受到偏見(jiàn)甚至歧視的指責(zé)。
在更深入之前,本文的一個(gè)更大的假設(shè)是模型已經(jīng)“準(zhǔn)備好使用”,意味著它經(jīng)過(guò)良好的訓(xùn)練并符合目的。模型可能不適用于所有情況,而且模型以驚人的速度改進(jìn),機(jī)器學(xué)習(xí)模型的正常使用壽命在2到18個(gè)月之間,具體取決于應(yīng)用場(chǎng)景。
輸入:
數(shù)據(jù)來(lái)源是防篡改的
私有輸入數(shù)據(jù)不被模型操作者竊取(隱私問(wèn)題)
模型:
模型本身如宣傳的那樣準(zhǔn)確
計(jì)算過(guò)程正確完成
參數(shù):
模型參數(shù)沒(méi)有被改變或與宣傳的一致
在過(guò)程中,對(duì)模型所有者具有價(jià)值的模型參數(shù)沒(méi)有泄露(隱私問(wèn)題)
輸出:
輸出結(jié)果可證明是正確的(可能隨著上述所有元素的改進(jìn)而改進(jìn))
制定需要證明的陳述:f(x, w)=true
“我使用具有私有參數(shù) w 的機(jī)器學(xué)習(xí)模型 f 正確地對(duì)這個(gè)圖像 x 進(jìn)行了分類。”
將陳述轉(zhuǎn)換為電路(算術(shù)化):不同的電路構(gòu)建方法包括 R 1 CS、QAP、Plonkish 等。與其他用例相比,ZKML 需要一個(gè)額外的步驟,稱為量化。神經(jīng)網(wǎng)絡(luò)推斷通常使用浮點(diǎn)算術(shù)完成,而在算術(shù)電路的主要領(lǐng)域中模擬浮點(diǎn)算術(shù)非常昂貴。不同的量化方法在精度和設(shè)備要求之間取得折衷。
一些像 R 1 CS 這樣的電路構(gòu)建方法對(duì)神經(jīng)網(wǎng)絡(luò)來(lái)說(shuō)效率不高。這部分可以調(diào)整以提高性能。
生成一個(gè)證明密鑰和一個(gè)驗(yàn)證密鑰
創(chuàng)建一個(gè)見(jiàn)證:當(dāng) w=w*時(shí),f(x, w)=true
創(chuàng)建一個(gè)哈希承諾:見(jiàn)證人 w*承諾使用加密哈希函數(shù)生成一個(gè)哈希值。這個(gè)哈希值可以公之于眾。
這有助于確保在計(jì)算過(guò)程中,私有輸入或模型參數(shù)沒(méi)有被篡改或修改。這一步至關(guān)重要,因?yàn)榧词故羌?xì)微的修改也可能對(duì)模型的行為和輸出產(chǎn)生重大影響。
生成證明:不同的證明系統(tǒng)使用不同的證明生成算法。
需要為機(jī)器學(xué)習(xí)操作設(shè)計(jì)特殊的零知識(shí)規(guī)則,如矩陣乘法和卷積層,以便實(shí)現(xiàn)這些計(jì)算的子線性時(shí)間高效協(xié)議。
? 像 groth 16 這樣的通用 zkSNARK 系統(tǒng)可能無(wú)法有效處理神經(jīng)網(wǎng)絡(luò),因?yàn)橛?jì)算負(fù)載過(guò)大。
? 自 2020 年以來(lái),許多新的 ZK 證明系統(tǒng)應(yīng)運(yùn)而生,以優(yōu)化模型推理過(guò)程的 ZK 證明,包括 vCNN、ZEN、ZKCNN 和 pvCNN。然而,它們中的大多數(shù)都針對(duì) CNN 模型進(jìn)行了優(yōu)化。它們只能應(yīng)用于一些主要的數(shù)據(jù)集,如 MNIST 或 CIFAR-10 。
? 2022 年,Daniel Kang Tatsunori Hashimoto、Ion Stoica 和 Yi Sun(Axiom 創(chuàng)始人)提出了一種基于 Halo 2 的新證明方案,首次實(shí)現(xiàn)了對(duì) ImageNet 數(shù)據(jù)集的 ZK 證明生成。他們的優(yōu)化主要集中在算術(shù)化部分,具有用于非線性的新穎查找參數(shù)和跨層重用子電路。
? Modulus Labs 正在為鏈上推理對(duì)不同證明系統(tǒng)進(jìn)行基準(zhǔn)測(cè)試,發(fā)現(xiàn)在證明時(shí)間方面,ZKCNN 和 plonky 2 表現(xiàn)最佳;在峰值證明者內(nèi)存使用方面,ZKCNN 和 halo 2 表現(xiàn)良好;而 plonky 雖然表現(xiàn)良好,但犧牲了內(nèi)存消耗,而且 ZKCNN 僅適用于 CNN 模型。它還正在開發(fā)一個(gè)專門為 ZKML 設(shè)計(jì)的新 zkSNARK 系統(tǒng),以及一個(gè)新的虛擬機(jī)。
驗(yàn)證證明:驗(yàn)證者使用驗(yàn)證密鑰進(jìn)行驗(yàn)證,無(wú)需知道見(jiàn)證人的知識(shí)。
因此,我們可以證明將零知識(shí)技術(shù)應(yīng)用于機(jī)器學(xué)習(xí)模型可以解決很多信任問(wèn)題。使用交互式驗(yàn)證的類似技術(shù)可以達(dá)到類似的效果,但會(huì)在驗(yàn)證者方面需要更多資源,并可能面臨更多的隱私問(wèn)題。值得注意的是,根據(jù)具體的模型,為它們生成證明可能需要時(shí)間和資源,因此在將此技術(shù)最終應(yīng)用于現(xiàn)實(shí)世界的用例時(shí),各方面將存在折衷。
如果輸入數(shù)據(jù)在鏈上,可以考慮使用 Axiom 作為解決方案:
Axiom 正在為以太坊構(gòu)建一個(gè)零知識(shí)協(xié)處理器,以改善用戶對(duì)區(qū)塊鏈數(shù)據(jù)的訪問(wèn)并提供更復(fù)雜數(shù)字化的鏈上數(shù)據(jù)視圖。在鏈上數(shù)據(jù)上進(jìn)行可靠的機(jī)器學(xué)習(xí)計(jì)算是可行的:
首先,Axiom 通過(guò)在其智能合約 AxiomV 0 中存儲(chǔ)以太坊區(qū)塊哈希的默克爾根來(lái)導(dǎo)入鏈上數(shù)據(jù),這些數(shù)據(jù)通過(guò) ZK-SNARK 驗(yàn)證過(guò)程進(jìn)行無(wú)信任驗(yàn)證。然后,AxiomV 0 StoragePf 合約允許對(duì) AxiomV 0 中緩存的區(qū)塊哈希給出的信任根進(jìn)行任意歷史以太坊存儲(chǔ)證明的批量驗(yàn)證。
接下來(lái),可以從導(dǎo)入的歷史數(shù)據(jù)中提取機(jī)器學(xué)習(xí)輸入數(shù)據(jù)。
然后,Axiom 可以在頂部應(yīng)用經(jīng)過(guò)驗(yàn)證的機(jī)器學(xué)習(xí)操作;使用經(jīng)過(guò)優(yōu)化的 halo 2 作為后端來(lái)驗(yàn)證每個(gè)計(jì)算部分的有效性。
最后,Axiom 會(huì)附上每個(gè)查詢結(jié)果的 zk 證明,并且 Axiom 智能合約會(huì)驗(yàn)證 zk 證明。任何想要證明的相關(guān)方都可以從智能合約中訪問(wèn)它。
如果將模型放在鏈上,可以考慮使用 RISC Zero 作為解決方案:
首先,需要將模型的源代碼編譯成 RISC-V 二進(jìn)制文件。當(dāng)這個(gè)二進(jìn)制文件在 ZKVM 中執(zhí)行時(shí),輸出會(huì)與一個(gè)包含加密密封的計(jì)算收據(jù)配對(duì)。這個(gè)密封作為計(jì)算完整性的零知識(shí)論據(jù),將加密的 imageID(識(shí)別執(zhí)行的 RISC-V 二進(jìn)制文件)與聲明的代碼輸出關(guān)聯(lián)起來(lái),以便第三方快速驗(yàn)證。
當(dāng)模型在 ZKVM 中執(zhí)行時(shí),關(guān)于狀態(tài)更改的計(jì)算完全在 VM 內(nèi)部完成。它不會(huì)向外部泄露有關(guān)模型內(nèi)部狀態(tài)的任何信息。
一旦模型執(zhí)行完畢,生成的密封就成為計(jì)算完整性的零知識(shí)證明。RISC Zero ZKVM 是一個(gè) RISC-V 虛擬機(jī),它可以生成對(duì)其執(zhí)行的代碼的零知識(shí)證明。使用 ZKVM,可以生成一個(gè)加密收據(jù),任何人都可以驗(yàn)證這個(gè)收據(jù)是由 ZKVM 的客戶代碼生成的。發(fā)布收據(jù)時(shí),不會(huì)泄露有關(guān)代碼執(zhí)行的其他信息(例如,所提供的輸入)。
通過(guò)在 RISC Zero 的 ZKVM 中運(yùn)行機(jī)器學(xué)習(xí)模型,可以證明模型涉及的確切計(jì)算是正確執(zhí)行的。計(jì)算和驗(yàn)證過(guò)程可以在用戶喜歡的環(huán)境中離線完成,或者在 Bonsai Network 中完成,Bonsai Network 是一個(gè)通用的 roll-up。
生成 ZK 證明的具體過(guò)程涉及到一個(gè)與隨機(jī) oracle 作為驗(yàn)證者的交互協(xié)議。RISC Zero 收據(jù)上的密封本質(zhì)上就是這個(gè)交互協(xié)議的記錄。
如果您想直接從常用的機(jī)器學(xué)習(xí)軟件(如 Tensorflow 或 Pytorch)導(dǎo)入模型,可以考慮使用 ezkl 作為解決方案:
首先,將最終模型導(dǎo)出為 .onnx 文件,將一些樣本輸入導(dǎo)出為 .json 文件。
然后,將 ezkl 指向 .onnx 和 .json 文件,以生成可以證明 ZKML 語(yǔ)句的 ZK-SNARK 電路。
Ezkl 是一個(gè)庫(kù)和命令行工具,用于在 zkSNARK 中進(jìn)行深度學(xué)習(xí)模型和其他計(jì)算圖的推斷。
看起來(lái)簡(jiǎn)單,對(duì)吧?Ezkl 的目標(biāo)是提供一個(gè)抽象層,允許在 Halo 2 電路中調(diào)用和布局高級(jí)操作。Ezkl 抽象了許多復(fù)雜性,同時(shí)保持了令人難以置信的靈活性。他們的量化模型具有自動(dòng)量化的縮放因子。他們支持靈活地更改為新解決方案所涉及的其他證明系統(tǒng)。他們還支持多種類型的虛擬機(jī),包括 EVM 和 WASM。
關(guān)于證明系統(tǒng),ezkl 通過(guò)聚合證明(通過(guò)中介將難以驗(yàn)證的證明轉(zhuǎn)換為易于驗(yàn)證的證明)和遞歸(可以解決內(nèi)存問(wèn)題,但難以適應(yīng) halo 2)來(lái)定制 halo 2 電路。Ezkl 還通過(guò)融合和抽象(可以通過(guò)高級(jí)證明減少開銷)來(lái)優(yōu)化整個(gè)過(guò)程。
值得注意的是,與其他通用 zkml 項(xiàng)目相比,Accessor Labs 專注于為完全上鏈游戲提供專門設(shè)計(jì)的 zkml 工具,可能涉及 AI NPC、游戲玩法的自動(dòng)更新、涉及自然語(yǔ)言的游戲界面等。
從本質(zhì)上講,這將是一個(gè)Web3應(yīng)用程序(在撰寫本文時(shí)可能存在或不存在),以無(wú)需信任的方式實(shí)現(xiàn) ML/AI。在無(wú)需信任的方式下,我們指的是它是否在無(wú)需信任的環(huán)境/平臺(tái)上運(yùn)行,或者其操作是否可以被證明是可驗(yàn)證的。請(qǐng)注意,并非所有 ML/AI 用例(即使在Web3中)都需要或更喜歡以無(wú)需信任的方式運(yùn)行。我們將分析在各種Web3領(lǐng)域中使用的 ML 功能的每個(gè)部分。然后,我們將確定需要 ZKML 的部分,通常是人們?cè)敢鉃樽C明支付額外費(fèi)用的高價(jià)值部分。下面提到的大多數(shù)用例/應(yīng)用仍處于實(shí)驗(yàn)研究階段。因此,它們距離實(shí)際采用還很遙遠(yuǎn)。我們稍后會(huì)討論原因。
Defi Defi 是區(qū)塊鏈協(xié)議和 Web3 應(yīng)用中為數(shù)不多的產(chǎn)品市場(chǎng)契合度證明之一。以無(wú)需許可的方式創(chuàng)建、存儲(chǔ)和管理財(cái)富和資本在人類歷史上是前所未有的。我們已經(jīng)確定了許多需要 AI/ML 模型無(wú)需許可地運(yùn)行以確保安全性和去中心化的用例。
Automated MM and liquidity provision:
本質(zhì)上,這是風(fēng)險(xiǎn)評(píng)估和資產(chǎn)管理中進(jìn)行的類似努力的結(jié)合,只是在交易量、時(shí)間線和資產(chǎn)類型方面采用了不同的方式。關(guān)于如何在股票市場(chǎng)中使用 ML 進(jìn)行做市的研究論文有很多。在一些研究成果適用于 Defi 產(chǎn)品可能只是時(shí)間問(wèn)題。
例如,Lyra Finance 正與 Modulus Labs 合作,通過(guò)智能功能提升其 AMM,使其資本利用效率更高。
榮譽(yù)提名:
Warp.cc 團(tuán)隊(duì)開發(fā)了一個(gè)教程項(xiàng)目,介紹如何部署一個(gè)運(yùn)行訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)以預(yù)測(cè)比特幣價(jià)格的智能合約。這符合我們框架的“輸入”和“模型”部分,因?yàn)檩斎胧褂?RedStone Oracles 提供的數(shù)據(jù),模型作為一個(gè) Warp 智能合約在 Arweave 上執(zhí)行。
這是第一次迭代并涉及 ZK,所以它屬于我們的榮譽(yù)提名,但是在未來(lái),Warp 團(tuán)隊(duì)考慮實(shí)現(xiàn)一個(gè) ZK 部分。
游戲
游戲與機(jī)器學(xué)習(xí)有很多交集:圖中的灰色區(qū)域代表了我們對(duì)游戲部分中的機(jī)器學(xué)習(xí)功能是否需要與相應(yīng)的 ZKML 證明配對(duì)的初步評(píng)估。Leela Chess Zero 是將 ZKML 應(yīng)用于游戲的一個(gè)非常有趣的例子:
AI 代理
LC 0 和人類集體輪流進(jìn)行游戲(正如象棋中應(yīng)有的那樣)。
LC 0 的移動(dòng)是通過(guò)簡(jiǎn)化的、適合電路的 LC 0 模型計(jì)算出來(lái)的。
Leela Chess Zero (LC 0):由 Modulus Labs 構(gòu)建的一款完全基于鏈上的 AI 棋手,與來(lái)自社區(qū)的一群人類玩家對(duì)戰(zhàn)。
LC 0 的移動(dòng)有一個(gè) Halo 2 snark 證明,以確保沒(méi)有人類智囊團(tuán)的干預(yù)。只有簡(jiǎn)化的 LC 0 模型在那里做決策。
這符合“模型”部分。模型的執(zhí)行有一個(gè) ZK 證明,以驗(yàn)證計(jì)算沒(méi)有被篡改。
數(shù)據(jù)分析與預(yù)測(cè):這一直是 Web2 游戲世界中 AI/ML 的常見(jiàn)用途。然而,我們發(fā)現(xiàn)在這個(gè) ML 過(guò)程中實(shí)現(xiàn) ZK 的理由非常少。為了不讓過(guò)多的價(jià)值直接涉及到這個(gè)過(guò)程,這可能不值得付出努力。然而,如果某些分析和預(yù)測(cè)被用來(lái)為用戶確定獎(jiǎng)勵(lì),那么 ZK 可能會(huì)被實(shí)施以確保結(jié)果是正確的。
榮譽(yù)提名:
AI Arena 是一款以太坊原生游戲,來(lái)自世界各地的玩家可以在其中設(shè)計(jì)、訓(xùn)練和戰(zhàn)斗由人工神經(jīng)網(wǎng)絡(luò)驅(qū)動(dòng)的 NFT 角色。來(lái)自世界各地的才華橫溢的研究人員競(jìng)相創(chuàng)建最佳機(jī)器學(xué)習(xí)(ML)模型來(lái)參與游戲戰(zhàn)斗。AI Arena 主要關(guān)注前饋神經(jīng)網(wǎng)絡(luò)。總體而言,它們的計(jì)算開銷比卷積神經(jīng)網(wǎng)絡(luò)(CNNs)或循環(huán)神經(jīng)網(wǎng)絡(luò)(RNNs)低。盡管如此,目前模型只在訓(xùn)練完成后上傳到平臺(tái),因此值得一提。
GiroGiro.AI 正在構(gòu)建一個(gè) AI 工具包,使大眾能夠?yàn)閭€(gè)人或商業(yè)用途創(chuàng)建人工智能。用戶可以根據(jù)直觀且自動(dòng)化的 AI 工作流平臺(tái)創(chuàng)建各種類型的 AI 系統(tǒng)。只需輸入少量數(shù)據(jù)和選擇算法(或用于改進(jìn)的模型),用戶就可以生成并利用心中的 AI 模型。盡管該項(xiàng)目處于非常早期階段,但我們非常期待看到 GiroGiro 可以為游戲金融和元宇宙為重點(diǎn)的產(chǎn)品帶來(lái)什么,因此將其列為榮譽(yù)提名。
DID 和社交
在 DID 和社交領(lǐng)域,Web3 和 ML 的交叉點(diǎn)目前主要體現(xiàn)在人類證明和憑據(jù)證明領(lǐng)域;其他部分可能會(huì)發(fā)展,但需要更長(zhǎng)的時(shí)間。
人類證明
用戶的應(yīng)用程序在本地生成一個(gè)錢包地址。
應(yīng)用程序使用 Semaphore 證明它擁有之前注冊(cè)的一個(gè)公鑰的私鑰。因?yàn)檫@是零知識(shí)證明,所以它不會(huì)透露是哪個(gè)公鑰。
證明再次發(fā)送到順序器,順序器驗(yàn)證證明并啟動(dòng)將代幣存入提供的錢包地址的過(guò)程。所謂的零件隨證明一起發(fā)送,確保用戶不能領(lǐng)取兩次獎(jiǎng)勵(lì)。
用戶在手機(jī)上生成一個(gè) Semaphore 密鑰對(duì),并通過(guò)二維碼向 Orb 提供哈希后的公鑰。
Orb 掃描用戶的虹膜并在本地計(jì)算用戶的 IrisHash。然后,它將包含哈希公鑰和 IrisHash 的簽名消息發(fā)送到注冊(cè)順序節(jié)點(diǎn)。
順序節(jié)點(diǎn)驗(yàn)證 Orb 的簽名,然后檢查 IrisHash 是否與數(shù)據(jù)庫(kù)中已有的匹配。如果唯一性檢查通過(guò),IrisHash 和公鑰將被保存。
Worldcoin 使用一種名為 Orb 的設(shè)備來(lái)判斷某人是否是一個(gè)真實(shí)存在的人,而不是試圖欺詐驗(yàn)證。它通過(guò)各種攝像頭傳感器和機(jī)器學(xué)習(xí)模型分析面部和虹膜特征來(lái)實(shí)現(xiàn)這一目標(biāo)。一旦做出這個(gè)判斷,Orb 就會(huì)拍攝一組人的虹膜照片,并使用多個(gè)機(jī)器學(xué)習(xí)模型和其他計(jì)算機(jī)視覺(jué)技術(shù)創(chuàng)建虹膜編碼,這是一個(gè)表示個(gè)體虹膜圖案最重要特征的數(shù)字表示。具體的注冊(cè)步驟如下:
Worldcoin 使用開源的 Semaphore 零知識(shí)證明系統(tǒng)將 IrisHash 的唯一性轉(zhuǎn)換為用戶帳戶的唯一性,而不會(huì)將它們關(guān)聯(lián)起來(lái)。這確保新注冊(cè)的用戶可以成功領(lǐng)取他/她的 WorldCoins。步驟如下:
WorldCoin 使用 ZK 技術(shù)確保其 ML 模型的輸出不會(huì)泄露用戶的個(gè)人數(shù)據(jù),因?yàn)樗鼈冎g沒(méi)有關(guān)聯(lián)。在這種情況下,它屬于我們信任框架的“輸出”部分,因?yàn)樗_保了輸出以期望的方式傳輸和使用,在這種情況下是私密的。
可以看到,Web3 中 ZKML 的潛在用例尚處于起步階段,但不能被忽視;未來(lái),隨著 ZKML 使用的不斷擴(kuò)大,可能會(huì)出現(xiàn)對(duì) ZKML 提供商的需求,形成下圖中的閉環(huán):ZKML 服務(wù)提供商主要關(guān)注 ML 信任框架的“模型”和“參數(shù)”部分。盡管我們現(xiàn)在看到的大部分與“參數(shù)”相關(guān)的更多是“模型”相關(guān)。需要注意的是,“輸入”和“輸出”部分更多地由基于區(qū)塊鏈的解決方案解決,無(wú)論是作為數(shù)據(jù)來(lái)源還是數(shù)據(jù)目的地。單獨(dú)使用 ZK 或區(qū)塊鏈可能無(wú)法實(shí)現(xiàn)完全的可信度,但它們聯(lián)合起來(lái)可能會(huì)實(shí)現(xiàn)。
那么證明大小和驗(yàn)證時(shí)間呢?我們可以參考 Daniel Kang、Tatsunori Hashimoto、Ion Stoica 和 Yi Sun 的論文。如下所示,他們的 DNN 推理解決方案在 ImageNet(模型類型:DCNN, 16 層, 3.4 百萬(wàn)參數(shù))上的準(zhǔn)確率可以達(dá)到 79% ,同時(shí)驗(yàn)證時(shí)間僅需 10 秒,證明大小為 5952 字節(jié)。此外,zkSNARKs 可以縮小到 59% 準(zhǔn)確率時(shí)驗(yàn)證時(shí)間僅需 0.7 秒。這些結(jié)果表明,在證明大小和驗(yàn)證時(shí)間方面,對(duì) ImageNet 規(guī)模的模型進(jìn)行 zkSNARKing 是可行的。目前主要的技術(shù)瓶頸在于證明時(shí)間和內(nèi)存消耗。在 web3 案例中應(yīng)用 ZKML 在技術(shù)上尚不可行。ZKML 是否有潛力趕上 AI 的發(fā)展呢?我們可以比較幾個(gè)經(jīng)驗(yàn)數(shù)據(jù):
機(jī)器學(xué)習(xí)模型的發(fā)展速度: 2019 年發(fā)布的 GPT-1 模型具有 1.5 億個(gè)參數(shù),而 2020 年發(fā)布的最新 GPT-3 模型具有 1, 750 億個(gè)參數(shù),僅兩年間參數(shù)數(shù)量增加了 1, 166 倍。
零知識(shí)系統(tǒng)的優(yōu)化速度:零知識(shí)系統(tǒng)的性能增長(zhǎng)基本上遵循“摩爾定律”式的步伐。幾乎每年都會(huì)出現(xiàn)新的零知識(shí)系統(tǒng),我們預(yù)計(jì)證明者性能的快速增長(zhǎng)在一段時(shí)間內(nèi)還將繼續(xù)。
從這些數(shù)據(jù)來(lái)看,盡管機(jī)器學(xué)習(xí)模型的發(fā)展速度非常快,但零知識(shí)證明系統(tǒng)的優(yōu)化速度也在穩(wěn)步提升。在未來(lái)一段時(shí)間內(nèi),ZKML 可能仍有機(jī)會(huì)逐步趕上 AI 的發(fā)展,但它需要不斷地進(jìn)行技術(shù)創(chuàng)新和優(yōu)化以縮小差距。這意味著,盡管目前 ZKML 在 web3 應(yīng)用中存在技術(shù)瓶頸,但隨著零知識(shí)證明技術(shù)的不斷發(fā)展,我們?nèi)杂欣碛善诖?ZKML 在未來(lái)能夠在 web3 場(chǎng)景中發(fā)揮更大的作用。對(duì)比前沿的 ML 與 ZK 的改進(jìn)率,前景并不十分樂(lè)觀。不過(guò),隨著卷積性能、ZK 硬件的不斷完善,以及基于高度結(jié)構(gòu)化的神經(jīng)網(wǎng)絡(luò)操作而量身定做的 ZK 證明系統(tǒng),希望 ZKML 的發(fā)展能夠滿足web3的需求,先從提供一些老式的機(jī)器學(xué)習(xí)功能開始。雖然我們可能很難用區(qū)塊鏈 ZK 來(lái)驗(yàn)證 ChatGPT 反饋給我的信息是否可信,但我們也許可以在 ZK 電路中安裝一些較小和較老的 ML 模型。
我們期待在 ZKML 領(lǐng)域看到更多的產(chǎn)品創(chuàng)新,ZK 和區(qū)塊鏈為 AI/ML 的運(yùn)行提供了一個(gè)安全和值得信賴的環(huán)境。我們也期待這些產(chǎn)品創(chuàng)新產(chǎn)生全新的商業(yè)模式,因?yàn)樵跓o(wú)許可的加密貨幣世界里,我們不受這里的去 SaaS 商業(yè)化模式的限制。我們期待著支持更多的建設(shè)者,在這個(gè) "西部荒野無(wú)政府狀態(tài) "和 "象牙塔精英 "的迷人重疊中,來(lái)建立他們令人興奮的想法。我們?nèi)蕴幱谠缙陔A段,但我們可能已經(jīng)在拯救世界的路上。