基于區(qū)塊鏈的機器學(xué)習(xí)市場區(qū)塊鏈

                  藍狐筆記 2018-10-12 20:01
                  分享到:
                  導(dǎo)讀

                  區(qū)塊鏈要想真正影響世界,它有一個很重要的突破口就是跟人工智能的結(jié)合。對于創(chuàng)業(yè)公司來說,人工智能發(fā)展最大瓶頸就是缺乏足夠多的優(yōu)質(zhì)數(shù)據(jù)。

                  基于區(qū)塊鏈數(shù)據(jù)市場訓(xùn)練的機器學(xué)習(xí)模型有可能創(chuàng)造出世界上最強大的人工智能。

                  它們結(jié)合了兩個強有力的元素:一是隱私的機器學(xué)習(xí)。它允許在不泄露敏感隱私數(shù)據(jù)的前提下進行模型訓(xùn)練。二是基于區(qū)塊鏈的激勵。區(qū)塊鏈系統(tǒng)將吸引最好的數(shù)據(jù)和模型,來使其更加智能。結(jié)果是在公開市場上,任何人都能夠售賣他們的數(shù)據(jù),同時保護他們的隱私。開發(fā)者則通過提供激勵獲得算法所需的最佳數(shù)據(jù)。

                  構(gòu)建這樣的系統(tǒng)極具挑戰(zhàn)性,但簡單的初始版本看起來是有可能的。我相信這樣的市場將把我們從當(dāng)前的Web 2.0大公司數(shù)據(jù)壟斷時代進化到數(shù)據(jù)和算法公開競爭的Web 3.0時代。兩者都直接商業(yè)化。

                  由來

                  這個想法源自于2015年與Numerai的Richard交談。 Numerai是一家對沖基金,它會向數(shù)據(jù)科學(xué)家發(fā)送加密的市場數(shù)據(jù),這些數(shù)據(jù)用于構(gòu)建各自的股票市場模型。Numerai結(jié)合最佳模型,并提交到“元模型”中,并通過“元模型”在市場中進行交易。如果模型表現(xiàn)良好,數(shù)據(jù)科學(xué)家會獲得收益。

                  讓數(shù)據(jù)科學(xué)家們進行競爭似乎是一個很贊的想法。它讓我想到:是否能夠創(chuàng)建一個完全去中心化的系統(tǒng),可以應(yīng)用到更通用的場景?我的答案是肯定的。

                  實施

                  舉個例子,讓我們先嘗試創(chuàng)建一個完全分布式的系統(tǒng),用來進行加密貨幣的交易。以下這些是架構(gòu)類似系統(tǒng)的元素:

                  數(shù)據(jù)

                  數(shù)據(jù)提供者對數(shù)據(jù)擁有權(quán)益,并使其可供建模者使用。

                  構(gòu)建模型

                  建模者創(chuàng)建模型并選擇用于訓(xùn)練的數(shù)據(jù)。在不泄露基礎(chǔ)數(shù)據(jù)的安全情況下,進行模型訓(xùn)練。模型也會有權(quán)益。

                  1

                  元模型的構(gòu)建

                  基于算法創(chuàng)建元模型,該算法考慮每個模型權(quán)益。

                  創(chuàng)建元模型是可選的——你可以想象使用的模型是那種還沒被整合進元模型中的。

                  使用元模型

                  智能合約采用元模型,并通過去中心化交易所在鏈上進行交易。

                  分配收益或損失

                  經(jīng)過一段時間后,交易產(chǎn)生盈利或虧損。這種利潤或損失在元模型的貢獻者之間進行分配,這取決于模型有多智能。如果模型造成損失,該模型的部分或全部權(quán)益會被沒收。同時,對于模型的數(shù)據(jù)提供者,也會執(zhí)行類似的利益分配或權(quán)益消減機制。

                  可驗證的計算

                  每個步驟的計算要么執(zhí)行中心化,中心化則可驗證且具有挑戰(zhàn)性(使用類似于Truebit的可驗證游戲),要么實施去中心化,使用安全多方計算。

                  托管

                  數(shù)據(jù)和模型要么托管在IPFS上,要么托管在安全的多方計算網(wǎng)絡(luò)中,因為鏈上存儲太昂貴了。

                  是什么讓這個系統(tǒng)強大?

                  激勵措施吸引全球最好的數(shù)據(jù)

                  吸引數(shù)據(jù)的激勵措施是系統(tǒng)中最有效的部分,因為數(shù)據(jù)往往是大多數(shù)機器學(xué)習(xí)的最主要限制因素。通過開放式激勵,比特幣創(chuàng)建了世界上算力最強的新興系統(tǒng)。同樣,設(shè)計良好的數(shù)據(jù)激勵結(jié)構(gòu)將為應(yīng)用程序帶來世界上最好的數(shù)據(jù)。并且?guī)缀醪豢赡荜P(guān)閉這個有數(shù)千或數(shù)百萬數(shù)據(jù)來源的系統(tǒng)。

                  算法之間的競爭

                  算法或模型之間的公開競爭,這在之前是沒有過的。可以想象一下,一個分布式的Facebook,有著數(shù)千種競爭的“信息流”算法。

                  透明的獎勵機制

                  數(shù)據(jù)和模型提供者可以看到他們獲得公平的價值收益,因為所有計算都是可驗證的,這讓他們更有動力參與其中。

                  自動化鏈上執(zhí)行

                  所有執(zhí)行通過鏈上自動完成,并且價值直接轉(zhuǎn)換為代幣,這就創(chuàng)建了一個自動化且可信任的閉環(huán)。

                  網(wǎng)絡(luò)效應(yīng)

                  來自用戶、數(shù)據(jù)提供者和數(shù)據(jù)科學(xué)家的多邊網(wǎng)絡(luò)效應(yīng)使系統(tǒng)迅速自我增強。它表現(xiàn)得越好,吸引的資金越多,這意味著更多的潛在價值輸出,這會吸引更多的數(shù)據(jù)提供者和數(shù)據(jù)科學(xué)家,他們使系統(tǒng)變得更加智能,從而吸引更多資金,實現(xiàn)自循環(huán)。

                  隱私保護

                  除了以上幾點之外,一個更重要的是隱私保護。它允許:

                  1)人們提交私密的數(shù)據(jù);

                  2)防止數(shù)據(jù)和模型的經(jīng)濟價值泄漏。如果在公開情況下不加密,數(shù)據(jù)和模型會被免費拷貝及被人使用,而這些人可能并沒有貢獻任何工作。也就是存在搭便車的問題。

                  對搭便車問題的部分解決方案是私下交易數(shù)據(jù),即使買家選擇再次出售或發(fā)布數(shù)據(jù),其價值也會隨著時間而衰減。但是,這種方法將我們限制在短期內(nèi)使用的場景,仍然會產(chǎn)生典型的隱私問題。因此,更復(fù)雜更強大的方法是使用一種安全計算方式。

                  安全計算

                  安全計算方法允許模型在不泄漏數(shù)據(jù)本身的情況下訓(xùn)練數(shù)據(jù)。現(xiàn)今使用和研究的3種主要安全計算的形式:同態(tài)加密(HE),安全多方計算(MPC)和零知識證明(ZKP)。目前用于機器學(xué)習(xí)最多是多方計算,因為同態(tài)加密往往太慢,而零知識證明應(yīng)用于機器學(xué)習(xí)效果還不明顯。安全計算方法正處于計算機科學(xué)研究的前沿。雖然它們比常規(guī)計算慢幾個數(shù)量級,也代表了系統(tǒng)的主要瓶頸,但近年來一直在改進。

                  終極推薦系統(tǒng)

                  為了說明私有機器學(xué)習(xí)的潛力,想象一下,一個名為“終極推薦系統(tǒng)”的應(yīng)用程序。它會監(jiān)視你在設(shè)備上執(zhí)行的所有操作:瀏覽歷史記錄,應(yīng)用程序中的所有操作,手機上的圖片,位置數(shù)據(jù),消費歷史記錄,可穿戴傳感設(shè)備,短信,家中的攝像頭,未來AR眼鏡的攝像頭。然后它會為你提供建議:你應(yīng)該訪問的下一個網(wǎng)站,要閱讀的文章,要收聽的歌曲或要購買的產(chǎn)品。

                  這個推薦系統(tǒng)非常有效。它比Google,F(xiàn)acebook或其他任何現(xiàn)有的數(shù)據(jù)孤島都要強大。因為它擁有最完整的視圖,并且可以更及時地從數(shù)據(jù)中學(xué)習(xí),否則這些數(shù)據(jù)將過于私密而無法使用。

                  與之前的加密貨幣交易系統(tǒng)類似,它允許專注于不同領(lǐng)域的模型(例如:網(wǎng)站推薦音樂),以此來競爭獲取用戶加密數(shù)據(jù)并向用戶推薦內(nèi)容,甚至可能通過付費來促使用戶貢獻數(shù)據(jù)或注意力。

                  雖然Google的聯(lián)合學(xué)習(xí)和Apple的差異隱私在私有機器學(xué)習(xí)方向上邁進了一步,但仍然需要獲得用戶信任,還不允許用戶直接檢查它們的安全性,存在數(shù)據(jù)孤立等問題。

                  目前的方法

                  現(xiàn)在還是很早期。還沒有多少項目,大多數(shù)團隊都在試圖解決一小塊問題。

                  Algorithmia Research的一個簡單構(gòu)建是在高于某個回測閾值的模型上給予一個獎勵:

                  2

                  (Algorithmia Research 的機器學(xué)習(xí)模型上簡單地創(chuàng)造了一筆賞金的設(shè)計)

                  Numerai目前開啟進一步提升:它使用了加密數(shù)據(jù)(雖然不是完全同態(tài)),它將眾包模型組合進元模型,并根據(jù)未來表現(xiàn)提供獎勵(一周股票交易時間),而不是通過以太坊代幣Numeraire進行回溯測試。

                  數(shù)據(jù)科學(xué)家必須將Numeraire作為游戲中的代幣,激勵未來的表現(xiàn),而不是已發(fā)生的事情。但是,目前它的數(shù)據(jù)集中分發(fā),最重要的部分被限制了。

                  目前為止,還沒有人成功地創(chuàng)建過基于區(qū)塊鏈的數(shù)據(jù)交易市場。“ Ocean”是早期的一個嘗試。

                  還有一些人從創(chuàng)建安全的計算網(wǎng)絡(luò)開始。例如Openmined正在創(chuàng)建一個多方的安全計算網(wǎng)絡(luò),基于Unity上訓(xùn)練機器學(xué)習(xí)模型,并能在任何設(shè)備上運行,包括游戲控制臺(類似于Folding at Home),然后再擴展到安全MPC。 Enigma也有類似的策略。

                  一個迷人的最終狀態(tài)是,共同擁有元模型。元模型可以給數(shù)據(jù)提供者和模型創(chuàng)造者們擁有權(quán),這個權(quán)益跟模型的智能程度成正比。模型將代幣化,可以隨著時間的推移支付股息,甚至可能由訓(xùn)練它們的人管理。一種共同擁有的智能。最初Openmined視頻展出的是我迄今為止看到的最接近的構(gòu)想。

                  哪些方法可能首先起作用?

                  我無法知道哪些是最好的結(jié)構(gòu),但我還是有一些個人的看法。

                  我評估區(qū)塊鏈項目的思想是:在某個范圍內(nèi),從物理原生屬性到數(shù)字原生屬性,再到區(qū)塊鏈原生屬性,區(qū)塊鏈原生屬性越多越好。區(qū)塊鏈原生屬性越少,就越依賴于引入可信的第三方,增加了復(fù)雜度,并降低了與其他系統(tǒng)一起構(gòu)建的易用性。

                  這意味著如果創(chuàng)造的價值是可量化的,系統(tǒng)就能更好運行- 理想情況下,直接用代幣形式更好,那將是一個干凈的閉環(huán)系統(tǒng)。將之前的加密貨幣交易系統(tǒng)與識別X射線中的腫瘤的系統(tǒng)進行比較,在后者中,你需要說服一家保險公司X射線模型是有價值的,并且在有多大價值的問題上討價還價,然后相信一小群人來驗證模型的成功或失敗。

                  這并不是說更積極的數(shù)字原生屬性的社會不會出現(xiàn)。像前面提到的推薦系統(tǒng)一樣可能非常有用,如果附加到策展市場,那是另一種情況,模型在鏈上運行,系統(tǒng)獎勵代幣,再次創(chuàng)建一個干凈的閉環(huán)。雖然現(xiàn)在似乎還不太清淅,但我希望區(qū)塊鏈原生項目隨著時間的推移而得到擴展。

                  啟示

                  首先,去中心化的機器學(xué)習(xí)市場可以突破當(dāng)前科技巨頭的數(shù)據(jù)壟斷。在過去的20年里,巨頭們對互聯(lián)網(wǎng)上價值資源進行了標(biāo)準(zhǔn)化并商業(yè)化,形成了專屬的數(shù)據(jù)網(wǎng)絡(luò)和圍繞數(shù)據(jù)產(chǎn)生的強大網(wǎng)絡(luò)效應(yīng)。結(jié)果,價值創(chuàng)建從數(shù)據(jù)轉(zhuǎn)移到算法。

                  3(技術(shù)的標(biāo)準(zhǔn)化和商業(yè)化,我們即將接近數(shù)據(jù)壟斷網(wǎng)絡(luò)時代的終結(jié)。圖表來自于Placeholder)

                  換句話說,他們?yōu)锳I創(chuàng)建了一個直接的商業(yè)模式,喂養(yǎng)并訓(xùn)練它。

                  其次,他們創(chuàng)造了世界上最強大的人工智能系統(tǒng)。通過直接的經(jīng)濟激勵吸引了最好的數(shù)據(jù)和模型。他們的力量隨著多邊網(wǎng)絡(luò)效應(yīng)的增加而增強。隨著Web 2.0時代數(shù)據(jù)網(wǎng)絡(luò)壟斷商品化,它們似乎有可能成為下一個勝出者。我們可能還需要幾年時間,但方向看起來是正確的。

                  第三,如推薦系統(tǒng)案例所示,搜索將被反轉(zhuǎn)。不是人去搜索產(chǎn)品,而是產(chǎn)品去搜索和爭取人(這種框架歸功于布拉德)。每個人都可能擁有自已的策展市場,推薦系統(tǒng)根據(jù)個體相關(guān)性的定義,算法模型爭相為其推薦最相關(guān)的內(nèi)容。

                  第四,它們將使我們能夠獲得類似谷歌和Facebook等公司強大的基于機器學(xué)習(xí)的服務(wù),同時不會泄露我們的隱私數(shù)據(jù)。

                  第五,機器學(xué)習(xí)發(fā)展會更快,因為任何工程師都可以訪問開放的數(shù)據(jù)市場,而不是只有大型Web 2.0公司中的工程師才能獲得。

                  挑戰(zhàn)

                  首先,安全計算方法目前還相當(dāng)慢,而且機器學(xué)習(xí)在計算上還很昂貴。但另一方面,由于人們對安全計算方法有了更多興趣,一切正在變好。在過去的6個月內(nèi)HE、MPC和ZKP性能提升的新方法已經(jīng)出現(xiàn)。

                  一組特定數(shù)據(jù)或模型對元模型是有價值的,但關(guān)于如何計算價值還是很困難的。

                  清理和格式化眾包數(shù)據(jù)也具有挑戰(zhàn)性。我們可能會看到一些工具、標(biāo)準(zhǔn)化和小企業(yè)的組合來解決這個問題。

                  最后,具有諷刺意味的是,用于創(chuàng)建此類系統(tǒng)的通用構(gòu)造的商業(yè)模式不如創(chuàng)建單個實例那么明確。這似乎更適用于許多新的加密原語,包括策展市場。

                  結(jié)論

                  機器學(xué)習(xí)與區(qū)塊鏈激勵相結(jié)合,可以在各種應(yīng)用中創(chuàng)造出最強大的機器智能。隨著時間的推移,存在可以解決的重大技術(shù)挑戰(zhàn)。但他們的長期潛力巨大,并且有可能從目前大型互聯(lián)網(wǎng)公司對數(shù)據(jù)的控制中脫穎而出。它們也有點可怕——因為系統(tǒng)引導(dǎo)出自己的存在,自我強化,消費隱私數(shù)據(jù),幾乎不可能停止,不可能被關(guān)閉,創(chuàng)建它們是否有點像召喚了前所未有的強大的異教神摩洛克(Moloch)?無論如何,它們是加密貨幣將如何慢慢地,然后突然進入每個行業(yè)的另一個突破口。

                  數(shù)據(jù) 系統(tǒng) 模型 創(chuàng)建 機器學(xué)習(xí)
                  分享到:

                  1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標(biāo)注作者和來源;
                  2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
                  3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補充。