今年十月,中央提出“加快推動區(qū)塊鏈技術(shù)和產(chǎn)業(yè)創(chuàng)新發(fā)展”的要求,讓“區(qū)塊鏈+”概念再上風口。在眾多的“區(qū)塊鏈+”之中,“區(qū)塊鏈+數(shù)據(jù)安全”這一話題跨越了技術(shù)、行業(yè)和場景的區(qū)隔,成為區(qū)塊鏈應用的又一大熱門領(lǐng)域。
區(qū)塊鏈的去中心化、防篡改和公開透明的特點,看似完美契合了數(shù)據(jù)安全的需求;但要讓這一技術(shù)真正落地,還需要跑通二者間融合的“最后一公里”:應用場景的連通。許多研究區(qū)塊鏈技術(shù)應用的企業(yè)和機構(gòu)嘗試通過“數(shù)據(jù)上鏈”,實現(xiàn)對數(shù)據(jù)本身的保護。而大數(shù)據(jù)分析與應用企業(yè)華策數(shù)科則將重點放在了數(shù)據(jù)確權(quán)與授權(quán)環(huán)節(jié),正式啟動區(qū)塊鏈技術(shù)針對數(shù)據(jù)科學的開發(fā)應用規(guī)劃。
“數(shù)據(jù)孤島”與聯(lián)邦學習
信息爆炸時代,人們?nèi)粘5囊慌e一動都產(chǎn)生著數(shù)據(jù)。據(jù)IDG發(fā)布的《數(shù)據(jù)時代2025》報告顯示,2018年全世界共產(chǎn)生33ZB(約合36萬億GB)的數(shù)據(jù)量。預計到2025年,全球年數(shù)據(jù)總量將增至175ZB。
與之形成鮮明對比的是,有行業(yè)媒體分析指出,全球數(shù)據(jù)利用率僅為2%(亦有分析認為不足1%)。余下超過35萬億GB的數(shù)據(jù),將不再流轉(zhuǎn)、不被分析,成為漂浮在信息海洋中的“孤島”。
連接這些“數(shù)據(jù)孤島”存在兩方面的難題:其一,數(shù)據(jù)要被合規(guī)使用,首先需要獲得其所有者的授權(quán),而現(xiàn)代社會行為的復雜性,使得數(shù)據(jù)所有者與數(shù)據(jù)使用者之間的距離可以被無限拉長,導致數(shù)據(jù)確權(quán)變得十分復雜;其二,數(shù)據(jù)需要流通才能產(chǎn)生價值,且不論小公司如何實現(xiàn)數(shù)據(jù)流通,就連少數(shù)巨頭公司之間,目前也未能打造出讓數(shù)據(jù)安全流動交互的工具(機制)。
在今年初《時代》周刊百大人物峰會上,李開復提到的“聯(lián)邦學習”(Federated Learning)引發(fā)眾多討論。這個由Google在2016年提出的概念,設想了一個數(shù)據(jù)不出本地的加密參數(shù)交換方式,讓自有數(shù)據(jù)不完整的企業(yè)之間通過聯(lián)合建模的形式,實現(xiàn)事實上的“數(shù)據(jù)流通”。
經(jīng)過數(shù)年探索與完善,聯(lián)邦學習在理論上為數(shù)據(jù)安全要求下的聯(lián)合建模提供了支持,但在操作層面,尤其是數(shù)據(jù)加密和樣本對齊,仍需要更加高效的工具(技術(shù))支撐。
正是在這一背景下,越來越多的開發(fā)者將目光投向區(qū)塊鏈(尤其是聯(lián)盟鏈)技術(shù)。華策數(shù)科的首席運營官陳志明介紹稱,“聯(lián)邦學習的建模效果不會差于傳統(tǒng)深度學習算法的建模效果,但區(qū)塊鏈的加密技術(shù)和共識算法能夠很好地滿足聯(lián)合建模對數(shù)據(jù)安全和效率的需求。”
陳志明表示,正是基于這一應用前景,華策數(shù)科啟動了區(qū)塊鏈技術(shù)開發(fā)的規(guī)劃,并計劃于明年起組建一支全新的研發(fā)團隊,研究區(qū)塊鏈技術(shù)與大數(shù)據(jù)分析與應用的結(jié)合。“華策數(shù)科擁有豐富的聯(lián)合建模經(jīng)驗,未來不僅可以擔任建模服務商的角色,在擁有區(qū)塊鏈技術(shù)應用的能力之后,還可以承擔聯(lián)合建模的‘協(xié)作者’,為更多企業(yè)搭建數(shù)據(jù)流通的橋梁。”
借區(qū)塊鏈打通數(shù)據(jù)信任“最后一公里”
在一些業(yè)內(nèi)人士看來,區(qū)塊鏈技術(shù)除了可以解決建模過程中的數(shù)據(jù)流通安全問題,也同樣可以在數(shù)據(jù)授權(quán)過程中發(fā)揮重要的作用。
華策數(shù)科的創(chuàng)始人兼首席執(zhí)行官張新昌在本月初的一場大數(shù)據(jù)行業(yè)分享會上提出了“讓用戶的授權(quán)行為上鏈”的想法,也受到不少技術(shù)開發(fā)者的關(guān)注。張新昌認為,以往數(shù)據(jù)從產(chǎn)生、收集到二次應用,需要經(jīng)歷多道程序流轉(zhuǎn),以致于當機構(gòu)或企業(yè)需要引入外部數(shù)據(jù)進行分析應用時,“獲取授權(quán)”就成為一道難以逾越的障礙。
“我們可以通過引入?yún)^(qū)塊鏈技術(shù)的應用,讓用戶的授權(quán)行為上鏈,數(shù)據(jù)方以此憑證輸出數(shù)據(jù)標簽或維度。這一行為過程中所需的公開透明、防偽可溯以及對數(shù)據(jù)方的獎勵機制,區(qū)塊鏈技術(shù)都已經(jīng)有了很成熟的應用。”張新昌說,“這是大數(shù)據(jù)與區(qū)塊鏈在新場景下的整合應用模式,我們也可以稱之為‘融合藝術(shù)’的一例。”
來源:華策數(shù)科
“科學和藝術(shù)在山麓分手,又在山頂重逢。”當比特幣橫空出世時,鮮有人能料到作為底層技術(shù)的區(qū)塊鏈能夠有朝一日成為一個國家重點推進的核心技術(shù)。如今,區(qū)塊鏈概念與供應鏈金融、物聯(lián)網(wǎng)、消費金融、智能制造等領(lǐng)域的創(chuàng)新結(jié)合,正是“融合藝術(shù)”帶來的美妙反應。
大數(shù)據(jù)讓商業(yè)決策變得“聰明”高效,區(qū)塊鏈讓大數(shù)據(jù)分析和應用變得安全可靠。張新昌相信,這一應用場景的開發(fā)不僅能讓華策數(shù)科的業(yè)務受益,同時體現(xiàn)華策數(shù)科踐行數(shù)據(jù)安全的理念,更重要的是能夠輸出一整套數(shù)據(jù)科學與區(qū)塊鏈技術(shù)結(jié)合的體系,為飽受數(shù)據(jù)合規(guī)爭議的大數(shù)據(jù)行業(yè)帶來全新的解決方案。