2012 年被認為是大數據元年。在這一年,美國奧巴馬政府推出了《大數據研究和發(fā)展計劃》,啟動(dòng)了美國國家大數據戰略;用戶(hù)日志管理公司 Splunk 成功上市,成為大數據第一股。在隨后的幾年中,大數據風(fēng)潮席卷全球,技術(shù)、資本、人才趨之若鶩,大數據產(chǎn)業(yè)出現了一波脈沖式的發(fā)展。從全球經(jīng)驗來(lái)看,企業(yè)是大數據應用創(chuàng )新的主要力量,政府為大數據產(chǎn)業(yè)發(fā)展提供了巨大支撐,開(kāi)源社區則為大數據技術(shù)進(jìn)步營(yíng)造了廣闊空間。但是,與此 同時(shí),鼓勵數據價(jià)值發(fā)現之“魚(yú)”和保護個(gè)人隱私之“熊掌”兩者不可兼得的法規矛盾變得越來(lái)越突出。 經(jīng)濟層面 創(chuàng )造價(jià)值是大數據應用創(chuàng )新的源動(dòng)力 利用大數據資源和技術(shù)創(chuàng )造更多價(jià)值,成為企業(yè) 開(kāi)展大數據應用創(chuàng )新的源動(dòng)力。圍繞既有的資源稟賦和競爭優(yōu)勢,企業(yè)進(jìn)行著(zhù)各種大數據產(chǎn)業(yè)創(chuàng )新,探索 出大數據背景下適合企業(yè)自身發(fā)展的路徑。 一方面,傳統IT硬件廠(chǎng)商積極向大數據基礎設 施和大數據技術(shù)平臺服務(wù)提供商轉型。根據美國專(zhuān) 業(yè)分析機構Wikibon發(fā)布的報告,IBM公司2013年從大數據相關(guān)產(chǎn)品及服務(wù)中獲得了13.68 億美元收益。其具體產(chǎn)品包括服務(wù)器與存儲硬件、數據庫軟件、 分析應用程序以及相關(guān)服務(wù),還有 DB2、Informix、 InfoSphere 數據庫平臺,Cognos 與 SPSS 等大數據 分析應用類(lèi)產(chǎn)品;萜展驹2013年獲得的大數據營(yíng)業(yè)收入總值為8.69億美元,它還提供與之相關(guān) 的硬件、軟件以及服務(wù),其中最為知名的方案當數 Vertica 分析平臺。 另一方面,諸多新型互聯(lián)網(wǎng)企業(yè)成為數據資源的集聚方,通過(guò)創(chuàng )新形成大量的數據產(chǎn)品服務(wù)于各類(lèi)應 用場(chǎng)景。比如,eBay公司用數據驅動(dòng)商業(yè),其所有的 數據產(chǎn)品都是針對業(yè)務(wù)而生,數據部門(mén)需要對不斷變 化的用戶(hù)需求找到解決之法,也就是從客戶(hù)的行為數據中尋找更多新價(jià)值。eBay公司針對賣(mài)家工具提供的 Seller Hub,可以對每一位賣(mài)家進(jìn)行深入分析,使賣(mài)家了解哪些商品更暢銷(xiāo),產(chǎn)品如何標價(jià)才能具備競爭 優(yōu)勢等。再比如,Salesforce公司是一家專(zhuān)注于CRM(用戶(hù)關(guān)系管理)的公司,通過(guò)對用戶(hù)數據分析挖掘 形成新的價(jià)值,是大數據在精準營(yíng)銷(xiāo)領(lǐng)域的典型應用。 Salesforce公司在2015年的營(yíng)業(yè)收入超過(guò)50億美元。 據大數據行業(yè)分析師師估計,到2020年,Salesforce公司有望成為一家市值達 1000 億美元的公司。 技術(shù)層面 開(kāi)源社區是大數據技術(shù)進(jìn)步的大生態(tài) 開(kāi)源模式成為大數據技術(shù)創(chuàng )新的主要途徑。從大數據技術(shù)的發(fā)展歷程上可以看出,大數據核心技術(shù)如分布式存儲、云端分布式及網(wǎng)格計算均依賴(lài)于開(kāi)源模式,即通過(guò)開(kāi)放式的平臺,吸引全球開(kāi)發(fā)者通過(guò)開(kāi)源社區進(jìn)行代碼的開(kāi)發(fā)、維護和完善,從而集全球智慧推動(dòng)大數據技術(shù)的不斷進(jìn)步。當前,全球各大企業(yè) 加大了對開(kāi)源社區的贊助和智力投入,開(kāi)源社區在大 數據技術(shù)進(jìn)步中占據核心地位。 一方面,由第三方打造的大數據技術(shù)開(kāi)源平臺 發(fā)揮了積極作用。Apache 軟件基金會(huì )(ASF)是推動(dòng)大數據技術(shù)發(fā)展的全球頂級開(kāi)源社區。ASF 正式創(chuàng )建 于 1999 年,至今已經(jīng)成功孵化了眾多大數據相關(guān)的 開(kāi)源項目。ASF 大數據開(kāi)源社區的創(chuàng )建過(guò)程是全球 大數據技術(shù)公司的集體智慧。其中,Apache Hadoop 技術(shù)的發(fā)展就是非常典型的例子。谷歌公司在 2003 年發(fā)布的關(guān)于谷歌文件系統(Google GFS)的論文 和 2004 年發(fā)布的關(guān)于編程模型 MapReduce 的論文是 Hadoop 的技術(shù)雛形。2005 年, 雅虎公司啟動(dòng)了 Nutch 項目,提供了一個(gè)專(zhuān)門(mén)的團隊和資源將 Hadoop 發(fā)展成一個(gè)可在網(wǎng)絡(luò )上運行的系統。到 2008 年 1 月, Hadoop 已成為 Apache 的頂級項目,并成為大數據發(fā)展的技術(shù)標準。 另一方面,大數據領(lǐng)先企業(yè)也在圍繞自身生態(tài) 打造技術(shù)開(kāi)源社區。這些企業(yè)通過(guò)開(kāi)源項目的方式推動(dòng)技術(shù)創(chuàng )新,并將創(chuàng )新成果通過(guò)開(kāi)源方式向全社會(huì )輻射,引導和推動(dòng)大數據技術(shù)的發(fā)展,在國際上逐漸形成了一套高效運轉的研發(fā)產(chǎn)業(yè)化體系。開(kāi)源提供了一 種高效生產(chǎn)軟件的方法,降低了企業(yè)進(jìn)入大數據應用服務(wù)市場(chǎng)的壁壘,催生更多技術(shù)和服務(wù)應用的創(chuàng )新。比如,Facebook 公司于 2013 年 11 月開(kāi)源了 Presto 技術(shù),該技術(shù)是新型分布式 SQL 引擎,它能夠對各 種大小(從 GB 級至 PB 級)的數據源進(jìn)行交互式的 分析查詢(xún)。2015 年,Presto 社區的代碼提交數量提 高了48%,而 fork 的數量則提高了 99%。Airbnb、 Dropbox、Netflix 等各大公司都開(kāi)始使用 Presto 作 為交互式查詢(xún)引擎。 Presto 在全球范圍內的接受度也在逐步提高,包括來(lái)自日本的社交媒體游戲開(kāi)發(fā)公司 Gree,以及來(lái)自中國的電子商務(wù)公司京東都在使 用該技術(shù)。 政策層面 政府戰略是推動(dòng)大數據產(chǎn)業(yè)發(fā)展的重要保障 完善的政策是當前大數據先行國家推廣大數據應用的重要保障。在政府大數據戰略部署和政策推動(dòng)下,發(fā)達國家的政府部門(mén)、企業(yè)、高校及研究機構都開(kāi)始積極探索大數據的應用。美國政府和歐盟成員國家都對大數據發(fā)展持積極態(tài)度,但具體策略有所不同。 美國的大數據戰略重在“以點(diǎn)帶面”,通過(guò)公布重要部門(mén)的大數據項目規劃,扶持重要領(lǐng)域的大數據技術(shù)研發(fā),帶動(dòng)其他部門(mén)和社會(huì )各界對大數據技術(shù)的研發(fā)投入和推廣應用。2009 年,美國國家科學(xué)技術(shù)委員會(huì )(NSTC)發(fā)布了《開(kāi)發(fā)數字數據的威力》報告,初步提出了發(fā)展大數據的框架、建議和目標。2012 年 3 月,奧巴馬政府宣布啟動(dòng)《大數據研究和發(fā)展計劃》,投入 2 億美元進(jìn)行大數據相關(guān)技術(shù)的研發(fā)。2013 年 5 月,奧巴馬政府發(fā)布行政命令,加大政府 數據開(kāi)放力度,以便更加有效地利用寶貴的公共數據 資源。2014 年 5 月,白宮行政辦公室與總統科技顧 問(wèn)委員會(huì )(PGAST)聯(lián)合發(fā)布報告《大數據:抓住機遇,保護價(jià)值》,從政策角度分析了大數據技術(shù)的發(fā)展對社會(huì )帶來(lái)的巨大影響。2016 年 5 月,白宮又發(fā)布了《聯(lián)邦大數據研發(fā)戰略計劃》報告,在已有基礎上提出美國下一步的大數據發(fā)展戰略。通過(guò)一系列的政策措施,美國大數據戰略形成了跨部門(mén)協(xié)同工作的機制。具體工作由 NSTC下設的“網(wǎng)絡(luò )與信息技術(shù)研發(fā)計劃”(NTTRD)分委員會(huì )負責,并專(zhuān)門(mén)設立跨部門(mén)高級別協(xié)調工作組,參與部門(mén)多達 15 個(gè),2016 年的工作預 算達到近 3 億美元。 歐盟則強調政府“鋪路打基礎”的作用,突出政府在人才培養、基礎設施建設、資金扶持、項目規劃、合作環(huán)境搭建中的基礎保障作用。2012年9月,歐盟進(jìn)一步公布了《釋放歐洲云計算服務(wù)潛力》戰略方案,并向歐盟委員會(huì )和歐洲議會(huì )提交了《云計算發(fā)展戰略及三大關(guān)鍵行動(dòng)》建議。該戰略計劃通過(guò)兩年時(shí)間,把歐盟打造成云計算服務(wù)的領(lǐng)先經(jīng)濟體,為 2014—2020年歐盟“云起飛”創(chuàng )造基礎,讓大數據技術(shù)革命滲透到經(jīng)濟社會(huì )的各個(gè)領(lǐng)域。到 2020 年,大數據技術(shù)為歐盟創(chuàng )造的GDP將達到9570 億歐元, 增加就業(yè)人數 380 萬(wàn)。2015 年以來(lái),歐盟力推的《數據價(jià)值鏈戰略計劃》旨在用大數據改造傳統治理模式,大幅降低公共部門(mén)成本,并促進(jìn)經(jīng)濟和就業(yè)增長(cháng)。這一計劃的重點(diǎn)是培育一個(gè)連貫的歐洲數據生態(tài)系統,促進(jìn)圍繞數據的研究和創(chuàng )新工作,采用數據服務(wù) 及產(chǎn)品,采取具體行動(dòng),改善數據價(jià)值提取的框架條件,包括基礎能力、基礎設備、標準以及有利的政策 和法規環(huán)境。目前,歐盟正在制定一系列重點(diǎn)行動(dòng)計劃,解決數據價(jià)值鏈中與價(jià)值創(chuàng )造相關(guān)的大量交叉問(wèn)題。數據價(jià)值鏈戰略計劃包括開(kāi)放數據、云計算、高性能計算和科學(xué)知識開(kāi)放獲取四大戰略。 法規層面 隱私保護是大數據產(chǎn)業(yè)發(fā)展的難掩之傷 當前,各國對大數據產(chǎn)業(yè)創(chuàng )新給予支持的同時(shí),未能形成明確的監管法律來(lái)確定個(gè)人隱私在大數據時(shí)代的法律邊界,這造成了大數據行業(yè)發(fā)展的法律 監管“灰色地帶”。一方面,以數據驅動(dòng)的經(jīng)濟發(fā)展模式是各國所向往的新經(jīng)濟形態(tài),鼓勵數據開(kāi)放是 “魚(yú)”;另一方面,數據價(jià)值挖掘背后是對個(gè)人隱私權不同程度的侵犯,呼吁保護隱私是“熊掌”。但是, “魚(yú)”和“熊掌”不可兼得。因此,我們經(jīng)?吹,各國政府在制定和實(shí)施隱私保**規的時(shí)候,往往會(huì ) 出現時(shí)緊時(shí)松、左右搖擺的現象。 美國是非常尊重個(gè)人隱私的國家,最早提出隱 私權概念,同時(shí)也是世界上互聯(lián)網(wǎng)絡(luò )技術(shù)最為發(fā)達的國家,大力倡導網(wǎng)絡(luò )信息自由。1966 年頒布的《信息自由法案》要求充分實(shí)現信息公開(kāi)和開(kāi)放,讓公民 有足夠的知情權;1986 年通過(guò)的處理網(wǎng)絡(luò )隱私權保 護問(wèn)題的重要法案《聯(lián)邦電子通訊隱私權法案》強調對個(gè)人隱私的保護。多種法律法規對行為主體的適用性會(huì )出現不一致的情況,所以美國政府砸保護網(wǎng)絡(luò )隱私方面更偏重于采用行業(yè)自律的模式。在“9 11”事件之后,尤其是“棱鏡門(mén)”事件之后,美國政府加強了對網(wǎng)絡(luò )信息的管控,直到大數據產(chǎn)業(yè)興起,網(wǎng)絡(luò )數據管控才有所放松。隨著(zhù)以數據驅動(dòng)的新經(jīng)濟模式的發(fā)展,個(gè)人數據隱私被侵犯的問(wèn)題變得越來(lái)越嚴重。奧巴馬政府時(shí)期,聯(lián)邦通信委員會(huì )(FCC)頒布了《網(wǎng)絡(luò )用戶(hù)個(gè)人隱私保**案》,不允許網(wǎng)絡(luò )服務(wù)提供商(ISP)在未經(jīng)用戶(hù)同意的情況下買(mǎi)賣(mài)用戶(hù)的個(gè)人數據信息。但是,2017 年 3 月 28 日,美國眾議院票決宣布廢除《網(wǎng)絡(luò )用戶(hù)個(gè)人隱私保**案》。這標志著(zhù)美國互聯(lián)網(wǎng)政策將發(fā)生急劇變化,政策搖擺現象展現得淋漓盡致。不過(guò),也有人將此解讀為商業(yè)巨頭的博弈,因為此次聯(lián)合決議授權 ISP 進(jìn)入原來(lái)由谷歌公司 和 Facebook 公司占據主導地位的在線(xiàn)廣告市場(chǎng)。 據羿戓設計所了解,歐盟在隱私保護方面更為保守,傾向于制定和 執行較為嚴格的隱私保**規。 歐盟 1995 年通過(guò)了《數據保護指令》,為歐盟成員國立法保護個(gè)人數據設立了最低標準。其后,2002 年頒布的《隱私與電子通信指令》要求網(wǎng)站告知用戶(hù)啟用 Cookie 及如何刪除或作廢 Cookie。2009 年頒布 的《歐洲 Cookie 指令》則要求網(wǎng)站在用戶(hù)初始使用時(shí)必須關(guān)閉 Cookie,直到用戶(hù)明確同意啟用 Cookie 時(shí)才能 開(kāi)啟此功能。2015 年 12 月,歐盟執委會(huì )(European Commission)通過(guò)了《一般數據保護條例》(GDPR),以歐盟法規的形式確定了對個(gè)人數據的保護原則和 監管方式。值得一提的是,《一般數據保護條例》還 提出了“被遺忘權”(Right to Be Forgotten), 即個(gè)人可以要求搜索引擎從包含“不相關(guān)”或者“過(guò) 期”個(gè)人信息的結果里移除鏈接。這種法律拘束性判決現在不僅是歐盟法律的一部分,還延伸到覆蓋各種 類(lèi)型的個(gè)人數據。比如,個(gè)人可以要求 Facebook 公司刪除個(gè)人賬戶(hù)以及所有自己的活動(dòng)相關(guān)的數據。 縱觀(guān)全球大數據產(chǎn)業(yè),當前尚處于初級階段。對于中國大數據產(chǎn)業(yè)來(lái)說(shuō),政府的戰略支持和企業(yè)創(chuàng )新能力都已經(jīng)具備,但還沒(méi)有形成成熟的大數據技術(shù)開(kāi)源社區。此外,為了保障大數據產(chǎn)業(yè)的有序規范發(fā)展,相應的法律法規也是必不可少的。
|