|
作者:維克托·邁爾-舍恩伯格
肯尼思·庫(kù)克耶 出版:浙江人民出版社 |
如果把“數(shù)據(jù)化”視為信息社會(huì)的初級(jí)階段,則名不見經(jīng)傳的英國(guó)科學(xué)家維克托·邁爾-舍恩伯格,用他別具洞見的天才新著《大數(shù)據(jù)時(shí)代》首次告訴我們:人類正在進(jìn)入“數(shù)據(jù)顛覆傳統(tǒng)”的信息社會(huì)中級(jí)階段。
在此階段,信息無(wú)所不在無(wú)所不包,其無(wú)限膨脹的天文海量催生了“統(tǒng)計(jì)+分類-推理分析=決策”的計(jì)算機(jī)處理程序(有點(diǎn)像刷卡消費(fèi)一步到位,節(jié)省了算賬找補(bǔ)等繁瑣環(huán)節(jié)),悄然挑戰(zhàn)“去粗取精、去偽存真、由表及里、由此及彼”的傳統(tǒng)認(rèn)識(shí)論模式,冥冥之中潛移默化,對(duì)我們的生活、工作與思維,對(duì)人類“階級(jí)斗爭(zhēng)、生產(chǎn)斗爭(zhēng)、科學(xué)試驗(yàn)”三大實(shí)踐活動(dòng)產(chǎn)生著重大而深刻的影響。
大數(shù)據(jù)點(diǎn)燃大智慧
美國(guó)政府曾為定期公布消費(fèi)物價(jià)指數(shù)CPI以監(jiān)控通脹率,雇用了大量人員向全美90個(gè)城市的商店、辦公室進(jìn)行電話、傳真拜訪,耗資2.5億美元搜集反饋8萬(wàn)種商品價(jià)格的延時(shí)信息。然而麻省理工學(xué)院兩位經(jīng)濟(jì)學(xué)家采取“大數(shù)據(jù)”方案,通過(guò)一個(gè)軟件在互聯(lián)網(wǎng)上每天搜集50萬(wàn)種商品價(jià)格即時(shí)信息。2008年9月雷曼兄弟公司破產(chǎn)后,該軟件馬上發(fā)現(xiàn)了通脹轉(zhuǎn)為通縮的趨勢(shì),而官方數(shù)據(jù)直到11月才發(fā)現(xiàn)。之后該軟件被暢銷到70多個(gè)國(guó)家。這一案例充分體現(xiàn)出“大數(shù)據(jù)”顛覆傳統(tǒng)的力量和變革思維的智慧。
“小數(shù)據(jù)”時(shí)代追求精準(zhǔn),竭力避免不精準(zhǔn)信息誤導(dǎo)誤判。然而95%被傳統(tǒng)數(shù)據(jù)庫(kù)拒絕接受的非結(jié)構(gòu)化(非標(biāo)準(zhǔn))數(shù)據(jù),在“大數(shù)據(jù)”時(shí)代的模糊化數(shù)據(jù)庫(kù)中發(fā)揮了重要的作用,因?yàn)閿?shù)據(jù)越模糊越全面,才能有效避免誤導(dǎo)誤判。
從因果關(guān)系到相關(guān)關(guān)系的思維變革,是“大數(shù)據(jù)”顛覆傳統(tǒng)認(rèn)識(shí)論模式的關(guān)鍵。電腦畢竟不是人腦,電腦永遠(yuǎn)搞不懂氣候與機(jī)票價(jià)格之間有什么因果關(guān)系。公雞打鳴和天亮之間雖無(wú)因果關(guān)系,但古人通過(guò)公雞打鳴來(lái)預(yù)報(bào)天亮卻很少失敗!叭绻麛(shù)百萬(wàn)條醫(yī)療記錄顯示橙汁和阿司匹林的特定組合對(duì)癌癥治療有效果,那就用不著通過(guò)一次次實(shí)驗(yàn)來(lái)探索其具體的藥理機(jī)制了”。“蘋果之父”喬布斯就主動(dòng)試用過(guò)一些醫(yī)療記錄有效但未經(jīng)臨床驗(yàn)證的療法同癌癥抗?fàn)。你可以嘲笑喬布斯“不講科學(xué)”,但他卻因此多活了好幾年。
從根本上說(shuō),所謂“大數(shù)據(jù)挑戰(zhàn)傳統(tǒng)認(rèn)識(shí)論”,其實(shí)是人類把復(fù)雜的認(rèn)識(shí)過(guò)程“全部打包”給了電腦,而電腦懶得分析推理驗(yàn)證,只通過(guò)統(tǒng)計(jì)分類對(duì)比,交出“最終答案”就OK了。大數(shù)據(jù)大智慧的精髓在于變“少而精”為“多而全”,變“因果”為“相關(guān)”。當(dāng)實(shí)地調(diào)研開始被數(shù)據(jù)采集所替代,當(dāng)嚴(yán)密的實(shí)驗(yàn)開始被非線性邏輯所替代,當(dāng)“唯一真理”開始被多項(xiàng)選擇所替代,“大數(shù)據(jù)”就用事實(shí)向人類宣告:“知其然不知其所以然”,既是電腦望塵人腦的劣勢(shì),也是電腦超越人腦的優(yōu)勢(shì)!
大數(shù)據(jù)滲透大世界
不要以為“大數(shù)據(jù)”只是科幻故事或政府與科學(xué)家的“專利”。環(huán)顧四周,“大數(shù)據(jù)”早已滲透我們生活和工作的方方面面,衍生出形形色色的數(shù)據(jù)超市、數(shù)據(jù)易趣、數(shù)據(jù)交友、數(shù)據(jù)聯(lián)誼、數(shù)據(jù)作坊、數(shù)據(jù)課堂、數(shù)據(jù)IB等傳奇版本。從治安管理、交通運(yùn)輸、醫(yī)療衛(wèi)生、商業(yè)貿(mào)易、批發(fā)零售、公益救援直到政治、軍事、經(jīng)濟(jì)、金融、社會(huì)、環(huán)境、文藝、體育。
UPS國(guó)際快運(yùn)公司從2000年開始通過(guò)“大數(shù)據(jù)”檢測(cè)其遍布全美的6萬(wàn)輛貨車車隊(duì),統(tǒng)計(jì)出各損耗零部件的生命周期,改“備份攜帶”為提前更換,有效預(yù)防了半路拋錨造成的嚴(yán)重麻煩和巨大損失,每年節(jié)省數(shù)百萬(wàn)美元。UPS還依靠“大數(shù)據(jù)”優(yōu)化行車路線(例如盡量右轉(zhuǎn)彎,避免左轉(zhuǎn)彎),2011年全公司車輛少跑4828萬(wàn)公里,節(jié)省燃料300萬(wàn)加侖,減少碳排放3萬(wàn)公噸。
為紐約提供電力支持的愛迪生電力公司,針對(duì)每年多起電纜沙井蓋爆炸造成嚴(yán)重事故,采取“大數(shù)據(jù)”手段統(tǒng)計(jì)出106種預(yù)警先兆,預(yù)測(cè)2009年可能出事的沙井蓋并嚴(yán)加監(jiān)控。結(jié)果位列前十分之一的高危井蓋中,預(yù)測(cè)準(zhǔn)確率達(dá)44%。
美國(guó)里士滿市警察當(dāng)局憑經(jīng)驗(yàn)認(rèn)定槍擊事件往往導(dǎo)致犯罪高峰期,“大數(shù)據(jù)”證明這種高峰期往往出現(xiàn)在槍擊事件后2周左右。孟菲斯市2006年啟動(dòng)“大數(shù)據(jù)”系統(tǒng)鎖定了更容易發(fā)生犯罪的地點(diǎn)和更容易抓捕罪犯的時(shí)間,使重大犯罪發(fā)生率下降26%。
沃爾瑪2004年依靠“大數(shù)據(jù)”發(fā)現(xiàn)了颶風(fēng)前夕銷量增加的各類商品,進(jìn)而每逢預(yù)報(bào)便及時(shí)設(shè)立颶風(fēng)用品專區(qū),并將手電筒、早餐零食蛋撻等擺放于專區(qū)附近,明顯增加了“順便購(gòu)買”的銷量。
至于“大數(shù)據(jù)”的經(jīng)濟(jì)價(jià)值,僅需略舉數(shù)例:2006年微軟以1.1億美元購(gòu)買了埃齊奧尼的Farecast公司,2008年谷歌以7億美元購(gòu)買了為Farecast提供數(shù)據(jù)的ITA
Software公司。同年在冰島成立的DataMarket網(wǎng)站干脆?克鸭峁┞(lián)合國(guó)、世界銀行、歐盟統(tǒng)計(jì)局等權(quán)威機(jī)構(gòu)的免費(fèi)信息來(lái)獲利生存,包括倒賣各類研究機(jī)構(gòu)公開發(fā)布的研究數(shù)據(jù)——只要找到買主,往往愿出高價(jià)!
大數(shù)據(jù)創(chuàng)造大金融
金融領(lǐng)域當(dāng)然是“大數(shù)據(jù)”的主戰(zhàn)場(chǎng)之一。程序化交易也許是現(xiàn)今最主要的“大數(shù)據(jù)”新式武器。美國(guó)股市每天成交量高達(dá)70億股,但其中三分之二的交易量并非由人操作,而是由建立在數(shù)學(xué)模型和算法之上的計(jì)算機(jī)程序自動(dòng)完成。日新月異的程序化交易只能運(yùn)用海量數(shù)據(jù)來(lái)預(yù)測(cè)收益、降低風(fēng)險(xiǎn)。幾乎所有銀行、券商、保險(xiǎn)、期貨、QFII和投資公司都開發(fā)了自己的程序化交易工具。誰(shuí)的武器更先進(jìn)?競(jìng)爭(zhēng)到最后恐怕還是比誰(shuí)搜集處理的數(shù)據(jù)更海量。
一家投資基金通過(guò)統(tǒng)計(jì)大商場(chǎng)周邊停車場(chǎng)及路口交通擁擠狀況,來(lái)預(yù)測(cè)商場(chǎng)經(jīng)營(yíng)及當(dāng)?shù)亟?jīng)濟(jì)狀況,進(jìn)而預(yù)測(cè)相關(guān)股價(jià)走勢(shì),最后居然拿數(shù)據(jù)統(tǒng)計(jì)資料換得了該商場(chǎng)的部分股權(quán)。
不少對(duì)沖基金通過(guò)搜集統(tǒng)計(jì)社交網(wǎng)站推特上的市場(chǎng)心情等信息來(lái)預(yù)測(cè)股市的表現(xiàn)。倫敦和加利福尼亞的兩家對(duì)沖基金,利用“大數(shù)據(jù)”形成119份表情圖和18864項(xiàng)獨(dú)立的指數(shù),向許多客戶推銷股市每分鐘的“動(dòng)態(tài)表情”:樂觀、憂郁、鎮(zhèn)靜、驚恐、呆滯、害怕、生氣、激憤等,以幫助和帶動(dòng)投資決策。
在金融機(jī)構(gòu)競(jìng)相拉客理財(cái)?shù)慕裉,如果能及時(shí)搜集處理海量的微博、微信、短信,自然也能從茫茫人海中及時(shí)發(fā)現(xiàn)怦然心動(dòng)打算開戶的,或一氣之下打算“跳槽”的投資者。
當(dāng)然,如果投資者都能通過(guò)“大數(shù)據(jù)”直接決策,將“刷卡消費(fèi)”拓展成“刷卡投資”,那藏龍臥虎的分析師群體和爭(zhēng)雄斗妍的研究報(bào)告未來(lái)還有市場(chǎng)嗎?
大數(shù)據(jù)暗藏大隱患
像所有新生事物一樣,大數(shù)據(jù)也是一把雙刃劍。宏觀上看,“大數(shù)據(jù)”在各個(gè)不同的領(lǐng)域?qū)⑷祟愄摂M分割為“數(shù)據(jù)化”與“被數(shù)據(jù)化”兩大陣營(yíng)。持續(xù)發(fā)酵的“棱鏡門”事件披露了美國(guó)政府長(zhǎng)期監(jiān)控全世界的“最高機(jī)密”,但美國(guó)總統(tǒng)、國(guó)會(huì)和政府都認(rèn)定這種監(jiān)控“天經(jīng)地義”,是“維護(hù)國(guó)家核心利益”。雖然社會(huì)早已建立起龐大的法律法規(guī)體系來(lái)保障個(gè)人信息安全,但在“大數(shù)據(jù)”時(shí)代,這些體系正蛻變?yōu)楣倘艚饻梢噪S意繞過(guò)的“馬其諾防線”。
“大數(shù)據(jù)”導(dǎo)致個(gè)人信息被交易、個(gè)人隱私被外泄還不算,更大的危險(xiǎn)在于“個(gè)人行為被預(yù)測(cè)”。正如作者預(yù)言——“這些能預(yù)測(cè)我們可能生病、拖欠還款甚至犯罪的算法程序,會(huì)讓我們無(wú)法購(gòu)買保險(xiǎn)、無(wú)法貸款,甚至在犯罪實(shí)施前就預(yù)先被逮捕”——也許你認(rèn)為這對(duì)全社會(huì)來(lái)說(shuō)無(wú)疑是好事?墒侨绻A(yù)測(cè)系統(tǒng)不完善、軟硬件出差錯(cuò)、數(shù)據(jù)搜集處理不當(dāng)、臨時(shí)數(shù)據(jù)未經(jīng)檢驗(yàn)、黑客攻擊、有人惡意或善意開玩笑制造假信息……導(dǎo)致你、你的家庭、你的親朋好友、你的所在單位甚至你的祖國(guó)被冤枉被制裁,你還能無(wú)動(dòng)于衷嗎?
微觀上看,即使是出于正當(dāng)目的采集的“大數(shù)據(jù)”,仍可能在“擴(kuò)展開發(fā)”過(guò)程中產(chǎn)生無(wú)法想象的副作用。例如谷歌的街景拍攝和GPS數(shù)據(jù)為衛(wèi)星定位和自動(dòng)駕駛儀提供了關(guān)鍵的支持,但同時(shí)因其有助于黑幫盜賊便捷挑選有利目標(biāo)而引發(fā)了多國(guó)民眾的強(qiáng)烈抗議。當(dāng)谷歌對(duì)圖像背景上的業(yè)主房屋、花園等目標(biāo)進(jìn)行模糊化處理后,反而引起盜賊更加注意。
無(wú)論你驚奇還是恐懼,歡迎還是躲避,關(guān)注還是漠視,理解還是拒絕,“大數(shù)據(jù)”都在加快步伐向我們走來(lái)。我們只有順勢(shì)而為,趨利避害,才不至于被這個(gè)充滿機(jī)遇和挑戰(zhàn)的新時(shí)代提前淘汰。