數(shù)據(jù)本身是沒(méi)有偏好的科學(xué)工具。除非這個(gè)原本枯燥的工作被賦予了太多的利益內(nèi)涵而又不受制約。簡(jiǎn)言之,數(shù)據(jù)就像是鐵面無(wú)私的法官,其公信力往往取決于數(shù)據(jù)生成全過(guò)程的抗干擾能力。
|
作者:涂子沛 出版:中信出版社 |
《數(shù)據(jù)之巔:大數(shù)據(jù)革命,歷史、現(xiàn)實(shí)與未來(lái)》是開中國(guó)社會(huì)大數(shù)據(jù)之先河的徐子沛的第二本著述,如果說(shuō)前一本開創(chuàng)性的《大數(shù)據(jù)》引發(fā)了大數(shù)據(jù)戰(zhàn)略、數(shù)據(jù)治國(guó)和開放數(shù)據(jù)的討論,“為華文世界開創(chuàng)了一個(gè)重要話題”,那《數(shù)據(jù)之巔》則在追根溯源,追述小數(shù)據(jù)的歷史與大數(shù)據(jù)的崛起過(guò)程,著重解析美國(guó)的實(shí)例,闡述歷史大架構(gòu)下的數(shù)據(jù)文化以及數(shù)據(jù)治國(guó)理念的形成。歸根結(jié)底,作者是要提醒國(guó)人,當(dāng)前信息技術(shù)的發(fā)展,已讓我國(guó)獲得了后發(fā)優(yōu)勢(shì),但數(shù)據(jù)文化從來(lái)是中國(guó)文化的薄弱之處,想在大數(shù)據(jù)時(shí)代的全球競(jìng)爭(zhēng)中勝出,必須把大數(shù)據(jù)從科技符號(hào)提升成為文化符號(hào),在全社會(huì)倡導(dǎo)數(shù)據(jù)文化。
按徐子沛的看法,大數(shù)據(jù)時(shí)代是從本世紀(jì)10年代開始的,標(biāo)志著人類社會(huì)正在向智能社會(huì)轉(zhuǎn)型,但追述大數(shù)據(jù)的興起過(guò)程,卻要從小數(shù)據(jù)開始。他選擇從美國(guó)的數(shù)據(jù)文化根基開始講起,通過(guò)闡述初數(shù)時(shí)代、內(nèi)戰(zhàn)時(shí)代、鍍金時(shí)代、進(jìn)步時(shí)代、抽樣時(shí)代的數(shù)據(jù)文化特征,以數(shù)據(jù)分權(quán)、人口普查、土地丈量、數(shù)據(jù)遠(yuǎn)征、數(shù)據(jù)審判等歷史事件為主線、系統(tǒng)梳理了美國(guó)數(shù)據(jù)文化的形成,闡述其數(shù)據(jù)治國(guó)之道。
無(wú)論是開國(guó)總統(tǒng)華盛頓,還是打贏南北戰(zhàn)爭(zhēng)的林肯,都高度重視統(tǒng)計(jì)。因“羅斯福新政”聞名于世的美國(guó)第31任總統(tǒng)富蘭克林·德拉諾·羅斯福更是“首倡要在公共政策的制定過(guò)程當(dāng)中應(yīng)用統(tǒng)計(jì)學(xué)的理論和方法”。高度重視統(tǒng)計(jì),表明一個(gè)政府對(duì)收集社會(huì)各方面信息的科學(xué)性,此舉也必定有助于決策的科學(xué)性。
但是,現(xiàn)實(shí)發(fā)展不可能總是自然走向好的一面。對(duì)數(shù)據(jù)越是高度重視,越不可避免地會(huì)遇到一個(gè)常識(shí)性的“技術(shù)”問(wèn)題,即數(shù)據(jù)的準(zhǔn)確性。數(shù)據(jù)是否準(zhǔn)確主要取決于兩大方面,一是統(tǒng)計(jì)標(biāo)準(zhǔn)的確立,二是統(tǒng)計(jì)過(guò)程的嚴(yán)謹(jǐn)。相較于后者,前者相對(duì)較為容易。之所以這么說(shuō),是因?yàn)榻y(tǒng)計(jì)過(guò)程的嚴(yán)謹(jǐn)與否,往往取決于統(tǒng)計(jì)人員的素質(zhì)以及相關(guān)制衡機(jī)制。很難想象,一個(gè)統(tǒng)計(jì)工作人員如果受到工作之外的強(qiáng)力干擾,仍會(huì)謹(jǐn)守?cái)?shù)據(jù)的準(zhǔn)確性。而如果缺乏外在有效監(jiān)督制約力量,統(tǒng)計(jì)很難不會(huì)朝向“趨利避害”的方向逐漸扭曲。這也就是說(shuō),統(tǒng)計(jì)做的是數(shù)字的工作,但歸根結(jié)底還是取決于人的素質(zhì),還有良好機(jī)制等系統(tǒng)機(jī)制的約束。
美國(guó)的數(shù)據(jù)權(quán)威之所以能夠得到較好的保證,拋開數(shù)屆政府堅(jiān)持確立科學(xué)的統(tǒng)計(jì)標(biāo)準(zhǔn)外,還在于整個(gè)社會(huì)對(duì)統(tǒng)計(jì)數(shù)據(jù)的真實(shí)性和科學(xué)性存在諸多制衡機(jī)制,比如公開和辯論。公開,本身就是社會(huì)對(duì)統(tǒng)計(jì)工作監(jiān)督的重要內(nèi)容之一,其中又以輿論監(jiān)督為最。在強(qiáng)大的輿論監(jiān)督壓力下,統(tǒng)計(jì)瑕疵一旦被曝光,輕則被質(zhì)疑,重則可能引發(fā)官場(chǎng)地震。二百多年來(lái),美國(guó)輿論對(duì)各類數(shù)據(jù)始終保持著習(xí)慣性“虎視眈眈”傳統(tǒng),絕大多數(shù)媒體還會(huì)通過(guò)民意調(diào)查等方式,從“民間”角度反證官方數(shù)據(jù)的準(zhǔn)確性與合理性。當(dāng)然,這種“民間發(fā)聲”也會(huì)被一些見風(fēng)使舵的政客所利用,一些美國(guó)總統(tǒng)精于踩著民意統(tǒng)計(jì)步點(diǎn),及時(shí)派“糖”以保個(gè)的支持率的實(shí)例屢見不鮮。不過(guò),徐子沛并不認(rèn)為這就是數(shù)據(jù)不可饒恕之積蔽,而是數(shù)據(jù)未來(lái)發(fā)展有必要努力克服的方向。
公開數(shù)據(jù),還是遏制特權(quán)的有效手段。在1843年前,美國(guó)“各地的執(zhí)法官為了提高(人口普查)數(shù)據(jù)的準(zhǔn)確性,在普查完成之后,還在城市、村莊的顯要位置張貼普查結(jié)果,號(hào)召民眾補(bǔ)充和核對(duì)”。盡管后來(lái)出于隱私保護(hù)的考慮,對(duì)有關(guān)統(tǒng)計(jì)信息都有所遮蔽,但“國(guó)會(huì)的議員必須每年公開自己的財(cái)產(chǎn)情況,包括各類股票的數(shù)量和交易明細(xì)”卻一點(diǎn)不通融。奧巴馬就任總統(tǒng)后,“從上任的第一天起,他就在全國(guó)范圍內(nèi)推動(dòng)數(shù)據(jù)開放運(yùn)動(dòng)”。數(shù)據(jù)公開力度,某種意義上也折射出一個(gè)社會(huì)的清廉度。
僅僅公開當(dāng)然是不夠的,因?yàn)橛械臄?shù)據(jù)不是公開后便可一目了然,這就需要專業(yè)人士的深入研究乃至充分爭(zhēng)論!霸趪(guó)會(huì)的聽證會(huì)上,每一個(gè)數(shù)據(jù)如果稍有含糊,每一個(gè)邏輯推理的鏈條如果斷裂,都有可能被虎視眈眈的競(jìng)爭(zhēng)對(duì)手揪出來(lái),受到質(zhì)疑和挑戰(zhàn)”。也只有經(jīng)常性地面臨被質(zhì)疑的強(qiáng)大壓力,才可能確保數(shù)據(jù)的生成過(guò)程始終嚴(yán)謹(jǐn)。
分析數(shù)據(jù),就是為了從數(shù)字中尋找可能的規(guī)律。一個(gè)過(guò)硬的數(shù)據(jù)體系,更有益于決策的造福于社會(huì)。數(shù)據(jù)不僅在美國(guó)政界大量開花結(jié)果,民間同樣收獲頗豐。如蓋洛普公司憑借“科學(xué)抽樣”不僅成功預(yù)測(cè)數(shù)屆總統(tǒng)人選,還為好萊塢電影《亂世佳人》提供全程指導(dǎo)并大獲成功。而被譽(yù)為“質(zhì)量管理之父”的愛德華·戴明通過(guò)抽樣檢查實(shí)現(xiàn)對(duì)產(chǎn)品質(zhì)量的控制,還推動(dòng)了日本制造業(yè)在短時(shí)間內(nèi)的質(zhì)量騰飛。
歷史學(xué)家黃仁宇在《萬(wàn)歷十五年》中有過(guò)一個(gè)著名論斷:中國(guó)人不善于用數(shù)目字管理,對(duì)古幣存世量的討論,大多含糊其辭。近幾十年來(lái),情況有了較大改變。1983年我國(guó)出臺(tái)了首部《統(tǒng)計(jì)法》,現(xiàn)在施行的《統(tǒng)計(jì)法》歷經(jīng)1996年和2009年兩次修訂。社會(huì)各方越來(lái)越重視分析比較各類統(tǒng)計(jì)數(shù)據(jù)。不過(guò),現(xiàn)實(shí)表明,我們的統(tǒng)計(jì)工作仍有大力提升的空間。順舉一例,據(jù)報(bào),2013年全國(guó)31省區(qū)市的GDP之和約為63萬(wàn)億,這個(gè)數(shù)據(jù)超出了全國(guó)GDP總量逾6.1萬(wàn)億。事實(shí)上,像這樣巨大的統(tǒng)計(jì)“誤差”絕非孤例。出現(xiàn)這類統(tǒng)計(jì)誤差,原因不外乎兩個(gè),一是統(tǒng)計(jì)標(biāo)準(zhǔn)不一,比如未能有效厘清對(duì)央企等特殊企業(yè)特殊行業(yè)的統(tǒng)計(jì)內(nèi)容;二是統(tǒng)計(jì)中摻有政績(jī)“水分”,這也是導(dǎo)致統(tǒng)計(jì)巨大“誤差”的重要原因。2002年,國(guó)務(wù)院前總理朱镕基為國(guó)家會(huì)計(jì)學(xué)院題寫校訓(xùn)“不做假賬”,這無(wú)疑是對(duì)數(shù)字工作者的巨大鞭策。然而,在多年來(lái)的“唯GDP”崇拜下,扭轉(zhuǎn)數(shù)字出政績(jī)的歷史慣性不僅需要智慧,恐怕還更需要“橫刀立馬”的勇氣。
數(shù)據(jù)本身是沒(méi)有偏好的科學(xué)工具。除非這個(gè)原本枯燥的工作被賦予了太多的利益內(nèi)涵而又不受制約。簡(jiǎn)言之,數(shù)據(jù)就像是鐵面無(wú)私的法官,其公信力往往取決于數(shù)據(jù)生成全過(guò)程的抗干擾能力。
隨著科學(xué)技術(shù)的飛速發(fā)展,特別隨著社交媒體的普及,每個(gè)網(wǎng)民在不知不覺(jué)中都變成了數(shù)據(jù)生產(chǎn)者。網(wǎng)民上網(wǎng)的過(guò)程,同時(shí)也是數(shù)據(jù)處理的過(guò)程,每個(gè)網(wǎng)民無(wú)形中變成了一臺(tái)臺(tái)數(shù)據(jù)處理器,所不同的是處理標(biāo)差和側(cè)重點(diǎn)的不同!皬目萍挤(hào)演變?yōu)槲幕?hào),形成一種文化話語(yǔ)體系,大數(shù)據(jù),正在撬動(dòng)中國(guó)的制度創(chuàng)新、科技創(chuàng)新”。現(xiàn)在的問(wèn)題是,面對(duì)海量的數(shù)字謎團(tuán),我們?cè)撊绾螐闹袑ふ铱赡艿膬?nèi)在規(guī)律?