做好搜索
《李開復(fù)自傳》連載
2010-08-20   作者:  來源:經(jīng)濟參考網(wǎng)
 

    在美國,谷歌是一家以精確搜索和恪守價值觀而聞名的公司,它的英文搜索引擎是全世界最精準的搜索引擎。
    谷歌改變了互聯(lián)網(wǎng)的新格局。它以搜尋精確和索引巨大,迅速贏得了網(wǎng)民的歡心。谷歌能夠搜到別的搜索引擎搜索不到的信息,并且精確、客觀地給出排名,導(dǎo)致谷歌成為廣告宣傳、趨勢分析,以及收集市場調(diào)查、統(tǒng)計數(shù)據(jù)的重要渠道和指標,也使google一詞成為了英語詞典中的一個動詞!
    谷歌的商業(yè)模式就是在搜索結(jié)果旁邊顯示清晰標注的廣告,它的巨大使用量保證了谷歌商業(yè)模式的成功。
    除了搜索外,谷歌還陸續(xù)推出其他的新產(chǎn)品。比如在谷歌地球,上面可以真實呈現(xiàn)每一個山丘、每一座建筑,用戶如同在一架飛機上,從空中俯瞰這個世界,使得人們有一種身臨其境的感覺;而谷歌的Gmail更是讓人驚奇,不但云計算功能把用戶的郵件海量存儲在服務(wù)器上,使Gmail的用戶永遠不用刪除郵件,而且只要鍵入幾個關(guān)鍵詞,就可以在往來郵件中輕松找到任何有關(guān)的郵件。
    這些各種各樣美妙的產(chǎn)品能在中國得以“復(fù)制”嗎?
    在團隊初建的時候,很多員工開始想把這些又炫又酷的“殺手級”應(yīng)用引入中國,然后迅速吸引眼球,進而取得立竿見影的成功!摆s緊做谷歌地球中文版!那是最酷的產(chǎn)品!”“國外YouTube最火,模仿YouTube做一個視頻網(wǎng)站!”“Web 20時代來臨了,像MySpace一樣做一個社區(qū)!”“國內(nèi)博客最火,做博客搜索!”甚至有人提出,“為什么我們不能賣頁面左邊的廣告呢?”這樣的聲音在谷歌中國的辦公室里此起彼伏。我能感覺到這些來自全國各地的天才們求勝若渴的心態(tài)。
    但是,“天才們”往往沒有考慮清楚:這些產(chǎn)品是否適合中國的國情與法律?谷歌能否得到相關(guān)的牌照?這些產(chǎn)品要做多久?這些產(chǎn)品是否能由一個欠缺經(jīng)驗的團隊做成?還有,最重要的一個問題在于,這些產(chǎn)品是否真的是當務(wù)之急?
    其實在當時,更嚴重的問題是谷歌的中文搜索還做得非常不完善。從中文搜索的歷史來看,谷歌中文搜索雖然最早在2000年上線,但在進入中國之前,谷歌美國總部只有一個五六人的小團隊負責中文搜索,服務(wù)器在美國,使用全球統(tǒng)一網(wǎng)址googlecom。而其他幾個搜索引擎公司在中國很早就有了很大的團隊,它們更理解中國的國情和法律。在谷歌進入中國之前,互聯(lián)網(wǎng)上還在流傳著一個名叫“我知道你不知道”的搞笑視頻,大意是對尚未進入中國的谷歌的一種冷嘲熱諷。它在暗示,一個外國公司不可能做好中文搜索。
    其實,搜索是整個谷歌公司的立業(yè)之本,不但是最核心的產(chǎn)品,也是用戶最需要、最常用、最不能缺少的產(chǎn)品。而其他的服務(wù)則都是在搜索服務(wù)成功之后圍繞著它推出的,所以我們做產(chǎn)品絕對不能本末倒置。
    在2006年3月不到10位工程師、到年底也最多有100名工程師的前提下,我意識到,谷歌中國必須臥薪嘗膽、踏踏實實地專注于網(wǎng)頁搜索質(zhì)量。如果分心去追逐其他更炫更酷的產(chǎn)品,那一定會紕漏百出。就像是一艘航船,如果不先補好船上的漏洞卻急于航行,那么航船早晚會像泰坦尼克號一樣沉沒在汪洋大海中,先做好搜索幾乎是谷歌中國的唯一出路。
    盡管我認為提高搜索質(zhì)量是谷歌當下最重要的任務(wù),但我還是盡量讓所有的員工經(jīng)過討論,都認同這個戰(zhàn)略方向。因為,谷歌的文化就是每個人都應(yīng)該是自愿工作的,不應(yīng)該被強迫。中國用戶最需要哪一種產(chǎn)品?經(jīng)過無數(shù)個戰(zhàn)略會議的討論,大家開始理解專注搜索的重要性。記得在一次關(guān)鍵性的溝通中,產(chǎn)品總監(jiān)俞可說:“如果我們網(wǎng)頁搜索取得成功,而所有其他的一切都失敗,那我們依然是成功的。但如果我們做好了視頻、社區(qū)、地球,但放棄了搜索,那我們依然是失敗的!碑敃r,我發(fā)現(xiàn)幾位“產(chǎn)品多元派”,都在這句話的“當頭棒喝”之下想通了。
    達成共識后,我匯集了大家的意見,飛到總部和CEO艾瑞克?施密特匯報。在開始我那份20多頁的PPT的演講前,我是這么說的:“Our China strategy is simply to focus on web search, attend to every detail and win over users,before working on any other products.(我們的中國戰(zhàn)略就是專注于網(wǎng)頁搜索,不放過任何一個細節(jié),以此贏得用戶。之后,我們才考慮其他產(chǎn)品。)”
    艾瑞克非常贊同這個觀點,他說:“搜索業(yè)務(wù)是谷歌成功的奧秘,如果搜索做不好,那么其他的業(yè)務(wù)想做好就是紙上談兵。何況,網(wǎng)頁搜索業(yè)務(wù)也是做好網(wǎng)頁廣告業(yè)務(wù)的基礎(chǔ)。”
    在總部認可并決定谷歌中國先做好搜索的基礎(chǔ)上,我們開始了提高中文搜索的歷程。在做中文搜索之前,我對工程師們說:“那些最酷最吸引眼球的業(yè)務(wù),我們肯定都會去做。但不是現(xiàn)在去做,而是將來。在我們作出決定之前,大家可以各抒己見。而現(xiàn)在,一旦公司作了決定,我們希望大家都能夠全力以赴,專注搜索業(yè)務(wù)!”
    從那時開始,只要有任何員工想做搜索以外的產(chǎn)品,我都儼然成為一個MrNo(“說不”先生)!我總是說:“做好搜索后再說!”
    統(tǒng)一思想后,我們就開始在搜索頁面的每一個細節(jié)上鉆研,在每一個可能的選擇上進行測試。當然,我們選擇提高頁面搜索質(zhì)量,讓谷歌“讀懂中文”,也意味著谷歌中國要忍受產(chǎn)品很少的“批評”。面對媒體的批評,面對外在的質(zhì)疑,我們只有像一個堅持己見卻暫時沒有票房的電影導(dǎo)演那樣堅持自己的理想,我們就像一個沉默的劍客一樣在聒噪的環(huán)境中專注修煉內(nèi)功。
    頂住壓力,不要盲從,向來是成功者必須具備的重要素質(zhì)之一。
    修復(fù)中文搜索并不是一件簡單的事情。其中可能有一萬個細節(jié)需要工程師們一一進行認證。而這種修正不可能“跟著感覺走”,而是需要先研究中國用戶的搜索習慣,然后再根據(jù)這些習慣提供用戶喜歡的搜索。
    在谷歌中文搜索2000年上線的時候,出現(xiàn)了一個嚴重的技術(shù)問題,谷歌中文總是把握不好“分詞”的問題。有一天我看到一篇清華的分析,說在搜索引擎里面,谷歌的精確度還是不錯的,甚至領(lǐng)先其他中文搜索網(wǎng)站,但是分詞做得不夠好,原因就在于投入不夠。因為當時谷歌只有五位工作在美國的華人工程師,他們無法集中精力做好這件事情。
    當系統(tǒng)無法準確分詞時,就會鬧出很多笑話。比如,用戶輸入“電腦”兩個字,正常的情況是,頁面左側(cè)應(yīng)出現(xiàn)“電腦”的搜索結(jié)果,右側(cè)應(yīng)該出現(xiàn)電腦產(chǎn)品廣告,但因為分詞的錯誤,可能會把“電腦”分成“電”和“腦”兩個字,出現(xiàn)的結(jié)果和廣告居然是關(guān)于“電話”和“腦白金”的,真令人啼笑皆非。
    在搜索引擎領(lǐng)域,分詞是中文特有的一個挑戰(zhàn),我們需要做的不是做一個符合語言學的分詞,而是一個符合用戶使用習慣的分詞。比如說,除了要把常用詞正確分開外,還應(yīng)該分清最新的網(wǎng)上用詞,比如“打醬油”、“芙蓉姐姐”等等。
    而即使分詞正確也仍可能造成匹配的問題。比如說,如果有一篇文章里面提到“清華大學”,但搜索“清華”,這篇文章就出不來了。但如果分詞時把文章里的“清華大學”分成“清華/大學”,那么搜索“清華大學”又出不了結(jié)果了,谷歌對這個問題研究了很久。
    有一天,谷歌中國工程研究院副院長劉駿跑來興奮地說:“開復(fù),你的語音搜索論文可以用在分詞上。如果我們把中文的字當做語音,然后用語音識別的方法和統(tǒng)計語言模式來識別出所有可能的分詞方法,那么匹配正確時,‘清華’和‘清華大學’就可能同時出來。還有,我們有這么大的網(wǎng)絡(luò)語料庫,可以訓練出一個非常巨大而精確的語言模型!焙髞恚麕ьI(lǐng)團隊真的實現(xiàn)了這方面的突破。
    在2006年下半年到2007年上半年,我們的工程師一一檢查嘗試各種領(lǐng)域的各種搜索詞,并統(tǒng)計出所有不合理的搜索結(jié)果,然后再向美國的工程師學習如何在系統(tǒng)里進行修正。可以說,今天谷歌中文搜索的每一點進步都是在工程師付出的辛勤努力下得來的。
    那時,每天都有很多有關(guān)提高搜索質(zhì)量的會議在清華科技園大廈召開,谷歌內(nèi)部的監(jiān)測系統(tǒng)每天都在對各家搜索引擎作出比較,我們評估搜索相關(guān)度、網(wǎng)頁索引大小、即時更新能力和對垃圾網(wǎng)站的識別性。為了衡量我們的進度,在我辦公室外面就有一個大牌子,上面可以看到我們當天的四個指標表現(xiàn)如何,以及和競爭對手的差距又如何。
    這是一項極其辛苦而回報率又相當?shù)偷墓ぷ。有時一個由五名工程師組成的團隊努力半年,也只不過把某一個指標提升01%而已。但我總是苦口婆心地鼓勵大家:這樣的工作是積少成多的。五個人半年做出的成果有限,但一百個人做兩年就會有巨大的變化。
    為了增加中文搜索產(chǎn)品的親和力,谷歌中國成立了一支用戶體驗團隊,成員中不乏心理學博士和碩士。我們將一間辦公室隔開,讓一些普通網(wǎng)民像平時那樣使用計算機。在隔壁的實驗室里,我們通過安裝在計算機上的特殊攝像頭將用戶使用互聯(lián)網(wǎng)的習慣記錄下來。這種記錄非常精密,比如用戶每一秒眼睛停留在哪里,鼠標停留在哪里等等。通過這樣的實時監(jiān)測,我們能夠真切感受和精確了解中國互聯(lián)網(wǎng)用戶的使用習慣!
    在研究用戶體驗的過程中,我們也發(fā)現(xiàn)了中美用戶很多不一樣的地方。比如,美國互聯(lián)網(wǎng)用戶搜索的目標都比較直接,他們以找到自己想要的信息為目標,一般只點擊搜索結(jié)果的前三個,之后就離開頁面。但中國用戶的目光更多是四處瀏覽,他們愿意嘗試更多的搜索結(jié)果,停留的時間也更長。中國用戶把搜索當成一種探索,去點擊網(wǎng)頁上各種有趣的東西。
    還有一個很有意思的現(xiàn)象,就是中國用戶有時候在搜索框里并不完全鍵入所有的關(guān)鍵字,而是在鍵入之后直接拉到搜索頁面的最下方去點擊相關(guān)搜索。比如,一位用戶想搜索“秦皇島地圖”,但他只輸入了“秦皇島”三個字,搜索結(jié)果頁面出來后,他直接在最下方的相關(guān)搜索中點擊秦皇島地圖。他說:“已經(jīng)習慣使用相關(guān)搜索這個功能了。”
    谷歌中國的工程師認為,造成這種差別的理由有以下幾個:第一,中國用戶使用搜索引擎進行探索的概率很高;第二,一些搜索引擎將前幾個搜索結(jié)果出售為廣告,用戶因此習慣了不信任排名較前的結(jié)果;第三,中文的輸入相對來說較慢,因此,中國的用戶寧愿用鼠標多點擊幾次來完成搜索,而不是長時間敲打鍵盤。
    用戶的體驗給了谷歌工程師們很多靈感,比如,為了滿足中國用戶的搜索習慣,谷歌在用戶鍵入搜索內(nèi)容的時候,就給予一系列的搜索提示,這樣就省去了用戶向下拉頁面的麻煩。而我們也按照中國用戶的習慣,改變了搜索摘要的長短、排版的版式、字體的大小,甚至字體的亮度。同時,我們還考慮了中國用戶普遍使用的顯示器規(guī)格,進而重新設(shè)置版面的安排。
    每天,我都和工程師們用巨大的投影屏幕,檢測每一像素的排版、顏色、字體等等。我們對各種指標進行現(xiàn)場比較,然后研究決定如何改進我們的中文界面和用戶體驗。
    但是,所有的改進都必須有數(shù)據(jù)的支持。比如,我們曾經(jīng)針對互聯(lián)網(wǎng)用戶做過一項調(diào)查,問題如下:“如果使用搜索引擎,你是喜歡第一頁搜索結(jié)果有10項,還是有20項?”結(jié)果90%的互聯(lián)網(wǎng)用戶都選擇有20項結(jié)果,因為他們想象第一頁結(jié)果多可以省時間。但事實卻并非如此,在真實的網(wǎng)絡(luò)環(huán)境測試中,我們卻發(fā)現(xiàn)大部分用戶喜歡第一頁有10項搜索結(jié)果!這是因為,第一頁呈現(xiàn)20個搜索結(jié)果要比呈現(xiàn)10個搜索結(jié)果慢015秒。在搜索過程中,不少用戶恰恰因為這015秒帶來的負面感覺,就無法忍受了。
    我們在一遍遍地嘗試和探索著。工程師們都沉浸在專注的努力中樂此不疲。對待員工一向?qū)捜莸奈遥诋a(chǎn)品的研發(fā)方面有時候就沒有那么放松了。我還是那個MrNo,不支持做任何不對搜索有直接幫助的工作,同時要求團隊仔細分析每一個細節(jié),從字體、空格以及翻譯,都絕對不能有一個錯誤存在。公司面臨的困境以及我們心中的夢想都在激勵著我們不斷前進。
    那一段日子,我睡覺、洗澡、吃飯的時間都想著如何把搜索做好。真的像走火入魔一般。就算去餐館吃飯,我對服務(wù)員也不放過,總是問:“聽說過谷歌嗎?”如果得到肯定的回答,我就會進一步追問對我們的產(chǎn)品的感覺;如果得到否定的回答,我就會鼓勵他們不妨去試試。
    雖然我在過去的工作中曾經(jīng)經(jīng)歷過無數(shù)次做產(chǎn)品的成功與喜悅、失敗與挫折,但我對成功的渴望卻從來沒有如此強烈過。
    這樣艱苦努力一年之后,2006年10月的某一天,我在辦公室外面的牌子上終于看到了我們的四個指標都已經(jīng)勝出!2007年4月,我們評估了過去9個月對中文搜索的改進成果,發(fā)現(xiàn)中文精確度的提升速度超過了公司內(nèi)部其他任何的語言。另外,中文的網(wǎng)絡(luò)索引數(shù)量在過去一年也增加了一倍(2008年又增加了10倍);對于新網(wǎng)頁敏感度也降低到幾分鐘(就是重要網(wǎng)站的新內(nèi)容幾分鐘后就可能搜索到);作弊網(wǎng)站在網(wǎng)頁出現(xiàn)的頻率則下降到原來的1/40。
    在搜索質(zhì)量不斷改善的同時,我們在2007年6月也終于獲得了ICP牌照,谷歌把googlecn的服務(wù)器逐步搬入中國,然后把上googlecom的用戶指向googlecn,斷網(wǎng)的問題終于徹底得以解決。
    可以說,在2006年這一年,谷歌中國的工作遠遠沒有外界想象得那樣有趣,與之相反,改善搜索引擎是最平淡、最不能帶給市場驚喜的,但長期來看,它是一切競爭的根本,是谷歌中國的立足之本。在這一段時間里,擺在工程師面前更多的是改進,而不是創(chuàng)新;是對細節(jié)的不斷改進,而不是炫酷產(chǎn)品的推出;是以辛勤耕耘一步步贏得中國用戶的心,而不是耀眼的廣告和推廣。我們幾乎把所有的精力都用在這里,讓用戶發(fā)自內(nèi)心地認可我們的中文搜索。
    在這個過程中,我們要忍受和拒絕的誘惑有很多。在競爭對手依然不斷推出各種眼花繚亂的產(chǎn)品的時候,我們必須沉下心來做我們應(yīng)該做的事情?梢哉f,這需要超強的韌性和定力才可以實現(xiàn)。
    那段時間除了內(nèi)部的壓力,外部壓力也紛至沓來。媒體和用戶紛紛批評谷歌中國“水土不服”,不做創(chuàng)新,在產(chǎn)品方面“鮮有建樹”,必將重蹈跨國公司注定要遭遇的滑鐵盧魔咒。當然,更有調(diào)查公司在毫不留情地用數(shù)字說明,谷歌的市場份額在迅速滑落!
    這真是一件讓我感覺孤獨又無奈的事情。有時候我會對朋友或親人說,做一個跨國公司的高級管理者常有“高處不勝寒”的感覺。但這種感覺并非所有人都能理解,很多時候都只能自己默默承受?鐕镜母吖茉诰薮蟮膲毫ο拢粌H要做好被誤解、被質(zhì)疑、被冤枉的準備,也要忍受在前進的過程中那些突破瓶頸之前的煎熬,同時還要做好員工的心理工作。這其中的心理承壓能力絕非一日能夠練就。
    事實證明,我們是正確的。盡管在這種努力的初期,員工因搜索質(zhì)量的提升并未迅速帶來流量的提升而悲觀失望,甚至在2006年年底市場份額滑落時還有員工選擇了離職。但是,我們最終戰(zhàn)勝了自己,迎來了陰霾之后的晴朗天空。2007年初,谷歌的“粉絲”終于認識到谷歌搜索的巨大進步,發(fā)出“谷歌中文搜索變好了”的聲音,這種肯定很快便蔓延到整個互聯(lián)網(wǎng)。而谷歌搜索的市場份額在2007年、2008年的逐漸回升,正體現(xiàn)了網(wǎng)民最大程度的認可。
    這也激勵我們后來成功推出谷歌地圖、視頻搜索、博客搜索、移動搜索、音樂搜索等等一系列更好的產(chǎn)品。有人說,谷歌中國走的是“慢熱”路線,我覺得,谷歌中國走的是穩(wěn)扎穩(wěn)打的路線。
    直到今天,依然有不理解谷歌的人在質(zhì)疑,谷歌為什么不能推出一款改變世界的“殺手級”產(chǎn)品,我想他們并不懂谷歌的真諦。

  凡標注來源為“經(jīng)濟參考報”或“經(jīng)濟參考網(wǎng)”的所有文字、圖片、音視頻稿件,及電子雜志等數(shù)字媒體產(chǎn)品,版權(quán)均屬新華社經(jīng)濟參考報社,未經(jīng)書面授權(quán),不得以任何形式發(fā)表使用。
 
相關(guān)新聞:
· 《巴菲特致股東的信》:價值投資者的必讀書 2010-08-13
· 深圳讀書月"全民閱讀網(wǎng)"上線 2010-08-11
· 第六屆江蘇讀書節(jié)在南京開幕 2010-07-20
· 深圳民間讀書會網(wǎng)羅愛書人參與 2010-07-20
· [讀書]《五常學經(jīng)濟》 2010-07-01
 
頻道精選:
·[財智]天價奇石開價過億元 誰是價格推手?·[財智]存款返現(xiàn)赤裸裸 銀行攬存大戰(zhàn)白熱化
·[思想]易憲容:央行揮動穩(wěn)健貨幣政策大棒·[思想]陳曉彬:“民企參軍”將實現(xiàn)強軍富民
·[讀書]《五常學經(jīng)濟》·[讀書]投資盡可逆向思維 做人恪守道德底線
 
關(guān)于我們 | 版面設(shè)置 | 聯(lián)系我們 | 媒體刊例 | 友情鏈接
經(jīng)濟參考報社版權(quán)所有 本站所有新聞內(nèi)容未經(jīng)協(xié)議授權(quán),禁止下載使用
新聞線索提供熱線:010-63074375 63072334 報社地址:北京市宣武門西大街甲101號
Copyright 2000-2010 XINHUANET.com All Rights Reserved.京ICP證010042號