“大數據”似乎在一夜之間闖入了任何一個關于互聯網未來的討論,成為一個炙手可熱無所不包的概念。但它是否真如許多IT行家們所言,將成為信息技術領域又一片蘊藏無限潛能的處女地?還是只是軟硬件巨頭們為了賣出更多產品而吹出的一個美麗泡沫?
正在大連舉行的2013夏季達沃斯開辟專場,以“大數據概念是否被過度炒作”為題,請四位嘉賓分成正反兩方,展開一場激辯。穿梭于各場彬彬有禮的“清談會”之間的聽者們,步入這場辯論時,無不感到意外之喜,目擊到一場有趣又有料的意見交鋒。
持正方觀點,即“大數據已被過度炒作”觀點的,出人意料地,是四位嘉賓中更年輕、更接近“技術宅男”的兩位,其中一位是美國Kaggle公司總裁兼首席科學家JeremyHoward,另一位是加納MPedigree網絡公司總裁BrightSimons。持反方觀點,為大技術時代的到來歡呼的,一位是北京大學光華管理學院新媒體營銷研究中心副主任蘇萌,另一位是日本政治家、內閣成員山本一太。
在辯論之前,主持人先作了一次現場調查,同意“大數據是過度炒作”的聽眾稍占上風,占比54.5%。聽眾被告知,在辯論結束后還會再來一輪投票,四位嘉賓的任務就是盡可能留住支持者,讓對方陣營倒戈。
辯論開始,正方嘉賓、科學家Howard起身走近聽眾席,一句話亮明觀點:數據不在多,而在怎么用。他提出“一臺電腦論”,即科學家們研究所需的數據,最好用一臺電腦就能裝下,否則數據處理會過于繁瑣,無助于解決問題。他結合自身經驗說,隨著數據量的增大,研究的準確性一開始會隨之上升,但很快就會趨平。
“舉個例子,如果我們把所有《星球大戰》鐵桿粉絲的數據拿來研究,就一定能準確地判斷出他們中誰會喜歡《魔戒》嗎?我們發現并非如此。”
反方嘉賓、北大的蘇萌教授起身應戰。他請大家原諒,“為了更流暢地表達觀點,我還是用中文”,引來聽眾理解的笑聲。他說,大數據剛剛露出冰山一角,在金融、零售等領域的運用上,還遠未釋放它的潛能。這有三個原因:一是因為不同機構間的數據還未真正流動起來,目前還只是數據“孤島”;二是完整的生態產業鏈還未形成,盡管通過行為數據分析已能夠分辨出一個消費者的喜好,但從供應到購買的鏈條還沒建成;三是因為數據分析人才仍然極度匱乏。
他說,15年前,很多人認為互聯網是泡沫,今天證明互聯網沒被高估,5年前,很多人認為電子商務是泡沫,但今天中國已經有3億人的電商市場,我們還有什么理由說大數據只是泡沫呢?聽眾席上點頭頻頻,現實顯然頗具說服力。
正方嘉賓,來自非洲加納的Simons急于扳回局面,拋出一個引人思索的問題:“請問,我們現在真的有什么問題,是靠大數據才能解決,而靠現在技術解決不了的?”
他說,大數據不僅分散了人們的注意力,甚至是“危險”的,因為海量數據意味著決策制定將更加“集權化”,而科學本身是應當以人為本,強調自主性的。他以多年前他在一家英國銀行開戶的經歷作為例子:一開始他與銀行客戶經理面對面聊天,對方認為他完全符合開戶條件,可當把他的所有信息輸入電腦之后,電腦卻拒絕了他的開戶申請,而他至今不知道自己為什么被拒。
“大數據意味著人們將不再運用自己的智慧、問真正該問的問題,”Simons說。“最后我想說,小才是美。”
聽眾們顯然有所觸動,天平似乎又重新傾斜。
最后出場的是反方辯手、日本內閣大臣山本一太。曾是搖滾音樂人的他十分懂得調動氣氛,鄭重宣稱,由于強敵當前,所以也決定臨時變更計劃,改用日語,再度引來笑聲。他為支持大數據拿出的“殺手锏”是——東京申奧成功的“奧秘”。他說,日本民眾最初對申辦奧運的支持率只有不到60%,但日本政府成功利用社交媒體和數據分析,向公眾傳遞支持申奧的訊息,最終將支持率提升到80%以上。另外,在自然災害頻發的日本,大數據也早已在防災減災上發揮作用。
兩輪交鋒下來,賽程過半,雙方似乎勢均力敵。主持人接著請聽眾來挑戰雙方辯手。
一位聽眾挑戰正方,說,你們認為大數據過于龐雜紛繁,反而解決不了問題,那是不是說,當處理數據的計算工具變得足夠好時,大數據就會變得有用?
科學家Howard重復了“一臺電腦論”,強調數據不是越多越好,而是恰到好處才好,但似乎沒能拿出更有說服力的論據。
一位聽眾挑戰反方,問:眼下的大數據熱,是由真實的需求驅動的嗎?還是IT企業的噱頭?決策制定真的要靠大數據嗎?
蘇萌教授一語中的(雖然似乎有些偷換概念):“不靠數據,難道靠直覺嗎?”
一位聽眾再次挑戰反方:幾年前愛沙尼亞遭到黑客攻擊,由于該國政府部門和私營部門的數據集中存放,網絡攻擊導致該國幾乎全面癱瘓,這個事件是不是說明,大數據會讓網絡安全變得更加脆弱?
山本回答:的確如此,但各國都已高度重視網絡安全,技術進步也會讓這個問題找到答案。
蘇萌最后總結道:所有新鮮事物都需要一定的泡沫,才能吸引到更多的投資和關注,最終才能讓真正好的東西沉淀下來。
辯論結束,主持人再度請現場聽眾投票,反方成功逆轉,支持率上升到57.1%。蘇萌與山本興奮地擊掌歡呼。
這場短短的交鋒,顯然只是大數據之爭的一個微小縮影,也無法給出是或非的答案,但足以激發聽眾的思考。正如Howard在發表“失敗感言”時所說,“我們并非反對數據,只是反對大而無當的數據,數據本身當然非常重要”。人類已經并將繼續產生日益龐大的數據,或許不論我們接受與否,大數據時代都已到來。如何利用它造福人類,才是最為關鍵的問題。