欧美aⅴ在线,国产手机精品一区二区,日韩国产欧美一区二区三区,精品视频在线观看视频免费视频,欧美在线小视频,精品一区视频

淺談大數據應用及發展誤區

放大字體  縮小字體 發布日期:2014-10-20     來源:[標簽:出處]     作者:[標簽:作者]     瀏覽次數:98
核心提示:

大數據,指的是所涉及的資料量規模巨大到無法通過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極目的的資訊。

近兩年來,“大數據”被廣泛應用到各行各業,而近階段又有著明顯的過熱跡象。從央視的春運遷徙圖到姚晨看到微博數據的驚呼;從兩會期間的兩會大數據,到《星星》都叫獸的高低領毛衣,“大數據”被人們推到了一個前所未有的高度,同時也從一個高精尖的科研方向變成了一個世人皆知的營銷詞匯。

什么是大數據?

Gartner給出了這樣的定義:“大數據”是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。

“新處理模式”是一個很關鍵的詞匯,這也是我所理解的“大數據”區別于傳統統計分析等最關鍵的特征之一。這個所謂的“新處理模式”有兩層含義:

1、由于海量的數據,需要更高效的存儲和處理技術,Hadoop成為了大數據時代的標志;

2、如果你認為大數據就等于Hadoop,那就大錯特錯了。Hadoop只是大數據時代的一個必要條件,大數據還有一個明顯的標志是數據挖掘和人工智能的緊密結合。這也是我理解的“大數據”與現在很多所謂“大數據”項目最明顯的區別之一。我會在后面的案例中給大家展開。

除了上面的“新處理模式”上的區別,個人認為還有一個最主要的區別是:數據統計分析是基于已有數據的縱向歸類,而大數據是基于對已有海量數據的處理,對還未產生的數據作出預測和推薦。數據統計是已經發生的事情,而大數據往往被用于還沒有發生的事情預測或者推薦中。

預測和推薦,是如何實現的?

目前主要的推薦算法大致可以分為兩類。一個是基于行為,一個是基于內容。當然,針對不同的領域,不同的預測和推薦的對象,又會有十余種算法。這就不是本文展開的內容了。

基于行為的分析,顧名思義,即對用戶在互聯網、移動互聯網留下的“痕跡”,即瀏覽、點擊、收藏、購買、二次購買的分析,得出未來會選擇購買的預測和推薦結果。基于行為的分析,屬于群體智慧,綜合利用群體用戶的行為偏好。用戶之間會相互影響,更加符合現實世界中的用戶行為。

基于內容的分析,包括對文字、圖片、音頻、視頻等信息的分析,得出預測和推薦的結論。內容的“基因”和用戶的偏好相匹配,最有代表的是潘多拉的音樂推薦項目,其將曲庫中所有歌曲都由400多位專家打上標簽,然后建立個人與音樂的聯系,從而完成音樂的推薦。內容的分析只針對個人,與用戶之間關系無關。

大數據的應用

簡單地來說,大數據可以幫我們解決決策和 選擇的問題。

天氣預報就是一個最古老而且眾所周知的預測。你可以根據預報來決定明天穿什么衣服,是否要帶雨傘,等等;

近兩年來,大數據被應用到影視制片行業,基于對觀眾偏好的分析,去預測、設計觀眾喜歡的劇情,找觀眾喜愛的演員出演相關的角色,甚至可以去預測票房。這些所有的預測都是基于數據的基礎上,經過一定的模型處理,得到接近真實的結論。從某種程度上給決策者決策的依據,比如《紙牌屋》和《星星》。

大數據還有一個重要的作用,就是解決人們的“選擇”問題。別笑,無論你的年齡、性別、教育背景,人們目前都面臨著前所未有的選擇問題。講的學術一些,這是由于“長尾效應”導致的問題;講得通俗一些,就是由于日益增多的可選擇的對象和我們自身的處理能力之間的矛盾。

科技的進步讓人變得更懶,也就是我們自身的處理能力降低,無論是主觀的還是客觀的。而可被選擇的對象卻在日益增多。從紛繁復雜的商品(電商),到海量曲庫中的樂曲;從婚戀網站的男女朋友,到交通管理的信號燈。

基于人工智能下的大數據,就是可以使人們“變懶”的一個手段。基于你的歷史行為,判斷出你可能的喜好,乃至需求,將最佳結果,推薦給你。這就是大數據,她是你的貼心管家,或者說是最懂你的朋友。

一個最經典的案例是沃爾瑪曾經做過的“啤酒”和“尿布”調研:沃爾瑪在研究中發現,一類顧客經常在購買尿布的同時也購買啤酒。尿布跟啤酒自然是毫無關聯的兩個品類的商品,從個人經驗上來看,根本想不到二者的聯系。后來發現,這是一類社會現象所導致的。美國有很多年輕夫婦,尿布用完后,女主人在家帶孩子,而男主人就去超市買尿布。買完尿布之后,男主人通常會順帶著買些啤酒。

上述例子說明,數據經常可以讓你發現看似不合理不合邏輯但卻存在,并且經常發生的現象。

再舉個例子,北京的交通擁堵是地球人都知道的事情。尤其是早晚高峰,這已經不需要預測了。但如果根據歷史交通數據,再經過數學模型,計算出一個全北京最佳的交通信號燈管理系統,這就屬于大數據的范疇了。

大數據的誤區:不是萬能的

大數據顯然不是萬能的。正因為如此,她才真實。大數據在有些領域由于種種原因,所帶來的價值并不如預期的那么高。導致這種現象最主要的問題有兩個,一個是由于數據本身的質量或者數量不夠;另一個是算法不合適。

不要以為是海量數據就一定會有價值,在過往的工作中,我們經常發現來自甲方的數據源有80-90%的數據都是無用的。只有10%-20%的數據才會產生一定的價值。這就又讓我想到MarryMeeker打的那

工博士工業品商城聲明:凡資訊來源注明為其他媒體來源的信息,均為轉載自其他媒體,并不代表本網站贊同其觀點,也不代表本網站對其真實性負責。您若對該文章內容有任何疑問或質疑,請立即與商城(www.lmelshi.com)聯系,本網站將迅速給您回應并做處理。
聯系電話:021-31666777
新聞、技術文章投稿QQ:3267146135  投稿郵箱:syy@gongboshi.com
主站蜘蛛池模板: 高清在线乱码| 2021中国大陆精品视频xxxx| 色a在线| 国产成+人+亚洲+欧美+日韩| 亚洲欧洲日韩国产aa色大片| 2022av在线| 校花调教喷水沦为肉奴| 99久女女精品视频在线观看| 美女被网站免费看九色视频| 新版freehdsex刘亦菲| 精品日韩在线视频| 亚洲女教师| 99热在线获取最新地址| 欧美成人一级| 中文字幕人成乱码中国| 国产视频1| 亚洲欧美人成综合导航| 久久久www免费看片| 伊人久久免费视频| 国产美女色视频| 亚洲日本欧美| 国产有码| 怡红院一区| 毛片激情永久免费| www.色综合| 香焦伊人| 欧美日韩亚洲一区二区三区| 亚洲国产成人99精品激情在线| 碰91精品国产91久久婷婷| 免费黄色网址在线观看| 亚洲qvod图片区电影| 国产一区二区三区在线免费| 大香伊人久久精品一区二区| 欧美国产成人一区二区三区| 9久久99久久久精品齐齐综合色圆| 青春草原| 精品色网| 国产国产人免费人成免费视频| 亚洲男女免费视频| 日本免费一区二区三区在线看| 91久久青青草原免费|