數據分析不使用Hadoop的五大理由

De Dominios, públicos y acceso
Ir a la navegación Ir a la búsqueda


我一度是Hadoop的忠實擁護者。我喜歡它可以輕而易舉地處理PB級別的數據,喜歡它可以將運算擴展到數千個節點的分布式計算能力,也喜歡它存儲和加載數據的靈活性。但在經歷過一系列的探索與使用之後,我對Hadoop非常失望。下面就是我為什麼不使用Hadoop做數據分析的見解。


Hadoop只是一個框架,而非一種完備的解決方案。人們期望Hadoop可以圓滿地解決大數據分析問題,但事實是,對於簡單的問題Hadoop尚可,對於複雜的問題,依然需要我們自己開發Map/Reduce代碼。這樣看起來,Hadoop與使用J2EE編程環境開發商業分析解決方案的方式別無二致!Pig和Hive都非常不錯,但卻受到架構的局限。Pig和Hive都是設計精巧的工具,它們可以讓人迅速上手,提高生產力。


但它們畢竟只是一種工具,用於將常規的SQL或文本轉化成Hadoop環境上的Map/Reduce查詢。Pig和Hive受限於Map/Reduce框架的運作性能,尤其是在節點通信的情況下(如排序和連接),效率更為低下。沒有軟件成本,部署相對容易,但維護和開發的代價極大。Hadoop非常受歡迎的理由在於,我們可以自由的下載、安裝並運行。


由於它是一個開源項目,所以沒有軟件成本,這使得它成為一種非常吸引人的解決方案,用於替代Oracle和Teradata。但是一旦進入維護和開發階段,Hadoop的真實成本就會凸顯出來。擅長大數據分析,卻在某些特定領域表現不佳。Hadoop非常擅長大數據分析,以及將原始數據轉化成應用(如搜索或文本挖掘)所需的有用數據。


但如果我們並不很清楚要分析的問題,而是想以模式匹配的方式探索數據,Hadoop很快會變得一塌糊塗。當然,Hadoop是非常靈活的,但需要你花費較長的時間周期去編寫Map/Reduce代碼。並行處理的性能極佳,但也不是萬能的。Hadoop可以將數千個節點投入計算,非常具有性能潛力。但並非所有的工作都可以進行並行處理,如用戶交互進行的數據分析。


如果你設計的應用沒有專門為 Hadoop集群進行優化,那麼性能並不理想,因為每個Map/Reduce任務都要等待之前的工作完成。綜上所述,Hadoop的確是一個令人震驚的計算框架,它可以進行大規模的數據分析。另一方面,這也意味着數據分析工作必須建立在大量的編程工作之上。


現在有許多提供這種服務的網站,網路企業對傳統行業的最大貢獻,就是建立了許多廉價的甚至是免費的「平台」,他們希望大量的傳統企業站在這個平台上,快速開展電子商務。因此,我們將建立一個網上商店作為一種網路營銷手段,實在是利人力己的好事。


但是,作為營銷工具的網上商店,究竟在多大程度上有效呢?這恐怕是很多人覺得沒有把握的事情,因為,一個不起眼的網上小商店,隱藏在一個網站(網上商店平台)中若干層次之下的某個角落,被別人發現的概率實在有限。不過,如果你為此多下點工夫,甚至投入一些必要的資金的話(除去店租之外的投入),情況可能會大不一樣。


下面是網上商店營銷策略中需要注意的三個方面。現在,各種網上商店平台很多,但是,最好不要輕易下決定,先試用一下再說。無論你建店的目的是為了給顧客提供一個了解你的產品的窗口,還是真的希望通過網上商店實現電子商務的目的,選擇一個理想的平台都是很重要的一步。


因為你要建立的網上商店相當於租用商場的一個櫃檯,經營效果的好壞在很大程度上取決於商場的知名度、客流量,以及你的櫃檯位置等因素,因此,選擇一個功能完善、管理方便、訪問量大的網站平台至關重要,即使為此比那些人煙冷清的網站付出多一點代價也是值得的。


不過,如果你是第一次開店,還是選擇租金相對低一點的網站好一些,因為,經營效果的好壞,除了網站流量之外,還有許多其他因素,比如你的店面布置是否有吸引力、產品或商店是否有最合適的分類、是否佔據顯著的位置等等。如果其他條件跟不上,為此支付高額租金,豈不是浪費?這實際上是在為自己做廣告啊,而且效果甚至還好過自己吹捧自己。


不過,可能要為此投入許多精力才行,除了自己的產品容易引起訪問者的興趣、有一個響亮的店名之外,店面的布置和裝飾可能更加重要,有時甚至需要請專業人士來為你設計。首先,不要相信那些電子商務平台所宣傳的「五分鐘建店」、「十分鐘開展電子商務」的宣傳,即使再傻瓜型的「電子商務」也沒有那麼簡單。


首先,要弄明白那些網站的說明和他們的租金就很費勁(也許是商業機密吧),然後,把你的產品一個一個連圖片帶說明、價格、售後服務措施、配送方法等等送到網上去,還要將雜亂的店面整理布置得漂亮大方。想想看,10 分鐘夠嗎?


當然,獲得網站特別推薦的機會也許不是很多,尤其在網站首頁的機會更少,當你的準備工作進行得很充分之後,不要忘記想辦法爭取呀,即使在分類頁面的宣傳機會也不要放棄。因為獲得網站特別推薦的機會不多,何況,還要求人,最好還是靠自己來推廣,求人不如求己嘛。一個重要的方法,就是為商店申請一個獨立域名。�不過,從網路營銷的角度來看,最好不要這樣做,道理很簡單,這個域名帶著濃重的網上商店提供商的色彩,即使沒有多少互聯網專業知識的人,看到你的網上商店某某著名網站聯繫在一起,也會覺得有些不對勁。