大數據分析的應用領域和發(fā)展前景
隨著互聯網的不斷發(fā)展,大數據分析與應用在各個領域的表現都是有目共睹的。今天,我們就通過案例分析來簡單來了解和學習一下,大數據分析的應用領域和前景。

對于很多需要提供24小時不間斷服務的網站來說,對數據庫系統進行升級和擴展是非常痛苦的事情,往往需要停機維護和數據遷移,除了這些,大數據平臺對傳統的關系型數據庫提出了更多的挑戰(zhàn),包括:高性能的事務管理性要求、讀寫實時性要求、高可用性要求。因此,在大數據平臺的建設中,關系型數據庫的很多特性失去了用武之地,非關系型數據庫(NoSQL)成為大數據平臺的標配。
在本次調研中,我們列出了目前相對常見的幾類非關系型數據庫產品,希望對幾款產品的市場接受度加以了解:
32%的受訪者應用了MangoDB數據庫,使用為廣泛:Mongo大的特點是支持的查詢語言非常強大,語法類似于面向對象的查詢語言,可以實現類似關系數據庫單表查詢的大部分功能,而且還支持對數據建立索引。MongoDB主要解決的是海量數據的訪問效率問題,當數據量達到50GB以上的時候,Mongo的數據庫訪問速度是MySQL的10倍以上,這也是MongoDB廣受青睞的主要原因。
其次為Hbase、Hive、Redis等幾類,均在22%左右:Hive與HBase都是基于Hadoop平臺的數據倉庫工具,其優(yōu)點是學習成本低,可以通過類SQL語句快速實現簡單的MapReduce統計,不必開發(fā)專門的MapReduce應用,十分適合數據倉庫的統計分析。
Spark緊隨其后,占比17%:Spark 是一種與 Hadoop 相似的開源集群計算環(huán)境,擁有Hadoop MapReduce所具有的優(yōu)點;但不同于MapReduce的是——Job中間輸出結果可以保存在內存中,從而不再需要讀寫HDFS,因此Spark能更好地適用于數據挖掘與機器學習等需要迭代的MapReduce的算法。
此外,在其他選項的答案中也出現了DB2、阿里大數據云等產品。



未通過身份證認證
未通過辦學許可認證
地理位置 Location