背景需求
大數(shù)據(jù)本身不是一個(gè)新概念,前幾年主要在互聯(lián)網(wǎng)行業(yè)比較熱,但是隨著政府單位對(duì)統(tǒng)一平臺(tái)、平安城市、各種智慧平臺(tái)概念的提出,大數(shù)據(jù)分析、數(shù)據(jù)挖掘類型的需求越來越多,它開始逐漸從互聯(lián)網(wǎng)走向到政府行業(yè)。
IDC發(fā)布的報(bào)告顯示,全球在2012年產(chǎn)生的數(shù)據(jù)量約為2.8ZB,并以大約每兩年翻一番的速度增長,預(yù)計(jì)2020年全球?qū)a(chǎn)生40ZB的數(shù)據(jù)量。這意味著我們正進(jìn)入大數(shù)據(jù)時(shí)代。
解決方案
大數(shù)據(jù)的“大”不僅指數(shù)量的龐大,還代表著數(shù)據(jù)種類繁多、結(jié)構(gòu)復(fù)雜,變化的速度也非常快。物聯(lián)網(wǎng)、云計(jì)算、移動(dòng)互聯(lián)網(wǎng)、智能手機(jī)、平板電腦、PC以及遍布全球各個(gè)角落的各種傳感器,無一不是數(shù)據(jù)來源。大量新數(shù)據(jù)源的出現(xiàn)導(dǎo)致非結(jié)構(gòu)化的數(shù)據(jù)迅猛增長,占比超過80%,超越了傳統(tǒng)數(shù)據(jù)庫的管理能力。
因此,能幫助人們從海量、高復(fù)雜的數(shù)據(jù)中提取價(jià)值的技術(shù)與架構(gòu)應(yīng)運(yùn)而生。這就是大數(shù)據(jù)技術(shù),主要是以Hadoop為代表的非關(guān)系型數(shù)據(jù)庫系統(tǒng)及分布式運(yùn)算架構(gòu)。由于擴(kuò)展性強(qiáng),能夠以較低成本處理多種數(shù)據(jù)類型,Hadoop正被廣泛應(yīng)用于互聯(lián)網(wǎng)(如Facebook、亞馬遜、淘寶、百度等)、電信、銀行和交通等各行各業(yè)。
客戶價(jià)值
通過大數(shù)據(jù)采集并存儲(chǔ)與企事業(yè)業(yè)務(wù)職能相關(guān)的所有數(shù)據(jù)。支撐先進(jìn)的分析功能,包括商業(yè)智能,采用現(xiàn)代方式對(duì)數(shù)據(jù)進(jìn)行先進(jìn)的可視化和預(yù)測(cè)性分析。將數(shù)據(jù)快速分享給所需之人,以實(shí)現(xiàn)通過“數(shù)據(jù)驅(qū)動(dòng)”幫助業(yè)務(wù)決策。