大數(shù)據(jù)如何為蘋果和亞馬遜等大公司帶來優(yōu)勢?
首先要明白什么是大數(shù)據(jù),現(xiàn)在和未來一定是大數(shù)據(jù)時(shí)代。
大數(shù)據(jù)(大數(shù)據(jù))
它是指在一定時(shí)間內(nèi),常規(guī)軟件工具無法捕捉、管理和處理的數(shù)據(jù)集合。它是一種海量、高增長、多元化的信息資產(chǎn),需要新的處理模式來擁有更強(qiáng)的決策力、洞察力和發(fā)現(xiàn)力以及流程優(yōu)化能力。
定義
高德納,一家研究機(jī)構(gòu)"大數(shù)據(jù)",給出了這樣的定義。"大數(shù)據(jù)"是一種信息資產(chǎn),需要新的處理模式,以具有更強(qiáng)的決策、洞察力和流程優(yōu)化能力,以適應(yīng)大規(guī)模、高增長率和多樣化。
麥肯錫全球研究院給出的定義是:規(guī)模遠(yuǎn)遠(yuǎn)超出傳統(tǒng)數(shù)據(jù)庫軟件工具在獲取、存儲(chǔ)、管理和分析方面能力的數(shù)據(jù)集,具有數(shù)據(jù)規(guī)模海量、數(shù)據(jù)流動(dòng)迅速、數(shù)據(jù)類型多樣、價(jià)值密度低四大特征。
隨著云時(shí)代的到來,大數(shù)據(jù)受到越來越多的關(guān)注。分析師團(tuán)隊(duì)認(rèn)為,大數(shù)據(jù)通常用于描述一家公司創(chuàng)建的大量非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),當(dāng)下載到關(guān)系數(shù)據(jù)庫進(jìn)行分析時(shí),會(huì)花費(fèi)太多的時(shí)間和金錢。大數(shù)據(jù)分析往往與云計(jì)算聯(lián)系在一起,因?yàn)榇髷?shù)據(jù)集的實(shí)時(shí)分析需要MapReduc
什么和物聯(lián)網(wǎng)是大數(shù)據(jù)時(shí)代?
Web系統(tǒng)、傳統(tǒng)信息系統(tǒng)、物聯(lián)網(wǎng)是大數(shù)據(jù)時(shí)代的數(shù)據(jù)基礎(chǔ)。
大數(shù)據(jù)需要特殊的技術(shù)才能在容許時(shí)間內(nèi)有效處理大量數(shù)據(jù)。適合大數(shù)據(jù)的技術(shù)有MPP數(shù)據(jù)庫、數(shù)據(jù)挖掘、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫、云計(jì)算平臺(tái)、互聯(lián)網(wǎng)和可擴(kuò)展存儲(chǔ)系統(tǒng)。
大數(shù)據(jù)包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)日益成為數(shù)據(jù)的主體部分。根據(jù)IDC的調(diào)查報(bào)告,企業(yè)中80%的數(shù)據(jù)是非結(jié)構(gòu)化數(shù)據(jù),并且這些數(shù)據(jù)每年以60%的指數(shù)級增長。