學(xué)大數(shù)據(jù)需要有基礎(chǔ)嗎?
學(xué)習(xí)大數(shù)據(jù)自然需要基礎(chǔ),而且相對(duì)于普通程序員,大數(shù)據(jù)的門檻略高。
大數(shù)據(jù)之所以叫大數(shù)據(jù),自然是因?yàn)樗臄?shù)據(jù)量巨大,數(shù)據(jù)模型復(fù)雜。所以學(xué)習(xí)大數(shù)據(jù)至少需要兩個(gè)基礎(chǔ),一個(gè)是編程基礎(chǔ),一個(gè)是數(shù)學(xué)和算法基礎(chǔ)。
讓讓我們談?wù)劸幊痰幕A(chǔ)。目前大數(shù)據(jù)的主流語(yǔ)言有兩種。一個(gè)是Java。Java作為目前最流行的編程語(yǔ)言,可以說(shuō)是用途相當(dāng)廣泛,各種領(lǐng)域基本上都有Java的影子。Hadoop作為一種基于Java設(shè)計(jì)的大數(shù)據(jù)框架,也有著廣泛的應(yīng)用。
另一個(gè)是Python,后起之秀,是在大數(shù)據(jù)和AI時(shí)代發(fā)展起來(lái)的,這兩年非?;?。
那么,只有學(xué)好這些語(yǔ)言,熟悉相應(yīng)的大數(shù)據(jù)框架,才能在這個(gè)行業(yè)有一個(gè)基本的定位。否則,你不連大數(shù)據(jù)實(shí)施的基礎(chǔ)知識(shí)都沒(méi)有,那么大數(shù)據(jù)呢?
那么,比編程能力更重要的是,在數(shù)學(xué)大數(shù)據(jù)的處理中,設(shè)計(jì)了大量與數(shù)學(xué)相關(guān)的知識(shí)。沒(méi)有數(shù)學(xué)基礎(chǔ),基本只是看到數(shù)字如海,然后你就可以不要開(kāi)始。
要做好大數(shù)據(jù),我們至少需要這些數(shù)學(xué)基礎(chǔ):
概率和數(shù)理統(tǒng)計(jì)
在數(shù)據(jù)建模和數(shù)據(jù)挖掘中,我們會(huì)用到很多與概率和數(shù)理統(tǒng)計(jì)相關(guān)的知識(shí)點(diǎn),比如隨機(jī)變量及其分布、方差分析和回歸分析、貝葉斯理論等等。
沒(méi)有這些理論的支撐,我們?cè)诮:屯诰虻倪^(guò)程中可能會(huì)出現(xiàn)較大的偏差或者效率較低。
線性代數(shù)
在大數(shù)據(jù)的應(yīng)用場(chǎng)景中,我們會(huì)把分析對(duì)象抽象成一個(gè)矩陣,矩陣會(huì)有轉(zhuǎn)置、向量等公式應(yīng)用到我們的實(shí)際場(chǎng)景中。奇異值分解、主成分分析、NMF、MF等。都是在大數(shù)據(jù)分析中廣泛應(yīng)用的,所以學(xué)好線性代數(shù)意義重大。
當(dāng)然理工科專業(yè),大學(xué)基本都會(huì)學(xué)線性代數(shù),你在大學(xué)學(xué)這些知識(shí)就夠了。
這部分?jǐn)?shù)學(xué)知識(shí)也與大數(shù)據(jù)技術(shù)的發(fā)展密切相關(guān)。矩陣、轉(zhuǎn)置、秩塊矩陣、向量、正交矩陣、向量空間、特征值和特征向量也是大數(shù)據(jù)建模和分析中常用的技術(shù)手段。
離散數(shù)學(xué)
離散數(shù)學(xué)是計(jì)算機(jī)科學(xué)的重要基礎(chǔ),重要性自然不言而喻。大數(shù)據(jù)也是計(jì)算機(jī)科學(xué)不可回避的范疇,自然是必須學(xué)好的學(xué)科。
看完之后,你覺(jué)得是"簡(jiǎn)單",好吧,那你可以選擇好好學(xué)習(xí),天天向上。
大數(shù)據(jù)怎么入門學(xué)習(xí)好?
要入門大數(shù)據(jù),首先要學(xué)會(huì)javase。掌握javase之后,你最好學(xué)javaee。如果你不學(xué)不會(huì),影響不會(huì)特別大。很大。接下來(lái)要學(xué)的東西很多,主要是兩塊。一個(gè)是離線計(jì)算,主要是hadoop,一個(gè)是實(shí)時(shí)計(jì)算,主要是spark。當(dāng)然,大數(shù)據(jù)不是一兩個(gè)技術(shù)的結(jié)合,而是一個(gè)完整的生態(tài)系統(tǒng),所以要學(xué)的東西還是很多的。大數(shù)據(jù)主要解決海量數(shù)據(jù)的存儲(chǔ)和計(jì)算。建議學(xué)好java,因?yàn)楹芏啻髷?shù)據(jù)軟件都是基于java編寫的,可以從大數(shù)據(jù)入手。