怎么分析數(shù)據(jù)?
1,結構分析法:看整體構成和分布,一步步拆解。2.分組分析法:按照某個具體維度細分拆卸。
3.對比分析,同比,環(huán)比,同行業(yè),同品類等。
4.時間序列趨勢法:查看時間趨勢。
5.相關性分析方法:相關性和因果性。
分析模型
對于一些簡單的模型,確實可以通過常見的分析方法得出一些一般性的結論,但是在實際工作中,并不是單一的問題,往往是一些符合性的問題,所以要考慮的方面也會增加:
要解決的問題涉及到那些維度的數(shù)據(jù);
從數(shù)據(jù)分析師的角度來看,這個問題有一個通用的解決方案或者需要重新研究。
從原始數(shù)據(jù)集到分析數(shù)據(jù)是否需要處理。
而所有的模型都是為了更好的解決問題。
RFM分類模型
R(recency),最近消費時間,表示用戶最近一次消費的時間距離現(xiàn)在越近,客戶越多s值。
f(頻率)消費頻率是指用戶在統(tǒng)計周期內的購買次數(shù)。頻率越高,值越大。
m(貨幣)消費金額:指統(tǒng)計期內消費的總額,金額越大,數(shù)值越高。
通過數(shù)據(jù)的標準化發(fā)送權重設置,對分類模型進行評分,比如餐廳的單價,20元以下的普通用戶。
20-30個好用戶,40個以上優(yōu)秀用戶,所有指標都可以用這個方法標準化。
中位數(shù)法常用于定義分支。
最晚消費時間,一般是一周或一個月,結合經營情況。
這種模式的本質是篩選頭部用戶,專注運營。
AARRR成長模型,了解模型就好,實際需要結合自己的業(yè)務。
A:得到A:當天活躍,R:明天繼續(xù)活躍,R:增加收入,R:提高自我溝通。
模型的主要功能是可以從那些點快速理清增長,找到突破點。
5W2H通用型號
生活中的聊天都是圍繞這幾點展開的,這個模型可以幫助我們快速確定一個問題。
用戶生命周期模型
互聯(lián)網行業(yè)往往可以跟蹤每個階段的用戶,每個階段應該有不同的運營策略和發(fā)展方向。對于分析師來說,要及時識別。
對模型有所了解,從而知道什么時候用,怎么用。
數(shù)據(jù)分析方法怎么寫?
一.描述性統(tǒng)計描述性統(tǒng)計是對統(tǒng)計方法的總結,揭示了數(shù)據(jù)分布的特征。主要包括數(shù)據(jù)頻率分析、數(shù)據(jù)集中趨勢分析、數(shù)據(jù)分散程度分析、數(shù)據(jù)分布以及一些基本的統(tǒng)計圖表。
1.填補缺失值:常見的方法有消元法、平均法、決策樹法。
2.正態(tài)性檢驗:許多統(tǒng)計方法要求數(shù)值服從或近似服從正態(tài)分布,所以數(shù)據(jù)分析前需要進行正態(tài)性檢驗。常用方法:非參數(shù)K-數(shù)量檢驗、P-P圖、Q-Q圖、W檢驗、動態(tài)差分法。
二、回歸分析
回歸分析是應用最廣泛的數(shù)據(jù)分析方法之一。它以觀察到的數(shù)據(jù)為基礎,在變量之間建立適當?shù)囊蕾囮P系來分析數(shù)據(jù)的內在規(guī)律。
1.一元線性分析
只有一個自變量X與因變量Y相關,X和Y都必須是連續(xù)變量,因變量Y或其殘差必須服從正態(tài)分布。
2.多次線性回歸分析
使用條件:分析多個自變量X和因變量Y的關系,X和Y都必須是連續(xù)變量,因變量Y或其殘差必須服從正態(tài)分布。
3.邏輯回歸分析
線性回歸模型要求因變量是連續(xù)的正態(tài)分布變量,自變量和因變量具有線性關系,而Logistic回歸模型不要求因變量的分布,一般在因變量離散時使用。
4.其他回歸方法:非線性回歸、有序回歸、Probit回歸、加權回歸等。
第三,方差分析
使用條件:每個樣本必須是獨立的隨機樣本;每個樣本都來自正態(tài)分布的總體;人口方差相等。
1.單因素方差分析:當一個實驗只有一個影響因素,或者有多個影響因素時,只分析其中一個因素與響應變量的關系。
2.有交互作用的多因素方差分析:1.實驗中有很多影響因素。分析影響因素與響應變量之間的關系,同時考慮影響因素之間的關系。
3.多因素非交互方差分析:分析多個影響因素與響應變量之間的關系,但影響因素之間沒有影響關系或影響關系被忽略。
4.協(xié)方差分叉:傳統(tǒng)的方差分析有明顯的缺點,不能控制分析中的一些隨機因素,降低了分析結果的準確性。協(xié)方差分析是將線性回歸和方差分析相結合的一種分析方法,主要是排除協(xié)變量的影響,然后分析校正后的主效應的方差。
第四,假設檢驗
1.參數(shù)測試
參數(shù)檢驗是對一些主要參數(shù)(如均值、百分比、方差、相關系數(shù)等)進行檢驗。)在已知總體分布的條件下(一個要求總體服從正態(tài)分布)。
2.非參數(shù)檢驗
非參數(shù)檢驗不考慮總體分布是否已知,往往不是針對總體參數(shù),而是針對總體的一些一般假設(如總體分布的位置是否相同,總體分布是否正態(tài))。
應用:順序數(shù)據(jù),其分布通常是未知的。
1)雖然是連續(xù)數(shù)據(jù),但總體分布模式未知或非正態(tài);
2)雖然總體呈正態(tài)分布,數(shù)據(jù)連續(xù),但樣本量極小,如10以下;
主要方法有卡方檢驗、秩和檢驗、二項式檢驗、游程檢驗、K-數(shù)量檢驗等。