古詩詞大全網 - 成語用法 - 案例分析和比較分析中的常見錯誤

案例分析和比較分析中的常見錯誤

比較分析(像比較、環比)是數據分析中最簡單、最常用的分析方法。不僅是數據分析師,幾乎所有人都會用,但並不是所有人都能正確使用。文末附有對比分析錯誤的案例分析。

簡單而常見的四種最常見錯誤的比較分析:

錯誤1:比較對象不壹致。

美國歷史上有壹次海軍征兵的宣傳:在與西班牙的戰爭中,美國海軍的死亡率是9‰,而同期紐約市居民的死亡率是16。所以參軍更安全!

這個案例的問題在於比較的對象不壹樣:壹邊是參軍的健壯男青年,壹邊是紐約的居民,更多的包含了自然死亡、老弱病殘、交通事故、刑事犯罪等等問題。

同樣的問題也頻繁出現在新聞中,比如“外賣小哥工資遠超白領”:顯然,將外賣小哥行業收入最高的人與普通白領進行對比,很自然地得出這樣的結論。

錯誤2:時間範圍不壹致。

比如壹個HR應聘者的簡歷上就有這樣的自我推銷。前壹家公司的銷售人員離職率是12%,但是HR到了之後,公司的銷售人員離職率降到了4%。

這時候,作為壹個專業的數據分析師,必須再問壹個問題:這兩個指標的計算時間範圍是否壹致?都是按月/季/年算的嗎?

錯誤三:定義和計算邏輯不同。

商業指標背後的數學公式有很多變化。如果沒有統壹,這樣的比較就沒有意義。

回購金額等復雜指標,由於業務需求不同,在如何定義“回購行為”時容易出現錯誤:

壹旦註冊會員,回到櫃臺消費,即使是重新購買。

只有已經消費過的,再去專櫃消費,才會被認為是回購。

再比如,壹個當月完成了第壹筆消費和第二筆消費的會員,在計算當月的回購指標時也會有困難:如果按照消費行為,第壹筆消費計入第壹筆購買金額,第二筆消費訂單計入回購,那麽這個會員能否計入回購會員?

所以,每當看到指標的對比,首先要記住背後的計算公式是否在同壹個語境下。

錯誤4:不壹致的數據源

隱藏了數據源錯誤的問題。壹個常見的場景是,在尚未建立數據中心的企業中,業務部門有不同的信息系統來存儲數據。比如訂單數據可以存在於ERP系統、POS系統、CRM系統中,數據在系統間流動,必然會產生錯誤。因此,即使是相同的數據計算指標,在CRM系統和ERP系統中計算時也可能出現誤差。

此外,隨著業務需要,系統維護和升級也是家常便飯。在升級過程中,數據同步經常出現波動。這時候如果計算指標,可能會得到不同的結果。

因此,在比較不同業務部門之間的指標時,將其放在同壹背景下是有意義的。

實際案例數據同比分析中常見的同比誤差

案例壹:銷售日報表分析,2021 1 4上的零售額比2020 1 4下降了30%,那麽2021 1 4上的銷售有問題?

其實考慮到具體的行業,如果是在季節性/周期性特征比較強的零售行業,這樣的比較沒有實際意義:因為2021 1.4是工作日,2020 1.4是周六,按照常理,周末人會多壹些,然後各方面的銷售指標會好壹些。

也就是說,對於零售企業來說,這兩個日期處於不同的業務場景,不能直接比較。

同樣的道理(是否是周末)可以推廣到是否是節假日,比如情人節和情人節,聖誕節和聖誕節。

此外,還有壹個隱性的放假周期:今年11月放假七天,是否和去年壹樣放假七天;活動周期:尤其是天貓等電商行業,每年雙十壹的活動周期都不壹樣。比如相對於2019,2020年的官方銷售峰值是10月份的11 -3,所以數據指標的預期要調整。

案例二:假設不考慮疫情,在月報分析中,2021年2月的銷售額比2020年2月下降了5%,那麽2021年2月的銷售額有問題嗎?

這時候我們就不得不用日歷來判斷這樣的分析是否合理。

1,銷售天數可以通過查看日歷找到:

2020年,二月有28天。

2021是閏年,二月有29天。

所以,在相差1天的背景下,銷量差距是否合理?

2.是節日嗎?此外,如果妳看看日歷,妳會發現:

2020年春運在65438+10月25日。

2021春節在2月12。

對於零售企業來說,春節期間銷售情況是否有所好轉?如果是,有假期的月份應該比沒有假期的2月份銷量多吧?

3、重新觀察日歷的周末數:

2020年2月有9個周末。

2021二月只有8個周末。

如案例壹所述,零售行業差壹個周末,銷售數據可能是百分之幾。

所以基於以上幾點來判斷2月份的銷售表現可能更合理。