當前位置 > 首頁 > 案例分析 > 淘寶電商數據分析:1套真實+完整的案例分析流程

淘寶電商數據分析:1套真實+完整的案例分析流程

來源:中國數據分析行業網 | 時間:2020-06-17 | 作者:數據委

該數據分析借鑒的的背景數據來源于天池數據集,為2012年7月2日至2015年2月5日發生在淘寶天貓交易平臺關于嬰幼兒商品的交易數據。其中包括兩個表格,截圖如下:

 

 

 

涵括的字段有用戶ID,交易編號,商品種類ID,商品類別,購買數量,購買日期,以及用戶人為提供的個人信息如嬰兒出生日期以及性別。字段含義解讀如下:

 

  • 用戶ID:以電商行業的購買數據為例,用戶ID是電商平臺識別該購買者的唯一信息。從用戶ID可以得到其他信息包括注冊信息,購物歷史記錄,購物喜好等。

 

  • 購買行為編號:我理解為交易號,通過這個號碼可以查詢到購買的具體事物,數量,購買行為產生日期,購買者或者需求者的位置。

 

  • 商品種類ID:該電商平臺繼而又把每個類別下的產品細分了種類,即被購買產品屬于該電商平臺規定的某個類別的某個種類下面,并賦予每個種類一個。

 

  • 商品類別:該電商平臺把產品分成了很多個種類。

 

  • 商品屬性:即產品的詳細情況。

 

  • 購買數量和購買時間即是字面意思。

 

  • 出生日期:記錄的是該用戶注冊時填寫的自己或者需求者的嬰兒的出生日期。

 

  • 性別:即字面意思

 

 

分析目的

該分析旨在通過以往的數據總結以前的銷售表現,找出需要改變及改善的地方,針對性采取有效措施以達到提升營業額的效果。

 

?

提出問題

  • 2015年的銷售下跌
  • 第三,四季度銷量上漲的原因
  • 性別對銷量的影響
  • 年齡與銷量的關系

 

分析思路

 

 

?

分析問題

由于整個分析過程都涉及到銷量,所以在開始分析之前首先對購買量進行數據清洗。篩選購買量這一列可以發現,數據區間跨度非常大,對其作描述性統計發現,購買量的平均值不到3,標準差為65左右。

 

剔除與平均值的偏差超過三倍標準差的高度異常值,即大于199.64的數值都需要剔除。因為商品的單位不可能為小數,所以實際應剔除大于199的值。

 

  1. 2015年的銷量下跌

分析流程是這樣的:

 

 

對購買量進行多維度拆解:購買量=新用戶購買量+老用戶購買量

 

新用戶為首次出現,以前沒有過購買行為的用戶id,老用戶為以前有過購買行為(重復的)的用戶id。

通過查找重復值得知老用戶為27個,占比為27/28396=0.93%,不到1%。換句話說,總購買量幾乎全是由占比大于99%的新用戶造成的,因此在這里我們忽略老用戶的購買量。而且,從以往的銷量折線圖可以看出,2015年數據下跌是因為數據集里關于這一年的數據不全,只有1月和2月的數據。

假設在這一年里頭兩個月銷量下跌,找出2015年的銷售數據,同比歷年的數據,來判斷是否假設是對的。

 

 

由于2012年缺乏上半年的數據,因此我們只能對比2013,2014和2015年銷量。從圖中可以看出,2015年1月銷量大幅高于2013和2014年,2月銷量低于前兩年,但總和并不少于前兩年。所以依據當前的數據不能證明2015年銷量下跌,假設不成立。

 

 

  1. 第三,四季度銷量上漲的原因

分析流程如下:

 

假設下半年銷量上漲是因為所有類別銷量上漲。我們提取各個季度各商品類別的銷量數據,得到下圖。

 

 

從上圖可以看出,第一二季度銷量基本持平,第三季度的銷量主要是由類別5008168,和28帶來的,其他類別沒有明顯變化。第四季度銷量主要是由類別50014815,28帶來的,其他類別差別不大。所以可以說季度銷量的上升是由于某個季度某些商品類別的銷量上漲導致的。

 

再來深究為什么第三季度和第四季度的銷量主要貢獻者類別5008168和50014815會在下半年出現大幅度增長。
???

首先從類別5008168開始。搜集第三季度銷量數據可以得到下圖。

 

 

從圖中可以看到,7-9月期間大部分時間銷量都是比較平穩,唯獨9月20日這天該產品的銷量達到了2815。進一步搜集數據發現,是因為在2014年該產品的銷量遠遠大于2012和2013年。

 

 

找出2014年9月該產品的銷售數據,得到如下圖。

 

 

上圖告訴我們,在2014年9月20號當天,508168的銷量達到了2779。

 

由于當年當月的節日如中秋節在9月8號,教師節在9月10號,產生熱銷的原因沒辦法證實。但可以揣測是因為商家對該類產品做了促銷活動導致的銷量上漲,從而導致第三季度銷量上升。

再來看類別50014815。

 

 

它在第四季度的11月份有一個顯著的增長高峰。

 

 

 

 

數據告訴我們,它的增長主要來源于2014年11月13日的銷量高峰,達到10029. 下面是該產品歷年的11月銷量圖。

 

 

 

 

上面三個圖我們可以看出,歷年來11月的銷售高峰并沒有出現在雙十一當天,而是2012年的11月10號,2013年的11月30號,2014年的11月13號。雖然2013年雙十一那天出現了銷量小高峰,但影響效果并不大。在其他日子出現銷量大幅上漲,猜測是由于商家進行了其他促銷活動,但缺乏數據支撐。

 

 

  1. 性別對銷量的影響

分析流程如下:

 

 

表1用If函數計算出成交單量,對表2用vlookup函數關聯表1的購買日期,購買數量,商品大類,成交單量。清洗數據集并統計有效數據后發現用戶里有406個女童,444個男童。所以男童用戶比女童用戶多。

 

 

從上圖得知,男女的購買比例為62%:38%

顯然男女用戶的比例不足以造成如此懸殊的銷量比例。

將購買量多維度拆解,可以得到:總購買量=成交單量*每單購買量

假設是因為男童的成交單量造成的。

 

 

男女用戶比例跟成交單量比例是一樣的,所以男童的購買量大于女童購買量可以說完全是因為男童的每單購買量大于女童的每單購買量導致的。

那又是什么年齡段的男童的每單購買量比較大呢?

 

 

 

可以看出,5歲以后的男童基本不再產生購買行為。主要買家為1歲以前的男童家長。

?

  1. 年齡與銷量的關系

購買量=各個商品類別的購買量之和

 

由上圖可以看出,所有的類別的購買量隨著年齡的增加都在下降。類別50022520從一開始就一直在下降,剩下的其他產品類別的趨勢是先上升,幅度或大或小,然后再都下降。仔細看來,類別,50014815,50008168和28的銷量高峰都產生在年齡為0歲,類別122650008和38的銷量高峰產生在年齡為1歲的時候。

 

因此可以說1歲以后所有類別銷量都在下降,可以猜測這些商品類別應該是適用低齡幼兒的產品。但不同年齡的銷量高峰對應的產品類別不同,又說明這些產品的受眾不同,應該采取分年齡營銷策略。

 

?

結論

  1. 依照現有數據2015年1,2月的銷量相比往年沒有下跌,反而比往年這兩個月銷量總和多。
  2. 第三,四季度的銷量相比于第一,二季度上升是因為個別商品類別購買量上漲導致,第三季度的增長主要是由類別5008168帶來的,第四季度銷量主要是由類別50014815帶來的。而5008168的增長是由于在2014年9月20號當天,該類別的銷量達到了2779;50014815的增長是因為2014年11月13日的銷量高峰達到了10029,兩者都發生在2014年。雙十一購物節確實對刺激某些商品類別的銷量有積極影響,但影響力度有限,有時候不及其他促銷活動有效果。
    3.?在銷量上,男童大于女童,原因是男童用戶的每單購買量大于女童用戶的每單購買量。5歲以后的男童基本不再產生購買行為,主要買家為1歲以前的男童家長。
  3. 對于1歲以上用戶,所有產品的吸引力都在下降。但每個品類最大受眾的年齡段不同,主要集中在0歲和1歲嬰幼兒。

 

 

建議

  • 優化影響單量的各個因素,如可以從產品,客戶服務,退貨款政策,廣告等方面著手,在2014年的基礎上進一步壯大用戶基數,提高留存與復購率
  • 在下半年將不暢銷產品類別與暢銷品類捆綁銷售,或者做加購活動,以帶動整體銷量
  • 調整產品范圍,縮減適用于5歲后孩子的產品,集中供應這個年齡前的嬰幼兒產品。尤其是要豐富1歲前孩子適用的嬰幼兒產品,特別是男童,給顧客創造更多消費的機會。
  • 升級改善1歲到5歲孩子適用的產品,可以從提升質量,捆綁營銷,買贈等方面刺激銷量。
  • 采取分年齡營銷策略,讓每個品類精準輻射到對應的人群。

 

宁夏十一选五今天开奖结果