在互聯網中,AB測試是為Web或App界面或流程制作兩個(A/B)或多個(A/B/n)版本,在同壹時間維度,分別讓組成成分相同(相似)的訪客群組(目標人群)隨機的訪問這些版本,收集各群組的用戶體驗數據和業務數據,最後分析、評估出最好版本,正式采用。
2、基本步驟
AB測試是壹個不斷叠代的過程
3、影響準確性因素分析
對此實驗影響最大的是樣本的選擇,也就是流量分配的問題,大致存在下面兩個方面的問題:
1)樣本數量
樣本數量不能過少,如果樣本數量過少的話,那麽實驗不具有代表性,和可能其中的某個特大值或特小值都會對試驗產生很大的偏差,影響最後的效果;
2)樣本是否均勻
各個實驗組分配到的樣本是否均勻,如果樣本並不均勻,則即使樣本數量再多也得不到壹個有價值的統計結果。
4、AB測試實戰階段
1)、背景:現在開通了壹個網站,然後給網站投放廣告的時候,壹開始給大家看到的落地頁是 訪問課程資料 ,現在又推出了 開始免費試學 這個落地頁,然後想著以後換上新的落地頁,這時候就要檢測兩個落地頁的轉化效果了,下面是測試的24天,看數據會有24天的。
2)、讀取數據
其中user_id是用戶id;timestamp是訪問時間;group是兩組樣本表示,control表示的是舊的落地頁,對應的是landing_page中的old_page;treatment表示的是新的落地頁,對應的是landing_page中的new_page;converted表示是否轉化,1是轉化,0是未轉化。
3)、觀察缺失值
此數據中沒有缺失值,所以不需要進壹步處理缺失值。
4)、數據中可能存在group和langding_page中的值不對應,找到並處理
5)、去除掉重復的用戶
6)、對數據整體做壹個概覽:
7)、進行假設性檢驗
a、隨機將測試用戶分為兩個組,A組和B組,可以得到各自的轉化率Pa和Pb,經過壹定測試時間後,根據收集到的兩方案樣本觀測數據,根據顯著性檢驗結果選取最好方案。
b、建立原假設和備擇假設
我們期望方案B(新方案)頁面的轉化率高於方案A(就方案)頁面的轉化率,所以構成如下的假設:
c、構建檢驗統計量
d、計算
1)
z-socre 是 1.3109241984234394,P-value 0.09494168724097551 > 0.05 所以不能拒絕原假設,也就是說方案B的效果不比方案A效果好,這種概率為95%。
2)、同過上面的檢驗統計量計算
和上面是相同的結果,所以截至到目前並沒有證據可以證明某壹頁面可以帶來更多的轉化率,這裏我們就需要再延長觀測時間或是修改新的頁面再進行測試了