Statistic

IMG_9395.jpg
source:統計學,最強的商業武器

 

t-test vs. Chi square

  • 當data是連續數值時,使用t-test。名目數值時(例如,是/否、男/女),使用Chi-squre

 

H0 與 H1的設置考量:

  1. H0: 要被證明為否的論述 vs. H1: 當H0 為否時的另一個情況。
  2. 假設檢定時通常會是把『2件事沒有差異』放在需要被證明為錯的地方。所以 “="都會放在H0
  3. 考量 Type I Type II errors。通常會把 Type I error 結果比較嚴重(ie. 其實為真,但被推翻為真)的放在 H0。

 

經過計算後得到的統計值:

可以視為是把樣本的數值特性,翻譯/轉譯為一個可用來在使用的分配上,用來查詢/對照,看落點在哪裡,的工具。

 

T-test

  • 一般來說通常variance會不同,所以不確定variance狀態時,用assuming unequal variance會比較適合。
  • 不同的假設檢定背後代表的是不同的分配型態。(ex. Chi Distribution, T distribution = student’s t distribution)
  • 選擇左尾 or 右尾:看p-value –> p value 就是 p(Ho) —> 例如:p(Ho >= xxx, 在分配上看的是大於統計值的情況,因此是看分配的右半邊,因此是右尾)

 

Chi-squre

  1. 比較適合用在2組數值時使用,3組以上用其他檢定方式比較準。
  2. 概念上是在此分配下,計算此樣本的平均值,與期望值的平均值之間,是否有明顯差異。
  3. df  = (colome -1)(row-1)

------------------------------------------

理想狀態下有A/A test 也有A/B test 比較合適。不過如果無法做到(例如,後話才做)。還是有幾種測試方式:
以刷卡頁是否有timer,是否影響用戶刷卡成功率來舉例。如果事前沒有設計A/A vs. A/B。因此有的數據只有day 0- day30 的成功率 (w/o timer),比較 day 31- day60 (w/ timer) 的來比較。

  1. day31-day45 vs. day46-day60 之間是否成功率就沒差(後話的 A/A test, 可證明不受時間/其他因素影響)
  2. 比較嚴謹做法是看同一用戶,在day0-day30 vs. day31-day60之間都有購買的,比較是否刷卡成功率有不同。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Google photo

您的留言將使用 Google 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s