そのABテスト意味ないかも！カイ二乗検定（χ二乗検定）で「優位性」を判断する方法をわかりやすく解説【無料計算ツール付き】

2021年8月23日

ABテストを行ってみると、Ａの方が良いのか？Ｂの方が良いのか？甲乙つけがたい結果を得ることが多々あります。本コラムでは、ABテストの結果の信ぴょう性を、偶然率と優位性をもとに判定する計算式『カイ二乗検定』（χ二乗検定）について、実際のやり方を詳しく解説します。

【目次】
１．数値の解釈
 ２．カイ二乗検定（χ二乗検定）とは？
３．カイ二乗検定（χ二乗検定）の事例・計算手順
 ４．優位性が「ない」場合はどうすれば…？無料計算ツールのご案内
 ５．カイ二乗検定（χ二乗検定）についてまとめ

１．数値の解釈

先日、パートナー企業様との打合せ中、

「ABテストの結果(数値)ってどうやって解釈しているんですか？」
「キャッチコピーのABテストで、CVRが0.03%(←曖昧な結果)上回った方を採用されたことがあって…」

という質問をいただきました。

さて、この判断は正しかったのか？
皆さんならどうやって解釈しますか？

仕事上、様々な前提条件が伴う「数値」と接するのですが、
正直に申し上げますと「伝えたいことありき」の集計・アウトプットになっている資料を目にする機会が少なくありません。

決して穿った見方をしているのではなく、事実確認をすると「それ」とわかってしまうケースがあります。

事業成長に直結する「施策」を選択するためには、
事業成長に直結する「数値」を読み解き、正しく解釈する力が必要です。

２．カイ二乗検定（χ二乗検定）とは？

先ほどの
「ABテストの結果をどうやって解釈しているのか？」
「信ぴょう性をどうやって確認しているのか？」

という質問に対して、
『カイ二乗検定(カイにじょうけんてい)』（χ二乗検定）を利用しています！と回答しました。

【カイ二乗検定（χ二乗検定）とは？】
ネットで調べてみると、「独立性」「分布」「自由度」「帰無仮説」「p値」などなど…。
聞きなれない言葉のオンパレードで、頭がパニックになることかと思います。

ものすごくざっくり説明すると、
ABテストの結果(数値)の信ぴょう性を、『偶然率』と『優位性』をもとに判定する計算式のことです。

● 偶然率：
　偶然得られた結果なのか？(今回たまたま得られた結果なのか？)

● 優位性：
　意味のある統計結果なのか？(何度やっても同じ結果が得られるのか？)

ABテストの結果を統計的に判定できる便利な計算式、とだけ覚えておけばOKです。

３．カイ二乗検定（χ二乗検定）の事例・計算手順

では、どのようにして『カイ二乗検定』（χ二乗検定）を行うのか？
大まかな手順は、以下の通りです。

▼ STEP１）
　『実測値』の計算

▼ STEP２）
　『期待値』の計算

▼ STEP３）
　『偶然率』と『優位性』の判定

それでは、実例を用いて、具体的に確認していきましょう。

【STEP１】実測値の計算
『実測値』とは、ABテストで得られた結果(実際の数値)のことです。(※下図参照)

まず始めに、クリエイティブＡとＢそれぞれの「CVR」を計算します。(※赤色塗りつぶし箇所)

● Ａの「CVR」　＝　実際の「購入者」143　÷　実際の「訪問数」40,001　＝　0.36%
● Ｂの「CVR」　＝　実際の「購入者」89　÷　実際の「訪問数」41,301　＝　0.22%

クリエイティブＡとＢの「CVR」を比較すると「Aの方が良さそうだ！」となるわけですが、
「この差(0.14%)が本当に信用できるのか？」を判定するのが『カイ二乗検定』です。

次、にＡとＢを合算した際の「CVR」と「非購入率」を計算します。(※青色塗りつぶし箇所)

● ＡとＢを合算した際の「CVR」　＝　実際の「購入者」232　÷　実際の「訪問数」81,302　＝　0.29%
● 〃　　　　　　「非購入率」　＝　100%　－　実際の「購入率(CVR)」0.29%　＝　99.71%

【STEP2】期待値の計算
『期待値』とは、ＡとＢに差がないと期待した際の数値のことです。(※下図参照)

Ａについて、以下の『期待値』を計算します。(※緑色塗りつぶし箇所)

● 「非購入者」　＝　実際の「訪問者」40,001　×　「非購入率」99.71%*　＝　39,887
● 「購入者」　＝　実際の「訪問者」40,001　×　「CVR」0.29%*　＝　114

同様に、Ｂの『期待値』を計算します。(※黄色塗りつぶし箇所)

● 「非購入者」　＝　実際の「訪問者」41,301　×　「非購入率」99.71%*　＝　41,183
● 「購入者」　＝　実際の「訪問者」41,301　×　「CVR」0.29%*　＝　118

＊補足：「非購入率」は四捨五入前の【99.7146441661952%】で計算し、「CVR」は四捨五入前の【0.2853558338048%】で計算しています。そのため、図にある四捨五入後の【99.71%】と【0.29%】を使ってお手元で計算すると数字が合わないと思いますが、Excelを利用すれば図と同じ値が算出されるはずです。

ここで、Ａ・Ｂそれぞれの『実測値』と『期待値』を見比べてみると、
「購入者」も「非購入者」どちらも29件の「差」が生まれていることに気づきます。

この差が「ABテストの差として信用できるのか？」それとも「偶然発生したのか？」を判定するのが『偶然率』になります。

【STEP3】偶然率と優位性の判定
ここで登場するのがExcelの『CHISQ.TEST関数』です。(※下図参照)