先日の記事で、SQLを使った簡単なバスケット分析の方法を紹介した。

【SQL】商品の併売率を求めてバスケット分析をする

併売率は分析用語で信頼度と呼ばれており、基本的にある商品とセットで別の商品を提案する場合は信頼度の高い組み合わせを勧めれば良い。

ただ、バスケット分析において信頼度と別の指標として、支持度リフト値というものもあり、これらを組み合わせた方がより精度を高めることができる。

支持度

全体の中でその組み合わせがどのくらいの割合で売れているかを表す値を支持度と呼び、以下の式で求めることができる。

$$\frac{ある組み合わせの注文回数}{全注文回数}$$

通常かなり小さな値になることが多いがこの値を使うことで、例えば信頼度が高いが支持度があまりにも低い場合はそもそもその組み合わせがほとんど売れていない、などといったことが分かるようになる。

リフト値

単品で売るよりも組み合わせて売った方がより売れるようになる割合をリフト値と呼び、以下の式で求めることができる。

$$\frac{AとBを同時に買う確率}{全体の中でBを買う確率}$$

リフト値が1を超える場合は、商品Bを単品で買うよりも組み合わせて買われる確率が高いということになるので、セット買いを勧めるべきということになる。

逆にリフト値が1未満の場合は、むしろ組み合わせない方が良いということになる。

まとめ

信頼度と合わせこの3つの軸をまとめて考えると、支持度がそこそこあり、リフト値が1を超え、信頼度の高い組み合わせが最もセット買いをお勧めする価値のある組み合わせということになる。