Apriori 算法

2021-09-22 | 阅读：次

Apriori 算法

最近上课讲到这个啤酒尿布的问题，说实话，这个事情是在大一的时候看那个魔鬼经济学里面看到的一个故事，但是没有想到里面居然有这么复杂的算法知识。。。。长见识了

啤酒和尿布就是一个相关问题，那么我们如何在实际生活中发现这样的相关关系呢？这就需要我们去设置一些指标去筛选。

两个商品具有比较强的相关关系的时候具有以下两个特点，其一：这两个产品同时出现的概率比较高，第二：在A产品出现的情况下，B产品出现的概率也比较高。

这两个指标分别为：支持度和置信度（support rate and confidence rate） \(support\ \ rate(A=>B) = P(A\cap{B}) \\ confidence\ \ rate(A=>B) = P(B\ | \ A)\) 实际上如果我们就是先去计算support rate的时候，我们按照最笨蛋的方法去计算一个个情况出现的概率那么计算的困难程度会超乎我们的想象。 \(C^1_n + C^2_n + C^3_n + ··· + C^n_n = 2^n\) 这个问题是所有可能的组合，对于一个超市而言，这个数据是很难以想象的，那么我们如何去计算超市里面所有的可能的满足条件组合呢？那么问题就使用了Apriori算法。