许多人把推荐系统视为一种神秘的存在,他们觉得推荐系统似乎知道我们的想法是什么。例如当当向我们推荐书籍,还有淘宝向我们推荐该买什么样的商品。
推荐系统是什么?
推荐系统是信息过滤系统的一个子类,它根据用户的偏好和行为,来向用户呈现他(或她)可能感兴趣的物品。推荐系统会尝试去预测你对一个物品的喜好,以此向你推荐一个你很有可能会喜欢的物品。
为什么要用推荐系统?
当今网上商店正在蓬勃发展,我们几乎可以通过点击鼠标来获得任何商品。然而,在传统实体店的时代,商店的储存空间有限,因此店主只能展示最受欢迎的商品,这意味着很多即使像书或 CD 这类质量好的商品也没有被展出。简而言之,店主必须预先对商品进行筛选。
然而,网购行业改变了这种情况。因为有无限的空间,所以不需要预先过滤。相反,这导致了一种后来被称为「长尾效应」的现象。
长尾现象
这种效应意思是受欢迎的少量商品在线上和线下商店都能找到。相反地,不太受欢迎的商品却占大多数并只能在网上商店找到,它们最终形成了长尾现象。然而,不受欢迎的商品也可能是好的,但在网站上找到这样的产品是一项艰巨的任务,并需要某种过滤器。这样的过滤器实际上就构成了推荐系统。
如何构建一个推荐系统?
现在已经有很多种技术来建立一个推荐系统了,最常用的算法就是协同过滤。
协同过滤使用多个用户/客户提供的综合评分来进行推荐。本质上是寻找与我们的目标用户具有相似品味的用户,根据其他人的协同行为来推荐物品。它是首次被用于推荐系统上的技术,至今仍是最简单且最有效的。
协同过滤的过程分为这三步:
(1)收集用户信息
(2)生成矩阵来计算用户关联
(3)作出高可信度的推荐。
这种技术分为两大类:一种基于用户,另一种则是基于组成环境的物品。有两种常用的协同过滤方法:
(1)基于用户的协同过滤
找到其他与你类似的人并推荐他们喜欢的东西。根据用户的行为及兴趣来为用户做推荐,是最常用的一种推荐形式。淘宝首页的猜你喜欢推荐,每个人推荐的都不一样。
(2)基于商品的协同过滤
推荐那些也买了你喜欢的东西的人所买的东西。电视猫APP节目详情页的相似影片,就是常见的一类基于商品的协同过滤推荐模式。