想给用户做推荐？先收下这份「推荐系统」评估指南

2020/09/18 编辑：土拨鼠作者： 58UXD阅读 1.2w 评论有奖阅读本文需 11 分钟

序言

对于当下的互联网产品，无论是主流或非主流，处处都能看到推荐系统的应用场景。比如，当你在淘宝下单购买了一台iPhone 11，购买完成页下方立刻就会给你推荐诸如「全新AirPods Pro」、「Apple Watch 5」等相关商品；再比如，当你在豆瓣上标记了想看热门悬疑网剧《隐秘的角落》，在厕所刷抖音的时候，可能就会看到《无证之罪》、《轮到你了》、《白夜追凶》等等相似剧集的精彩片段。推荐系统这只无形的「大手」已经把我们安排的明明白白了。

想给用户做推荐？先收下这份「推荐系统」评估指南

△ @alienking2000 from unsplash.com

推荐系统的强大毋庸置疑，而且我们经常会把它看作是一个神秘的黑箱子，会将其与多种复杂的技术术语相关联，比如「大数据」、「人工智能」、「机器学习」等等，进而认为推荐系统的好坏，就是对用户偏好预测的精准与否。然而，不久前完成的一个研究课题，打破了这个认知误区。

反思

通过本次调研，虽然迈出了推荐系统体验评估的第一步，但依然存在不足之处：

1. 评估颗粒度较粗

本次评估是针对推荐系统整体条目来进行的，虽然在评估维度上划分了若干子维度，但由于推荐信息展示规则的复杂性，很难定位出具体哪些条目存在问题，即使量化了用户的主观感受，也是一种笼统性的诊断，对于较明显的缺陷（例如缺乏推荐理由）尚可探查，但对于涉及算法层面的调优，指导意义则相对较弱；

2. 用户回忆门槛高

用户在填答评估问卷时，需要回忆推荐列表中曾经出现过的信息条目，但不同用户的浏览习惯差异较大，有些用户会逐条仔细浏览，有些用户会跳跃式的浏览，这种干扰因素较难在线上进行控制，结果是用户填答问卷时，可能会出现对之前浏览过的信息无法回忆的情况，进而会影响到最终的评估结果。针对该问题，可考虑选择实时性更高的填答方式，例如，在用户进入评估页面后，为用户实时呈现真实算法展示的信息条目，也可以确保用户会逐条阅读推荐信息并进行评估。

进入淘宝首页推荐系统调研页面后，用户会进入一个评估问卷中，但评估的条目会根据用户的喜好来个性化呈现，用户直接针对不同条目进行评估即可，无需回忆

以上便是笔者近期关于推荐系统评估的若干实践与反思，希望能给对该主题感兴趣的朋友们带来一些启发。

为什么微信开始推荐公众号了？从算法概述张小龙的产品哲学

编辑导语：算法分发已经不是一个陌生的词汇了，各大APP都有自己的算法，并且通过这些算法了解用户、推荐内容，从而达到自己的目的。

阅读文章 >

参考文献

[1] 王国霞，刘贺平.个性化推荐系统综述[J]. 计算机工程与应用，2012,48(7):66-76.
[2] Paul Resnick, Hal R. Varian. Recommender Systems[J]. Communications of the ACM, 1997,40(3): 56-58.
[3] 项亮. 推荐系统实践[M]. 北京：人民邮电出版社, 2012.

欢迎关注「58UXD」的微信公众号：