https://zhuanlan.zhihu.com/p/247941842
- A Method to Anonymize Business Metrics to Publishing Implicit Feedback Datasets
2.A Ranking Optimization Approach to Latent Linear Critiquing in Conversational Recommender System
3.Cascading Hybrid Bandits: Online Learning to Rank for Relevance and Diversity
4.Content-Collaborative Disentanglement Representation Learning for Enhanced Recommendation
现代推荐系统通常需要考虑用户行为数据(如点击)中的协作特征和关于用户和物品的内容信息(如用户年龄或物品图片)来改进推荐。虽然结果很鼓舞人,但从这些协作和基于内容视角得到的未被发现的用户喜好表示可能会由于相互影响的混合而被纠缠,从而导致次优的不稳定的推荐。因此,我们建议将从用户行为数据和内容信息中学习到的表示进行分离开来。具体地,我们提出了一种新的支持内容协同解离和特征解离的两级解离生成推荐模型(DICER):对于内容协同解离,DICER基于内容和用户项交互作用,通过边缘分布对特征进行分解,以保证特征的安全性每种类型的学习特征在统计学上是独立的。对于特征分离,通过分解Kullback-Leibler散度,我们从理论上证明了每种类型中提取的特征都是在一个粒度级别上进行分离的。此外,DICER使用一个协解码器,该解码器同时解码内容和用户项交互,以确保所学特征的高质量。通过对三个真实数据集的大量实验,结果表明DICER在NDCG中的平均命中率和NDCG的平均命中率分别比其他目前最好的方法高出13.5%和14.4%。
5.Contextual and Sequential User Embeddings for Large-Scale Music Recommendation
6.Contextual User Browsing Bandits for Large-Scale Online Mobile Recommendation
7. Debiasing Item-to-Item Recommendations With Small Annotated Datasets
8. Deconstructing the Filter Bubble: User Decision-Making and Recommender Systems
通过数值模拟研究了推荐系统环境下的用户决策模型。我们的模型为Nguyen等人(2014)的研究结果提供了解释,在推荐系统通常部署的环境中,即使没有推荐,用户也会随着时间的推移消费越来越相似的物品。我们发现,推荐缓解了这些自然的过滤泡沫效应,但它也会导致用户之间同质性的增加,从而在用户消费的同质化和用户消费的多样化之间做出权衡。最后,我们讨论我们的模型如何强调收集用户信念及其随时间演变的数据的重要性,以设计更好的建议并进一步了解其影响。
9.Doubly Robust Estimator for Ranking Metrics with Post-Click Conversions
点击后转换(Post-click conversion)是一种重要的反馈形式,因为它直接为最终收入做出贡献,并准确地捕捉用户对商品的偏好,而不是模棱两可的点击。然而,天真地使用点击后转换会导致学习或评估推荐者时出现严重偏差,因为点击和未点击的数据之间存在选择偏差。在这项研究中,我们解决了有偏见后点击转换的离线评估问题的算法推荐问题。 解决这一偏差的一个可能的解决办法是使用反向倾向分数估计,因为它可以提供一个无偏的评价,即使有选择偏差。然而,众所周知,这种估计器受到方差和不稳定性问题的影响,这在推荐设置中可能很严重,因为反馈通常非常稀疏。为了克服以往无偏估计器的这些局限性,我们提出一个双稳健估计器,以评估推荐者的基本真实性排名表现。我们提出的估计器对真实值的排序度量是无偏的,改进了现有无偏估计量的方差和估计误差尾界。最后,为了评估所提出估计器的经验效能,我们使用半合成和两个公开的真实世界资料集进行实证评估。结果表明,与现有的基线指标相比,该指标具有更好的模型评价性能,特别是在存在严重选择偏差的情况下。
10.Ensuring Fairness in Group Recommendations by Rank-Sensitive Balancing of Relevance
11. Exploiting Performance Estimates for Augmenting Recommendation Ensembles
通过叠加将多个推荐系统集合起来,可以有效地提高协同推荐的效率。最近的工作扩展了堆叠,使用额外的用户性能预测器(例如,用户所做的评分总数)来帮助确定每个基本推荐者应该为集成贡献多少。尽管如此,尽管手工制作有区别的预测值(通常需要深入了解集成中每个推荐者的优缺点)的成本,但只观察到一些微小的改进。为了克服这一局限性,我们建议通过利用用户自己的历史评分来直接评估这些性能,而不是设计复杂的特征来预测给定用户的不同推荐者的性能。对来自多个领域的真实数据集进行的实验表明,使用性能估计作为附加特征可以显著提高最先进的集成器的精度,在nDCG@20上,平均提高了23%。
12. Exploring Clustering of Bandits for Online Recommendation System
13. FISSA: Fusing Item Similarity Models with Self-Attention Networks for Sequential Recommendation
14. From the Lab to Production: A Case Study of Session-Based Recommendations in the Home-Improvement Domain
电子商务应用程序在很大程度上依赖于基于会话的推荐算法来改善客户的购物体验。基于会话的推荐算法的最新进展显示了巨大的前景。然而,将这一承诺转化为现实世界的成果是一项具有挑战性的任务,原因有很多,但主要是由于现有模型的数量多且特性各异。在这篇论文中,我们讨论了在家居装修领域的一个领先的电子商务应用程序中识别和部署一个成功的基于会话的推荐算法的过程中的方法和经验教训。为此,我们首先在离线环境下对14个基于会话的推荐算法进行了评估,在三个数据集上使用了8个不同的流行评估指标。结果表明,离线评估并不能提供足够的洞察力来做出明智的决策,因为在所有指标上都没有明确的获胜方法。另外,我们发现标准的离线评估指标不适合这个应用程序。具体地说,只有当算法预测到用户下一次点击或最终购买的商品时,他们才会奖励它。然而,在实际情况下,有一些几乎相同的产品,尽管它们被分配了不同的标识符,但它们应该被视为同样好的建议。为了克服这些局限性,我们进行了另一轮评估,在这一轮评估中,人类专家为五种算法的建议提供客观和主观反馈,这些算法在离线评估中表现最好。我们发现,专家的意见往往与线下评估结果不同。对反馈的分析证实,当我们评估与之相关的几乎相同的产品推荐时,所有模型的性能都显著提高。最后,我们使用在人类评估阶段表现最好的模型之一运行A/B测试。与领先的第三方解决方案相比,该治疗模式的转化率提高了15.6%,每次就诊的收入增加了18.5%。
15. Global and Local Differential Privacy for Collaborative Bandits
16. Goal-driven Command Recommendations for Analysts
17. ImRec: Learning Reciprocal Preferences Using Images
互惠推荐系统是为连接人与人之间的 交平台而设计的推荐系统。它们通常用于在线约会、 交 络和招聘服务。这些推荐者与传统的用户商品推荐者之间的主要区别在于,他们必须考虑双方的利益。在这项研究中,我们提出了一种新的方法,提出了一种基于图像数据的相互推荐方法。考虑到用户对其他用户图像的积极和消极偏好表达的历史,我们训练一个siamese 络来识别符合用户个人偏好的图像。我们提供了一个算法来解释这些个体偏好指标为一个相互的偏好关系。我们的评估是在一个流行的在线约会服务提供的大型真实数据集上进行的。基于此,我们的服务大大改进了以前最先进的基于内容的解决方案,并且在冷启动情况下的性能也优于协作过滤解决方案。该模型的成功为图像在 上约会中的重要性提供了经验证据。
18. In-Store Augmented Reality-Enabled Product Comparison and Recommendation
我们提出了一种将实体零售商店中基于AR的产品属性表示与仅在线提供的商品推荐相结合的方法。该系统支持用户的决策过程,通过提供功能来比较商品之间的产品特性,包括实物和在线产品,并提供基于选择店内产品的建议。因此,物理产品可以作为形成用户偏好的锚定,并且在亲自探索产品时提供更丰富和更吸引人的体验。客观产品属性和物理产品的视觉外观都用于从在线空间生成推荐。这样, 上购物和店内购物的优势可以结合起来,为商家创造了新的多渠道机会。实证分析表明,比较和推荐功能得到了用户的认可,并暗示了混合实体 络购物支持系统的一些可能的好处。尽管这项研究有局限性,但有足够的证据认为这是一种可行的方法,值得进一步探讨.
19. Keeping Dataset Biases out of the Simulation: A Debiased Simulator for Reinforcement Learning based Recommender Systems
强化学习推荐(RL4Rec)方法作为一种提高用户长期参与度的有效方法越来越受到关注。然而,在线应用RL4Rec会带来风险:探索可能会导致有害的用户体验。此外,很少有研究人员能够访问现实世界中的推荐系统。模拟已经被提出作为一种解决方案,其中用户反馈是根据记录的历史用户数据来模拟的,从而实现优化和评估,而无需在线运行。虽然模拟器不会给用户体验带来风险,而且可以广泛使用,但我们发现现有模拟方法的一个重要局限性。它们忽略了日志用户数据中存在的交互偏差,因此,这些偏差会影响结果模拟。作为这个问题的解决方案,我们在模拟管道中引入了一个去借方步骤,它在用于模拟用户行为之前纠正日志数据中存在的偏差。为了评估偏差对RL4Rec仿真的影响,我们提出了一种新的模拟器评估方法,该方法考虑了使用模拟器优化的策略的性能。我们的结果显示,来自记录数据的偏差会对结果策略产生负面影响,除非使用我们的借记方法进行纠正。虽然我们的借记方法可以应用于任何模拟器,但我们将完整的管道公开作为离线学习和评估的模拟器(SOFA):第一个在优化和评估之前解释交互偏差的模拟器。
20. KRED: Knowledge-Aware Document Representation for News Recommendations
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!