Artificial Intelligence 17 min read

Machine Heart Column

Researchers propose a causal learning framework IV4Rec to separate causal and non-causal factors in recommendations using search data.

Kuaishou Tech

Feb 14, 2022

本文中，研究者提出了一个基于工具变量的模型无关的因果学习框架 IV4Rec，从而利用搜索数据辅助推荐模型。该框架将搜索的 query 作为 IVs 来将推荐系统中的 embedding 分解为因果和非因果的部分，再将它们联合起来探索不同机制对于推荐结果的影响。此外，IV4Rec 将传统的 IVs 的方法和深度学习结合，提供了一个端到端的框架来学习模型的参数。研究者在快手短视频数据集和公开数据集 MIND 上的实验验证了该框架的有效性。

基于机器学习的推荐系统逐渐成为帮助人们自动过滤信息、发掘兴趣的主要方式。

现有模型通常使用 embedding 来表示推荐系统中丰富的信息，比如物品、用户和上下文信息。

从因果分析的角度来看，这些向量和用户最终的反馈（比如点击、点赞、转发等）之间的关系是由因果关系和非因果关系混杂在一起组成的。

因果关系是反应物品被用户偏好的原因，非因果关系仅仅反应用户和物品之间的统计依赖关系，比如曝光模式、公众观念、展示位置等。然而现有推荐算法大部分都忽略了因果关系和非因果关系之间的不同之处。

在这篇文章中，快手和人大的研究者提出了一个模型无关的因果学习框架，该框架被称作 IV4Rec，用来有效地分离出这两种关系，从而加强推荐模型的效果。更确切地说，研究者联合考虑了搜索场景和推荐场景下的用户行为。通过借鉴因果推断中的概念，他们将用户的搜索行为作为工具变量（Instrumental variables, IVs），来帮助分解原本推荐中 embedding，即 treatments。然后使用深度神经网络将分离的两个部分结合起来，用结合后的结果来完成推荐任务。

因此，研究者认为：

现有搜索推荐联合的模型与方法并没有从深层次发掘和利用搜索行为与推荐模型之间的因果关系；

现有推荐模型普遍没有考虑到训练过程中产生的各种 bias，多种 bias 组成的 confounder 会影响模型的训练。

因此，他们提出了一个因果学习框架，使用工具变量（instrumental variable）方法利用搜索数据辅助推荐模型。首先 T 被分解为 causal 和 non-causal 的部分，再将这两个部分重构成为新的 T，作为推荐模型的输入。

具体来说，该方法主要分为三个部分：A. 构造 treatment （T）和 Instrumental Variables （IVs），B. 重构 treatment，C. 将重构的 treatment 应用到推荐模型

A. 构造 treatment

对于推荐场景来说，研究者认为交互数据中的 use-item pair 是 treatment。对于序列推荐来说，user embedding 是通过 user 的浏览历史的到的，所以 user 可以看作是浏览历史中所有 item embedding 的集合。所以 use-item pair 可以看作一个 item embedding 的集合，其中元素为候选物品以及用户浏览历史中的所有物品。

对于搜索引擎的日志数据来说，一般存储的是 user-query-item-click 这种四元组。对于每一个需要的 item，通过搜索日志数据召回点击过它的 query。每一个 item 召回 n 个点击过它的 query 作为其工具变量，具体方法为：通过 BERT 等预训练模型将 query 的文本信息转化为向量，将 n 个 query 的 embedding 堆叠起来成为一个矩阵，该矩阵即是对应 item embedding 的工具变量（IVs）。对于每一个 user 的浏览历史中的 item 构造 IVs，这些矩阵构成了 user 的 IVs。

B. Treatment 重构

首先进行 treatment 分解。使用 IVs 的目标是通过 IVs 分离出来 treatment 和 outcome 之间的因果关系。研究者用 IVs（Z）回归 treatment（T）得到

，根据 IVs 的理论，

和 Y 之间的关系代表了 T 和 Y 之间的因果关系。并且，他们用 T -

得到残差

，并认为

和 Y 之间代表了 T 和 Y 之间的非因果关系。传统的因果推荐应用中，主要目的是探究因果关系而不是预测准最终的 Y，所以通常会直接移除残差

。

但是，研究者关心的更多是提升推荐模型的预测准确性，所以在下一步仍然利用残差来提升推荐性能。

Treatment 融合。研究者使用加权求和的方式融合两部分 treatment，2 个深度神经网络（MLP）被分别用来学习

和

的权重，两个网络结构相同，输入均为

和

的 concatenation。

C. 将重构的 treatment 应用到推荐模型

许多序列推荐模型（DIN、DIEN、NRHUB、BST 等等）都共享上图左边的结构，我们将其称之为 underlying model。Underlying model 将 item 用向量表示，利用用户的历史行为来学习用户的表示，并基于学到的用户和物品的表示来预测用户对于物品的偏好分数。

研究者提出的 IV4Rec 框架可以应用在所有符合 underlying model 结构的模型上，只需要简单地在 item embedding layer 后加入 treatment reconstruction module。重构的用户表示是通过其浏览历史中的物品的重构向量得到的，再利用重构出的用户和候选物品向量，便可以得到更加精确的预测值。

为了证明提出的 IV4Rec 框架的有效性，研究者在新闻推荐公开数据集 MIND 和快手短视频数据集上进行了实验。采用准确性指标 AUC，以及两个排名指标 MRR 和 NDCG 进行评估，MRR 和 NDCG 的位置分别设置为 5 和 10。

研究者将 IV4Rec 框架应用在了两个推荐模型 DIN 和 NRHUB 上（记为 IV4Rec-DIN, IV4Rec-NRHUB），并且和一个联合优化搜索和推荐的框架 JSR 进行了比较（记为 JSR-DIN，JSR-NRHUB）。

从下表 1 可以看出，与不加入 IV4Rec 的 underlying model 比较，在所有指标上，本文提出的 IV4Rec 框架具有不俗的性能提升。另外，IV4Rec 对于 underlying model 的性能提升远超过 JSR 这个联合优化搜索和推荐的框架。这些结果都验证了 IV4Rec 的有效性。

在快手短视频数据集上，NRHUB 本身就利用了搜索行为作为用户特征，研究者对于 DIN 也额外加入了一个用户行为的塔来利用搜索行为特征，因此在该数据集的实验中，IV4Rec 的确是从因果推断的角度提升了模型的效果，而不是因为加入搜索特征得到的提升。

为了进一步探究所提出的方法利用残差的效果，研究者在快手短视频数据集上尝试了不同版本的 IV4Rec 框架，结果如下图 2 所示。

不同的版本分别为：只使用因果的部分

；只使用残差

；不用 reconstruction module，直接使用原本的 treatment；使用重构的 treatment 通过 concatenate

和残差

；使用 IV4Rec 中方式重构的 treatment。

可以发现当两个部分被联合到一起的时候，AUC 提升了很多。

这种现象同时发生在 NRHUB 和 DIN 上，这说明了残差也可以提升用户偏好的预测，因为残差仍然和最终的 Y 有很强的相关关系。

当目标是做出准确的预测而不是分析因果关系时，

和

是互补的两个部分。

封面图源：

https://www.xenonstack.com/use-cases/recommendation-system/

Original Source

Signed-in readers can open the original source through BestHub's protected redirect.

Republication Notice

This article has been distilled and summarized from source material, then republished for learning and reference. If you believe it infringes your rights, please contactand we will review it promptly.

.ai instrumental variables causal learning search data

Written by

Kuaishou Tech

Official Kuaishou tech account, providing real-time updates on the latest Kuaishou technology practices.

0 followers

Reader feedback

How this landed with the community

Rate this article

Was this worth your time?

Discussion

0 Comments

Thoughtful readers leave field notes, pushback, and hard-won operational detail here.