专利 基于评论共性信息嵌入和迁移的跨域推荐方法及系统

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111591808.8 (22)申请日 2021.12.23 (71)申请人中国海洋大学地址 266100 山东省青岛市崂山区松岭路 238号 (72)发明人聂婕　左子杰　宋宁　王京禹　谢华鑫　时津津　 (74)专利代理机构青岛华慧泽专利代理事务所 (普通合伙) 37247 代理人赵梅 (51)Int.Cl. G06F 16/9535(2019.01) G06N 20/00(2019.01) (54)发明名称基于评论共性信息嵌入和迁移的跨域推荐方法及系统 (57)摘要本发明属于跨域推荐技术领域，公开了基于评论共性信息嵌入和迁移的跨域推荐方法及系统，该方法包括源数据的预处理、抽离评论信息的共性表征、学习用户和物品的嵌入表征、用户嵌入表征的跨域迁移和冷启动跨域推荐的步骤，本发明充分利用评论信息在辅助域和目标域的共性表征开展嵌入表征的迁移，提高嵌入表征的泛化性；在多域表征融合时，应用堆叠变分自编码机作为融合架构，提升了多视角信息融合的合理性。权利要求书3页说明书8页附图6页 CN 114254203 A 2022.03.29 CN 114254203 A 1.基于评论共性信息嵌入和迁移的跨域推荐方法，其特征在于，包括以下步骤：步骤一、源数据的预处理源数据由评分数据和评论数据两部分组成，其中评论数据需要预先处理成结构化的N 维向量，在输入模型时，评分数据分别从用户和物品的视角对每一个项都随机初始化成一个N维的评分向量；步骤二、抽离评论信息的共性表征在整个模型训练过程中，利用变分自编码器抽离出用户在辅助域和目标域上评论信息的共性表征，同时也抽离出物品在辅助域和目标域上的评论信息的共性表征；步骤三、学习用户和物品的嵌入表征在抽离了评论信息的共性表征之后，利用多个堆叠变分自编码器分别从用户和物品的视角同时在辅助域和目标域深度融合评论信息的共性表征和相应的评分向量，最终同时得到用户和物品在辅助域和目标域上的嵌入表征；步骤四、用户嵌入表征的跨域迁移最后利用多层感知机建立用户嵌入表征从辅助域到目标域的映射关系，该过程的真实值是目标域的用户嵌入表征，即将辅助域的用户嵌入表征向该用户在目标域的嵌入表征对齐；步骤五、冷启动跨域推荐完成模型的训练以后，对于任一一个冷启动用户，利用多层感知机构建的映射关系将其在辅助域的嵌入表征向目标域进行映射，根据其目标域的嵌入表征，可以为其完成目标域上的推荐。 2.根据权利要求1所述的基于评论共性信息嵌入和迁移的跨域推荐方法，其特征在于，步骤三中，在学习嵌入表征的步骤当中，堆叠了多个隐藏层以抽离更多语义信息，实现用户和物品表征的学习，并在此基础上，将步骤二中得到的评论信息的共性表征融合到用户和物品的表征学习过程中，将评论信息的共性表征和评分向量同时输入堆叠变分自编码器。 3.根据权利要求1所述的基于评论共性信息嵌入和迁移的跨域推荐方法，其特征在于，步骤四的详细步骤是：将用户在辅助域的嵌入表征作为多层感知机的输入，将用户在目标域上的嵌入表征作为该步的真值；并且，在多层感知机的每一个网络层都嵌入步骤二所提取的用户评论信息的共性表征，使得映射关系包含更多共性信息。 4.根据权利要求1所述的基于变分自编码器的共性辅助信息嵌入跨域推荐方法，其特征在于，模型在训练时采用辅助域和目标域同时训练的联合训练方式，一个训练样本具体为：共同用户u、该用户在辅助域和目标域相应的物品ID及相应的评分五个数据，表示如下： A表示辅助域， T表示目标域， i(A)表示用户u在辅助域有交互的一个物品， i(T)表示用户u 在目标域有交互的一个物品，表示用户u在对辅助域物品i(A)的评分值，表示用户u在对目标域物品i(T)的评分值；按批量训练整个模型，每次向模型输入多个样本作为一批训练数据，每批数据经过模型训练都会得到相应的预测评分，通过计算预测评分和真实评分数值的平均平方误差并回传误差，整个模型会不断地更新参数模型以降低误差，最后训练误差会逐渐收敛到一个最低值便不再降低，此时用测试数据测试训练好的模型，得权　利　要　求　书 1/3 页 2 CN 114254203 A 2出的预测准确度即为本模型的最终准确度。 5.根据权利要求4所述的基于评论共性信息嵌入和迁移的跨域推荐方法，其特征在于，总损失函数包括七个部分的损失函数，如下式： L总＝LGU+LGI+LAU+LAI+LTU+LTI+LMLP (1) 其中， LGU是提取用户评论信息的共性表征的损失函数， LGI是提取物品评论信息的共性表征的损失函数， LAU是学习用户在辅助域上的嵌入表征的损失函数， LAI是学习物品在辅助域上的嵌入表征的损失函数， LTU学习用户在目标域上的嵌入表征的损失函数， LTI是学习物品在目标域上的嵌入表征的损失函数， LMLP是实现用户的嵌入表征从辅助域到目标域跨域迁移的损失函数。 6.根据权利要求5所述的基于评论共性信息嵌入和迁移的跨域推荐方法，其特征在于，损失LGU和LGI，具体如下: 在式(2)中， LGU分为四部分： ①为辅助域用户评论向量的重构损失，为辅助域用户的评论向量，为重构的向量； ②为目标域用户评论向量的重构损失，为目标域用户的评论向量，为重构的向量； ③为辅助域用户评论向量的隐空间分布与标准正态分布的KL散度，为辅助域用户评论向量的均值和方差； ④为目标域用户评论向量的隐空间分布与标准正态分布的KL散度，为目标域用户评论向量的均值和方差；在式(3)中， LGI分为四部分：第一部分为辅助域物品评论向量的重构损失，为辅助域物品的评论向量，为重构的向量；第二部分为目标域物品评论向量的重构损失，为目标域物品的评论向量，为重构的向量；第三部分为辅助域物品评论向量的隐空间分布与标准正态分布的KL散度，为辅助域物品评论向量的均值和方差；第四部分为目标域物品评论向量的隐空间分布与标准正态分布的KL散度，为目标域物品评论向量的均值和方差。权　利　要　求　书 2/3 页 3 CN 114254203 A 3

专利 基于评论共性信息嵌入和迁移的跨域推荐方法及系统

专利基于评论共性信息嵌入和迁移的跨域推荐方法及系统