说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111591808.8 (22)申请日 2021.12.23 (71)申请人 中国海洋大学 地址 266100 山东省青岛市崂山区松岭路 238号 (72)发明人 聂婕 左子杰 宋宁 王京禹  谢华鑫 时津津  (74)专利代理 机构 青岛华慧泽专利代理事务所 (普通合伙) 37247 代理人 赵梅 (51)Int.Cl. G06F 16/9535(2019.01) G06N 20/00(2019.01) (54)发明名称 基于评论共性信息嵌入和迁移的跨域推荐 方法及系统 (57)摘要 本发明属于跨域推荐技术领域, 公开了基于 评论共性信息嵌入和迁移的跨域推荐方法及系 统, 该方法包括源数据的预处理、 抽离评论信息 的共性表征、 学习用户和物品的嵌入表征、 用户 嵌入表征的跨域迁移和冷启动跨域推荐的步骤, 本发明充分利用评论信息在辅助域和目标域的 共性表征开展嵌入表征的迁移, 提高嵌入表征的 泛化性; 在多域表征融合时, 应用堆叠变分自编 码机作为融合架构, 提升了多视角信息融合的合 理性。 权利要求书3页 说明书8页 附图6页 CN 114254203 A 2022.03.29 CN 114254203 A 1.基于评论共性信息嵌入和迁移的跨 域推荐方法, 其特 征在于, 包括以下步骤: 步骤一、 源数据的预处 理 源数据由评分数据和评论数据两部分组成, 其中评论数据需要预先处理成结构化的N 维向量, 在输入模型时, 评分数据分别从用户和物品的视角对每一个项都随机初始化成一 个N维的评分向量; 步骤二、 抽离 评论信息的共性表征 在整个模型训练过程中, 利用变分 自编码器抽离出用户在辅助域和目标域上评论信 息 的共性表征, 同时也抽离出物品在辅助域和目标域上的评论信息的共性表征; 步骤三、 学习用户和物品的嵌入表征 在抽离了评论信 息的共性表征之后, 利用多个堆叠变分 自编码器分别从用户和物品的 视角同时在辅助域和目标域深度融合评论信息的共性表征和相应的评 分向量, 最 终同时得 到用户和物品在辅助域和目标域上的嵌入表征; 步骤四、 用户嵌入表征的跨 域迁移 最后利用多层感知机建立用户嵌入表征从辅助域到目标域的映射关系, 该过程的真实 值是目标域的用户嵌入表征, 即将辅助域的用户嵌入表征向该用户在目标域的嵌入表征对 齐; 步骤五、 冷启动跨 域推荐 完成模型的训练以后, 对于任一一个冷启动用户, 利用多层感知机构建的映射关系将 其在辅助域的嵌入表征向目标域进行映射, 根据其 目标域的嵌入表征, 可以为其完成目标 域上的推荐。 2.根据权利要求1所述的基于评论共性信 息嵌入和迁移的跨域推荐方法, 其特征在于, 步骤三中, 在学习嵌入表征的步骤当中, 堆叠了多个隐藏层以抽离更多语义信息, 实现用户 和物品表征 的学习, 并在此基础上, 将步骤二中得到的评论信息的共性表征融合到用户和 物品的表征 学习过程中, 将评论信息的共性表征和评分向量同时输入堆叠变分自编码器。 3.根据权利要求1所述的基于评论共性信 息嵌入和迁移的跨域推荐方法, 其特征在于, 步骤四的详细步骤是: 将用户在辅助域的嵌入表征作为多层感知机的输入, 将用户在目标 域上的嵌入表征作为该步的真值; 并且, 在多层感知机的每一个网络层都嵌入步骤二所提 取的用户评论信息的共性表征, 使得映射关系包 含更多共性信息 。 4.根据权利要求1所述的基于变分自编码器的共性辅助信息嵌入跨域推荐方法, 其特 征在于, 模型在训练时采用辅助域和目标域同时训练的联合训练方式, 一个训练样本具体 为: 共同用户u、 该用户在辅助域和目标域相应的物品ID及相应的评分五个数据, 表示如下: A表示辅助域, T表示目标域, i(A)表示用户u在辅助 域有交互的一个物品, i(T)表示用户u 在目标域有交互的一个物品, 表示用户u在对辅助域物品i(A)的评分值, 表示 用户u在对目标域物品i(T)的评分值; 按批量训练整个模型, 每次向模型输入多个样本作为 一批训练数据, 每批数据经过模型训练都会得到相应的预测评分, 通过计算预测评分和真 实评分数值的平均平方误差并回传误差, 整个模型会不断地更新参数模型以降低误差, 最 后训练误差会逐渐 收敛到一个最低值便不再降低, 此时用测试数据测试训练好的模型, 得权 利 要 求 书 1/3 页 2 CN 114254203 A 2出的预测准确度即为本模型的最终准确度。 5.根据权利要求4所述的基于评论共性信 息嵌入和迁移的跨域推荐方法, 其特征在于, 总损失函数包括七个部分的损失函数, 如下式: L总=LGU+LGI+LAU+LAI+LTU+LTI+LMLP   (1) 其中, LGU是提取用户评论信息的共性表征的损失函数, LGI是提取物品评论信息的共性 表征的损失函数, LAU是学习用户在辅助域上的嵌入表征的损失函数, LAI是学习物品在辅助 域上的嵌入表征的损失函数, LTU学习用户在目标域上的嵌入表征的损失函数, LTI是学习物 品在目标域上的嵌入表征的损失函数, LMLP是实现用户的嵌入表征从辅助域到目标域跨域 迁移的损失函数。 6.根据权利要求5所述的基于评论共性信 息嵌入和迁移的跨域推荐方法, 其特征在于, 损失LGU和LGI, 具体如下: 在式(2)中, LGU分为四部分: ①为辅助域用户评论向量的重构损失, 为辅助域用户的 评论向量, 为 重构的向量; ②为目标域用户评论向量的重构损失, 为目标域用户 的评论向量, 为 重构的向量; ③为辅助域用户评论向量 的隐空间分布与标准正态 分布的KL散度, 为辅助域用户评论向量 的均值和方差; ④为目标域用户评论 向量 的隐空间分布与标准正态分布 的KL散度, 为目标域用户评论向量 的 均值和方差; 在式(3)中, LGI分为四部分: 第一部分为辅助域物品评论向量的重构损失, 为辅助域 物品的评论向量, 为 重构的向量; 第二部分为目标域物品评论向量的重构损失, 为目标域物品的评 论向量, 为 重构的向量; 第三部分为辅助域物品评 论向量 的隐 空间分布与标准正态分布的KL散度, 为辅助域物品评论向量 的均值和方差; 第 四部分为目标域物品评论向量 的隐空间分布与标准正态分布的KL散度, 为目 标域物品评论向量 的均值和方差 。权 利 要 求 书 2/3 页 3 CN 114254203 A 3

.PDF文档 专利 基于评论共性信息嵌入和迁移的跨域推荐方法及系统

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于评论共性信息嵌入和迁移的跨域推荐方法及系统 第 1 页 专利 基于评论共性信息嵌入和迁移的跨域推荐方法及系统 第 2 页 专利 基于评论共性信息嵌入和迁移的跨域推荐方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:17:14上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。