说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111591808.8 (22)申请日 2021.12.23 (71)申请人 中国海洋大学 地址 266100 山东省青岛市崂山区松岭路 238号 (72)发明人 聂婕 左子杰 宋宁 王京禹 谢华鑫 时津津 (74)专利代理 机构 青岛华慧泽专利代理事务所 (普通合伙) 37247 代理人 赵梅 (51)Int.Cl. G06F 16/9535(2019.01) G06N 20/00(2019.01) (54)发明名称 基于评论共性信息嵌入和迁移的跨域推荐 方法及系统 (57)摘要 本发明属于跨域推荐技术领域, 公开了基于 评论共性信息嵌入和迁移的跨域推荐方法及系 统, 该方法包括源数据的预处理、 抽离评论信息 的共性表征、 学习用户和物品的嵌入表征、 用户 嵌入表征的跨域迁移和冷启动跨域推荐的步骤, 本发明充分利用评论信息在辅助域和目标域的 共性表征开展嵌入表征的迁移, 提高嵌入表征的 泛化性; 在多域表征融合时, 应用堆叠变分自编 码机作为融合架构, 提升了多视角信息融合的合 理性。 权利要求书3页 说明书8页 附图6页 CN 114254203 A 2022.03.29 CN 114254203 A 1.基于评论共性信息嵌入和迁移的跨 域推荐方法, 其特 征在于, 包括以下步骤: 步骤一、 源数据的预处 理 源数据由评分数据和评论数据两部分组成, 其中评论数据需要预先处理成结构化的N 维向量, 在输入模型时, 评分数据分别从用户和物品的视角对每一个项都随机初始化成一 个N维的评分向量; 步骤二、 抽离 评论信息的共性表征 在整个模型训练过程中, 利用变分 自编码器抽离出用户在辅助域和目标域上评论信 息 的共性表征, 同时也抽离出物品在辅助域和目标域上的评论信息的共性表征; 步骤三、 学习用户和物品的嵌入表征 在抽离了评论信 息的共性表征之后, 利用多个堆叠变分 自编码器分别从用户和物品的 视角同时在辅助域和目标域深度融合评论信息的共性表征和相应的评 分向量, 最 终同时得 到用户和物品在辅助域和目标域上的嵌入表征; 步骤四、 用户嵌入表征的跨 域迁移 最后利用多层感知机建立用户嵌入表征从辅助域到目标域的映射关系, 该过程的真实 值是目标域的用户嵌入表征, 即将辅助域的用户嵌入表征向该用户在目标域的嵌入表征对 齐; 步骤五、 冷启动跨 域推荐 完成模型的训练以后, 对于任一一个冷启动用户, 利用多层感知机构建的映射关系将 其在辅助域的嵌入表征向目标域进行映射, 根据其 目标域的嵌入表征, 可以为其完成目标 域上的推荐。 2.根据权利要求1所述的基于评论共性信 息嵌入和迁移的跨域推荐方法, 其特征在于, 步骤三中, 在学习嵌入表征的步骤当中, 堆叠了多个隐藏层以抽离更多语义信息, 实现用户 和物品表征 的学习, 并在此基础上, 将步骤二中得到的评论信息的共性表征融合到用户和 物品的表征 学习过程中, 将评论信息的共性表征和评分向量同时输入堆叠变分自编码器。 3.根据权利要求1所述的基于评论共性信 息嵌入和迁移的跨域推荐方法, 其特征在于, 步骤四的详细步骤是: 将用户在辅助域的嵌入表征作为多层感知机的输入, 将用户在目标 域上的嵌入表征作为该步的真值; 并且, 在多层感知机的每一个网络层都嵌入步骤二所提 取的用户评论信息的共性表征, 使得映射关系包 含更多共性信息 。 4.根据权利要求1所述的基于变分自编码器的共性辅助信息嵌入跨域推荐方法, 其特 征在于, 模型在训练时采用辅助域和目标域同时训练的联合训练方式, 一个训练样本具体 为: 共同用户u、 该用户在辅助域和目标域相应的物品ID及相应的评分五个数据, 表示如下: A表示辅助域, T表示目标域, i(A)表示用户u在辅助 域有交互的一个物品, i(T)表示用户u 在目标域有交互的一个物品, 表示用户u在对辅助域物品i(A)的评分值, 表示 用户u在对目标域物品i(T)的评分值; 按批量训练整个模型, 每次向模型输入多个样本作为 一批训练数据, 每批数据经过模型训练都会得到相应的预测评分, 通过计算预测评分和真 实评分数值的平均平方误差并回传误差, 整个模型会不断地更新参数模型以降低误差, 最 后训练误差会逐渐 收敛到一个最低值便不再降低, 此时用测试数据测试训练好的模型, 得权 利 要 求 书 1/3 页 2 CN 114254203 A 2出的预测准确度即为本模型的最终准确度。 5.根据权利要求4所述的基于评论共性信 息嵌入和迁移的跨域推荐方法, 其特征在于, 总损失函数包括七个部分的损失函数, 如下式: L总=LGU+LGI+LAU+LAI+LTU+LTI+LMLP (1) 其中, LGU是提取用户评论信息的共性表征的损失函数, LGI是提取物品评论信息的共性 表征的损失函数, LAU是学习用户在辅助域上的嵌入表征的损失函数, LAI是学习物品在辅助 域上的嵌入表征的损失函数, LTU学习用户在目标域上的嵌入表征的损失函数, LTI是学习物 品在目标域上的嵌入表征的损失函数, LMLP是实现用户的嵌入表征从辅助域到目标域跨域 迁移的损失函数。 6.根据权利要求5所述的基于评论共性信 息嵌入和迁移的跨域推荐方法, 其特征在于, 损失LGU和LGI, 具体如下: 在式(2)中, LGU分为四部分: ①为辅助域用户评论向量的重构损失, 为辅助域用户的 评论向量, 为 重构的向量; ②为目标域用户评论向量的重构损失, 为目标域用户 的评论向量, 为 重构的向量; ③为辅助域用户评论向量 的隐空间分布与标准正态 分布的KL散度, 为辅助域用户评论向量 的均值和方差; ④为目标域用户评论 向量 的隐空间分布与标准正态分布 的KL散度, 为目标域用户评论向量 的 均值和方差; 在式(3)中, LGI分为四部分: 第一部分为辅助域物品评论向量的重构损失, 为辅助域 物品的评论向量, 为 重构的向量; 第二部分为目标域物品评论向量的重构损失, 为目标域物品的评 论向量, 为 重构的向量; 第三部分为辅助域物品评 论向量 的隐 空间分布与标准正态分布的KL散度, 为辅助域物品评论向量 的均值和方差; 第 四部分为目标域物品评论向量 的隐空间分布与标准正态分布的KL散度, 为目 标域物品评论向量 的均值和方差 。权 利 要 求 书 2/3 页 3 CN 114254203 A 3
专利 基于评论共性信息嵌入和迁移的跨域推荐方法及系统
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 23:17:14
上传分享
举报
下载
原文档
(1.1 MB)
分享
友情链接
tc260 人工智能安全标准化白皮书 2019.pdf
GB-Z 10096-2022 齿条精度.pdf
SN-T 3005-2011 有机化学品中碳、氢、氮、硫含量的元素分析仪测定方法.pdf
中山市市容和环境卫生管理条例.pdf
GB-T 41925-2022 城市地下空间与地下工程分类.pdf
GB-T 6414-2017 铸件 尺寸公差、几何公差与机械加工余量.pdf
GB-T 5462-2015 工业盐.pdf
LY-T 3160-2019 单板干燥机节能监测方法.pdf
DB34-T 3704-2020 公路工程路基动态回弹模量现场测试规程 安徽省.pdf
YD-T 3751-2020 车联网信息服务数据安全技术要求.pdf
GB-T 23402-2009 地理标志产品 增城丝苗米.pdf
GB-T 8567-2006 计算机软件文档编制规范.pdf
GB-T 34120-2017 电化学储能系统储能变流器技术规范.pdf
DB42-T 2226.2-2024 自然资源政务一张图应用规范 第2部分:应用服务 湖北省.pdf
GB-T 42277-2022 水泥胶砂碳化性试验方法.pdf
ISO IEC 2382-37 022 Information technology — Vocabulary — Part 37 Biometrics.pdf
GB-T 20530-2006 文献档案资料数字化工作导则.pdf
GB 7260.4-2008 不间断电源设备(UPS)第1-2部分 一般规定和安全要求.pdf
GB-T 20257.3-2017 国家基本比例尺地图图式 第3部分:125 000 150 000 1100 000地形图图式.pdf
GW0102-2014 国家电子政务外网 信息安全标准化规范性要求.pdf
1
/
3
18
评价文档
赞助2.5元 点击下载(1.1 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。