说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111571317.7 (22)申请日 2021.12.21 (71)申请人 北京达佳互联信息技 术有限公司 地址 100085 北京市海淀区上地西路6号1 幢1层101D1-7 (72)发明人 王龙甫 方美玲  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 贾允 (51)Int.Cl. G06F 16/9035(2019.01) G06F 16/906(2019.01) G06N 20/00(2019.01) (54)发明名称 推荐模型训练方法、 对象推荐方法、 装置及 存储介质 (57)摘要 本公开关于一种推荐模 型训练方法、 对象推 荐方法、 装置及存储介质。 该方法包括: 获取多个 第一样本训练数据、 多个第二样 本训练数据以及 对应的标签信息, 多个第二样 本训练数据是基于 多个第一样 本训练数据与 样本交互信息得到的; 将多个第一样本训练数据输入第一模 型, 得到第 一预测结果; 将多个第二样本训练数据输入第二 模型, 得到第二预测结果; 第二模型为预先训练 的、 满足预设收敛条件的预设机器学习模型; 基 于第一预测结果、 第二预测结果和标签信息, 训 练第一模型和第二模型, 直至第一模 型满足预设 条件, 将满足预设条件的第一模 型作为目标推荐 模型。 本公开提供的技术方案可以提升目标推荐 模型的精度。 权利要求书3页 说明书14页 附图5页 CN 114461871 A 2022.05.10 CN 114461871 A 1.一种推荐模型训练方法, 其特 征在于, 包括: 获取多个第一样本训练数据、 多个第二样本训练数据以及对应的标签信息, 所述多个 第一样本训练数据是基于多个样本用户账号的样本用户关联信息和多个样本对 象各自的 样本对象关联信息得到的, 所述多个第二样本训练数据是基于所述多个第一样本训练数据 与样本交互信息得到的, 所述样本交互信息为所述多个样本用户账号与所述多个样本对象 的样本交 互信息; 将所述多个第一样本训练数据输入第一模型, 得到第一预测结果; 将所述多个第二样本训练数据输入第二模型, 得到第二预测结果; 所述第二模型为预 先训练的、 满足预设收敛 条件的预设机器学习模型; 基于所述第一预测结果、 所述第二预测结果和所述标签信息, 训练所述第一模型和所 述第二模型, 直至第一模型满足预设条件, 将满足预设条件的第一模型作为目标推荐模型。 2.根据权利要求1所述的方法, 其特征在于, 所述获取多个第一样本训练数据、 多个第 二样本训练数据, 包括: 获取多个样本用户账号各自的样本用户关联信 息、 多个样本对象各自的样本对象关联 信息、 以及所述多个样本用户账号与所述多个样本对 象的样本交互信息; 所述样本用户关 联信息是基于所述样本用户账号的样本用户属性信息和样本历史行为信息得到的; 将多个样本用户关联信 息与多个样本对象关联信 息进行组合处理, 得到所述多个第 一 样本训练数据; 基于所述多个第一样本训练数据以及对应的样本交 互信息, 得到第二样本训练数据。 3.根据权利要求1所述的方法, 其特征在于, 所述基于所述第一预测结果、 所述第二预 测结果和所述标签信息, 训练所述第一模型和所述第二模型, 直至第一模型满足预设条件, 将满足预设条件的第一模型作为目标推荐模型, 包括: 根据所述第一预测结果和所述标签信息, 确定第一损失信息; 根据所述第一预测结果和所述第二预测结果, 确定第二损失信息; 根据所述第二预测结果和所述标签信息, 确定第三损失信息; 利用所述第 一损失信 息和所述第 二损失信 息训练所述第 一模型, 并利用所述第 三损失 信息训练所述第二模型以更新第二模型, 直至第一模型满足预设条件, 将满足所述预设条 件的第一模型作为目标推荐模型。 4.根据权利要求2所述的方法, 其特征在于, 所述获取多个样本用户账号各自的样本用 户关联信息, 包括: 获取所述样本用户账号的样本用户基础属性信 息、 关联设备信 息、 关联网络环境信 息、 所述样本用户账号关联的第一样本账号信息、 所述样本用户账号与历史交互对象的历史操 作信息; 其中, 所述历史 交互对象为所述样本用户账号执 行过预设操作的对象; 根据所述样本用户基础属性信 息、 所述关联设备信 息和所述关联网络环境信 息中的至 少一种, 获取 所述样本用户账号的样本用户属性信息; 基于所述第 一样本账号信 息和所述历史操作信 息, 获取所述多个样本用户账号各自的 样本历史行为信息; 基于所述样本属性信 息和所述样本历史行为信 息, 获取所述多个样本用户账号各自的 样本用户关联信息 。权 利 要 求 书 1/3 页 2 CN 114461871 A 25.一种对象推荐方法, 其特 征在于, 包括: 接收目标用户账号的推荐请求, 获取所述目标用户账号的目标用户关联信息、 以及待 推荐的多个对象; 确定所述多个对象各自的目标对象关联信息; 将所述目标用户关联信 息和所述目标对象关联信 息输入目标推荐模型, 进行推荐预测 处理, 得到推荐 预测结果; 其中, 所述目标推荐模 型是基于权利要求 1至4中任一项 所述的推 荐模型训练方法得到的; 基于所述推荐预测结果, 从所述多个对象中确定向所述目标用户账号推荐的目标对 象。 6.一种推荐模型训练装置, 其特 征在于, 包括: 第一获取模块, 被配置为执行获取多个第一样本训练数据、 多个第二样本训练数据以 及对应的标签信息, 所述多个第一样本训练数据是基于多个样本用户账号的样本用户关联 信息和多个样本对象各自的样本对象关联信息得到的, 所述多个第二样本训练数据是基于 所述多个第一样本训练数据与样本交互信息得到的, 所述样本交互信息为所述多个样本用 户账号与所述多个样本对象的样本交 互信息; 第一预测模块, 被配置为执行将所述多个第一样本训练数据输入第一模型, 得到第一 预测结果; 第二预测模块, 被配置为执行将所述多个第二样本训练数据输入第二模型, 得到第二 预测结果; 所述第二模型为预 先训练的、 满足预设收敛 条件的预设机器学习模型; 训练模块, 被配置为执行基于所述第 一预测结果、 所述第 二预测结果和所述标签信 息, 训练所述第一模型和所述第二模型, 直至第一模型满足预设条件, 将满足预设条件的第一 模型作为目标推荐模型。 7.一种对象推荐装置, 其特 征在于, 包括: 第二获取模块, 被配置为执行接收目标用户账号的推荐请求, 获取所述目标用户账号 的目标用户关联信息、 以及待推荐的多个对象; 目标对象关联信 息确定模块, 被配置为执行确定所述多个对象各自的目标对象关联信 息; 推荐预测模块, 被配置为执行将所述目标用户关联信 息和所述目标对象关联信 息输入 目标推荐模型, 进行推荐预测处理, 得到推荐预测结果; 其中, 所述目标推荐模型为权利要 求6所述的目标推荐模型; 推荐模块, 被配置为执行基于所述推荐预测结果, 从所述多个对象中确定向所述目标 用户账号推荐的目标对象。 8.一种电子设备, 其特 征在于, 包括: 处理器; 用于存储所述处 理器可执行指令的存 储器; 其中, 所述处理器被配置为执行所述指令, 以实现如权利要求1至4中任一项所述的推 荐模型训练方法或实现如权利要求5所述的对象推荐方法。 9.一种计算机可读存储介质, 其特征在于, 当所述计算机可读存储介质中的指令由电 子设备的处理器执行时, 使得所述电子 设备能够执行如权利要求 1至4中任一项 所述的推荐权 利 要 求 书 2/3 页 3 CN 114461871 A 3

.PDF文档 专利 推荐模型训练方法、对象推荐方法、装置及存储介质

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 推荐模型训练方法、对象推荐方法、装置及存储介质 第 1 页 专利 推荐模型训练方法、对象推荐方法、装置及存储介质 第 2 页 专利 推荐模型训练方法、对象推荐方法、装置及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:17:34上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。