说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111628245.5 (22)申请日 2021.12.28 (71)申请人 北京三快在线科技有限公司 地址 100080 北京市海淀区北四环西路9号 2106-030 (72)发明人 王海涛 张锦 董健 王永康  王兴星  (74)专利代理 机构 北京曼威知识产权代理有限 公司 11709 代理人 邓超 (51)Int.Cl. G06F 16/9535(2019.01) G06N 20/00(2019.01) (54)发明名称 一种模型训练的方法、 信息推荐的方法以及 装置 (57)摘要 本说明书公开了一种模 型训练的方法、 信息 推荐的方法以及装置, 获取历史训练样本以及新 增训练样本。 其次, 针对每个历史训练样本, 将该 历史训练样 本输入到预设的历史推荐模型中, 确 定第一点击率, 将该历史训练样 本输入到推荐模 型中, 确定第二点击率, 以及将新增训练样本输 入到推荐模 型中, 确定新增训练样 本对应的新增 点击率。 最后, 以最小化第一点击率与第二点击 率之间的偏 差, 以及新增点击率与新增训练样本 对应的标签 之间的偏差为优化目标, 对推荐模型 进行训练。 本方法可以避免推荐模 型失去早期的 历史训练样 本对推荐模型的训练成果, 并保证推 荐模型在更新过程中可以确定出用户的偏好的 变化, 提高推荐模型确定出的推荐信息的准确 性。 权利要求书3页 说明书14页 附图4页 CN 114297491 A 2022.04.08 CN 114297491 A 1.一种模型训练的方法, 其特 征在于, 包括: 获取历史训练样本以及新增训练样本, 其中, 训练样本中包含有用户特征以及推荐信 息; 针对每个历史训练样本, 将该历史训练样本输入到预设的历史推荐模型中, 确定该历 史训练样本在所述历史推荐模型对应的点击率, 作为第一点击率, 将该历史训练样本输入 到推荐模 型中, 确定该历史训练样本在所述推荐模 型对应的点击率, 作为第二点击率, 以及 将该历史训练样本对应的新增训练样本输入到所述推荐模型中, 确定所述新增训练样本对 应的点击率, 作为 新增点击率; 以最小化所述第 一点击率与 所述第二点击率之间的偏差, 以及所述新增点击率与 所述 新增训练样本对应的标签之间的偏差为优化目标, 对所述推荐模型进行训练。 2.如权利要求1所述的方法, 其特 征在于, 获取历史训练样本, 具体包括: 获取训练样本集, 所述训练样本集中的训练样本包 含有业务对象的对象数据; 针对每个业务对象, 根据所述对象数据, 确定该业务对象对应的训练样本的数量在所 述训练样本集中的占比, 作为该业 务对象对应的占比; 按照各业务对象对应的占比, 从所述训练样本集中选取训练样本, 作为获取到的历史 训练样本 。 3.如权利要求1或2所述的方法, 其特 征在于, 获取历史训练样本, 具体包括: 确定获取到的新增训练样本对应的业 务时段; 从获取到的训练样本集中选取出与 所述业务 时段相匹配的训练样本, 作为获取到的历 史训练样本 。 4.如权利要求1所述的方法, 其特征在于, 针对每个历史训练样本, 将该历史训练样本 输入到预设的历史推荐模型中, 确定该历史训练样本在所述历史推荐模型对应的点击率, 作为第一点击率, 将该历史训练样本输入到推荐模型中, 确定该历史训练样本在所述推荐 模型对应的点击率, 作为第二点击率, 以及将该历史训练样本对应的新增训练样本输入到 所述推荐模型中, 确定所述 新增训练样本对应的点击率, 作为 新增点击率, 具体包括: 针对每个训练样本, 确定该训练样本对应的所述用户特征、 所述推荐信息对应的推荐 信息特征以及环境数据对应的环境特 征; 将所述用户特征、 所述推荐信 息对应的推荐信 息特征以及所述环境数据对应的环境特 征进行合并, 确定该训练样本对应的综合特 征; 针对每个历史训练样本, 将该历史训练样本对应的综合特征输入到预设的历史推荐模 型中, 确定该历史训练样本在所述历史推荐模型对应的点击率, 作为第一点击率, 将该历史 训练样本对应的综合特征输入到推荐模型中, 确定该历史训练样本在所述推荐模型对应的 点击率, 作为第二点击率, 以及将该历史训练样本对应的新增训练样本的综合特征输入到 所述推荐模型中, 确定所述 新增训练样本对应的点击率, 作为 新增点击率。 5.如权利要求1所述的方法, 其特征在于, 以最小化所述第 一点击率与 所述第二点击率 之间的偏差, 以及所述新增点击率与所述新增训练样本对应的标签之间的偏差为优化目 标, 对所述推荐模型进行训练, 具体包括: 将所述第一点击率与所述第二点击率之间的偏差, 作为第一偏差, 以及将所述新增点 击率与所述 新增训练样本对应的标签之间的偏差, 作为第二偏差;权 利 要 求 书 1/3 页 2 CN 114297491 A 2根据所述历史训练样本中的历史训练样本的数量与所述新增训练样本中的新增训练 样本的数量, 确定第一偏差对应的权重, 作为第一权重, 其中, 所述新增训练样本中的新增 训练样本的数量相比于所述历史训练样本中的历史训练样本的数量越多, 第一权 重越小; 根据所述第一偏差、 所述第二偏差, 以及所述第一权 重, 对所述推荐模型进行训练。 6.如权利要求1或5所述的方法, 其特征在于, 以最小化所述第一点击率与所述第二点 击率之间的偏差, 以及所述新增点击率与所述新增训练样本对应的标签之 间的偏差为优化 目标, 对所述推荐模型进行训练, 具体包括: 将所述第一点击率与所述第二点击率之间的偏差, 作为第一偏差, 以及将所述新增点 击率与所述 新增训练样本对应的标签之间的偏差, 作为第二偏差; 根据所述历史训练样本中的业务对象的数量与所述新增训练样本中的业务对象的数 量, 确定第一偏差对应的权重, 作为第二权重, 其中, 所述新增训练样本中的业务对 象的数 量相比于所述历史训练样本中的业 务对象的数量越多, 第二权 重越小; 根据所述第一偏差、 所述第二偏差、 所述第一权重, 以及所述第二权重, 对所述推荐模 型进行训练。 7.一种信息推荐的方法, 其特 征在于, 包括: 响应于目标用户的信息推荐请求, 获取 所述目标用户的用户特 征; 针对每个候选推荐信 息, 将所述用户特征以及该候选推荐信 息输入到预先训练 的推荐 模型中, 预测所述 目标用户针对该候选推荐信息的点击率, 作为该候选推荐信息对应的点 击率, 所述推荐模型 是通过上述权利要求1~6任一项所述的方法训练得到的; 根据各候选推荐信息对应的点击率, 确定向所述目标用户进行推荐的推荐商户, 作为 目标推荐信息, 并将所述目标推荐信息推荐给 所述目标用户。 8.一种模型训练的装置, 其特 征在于, 包括: 获取模块, 用于获取历史训练样本以及新增训练样本, 其中, 训练样本中包含有用户特 征以及推荐信息; 确定模块, 用于针对每个历史训练样本, 将该历史训练样本输入到预设的历史推荐模 型中, 确定该历史训练样本在所述历史推荐模型对应的点击率, 作为第一点击率, 将该历史 训练样本输入到推荐模型中, 确定该历史训练样本在所述推荐模型对应的点击率, 作为第 二点击率, 以及将该历史训练样本对应的新增训练样本输入到所述推荐模型中, 确定所述 新增训练样本对应的点击率, 作为 新增点击率; 训练模块, 用于以最小化所述第一点击率与所述第二点击率之间的偏差, 以及所述新 增点击率与所述新增训练样本对应的标签之间的偏差为优化目标, 对所述推荐模型进 行训 练。 9.一种信息推荐的装置, 其特 征在于, 包括: 获取模块, 用于响应于目标用户的信息推荐请求, 获取 所述目标用户的用户特 征; 预测模块, 用于针对每个候选推荐信息, 将所述用户特征以及该候选推荐信息输入到 预先训练的推荐模型中, 预测所述 目标用户针对该候选推荐信息的点击率, 作为该候选推 荐信息对应的点击率, 所述推荐模型是通过上述权利要求 1~6任一项 所述的方法训练得到 的; 推荐模块, 用于根据各候选推荐信息对应的点击率, 确定向所述目标用户进行推荐的权 利 要 求 书 2/3 页 3 CN 114297491 A 3

.PDF文档 专利 一种模型训练的方法、信息推荐的方法以及装置

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种模型训练的方法、信息推荐的方法以及装置 第 1 页 专利 一种模型训练的方法、信息推荐的方法以及装置 第 2 页 专利 一种模型训练的方法、信息推荐的方法以及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:15:27上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。