说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111629884.3 (22)申请日 2021.12.28 (71)申请人 中国电信股份有限公司 地址 100033 北京市西城区金融街31号 (72)发明人 胡圣凯 徐喆 王振东 娄鉴  (74)专利代理 机构 北京同达信恒知识产权代理 有限公司 1 1291 代理人 刘亚威 (51)Int.Cl. G06N 20/00(2019.01) G06Q 30/02(2012.01) (54)发明名称 一种用户行为预测方法及设备 (57)摘要 本发明公开了一种用户行为预测方法及设 备, 用于筛选出第一特征集合后, 基于第一特征 集合对应数据序列, 利用M种机器学习模型进行 预测, 有效地提高预测结果的准确性。 该方法包 括: 从历史时段内目标用户的数据集中, 筛选出 第一特征集合对应的数据序列, 其中, 所述第一 特征集合表征在执行行为预测时贡献度大于或 等于第一阈值的特征组成的集合; 将所述数据序 列分别输入到训练好的M种机器学习模型, 输出 所述数据序列对应的M种预测结果; 根据所述数 据序列的M种预测结果构建稀疏矩阵, 将所述稀 疏矩阵输入到训练好的分类模型, 输出所述数据 序列的最优 预测结果; 根据所述数据序列的最优 预测结果, 预测所述目标用户的行为。 权利要求书2页 说明书17页 附图3页 CN 114386618 A 2022.04.22 CN 114386618 A 1.一种用户行为预测方法, 其特 征在于, 该 方法包括: 从历史时段内目标用户的数据集中, 筛选出第 一特征集合对应的数据序列, 其中, 所述 第一特征集合表征在执 行行为预测时贡献度大于或等于第一阈值的特 征组成的集 合; 将所述数据序列分别输入到训练好的M种机器学习模型, 输出所述数据序列对应的M种 预测结果, 其中M为 正整数且为奇数; 根据所述数据序列的M种预测结果构建稀疏矩阵, 将所述稀疏矩阵输入到训练好的分 类模型, 输出 所述数据 序列的最优预测结果; 根据所述数据 序列的最优预测结果, 预测所述目标用户的行为。 2.根据权利要求1所述的方法, 其特 征在于, 通过如下 方式确定所述第一阈值: 从样本数据集中, 确定与预设的各个备选特征分别对应的特征数据向量, 以及所述样 本数据集对应的标签向量, 其中标签向量中的标签是根据所述样本数据集中的样本数据的 标注标签确定的; 根据各个特 征数据向量和所述标签向量的相关度, 确定所述第一阈值。 3.根据权利要求1所述的方法, 其特 征在于, 通过如下 方式确定所述第一特 征集合: 针对每种机器学习模型 执行如下过程: 将样本数据集作为输入, 将输出结果与 所述样本数据集对应的标签向量之间的相似度 作为优化条件, 对所述机器学习模型 的初始模型进行训练; 训练完成后得到各个备选特征 与所述样本数据集中的标注标签的相关度, 根据大于或等于第一阈值的所述相关度对应的 备选特征确定第二特 征集合; 根据M种机器学习模型分别确定的第二特 征集合, 确定第一特 征集合。 4.根据权利要求3所述的方法, 其特征在于, 所述根据M种机器学习模型分别确定的第 二特征集合, 确定第一特 征集合, 包括: 将M种第二特 征集合去除重复的备选特 征后合并, 得到合并集 合; 根据合并集合中各个备选特征在M种第二特征集合中出现的概率, 从所述合并集合中 筛选出M‑1种第三特 征集合; 根据M‑1种第三特 征集合, 确定第一特 征集合。 5.根据权利要求4所述的方法, 其特征在于, 所述根据合并集合中各个备选特征在M种 第二特征集合中出现的概 率, 从所述 合并集合中筛选出M‑1种第三特 征集合, 包括: 预先设定M‑1种第二阈值, 基于每种第二阈值对所述 合并集合执行如下步骤: 从合并集合中筛选出概率值大于或等于所述第 二阈值的备选特征, 根据筛选出的备选 特征确定与所述第二阈值对应的第三特 征集合; 将M‑1种第二阈值分别对应的第三特 征集合, 确定为所述M ‑1种第三特 征集合。 6.根据权利要求4所述的方法, 其特征在于, 所述根据M ‑1种第三特征集合, 确定第一特 征集合, 包括: 针对每种第 三特征集合执行如下步骤: 从所述样本数据集中筛选出所述第 三特征集合 对应的样本数据序列, 将所述样本数据序列作为M种机器学习模型 的训练样本, 获取M种机 器学习模型在训练完成后得到的模型参数与模型评价值的关系曲线; 根据M种关系曲线中 的最优模型评价 值, 确定所述第三特 征集合的贡献度; 根据M‑1种第三特 征集合的贡献度, 从M ‑1种第三特 征集合中确定第一特 征集合。权 利 要 求 书 1/2 页 2 CN 114386618 A 27.根据权利要求6所述的方法, 其特征在于, 所述根据M种关系曲线中的最优模型评价 值, 确定所述第三特 征集合的贡献度, 包括: 将M种最优 模型评价 值中的最大值, 确定为所述第三特 征集合的贡献度; 或, 将M种最优 模型评价 值的平均值, 确定为所述第三特 征集合的贡献度; 或, 将M种最优模型评价值去 除最大值和最小值后的平均值, 确定为所述第三特征集合的 贡献度。 8.根据权利要求6所述的方法, 其特征在于, 针对每种机器学习模型, 通过如下方式获 取所述模型参数与模型评价 值的关系曲线, 包括: 将所述样本数据序列作为输入, 将输出结果与 所述样本数据序列对应的标注标签之间 的相似度作为优化条件, 对所述机器学习模型的初始模型进行训练; 训练完成后得到所述机器学习模型的模型参数与模型评价 值的关系曲线。 9.根据权利要求1~8任一所述的方法, 其特征在于, 所述确定第一特征集合之后, 通过 如下方式确定所述训练好的机器学习模型: 从样本数据集中, 确定所述第一特 征集合对应的第一数据 序列; 将所述第 一数据序列作为M种机器学习模型的训练样本, 获取M种机器学习模型在训练 完成后得到的模型参数与模型评价 值的关系曲线; 将M种关系曲线中与最优模型评价值对应的模型参数, 作为所述关系曲线对应的机器 学习模型的模型参数, 将具有 所述模型参数的所述机器学习模型确定为训练好的机器学习 模型。 10.根据权利要求1~8任一所述的方法, 其特征在于, 所述确定第一特征集合之后, 通 过如下方式对所述分类模型进行训练: 从样本数据集中, 确定所述第一特 征集合对应的第一数据 序列; 将所述第一数据序列输入到训练好的M种机器学习模型, 输出所述第一数据序列对应 的M种第一预测结果; 根据所述M种第 一预测结果构建第 一稀疏矩阵, 将所述第 一稀疏矩阵作为输入, 将输出 结果与所述第一数据序列对应的标注标签的相似度作为优化条件, 对所述分类模型的初始 模型进行训练, 其中所述分类模型包括阶跃函数模型。 11.根据权利要求1~8任一所述的方法, 其特 征在于, 所述M为大于或等于 3的奇数。 12.一种用户行为预测设备, 其特征在于, 该设备包括处理器和存储器, 所述存储器用 于存储所述处理器可执行的程序, 所述处理器用于读取所述存储器中的程序并执行权利要 求1~11任一所述方法的步骤。 13.一种计算机存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器执行 时实现如权利要求1~1 1任一所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114386618 A 3

.PDF文档 专利 一种用户行为预测方法及设备

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种用户行为预测方法及设备 第 1 页 专利 一种用户行为预测方法及设备 第 2 页 专利 一种用户行为预测方法及设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:15:39上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。