(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111629884.3
(22)申请日 2021.12.28
(71)申请人 中国电信股份有限公司
地址 100033 北京市西城区金融街31号
(72)发明人 胡圣凯 徐喆 王振东 娄鉴
(74)专利代理 机构 北京同达信恒知识产权代理
有限公司 1 1291
代理人 刘亚威
(51)Int.Cl.
G06N 20/00(2019.01)
G06Q 30/02(2012.01)
(54)发明名称
一种用户行为预测方法及设备
(57)摘要
本发明公开了一种用户行为预测方法及设
备, 用于筛选出第一特征集合后, 基于第一特征
集合对应数据序列, 利用M种机器学习模型进行
预测, 有效地提高预测结果的准确性。 该方法包
括: 从历史时段内目标用户的数据集中, 筛选出
第一特征集合对应的数据序列, 其中, 所述第一
特征集合表征在执行行为预测时贡献度大于或
等于第一阈值的特征组成的集合; 将所述数据序
列分别输入到训练好的M种机器学习模型, 输出
所述数据序列对应的M种预测结果; 根据所述数
据序列的M种预测结果构建稀疏矩阵, 将所述稀
疏矩阵输入到训练好的分类模型, 输出所述数据
序列的最优 预测结果; 根据所述数据序列的最优
预测结果, 预测所述目标用户的行为。
权利要求书2页 说明书17页 附图3页
CN 114386618 A
2022.04.22
CN 114386618 A
1.一种用户行为预测方法, 其特 征在于, 该 方法包括:
从历史时段内目标用户的数据集中, 筛选出第 一特征集合对应的数据序列, 其中, 所述
第一特征集合表征在执 行行为预测时贡献度大于或等于第一阈值的特 征组成的集 合;
将所述数据序列分别输入到训练好的M种机器学习模型, 输出所述数据序列对应的M种
预测结果, 其中M为 正整数且为奇数;
根据所述数据序列的M种预测结果构建稀疏矩阵, 将所述稀疏矩阵输入到训练好的分
类模型, 输出 所述数据 序列的最优预测结果;
根据所述数据 序列的最优预测结果, 预测所述目标用户的行为。
2.根据权利要求1所述的方法, 其特 征在于, 通过如下 方式确定所述第一阈值:
从样本数据集中, 确定与预设的各个备选特征分别对应的特征数据向量, 以及所述样
本数据集对应的标签向量, 其中标签向量中的标签是根据所述样本数据集中的样本数据的
标注标签确定的;
根据各个特 征数据向量和所述标签向量的相关度, 确定所述第一阈值。
3.根据权利要求1所述的方法, 其特 征在于, 通过如下 方式确定所述第一特 征集合:
针对每种机器学习模型 执行如下过程:
将样本数据集作为输入, 将输出结果与 所述样本数据集对应的标签向量之间的相似度
作为优化条件, 对所述机器学习模型 的初始模型进行训练; 训练完成后得到各个备选特征
与所述样本数据集中的标注标签的相关度, 根据大于或等于第一阈值的所述相关度对应的
备选特征确定第二特 征集合;
根据M种机器学习模型分别确定的第二特 征集合, 确定第一特 征集合。
4.根据权利要求3所述的方法, 其特征在于, 所述根据M种机器学习模型分别确定的第
二特征集合, 确定第一特 征集合, 包括:
将M种第二特 征集合去除重复的备选特 征后合并, 得到合并集 合;
根据合并集合中各个备选特征在M种第二特征集合中出现的概率, 从所述合并集合中
筛选出M‑1种第三特 征集合;
根据M‑1种第三特 征集合, 确定第一特 征集合。
5.根据权利要求4所述的方法, 其特征在于, 所述根据合并集合中各个备选特征在M种
第二特征集合中出现的概 率, 从所述 合并集合中筛选出M‑1种第三特 征集合, 包括:
预先设定M‑1种第二阈值, 基于每种第二阈值对所述 合并集合执行如下步骤:
从合并集合中筛选出概率值大于或等于所述第 二阈值的备选特征, 根据筛选出的备选
特征确定与所述第二阈值对应的第三特 征集合;
将M‑1种第二阈值分别对应的第三特 征集合, 确定为所述M ‑1种第三特 征集合。
6.根据权利要求4所述的方法, 其特征在于, 所述根据M ‑1种第三特征集合, 确定第一特
征集合, 包括:
针对每种第 三特征集合执行如下步骤: 从所述样本数据集中筛选出所述第 三特征集合
对应的样本数据序列, 将所述样本数据序列作为M种机器学习模型 的训练样本, 获取M种机
器学习模型在训练完成后得到的模型参数与模型评价值的关系曲线; 根据M种关系曲线中
的最优模型评价 值, 确定所述第三特 征集合的贡献度;
根据M‑1种第三特 征集合的贡献度, 从M ‑1种第三特 征集合中确定第一特 征集合。权 利 要 求 书 1/2 页
2
CN 114386618 A
27.根据权利要求6所述的方法, 其特征在于, 所述根据M种关系曲线中的最优模型评价
值, 确定所述第三特 征集合的贡献度, 包括:
将M种最优 模型评价 值中的最大值, 确定为所述第三特 征集合的贡献度; 或,
将M种最优 模型评价 值的平均值, 确定为所述第三特 征集合的贡献度; 或,
将M种最优模型评价值去 除最大值和最小值后的平均值, 确定为所述第三特征集合的
贡献度。
8.根据权利要求6所述的方法, 其特征在于, 针对每种机器学习模型, 通过如下方式获
取所述模型参数与模型评价 值的关系曲线, 包括:
将所述样本数据序列作为输入, 将输出结果与 所述样本数据序列对应的标注标签之间
的相似度作为优化条件, 对所述机器学习模型的初始模型进行训练;
训练完成后得到所述机器学习模型的模型参数与模型评价 值的关系曲线。
9.根据权利要求1~8任一所述的方法, 其特征在于, 所述确定第一特征集合之后, 通过
如下方式确定所述训练好的机器学习模型:
从样本数据集中, 确定所述第一特 征集合对应的第一数据 序列;
将所述第 一数据序列作为M种机器学习模型的训练样本, 获取M种机器学习模型在训练
完成后得到的模型参数与模型评价 值的关系曲线;
将M种关系曲线中与最优模型评价值对应的模型参数, 作为所述关系曲线对应的机器
学习模型的模型参数, 将具有 所述模型参数的所述机器学习模型确定为训练好的机器学习
模型。
10.根据权利要求1~8任一所述的方法, 其特征在于, 所述确定第一特征集合之后, 通
过如下方式对所述分类模型进行训练:
从样本数据集中, 确定所述第一特 征集合对应的第一数据 序列;
将所述第一数据序列输入到训练好的M种机器学习模型, 输出所述第一数据序列对应
的M种第一预测结果;
根据所述M种第 一预测结果构建第 一稀疏矩阵, 将所述第 一稀疏矩阵作为输入, 将输出
结果与所述第一数据序列对应的标注标签的相似度作为优化条件, 对所述分类模型的初始
模型进行训练, 其中所述分类模型包括阶跃函数模型。
11.根据权利要求1~8任一所述的方法, 其特 征在于, 所述M为大于或等于 3的奇数。
12.一种用户行为预测设备, 其特征在于, 该设备包括处理器和存储器, 所述存储器用
于存储所述处理器可执行的程序, 所述处理器用于读取所述存储器中的程序并执行权利要
求1~11任一所述方法的步骤。
13.一种计算机存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器执行
时实现如权利要求1~1 1任一所述方法的步骤。权 利 要 求 书 2/2 页
3
CN 114386618 A
3
专利 一种用户行为预测方法及设备
文档预览
中文文档
23 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 23:15:39上传分享