说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111571234.8 (22)申请日 2021.12.21 (71)申请人 同盾科技有限公司 地址 310012 浙江省杭州市余杭区五常街 道文一西路9 98号18幢209室 (72)发明人 宋万鹏  (74)专利代理 机构 北京律智知识产权代理有限 公司 11438 代理人 孙宝海 阚梓瑄 (51)Int.Cl. G06N 20/00(2019.01) (54)发明名称 特征筛选方法、 装置、 电子设备及存 储介质 (57)摘要 本申请提供了一种特征筛选方法、 装置、 电 子设备及存储介质, 所述方法包括: 获取候选特 征在建模样 本上的第一稳定性指标; 获取所述候 选特征在非建模样本上的第二稳定性指标, 其 中, 所述非建模样本的采样时间位于所述建模样 本的采样时间之后; 基于所述第一稳定性指标以 及所述第二稳定性指标, 获取所述候选特征在综 合样本上的综合稳定性指标, 其中, 所述综合样 本包含所述 建模样本以及所述非建模样本; 基于 所述综合稳定性指标, 对所述候选特征进行筛 选, 得到用于建模的目标特征。 本申请有利于保 证所建模型在上线调用时的稳定性。 权利要求书2页 说明书11页 附图2页 CN 114239856 A 2022.03.25 CN 114239856 A 1.一种特 征筛选方法, 其特 征在于, 所述方法包括: 获取候选特 征在建模样本上的第一稳定性指标; 获取所述候选特征在非建模样本上的第二稳定性指标, 其中, 所述非建模样本的采样 时间位于所述建模样本的采样时间之后; 基于所述第 一稳定性指标以及所述第 二稳定性指标, 获取所述候选特征在综合样本上 的综合稳定性指标, 其中, 所述综合样本包 含所述建模样本以及所述非建模样本; 基于所述综合稳定性指标, 对所述 候选特征进行筛 选, 得到用于建模的目标 特征。 2.根据权利要求1所述的方法, 其特征在于, 获取候选特征在 建模样本上的第 一稳定性 指标, 包括: 对所述建模样本的采样时间进行区间划分, 得到各第一时间区间; 对所述候选特征在所述建模样本上的特 征值进行区间划分, 得到各第一特 征值区间; 基于各第一 时间区间中各第 一特征值 区间的建模样本数量占比, 获取所述候选特征在 相邻第一时间区间的建模样本上的第一子稳定性指标; 基于所述第一子稳定性指标, 获取 所述第一稳定性指标。 3.根据权利要求2所述的方法, 其特征在于, 基于各第 一时间区间中各第 一特征值区间 的建模样本数量占比, 获取所述候选特征在相 邻第一时间区间的建模样本上的第一子稳定 性指标, 包括: 基于各第一 时间区间中各第 一特征值 区间的建模样本数量占比, 获取相邻第 一时间区 间之间各第一特征值区间的建模样本数量占比之差, 以及相 邻第一时间区间之 间各第一特 征值区间的建模样本数量占比之比; 基于所述建模样本数量占比之差以及所述建模样本数量占比之比, 获取所述第 一子稳 定性指标。 4.根据权利要求2所述的方法, 其特征在于, 基于所述第一子稳定性指标, 获取所述第 一稳定性指标, 包括: 计算所述第一子稳定性指标的平均值, 得到所述第一稳定性指标。 5.根据权利要求1 ‑4任一项所述的方法, 其特征在于, 获取所述候选特征在非建模样本 上的第二稳定性指标, 包括: 对所述非建模样本的采样时间进行区间划分, 得到各第二时间区间; 对所述候选特征在所述非建模样本上的特征值进行区间划分, 得到各第二特征值区 间; 基于各第二 时间区间中各第 二特征值 区间的非建模样本数量占比, 获取所述候选特征 在相邻第二时间区间的非建模样本上的第二子稳定性指标; 基于所述第二子稳定性指标, 获取 所述第二稳定性指标。 6.根据权利要求5所述的方法, 其特征在于, 基于所述第二子稳定性指标, 获取所述第 二稳定性指标, 包括: 计算所述第二子稳定性指标的平均值, 得到所述第二稳定性指标。 7.根据权利要求5所述的方法, 其特征在于, 基于所述第二子稳定性指标, 获取所述第 二稳定性指标, 包括: 获取各相邻第二时间区间的权重, 其中, 所述权重与对应相邻第二时间区间到当前时权 利 要 求 书 1/2 页 2 CN 114239856 A 2刻的距离呈负相关; 基于所述权 重计算所述第二子稳定性指标的加权值, 得到所述第二稳定性指标。 8.根据权利要求5所述的方法, 其特 征在于, 所述方法还 包括: 获取第一时间区间的建模样本的平均样本数量; 从各第二时间区间分别采样得到所述平均样本数量的非建模样本 。 9.一种特 征筛选装置, 其特 征在于, 所述装置包括: 第一获取模块, 配置为获取候选特 征在建模样本上的第一稳定性指标; 第二获取模块, 配置为获取所述候选特征在非建模样本上的第二稳定性指标, 其中, 所 述非建模样本的采样时间位于所述建模样本的采样时间之后; 第三获取模块, 配置为基于所述第一稳定性指标以及所述第二稳定性指标, 获取所述 候选特征在综合样本上 的综合稳定性指标, 其中, 所述综合样本包含所述建模样本以及所 述非建模样本; 筛选模块, 配置为基于所述综合稳定性指标, 对所述候选特征进行筛选, 得到用于建模 的目标特征。 10.一种电子设备, 其特 征在于, 包括: 一个或多个处 理器; 存储装置, 用于存储一个或多个程序, 当所述一个或多个程序被所述一个或多个处理 器执行时, 使得 所述电子设备实现如权利要求1至8任一项所述的方法。 11.一种计算机可读存储介质, 其特征在于, 其上存储有计算机可读指令, 当所述计算 机可读指令被 计算机的处 理器执行时, 使计算机执 行权利要求1 ‑8任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114239856 A 3

.PDF文档 专利 特征筛选方法、装置、电子设备及存储介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 特征筛选方法、装置、电子设备及存储介质 第 1 页 专利 特征筛选方法、装置、电子设备及存储介质 第 2 页 专利 特征筛选方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:17:54上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。