说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111609146.2 (22)申请日 2021.12.27 (71)申请人 中国工商银行股份有限公司 地址 100140 北京市西城区复兴门内大街 55号 (72)发明人 李策 邬子庄 赵心睿 徐晨灿  (74)专利代理 机构 华进联合专利商标代理有限 公司 44224 代理人 黄恕 (51)Int.Cl. G06N 20/00(2019.01) G06K 9/62(2022.01) (54)发明名称 可解释性机器学习模 型构建方法、 装置和计 算机设备 (57)摘要 本申请涉及一种可解释性机器学习模型构 建方法、 装置、 计算机设备、 存储介质和计算机程 序产品, 可用于金融领域、 人工智能领域或其他 领域。 所述方法包括: 通过获取业务场景的样本 数据, 根据训练集对初始第一机器学习模型进行 训练, 得到业务场景的第一机器学习模型, 根据 测试集对业务场景的第一机器学习模型进行测 试, 得到预测结果, 根据预测结果, 对训练集进行 分组, 获得分组后的训练集, 根据分组后的训练 集分别对多个初始第二机器学习模 型进行训练, 得到业务场景的多个第二机器学习模 型, 归集业 务场景的多个第二机器学习模型, 得到业务场景 的可解释性机器学习模型组, 基于该业务场景的 可解释性机器学习模型组, 能够支持得到良好的 可解释性结果。 权利要求书2页 说明书13页 附图7页 CN 114254762 A 2022.03.29 CN 114254762 A 1.一种可解释性机器学习模型构建方法, 其特 征在于, 所述方法包括: 获取业务场景的样本数据, 所述样本数据包括训练集和 测试集; 根据所述训练集对初始第 一机器学习 模型进行训练, 得到所述业务场景的第 一机器学 习模型, 所述初始第一机器学习模型为精度导向的机器学习模型; 根据所述测试集对所述 业务场景的第一机器学习模型进行测试, 得到预测结果; 根据所述预测结果, 对所述训练集进行分组, 获得分组后的训练集; 根据所述分组后的训练集分别对多个初始第 二机器学习 模型进行训练, 得到所述业务 场景的多个第二机器学习模型, 所述初始第二机器学习模型为可解释性导向的机器学习模 型; 归集所述业务场景的多个第 二机器学习模型, 得到所述业务场景的可解释性机器学习 模型组。 2.根据权利要求1所述的可解释性机器学习 模型构建方法, 其特征在于, 根据 所述预测 结果, 对所述训练集进行分组, 获得分组后的训练集包括: 将所述预测结果进行排序, 结合预设的组间距离, 获得 所述训练集的预分组; 根据所述预分组, 获得每 个所述预分组的样本数据个数; 根据所述预分组和所述每个预分组的样本数据个数, 通过集中分组, 获得分组后的训 练集。 3.根据权利要求2所述的可解释性机器学习 模型构建方法, 其特征在于, 根据 所述预分 组和所述每 个预分组的样本数据个数, 通过集中分组, 获得分组后的训练集包括: 若所述预分组 的样本数据个数小于预设比例的相邻预分组 的样本个数, 则将所述预分 组的样本数据与对应的所述相邻预分组的样本数据进行合并; 若所述预分组 的样本数据个数大于等于预设比例的相邻预分组 的样本个数, 则根据 所 述预分组的样本数据, 获得分组后的训练集。 4.根据权利要求1所述的可解释性机器学习 模型构建方法, 其特征在于, 归集所述业务 场景的多个第二机器学习模型, 得到所述业务场景 的可解释性机器学习模型组, 之后还包 括: 对所述业务场景的可解释性机器学习 模型组进行解释, 获得所述业务场景的可解释性 机器学习模型组的解释结果。 5.根据权利要求1所述的可解释性机器学习 模型构建方法, 其特征在于, 所述方法还包 括: 获取待测业 务场景的样本数据; 通过所述业务场景的第 一机器学习 模型对所述待测业务场景的样本数据进行预测, 获 得所述待测业 务场景的第一预测结果; 根据所述待测业务场景的第 一预测结果和所述可解释性机器学习 模型组, 获得所述待 测业务场景的第二预测结果。 6.根据权利要求5所述的可解释性机器学习 模型构建方法, 其特征在于, 根据 所述待测 业务场景的第一预测结果和所述可解释性机器学习模型组, 获得所述待测业务场景的第二 预测结果包括: 根据所述分组后的训练集, 获得分组 空间;权 利 要 求 书 1/2 页 2 CN 114254762 A 2确定所述第一预测结果对应的分组 空间, 得到目标分组 空间; 根据可解释性机器学习 模型组, 选定与 所述目标分组空间对应的所述第 二机器学习 模 型; 通过选定的所述第二机器学习模型, 对所述待测业务场景的样本数据进行预测, 获得 所述待测业 务场景的第二预测结果。 7.一种可解释性机器学习模型构建装置, 其特 征在于, 所述装置包括: 数据获取模块, 用于获取业 务场景的样本数据, 所述样本数据包括训练集和 测试集; 第一机器学习模型获取模块, 用于根据所述训练集对初始第一机器学习模型进行训 练, 得到所述业务场景 的第一机器学习模型, 所述初始第一机器学习模型为精度导向的机 器学习模型; 预测结果获取模块, 用于根据 所述测试集对所述业务场景的第 一机器学习模型进行测 试, 得到预测结果; 训练集分组模块, 用于根据 所述预测结果, 对所述训练集进行分组, 获得分组后的训练 集; 第二机器学习 模型获取模块, 用于根据所述分组后的训练集分别对多个初始第 二机器 学习模型进行训练, 得到所述业务场景 的多个第二机器学习模型, 所述初始第二机器学习 模型为可解释性 导向的机器学习模型; 第二机器学习模型归集模块, 用于归集所述业务场景的多个第二机器学习模型, 得到 所述业务场景的可解释性机器学习模型组。 8.一种计算机设备, 包括存储器和处理器, 所述存储器存储有计算机程序, 其特征在 于, 所述处 理器执行所述计算机程序时实现权利要求1至 6中任一项所述的方法的步骤。 9.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被 处理器执行时实现权利要求1至 6中任一项所述的方法的步骤。 10.一种计算机程序产品, 包括计算机程序, 其特征在于, 该计算机程序被处理器执行 时实现权利要求1至 6中任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 114254762 A 3

.PDF文档 专利 可解释性机器学习模型构建方法、装置和计算机设备

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 可解释性机器学习模型构建方法、装置和计算机设备 第 1 页 专利 可解释性机器学习模型构建方法、装置和计算机设备 第 2 页 专利 可解释性机器学习模型构建方法、装置和计算机设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:16:29上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。