说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111620425.9 (22)申请日 2021.12.27 (71)申请人 西安交通大 学 地址 710049 陕西省西安市咸宁西路28号 (72)发明人 沈超 张笑宇 蔺琛皓  (74)专利代理 机构 西安通大专利代理有限责任 公司 6120 0 代理人 李鹏威 (51)Int.Cl. G06N 20/00(2019.01) (54)发明名称 机器学习模型修复方法、 系统、 计算机设备 及存储介质 (57)摘要 本发明属于机器学习领域, 公开了一种机器 学习模型修复方法、 系统、 计算机设备及存储介 质, 包括: S1: 获取待训练的机器 学习模型; S2: 通 过预设的训练集训练机器学习模 型, 并获取训练 过程中机器学习模型的预设监控指标数据; S3: 根据获取的预设监控指标数据, 判断机器学习模 型是否存在训练问题; S4: 当机器学习模型不存 在训练问题时, 输出当前机器学习模 型并结束修 复; S5: 当机器学习模型存在训练问题时, 依次选 取预设的训练问题修复策略集合中的训练问题 修复策略, 并且每选取一训练问题 修复策略均进 行修复步骤: 根据选取的训练问题 修复策略修复 机器学习模型, 并重复S2~S4。 该方法工作效率 高, 复杂度低, 可以有效检测并修复训练问题, 减 少人工成本 。 权利要求书2页 说明书8页 附图4页 CN 114254763 A 2022.03.29 CN 114254763 A 1.一种机器学习模型修复方法, 其特 征在于, 包括以下步骤: S1: 获取待训练的机器学习模型; S2: 通过预设的训练集训练机器学习模型, 并获取训练过程中机器学习模型的预设监 控指标数据; S3: 根据获取的预设监控指标 数据, 判断机器学习模型 是否存在训练问题; S4: 当机器学习模型不存在训练问题时, 输出当前机器学习模型并结束修复; S5: 当机器学习模型存在训练问题时, 依次选取预设的训练问题修复策略集合中的训 练问题修复策略, 并且每选取一训练问题修复策略均进行修复步骤: 根据选取 的训练问题 修复策略修复机器学习模型, 并重复S2 ~S4。 2.根据权利要求1所述的机器学习模型修复方法, 其特征在于, 所述待训练的机器学习 模型为文本分类机器学习模型、 图像分类机器学习模型或音频识别机器学习模型。 3.根据权利要求1所述的机器学习模型修复方法, 其特征在于, 所述预设监控指标包 括、 准确率、 模型梯度和模型权 重。 4.根据权利要求3所述的机器学习模型修复方法, 其特征在于, 所述训练问题包括梯度 爆炸问题、 梯度消失问题、 死亡ReLU问题、 不稳定收敛问题以及缓慢收敛问题; 所述根据 获 取的预设监控指标 数据, 判断机器学习模型 是否存在训练问题的具体方法为: 当机器学习模型的输入层的模型梯度与输出层的模型梯度的比值超过第 一预设阈值, 且机器学习模型 的准确率低于预设准确 率阈值时, 或者, 机器学习模型 的模型梯度或模型 权重中存在NaN数值时, 机器学习模型存在训练问题且为梯度爆炸问题; 当机器学习模型的输入层的模型梯度与输出层的模型梯度的比值超过第 二预设阈值, 且输入层的模型梯度小于第三预设阈值时, 机器学习模型存在训练问题且为梯度消失问 题; 当机器学习模型的模型梯度中包含超过预设比例的零值, 且激活函数为ReLU激活函 数, 且机器学习模型 的准确率低于预设准确 率阈值时, 机器学习模型存在训练问题且为死 亡ReLU问题; 当机器学习模型的准确率的抖动幅度超过预设抖动幅度阈值, 且持续超过预设数量的 训练次数时, 机器学习模型存在训练问题且为 不稳定收敛问题; 当机器学习模型的准确率低于预设准确率阈值, 且相邻 两次训练 的最大改进未超过第 四预设阈值时, 机器学习模型存在训练问题且为缓慢收敛问题。 5.根据权利要求4所述的机器学习模型修复方法, 其特征在于, 所述第一预设阈值为 70, 第二预设阈值为为1e‑3, 第三预设阈值为为1e‑4, 第四预设阈值为0.01, 预设抖动幅度阈 值为0.03, 预设数量的训练次数为总训练次数的20%。 6.根据权利要求1所述的机器学习模型修复方法, 其特征在于, 所述训练问题修复策略 包括加入批量正则化层、 修改机器学习模型激活函数、 裁剪机器学习模型梯度、 修改机器学 习模型初始化器、 调整机器学习模型修复批量大小、 调整机器学习模型修复优化器学习率 以及替换机器学习模型修复优化器。 7.根据权利要求1所述的机器学习模型修复方法, 其特征在于, 所述S5还包括: 当训练 问题修复策略集合中的训练问题修复策略均被选取时, 输出当前的机器学习模型以及机器 学习模型的训练问题。权 利 要 求 书 1/2 页 2 CN 114254763 A 28.一种机器学习模型修复系统, 其特 征在于, 包括: 模型获取模块, 用于获取待训练的机器学习模型; 指标获取模块, 用于通过预设的训练集训练机器学习模型, 并获取训练过程中机器学 习模型的预设监控指标 数据; 训练问题确认模块, 用于根据获取的预设监控指标数据, 判断机器学习模型是否存在 训练问题; 修复模块, 用于当机器学习模型存在训练问题时, 依次选取预设的训练问题修复策略 集合中的训练问题修复策略, 并且每选取一训练问题修复策略均进行修复步骤: 根据选取 的训练问题修复策略修复机器学习模型, 并触发指标获取模块和训练问题确认模块; 输出模块, 用于当机器学习模型不存在训练问题时, 输出当前机器学习模型并结束修 复。 9.一种计算机设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器 上运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求 1至 7任一项所述机器学习模型修复方法的步骤。 10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在 于, 所述计算机程序被处理器执行时实现如权利要求 1至7任一项 所述机器学习模型修复方 法的步骤。权 利 要 求 书 2/2 页 3 CN 114254763 A 3

.PDF文档 专利 机器学习模型修复方法、系统、计算机设备及存储介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 机器学习模型修复方法、系统、计算机设备及存储介质 第 1 页 专利 机器学习模型修复方法、系统、计算机设备及存储介质 第 2 页 专利 机器学习模型修复方法、系统、计算机设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:17:43上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。