说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111620425.9 (22)申请日 2021.12.27 (71)申请人 西安交通大 学 地址 710049 陕西省西安市咸宁西路28号 (72)发明人 沈超 张笑宇 蔺琛皓 (74)专利代理 机构 西安通大专利代理有限责任 公司 6120 0 代理人 李鹏威 (51)Int.Cl. G06N 20/00(2019.01) (54)发明名称 机器学习模型修复方法、 系统、 计算机设备 及存储介质 (57)摘要 本发明属于机器学习领域, 公开了一种机器 学习模型修复方法、 系统、 计算机设备及存储介 质, 包括: S1: 获取待训练的机器 学习模型; S2: 通 过预设的训练集训练机器学习模 型, 并获取训练 过程中机器学习模型的预设监控指标数据; S3: 根据获取的预设监控指标数据, 判断机器学习模 型是否存在训练问题; S4: 当机器学习模型不存 在训练问题时, 输出当前机器学习模 型并结束修 复; S5: 当机器学习模型存在训练问题时, 依次选 取预设的训练问题修复策略集合中的训练问题 修复策略, 并且每选取一训练问题 修复策略均进 行修复步骤: 根据选取的训练问题 修复策略修复 机器学习模型, 并重复S2~S4。 该方法工作效率 高, 复杂度低, 可以有效检测并修复训练问题, 减 少人工成本 。 权利要求书2页 说明书8页 附图4页 CN 114254763 A 2022.03.29 CN 114254763 A 1.一种机器学习模型修复方法, 其特 征在于, 包括以下步骤: S1: 获取待训练的机器学习模型; S2: 通过预设的训练集训练机器学习模型, 并获取训练过程中机器学习模型的预设监 控指标数据; S3: 根据获取的预设监控指标 数据, 判断机器学习模型 是否存在训练问题; S4: 当机器学习模型不存在训练问题时, 输出当前机器学习模型并结束修复; S5: 当机器学习模型存在训练问题时, 依次选取预设的训练问题修复策略集合中的训 练问题修复策略, 并且每选取一训练问题修复策略均进行修复步骤: 根据选取 的训练问题 修复策略修复机器学习模型, 并重复S2 ~S4。 2.根据权利要求1所述的机器学习模型修复方法, 其特征在于, 所述待训练的机器学习 模型为文本分类机器学习模型、 图像分类机器学习模型或音频识别机器学习模型。 3.根据权利要求1所述的机器学习模型修复方法, 其特征在于, 所述预设监控指标包 括、 准确率、 模型梯度和模型权 重。 4.根据权利要求3所述的机器学习模型修复方法, 其特征在于, 所述训练问题包括梯度 爆炸问题、 梯度消失问题、 死亡ReLU问题、 不稳定收敛问题以及缓慢收敛问题; 所述根据 获 取的预设监控指标 数据, 判断机器学习模型 是否存在训练问题的具体方法为: 当机器学习模型的输入层的模型梯度与输出层的模型梯度的比值超过第 一预设阈值, 且机器学习模型 的准确率低于预设准确 率阈值时, 或者, 机器学习模型 的模型梯度或模型 权重中存在NaN数值时, 机器学习模型存在训练问题且为梯度爆炸问题; 当机器学习模型的输入层的模型梯度与输出层的模型梯度的比值超过第 二预设阈值, 且输入层的模型梯度小于第三预设阈值时, 机器学习模型存在训练问题且为梯度消失问 题; 当机器学习模型的模型梯度中包含超过预设比例的零值, 且激活函数为ReLU激活函 数, 且机器学习模型 的准确率低于预设准确 率阈值时, 机器学习模型存在训练问题且为死 亡ReLU问题; 当机器学习模型的准确率的抖动幅度超过预设抖动幅度阈值, 且持续超过预设数量的 训练次数时, 机器学习模型存在训练问题且为 不稳定收敛问题; 当机器学习模型的准确率低于预设准确率阈值, 且相邻 两次训练 的最大改进未超过第 四预设阈值时, 机器学习模型存在训练问题且为缓慢收敛问题。 5.根据权利要求4所述的机器学习模型修复方法, 其特征在于, 所述第一预设阈值为 70, 第二预设阈值为为1e‑3, 第三预设阈值为为1e‑4, 第四预设阈值为0.01, 预设抖动幅度阈 值为0.03, 预设数量的训练次数为总训练次数的20%。 6.根据权利要求1所述的机器学习模型修复方法, 其特征在于, 所述训练问题修复策略 包括加入批量正则化层、 修改机器学习模型激活函数、 裁剪机器学习模型梯度、 修改机器学 习模型初始化器、 调整机器学习模型修复批量大小、 调整机器学习模型修复优化器学习率 以及替换机器学习模型修复优化器。 7.根据权利要求1所述的机器学习模型修复方法, 其特征在于, 所述S5还包括: 当训练 问题修复策略集合中的训练问题修复策略均被选取时, 输出当前的机器学习模型以及机器 学习模型的训练问题。权 利 要 求 书 1/2 页 2 CN 114254763 A 28.一种机器学习模型修复系统, 其特 征在于, 包括: 模型获取模块, 用于获取待训练的机器学习模型; 指标获取模块, 用于通过预设的训练集训练机器学习模型, 并获取训练过程中机器学 习模型的预设监控指标 数据; 训练问题确认模块, 用于根据获取的预设监控指标数据, 判断机器学习模型是否存在 训练问题; 修复模块, 用于当机器学习模型存在训练问题时, 依次选取预设的训练问题修复策略 集合中的训练问题修复策略, 并且每选取一训练问题修复策略均进行修复步骤: 根据选取 的训练问题修复策略修复机器学习模型, 并触发指标获取模块和训练问题确认模块; 输出模块, 用于当机器学习模型不存在训练问题时, 输出当前机器学习模型并结束修 复。 9.一种计算机设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器 上运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求 1至 7任一项所述机器学习模型修复方法的步骤。 10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在 于, 所述计算机程序被处理器执行时实现如权利要求 1至7任一项 所述机器学习模型修复方 法的步骤。权 利 要 求 书 2/2 页 3 CN 114254763 A 3
专利 机器学习模型修复方法、系统、计算机设备及存储介质
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 23:17:43
上传分享
举报
下载
原文档
(795.0 KB)
分享
友情链接
GB-T 30281-2013 信息安全技术 鉴别与授权 可扩展访问控制标记语言.pdf
信通院 人工智能生成内容 AIGC 白皮书 2022年.pdf
DB23-T 3277—2022 数字化农业服务信息系统建设规范 黑龙江省.pdf
T-CSFSIM 001—2022 复杂产品协同设计集成建模语言X语言架构.pdf
T-CSTM 00043.6—2018 大气环境腐蚀试验 第6部分:建筑涂层材料暴露腐蚀试验.pdf
T-CRHA 018—2023 人肝胆肿瘤细胞类器官构建、质量控制与保藏操作指南.pdf
GB-T 40665.3-2021 中医四诊操作规范 第3部分:问诊.pdf
DL-T 1989-2019 电化学储能电站监控系统与电池管理系统通信协议.pdf
法律法规 无锡市科技创新促进条例2021-12-10.pdf
GB-T 31495.1-2015 信息安全技术 信息安全保障指标体系及评价方法 第1部分:概念和模型.pdf
GB-T 36710-2018 公共机构办公区节能运行管理规范.pdf
GB-T 39046-2020 政务服务平台基础数据规范.pdf
GB-T 35286-2017 信息安全技术 低速无线个域网空口安全测试规范.pdf
GB-T 15909-2017 电子工业用气体 硅烷.pdf
DB37-T 3304-2018 信息安全技术 云计算运维安全管理规范 山东省.pdf
DB44-T 747-2010 转子侧变频调速节能装置通用技术规范 广东省.pdf
GB-T 18771.5-2015 烟草术语 第5部分:烟草机械与烟草专用检测仪器.pdf
GB-T 12350-2022 小功率电动机的安全要求.pdf
DB3305-T 197-2021 绿水青山就是金山银山 生态资源数字化建设与应用指南 湖州市.pdf
GB 11174-2011 液化石油气.pdf
1
/
3
15
评价文档
赞助2.5元 点击下载(795.0 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。