(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111562792.8
(22)申请日 2021.12.20
(71)申请人 北京创世云科技股份有限公司
地址 100085 北京市海淀区上地信息路2号
中关村国际孵化园804室
(72)发明人 孟维良 张宇超 刘泓昆 王文东
(74)专利代理 机构 北京集佳知识产权代理有限
公司 11227
代理人 刘珂
(51)Int.Cl.
G06F 9/50(2006.01)
G06K 9/62(2022.01)
G06N 20/00(2019.01)
(54)发明名称
一种生成边 缘模型的方法、 装置及电子设备
(57)摘要
本发明提供了一种生成边缘模 型的方法、 装
置及电子设备, 其中, 该方法包括: 获取用于训练
学生模型的多个样本数据, 并确定至少部分样本
数据的难度值; 将训练学生模型的过程划分n个
阶段, 确定每个阶段的包含多个样 本数据的样本
集; 在教师模型的基础上, 将每个阶段的样本集
依次输入至学生模型进行训练, 生成边缘模型。
通过本发明实施例提供的生 成边缘模 型的方法、
装置及电子设备, 阶段性地且由易至难地对学生
模型进行训练, 能够提升训练学生模型的速度;
且由于利用该边缘模型替换掉了占据空间资源
较大的机器学习模型, 能够减少空间资源的消
耗, 缓解边缘设备的承载压力。
权利要求书2页 说明书16页 附图3页
CN 114253725 A
2022.03.29
CN 114253725 A
1.一种生成边 缘模型的方法, 应用于边 缘设备, 其特 征在于, 包括:
获取用于训练学生模型的多个样本数据, 并确定 至少部分所述样本数据的难度值;
将训练所述学生模型的过程划分n个阶段, 确定每个所述阶段的包含多个所述样本数
据的样本集; 第i个阶段的样本集比第i ‑1个阶段的样本集具有更多的所述样本数据, 所述
第i个阶段的样 本集包含 所述第i‑1个阶段的样 本集中的至少部 分所述样 本数据, 且所述第
i个阶段的样本集中的至少部分所述样本数据的难度值高于所述第i ‑1个阶段的样本集中
的任一所述样本数据的难度值;
在教师模型的基础上, 将每个所述阶段的样本集依次输入至所述学生模型进行训练,
生成边缘模型, 所述 边缘模型用于执 行边缘任务。
2.根据权利要求1所述的方法, 其特征在于, 所述确定至少部分所述样本数据的难度值
包括:
确定所述样本数据的真实标签, 所述真实标签属于一种类别;
基于所述样本数据的真实标签, 以及将所述样本数据输入至所述教师模型得到的输出
结果, 得到所述样本数据的难度值Dj, 且
其中, j表示所述样本数据; k表示所有类别中的一种; K表示多个所述样本数据中包含
的类别总量; yj,k表示所述样本数据j的真实标签是否属于类别k; ft(j,k)表示将所述样本
数据j输入至所述教师模型 得到的输出 结果是类别k的概 率。
3.根据权利要求1所述的方法, 其特征在于, 在所述确定每个所述阶段的包含多个所述
样本数据的样本集之前, 还 包括:
确定所述样本数据的总量, 确定所述样本数据的增长率; 所述增长率表示每个所述阶
段所述样本数据的增长量与所述样本数据的总量的比值;
基于所述样本数据的总量和增长率, 确定每个所述阶段的样本集包含所述样本数据的
数量; 第i个阶段的样本集包含所述样本数据的数量为Ni, 且Ni=i×λ×N; 其中, λ为所述增
长率; N为所述样本数据的总量。
4.根据权利要求1所述的方法, 其特征在于, 所述确定每个所述阶段的包含多个所述样
本数据的样本集, 包括:
将具有所述难度值的所述样本数据按难度递增的方式排序, 得到难度值 递增的序列;
基于所述难度值递增的序列, 确定每个所述阶段的包含多个所述样本数据的样本集;
在任意所述阶段的样本集中, 每种真实标签的样本数据的数量是相同的。
5.根据权利要求4所述的方法, 其特征在于, 所述基于所述难度值递增的序列, 确定每
个所述阶段的包 含多个所述样本数据的样本集, 包括:
分别从每种所述真实标签对应的样本数据中由最简单的所述样本数据开始, 依次选取
所述难度值连续递增的所述样本数据, 将选取出的所述难度值连续递增的所述样本数据作
为样本集。
6.根据权利要求1所述的方法, 其特征在于, 所述在教师模型的基础上, 将每个所述阶
段的样本集依次输入至所述学生模型进行训练, 生成边 缘模型包括:
将当前阶段的样本集输入至上一阶段生成的学生模型进行训练, 得到当前阶段生成的
学生模型, 所述上一阶段生成的学生模型是根据所述上一阶段的样本集进 行训练所生成的权 利 要 求 书 1/2 页
2
CN 114253725 A
2学生模型。
7.一种生成边缘模型的装置, 所述装置设置于边缘设备, 其特征在于, 包括: 获取模块、
确定模块和训练模块;
所述获取模块用于获取用于训练学生模型的多个样本数据, 并确定至少部分所述样本
数据的难度值;
所述确定模块用于将训练所述学生模型的过程划分n个阶段, 确定每个所述阶段的包
含多个所述样本数据的样本集; 第i个阶段的样本集比第i ‑1个阶段的样 本集具有 更多的所
述样本数据, 所述第i个阶段的样本集包含所述第i ‑1个阶段的样本集中的至少部 分所述样
本数据, 且所述第i个阶段的样 本集中的至少部 分所述样本数据的难度值高于所述第i ‑1个
阶段的样本集中的任一所述样本数据的难度值;
所述训练模块用于在教师模型的基础上, 将每个所述阶段的样本集依次输入至所述学
生模型进行训练, 生成边 缘模型, 所述 边缘模型用于执 行边缘任务。
8.根据权利要求4所述的装置, 其特征在于, 所述确定模块包括: 第一确定单元和第二
确定单元;
所述第一确定单 元用于确定所述样本数据的真实标签, 所述真实标签属于一种类别;
所述第二确定单元用于基于所述样本数据的真实标签, 以及将所述样本数据输入至所
述教师模型 得到的输出 结果, 得到所述样本数据的难度值Dj, 且
其中, j表示所述样本数据; k表示所有类别中的一种; yj,k表示所述样本数据j的真实标
签是否属于类别k; ft(j,k)表示将所述样本数据j输入至所述教师模型得到的输出结果是
类别k的概 率。
9.一种电子设备, 包括总线、 收发器、 存储器、 处理器及存储在所述存储器上并可在所
述处理器上运行的计算机程序, 所述收发器、 所述存储器和所述处理器通过所述总线相连,
其特征在于, 所述计算机程序被所述处理器执行时实现如权利要求 1至6中任一项 所述的生
成边缘模型的方法中的步骤。
10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序
被处理器执行时实现如权利要求1至 6中任一项所述的生成边 缘模型的方法中的步骤。权 利 要 求 书 2/2 页
3
CN 114253725 A
3
专利 一种生成边缘模型的方法、装置及电子设备
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 23:15:35上传分享