说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111602781.8 (22)申请日 2021.12.24 (71)申请人 四川云从 天府人工智能科技有限公 司 地址 610000 四川省成 都市自由贸易试验 区成都天府新区煎茶街道菁蓉南三街 99号 (72)发明人 孟嘉琪  (74)专利代理 机构 北京润泽恒知识产权代理有 限公司 1 1319 代理人 李兴迪 (51)Int.Cl. G06N 20/00(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 标签预测模型训练及样本筛选方法、 装置、 存储介质 (57)摘要 本申请提供一种标签预测模型训练及样本 筛选方法、 装置、 存储介质, 包括: 根据标注数据、 标注数据的真实标签、 未标注数据, 训练生成器, 利用生成器输出的标注数据、 未标注数据各自的 特征提取结果、 标注数据的真实标签, 未标注数 据的参考标签, 训练判别器, 并基于训练好的生 成器和判别器, 生成训练好的标签预测模型。 借 此, 本申请可提高模型训练的迭代效率, 并降低 训练数据的筛 选成本。 权利要求书4页 说明书9页 附图4页 CN 114418111 A 2022.04.29 CN 114418111 A 1.一种标签预测模型训练方法, 包括: 根据标注数据、 所述标注数据的真实标签、 未 标注数据, 训练生成器; 利用所述生成器输出的所述标注数据、 所述未标注数据各自的特征提取结果、 所述标 注数据的真实标签, 所述未 标注数据的参 考标签, 训练判别器; 基于训练好的所述 生成器和所述判别器, 生成训练好的标签预测模型。 2.根据权利要求1所述的标签预测模型训练方法, 其特征在于, 所述根据标注数据、 所 述标注数据的真实标签、 未 标注数据, 训练生成器, 包括: 利用所述生成器, 针对所述标注数据、 所述未标注数据执行卷积处理和隐变量学习, 获 得所述标注数据、 所述未 标注数据各自的特 征向量和隐变量; 利用有监督学习器, 根据所述标注数据的隐变量执行分类预测, 获得所述有监督学习 器的损失函数; 利用无监督重建器, 根据所述标注数据、 所述未标注数据各自的特征向量、 隐变量, 执 行反卷积处 理, 获得所述无监 督重建器的损失函数; 根据所述有监 督学习器的损失函数、 所述无监 督重建器的损失函数, 训练所述 生成器。 3.根据权利要求2所述的标签预测模型训练方法, 其特征在于, 所述利用所述生成器, 针对所述标注数据、 所述未标注数据执行卷积处理和隐变量学习, 获得所述标注数据、 所述 未标注数据各自的特 征向量和隐变量, 包括: 利用所述生成器的CNN模型, 针对所述标注数据、 所述未标注数据执行卷积处理, 获得 所述标注数据、 所述未 标注数据各自的特 征向量; 利用所述生成器的FC模型, 针对所述标注数据、 所述未标注数据 执行隐变量学习, 获得 所述标注数据、 所述未 标注数据各自的隐变量。 4.根据权利要求2所述的标签预测模型训练方法, 其特征在于, 所述利用有监督学习 器, 根据所述标注数据的隐变量执 行分类预测, 获得 所述有监 督学习器的损失函数, 包括: 利用所述有监督学习器, 根据所述标注数据的隐变量执行分类预测, 获得所述标注数 据的预测标签; 根据所述标注数据的真实标签、 所述预测标签, 获得 所述有监 督学习器的损失函数; 所述有监 督学习器的损失函数表示 为: 其中, 所述STL表示所述有监督学习器, 所述 表示所述有监督学习器的损失函数, 所述zL表示所述标注数据的隐变量, 所述xL表示所述标注数据, 所述yL表示所述标注数据的 真实标签, 所述DKL表示所述生成器输出的所述隐变量的KL散度, 所述pφ表示φ参数化解码 器, 所述qθ表示θ 参数化编码器。 5.根据权利要求2所述的标签预测模型训练方法, 其特征在于, 所述利用无监督重建 器, 根据所述标注数据、 所述未标注数据各自的特征向量、 隐变量, 执行反卷积处理, 获得所 述无监督重建器的损失函数, 包括: 利用所述无监督重建器, 根据 所述标注数据的隐变量、 所述标注数据的特征向量, 执行 反卷积处理, 获得所述标注数据的标注还原预测, 并根据所述标注数据和所述标注还原预 测, 获得所述有监 督学习器的标注损失子函数;权 利 要 求 书 1/4 页 2 CN 114418111 A 2利用所述无监督重建器, 根据 所述未标注数据的隐变量、 所述未标注数据的特征向量, 执行反卷积处理, 获得所述未标注数据的未标注还原预测, 并根据所述未标注数据和所述 未标注还原预测, 获得 所述无监 督重建器的未 标注损失子函数; 根据所述标注损 失子函数、 所述未标注损 失子函数, 获得所述无监督重建器的损 失函 数; 所述无监 督重建器的损失函数表示 为: 其中, 所述 表示所述无监督重建器的损失函数, 所述 表示所述未标注损失子 函数, 所述 表示所述标注损失子函数; 所述未标注损失子函数表示 为: 所述标注损失子函数表示 为: 其中, 所述xU表示所述未标注数据, 所述zU表示所述未标注数据的隐变量; 所述xL表示 所述标注数据, 所述zL表示所述标注数据的隐变量, 所述pφ表示φ参数化解码器, 所述qθ表 示θ 参数化编码器。 6.根据权利要求2所述的标签预测模型训练方法, 其特征在于, 所述利用所述生成器输 出的所述标注数据、 所述未标注数据各自的特征提取结果、 所述标注数据的真实标签, 所述 未标注数据的参 考标签, 训练判别器, 包括: 利用所述判别器, 根据所述生成器针对所述标注数据输出的特征向量, 获得所述标注 数据的标注预测标签; 利用所述判别器, 根据所述生成器针对所述未标注数据输出的特征向量, 获得所述未 标注数据的未标注预测标签, 并根据所述未标注预测标签、 所述未标注数据的参考标签, 获 得所述判别器的未 标注损失子函数; 根据所述标注损失子函数、 所述未 标注损失子函数, 获得 所述判别器的损失函数; 所述标注数据的标注预测标签表示 为: pL=Dc(xL)log(Dc(xL)) 所述未标注数据的未 标注预测标签表示 为: pU=Dc(xU)log(Dc(xU)) 其中, 所述xL表示所述标注数据, 所述xU表示所述未 标注数据, 所述Dc表示所述判别器; 所述判别器的损失函数表示 为: 其中, 所述 表示所述判别器的损失函数, 所述mse(pL, yL)表示所述标注损失子函 数, 所述pL表示所述标注数据的标注预测标签, 所述yL表示所述标注数据的真实标签, 所述 mse(pU, yU)表示所述未标注损失子函数, 所述pU表示所述未标注数据的未标注预测标签, 所 述yU表示所述未 标注数据的参 考标签; 其中, 所述yL的取值为0。权 利 要 求 书 2/4 页 3 CN 114418111 A 3

.PDF文档 专利 标签预测模型训练及样本筛选方法、装置、存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 标签预测模型训练及样本筛选方法、装置、存储介质 第 1 页 专利 标签预测模型训练及样本筛选方法、装置、存储介质 第 2 页 专利 标签预测模型训练及样本筛选方法、装置、存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:17:45上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。