(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111653142.4
(22)申请日 2021.12.3 0
(71)申请人 上海商汤智能科技有限公司
地址 200233 上海市徐汇区桂平路391号3
号楼1605A室
(72)发明人 许晓薇 叶宇翔 陈翼男
(74)专利代理 机构 北京中知恒瑞知识产权代理
事务所(普通 合伙) 11889
代理人 袁忠林
(51)Int.Cl.
G06T 7/00(2017.01)
G06V 10/764(2022.01)
G06K 9/62(2022.01)
(54)发明名称
图像识别方法、 装置、 电子设备及存 储介质
(57)摘要
本公开提供了一种图像识别方法、 装置、 电
子设备及存储介质, 该方法包括: 获取目标对象
的至少一个三维图像; 对各个所述三维图像进行
压缩处理, 得到每个所述三维图像相关的第一目
标图像和第二目标图像; 基于所述第一目标图像
和所述第二目标图像, 确定所述三维图像的目标
类别; 其中, 所述目标类别包括用于指示所述三
维图像所属期相的第一类别, 和/或, 用于指示所
述三维图像的成像方式的第二类别。
权利要求书3页 说明书22页 附图4页
CN 114332032 A
2022.04.12
CN 114332032 A
1.一种图像识别方法, 其特 征在于, 包括:
获取目标对象的至少一个三维图像;
对各个所述三维图像进行压缩处理, 得到每个所述三维图像相关的第 一目标图像和第
二目标图像;
基于所述第一目标图像和所述第二目标图像, 确定所述 三维图像的目标类别;
其中, 所述目标类别包括用于指示所述三维图像所属期相的第一类别, 和/或, 用于指
示所述三维图像的成像方式的第二类别。
2.根据权利要求1所述的方法, 其特征在于, 所述对各个所述三维图像进行压缩处理,
得到每个所述三维图像相关的第一目标图像和第二目标图像, 包括:
针对每个所述三维图像, 按照设置的断面方向, 将所述三维图像划分为多个三维图像
块;
将各个所述三维图像块分别进行压缩处理, 得到每个所述三维图像块对应的第 一目标
图像和第二 目标图像; 其中, 所述第一 目标图像为对所述三维 图像块中的各个像素点按照
所述断面方向进 行投影后, 对投影到同一像素点位置的各个像素点的像素信息取平均值得
到的; 所述第二目标图像为对投影到同一像素点位置的各个像素点的像素信息取最大值得
到的;
将各个三维图像块分别对应的所述第 一目标图像和所述第 二目标图像, 确定为所述三
维图像相关的第一目标图像和第二目标图像。
3.根据权利要求1所述的方法, 其特征在于, 所述基于所述第 一目标图像和所述第 二目
标图像, 确定所述 三维图像的目标类别, 包括:
对所述至少一个三维图像对应的所述第一目标图像和所述第二目标图像进行特征处
理, 得到每 个所述三维图像对应的目标 特征数据;
对各个三维图像分别对应的所述目标特征数据进行特征提取, 生成每个所述三维图像
对应的局部特 征数据;
基于所述 三维图像对应的所述局部特 征数据, 确定所述 三维图像对应的目标类别。
4.根据权利要求3所述的方法, 其特征在于, 所述基于所述三维图像对应的所述局部特
征数据, 确定所述 三维图像对应的目标类别, 包括:
对所述三维图像对应的所述局部特征数据进行全局特征提取, 得到所述三维图像对应
的全局特 征数据;
基于所述三维图像对应的所述局部特征数据和所述全局特征数据, 得到所述三维图像
对应的融合特 征数据;
基于所述融合特 征数据, 确定所述 三维图像对应的所述目标类别。
5.根据权利要求4所述的方法, 其特征在于, 所述对所述三维图像对应的所述局部特征
数据进行全局特 征提取, 得到所述 三维图像对应的全局特 征数据, 包括:
利用设置的多种全局特征提取方式, 分别对所述局部特征数据进行全局特征提取, 得
到所述三维图像对应的多个全局特 征数据;
所述基于所述三维图像对应的所述局部特征数据和所述全局特征数据, 得到所述三维
图像对应的融合特 征数据, 包括:
确定所述局部特 征数据和每 个所述全局特 征数据之间的残差特 征数据;权 利 要 求 书 1/3 页
2
CN 114332032 A
2将所述三维图像对应的所述局部特征数据和多个所述残差特征数据进行拼接, 得到所
述三维图像对应的融合特 征数据。
6.根据权利要求3~5任一所述的方法, 其特征在于, 所述对所述至少一个三维图像对
应的所述第一目标图像和所述第二目标图像进行特征 处理, 得到每个所述三 维图像对应的
目标特征数据, 包括:
对每个所述三维图像对应的所述第 一目标图像和所述第 二目标图像进行特征提取, 得
到所述三维图像对应的中间特 征数据;
基于所述中间特征数据, 确定区域边界信 息; 其中, 所述区域边界信 息用于表征所述三
维图像中所述目标对象所处的目标区域;
根据所述区域边界信息, 对所述中间特征数据进行截取, 得到所述三维图像对应的目
标特征数据。
7.根据权利要求6所述的方法, 其特征在于, 在得到所述三维图像对应的中间特征数据
之后, 所述方法还 包括:
基于所述中间特 征数据, 确定表征 所述三维图像中目标对象的完整程度的比例信息;
所述根据所述区域边界信息, 对所述中间特征数据进行截取, 得到所述三维图像对应
的目标特征数据, 包括:
在所述比例信息大于或等于设置的比例阈值的情况下, 根据所述区域边界信息, 对所
述中间特 征数据进行截取, 得到所述 三维图像对应的目标 特征数据。
8.根据权利要求7 所述的方法, 其特 征在于, 所述方法还 包括:
在所述比例信息小于设置的所述比例阈值的情况下, 生成第一提示信息, 以提示所述
三维图像的所述目标对象不完整。
9.根据权利要求6~8任一所述的方法, 其特征在于, 所述根据 所述区域边界信 息, 对所
述中间特 征数据进行截取, 得到所述 三维图像对应的目标 特征数据, 包括:
根据所述区域边界信息, 对所述中间特征数据进行截取, 得到所述三维图像对应的待
处理特征数据;
对所述待处 理特征数据进行尺寸调整, 得到所述 三维图像对应的目标 特征数据。
10.根据权利要求1~9任一所述的方法, 其特征在于, 所述三维图像对应的目标类别为
基于目标神经网络确定的; 所述目标神经网络通过以下步骤训练得到:
获取训练样本集, 所述训练样本集中包括多个样本对象分别对应的样本 图像集合, 每
个样本图像集合中包括所述样本对象对应的至少一个样本图像组, 所述样本图像组包括第
一样本图像和第二样本图像;
利用所述样本对象对应的所述样本 图像集合, 对神经网络进行训练, 得到本次训练后
的神经网络;
在本次训练后的神经网络不满足设置的截止条件的情况下, 返回至利用所述样本对象
对应的所述样本图像集 合, 对神经网络进行训练, 得到 本次训练后的神经网络的步骤;
在本次训练后的神经网络满足设置的截止条件的情况下, 将所述本次训练后的神经网
络作为所述目标神经网络 。
11.根据权利要求10所述的方法, 其特征在于, 所述利用所述样本对象对应的所述样本
图像集合, 对神经网络进行训练, 得到 本次训练后的神经网络, 包括:权 利 要 求 书 2/3 页
3
CN 114332032 A
3
专利 图像识别方法、装置、电子设备及存储介质
文档预览
中文文档
30 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共30页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 22:49:38上传分享