专利 图像识别方法、装置、电子设备及存储介质

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111653142.4 (22)申请日 2021.12.3 0 (71)申请人上海商汤智能科技有限公司地址 200233 上海市徐汇区桂平路391号3 号楼1605A室 (72)发明人许晓薇　叶宇翔　陈翼男　 (74)专利代理机构北京中知恒瑞知识产权代理事务所(普通合伙) 11889 代理人袁忠林 (51)Int.Cl. G06T 7/00(2017.01) G06V 10/764(2022.01) G06K 9/62(2022.01) (54)发明名称图像识别方法、装置、电子设备及存储介质 (57)摘要本公开提供了一种图像识别方法、装置、电子设备及存储介质，该方法包括：获取目标对象的至少一个三维图像；对各个所述三维图像进行压缩处理，得到每个所述三维图像相关的第一目标图像和第二目标图像；基于所述第一目标图像和所述第二目标图像，确定所述三维图像的目标类别；其中，所述目标类别包括用于指示所述三维图像所属期相的第一类别，和/或，用于指示所述三维图像的成像方式的第二类别。权利要求书3页说明书22页附图4页 CN 114332032 A 2022.04.12 CN 114332032 A 1.一种图像识别方法，其特征在于，包括：获取目标对象的至少一个三维图像；对各个所述三维图像进行压缩处理，得到每个所述三维图像相关的第一目标图像和第二目标图像；基于所述第一目标图像和所述第二目标图像，确定所述三维图像的目标类别；其中，所述目标类别包括用于指示所述三维图像所属期相的第一类别，和/或，用于指示所述三维图像的成像方式的第二类别。 2.根据权利要求1所述的方法，其特征在于，所述对各个所述三维图像进行压缩处理，得到每个所述三维图像相关的第一目标图像和第二目标图像，包括：针对每个所述三维图像，按照设置的断面方向，将所述三维图像划分为多个三维图像块；将各个所述三维图像块分别进行压缩处理，得到每个所述三维图像块对应的第一目标图像和第二目标图像；其中，所述第一目标图像为对所述三维图像块中的各个像素点按照所述断面方向进行投影后，对投影到同一像素点位置的各个像素点的像素信息取平均值得到的；所述第二目标图像为对投影到同一像素点位置的各个像素点的像素信息取最大值得到的；将各个三维图像块分别对应的所述第一目标图像和所述第二目标图像，确定为所述三维图像相关的第一目标图像和第二目标图像。 3.根据权利要求1所述的方法，其特征在于，所述基于所述第一目标图像和所述第二目标图像，确定所述三维图像的目标类别，包括：对所述至少一个三维图像对应的所述第一目标图像和所述第二目标图像进行特征处理，得到每个所述三维图像对应的目标特征数据；对各个三维图像分别对应的所述目标特征数据进行特征提取，生成每个所述三维图像对应的局部特征数据；基于所述三维图像对应的所述局部特征数据，确定所述三维图像对应的目标类别。 4.根据权利要求3所述的方法，其特征在于，所述基于所述三维图像对应的所述局部特征数据，确定所述三维图像对应的目标类别，包括：对所述三维图像对应的所述局部特征数据进行全局特征提取，得到所述三维图像对应的全局特征数据；基于所述三维图像对应的所述局部特征数据和所述全局特征数据，得到所述三维图像对应的融合特征数据；基于所述融合特征数据，确定所述三维图像对应的所述目标类别。 5.根据权利要求4所述的方法，其特征在于，所述对所述三维图像对应的所述局部特征数据进行全局特征提取，得到所述三维图像对应的全局特征数据，包括：利用设置的多种全局特征提取方式，分别对所述局部特征数据进行全局特征提取，得到所述三维图像对应的多个全局特征数据；所述基于所述三维图像对应的所述局部特征数据和所述全局特征数据，得到所述三维图像对应的融合特征数据，包括：确定所述局部特征数据和每个所述全局特征数据之间的残差特征数据；权　利　要　求　书 1/3 页 2 CN 114332032 A 2将所述三维图像对应的所述局部特征数据和多个所述残差特征数据进行拼接，得到所述三维图像对应的融合特征数据。 6.根据权利要求3～5任一所述的方法，其特征在于，所述对所述至少一个三维图像对应的所述第一目标图像和所述第二目标图像进行特征处理，得到每个所述三维图像对应的目标特征数据，包括：对每个所述三维图像对应的所述第一目标图像和所述第二目标图像进行特征提取，得到所述三维图像对应的中间特征数据；基于所述中间特征数据，确定区域边界信息；其中，所述区域边界信息用于表征所述三维图像中所述目标对象所处的目标区域；根据所述区域边界信息，对所述中间特征数据进行截取，得到所述三维图像对应的目标特征数据。 7.根据权利要求6所述的方法，其特征在于，在得到所述三维图像对应的中间特征数据之后，所述方法还包括：基于所述中间特征数据，确定表征所述三维图像中目标对象的完整程度的比例信息；所述根据所述区域边界信息，对所述中间特征数据进行截取，得到所述三维图像对应的目标特征数据，包括：在所述比例信息大于或等于设置的比例阈值的情况下，根据所述区域边界信息，对所述中间特征数据进行截取，得到所述三维图像对应的目标特征数据。 8.根据权利要求7 所述的方法，其特征在于，所述方法还包括：在所述比例信息小于设置的所述比例阈值的情况下，生成第一提示信息，以提示所述三维图像的所述目标对象不完整。 9.根据权利要求6～8任一所述的方法，其特征在于，所述根据所述区域边界信息，对所述中间特征数据进行截取，得到所述三维图像对应的目标特征数据，包括：根据所述区域边界信息，对所述中间特征数据进行截取，得到所述三维图像对应的待处理特征数据；对所述待处理特征数据进行尺寸调整，得到所述三维图像对应的目标特征数据。 10.根据权利要求1～9任一所述的方法，其特征在于，所述三维图像对应的目标类别为基于目标神经网络确定的；所述目标神经网络通过以下步骤训练得到：获取训练样本集，所述训练样本集中包括多个样本对象分别对应的样本图像集合，每个样本图像集合中包括所述样本对象对应的至少一个样本图像组，所述样本图像组包括第一样本图像和第二样本图像；利用所述样本对象对应的所述样本图像集合，对神经网络进行训练，得到本次训练后的神经网络；在本次训练后的神经网络不满足设置的截止条件的情况下，返回至利用所述样本对象对应的所述样本图像集合，对神经网络进行训练，得到本次训练后的神经网络的步骤；在本次训练后的神经网络满足设置的截止条件的情况下，将所述本次训练后的神经网络作为所述目标神经网络。 11.根据权利要求10所述的方法，其特征在于，所述利用所述样本对象对应的所述样本图像集合，对神经网络进行训练，得到本次训练后的神经网络，包括：权　利　要　求　书 2/3 页 3 CN 114332032 A 3

专利 图像识别方法、装置、电子设备及存储介质

专利图像识别方法、装置、电子设备及存储介质