专利 一种服饰识别方法、装置、终端及存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210356711.7 (22)申请日 2022.04.06 (71)申请人北京爱奇艺科技有限公司地址 100080 北京市海淀区海淀北一街2号鸿城拓展大厦10、 1 1层 (72)发明人李冠楠　 (74)专利代理机构北京润泽恒知识产权代理有限公司 1 1319 专利代理师吕俊秀 (51)Int.Cl. G06V 20/60(2022.01) G06V 20/40(2022.01) G06V 10/80(2022.01) G06V 10/762(2022.01) G06V 10/74(2022.01)G06V 10/42(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种服饰识别方法、装置、终端及存储介质 (57)摘要本发明实施例提供了一种服饰识别方法、装置、终端及存储介质，其中，方法包括：获取多张包含不同服饰视角的服饰图像；多张服饰图像中待识别的目标服饰为相同的服饰款式；对每张服饰图像进行服饰视角识别，确定服饰图像中待识别的目标服饰对应的服饰视角；对每张服饰图像进行特征提取，得到第一服饰特征；融合多张服饰图像对应的第一服饰特征和服饰视角，得到待识别的目标服饰对应的多视角服饰特征，以基于多视角服饰特征得到待识别的目标服饰的识别结果。本发明实施例将多视角服饰特征作为一个整体对待识别的目标服饰进行识别，可以提高服饰识别的准确率。权利要求书2页说明书15页附图2页 CN 114863405 A 2022.08.05 CN 114863405 A 1.一种服饰识别方法，其特征在于，所述方法包括：获取多张包含不同服饰视角的服饰图像；多张所述服饰图像中待识别的目标服饰为相同的服饰款式；对每张所述服饰图像进行服饰视角识别，确定所述服饰图像中待识别的目标服饰对应的服饰视角；对每张所述服饰图像进行特征提取，得到第一服饰特征；融合多张所述服饰图像对应的第一服饰特征和服饰视角，得到所述待识别的目标服饰对应的多视角服饰特征，以基于所述多视角服饰特征得到所述待识别的目标服饰的识别结果。 2.根据权利要求1所述的方法，其特征在于，所述对每张所述服饰图像进行特征提取，得到第一服饰特征，包括：对所述服饰图像进行人体关键点检测和服饰关键点检测，以得到所述服饰图像对应的人体关键点和服饰关键点；对所述服饰图像进行全局特征提取，得到所述服饰图像对应的全局特征；所述全局特征用于表征所述服饰图像中待识别的目标服饰的款式；根据所述人体关键点和服饰关键点对所述全局特征进行处理，得到所述服饰图像的第一服饰特征。 3.根据权利要求1所述的方法，其特征在于，所述融合多张所述服饰图像对应的第一服饰特征和服饰视角，得到所述待识别的目标服饰对应的多视角服饰特征，包括：将多张所述服饰图像对应的第一服饰特征组成的特征序列，以及多张所述服饰图像的服饰视角对应的视角编码组成的视角编码序列，输入预先训练好的变换器结构，由所述变换器结构对所述特征序列和所述视角编码序列进行融合，输出所述待识别的目标服饰对应的多视角服饰特征。 4.根据权利要求1所述的方法，其特征在于，所述对每张所述服饰图像进行服饰视角识别，确定所述服饰图像中待识别的目标服饰对应的服饰视角，包括：检测所述服饰图像中待识别的目标服饰的姿态信息；将所述姿态信息对应的视角确定为所述服饰图像中待识别的目标服饰对应的服饰视角。 5.根据权利要求1所述的方法，其特征在于，所述对每张所述服饰图像进行服饰视角识别，确定所述服饰图像中待识别的目标服饰对应的服饰视角，包括：将所述服饰图像输入到视角识别模型，由所述视角识别模型输出所述服饰图像中待识别的目标服饰对应的服饰视角；其中，所述视角识别模型是使用第一训练样本对初始视角识别模型进行训练得到的，所述第一训练样本是标注出包含的第一训练服饰的服饰视角的图像。 6.根据权利要求1所述的方法，其特征在于，所述获取多张不同服饰视角的服饰图像，包括：从待识别视频中提取多个不同时刻的待识别帧图像；检测所述待识别帧图像中的服饰区域，并提取所述服饰区域的图像特征；基于各个所述待识别帧图像对应的图像特征，对多个所述待识别帧图像进行聚类；权　利　要　求　书 1/2 页 2 CN 114863405 A 2将聚类后得到的、属于同一类的多个待识别帧图像作为所述服饰图像。 7.根据权利要求1所述的方法，其特征在于，所述基于所述多视角服饰特征得到所述待识别的目标服饰的识别结果，包括：计算所述多视角服饰特征与数据库中的各个预设多视角服饰特征之间的相似度；确定满足预设要求的相似度对应的目标预设多视角服饰特征，并将所述目标预设多视角服饰特征对应的服饰信息作为所述待识别的目标服饰的识别结果。 8.一种服饰识别装置，其特征在于，所述装置包括：第一获取模块，用于获取多张包含不同服饰视角的服饰图像；多张所述服饰图像中待识别的目标服饰为相同的服饰款式；视角识别模块，用于对每张所述服饰图像进行服饰视角识别，确定所述服饰图像中待识别的目标服饰对应的服饰视角；特征提取模块，用于对每张所述服饰图像进行特征提取，得到第一服饰特征；多视角识别模块，用于融合多张所述服饰图像对应的第一服饰特征和服饰视角，得到所述待识别的目标服饰对应的多视角服饰特征，以基于所述多视角服饰特征得到所述待识别的目标服饰的识别结果。 9.一种终端，其特征在于，包括：处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1至7任一所述的服饰识别方法。 10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7任一所述的服饰识别方法。权　利　要　求　书 2/2 页 3 CN 114863405 A 3

专利 一种服饰识别方法、装置、终端及存储介质

专利一种服饰识别方法、装置、终端及存储介质