(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210356711.7
(22)申请日 2022.04.06
(71)申请人 北京爱奇艺科技有限公司
地址 100080 北京市海淀区海淀北一 街2号
鸿城拓展大厦10、 1 1层
(72)发明人 李冠楠
(74)专利代理 机构 北京润泽恒知识产权代理有
限公司 1 1319
专利代理师 吕俊秀
(51)Int.Cl.
G06V 20/60(2022.01)
G06V 20/40(2022.01)
G06V 10/80(2022.01)
G06V 10/762(2022.01)
G06V 10/74(2022.01)G06V 10/42(2022.01)
G06V 10/82(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种服饰识别方法、 装置、 终端及存 储介质
(57)摘要
本发明实施例提供了一种服饰识别方法、 装
置、 终端及存储介质, 其中, 方法包括: 获取多张
包含不同服饰视角的服饰图像; 多张服饰图像中
待识别的目标服饰为相同的服饰款式; 对每张服
饰图像进行服饰视角识别, 确定服饰图像中待识
别的目标服饰对应的服饰视角; 对每张服饰图像
进行特征提取, 得到第一服饰特征; 融合多张服
饰图像对应的第一服饰特征和服饰视角, 得到待
识别的目标服饰对应的多视角服饰特征, 以基于
多视角服饰特征得到待识别的目标服饰的识别
结果。 本发 明实施例将多视角服饰特征作为一个
整体对待识别的目标服饰进行识别, 可以提高服
饰识别的准确率。
权利要求书2页 说明书15页 附图2页
CN 114863405 A
2022.08.05
CN 114863405 A
1.一种服饰识别方法, 其特 征在于, 所述方法包括:
获取多张包含不同服饰视角的服饰图像; 多 张所述服饰图像中待识别的目标服饰为相
同的服饰款式;
对每张所述服饰图像进行服饰视角识别, 确定所述服饰图像中待识别的目标服饰对应
的服饰视角;
对每张所述 服饰图像进行 特征提取, 得到第一 服饰特征;
融合多张所述服饰图像对应的第 一服饰特征和服饰视角, 得到所述待识别的目标服饰
对应的多视角服饰特征, 以基于所述多视角服饰特征得到所述待识别的目标服饰的识别结
果。
2.根据权利要求1所述的方法, 其特征在于, 所述对每张所述服饰图像进行特征提取,
得到第一 服饰特征, 包括:
对所述服饰图像进行人体关键点检测和服饰关键点检测, 以得到所述服饰图像对应的
人体关键点和服饰关键点;
对所述服饰图像进行全局特征提取, 得到所述服饰图像对应的全局特征; 所述全局特
征用于表征 所述服饰图像中待识别的目标服饰的款式;
根据所述人体关键点和服饰关键点对所述全局特征进行处理, 得到所述服饰图像的第
一服饰特征。
3.根据权利要求1所述的方法, 其特征在于, 所述融合多张所述服饰图像对应的第 一服
饰特征和服饰视角, 得到所述待识别的目标服饰对应的多视角服饰特 征, 包括:
将多张所述服饰图像对应的第 一服饰特征组成的特征序列, 以及多 张所述服饰图像的
服饰视角对应的视角编码组成的视角编码序列, 输入预先训练好的变换器结构, 由所述变
换器结构对所述特征序列和所述视角编 码序列进 行融合, 输出所述待识别的目标服饰对应
的多视角服饰特 征。
4.根据权利要求1所述的方法, 其特征在于, 所述对每张所述服饰图像进行服饰视角识
别, 确定所述 服饰图像中待识别的目标服饰对应的服饰视角, 包括:
检测所述 服饰图像中待识别的目标服饰的姿态信息;
将所述姿态信息对应的视角确定为所述服饰图像中待识别的目标服饰对应的服饰视
角。
5.根据权利要求1所述的方法, 其特征在于, 所述对每张所述服饰图像进行服饰视角识
别, 确定所述 服饰图像中待识别的目标服饰对应的服饰视角, 包括:
将所述服饰图像输入到视角识别模型, 由所述视角识别模型输出所述服饰图像中待识
别的目标服饰对应的服饰视角; 其中, 所述视角识别模型是使用第一训练样本对初始视角
识别模型进行训练得到的, 所述第一训练样本是标注出包含的第一训练服饰的服饰视角的
图像。
6.根据权利要求1所述的方法, 其特征在于, 所述获取多张不同服饰视角的服饰图像,
包括:
从待识别视频中提取多个不同时刻的待识别帧图像;
检测所述待识别帧图像中的服饰区域, 并提取 所述服饰区域的图像特 征;
基于各个所述待识别帧图像对应的图像特 征, 对多个所述待识别帧图像进行聚类;权 利 要 求 书 1/2 页
2
CN 114863405 A
2将聚类后得到的、 属于同一类的多个待识别帧图像作为所述 服饰图像。
7.根据权利要求1所述的方法, 其特征在于, 所述基于所述多视角服饰特征得到所述待
识别的目标服饰的识别结果, 包括:
计算所述多视角服饰特 征与数据库中的各个预设多视角服饰特 征之间的相似度;
确定满足预设要求的相似度对应的目标预设多视角服饰特征, 并将所述目标预设多视
角服饰特 征对应的服饰信息作为所述待识别的目标服饰的识别结果。
8.一种服饰识别装置, 其特 征在于, 所述装置包括:
第一获取模块, 用于获取多张包含不同服饰视角的服饰图像; 多张所述服饰图像中待
识别的目标服饰为相同的服饰款式;
视角识别模块, 用于对每张所述服饰图像进行服饰视角识别, 确定所述服饰图像中待
识别的目标服饰对应的服饰视角;
特征提取模块, 用于对每张所述 服饰图像进行 特征提取, 得到第一 服饰特征;
多视角识别模块, 用于融合多张所述服饰图像对应的第一服饰特征和服饰视角, 得到
所述待识别的目标服饰对应的多视角服饰特征, 以基于所述多视角服饰特征得到所述待识
别的目标服饰的识别结果。
9.一种终端, 其特征在于, 包括: 处理器、 存储器及存储在所述存储器上并可在所述处
理器上运行的计算机程序, 所述计算机程序被所述处理器执行时实现如权利要求1至7任一
所述的服饰识别方法。
10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储计算机程
序, 所述计算机程序被处 理器执行时实现如权利要求1至7任一所述的服饰识别方法。权 利 要 求 书 2/2 页
3
CN 114863405 A
3
专利 一种服饰识别方法、装置、终端及存储介质
安全报告 >
其他 >
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 07:34:48上传分享