(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211217811.8 (22)申请日 2022.09.30 (71)申请人 云南大学 地址 650091 云南省昆明市五华区翠湖北 路2号 申请人 云南览易网络科技有限责任公司 (72)发明人 廖赟 邸一得 周豪 朱开军  (74)专利代理 机构 昆明金科智诚知识产权代理 事务所(普通 合伙) 53216 专利代理师 彭志鼎 (51)Int.Cl. G06V 10/75(2022.01) G06V 10/774(2022.01) G06V 10/44(2022.01) G06V 10/80(2022.01)G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于多重特征匹配的多模态图像特征匹配 方法 (57)摘要 本发明提供一种基于多重特征匹配的多模 态图像特征匹配方法, 该方法使用数据增强, 对 不同模态的一组图像进行仿射变换和随机裁剪, 生成增强后的图像数据和相应的匹配矩阵GT_ Matrix; 设计卷积神经网络和特征金字塔提取多 尺度的图像特征; 设计Transformer网络进一步 对1/8尺寸的粗粒度特征进行提取, 生成粗粒度 的注意力特征; 使用双向softmax处理细粒度的 注意力特征, 生成置信度矩阵, 以匹配矩阵GT_ Matrix为标签进行粗匹配; 设计局部特征窗口, 通过Transformer和卷积神经网络 特征融合和特 征提取, 进行精化回归; 使用精化回归对粗匹配 的预测结果进行再调整, 最终实现精确的多模态 图像特征匹配。 权利要求书4页 说明书15页 附图10页 CN 115496928 A 2022.12.20 CN 115496928 A 1.基于多重特 征匹配的多模态图像特 征匹配方法, 其特 征在于, 包括以下步骤: S1: 使用数据增强方法, 对不同模态的一组图像进行仿射变换和随机裁剪, 生成增强后 的图像数据和相应的匹配矩阵GT_Mat rix; S2: 设计卷积神经网络和特征金字塔提取多尺度的图像特征, 分别为1/8尺寸特征和1/ 2尺寸特征; S3: 设计Transformer网络进一步对1/8尺寸的粗粒度特征进行提取, 生成粗粒度的注 意力特征; S4: 使用双向softmax函数处理粗粒度的注意力特征, 生成置信度矩阵, 再以匹配矩阵 GT_Matrix为标签进行粗匹配; S5: 设计局部特征窗口, 通过Transformer和卷积神经网络特征融合和特征提取, 进行 精化回归; S6: 使用精化回归对粗匹配的预测结果进行再调整, 最终实现精确的多模态图像特征 匹配。 2.根据权利要求1所述的基于多重特征匹配的多模态图像特征匹配方法, 其特征在于, 所述S1中, 生成增强后的图像数据和相应的匹配矩阵GT_Mat rix, 具体如下: 输入为不同模态的索引图Imgq和参考图Imgr, 输出分别为原始图像的随机增强图像Iq、 Ir, 以及增强图像Iq和Ir之间的补丁级匹配标签GT矩阵; 对两种不同模态的图像分别进行随机裁剪, 如果裁剪后的Im gq和Imgr重叠, 则重叠部分 可以相互转 化; Iq和Ir的获取方式如下: Iq=RandomCrop(QM ×Imgq) Ir=RandomCrop(RM ×Imgr) 其中, 在图像增强过程中, RM是在索引图Imgq上的随机仿射矩阵, QM是在参考图Imgr上 的随机仿射矩阵; RandomCrop表示在图像上的随机 仿射变换。 3.根据权利要求1或2所述的基于多重特征匹配的多模态图像特征匹配方法, 其特征在 于, 所述S1中, 生成相应的匹配矩阵GT_Mat rix, 具体如下: 将增强图像Iq划分为N=W/p ×H/p网格, 其中N为网格 数, W和H为图像的高度和宽度, p × p为网格单元格大小; 对于每个网格单元, 定义一个网格单元坐标, 其中第n个网格单元坐标 计算如下: 上式中, 是Iq图像的网格单元格坐标, n为网格数, W为图像 的高度, p是网格单 元格的边长, 其中 n=0,…n; 将增强图像Iq中所有网格的中心点作为 查询点, 其索引点像素坐标 定义如下: 上式中, 是Iq图像的网格单元格坐标, 是获取索引点坐 标的函数, p是网格单 元格的边长;权 利 要 求 书 1/4 页 2 CN 115496928 A 2将参考图Im gr中与查询点对应的点定义为参考点, 其参考点的像素坐标定义为 参考点是通过从查询点获得的, 使用的是与图像仿射变换相同的矩阵; 通过变换从查询点 得到参考点, 其表达式如下: 上式中, 是索引点像素坐标, 是获取参考点坐标的函 数; 获得参考点的像素坐标 后, 提取参 考点的网格单 元坐标为: 上式中, 是Ir图像的网格单元格坐标, 是获取网格单元格坐标的 函数, []表示向下 取整数; Iq的网格单 元在Ir中的映射计算如下: 上式中, 由于Ir只与Iq部分重叠, 可能在Ir图像的内部 或外部, 如果 在 Ir图像中, 则: GT矩阵是N ×N的方阵, GT(i, j)表示GT矩阵第i行第j列的元素, 如果GT(i, j)=1, 则表 示图像Iq中的第i个网格单 元与图像Ir中的第j个网格单 元匹配。 4.根据权利要求1所述的基于多重特征匹配的多模态图像特征匹配方法, 其特征在于, 所述S2中, 设计卷积神经网络和特 征金字塔提取多尺度的图像特 征, 具体如下: 网络接受大小为320 ×320×3的数据, 输出大小为1/8尺寸特征和1/2尺寸特征, 1/8尺 寸特征是40 ×40×512, 1/2尺寸特征是160 ×160×320, 结合带有特征金字塔的卷积神经网 络融合低分辨率语义信息和高分辨率空间信息的特征图, 增强后的数据通过带有 特征金字 塔的卷积神经网络生成两组不同尺度的特 征。 5.根据权利要求1所述的基于多重特征匹配的多模态图像特征匹配方法, 其特征在于, 所述S3中, 设计Transformer网络进一步对1/8尺寸的粗粒度特征进行提取, 生成粗粒度的 注意力特 征, 具体如下: 设计的Transformer网络使用线性注意力机制代替 点积注意力机制; 设计的Transformer包含自我注意层和交叉注意层, 输入序列f是由特征Fq加上它的位 置数据p得到的; 位置编码以正弦格式为每个元素提供唯一的位置信息, 通过添加位置编 码, 转换后的特征变得与位置相关, 使基于多重特征匹配的多模态图像特征匹配方法即使 在模糊的区域 也能生成匹配; 在自我注意层中, Q、 K和V由相同的输入序列f产生, 从而学习到一张图片内部特征之间 的关系; 在交叉注意层中, Q由一个输入序列fi生成, K和 V由另一个输入序列fj生成, 从而学 习不同模态的成对图像之间的关系; 特征通过4个交替的自注意层和交叉注意层生成输出权 利 要 求 书 2/4 页 3 CN 115496928 A 3

.PDF文档 专利 基于多重特征匹配的多模态图像特征匹配方法

安全报告 > 其他 > 文档预览
中文文档 30 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共30页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于多重特征匹配的多模态图像特征匹配方法 第 1 页 专利 基于多重特征匹配的多模态图像特征匹配方法 第 2 页 专利 基于多重特征匹配的多模态图像特征匹配方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常2024-03-18 04:41:20上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。