(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210488938.7 (22)申请日 2022.05.07 (71)申请人 西南科技大 学 地址 612010 四川省绵阳市涪城区青龙 大 道中段59号 (72)发明人 张红英 张奇 罗向东  (51)Int.Cl. G06V 20/17(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) (54)发明名称 一种面向无人机航拍图像的小目标检测方 法 (57)摘要 本发明给出一种面向无人机航拍图像的小 目标检测方法。 首先, 针对目标尺寸较小的问题, 改变了检测头尺寸, 以获得更多小目标的原始信 息; 其次, 为了在复杂场景中准确检测到密集连 续的小目标, 在特征提取阶段采用融合了CB AM注 意力机制的残差卷积模块, 为训练图片中密集连 接的感兴趣区域增加权重; 然后, 为了缓解背景 杂乱, 像素模糊带来的问题, 引入跳跃多尺度特 征增强模块, 在自顶向下的特征融合中增加两条 相同尺度残差路径, 三条跨尺度残差路径, 将浅 层特征信息和深层特征信息充分融合, 让不同尺 度的检测头得到足够的图像语义信息和空间信 息。 本发明利用多方向跳跃残差连接路径融合图 像多尺度特征, 实现了优异的小目标检测性能, 具有广泛的适用性。 权利要求书2页 说明书5页 附图3页 CN 114863301 A 2022.08.05 CN 114863301 A 1.一种面向无人机航拍图像的小目标检测方法, 其特征在于, 引入融合注意力机制的 残差结构进行特征提取和多向多尺度 残差跳跃路径进 行特征融合, 并通过不同尺度的无锚 预测方式进行多个检测头预测, 该方法包括数据集预处理、 对无人机小目标数据集进行特 征提取、 对于来自不同阶段的特征进行特征融合、 对融合后的特征图进行不同尺度的分类 和回归预测、 网络训练与测试五个部分; 第一部分包括两个步骤: 步骤1, 下载无人机小目标公开数据集VisDrone, 选取自然场景复杂、 角 度多样和光照 变化剧烈的图像作为测试集, 将测试集图片尺寸统一到640 ×640大小, 对测试集不进行任 何的图像增强; 步骤2, 对训练数据集的图片大小进行重置, 将图片调整至640 ×640像素, 在训练总轮 次的前90%对数据集进行马赛克数据增强, 将训练集中每一张图片进行四次分割、 翻转, 然 后将翻转后的图片分别放置在 对应分割位置上最后对图片进 行色域变换等操作, 增强训练 样本集, 得到最终的训练样本; 第二部分包括两个步骤: 步骤3, 通过Focus结构将训练图片宽高信息集中到通道上, 并将通道数从原来的3通道 扩大到64通道, 接着进行一个1 ×1的卷积拓张通道数扩充信息, 使用SILU激活函数增加网 络模型的非线性因素; 步骤4, 然后利用如图1中的四个残差模块Resblock1、 Resblock2、 Resblock3、 Resblock4对图像信息特征进行提取, 分别输出中间层的4个特征图feat0、 feat1、 feat2、 feat3, 通道数分别为128、 25 6、 512、 1024; 第三部分包括四个步骤: 步骤5, 将步骤4中得到的特征图feat0、 feat1、 feat2和feat3分别经过多尺度跳跃残差 处理, 在自底向上路径中共进行3次concatenate操作, 同时增加另一条自底向上的路径, 将 最底层特征图feat3和最浅层特征图feat0进行跨多尺度跳跃连接得到融合特征图P0、 P1、 P2 步骤6, 将步骤5得到的P0、 P1、 P2经过自顶向下路径再次进行深层的特征融合, 得到不 同尺度相互融合的特 征图P3和P4; 步骤7, 在步骤5和步骤6的基础上, 在进行自顶而下的特征融合时额外增加两条相同尺 度残差路径, 将步骤6得到的P3和P4与特征提取得到的feat1和feat2进行跳跃融合得到特 征图P5和P6; 步骤8, 再增加两条自底向上路径, 将步骤4中的feat3与步骤7中的P6再次融合得到特 征图P7, 同时将步骤3中的P0与步骤7中的P5再次融合得到P 8, 具体实施如下: 将feat3经过一个2倍的邻近插值上采样得到40 ×40的特征图, 然后进行一个1 ×1的卷 积、 归一化和SILU激活函数得到大小不变、 通道数为512的特征图, 紧接着与步骤 7中的P6再 次融合, 同样的, 将步骤5中的P 0经过一个特征提取模块之后的特征图进 行两倍的邻近插值 上采样然后进行1 ×1的卷积调整通道数为258, 与步骤7中的P5用co ncatenate进行融合; 第四部分包括两个步骤: 步骤9, 增加一个Head0检测头, 丢弃原始YOLOX网络中的Head3检测头, 将步骤5得到的 特征图P2通过一个融合了CBAM注意力机制的特征提取强化模块, 然后输入到Head0中完成权 利 要 求 书 1/2 页 2 CN 114863301 A 2小目标检测的目标 预测, 具体实施如下: 步骤9‑1, 将feat0特征利用起来, 引入到特征融合结构新增的特征融合模块中, 由 feat0产生一个160 ×160×128的检测头H ead0, 并且将feat 3产生的20 ×20×1024的检测头 Head3丢弃; 步骤9‑2, 特征提取强化模块如图3所示, 输入 的特征分别进行2个1 ×1卷积, 分为两个 支路, 其中一个支路再进行 n次残差结构Bottleneck的堆叠, 而Bottleneck的一条支路经过 一个1×1卷积和一个3 ×3卷积进行特征提取, 此时在两个1 ×1卷积和3 ×3卷积之间加入 CBAM注意力机制, Bottleneck的另一条支路不做任何操作, 将Bottleneck的两条支路用add 进行融合, 随着Bottleneck的 n次堆叠CBAM也重复 n次; 另外一个支路是残差边支路, 仅进行 一个1×1的卷积操作, 最后将两条支路用co ncatenate 连接起来输出; 步骤10, 将步骤8得到的特征图P7和P8分别经过一个不同输入的特征提取模块, 将提取 后的特征信息分别输入到80 ×80×256大小的检测头Head1和40 ×40×512大小的检测头 Head2中完成小目标检测的目标 预测; 步骤11, 将步骤9和步骤10中的检测头Head0、 Head1和Head2通过两个支路的卷积来分 别完成小目标检测的分类和回归 任务; 第五个部分包括两个步骤: 步骤12, 调试从步骤3到步骤10 的网络结构超参数, 设置网络模型参数, 其中, epoch设 置为130, 采用迁移训练, 在前50个epoch中冻结主干网络, 学习率设置为0.001, 加载预训练 模型, bach  size设置为4; 后80个epoch解冻 主干网络, 学习率设置为0.0001, bach  size设 置为2, 每1个epoc h后将学习率降为原来的0.9 2, 训练后得到最终的训练模型; 步骤13, 将步骤1中测试集输入步骤11中的训练模型中, 得到无人机小目标检测的测试 结果。 2.根据权利要求1所述的一种面向无人机航拍图像的小目标检测方法, 其特征在于, 步 骤5和步骤7增加多条反向递归路径的特征融合, 为浅层特征层增加深层特征信息的细粒 度。 3.根据权利要求1所述的一种面向无人机航拍图像的小目标检测方法, 其特征在于, 步 骤8增加两条自底向上路径, 将第一次融合后的特征经通道数转换进一步进行特征融合, 丰 富了上下文语义信息的多样性。 4.根据权利要求1所述的一种面向无人机航拍图像的小目标检测方法, 其特征在于, 步 骤9使用CBAM注意力机制将关注度放在利于样本分类的特 征上, 减少了特 征冗余。 5.根据权利要求1所述的一种面向无人机航拍图像的小目标检测方法, 其特征在于, 步 骤9中采用增加一个Head0检测头, 丢弃原始Y OLOX网络中的Head3检测头的方式来改进检测 头尺寸。权 利 要 求 书 2/2 页 3 CN 114863301 A 3

.PDF文档 专利 一种面向无人机航拍图像的小目标检测方法

安全报告 > 其他 > 文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种面向无人机航拍图像的小目标检测方法 第 1 页 专利 一种面向无人机航拍图像的小目标检测方法 第 2 页 专利 一种面向无人机航拍图像的小目标检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常2024-03-18 07:35:57上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。