(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210310895.3 (22)申请日 2022.03.28 (71)申请人 南京邮电大 学 地址 210003 江苏省南京市 鼓楼区新模范 马路66号 (72)发明人 范保杰 蔡达 丛杨 徐丰羽  (74)专利代理 机构 南京正联知识产权代理有限 公司 32243 专利代理师 张玉红 (51)Int.Cl. G06V 10/56(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06T 3/40(2006.01)G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06V 10/774(2022.01) G06V 20/05(2022.01) (54)发明名称 一种基于空间特征自监督的水下目标检测 方法 (57)摘要 本发明是一种基于空间特征自监督的水下 目标检测方法, 包括如下步骤: 步骤1: 采集数据, 构建检测任务所需的数据集; 步骤2: 行数据增 强, 扩充原有数据并进行手工标注; 步骤3: 搭建 自监督对比学习网络, 使用空间注 意力和通道归 一化使得主干网络适应水下目标检测任务; 步骤 4: 构建水下目标检测网络框架; 步骤5: 训练水下 目标检测网络, 得到针对海产品的水下目标检测 的网络的权重模型; 步骤6: 根据权重模型, 对已 划分的验证集进行结果预测来评估实际应用中 的检测效果。 发 明能够有效地针对 水下生物的特 点进行对象识别定位; 通过自监督学习, 使得网 络能适应特定的水下场景; 本发 明提出的方法可 以完美地适应水下检测任务。 权利要求书3页 说明书8页 附图2页 CN 114663683 A 2022.06.24 CN 114663683 A 1.一种基于空间特征自监督的水下目标检测方法, 其特征在于: 所述水下目标检测方 法包括如下步骤: 步骤1: 采集数据, 通过光学相机获取水下照片, 包含所需检测的海产品, 构建检测任务 所需的数据集; 步骤2: 数据扩充, 对步骤1获取的水下光学数据进行数据增强, 扩充原有数据并进行手 工标注, 使得训练集占80%, 验证集占剩余的20%; 步骤3: 搭建自监督对比学习网络, 使用空间注意力和通道归一化使得主干网络适应水 下目标检测任务; 步骤4: 构建水下目标检测网络框架, 所述水下目标检测网络框架包括特征提取主干网 络、 特征金字塔网络和基于特 征解耦的特 征选择检测头; 步骤5: 训练水下目标检测网络, 将采集的样本数据通过旋转、 裁剪、 缩放输入搭建好的 网络, 得到针对 海产品的水 下目标检测的网络的权 重模型; 步骤6: 根据步骤5训练得到的权重模型, 对已划分的验证集进行结果预测来评估实际 应用中的检测效果。 2.根据权利要求1所述一种基于空间特征自监督的水下目标检测方法, 其特征在于: 步 骤4中特征金字塔网络包含不同分辨率大小的5个层级, 前三个层级P1、 P2、 P3由特征提取网 络的后三层得到, P4、 P5在P3的基础上分别做了一次和两次的下采样。 3.根据权利要求2所述一种基于空间特征自监督的水下目标检测方法, 其特征在于: 步 骤4中特征金字塔网络中5个层级的输出步骤为: 步骤4‑1: 对5个层级设置学习参数, 通过双线性插值实现不同层之间的融合, 最终实现 自适应的加权融合, 特 征金字塔层的处 理表示为以下公式: OUTi=F(Wi1*P1+Wi2*P2+Wi3*P3+Wi4*P4+Wi5*P5) 其中(wi1,wi2,wi3,wi4,wi5)表示不同层级间的可学习权重, (P1,P2,P3,P4,P5)表示五个层 级不同分辨 率的特征图, F表示使用3DMaxPo oling; 步骤4‑2: 在加权融合后引入3DMaxPooling进行特征冗余抑制, 3DMaxPooling首先将输 入特征图经过一个3 ×3卷积核, 然后经过插值获得相邻层级之间相同大小的特征图, 通过 3Dmaxpool挖掘潜在的空间特征关系, 去除冗余的特征, 特征冗余抑制的过程表示为以下公 式: ys=max{xs,k=Bilinear(xk)} 其中, s代表当前层的特征图, k表示相邻层级的特征图, y表示最终输出, Bilinear表示 插值方式; 步骤4‑3: 最后将输入特 征图与3Dmaxpo ol相加得到的结果送入GN ‑RELU层。 4.根据权利要求1所述一种基于空间特征自监督的水下目标检测方法, 其特征在于: 步 骤4中所述特征选择检测头包括分类分支、 回归分支和中心度分支, 所述分类分支 通过采样 选择网格中间部分作为正样本, 所述回归分支采用边界提取模块提取边界特征以进行更加 精确的边界定位, 所述中心度分支用来计算样本偏离中心的程度, 其 值在0到1之间。 5.根据权利要求4所述一种基于空间特征自监督的水下目标检测方法, 其特征在于: 所 述分类分支通过采样选择网络中间部分作为 正样本的选择 过程表示 为以下公式: x′1=c′x‑0.5w ε权 利 要 求 书 1/3 页 2 CN 114663683 A 2y′1=c'y‑0.5h ε x′2=c′x+0.5w ε y'2=c'y+0.5h ε 其中ε是缩放系数, 默认值为0.3, c'x,c'y是中心坐标, w和h分别为真实框的宽和高, [x′1,y′1,x'2,y'2]为特征提取后, 特征图中对象的真实位置, 它经过了不同倍数的下采样, 由真实框除以2l得到, l为下采样倍数。 6.根据权利要求4所述一种基于空间特征自监督的水下目标检测方法, 其特征在于: 所 述回归分支的边界定位具体为: 回归分支采用两次回归级联的方式, 使用第一次的回归结 果, 计算回归框四个边界上的最大值点, 通过插值找到原图中像素位置, 使用该像素进行回 归任务, 最终 获得更加精细的对象定位。 7.根据权利要求1所述一种基于空间特征自监督的水下目标检测方法, 其特征在于: 所 述步骤3中自监 督对比学习网络包 含在线分支和目标分支, 所述在线分支的特征编码器由ResNet50构成, 所述在线分支包括特征编码器、 空间特 征注意力、 通道归一化结构和两个线性投影层, 所述特征编码器在最前面, 所述空间特征注 意力以所述特征编 码器的输出为输入, 通道归一化结构又以所述空间特征注意力的输出作 为输入, 最后将输出的特 征经过两个线性投影层进行编码; 所述目标分支的特征编码器由ResNet50构成, 所述目标分支包括特征编码器和一个线 性投影层, 所述特 征编码器的输出直接送入线性投影层。 8.根据权利要求1所述一种基于空间特征自监督的水下目标检测方法, 其特征在于: 所 述步骤2中对数据进行增强的方法主 要包括颜色颜色恢复和光照变化。 9.根据权利要求8所述一种基于空间特征自监督的水下目标检测方法, 其特征在于: 所 述颜色恢复采用白平衡方式, 具体包括如下步骤: 步骤2‑1: 在采集完包含水下生物的图片后, 将预先设置的比色卡置于水中, 用相机拍 摄带有标准比色卡的水 下场景图片, 步骤2‑2: 使用op encv将带有标准比色卡的水下图片离散化为红、 绿、 蓝三个通道, 提取 比色卡中为红、 绿、 蓝颜色的位置 步骤2‑3: 根据红、 绿、 蓝颜色的位置获取像素值, 通过与标准色彩的离散值进行对比, 计算出实际补偿值, 补偿值v的计算如下: vred=cred‑c′red vgreen=cgreen‑c′green vblue=cblue‑c′blue 其中v有三个值, 分别 对应红、 绿、 蓝三个颜色通道, c'表示标准比色卡离散化后的像素 值, c表示所提取颜色离 散化后的像素值; 步骤2‑4: 将所有采集的数据图像的三个颜色通道与对应的补偿值相加, 得到最终的增 强图片。 10.根据权利要求1所述一种基于空间特征自监督的水下目标检测方法, 其特征在于: 所述步骤5训练水下目标检测网络的训练过程是: 将步骤2中增强过的水下图片 输入到检测 网络, 使用SGD作为优化方法, 在前500次迭代采样线性warm  up策略, 逐渐增加学习率至 0.005, 并且在总迭代次数的80%和90%分别进行10倍学习率衰减, 进行36轮基础训练后保权 利 要 求 书 2/3 页 3 CN 114663683 A 3

.PDF文档 专利 一种基于空间特征自监督的水下目标检测方法

安全报告 > 其他 > 文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于空间特征自监督的水下目标检测方法 第 1 页 专利 一种基于空间特征自监督的水下目标检测方法 第 2 页 专利 一种基于空间特征自监督的水下目标检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常2024-03-18 07:34:01上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。