专利 一种基于空间特征自监督的水下目标检测方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210310895.3 (22)申请日 2022.03.28 (71)申请人南京邮电大学地址 210003 江苏省南京市鼓楼区新模范马路66号 (72)发明人范保杰　蔡达　丛杨　徐丰羽　 (74)专利代理机构南京正联知识产权代理有限公司 32243 专利代理师张玉红 (51)Int.Cl. G06V 10/56(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06T 3/40(2006.01)G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06V 10/774(2022.01) G06V 20/05(2022.01) (54)发明名称一种基于空间特征自监督的水下目标检测方法 (57)摘要本发明是一种基于空间特征自监督的水下目标检测方法，包括如下步骤：步骤1：采集数据，构建检测任务所需的数据集；步骤2：行数据增强，扩充原有数据并进行手工标注；步骤3：搭建自监督对比学习网络，使用空间注意力和通道归一化使得主干网络适应水下目标检测任务；步骤 4：构建水下目标检测网络框架；步骤5：训练水下目标检测网络，得到针对海产品的水下目标检测的网络的权重模型；步骤6：根据权重模型，对已划分的验证集进行结果预测来评估实际应用中的检测效果。发明能够有效地针对水下生物的特点进行对象识别定位；通过自监督学习，使得网络能适应特定的水下场景；本发明提出的方法可以完美地适应水下检测任务。权利要求书3页说明书8页附图2页 CN 114663683 A 2022.06.24 CN 114663683 A 1.一种基于空间特征自监督的水下目标检测方法，其特征在于：所述水下目标检测方法包括如下步骤：步骤1：采集数据，通过光学相机获取水下照片，包含所需检测的海产品，构建检测任务所需的数据集；步骤2：数据扩充，对步骤1获取的水下光学数据进行数据增强，扩充原有数据并进行手工标注，使得训练集占80％，验证集占剩余的20％；步骤3：搭建自监督对比学习网络，使用空间注意力和通道归一化使得主干网络适应水下目标检测任务；步骤4：构建水下目标检测网络框架，所述水下目标检测网络框架包括特征提取主干网络、特征金字塔网络和基于特征解耦的特征选择检测头；步骤5：训练水下目标检测网络，将采集的样本数据通过旋转、裁剪、缩放输入搭建好的网络，得到针对海产品的水下目标检测的网络的权重模型；步骤6：根据步骤5训练得到的权重模型，对已划分的验证集进行结果预测来评估实际应用中的检测效果。 2.根据权利要求1所述一种基于空间特征自监督的水下目标检测方法，其特征在于：步骤4中特征金字塔网络包含不同分辨率大小的5个层级，前三个层级P1、 P2、 P3由特征提取网络的后三层得到， P4、 P5在P3的基础上分别做了一次和两次的下采样。 3.根据权利要求2所述一种基于空间特征自监督的水下目标检测方法，其特征在于：步骤4中特征金字塔网络中5个层级的输出步骤为：步骤4‑1：对5个层级设置学习参数，通过双线性插值实现不同层之间的融合，最终实现自适应的加权融合，特征金字塔层的处理表示为以下公式： OUTi＝F(Wi1*P1+Wi2*P2+Wi3*P3+Wi4*P4+Wi5*P5) 其中(wi1,wi2,wi3,wi4,wi5)表示不同层级间的可学习权重， (P1,P2,P3,P4,P5)表示五个层级不同分辨率的特征图， F表示使用3DMaxPo oling；步骤4‑2：在加权融合后引入3DMaxPooling进行特征冗余抑制， 3DMaxPooling首先将输入特征图经过一个3 ×3卷积核，然后经过插值获得相邻层级之间相同大小的特征图，通过 3Dmaxpool挖掘潜在的空间特征关系，去除冗余的特征，特征冗余抑制的过程表示为以下公式： ys＝max{xs,k＝Bilinear(xk)} 其中， s代表当前层的特征图， k表示相邻层级的特征图， y表示最终输出， Bilinear表示插值方式；步骤4‑3：最后将输入特征图与3Dmaxpo ol相加得到的结果送入GN ‑RELU层。 4.根据权利要求1所述一种基于空间特征自监督的水下目标检测方法，其特征在于：步骤4中所述特征选择检测头包括分类分支、回归分支和中心度分支，所述分类分支通过采样选择网格中间部分作为正样本，所述回归分支采用边界提取模块提取边界特征以进行更加精确的边界定位，所述中心度分支用来计算样本偏离中心的程度，其值在0到1之间。 5.根据权利要求4所述一种基于空间特征自监督的水下目标检测方法，其特征在于：所述分类分支通过采样选择网络中间部分作为正样本的选择过程表示为以下公式： x′1＝c′x‑0.5w ε权　利　要　求　书 1/3 页 2 CN 114663683 A 2y′1＝c'y‑0.5h ε x′2＝c′x+0.5w ε y'2＝c'y+0.5h ε 其中ε是缩放系数，默认值为0.3， c'x,c'y是中心坐标， w和h分别为真实框的宽和高， [x′1,y′1,x'2,y'2]为特征提取后，特征图中对象的真实位置，它经过了不同倍数的下采样，由真实框除以2l得到， l为下采样倍数。 6.根据权利要求4所述一种基于空间特征自监督的水下目标检测方法，其特征在于：所述回归分支的边界定位具体为：回归分支采用两次回归级联的方式，使用第一次的回归结果，计算回归框四个边界上的最大值点，通过插值找到原图中像素位置，使用该像素进行回归任务，最终获得更加精细的对象定位。 7.根据权利要求1所述一种基于空间特征自监督的水下目标检测方法，其特征在于：所述步骤3中自监督对比学习网络包含在线分支和目标分支，所述在线分支的特征编码器由ResNet50构成，所述在线分支包括特征编码器、空间特征注意力、通道归一化结构和两个线性投影层，所述特征编码器在最前面，所述空间特征注意力以所述特征编码器的输出为输入，通道归一化结构又以所述空间特征注意力的输出作为输入，最后将输出的特征经过两个线性投影层进行编码；所述目标分支的特征编码器由ResNet50构成，所述目标分支包括特征编码器和一个线性投影层，所述特征编码器的输出直接送入线性投影层。 8.根据权利要求1所述一种基于空间特征自监督的水下目标检测方法，其特征在于：所述步骤2中对数据进行增强的方法主要包括颜色颜色恢复和光照变化。 9.根据权利要求8所述一种基于空间特征自监督的水下目标检测方法，其特征在于：所述颜色恢复采用白平衡方式，具体包括如下步骤：步骤2‑1：在采集完包含水下生物的图片后，将预先设置的比色卡置于水中，用相机拍摄带有标准比色卡的水下场景图片，步骤2‑2：使用op encv将带有标准比色卡的水下图片离散化为红、绿、蓝三个通道，提取比色卡中为红、绿、蓝颜色的位置步骤2‑3：根据红、绿、蓝颜色的位置获取像素值，通过与标准色彩的离散值进行对比，计算出实际补偿值，补偿值v的计算如下： vred＝cred‑c′red vgreen＝cgreen‑c′green vblue＝cblue‑c′blue 其中v有三个值，分别对应红、绿、蓝三个颜色通道， c'表示标准比色卡离散化后的像素值， c表示所提取颜色离散化后的像素值；步骤2‑4：将所有采集的数据图像的三个颜色通道与对应的补偿值相加，得到最终的增强图片。 10.根据权利要求1所述一种基于空间特征自监督的水下目标检测方法，其特征在于：所述步骤5训练水下目标检测网络的训练过程是：将步骤2中增强过的水下图片输入到检测网络，使用SGD作为优化方法，在前500次迭代采样线性warm up策略，逐渐增加学习率至 0.005，并且在总迭代次数的80％和90％分别进行10倍学习率衰减，进行36轮基础训练后保权　利　要　求　书 2/3 页 3 CN 114663683 A 3

专利 一种基于空间特征自监督的水下目标检测方法

专利一种基于空间特征自监督的水下目标检测方法