(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210978054.X (22)申请日 2022.08.16 (71)申请人 中国人民解 放军军事科学院国防科 技创新研究院 地址 100071 北京市丰台区东大街5 3号 (72)发明人 牛戈 郭鹏宇 刘勇 张飞  季明江 冉德超  (74)专利代理 机构 北京奥文知识产权代理事务 所(普通合伙) 11534 专利代理师 张文 (51)Int.Cl. G06V 20/13(2022.01) G06V 10/25(2022.01) G06V 10/26(2022.01) G06V 10/28(2022.01)G06V 10/44(2022.01) G06V 10/764(2022.01) G06V 10/774(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06T 3/00(2006.01) G06T 7/246(2017.01) (54)发明名称 基于分割的图像目标快速 检测方法 (57)摘要 本发明公开了一种基于分割的图像目标快 速检测方法, 包括: 准备训练数据; 构建神经网络 模型, 使用嵌入 可变形卷积的残差网络作为用于 特征提取的骨干网络, 通过对特征金字塔各层特 征进行上采样和相加操作, 使得特征金字塔各层 融合为原输入 图像的1/4尺寸的新特征图, 将获 取的新特征图通过标签学习生成概率图和 阈值 图, 再由可微分二值化公式将生成的概率图和阈 值图生成近似二值化图; 设定优化方法; 检测目 标, 将待检测图像输入神经网络模型, 加载之前 得到的网络权重, 通过轮廓追踪算法生成舰船目 标边界框。 本方法使用自适应阈值替代了固定阈 值, 能够更精确地过滤目标背景; 在需要生成检 测框时, 无需复杂的后处理过程, 能够减少计算 量, 提高运 算速度。 权利要求书3页 说明书9页 附图6页 CN 115471755 A 2022.12.13 CN 115471755 A 1.一种基于分割的图像目标 快速检测方法, 其特 征在于, 所述方法包括: S1: 准备训练数据, 对4点坐标形式标注的舰船目标训练图像进行离线数据增 强, 将原 始数据以及经由离线数据增强后生成的数据一 起作为训练样本; S2: 构建神经网络模型, 使用嵌入可变形卷积的残差网络作为用于特征提取的骨干网 络, 通过对特征金字塔各层特征进行上采样和相加操作, 使得特征金字塔各层融合为原输 入图像的1/4尺寸的新特征图, 将获取的新特征图通过标签学习生成概率图和阈值图, 再由 可微分二 值化公式将生成的概 率图和阈值图生成近似二 值化图; S3: 设定优化方法, 借助训练样本, 计算神经网络模型中概率图、 阈值 图和近似二值化 图的损失并进行优化, 保存通过神经网络模型 得到的网络 权重; S4: 检测目标, 将待检测图像输入神经网络模型, 加载之前得到的网络权重, 通过轮廓 追踪算法生成舰船目标边界框 。 2.根据权利要求1所述的一种基于分割的图像目标快速检测方法, 其特征在于, 在所述 S1中, 所述对4 点坐标形式标注的舰船目标训练图像进行离线数据增强, 包括: 将舰船目标训练图像连带(x1, y1, x2, y2, x3, y3, x4, y4)格式标注的真实标签一同进行 离线数据增强, 其中, 所述离线 数据增强包括: 旋转图像、 随机改变图像亮度、 对图像随机添 加高斯噪声。 3.根据权利要求2所述的一种基于分割的图像目标快速检测方法, 其特征在于, 所述离 线数据增强 中的旋转图像操作包括: 对图像使用仿射变换实现随机角度旋转, 其中, 变换公 式如下: 在上式中, θ表示旋转角度, (x, y)表示选定的旋转目标在图像中的原始坐标, (x ′, y′) 表示选定的旋转目标对应生成的新 坐标。 4.根据权利要求2所述的一种基于分割的图像目标快速检测方法, 其特征在于, 所述离 线数据增强中的随机改变图像亮度、 对图像随机添加高斯噪声包括: 利用Python中的 Scikit‑Image数字图片处 理包和Numpy包, 对图像加入随机亮度和随机噪声。 5.根据权利要求1所述的一种基于分割的图像目标快速检测方法, 其特征在于, 在所述 S2中, 所述使得 特征金字塔各层融合 为原输入图像的1/4尺寸的新特 征图, 包括: 将原始的训练图像的尺寸调整到固定大小, 输入至提取特征的骨干网络, 使用ResNet ‑ 50, 并在Co nv3、 Conv4、 Conv5层中使用可变形 卷积v2, 其计算方法如下: 在上式中, p表示输入, y(p)表示输出矩阵, pk表示卷积核参数集合R中的第k个点, △pk 表示神经网络模 型学习到的每个位置的偏移 量,△mk表示权重系数, △mk与△pk都通过一个 卷积层进行学习, 其中, 权重系数 △mk可以使神经网络模型区分变形卷积核覆盖 的区域是 否为感兴趣区域, 若对应区域 不包含目标, 则权 重系数为0 。 6.根据权利要求5所述的一种基于分割的图像目标快速检测方法, 其特征在于, 在所述 S2中, 包括:权 利 要 求 书 1/3 页 2 CN 115471755 A 2当训练样本经过嵌入可变形卷积的骨干网络提取特征后, 将生成得到的特征图输入特 征金字塔中, 特征金字塔中的五层特征图分别为C1、 C2、 C3、 C4、 C5, 五层特征图的尺寸分别 为原始训练图像的1/2、 1/4、 1/8、 1/16、 1/32, 然后通过对特征金字塔各层特征进行上采样 和相加操作, 将特 征金字塔各层融合 为原输入图像1/4尺寸的新特 征图, 之后, 将得到的新特征图通过标签学习生成概率图与阈值图, 概率图和近似二值化图 受相同标签的监督, 将每个舰船目标矩形标注框通过收缩一定的偏移量形成标签, 定义偏 移量的计算方法如下: 在上式中, D表示偏移量, L表示 边界框周长, A 表示边界框面积, 参数r 表示收缩比例; 对于阈值图训练使用的标签, 在由上式计算出偏移量之后, 将原真实标签收缩并扩张 偏移量的区域作为阈值图的标签, 将扩张框和收缩框之 间差集中各个像素点到原真实标签 边界的归一 化距离作为区域内各像素的值, 使得区域内每 个像素的值 不完全相同。 7.根据权利要求6所述的一种基于分割的图像目标快速检测方法, 其特征在于, 在所述 S2中, 还包括: 在训练过程中, 近似二值化图由概率图和阈值图经可微分二值化处理后生成, 可微分 二值化过程如下式所示: 在上式中, (i, j)表示图像中的位置, 表示生成 的近似二值化图, P表示概率图, T表示 神经网络模型中学习到的自适应阈值图, k表示超参数, k设为5 0。 8.根据权利要求7所述的一种基于分割的图像目标快速检测方法, 其特征在于, 在所述 S3中, 包括: 神经网络模型的损失函数L由多个损失组合而成, 具体为: L=Ls+α×Lb+β×Lt 在上式中, Ls表示概率图对应的损失, Lb表示近似二值化图对应的损失, Lt表示阈值图 对应的损失, 根据实际损失值的数量级, 将α 设为1.0, β 设为10 。 其中, 概率图对应的损失Ls使用二分类交叉熵损失函数, 具体为: 在上式中, Sl表示正负样本比例1:3的训练集, xi表示预测类别的概率, yi表示对应的真 实样本标签; 近似二值化图对应的损失Lb使用Dice Loss, 具体为: 在上式中, X表示预测的分割图像, Y表示真实标签; 阈值图对应的损失Lt使用L1 Loss, 具体为:权 利 要 求 书 2/3 页 3 CN 115471755 A 3

.PDF文档 专利 基于分割的图像目标快速检测方法

安全报告 > 其他 > 文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于分割的图像目标快速检测方法 第 1 页 专利 基于分割的图像目标快速检测方法 第 2 页 专利 基于分割的图像目标快速检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常2024-03-18 04:41:00上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。