(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210486074.5 (22)申请日 2022.05.06 (71)申请人 南京邮电大 学 地址 210003 江苏省南京市 鼓楼区新模范 马路66号 (72)发明人 张梦纯 高广谓 徐国安 吴飞  岳东  (74)专利代理 机构 南京苏科专利代理有限责任 公司 32102 专利代理师 杜春秋 (51)Int.Cl. G06V 10/26(2022.01) G06V 10/774(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01)G06N 3/04(2006.01) (54)发明名称 上下文聚合网络以及基于该网络的图像实 时语义分割方法 (57)摘要 本发明涉及一种用于实时语义分割的高效 多尺度上下文聚合网络, 包括下采样模块、 不对 称卷积模块、 多分支不对称卷积模块、 空间注意 模块、 通道注意模块和上采样模块, 所述不对称 卷积模块包括两个或三个不对称卷积单元, 所述 多分支不对称卷积模块包括三个多分支不对称 卷积单元。 本发 明网络主干分支的编码器与解码 器部分基本成对称关系。 在解码器最后, 对图像 进行一次上采样操作, 即可获得原始分辨率图 像。 最后一次上采样模块即为分类卷积, 其输出 为原始分辨率大小的最终预测结果, 将预测结果 与对应的语义标签进行对比, 目标函数设置为交 叉熵损失函数, 就可得到训练好的网络模型。 使 用这个训练好的网络模型, 方便进行图像语义分 割的结果预测。 权利要求书4页 说明书14页 附图3页 CN 114821061 A 2022.07.29 CN 114821061 A 1.一种上下文聚合网络, 其特征在于: 包括下采样模块、 不对称卷积模块、 多分支不对 称卷积模块、 空间注意模块、 通道注 意模块和上采样模块, 所述不对称卷积模块包括两个或 三个不对称卷积单 元, 所述多分支不对称卷积模块包括 三个多分支不对称卷积单 元。 2.根据权利要求1所述一种上下文聚合网络, 其特征在于: 所述不对称卷积模块在聚合 网络的编 码器部分分为第一编 码器不对称卷积模块和 第二编码器不对称卷积模块, 第一编 码器不对称卷积模块包含三个不对称卷积单元, 其卷积核为3, 第二编码 器不对称卷积模块 包含两个不对称卷积单元, 其卷积核为5; 所述不对称卷积模块在聚合网络的解码 器部分分 为第一解码 器不对称卷积模块和 第二解码器不对称卷积模块, 第一解码 器不对称卷积模块 由两个不对称卷积单元组成, 其卷积核为5, 第二解码 器不对称卷积模块由两个不对称卷积 单元组成, 其卷积核为3 。 3.根据权利要求1所述一种上下文聚合网络, 其特征在于: 所述多分支不对称卷积单元 包含四个不对称卷积分支, 每个不对称卷积分支采用不对称空洞卷积, 其卷积核分别为3, 5, 7, 9, 扩张率均为2。 4.根据权利要求1所述一种上下文聚合网络, 其特征在于: 所述下采样模块包含一个卷 积层和一个池化层, 所述卷积层的核为3 ×3, 所述池化层的步幅为2; 所述上采样模块包含 一个核为3 ×3, 步幅为2的反卷积层。 5.基于权利要求1至4任一项所述上下文聚合网络的图像实时语义分割方法, 其特征在 于, 包括以下步骤: 步骤1、 构建基于轻量级对称网络的实时语义分割网络模型, 包含下采样模块、 不对称 卷积模块、 多分支不对称卷积模块、 空间注意模块、 通道 注意模块、 上采样模块; 步骤2、 初始输入图像输入到下采样模块进行第一次下采样, 以提取出初始图像的特 征, 并且将其图像分辨 率变为1/2, F1=Down(Fin)         (1) 其中, Fin表示输入图像, Down表示降采样率为2的降采样模块, F1表示对初始图像进行 第一次降采样率 为2的下采样后的输出; 然后, 对经 过第一次下采样后的图像, 使用编码器的第一个不对称卷积模块进行处 理, F13=C1×3(C3×1(C1×3(C3×1(C1×3(C3×1(F1))))))     (8) 其中, F1表示对初始图像进行第一次降采样率为2的下采样后的输出, C3×1表示卷积核 为3×1的卷积操作, C1×3表示卷积核为1 ×3的卷积操作, F13表示编码器第一个不对称卷积 模块的输出; 步骤3、 将编码器第一个不对称卷积模块的输出F13与1/2分辨率图像经过空间注意力模 块处理后的输出Y1进行第一次特 征融合, Fc1=Concat(F13,Y1)                         (9) 其中, Concat表示Concatenate级联操作, Fc1表示第一次特 征融合后的输出 特征图; 步骤4、 将第一次特 征融合后的输出 特征图输送到通道 注意模块进行处 理, FCAM1=CAM(Fc1)        (10) 其中, CAM表示 通道注意力模块, FCAM1表示第一个通道 注意模块的输出; 再将第一个通道注意模块的输出输送至下采样模块进行第 二次下采样, 以提取输出特 征图像的特 征,权 利 要 求 书 1/4 页 2 CN 114821061 A 2F2=Down(FCAM1)             (11) 其中, Down表示降采样率为2的降采样模块, F2表示图像经过第二次下采样之后得到的 1/4分辨率的输出; 然后, 使用编码器的第二个不对称卷积模块对经 过第二次下采样后的图像进行处 理, F22=C1×5(C5×1(C1×5(C5×1(F2))))       (12) 其中, C5×1表示卷积核为5 ×1的卷积操作, C1×5表示卷积核为1 ×5的卷积操作, F22表示 编码器第二个不对称卷积模块的输出; 步骤5、 将编码器第二个不对称卷积模块的输出F22与1/4分辨率图像经过空间注意力模 块处理后的输出Y2进行第二次特 征融合, Fc2=Concat(F22,Y2)             (13) 其中, Y2表示1/4分辨率图像经过空间注意力 模块处理后的输出, Fc2表示第二次特征融 合后的输出; 步骤6、 将第二次特 征融合后的输出 特征图输送到通道 注意模块进行处 理, FCAM2=CAM(Fc2)              (14) 其中, FCAM2表示第二个通道 注意力模块的输出; 再将第二个通道注意模块的输出输送至下采样模块进行第 三次下采样, 以提取输出特 征图像的特 征, F3=Down(FCAM2)                (15) 其中, F3表示图像经 过第三次下采样之后得到的1/8分辨 率的输出; 然后, 使用多分支不对称卷积模块对经 过第三次下采样后的图像进行处 理, F31=PFCU1(F3)           (32) F32=PFCU2(F31)           (33) F33=PFCU3(F32)           (34) 其中, PFCU1表示第一个多 分支不对称卷积单元, PFCU2表示第二个多 分支不对称卷积单 元, PFCU3表示第三个多分支不对称卷积单元, F31表示第一个多分支不对称卷积单元的输 出, F32表示第二个多分支不对称 卷积单元的输出, F33表示第三个多分支不对称 卷积单元的 输出; 步骤7、 将多 分支不对称卷积模块的输出F33与1/8分辨率图像经过空间注意力模块 处理 后的输出Y3进行第三次特 征融合, Fc3=Concat(F33,Y3)       (35) 其中, Y3表示1/8分辨率图像经过空间注意力 模块处理后的输出, Fc3表示第三次特征融 合后的输出; 步骤8、 将第三次特 征融合后的输出 特征图输送到通道 注意模块进行处 理, FCAM3=CAM(Fc3)        (36) 其中, FCAM3表示第三个通道 注意力模块输出; 再将第三个通道 注意模块的输出输送至上采样模块进行第一次上采样, F4=UP(FCAM3)    (37) 其中, UP表示上采样率为2的上采样模块, F4表示经过第一个 上采样模块后得到的1/4 分 辨率的输出;权 利 要 求 书 2/4 页 3 CN 114821061 A 3

.PDF文档 专利 上下文聚合网络以及基于该网络的图像实时语义分割方法

安全报告 > 其他 > 文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 上下文聚合网络以及基于该网络的图像实时语义分割方法 第 1 页 专利 上下文聚合网络以及基于该网络的图像实时语义分割方法 第 2 页 专利 上下文聚合网络以及基于该网络的图像实时语义分割方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常2024-03-18 07:36:03上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。