(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210485810.5 (22)申请日 2022.05.06 (65)同一申请的已公布的文献号 申请公布号 CN 114584675 A (43)申请公布日 2022.06.03 (73)专利权人 中国科学院深圳先进技 术研究院 地址 518055 广东省深圳市南 山区深圳大 学城学苑大道1068号 专利权人 华中科技大 学协和深圳医院 (72)发明人 周蔚 邹静 刘翼豪 李英 董超  乔宇  (74)专利代理 机构 北京市诚辉律师事务所 11430 专利代理师 耿慧敏 成丹(51)Int.Cl. H04N 5/21(2006.01) H04N 5/225(2006.01) G16H 30/40(2018.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06T 5/00(2006.01) G06V 10/774(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) (56)对比文件 CN 110634108 A,2019.12.31 CN 112365551 A,2021.02.12 WO 2022011571 A1,202 2.01.20 审查员 张鑫垚 (54)发明名称 一种自适应 视频增强方法和装置 (57)摘要 本发明公开一种自适应视频增强方法和装 置, 该方法包括: 采集目标视频数据; 将目标视频 数据输入预训练的视频增强模型, 获得增强视 频, 其中训练样本集的获取包括: 构建生成对抗 网络, 该生成对抗网络包括生成器和判别器, 生 成器以真实高质量视频和退化特征作为输入, 生 成模拟低质量视频, 判别器用于判断模拟低质量 视频与真实低质量视频之间的拟合程度; 训练所 述生成对抗网络, 以使模拟低质量视频与真实低 质量视频之间的拟合程度满足设定损失标准; 将 经训练的生成器作为视频退化学习模 型, 以针对 采集的高质量视频生成具有不同退化分布特征 的低质量视频, 进而构建出所述训练样本集。 利 用本发明能够提升目标视频的视觉清晰度以及 保真度。 权利要求书2页 说明书8页 附图1页 CN 114584675 B 2022.08.02 CN 114584675 B 1.一种自适应视频增强方法, 包括: 采集目标视频 数据; 将所述目标视频数据输入到视频增强模型, 获得增强视频, 所述视频增强模型利用训 练样本集训练获得, 该训练样本集的每条样本反映高质量视频与低质量视频之 间的对应关 系, 且根据以下步骤获得: 构建生成对抗网络, 该生成对抗网络包括生成器和判别器, 所述生成器以真实高质量 视频和对应的退化特征作为输入, 生成模拟低质量视频, 所述判别器用于判断所生成的模 拟低质量视频与真实低质量视频之间的拟合 程度; 训练所述生成对抗网络, 以使生成的模拟低质量视频与真实低质量视频之间的拟合程 度满足设定损失标准; 将经训练 的生成器作为视频退化学习 模型, 以针对采集的高质量视频生成具有不同退 化分布特 征的低质量视频, 进 而构建出 所述训练样本集; 其中, 所述退化特征利用第一退化分布提取器提取, 该第一退化分布提取器以真实低 质量视频作为输入, 提取反映不同退化类型和不同退化 程度的退化特 征。 2.根据权利要求1所述的方法, 其特征在于, 所述第 一退化分布提取器是分辨率逐渐减 少, 同时通道数 逐渐增加的卷积神经网络 。 3.根据权利要求1所述的方法, 其特征在于, 所述视频增强模型包括分频特征提取器, 第二退化分布提取器、 自适应双向循环网络和时频特征融合模块, 其中, 分频特征提取器对 输入视频按照频域进行分解, 获得不同尺度的多个频率分量; 第二退化分布提取器用于从 输入视频中提取对应的退化特征; 自适应双向循环网络针对多个频率分量对连续帧的特征 进行时序建模并且经 由退化特征 的调制, 获得针对不同频率分量的复原结果; 时频特征融 合模块用于融合复原结果中的时域特 征和频域特 征, 获得相对于 输入视频的增强视频。 4.根据权利要求3所述的方法, 其特征在于, 所述多个频率分量通过对输入图像施加不 同的程度的高斯模糊核获得, 模糊后的低频分量图像和高频分量图像分别表示 为: 其中, 代表卷积操作, 是低频分量图像, 是高频分量图像, ki表示高斯模糊 核, 取值为{k1, k2,…, kn}, k1模糊程度最低, kn模糊程度最高, I表示原 始的输入图像。 5.根据权利要求3所述的方法, 其特征在于, 在训练所述视频增强模型过程中, 所述分 频特征提取器和所述自适应双向循环网络对于不同的频率分量共享 参数。 6.根据权利要求3所述的方法, 其特征在于, 在训练所述视频增强模型过程中, 对不同 频率分量的复原结果进行分频监督, 所使用损失函数中包含保真损失项, 该保真损失项是 针对不同频率分量施加的L1或者 L2损失。 7.根据权利要求1所述的方法, 其特征在于, 所述不同退化类型包括烟、 雾、 噪声、 模糊 和压缩。 8.一种自适应视频增强装置, 包括: 视频采集单 元; 用于采集目标视频 数据;权 利 要 求 书 1/2 页 2 CN 114584675 B 2视频增强单元, 用于将所述目标视频数据输入到视频增强模型, 获得增强视频, 其中, 所述视频增强模型利用训练样本集训练获得, 每条样本反映高质量视频与低质量视频之间 的对应关系; 样本采集单 元: 用于根据以下步骤获取 所述训练样本集: 构建生成对抗网络, 该生成对抗网络包括生成器和判别器, 所述生成器以真实高质量 视频和退化特征作为输入, 生成模拟低质量视频, 所述判别器用于判断所生成的模拟低质 量视频与真实低质量视频之间的拟合 程度; 训练所述生成对抗网络, 以使所生成的模拟低质量视频与真实低质量视频之间的拟合 程度满足设定标准; 将经训练 的生成器作为视频退化学习 模型, 以针对采集的高质量视频生成具有不同退 化分布特 征的低质量视频, 进 而构建出 所述训练样本集; 其中, 所述退化特征利用第一退化分布提取器提取, 该第一退化分布提取器以真实低 质量视频作为输入, 提取反映不同退化类型和不同退化 程度的退化特 征。 9.一种计算机可读存储介质, 其上存储有计算机程序, 其中, 该计算机程序被处理器执 行时实现根据权利要求1至7中任一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114584675 B 3

.PDF文档 专利 一种自适应视频增强方法和装置

安全报告 > 其他 > 文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种自适应视频增强方法和装置 第 1 页 专利 一种自适应视频增强方法和装置 第 2 页 专利 一种自适应视频增强方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常2024-03-18 07:35:22上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。