专利 一种端到端的视频压缩方法、装置和计算机可读存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111651023.5 (22)申请日 2021.12.3 0 (71)申请人浙江大华技术股份有限公司地址 310051 浙江省杭州市滨江区滨安路 1187号 (72)发明人粘春湄　方瑞东　陈瑶　施晓迪　杜亚鹏　江东　林聚财　殷俊　 (74)专利代理机构深圳市威世博知识产权代理事务所(普通合伙) 44280 专利代理师何倚雯 (51)Int.Cl. H04N 19/51(2014.01) G06T 7/00(2017.01) (54)发明名称一种端到端的视频压缩方法、装置和计算机可读存储介质 (57)摘要本申请公开了一种端到端的视频压缩方法、装置和计算机可读存储介质，该方法包括：基于当前帧图像对应的参考帧库中各参考帧的质量信息，从参考帧库中选取出第一参考帧图像；基于第一参考帧图像对当前帧图像进行运动估计，得到运动信息；基于运动信息，对当前帧图像进行压缩处理，得到当前帧图像的压缩数据。通过上述方式，本申请能够优化端到端视频压缩的效果。权利要求书4页说明书10页附图9页 CN 114513670 A 2022.05.17 CN 114513670 A 1.一种端到端的视频压缩方法，其特征在于，包括：基于当前帧图像对应的参考帧库中各参考帧的质量信息，从所述参考帧库中选取出第一参考帧图像；基于所述第一参考帧图像对所述当前帧图像进行运动估计，得到运动信息；基于所述运动信息，对所述当前帧图像进行压缩处理，得到所述当前帧图像的压缩数据。 2.根据权利要求1所述的端到端的视频压缩方法，其特征在于，所述基于所述运动信息，对所述当前帧图像进行压缩处理，得到所述当前帧图像的压缩数据的步骤，包括：采用压缩模型基于所述运动信息，对所述当前帧图像进行压缩处理，得到所述当前帧图像的压缩数据；其中，所述压缩模型是基于训练数据训练的，所述训练数据包括样本图像，所述压缩模型用于对所述样本图像进行处理，得到重建样本图像；所述压缩模型的损失函数包括至少两个子损失函数，所述压缩模型的训练过程包括多个训练阶段，在每个所述训练阶段，采用一个所述子损失函数计算所述样本图像的损失值，所述子损失函数包括所述样本图像与所述重建样本图像之间的重建误差以及编码码率，在至少一个所述训练阶段，所述重建误差的权重、所述编码码率的权重与所述样本图像的帧数满足预设规律。 3.根据权利要求2所述的端到端的视频压缩方法，其特征在于，所述参考帧库包括至少两帧参考帧图像，所述从所述参考帧库中选取出第一参考帧图像的步骤，包括：从所述至少两帧参考帧图像中任意筛选出一个参考帧图像；若筛选出的参考帧图像的质量评分大于预设分值，则将所述筛选出的参考帧图像确定为所述第一参考帧图像；若筛选出的参考帧图像的质量评分不大于所述预设分值，则返回所述从所述至少两帧参考帧图像中任意筛选出一个参考帧图像的步骤。 4.根据权利要求2所述的端到端的视频压缩方法，其特征在于，所述压缩模型还用于对所述样本图像进行处理，得到预测样本图像，所述至少两个子损失函数包括第一子损失函数与第二子损失函数，所述第一子损失函数包括所述样本图像与所述预测样本图像之间的预测误差、所述重建误差以及所述编码码率，所述第二子损失函数包括所述重建误差以及所述编码码率，在所述第二子损失函数对应的训练阶段，所述训练阶段包括第一子训练阶段与第二子训练阶段，所述第一子训练阶段中的重建误差的权重大于所述第二子训练阶段中的重建误差的权重，所述第一子训练阶段中的预测误差的权重小于所述第二子训练阶段中的预测误差的权重。 5.根据权利要求 4所述的端到端的视频压缩方法，其特征在于，所述方法还包括：采用所述第一子损失函数对所述重建误差与所述编码码率进行处理，得到第一损失值；基于所述第一损失值，判断所述压缩模型是否满足第一预设收敛条件；若否，则返回所述采用所述第一子损失函数对所述重建误差与所述编码码率进行处理的步骤，直至所述压缩模型满足所述第一预设收敛条件；若是，则采用所述第二子损失函数对所述预测误差、所述重建误差与所述编码码率进行处理，得到第二损失值；权　利　要　求　书 1/4 页 2 CN 114513670 A 2基于所述第二损失值，判断所述压缩模型是否满足第二预设收敛条件；若所述压缩模型不满足所述第二预设收敛条件，则返回采用所述第二子损失函数对所述预测误差、所述重建误差与所述编码码率进行处理，得到第二损失值的步骤，直至所述压缩模型满足所述第二预设收敛条件。 6.根据权利要求5所述的端到端的视频压缩方法，其特征在于，所述采用所述第一子损失函数对所述重建误差与所述编码码率进行处理，得到第一损失值的步骤，包括：对所述预测样本图像与所述样本图像进行失真计算，得到所述预测误差；对所述重建样本图像与所述样本图像进行失真计算，得到所述重建误差；对所述预测误差、所述重建误差以及所述编码码率进行加权计算，得到所述第一损失值；其中，在所述压缩模型不满足所述第一预设收敛条件时，对所述预测误差的权重、重建误差的权重以及所述编码码率的权重进行调整。 7.根据权利要求5所述的端到端的视频压缩方法，其特征在于，所述采用所述第二子损失函数对所述预测误差、所述重建误差与所述编码码率进行处理，得到第二损失值的步骤，包括：对所述重建误差与所述编码码率进行加权计算，得到所述第二损失值；其中，在所述压缩模型不满足所述第二预设收敛条件时，对所述编码码率的权重以及所述重建误差的权重进行调整。 8.根据权利要求7所述的端到端的视频压缩方法，其特征在于，所述在所述压缩模型不满足所述第二预设收敛条件时，对所述编码码率的权重以及所述重建误差的权重进行调整的步骤，包括：判断所述样本图像的帧数是否小于预设帧数；若否，则将所述编码码率的权重上调第一预设数值，将所述重建误差下调第二预设数值；若是，则将所述编码码率的权重下调第三预设数值，将所述重建误差上调第四预设数值。 9.根据权利要求2所述的端到端的视频压缩方法，其特征在于，所述采用压缩模型基于所述运动信息，对所述当前帧图像进行压缩处理，得到所述当前帧图像的压缩数据的步骤，包括：基于所述运动信息对所述第一参考帧图像进行运动补偿处理，得到所述当前帧图像对应的预测帧图像；基于所述预测帧图像对所述当前帧图像进行残差计算，得到残差信息；基于所述残差信息与所述运动信息，对所述当前帧图像进行压缩处理，得到所述压缩数据。 10.根据权利要求9所述的端到端的视频压缩方法，其特征在于，所述基于所述第一参考帧图像对所述当前帧图像进行运动估计，得到运动信息的步骤，还包括：在所述第一参考帧图像为多个时，分别利用每个所述第一参考帧图像对所述当前帧图像进行运动估计，得到多个所述运动信息。 11.根据权利要求10所述的端到端的视频压缩方法，其特征在于，所述基于所述运动信权　利　要　求　书 2/4 页 3 CN 114513670 A 3

专利 一种端到端的视频压缩方法、装置和计算机可读存储介质

专利一种端到端的视频压缩方法、装置和计算机可读存储介质