CN114339222A - 视频编码方法 - Google Patents
视频编码方法 Download PDFInfo
- Publication number
- CN114339222A CN114339222A CN202111567692.4A CN202111567692A CN114339222A CN 114339222 A CN114339222 A CN 114339222A CN 202111567692 A CN202111567692 A CN 202111567692A CN 114339222 A CN114339222 A CN 114339222A
- Authority
- CN
- China
- Prior art keywords
- roi
- frame
- video
- area
- ith
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种视频编码方法,包括:编码器编码时,对于一段视频,间隔若干帧做ROI检测,对于不做ROI检测的帧,利用上一帧ROI的位置和上一帧ROI在当前帧的匹配块来预测当前帧的ROI区域;对非ROI区域先滤波再编码,对ROI区域直接编码。本发明用于在提升编码压缩效率的同时,使重要区域的主观质量不下降。
Description
技术领域
本发明属于视频编码技术领域,具体涉及一种视频编码方法。
背景技术
随着网络通信和视频处理技术的快速发展,视频监控越来越广泛地应用到人们生活中的各个方面,如银行、地铁、道路、社区监控。传统视频监控拍摄后的视频码率通常为4000kbps左右,但由于网络带宽有限,不可能在中心端多路视频同时调阅,因此出现了一些低码率的视频监控系统,如基于边缘计算的视频监控,将边缘端拍摄的视频码率压缩至400kbps~1300kbps,这样在中心端调阅的路数便可以增加到传统方法的3~10倍左右,调阅效率大大增加。当然,码率的降低意味着视频质量会降低,因此,如何在减少码率的同时又能保证视频质量,是该类低码率的视频监控技术发展的关键。
视频图像数据有极强的相关性,也就是说有大量的冗余信息,其中冗余信息可分为空域冗余信息和时域冗余信息,编码压缩就是将数据中的冗余信息去掉,视频编码中的帧内编码技术可以去除空域冗余,而帧间编码技术则可以去除时域冗余。帧间编码利用邻近帧之间存在的相关性,将一帧图像分成若干个CU(Coding Unit,编码单元),并设法搜索出每个CU在邻近帧中像素值最相近的块,称之为匹配块,计算出当前CU和匹配块之间的空间位置的相对偏移量,得到的相对偏移量就是运动矢量,而得到运动矢量的过程被称为运动估计。
发明内容
本发明要解决的技术问题是提供一种视频编码方法,用于在提升编码压缩效率的同时,使重要区域的主观质量不下降。
为解决上述技术问题,本发明采用如下的技术方案:
本发明实施例提供一种视频编码方法,包括:
编码器编码时,对于一段视频,间隔若干帧做ROI检测,对于不做ROI检测的帧,利用上一帧ROI的位置和上一帧ROI在当前帧的匹配块来预测当前帧的ROI区域;
对非ROI区域先滤波再编码,对ROI区域直接编码。
一种可能设计中,所述视频为监控视频。
一种可能设计中,滤波采用高斯滤波,为对局部图像像素值进行加权平均,减少高频信息。
一种可能设计中,编码器为HEVC、H.264、H.266、AVS、AVS2或AVS3中的一种。
一种可能设计中,编码器编码时,对于一段视频,间隔若干帧做ROI检测,对于不做ROI检测的帧,利用上一帧ROI的位置和上一帧ROI在当前帧的匹配块来预测当前帧的ROI区域包括:在编码第i帧时,判断i是否满足i%N=0,若满足则进行ROI检测获取第i帧中所有的ROI区域,并分别标记为{roi(i,1),roi(i,2),roi(i,3)……roi(i,k)},其中k为第i帧中ROI区域的个数,k的取值范围为(0~50);否则,将第i-1帧中第j个ROI区域包含的所有CU标记为{cu(i-1,j,1),cu(i-1,j,2),cu(i-1,j,3),……cu(i-1,j,m)},其中j的取值范围为(0~k),m为第i-1帧中第j个ROI区域包含的CU个数,m的取值范围为(0~100),利用运动估计求取{cu(i-1,j,1),cu(i-1,j,2),cu(i-1,j,3),……cu(i-1,j,m)}在第i帧中的匹配块,分别标记为{cu(i,j,1),cu(i,j,2),cu(i,j,3),……cu(i,j,m)},将{cu(i,j,1),cu(i,j,2),cu(i,j,3),……cu(i,j,m)}合并成为一个区域,定义为第i帧中第j个ROI区域。
采用本发明具有如下的有益效果:本发明实施例首先高效获取ROI区域,其次,对ROI区域做质量保护,对非ROI区域做高斯滤波,减少非ROI区域的信息量,从而在编码时节省编码码率,最终在大幅节省码率的前提下,使得编码输出的主观质量依然较好。
具体实施方式
下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种视频编码方法,包括:编码器编码时,对于一段视频,间隔若干帧做ROI检测,对于不做ROI检测的帧,利用上一帧ROI的位置和上一帧ROI在当前帧的匹配块来预测当前帧的ROI区域;对非ROI区域先滤波再编码,对ROI区域直接编码。
由于ROI检测比较耗时,本发明实施例方法间隔若干帧做ROI检测,对于不做ROI检测的帧,利用上一帧ROI的位置和上一帧ROI在当前帧的匹配块来预测当前帧的ROI区域,这样可以确保每帧ROI区域的计算准确度较高,同时相比于每帧做ROI检测的方法更节省时间;对非ROI区域先滤波再编码,对ROI区域直接编码,由于在非ROI区域的滤波可以减少高频信息,进一步减少非ROI区域的编码码率,这样既可确保ROI区域的质量,又可以减少整体的编码码率。
ROI(Region ofInterest,感兴趣区域)是从图像中选择的一个最易引起用户兴趣的图像区域。例如在地铁监控视频中,用户更倾向于关注人脸、行李,而不太关注旁边的广告牌、墙壁,此时视频中的人脸和行李便可归为ROI。基于ROI的监控视频编码可以对ROI区域做无损压缩或近无损压缩,而对非ROI区域进行有损压缩,既可较好保留用户需要监测的对象,又比常规编码提升了压缩效率。
基于机器学习的ROI检测是常用且准确度高的ROI检测方式,但是机器学习非常耗时,如果编码之前需要对每帧都做ROI检测,编码性能必然会大大降低,因此,本发明实施例方法高效地结合ROI检测和编码器内部的运动估计,对部分帧做ROI预测,既可确保ROI检测的准确度,也能确保编码性能不降低。
本发明一实施例中,滤波采用高斯滤波。高斯滤波是对局部图像像素值进行加权平均,它可以在尽量保留图像细节特征的条件下对目标图像的高频信息(边缘、噪声)进行抑制。高斯滤波可以减少高频信息从而节省编码码率,但是编码输出画面可能看起来很模糊,故本发明实施例中在视频编码时对非ROI区域做高斯滤波从而减少该类区域的码率。
本发明实施例中,本发明实施例的一种视频编码方法,编码器为HEVC、H.264、H.266、AVS、AVS2或AVS3中的任一一种。
本发明一实施例中,编码器编码时,对于一段视频,间隔若干帧做ROI检测,对于不做ROI检测的帧,利用上一帧ROI的位置和上一帧ROI在当前帧的匹配块来预测当前帧的ROI区域包括:在编码第i帧时,判断i是否满足i%N=0,若满足则进行ROI检测获取第i帧中所有的ROI区域,并分别标记为{roi(i,1),roi(i,2),roi(i,3)……roi(i,k)},其中k为第i帧中ROI区域的个数,k的取值范围为(0~50);否则,将第i-1帧中第j个ROI区域包含的所有CU标记为{cu(i-1,j,1),cu(i-1,j,2),cu(i-1,j,3),……cu(i-1,j,m)},其中j的取值范围为(0~k),m为第i-1帧中第j个ROI区域包含的CU个数,m的取值范围为(0~100),利用运动估计求取{cu(i-1,j,1),cu(i-1,j,2),cu(i-1,j,3),……cu(i-1,j,m)}在第i帧中的匹配块,分别标记为{cu(i,j,1),cu(i,j,2),cu(i,j,3),……cu(i,j,m)},将{cu(i,j,1),cu(i,j,2),cu(i,j,3),……cu(i,j,m)}合并成为一个区域,定义为第i帧中第j个ROI区域,其中N为常数,取值范围在[2,50]之间,典型值为10。
本发明方案相比于每帧做ROI检测的编码方案,编码质量不下降且速度可以提升70%。
应当理解,本文所述的示例性实施例是说明性的而非限制性的。尽管描述了本发明的一个或多个实施例,本领域普通技术人员应当理解,在不脱离通过所附权利要求所限定的本发明的精神和范围的情况下,可以做出各种形式和细节的改变。
Claims (5)
1.一种视频编码方法,其特征在于,包括:
编码器编码时,对于一段视频,间隔若干帧做ROI检测,对于不做ROI检测的帧,利用上一帧ROI的位置和上一帧ROI在当前帧的匹配块来预测当前帧的ROI区域;
对非ROI区域先滤波再编码,对ROI区域直接编码。
2.如权利要求1所述的视频编码方法,其特征在于,所述视频为监控视频。
3.如权利要求1所述的视频编码方法,其特征在于,滤波采用高斯滤波,为对局部图像像素值进行加权平均,减少高频信息。
4.如权利要求1所述的视频编码方法,其特征在于,编码器为HEVC、H.264、H.266、AVS、AVS2或AVS3中的一种。
5.如权利要求1至4任一所述的视频编码方法,其特征在于,编码器编码时,对于一段视频,间隔若干帧做ROI检测,对于不做ROI检测的帧,利用上一帧ROI的位置和上一帧ROI在当前帧的匹配块来预测当前帧的ROI区域包括:在编码第i帧时,判断i是否满足i%N=0,若满足则进行ROI检测获取第i帧中所有的ROI区域,并分别标记为{roi(i,1),roi(i,2),roi(i,3)……roi(i,k)},其中k为第i帧中ROI区域的个数,k的取值范围为(0~50);否则,将第i-1帧中第j个ROI区域包含的所有CU标记为{cu(i-1,j,1),cu(i-1,j,2),cu(i-1,j,3),……cu(i-1,j,m)},其中j的取值范围为(0~k),m为第i-1帧中第j个ROI区域包含的CU个数,m的取值范围为(0~100),利用运动估计求取{cu(i-1,j,1),cu(i-1,j,2),cu(i-1,j,3),……cu(i-1,j,m)}在第i帧中的匹配块,分别标记为{cu(i,j,1),cu(i,j,2),cu(i,j,3),……cu(i,j,m)},将{cu(i,j,1),cu(i,j,2),cu(i,j,3),……cu(i,j,m)}合并成为一个区域,定义为第i帧中第j个ROI区域。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111567692.4A CN114339222A (zh) | 2021-12-20 | 2021-12-20 | 视频编码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111567692.4A CN114339222A (zh) | 2021-12-20 | 2021-12-20 | 视频编码方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114339222A true CN114339222A (zh) | 2022-04-12 |
Family
ID=81053922
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111567692.4A Pending CN114339222A (zh) | 2021-12-20 | 2021-12-20 | 视频编码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114339222A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070076957A1 (en) * | 2005-10-05 | 2007-04-05 | Haohong Wang | Video frame motion-based automatic region-of-interest detection |
CN106162177A (zh) * | 2016-07-08 | 2016-11-23 | 腾讯科技(深圳)有限公司 | 视频编码方法和装置 |
CN108810538A (zh) * | 2018-06-08 | 2018-11-13 | 腾讯科技(深圳)有限公司 | 视频编码方法、装置、终端及存储介质 |
CN110213587A (zh) * | 2019-07-08 | 2019-09-06 | 北京达佳互联信息技术有限公司 | 视频编码方法、装置、电子设备及存储介质 |
CN113242428A (zh) * | 2021-04-15 | 2021-08-10 | 中南大学 | 视频会议场景下基于roi区域的后处理加速方法 |
-
2021
- 2021-12-20 CN CN202111567692.4A patent/CN114339222A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070076957A1 (en) * | 2005-10-05 | 2007-04-05 | Haohong Wang | Video frame motion-based automatic region-of-interest detection |
CN106162177A (zh) * | 2016-07-08 | 2016-11-23 | 腾讯科技(深圳)有限公司 | 视频编码方法和装置 |
CN108810538A (zh) * | 2018-06-08 | 2018-11-13 | 腾讯科技(深圳)有限公司 | 视频编码方法、装置、终端及存储介质 |
CN110213587A (zh) * | 2019-07-08 | 2019-09-06 | 北京达佳互联信息技术有限公司 | 视频编码方法、装置、电子设备及存储介质 |
CN113242428A (zh) * | 2021-04-15 | 2021-08-10 | 中南大学 | 视频会议场景下基于roi区域的后处理加速方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110324626B (zh) | 一种面向物联网监控的双码流人脸分辨率保真的视频编解码方法 | |
CN108347612B (zh) | 一种基于视觉注意机制的监控视频压缩与重构方法 | |
WO2013074365A1 (en) | Subjective based post-filter optimization | |
CN104992419A (zh) | 基于jnd因子的超像素高斯滤波预处理方法 | |
CN116996673A (zh) | 基于通行出入管理及设备运行状态的智能云端管理系统 | |
CN106878754B (zh) | 一种3d视频深度图像帧内预测模式选择方法 | |
CN114173131A (zh) | 一种基于帧间相关性的视频压缩方法及系统 | |
KR100255917B1 (ko) | 향상된 이동 보상을 위한 방법 및 장치 | |
Chen et al. | A fast inter coding algorithm for HEVC based on texture and motion quad-tree models | |
CN114339222A (zh) | 视频编码方法 | |
Lee et al. | Machine-Attention-based Video Coding for Machines | |
CN115665359B (zh) | 一种环境监测数据智能压缩方法 | |
GB2449887A (en) | Replacement of spurious motion vectors for video compression | |
CN114339241A (zh) | 视频码率控制方法 | |
US6463174B1 (en) | Macroblock-based segmentation and background mosaicking method | |
CN114422788A (zh) | 数字视网膜视频联合编码方法、译码方法、装置及电子设备 | |
CN113542745A (zh) | 一种率失真编码优化方法 | |
CN112165619A (zh) | 一种面向监控视频压缩存储的方法 | |
CN114882390B (zh) | Vvc编码标准中基于ctu直方图的视频帧类型决策方法 | |
Rath et al. | Subblock matching-based conditional motion estimation with automatic threshold selection for video compression | |
CN118509607B (zh) | 一种基于边缘计算的实时视频处理和智能分析方法 | |
Kim et al. | Image coding based on selective super-resolution network | |
Patnaik et al. | Region of interest based scalable image and video coding a superlative study | |
Zan et al. | Wavelet-based multiresolution motion estimation through median filtering | |
Gopalan | Exploiting Region Of Interest For Improved Video Coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |