CN101783956A - 基于时空邻居信息的后向预测方法 - Google Patents
基于时空邻居信息的后向预测方法 Download PDFInfo
- Publication number
- CN101783956A CN101783956A CN 201010107371 CN201010107371A CN101783956A CN 101783956 A CN101783956 A CN 101783956A CN 201010107371 CN201010107371 CN 201010107371 CN 201010107371 A CN201010107371 A CN 201010107371A CN 101783956 A CN101783956 A CN 101783956A
- Authority
- CN
- China
- Prior art keywords
- space
- time
- pixel
- forecast
- linear prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
本发明涉及视频编码技术领域,尤其涉及一种基于时空邻居点的后向预测方法。本发明包括选择局部空域邻居像素的步骤、选择局部时域邻居像素的步骤、设置时空样本训练窗口的步骤、求解线性预测权值矩阵的步骤、进行基于时空邻居点的后向预测的步骤、预测模式集成的步骤。本发明通过增加一种基于后向预测的帧间宏块预测模式,结合现有标准中的前向预测模式,从而提高了帧间预测效率。
Description
技术领域
本发明涉及视频编码技术领域,尤其涉及一种基于时空邻居信息的后向预测方法。
背景技术
最新的国际视频标准H.264/AVC与以往的视频编码标准相比,在压缩性能方面取得了明显的进步,H.264标准之所以能取得如此大的增益,是因为它引入了很多先进的视频编码技术,其中最重要的技术之一是基于块匹配的帧间预测技术。
基于块匹配的帧间预测技术为一种“前向预测”技术,该方法的特点是编码端通过对原始图像进行运动估计,得到对应的运动矢量并将其打包传输到解码端;解码端通过解析运动矢量信息,结合残差数据可恢复出对应的重建图像。前向预测由于具有位移跟踪能力强、实现简单等优点,在一系列视频编码标准中得以使用,但是也存在着一定的缺陷:虽然对描述线性运动具有很好的精确度,但是当图像中物体运动更为复杂时,该方法就无法得到很好的效果;并且,当最优编码模式是小块模式时,编码器需要编码并传输更多的运动矢量信息,导致增加了较多的比特数。
为了改善这一问题,“后向预测”技术获得了国内外学者越来越多的关注。后向预测不需要将运动矢量嵌入码流中,编、解码器事先设计好对应的计算规则,解码器可以利用编码器传输过来的隐含信息计算出对应的运动信息。
Xin Li提出了一种基于时空局部自学习模型(Spatio-Temporal Adaptive Localized Learning,STALL)的像素级视频处理框架(参见文献1),在该框架下通过局部时空线性预测来计算当前像素点的值,从而构建起一套基于像素级的视频编解码器。不过当前视频编码标准的有损压缩应用中都是基于块级的处理框架,使得Xin Li提出的这种像素级后向预测技术还无法适用于当前视频编码标准的有损压缩中。
文献1:Li Xin,“Video Processing Via Implicit and Mixture Motion Models,”IEEETransactions on Circuits and Systems for Video Technology,vol.17,no.8,pp.953-963,2007.
发明内容
本发明的目的是提供一种基于时空邻居点的后向预测方法,改善前向预测必须编码运动矢量边信息而导致增加编码比特数、降低压缩效率的问题。
为达到上述目的,本发明采用如下的技术方案:
①选择局部空域邻居像素的步骤,该步骤选择当前图像中当前编码块周围的已编码块的像素点来进行线性预测;
②选择局部时域邻居像素的步骤,该步骤选择当前图像的参考帧中的像素点用来进行线性预测;
③设置时空样本训练窗口的步骤,该步骤把当前图像的参考帧中至少一帧的若干像素点设置为样本训练点,从而组成样本训练集合;
④求解线性预测权值矩阵的步骤,该步骤在步骤③所设置的训练样本集内,依据求解最小二乘问题的方法求得线性预测权值矩阵的局部最优解;
⑤进行基于时空邻居点的后向预测的步骤,该步骤用步骤④中求得的线性预测权值矩阵作为线性加权的权值,对步骤①中确定的空域邻居像素点和步骤②中确定的时域邻居像素点进行线性加权,从而预测出当前图像的当前编码块中每个像素的预测值;
⑥预测模式集成的步骤,该步骤把步骤⑤中当前编码块的线性预测值,作为一种新的宏块帧间预测模式集成到视频编码框架中的帧间预测模式集合中。
所述步骤①中,选择周围的已编码块的像素点,分别来自当前编码块的左边块、上边块、左上边块中的9个像素点。
选择局部时域邻居像素点,为当前图像的前一参考帧中3×3大小的9个像素点。
所述步骤③中,设置样本训练集,为当前图像的若干参考帧中范围为:
W(T1,T2)=[-T1,T1]×[-T1,T1]×[-T2,-1]的区域,其中,T1表示训练集的空域范围,T2表示训练窗口的时域范围,单位为像素个数。
本发明具有以下优点和积极效果:
1)通过增加一种基于后向预测的帧间宏块预测模式,减少了码流中运动矢量边信息的比特数;
2)结合现有标准中的前向预测模式,提高了帧间预测的压缩效率;
附图说明
图1是本发明提供的基于时空邻居点的后向预测方法的流程图。
图2是本发明提供的基于时空邻居点的后向预测方法的一个实施例的示意图。
图3是本发明中空域邻居像素点选择示意图。
图4是本发明中时域邻居像素点选择示意图。
具体实施方式
本发明提出的基于时空邻居信息的后向预测方法,根据视频在小范围内属于稳态分布、具有时空相似性的特点,利用当前图像总当前编码块的时域、空域邻居像素的内容相似性来线性预测当前编码块的像素值,具体采用如下技术方案,如图1所示,包括以下步骤:
1、选择局部空域邻居像素(11),该步骤选择当前图像中当前编码块周围的已编码块的像素点来进行线性预测;
2、选择局部时域邻居像素(12),该步骤选择当前图像的参考帧中的像素点用来进行线性预测;
3、设置时空样本训练窗口(13),该步骤把当前图像的参考帧中至少一帧的若干像素点设置为样本训练点,从而组成样本训练集合;
4、求解线性预测权值矩阵(14),该步骤在步骤3所设置的训练样本集内,依据求解最小二乘问题的方法求得线性预测权值矩阵的局部最优解;
5、进行基于时空邻居点的后向预测(15),该步骤用步骤4中求得的线性预测权值矩阵作为线性加权的权值,对步骤1中确定的空域邻居像素点和步骤2中确定的时域邻居像素点进行线性加权,从而预测出当前图像的当前编码块中每个像素的预测值;
6、预测模式集成(16),该步骤把步骤5中当前编码块的线性预测值,作为一种新的宏块帧间预测模式集成到视频编码框架中的帧间预测模式集合中。
上述所述的基于时空邻居点的后向预测方法,在步骤1中,选择局部空域邻居像素点,分别来自当前编码块的左边块、上边块、左上边块中的9个像素点;
步骤2中,选择局部时域邻居像素点,为当前图像的前一参考帧中3×3大小的9个像素点;
步骤3中,设置样本训练集,为当前图像的若干参考帧中范围为:
W(T1,T2)=[-T1,T1]×[-T1,T1]×[-T2,-1]的区域,其中,T1表示训练集的空域范围,T2表示训练窗口的时域范围,单位为像素个数;
步骤4中线性预测权值矩阵求解,为将训练样本数据(共M个)记为一个M×1大小的列向量将时空邻居像素点(共N个)记为一个1×N大小的行向量利用和生成一个M×N的协方差矩阵C,根据公式: 计算得到线性预测权值矩阵
下面再以具体实施例结合附图2对本发明提供的基于时空邻居点的后向预测方法作进一步说明:
采用H.264的参考软件JM12.4作为编码器,编码类型为IPPPPP,参考帧个数为3,打开RDO选项,选取QCIF分辨率大小(176×144)的claire序列作为测试序列,以编码claire序列中第4帧图像的第13个宏块为例,具体实施步骤如下:
1、局部空域邻居像素的选择(23)
对于第4帧图像的第13个宏块首先以4×4块为单元将宏块分成16个4×4块。对于每个4×4块而言,选择9个点作为空域邻居点,如图3所示,4×4块为当前编码块;9个黑色圆点为局部空域邻居像素点,分别来自当前编码块周围已编码完的左边块、上边块和左上块;
当前编码4×4块内部的所有16个待编码的像素点都使用这9个邻居像素点来进行线性预测。
2、局部时域邻居像素的选择(24)
在参考帧队列中对第3帧参考帧进行相似度搜索,从而找到当前编码块中待编码像素的最近似像素点,设为当前编码4×4块中待编码像素点的配准像素点,如图4所示。对于当前编码4×4块内部的每个待编码像素点而言,选择以配准像素点为中心的3×3面积大小的9个像素作为时域邻居点来进行线性计算。
3、设置时空样本训练窗口(25)
定义一个三维长度为(3,3,2)的训练集合W:
W=[-31,31]×[-31,31]×[-2,-1]
4、线性预测权值矩阵求解(26)
将训练样本数据(共7×7×2=98个)记为一个98×1大小的列向量将18个(9+9=18)时/空邻居像素点记为一个1×18大小的行向量利用和生成一个98×18的协方差矩阵C。根据公式: 计算得到18×1大小的线性预测权值矩阵
5、基于时空邻居点的后向预测(17)
将线性预测权值矩阵和18个时/空域邻居像素点根据公式: 进行线性加权,从而预测出当前图像中正在编码的4×4块中每个像素的预测值。依此来推,可得到16个4×4块的像素预测值,从而得到当前编码宏块的预测值。
6、预测模式集成
将本发明的后向预测方法作为H.264标准中针对P帧的一种新的帧间预测模式(LSP模式),编码器基于率失真选择策略从H.264标准中现有的各种帧间预测模式和新增加的LSP模式中选择出最优编码模式,率失真代价函数如下所示:
J(s,c,mode|QP,λmode)=D(s,c,mode|QP)+λmode·R(s,c,mode|QP)
为了验证本发明后向预测方法的有效性,将本发明方法和H.264标准进行比较,表1给出了3个QCIF和3个416×240序列的编码图像峰值信噪比PSNR增益和码率节省结果,从中可以看出本发明具有更佳的压缩效率:
表1 QCIF、416×240序列亮度分量测试结果
QCIF序列 | BDPSNR(dB) | BD-BitRate(%) | 416×240序列 | BDPSNR(dB) | BD-BitRate(%) |
Claire | 0.18 | -3.27 | BQSquare | 0.19 | -4.27 |
Foreman | 0.08 | -1.47 | Flowervase | 0.14 | -2.97 |
News | 0.14 | -2.34 | Nuts3 | 0.29 | -5.43 |
Claims (6)
1.一种基于时空邻居信息的后向预测方法,其特征在于,包括以下步骤:
①选择局部空域邻居像素的步骤,该步骤选择当前图像中当前编码块周围的已编码块的像素点来进行线性预测;
②选择局部时域邻居像素的步骤,该步骤选择当前图像的参考帧中的像素点来进行线性预测;
③设置时空样本训练窗口的步骤,该步骤把当前图像的参考帧中至少一帧的若干像素点设置为样本训练点,从而组成样本训练集合;
④求解线性预测权值矩阵的步骤,该步骤在步骤③所设置的训练样本集内,依据求解最小二乘问题的方法求得线性预测权值矩阵的局部最优解;
⑤进行基于时空邻居点的后向预测的步骤,该步骤用步骤④中求得的线性预测权值矩阵作为线性加权的权值,对步骤①中确定的空域邻居像素点和步骤②中确定的时域邻居像素点进行线性加权,从而预测出当前图像的当前编码块中每个像素的预测值;
⑥预测模式集成的步骤,该步骤把步骤⑤中当前编码块的线性预测值,作为一种新的宏块帧间预测模式集成到视频编码框架中的帧间预测模式集合中。
2.根据权利要求1所述的基于时空邻居信息的后向预测方法,其特征在于:
所述步骤①中,选择周围的已编码块的像素点,分别来自当前编码块的左边块、上边块、左上边块中的9个像素点。
3.根据权利要求1所述的基于时空邻居信息的后向预测方法,其特征在于:
选择局部时域邻居像素点,为当前图像的前一参考帧中3×3大小的9个像素点。
4.根据权利要求1、2、3中任一项所述的基于时空邻居信息的后向预测方法,其特征在于:
所述步骤③中,设置样本训练集,为当前图像的若干参考帧中范围为:
W(T1,T2)=[-T1,T1]×[-T1,T1]×[-T2,-1]的区域,其中,T1表示训练集的空域范围,T2表示训练窗口的时域范围,单位为像素个数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010107371 CN101783956B (zh) | 2010-02-03 | 2010-02-03 | 基于时空邻居信息的后向预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010107371 CN101783956B (zh) | 2010-02-03 | 2010-02-03 | 基于时空邻居信息的后向预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101783956A true CN101783956A (zh) | 2010-07-21 |
CN101783956B CN101783956B (zh) | 2012-01-11 |
Family
ID=42523742
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201010107371 Expired - Fee Related CN101783956B (zh) | 2010-02-03 | 2010-02-03 | 基于时空邻居信息的后向预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101783956B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102413326A (zh) * | 2010-09-26 | 2012-04-11 | 华为技术有限公司 | 视频编码、解码方法和装置 |
CN102790895A (zh) * | 2012-07-30 | 2012-11-21 | 武汉大学 | 一种基于最小二乘的多视点视频编码视点合成预测方法 |
CN104539967A (zh) * | 2015-01-15 | 2015-04-22 | 哈尔滨工业大学 | 混合视频编码标准中帧间预测方法 |
CN108156461A (zh) * | 2017-12-28 | 2018-06-12 | 上海通途半导体科技有限公司 | 一种Bayer图像压缩方法及装置 |
CN113824961A (zh) * | 2021-11-22 | 2021-12-21 | 康达洲际医疗器械有限公司 | 一种可适用于vvc编码标准的帧间图像编码方法与系统 |
-
2010
- 2010-02-03 CN CN 201010107371 patent/CN101783956B/zh not_active Expired - Fee Related
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102413326A (zh) * | 2010-09-26 | 2012-04-11 | 华为技术有限公司 | 视频编码、解码方法和装置 |
CN102413326B (zh) * | 2010-09-26 | 2014-04-30 | 华为技术有限公司 | 视频编码、解码方法和装置 |
CN102790895A (zh) * | 2012-07-30 | 2012-11-21 | 武汉大学 | 一种基于最小二乘的多视点视频编码视点合成预测方法 |
CN102790895B (zh) * | 2012-07-30 | 2015-03-25 | 武汉大学 | 一种基于最小二乘的多视点视频编码视点合成预测方法 |
CN104539967A (zh) * | 2015-01-15 | 2015-04-22 | 哈尔滨工业大学 | 混合视频编码标准中帧间预测方法 |
CN104539967B (zh) * | 2015-01-15 | 2017-07-28 | 哈尔滨工业大学 | 混合视频编码标准中帧间预测方法 |
CN108156461A (zh) * | 2017-12-28 | 2018-06-12 | 上海通途半导体科技有限公司 | 一种Bayer图像压缩方法及装置 |
CN108156461B (zh) * | 2017-12-28 | 2021-12-10 | 上海通途半导体科技有限公司 | 一种Bayer图像压缩方法及装置 |
CN113824961A (zh) * | 2021-11-22 | 2021-12-21 | 康达洲际医疗器械有限公司 | 一种可适用于vvc编码标准的帧间图像编码方法与系统 |
CN113824961B (zh) * | 2021-11-22 | 2022-03-29 | 康达洲际医疗器械有限公司 | 一种可适用于vvc编码标准的帧间图像编码方法与系统 |
Also Published As
Publication number | Publication date |
---|---|
CN101783956B (zh) | 2012-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101640802B (zh) | 基于宏块特征和统计特性的视频帧间压缩编码方法 | |
CN103260031B (zh) | 用于对运动矢量进行编码/解码的方法和设备 | |
CN102158709B (zh) | 一种解码端可推导的运动补偿预测方法 | |
CN101783957B (zh) | 一种视频预测编码方法和装置 | |
CN102025995B (zh) | 一种可伸缩视频编码的空间增强层快速模式选择方法 | |
CN103188496B (zh) | 基于运动矢量分布预测的快速运动估计视频编码方法 | |
CN107396102B (zh) | 一种基于Merge技术运动矢量的帧间模式快速选择方法及装置 | |
CN103546758B (zh) | 一种快速深度图序列帧间模式选择分形编码方法 | |
CN101022555B (zh) | 帧间预测编码的模式快速选择方法 | |
CN101385356A (zh) | 采用帧内预测模式的图像编码方法 | |
CN102137263A (zh) | 基于cnm关键帧分类的分布式视频编码及解码方法 | |
CN101888546B (zh) | 一种运动估计的方法及装置 | |
CN108289224B (zh) | 一种视频帧预测方法、装置及自动补偿神经网络 | |
CN103327327B (zh) | 用于高性能视频编码hevc的帧间预测编码单元选择方法 | |
CN100591136C (zh) | 一种基于空域分解的视频帧内编码方法 | |
CN101783956B (zh) | 基于时空邻居信息的后向预测方法 | |
CN102932642A (zh) | 一种帧间编码快速模式选择方法 | |
CN107222742B (zh) | 基于时空域相关性的视频编码Merge模式快速选择方法及装置 | |
CN102291582A (zh) | 一种基于运动补偿精化的分布式视频编码方法 | |
CN103067704A (zh) | 一种基于编码单元层次提前跳过的视频编码方法和系统 | |
CN102647598A (zh) | 基于极大极小mv差值的h.264帧间模式优化方法 | |
CN102088605B (zh) | 可伸缩视频编码快速层间预测选择方法 | |
CN102196272B (zh) | 一种p帧编码方法及装置 | |
CN104702959B (zh) | 一种视频编码的帧内预测方法及系统 | |
CN101883275B (zh) | 视频编码方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120111 Termination date: 20160203 |