CN103517078A - 分布式视频编码中边信息生成方法 - Google Patents

分布式视频编码中边信息生成方法 Download PDF

Info

Publication number
CN103517078A
CN103517078A CN201310452915.1A CN201310452915A CN103517078A CN 103517078 A CN103517078 A CN 103517078A CN 201310452915 A CN201310452915 A CN 201310452915A CN 103517078 A CN103517078 A CN 103517078A
Authority
CN
China
Prior art keywords
motion vector
characteristic point
side information
frame
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310452915.1A
Other languages
English (en)
Inventor
袁春
游小光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Graduate School Tsinghua University
Original Assignee
Shenzhen Graduate School Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Tsinghua University filed Critical Shenzhen Graduate School Tsinghua University
Priority to CN201310452915.1A priority Critical patent/CN103517078A/zh
Publication of CN103517078A publication Critical patent/CN103517078A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种分布式视频编码中边信息生成方法,包括以下步骤:分别对当前WZ帧的两个相邻关键帧进行SIFT特征提取;对提取的特征点,按照距离最近的原则进行帧间特征匹配,生成若干特征点对;用特征点对的运动向量生成用于解码当前WZ帧的边信息,所述特征点对的运动向量为特征点对中两个特征点的相对位移矢量。该方法能够有效提高分布式视频编码中边信息的质量。

Description

分布式视频编码中边信息生成方法
技术领域
本发明涉及分布式视频编码,更具体地说,涉及分布式视频编码中边信息生成方法。
背景技术
随着无线多媒体传感器网络应用的逐渐兴起,分布式视频编码近来逐渐成为研究的热点。由于分布式视频编码当前最大问题在于其率失真性能方面不如传统视频编码标准,如ITU-TH.264。为了提高分布式视频编码的率失真性能,国内外的研究人员在相关噪声模型优化以及改善边信息质量上做了大量的工作。
传统边信息生成算法一般采用运动预测和运动补偿方式进行,其基本步骤包含匹配最佳块、预测运动向量和运动补偿等。匹配算法往往采用最小均方差等方式进行,然后通过前后视频帧的运动向量加权求和来预测当前视频帧的运动向量,最后通过加权平均方式完成运动补偿来生成边信息。在分布式视频编码中,由于解码器并不知道当前帧的内容,因此通过传统方式得到的前后视频帧的最佳匹配块并不能准确反映当前视频帧的运动向量。
发明内容
本发明的目的是提供一种分布式视频编码中边信息生成方法,以提高分布式视频编码中边信息的质量。
图像边缘区域以及图像纹理复杂区域通常是提高边信息质量的瓶颈区域。通过SIFT算法提取的局部特征往往位于局部对象边缘区域以及纹理复杂区域,因此非常有利于准确估计运动向量,与传统基于视频块的运动预测运动补偿相比,有很大的优势。
为了实现上述目的,本发明的总体思路是:通过对相邻的两个关键帧(前后视频帧)的局部特征进行特征匹配来定位局部特征在视频序列中的运动矢量,然后基于局部特征的运动矢量来有效估计局部对象运动向量和/或全局背景运动向量。
本发明采用的技术方案如下:
一种分布式视频编码中边信息生成方法,包括以下步骤:
分别对当前WZ帧的两个相邻关键帧进行SIFT特征提取;
对提取的特征点,按照距离最近的原则进行帧间特征匹配,生成若干特征点对;以及
用特征点对的运动向量生成用于解码当前WZ帧的边信息,所述特征点对的运动向量为特征点对中两个特征点的相对位移矢量。
上述的边信息生成方法中,生成的边信息可以包括局部对象运动向量、和/或全局背景运动向量。
上述的边信息生成方法中,优选通过以下方法计算局部对象区域中像素的运动向量:
从所述的若干特征点对中选择与当前像素相邻的特征点对;
按照距离当前像素越近权重越大的原则,对选出的相邻的特征点对进行运动向量加权平均,所得平均值作为当前像素的运动向量。
上述的边信息生成方法中,优选地,全局背景运动向量的计算方法包括:
将当前WZ帧分割成宏块的集合;
对于含有特征点对的每个宏块,统计宏块内特征点对的所有运动向量的次数,将出现次数最多的运动向量作为该宏块的运动向量;
对于没有特征点对的宏块,将全局运动向量作为其运动向量;所述全局运动向量通过以下方法获得:统计帧内特征点对的所有运动向量的次数,将运动矢量出现次数最多的运动矢量作为全局运动向量。
本发明能够提升边信息的质量。经实验证明,采用本发明边信息生成方法后,分布式视频编码的率失真性能(尤其是低码率下的率失真性能)有很大改善。
附图说明
图1为基于特征点对的全局背景运动估计示意图;
图2为基于特征点对集合的局部对象运动估计示意图;
图3为帧率7.5,GOP大小为2的情况下,Foreman视频序列的性能比较图;
图4为帧率7.5,GOP大小为4的情况下,Foreman视频序列的性能比较图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
以下实施例中,当前WZ帧用X2i表示,当前WZ帧的前、后两个相邻向关键帧分别用x2i-1和X2i+1表示。一些实施例分布式视频编码中边信息生成方法如下。
一.首先,对于视频序列中的当前WZ帧X2i,先将其相邻的前、后两幅关键帧X2i-1和X2i+1进行SIFT特征提取,得到相应的特征点集合W2i-1和w2i+1。对于SIFT特征提取本身而言,是本领域的公知技术,这里不再赘述。
二.对提取的特征点,按照距离最近的原则进行帧间特征匹配,生成若干特征点对。
一种实施例中,用特征点集合w2i+1来构建一棵Kd-树,遍历特征点集合W2i-1中的每一个特征点ωi,在Kd-树中寻找距离最近特征点。距离匹配函数采用欧氏距离:
Θ ( ω i , ω j ) : = { Σ k ( δ il - δ jk ) 2 | δ ik ∈ ω i , δ jk ∈ ω j } - - - ( 1 )
,其中δik表示特征点ωi的第k个特征分量,δjk表示对应特征点ωj的第k个特征分量。所有找到的特征点对组成一个集合,表示为式(2)
ξ : = { ( ω 2 i - 1 m , ω 2 i + 1 n ) | ω 2 i - 1 m ∈ ω 2 i - 1 , ω 2 i + 1 n ∈ w 2 i + 1 , Θ ≤ σ } - - - ( 2 )
,其中σ表示连个特征点是否相邻的阈值。
三.用特征点对的运动向量生成用于解码当前WZ帧X2i的边信息,其中,所述的特征点对的运动向量为特征点对中两个特征点的相对位移矢量。
一种较佳实施例中,生成的边信息包括局部对象运动向量和全局背景运动向量。下面分别说明其生成方法。
1.全局背景运动向量的一种生成方法如下:
图1显示的是对WZ帧进行宏块分割示意图,每一个小的虚框表示宏块,每个宏块内包含一些特征点对。如图1所示,首先将图像分割为宏块的集合,将相同宏块内的特征点对组成同一组,当特征点对的两个特征点属于不同组时,则同时加入两组。接着,统计每一个宏块内特征点对的所有运动矢量的次数,然后将宏块内出现次数最多的运动矢量作为该宏块的运动向量,该方法的计算公式如下所示:
π ij : = arg m ax δ { ( x , y ) | δ = count [ U ∈ → k = ( x , y ) ] , ∈ k ∈ m ( i , j ) } - - - ( 3 )
其中,∈k表示落在位置为(i,j)的宏块m(i,j)的特征点对,为了便于描述,
Figure BDA0000389748140000035
同时表示特征点对中两个特征点的相对位移矢量。δ是位置为(i,j)的宏块内特征点对的数量。运动向量(x,y)就是特征对中两个特征点的相对位移矢量。
对于那些没有特征点对的区域,通常是运动不剧烈区域,即使运动也是因为摄影机或者全局整体移动造成,通过计算整副图像的运动向量就能够很好预测它们的运动向量。为此,为那些没有特征点对的宏块计算一个通用的运动向量,具体可以通过统计当前WZ帧的所有的特征点对的所有运动向量的次数,将出现次数最多的运动矢量作为全局运动向量。该方法的计算公式如下:
π : = arg ma x δ { ( x , y ) | δ = count [ U ∈ → k = ( x , y ) ] } - - - ( 4 )
其中,∈k表示当前WZ帧的特征点对,同时表示特征点对中两个特征点的相对位移矢量。δ是特征点对的数量。运动向量(x,y)就是特征对中两个特征点的相对位移矢量。
2.局部对象运动向量的一种生成方法为,对于局部对象区域的每一个像素,分别计算其运动向量。像素的运动向量的一种计算方法如下:
首先,从生成的所有特征点对中选择与当前像素相邻的特征点对。更具体地说,对于当前像素Pij,遍历所有特征点对,通过过滤函数选择当前像素Pij附近的特征点对,得到相邻特征点对集合
Figure BDA0000389748140000044
ϵ ij neig : = { ∈ k | ∈ k - p ij ≤ σ } - - - ( 5 )
其中,σ是过滤函数阈值。图2示意性地表示了WZ帧中像素的相邻特征点对集合,Pij表示其中一个像素,虚框内的特征点对是其相邻特征点对。在图2中,特征点对∈1-∈4与像素pij的距离在过滤函数阈值以内,因此属于像素pij的相邻特征点对集合成员,然而特征点对∈5与像素pij距离在过滤函数阈值以外,因此不在像素Pij的相邻特征点对集合中,但是它可能是其他像素的相邻点对集合成员。
从图2还可以看出,当前像素pij的相邻特征点对集合
Figure BDA0000389748140000046
中的每一个特征点对都和当前像素Pij相邻匹配,但是和当前像素Pij的相关程度却不一样,因为相邻特征点对集合
Figure BDA0000389748140000047
中的元素与当前像素pij距离并不一样。那些距离当前像素更近的特征点对,其和当前像素的相关度应该更高一些;相反,那些和当前像素距离更远的特征点对,其和当前像素的相关度应该更低一些。
基于上述研究,提出的一种算法是:按照距离当前像素Pij越近权重越大的原则,对选出的相邻的特征点对(即相邻特征点对集合
Figure BDA0000389748140000048
的成员)进行运动向量加权平均,所得平均值作为当前像素Pij的运动向量。
对于每一个特征点对∈k,假设它到当前像素Pij的距离为P[pij-∈k],该特征点对∈k和当前像素Pij相关程度的权值函数可以定义为:
α ( p ij , ∈ k ) : = 1 / e p [ p ij - ∈ k ] , ∈ k ∈ ϵ ij neig - - - ( 6 )
当前像素Pij的运动向量的计算公式如下:
π ′ ij : = Σ k α ( p ij , ∈ k ) * ∈ → k Σ k α ( p ij , ∈ k ) , ∈ k ∈ ϵ ij neig - - - ( 7 )
其中,α(pij,∈k)表示特征点对∈k的权值,
Figure BDA0000389748140000043
是特征点对∈k的特征向量。
通过上述过滤函数,能够有效避免当前像素运动向量估计受到不相关特征点对的影响,特别是在与当前像素相近的特征点对比较少,整体特征点对比较多的情况下,使用过滤函数效果更佳。当一个像素附近有一个特征点对时,特别在当前像素距离特征点对非常近的时候,那么采用特征点对的相对运动矢量作为当前像素的运动向量应该非常可靠。
实验:为了评估本发明所提出的方法的性能,本实验采用和DISCOVER相同的测试条件进行试验。图3和图4表示了实验的结果。
图3显示的是帧率7.5,GOP大小为2的情况下,Foreman视频序列的表现,我们可以看到,由于边信息质量有很大的改进,本发明提出的方法在低码率下明显比DISCOVER系统有很大改进,PSNR性能比DISCOVER系统提高1(dB)。
图4显示的是帧率为7.5,GOP大小为4的情况下,Foreman视频序列的表现,我们可以看到,由于本发明提出的新方法在边信息质量方面有非常大的提升,本发明提出的方法和DISCOVER系统相比在率失真性能上有很大的改进。特别是在低码率情况下,系统采用的基于特征点对的运动估计方法对系统整体性能提高很大。

Claims (5)

1.分布式视频编码中边信息生成方法,其特征在于,包括以下步骤:
分别对当前WZ帧的两个相邻关键帧进行SIFT特征提取;
对提取的特征点,按照距离最近的原则进行帧间特征匹配,生成若干特征点对;以及
用特征点对的运动向量生成用于解码当前WZ帧的边信息,所述特征点对的运动向量为特征点对中两个特征点的相对位移矢量。
2.根据权利要求1所述的边信息生成方法,其特征在于,生成的边信息包括局部对象运动向量。
3.根据权利要求1或2所述的边信息生成方法,其特征在于,生成的边信息包括全局背景运动向量。
4.根据权利要求2所述的边信息生成方法,其特征在于,通过以下方法计算局部对象区域中像素的运动向量:
从所述的若干特征点对中选择与当前像素相邻的特征点对;
按照距离当前像素越近权重越大的原则,对选出的相邻的特征点对进行运动向量加权平均,所得平均值作为当前像素的运动向量。
5.根据权利要求3所述的边信息生成方法,其特征在于,全局背景运动向量的计算方法包括:
将当前WZ帧分割为宏块的集合;
对于含有特征点对的每个宏块,统计宏块内特征点对的所有运动向量的次数,将出现次数最多的运动向量作为该宏块的运动向量;
对于没有特征点对的宏块,将全局运动向量作为其运动向量;所述全局运动向量通过以下方法获得:统计帧内特征点对的所有运动向量的次数,将运动矢量出现次数最多的运动矢量作为全局运动向量。
CN201310452915.1A 2013-09-29 2013-09-29 分布式视频编码中边信息生成方法 Pending CN103517078A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310452915.1A CN103517078A (zh) 2013-09-29 2013-09-29 分布式视频编码中边信息生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310452915.1A CN103517078A (zh) 2013-09-29 2013-09-29 分布式视频编码中边信息生成方法

Publications (1)

Publication Number Publication Date
CN103517078A true CN103517078A (zh) 2014-01-15

Family

ID=49898991

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310452915.1A Pending CN103517078A (zh) 2013-09-29 2013-09-29 分布式视频编码中边信息生成方法

Country Status (1)

Country Link
CN (1) CN103517078A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104093030A (zh) * 2014-07-09 2014-10-08 天津大学 分布式视频编码边信息生成方法
CN105306952A (zh) * 2015-09-30 2016-02-03 南京邮电大学 一种降低边信息生成计算复杂度的方法
CN110839157A (zh) * 2019-10-17 2020-02-25 西安万像电子科技有限公司 图像处理方法及装置
CN110933428A (zh) * 2019-10-17 2020-03-27 西安万像电子科技有限公司 图像处理方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090245372A1 (en) * 2008-03-27 2009-10-01 Oki Electric Industry Co., Ltd. Decoding system and method
CN102026000A (zh) * 2011-01-06 2011-04-20 西安电子科技大学 像素域-变换域联合的分布式视频编码系统
CN102572418A (zh) * 2010-12-28 2012-07-11 深圳市融创天下科技股份有限公司 一种帧间编码的运动预测方法和系统
CN102811349A (zh) * 2012-07-20 2012-12-05 西安电子科技大学 可自动调节冗余的无反馈多描述分布式视频编解码器
JP2013123192A (ja) * 2011-12-12 2013-06-20 Oki Electric Ind Co Ltd 動画像符号化装置、システム及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090245372A1 (en) * 2008-03-27 2009-10-01 Oki Electric Industry Co., Ltd. Decoding system and method
CN102572418A (zh) * 2010-12-28 2012-07-11 深圳市融创天下科技股份有限公司 一种帧间编码的运动预测方法和系统
CN102026000A (zh) * 2011-01-06 2011-04-20 西安电子科技大学 像素域-变换域联合的分布式视频编码系统
JP2013123192A (ja) * 2011-12-12 2013-06-20 Oki Electric Ind Co Ltd 動画像符号化装置、システム及びプログラム
CN102811349A (zh) * 2012-07-20 2012-12-05 西安电子科技大学 可自动调节冗余的无反馈多描述分布式视频编解码器

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ABDALBASSIR ABOU-ELAILAH,FREDERIC DUFAUX,ET AL.: "Fusion of Global and Local Motion Estimation for Distributed Video Coding", 《IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY》 *
RALPH HANSEL,HENRYK RICHTER,ERIKA MULLER: "Incorporating feature point-based motion hypotheses in distributed video coding", 《2011 3RD INTERNATIONAL CONGRESS ONULTRA MODERN TELECOMMUNICATIONS AND CONTROL SYSTEMS AND WORKSHOPS (ICUMT)》 *
TAEYOUNG NA,MUNCHURL KIM: "Side information extraction based on motion trajectory learning for distributed video coding", 《2012 IEEE INTERNATIONAL SYMPOSIUM ON BROADBAND MULTIMEDIA SYSTEMS AND BROADCASTING (BMSB) 》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104093030A (zh) * 2014-07-09 2014-10-08 天津大学 分布式视频编码边信息生成方法
CN104093030B (zh) * 2014-07-09 2017-12-12 天津大学 分布式视频编码边信息生成方法
CN105306952A (zh) * 2015-09-30 2016-02-03 南京邮电大学 一种降低边信息生成计算复杂度的方法
CN105306952B (zh) * 2015-09-30 2019-03-05 南京邮电大学 一种降低边信息生成计算复杂度的方法
CN110839157A (zh) * 2019-10-17 2020-02-25 西安万像电子科技有限公司 图像处理方法及装置
CN110933428A (zh) * 2019-10-17 2020-03-27 西安万像电子科技有限公司 图像处理方法及装置

Similar Documents

Publication Publication Date Title
CN105847804B (zh) 一种基于稀疏冗余表示模型的视频帧率上转换方法
CN101860748B (zh) 基于分布式视频编码的边信息生成系统及方法
CN111355956B (zh) 一种hevc帧内编码中基于深度学习的率失真优化快速决策系统及其方法
CN103327327B (zh) 用于高性能视频编码hevc的帧间预测编码单元选择方法
CN102137263A (zh) 基于cnm关键帧分类的分布式视频编码及解码方法
CN103546758B (zh) 一种快速深度图序列帧间模式选择分形编码方法
CN105120290B (zh) 一种深度视频快速编码方法
CN101986716A (zh) 一种快速深度视频编码方法
CN108924568B (zh) 一种基于3d-hevc框架的深度视频错误隐藏方法
CN108574844B (zh) 一种时空显著感知的多策略视频帧率提升方法
CN103517078A (zh) 分布式视频编码中边信息生成方法
CN104869421A (zh) 基于全局运动估计的视频显著性检测方法
CN102572446A (zh) 一种多视点视频整帧丢失错误隐藏方法
KR100947447B1 (ko) 다시점 동영상 부호화에서 고속 모드 결정 방법 및 장치
TWI489876B (zh) A Multi - view Video Coding Method That Can Save Decoding Picture Memory Space
CN115695803A (zh) 一种基于极限学习机的帧间图像编码方法
CN103856782B (zh) 基于多视点视频整帧丢失的自适应错误掩盖方法
CN101557519B (zh) 一种多视点视频编码方法
CN102647595B (zh) 一种基于avs的亚像素运动估计的装置
CN101783956B (zh) 基于时空邻居信息的后向预测方法
Sotetsumoto et al. Low complexity algorithm for sub-pixel motion estimation of HEVC
CN104618714B (zh) 一种立体视频帧重要性评估方法
CN114173206B (zh) 融合用户兴趣和行为特征的低复杂度视点预测方法
CN101459849A (zh) 基于多视点编码的运动搜索范围自适应调节的快速运动估计方法
Xiang et al. Auto-regressive model based error concealment scheme for stereoscopic video coding

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140115