CN102164281B - 一种基于视觉显著度模型的视频编码码率控制方法 - Google Patents

一种基于视觉显著度模型的视频编码码率控制方法 Download PDF

Info

Publication number
CN102164281B
CN102164281B CN 201110078756 CN201110078756A CN102164281B CN 102164281 B CN102164281 B CN 102164281B CN 201110078756 CN201110078756 CN 201110078756 CN 201110078756 A CN201110078756 A CN 201110078756A CN 102164281 B CN102164281 B CN 102164281B
Authority
CN
China
Prior art keywords
significance
frm
frame
macro block
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN 201110078756
Other languages
English (en)
Other versions
CN102164281A (zh
Inventor
胡瑞敏
阮若林
陈皓
夏洋
王中元
胡金晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kean electric Polytron Technologies Inc
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN 201110078756 priority Critical patent/CN102164281B/zh
Publication of CN102164281A publication Critical patent/CN102164281A/zh
Application granted granted Critical
Publication of CN102164281B publication Critical patent/CN102164281B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及视频通信技术领域,尤其涉及一种基于视觉显著度模型的视频编码码率控制方法。本发明根据视频图像自身的特性和人眼视觉感知特性对视频图像进行显著度建模,并根据该模型提取视频场景的显著度区域;结合视频场景显著度区域的大小改进H.264现有的帧级码率分配机制,计算分配当前帧的目标比特率;在宏块级码率分配中,结合当前编码宏块的纹理信息丰富程度、运动剧烈程度和宏块的显著度建立基于显著度模型的宏块级码率分配机制;重复上述步骤,直至当前帧编码完毕。本发明根据人眼视觉的选择注意机制和视频场景的显著度显著进行码率分配,符合人眼视觉的编码特性。本发明在码率受限的情况下可以获得更好的的主观视频图像质量。

Description

一种基于视觉显著度模型的视频编码码率控制方法
技术领域
本发明涉及视频通信技术领域,尤其涉及一种基于视觉显著度模型的视频编码码率控制方法。
背景技术
视频编码的目的就是要用尽可能低的码率获得尽可能高的用户感受质量,视频编码码率控制机制是根据传输信道的速率和缓冲区的大小来动态调节编码宏块的编码参数,以充分利用所提供的网络资源,并在防止拥塞发生的情况下有效保证用户获得最佳的主客观感受质量。传统的码率分配都是根据图像内容的复杂程度进行比特分配,但是并未考虑人眼视觉对图像的显著程度,因而导致在码率受限的情况下许多图像中重要的区域由于没有得到充分的码率资源而模糊不清。因此,利用人眼视觉特性结合视频图像自身特点建模进行码率分配机制的研究具有重要意义。
发明内容
针对上述存在的技术问题,本发明的目的是提供一种基于视觉显著度模型的视频编码码率控制方法,在码率受限的情况下有效保证视频场景中显著度区域的主观质量,根据视频图像自身特性和人眼视觉相关特性建立基于视觉显著度模型来指导视频编码码率分配,提高码率受限情况下显著度区域的主观图像质量。
为达到上述目的,本发明采用如下的技术方案:
(1)根据Itti等人2003年在48届SPIE年会论文集中发表的文章“Realistic avatar eye andhead animation using a neurobiological model of visual attention”中提出的视觉显著度模型,融合视频图像自身特性,建立修正的显著度计算模型,计算像素点的显著度值SM:SM=λ1·I+λ2·C+λ3·F+λ4·O+λ5·M
其中,λ1,λ2,λ3,λ4,λ5为对应的加权系数,此处均取值为1,I、C、F、O、M分别代表图像强度、颜色、闪烁、方向、运动特性对应的显著度子图;
(2)根据显著度计算模型得到的融合显著度图提取当前帧的显著度区域,记为ROA(frmi),并计算显著度区域ROA(frmi)的大小;
(3)根据视频帧的显著度区域改进H264现有的帧级码率分配机制,重新计算当前帧的目标比特数;
(4)计算在考虑实际带宽条件的当前帧目标比特数R′(frmi):
R ′ ( frm i ) = R f + γ ( Tbl ( i ) - Buffer ( i ) )
其中R是可用信道带宽,f是帧率,γ是常数,其典型值在B帧时为0.5,否则为0.25,Tbl(i)是目标比特流,Buffer(i)是缓冲区大小;
(5)计算在考虑GOP剩余比特数的当前帧目标比特数R″(frmi):
R ′ ′ ( frm i ) = W p ( n i ) T r ( n i , j ) W p ( n i ) N p , r + W b ( n i ) N b , r
其中Wp(ni)为P帧的复杂度,Wb(ni)为B帧的复杂度,Tr(ni,j)为剩余比特,Np,r和Nb,r分别是剩余的P帧和B帧数;
(6)根据R′(frmi)和R″(frmi),考虑前、后帧显著度区域大小,计算当前帧目标比特数R(frmi):
R ( frm i ) = [ β * R ′ ′ ( frm i ) + ( 1 - β ) R ′ ( frm i ) ] * ROA ( frm i ) ROA ( frm i - 1 )
其中β是为常数,其典型值在B时为0.5,否则为0.9,ROA(frmi-1)是前一帧的显著度区域;
(7)根据宏块像素的显著度值计算得到的整个宏块的显著度值SM(MBi),利用SM(MBi)和宏块的MAD值MAD(MBi)计算宏块的复杂度MADSM(MBi):
MADSM(MBi)=SM(MBi)*MAD(MBi);
(8)根据宏块的复杂度MADSM(MBi)建立全局优化的宏块级码率分配模型,计算当前宏块的比特数R(MBi):
R ( MB i ) = [ R ( frm i ) N mb - m head ] * MAD SM ( MB i ) Σ k ∈ [ 1 , N mb ] MAD SM ( MB k )
其中Nmb一帧中宏块的数目,mhead头信息所占的比特数;
(9)重复步骤(7)~(8),若是最后一个宏块,则更新码率控制模型的参数,结束操作。
本发明具有以下优点和积极效果:
本发明与H.264/中采用的技术相对照,效果是积极且明显的;提高了解码图像的主观质量特别是视频图像的显著度区域的主观质量。
附图说明
图1是本发明提供的基于视觉显著度模型的视频编码码率控制方法的流程图。
具体实施方式
一种基于视觉显著度模型的视频编码码率控制方法,其特征在于:先根据视频图像自身的特性和人眼视觉感知特性对视频图像进行显著度建模,并根据该模型提取视频场景的显著度区域;其次,结合视频场景显著度区域的大小改进H.264现有的帧级码率分配机制,计算分配当前帧的目标比特率;然后,在宏块级码率分配中,结合当前编码宏块的纹理信息丰富程度、运动剧烈程度和宏块的显著度建立基于显著度模型的宏块级码率分配机制,最后,重复上述步骤,直至当前帧编码完毕,具体步骤如下:
(1)根据Itti等人2003年在48届SPIE年会论文集中发表的文章“Realistic avatar eye andhead animation using a neurobiological model ofvisual attention”中提出的视觉显著度模型,利用图像自身的强度、颜色、闪烁、方向、运动等特性,分别计算得到各种显著度子图,最后融合这五种特性的显著度子图得到融合的显著度图,计算得到像素点的显著度值SM:SM=λ1·I+λ2·C+λ3·F+λ4·O+λ5·M
其中,λ1,λ2,λ3,λ4,λ5为对应的加权系数,此处均取值为1,I、C、F、O、M分别代表图像强度、颜色、闪烁、方向、运动特性对应的显著度子图;
(2)根据显著度计算模型得到的融合显著度图提取当前帧的显著度区域,记为ROA(frmi),并计算显著度区域ROA(frmi)的大小;
(3)根据视频帧的显著度区域改进H264现有的帧级码率分配机制,重新计算当前帧的目标比特数;
(4)计算在考虑实际带宽条件的当前帧目标比特数R′(frmi):
R ′ ( frm i ) = R f + γ ( Tbl ( i ) - Buffer ( i ) )
其中R是可用信道带宽,f是编码帧率,γ是常数,其典型值在B帧时为0.5,否则为0.25,Tbl(i)是目标比特流,Buffer(i)是缓冲区大小;
(5)计算在考虑GOP(图像组)剩余比特数的当前帧目标比特数R″(frmi):
R ′ ′ ( frm i ) = W p ( n i ) T r ( n i , j ) W p ( n i ) N p , r + W b ( n i ) N b , r
其中Wp(ni)为P帧的复杂度,Wb(ni)为B帧的复杂度,Tr(ni,j)为剩余比特,Np,r和Nb,r分别是GOP中剩余的P帧和B帧数;
(6)根据R′(frmi)和R″(frmi),考虑前、后帧显著度区域大小,计算当前帧目标比特数R(frmi):
R ( frm i ) = [ β * R ′ ′ ( frm i ) + ( 1 - β ) R ′ ( frm i ) ] * ROA ( frm i ) ROA ( frm i - 1 )
其中β是为常数,其典型值在B时为0.5,否则为0.9,ROA(frmi-1)是前一帧的显著度区域大小;
(7)根据宏块像素的显著度值计算得到的整个宏块的显著度值,记为SM(MBi),并根据宏块的SM(MBi)和MAD(MBi)(宏块的MAD值)计算宏块的复杂度,记为MADSM(MBi):
MADSM(MBi)=SM(MBi)*MAD(MBi);
(8)根据宏块的复杂度MADSM(MBi)建立全局优化的宏块级码率分配模型,计算当前宏块的比特数,记为R(MBi):
R ( MB i ) = [ R ( frm i ) N mb - m head ] * MAD SM ( MB i ) Σ k ∈ [ 1 , N mb ] MAD SM ( MB k )
其中Nmb一帧中宏块的数目,mhead头信息所占的比特数;
(9)重复步骤(7)~(8),若是最后一个宏块,则更新码率控制模型的参数,结束操作。
本发明与H.264/中采用的技术相对照,效果是积极且明显的;提高解码图像的主观质量特别是视频图像的显著度区域的主观质量。
实施例
本实施例采用H264/AVC的参考软件JM12.2作为编解码器,视频传输采用3GPP/3GPP2无线IP信道,以下为本发明实施例的具体步骤:
(1)根据Itti等人2003年在48届SPIE年会论文集中发表的文章“Realistic avatar eye andhead animation using a neurobiological model of visual attention”中提出的视觉显著度模型,利用图像自身的强度、颜色、闪烁、方向、运动等特性,分别计算得到各种显著度子图,最后融合这五种特性的显著度子图得到融合的显著度图,计算得到像素点的显著度值SM:SM=λ1·I+λ2·C+λ3·F+λ4·O+λ5·M
其中,λ1,λ2,λ3,λ4,λ5为对应的加权系数,此处均取值为1,I、C、F、O、M分别代表图像强度、颜色、闪烁、方向、运动特性对应的显著度子图;
(2)根据显著度计算模型得到的融合显著度图提取当前帧的显著度区域,记为ROA(frmi),并计算显著度区域ROA(frmi)的大小;
(3)根据视频帧的显著度区域改进H264现有的帧级码率分配机制,重新计算当前帧的目标比特数;
(4)计算在考虑实际带宽条件的当前帧目标比特数R′(frmi):
R ′ ( frm i ) = R f + γ ( Tbl ( i ) - Buffer ( i ) )
其中R是可用信道带宽,f是编码帧率,γ是常数,其典型值在B帧时为0.5,否则为0.25,Tbl(i)是目标比特流,Buffer(i)是缓冲区大小;
(5)计算在考虑GOP(图像组)剩余比特数的当前帧目标比特数R″(frmi):
R ′ ′ ( frm i ) = W p ( n i ) T r ( n i , j ) W p ( n i ) N p , r + W b ( n i ) N b , r
其中Wp(ni)为P帧的复杂度,Wb(ni)为B帧的复杂度,Tr(ni,j)为剩余比特,Np,r和Nb,r分别是GOP中剩余的P帧和B帧数;
(6)根据R′(frmi)和R″(frmi),考虑前、后帧显著度区域大小,计算当前帧目标比特数R(frmi):
R ( frm i ) = [ β * R ′ ′ ( frm i ) + ( 1 - β ) R ′ ( frm i ) ] * ROA ( frm i ) ROA ( frm i - 1 )
其中β是为常数,其典型值在B时为0.5,否则为0.9,ROA(frmi-1)是前一帧的显著度区域大小;
(7)根据宏块像素的显著度值计算得到的整个宏块的显著度值,记为SM(MBi),并根据宏块的SM(MBi)和MAD(MBi)(宏块的MAD值)计算宏块的复杂度,记为MADSM(MBi):
MADSM(MBi)=SM(MBi)*MAD(MBi);
(8)根据宏块的复杂度MADSM(MBi)建立全局优化的宏块级码率分配模型,计算当前宏块的比特数,记为R(MBi):
R ( MB i ) = [ R ( frm i ) N mb - m head ] * MAD SM ( MB i ) Σ k ∈ [ 1 , N mb ] MAD SM ( MB k )
其中Nmb一帧中宏块的数目,mhead头信息所占的比特数;
(9)重复步骤(7)~(8),若是最后一个宏块,则更新码率控制模型的参数,结束操作。
本实施例使用的是适合无线传输的典型标准QCIF视频序列:Foreman、Carphone、Akiyo,这些视频序列是头肩系列,具有不同的纹理以及运动特征,显著区域主要集中在图像的中央。编码器的主要参数为:编码模式为IPPP,编码帧率为15frame/s,视频序列的编码帧数均为100帧,不使用多参考帧运动预测,每个视频数据包的大小限定为100个字节。实验采用了ITU推荐的3G无线视频通用测试环境,使用误码模式文件来模拟实际信道的比特误码,其中Foreman和Carphone序列使用比特率为128kbit/s、误比特率为5.0×10-4、移动速度为3km/h的误码模式文件,而Akiyo序列则使用比特率为64kbit/s、误比特率为5.1×10-4、移动速度为3km/h的误码模式文件。
以上实施例仅供说明本发明之用,而非对本发明的限制,有关技术领域的技术人员,在不脱离本发明的精神和范围的情况下,还可以作出各种变换或变型,因此所有等同的技术方案,都落入本发明的保护范围。

Claims (1)

1.一种基于视觉显著度模型的视频编码码率控制方法,其特征在于,包括以下步骤:
(1)根据Itti等人2003年在48届SPIE年会论文集中发表的文章“Realistic avatar eye andhead animation using a neurobiological model ofvisual attention”中提出的视觉显著度模型,融合视频图像自身特性,建立修正的显著度计算模型,计算像素点的显著度值SM:SM=λ1·I+λ2·C+λ3·F+λ4·O+λ5·M
其中,λ1,λ2,λ3,λ4,λ5为对应的加权系数,此处均取值为1,I、C、F、O、M分别代表图像强度、颜色、闪烁、方向、运动特性对应的显著度子图;
(2)根据显著度计算模型得到的融合显著度图提取当前帧的显著度区域ROA(frmi);
(3)根据视频帧的显著度区域改进H.264现有的帧级码率分配机制,重新计算当前帧的目标比特数;
(4)计算在考虑实际带宽条件的当前帧目标比特数R′(frmi):
R ′ ( frm i ) = R f + γ ( Tbl ( i ) - Buffer ( i ) )
其中R是可用信道带宽,f是帧率,γ是常数,其典型值在B帧时为0.5,否则为0.25,Tbl(i)是目标比特流,Buffer(i)是缓冲区大小;
(5)计算在考虑GOP图像组剩余比特数的当前帧目标比特数R″(frmi):
R ′ ′ ( frm i ) = W p ( n i ) T r ( n i , j ) W p ( n i ) N p , r + W b ( n i ) N b , r
其中Wp(ni)为P帧的复杂度,Wb(ni)为B帧的复杂度,Tr(ni,j)为剩余比特,Np,r和Nb,r分别是剩余的P帧和B帧数;
(6)根据R′(frmi)和R″(frmi),考虑前、后帧显著度区域大小,计算当前帧目标比特数R(frmi):
R ( frm i ) = [ β * R ′ ′ ( frm i ) + ( 1 - β ) R ′ ( frm i ) ] * ROA ( frm i ) ROA ( frm i - 1 )
其中β是为常数,其典型值在B帧时为0.5,否则为0.9,ROA(frmi-1)是前一帧的显著度区域;
(7)根据宏块像素的显著度值计算得到整个宏块的显著度值SM(MBi),利用SM(MBi)和宏块的MAD值MAD(MBi)计算宏块的复杂度MADSM(MBi):
MADSM(MBi)=SM(MBi)*MAD(MBi);
(8)根据宏块的复杂度MADSM(MBi)建立全局优化的宏块级码率分配模型,计算当前宏块的比特数R(MBi):
R ( MB i ) = [ R ( frm i ) N mb - m head ] * M AD SM ( MB i ) Σ k ∈ [ 1 , N mb ] MAD SM ( MB k )
其中Nmb一帧中宏块的数目,mhead头信息所占的比特数;
(9)重复步骤(7)~(8),若是最后一个宏块,则更新码率控制模型的参数,结束操作。
CN 201110078756 2011-03-30 2011-03-30 一种基于视觉显著度模型的视频编码码率控制方法 Active CN102164281B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110078756 CN102164281B (zh) 2011-03-30 2011-03-30 一种基于视觉显著度模型的视频编码码率控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110078756 CN102164281B (zh) 2011-03-30 2011-03-30 一种基于视觉显著度模型的视频编码码率控制方法

Publications (2)

Publication Number Publication Date
CN102164281A CN102164281A (zh) 2011-08-24
CN102164281B true CN102164281B (zh) 2012-08-08

Family

ID=44465208

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110078756 Active CN102164281B (zh) 2011-03-30 2011-03-30 一种基于视觉显著度模型的视频编码码率控制方法

Country Status (1)

Country Link
CN (1) CN102164281B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102395030B (zh) * 2011-11-18 2014-05-07 杭州海康威视数字技术股份有限公司 基于视频压缩码流的运动分析方法、码流转换方法及其装置
CN103024387B (zh) * 2012-12-17 2015-12-09 宁波大学 一种基于感知的多视点视频码率控制方法
CN109451309B (zh) * 2018-12-04 2022-07-26 南京邮电大学 Hevc全i帧编码基于显著性的ctu层码率分配方法
CN110784716B (zh) * 2019-08-19 2023-11-17 腾讯科技(深圳)有限公司 媒体数据处理方法、装置及介质
CN110996125B (zh) * 2019-11-18 2021-08-17 腾讯科技(深圳)有限公司 一种视频流的生成方法、装置、电子设备及存储介质
CN112291563A (zh) * 2020-10-22 2021-01-29 咪咕视讯科技有限公司 一种视频编码方法、设备及计算机可读存储介质
CN112637596B (zh) * 2020-12-21 2023-04-11 中国科学院国家空间科学中心 一种码率控制系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101668197A (zh) * 2009-09-18 2010-03-10 浙江大学 一种基于线性模型的可伸缩性视频编码中的码率控制方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101668197A (zh) * 2009-09-18 2010-03-10 浙江大学 一种基于线性模型的可伸缩性视频编码中的码率控制方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Yu Sun et al.Region-Based Rate Control and Bit Allocation for Wireless Video Transmission.《IEEE Transactions on Multimedia》.2006,第8卷(第1期),全文. *
张锦辉等.基于感知模型的自适应码率控制算法.《电视技术》.2008,第32卷(第9期),全文. *
江建敏等.H.264码率控制算法研究.《计算机工程与应用》.2007,(第20期),全文. *

Also Published As

Publication number Publication date
CN102164281A (zh) 2011-08-24

Similar Documents

Publication Publication Date Title
CN102164281B (zh) 一种基于视觉显著度模型的视频编码码率控制方法
CN101466035B (zh) 一种基于h.264的视频图像组比特分配方法
CN101534436B (zh) 一种视频图像宏块级自适应码率分配方法
CN102137258B (zh) 一种立体视频码率控制方法
CN100425077C (zh) 采用帧目标比特数不平均分配的视频压缩码率控制方法
US6741648B2 (en) Apparatus, and associated method, for selecting an encoding rate by which to encode video frames of a video sequence
CN105049850A (zh) 基于感兴趣区域的hevc码率控制方法
CN102630013B (zh) 基于场景切换的码率控制视频压缩方法和装置
CN101572806B (zh) 一种基于h.264的i帧码率控制方法
CN102281446B (zh) 一种分布式视频编码中基于视觉感知特性的量化方法
CN104994382B (zh) 一种感知率失真的优化方法
CN100448297C (zh) 一种码率控制方法
CN104104951A (zh) Hevc中屏幕内容编码的码率控制方法
CN101674472A (zh) 多视点视频编码的多级码率控制方法
CN108810530A (zh) 一种基于人眼视觉系统的avc码率控制方法
CN103533359A (zh) 一种h.264码率控制方法
CN102938840A (zh) 应用于多视点视频编码系统的关键帧量化参数选择方法
TWI674796B (zh) 用於即時編碼之方法及裝置
Liu et al. A novel rate control scheme for panoramic video coding
CN103108210B (zh) 基于空域复杂度的无参考视频质量评价方法
CN103391439B (zh) 一种基于主动宏块隐藏的h.264/avc码率控制方法
CN105187832B (zh) 基于2.5g无线网络移动视频码率控制方法
CN100442848C (zh) 一种h263编码中码率的控制方法
CN101572810A (zh) 一种基于感兴趣区的视频编码方法
CN101389012B (zh) 一种率失真码率控制的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20160113

Address after: 100102 Beijing city Chaoyang District Guangshun North Street Hospital No. 33, No. 1 Building 1 unit 7 room 808

Patentee after: Kean electric (Beijing) Technology Co., Ltd.

Address before: 430072 Hubei Province, Wuhan city Wuchang District of Wuhan University Luojiashan

Patentee before: Wuhan University

CP03 Change of name, title or address

Address after: 100102 Beijing city Chaoyang District Guangshun North Street Hospital No. 33 Building 1 unit 7 room 808

Patentee after: Kean electric (Beijing) Polytron Technologies Inc

Address before: 100102 Beijing city Chaoyang District Guangshun North Street Hospital No. 33, No. 1 Building 1 unit 7 room 808

Patentee before: Kean electric (Beijing) Technology Co., Ltd.

CP03 Change of name, title or address
CP01 Change in the name or title of a patent holder

Address after: 100102 Beijing city Chaoyang District Guangshun North Street Hospital No. 33 Building 1 unit 7 room 808

Patentee after: Kean electric Polytron Technologies Inc

Address before: 100102 Beijing city Chaoyang District Guangshun North Street Hospital No. 33 Building 1 unit 7 room 808

Patentee before: Kean electric (Beijing) Polytron Technologies Inc

CP01 Change in the name or title of a patent holder