CN110401832B - 一种基于时空管道建模的全景视频客观质量评估方法 - Google Patents
一种基于时空管道建模的全景视频客观质量评估方法 Download PDFInfo
- Publication number
- CN110401832B CN110401832B CN201910654689.2A CN201910654689A CN110401832B CN 110401832 B CN110401832 B CN 110401832B CN 201910654689 A CN201910654689 A CN 201910654689A CN 110401832 B CN110401832 B CN 110401832B
- Authority
- CN
- China
- Prior art keywords
- distortion
- space
- time
- frame
- pipeline
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001303 quality assessment method Methods 0.000 title claims description 12
- 238000013441 quality evaluation Methods 0.000 claims abstract description 22
- 238000011176 pooling Methods 0.000 claims abstract description 18
- 230000008859 change Effects 0.000 claims abstract description 8
- 238000010845 search algorithm Methods 0.000 claims abstract description 8
- 230000007246 mechanism Effects 0.000 claims abstract description 6
- 238000011156 evaluation Methods 0.000 claims description 9
- 230000002123 temporal effect Effects 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 5
- 230000000007 visual effect Effects 0.000 claims description 5
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000000034 method Methods 0.000 abstract description 13
- 238000004364 calculation method Methods 0.000 abstract description 10
- 230000004438 eyesight Effects 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000004424 eye movement Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000007654 immersion Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004434 saccadic eye movement Effects 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000016776 visual perception Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N17/00—Diagnosis, testing or measuring for television systems or their details
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N2013/0074—Stereoscopic image analysis
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种基于时空管道建模的全景视频客观质量评估方法,首先,根据人眼视觉机制,加入了时域失真的概念,建立了一种基于时空管道的视频质量评估模型;其次,时空管道的建立由用于运动估计的块搜索算法实现,实现了将在空间上切分的视频内容在时间上前后关联,而时空管道的失真分解为平均失真和时域失真,前者通过一个递归滤波器对时空管道中块与块的空间失真进行合理的平均,后者通过结合块与块之间失真变化梯度的频率和幅度对时空管道失真计算进行了巩固;最后,将所有时空管道失真通过空域池化和时域池化计算得出最终的视频质量评分。采用本发明方法,可大大提高全景视频客观质量评估的精确度,使之更符合人眼的主观质量评价的结果。
Description
技术领域
本发明属于视频编码和处理领域,具体涉及一种基于时空管道建模的全景视频客观质量评估方法。
背景技术
随着虚拟与增强现实技术的不断发展,全景视频媒体系统技术标准的制定与完善逐渐显得越来越重要。全景视频(即360度视频)是通过专业相机捕捉整个场景的图像信息,使用软件进行拼接,并用专门的播放器进行播放。在观看360度视频时,观看者通常需要佩戴虚拟头盔,通过头部的运动观看不同位置的视频图像,从而达到观看的沉浸感和身临其境感。然而,由于全景视频包含很多的视角观看信息,通常都具有较大的图像分辨率(如4K,8K等),如何对其高效压缩与质量评估目前成为研究热点。用于2D平面视频媒体的成熟技术方案直接移植于360度全景视频系统中还存在各种各样的问题,其中对于全景视频的客观质量评估方法是亟待解决的问题之一。
视频质量评估从方法上可分为主观评估和客观评估。主观评估就是人从主观感知来评价视频图像质量,通过给观察者展示原始参考图像和失真图像,让观察者为其失真图像评分;而客观评估使用数学模型计算给出量化值,无需人工参与,简便易行。由于主观实验受观察者位置、设备、照明、视力水平甚至情绪等因素影响,费时费力,所以有必要设计出能够精确预测主观质量的客观质量评估方法。由于360度全景视频的球面特性,直接将传统2D平面视频的客观质量评估方法用于分析全景视频,其结果与用户主观体验差异较大,不能够准确反应主观质量。另外,现有的全景视频客观质量评估方案中,WS-PSNR(Weighted-Spherically PNSR)是一种最近提出的并得到广泛应用的客观质量计算方法,该方法通过计算球面到平面映射的拉伸因子,并利用该因子加权对应平面视频计算的PSNR。但该方法也只考虑了全景视频的空间特性,没有考虑失真的时域变换,精确度也尚有提升的空间。
发明内容
发明目的:本发明提出一种考虑时域特性的基于时空管道建模的全景视频客观质量评估方法,可提高360度全景视频客观质量评估的精确度,使之更符合人眼的主观质量评价结果。
发明内容:本发明所述的一种基于时空管道建模的全景视频客观质量评估方法,包括以下步骤:
(1)将全景视频序列每帧分块,对于每帧每块的质量评估通过向前回溯构建的时空管道来计算取得;所述时空管道的构建由运动估计的块搜索算法按块与块之间内容相似度来匹配连接,作为视频质量评估的基本单元;
(2)在时空管道评估单元构建完成后,计算每帧每块的时空管道的失真值;所述失真值由平均失真和时域失真两部分构成,平均失真是由时空管道上所有块的空间失真平均计算得到,而时域失真则由块与块之间失真变化的梯度值的频率和幅度结合平均失真得到;
(3)将每一帧的所有时空管道单元失真值进行空间池化,得到每一帧的失真值评估,将整个视频所有帧的失真求平均得到关于该视频的失真评估,再通过对该视频失真计算峰值信噪比得出最终全景视频客观质量评分。
所述步骤(1)包括以下步骤:
(11)对于原始视频序列的第t帧,我们将该帧按行列分成K·L个块;
(12)根据人眼视觉机制,假设一次可能的眼球注视动作会从任一帧t的任一块(k,l)开始,并在时空域中移动且持续不超过注视时长Th;对于块(kt,lt)在向前一个Th时间范围内的若干帧中,用块搜索算法向前逐帧寻找相似的匹配块(kt-1,lt-1),块(kt-2,lt-2),…,块(kt-n,lt-n);
(13)将空域上的n个块连接组成一个时空管道,作为一个基本质量评估单元,在每帧中,便有K·L个时空管道。
所述步骤(2)通过以下公式实现:
块的失真值:
时空管道的平均失真值Dk,l,t:
Dk,l,t=α·Dk,l,t-1+(1-α)·dk,l,t
时空管道的时域失真D′k,l,t:
其中,M和N表示块中水平和垂直方向的像素个数,y(i,j)和y′(i,j)分别是原始视频序列和失真视频序列中的像素值,ω(i,j)则是对应像素点权值,α为平滑因子,为块(k,l,t)的失真变化梯度,β为自由参数,表示时域失真D′k,l,t的影响程度,β越大,时域失真对总体失真影响越大。
所述步骤(3)通过以下公式实现:
空域池化计算如下:
时域池化计算如下:
其中,Dt表示帧t的失真,βs为Minkowski指数,N为视频序列中总帧数,D为整个视频序列的失真评估。
有益效果:与现有技术相比本发明的有益效果:本发明充分地结合了人眼的视觉关注机制,不仅在保留了已有的全景视频客观质量评估方案中的空间特性的前提下,引入时域失真变化的考虑,大大的增加了全景视频客观质量评估的精确度,使其更符合主观质量评估的结果。
附图说明
图1为本发明的流程图;
图2为时空管道结构示意图;
图3为拟合函数fs(ns)图像。
具体实施方式
不同于传统的2D视频的平面表现空间,全景视频的表示空间是三维球面。因此,当使用传统平面视频的压缩编码方案编码全景视频数据时,需先将全景视频的球面空间映射到平面空间,再进行编码压缩;当解码后,还需要再映射回球面空间用于展现。时域失真可以被定义为空间失真在时间尺度上的演变,如画面连续闪烁,急速抖动等,这些剧烈且持续的空间失真对人眼的感知系统同样产生着重大的影响。
下面结合附图对本发明作进一步详细说明。如图1所示本发明包括以下步骤:
1、时空管道的建立
人视觉机制中的眼球运动可分为三种类型:扫视(Saccades),追瞄(Pursuits),注视(Fixation),其中扫视持续时间较短,而追瞄和注视的平均时长为400ms。因此,观察者观看视频的行为可以分解为若干次眼球运动,每一次眼球运动可假定为发生从视频任一帧上任一区域开始持续不超过400ms的注视行为。本发明首先需建立视频的基本质量评估单元,即时空管道。对于原始视频序列的第t帧,我们将该帧按行列分成K·L个块。根据上述的人眼视觉机制,假设一次可能的眼球注视动作会从任一帧t的任一块(k,l)开始,并在时空域中移动且持续不超过注视时长Th(如400ms)。因此,对于块(kt,lt)在向前一个Th时间范围内的若干帧中,用块搜索算法向前逐帧寻找相似的匹配块(kt-1,lt-1),块(kt-2,lt-2),…,块(kt-n,lt-n)。由这时空域上的n个块连接组成一个时空管道,作为一个基本质量评估单元,如图2所示。在每帧中,我们便有K·L个时空管道。
2、关于块的失真计算
对于上述的块(kt,lt)的失真值,由于该块是由球面上某一个不规则块映射过来的。为了考虑全景视频的空间特效,即格式映射造成的拉伸失真,采用加权的均方误差(WMSE,Weighted MSE)方法来计算:
其中,M和N表示块中水平和垂直方向的像素个数,y(i,j)和y′(i,j)分别是原始视频序列和失真视频序列中的像素值,ω(i,j)则是对应像素点权值,该值与全景视频的映射格式相关。如等距圆柱投影格式(ERP)的ω(i,j)计算如下:
其中,H为视频分辨率的高度。该式子考虑了球面上在不同经度和纬度的像素具有不同的拉伸因子的特性。
3、时空管道平均失真的计算
在上述建立完时空管道并包含对应块失真值后,基于一个递归滤波器来计算关于此时空管道的平均失真值Dk,l,t:
Dk,l,t=α·Dk,l,t-1+(1-α)·dk,l,t (3)
其中,dk,l,t是上述所计算的块失真值,α为平滑因子,Δt为帧间隔时长(如40ms),T为我们取的时间常数,用于控制α的取值大小,当α越大,表示关于t的时空管道平均失真值计算受来自t之前块的失真值的影响更大,当α=0时,Dk,l,t与dk,l,t相等。另外,T的取值取决于时空管道中块与块之间的失真梯度变化,如若失真梯度变化的绝对值大于一个阈值μ,T值取一较小值T1,否则取一较大值T2。
4、时空管道时域失真的计算
上述计算得到时空管道的平均失真Dk,l,t表示块(k,l,t)的时空失真程度,而时空管道的时域失真同样显著地影响着视觉感知,这些时域失真的特征可由失真变化的频率和幅度来体现。于是,使用时空管道中失真变化的梯度值来计算时域失真D′k,l,t:
5、时空管道失真的计算
其中β为自由参数,表示了时域失真D′k,l,t的影响程度,β越大时域失真对总体失真影响越大。
6、失真的空域和时域池化
其中,Dt表示帧t的失真,βs为Minkowski指数。
时域池化计算如下:
其中,N为视频序列中总帧数,D即为整个视频序列的失真评估。
7、最终质量评分
用峰值信噪比(PSNR)来表示视频质量评估的最终评分。全景视频的客观质量评价模型表示为VWS-PSNR(Video WS-PSNR),计算如下:
其中,D为上述求得的视频失真,MAXI为像素值的最大取值(颜色8位表示时,MAXI即255)。
实施例
下面结合一个具体的实施方式对本发明作进一步的详细说明。为便于说明,且不失一般性,做如下假定:
本发明提出的方法拟在公开的全景视频数据集VQA48上实验,该数据集包含12个原始视频序列,以及36个对应的失真视频序列,并包含对每个失真视频序列的主观质量评分MOS(Mean opinion score)。以其中一个视频序列Dianying与它对应的三个不同失真程度视频Dianying_1、Dianying_2、Dianying_3为例,分辨率为4096×2048,帧率为25fps,共300帧,映射格式为ERP。失真视频Dianying_1、Dianying_2、Dianying_3分别是以量化参数QP为27、37、42对原始视频序列进行压缩产生,且对应的MOS分别为38.8345,42.9789和57.2033。
假定本实施例采用上述的实施方法建立时空管道(如图1所示),不失一般性,这里使用的块搜索算法为新三步搜索算法NTSS(New Three-Step Search),用于匹配内容相似的相邻块以构建时空管道,且分块大小为16,管道时长范围为400ms,则每帧可分为256×128=32768个块,帧间隔为1000ms/25=40ms,每个管道长度由400ms/40ms=10个块构成。另外,前10帧中分块所对应的管道内不足10个块,则按最大能包含块数量来构建。
假定对于第5帧的第(2,2)块(简称块(2,2,4),下同),它所对应的时空管道(简称管道(2,2,4),下同)由5个块构成,为了方便表示,假设从后向前分别为块(2,2,4),块(2,2,3),块(2,1,2),块(2,1,1),块(1,1,0)。根据式(1)计算块的空间失真,如块(2,2,3)的空间失真d2,2,3计算如下:
在管道(2,2,4)计算得到包含的5个块空间失真d2,2,4,d2,2,3,d2,1,2,d2,1,1,d1,1,0之后,根据式(3)和式(4)计算管道(2,2,4)的平均失真D2,2,4,其中α选择由块失真变化梯度和阈值μ决定,这里μ根据经验取2.5,若大于2.5,式(4)中T值取200ms,否则T值取400ms,举例如下:
D1,1,0=d1,1,0
至此,时空管道(2,2,4)的平均失真D2,2,4计算完成。
其中,fs(ns)拟合函数具体如下:
至此,时空管道(2,2,4)的时域失真D′2,2,4计算完成。
这里不失一般性,βs取2。
通过时域池化方法将视频序列包含的每帧失真池化为整个视频序列的失真,根据式(10),有
最终,通过峰值信噪比公式计算得出最后评分VWS-PSNR:
这里Dianying_1、Dianying_2、Dianying_3的最终质量评分VWS-PSNR分别为20.06,22.78,38.18。
Claims (3)
1.一种基于时空管道建模的全景视频客观质量评估方法,其特征在于,包括以下步骤:
(1)将全景视频序列每帧分块,对于每帧每块的质量评估通过向前回溯构建的时空管道来计算取得;所述时空管道的构建由运动估计的块搜索算法按块与块之间内容相似度来匹配连接,作为视频质量评估的基本单元;
(2)在时空管道评估单元构建完成后,计算每帧每块的时空管道的失真值;所述失真值由平均失真和时域失真两部分构成,基于一个递归滤波器来计算时空管道的平均失真,时域失真由块与块之间失真变化的梯度值的频率和幅度结合平均失真得到;
(3)将每一帧的所有时空管道的失真值进行空域池化,得到每一帧的失真评估,基于时域池化将整个视频所有帧的失真求平均得到关于该视频序列的失真评估,再通过对该视频序列的失真计算峰值信噪比得出最终全景视频客观质量评分。
2.根据权利要求1所述的一种基于时空管道建模的全景视频客观质量评估方法,其特征在于,所述步骤(1)包括以下步骤:
(11)对于原始视频序列的第t帧,我们将该帧按行列分成K·L个块;
(12)根据人眼视觉机制,假设一次可能的眼球注视动作会从任一帧t的任一块(k,l)开始,并在时空域中移动且持续不超过注视时长Th;对于块(kt,lt)在向前一个Th时间范围内的若干帧中,用块搜索算法向前逐帧寻找相似的匹配块(kt-1,lt-1),块(kt-2,lt-2),…,块(kt-n,lt-n);
(13)将时域上的n个块连接组成一个时空管道,作为一个基本质量评估单元,在每帧中,便有K·L个时空管道。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910654689.2A CN110401832B (zh) | 2019-07-19 | 2019-07-19 | 一种基于时空管道建模的全景视频客观质量评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910654689.2A CN110401832B (zh) | 2019-07-19 | 2019-07-19 | 一种基于时空管道建模的全景视频客观质量评估方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110401832A CN110401832A (zh) | 2019-11-01 |
CN110401832B true CN110401832B (zh) | 2020-11-03 |
Family
ID=68324757
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910654689.2A Active CN110401832B (zh) | 2019-07-19 | 2019-07-19 | 一种基于时空管道建模的全景视频客观质量评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110401832B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114332088B (zh) * | 2022-03-11 | 2022-06-03 | 电子科技大学 | 一种基于运动估计的全参考视频质量评估方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102769772A (zh) * | 2011-05-05 | 2012-11-07 | 浙江大学 | 一种视频序列失真评价方法和装置 |
CN102883179A (zh) * | 2011-07-12 | 2013-01-16 | 中国科学院计算技术研究所 | 一种视频质量客观评价方法 |
WO2015031982A8 (en) * | 2013-09-06 | 2016-03-17 | Zhou Wang | Method and system for objective perceptual video quality assessment |
CN106028026A (zh) * | 2016-05-27 | 2016-10-12 | 宁波大学 | 一种基于时空域结构的高效视频质量客观评价方法 |
CN106341677A (zh) * | 2015-07-07 | 2017-01-18 | 中国科学院深圳先进技术研究院 | 虚拟视点视频质量评价方法 |
CN108513132A (zh) * | 2017-02-24 | 2018-09-07 | 深圳市中兴微电子技术有限公司 | 一种视频质量评价方法及装置 |
-
2019
- 2019-07-19 CN CN201910654689.2A patent/CN110401832B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102769772A (zh) * | 2011-05-05 | 2012-11-07 | 浙江大学 | 一种视频序列失真评价方法和装置 |
CN102883179A (zh) * | 2011-07-12 | 2013-01-16 | 中国科学院计算技术研究所 | 一种视频质量客观评价方法 |
WO2015031982A8 (en) * | 2013-09-06 | 2016-03-17 | Zhou Wang | Method and system for objective perceptual video quality assessment |
CN106341677A (zh) * | 2015-07-07 | 2017-01-18 | 中国科学院深圳先进技术研究院 | 虚拟视点视频质量评价方法 |
CN106028026A (zh) * | 2016-05-27 | 2016-10-12 | 宁波大学 | 一种基于时空域结构的高效视频质量客观评价方法 |
CN108513132A (zh) * | 2017-02-24 | 2018-09-07 | 深圳市中兴微电子技术有限公司 | 一种视频质量评价方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110401832A (zh) | 2019-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10375372B2 (en) | 3D system including a marker mode | |
CN104079925B (zh) | 基于视觉感知特性的超高清视频图像质量客观评价方法 | |
CN102158712B (zh) | 一种基于视觉的多视点视频信号编码方法 | |
Min et al. | Perceptual video quality assessment: A survey | |
Tamboli et al. | Super-multiview content with high angular resolution: 3D quality assessment on horizontal-parallax lightfield display | |
CN109309834A (zh) | 基于卷积神经网络和hevc压缩域显著信息的视频压缩方法 | |
CN108924554B (zh) | 一种球形加权结构相似度的全景视频编码率失真优化方法 | |
CN107240147B (zh) | 图像渲染方法及系统 | |
US11582384B2 (en) | Methods and apparatus for encoding, communicating and/or using images | |
CN112468806B (zh) | 一种用于云vr平台的全景视频传输优化方法 | |
Pourazad et al. | Generating the depth map from the motion information of H. 264-encoded 2D video sequence | |
CN102572502A (zh) | 一种用于视频质量评价的关键帧的选取方法 | |
CN110177282A (zh) | 一种基于srcnn的帧间预测方法 | |
CN105306954A (zh) | 一种基于视差最小可察觉误差模型的感知立体视频编码 | |
Meng et al. | Viewport-based omnidirectional video quality assessment: Database, modeling and inference | |
Azevedo et al. | A viewport-driven multi-metric fusion approach for 360-degree video quality assessment | |
Wu et al. | Virtual reality video quality assessment based on 3d convolutional neural networks | |
CN110401832B (zh) | 一种基于时空管道建模的全景视频客观质量评估方法 | |
CN113298779B (zh) | 基于逆向重建网格的视频重定向质量客观评价方法 | |
Lee et al. | Video quality model of compression, resolution and frame rate adaptation based on space-time regularities | |
US20170142392A1 (en) | 3d system including additional 2d to 3d conversion | |
Nur Yilmaz | A no reference depth perception assessment metric for 3D video | |
CN112954313A (zh) | 一种对全景图像感知质量的计算方法 | |
Li et al. | State-of-the-art in 360 {\deg} Video/Image Processing: Perception, Assessment and Compression | |
US10721452B2 (en) | 3D system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |