CN107888931B - 一种利用视频统计特征预测差错敏感度的方法 - Google Patents

一种利用视频统计特征预测差错敏感度的方法 Download PDF

Info

Publication number
CN107888931B
CN107888931B CN201711212702.6A CN201711212702A CN107888931B CN 107888931 B CN107888931 B CN 107888931B CN 201711212702 A CN201711212702 A CN 201711212702A CN 107888931 B CN107888931 B CN 107888931B
Authority
CN
China
Prior art keywords
lost
block
blocks
video
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711212702.6A
Other languages
English (en)
Other versions
CN107888931A (zh
Inventor
马然
李童
郑鸿鹤
安平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Transpacific Technology Development Ltd
Original Assignee
Beijing Transpacific Technology Development Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Transpacific Technology Development Ltd filed Critical Beijing Transpacific Technology Development Ltd
Priority to CN201711212702.6A priority Critical patent/CN107888931B/zh
Publication of CN107888931A publication Critical patent/CN107888931A/zh
Application granted granted Critical
Publication of CN107888931B publication Critical patent/CN107888931B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • H04N19/895Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder in combination with error concealment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/647Control signaling between network components and server or clients; Network processes for video distribution between server and clients, e.g. controlling the quality of the video stream, by dropping packets, protecting content from unauthorised alteration within the network, monitoring of network load, bridging between two different networks, e.g. between IP and wireless
    • H04N21/64784Data processing by the network
    • H04N21/64792Controlling the complexity of the content stream, e.g. by dropping packets

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种利用视频统计特征预测差错敏感度的方法,具体步骤是:提取丢包视频特征:对测试视频随机丢包处理,获取丢失块周围块的丢失情况,计算丢失块所处区域的纹理复杂度,计算丢失块区域梯度,估计丢失块的运动矢量;同时将周围块的丢失情况、纹理复杂度、梯度以及运动矢量联合构成丢失块的统计特征;计算差错敏感度:将丢包后的视频进行差错隐藏,再以块为单位统计仍存在的错误像素,计算差错敏感度;训练模型并预测:丢失块的统计特征及其相应的差错敏感度构成训练集,使用训练集训练支持向量回归器SVR,把丢失块的统计特征输入训练好的SVR模型,输出预测的差错敏感度。本方法精确预测出丢包对视频帧不同区域影响严重程度,减少复杂度。

Description

一种利用视频统计特征预测差错敏感度的方法
技术领域
本发明涉及一种利用视频统计特征预测差错敏感度的方法。
背景技术
近年来,随着视频技术的飞速发展,视频会议、网络电视、视频电话等各种视频通信应用越来越广泛。面对不断增多的视频数据以及有限的传输带宽等问题,视频编码技术应运而生。目前,世界上的视频编解码标准主要来源于国际电信联盟(ITU-T)和国际标准化组织(ISO)。他们制定并颁布的H26x系列和MPEG系列编解码技术,可有效满足各种视频通信需求。其中,H.264/AVC因其良好的稳定性以及网络传输性,目前已被广泛应用于视频技术中。然而随着超高清视频的发展,传统编码技术处理性能逐渐落后,为顺应时代新一代视频编码标准—高效率视频编码(High Efficiency Video Coding,HEVC)于2013年问世。与H.264/AVC相比,HEVC支持更高分辨率的视频以及改进的并行处理模式,在重建视频同等质量下可减少50%比特率。
然而不管是H.264/AVC或者HEVC,视频码流经压缩传输的过程中由于噪声干扰强、环境复杂性以及带宽不稳定等原因,极易造成数据包丢失或比特出错。由于编解码特性出错码流内部还会产生一定的错误传播,这些都将严重影响重建帧质量,导致视频在终端不能正常显示。研究有效的错误控制技术成为视频通信不可或缺的一部分。
差错隐藏技术作为错误控制技术之一,在解码端利用已接收的正确信息,根据视频的时间、空间以及视点间的相关性,恢复由于比特流差错造成的视频帧内容的缺失。它因为具有提高带宽利用率、编码效率、降低编码器负担等优点,得广泛应用和研究。目前,差错隐藏方法很多,如时域差错隐藏和空域差错隐藏等。有些视频标准(例如,H.264/AVC)也采纳了其中的经典算法,但在不同的网络状况下、对不同视频序列的隐藏效果并非都能达到理想状态。各种差错隐藏算法优劣并存,适用点亦不同。不同区域、不同形式的丢包,都将影响最终隐藏效果,因此单一的差错隐藏算法常无法满足复杂多变的丢包情况。
研究丢包对视频的影响,可用于引导不同丢包情况下实施不同的差错隐藏算法,从而实现高效、快速隐藏。目前国内外众多学者对丢包的影响做了大量研究。Tang S,Alface P R.Impact of Random and Burst Packet Losses on H.264Scalable VideoCoding[J].IEEE Transactions on Multimedia,2014,16(8):2256-2269.公开了一个基于编码的预测模型学习丢包的影响,该模型用马尔科夫链来描述图像组(Group ofPictures,GOP)中的错误传输过程,分析给定可分级层被正确接收的概率即可估计出由丢包引起的质量下降。Pauliks R,Slaidins I,Pauliks R,et al.Assessment of IP packetloss influence on perceptual quality of streaming video[C]//Multimedia andBroadcasting.IEEE,2015:1-6.公开了不同的丢包概率分布(高斯、泊松、均匀)、不同丢包率与视频平均主观意见得分(Mean Opinion Score,MOS)的关系,并得出当丢包率大时,可用失真图像与原始图像的累积平方误差来预测MOS。Saputra Y M,Hendrawan.The effectof packet loss and delay jitter on the video streaming performance usingH.264/MPEG-4Scalable Video Coding[C]//International Conference onTelecommunication Systems Services and Applications.IEEE,2017.公开了丢包对视频帧质量即峰值信噪比(Peak Signal to Noise Ratio,PSNR)的影响,重点研究了数据包丢失发生在不同层级(单层、PSNR可分级、PSNR-时域可分级编码)、不同类型帧(I帧、P帧、B帧)的情况下对视频PSNR的影响。
目前对丢包影响的研究大多都是针对视频帧整体质量的影响,而极少研究单独一个丢包对帧局部造成的影响。若预知丢包对帧不同区域的影响程度,即差错敏感度,便可指导人们在不同的差错敏感度区域实施不同的隐藏算法。Gao P,Peng Q,Wei X.Analysis ofPacket-Loss-Induced Distortion in View Synthesis Prediction-Based 3-D VideoCoding[J].IEEE Transactions on Image Processing,2017,PP(99):1-1.公开了一个评估丢包所致的视点合成失真的数学模型。该模型通过分析解码端重建纹理图像的功率谱密度以及信道和传播错误的能量密度,用一个递归函数即可直接估计出由丢包造成的视点合成预测失真。虽然此模型在以编码块为单位上预测准确度不错,但由于块内每个像素都要进行递归函数计算,复杂度较高。考虑到丢包的影响与丢包所在区域特征密切相关,本发明提出一种利用视频统计特征预测差错敏感度的方法。
发明内容
本发明的目的在于克服现有预测丢包影响模型的不足,提出了一种利用视频统计特征预测差错敏感度的方法。该方法利用丢包所处区域的一些简单统计特征,更精确地预测出丢包对视频帧不同区域影响的严重程度,又减少复杂度。
本发明具体的构思是:
本发明中视频码流以块的形式进行丢包。主要分为数据收集阶段以及训练回归阶段。在数据收集阶段,先模拟视频序列在不同丢包率下丢包,对于每个丢失块,收集其统计特征。然后对丢包序列进行差错隐藏,计算每个丢失块对应的差错敏感度。在训练回归阶段,每一个丢失块作为一个样本,训练回归模型。达到只要已知测试序列的统计特征,便可迅速且准确地输出相应差错敏感度的目的。
根据上述的构思,本发明采用下述技术方案:
一种利用视频统计特征预测差错敏感度的方法,具体步骤如下:
步骤1.提取丢包视频特征:对测试视频随机丢包处理,获取丢失块周围块的丢失情况,计算丢失块所处区域的纹理复杂度,计算丢失块区域梯度,估计丢失块的运动矢量;同时将周围块的丢失情况、纹理复杂度、梯度以及运动矢量联合构成丢失块的统计特征;
步骤2.计算差错敏感度:将丢包后的视频进行差错隐藏,再以块为单位统计仍存在的错误像素,计算差错敏感度;
步骤3.训练模型并预测:丢失块的统计特征及其相应的差错敏感度构成训练集,使用训练集训练支持向量回归器(Support Vector Regression,SVR),把丢失块的统计特征输入训练好的SVR模型,输出预测的差错敏感度。
本发明与现有技术相比较,具有如下显而易见的突出实质性特点和显著技术进步:
本发明利用视频统计特征预测差错敏感度,根据丢包所处区域的一些简单统计特征,训练回归模型,可以更加精确地预测出丢包对视频帧不同区域影响的严重程度,同时降低复杂度。
附图说明
图1为本发明方法的流程框图。
图2为丢失块与周围块关系图。
图3为运动矢量关系图。
图4为丢包后的视频帧:(a)为GT_Fly的第6帧,(b)为Dancer的第6帧,丢包率均为10%。
图5为差错隐藏后的视频帧:(a)为GT_Fly的第6帧,(b)为Dancer的第6帧。
具体实施方式
本发明的优选实施例结合附图详述如下:
参见图1,一种利用视频统计特征预测差错敏感度的方法,本实施例在HM 12.0以及Matlab2016a下实施,具体实施步骤如下:
步骤1.提取丢包视频特征:对测试视频随机丢包处理,获取丢失块周围块的丢失情况,计算丢失块所处区域的纹理复杂度,计算丢失块区域梯度,估计丢失块的运动矢量;同时将周围块的丢失情况、纹理复杂度、梯度以及运动矢量联合构成丢失块的统计特征;
步骤2.计算差错敏感度:将丢包后的视频进行差错隐藏,再以块为单位统计仍存在的错误像素,计算差错敏感度;
步骤3.训练模型并预测:丢失块的统计特征及其相应的差错敏感度构成训练集,使用训练集训练支持向量回归器SVR,把丢失块的统计特征输入训练好的SVR模型,输出预测的差错敏感度。
所述步骤1中,提取丢失块特征的基本步骤为:
如图2所示,步骤1.1.丢包是以块为单位,尺寸为2N×2N,本实施例中N取32,丢包后的视频帧如图4所示,取与当前丢失块MB0空域相邻的上、下、左、右、左上、右上、左下和右下共8个块作为周围块,分别记为MB1、MB2、MB3、MB4、MB5、MB6、MB7、MB8
步骤1.1.1.判断周围块是否正确接收,得到对应的标志位Fi
Figure BDA0001484897140000041
丢失为0,反之为1;
步骤1.1.2.计算正确接收的周围块的灰度共生矩阵,获得统计量熵,取熵平均以表征当前丢失块所处区域的纹理复杂度blkcomplexity,计算过程如下:
ENTi=-∑mnp(m,n)log p(m,n)(i=1,2,…,8)
Figure BDA0001484897140000042
其中,p(m,n)为MBi的灰度共生矩阵(m,n)处的值,ENTi为MBi的统计量熵;
步骤1.1.3.分别计算正确接收的周围块的灰度梯度值,丢失块区域梯度值blkgradient则为周围块的平均灰度梯度值;
如图3所示,步骤1.2.估计当前丢失块的运动矢量时,先取当前丢失块相邻上下左右32个像素宽的区域;求得区域内正确接收的像素点的运动矢量(MV1、MV2、MV3、MV4);再求均值得到最终丢失块的运动矢量blkMV,若区域内无正确接收像素点,则当前丢失块运动矢量blkMV为0;
步骤1.3.把Fi(i=1,2,…,8)、blkcomplexity、blkgradient和blkMV联合构成丢失块的统计特征。
所述步骤2中计算差错敏感度,具体步骤为:
步骤2.1.对丢包视频进行差错隐藏;本实施例采用时域拷贝法,直接从前面帧拷贝对应位置块,隐藏后的结果如图5所示,当然也不限制于这一种差错隐藏算法。
步骤2.2.判断隐藏后的块内的每个像素是否正确:若隐藏后的像素值与原始像素值差异大于阈值,视该像素为错误像素;
步骤2.3.统计每个块中的错误像素数,计算差错敏感度S:
Figure BDA0001484897140000051
其中,n为块内的错误像素数,块的大小为2N×2N。
所述步骤3中训练回归模型并预测差错敏感度:
步骤3.1.将样本80%作为训练集,20%作为测试集,用训练集训练支持向量回归器SVR。
步骤3.2.把测试集中丢失块统计特征输入训练好的SVR模型,输出预测的差错敏感度。
由上述步骤可以看出,利用丢失块周围统计特征,本发明可以有效预测出其对应的差错敏感度,且复杂度不高。

Claims (1)

1.一种利用视频统计特征预测差错敏感度的方法,其特征在于,具体步骤如下:
步骤1.提取丢包视频特征:对测试视频随机丢包处理,获取丢失块周围块的丢失情况,计算丢失块所处区域的纹理复杂度,计算丢失块区域梯度,估计丢失块的运动矢量;同时将周围块的丢失情况、纹理复杂度、梯度以及运动矢量联合构成丢失块的统计特征;
步骤2.计算差错敏感度:将丢包后的视频进行差错隐藏,再以块为单位统计仍存在的错误像素,计算差错敏感度;
步骤3.训练模型并预测:丢失块的统计特征及其相应的差错敏感度构成训练集,使用训练集训练支持向量回归器SVR,把丢失块的统计特征输入训练好的SVR模型,输出预测的差错敏感度;在所述步骤1中,提取丢失块特征的基本步骤为:
步骤1.1.丢包是以块为单位,尺寸为2N×2N,取与当前丢失块MB0空域相邻的上、下、左、右、左上、右上、左下和右下共8个块作为周围块,分别记为MB1、MB2、MB3、MB4、MB5、MB6、MB7、MB8
步骤1.1.1.判断周围块是否正确接收,得到对应的标志位Fi
Figure FDA0002288242620000011
丢失为0,反之为1;
步骤1.1.2.计算正确接收的周围块的灰度共生矩阵,获得统计量熵,取熵平均以表征当前丢失块所处区域的纹理复杂度blkcomplexity,计算过程如下:
ENTi=-∑mnp(m,n)log p(m,n)(i=1,2,…,8)
Figure FDA0002288242620000012
其中,p(m,n)为MBi的灰度共生矩阵(m,n)处的值,ENTi为MBi的统计量熵;
步骤1.1.3.分别计算正确接收的周围块的灰度梯度值,丢失块区域梯度值blkgradient则为周围块的平均灰度梯度值;
步骤1.2.估计当前丢失块的运动矢量时,先取当前丢失块相邻上下左右N个像素宽的区域;求得区域内正确接收的像素点的运动矢量;再求均值得到最终丢失块的运动矢量blkMV,若区域内无正确接收像素点,则当前丢失块运动矢量blkMV为0;
步骤1.3.把Fi(i=1,2,…,8)、blkcomplexity、blkgradient和blkMV联合构成丢失块的统计特征;
在所述步骤2中,计算差错敏感度,具体步骤为:
步骤2.1.对丢包视频进行差错隐藏;
步骤2.2.判断隐藏后的块内的每个像素是否正确:若隐藏后的像素值与原始像素值差异大于阈值,视该像素为错误像素;
步骤2.3.统计每个块中的错误像素数,计算差错敏感度S:
Figure FDA0002288242620000021
其中,n为块内的错误像素数,块的大小为2N×2N。
CN201711212702.6A 2017-11-28 2017-11-28 一种利用视频统计特征预测差错敏感度的方法 Active CN107888931B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711212702.6A CN107888931B (zh) 2017-11-28 2017-11-28 一种利用视频统计特征预测差错敏感度的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711212702.6A CN107888931B (zh) 2017-11-28 2017-11-28 一种利用视频统计特征预测差错敏感度的方法

Publications (2)

Publication Number Publication Date
CN107888931A CN107888931A (zh) 2018-04-06
CN107888931B true CN107888931B (zh) 2020-03-17

Family

ID=61775575

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711212702.6A Active CN107888931B (zh) 2017-11-28 2017-11-28 一种利用视频统计特征预测差错敏感度的方法

Country Status (1)

Country Link
CN (1) CN107888931B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020042177A1 (zh) * 2018-08-31 2020-03-05 深圳大学 视频编码质量平滑度的优化方法、装置、设备及存储介质
CN109120943B (zh) * 2018-10-10 2021-02-23 鲍金龙 视频数据恢复方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102843573A (zh) * 2012-07-16 2012-12-26 上海大学 利用无线局域网服务质量参数的视频传输质量评估方法
CN103237226A (zh) * 2013-04-07 2013-08-07 宁波大学 一种立体视频宏块丢失错误隐藏方法
CN103269457A (zh) * 2013-05-15 2013-08-28 西安交通大学 基于失真估计的h.264/avc视频包优先级调度方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003019939A1 (en) * 2001-08-23 2003-03-06 Polycom, Inc. System and method for video error concealment
US7466755B2 (en) * 2002-10-04 2008-12-16 Industrial Technology Research Institute Method for video error concealment by updating statistics
US7916796B2 (en) * 2005-10-19 2011-03-29 Freescale Semiconductor, Inc. Region clustering based error concealment for video data
FR2934453B1 (fr) * 2008-07-22 2010-10-15 Canon Kk Procede et dispositif de masquage d'erreurs
US9014499B2 (en) * 2013-09-25 2015-04-21 Mitsubishi Electric Research Laboratories, Inc. Distributed source coding using prediction modes obtained from side information

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102843573A (zh) * 2012-07-16 2012-12-26 上海大学 利用无线局域网服务质量参数的视频传输质量评估方法
CN103237226A (zh) * 2013-04-07 2013-08-07 宁波大学 一种立体视频宏块丢失错误隐藏方法
CN103269457A (zh) * 2013-05-15 2013-08-28 西安交通大学 基于失真估计的h.264/avc视频包优先级调度方法

Also Published As

Publication number Publication date
CN107888931A (zh) 2018-04-06

Similar Documents

Publication Publication Date Title
Khan et al. Quality of experience-driven adaptation scheme for video applications over wireless networks
CN101982977B (zh) 用于与时域边界进行数据对准的方法和装置
Hameed et al. A decision-tree-based perceptual video quality prediction model and its application in FEC for wireless multimedia communications
Huszák et al. Analysing GOP structure and packet loss effects on error propagation in MPEG-4 video streams
US20060165176A1 (en) Method and apparatus for encoder assisted-frame rate up conversion (EA-FRUC) for video compression
CN102158729B (zh) 无参考的视频序列编码质量客观评价方法
CN106888376B (zh) 基于丢包分析的多级联网监控视频质量实时评价方法
EP2347599A1 (en) Method and system for determining a quality value of a video stream
CN107888931B (zh) 一种利用视频统计特征预测差错敏感度的方法
CN102026001B (zh) 基于运动信息的视频帧重要性评估方法
CN107343202B (zh) 基于附加码率的无反馈分布式视频编解码方法
Cheng et al. A unified QoE prediction framework for HEVC encoded video streaming over wireless networks
Khan et al. Impact of video content on video quality for video over wireless networks
US10536703B2 (en) Method and apparatus for video quality assessment based on content complexity
US6755531B2 (en) Motion picture code evaluator and billing system
US9723266B1 (en) Lightweight content aware bit stream video quality monitoring service
Martínez et al. Objective video quality metrics: A performance analysis
Nishikawa et al. No-reference PSNR estimation for quality monitoring of motion JPEG2000 video over lossy packet networks
CN103596012B (zh) 一种实时的基于avs的视频帧率转码中帧间宏块类型选择方法
CN101296166A (zh) 基于索引的多媒体数据的测量方法
CN108810651B (zh) 基于深度压缩感知网络的无线视频组播方法
Chiou et al. Error-resilient transcoding using adaptive intra refresh for video streaming
Uhrina et al. The impact of bitrate and packet loss on the video quality of H. 264/AVC compression standard
Kodikara et al. Optimal settings of maximum transfer unit (mtu) for efficient wireless video communications
Lu et al. Quality assessing of video over a packet network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant