CN107682701B - 基于感知哈希算法的分布式视频压缩感知自适应分组方法 - Google Patents

基于感知哈希算法的分布式视频压缩感知自适应分组方法 Download PDF

Info

Publication number
CN107682701B
CN107682701B CN201710750320.2A CN201710750320A CN107682701B CN 107682701 B CN107682701 B CN 107682701B CN 201710750320 A CN201710750320 A CN 201710750320A CN 107682701 B CN107682701 B CN 107682701B
Authority
CN
China
Prior art keywords
frame
video
grouping
sampling rate
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710750320.2A
Other languages
English (en)
Other versions
CN107682701A (zh
Inventor
张登银
陈灿
赵烜
丁科休
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201710750320.2A priority Critical patent/CN107682701B/zh
Publication of CN107682701A publication Critical patent/CN107682701A/zh
Application granted granted Critical
Publication of CN107682701B publication Critical patent/CN107682701B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/43Hardware specially adapted for motion estimation or compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了基于感知哈希算法的分布式视频压缩感知自适应分组方法,针对在分布式视频压缩感知系统中当视频序列变化剧烈或发生场景切换时,采用固定的图像分组将导致参考帧选择的不准确进而严重影响非关键帧的重构质量,如果非关键帧与相邻关键帧的重构质量相差过大,解码端将产生视频闪烁效应的问题,本发明首先利用感知哈希算法评估图像的时域相关性大小,并根据时域相关性大小将图像分级,然后进行自适应图像分组;在自适应图像分组基础上,采用一种新的帧采样率分配模型进一步提高总体重构质量。本发明在保持总采样率不变的前提下,有效降低了解码视频中视频闪烁程度,为分布式视频压缩感知系统进一步提高提高服务质量和用户体验提供了可能。

Description

基于感知哈希算法的分布式视频压缩感知自适应分组方法
技术领域
本发明属于视频图像处理技术领域,具体涉及一种基于感知哈希算法的分布式视频压缩感知自适应图像分组方法。
背景技术
无线传感网(WSN)是由大量具有通信和计算能力的视频传感器节点通过自组织方式组成,能够实时采集、处理现场信息,经过节点间多跳转发传输到汇聚节点。由于传感节点本身存在能量受限和传输能力有限的问题,加之无线传感器网络的信道存在时变特性,无线传感网的应用一直是研究热点之一。随着采用视频传感器构建的无线传感器网络(WVSN)来实现实时视频感知应用的增加,人们对视频传输的质量和速度提出了更高的要求和期待,如何利用无线视频传感网进行实时视频感知并保证视频质量满足用户体验(QOE)是一个亟待解决的问题。
传统的视频压缩编码系统在编码端进行复杂的运动估计(ME)与运动补偿(MC)技术进行压缩编码,与之相比,由于无线视频传感网络(WVSN)由大量视频传感器节点构成,并且传感节点本身存在能量受限和传输能力有限的问题,移动终端不能处理复杂运算的问题。为了满足新视频应用场景下的新需求,分布式视频编码(DVC)应运而生。分布式视频编码(DVC)采用“编码端各帧独立编码,解码端联合重构”的思想,将复杂的运动估计(ME)与运动补偿(MC)技术转移到了解码端,大大减轻了编码端的负担,十分适用于无线视频传感网(WVSN)。由于传统视频编码技术,例如H.26/MPEG-X编码过于复杂,为了进一步减少编码负担,整合分布式编码(DVC)与压缩感知(CS)的分布式视频压缩感知编码(DCVS)应运而生。
在分布式视频压缩感知编码中,视频帧序列被分一个个视频帧组(GOP)。帧组中的第一帧为关键帧,其余的为非关键帧。关键帧的采样率往往高于非关键帧,以获得高质量的重构的关键帧用来生成边信息(非关键帧的预测)辅助非关键帧的重构。边信息的准确与否直接影响非关键帧的重构质量,因此编码系统总是采用固定的小帧组来选择合适的参考帧来获得准确的边信息,比如GOP=2、4、8、16。但是对于运动剧烈、场景切换的视频帧序列,即使是最小的分组大小GOP=2,相邻关键帧差异性太大所导致的边信息不准确会严重影响非关键帧的重构质量。关键帧与非关键帧的重构质量若相差太多,重构的视频帧序列会表现出闪烁的问题,会严重影响用户体验与服务质量。
发明内容
本发明目的在于提出了一种基于感知哈希算法的分布式视频压缩感知自适应图像分组方法,该方法解决了传统分布式视频压缩感知系统中视频闪烁的问题。本发明首先利用感知哈希算法评估图像的时域相关性大小,并根据时域相关性大小将图像分级,然后进行自适应图像分组;在自适应图像分组基础上,采用一种新的帧采样率分配模型进一步提高总体重构质量。本发明在总采样率不变的前提下,有效降低了解码视频中视频闪烁程度,提高服务质量与用户体验,并且提高了整体重视频构质量,为分布式视频压缩感知系统进一步提高提高服务质量和用户体验提供了可能。
本发明解决其技术问题所采取的技术方案为基于感知哈希算法的分布式视频压缩感知自适应分组方法,
设输入视频序列为X={x1,x2,…,xi,…,xN};
参数定义:xi为第i帧视频图像,i为帧的序号,N为视频序列长度;T1和T2为阈值;Rmin和Rmax分别为允许的最小帧采样率和最大帧采样率;λ1和λ2分别为关键帧和非关键帧的信息率;R1和R2分别为关键帧和非关键帧的采样率;
所述方法具体包含以下步骤:
(1)将视频序列的第一帧和最后一帧直接设为关键帧;
(2)用感知哈希算法计算每两个连续帧的相关度RD,计算公式为:
RDi=HD(PHash(xi,xi-1)) (1)
xi,xi-1为两个连续的视频图像帧,PHash(.)代表感知哈希算法,HD(.)代表汉明距离;
(3)根据RD将各视频图像帧进行图像分组等级分级,记为GOP_level,即该图像所允许的最大分组的大小,分级准则如下:
Figure BDA0001390991510000021
其中T1、T2为设定 的阈值;
(4)根据视频图像分组等级,对各视频图像帧进行适应性分组;
(5)根据帧采样率模型计算关键帧的采样率R1和非关键帧的采样率R2,构建模型。
进一步,作为优选,上述步骤(3)所述的根据各相邻两帧的RD值,进行图像分组等级分级的分级准则,其中T1=1,T2=2。
进一步,上述步骤(4)所述的根据视频图像分组等级,对各视频图像帧进行适应性分组的具体步骤如下:
步骤1:令k=1,转向步骤2;
步骤2:用公式(1)计算每个RDi,转向步骤3;
步骤3:用公式(2)计算每个GOP_leveli,转向步骤4;
步骤4:令a=3,转向步骤5;
步骤5:计算最小值,计算方式如下:
c=min{GOP_levelk,……,GOP_levelk+a} (3)
步骤6:如果k+a>N,将N-k赋值给a,转向步骤5;否则转向步骤7;
步骤7:如果c≥a,将xk+a帧设为关键帧,并将k+a赋值给k,转向步骤4;否则将a-1赋值给a,转向步骤5,
当k=N时,终止该算法,得到关键帧xk+a
进一步,上述步骤(5)所述的帧采样率模型如下:
其中,λ1代表关键帧的测量矢量的信息率,λ2代表非关键帧的测量矢量的信息率,设定λ12,N1为关键帧的数量,N2为非关键帧的数量,n为每一帧的像素数,
Figure BDA0001390991510000031
s.t.N1R1n+N2R2n=M (6)
Rmin≤R2≤R1≤Rmax (7)
λ21 (8)
其中M为总测量数,N1为关键帧的数量,N2为非关键帧的数量,n为每一帧的像素数,λ1为关键帧的信息率,λ2为非关键帧的信息率。
进一步,作为优选,上述允许的最小帧采样率Rmin=0.1,允许的最大帧采样率Rmax=0.9。
与现有技术相比,本发明具有如下优点:
第一,本发明充分利用视频序列的时域相关性,通过感知哈希算法衡量相邻两帧的相关度大小,并根据时域相关性大小将图像分级,然后进行自适应图像分组。改善了视频闪烁问题,提高了服务质量与用户体验
第二,本发明在自适应图像分组的基础上,设计了帧采样率分配模型,改善了整个视频序列的重构质量。
附图说明
图1为本发明一种基于感知哈希算法的分布式视频压缩感知自适应图像分组方法的流程图。
图2为本发明针对的分布式视频压缩感知系统框架图(阴影部分为本发明改进部分)。
图3为本发明方法与现有技术的Foreman视频序列重构性能对比图(key帧采样率为0.4,non-key帧采样率为0.2)。
图4为本发明方法与现有技术的Tennis视频序列重构性能对比图(key帧采样率为0.4,non-key帧采样率为0.2)。
具体实施方式
下面结合说明书附图对本发明作进一步的详细描述。
如图1所示,本发明涉及一种基于感知哈希算法的分布式视频压缩感知自适应图像分组方法,该方法具体步骤如下:
输入:视频序列为X={x1,x2,……,xn};
参数设定:阈值T1、T2,允许的最小帧采样率Rmin,允许的最大帧采样率Rmax,关键帧的信息率λ1,非关键帧的信息率λ2
(1)将视频序列的第一帧和最后一帧直接设为关键帧;
(2)用感知哈希算法计算每两个连续帧的相关度RD,计算公式为:
RDi=HD(PHash(xi,xi-1)) (1)
xi,xi-1分别代表两个连续的视频图像帧,i代表帧数,PHash(.)代表感知哈希算法,HD(.)代表汉明距离公式;
(3)根据RD将各视频图像帧进行图像分组等级分级GOP_level,即该图像所允许的最大分组的大小,分级准则如下:
Figure BDA0001390991510000051
其中T1,T2为设定阈值。
(4)根据视频图像分组等级,对各视频图像帧进行适应性分组,步骤如下:
步骤1:令k=1,转向步骤2。
步骤2:用公式(1)计算每个RDi,转向步骤3。
步骤3:用公式(2)计算每个GOP_leveli,转向步骤4。
步骤4:令a=3,转向步骤5。
步骤5:计算最小值,计算方式如下:
c=min{GOP_levelk,……,GOP_levelk+a} (3)
步骤6:如果k+a>N,将N-k赋值给a,转向步骤5;否则转向步骤7。
步骤7:如果c≥a,将xk+a帧设为关键帧,并将k+a赋值给k,转向步骤4;否则将a-1赋值给a,转向步骤5。
当k=N时,终止该算法,得到关键帧xk+a
(5)根据帧采样率模型计算关键帧的采样率R1和非关键帧的采样率R2,模型如下:
其中,λ1代表关键帧的测量矢量的信息率,λ2代表非关键帧的测量矢量的信息率。设定λ12,N1为关键帧的数量,N2为非关键帧的数量,n为每一帧的像素数。
Figure BDA0001390991510000061
s.t.N1R1n+N2R2n=M (6)
Rmin≤R2≤R1≤Rmax (7)
λ21 (8)
其中M为总测量数,N1为关键帧的数量,N2为非关键帧的数量,为n每一帧的像素数,λ1为关键帧的信息率,λ2为非关键帧的信息率。
下面结合附图对本发明方法的效果做进一步说明:
以foreman视频序列和tennis视频序列作为测试序列,其中foreman视频序列的格式为cif格式(352×288),tennis视频序列的格式为cif格式(352×240)。实验组稀疏变换采用小波变换,测量矩阵采用局部哈达玛矩阵,重构采用GPSR算法,边信息采用双边运动补偿算法。对比组采用GOP=2,除此之外,进行与实验组相同的操作。此外,为了评估解码视频闪烁的问题,额外定义了一些评估参数,计算方式如下:
ΔPSNRi=|PSNRi-PSNRi-1| (9)
ΔPSNRmax=max{ΔPSNR1,……,ΔPSNRn} (10)
Figure BDA0001390991510000062
其中n代表帧总数,i代表帧号。
图3和图4是当设置key帧采样率为0.4,non-key帧采样率为0.2时,测试视频序列的性能对比图,分别对比了PSNR和ΔPSNR分布情况。可以观察到,相比于现有方法foreman从0到16剧烈浮动,而在改进的方法则相对稳定在一个较低的数值。可以看出,减缓了解码端视频闪烁的问题。
表1
表1为本发明方法与现有技术关键帧的重构性能对比数据(key帧采样率为0.4,non-key帧采样率为0.2)。以foreman视频序列为例,采用本发明方法,视频序列的ΔPSNRaverage从3.6077dB降低到1.1769dB,ΔPSNRmax从15.2319dB降低到4.5463dB。Tennis序列同样如此。同时,本发明方法相比于现有方法,视频序列的整体重构质量维持在同一水平。在foreman视频序列上,改进效果在第190帧key帧上最为明显,现有方法重构图像的PSNR值为22.4450dB,本发明方法重构图像的PSNR值为36.8307dB,提升了14.3875dB;在tennis视频序列上,改进效果在第68帧key帧上最为明显,现有方法重构图像的PSNR值为17.4498dB,本发明方法重构图像的PSNR值为25.4976dB,提升了8.0478dB。可以看出本发明方法大大缓解了解码端视频因相邻图像帧重构质量相差过大而引起的视频闪烁问题,提高了服务质量与用户体验。
本发明方法通过自适应图像分组方法,实现了自适应图像分组和自适应的采样率分配,改善了视频场景快速变化时视频闪烁的问题,提高了服务质量与用户体验。

Claims (4)

1.基于感知哈希算法的分布式视频压缩感知自适应分组方法,
设输入视频序列为X={x1,x2,...,xi,...,xN};
参数定义:xi为第i帧视频图像,i为帧的序号,N为视频序列长度;T1和T2为阈值;Rmin和Rmax分别为允许的最小帧采样率和最大帧采样率;λ1和λ2分别为关键帧和非关键帧的信息率;R1和R2分别为关键帧和非关键帧的采样率;
其特征在于包含以下步骤:
(1)将视频序列的第一帧和最后一帧直接设为关键帧;
(2)用感知哈希算法计算每两个连续帧的相关度RD,计算公式为:
RDi=HD(PHash(xi,xi-1)) (1)
xi,xi-1为两个连续的视频图像帧,PHash(.)代表感知哈希算法,HD(.)代表汉明距离;
(3)根据RD将各视频图像帧进行图像分组等级分级,记为GOP_level,即该图像所允许的最大分组的大小,分级准则如下:
Figure FDA0002302536880000011
其中T1、T2为设定的阈值;
(4)根据视频图像分组等级,对各视频图像帧进行适应性分组;
(5)根据帧采样率模型计算关键帧的采样率R1和非关键帧的采样率R2,构建模型。
2.根据权利要求1所述的基于感知哈希算法的分布式视频压缩感知自适应分组方法,其特征在于:步骤(3)根据各相邻两帧的RD值,进行图像分组等级分级的分级准则,其中T1=1,T2=2。
3.根据权利要求1所述的基于感知哈希算法的分布式视频压缩感知自适应分组方法,其特征在于:步骤(4)所述的根据视频图像分组等级,对各视频图像帧进行适应性分组的具体步骤如下:
步骤1:令k=1,转向步骤2;
步骤2:用公式(1)计算每个RDi,转向步骤3;
步骤3:用公式(2)计算每个GOP_leveli,转向步骤4;
步骤4:令a=3,转向步骤5;
步骤5:计算最小值,计算方式如下:
c=min{GOP_levelk,......,GOP_levelk+a} (3)
步骤6:如果k+a>N,将N-k赋值给a,转向步骤5;否则转向步骤7;
步骤7:如果c≥a,将xk+a帧设为关键帧,并将k+a赋值给k,转向步骤4;否则将a-1赋值给a,转向步骤5,
当k=N时,终止该算法,得到关键帧xk+a
4.根据权利要求1所述的基于感知哈希算法的分布式视频压缩感知自适应分组方法,其特征在于:允许的最小帧采样率Rmin=0.1,允许的最大帧采样率Rmax=0.9。
CN201710750320.2A 2017-08-28 2017-08-28 基于感知哈希算法的分布式视频压缩感知自适应分组方法 Active CN107682701B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710750320.2A CN107682701B (zh) 2017-08-28 2017-08-28 基于感知哈希算法的分布式视频压缩感知自适应分组方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710750320.2A CN107682701B (zh) 2017-08-28 2017-08-28 基于感知哈希算法的分布式视频压缩感知自适应分组方法

Publications (2)

Publication Number Publication Date
CN107682701A CN107682701A (zh) 2018-02-09
CN107682701B true CN107682701B (zh) 2020-02-07

Family

ID=61134862

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710750320.2A Active CN107682701B (zh) 2017-08-28 2017-08-28 基于感知哈希算法的分布式视频压缩感知自适应分组方法

Country Status (1)

Country Link
CN (1) CN107682701B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109688429A (zh) * 2018-12-18 2019-04-26 广州励丰文化科技股份有限公司 一种基于非关键视频帧的预览方法及服务设备
CN112560552A (zh) * 2019-09-25 2021-03-26 华为技术有限公司 视频分类的方法和装置
CN114867059A (zh) * 2022-05-11 2022-08-05 重庆科技学院 一种基于压缩感知的无线数据安全聚合方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101035365B1 (ko) * 2010-02-04 2011-05-20 서강대학교산학협력단 Cs를 이용한 화질 평가 장치 및 방법
US20130266078A1 (en) * 2010-12-01 2013-10-10 Vrije Universiteit Brussel Method and device for correlation channel estimation
CN102427527B (zh) * 2011-09-27 2013-11-06 西安电子科技大学 基于分布式视频压缩感知系统非关键帧的重构方法
CN102929970A (zh) * 2012-10-15 2013-02-13 山东大学 基于时域视觉关注的视频拷贝检测方法
CN103297782B (zh) * 2013-06-08 2016-04-27 河海大学常州校区 分布式视频压缩感知系统中基于区域划分的重构方法
CN104159112B (zh) * 2014-08-08 2017-11-03 哈尔滨工业大学深圳研究生院 基于双重稀疏模型解码的压缩感知视频传输方法及系统
CN106412619B (zh) * 2016-09-28 2019-03-29 江苏亿通高科技股份有限公司 一种基于hsv颜色直方图和dct感知哈希的镜头边界检测方法
CN106993189B (zh) * 2017-04-06 2019-10-15 北京工业大学 一种基于优化排序的屏幕内容视频编码方法

Also Published As

Publication number Publication date
CN107682701A (zh) 2018-02-09

Similar Documents

Publication Publication Date Title
RU2402885C2 (ru) Классификация контента для обработки мультимедийных данных
KR100977694B1 (ko) 비디오 코딩용 순간 품질 메트릭
CN107682701B (zh) 基于感知哈希算法的分布式视频压缩感知自适应分组方法
WO2013143396A1 (zh) 一种数字视频质量控制方法及其装置
CN103974060A (zh) 视频质量调整方法和装置
WO2021129007A1 (zh) 视频码率的确定方法、装置、计算机设备及存储介质
CN104994387B (zh) 一种融合图像特征的码率控制方法
CN106713901B (zh) 一种视频质量评价方法及装置
Khan et al. Impact of video content on video quality for video over wireless networks
WO2007089916A2 (en) Dynamic reference frame decision method and system
KR20150114959A (ko) 컨텍스트-기반 비디오 품질 평가를 위한 방법 및 장치
Chien et al. Quality driven frame rate optimization for rate constrained video encoding
AU2013307970A1 (en) Method and apparatus for estimating content complexity for video quality assessment
JP2016510567A (ja) コンテキスト・ベースのビデオ品質評価のための方法および装置
Kumar et al. Double sarsa based machine learning to improve quality of video streaming over HTTP through wireless networks
Zhou et al. Content-adaptive parameters estimation for multi-dimensional rate control
Yunus et al. A rate control model of MPEG-4 encoder for video transmission over Wireless Sensor Network
Zhao et al. Perceptual quality driven cross-layer optimization for wireless video streaming
CN110572661B (zh) 一种面向4k/8k超高清视频编码的低延时码率控制方法
WO2023082520A1 (zh) 图像处理方法及装置、存储介质及电子装置
CN107749993A (zh) 基于mmse重构的分布式视频编码信源失真估算方法
Dan et al. Visual sensitivity aware rate adaptation for video streaming via deep reinforcement learning
CN104995914A (zh) 用于基于上下文的视频质量评估的方法和装置
Sakamoto et al. Light-weight video coding based on perceptual video quality for live streaming
Wang et al. Joint Optimization Algorithm for Adaptive Bit Allocation Based on Temporal-Spatial Information

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant