CN112188210A - 一种采用深度信念网络的dvc边信息求取方法 - Google Patents
一种采用深度信念网络的dvc边信息求取方法 Download PDFInfo
- Publication number
- CN112188210A CN112188210A CN202011053883.4A CN202011053883A CN112188210A CN 112188210 A CN112188210 A CN 112188210A CN 202011053883 A CN202011053883 A CN 202011053883A CN 112188210 A CN112188210 A CN 112188210A
- Authority
- CN
- China
- Prior art keywords
- network
- frame
- frames
- video
- belief network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/395—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving distributed video coding [DVC], e.g. Wyner-Ziv video coding or Slepian-Wolf video coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
一种采用深度信念网络的DVC边信息求取方法,包括以下步骤;(1)输入的视频序列将被分成WZ帧和关键帧两种类型,其中WZ帧为偶数帧,关键帧为奇数帧;(2)采用4×4的离散余弦变换对步骤(1)中的每个WZ帧进行变换操作,然后对变换系数进行量化操作,再由turbo编码器对各个位平面进行处理并传输;(3)步骤(1)得到的关键帧采用传统的H.264/AVC编码标准进行帧内编码;(4)解码端以当前帧前后各两帧作为输入,采用深度信念网络求取边信息,并与Turbo中的校验位一道完成位平面的解码。本发明能够提高无线传输环境下的视频传输的可靠性。
Description
技术领域
本发明涉及无线传感器网络技术领域,特别涉及一种采用深度信念网络的DVC边信息求取方法。
背景技术
近几年来,随着视频数据成为WSN中的重要传输内容,如何稳定、实时地采集视频数据并可靠寺传输,正成为面向WSN的视频传输技术的一个研究和应用热点。WSN中各节点覆盖范围灵活,其运算、能量和带宽等有限,这要求视频编码端尽可能简单,而解码端的复杂度可以高一些。传统视频编解码算法的编码复杂度远高于解码复杂度,特别是运动估计与变换等操作,其时间和空间复杂度超过50%,导致WSN节点计算能力与存储空间很难满足实际使用要求,其在WSN中受到一定的限制。
发明内容
为了解决以上技术问题,本发明的目的在于提供一种采用深度信念网络的DVC边信息求取方法,能够提高无线传输环境下的视频传输的可靠性。
为了实现上述目的,本发明采用的技术方案是:
一种采用深度信念网络的DVC边信息求取方法,包括以下步骤;
(1)输入的视频序列将被分成WZ帧和关键帧两种类型,其中WZ帧为偶数帧,关键帧为奇数帧;
(2)采用4×4的离散余弦变换(DCT)对步骤(1)中的每个WZ帧进行变换操作,然后对变换系数进行量化操作,再由turbo编码器对各个位平面进行处理并传输;
(3)步骤(1)得到的关键帧采用传统的H.264/AVC编码标准进行帧内编码;
(4)解码端以当前帧前后各两帧作为输入,采用深度信念网络求取边信息,并与Turbo中的校验位一道完成位平面的解码。
所述步骤(4)的深度信念网络(DBN)中,包含了可视层和隐含层,分别表示为v=[v1,v2,.....vn],h=[h1,h2,.....hm],可视层为视频数据的输入层,数据经过可视层传输至隐含层,隐含层用于对视频数据中的特征进行处理,对可视层数据的特征进行分析,所述输入层和隐含层分别采用了Gaussian-Bernoulli RBM和Bernoulli-Bernoulli RBM,其结点的能量函数分别为:
其中Z=∑v∑he{-E(v,h;θ)};v,h分别为深度网络中的可视层和隐藏层的数量,θ为阀值,n,m分别为可视导和隐藏层的数量,E(v,h;θ)为能量函数,e()为指数函数。
所述深度信念网络具体为:采用对比散度算法对网络进行训练,其参数更新法则如下;
在上述过程,根据式(1)至(3),确定了深度信念网络的结构,通过式(4)至(5)对训练参数进行更新,在编码过程中,采用当前帧前后各两个关键帧对边信息进行预测,提高WZ帧的重建质量,减少解码端的请求次数,使分布式视频编码能更好地克服无线传输环境下网络服务质量不稳定的问题,同时,为提高训练和计算效率,将当前帧前后各两个关键帧中16×16的块作为输入信息,在实际应用时,首先采用不同运动特征的视频序列并对深度信念网络进行训练,确定网络中的参数后,再通过该网络在接收端对分布式视频中的边信息,即WZ帧进行计算。
采用深度信念网络的DVC边信息求取方法的具体流程如下:
(1)采用HMDB51视频序列数据库(http://serre-lab.clps.brown.edu/resource/)具有不同运动特征的视频序列,共有6849个视频序列,其中70%用于训练,30%用于测试,视频序列的大小为320*240,以这些视频序列组建训练样本;
(2)以训练样本中的不同类型的视频序列对深度信念网络进行训练,并使用Contrastive Wake-Sleep算法完成其调优过程,确定网络中的各参数;
(3)经过上述(1)、(2)两步,深度网络已训练完成,此时,为便与输入,将当前帧(第i帧)的前后各两帧,即第i-1,i-2,i+1,i+2个关键帧划分成16×16的块,作为该网络的输入数据;
(4)在分布式视频解码器中,以解码后的当前帧(第i帧)前后第i-1,i-2,i+1,i+2个关键帧作为深度信念网络的输入,经网络处理并输出后得到对应的WZ帧;
(5)以输出的WZ帧作为边信息,由解码器完成分布式视频的WZ帧的解码操作。
由于采用深度信念网络对DVC的边信息进行计算,使DVC边信息预测更精确,从而提高了WZ帧的重建质量,在接收端获得更高的视频解码质量。
本发明的有益效果:
本申请针对WSN中视频传输质量较低的问题,在分析现有分布式视频编码边信息求取算法的基础上,设计了一种采用深度信念网络的DVC边信息求取算法,对提高无线传输环境下的视频传输的可靠性具有一定的实际意义。
为提高深度信念网络的预测性能,采用了具有不同运动特征的视频序列对网络进行训练。此外,为提高编解码的效率,提供良好的率失真性能,使用当前帧的前后各两个关键帧作为网络的输入来求取边信息,并在实验中验证了算法的有效性。
本发明能够有效地增强无线传感器网络中分布式视频传输的可靠性,分布式视频边信息质量较高,解码端能获得更好率失真性能。在低码率条件下也能更好保证视频重建质量,能有效地增强分布式视频在无线传输环境中的适应能力。
附图说明
图1为DVC编码结构结构图。
图2为深度信念网络结构示意图。
图3为DBNB_SI算法的基本流程结构图。
图4为不同算法对应SI帧的质量示意图。
图5为不同算法对应的率失真性能示意图。
具体实施方式
下面结合附图对本发明作进一步详细说明。
如图1所示:输入的视频序列将被分成WZ帧和关键帧两种类型,其中奇数帧为关键帧,偶数帧为WZ帧。采用4×4的离散余弦变换(DCT)对每个WZ帧进行变换操作,然后对变换系数进行量化操作,再由turbo编码器对各个位平面进行处理并传输。而关键帧采用传统的H.264/AVC编码标准进行帧内编码。在解码端,以当前帧前后各两帧作为输入,采用深度信念网络求取边信息,并与Turbo中的校验位一道完成位平面的解码,实现WZ帧的重建。
如图2所示:在DBN中,包含了可视层和隐含层,分别表示为v=[v1,v2,.....vn],h=[h1,h2,.....hm]。根据文献[11],本文对输入层和其它层分别采用了Gaussian-BernoulliRBM和Bernoulli-Bernoulli RBM,其结点的能量函数分别为:
其中Z=∑v∑he{-E(v,h;θ)}。同时,RBM中可视单元与隐含单元的节点值可根据文献[11]求得,其参数更新的方法也在该文献中进行了详细的分析。为保证算法的可靠性,采用对比散度算法对网络进行训练,其本质上是一种逐层的训练方法。其参数更新法则如下:
如图3所示:在提出的DBNB_SI方法中,为提高预测精度,采用当前帧前后各两个关键帧对边信息进行预测,其目的是提高WZ帧的重建质量,减少解码端的请求次数,使分布式视频编码能更好地克服无线传输环境下网络服务质量不稳定的问题。同时,为提高训练和计算效率,将当前帧前后各两个关键帧中16×16的块作为输入信息。在实际应用时,首先采用不同运动特征的视频序列并对深度信念网络进行训练。确定网络中的参数后,再通过该网络在接收端对分布式视频中的边信息,即WZ帧进行计算。DBNB_SI方法法的具体流程如下:(1)采用具有不同运动特征的视频序列组建训练样本;(2)以训练样本中的不同类型的视频序列对深度信念网络进行训练,并使用Contrastive Wake-Sleep算法完成其调优过程,确定网络中的各参数;(3)将当前帧(第i帧)的前后各两帧,即第i-1,i-2,i+1,i+2个关键帧划分成16×16的块;(4)在分布式视频解码器中,以解码后的当前帧(第i帧)前后第i-1,i-2,i+1,i+2个关键帧作为深度信念网络的输入,经网络处理并输出后得到对应的WZ帧;(5)以输出的WZ帧作为边信息,由解码器完成分布式视频的WZ帧的解码操作。
指得指出的是,学习速率对网络的性能有较大的影响,在实际应用时,经过多次实验,我们将其值取为0.027。本质上,其训练是一个迭代的过程,本文根据经验值将各层的训练次数设为40次。为验证本文提出的边信息求取算法的性能,将提出的算法集成到基于斯坦福框架的DISCOVER编码架下,并与目前典型的IST-TDWZ方法进行了对比和分析。实验中的WZ帧在编码时采用的是Laplacian分布,关键帧采用H.264/AVC进行编码。同时,在matlab2017中建立了无线视频传输仿真系统,设置其信道为雷利衰减,传输范围为100m。基于matlab2017的DBN类函数建立了深度信念网络,并利用不同类型的视频序列完成训练。深度视频序列的GOP大小设为2,初始码率为50kbps。在实验中计算RD性能时综合考虑WZ帧和关键帧。对比了各视频序列中的SI帧和重建帧的峰值信噪比(PSNR)性能(客观质量),并根据下式计算视频的PSNR:
PSNR=10Log(2552/MSE) (7)
训练样本中采取的视频帧来自于不同的视频序列,包括了Container、Mother andDaughter、Miss America、Soccer等,各序列具有不同的运动特征。帧率设为15fps。采用的测试视频序列为News、Foreman、Carphone。各视频序列在不同码率条件下对应的PSNR如图4所示。从图4不难看出,本文提出的DBNB_SI算法较IST-TDWZ可以获得更高质量的边信息,各视频序列获得的增益约为1.3~3.7dB。说明DBNB_SI算法在无线传输环境下能够有效地提高边信息生成的质量。这有助于提高解码器的解码效率和重建WZ帧的质量,同时减少解码端向编码端的请求次数,增强视频传输的稳定性。
图4a为测试视频序列为Carphone时提出的方法与IST-TDWZ方法的峰值信噪比的对比情况
图4b为测试视频序列为Foreman时提出的方法与IST-TDWZ方法的峰值信噪比的对比情况
图4c为测试视频序列为News时提出的方法与IST-TDWZ方法的峰值信噪比的对比情况
图5比较了不同算法对应的解码帧的质量,可以看出,在码率相同的情况下,DBNB_SI算法求出边信息质量较高,其解码后的帧的PSNR也更高,表明提出的算法具有更好的率失真性能。在低码率条件下DBNB_SI算法也能更好保证视频重建质量,可有效地增强分布式视频在无线传输环境中的适应能力。
图5a为测试视频序列为Carphone时提出的方法与IST-TDWZ方法的率失真对比情况;
图5b为测试视频序列为Foreman时提出的方法与IST-TDWZ方法的率失真对比情况;
图5c为为测试视频序列为News时提出的方法与IST-TDWZ方法的率失真对比情况。
Claims (4)
1.一种采用深度信念网络的DVC边信息求取方法,其特征在于,包括以下步骤;
(1)输入的视频序列将被分成WZ帧和关键帧两种类型,其中WZ帧为偶数帧,关键帧为奇数帧;
(2)采用4×4的离散余弦变换(DCT)对步骤(1)中的每个WZ帧进行变换操作,然后对变换系数进行量化操作,再由turbo编码器对各个位平面进行处理并传输;
(3)步骤(1)得到的关键帧采用传统的H.264/AVC编码标准进行帧内编码;
(4)解码端以当前帧前后各两帧作为输入,采用深度信念网络求取边信息,并与Turbo中的校验位一道完成位平面的解码。
2.根据权利要求1所述的一种采用深度信念网络的DVC边信息求取方法,其特征在于,所述步骤(4)的深度信念网络中,包含了可视层和隐含层,分别表示为v=[v1,v2,.....vn],h=[h1,h2,.....hm],可视层为视频数据的输入层,数据经过可视层传输至隐含层,隐含层用于对视频数据中的特征进行处理,对可视层数据的特征进行分析,所述输入层和隐含层分别采用了Gaussian-Bernoulli RBM和Bernoulli-Bernoulli RBM,其结点的能量函数分别为:
其中Z=∑v∑he{-E(v,h;θ)};v,h分别为深度网络中的可视层和隐藏层的数量,θ为阀值,n,m分别为可视导和隐藏层的数量,E(v,h;θ)为能量函数,e( )为指数函数。
3.根据权利要求1所述的一种采用深度信念网络的DVC边信息求取方法,其特征在于,所述深度信念网络具体为:采用对比散度算法对网络进行训练,其参数更新法则如下;
在上述过程,根据式(1)至(3),确定了深度信念网络的结构,通过式(4)至(5)对训练参数进行更新,在编码过程中,采用当前帧前后各两个关键帧对边信息进行预测,提高WZ帧的重建质量,减少解码端的请求次数,使分布式视频编码能更好地克服无线传输环境下网络服务质量不稳定的问题,同时,为提高训练和计算效率,将当前帧前后各两个关键帧中16×16的块作为输入信息,在实际应用时,首先采用不同运动特征的视频序列并对深度信念网络进行训练,确定网络中的参数后,再通过该网络在接收端对分布式视频中的边信息,即WZ帧进行计算。
4.根据权利要求3所述的一种采用深度信念网络的DVC边信息求取方法,其特征在于,采用深度信念网络的DVC边信息求取方法的具体流程如下:
(1)采用HMDB51视频序列数据库(http://serre-lab.clps.brown.edu/resource/)具有不同运动特征的视频序列,共有6849个视频序列,其中70%用于训练,30%用于测试,视频序列的大小为320*240,以这些视频序列组建训练样本;
(2)以训练样本中的不同类型的视频序列对深度信念网络进行训练,并使用Contrastive Wake-Sleep算法完成其调优过程,确定网络中的各参数;
(3)经过上述(1)、(2)两步,深度网络已训练完成,此时,为便与输入,将当前帧(第i帧)的前后各两帧,即第i-1,i-2,i+1,i+2个关键帧划分成16×16的块,作为该网络的输入数据;
(4)在分布式视频解码器中,以解码后的当前帧(第i帧)前后第i-1,i-2,i+1,i+2个关键帧作为深度信念网络的输入,经网络处理并输出后得到对应的WZ帧;
(5)以输出的WZ帧作为边信息,由解码器完成分布式视频的WZ帧的解码操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011053883.4A CN112188210A (zh) | 2020-09-27 | 2020-09-27 | 一种采用深度信念网络的dvc边信息求取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011053883.4A CN112188210A (zh) | 2020-09-27 | 2020-09-27 | 一种采用深度信念网络的dvc边信息求取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112188210A true CN112188210A (zh) | 2021-01-05 |
Family
ID=73946863
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011053883.4A Pending CN112188210A (zh) | 2020-09-27 | 2020-09-27 | 一种采用深度信念网络的dvc边信息求取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112188210A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102291582A (zh) * | 2011-09-21 | 2011-12-21 | 北京邮电大学 | 一种基于运动补偿精化的分布式视频编码方法 |
CN106060567A (zh) * | 2016-06-16 | 2016-10-26 | 四川大学 | 一种基于分层wz帧的小波域分布式多视点视频编码 |
CN108805167A (zh) * | 2018-05-04 | 2018-11-13 | 江南大学 | 一种基于Laplace函数约束的稀疏深度置信网络图像分类方法 |
CN110337807A (zh) * | 2017-04-07 | 2019-10-15 | 英特尔公司 | 针对深度通道和卷积神经网络图像和格式使用相机设备的方法和系统 |
-
2020
- 2020-09-27 CN CN202011053883.4A patent/CN112188210A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102291582A (zh) * | 2011-09-21 | 2011-12-21 | 北京邮电大学 | 一种基于运动补偿精化的分布式视频编码方法 |
CN106060567A (zh) * | 2016-06-16 | 2016-10-26 | 四川大学 | 一种基于分层wz帧的小波域分布式多视点视频编码 |
CN110337807A (zh) * | 2017-04-07 | 2019-10-15 | 英特尔公司 | 针对深度通道和卷积神经网络图像和格式使用相机设备的方法和系统 |
CN108805167A (zh) * | 2018-05-04 | 2018-11-13 | 江南大学 | 一种基于Laplace函数约束的稀疏深度置信网络图像分类方法 |
Non-Patent Citations (4)
Title |
---|
"基于人工神经网络的分布式视频编码边信息生成方法", 《铜仁学院学报》, pages 1 - 3 * |
SHI TAO: "Aerial Image Classification based on Sparse Representation and Deep Belief Network", 《35TH CHINESE CONTROL CONFERENCE》 * |
TAO SHI: "Aerial image classification based on sparse representation and deep belief network", 《2016 35TH CHINESE CONTROL CONFERENCE (CCC)》 * |
柴瑞敏: "一种改进的深度置信网络及其在自然图像分类中的应用", 《计算机应用与软件》, pages 2 - 1 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8505059B2 (en) | Channel capacity estimation and prediction method and apparatus for rate adaptive wireless video | |
CN101835042B (zh) | 基于无反馈速率控制的Wyner-Ziv视频编码系统及方法 | |
CN102138326B (zh) | 反量化图像的方法和设备以及解码图像的方法和设备 | |
US8798144B2 (en) | System and method for determining encoding parameters | |
KR101511230B1 (ko) | 적응 양자화를 이용한 분산 비디오 부호화/복호화 장치 및 그 방법 | |
CN101077011A (zh) | 运用精细粒度可伸缩性技术进行数字视频实时代码转换的系统和方法 | |
Yea et al. | A wavelet-based two-stage near-lossless coder | |
CN107343202B (zh) | 基于附加码率的无反馈分布式视频编解码方法 | |
WO2002035854A1 (en) | Dct-based scalable video compression | |
CN114501013A (zh) | 一种可变码率视频压缩方法、系统、装置及存储介质 | |
Hemami | Digital image coding for robust multimedia transmission | |
US20050141616A1 (en) | Video encoding and decoding methods and apparatuses using mesh-based motion compensation | |
CN111726635B (zh) | 一种基于滑窗bats码的低时延图像渐进传输方法 | |
US10536703B2 (en) | Method and apparatus for video quality assessment based on content complexity | |
Ivrlač et al. | Models and analysis of streaming video transmission over wireless fading channels | |
CN112188210A (zh) | 一种采用深度信念网络的dvc边信息求取方法 | |
CN107888931B (zh) | 一种利用视频统计特征预测差错敏感度的方法 | |
US8437391B2 (en) | Transmitting video between two stations in a wireless network | |
CN113630120A (zh) | 一种结合1比特模数转换器的零时延通信方法及其应用 | |
JP2014506759A (ja) | 異種ネットワークを介したコンテンツ配信のクリフ効果を軽減するシステムおよび方法 | |
Babu et al. | Effective compressed image transmission through context aware wireless networks | |
CN116437089B (zh) | 一种基于关键目标的深度视频压缩方法 | |
CN110572661B (zh) | 一种面向4k/8k超高清视频编码的低延时码率控制方法 | |
Xu et al. | Optimization-Based Pseudo-Analog Transmission Scheme for Wireless Feature Map Transmission | |
Zhang et al. | Compressive Sensing Based Image Compression and Transmission for Noisy Channels |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |