CN109451331A

CN109451331A - 基于用户认知需求的视频传输方法

Info

Publication number: CN109451331A
Application number: CN201910036006.7A
Authority: CN
Inventors: 吴金建; 吴雨豪; 毛永伟; 石光明
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2019-01-15
Filing date: 2019-01-15
Publication date: 2019-03-08
Anticipated expiration: 2039-01-15
Also published as: CN109451331B

Abstract

本发明提出了一种基于用户认知需求的视频传输方法，旨在提高用户体验，并减少冗余数据导致的带宽浪费；包括如下步骤：服务端获取视频片段；客户端定义用户的认知需求，并对每个认知需求编号；客户端将用户选择的认知需求的编号发送至服务端；服务端根据认知需求的编号采用无损或有损压缩编码算法对视频片段编码，其中有损压缩编码参数利用质量评价算法计算，并将编码结果发送至客户端；客户端对编码结果进行对应解码。本发明通过制定用户对视频的认知需求，使得用户够能准确选择视频的质量，同时利用质量评价算法计算编码参数，使得编码后的视频质量刚好满足用户需求，节约了网络带宽，可用于视频传输系统。

Description

基于用户认知需求的视频传输方法

技术领域

本发明属于视频传输技术领域，涉及一种视频传输方法，特别涉及一种基于用户认知需求的视频传输方法，可用于视频传输系统。

背景技术

大数据的发展导致了视觉大数据的产生，随着图像采集设备以及显示设备的更新迭代，大量的视觉数据以便捷的形式呈现在用户眼前，为用户提供丰富多彩的信息。然而在不同工作环境下，网络带宽并不总是能满足视觉数据传输的需求，无目的、无组织的高清图像采集制造出了巨量的冗余数据，导致关键的有效数据无法在有限的网络带宽中正常传递给用户，使得用户体验下降，甚至错过重要信息。

为了减轻网络压力，优化用户体验，在传统的视频传输方法中，服务端将获取到的原始视频数据进行有损压缩编码，再把有损压缩编码后的数据发送给客户端，客户端对接收到的视频数据解码还原成近似原始的数据，此时服务端获取到的原始视频数据才能以一定质量展示到用户面前，同时，用户一般有控制视频质量的权利，即通过预设的选项来控制压缩编码过程中的编码参数，以调整所看到的视频质量。这个过程虽然会增加整个系统的复杂度，同时有损压缩也会对视频数据的质量造成影响，但只要调控得当，适当地牺牲系统复杂度以及视频数据质量能够使得系统更合理地使用网络带宽，在有限的带宽条件下为用户提供更流畅的体验。但在传统的视频传输方法中仍存在缺陷，程序无法准确地度量用户对视频质量的需求，更无法精确地为用户提供指定质量的视频，同时，对于不同内容的视频片段，以同样的编码参数进行压缩编码后，其感知质量损失是不同的，若对所有视频片段以同样的编码参数进行压缩编码，则用户在客户端得到的视频质量参差不齐，用户体验较差。

目前，为了优化用户获取视频的体验，主要是通过获取的当前网络状态来优化视频传输方法，例如，申请公布号为CN105025294A，名称为“一种视频传输控制装置及方法”的专利申请，公开了一种视频传输方法，该方法先监测网络状态，再根据网络状态对视频进行采样，得到采样后的视频帧，最后将视频帧发送给用户。该方法通过视频帧率控制待传输视频的码率，能有效地减少视频传输时的数据量，同时视频帧率根据网络状态确定，因此能保证用户能获得流畅的视频体验。但该方法存在的缺陷是：

1)根据网络状态控制传输视频的码率，导致用户没有选择视频质量的权力，不能根据自身需求选择视频质量，用户体验仍然较差；

2)根据网络状态盲目地提高视频的码率，并不总是能提高视频的感官质量，虽然网络带宽能确保这些数据流畅地传输给用户，但由于没有考虑人眼的感知特性，视频数据中人眼感知不到的冗余数据会无意义地占据带宽，导致带宽的浪费。

发明内容

本发明的目的在于克服上述现有技术存在的缺陷，提出了基于用户认知需求的视频传输方法，旨在提高用户体验，并减少冗余数据导致的带宽浪费。

为实现上述目的，本发明采取的技术方案包括如下步骤：

(1)服务端获取视频片段X；

(2)客户端定义用户的认知需求R，并对每个认知需求进行编号：

客户端定义用户的绝对无损需求、感知无损需求和认知无损需求，其中，绝对无损需求表示用户在客户端获取的视频数据与原视频片段X一致的编号为R＝0的需求；感知无损需求表示用户在客户端获取的视频数据与原视频片段X感官质量一致的编号为R＝1的需求；认知无损需求表示用户在客户端获取的视频数据存在感官质量损失的需求，按照感官质量损失从小到大的顺序，认知无损需求分为第一级认知无损需求、第二级认知无损需求、第三级认知无损需求和第四级认知无损需求四个等级，编号分别为R＝2、R＝3、R＝4和R＝5；

(3)客户端将用户选择的认知需求的编号发送至服务端：

客户端将用户根据自身在客户端获取的视频数据质量的需要选择的一种认知需求R的编号发送至服务端；

(4)服务端对视频片段X进行编码，并将编码结果发送至客户端：

(4a)服务端判断用户选择的认知需求R的编号是否为0，若是，执行步骤(4b)，否则，执行步骤(4c)；

(4b)服务端采用无损压缩编码算法对视频片段X进行编码，得到编码后的视频片段Y；

(4c)服务端利用质量评价算法计算视频片段X的第n阶编码参数Q，n∈[1,5]且n＝R，并采用有损压缩编码算法，通过Q对视频片段X进行编码，得到编码后的视频片段Y；

(4d)服务端将步骤(4b)或步骤(4c)得到的编码后的视频片段Y发送至客户端；

(5)客户端对视频片段Y进行解码：

(5a)客户端判断接收到的视频片段Y是否为通过无损压缩编码算法获取，若是，执行步骤(5b)，否则，执行步骤(5c)；

(5b)客户端采用无损压缩编码算法对视频片段Y进行解码，得到解码后的可播放的视频片段X′；

(5c)客户端采用有损压缩编码算法对视频片段Y进行解码，得到解码后的可播放的视频片段X′。

本发明与现有技术相比，具有如下优点：

1)本发明在对视频片段进行编解码的过程中，是根据用户不同的认知需求，采用不同的压缩编码方法实现的，用户选择的每一种认知需求都有其实际含义，根据实际含义选择认知需求就能获得所需质量的视频片段，避免了现有技术因根据网络带宽控制视频码率调整视频质量导致的用户体验差的缺陷。

2)本发明利用质量评价算法计算视频指定感官质量对应的编码参数，通过该编码参数对视频编码再传输，使得用户获取到的视频数据刚好满足用户的感官质量需求，解决了视频在传输过程中存在大量用户不需要的冗余数据的问题，实现了为用户提供指定质量视频的前提下，将视频码率降到最低，节约了网络带宽。

附图说明

附图1为本发明的实现流程图。

具体实施方式

以下结合附图和具体实施例，对本发明作进一步详细描述。

实施例1.本实施例客户端采用无损压缩编码算法对视频片段Y进行编码和解码。

参照图1.本发明包括如下步骤：

步骤1)服务端获取视频片段X；

视频片段X可以由摄像头等能产生可播放的视频数据的对象提供；

步骤2)客户端定义用户的认知需求R，并对每个认知需求进行编号：

虽然通过不同的编码算法以及相应的编码参数，能得到一系列不同码率的编码视频，但受限于人眼的感知特性，人眼只能从中分辨出有限的几个质量等级，因此在本发明中，对用户关于视频质量的认知需求作了一定的限定，在客户端定义用户的认知需求为绝对无损需求、感知无损需求和认知无损需求三大类，其中，绝对无损需求表示用户在客户端获取的视频数据与原视频片段X一致的编号为R＝0的需求，主要用于医疗及军事等需要确保信息完整性的应用中；感知无损需求表示用户在客户端获取的视频数据与原视频片段X感官质量一致的编号为R＝1的需求，主要用于艺术欣赏及数字娱乐等用户不要求确保信息完整性，但同时也不希望察觉出视频质量损失的应用中；认知无损需求表示用户在客户端获取的视频数据存在感官质量损失的需求，按照感官质量损失从小到大的顺序，认知无损需求分为第一级认知无损需求、第二级认知无损需求、第三级认知无损需求和第四级认知无损需求四个等级，编号分别为R＝2、R＝3、R＝4和R＝5，主要用于实况体育及交通监控等用户不要求获得完美的观影体验，但要求能认知视频中的目标的应用中，其中第四级认知无损需求为实现该目的的最低要求，若用户在该认知需求下得到的视频的质量进一步下降，则会出现用户无法认知视频中目标的现象；

步骤3)客户端将用户选择的认知需求的编号发送至服务端：

步骤4)服务端对视频片段X进行编码，并将编码结果发送至客户端：

(4a)服务端判断用户选择的认知需求R的编号是否为0，若是，则采用无损压缩编码算法对视频片段X进行编码，得到编码后的视频片段Y，其中，无损压缩编码算法可采用Huffyuv、H.264无损模式、MJPEG2000无损模式等可对视频进行无损压缩编码的算法，由于无损编码算法压缩率都较高，因此实施例采用计算速度最快的Huffyuv算法；

(4b)服务端将编码后的视频片段Y发送至客户端；

步骤5)客户端对视频片段Y进行解码：

客户端判断接收到的视频片段Y是否为通过无损压缩编码算法获取，若是，则采用Huffyuv算法对视频片段Y进行解码，得到解码后的可播放的视频片段X′。

实施例2.本实施例客户端采用有损压缩编码算法对视频片段Y进行编码和解码，其中的步骤1)～步骤3)与实施例1相同，仅对步骤4)和步骤5)作了调整。

参照图1.本发明包括如下步骤：

步骤1)服务端获取视频片段X；

步骤3)客户端将用户选择的认知需求的编号发送至服务端：

(4a)服务端判断用户选择的认知需求R的编号是否为0，若不是，则利用质量评价算法计算视频片段X的第n阶编码参数Q，n∈[1,5]且n＝R，并采用有损压缩编码算法，通过Q对视频片段X进行编码，得到编码后的视频片段Y，其中有损压缩编码算法可采用MJPEG、H.264、H.265等可对视频进行有损压缩编码的算法，为了更好地与其它方案对接，实施例采用目前普及率最高的H.264算法，此时，编码参数等价于H.264算法中的量化参数；

对于同一有损压缩编码算法与同一等级的编码后视频感官质量，其编码过程中采用的编码参数与视频本身内容有关，因此本发明利用能代表感官质量的质量分来计算编码参数，视频片段X的第n阶编码参数Q的计算步骤为：

(4a1)客户端通过预先实验统计的编码参数与质量分关系表，查表第n阶编码参数对应的质量分S_n，同时将第n阶编码参数Q的初始值设置为0；

为了获得编码参数与质量分关系表，实施例预先准备一系列测试视频，以不同编码参数对视频进行编码，编码后的视频以质量高到质量低排序，并让参与实验人员对同一内容的视频选择出5个感官质量开始发生变化的视频，5个视频的感官质量满足感知无损需求及认知无损需求的定义，再记录这5个视频相对于原始视频的5级质量分，最后将通过所有参与实验人员得到的5级质量分进行统计得到统计后的5级质量分S₁、S₂、S₃、S₄和S₅；

(4a2)客户端对Q进行更新：

Q＝Q+1；

(4a3)客户端采用H.264算法，以Q为编码参数对视频片段X进行编码，得到编码后的视频片段Y₁；

(4a4)客户端采用H.264算法对Y₁进行解码，得到解码后的视频片段X₁′，并采用基于结构相似性的质量评价算法SSIM，计算X₁′相对于X的质量分S(X,X₁′)；

质量评价算法SSIM主要利用图像的局部结构特征，结合亮度与对比度，来计算两幅图像之间的相似度，即失真图像相对于原图的质量分，对于视频，实施例通过计算失真视频相对于原视频每个对应帧之间的SSIM质量分，并计算其平均值以得到失真视频相对于原视频的SSIM质量分，其中，失真视频的质量失真来自于H.264编码过程中的信息丢失，质量评价算法SSIM是质量评价算法领域中最为经典的算法之一，较低的计算复杂度使其得到了广泛的应用，在实施例中利用质量评价算法SSIM得到的质量分，能有效地计算出指定认知需求对应感官质量视频的编码参数，在实施例中采用的质量评价算法SSIM计算步骤如下：

(4a41)客户端将视频片段X中第i帧图像记为X_i，可播放的视频片段X₁′中第i帧图像记为X_1i′，其中，i＝1,2,...,N，N为视频片段X及视频片段X₁′中总图像帧数，并分别计算X_i的平均强度和X_1i′的平均强度

其中，M表示每帧图像的总像素数，X_i(j)表示X_i的第j个像素点，X_1i′(j)表示X_1i′的第j个像素点，j＝1,2,...,M；

(4a42)客户端计算视频片段X中第i帧图像X_i与视频片段X₁′中第i帧图像X_1i′之间的亮度相似度L(X_i,X_1i′)：

其中，C₁＝(K₁L)²为避免分母为0的常数，K₁＝0.01，L＝255；

(4a43)客户端计算视频片段X中第i帧图像X_i的标准差和视频片段X₁′中第i帧图像X_1i′的标准差

(4a44)客户端计算视频片段X中第i帧图像X_i和视频片段X₁′中第i帧图像X_1i′之间的对比度相似度C(X_i,X_1i′)：

其中，C₂＝(K₂L)²为避免分母为0的常数，参数K₂＝0.03；

(4a45)客户端计算视频片段X中第i帧图像X_i和视频片段X₁′中第i帧图像X_1i′之间的结构相似度ST(X_i,X_1i′)：

其中，为避免分母为0的常数，表示视频片段X中第i帧图像X_i和视频片段X₁′中第i帧图像X_1i′之间的协方差：

(4a46)客户端计算视频片段X中第i帧图像X_i与视频片段X₁′中第i帧图像X_1i′之间的SSIM值SSIM(X_i,X_1i′)，得到视频片段X₁′相对于视频片段X的质量分S(X,X₁′)：

其中，SSIM(X_i,X_1i′)＝L(X_i,X_1i′)C(X_i,X_1i′)ST(X_i,X_1i′)。

(4a5)客户端重复步骤(4a2)至步骤(4a4)，直到S(X,X₁′)≤S_n，得到的Q即为视频片段X的第n阶编码参数；

对于实施例采用的H.264编码算法，其编码参数范围为[0,51]，其中编码参数越小，对应编码后视频质量越高，实施例通过设置最高的编码后视频质量作为起始值，并逐步增大编码参数以使编码后视频质量分接近指定质量分；

(4b)服务端将编码后的视频片段Y发送至客户端；

步骤5)客户端对视频片段Y进行解码：

客户端判断接收到的视频片段Y是否为通过无损压缩编码算法获取，若不是，则采用H.264算法对视频片段Y进行解码，得到解码后的可播放的视频片段X′。

以上描述仅是本发明的两个具体实例，不构成对本发明的任何限制。显然对于本领域的专业人员来说，在了解了本发明内容和原理后，都可能在不背离本发明原理、结构的情况下，进行形式和细节上的各种修改和改变，但是这些基于本发明思想的修正和改变仍在本发明的权利要求保护范围之内。

Claims

1.一种基于用户认知需求的视频传输方法，其特征在于，通过客户端和服务端实现，包括如下步骤：

(1)服务端获取视频片段X；

(3)客户端将用户选择的认知需求的编号发送至服务端：

(5)客户端对视频片段Y进行解码：

2.根据权利要求1所述的基于用户认知需求的视频传输方法，其特征在于，步骤(4c)中所述的服务端利用质量评价算法计算视频片段X的第n阶编码参数Q，实现步骤为：

(4c1)客户端通过预先实验统计的编码参数与质量分关系表，查表第n阶编码参数对应的质量分S_n，同时将第n阶编码参数Q的初始值设置为0；

(4c2)客户端对Q进行更新：

Q＝Q+1；

(4c3)客户端采用有损压缩编码算法，以Q为编码参数对视频片段X进行编码，得到编码后的视频片段Y₁；

(4c4)客户端采用有损压缩编码算法对Y₁进行解码，得到解码后的视频片段X₁′，并采用基于结构相似性的质量评价算法SSIM，计算X₁′相对于X的质量分S(X,X₁′)；

(4c5)客户端重复步骤(4c2)至步骤(4c4)，直到S(X,X₁′)≤S_n，得到的Q即为视频片段X的第n阶编码参数。

3.根据权利要求2所述的基于用户认知需求的视频传输方法，其特征在于，步骤(4c4)中所述的客户端以基于结构相似性的质量评价算法SSIM，计算X₁′相对于X的质量分S(X,X₁′)，实现步骤为：

(4c41)客户端将视频片段X中第i帧图像记为X_i，视频片段X₁′中第i帧图像记为X_1i′，其中，i＝1,2,...,N，N为视频片段X及视频片段X₁′中图像帧数，并分别计算X_i的平均强度和X_1i′的平均强度

(4c42)客户端计算视频片段X中第i帧图像X_i与视频片段X₁′中第i帧图像X_1i′之间的亮度相似度L(X_i,X_1i′)：

(4c43)客户端计算视频片段X中第i帧图像X_i的标准差和视频片段X₁′中第i帧图像X_1i′的标准差

(4c44)客户端计算视频片段X中第i帧图像X_i和视频片段X₁′中第i帧图像X_1i′之间的对比度相似度C(X_i,X_1i′)：

其中，C₂＝(K₂L)²为避免分母为0的常数，参数K₂＝0.03；

(4c45)客户端计算视频片段X中第i帧图像X_i和视频片段X₁′中第i帧图像X_1i′之间的结构相似度ST(X_i,X_1i′)：

(4c46)客户端计算视频片段X中第i帧图像X_i与视频片段X₁′中第i帧图像X_1i′之间的SSIM值SSIM(X_i,X_1i′)，得到视频片段X₁′相对于视频片段X的质量分S(X,X₁′)：

其中，SSIM(X_i,X_1i′)＝L(X_i,X_1i′)C(X_i,X_1i′)ST(X_i,X_1i′)。

4.根据权利要求1所述的基于用户认知需求的视频传输方法，其特征在于，步骤(4b)和步骤(5b)中所述的无损压缩编码算法，采用Huffyuv算法，步骤(4c)和步骤(5c)中所述的有损压缩编码算法，采用H.264算法。