CN114245141B

CN114245141B - 一种基于深度学习的视频码流压缩方法和装置

Info

Publication number: CN114245141B
Application number: CN202111442085.5A
Authority: CN
Inventors: 兰雨晴; 黄永琢; 余丹; 王丹星; 唐霆岳
Original assignee: China Standard Intelligent Security Technology Co Ltd
Current assignee: China Standard Intelligent Security Technology Co Ltd
Priority date: 2021-11-30
Filing date: 2021-11-30
Publication date: 2022-07-15
Anticipated expiration: 2041-11-30
Also published as: CN114245141A

Abstract

本申请提供了一种基于深度学习的视频码流压缩方法和装置，涉及视频数据处理技术领域。该方法通过深度学习算法对视频码流进行压缩，压缩完成后比对视频码流压缩前后的数据量，判断视频码流是否需要进行深度学习算法的压缩；若需要进行深度学习算法的压缩，则保存压缩完成后的视频码流；在保存所述压缩完成后的视频码流的同时还会保存压缩前视频码流的校验数组；当需要完整码流时，通过深度学习算法反向还原出未压缩的码流，然后再求取还原出的未压缩的码流的校验数组，并与保存的校验数组进行比对，判断所述深度学习算法反向还原的结果是否正确。可以看到，本实施例通过深度学习算法压缩码流，并可以通过训练好的框架还原出未压缩的码流。

Description

一种基于深度学习的视频码流压缩方法和装置

技术领域

本申请涉及视频数据处理技术领域，尤其涉及一种基于深度学习的视频码流压缩方法和装置。

背景技术

视频压缩的目标是在尽可能保证视觉效果的前提下减少视频数据率，视频压缩比一般指压缩后的数据量与压缩前的数据量之比。相关技术中对视频的压缩主要是只保留I帧以及其他帧的运动向量，从I帧预测出P帧与B帧。这样的编码方式可以将码流压缩至很小，但是很难从已经压缩过的码流还原出未压缩过的完整码流，故当需要完整码流时只能重新传输完整码流。因此，亟需解决这一技术问题。

发明内容

鉴于上述问题，提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的基于深度学习的视频码流压缩方法，通过深度学习算法压缩码流，并可以通过训练好的框架还原出未压缩的码流。所述技术方案如下：

第一方面，提供了一种基于深度学习的视频码流压缩方法，包括：

通过深度学习算法对视频码流进行压缩，压缩完成后比对视频码流压缩前后的数据量，判断视频码流是否需要进行深度学习算法的压缩；

若需要进行深度学习算法的压缩，则保存压缩完成后的视频码流；

在保存所述压缩完成后的视频码流的同时还会保存压缩前视频码流的校验数组；

当需要完整码流时，通过深度学习算法反向还原出未压缩的码流，然后再求取还原出的未压缩的码流的校验数组，并与保存的校验数组进行比对，判断所述深度学习算法反向还原的结果是否正确。

在一种可能的实现方式中，所述方法还包括：

若判断所述深度学习算法反向还原的结果不正确，则通过比对所述深度学习算法反向还原的结果与原始未压缩过的完整码流，控制所述深度学习算法再训练的次数，以完善深度学习算法的准确性。

在一种可能的实现方式中，利用如下公式根据深度学习算法对视频码流压缩前后的数据量，判断视频码流是否需要进行深度学习算法的压缩：

G(P)＝b×len[P(D)]-B₀

其中G(P)表示经过深度学习算法压缩的视频码流的使用控制值；b表示视频码流中单个字节的数据量；D表示视频码流数据的二进制形式；P(D)表示经过深度学习算法压缩后的视频码流数据的二进制形式；len[P(D)]表示求取数据P(D)中字节个数；B₀表示未经过深度学习算法压缩的视频码流的总数据量；

若G(P)≥0，则表示经过深度学习算法压缩后的视频码流总数据量大于或等于未经过深度学习算法压缩的视频码流的总数据量，则控制系统不使用经过深度学习算法压缩的视频码流，即直接传输视频码流的完整码流；

若G(P)＜0，则表示经过深度学习算法压缩后的视频码流总数据量小于未经过深度学习算法压缩的视频码流的总数据量，则控制系统使用经过深度学习算法压缩的视频码流进行传输。

在一种可能的实现方式中，利用如下公式根据视频码流数据得到视频码流数据的校验数组：

其中A表示视频码流数据的校验数组矩阵；len(D)表示求取视频码流数据字节个数；D(i)表示视频码流数据的二进制形式中第i位上的二进制数值；[]₁₀表示将括号内的数值转换为十进制数；n表示视频码流数据的二进制形式中二进制数的位数；S{}表示奇偶判断函数，若括号内的数值为奇数则函数值为1，若括号内的数值为偶数则函数值为0。

在一种可能的实现方式中，利用如下公式根据深度学习算法反向还原出未压缩的码流的校验数组与保存的校验数组判断所述深度学习算法反向还原的结果是否正确：

其中η表示所述深度学习算法反向还原的校验结果输出值；A(a)表示视频码流数据的校验数组矩阵中的第a个元素的数值；

表示经过深度学习算法压缩后的视频码流数据的校验数组矩阵中的第a个元素的数值；||表示求取绝对值；

若η＝0表示所述深度学习算法反向还原的校验结果输出值为0，即所述深度学习算法反向还原的校验结果不存在错误，是正确的；

若η＝1表示所述深度学习算法反向还原的校验结果输出值为1，即所述深度学习算法反向还原的校验结果存在错误，是不正确的。

在一种可能的实现方式中，利用如下公式通过比对所述深度学习算法反向还原的结果与原始未压缩过的完整码流，控制所述深度学习算法再训练的次数，以完善深度学习算法的准确性：

其中K表示所述深度学习算法再训练的控制次数；k₀(t)表示所述深度学习算法当前已经训练完成的次数；P[D(i)]表示经过深度学习算法压缩后的视频码流数据的二进制形式中第i位上的二进制数值；

表示向上取整。

第二方面，提供了一种基于深度学习的视频码流压缩装置，包括：

第一判断模块，用于通过深度学习算法对视频码流进行压缩，压缩完成后比对视频码流压缩前后的数据量，判断视频码流是否需要进行深度学习算法的压缩；

第一保存模块，用于若需要进行深度学习算法的压缩，则保存压缩完成后的视频码流；

第二保存模块，用于在保存所述压缩完成后的视频码流的同时还会保存压缩前视频码流的校验数组；

第二判断模块，用于当需要完整码流时，通过深度学习算法反向还原出未压缩的码流，然后再求取还原出的未压缩的码流的校验数组，并与保存的校验数组进行比对，判断所述深度学习算法反向还原的结果是否正确。

在一种可能的实现方式中，所述装置还包括：

控制模块，用于若判断所述深度学习算法反向还原的结果不正确，则通过比对所述深度学习算法反向还原的结果与原始未压缩过的完整码流，控制所述深度学习算法再训练的次数，以完善深度学习算法的准确性。

在一种可能的实现方式中，所述第一判断模块还用于：

利用如下公式根据深度学习算法对视频码流压缩前后的数据量，判断视频码流是否需要进行深度学习算法的压缩：

G(P)＝b×len[P(D)]-B₀

在一种可能的实现方式中，所述第二保存模块还用于：

利用如下公式根据视频码流数据得到视频码流数据的校验数组：

借由上述技术方案，本申请实施例提供的基于深度学习的视频码流压缩方法和装置，首先通过深度学习算法对视频码流进行压缩，压缩完成后比对视频码流压缩前后的数据量，判断视频码流是否需要进行深度学习算法的压缩；若需要进行深度学习算法的压缩，则保存压缩完成后的视频码流；在保存所述压缩完成后的视频码流的同时还会保存压缩前视频码流的校验数组；当需要完整码流时，通过深度学习算法反向还原出未压缩的码流，然后再求取还原出的未压缩的码流的校验数组，并与保存的校验数组进行比对，判断所述深度学习算法反向还原的结果是否正确。可以看到，本实施例通过深度学习算法压缩码流，并可以通过训练好的框架还原出未压缩的码流。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例描述中所需要使用的附图作简单地介绍。

图1示出了根据本申请实施例的基于深度学习的视频码流压缩方法的流程图；

图2示出了根据本申请实施例的基于深度学习的视频码流压缩装置的结构图；以及

图3示出了根据本申请另一实施例的基于深度学习的视频码流压缩装置的结构图。

具体实施方式

下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例，然而应当理解，可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本申请，并且能够将本申请的范围完整的传达给本领域的技术人员。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”及其变体要被解读为意味着“包括但不限于”的开放式术语。

本申请实施例提供了一种基于深度学习的视频码流压缩方法，如图1所示，该基于深度学习的视频码流压缩方法可以包括以下步骤S101至S104：

步骤S101，通过深度学习算法对视频码流进行压缩，压缩完成后比对视频码流压缩前后的数据量，判断视频码流是否需要进行深度学习算法的压缩；

步骤S102，若需要进行深度学习算法的压缩，则保存压缩完成后的视频码流；

步骤S103，在保存压缩完成后的视频码流的同时还会保存压缩前视频码流的校验数组；

步骤S104，当需要完整码流时，通过深度学习算法反向还原出未压缩的码流，然后再求取还原出的未压缩的码流的校验数组，并与保存的校验数组进行比对，判断深度学习算法反向还原的结果是否正确。

本申请实施例首先通过深度学习算法对视频码流进行压缩，压缩完成后比对视频码流压缩前后的数据量，判断视频码流是否需要进行深度学习算法的压缩；若需要进行深度学习算法的压缩，则保存压缩完成后的视频码流；在保存压缩完成后的视频码流的同时还会保存压缩前视频码流的校验数组；当需要完整码流时，通过深度学习算法反向还原出未压缩的码流，然后再求取还原出的未压缩的码流的校验数组，并与保存的校验数组进行比对，判断深度学习算法反向还原的结果是否正确。可以看到，本实施例通过深度学习算法压缩码流，并可以通过训练好的框架还原出未压缩的码流。

本申请实施例中提供了一种可能的实现方式，上文步骤S104中判断深度学习算法反向还原的结果是否正确，若判断深度学习算法反向还原的结果不正确，则通过比对深度学习算法反向还原的结果与原始未压缩过的完整码流，控制深度学习算法再训练的次数，以完善深度学习算法的准确性。

本申请实施例中提供了一种可能的实现方式，可以利用如下公式根据深度学习算法对视频码流压缩前后的数据量，判断视频码流是否需要进行深度学习算法的压缩：

G(P)＝b×len[p(D)]-B₀

本实施例根据深度学习算法对视频码流压缩前后的数据量，判断视频码流是否需要进行深度学习算法的压缩，以确保经过深度学习算法压缩后数据的数据量是减小的，若不能达到减小的目的则传输其原始完整数据。

本申请实施例中提供了一种可能的实现方式，可以利用如下公式根据视频码流数据得到视频码流数据的校验数组：

本实施例中根据视频码流数据得到视频码流数据的校验数组，得到可以进行校验的数组，以确保后续对深度学习算法的优化。

本申请实施例中提供了一种可能的实现方式，可以利用如下公式根据深度学习算法反向还原出未压缩的码流的校验数组与保存的校验数组判断深度学习算法反向还原的结果是否正确：

其中η表示深度学习算法反向还原的校验结果输出值；A(a)表示视频码流数据的校验数组矩阵中的第a个元素的数值；

若η＝0表示深度学习算法反向还原的校验结果输出值为0，即深度学习算法反向还原的校验结果不存在错误，是正确的；

若η＝1表示深度学习算法反向还原的校验结果输出值为1，即深度学习算法反向还原的校验结果存在错误，是不正确的。

本实施例中，

的求取过程与求取A的公式一致，数值需将公式中的换成P(D)。根据深度学习算法反向还原出未压缩的码流的校验数组与保存的校验数组判断深度学习算法反向还原的结果是否正确，从而知晓深度学习算法当前训练的程度是否可以将码流准确的反向预测出来。

本申请实施例中提供了一种可能的实现方式，可以利用如下公式通过比对深度学习算法反向还原的结果与原始未压缩过的完整码流，控制深度学习算法再训练的次数，以完善深度学习算法的准确性：

其中K表示深度学习算法再训练的控制次数；k₀(t)表示深度学习算法当前已经训练完成的次数；P[D(i)]表示经过深度学习算法压缩后的视频码流数据的二进制形式中第i位上的二进制数值；

表示向上取整。

本实施例通过比对深度学习算法反向还原的结果与原始未压缩过的完整码流，控制深度学习算法再训练的次数，以完善深度学习算法的准确性，确保深度学习算法预测的可靠性。

需要说明的是，实际应用中，上述所有可能的实施方式可以采用结合的方式任意组合，形成本申请的可能的实施例，在此不再一一赘述。

基于上文各个实施例提供的基于深度学习的视频码流压缩方法，基于同一发明构思，本申请实施例还提供了一种基于深度学习的视频码流压缩装置。

图2示出了根据本申请实施例的基于深度学习的视频码流压缩装置的结构图。如图2所示，该基于深度学习的视频码流压缩装置可以包括第一判断模块210、第一保存模块220、第二保存模块230以及第二判断模块240。

第一判断模块210，用于通过深度学习算法对视频码流进行压缩，压缩完成后比对视频码流压缩前后的数据量，判断视频码流是否需要进行深度学习算法的压缩；

第一保存模块220，用于若需要进行深度学习算法的压缩，则保存压缩完成后的视频码流；

第二保存模块230，用于在保存压缩完成后的视频码流的同时还会保存压缩前视频码流的校验数组；

第二判断模块240，用于当需要完整码流时，通过深度学习算法反向还原出未压缩的码流，然后再求取还原出的未压缩的码流的校验数组，并与保存的校验数组进行比对，判断深度学习算法反向还原的结果是否正确。

本申请实施例中提供了一种可能的实现方式，如图3所示，上文图2展示的装置还可以包括控制模块310，用于若判断深度学习算法反向还原的结果不正确，则通过比对深度学习算法反向还原的结果与原始未压缩过的完整码流，控制深度学习算法再训练的次数，以完善深度学习算法的准确性。

本申请实施例中提供了一种可能的实现方式，第一判断模块210还用于：

G(P)＝b×len[P(D)]-B₀

本申请实施例中提供了一种可能的实现方式，第二保存模块230还用于：

本申请实施例中提供了一种可能的实现方式，第二判断模块240还用于

利用如下公式根据深度学习算法反向还原出未压缩的码流的校验数组与保存的校验数组判断深度学习算法反向还原的结果是否正确：

本申请实施例中提供了一种可能的实现方式，控制模块310还用于：

利用如下公式通过比对深度学习算法反向还原的结果与原始未压缩过的完整码流，控制深度学习算法再训练的次数，以完善深度学习算法的准确性：

表示向上取整。

所属领域的技术人员可以清楚地了解到，上述描述的系统、装置、模块的具体工作过程，可以参考前述方法实施例中的对应过程，为简洁起见，在此不另赘述。

本领域普通技术人员可以理解：本申请的技术方案本质上或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，其包括若干程序指令，用以使得一电子设备(例如个人计算机，服务器，或者网络设备等)在运行所述程序指令时执行本申请各实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM)、随机存取存储器(RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

或者，实现前述方法实施例的全部或部分步骤可以通过程序指令相关的硬件(诸如个人计算机，服务器，或者网络设备等的电子设备)来完成，所述程序指令可以存储于一计算机可读取存储介质中，当所述程序指令被电子设备的处理器执行时，所述电子设备执行本申请各实施例所述方法的全部或部分步骤。

以上各实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述各实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：在本申请的精神和原则之内，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案脱离本申请的保护范围。

Claims

1.一种基于深度学习的视频码流压缩方法，其特征在于，包括以下步骤：

当需要完整码流时，通过深度学习算法反向还原出未压缩的码流，然后再求取还原出的未压缩的码流的校验数组，并与保存的校验数组进行比对，判断所述深度学习算法反向还原的结果是否正确；

其中，所述视频码流压缩方法还包括：

若判断所述深度学习算法反向还原的结果不正确，则通过比对所述深度学习算法反向还原的结果与原始未压缩过的完整码流，控制所述深度学习算法再训练的次数，以完善深度学习算法的准确性；

其中，利用如下公式根据深度学习算法对视频码流压缩前后的数据量，判断视频码流是否需要进行深度学习算法的压缩：

G(P)＝b×len[P(D)]-B₀

若G(P)＜0，则表示经过深度学习算法压缩后的视频码流总数据量小于未经过深度学习算法压缩的视频码流的总数据量，则控制系统使用经过深度学习算法压缩的视频码流进行传输；

其中，利用如下公式根据视频码流数据得到视频码流数据的校验数组：

2.根据权利要求1所述的基于深度学习的视频码流压缩方法，其特征在于，利用如下公式根据深度学习算法反向还原出未压缩的码流的校验数组与保存的校验数组判断所述深度学习算法反向还原的结果是否正确：

3.根据权利要求2所述的基于深度学习的视频码流压缩方法，其特征在于，利用如下公式通过比对所述深度学习算法反向还原的结果与原始未压缩过的完整码流，控制所述深度学习算法再训练的次数，以完善深度学习算法的准确性：

表示向上取整。

4.一种基于深度学习的视频码流压缩装置，其特征在于，包括：

第二判断模块，用于当需要完整码流时，通过深度学习算法反向还原出未压缩的码流，然后再求取还原出的未压缩的码流的校验数组，并与保存的校验数组进行比对，判断所述深度学习算法反向还原的结果是否正确；

其中，所述视频码流压缩装置还包括：

控制模块，用于若判断所述深度学习算法反向还原的结果不正确，则通过比对所述深度学习算法反向还原的结果与原始未压缩过的完整码流，控制所述深度学习算法再训练的次数，以完善深度学习算法的准确性；

其中，所述第一判断模块还用于：

G(P)＝b×len[P(D)]-B₀

其中G(P)表示经过深度学习算法压缩的视频码流的使用控制值；b表示视频码流中单个字节的数据量；D表示视频码流数据的二进制形式；[(D)表示经过深度学习算法压缩后的视频码流数据的二进制形式；len[P(D)]表示求取数据P(D)中字节个数；B₀表示未经过深度学习算法压缩的视频码流的总数据量；

其中，所述第二保存模块还用于：