CN114245141B - 一种基于深度学习的视频码流压缩方法和装置 - Google Patents

一种基于深度学习的视频码流压缩方法和装置 Download PDF

Info

Publication number
CN114245141B
CN114245141B CN202111442085.5A CN202111442085A CN114245141B CN 114245141 B CN114245141 B CN 114245141B CN 202111442085 A CN202111442085 A CN 202111442085A CN 114245141 B CN114245141 B CN 114245141B
Authority
CN
China
Prior art keywords
code stream
deep learning
learning algorithm
video code
compressed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111442085.5A
Other languages
English (en)
Other versions
CN114245141A (zh
Inventor
兰雨晴
黄永琢
余丹
王丹星
唐霆岳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Standard Intelligent Security Technology Co Ltd
Original Assignee
China Standard Intelligent Security Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Standard Intelligent Security Technology Co Ltd filed Critical China Standard Intelligent Security Technology Co Ltd
Priority to CN202111442085.5A priority Critical patent/CN114245141B/zh
Publication of CN114245141A publication Critical patent/CN114245141A/zh
Application granted granted Critical
Publication of CN114245141B publication Critical patent/CN114245141B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本申请提供了一种基于深度学习的视频码流压缩方法和装置,涉及视频数据处理技术领域。该方法通过深度学习算法对视频码流进行压缩,压缩完成后比对视频码流压缩前后的数据量,判断视频码流是否需要进行深度学习算法的压缩;若需要进行深度学习算法的压缩,则保存压缩完成后的视频码流;在保存所述压缩完成后的视频码流的同时还会保存压缩前视频码流的校验数组;当需要完整码流时,通过深度学习算法反向还原出未压缩的码流,然后再求取还原出的未压缩的码流的校验数组,并与保存的校验数组进行比对,判断所述深度学习算法反向还原的结果是否正确。可以看到,本实施例通过深度学习算法压缩码流,并可以通过训练好的框架还原出未压缩的码流。

Description

一种基于深度学习的视频码流压缩方法和装置
技术领域
本申请涉及视频数据处理技术领域,尤其涉及一种基于深度学习的视频码流压缩方法和装置。
背景技术
视频压缩的目标是在尽可能保证视觉效果的前提下减少视频数据率,视频压缩比一般指压缩后的数据量与压缩前的数据量之比。相关技术中对视频的压缩主要是只保留I帧以及其他帧的运动向量,从I帧预测出P帧与B帧。这样的编码方式可以将码流压缩至很小,但是很难从已经压缩过的码流还原出未压缩过的完整码流,故当需要完整码流时只能重新传输完整码流。因此,亟需解决这一技术问题。
发明内容
鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的基于深度学习的视频码流压缩方法,通过深度学习算法压缩码流,并可以通过训练好的框架还原出未压缩的码流。所述技术方案如下:
第一方面,提供了一种基于深度学习的视频码流压缩方法,包括:
通过深度学习算法对视频码流进行压缩,压缩完成后比对视频码流压缩前后的数据量,判断视频码流是否需要进行深度学习算法的压缩;
若需要进行深度学习算法的压缩,则保存压缩完成后的视频码流;
在保存所述压缩完成后的视频码流的同时还会保存压缩前视频码流的校验数组;
当需要完整码流时,通过深度学习算法反向还原出未压缩的码流,然后再求取还原出的未压缩的码流的校验数组,并与保存的校验数组进行比对,判断所述深度学习算法反向还原的结果是否正确。
在一种可能的实现方式中,所述方法还包括:
若判断所述深度学习算法反向还原的结果不正确,则通过比对所述深度学习算法反向还原的结果与原始未压缩过的完整码流,控制所述深度学习算法再训练的次数,以完善深度学习算法的准确性。
在一种可能的实现方式中,利用如下公式根据深度学习算法对视频码流压缩前后的数据量,判断视频码流是否需要进行深度学习算法的压缩:
G(P)=b×len[P(D)]-B0
其中G(P)表示经过深度学习算法压缩的视频码流的使用控制值;b表示视频码流中单个字节的数据量;D表示视频码流数据的二进制形式;P(D)表示经过深度学习算法压缩后的视频码流数据的二进制形式;len[P(D)]表示求取数据P(D)中字节个数;B0表示未经过深度学习算法压缩的视频码流的总数据量;
若G(P)≥0,则表示经过深度学习算法压缩后的视频码流总数据量大于或等于未经过深度学习算法压缩的视频码流的总数据量,则控制系统不使用经过深度学习算法压缩的视频码流,即直接传输视频码流的完整码流;
若G(P)<0,则表示经过深度学习算法压缩后的视频码流总数据量小于未经过深度学习算法压缩的视频码流的总数据量,则控制系统使用经过深度学习算法压缩的视频码流进行传输。
在一种可能的实现方式中,利用如下公式根据视频码流数据得到视频码流数据的校验数组:
Figure BDA0003383723300000021
其中A表示视频码流数据的校验数组矩阵;len(D)表示求取视频码流数据字节个数;D(i)表示视频码流数据的二进制形式中第i位上的二进制数值;[]10表示将括号内的数值转换为十进制数;n表示视频码流数据的二进制形式中二进制数的位数;S{}表示奇偶判断函数,若括号内的数值为奇数则函数值为1,若括号内的数值为偶数则函数值为0。
在一种可能的实现方式中,利用如下公式根据深度学习算法反向还原出未压缩的码流的校验数组与保存的校验数组判断所述深度学习算法反向还原的结果是否正确:
Figure BDA0003383723300000031
其中η表示所述深度学习算法反向还原的校验结果输出值;A(a)表示视频码流数据的校验数组矩阵中的第a个元素的数值;
Figure BDA0003383723300000032
表示经过深度学习算法压缩后的视频码流数据的校验数组矩阵中的第a个元素的数值;||表示求取绝对值;
若η=0表示所述深度学习算法反向还原的校验结果输出值为0,即所述深度学习算法反向还原的校验结果不存在错误,是正确的;
若η=1表示所述深度学习算法反向还原的校验结果输出值为1,即所述深度学习算法反向还原的校验结果存在错误,是不正确的。
在一种可能的实现方式中,利用如下公式通过比对所述深度学习算法反向还原的结果与原始未压缩过的完整码流,控制所述深度学习算法再训练的次数,以完善深度学习算法的准确性:
Figure BDA0003383723300000033
其中K表示所述深度学习算法再训练的控制次数;k0(t)表示所述深度学习算法当前已经训练完成的次数;P[D(i)]表示经过深度学习算法压缩后的视频码流数据的二进制形式中第i位上的二进制数值;
Figure BDA0003383723300000034
表示向上取整。
第二方面,提供了一种基于深度学习的视频码流压缩装置,包括:
第一判断模块,用于通过深度学习算法对视频码流进行压缩,压缩完成后比对视频码流压缩前后的数据量,判断视频码流是否需要进行深度学习算法的压缩;
第一保存模块,用于若需要进行深度学习算法的压缩,则保存压缩完成后的视频码流;
第二保存模块,用于在保存所述压缩完成后的视频码流的同时还会保存压缩前视频码流的校验数组;
第二判断模块,用于当需要完整码流时,通过深度学习算法反向还原出未压缩的码流,然后再求取还原出的未压缩的码流的校验数组,并与保存的校验数组进行比对,判断所述深度学习算法反向还原的结果是否正确。
在一种可能的实现方式中,所述装置还包括:
控制模块,用于若判断所述深度学习算法反向还原的结果不正确,则通过比对所述深度学习算法反向还原的结果与原始未压缩过的完整码流,控制所述深度学习算法再训练的次数,以完善深度学习算法的准确性。
在一种可能的实现方式中,所述第一判断模块还用于:
利用如下公式根据深度学习算法对视频码流压缩前后的数据量,判断视频码流是否需要进行深度学习算法的压缩:
G(P)=b×len[P(D)]-B0
其中G(P)表示经过深度学习算法压缩的视频码流的使用控制值;b表示视频码流中单个字节的数据量;D表示视频码流数据的二进制形式;P(D)表示经过深度学习算法压缩后的视频码流数据的二进制形式;len[P(D)]表示求取数据P(D)中字节个数;B0表示未经过深度学习算法压缩的视频码流的总数据量;
若G(P)≥0,则表示经过深度学习算法压缩后的视频码流总数据量大于或等于未经过深度学习算法压缩的视频码流的总数据量,则控制系统不使用经过深度学习算法压缩的视频码流,即直接传输视频码流的完整码流;
若G(P)<0,则表示经过深度学习算法压缩后的视频码流总数据量小于未经过深度学习算法压缩的视频码流的总数据量,则控制系统使用经过深度学习算法压缩的视频码流进行传输。
在一种可能的实现方式中,所述第二保存模块还用于:
利用如下公式根据视频码流数据得到视频码流数据的校验数组:
Figure BDA0003383723300000051
其中A表示视频码流数据的校验数组矩阵;len(D)表示求取视频码流数据字节个数;D(i)表示视频码流数据的二进制形式中第i位上的二进制数值;[]10表示将括号内的数值转换为十进制数;n表示视频码流数据的二进制形式中二进制数的位数;S{}表示奇偶判断函数,若括号内的数值为奇数则函数值为1,若括号内的数值为偶数则函数值为0。
借由上述技术方案,本申请实施例提供的基于深度学习的视频码流压缩方法和装置,首先通过深度学习算法对视频码流进行压缩,压缩完成后比对视频码流压缩前后的数据量,判断视频码流是否需要进行深度学习算法的压缩;若需要进行深度学习算法的压缩,则保存压缩完成后的视频码流;在保存所述压缩完成后的视频码流的同时还会保存压缩前视频码流的校验数组;当需要完整码流时,通过深度学习算法反向还原出未压缩的码流,然后再求取还原出的未压缩的码流的校验数组,并与保存的校验数组进行比对,判断所述深度学习算法反向还原的结果是否正确。可以看到,本实施例通过深度学习算法压缩码流,并可以通过训练好的框架还原出未压缩的码流。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1示出了根据本申请实施例的基于深度学习的视频码流压缩方法的流程图;
图2示出了根据本申请实施例的基于深度学习的视频码流压缩装置的结构图;以及
图3示出了根据本申请另一实施例的基于深度学习的视频码流压缩装置的结构图。
具体实施方式
下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”及其变体要被解读为意味着“包括但不限于”的开放式术语。
本申请实施例提供了一种基于深度学习的视频码流压缩方法,如图1所示,该基于深度学习的视频码流压缩方法可以包括以下步骤S101至S104:
步骤S101,通过深度学习算法对视频码流进行压缩,压缩完成后比对视频码流压缩前后的数据量,判断视频码流是否需要进行深度学习算法的压缩;
步骤S102,若需要进行深度学习算法的压缩,则保存压缩完成后的视频码流;
步骤S103,在保存压缩完成后的视频码流的同时还会保存压缩前视频码流的校验数组;
步骤S104,当需要完整码流时,通过深度学习算法反向还原出未压缩的码流,然后再求取还原出的未压缩的码流的校验数组,并与保存的校验数组进行比对,判断深度学习算法反向还原的结果是否正确。
本申请实施例首先通过深度学习算法对视频码流进行压缩,压缩完成后比对视频码流压缩前后的数据量,判断视频码流是否需要进行深度学习算法的压缩;若需要进行深度学习算法的压缩,则保存压缩完成后的视频码流;在保存压缩完成后的视频码流的同时还会保存压缩前视频码流的校验数组;当需要完整码流时,通过深度学习算法反向还原出未压缩的码流,然后再求取还原出的未压缩的码流的校验数组,并与保存的校验数组进行比对,判断深度学习算法反向还原的结果是否正确。可以看到,本实施例通过深度学习算法压缩码流,并可以通过训练好的框架还原出未压缩的码流。
本申请实施例中提供了一种可能的实现方式,上文步骤S104中判断深度学习算法反向还原的结果是否正确,若判断深度学习算法反向还原的结果不正确,则通过比对深度学习算法反向还原的结果与原始未压缩过的完整码流,控制深度学习算法再训练的次数,以完善深度学习算法的准确性。
本申请实施例中提供了一种可能的实现方式,可以利用如下公式根据深度学习算法对视频码流压缩前后的数据量,判断视频码流是否需要进行深度学习算法的压缩:
G(P)=b×len[p(D)]-B0
其中G(P)表示经过深度学习算法压缩的视频码流的使用控制值;b表示视频码流中单个字节的数据量;D表示视频码流数据的二进制形式;P(D)表示经过深度学习算法压缩后的视频码流数据的二进制形式;len[P(D)]表示求取数据P(D)中字节个数;B0表示未经过深度学习算法压缩的视频码流的总数据量;
若G(P)≥0,则表示经过深度学习算法压缩后的视频码流总数据量大于或等于未经过深度学习算法压缩的视频码流的总数据量,则控制系统不使用经过深度学习算法压缩的视频码流,即直接传输视频码流的完整码流;
若G(P)<0,则表示经过深度学习算法压缩后的视频码流总数据量小于未经过深度学习算法压缩的视频码流的总数据量,则控制系统使用经过深度学习算法压缩的视频码流进行传输。
本实施例根据深度学习算法对视频码流压缩前后的数据量,判断视频码流是否需要进行深度学习算法的压缩,以确保经过深度学习算法压缩后数据的数据量是减小的,若不能达到减小的目的则传输其原始完整数据。
本申请实施例中提供了一种可能的实现方式,可以利用如下公式根据视频码流数据得到视频码流数据的校验数组:
Figure BDA0003383723300000081
其中A表示视频码流数据的校验数组矩阵;len(D)表示求取视频码流数据字节个数;D(i)表示视频码流数据的二进制形式中第i位上的二进制数值;[]10表示将括号内的数值转换为十进制数;n表示视频码流数据的二进制形式中二进制数的位数;S{}表示奇偶判断函数,若括号内的数值为奇数则函数值为1,若括号内的数值为偶数则函数值为0。
本实施例中根据视频码流数据得到视频码流数据的校验数组,得到可以进行校验的数组,以确保后续对深度学习算法的优化。
本申请实施例中提供了一种可能的实现方式,可以利用如下公式根据深度学习算法反向还原出未压缩的码流的校验数组与保存的校验数组判断深度学习算法反向还原的结果是否正确:
Figure BDA0003383723300000082
其中η表示深度学习算法反向还原的校验结果输出值;A(a)表示视频码流数据的校验数组矩阵中的第a个元素的数值;
Figure BDA0003383723300000083
表示经过深度学习算法压缩后的视频码流数据的校验数组矩阵中的第a个元素的数值;||表示求取绝对值;
若η=0表示深度学习算法反向还原的校验结果输出值为0,即深度学习算法反向还原的校验结果不存在错误,是正确的;
若η=1表示深度学习算法反向还原的校验结果输出值为1,即深度学习算法反向还原的校验结果存在错误,是不正确的。
本实施例中,
Figure BDA0003383723300000084
的求取过程与求取A的公式一致,数值需将公式中的换成P(D)。根据深度学习算法反向还原出未压缩的码流的校验数组与保存的校验数组判断深度学习算法反向还原的结果是否正确,从而知晓深度学习算法当前训练的程度是否可以将码流准确的反向预测出来。
本申请实施例中提供了一种可能的实现方式,可以利用如下公式通过比对深度学习算法反向还原的结果与原始未压缩过的完整码流,控制深度学习算法再训练的次数,以完善深度学习算法的准确性:
Figure BDA0003383723300000091
其中K表示深度学习算法再训练的控制次数;k0(t)表示深度学习算法当前已经训练完成的次数;P[D(i)]表示经过深度学习算法压缩后的视频码流数据的二进制形式中第i位上的二进制数值;
Figure BDA0003383723300000092
表示向上取整。
本实施例通过比对深度学习算法反向还原的结果与原始未压缩过的完整码流,控制深度学习算法再训练的次数,以完善深度学习算法的准确性,确保深度学习算法预测的可靠性。
需要说明的是,实际应用中,上述所有可能的实施方式可以采用结合的方式任意组合,形成本申请的可能的实施例,在此不再一一赘述。
基于上文各个实施例提供的基于深度学习的视频码流压缩方法,基于同一发明构思,本申请实施例还提供了一种基于深度学习的视频码流压缩装置。
图2示出了根据本申请实施例的基于深度学习的视频码流压缩装置的结构图。如图2所示,该基于深度学习的视频码流压缩装置可以包括第一判断模块210、第一保存模块220、第二保存模块230以及第二判断模块240。
第一判断模块210,用于通过深度学习算法对视频码流进行压缩,压缩完成后比对视频码流压缩前后的数据量,判断视频码流是否需要进行深度学习算法的压缩;
第一保存模块220,用于若需要进行深度学习算法的压缩,则保存压缩完成后的视频码流;
第二保存模块230,用于在保存压缩完成后的视频码流的同时还会保存压缩前视频码流的校验数组;
第二判断模块240,用于当需要完整码流时,通过深度学习算法反向还原出未压缩的码流,然后再求取还原出的未压缩的码流的校验数组,并与保存的校验数组进行比对,判断深度学习算法反向还原的结果是否正确。
本申请实施例中提供了一种可能的实现方式,如图3所示,上文图2展示的装置还可以包括控制模块310,用于若判断深度学习算法反向还原的结果不正确,则通过比对深度学习算法反向还原的结果与原始未压缩过的完整码流,控制深度学习算法再训练的次数,以完善深度学习算法的准确性。
本申请实施例中提供了一种可能的实现方式,第一判断模块210还用于:
利用如下公式根据深度学习算法对视频码流压缩前后的数据量,判断视频码流是否需要进行深度学习算法的压缩:
G(P)=b×len[P(D)]-B0
其中G(P)表示经过深度学习算法压缩的视频码流的使用控制值;b表示视频码流中单个字节的数据量;D表示视频码流数据的二进制形式;P(D)表示经过深度学习算法压缩后的视频码流数据的二进制形式;len[P(D)]表示求取数据P(D)中字节个数;B0表示未经过深度学习算法压缩的视频码流的总数据量;
若G(P)≥0,则表示经过深度学习算法压缩后的视频码流总数据量大于或等于未经过深度学习算法压缩的视频码流的总数据量,则控制系统不使用经过深度学习算法压缩的视频码流,即直接传输视频码流的完整码流;
若G(P)<0,则表示经过深度学习算法压缩后的视频码流总数据量小于未经过深度学习算法压缩的视频码流的总数据量,则控制系统使用经过深度学习算法压缩的视频码流进行传输。
本申请实施例中提供了一种可能的实现方式,第二保存模块230还用于:
利用如下公式根据视频码流数据得到视频码流数据的校验数组:
Figure BDA0003383723300000101
其中A表示视频码流数据的校验数组矩阵;len(D)表示求取视频码流数据字节个数;D(i)表示视频码流数据的二进制形式中第i位上的二进制数值;[]10表示将括号内的数值转换为十进制数;n表示视频码流数据的二进制形式中二进制数的位数;S{}表示奇偶判断函数,若括号内的数值为奇数则函数值为1,若括号内的数值为偶数则函数值为0。
本申请实施例中提供了一种可能的实现方式,第二判断模块240还用于
利用如下公式根据深度学习算法反向还原出未压缩的码流的校验数组与保存的校验数组判断深度学习算法反向还原的结果是否正确:
Figure BDA0003383723300000111
其中η表示深度学习算法反向还原的校验结果输出值;A(a)表示视频码流数据的校验数组矩阵中的第a个元素的数值;
Figure BDA0003383723300000112
表示经过深度学习算法压缩后的视频码流数据的校验数组矩阵中的第a个元素的数值;||表示求取绝对值;
若η=0表示深度学习算法反向还原的校验结果输出值为0,即深度学习算法反向还原的校验结果不存在错误,是正确的;
若η=1表示深度学习算法反向还原的校验结果输出值为1,即深度学习算法反向还原的校验结果存在错误,是不正确的。
本申请实施例中提供了一种可能的实现方式,控制模块310还用于:
利用如下公式通过比对深度学习算法反向还原的结果与原始未压缩过的完整码流,控制深度学习算法再训练的次数,以完善深度学习算法的准确性:
Figure BDA0003383723300000113
其中K表示深度学习算法再训练的控制次数;k0(t)表示深度学习算法当前已经训练完成的次数;P[D(i)]表示经过深度学习算法压缩后的视频码流数据的二进制形式中第i位上的二进制数值;
Figure BDA0003383723300000114
表示向上取整。
所属领域的技术人员可以清楚地了解到,上述描述的系统、装置、模块的具体工作过程,可以参考前述方法实施例中的对应过程,为简洁起见,在此不另赘述。
本领域普通技术人员可以理解:本申请的技术方案本质上或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,其包括若干程序指令,用以使得一电子设备(例如个人计算机,服务器,或者网络设备等)在运行所述程序指令时执行本申请各实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM)、随机存取存储器(RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,实现前述方法实施例的全部或部分步骤可以通过程序指令相关的硬件(诸如个人计算机,服务器,或者网络设备等的电子设备)来完成,所述程序指令可以存储于一计算机可读取存储介质中,当所述程序指令被电子设备的处理器执行时,所述电子设备执行本申请各实施例所述方法的全部或部分步骤。
以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:在本申请的精神和原则之内,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案脱离本申请的保护范围。

Claims (4)

1.一种基于深度学习的视频码流压缩方法,其特征在于,包括以下步骤:
通过深度学习算法对视频码流进行压缩,压缩完成后比对视频码流压缩前后的数据量,判断视频码流是否需要进行深度学习算法的压缩;
若需要进行深度学习算法的压缩,则保存压缩完成后的视频码流;
在保存所述压缩完成后的视频码流的同时还会保存压缩前视频码流的校验数组;
当需要完整码流时,通过深度学习算法反向还原出未压缩的码流,然后再求取还原出的未压缩的码流的校验数组,并与保存的校验数组进行比对,判断所述深度学习算法反向还原的结果是否正确;
其中,所述视频码流压缩方法还包括:
若判断所述深度学习算法反向还原的结果不正确,则通过比对所述深度学习算法反向还原的结果与原始未压缩过的完整码流,控制所述深度学习算法再训练的次数,以完善深度学习算法的准确性;
其中,利用如下公式根据深度学习算法对视频码流压缩前后的数据量,判断视频码流是否需要进行深度学习算法的压缩:
G(P)=b×len[P(D)]-B0
其中G(P)表示经过深度学习算法压缩的视频码流的使用控制值;b表示视频码流中单个字节的数据量;D表示视频码流数据的二进制形式;P(D)表示经过深度学习算法压缩后的视频码流数据的二进制形式;len[P(D)]表示求取数据P(D)中字节个数;B0表示未经过深度学习算法压缩的视频码流的总数据量;
若G(P)≥0,则表示经过深度学习算法压缩后的视频码流总数据量大于或等于未经过深度学习算法压缩的视频码流的总数据量,则控制系统不使用经过深度学习算法压缩的视频码流,即直接传输视频码流的完整码流;
若G(P)<0,则表示经过深度学习算法压缩后的视频码流总数据量小于未经过深度学习算法压缩的视频码流的总数据量,则控制系统使用经过深度学习算法压缩的视频码流进行传输;
其中,利用如下公式根据视频码流数据得到视频码流数据的校验数组:
Figure FDA0003660893110000021
其中A表示视频码流数据的校验数组矩阵;len(D)表示求取视频码流数据字节个数;D(i)表示视频码流数据的二进制形式中第i位上的二进制数值;[]10表示将括号内的数值转换为十进制数;n表示视频码流数据的二进制形式中二进制数的位数;S{}表示奇偶判断函数,若括号内的数值为奇数则函数值为1,若括号内的数值为偶数则函数值为0。
2.根据权利要求1所述的基于深度学习的视频码流压缩方法,其特征在于,利用如下公式根据深度学习算法反向还原出未压缩的码流的校验数组与保存的校验数组判断所述深度学习算法反向还原的结果是否正确:
Figure FDA0003660893110000022
其中η表示所述深度学习算法反向还原的校验结果输出值;A(a)表示视频码流数据的校验数组矩阵中的第a个元素的数值;
Figure FDA0003660893110000023
表示经过深度学习算法压缩后的视频码流数据的校验数组矩阵中的第a个元素的数值;||表示求取绝对值;
若η=0表示所述深度学习算法反向还原的校验结果输出值为0,即所述深度学习算法反向还原的校验结果不存在错误,是正确的;
若η=1表示所述深度学习算法反向还原的校验结果输出值为1,即所述深度学习算法反向还原的校验结果存在错误,是不正确的。
3.根据权利要求2所述的基于深度学习的视频码流压缩方法,其特征在于,利用如下公式通过比对所述深度学习算法反向还原的结果与原始未压缩过的完整码流,控制所述深度学习算法再训练的次数,以完善深度学习算法的准确性:
Figure FDA0003660893110000031
其中K表示所述深度学习算法再训练的控制次数;k0(t)表示所述深度学习算法当前已经训练完成的次数;P[D(i)]表示经过深度学习算法压缩后的视频码流数据的二进制形式中第i位上的二进制数值;
Figure FDA0003660893110000032
表示向上取整。
4.一种基于深度学习的视频码流压缩装置,其特征在于,包括:
第一判断模块,用于通过深度学习算法对视频码流进行压缩,压缩完成后比对视频码流压缩前后的数据量,判断视频码流是否需要进行深度学习算法的压缩;
第一保存模块,用于若需要进行深度学习算法的压缩,则保存压缩完成后的视频码流;
第二保存模块,用于在保存所述压缩完成后的视频码流的同时还会保存压缩前视频码流的校验数组;
第二判断模块,用于当需要完整码流时,通过深度学习算法反向还原出未压缩的码流,然后再求取还原出的未压缩的码流的校验数组,并与保存的校验数组进行比对,判断所述深度学习算法反向还原的结果是否正确;
其中,所述视频码流压缩装置还包括:
控制模块,用于若判断所述深度学习算法反向还原的结果不正确,则通过比对所述深度学习算法反向还原的结果与原始未压缩过的完整码流,控制所述深度学习算法再训练的次数,以完善深度学习算法的准确性;
其中,所述第一判断模块还用于:
利用如下公式根据深度学习算法对视频码流压缩前后的数据量,判断视频码流是否需要进行深度学习算法的压缩:
G(P)=b×len[P(D)]-B0
其中G(P)表示经过深度学习算法压缩的视频码流的使用控制值;b表示视频码流中单个字节的数据量;D表示视频码流数据的二进制形式;[(D)表示经过深度学习算法压缩后的视频码流数据的二进制形式;len[P(D)]表示求取数据P(D)中字节个数;B0表示未经过深度学习算法压缩的视频码流的总数据量;
若G(P)≥0,则表示经过深度学习算法压缩后的视频码流总数据量大于或等于未经过深度学习算法压缩的视频码流的总数据量,则控制系统不使用经过深度学习算法压缩的视频码流,即直接传输视频码流的完整码流;
若G(P)<0,则表示经过深度学习算法压缩后的视频码流总数据量小于未经过深度学习算法压缩的视频码流的总数据量,则控制系统使用经过深度学习算法压缩的视频码流进行传输;
其中,所述第二保存模块还用于:
利用如下公式根据视频码流数据得到视频码流数据的校验数组:
Figure FDA0003660893110000041
其中A表示视频码流数据的校验数组矩阵;len(D)表示求取视频码流数据字节个数;D(i)表示视频码流数据的二进制形式中第i位上的二进制数值;[]10表示将括号内的数值转换为十进制数;n表示视频码流数据的二进制形式中二进制数的位数;S{}表示奇偶判断函数,若括号内的数值为奇数则函数值为1,若括号内的数值为偶数则函数值为0。
CN202111442085.5A 2021-11-30 2021-11-30 一种基于深度学习的视频码流压缩方法和装置 Active CN114245141B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111442085.5A CN114245141B (zh) 2021-11-30 2021-11-30 一种基于深度学习的视频码流压缩方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111442085.5A CN114245141B (zh) 2021-11-30 2021-11-30 一种基于深度学习的视频码流压缩方法和装置

Publications (2)

Publication Number Publication Date
CN114245141A CN114245141A (zh) 2022-03-25
CN114245141B true CN114245141B (zh) 2022-07-15

Family

ID=80752133

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111442085.5A Active CN114245141B (zh) 2021-11-30 2021-11-30 一种基于深度学习的视频码流压缩方法和装置

Country Status (1)

Country Link
CN (1) CN114245141B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103188247A (zh) * 2011-12-31 2013-07-03 深圳市金蝶友商电子商务服务有限公司 一种数据传输方法及系统
CN112565777A (zh) * 2020-11-30 2021-03-26 通号智慧城市研究设计院有限公司 基于深度学习模型视频数据传输方法、系统、介质及设备
CN113313774A (zh) * 2020-02-26 2021-08-27 华为技术有限公司 图像处理方法、装置、电子设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200053388A1 (en) * 2018-08-10 2020-02-13 Disney Enterprises, Inc. Machine learning based video compression

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103188247A (zh) * 2011-12-31 2013-07-03 深圳市金蝶友商电子商务服务有限公司 一种数据传输方法及系统
CN113313774A (zh) * 2020-02-26 2021-08-27 华为技术有限公司 图像处理方法、装置、电子设备及存储介质
CN112565777A (zh) * 2020-11-30 2021-03-26 通号智慧城市研究设计院有限公司 基于深度学习模型视频数据传输方法、系统、介质及设备

Also Published As

Publication number Publication date
CN114245141A (zh) 2022-03-25

Similar Documents

Publication Publication Date Title
US20190327479A1 (en) Devices for compression/decompression, system, chip, and electronic device
CN109379598B (zh) 一种基于fpga实现的图像无损压缩方法
CN112820306B (zh) 语音传输方法、系统、装置、计算机可读存储介质和设备
JP2006050096A5 (zh)
CN104509110A (zh) 通过源量化和无损压缩内核执行图像有损压缩的方法和装置,以及相应的相关的图像解压缩方法和装置
JP2007336590A (ja) ビデオ符号化時の動き予測の実行方法、ビデオ符号化システム、及び、ビデオ符号化装置
CN114245141B (zh) 一种基于深度学习的视频码流压缩方法和装置
WO2024051757A1 (zh) 信息的处理方法、装置、电子设备及计算机可读介质
CN101751897A (zh) 压缩及解压缩查找表的方法及其相关装置
CN112631434B (zh) 一种基于深度学习的振动触觉编解码方法
CN113630125A (zh) 数据压缩、编码解压缩方法、装置、电子设备及存储介质
US11823686B2 (en) Methods, devices and computer program products for lossless data compression and decompression
CN103281532A (zh) 一种基于运动强度检测的量化调整方法及系统
CN110191341A (zh) 一种深度数据的编码方法和解码方法
CN109660809A (zh) 基于inter解码的colmv数据无损压缩方法及系统
US10938412B2 (en) Decompression of model parameters using functions based upon cumulative count distributions
CN112054805B (zh) 一种模型数据压缩方法、系统及相关设备
US10931303B1 (en) Data processing system
KR100728918B1 (ko) 이진영상을 고속 압축하는 방법 및 장치, 이진영상을 고속 복원하는 방법 및 장치, 이진영상을 고속 압축 및 복원하는 시스템 그리고 그 방법
CN115250351A (zh) 用于图像数据的压缩方法、解压方法及相关产品
CN106302573B (zh) 一种采用擦除码处理数据的方法、系统及装置
CN114245140B (zh) 一种基于深度学习的码流预测方法和装置
CN114363631B (zh) 一种基于深度学习的音视频处理方法和装置
CN109473116A (zh) 语音编码方法、语音解码方法及装置
CN113904900B (zh) 一种实时遥测信源分阶相对编码方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant