CN112995676A

CN112995676A - 一种音视频压缩方法、装置、设备、系统及存储介质

Info

Publication number: CN112995676A
Application number: CN202110445180.4A
Authority: CN
Inventors: 栾润峰; 平康; 程洪彬; 李跃海
Original assignee: Beijing Jinher Software Co Ltd
Current assignee: Beijing Jinher Software Co Ltd
Priority date: 2021-04-25
Filing date: 2021-04-25
Publication date: 2021-06-18

Abstract

本发明涉及一种音视频压缩方法、装置、设备、系统及存储介质。该方法包括：获取待压缩音视频；待压缩音视频包括：待压缩音频和待压缩视频；利用预设切片时间间隔对待压缩视频进行分段切分，得到多个视频段；识别视频段中的相似帧图片，并对相似帧图片进行删除；将待压缩音频和删除相似帧图片后的视频段进行合成，得到合成音视频；将合成音视频进行压缩。上述方法在音视频未压缩前对视频进行相似帧图片删除，进而缩小了音视频压缩文件的空间。

Description

一种音视频压缩方法、装置、设备、系统及存储介质

技术领域

本发明涉及音视频压缩技术领域，具体涉及一种音视频压缩方法、装置、设备、系统及存储介质。

背景技术

随着音视频技术的快速发展，越来越多的场景中应用到音视频。在音视频应用的过程中，不可避免的会涉及到音视频压缩。现实生活中，视频泛指将一系列静态影像以电信号的方式加以捕捉、记录、处理、储存、传送与重现的各种技术，即视频本质上是一段连续的图片。通常情况下，在视频图片画面的基础上，还会配有声音，此时的声音即为与视频对应的音频。因此在对音视频进行压缩时本质上是对音频和视频进行压缩。众所周知，音视频文件压缩的主要目的即为减小文件的空间，因此压缩后文件越小，表明压缩效果越好。

目前对音视频压缩通常采用对视频的分辨率或码率进行设置的方式，再通过压缩技术对设置后的音视频进行压缩。例如：采用主流视频压缩技术H.264、HEVC等对音视频进行压缩，以减小音视频的大小。

发明内容

有鉴于此，本发明的目的在于克服现有技术的不足，提供一种音视频压缩方法、装置、设备、系统及存储介质。解决了当前音视频压缩时压缩文件空间较大的问题。

为实现以上目的，本发明采用如下技术方案：

一种音视频压缩方法，包括：

获取待压缩音视频；所述待压缩音视频包括：待压缩音频和待压缩视频；

利用预设切片时间间隔对所述待压缩视频进行分段切分，得到多个视频段；

识别所述视频段中的相似帧图片，并对所述相似帧图片进行删除；包括：对所述视频段中的视频图片间进行图片差异值比对；将所述图片差异值与预设差异值比对，判断是否存在相似帧图片；若存在相似帧图片，则依据预设规则删除所述相似帧图片；

将所述待压缩音频和删除相似帧图片后的所述视频段进行合成，得到合成音视频；

将所述合成音视频进行压缩。

可选的，还包括：

获取终端设备录制的原始音视频；

将所述原始音视频进行音频视频分类存储，生成所述待压缩音视频。

可选的，所述对所述视频段中的视频图片间进行图片差异值比对，包括：

依设定标准选取所述视频段中设定数目帧的视频图片，作为初始图片；

对所述初始图片进行图像识别；

依据图像识别结果计算所述初始图片间的图片差异值。

可选的，所述将所述图片差异值与预设差异值比对，判断是否存在相似帧图片，包括：

判断所述图片差异值是否小于预设差异值；

若小于所述预设差异值，确定所述初始图片中存在相似帧图片；

若大于或等于所述预设差异值，确定所述初始图片中不存在相似帧图片。

可选的，所述依设定标准选取所述视频段中设定数目帧的视频图片，作为初始图片，包括：

在所述视频段的首帧视频图片开始依次选取设定数目帧所述视频图片，作为所述初始图片；

或者，若所述图片差异值小于所述预设差异值，从所述视频段的剩余帧图片中选取一帧视频图片，并与上一轮图片差异值计算过程中存留视频图片构建所述初始图片；所述存留视频图片为所述初始图片中删除所述相似帧图片后的视频图片；

或者，若所述图片差异值大于或等于所述预设差异值，从所述视频段中的剩余帧图片中选取一帧视频图片作为所述初始图片。

可选的，所述设定数目帧为两帧。

一种音视频压缩装置，包括：

音视频获取模块，用于获取待压缩音视频；所述待压缩音视频包括：待压缩音频和待压缩视频；

视频分段模块，用于利用预设切片时间间隔对所述待压缩视频进行分段切分，得到多个视频段；

相似帧删除模块，用于识别所述视频段中的相似帧图片，并对所述相似帧图片进行删除；包括：差异值计算单元，用于对所述视频段中的视频图片间进行图片差异值比对；相似帧图片判断单元，用于将所述图片差异值与预设差异值比对，判断是否存在相似帧图片；相似帧图片删除单元，用于若存在相似帧图片，则依据预设规则删除所述相似帧图片；

音视频合成模块，用于将所述待压缩音频和删除相似帧图片后的所述视频段进行合成，得到合成音视频；

压缩模块，用于将所述合成音视频进行压缩。

一种音视频压缩设备，包括：

处理器，以及与所述处理器相连接的存储器；

所述存储器用于存储计算机程序，所述计算机程序至少用于执行上述所述的音视频压缩方法；

所述处理器用于调用并执行所述存储器中的所述计算机程序。

一种音视频压缩系统，包括：

终端设备，及与所述终端设备通信连接的如上述所述的音视频压缩设备。

一种存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时，实现如上述所述的空调机组的保护控制方法中各个步骤。

本申请提供的技术方案可以包括以下有益效果：

本申请中公开一种音视频压缩方法、装置、设备、系统及存储介质，方法包括：获取待压缩音视频，该待压缩音视频中包括待压缩音频和待压缩视频，然后依据预设切片时间间隔对待压缩视频进行分段切分，分为多个视频段，然后将每一个视频段中的相似帧图片删除，再将待压缩音频和删除相似帧图片后的视频段合成，最后将合成音视频进行压缩。上述方法中在进行音视频压缩时，先将音频和视频分开处理，将视频依据时间间隔进行分段切分，对切分后的视频段中的图片分别进行相似帧图片删除，精简视频段中图片，以此降低视频段中相似图片的存在率，利用预设切片时间间隔提高了相似帧图片删除的精确度；同时视频段中删除相似帧图片后极大地缩小了音视频压缩后的空间大小。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例提供的音视频压缩方法的流程图；

图2是本发明另一实施例提供的音视频压缩方法的流程图；

图3是本发明一实施例提供的音视频压缩装置的模块图；

图4是本发明一实施例提供的音视频压缩设备的结构图；

图5是本发明一实施例提供的音视频压缩系统的结构图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将对本发明的技术方案进行详细的描述。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式，都属于本发明所保护的范围。

图1是本发明一实施例提供的音视频压缩方法的流程图。参见图1，一种音视频压缩方法，包括：

步骤101：获取待压缩音视频；所述待压缩音视频包括：待压缩音频和待压缩视频。此处的待压缩音视频的获取来源为：用户通过手机等终端设备进行音视频录制，得到原始音视频，然后将原始音视频按照音频和视频分类存储，音频和视频即构成此处的待压缩音视频。

需要注意的是，通常情况下，终端设备在进行音视频采集时，得到的大多为音视频混合文件，在本申请中进行音视频压缩前，需要先将混合的音视频进行分格，将中的设备录制的原始音视频按照音频和视频两类进行存储，以供后续对视频进行相关处理。此处，对原始音视频进行音频和视频分类，可通过利用现有软件实现，具体实现方式并不局限，只要能够实现音频和视频分类存储的功能即可。

步骤102：利用预设切片时间间隔对所述待压缩视频进行分段切分，得到多个视频段。终端设备在录制音视频时，会同步带有音视频录制时间，在将音视频进行音频和视频分类后，对应的音频和视频也会自带时间属性。然后，在对视频进行分段切分时，则依据时间属性对视频进行分段。其中，在进行分段时，依据时间间隔确定将视频分为几段，此处的时间间隔即为预设切片时间间隔，为人为设定值。需要注意的是，此处的预设切片时间间隔的具体时长设定并不局限，可根据实际应用场景而定。具体的，此处的预设切片时间间隔以秒为单位进行设定，例如：本申请中将预设切片时间间隔设为3s。原则上预设切片时间间隔的时长越短后期删除视频段中相似帧图片的精度越高。

步骤103：识别所述视频段中的相似帧图片，并对所述相似帧图片进行删除。

在将视频进行分段处理后，对所有视频段中所有帧的视频图片均进行相似性评判，然后将每段视频段中的相似帧图片进行删除，避免视频段中存在视频图片间极度相似的情况。

步骤104：将所述待压缩音频和删除相似帧图片后的所述视频段进行合成，得到合成音视频。

步骤101中获取的待压缩音视频中待压缩音频和待压缩视频二者之间在时间上是完全对应的，即每帧图片会有相同时间点对应的音频。但在此处进行合成的过程中，由于存在删除相似帧图片的情况，可能会导致视频段中的视频和音频不能完全对应。此种情况下，可将视频和音频进行正常合成，当合成后若音频时长大于视频的帧数，可让视频最后一帧的视频图片对应剩余的音频。或者，也可将音频调整为与视频段中视频图片时间完全对应的形式。具体的音频和视频的合成标准并不固定，可根据实际需求而定。

步骤105：将所述合成音视频进行压缩。当删除相似帧图片后的视频和音频合成后，将合成音视频利用通用压缩算法进行压缩并保存。

上述实施例中在进行音视频压缩时，先将音频和视频分开处理，将视频依据时间间隔进行分段切分，对切分后的视频段中的图片分别进行相似帧图片删除，精简视频段中图片，以此降低视频段中相似图片的存在率，利用预设切片时间间隔提高了相似帧图片删除的精确度；同时视频段中删除相似帧图片后极大地缩小了音视频压缩后的空间大小。

为了更详细地介绍本申请中的音视频压缩的实现过程，现对本申请中的音视频压缩方法进行更进一步地介绍，具体参见如下内容：

图2是本发明另一实施例提供的音视频压缩方法的流程图。参见图2，一种音视频压缩方法，包括：

步骤201：获取待压缩音视频；所述待压缩音视频包括：待压缩音频和待压缩视频。此处获取终端设备录制的原始音视频，然后将原始音视频进行音频和视频分类存储得到此处的待压缩音视频。

步骤202：利用预设切片时间间隔对所述待压缩视频进行分段切分，得到多个视频段。

步骤203：选取所述视频段中设定数目帧的视频图片，作为初始图片。

此处在视频段中选取视频图片时可分为多种情况。具体的，从视频段的首帧视频图片开始选取设定数目帧视频图片；或者在视频段中任意选取设定数目帧的视频图片。需要注意的是，此处按何种标准选取视频图片并不固定，具体根据实际需求而定。

同时，此处在视频段中选取视频图片时，选取的视频图片的帧数也可根据实际需求设定，可以为两帧，也可以为更多帧。

步骤204：计算初始图片的图片差异值。

在进行图片差异值计算时，通过对初始图片进行图像识别，然后通过图像识别的结果计算初始图片间的图片差异值。此处的图片差异值代表着初始图片间的相似度。需要注意的是，此处图像识别和图片差异值的计算过程可依据现有技术实现，具体实现方式不限定。

需要注意的是，不论初始图片中包含几帧视频图片，在计算图片差异值时，均为两帧视频图片计算图片差异值。若视频图片中包含两帧视频图片时，只比对此两帧图片，若有多帧视频图片，则依次进行两两视频图片的比对。

步骤205：判断所述图片差异值是否小于预设差异值。

在计算出图片差异值后，会将该图片差异值与预设差异值进行比较，此处预设差异值根据应用场景不同而定。本实施例中预设差异值可以为百分比数值，例如设定预设差异值为50%。也就是要将实时计算出的视频段中的视频图片间的图片差异值是否小于50%。

步骤206：若图片差异值小于所述预设差异值，确定所述初始图片中存在相似帧图片，删除相似帧图片。

此处，当存在两帧视频图片的图片差异值小于预设差异值时，选取此两帧视频图片中的一帧进行删除。此时，如何确定删除哪一帧，可根据不同情况设定。可以任选两帧中的一帧进行删除，也可根据两帧图片的时间先后顺序进行删除。例如：当第一帧视频图片和第二帧视频图片图片差异值小于预设差异值时，删除第二针视频图片，保留第一帧视频图片。

若图片差异值大于或等于所述预设差异值，执行步骤207。

步骤207：判断是否存在下一帧视频图片。

在删除了相似帧图片后，遍历此时的视频段，查看此时视频段中是否存在下一帧视频图片，以选取新的一帧视频图片进行新一轮的相似帧图片的识别及删除。

步骤208：若存在下一帧视频图片，获取下一帧视频图片与上一轮图片差异值计算过程中的视频图片构建初始图片。

此时，在获取下一帧视频图片时存在两种情况：

第一，在上一轮图片差异值计算过程中，初始图片中存在图片差异值小于预设差异值的视频图片，并进行了相似帧图片的删除。此时删除了相似帧图片后，还剩一帧视频图片，此处称为留存视频图片，此时在相同视频段中选取下一帧视频图片，与留存视频图片作为新的一组初始图片。

第二，若所述图片差异值大于或等于所述预设差异值，此时表示在上一轮图片差异值计算的过程中，初始图片中不存在相似帧图片，此时在相同视频段中选取一帧视频图片，将新选取的视频图片与上一轮图片差异值计算的过程中的拍摄时间最晚的那帧视频图片构建新一组的初始图片。

需要注意的是，此处选取的下一帧视频图片根据开始选取视频图片的规则不同而定。若在开始选取视频图片时，是从视频段的首帧开始选取，则此处按照视频帧的顺序选取下一帧图片。若在最开始选取视频图片时，是在视频段中任意选取的，此时则可视频段中剩余帧的视频图片中任意选取一帧。

步骤209：若不存在下一帧视频图片，得到删除相似帧图片后的视频段。

当在视频段中找不到下一帧视频图片时，代表此视频段内的所有视频图片已进行相似帧图片的处理，此视频段结束视频图片差异值的比对。

步骤210：将待压缩音频和视频段进行合成，并将合成音视频进行压缩并存储。

上述实施例中利用分段切片的时间间隔提高了删除的视频帧的精确度，更进一步地利用视频图片对比的图片差异值控制删除视频帧的多少，以此提高了相似帧图片的删除准确度。进而缩小了原音视频的未压缩之前的文件空间大小，并实现了音频、视频、合成音视频的存储。

为了更清楚的介绍本申请中音视频压缩的实现过程，现以设定数目帧为两帧，从视频段首帧开始依次选取视频图片为例，进行介绍，具体如下：

将获取的原始音视频进行音频和视频的分类划分，并将视频以4s的时间间隔进行划分，划分为10个视频段。其中10个视频段根据拍摄时间的前后顺序进行排序。

首先，选取第一个视频段中的第一帧视频图片和第二帧视频图片，计算这两帧视频图片的图片差异值，得到图片差异值为40%，此处40%小于预设差异值50%，此时删除这两帧视频图片中的一帧，此处选择删除第一帧视频图片，保留第二帧视频图片。然后依次选取第一个视频段中的第三帧视频图片，然后将第三帧视频图片与第二帧视频图片进行图片差异值计算，得到图片差异值为60%，大于预设差异值50%，此时第二帧视频图片和第三帧视频图片均保留，然后再第一个视频段中选取第四帧视频图片，再将第四帧视频图片和第三帧视频图片进行差异值计算，依次完成第一个视频段内的相似帧图片的删除。

然后再以相同的方式对剩余的9个视频段内的相似帧图片进行删除，最后得到10个删除相似帧图片后的视频段。

最后将音频与10个删除相似帧图片后的视频段进行合成，合成后利用现有压缩手段进行压缩。

对应于本发明实施例提供的一种音视频压缩方法，本发明实施例还提供一种音视频压缩装置。请参见下文实施例。

图3是本发明一实施例提供的音视频压缩装置的模块图。参见图3，一种音视频压缩装置，包括：

音视频获取模块301，用于获取待压缩音视频；所述待压缩音视频包括：待压缩音频和待压缩视频。

视频分段模块302，用于利用预设切片时间间隔对所述待压缩视频进行分段切分，得到多个视频段。

相似帧删除模块303，用于识别所述视频段中的相似帧图片，并对所述相似帧图片进行删除。

音视频合成模块304，用于将所述待压缩音频和删除相似帧图片后的所述视频段进行合成，得到合成音视频。

压缩模块305，用于将所述合成音视频进行压缩。

更进一步地，本申请中装置还包括：

原始音视频获取模块，用于获取终端设备录制的原始音视频。

原始音视频处理模块，用于将所述原始音视频进行音频视频分类存储，生成所述待压缩音视频。

更详细地，相似帧删除模块303，包括：

差异值计算单元，用于对所述视频段中的视频图片间进行图片差异值比对。

相似帧图片判断单元，用于将所述图片差异值与预设差异值比对，判断是否存在相似帧图片。

相似帧图片删除单元，用于若存在相似帧图片，则依据预设规则删除所述相似帧图片。

其中差异值计算单元具体用于：依设定标准选取所述视频段中设定数目帧的视频图片，作为初始图片；对所述初始图片进行图像识别；依据图像识别结果计算所述初始图片间的图片差异值。其中，依设定标准选取所述视频段中设定数目帧的视频图片，作为初始图片具体包括：在所述视频段的首帧视频图片开始依次选取设定数目帧所述视频图片，作为所述初始图片；或者，若所述图片差异值小于所述预设差异值，从所述视频段的剩余帧图片中选取一帧视频图片，并与上一轮图片差异值计算过程中存留视频图片构建所述初始图片；所述存留视频图片为所述初始图片中删除所述相似帧图片后的视频图片；或者，若所述图片差异值大于或等于所述预设差异值，从所述视频段中的剩余帧图片中选取一帧视频图片作为所述初始图片。

相似帧图片判断单元具体用于：判断所述图片差异值是否小于预设差异值；若小于所述预设差异值，确定所述初始图片中存在相似帧图片；若大于或等于所述预设差异值，确定所述初始图片中不存在相似帧图片。

上述装置中利用分段切片将待压缩视频分为多个视频段，然后分别对每一个视频段中所有帧视频图片进行相似帧的删除，最后得到最精简的视频，最后将视频和音频进行合成及压缩，以此极大地降低了音视频压缩文件的空间，同时利用预设切片时间间隔进行视频段的划分，提高了视频段分段的精确度，同时利用差异值控制相似帧图片的删除，以此提高了相似帧图片的删除准确度。

为了更清楚地介绍实现本发明实施例的硬件系统，对应于本发明实施例提供的一种音视频压缩方法，本发明实施例还提供一种音视频压缩设备及系统。请参见下文实施例。

图4是本发明一实施例提供的音视频压缩设备的结构图。参见图4，一种音视频压缩设备，包括：

处理器401，以及与所述处理器401相连接的存储器402；

所述存储器402用于存储计算机程序，所述计算机程序至少用于执行上述所述的音视频压缩方法；所述处理器401用于调用并执行所述存储器402中的所述计算机程序。

同时，图5是本发明一实施例提供的音视频压缩系统的结构图。参见图5，一种音视频压缩系统，包括：

终端设备501，及与所述终端设备501通信连接的如上述所述的音视频压缩设备502。

在此基础上，本申请中还公开一种存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时，实现如上述所述的空调机组的保护控制方法中各个步骤。

采用上述设备及系统在音视频进行压缩前，将视频中的相似帧图片进行删除，以此降低音视频压缩文件的空间大小，同时在进行相似帧图片删除的过程中对视频进行分段处理，在分段过程中利用时间间隔分段，以此提高了视频帧分段的精确度，同时利用视频图片的图片差异值决定删除视频段中的哪帧图片，以此提高了相似帧图片删除的准确度，进而确保在压缩时视频中不会存在大量相似的视频图片，降低了压缩文件的大小。

可以理解的是，上述各实施例中相同或相似部分可以相互参考，在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。

需要说明的是，在本发明的描述中，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本发明的描述中，除非另有说明，“多个”的含义是指至少两个。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列（PGA），现场可编程门阵列（FPGA）等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种音视频压缩方法，其特征在于，包括：

将所述合成音视频进行压缩。

2.根据权利要求1所述的方法，其特征在于，还包括：

获取终端设备录制的原始音视频；

3.根据权利要求1所述的方法，其特征在于，所述对所述视频段中的视频图片间进行图片差异值比对，包括：

对所述初始图片进行图像识别；

依据图像识别结果计算所述初始图片间的图片差异值。

4.根据权利要求3所述的方法，其特征在于，所述将所述图片差异值与预设差异值比对，判断是否存在相似帧图片，包括：

判断所述图片差异值是否小于预设差异值；

5.根据权利要求4所述的方法，其特征在于，所述依设定标准选取所述视频段中设定数目帧的视频图片，作为初始图片，包括：

6.根据权利要求3所述的方法，其特征在于，所述设定数目帧为两帧。

7.一种音视频压缩装置，其特征在于，包括：

压缩模块，用于将所述合成音视频进行压缩。

8.一种音视频压缩设备，其特征在于，包括：

处理器，以及与所述处理器相连接的存储器；

所述存储器用于存储计算机程序，所述计算机程序至少用于执行权利要求1-6任一项所述的音视频压缩方法；

9.一种音视频压缩系统，其特征在于，包括：

终端设备，及与所述终端设备通信连接的如权利要求8所述的音视频压缩设备。

10.一种存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时，实现如权利要求1-6任一项所述的音视频压缩方法中各个步骤。