CN112735452A - 实现超低编码速率的编码方法、装置、存储介质及设备 - Google Patents
实现超低编码速率的编码方法、装置、存储介质及设备 Download PDFInfo
- Publication number
- CN112735452A CN112735452A CN202011621138.5A CN202011621138A CN112735452A CN 112735452 A CN112735452 A CN 112735452A CN 202011621138 A CN202011621138 A CN 202011621138A CN 112735452 A CN112735452 A CN 112735452A
- Authority
- CN
- China
- Prior art keywords
- audio frame
- coding rate
- zero
- rate
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000003595 spectral effect Effects 0.000 claims abstract description 37
- 238000005070 sampling Methods 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000004891 communication Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 239000002699 waste material Substances 0.000 description 2
- 101150036464 aptx gene Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本申请公开了一种实现超低编码速率的编码方法、装置、存储介质及设备,属于音频编码技术领域。该方法包括根据各个音频帧的音频数据,分别确定包含当前音频帧的连续N帧音频帧中各个音频帧对应的全零标志,其中,N为不小于2的自然数;根据各个音频帧对应的全零标志,确定当前音频帧的编码码率,其中若全零标志均为第一数值,则将当前音频帧的第一编码码率设置为超低码率;若全零标志中存在一者为第二数值,则根据当前音频帧的谱系数,确定当前音频帧的第二编码码率,其中第二编码码率包括超低码率和默认码率;根据第一编码码率或第二编码码率对当前音频帧进行编码。本申请降低了语音通话时的编码速率,提高了编码效率,节省了空中带宽。
Description
技术领域
本申请涉及音频编码技术领域,特别涉及一种实现超低编码速率的编码方法、装置、存储介质及设备。
背景技术
目前主流的蓝牙音频编解码器包括:SBC音频编解码器,其由A2DP协议强制要求,且音质一般;AAC-LC音频编解码器,其音质较好且应用较为广泛,但由于蓝牙设备一般电池容量有限,处理器运算能力较差且内存有限,且专利费较高,限制了它的使用;aptX系列音频编解码器,其音质较好,但码率很高,且为高通独有的技术,较为封闭;LDAC音频编解码器,其音质较好,但码率也很高,且为索尼独有的技术,也很封闭;LHDC音频编解码器,其码率也很高,并且对蓝牙的基带/射频设计有很高的要求。基于上述原因,蓝牙国际联盟Bluetooth Sig联合众多厂商推出了LC3音频编解码器,其具有较低延迟、较高音质和编码增益以及在蓝牙领域无专利费的优点,受到广大厂商的关注。
为了节省码率,如3GPP和3GPP2中的声码器,都采用了非常复杂的话音激活检测和码率判决算法,虽然可以极大限度的节省码率,但资源消耗都比较大,如代码空间、数据空间以及运算资源。这些方法对于面向低功耗蓝牙平台都不适用,因为低功耗蓝牙平台存储空间和运算能力都较为有限。
本申请主要解决的问题是针对目前符合标准规范的LC3编码器编码效率不高的问题,特别是上述的编码比特浪费的问题,通过码率控制算法,实现比标准规范规定的码率更低的码率,在确保编解码效果不变的前提下有效的降低编码速率。
发明内容
本申请主要提供一种实现超低编码速率的编码方法、装置、存储介质及设备,以解决编码器编码比特浪费,编码效率不高的问题。
为了解决上述问题,本申请采用的一个技术方案是:提供一种实现超低编码速率的编码方法,其包括:根据各个音频帧的音频数据,分别确定包含当前音频帧的连续N帧音频帧中各个音频帧对应的全零标志,其中,N为不小于2的自然数;根据各个音频帧对应的全零标志,确定当前音频帧的编码码率,其中若全零标志均为第一数值,则将当前音频帧的第一编码码率设置为超低码率;若全零标志中至少存在一者为第二数值,则根据当前音频帧的谱系数,确定当前音频帧的第二编码码率,其中第二编码码率包括超低码率和默认码率;根据第一编码码率或第二编码码率对当前音频帧进行编码。
本申请采用的另一个技术方案是:提供一种实现超低编码速率的编码装置,其包括:全零标志计算模块,其用于根据各个音频帧的音频数据,分别确定包含当前音频帧的连续N帧音频帧中各个音频帧对应的全零标志,其中,N为不小于2的自然数;码率确定模块,其用于根据各个音频帧对应的全零标志,确定当前音频帧的编码码率,其中若全零标志均为第一数值,则将当前音频帧的第一编码码率设置为超低码率;若全零标志中至少存在一者为第二数值,则根据当前音频帧的谱系数,确定当前音频帧的第二编码码率,其中第二编码码率包括超低码率和默认码率;编码模块,其用于根据第一编码码率或第二编码码率对当前音频帧进行编码。
本申请采用的另一个技术方案是:提供一种计算机可读存储介质,其存储有计算机指令,该计算机指令被操作以执行方案一中的实现超低编码速率的编码方法。
本申请采用的另一个技术方案是:提供一种蓝牙设备,蓝牙设备对音频数据进行编解码时,采用方案一中的实现超低编码速率的编码方法。
本申请采用的另一个技术方案是:提供一种计算机设备,其包括处理器和存储器,存储器存储有计算机指令,该计算机指令被操作以执行方案一中的实现超低编码速率的编码方法。
本申请的技术方案可以达到的有益效果是:本申请设计了实现超低编码速率的编码方法、装置、存储介质及设备。该方法通过计算并判断连续N帧音频帧的全零标志来控制当前音频帧的编码码率,降低了语音通话时的编码速率,提高了编码效率,从而节省了空中带宽。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一种实现超低编码速率的编码方法的一个具体实施方式的示意图;
图2是本申请一种实现超低编码速率的编码方法的编码过程的示意图;
图3是本申请一种实现超低编码速率的编码方法的一个具体实例的示意图;
图4是本申请一种实现超低编码速率的编码方法的另一个具体实例的示意图;
图5是本申请一种实现超低编码速率的编码装置的另一个具体实例的示意图;
图6是本申请一种实现超低编码速率的编码装置的一个具体实施方式的示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
下面结合附图对本申请的较佳实施例进行详细阐述,以使本申请的优点和特征能更易于被本领域技术人员理解,从而对本申请的保护范围做出更为清楚明确的界定。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
在现有技术中,由于目前市场主流的音频编解码器的编码码率较高,稳定支持高码率的环境复杂且困难,技术较为封闭且专利费较高等一系列的原因,蓝牙国际联盟Bluetooth Sig联合众多厂商推出了LC3音频编解码器,主要面向低功耗蓝牙,其具有较低延迟、较高音质和编码增益以及在蓝牙领域无专利费的优点,受到广大厂商的关注。但是LC3音频编解码器较高的码率占用了较大的带宽,需要更多的发射功率,在公共场合,蓝牙设备较多,相互之间会造成干扰,影响了用户体验,相互干扰的程度与占用的带宽、发射功率有很大关系。目前标准规范的LC3音频编解码器使用固定码率编码,即开始编码后每一音频帧音频数据都是使用相同的比特数进行编码,这就导致当前音频帧为非音频帧编码时仍然使用相同的码率,造成了编码比特的浪费,降低了编码速率。
本申请的发明构思是:通过计算并判断连续N帧音频帧的全零标志来控制当前音频帧的编码码率。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图1示出了本申请一种实现超低编码速率的编码方法的一个具体实施方式。
在图1所示的具体实施方式中,实现超低编码速率的编码方法主要包括步骤S101,根据各个音频帧的音频数据,分别确定包含当前音频帧的连续N帧音频帧中各个音频帧对应的全零标志,其中,N为不小于2的自然数。
在本申请的一个具体实施例中,根据各个音频帧的音频数据,确定包含当前音频帧的连续N帧音频帧中各个音频帧对应的全零标志,包括,在音频数据进行编码前,对连续N帧音频帧中对应的全零标志进行初始化;依次对各个音频帧的音频数据进行判断,分别确定各个音频帧对应的全零标志;在对下一音频帧的音频数据进行判断前,对上一音频帧全零标志进行更新,并对当前音频帧全零标志进行初始化。
在该具体实施例中,在对输入的连续N帧音频数据开始编码前,将对应的N个全零标志进行初始化,防止后续对全零标志的调用不会出现异常;依次对连续N帧中每一帧的音频数据进行判断,依次分别确定连续N帧对应的全零标志,使得全零标志的计算过程更加有条理。
在本申请的一个具体实施例中,对上一音频帧全零标志进行更新,包括,将当前音频帧全零标志中的值存储到上一音频帧全零标志,完成对上一音频帧全零标志的更新。
在本申请的一个具体实例中,当N取值为2时,即存在当前音频帧和上一音频帧,针对当前音频帧和上一音频帧的全零标志分别设置两个变量,即上一音频帧的全零标志变量all_zero_last;当前音频帧的全零标志变量all_zero_current。将两个变量进行初始化之后,假设当前的连续两帧音频帧为第一帧和第二帧,那么在当前音频帧的全零标志变量中存储着第二帧的全零标志,在上一音频帧的全零标志变量存储着第一帧的全零标志。当第三帧的音频数据需要进行计算其全零标志时,那么需要将第二帧的全零标志的值存储到上一音频帧的全零标志变量中,当前音频帧的全零标志变量重新进行初始化后,然后进行第三帧的全零标志的计算,将计算出的第三帧的全零标志的值存储到当前音频帧的全零标志变量中。当前的连续两帧音频帧就变成第二帧和第三帧,这样在第三帧来临时,就完成了对上一音频帧全零标志的更新。
在本申请的一个具体实例中,当N取值为3时,即存在当前音频帧、上一音频帧以及上上一帧,针对当前音频帧、上一音频帧以及上上一音频帧的全零标志分别设置三个变量,即上上一音频帧的全零标志变量all_zero_last_last;上一音频帧的全零标志变量all_zero_last;当前音频帧的全零标志变量all_zero_current。将三个变量进行初始化之后,假设当前的连续三帧音频帧为第一帧、第二帧以及第三帧,那么当前音频帧的全零标志变量存储第三帧的全零标志的值,上一音频帧的全零标志变量存储第二帧的全零标志的值,上上一音频帧的全零标志变量存储第一帧的全零标志的值。当第四帧的音频数据输入并且计算其全零标志时,那么需要将第三帧的全零标志的值存储到上一音频帧的全零标志变量中,第二帧的全零标志的值存储到上上一音频帧的全零标志变量中,当前音频帧的全零标志变量重新进行初始化后,然后进行第四帧的全零标志的计算,将计算出的第四帧的全零标志的值存储到当前音频帧的全零标志变量中。当前的连续三帧音频就变成第二帧、第三帧和第四帧,这样在第四帧来临时,就完成了对上一音频帧全零标志和上上一音频帧全零标志的更新。
优选的,N取值为2是最佳的。LC3音频编码器在编码时,虽然每次编码一帧,但其使用了上一帧的部分数据,举例来说,LC3音频编码器在配置为48kHz采样率、10ms帧长时,每帧有480个采样点数据,当编码第N帧时,其使用的数据分为3个部分:第一部分:第N-1帧的7.5ms数据,即360点;第二部分:和第N帧的10ms数据,即480点;第三部分:120个0;总共960个数据用来编码。所以,选取连续两帧的含义是如果连续两帧的采样点数据为全0,譬如第N-1帧和第N帧的采样点数据为全0,则LC3音频编码器在编码第N帧时,其输入的采样点数据数据为960个0,在此种情形下,使用超低码率不会影响编码解码后的语音质量。
在本申请的一个具体实施例中,依次对各个音频帧的音频数据进行判断,分别确定各个音频帧对应的全零标志,包括,依次对各个音频帧中每一音频帧音频数据中每个采样点是否存在非零值进行判断,若每一音频帧音频数据中每个采样点均不存在非零值,则对应音频帧的全零标志设置为第一数值;否则对应音频帧的全零标志设置为第二数值。这样使得对全零标志的设置更加准确。
例如,第一数值可以设置为0,第二数值可以设置为1。
在图1所示的具体实施方式中,实现超低编码速率的编码方法,还包括步骤S102,根据各个音频帧对应的全零标志,确定当前音频帧的编码码率,其中若全零标志均为第一数值,则将当前音频帧的第一编码码率设置为超低码率;若全零标志中至少存在一者为第二数值,则根据当前音频帧的谱系数,确定当前音频帧的第二编码码率,其中第二编码码率包括超低码率和默认码率。
在该具体实施方式中,根据各个音频帧对应的全零标志,确定当前音频帧的编码码率,包括,若全零标志均为第一数值,则将当前音频帧的第一编码码率设置为超低码率;若全零标志中至少存在一者为第二数值,则对经低延迟改进型离散余弦变换后输出的当前音频帧音频数据的所有谱系数逐一进行判断,以方便对当前音频帧的第二编码码率的确定。
在本申请的一个具体实施例中,根据当前音频帧的谱系数,确定当前音频帧的第二编码码率,其中第二编码码率包括超低码率和默认码率的过程还包括,当谱系数中不存在非零值时,将第二编码码率确定为超低码率;当谱系数中存在非零值时,将第二编码码率确定为默认码率。
在该具体实施例中,若当前音频帧音频数据的所有谱系数均不存在非零值,则将当前音频帧音频数据的第二编码码率确定为超低码率;若当前音频帧音频数据的所有谱系数中至少存在一者为非零值,则将当前音频帧音频数据的第二编码码率确定为默认码率。这样方便了后续对音频数据具体的编码码率的使用,有效的降低了编码速率。
在如图2所示的在编码过程的示意图中,码率控制1模块用于执行对各个音频帧对应的全零标志进行判断,从而确定当前音频帧的第一编码码率;码率控制2模块,其根据各个音频帧对应的全零标志的判断结果,对当前音频帧的谱系数进行判断,从而确定当前音频帧的第二编码码率。由于码率控制1模块与码率控制2模块的位置不相邻,为了便于对编码过程进行控制,提出超低码率标志的概念,在此,超低码率标志可用于方便确认是否需要对低延迟改进型离散余弦变换输出的谱系数中是否存在非零值进行判断,首先需要将超低码率标志进行初始化,其初始化值可以为0,方便了后续对超低码率标志的调用。
图3是本申请一种实现超低编码速率的编码方法的一个具体实例的示意图。
作为图1所示的具体实施方式的一个实例,取N=2,其中,图3所示的实例对应图2中的码率控制1模块。该实例中的处理步骤如下:
在该具体实例中,当N取值为2时,需要对连续两帧音频帧的全零标志进行判断,其中连续两帧音频帧包括当前音频帧和上一音频帧。首先在编码过程中,将超低码率标志设置为0。然后计算当前音频帧的全零标志,例如,当编码器的配置为16kHz的采样率,10ms帧长时,在对每一帧的采样点数据进行判断时,每一帧的采样点数据的数据长度都是相同的,根据相同的数据长度,对当前音频帧中的音频数据中的采样点数据一一进行判断,当采样点数据全部为0时,代表当前音频帧为静音帧,即当前音频帧中的音频数据中不存在有效的采样点数据,对当前音频帧的全零标志设置为第一数值,例如第一数值可以为0;当采样点数据中有一个采样点数据不为0时,那么代表当前音频帧为语音帧,即当前音频帧中的音频数据中存在有效的采样点数据,对当前音频帧的全零标志设置为第二数值,例如第二数值可以为1。将当前音频帧的全零标志计算出来之后,结合上一音频帧的历史全零标志,对这连续两帧音频帧的全零标志是否全为0进行判断,若连续两帧音频帧的全零标志全为0,则确认当前音频帧是静音帧,则将当前音频帧的第一编码码率设置为超低码率,并将超低码率标志设置为1,代表确定对当前音频帧使用超低码率进行编码;若连续两帧音频帧的全零标志不全为0,则可以认为当前音频帧不是静音帧,则可以将当前音频帧的编码码率预先设置为默认码率。当前音频帧的第二编码码率的确定需要在如图2所示的码率控制2模块中根据当前音频帧的谱系数进行确定。
图4是本申请一种实现超低编码速率的编码方法的另一个具体实例的示意图。
作为图1所示的具体实施方式的一个实例中,其中,图4所示的实例对应图2中的码率控制2模块,在该实例中,需要根据对超低码率标志的判断,来确认是否需要对当前音频帧的谱系数中是否存在非零值进行判断。其处理步骤如下:
在图4所示的具体实例中,对超低码率标志进行判断,若超低码率标志为1,则不需要对当前音频帧的谱系数进行判断,这就代表当前音频帧的第一编码码率确定为超低码率;若超低码率标志为0,则需要将经低延迟改进型离散余弦变换后输出的当前音频帧的谱系数进行判断,若当前音频帧所有的谱系数均为0,则将当前音频帧的第二编码码率确定为超低码率,这就代表当前音频帧为静音帧,;若当前音频帧所有的谱系数存在不为0的值,则对当前音频帧的第二编码码率确定为默认码率,这就代表当前音频帧为语音帧。
在该具体实例中,连续两帧音频数据的全零标志非全为0时,此时当前音频帧的所有谱系数有可能为0,可能的原因有两个,其一为当前音频帧音频数据中有很小的值,在谱系数的定点运算中,由于精度有限,得出的谱系数有可能为0;其二为对于48kHz采样率、10ms帧长的情况,每帧有480个采样点数据,低延迟改进型离散余弦变换在对当前音频帧的谱系数进行计算时,使用了上一音频帧的360个采样点,虽然上一音频帧的480个采样点不为全0,但对当前音频帧编码时采用的上一音频帧的360个采样点有可能为全0。
例如,当连续两帧音频数据的全零标志为1、0,0、1或1、1时,当前音频帧音频数据的编码码率虽然预先设定为默认码率,但是由于其谱系数可能均为0,所以需要对预先设定的默认码率进行进一步的确定。若其谱系数均为0,则将当前音频帧音频数据的第二编码码率确定为超低码率;若其谱系数不全为0,则将当前音频帧音频数据的第二编码码率确定为预先设定的默认码率。
图5是本申请一种实现超低编码速率的编码方法的另一个具体实例的示意图。
作为图1所示的具体实施方式的一个实例,取N=3,其中,图5所示的实例对应图2中的码率控制1模块。该实例中的处理步骤如下:
在该具体实例中,当N取值为3时,需要对连续三帧音频帧的全零标志进行判断,其中连续三帧音频帧包括当前音频帧、上一音频帧以及上上一音频帧。首先在编码过程中,将超低码率标志设置为0,此为超低码率标志初始化操作。将当前音频帧的全零标志计算并输出之后,结合上一音频帧的历史全零标志和上上一音频帧的历史全零标志,对这连续三帧音频帧的全零标志是否全为0进行判断,此操作可以做出编码码率设置的决策。当这连续三帧音频帧的全零标志全为0时,则可以将当前音频帧的第一编码码率设置为超低码率,并且将超低码率标志设置为1,方便后续对超低码率标志的调用和判断;当这连续三帧音频帧的全零标志不全为0时,则可以将当前音频帧的第二编码码率设置为默认码率。
在该具体实施方式的其他实例中,例如,取N=4或N=5,需要做与N=2或N=3的实例类似的相应替换,此处不再赘述。
在图1所示的具体实施方式中,实现超低编码速率的编码方法,还包括步骤S103,根据第一编码码率或第二编码码率对当前音频帧进行编码。
在该具体实施方式中,使用第一编码码率或第二编码码率对当前音频帧进行编码,在确保编解码效果不变的前提下有效的降低了编码速率,提高了编码效率,从而节省了空中带宽。
图6示出了本申请一种实现超低编码速率的编码装置的具体实施方式。
在图6所示的具体实施方式中,实现超低编码速率的编码装置包括:模块601,全零标志计算模块,其用于根据各个音频帧的音频数据,分别确定包含当前音频帧的连续N帧音频帧中各个音频帧对应的全零标志,其中,N为不小于2的自然数。
在图6所示的具体实施方式中,实现超低编码速率的编码装置包括:模块602,码率确定模块,其用于根据各个音频帧对应的全零标志,确定当前音频帧的编码码率,若全零标志均为第一数值,则将当前音频帧的第一编码码率设置为超低码率;若全零标志中至少存在一者为第二数值,则根据当前音频帧的谱系数,确定当前音频帧的第二编码码率,其中第二编码码率包括超低码率和默认码率。
在图6所示的具体实施方式中,实现超低编码速率的编码装置包括:模块603,编码模块,其用于根据第一编码码率或第二编码码率对当前音频帧进行编码。
在本申请的一个具体实施例中,在码率确定模块中,根据当前音频帧的谱系数,确定当前音频帧的第二编码码率时,当谱系数中不存在非零值时,将第二编码码率确定为超低码率;当谱系数中的非零值存在时,将第二编码码率确定为默认码率。这样方便了后续对音频数据具体的编码码率的使用,有效的降低了编码速率。
本申请提供的实现超低编码速率的编码装置,可用于执行上述任一实施例描述的实现超低编码速率的编码方法,其实现原理和技术效果类似,在此不再赘述。
在本申请的一个具体实施例中,本申请的一种实现超低编码速率的编码装置中的各功能模块可直接在硬件中、在由处理器执行的软件模块中或在两者的组合中。
软件模块可驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可装卸盘、CD-ROM或此项技术中已知的任何其它形式的存储介质中。示范性存储介质耦合到处理器,使得处理器可从存储介质读取信息和向存储介质写入信息。
处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)、现场可编程门阵列(英文:Field Programmable Gate Array,简称:FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其任何组合等。通用处理器可以是微处理器,但在替代方案中,处理器可以是任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器或任何其它此类配置。在替代方案中,存储介质可与处理器成一体式。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替代方案中,处理器和存储介质可作为离散组件驻留在用户终端中。
在本申请的另一个具体实施方式中,一种计算机可读存储介质,其存储有计算机指令,计算机指令被操作以执行方案一中的实现超低编码速率的编码方法。
在本申请的另一个具体实施方式中,一种蓝牙设备,蓝牙设备对音频数据进行编解码时,采用方案一中的实现超低编码速率的编码方法。
在本申请的另一个具体实施方式中,一种计算机设备,其包括处理器和存储器,存储器存储有计算机指令,该计算机指令被操作以执行方案一中的实现超低编码速率的编码方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上描述仅为本申请的实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种实现超低编码速率的编码方法,其特征在于,包括:
根据各个音频帧的音频数据,分别确定包含当前音频帧的连续N帧音频帧中所述各个音频帧对应的全零标志,其中,N为不小于2的自然数;
根据所述各个音频帧对应的所述全零标志,确定所述当前音频帧的编码码率,其中
若所述全零标志均为第一数值,则将所述当前音频帧的第一编码码率设置为超低码率;
若所述全零标志中至少存在一者为第二数值,则根据所述当前音频帧的谱系数,确定所述当前音频帧的第二编码码率,其中所述第二编码码率包括所述超低码率和默认码率;
根据所述第一编码码率或所述第二编码码率对所述当前音频帧进行编码。
2.如权利要求1所述的实现超低编码速率的编码方法,其特征在于,所述根据所述当前音频帧的谱系数,确定所述当前音频帧的第二编码码率,其中所述第二编码码率包括所述超低码率和默认码率,包括:
当所述谱系数中不存在非零值时,将所述第二编码码率确定为所述超低码率;
当所述谱系数中存在非零值时,将所述第二编码码率确定为所述默认码率。
3.如权利要求1所述的实现超低编码速率的编码方法,其特征在于,所述根据各个音频帧的音频数据,确定包含当前音频帧的连续N帧音频帧中所述各个音频帧对应的全零标志,包括:
在所述音频数据进行编码前,对所述连续N帧音频帧中对应的所述全零标志进行初始化;
依次对所述各个音频帧的音频数据进行判断,分别确定所述各个音频帧对应的所述全零标志;
在对下一音频帧的音频数据进行判断前,对上一音频帧全零标志进行更新,并对当前音频帧全零标志进行初始化。
4.如权利要求3所述的实现超低编码速率的编码方法,其特征在于,所述依次对所述各个音频帧的音频数据进行判断,分别确定所述各个音频帧对应的所述全零标志,包括:
依次对所述各个音频帧中每一音频帧音频数据中每个采样点是否存在非零值进行判断,
若所述每一音频帧音频数据中每个采样点均不存在非零值,则对应音频帧的全零标志设置为所述第一数值;否则所述对应音频帧的全零标志设置为所述第二数值。
5.如权利要求3所述的实现超低编码速率的编码方法,其特征在于,所述对上一音频帧全零标志进行更新,包括:
将所述当前音频帧全零标志的值存储到所述上一音频帧全零标志中,完成对所述上一音频帧全零标志的更新。
6.一种实现超低编码速率的编码装置,其特征在于,包括:
全零标志计算模块,其用于根据各个音频帧的音频数据,分别确定包含当前音频帧的连续N帧音频帧中所述各个音频帧对应的全零标志,其中,N为不小于2的自然数;
码率确定模块,其用于根据所述各个音频帧对应的所述全零标志,确定所述当前音频帧的编码码率,其中
若所述全零标志均为第一数值,则将所述当前音频帧的第一编码码率设置为超低码率;
若所述全零标志中至少存在一者为第二数值,则根据所述当前音频帧的谱系数,确定所述当前音频帧的第二编码码率,其中所述第二编码码率包括所述超低码率和默认码率;编码模块,其用于根据所述第一编码码率或所述第二编码码率对所述当前音频帧进行编码。
7.如权利要求6所述的实现超低编码速率的编码装置,其特征在于,在所述码率确定模块中,根据所述当前音频帧的谱系数,确定所述当前音频帧的第二编码码率时,
当所述谱系数中不存在非零值时,将所述第二编码码率确定为所述超低码率;
当所述谱系数中存在非零值时,将所述第二编码码率确定为所述默认码率。
8.一种计算机可读存储介质,其存储有计算机指令,其特征在于,所述计算机指令被操作以执行权利要求1-5中任一项所述的实现超低编码速率的编码方法。
9.一种蓝牙设备,其特征在于,所述蓝牙设备对音频数据进行编解码时,采用如权利要求1-5任一项所述的实现超低编码速率的编码方法。
10.一种计算机设备,其包括处理器和存储器,所述存储器存储有计算机指令,其中所述处理器操作所述计算机指令以执行权利要求1-5中任一项所述的实现超低编码速率的编码方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011621138.5A CN112735452B (zh) | 2020-12-31 | 2020-12-31 | 实现超低编码速率的编码方法、装置、存储介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011621138.5A CN112735452B (zh) | 2020-12-31 | 2020-12-31 | 实现超低编码速率的编码方法、装置、存储介质及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112735452A true CN112735452A (zh) | 2021-04-30 |
CN112735452B CN112735452B (zh) | 2023-03-21 |
Family
ID=75608004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011621138.5A Active CN112735452B (zh) | 2020-12-31 | 2020-12-31 | 实现超低编码速率的编码方法、装置、存储介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112735452B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101046964A (zh) * | 2007-04-13 | 2007-10-03 | 清华大学 | 基于重叠变换压缩编码的错误隐藏帧重建方法 |
JP2011090311A (ja) * | 2010-11-08 | 2011-05-06 | Qualcomm Inc | 閉ループのマルチモードの混合領域の線形予測音声コーダ |
CN102177543A (zh) * | 2008-10-08 | 2011-09-07 | 弗朗霍夫应用科学研究促进协会 | 音频解码器、音频编码器、用于解码音频信号的方法、用于编码音频信号的方法、计算机程序及音频信号 |
CN102724513A (zh) * | 2012-07-12 | 2012-10-10 | 杭州海康威视数字技术股份有限公司 | 有实时码率控制的媒体流编码方法及其系统 |
CN111583942A (zh) * | 2020-05-26 | 2020-08-25 | 腾讯科技(深圳)有限公司 | 语音会话的编码码率控制方法、装置和计算机设备 |
CN111681663A (zh) * | 2020-07-24 | 2020-09-18 | 北京百瑞互联技术有限公司 | 一种降低音频编码运算量的方法、系统、存储介质及设备 |
CN111681664A (zh) * | 2020-07-24 | 2020-09-18 | 北京百瑞互联技术有限公司 | 一种降低音频编码码率的方法、系统、存储介质及设备 |
-
2020
- 2020-12-31 CN CN202011621138.5A patent/CN112735452B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101046964A (zh) * | 2007-04-13 | 2007-10-03 | 清华大学 | 基于重叠变换压缩编码的错误隐藏帧重建方法 |
CN102177543A (zh) * | 2008-10-08 | 2011-09-07 | 弗朗霍夫应用科学研究促进协会 | 音频解码器、音频编码器、用于解码音频信号的方法、用于编码音频信号的方法、计算机程序及音频信号 |
JP2011090311A (ja) * | 2010-11-08 | 2011-05-06 | Qualcomm Inc | 閉ループのマルチモードの混合領域の線形予測音声コーダ |
CN102724513A (zh) * | 2012-07-12 | 2012-10-10 | 杭州海康威视数字技术股份有限公司 | 有实时码率控制的媒体流编码方法及其系统 |
CN111583942A (zh) * | 2020-05-26 | 2020-08-25 | 腾讯科技(深圳)有限公司 | 语音会话的编码码率控制方法、装置和计算机设备 |
CN111681663A (zh) * | 2020-07-24 | 2020-09-18 | 北京百瑞互联技术有限公司 | 一种降低音频编码运算量的方法、系统、存储介质及设备 |
CN111681664A (zh) * | 2020-07-24 | 2020-09-18 | 北京百瑞互联技术有限公司 | 一种降低音频编码码率的方法、系统、存储介质及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112735452B (zh) | 2023-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5606433B2 (ja) | オーディオエンコーダ及びオーディオデコーダ | |
JP5149217B2 (ja) | 望ましくないパケット生成を減少する方法および装置 | |
CN105210149A (zh) | 用于音频信号解码或编码的时域电平调整 | |
KR101770237B1 (ko) | 오디오 데이터 처리 방법, 장치 및 시스템 | |
CN111681663B (zh) | 一种降低音频编码运算量的方法、系统、存储介质及设备 | |
JPH10307599A (ja) | スプラインを使用する波形補間音声コーディング | |
WO2007063910A1 (ja) | スケーラブル符号化装置およびスケーラブル符号化方法 | |
CN111833891A (zh) | 一种lc3编解码系统、lc3编码器及其优化方法 | |
CN111681664A (zh) | 一种降低音频编码码率的方法、系统、存储介质及设备 | |
JP4551817B2 (ja) | ノイズレベル推定方法及びその装置 | |
CN112669860B (zh) | 一种增加lc3音频编解码有效带宽的方法及装置 | |
CN114863942A (zh) | 音质转换的模型训练方法、提升语音音质的方法及装置 | |
CN112735452B (zh) | 实现超低编码速率的编码方法、装置、存储介质及设备 | |
CN114999503B (zh) | 一种基于生成对抗网络的全带宽谱系数生成方法及系统 | |
US7738361B2 (en) | Method and apparatus for generating fill frames for voice over internet protocol (VoIP) applications | |
CN101377926B (zh) | 加速量化循环程序功能的音频编码方法 | |
CN112509591B (zh) | 一种音频编解码方法及系统 | |
CN1780326A (zh) | 通话音量自适应调节方法 | |
CN111916090B (zh) | 一种lc3编码器近奈奎斯特频率信号检测方法、检测器、存储介质及设备 | |
CN118230746A (zh) | 增强音质的音频解码方法、装置、解码器、介质及设备 | |
CN114070470B (zh) | 编解码方法及装置 | |
CN117253499A (zh) | 支持多种延迟模式的音频编解码方法、系统、介质及设备 | |
CN116504256A (zh) | 一种语音编码方法、装置、介质、设备和程序产品 | |
CN115497488A (zh) | 一种语音滤波方法、装置、存储介质及设备 | |
JP2001265392A (ja) | 音声符号化装置及びその方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: A1009, floor 9, block a, No. 9, Shangdi Third Street, Haidian District, Beijing 100085 Patentee after: Beijing Bairui Internet Technology Co.,Ltd. Address before: 7-1-1, building C, 7 / F, building 2-1, No.2, Shangdi Information Road, Haidian District, Beijing 100085 Patentee before: BARROT WIRELESS Co.,Ltd. |