CN112289328A - 一种确定音频编码码率的方法及系统 - Google Patents
一种确定音频编码码率的方法及系统 Download PDFInfo
- Publication number
- CN112289328A CN112289328A CN202011176843.9A CN202011176843A CN112289328A CN 112289328 A CN112289328 A CN 112289328A CN 202011176843 A CN202011176843 A CN 202011176843A CN 112289328 A CN112289328 A CN 112289328A
- Authority
- CN
- China
- Prior art keywords
- autocorrelation value
- normalized autocorrelation
- rate
- determining
- audio frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 126
- 230000008569 process Effects 0.000 claims abstract description 62
- 230000007774 longterm Effects 0.000 claims abstract description 53
- 230000007704 transition Effects 0.000 claims description 35
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000001514 detection method Methods 0.000 claims description 11
- 230000005236 sound signal Effects 0.000 claims description 4
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 239000002699 waste material Substances 0.000 abstract description 10
- 230000000694 effects Effects 0.000 description 13
- 238000006243 chemical reaction Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000010606 normalization Methods 0.000 description 7
- 238000005070 sampling Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 101150036464 aptx gene Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本申请公开了一种确定音频编码码率的方法、系统、编码方法、存储介质及设备,属于音频编码技术领域。该确定音频编码码率的方法包括:在编码器的长期后置滤波器内获取当前音频帧的第一归一化自相关值;根据第一归一化自相关值确定当前音频帧对应的第一编码码率;获取当前音频帧的第二归一化自相关值;以及根据第二归一化自相关值对第一编码码率进行更新,并根据第一编码码率的更新结果,确定当前音频帧对应的编码码率。本申请根据当前音频帧的自相关特性确定对应的编码码率对当前音频帧进行编码,降低编码过程的编码码率,避免码率的浪费。
Description
技术领域
本申请涉及音频编码处理技术领域,特别是一种确定音频编码码率的方法、系统、编码方法、存储介质及设备。
背景技术
目前主流的蓝牙音频编解码器包括:SBC音频编解码器,其由A2DP协议强制要求,使用最为广泛;AAC-LC音频编解码器,其音质较好且应用较为广泛,很多主流的手机都支持;aptX系列音频编解码器,其音质较好,但码率很高,且为高通独有的技术,较为封闭;LDAC音频编解码器,其音质较好,但码率也很高,且为索尼独有的技术,也很封闭。基于上述原因,蓝牙国际联盟Bluetooth Sig联合众多厂商推出了LC3音频编解码器,其具有较低延迟、较高音质和编码增益以及在蓝牙领域无专利费的优点,受到广大厂商的关注。
LC3音频编码器与现有的CVSD音频编码器和WBS音频编码器相比,编码过程中,在相同采样率的情况下,降低了编码码码率,提升音质。LC3音频编码器基于波形编码技术,与传统声码器相比,压缩效率很低。例如,LC3在8KHz采样率时的推荐码率为24kbps,但应用于WCDMA的AMR-NB最大码率仅为12.2kbps,平均码率10kbps以下,应用于CDMA系统的EVRC-A最大码率为8kbps,平均码率约为5kbps,而3GPP Release12推出的应用于VoLTE的EVS,其最低码率为5.9kbps。LC3音频编码器较高的编码码率会占用较大的带宽,因此需要更大的发射功率。因此在公共场合蓝牙设备较多的环境下,设备之间容易造成干扰,影响用户的实用体验。
另外在进行音频编码时,音频的类型各种各样,若统一采用固定的编码码率进行编码,则会造成码率的浪费,例如,在语音通话的音频编码过程中,大约有35%的时间里通话音频有效,在进行语音对话。若进行通话时的空白音频帧仍然采用标准的固定编码码率进行编码,则会造成编码码率的浪费。
为了节省编码码率,避免不必要的码率浪费,在3GPP和3GPP2的声码器中采用复杂的话音激活检测和码率判决算法,该方法可以降低编码码率,但同时该方法运算复杂,会占用较大的运算资源,消耗较大。在低功耗蓝牙平台上,因为其功耗、存储空间及运算能力的限制,导致此种方法在低功耗蓝牙平台并不适用。
发明内容
针对现有技术中存在的LC3音频编码器中的编码码率较高,空中带宽占比较大,压缩效率低导致的设备之间存在较大干扰的问题,本申请提出一种确定音频编码码率的方法、系统、编码方法、存储介质及设备。
在本申请的一个技术方案中,提供一种确定音频编码码率的方法,包括:在编码器的长期后置滤波器内获取当前音频帧的第一归一化自相关值,第一归一化自相关值为经过长期后置滤波器内基音检测过程后的当前音频帧对应的粗略的归一化自相关值;根据第一归一化自相关值确定当前音频帧对应的第一编码码率;获取当前音频帧的第二归一化自相关值,第二归一化自相关值为经过长期后置滤波器内基音延迟计算过程后的当前音频帧对应的精确的归一化自相关值;以及根据第二归一化自相关值对第一编码码率进行更新,并根据第一编码码率的更新结果,确定当前音频帧对应的编码码率。
在本申请的另一个技术方案中,提供一种确定音频编码码率的系统,包括:用于在编码器的长期后置滤波器内获取当前音频帧的第一归一化自相关值,第一归一化自相关值为经过长期后置滤波器内基音检测过程后的当前音频帧对应的粗略的归一化自相关值的模块;用于根据第一归一化自相关值确定当前音频帧对应的第一编码码率的模块;用于获取当前音频帧的第二归一化自相关值,第二归一化自相关值为经过长期后置滤波器内基音延迟计算过程后的当前音频帧对应的精确的归一化自相关值的模块;以及用于根据第二归一化自相关值对第一编码码率进行更新,并根据第一编码码率的更新结果,确定当前音频帧对应的编码码率的模块。
在本申请的另一个技术方案中,提供一种LC3音频编码器编码方法,包括:在LC3音频编码器的长期后置滤波器内获取当前音频帧的第一归一化自相关值,第一归一化自相关值为经过长期后置滤波器内基音检测过程后的当前音频帧对应的粗略的归一化自相关值;根据第一归一化自相关值确定当前音频帧对应的第一编码码率;获取当前音频帧的第二归一化自相关值,第二归一化自相关值为经过长期后置滤波器内基音延迟计算过程后的当前音频帧对应的精确的归一化自相关值;根据第二归一化自相关值对第一编码码率进行更新,并根据第一编码码率的更新结果,确定当前音频帧对应的编码码率;以及在LC3音频编码器中,根据编码码率对当前音频进行编码。
在本申请的另一个技术方案中,提供一种计算机可读存储介质,其存储有计算机指令,其中计算机指令被操作以执行方案一中的确定音频编码码率的方法。
在本申请的另一个技术方案中,提供一种计算机设备,其包括处理器和存储器,存储器存储有计算机指令,其中,处理器操作计算机指令以执行方案一中的确定音频编码码率的方法。
本申请的有益效果是:本申请根据当前音频帧的自相关特性确定对应的编码码率对当前音频帧进行编码,降低编码过程的编码码率,避免码率的浪费。
附图说明
图1是本申请确定音频编码码率的方法的一个具体实施方式的流程示意图;
图2是本申请确定音频编码码率的方法中编码音频的一个具体实例示意图;
图3是本申请确定音频编码码率的方法中第一归一化自相关值的一个实例变化趋势图;
图4是本申请确定音频编码码率的方法的一个具体实例的流程示意图;
图5是本申请确定音频编码码率的方法的一个具体实例的流程示意图;
图6是本申请更新的LC3音频编码器的编码流程图;
图7是本申请更新的长期后置滤波器的工作流程示意图;
图8是本申请确定音频编码码率的方法的运用效果示意图;
图9是本申请确定音频编码码率的系统的组成示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
图1示出了本申请确定音频编码码率的方法的一个具体实施方式。
在图1所示的具体实施方式中,本申请的确定音频编码码率的方法包括:过程S101,在编码器的长期后置滤波器内获取当前音频帧的第一归一化自相关值,第一归一化自相关值为经过长期后置滤波器内基音检测过程后的当前音频帧对应的粗略的归一化自相关值;过程S102,根据第一归一化自相关值确定当前音频帧对应的第一编码码率;过程S103,获取当前音频帧的第二归一化自相关值,第二归一化自相关值为经过长期后置滤波器内基音延迟计算过程后的当前音频帧对应的精确的归一化自相关值;以及过程S104,根据第二归一化自相关值对第一编码码率进行更新,并根据第一编码码率的更新结果,确定当前音频帧对应的编码码率。
在该具体实施方式中,在音频编码器中的长期后置滤波器内,一方面完成标准规范要求的长期后置滤波器的相关参数的计算;另一方面,在长期后置滤波器内获取当前音频帧的第一归一化自相关值和第二归一化自相关值。其中,第一归一化自相关值为经过长期后置滤波器内基音检测过程后的当前音频帧对应的粗略的归一化自相关值,第二归一化自相关值为经过长期后置滤波器内基音延迟计算过程后的当前音频帧对应的精确的归一化自相关值,根据音频编码器的编码规范进行确定。其中,不同的音频帧对应不同的第一归一化自相关值和第二归一化自相关值,因此第一归一化自相关值和第二归一化自相关值在一定程度上反映了编码音频帧的性质。根据第一归一化自相关值和第二归一化自相关值确定当前音频帧的编码码率,使得对当前音频帧进行编码的过程中,使用合适的编码码率进行编码,避免高编码码率下的码率浪费;也避免编码码率不足时,导致的编码结果的音质较差,编码效果不佳的问题。
在图1所示的具体实施方式中,本申请的确定音频编码码率的方法包括:过程S101,在编码器的长期后置滤波器内获取当前音频帧的第一归一化自相关值,第一归一化自相关值为经过长期后置滤波器内基音检测过程后的当前音频帧对应的粗略的归一化自相关值。
在该具体实施方式中,在音频编码器中的长期后置滤波器内,一方面完成标准规范要求的长期后置滤波器的相关参数的计算;另一方面,在长期后置滤波器内获取当前音频帧的第一归一化自相关值。其中,第一归一化自相关值根据音频编码器的编码规范进行确定。其中,第一归一化自相关值为判断编码音频中基音是否存在的重要依据。在LC3音频编码器的长期后置滤波器中,在对音频进行编码过程中,可获得当前音频帧对应的第一归一化自相关值。
在图1所示的具体实施方式中,本申请确定音频编码码率的方法包括:过程S102,根据第一归一化自相关值确定当前音频帧对应的第一编码码率。
在该具体实施方式中,在音频编码器的长期后置滤波器中获取第一归一化自相关值。因为不同的编码音频对应不同的第一归一化自相关值,因此第一归一化自相关值在一定程度上反映了编码音频的性质。再根据第一归一化自相关值确定当前音频帧对应的编码码率,使得对当前音频帧进行编码的过程中,使用合适的编码码率进行编码,避免高编码码率下的码率浪费,也避免编码码率不足时,导致的编码音质较差,编码效果不佳的问题。
在本申请的一个具体实施例中,在根据第一归一化自相关值确定当前音频帧对应的编码码率的过程中,包括:当第一归一化自相关值大于第一门限时,确定编码码率为全码率;当第一归一化自相关值不大于第一门限且大于第二门限时,确定编码码率为中码率;以及当第一归一化自相关值不大于第二门限时,确定编码码率为最低码率。
在该具体实施例中,对第一归一化自相关值的大小进行判断。其中,当第一归一化自相关值大于第一门限时,表明当前音频帧中有较大概率是浊音,为了保证编码以及解码的音质效果,此时设置编码码率为全码率;当第一归一化自相关值不大于第一门限且大于第二门限时,表明此时的当前音频帧中有较大概率是过度音、清音或者噪声,为了避免对编码码率的浪费以及保证编码结果的音质效果,此时设置编码码率为中码率;当第一归一化自相关值不大于第二门限时,表明此时的编码音频帧中有较大概率是静音或者能量很小的噪声,为了避免对编码码率的浪费,此时设置编码码率为最低码率。
在图1所示的具体实施方式中,本申请确定音频编码码率的方法包括:过程S103,获取当前音频帧的第二归一化自相关值,第二归一化自相关值为经过长期后置滤波器内基音延迟计算过程后的当前音频帧对应的精确的归一化自相关值。
在该实施例中,在音频编码器的长期后置滤波器内基音延迟计算过程后,计算当前音频帧对应的精确的归一化自相关值作为第二归一化自相关值。通过第二归一化自相关值对编码码率进行确定,使得最终确定的编码码率更符合当前编码音频帧的编码需求,提高对编码音频帧的编码效果。
在图1所示的具体实施方式中,本申请确定音频编码码率的方法包括:过程S104,根据第二归一化自相关值对第一编码码率进行更新,并根据第一编码码率的更新结果,确定当前音频帧对应的编码码率。通过第二归一化自相关值对编码码率进行确定,使得最终确定的编码码率更符合当前编码音频帧的编码需求,提高对编码音频帧的编码效果。
在本申请的一个具体实施例中,根据第二归一化自相关值对第一编码码率进行更新的过程,包括:当第二归一化自相关值大于第三门限时,确定第一编码码率为超码率。
在该具体实施例中,在长期后置滤波器中,获取当前音频帧的第二归一化自相关值。其中,第二归一化自相关值为经过长期后置滤波器内基音延迟计算过程后的当前音频帧对应的精确的归一化自相关值。在获得第二归一化自相关值后,将第二归一化自相关值与第三门限进行比较。当第二归一化自相关值大于第三门限时,确定当前音频帧对应的编码码率为超码率。当第二归一化自相关值不大于第三门限时,根据第一归一化自相关值确定的全码率、中码率或者最低码率对当前音频帧进行编码。
在本申请的一个具体实施例中,第三门限、第一门限以及第二门限依次降低。
在本申请的一个实例中,在LC3音频编码器中,第三门限根据LC3音频编码器的标准规定进行确定,其在LC3音频编码器中的含义是长期后置滤波器使能的判决依据。其中,第三门限的取值可设置为0.9。第一门限根据LC3音频编码器的标准规定进行确定,用来指示检测到基音的较大的可能性,在本申请中,使用此门限作为码率判断的基准。其中,第一门限的取值可以为0.6。第二门限为本申请定义的门限,其指示说话人说话的可能性。其中,第二门限的取值可以为0.2,第三门限的取值可以为0.9。其中,在LC3音频编码器中,第三门限有LC3音频编解码器的标准规范规定,用来作为是否使能长期后置滤波器的重要判决依据。其中,关于具体的门限值的选择,可根据实际的音频编码的具体要求进行确定。
在本申请的一个具体实施例中,超码率、全码率、中码率以及最低码率对应的编码码率依次降低。
在本申请的一个实例中,在LC3音频编码器的长期后置滤波器内,根据第一归一化自相关值与第一门限或者第二门限的关系以及第二归一化自相关值与第三门限的关系确定出超码率、全码率、中码率以及最低码率。其中,超码率、全码率、中码率以及最低码率对应的编码码率值依次降低。例如,在采样率为16KHz,平均编码码率为46KHz的LC3音频编码器中,可设置超码率为68kbps、全码率为64kbps、中码率为40kbps以及最低码率为16kbps。
通过对音频编码器中的第一归一化自相关值与第一门限及第二门限的关系以及第二归一化自相关值与第三门限的关系确定出当前编码音频帧对应的编码码率。通过对不同的编码音频帧设置对应的超码率、全码率、中码率或者最低码率进行编码,避免对编码码率的浪费以及保证编码结果的音质效果。
图2示出了本申请确定音频编码码率的方法中编码音频的一个具体实例。
如图2所示,在该段编码音频中,编码音频数据在中间轴线处上下波动。在片段1处,其对应的编码音频具有较高的振幅,并且高振幅延续的时间较长;在片段2处,其对应的编码音频虽然就有高振幅,但其高振幅延续的时间较短;在片段3处,其对应的编码音频具有较低的振幅,同时延续的时间较短;在片段4处,其对应的编码音频为空白帧数据,对应现实情况中的静音帧数据。因此,针对如图2所示的编码音频中复杂的音频帧情况,如果均采用统一编码码率进行编码,则会造成编码码率的浪费,增加编解码器的功耗。
在本申请的一个实例中,根据第一归一化自相关值的大小与和第一门限和第二门限的关系,确定对应的全码率、中码率或者最低码率以及根据第二归一化自相关值与第三门限的关系确定超码率。
图3示出了本申请确定音频编码码率的方法中第一归一化自相关值的变化趋势图的一个实例。其中,图2与图3之间对应。由图3可知,随着图2中音频信号的变化,第一归一化自相关值也进行变化。其中,当人由静默开始说话时,通常语音中含有一定比例的浊音成分,由于浊音有较强的准周期特性,所以对应的第一归一化自相关值明显升高。当音频信号为空白或者为静音帧信号时,对应的第一归一化自相关值很小。因此,可根据第一归一化自相关值的大小变化反映出编码音频的状态,从而根据第一归一化自相关值确定出当前音频帧对应的编码码率进行编码。
在本申请的一个具体实施例中,在根据第一归一化自相关值确定当前音频帧对应的编码码率的过程中,还包括:设置状态转移计数器,当当前音频帧对应的编码码率由高向低进行转换时,状态转移计数器开始计数;以及当状态转移计数器的数值为预设数值时,编码码率由高向低进行转换。
在该具体实施例中,在编码过程中,当进行编码码率的由高码率向低码率进行转换时,为了确保码率转换过程平稳,以保证音质平稳,本申请设置状态转移计数器。在编码过程中,当高码率向低码率进行转换时,状态转移计数器开始计数,在状态转移计数器的数值达到预设数值时,开始编码码率的转换。从而保证码率转换过程平稳,确保最终的音质。
在本申请的一个实例中,例如,当编码码率由全码率向中等码率转换时,并不会立刻进行转换,而是开启状态转移计数器。当状态转移计数器的计数达到预设数值时,开始进行编码码率由全码率向中等码率的转换。通过设置码率转换的状态转移计数器,在满足码率转换的条件并且满足状态转移计数器计数预设数值下再进行码率的转换,保证码率转换过程的平稳性,同时保证对编码音频编码结果的音质效果。
图4示出了本申请确定音频编码码率的方法的一个具体实例。
结合图四,对本申请的确定音频编码码率的方法的具体过程进行说明。其中,在LC3音频编码器中,在长期后置滤波器内获取当前编码音频帧的第一归一化自相关值后,对第一归一化自相关值的大小进行判断。当第一归一化自相关值大于第一门限时,设置全码率状态转移计数器并开始计数,并将LC3音频编码器的编码码率设置为全码率;当第一归一化自相关值不大于第一门限时,判断全码率状态转移计数器是否计数到零。若全码率状态转移计数器的数值大于零,则全码率状态转移计数器数值减一,此时仍然输出全码率对音频帧进行编码,若全码率状态转移计数器数值为零,则判断第一归一化自相关值与第二门限的关系。若第一归一化自相关值大于第二门限,则设置中码率状态转移计数器并开始计数,并将LC3音频编码器的编码码率设置为中码率;当第一归一化自相关值不大于第二门限时,判断中码率状态转移计数器是否计数到零,若中码率状态转移计数器的数值大于零,则中码率状态转移计数器数值减一,此时仍然输出中码率对音频帧进行编码,若中码率状态转移计数器数值为零,则设置LC3音频编码器的编码码率为最低码率。其中第一门限大于第二门限,且全码率状态转移计数器和中码率状态转移计数器各自开始计数的开始数值及计数结束数值,可根据具体的编码过程进行设置。
图5示出了本申请确定音频编码码率的方法的一个具体实例。
在LC3音频编码器的长期后置滤波器中,对编码音频帧进行基音延迟计算后,得到第二归一化自相关值,其中,第二归一化自相关值为经过长期后置滤波器内基音延迟计算过程后的当前音频帧对应的精确的归一化自相关值。判断第二归一化自相关值与第三门限的大小关系,当第二归一化自相关值大于第三门限时,设置超码率状态转移计数器并开始计数,并将LC3音频编码器的编码码率设置为超码率;当第二归一化自相关值不大于第三门限时,判断超码率状态转移计数器是否计数到零,若超码率状态转移计数器的数值大于零,则超码率状态转移计数器数值减一,此时仍然输出全码率对音频帧进行编码,若超码率状态转移计数器数值为零,则该过程结束。其中,第三门限大于第一门限和第二门限。超码率状态转移计数器开始计数的开始数值及计数结束数值,可根据具体的编码过程进行设置。
通过第一归一化自相关值和第二归一化自相关值的获取,以及第一门限、第二门限以及第三门限的设置,根据当前编码音频帧的情况设置对应的编码码率,从而避免对编码码率的浪费以及保证编码结果的音质效果。通过设置码率转换的状态转移计数器,在满足码率转换的条件并且满足状态转移计数器计数预设数值下再进行码率的转换,保证码率转换过程的平稳性,同时保证对编码音频编码结果的音质效果。
图6示出了更新的LC3音频编码器编码流程图。
如图6所示,在阴影部分的新的长期后置滤波器处执行本申请的确定音频编码码率的方法。本申请的确定音频编码码率的方法增加少量的控制代码用来更新码率,容易实现。
图7示出了本申请更新的长期后置滤波器的工作流程示意图。
如图7所示,其中阴影部分的第一码率判决过程和第二码率判决过程为本申请确定音频编码码率的方法的主要过程。其中,在第一码率判决过程中,获取第一归一化自相关值,并对第一归一化自相关值与第一门限、第二门限的大小关系进行判断,确定当前音频帧的编码码率为全码率,中码率或者最低码率。在第二码率判决过程中,当前编码音频帧经过基音延迟计算后对应的精确的归一化自相关值确定为第二归一化自相关值。其中,对第二归一化自相关值与第三门限的大小进行比较,确定编码码率是否为超码率。最终针对当前编码音频帧,输出超码率、全码率、中码率或者最低码率。
图8示出了本申请确定音频编码码率的方法的运用效果图。
如图8所示,通过本申请确定音频编码码率的方法确定当前音频帧对应的编码码率,从而整体降低对编码音频的编码码率,由标准编码过程中的64kbps降低到46kbps。对音频帧设置对应的适应当前编码音频帧的编码码率进行编码,同时设置状态转换计数器,保证码率转换过程平稳进行,保证编码结果的音质。如图8所示,本申请的编码的音质效果(MOS分)由3.928提升到3.934,可实现编码音质的提升。
本申请的确定音频编码码率的方法通过对长期后置滤波器中当前音频帧的第一归一化自相关值或者第二归一化自相关值的判断,确定当前编码音频帧对应的编码码率,从而节省LC3音频编码器在实际通话时的编码码率,节省空中带宽,降低蓝牙发射设备之间的干扰;同时通过编码码率的降低,降低编码端以及解码端的运算量,降低功耗,延长设备的使用时间。本申请的确定音频编码码率的方法可通过增加少量代码实现码率的确定过程,实现过程简单。本申请的确定音频编码码率的方法适用于包括10ms帧长,7.5ms帧长以及其他采样率的编码音频的编码过程。
在本申请的一个具体实施方式中,图9示出了本申请确定音频编码码率的系统的组成示意图。包括:用于在编码器的长期后置滤波器内获取当前音频帧的第一归一化自相关值,第一归一化自相关值为经过长期后置滤波器内基音检测过程后的当前音频帧对应的粗略的归一化自相关值的模块;用于根据第一归一化自相关值确定当前音频帧对应的第一编码码率的模块;用于获取当前音频帧的第二归一化自相关值,第二归一化自相关值为经过长期后置滤波器内基音延迟计算过程后的当前音频帧对应的精确的归一化自相关值的模块;以及用于根据第二归一化自相关值对第一编码码率进行更新,并根据第一编码码率的更新结果,确定当前音频帧对应的编码码率的模块。
本申请的确定音频编码码率的系统通过对长期后置滤波器中当前音频帧对应的第一归一化自相关值或者第二归一化自相关值的判断,确定当前编码音频帧对应的编码码率,避免编码码率的浪费,降低编码及解码过程的运算量,降低编码器及解码器设置的功耗。
在本申请的一个具体实施方式中,一种LC3音频编码器编码方法,其特征在于,包括:在LC3音频编码器的长期后置滤波器内获取当前音频帧的第一归一化自相关值;根据第一归一化自相关值确定当前音频帧对应的编码码率;以及在LC3音频编码器中,根据编码码率对当前音频帧进行编码。
在本申请的一个具体实施方式中,一种计算机可读存储介质,其存储有计算机指令,其中计算机指令被操作以执行任一实施例描述的确定音频编码码率的方法。其中,该存储介质可直接在硬件中、在由处理器执行的软件模块中或在两者的组合中。
软件模块可驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可装卸盘、CD-ROM或此项技术中已知的任何其它形式的存储介质中。示范性存储介质耦合到处理器,使得处理器可从存储介质读取信息和向存储介质写入信息。
处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)、现场可编程门阵列(英文:Field Programmable Gate Array,简称:FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其任何组合等。通用处理器可以是微处理器,但在替代方案中,处理器可以是任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器或任何其它此类配置。在替代方案中,存储介质可与处理器成一体式。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替代方案中,处理器和存储介质可作为离散组件驻留在用户终端中。
在本申请的一个具体实施方式中,一种计算机设备,其包括处理器和存储器,存储器存储有计算机指令,其中:处理器操作计算机指令以执行任一实施例描述的确定音频编码码率的方法。
在本申请所提供的实施方式中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上仅为本申请的实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种确定音频编码码率的方法,其特征在于,包括:
在编码器的长期后置滤波器内获取当前音频帧的第一归一化自相关值,所述第一归一化自相关值为经过所述长期后置滤波器内基音检测过程后的所述当前音频帧对应的粗略的归一化自相关值;
根据所述第一归一化自相关值确定所述当前音频帧对应的第一编码码率;
获取所述当前音频帧的第二归一化自相关值,所述第二归一化自相关值为经过所述长期后置滤波器内基音延迟过程后的所述当前音频帧对应的精确的归一化自相关值;以及
根据所述第二归一化自相关值对所述第一编码码率进行更新,并根据所述第一编码码率的更新结果,确定所述当前音频帧对应的编码码率。
2.如权利要求1所述的确定音频编码码率的方法,其特征在于,在所述根据所述第一归一化自相关值确定所述当前音频帧对应的编码码率的过程中,包括:
当所述第一归一化自相关值大于第一门限时,确定所述第一编码码率为全码率;
当所述第一归一化自相关值不大于所述第一门限且大于第二门限时,确定所述第一编码码率为中码率;以及
当所述第一归一化自相关值不大于所述第二门限时,确定所述第一编码码率为最低码率。
3.如权利要求1所述的确定音频编码码率的方法,其特征在于,所述根据所述第二归一化自相关值对所述第一编码码率进行更新的过程,包括:当所述第二归一化自相关值大于第三门限时,确定所述第一编码码率为超码率。
4.如权利要求1-3任一所述的确定音频编码码率的方法,其特征在于,所述超码率、所述全码率、所述中码率以及所述最低码率对应的码率值依次降低。
5.如权利要求1-3任一所述的确定音频编码码率的方法,其特征在于,所述第三门限、第一门限以及第二门限依次降低。
6.如权利要求1所述的确定音频编码码率的方法,其特征在于,在所述根据所述第一归一化自相关值确定所述当前音频帧对应的编码码率的过程中,还包括:
设置状态转移计数器,当所述当前音频帧对应的所述编码码率由高向低进行转换时,所述状态转移计数器开始计数;以及
当所述状态转移计数器的数值为预设数值时,所述编码码率由高向低进行转换。
7.一种确定音频编码码率的系统,其特征在于,包括:
用于在编码器的长期后置滤波器内获取当前音频帧的第一归一化自相关值,所述第一归一化自相关值为经过所述长期后置滤波器内基音检测过程后的所述当前音频帧对应的粗略的归一化自相关值的模块;
用于根据所述第一归一化自相关值确定所述当前音频帧对应的第一编码码率的模块;
用于获取所述当前音频帧的第二归一化自相关值,所述第二归一化自相关值为经过所述长期后置滤波器内基音延迟计算过程后的所述当前音频帧对应的精确的归一化自相关值的模块;以及
用于根据所述第二归一化自相关值对所述第一编码码率进行更新,并根据所述第一编码码率的更新结果,确定所述当前音频帧对应的编码码率的模块。
8.一种LC3音频编码器编码方法,其特征在于,包括:
在LC3音频编码器的长期后置滤波器内获取当前音频帧的第一归一化自相关值,所述第一归一化自相关值为经过所述长期后置滤波器内基音检测过程后的所述当前音频帧对应的粗略的归一化自相关值;
根据所述第一归一化自相关值确定所述当前音频帧对应的第一编码码率;
获取所述当前音频帧的第二归一化自相关值,所述第二归一化自相关值为经过所述长期后置滤波器内基音延迟计算过程后的所述当前音频帧对应的精确的归一化自相关值;
根据所述第二归一化自相关值对所述第一编码码率进行更新,并根据所述第一编码码率的更新结果,确定所述当前音频帧对应的编码码率;以及
在所述LC3音频编码器中,根据所述编码码率对所述当前音频进行编码。
9.一种计算机可读存储介质,其存储有计算机指令,其中所述计算机指令被操作以执行权利要求1-6任一项所述的确定音频编码码率的方法。
10.一种计算机设备,其包括处理器和存储器,所述存储器存储有计算机指令,其中,所述处理器操作所述计算机指令以执行权利要求1-6任一项所述的确定音频编码码率的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011176843.9A CN112289328B (zh) | 2020-10-28 | 2020-10-28 | 一种确定音频编码码率的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011176843.9A CN112289328B (zh) | 2020-10-28 | 2020-10-28 | 一种确定音频编码码率的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112289328A true CN112289328A (zh) | 2021-01-29 |
CN112289328B CN112289328B (zh) | 2024-06-21 |
Family
ID=74374128
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011176843.9A Active CN112289328B (zh) | 2020-10-28 | 2020-10-28 | 一种确定音频编码码率的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112289328B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112767956A (zh) * | 2021-04-09 | 2021-05-07 | 腾讯科技(深圳)有限公司 | 音频编码方法、装置、计算机设备及介质 |
CN113450809A (zh) * | 2021-08-30 | 2021-09-28 | 北京百瑞互联技术有限公司 | 语音数据处理方法、系统及介质 |
CN113870885A (zh) * | 2021-12-02 | 2021-12-31 | 北京百瑞互联技术有限公司 | 蓝牙音频啸叫检测和抑制方法、装置、介质及设备 |
WO2022267758A1 (zh) * | 2021-06-21 | 2022-12-29 | Oppo广东移动通信有限公司 | 蓝牙数据处理方法、装置、设备、芯片、存储介质、程序、及程序产品 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20010023395A1 (en) * | 1998-08-24 | 2001-09-20 | Huan-Yu Su | Speech encoder adaptively applying pitch preprocessing with warping of target signal |
JP2002091498A (ja) * | 2000-09-19 | 2002-03-27 | Victor Co Of Japan Ltd | オーディオ信号符号化装置 |
JP2005128401A (ja) * | 2003-10-27 | 2005-05-19 | Casio Comput Co Ltd | 音声処理装置及び音声符号化方法 |
JP2008107629A (ja) * | 2006-10-26 | 2008-05-08 | Nec Corp | オーディオ信号の符号化復号化方法、この方法を実施するための装置及びプログラム |
CN102208188A (zh) * | 2011-07-13 | 2011-10-05 | 华为技术有限公司 | 音频信号编解码方法和设备 |
CN111566731A (zh) * | 2017-11-10 | 2020-08-21 | 弗劳恩霍夫应用研究促进协会 | 编码和解码音频信号 |
CN111583942A (zh) * | 2020-05-26 | 2020-08-25 | 腾讯科技(深圳)有限公司 | 语音会话的编码码率控制方法、装置和计算机设备 |
-
2020
- 2020-10-28 CN CN202011176843.9A patent/CN112289328B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20010023395A1 (en) * | 1998-08-24 | 2001-09-20 | Huan-Yu Su | Speech encoder adaptively applying pitch preprocessing with warping of target signal |
JP2002091498A (ja) * | 2000-09-19 | 2002-03-27 | Victor Co Of Japan Ltd | オーディオ信号符号化装置 |
JP2005128401A (ja) * | 2003-10-27 | 2005-05-19 | Casio Comput Co Ltd | 音声処理装置及び音声符号化方法 |
JP2008107629A (ja) * | 2006-10-26 | 2008-05-08 | Nec Corp | オーディオ信号の符号化復号化方法、この方法を実施するための装置及びプログラム |
CN102208188A (zh) * | 2011-07-13 | 2011-10-05 | 华为技术有限公司 | 音频信号编解码方法和设备 |
CN111566731A (zh) * | 2017-11-10 | 2020-08-21 | 弗劳恩霍夫应用研究促进协会 | 编码和解码音频信号 |
CN111583942A (zh) * | 2020-05-26 | 2020-08-25 | 腾讯科技(深圳)有限公司 | 语音会话的编码码率控制方法、装置和计算机设备 |
Non-Patent Citations (3)
Title |
---|
JEAN-MARC VALIN ETC: "High-Quality, Low-Delay Music Coding in the Opus Codec", AES 135 CONVENTION, pages 2 - 10 * |
祝建英;夏哲雷;殷海兵;华强;: "基于神经网络的视频编码量化参数选择算法", 电视技术, no. 19 * |
贾懋珅等: "8~64kbit/s 超宽带嵌入式语音频编码方法", 通信学报, vol. 30, no. 5, pages 28 - 34 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112767956A (zh) * | 2021-04-09 | 2021-05-07 | 腾讯科技(深圳)有限公司 | 音频编码方法、装置、计算机设备及介质 |
CN112767956B (zh) * | 2021-04-09 | 2021-07-16 | 腾讯科技(深圳)有限公司 | 音频编码方法、装置、计算机设备及介质 |
WO2022267758A1 (zh) * | 2021-06-21 | 2022-12-29 | Oppo广东移动通信有限公司 | 蓝牙数据处理方法、装置、设备、芯片、存储介质、程序、及程序产品 |
CN113450809A (zh) * | 2021-08-30 | 2021-09-28 | 北京百瑞互联技术有限公司 | 语音数据处理方法、系统及介质 |
CN113450809B (zh) * | 2021-08-30 | 2021-11-30 | 北京百瑞互联技术有限公司 | 语音数据处理方法、系统及介质 |
CN113870885A (zh) * | 2021-12-02 | 2021-12-31 | 北京百瑞互联技术有限公司 | 蓝牙音频啸叫检测和抑制方法、装置、介质及设备 |
CN113870885B (zh) * | 2021-12-02 | 2022-02-22 | 北京百瑞互联技术有限公司 | 蓝牙音频啸叫检测和抑制方法、装置、介质及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112289328B (zh) | 2024-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112289328B (zh) | 一种确定音频编码码率的方法及系统 | |
JP5730682B2 (ja) | 背景雑音情報の断続伝送及び正確な再生の方法 | |
EP1747555B1 (en) | Audio encoding with different coding models | |
RU2469419C2 (ru) | Способ и устройство для управления сглаживанием стационарного фонового шума | |
US7061934B2 (en) | Method and apparatus for interoperability between voice transmission systems during speech inactivity | |
EP1747442B1 (en) | Selection of coding models for encoding an audio signal | |
CN113724725B (zh) | 一种蓝牙音频啸叫检测抑制方法、装置、介质及蓝牙设备 | |
AU672934B2 (en) | Discriminating between stationary and non-stationary signals | |
CN111681663B (zh) | 一种降低音频编码运算量的方法、系统、存储介质及设备 | |
JP2008530591A5 (zh) | ||
JP2007501444A (ja) | 信号対雑音比による音声認識方法 | |
CN112599140B (zh) | 一种优化语音编码速率和运算量的方法、装置及存储介质 | |
CN110619881B (zh) | 一种语音编码方法、装置及设备 | |
CN113823277A (zh) | 基于深度学习的关键词识别方法、系统、介质及设备 | |
CN114121004A (zh) | 基于深度学习的语音识别方法、系统、介质及设备 | |
CN1244090C (zh) | 具备背景噪声再现的语音编码 | |
CN112002338A (zh) | 一种优化音频编码量化次数的方法及系统 | |
CN114566174B (zh) | 一种优化语音编码的方法、装置、系统、介质及设备 | |
CN101211561A (zh) | 音乐信号质量增强方法和装置 | |
CN114999503B (zh) | 一种基于生成对抗网络的全带宽谱系数生成方法及系统 | |
CN112509591B (zh) | 一种音频编解码方法及系统 | |
CN115662453A (zh) | 一种基于深度学习的语音编码方法、系统、介质及设备 | |
JPH07135490A (ja) | 音声検出器及び音声検出器を有する音声符号化器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Country or region after: China Address after: A1009, floor 9, block a, No. 9, Shangdi Third Street, Haidian District, Beijing 100085 Applicant after: Beijing Bairui Internet Technology Co.,Ltd. Address before: 7-1-1, building C, 7 / F, building 2-1, No.2, Shangdi Information Road, Haidian District, Beijing 100085 Applicant before: BARROT WIRELESS Co.,Ltd. Country or region before: China |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |