CN116189693A - 一种带宽扩展方法、装置、介质及设备 - Google Patents
一种带宽扩展方法、装置、介质及设备 Download PDFInfo
- Publication number
- CN116189693A CN116189693A CN202211700088.9A CN202211700088A CN116189693A CN 116189693 A CN116189693 A CN 116189693A CN 202211700088 A CN202211700088 A CN 202211700088A CN 116189693 A CN116189693 A CN 116189693A
- Authority
- CN
- China
- Prior art keywords
- frequency
- low
- frequency spectrum
- spectrum coefficient
- coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 96
- 238000001228 spectrum Methods 0.000 claims abstract description 205
- 230000008569 process Effects 0.000 claims abstract description 42
- 238000005538 encapsulation Methods 0.000 claims abstract description 6
- 230000003595 spectral effect Effects 0.000 claims description 70
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 8
- 238000004806 packaging method and process Methods 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 abstract description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本申请公开了一种带宽扩展方法、装置、介质及设备,属于音频编解码技术领域,该方法包括:在LC3音频编码过程中,对输入的音频帧进行低延迟改进型离散余弦变换,得到音频帧对应的频域谱系数;对频域谱系数进行划分,并对得到的低频谱系数按照标准流程进行编码,得到低频编码结果;根据低频谱系数与高频谱系数之间的关系与高频谱系数之间的关系对高频谱谱系数进行编码,得到高频编码结果;对低频编码结果和高频编码结果进行码流封装,得到编码码流。本申请通过对低频谱系数进行标准编码,对高频谱系数按照低频谱系数的信息进行编码,得到相应的高频编码结果。实现使用较低的算力及码率完成对音频的编码,适用低功耗蓝牙及嵌入式系统领域。
Description
技术领域
本申请涉及音频编解码技术领域,特别涉及一种带宽扩展方法、装置、介质及设备。
背景技术
使用蓝牙设备播放音乐或通话时,使用较高的码率对音频进行编解码可以确保获得较高的音质,但随着干扰信号的增多或者距离的增大,蓝牙设备的信号会变差,此时为了避免卡顿,必须降低音频信号的码率,从而导致音质的降低。以采样率48kHz的音频为例,在LE Audio中使用LC3作为音频编解码器时,标准规范白皮书推荐的典型立体声码率248kbps,当蓝牙无线信号质量变差时必须降低码率确保不卡顿。
在降低码率并且保持音质,现有的技术主要采取带宽扩展的方法。一种是基于时域带宽扩展,通过低频信号的上采样或基于LPC估计来产生高频信号部分;另一种基于频域带宽扩展,在频域将低频信号扩展到高频信号,这种方法更灵活。基于频域带宽扩展的方法已经成功应用于aacPlus(即AAC+SBR)中,Spectral Band Replication,频带复制,简称SBR,是使用最为广泛的基于频域的带宽扩展技术,其主要思想为方法通过复制低频带信息到高频带,并在后处理阶段进行逆滤波、自适应噪声消除、谱包络重整等操作,取得了较好的重建音质。但SBR的算法复杂度和存储复杂度也较高,特别是其中的QMF处理,需要占用较多的算力资源和存储资源,这些缺点导致SBR技术在嵌入式系统以及低功耗蓝牙中的应用受到限制。
发明内容
针对在进行降低码率,同时保持音质时,现有技术方法有较高的算法复杂度和存储复杂度,不适用低功耗蓝牙以及嵌入式系统的低算力要求的问题,本申请提出一种带宽扩展方法、装置、介质及设备。
第一方面,本申请提出一种带宽扩展方法,包括:在LC3音频编码过程中,对输入的音频帧进行低延迟改进型离散余弦变换,得到音频帧对应的频域谱系数;对频域谱系数进行划分,得到低频谱系数和高频谱系数;对低频谱系数按照标准流程进行编码,得到低频编码结果;根据低频谱系数与高频谱系数之间的关系对高频谱谱系数进行编码,得到高频编码结果;对低频编码结果和高频编码结果进行码流封装,得到编码码流。
可选的,根据低频谱系数与高频谱系数之间的关系对高频谱谱系数进行编码,得到高频编码结果,包括:分别对低频谱系数和高频谱系数进行子带划分,得到低频子带和高频子带;根据低频子带和高频子带,计算得到低频子带对应的低频谱包络和高频子带对应的高频谱包络;计算高频谱包络与低频谱包络之间的谱包络比,并根据高频子带计算得到高频子带对应的高频音调因子;对谱包络比和高频音调因子进行量化,并根据量化后的谱包络比和高频音调因子进行编码,得到高频编码结果。
可选的,还包括对编码码流的解码过程,其中解码过程包括:对编码码流进行码流解析及算术编码,得到高频谱和低频谱之间的包络比和低频谱系数;根据低频谱系数和包络比,计算得到高频谱系数;合并低频谱系数和修正后的高频谱系数,得到全频段谱系数;对全频段谱系数进行低延迟改进型离散余弦逆变换,输出音频帧。
可选的,在解码过程中,在合并低频谱系数和修正后的高频谱系数之前还包括:对高频谱系数的音调特性进行修正,得到修正后的高频谱系数。
第二方面,本申请提出一种带宽扩展装置,包括:低延迟改进型离散余弦变换模块,其在LC3音频编码过程中,对输入的音频帧进行低延迟改进型离散余弦变换,得到音频帧对应的频域谱系数;谱系数划分模块,其对频域谱系数进行划分,得到低频谱系数和高频谱系数;低频谱系数编码模块,其对低频谱系数按照标准流程进行编码,得到低频编码结果;带宽扩展编码模块,其根据低频谱系数与高频谱系数之间的关系对高频谱谱系数进行编码,得到高频编码结果;码流封装模块,其对低频编码结果和高频编码结果进行码流封装,得到编码码流。
第三方面,本申请提供一种计算机可读存储介质,其存储有计算机程序,其中计算机程序被操作以执行方案一中的带宽扩展方法。
第四方面,本申请提供一种计算机设备,其包括处理器和存储器,存储器存储有计算机程序,其中处理器操作计算机程序以执行方案一中的带宽扩展方法。
本申请的带宽扩展方法通过对LC3编码音频对应的频域谱系数进行划分,对低频谱系数进行标准编码,对高频谱系数按照低频谱系数的信息进行编码,得到相应的高频编码结果。实现使用较低的算力及码率完成对音频的编码,适用低功耗蓝牙及嵌入式系统。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图示例性的示出了本申请的一些实施例。
图1示出了本申请带宽扩展方法的一个实施方式的示意图;
图2是本申请LC3编码过程的编码框架图;
图3是本申请LC3解码过程的解码框架图;
图4是本申请带宽扩展装置的一个实施方式的示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
下面结合附图对本申请的较佳实施例进行详细阐述,以使本申请的优点和特征能更易于被本领域技术人员理解,从而对本申请的保护范围做出更为清楚明确的界定。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
使用蓝牙设备播放音乐或通话时,使用较高的码率对音频进行编解码可以确保获得较高的音质,但随着干扰信号的增多或者距离的增大,蓝牙设备的信号会变差,此时为了避免卡顿,必须降低音频信号的码率,从而导致音质的降低。以采样率48kHz的音频为例,在LE Audio中使用LC3作为音频编解码器时,标准规范白皮书推荐的典型立体声码率248kbps,当蓝牙无线信号质量变差时必须降低码率确保不卡顿。
在降低码率并且保持音质,现有的技术主要采取带宽扩展的方法。一种是基于时域带宽扩展,通过低频信号的上采样或基于LPC估计来产生高频信号部分;另一种基于频域带宽扩展,在频域将低频信号扩展到高频信号,这种方法更灵活。基于频域带宽扩展的方法已经成功应用于aacPlus(即AAC+SBR)中,Spectral Band Replication,频带复制,简称SBR,是使用最为广泛的基于频域的带宽扩展技术,其主要思想为方法通过复制低频带信息到高频带,并在后处理阶段进行逆滤波、自适应噪声消除、谱包络重整等操作,取得了较好的重建音质。但SBR的算法复杂度和存储复杂度也较高,特别是其中的QMF处理过程,需要占用较多的算力资源和存储资源,这些缺点导致SBR技术在嵌入式系统以及低功耗蓝牙中的应用受到限制。
针对上述问题,本申请提出一种带宽扩展方法、装置、介质及设备,该方法包括:在LC3音频编码过程中,对输入的音频帧进行低延迟改进型离散余弦变换,得到音频帧对应的频域谱系数;对频域谱系数进行划分,得到低频谱系数和高频谱系数;对低频谱系数按照标准流程进行编码,得到低频编码结果;根据低频谱系数与高频谱系数之间的关系对高频谱谱系数进行编码,得到高频编码结果;对低频编码结果和高频编码结果进行码流封装,得到编码码流。
本申请的带宽扩展方法通过对LC3编码音频对应的频域谱系数进行划分,对低频谱系数进行标准编码,对高频谱系数按照低频谱系数的信息进行编码,得到相应的高频编码结果。实现使用较低的算力及码率完成对音频的编码,适用低功耗蓝牙及嵌入式系统领域。
下面,以具体的实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面述及的具体的实施例可以相互结合形成新的实施例。对于在一个实施例中描述过的相同或相似的思想或过程,可能在其他某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图1是本申请带宽扩展方法的一个实施方式的示意图。
在图1所示的实施方式中,本申请的带宽扩展方法包括过程S101,在LC3音频编码过程中,对输入的音频帧进行低延迟改进型离散余弦变换,得到音频帧对应的频域谱系数。
在该实施方式中,在LC3编码器对音频进行编码时,利用LC3编码器中已有的低延迟改进型离散余弦变换模块对输入的音频帧进行标准的转换处理,从时域变换到频域得到音频帧对应的频域谱系数。
具体的,在LC3编码器对音频编码前,对输入的音频进行分帧,得到7.5ms或10ms帧长的音频帧,然后进行后续的编码过程。
在图1所示的实施方式中,本申请的带宽扩展方法包括过程S102,对频域谱系数进行划分,得到低频谱系数和高频谱系数,并对低频谱系数按照标准流程进行编码,得到低频编码结果。
在该实施方式中,为了实现低码率编码,本申请将得到的频域谱系数进行划分,得到低频谱系数和高频谱系数,然后对低频谱系数进行LC3标准编码,得到对应的低频编码结果。
在图1所示的实施方式中,本申请的带宽扩展方法包括过程S103,根据低频谱系数与高频谱系数之间的关系对高频谱谱系数进行编码,得到高频编码结果。
在该实施方式中,在对高频谱系数进行编码时,并没有对高频谱系数进行标准的编码过程,而是利用高频谱系数与低频谱系数之间的关系,利用低频谱系数及其对应的低频编码结果得到高频谱系数对应的高频编码结果。现有的常规编码方法中,对全频段的谱系数均进行编码,而在本申请的技术方案中,进行频域谱系数的划分,得到低频谱系数和高频谱系数。在本申请中,仅需要对低频谱系数进行标准编码,得到低频编码结果;在对高频谱系数进行编码时,并非进行标准的编码,而是利用低频谱系数与高频谱系数之间的关系,利用低频谱系数的编码信息间接得到高频编码结果。相当于仅对低频谱系数进行编码,再根据低频编码结果得到高频编码结果,将码率降低到原来的一半,便可得到整体的编码结果。从而降低算力及码率,同时保证高频谱系数的高频编码结果。
可选的,根据低频谱系数与高频谱系数之间的关系对高频谱谱系数进行编码,得到高频编码结果,包括:分别对低频谱系数和高频谱系数进行子带划分,得到低频子带和高频子带;根据低频子带和高频子带,计算得到低频子带对应的低频谱包络和高频子带对应的高频谱包络;计算高频谱包络与低频谱包络之间的谱包络比,并根据高频子带计算得到高频子带对应的高频音调因子;对谱包络比和高频音调因子进行量化,并根据量化后的谱包络比和高频音调因子进行编码,得到高频编码结果。
在该可选实施例中,在根据低频编码结果得到高频编码结果时,要确定低频谱系数与高频谱系数之间的关系,实现根据低频编码结果得到高频编码结果。
具体的,首先进行低频谱系数和高频谱系数的子带划分,对应的得到低频子带和高频子带。以采样率16kHz、帧长10ms的音频配置为例,对音频帧进行低延迟改进型离散余弦变换,得到频域谱系数,如下:
t(n)=xs(z-NF+n),for n=0...2·NF-1-Z
t(2NF-Z+n)=0,for n=0...Z-1
其中,xs(n)是输入的时域音频pcm信号,X(k)是经过离散余弦变换的频域谱系数。在当前配置下,NF=160,其中低频谱系数XL(k)=X(k),高频谱系数XH(k)=X(k+80),k=0,...,79。在子带划分中,将低频带和高频带划分为10个子带,每个子带8个谱系数。
然后分别按照子带进行谱包络的计算,其中在低频谱包络:
高频谱包络:
此处将低频带和高频带各划分为10个均匀的子带(SUBBAND),每个子带共8个(SUBBANDWIDTH)谱系数,具体的实施例中,也可以划分成非均匀的子带。
然后根据计算得出的高频谱包络和低频谱包络计算谱包络比,将低频谱包络记为ELB(b),将高频谱包为EHB(b),则谱包络比为:
然后按照子带计算高频音调因子,其显示了高频谱系数的音调特性,值越大则音调特性越强,值越小则音调特性越弱,更接近噪声特性:
b=0...SUBBAND-1,k=0...7
然后使用与标准LC3编码中谱系数量化的方法对高频低频谱包络比和音调因子进行量化,并将量化后的谱包络比和音调因子进行算术编码得到高频编码结果。
在图1所示的实施方式中,本申请的带宽扩展方法包括过程S104,对低频编码结果和高频编码结果进行码流封装,得到编码码流.
在该实施方式中,在得到高频编码结果后,对低频编码结果和高频编码结果进行码流封装,使用标准LC3编码中相同的方法,得到高频编码结果,此处不进行赘述。
具体的,图2是本申请LC3编码过程的编码框架图。
如图2所示,在编码过程中,对音频帧经过低延迟改进型离散余弦变换后,再进行频域谱系数的划分,得到低频谱系数和高频谱系数。对于低频谱系数进行标准的LC3编码过程,对于高频谱系数进行带宽扩展模块的编码过程,最后高频编码结果,最后将低频编码结果和高频编码结果进行码流封装,得到编码码流。
可选的,本申请的带宽扩展方法还包括对编码码流的解码过程,其中解码过程包括:对编码码流进行码流解析及算术编码,得到高频谱和低频谱之间的包络比和低频谱系数;根据低频谱系数和包络比,计算得到高频谱系数;合并低频谱系数和修正后的高频谱系数,得到全频段谱系数;对全频段谱系数进行低延迟改进型离散余弦逆变换,输出音频帧。
在该可选实施例中,在进行解码时,在对输入的编码码流进行码流解析,得到对应的低频码流和高频码流,然后对低频码流进行标准的解码流程,得到低频谱系数。然后利用高频谱系数与低频谱系数在音频编码时的对应关系进行对应的解码,得到高频谱系数。再进行低频谱系数与高频谱系数之间的合并,最终得到音频帧。
可选的,在解码过程中,在合并低频谱系数和修正后的高频谱系数之前还包括:对高频谱系数的音调特性进行修正,得到修正后的高频谱系数。
具体的,以采样率16kHz、帧长10ms的配置为例,对解码过程进行说明:
对高频码流进行码流解析、算术解码和反量化方法同标准的LC3解码一致,此处不再赘述。反量化输出高频低频谱包络比;
RatioEnvelope(b),for b=0...SUBBAND-1
通过标准的LC3解码输出低频谱系数:
然后结合低频谱系数与谱包络比,输出高频谱系数:
……
然后进行高频谱系数的音调特性的修正:
其中αb∈[0,1]和βb∈[0,10]的计算可以依据下式求得,使得下式的值小于设定门限的αb和βb的组合即满足要求。假定设定门限为0.1,一种常规的计算方法是,在αb和βb的范围内按照步长(譬如0.05和0.1)搜索最佳组合,使得下式的结果小于门限。也可以使用快速算法,如牛顿迭代法。
argmin(TonalityEncoder(b)-TonalityDecoder(b))
其中TonalityDecoder(b)用来在解码端计算修正后的音调因子,计算方法同编码端。
αb用来压缩音调信号的谱峰,使得修正后的高频信号其音调信号的谱峰与原始的高频信号匹配;βb用来调节高频信号的噪声特性,如果原始低频信号为音调特性较强的信号,而原始高频信号为噪声特性较强的信号,直接使用低频信号重建得到的高频信号其音调特性较强,与原始高频信号的特性偏差大,此处使用βb来增强其噪声特性,random即用来产生随机噪声的。然后进行低频谱系数和高频谱系数的合并,得到全频段谱系数:
最后进行低延迟改进型离散余弦逆变换,输出全频带:
并在最后执行长期后置滤波器,其中具体过程与标准规范相同,此处不再赘述。
具体的,图3是本申请LC3解码过程的解码框架图。
如图3所示,在进行解码时,对输入的码流进行码流解析,然后对低频码流进行标准的包括算术及残差解码,噪声填充等标准的解码流程,得到低频谱系数;对高频码流进行带宽扩展模块的解码过程,利用高频谱系数与低频谱系数之间的关系,最终得到高频谱系数。在然后进行低频谱系数与高频谱系数的合并,最终输出音频帧。
本申请的带宽扩展方法通过对LC3编码音频对应的频域谱系数进行划分,对低频谱系数进行标准编码,对高频谱系数按照低频谱系数的信息进行编码,得到相应的高频编码结果。实现使用较低的算力完成对音频的编码,适用低功耗蓝牙及嵌入式系统领域。
图4是本申请带宽扩展装置的一个实施方式的示意图。
在图4所示的实施方式中,本申请的带宽扩展装置包括低延迟改进型离散余弦变换模块401,其在LC3音频编码过程中,对输入的音频帧进行低延迟改进型离散余弦变换,得到音频帧对应的频域谱系数;谱系数划分模块402,其对频域谱系数进行划分,得到低频谱系数和高频谱系数;低频谱系数编码模块403,其对低频谱系数按照标准流程进行编码,得到低频编码结果;带宽扩展编码模块404,其根据低频谱系数与高频谱系数之间的关系对高频谱谱系数进行编码,得到高频编码结果;码流封装模块405,其对低频编码结果和高频编码结果进行码流封装,得到编码码流。
可选的,在带宽扩展编码模块中,分别对低频谱系数和高频谱系数进行子带划分,得到低频子带和高频子带;根据低频子带和高频子带,计算得到低频子带对应的低频谱包络和高频子带对应的高频谱包络;计算高频谱包络与低频谱包络之间的谱包络比,并根据高频子带计算得到高频子带对应的高频音调因子;对谱包络比和高频音调因子进行量化,并根据量化后的谱包络比和高频音调因子进行编码,得到高频编码结果。
可选的,还包括解码器,其对编码码流进行解码,其中解码过程包括:对编码码流进行码流解析及算术编码,得到高频谱和低频谱之间的包络比和低频谱系数;根据低频谱系数和包络比,计算得到高频谱系数;合并低频谱系数和修正后的高频谱系数,得到全频段谱系数;对全频段谱系数进行低延迟改进型离散余弦逆变换,输出音频帧。
本申请的带宽扩展装置通过对LC3编码音频对应的频域谱系数进行划分,对低频谱系数进行标准编码,对高频谱系数按照低频谱系数的信息进行编码,得到相应的高频编码结果。实现使用较低的算力完成对音频的编码,适用低功耗蓝牙及嵌入式系统领域。
在本申请的一个实施方式中,一种计算机可读存储介质,其存储有计算机指令,其中计算机指令被操作以执行任一实施例描述的带宽扩展方法。其中,该存储介质可直接在硬件中、在由处理器执行的软件模块中或在两者的组合中。
软件模块可驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可装卸盘、CD-ROM或此项技术中已知的任何其它形式的存储介质中。示范性存储介质耦合到处理器,使得处理器可从存储介质读取信息和向存储介质写入信息。
处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)、现场可编程门阵列(英文:Field Programmable Gate Array,简称:FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其任何组合等。通用处理器可以是微处理器,但在替代方案中,处理器可以是任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器或任何其它此类配置。在替代方案中,存储介质可与处理器成一体式。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替代方案中,处理器和存储介质可作为离散组件驻留在用户终端中。
在本申请的一个具体实施方式中,一种计算机设备,其包括处理器和存储器,存储器存储有计算机指令,其中:处理器操作计算机指令以执行任一实施例描述的带宽扩展方法。
在本申请所提供的实施方式中,应该理解到,所揭露的装置,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上仅为本申请的实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (9)
1.一种带宽扩展方法,其特征在于,包括:
在LC3音频编码过程中,对输入的音频帧进行低延迟改进型离散余弦变换,得到所述音频帧对应的频域谱系数;
对所述频域谱系数进行划分,得到低频谱系数和高频谱系数,并对所述低频谱系数按照标准流程进行编码,得到低频编码结果;
根据所述低频谱系数与所述高频谱系数之间的关系对所述高频谱谱系数进行编码,得到高频编码结果;
对所述低频编码结果和所述高频编码结果进行码流封装,得到编码码流。
2.根据权利要求1所述的带宽扩展方法,其特征在于,所述根据所述低频谱系数与所述高频谱系数之间的关系对所述高频谱谱系数进行编码,得到高频编码结果,包括:
分别对所述低频谱系数和所述高频谱系数进行子带划分,得到低频子带和高频子带;
根据所述低频子带和所述高频子带,计算得到所述低频子带对应的低频谱包络和所述高频子带对应的高频谱包络;
计算所述高频谱包络与所述低频谱包络之间的谱包络比,并根据所述高频子带计算得到所述高频子带对应的高频音调因子;
对所述谱包络比和所述高频音调因子进行量化,并根据量化后的所述谱包络比和所述高频音调因子进行编码,得到所述高频编码结果。
3.根据权利要求1所述的带宽扩展方法,其特征在于,还包括对所述编码码流的解码过程,其中所述解码过程包括:
对所述编码码流进行码流解析及算术编码,得到高频谱和低频谱之间的包络比和低频谱系数;
根据所述低频谱系数和所述包络比,计算得到高频谱系数;
合并所述低频谱系数和修正后的高频谱系数,得到全频段谱系数;
对所述全频段谱系数进行低延迟改进型离散余弦逆变换,输出音频帧。
4.根据权利要求3所述的带宽扩展方法,其特征在于,在所述解码过程中,在所述合并所述低频谱系数和修正后的高频谱系数之前还包括:
对所述高频谱系数的音调特性进行修正,得到修正后的所述高频谱系数。
5.一种带宽扩展装置,其特征在于,包括:
低延迟改进型离散余弦变换模块,其在LC3音频编码过程中,对输入的音频帧进行低延迟改进型离散余弦变换,得到所述音频帧对应的频域谱系数;
谱系数划分模块,其对所述频域谱系数进行划分,得到低频谱系数和高频谱系数;
低频谱系数编码模块,其对所述低频谱系数按照标准流程进行编码,得到低频编码结果;
带宽扩展编码模块,其根据所述低频谱系数与所述高频谱系数之间的关系对所述高频谱谱系数进行编码,得到高频编码结果;
码流封装模块,其对所述低频编码结果和所述高频编码结果进行码流封装,得到编码码流。
6.根据权利要求5所述的带宽扩展装置,其特征在于,在所述带宽扩展编码模块中,分别对所述低频谱系数和所述高频谱系数进行子带划分,得到低频子带和高频子带;
根据所述低频子带和所述高频子带,计算得到所述低频子带对应的低频谱包络和所述高频子带对应的高频谱包络;
计算所述高频谱包络与所述低频谱包络之间的谱包络比,并根据所述高频子带计算得到所述高频子带对应的高频音调因子;
对所述谱包络比和所述高频音调因子进行量化,并根据量化后的所述谱包络比和所述高频音调因子进行编码,得到所述高频编码结果。
7.根据权利要求5所述的带宽扩展装置,其特征在于,还包括解码器,其对所述编码码流进行解码,其中所述解码过程包括:
对所述编码码流进行码流解析及算术编码,得到高频谱和低频谱之间的包络比和低频谱系数;
根据所述低频谱系数和所述包络比,计算得到高频谱系数;
合并所述低频谱系数和修正后的高频谱系数,得到全频段谱系数;
对所述全频段谱系数进行低延迟改进型离散余弦逆变换,输出音频帧。
8.一种计算机可读存储介质,其存储有计算机程序,其中所述计算机程序被操作以执行权利要求1-4中任一项所述的带宽扩展方法。
9.一种计算机设备,其包括处理器和存储器,所述存储器存储有计算机程序,其中所述处理器操作所述计算机程序以执行权利要求1-4中任一项所述的带宽扩展方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211700088.9A CN116189693A (zh) | 2022-12-28 | 2022-12-28 | 一种带宽扩展方法、装置、介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211700088.9A CN116189693A (zh) | 2022-12-28 | 2022-12-28 | 一种带宽扩展方法、装置、介质及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116189693A true CN116189693A (zh) | 2023-05-30 |
Family
ID=86449923
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211700088.9A Pending CN116189693A (zh) | 2022-12-28 | 2022-12-28 | 一种带宽扩展方法、装置、介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116189693A (zh) |
-
2022
- 2022-12-28 CN CN202211700088.9A patent/CN116189693A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4950210B2 (ja) | オーディオ圧縮 | |
US10515648B2 (en) | Audio/speech encoding apparatus and method, and audio/speech decoding apparatus and method | |
US8473301B2 (en) | Method and apparatus for audio decoding | |
US9524726B2 (en) | Audio signal decoder, audio signal encoder, method for decoding an audio signal, method for encoding an audio signal and computer program using a pitch-dependent adaptation of a coding context | |
JP5140730B2 (ja) | 切り換え可能な時間分解能を用いた低演算量のスペクトル分析/合成 | |
US20100063803A1 (en) | Spectrum Harmonic/Noise Sharpness Control | |
EP3696813B1 (en) | Audio encoder for encoding an audio signal, method for encoding an audio signal and computer program under consideration of a detected peak spectral region in an upper frequency band | |
CN106847297B (zh) | 高频带信号的预测方法、编/解码设备 | |
EP2856776B1 (en) | Stereo audio signal encoder | |
US20090132238A1 (en) | Efficient method for reusing scale factors to improve the efficiency of an audio encoder | |
JP2007293118A (ja) | 符号化方法および符号化装置 | |
JP2021502592A (ja) | スケールパラメータのダウンサンプリングまたは補間を使用してオーディオ信号をエンコードおよびデコードするための装置および方法 | |
WO2007028280A1 (fr) | Codeur et decodeur pour commande de pre echo et son procede | |
EP3707713B1 (en) | Controlling bandwidth in encoders and/or decoders | |
CN116189693A (zh) | 一种带宽扩展方法、装置、介质及设备 | |
KR20240066586A (ko) | 복소수 양자화를 이용하는 오디오 신호의 부호화 및 복호화 방법 및 장치 | |
CN113539277A (zh) | 一种保护听力的蓝牙音频解码方法、装置、介质及设备 | |
CN118136023A (zh) | 基于谱熵的语音感知哈希认证方法、系统、介质及设备 | |
Robles Moya | Survey of error concealment schemes for real-time audio transmission systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |