CN115346540A - 一种联合立体声音频编解码方法及装置 - Google Patents
一种联合立体声音频编解码方法及装置 Download PDFInfo
- Publication number
- CN115346540A CN115346540A CN202210989905.0A CN202210989905A CN115346540A CN 115346540 A CN115346540 A CN 115346540A CN 202210989905 A CN202210989905 A CN 202210989905A CN 115346540 A CN115346540 A CN 115346540A
- Authority
- CN
- China
- Prior art keywords
- channel
- right channel
- left channel
- coding
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 93
- 230000003595 spectral effect Effects 0.000 claims abstract description 140
- 238000007493 shaping process Methods 0.000 claims abstract description 16
- 238000001228 spectrum Methods 0.000 claims description 40
- 238000004364 calculation method Methods 0.000 claims description 22
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 238000004091 panning Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 208000035126 Facies Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本申请公开了一种联合立体声音频编解码方法及装置,属于音频编解码技术领域。该方法主要包括:对左右声道的蓝牙音频分别根据标准蓝牙编码步骤编码至时域噪声整形模块,获取左右声道分别对应的左声道谱系数与右声道谱系数;将左声道谱系数与右声道谱系数进行联合编码,获取左声道对应的左声道联合编码数据与右声道对应的右声道联合编码数据;以及对左声道联合编码数据与右声道联合编码数据分别根据标准蓝牙编码步骤进行剩余编码步骤,获取左声道与右声道分别对应的码流。本申请在确保音质的前提下,充分利用立体声双声道间的相关性,改进立体声编码的效率,较大的降低了码率,节省了蓝牙空中带宽,从而减少了干扰,提高了用户体验。
Description
技术领域
本申请涉及音频编解码技术领域,特别涉及一种联合立体声音频编码方法、装置、联合立体声音频解码方法及装置。
背景技术
在移动通信系统中,为了电波资源等的有效利用,要求将语音信号压缩为低比特率进行传送。另一方面,也希望提高通话语音的质量及实现临场感高的通话服务,对于其实现,不只是对单声道信号,还希望对多声道音响信号、特别是立体声音响信号进行高质量编码。
作为将立体声音响信号以低比特率进行编码的方式,已知强度立体声方(intensity stereo method)。在强度立体声方式中,采用将单声道信号乘以比例系数(scaling coefficients)从而生成L声道信号(左声道信号)和R声道信号(右声道信号)的方法。这样的方法也称作振幅声相(amplitude panning)。振幅声相的最基本的方法是对时域的单声道信号乘以振幅声相用的增益系数(声相增益系数)而求出L声道信号及R声道信号的方法。另外,作为另外的方法,也有在频域中按每一个频率分量(或者每个频率组)对单声道信号乘以声相增益系数从而求出L声道信号及R声道信号的方法。
另外,若将声相增益系数作为参量立体声(parametric stereo)的编码参数进行利用,则能够实现立体声信号的可扩展编码(单声道-立体声可扩展编码)。另一方面,在移动通信系统中,为了电波资源的有效利用而存在间歇传(Discontinuous Transmission(不连续传送):DTX)的技术。DTX是在未发出语音时以极低比特率间歇性地传送表示背景噪声的信息的技术。由此,能够降低通话时的平均比特率,能够在相同的频带中容纳更多的移动终端。
基于上述可知在对立体声编码技术中,既可采用对每一声道独立编码的方式,也可采用联合立体声编码的方式,并且后者的编码方式相较于前者的编码方式,由于其利用声道间的相关性,因此能够提高压缩效率。
然而,目前LC3(低功耗蓝牙)中对立体声的编码方式为对每一单声道独立编码,即在对编码器中输入立体声信号时,其拥有两个声道,即使两个声道间有较强的相关性,LC3也只能对每一个声道独立编码,无法利用声道间的相关性提高压缩效率,这导致LC3对立体声音频编码时,其码率是单声道的两倍。
发明内容
针对现有技术存在的LC3对立体声音频编码时,其码率是单声道的两倍的问题,本申请主要提供一种联合立体声音频编码方法、装置、联合立体声音频解码方法及装置。为了实现上述目的,本申请采用的一个技术方案是:提供一种联合立体声音频编码方法,其包括:对左右声道的蓝牙音频分别根据标准蓝牙编码步骤编码至时域噪声整形模块,获取左右声道分别对应的左声道谱系数与右声道谱系数;将左声道谱系数与右声道谱系数进行联合编码,获取左声道对应的左声道联合编码数据与右声道对应的右声道联合编码数据;以及对左声道联合编码数据与右声道联合编码数据分别根据标准蓝牙编码步骤进行剩余编码步骤,获取左声道与右声道分别对应的码流。
本申请采用的另一个技术方案是:提供一种联合立体声音频编码装置,其包括:用于对左右声道的蓝牙音频分别根据标准蓝牙编码步骤编码至时域噪声整形模块,获取左右声道分别对应的左声道谱系数与右声道谱系数的模块;用于将左声道谱系数与右声道谱系数进行联合编码,获取左声道对应的左声道联合编码数据与右声道对应的右声道联合编码数据的模块;以及用于对左声道联合编码数据与右声道联合编码数据分别根据标准蓝牙编码步骤进行剩余编码步骤,获取左声道与右声道分别对应的码流的模块。
本申请采用的另一个技术方案是:提供一种联合立体声音频解码方法,其包括:根据标准蓝牙解码步骤解码经方案一的联合立体声音频编码方法获取的码流至全局增益模块,获取左右声道分别对应的左声道解码谱系数与右声道解码谱系数;将左声道解码谱系数与右声道解码谱系数进行联合立体声解码,获取左声道对应的左声道联合立体声解码数据与右声道对应的右声道解码编码数据;以及对左声道联合立体声解码数据与右声道联合立体声解码数据分别根据标准蓝牙解码步骤进行剩余解码步骤,获取左声道与右声道分别对应的目标音频。
本申请采用的另一个技术方案是:提供一种联合立体声音频解码装置,其包括:用于根据标准蓝牙解码步骤解码经方案一的联合立体声音频编码方法获取的码流至全局增益模块,获取左右声道分别对应的左声道解码谱系数与右声道解码谱系数的模块;用于将左声道解码谱系数与右声道解码谱系数进行联合立体声解码,获取左声道对应的左声道联合立体声解码数据与右声道对应的右声道解码编码数据的模块;以及用于对左声道联合立体声解码数据与右声道联合立体声解码数据分别根据标准蓝牙解码步骤进行剩余解码步骤,获取左声道与右声道分别对应的目标音频的模块。
本申请采用的另一个技术方案是:提供一种计算机可读存储介质,其存储有计算机指令,该计算机指令被操作以执行方案一中的联合立体声音频编码方法或方案三中的联合立体声音频解码方法。
本申请采用的另一个技术方案是:提供一种计算机设备,其包括:至少一个处理器;以及与至少一个处理器进行通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的计算机指令,至少一个处理器操作计算机指令以执行方案一中的联合立体声音频编码方法或方案三中的联合立体声音频解码方法。
本申请的技术方案可以达到的有益效果是:在确保音质的前提下,充分利用立体声双声道间的相关性,改进立体声编码的效率,较大的降低了码率,节省了蓝牙空中带宽,从而减少了干扰,提高了用户体验;并且本方案操作简单,在标准规范的基础上,充分利用已有的信息,辅以少量的计算即可实现;需要说明的是,本方案提供的方法既可以用于低功耗蓝牙,也可以用于经典蓝牙。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作以简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一种联合立体声音频编码方法的一个可选实施方式的示意图;
图2示出了本申请一种联合立体声音频编码方法中发射端与接收端参数配置对应关系的可选实例的示意图;
图3示出了本申请一种联合立体声音频编码方法的编码流程的一个可选实例的示意图;
图4是本申请一种联合立体声音频编码装置的一个可选实施方式的示意图;
图5是本申请一种联合立体声音频解码方法的一个可选实施方式的示意图;
图6示出了本申请一种联合立体声音频解码方法的解码流程的一个可选实例的示意图;
图7是本申请一种联合立体声音频解码装置的一个可选实施方式的示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
下面结合附图对本申请的较佳实施例进行详细阐述,以使本申请的优点和特征能更易于被本领域技术人员理解,从而对本申请的保护范围做出更为清楚明确的界定。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
在对立体声编码技术中,既可采用对每一声道独立编码的方式,也可采用联合立体声编码的方式,并且后者的编码方式相较于前者的编码方式,由于其利用声道间的相关性,因此能够提高压缩效率。
然而,目前LC3(低功耗蓝牙)中对立体声的编码方式为对每一单声道独立编码,即在对编码器中输入立体声信号时,其拥有两个声道,即使两个声道间有较强的相关性,LC3也只能对每一个声道独立编码,无法利用声道间的相关性提高压缩效率,这导致LC3对立体声音频编码时,其码率是单声道的两倍。
针对现有技术存在的LC3对立体声音频编码时,其码率是单声道的两倍的问题,本申请主要提供一种联合立体声音频编码方法、装置、联合立体声音频解码方法及装置。该方法包括:对左右声道的蓝牙音频分别根据标准蓝牙编码步骤编码至时域噪声整形模块,获取左右声道分别对应的左声道谱系数与右声道谱系数;将左声道谱系数与右声道谱系数进行联合编码,获取左声道对应的左声道联合编码数据与右声道对应的右声道联合编码数据;以及对左声道联合编码数据与右声道联合编码数据分别根据标准蓝牙编码步骤进行剩余编码步骤,获取左声道与右声道分别对应的码流。
在确保音质的前提下,充分利用立体声双声道间的相关性,改进立体声编码的效率,较大的降低了码率,节省了蓝牙空中带宽,从而减少了干扰,提高了用户体验;并且本方案操作简单,在标准规范的基础上,充分利用已有的信息,辅以少量的计算即可实现;需要说明的是,本方案提供的方法既可以用于低功耗蓝牙,也可以用于经典蓝牙。
下面,以具体的实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面述及的具体的实施例可以相互结合形成新的实施例。对于在一个实施例中描述过的相同或相似的思想或过程,可能在其他某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图1示出了本申请一种联合立体声音频编码方法的一个可选实施方式。
在图1所示的可选实施方式中,联合立体声音频编码方法主要包括步骤S101,对左右声道的蓝牙音频分别根据标准蓝牙编码步骤编码至时域噪声整形模块,获取左右声道分别对应的左声道谱系数与右声道谱系数。
在该可选实施方式中,在蓝牙立体声编码过程中,利用蓝牙发射端的编码器分别对左声道音频数据与右声道音频数据分别进行低延迟改进型离散余弦变换、变换域噪声整形以及时域噪声整形,获取左声道音频数据与右声道音频数据分别对应的频域数据;对音频数据直接利用蓝牙发射端自身的编码器中的低延迟改进型离散余弦变换模块进行时频转换,为后续在频域进行联合编码步骤提供必要基础。
在本申请的一个可选实施例中,将左声道谱系数与右声道谱系数进行联合编码,获取左声道对应的左声道联合编码数据与右声道对应的右声道联合编码数据之前,还包括:分别提取左右声道具有蓝牙匹配关系的蓝牙发射端与蓝牙接收端的配置参数;根据配置参数与预设联合立体声的编码标准的关系,对符合编码标准的配置参数对应左右声道的左声道谱系数与右声道谱系数进行联合编码。
在该可选实施例中,在蓝牙发射端与蓝牙接收端均进行参数协商与配置,即在应用启动时,蓝牙发射端和蓝牙接收端便进行协商参数的步骤,即根据蓝牙发射端和蓝牙接收端的参数判断该蓝牙发射端和蓝牙接收端是否能够支持联合立体声编解码;当蓝牙发射端和蓝牙接收端的参数均符合预设联合立体声的编码标准时,表示该蓝牙发射端和蓝牙接收端支持联合立体声编解码,即对左右声道的左声道谱系数与右声道谱系数进行联合编码。
图2示出了本申请一种联合立体声音频编码方法中发射端与接收端参数配置对应关系的可选实例。
根据图2所示的实例,在开始播放音乐时,首先在蓝牙发射端和蓝牙接收端协商参数,即将音频格式、采样率、码率范围均与预设联合立体声的编码标准进行比较,判断上述参数是否符合预设联合立体声的编码标准,以获知蓝牙发射端和蓝牙接收端是否支持联合立体声编码;若蓝牙发射端和蓝牙接收端都支持联合立体声,则在蓝牙发射端选择联合立体声编码、在蓝牙接收端选择联合立体声解码,否则,选择普通模式的编码与解码。
在本申请的一个可选实施例中,对符合编码标准的配置参数对应左右声道的左声道谱系数与右声道谱系数进行联合编码,进一步包括:对每一帧符合编码标准的配置参数对应左右声道的左声道谱系数与右声道谱系数设置使能标志;对具有使能标志的左声道谱系数与右声道谱系数进行联合编码。
在该可选实施例中,在判断是否进行联合立体声编码时,对每一帧音频数据均进行判断,以帧级进行联合立体声的编码;判断过后在该帧音频数据中添加使能标志作为该帧符合编码标准的配置参数的标志,在后续的蓝牙接收端,便通过该帧数据是否存在使能标志确定是否进行联合立体声解码,无需再进行第二次参数的判断,减少系统的运算量,提高运算效率。
在本申请的一个可选实例中,在全局使能联合立体声编码时,每帧的输出码流中增加一个bit指示,位于时域噪声整形的码流之后,1:表示当前帧使能,0:表示当前帧不使能;可将上述bit写入side information(辅助信息)的最后;其中Side information(辅助信息)是蓝牙编码输出码流的一部分,主要用来存储一些帧级的信息,如带宽、全局增益和TNS激活标志等。
在图1所示的可选实施方式中,联合立体声音频编码方法,还包括步骤S102,将左声道谱系数与右声道谱系数进行联合编码,获取左声道对应的左声道联合编码数据与右声道对应的右声道联合编码数据。
在该可选实施方式中,对具有使能标志的左声道谱系数与右声道谱系数进行联合编码,获取左声道对应的左声道联合编码数据与右声道对应的右声道联合编码数据,使得编码过程的压缩效率提高,码率降低。
在本申请的一个可选实施例中,将左声道谱系数与右声道谱系数进行联合编码,获取左声道对应的左声道联合编码数据与右声道对应的右声道联合编码数据,进一步包括:分别计算左声道谱系数与右声道谱系数的平坦度;将左右声道间的谱平坦度差异与预设门限值进行比较;当谱平坦度差异小于或等于预设门限值时,对谱平坦度差异对应的冗余进行消除,获取左声道联合编码数据与右声道联合编码数据;其中,谱平坦度差异与冗余是一对成反比的参数,即差异越小,冗余越大。
在该可选实施例中,本方案的联合立体声编码即为对左声道谱系数与右声道谱系数进行平坦度计算,根据左声道与右声道平坦度之间的相关程度,进行联合立体声判决,当两个平坦度越接近表示两者之间的相关程度越高,即两个声道之间的冗余越多,通过联合立体声处理消除冗余,获取左声道联合编码数据与右声道联合编码数据。优选地,利用门限值判断平坦度及冗余的大小,其中门限值地可取范围为0.05~0.1。
在本申请的一个可选实例中,联合立体声判决公式如下:
计算获取左右声道谱系数之间的差异,其计算公式如下:
其中,Xf,Left-Joint(k)即为基于左声道计算获取的左右声道谱系数之间的差异,Xf,Right-Joint(k)即为基于右声道计算获取的左右声道谱系数之间的差异,Xf,Left(k)即为左声道谱系数,Xf,Right(k)即为右声道谱系数,NE即为有效编码谱线的数量。
当谱系数的平坦度差异很小时,则其大部分值都是0或接近于0的小值,在码率分配时可以分配较低的码率即可确保音质。例如,双声道总码率为240kbps,现有技术会平均分配给左右声道各120kbps,采用联合立体声编码后,新的左声道Xf,Left-Joint可以继续分配120kpbs,而新的右声道Xf,Right-Joint只需分配较低的码率,譬如64kbps或更低,节省了码率从而节省了空中传输带宽,减少了干扰,提高了用户体验。
而,若此时该帧音频数据不能使用联合立体声编码,则直接拷贝赋值:
Xf,Left-Joint(k)=Xf,Left(k),k=0...NE-1
Xf,Right-Joint(k)=Xf,Right(k),k=0...NE-1
其中,Xf,Left-Joint(k)即为基于左声道计算获取的左右声道谱系数之间的差异,Xf,Right-Joint(k)即为基于右声道计算获取的左右声道谱系数之间的差异,Xf,Left(k)即为左声道谱系数,Xf,Right(k)即为右声道谱系数,NE即为有效编码谱线的数量。
在本申请的一个可选实施例中,分别计算左声道谱系数与右声道谱系数的平坦度,进一步包括:分别计算左声道谱系数与右声道谱系数的伪谱,获得左声道对应的左声道伪谱与右声道谱系数对应的右声道伪谱;对左声道伪谱与右声道伪谱分别进行平坦度计算,获取左声道平坦度与右声道平坦度。
在该可选实施例中,由于本方案直接在蓝牙解码过程中,对低延迟改进型离散余弦逆变换之前的谱系数进行联合立体声编码,而直接利用低延迟改进型离散余弦变换获取的谱系数计算获取平坦度的准确度不是很高,使得在联合立体声判决时容易造成误判。以正弦波为例,利用离散傅里叶变换得到的谱系数,其谱系数与正弦波的频率有较为准确的对应关系,计算得到的平坦度能够较为准确的表达该帧音频数据的增益;而利用低延迟改进型离散余弦变换得到的谱系数,其谱系数与正弦波的频率有偏差,所以计算得到的平坦度的准确度不是很高,所以本方案加入伪谱计算的过程,进而计算伪谱的平坦度,使得实现较为准确的表达该帧音频数据的增益的效果。
在本申请的一个可选实施例中,对左声道伪谱与右声道伪谱分别进行平坦度计算,获取左声道平坦度与右声道平坦度,进一步包括:分别计算左声道伪谱与右声道伪谱的几何平均值;分别计算所述左声道伪谱与右声道伪谱的算术平均值;根据几何平均值与算术平均值计算获得左声道平坦度与右声道平坦度。
在该可选实施例中,在根据上述时域噪声整形模块获取的左声道谱系数与右声道谱系数,计算左声道谱系数与右声道谱系数的伪谱,其计算公式如下:
其中X(k)=0,当k=-1或NF时
其中,Xpseudo(k)即为谱系数的伪谱,X(k)为谱系数,NF即为谱系数的序列号。
根据上述计算获取的伪谱,计算伪谱的几何平均值,其计算公式如下:
其中,Psuedo_geo_mrean即为几何平均值,Xpseudo(k)即为伪谱,NF即为谱系数的序列号。
根据上述计算获取的伪谱,计算伪谱的算术平均值,其计算公式如下:
其中,Psuedo_algo_mean即为算术平均值,Xpseudo(k)即为伪谱,NF即为谱系数的序列号。
根据上述计算获取的几何平均值与算术平均值分别计算左右声道的平坦度,其计算公式如下:
其中,Pseudo_spec_flatness即为平坦度,Psuedo_geo_mean即为几何平均值,Psuedo_algo_mean即为算术平均值。
在图1所示的可选实施方式中,联合立体声音频编码方法,还包括步骤S103,对左声道联合编码数据与右声道联合编码数据分别根据标准蓝牙编码步骤进行剩余编码步骤,获取左声道与右声道分别对应的码流。
在该可选实施方式中,对上述确定的左声道联合编码数据与右声道联合编码数据进行剩余的编码步骤,直至码流封装步骤获取联合立体声对应的码流,并且将该码流输出至蓝牙接收端。
图3示出了本申请一种联合立体声音频编码方法的编码流程的一个可选实例。
在蓝牙发射端,首先根据标准的编码流程分别对做左声道音频数据与右声道音频数据进行低延迟改进型离散余弦变换、变换域噪声整形以及时域噪声整形,获取对应的频域数据,在频域对左右声道进行联合立体声编码,获取左声道联合编码数据与右声道联合编码数据,之后根据标准的编码流程继续进行量化、噪声电平估计、算术与残差编码、码流封装等步骤直至编码完成。
图4示出了本申请一种联合立体声音频编码装置的可选实施方式。
在图4所示的可选实施方式中,联合立体声音频编码装置主要包括:用于对左右声道的蓝牙音频分别根据标准蓝牙编码步骤编码至时域噪声整形模块401,获取左右声道分别对应的左声道谱系数与右声道谱系数的模块;用于将左声道谱系数与右声道谱系数进行联合编码,获取左声道对应的左声道联合编码数据与右声道对应的右声道联合编码数据的模块402;以及用于对左声道联合编码数据与右声道联合编码数据分别根据标准蓝牙编码步骤进行剩余编码步骤,获取左声道与右声道分别对应的码流的模块403。
在本申请的一个可选实施例中,本申请一种联合立体声音频编码装置中各功能模块可直接在硬件中、在由处理器执行的软件模块中或在两者的组合中。
软件模块可驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可装卸盘、CD-ROM或此项技术中已知的任何其它形式的存储介质中。示范性存储介质耦合到处理器,使得处理器可从存储介质读取信息和向存储介质写入信息。
处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)、现场可编程门阵列(英文:Field Programmable Gate Array,简称:FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其任何组合等。通用处理器可以是微处理器,但在替代方案中,处理器可以是任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器或任何其它此类配置。在替代方案中,存储介质可与处理器成一体式。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替代方案中,处理器和存储介质可作为离散组件驻留在用户终端中。
本申请提供的联合立体声音频编码装置,可用于执行上述任一实施例描述的联合立体声音频编码方法,其实现原理和技术效果类似,在此不再赘述。
图5示出了本申请一种联合立体声音频解码方法的可选实施方式。
在图5所示可选实施方式中,联合立体声音频解码方法,包括步骤S501,根据标准蓝牙解码步骤解码经联合立体声音频编码方法获取的码流至全局增益模块,获取左右声道分别对应的左声道解码谱系数与右声道解码谱系数;步骤S502,将左声道解码谱系数与右声道解码谱系数进行联合立体声解码,获取左声道对应的左声道联合立体声解码数据与右声道对应的右声道解码编码数据;以及步骤S503,对左声道联合立体声解码数据与右声道联合立体声解码数据分别根据标准蓝牙解码步骤进行剩余解码步骤,获取左声道与右声道分别对应的目标音频。
在本申请的一个可选实施例中,将左声道解码谱系数与右声道解码谱系数进行联合立体声解码,获取左声道对应的左声道联合立体声解码数据与右声道对应的右声道解码编码数据之前,还包括:分别对左声道解码谱系数与右声道解码谱系数是否存在使能标志进行检测;对存在使能标志的左声道解码谱系数与右声道解码谱系数进行联合立体声解码。
在该可选实施例中,首先判断蓝牙接收端接收到的单帧码流是否存在使能标志,当存在使能标志或能够使能时即表示该帧码流可进行联合立体声解码,其解码公式如下:
当不存在使能标志或不能够使能时即表示该帧码流不可进行联合立体声解码,则不处理该帧频域数据,其解码公式如下:
图6示出了本申请一种联合立体声音频解码方法的解码流程的一个可选实例。
在蓝牙接收端,首先根据标准的解码流程分别对做左声道码流与右声道码流进行码流解析、算术及残差解码、噪声填充及全局增益等解码步骤,获取对应的频域数据,在频域对左右声道进行联合立体声解码,获取左声道联合解码数据与右声道联合解码数据,之后根据标准的编码流程继续进行时域噪声整形解码、变换域噪声整形解码、变换域噪声整形解码、低延迟改进型离散余弦反变换等步骤直至解码完成。
本申请提供的联合立体声音频解码方法,可用于执行上述任一实施例描述的联合立体声音频编码方法相对应的解码方法,其实现原理和技术效果类似,在此不再赘述。
图7示出了本申请一种联合立体声音频解码装置的可选实施方式。
在图7所示的可选实施方式中,联合立体声音频解码装置主要包括:用于根据标准蓝牙解码步骤解码经联合立体声音频编码方法获取的码流至全局增益模块,获取左右声道分别对应的左声道解码谱系数与右声道解码谱系数的模块701;用于将左声道解码谱系数与右声道解码谱系数进行联合立体声解码,获取左声道对应的左声道联合立体声解码数据与右声道对应的右声道解码编码数据的模块702;以及用于对左声道联合立体声解码数据与右声道联合立体声解码数据分别根据标准蓝牙解码步骤进行剩余解码步骤,获取左声道与右声道分别对应的目标音频的模块703。
本申请提供的联合立体声音频解码装置,可用于执行上述任一实施例描述的联合立体声音频编码方法或联合立体声音频解码方法,其实现原理和技术效果类似,在此不再赘述。
在本申请的另一个可选实施方式中,一种计算机可读存储介质,其存储有计算机指令,计算机指令被操作以执行上述实施例中描述的联合立体声音频编码方法或联合立体声音频解码方法。
在本申请的一个可选实施方式中,一种计算机设备,其包括:至少一个处理器;以及与至少一个处理器进行通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的计算机指令,至少一个处理器操作计算机指令以执行上述实施例中描述的联合立体声音频编码方法或联合立体声音频解码方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述仅为本申请的实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种联合立体声音频编码方法,其特征在于,包括:
对左右声道的蓝牙音频分别根据标准蓝牙编码步骤编码至时域噪声整形模块,获取所述左右声道分别对应的左声道谱系数与右声道谱系数;
将所述左声道谱系数与所述右声道谱系数进行联合编码,获取所述左声道对应的左声道联合编码数据与所述右声道对应的右声道联合编码数据;以及
对所述左声道联合编码数据与所述右声道联合编码数据分别根据所述标准蓝牙编码步骤进行剩余编码步骤,获取所述左声道与所述右声道分别对应的码流。
2.根据权利要求1所述的联合立体声音频编码方法,其特征在于,所述将所述左声道谱系数与所述右声道谱系数进行联合编码,获取所述左声道对应的左声道联合编码数据与所述右声道对应的右声道联合编码数据,进一步包括:
分别计算所述左声道谱系数与所述右声道谱系数的平坦度;
将所述左右声道间的谱平坦度差异与预设门限值进行比较;
当所述谱平坦度差异小于或等于所述预设门限值时,对所述谱平坦度差异对应的冗余进行消除,获取所述左声道联合编码数据与所述右声道联合编码数据。
3.根据权利要求2所述的联合立体声音频编码方法,其特征在于,所述分别计算所述左声道谱系数与所述右声道谱系数的平坦度,进一步包括:
分别计算所述左声道谱系数与所述右声道谱系数的伪谱,获得所述左声道对应的左声道伪谱与所述右声道谱系数对应的右声道伪谱;
对所述左声道伪谱与所述右声道伪谱分别进行平坦度计算,获取所述左声道平坦度与所述右声道平坦度。
4.根据权利要求3所述的联合立体声音频编码方法,其特征在于,所述对所述左声道伪谱与所述右声道伪谱分别进行平坦度计算,获取所述左声道平坦度与所述右声道平坦度,进一步包括:
分别计算所述左声道伪谱与所述右声道伪谱的几何平均值;
分别计算所述左声道伪谱与所述右声道伪谱的算术平均值;
根据所述几何平均值与所述算术平均值计算获得所述左声道平坦度与所述右声道平坦度。
5.根据权利要求1所述的联合立体声音频编码方法,其特征在于,所述将所述左声道谱系数与所述右声道谱系数进行联合编码,获取所述左声道对应的左声道联合编码数据与所述右声道对应的右声道联合编码数据之前,还包括:
分别提取所述左右声道具有蓝牙匹配关系的蓝牙发射端与蓝牙接收端的配置参数;
根据所述配置参数与预设联合立体声的编码标准的关系,对符合所述编码标准的所述配置参数对应所述左右声道的所述左声道谱系数与所述右声道谱系数进行联合编码。
6.根据权利要求5所述的联合立体声音频编码方法,其特征在于,所述对符合所述编码标准的所述配置参数对应所述左右声道的所述左声道谱系数与所述右声道谱系数进行联合编码,进一步包括:
对每一帧符合所述编码标准的所述配置参数对应所述左右声道的所述左声道谱系数与所述右声道谱系数设置使能标志;
对具有所述使能标志的所述左声道谱系数与所述右声道谱系数进行联合编码。
7.一种联合立体声音频解码方法,其特征在于,包括:
根据标准蓝牙解码步骤解码经权利要求1所述的联合立体声音频码方法获取的码流至全局增益模块,获取所述左右声道分别对应的左声道解码谱系数与右声道解码谱系数;
将所述左声道解码谱系数与所述右声道解码谱系数进行联合立体声解码,获取所述左声道对应的左声道联合立体声解码数据与所述右声道对应的右声道解码编码数据;以及
对所述左声道联合立体声解码数据与所述右声道联合立体声解码数据分别根据所述标准蓝牙解码步骤进行剩余解码步骤,获取所述左声道与所述右声道分别对应的目标音频。
8.根据权利要求7所述的联合立体声音频解码方法,其特征在于,所述将所述左声道解码谱系数与所述右声道解码谱系数进行联合立体声解码,获取所述左声道对应的左声道联合立体声解码数据与所述右声道对应的右声道解码编码数据之前,还包括:
分别对所述左声道解码谱系数与所述右声道解码谱系数是否存在使能标志进行检测;
对存在所述使能标志的所述左声道解码谱系数与所述右声道解码谱系数进行联合立体声解码。
9.一种联合立体声音频编码装置,其特征在于,包括:
用于对左右声道的蓝牙音频分别根据标准蓝牙编码步骤编码至时域噪声整形模块,获取所述左右声道分别对应的左声道谱系数与右声道谱系数的模块;
用于将所述左声道谱系数与所述右声道谱系数进行联合编码,获取所述左声道对应的左声道联合编码数据与所述右声道对应的右声道联合编码数据的模块;以及
用于对所述左声道联合编码数据与所述右声道联合编码数据分别根据所述标准蓝牙编码步骤进行剩余编码步骤,获取所述左声道与所述右声道分别对应的码流的模块。
10.一种联合立体声音频解码装置,其特征在于,包括:
用于根据标准蓝牙解码步骤解码经权利要求1所述的联合立体声音频解码方法获取的码流至全局增益模块,获取所述左右声道分别对应的左声道解码谱系数与右声道解码谱系数的模块;
用于将所述左声道解码谱系数与所述右声道解码谱系数进行联合立体声解码,获取所述左声道对应的左声道联合立体声解码数据与所述右声道对应的右声道解码编码数据的模块;以及
用于对所述左声道联合立体声解码数据与所述右声道联合立体声解码数据分别根据所述标准蓝牙解码步骤进行剩余解码步骤,获取所述左声道与所述右声道分别对应的目标音频的模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210989905.0A CN115346540A (zh) | 2022-08-18 | 2022-08-18 | 一种联合立体声音频编解码方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210989905.0A CN115346540A (zh) | 2022-08-18 | 2022-08-18 | 一种联合立体声音频编解码方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115346540A true CN115346540A (zh) | 2022-11-15 |
Family
ID=83951878
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210989905.0A Pending CN115346540A (zh) | 2022-08-18 | 2022-08-18 | 一种联合立体声音频编解码方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115346540A (zh) |
-
2022
- 2022-08-18 CN CN202210989905.0A patent/CN115346540A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6859423B2 (ja) | チャネル間時間差を推定する装置及び方法 | |
RU2560790C2 (ru) | Параметрическое кодирование и декодирование | |
KR101798559B1 (ko) | 스테레오 위상 파라미터 인코딩 방법 및 장치 | |
CN104584122B (zh) | 使用改进的概率分布估计的基于线性预测的音频编码 | |
US9275646B2 (en) | Method for inter-channel difference estimation and spatial audio coding device | |
US10762912B2 (en) | Estimating noise in an audio signal in the LOG2-domain | |
CN113689864B (zh) | 一种音频数据处理方法、装置及存储介质 | |
WO2019029737A1 (zh) | 音频编解码模式确定方法和相关产品 | |
CN114550732A (zh) | 一种高频音频信号的编解码方法和相关装置 | |
KR102288111B1 (ko) | 스테레오 신호의 인코딩 및 디코딩 방법과, 인코딩 및 디코딩 장치 | |
JP7159351B2 (ja) | ダウンミックスされた信号の計算方法及び装置 | |
CN115346540A (zh) | 一种联合立体声音频编解码方法及装置 | |
CN112995425B (zh) | 一种等响度混音方法及装置 | |
WO2019037714A1 (zh) | 立体声信号的编码方法和编码装置 | |
WO2019029736A1 (zh) | 时域立体声编解码方法和相关产品 | |
WO2021000723A1 (zh) | 一种立体声编码方法、立体声解码方法和装置 | |
WO2021000724A1 (zh) | 一种立体声编码方法、立体声解码方法和装置 | |
JP2017058696A (ja) | インターチャネル差分推定方法及び空間オーディオ符号化装置 | |
CN109427337B (zh) | 立体声信号编码时重建信号的方法和装置 | |
CN113129913A (zh) | 音频信号的编解码方法和编解码装置 | |
CN107358961B (zh) | 多声道信号的编码方法和编码器 | |
CN107358960B (zh) | 多声道信号的编码方法和编码器 | |
CN117037816A (zh) | 多声道音频编码方法、系统、介质及设备 | |
CN116129920A (zh) | 骨导语音的编码方法、编解码方法、装置、介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |