CN116129920A - 骨导语音的编码方法、编解码方法、装置、介质及设备 - Google Patents
骨导语音的编码方法、编解码方法、装置、介质及设备 Download PDFInfo
- Publication number
- CN116129920A CN116129920A CN202211700089.3A CN202211700089A CN116129920A CN 116129920 A CN116129920 A CN 116129920A CN 202211700089 A CN202211700089 A CN 202211700089A CN 116129920 A CN116129920 A CN 116129920A
- Authority
- CN
- China
- Prior art keywords
- bone conduction
- conduction voice
- voice
- bandwidth
- time domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 210000000988 bone and bone Anatomy 0.000 title claims abstract description 278
- 238000000034 method Methods 0.000 title claims abstract description 97
- 238000001514 detection method Methods 0.000 claims abstract description 116
- 238000007493 shaping process Methods 0.000 claims abstract description 93
- 238000005070 sampling Methods 0.000 claims description 13
- 238000001228 spectrum Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 8
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000036039 immunity Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005429 filling process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本申请公开了一种骨导语音的编码方法、编解码方法、装置、介质及设备,属于音频编解码技术领域,该编码方法包括:预先对带宽检测参数表进行更新;预先对时域噪声整形编码系数表进行更新;在LC3音频编码过程中,通过更新的带宽检测参数表和更新的时域噪声整形编码系数表对骨导语音进行编码,并在骨导语音频段进行对骨导语音的噪声电平估计过程,完成对骨导语音的编码。本申请通过对LC3编码器中包括带宽检测参数表、时域噪声整形编码系数表等进行更新,使得LC3编码器对骨导语音编码时,能够对骨导语音的低频段部分进行识别,并进行相应的编码处理,实现骨导语音的编码,拓宽LC3音频编解码器的应用范围。
Description
技术领域
本申请涉及音频编解码技术领域,特别涉及一种骨导语音的编码方法、编解码方法、装置、介质及设备。
背景技术
在目前的蓝牙音频编解码器中,作为低功耗蓝牙,LC3音频编解码器的应用越来越广。传统的麦克风(Air Conduction,AC,又称为气导)采集的语音都是经过空气传导的,容易受到背景噪声干扰,骨导(Bone Conduction,BC)麦克风是利用人体骨头振动形成电信号的语音采集设备,可有效避免背景噪声干扰,具有很强抗噪性能,已得到广泛应用。在蓝牙领域,也有很多应用场景,譬如有骨导麦克风的蓝牙耳机。骨导语音也存在缺点,例如包括骨导麦克风采集的语音高频部分缺失、中频部分厚重等现象,语音的清晰度和明亮度不够。目前有一些语音增强算法来提升骨导语音的质量,但同时也会消耗一定的存储资源和运算资源。在一些特殊的环境中,譬如高噪声环境和/或救援救灾中,更关注设备的使用时长,语音通话只要能正常交流即可,而骨导语音增强会消耗一定的算力,减少设备使用的时间,此种场景期望直接用骨导语音交流。其中,在LE Audio中,LC3为主流的编解码器,其输入语音的条件是:语音是部分带宽或全带宽信号;部分带宽的最小值是4kHz。但是由于LC3的带宽检测模块只能检测出最小带宽为4kHz的信号,如果直接用LC3对骨导语音编码,则会导致频谱泄露到2kHz以外的频带,引入额外的噪声。
发明内容
针对在进行LC3音频编解码器对音频进行编解码时,若直接对骨导语音进行编解码,会导致频谱泄露,引入噪声的问题,本申请提出一种骨导语音的编码方法、编解码方法、装置、介质及设备。
第一方面,本申请提出一种骨导语音的编码方法,包括:预先在带宽检测参数表中,增加骨导语音的性质描述,并增加对骨导语音的最小带宽的参数描述,对带宽检测参数表进行更新;预先在时域噪声整形编码系数表中增加骨导语音对应的最小带宽的参数描述,对时域噪声整形编码系数表进行更新;在LC3音频编码过程中,通过更新的带宽检测参数表和更新的时域噪声整形编码系数表对骨导语音进行编码,并在骨导语音频段进行对骨导语音的噪声电平估计过程,完成对骨导语音的编码。
可选的,预先在带宽检测参数表中,增加骨导语音的性质描述,并增加对骨导语音的最小带宽的参数描述,对带宽检测参数表进行更新,包括:根据LC3音频编码数据的音频特性和骨导语音的最小带宽检测要求,在带宽检测参数表中增加对骨导语音的描述,其中音频特性包括编码音频对应的帧长。
可选的,预先在带宽检测参数表中,增加骨导语音的性质描述,并增加对骨导语音的最小带宽的参数描述,对带宽检测参数表进行更新,包括:根据增加的骨导语音的最小带宽检测要求,对带宽检测参数表中不同帧长、不同采样率对应的带宽信息进行更新。
可选的,预先在时域噪声整形编码系数表中增加骨导语音对应的最小带宽的参数描述,对时域噪声整形编码系数表进行更新,包括:根据LC3音频编码数据的音频特性和骨导语音对应的最小带宽,在时域噪声整形编码系数表中增加相应的参数配置,使得根据带宽检测的结果对骨导语音划分频段进行时域噪声整形分析。
第二方面,本申请提出一种骨导语音的编解码方法,包括:预先在带宽检测参数表中,增加骨导语音的性质描述,并增加对骨导语音的最小带宽的参数描述,对带宽检测参数表进行更新;预先在时域噪声整形编码系数表中增加骨导语音对应的最小带宽的参数描述,对时域噪声整形编码系数表进行更新;在LC3音频编码的带宽检测过程中,通过更新的带宽检测参数表和更新的时域噪声整形编码系数表对骨导语音进行编码,并在骨导语音频段进行对骨导语音的噪声电平估计过程,完成对骨导语音的编码;在对编码后的骨导语音解码时,根据更新的带宽截止频率对编码后的骨导语音进行噪声填充;根据骨导语音的带宽,预先对时域噪声整形解码起止谱系数索引表进行更新,并利用更新后的时域噪声整形解码起止谱系数索引表对编码后的骨导语音进行解码。
第三方面,本申请提出一种骨导语音的编码装置,包括:带宽检测模块,在LC3音频编码过程中,利用更新的带宽检测参数表对骨导语音进行带宽检测;时域噪声整形模块,利用更新的时域噪声整形编码系数表对骨导语音进行编码;噪声电平估计模块,在骨导语音频段进行对骨导语音的噪声电平估计过程,其中预先在带宽检测参数表中,增加骨导语音的性质描述,并增加对骨导语音的最小带宽的参数描述,得到更新的带宽检测参数表;预先在时域噪声整形编码系数表中增加骨导语音对应的最小带宽的参数描述,得到更新的时域噪声整形编码系数表。
第四方面,本申请提供一种计算机可读存储介质,其存储有计算机程序,其中计算机程序被操作以执行方案一中的骨导语音的编码方法或方案二中的骨导语音的编解码方法。
第五方面,本申请提供一种计算机设备,其包括处理器和存储器,存储器存储有计算机程序,其中处理器操作计算机程序以执行方案一中的骨导语音的编码方法或方案二中的骨导语音的编解码方法。
本申请的骨导语音的编码方法、编解码方法、装置、介质及设备,通过对LC3编码器中包括带宽检测参数表、时域噪声整形编码系数表等进行更新,使得LC3编码器对骨导语音编码时,能够对骨导语音的低频段部分进行识别,并进行相应的编码处理,实现骨导语音的编码,拓宽LC3音频编解码器的应用范围。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图示例性的示出了本申请的一些实施例。
图1是本申请骨导语音的编码方法的一个实施方式的示意图;
图2是本申请骨导语音编解码过程的一个实例的示意图;
图3是在本申请一种骨导语音的编解码方法的一个实施方式的示意图;
图4是本申请骨导语音的编码装置的一个实施方式的示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
下面结合附图对本申请的较佳实施例进行详细阐述,以使本申请的优点和特征能更易于被本领域技术人员理解,从而对本申请的保护范围做出更为清楚明确的界定。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
在目前的蓝牙音频编解码器中,作为低功耗蓝牙,LC3音频编解码器的应用越来越广。传统的麦克风(Air Conduction,AC,又称为气导)采集的语音都是经过空气传导的,容易受到背景噪声干扰,骨导(Bone Conduction,BC)麦克风是利用人体骨头振动形成电信号的语音采集设备,可有效避免背景噪声干扰,具有很强抗噪性能,已得到广泛应用。在蓝牙领域,也有很多应用场景,譬如有骨导麦克风的蓝牙耳机。骨导语音的也有缺点,诸如骨导麦克风采集的语音高频部分缺失、中频部分厚重等现象,语音的清晰度和明亮度不够。目前有一些语音增强算法来提升骨导语音的质量,但同时也会消耗一定的存储资源和运算资源。在一些特殊的环境中,譬如高噪声环境和/或救援救灾中,更关注设备的使用时长,语音通话只要能正常交流即可,而骨导语音增强会消耗一定的算力,减少设备使用的时间,此种场景期望直接用骨导语音交流。其中,在LE Audio中,LC3为主流的编解码器,其输入语音的条件是:语音是部分带宽或全带宽信号;部分带宽的最小值是4kHz。但是由于LC3的带宽检测模块只能检测出最小带宽为4kHz的信号,如果直接用LC3对骨导语音编码,则会导致频谱泄露到2kHz以外的频带,引入额外的噪声。
针对上述问题,本申请提出一种骨导语音的编码方法、编解码方法、装置、介质及设备,该编码方法包括:预先在带宽检测参数表中,增加骨导语音的性质描述,并增加对骨导语音的最小带宽的参数描述,对带宽检测参数表进行更新;预先在时域噪声整形编码系数表中增加骨导语音对应的最小带宽的参数描述,对时域噪声整形编码系数表进行更新;在LC3音频编码过程中,通过更新的带宽检测参数表和更新的时域噪声整形编码系数表对骨导语音进行编码,并在骨导语音频段进行对骨导语音的噪声电平估计过程,完成对骨导语音的编码。
本申请通过对LC3编码器中包括带宽检测参数表、时域噪声整形编码系数表等进行更新,使得LC3编码器对骨导语音编码时,能够对骨导语音的低频段部分进行识别,并进行相应的编码处理,实现骨导语音的编码,拓宽LC3音频编解码器的应用范围。
下面,以具体的实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面述及的具体的实施例可以相互结合形成新的实施例。对于在一个实施例中描述过的相同或相似的思想或过程,可能在其他某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图1是本申请骨导语音的编码方法的一个实施方式的示意图。
在图1所示的实施方式中,本申请的骨导语音的编码方法包括过程S101,预先在带宽检测参数表中,增加骨导语音的性质描述,并增加对骨导语音的最小带宽的参数描述,对带宽检测参数表进行更新。
在该实施方式中,在利用LC3编解码器对骨导语音进行编解码时,由于骨导语音具有更低的带宽,而LC3音频编码器所能够检测到的部分带宽的最小值为4KHz,大于骨导语音的带宽,若直接对骨导语音进行编码会造成频谱的泄露。因此,为了能够对骨导语音进行完整的识别,预先在LC3音频编码器的带宽检测模块中,对带宽检测参数表进行更新,增加对骨导语音的相关性质描述,增加对骨导语音的最小带宽的参数描述,从而使得在LC3编码器对骨导语音进行编码时,通过带宽检测模块能够完整检测出骨导语音中较低带宽的部分,避免频谱的泄露。
可选的,预先在带宽检测参数表中,增加骨导语音的性质描述,并增加对骨导语音的最小带宽的参数描述,对带宽检测参数表进行更新,包括:根据LC3音频编码数据的音频特性和骨导语音的最小带宽检测要求,在带宽检测参数表中增加对骨导语音的描述,其中音频特性包括编码音频对应的帧长。
在该可选实施例中,为了实现在LC3音频编码器中对骨导语音的低带宽进行检测,在带宽检测参数表中增加相应的描述。其中,在LC3音频编码器中,编码音频分为10ms帧长和7.5ms帧长,同理在增加的骨导语音的描述中,也按照这两种帧长分别增加相应的描述。另外,对于骨导语音,当采样频率是8kHz,那么其对应的语音带宽约为2kHz,小于LC3音频编码器中4kHz的最小识别带宽。因此,在带宽检测参数表中,需要将该2kHz的最低带宽进行添加。
可选的,预先在带宽检测参数表中,增加骨导语音的性质描述,并增加对骨导语音的最小带宽的参数描述,对带宽检测参数表进行更新,包括:根据增加的骨导语音的最小带宽检测要求,对带宽检测参数表中不同帧长、不同采样率对应的带宽信息进行更新。
在该可选实施例中,由于新增加了骨导语音在采样频率是8kHz情况下,2kHz的最低带宽要求。因为在LC3音频编码器对音频的编码过程中,常见的采样率除了8kHz外,还包括16kHz、24kHz以及48kHz等多种采样率,因此也需要将不同采样率对应的带宽检测参数进行更新,使得在不同采样考虑下,LC3音频编码器均能够对骨导语音完成编码。
具体的,表1是LC3编码器中带宽检测参数表的标准格式,表2为对增加骨导语音的相关描述,更新后带宽检测参数表,具体如下:
表1:LC3编码器中带宽检测参数表
表2:更新后的带宽检测参数表
如表2中所示,表2与表1相比,表中添加阴影加粗的部分为新增加或者进行参数改变的部分,通过带宽检测参数表的更新,实现LC3编码器对骨导语音的识别,然后进行有效的编码,避免频谱的泄露。下面对更新的带宽检测参数表进行简单说明:
表2中Nms表示帧长,fs表示采样率,Nbw表示带宽索引,Ibw start和Ibw stop分别表示起止带宽索引,Bandwidth(Pbw)表示带宽分类,nbitsbw表示信息传输所需要的比特数。其中,表2中的第一行和第七行为新增加的配置,表示输入语音是采样率为8kHz,帧长分别为10ms或7.5ms,有效带宽为2kHz的骨导语音。表2中的第二行与表1相比,在表1的标准规范中,NB是最小的带宽,所以在表1中的nbitsbw为0,即不用传输任何比特。在本申请的方案中,对带宽检测参数表更新后,带宽有两种可能HNB和NB,所以需要1个bit来传输,即0表示HNB,1表示NB。在标准规范中,此处的Ibw start和Ibw stop没有定义,因为不需要检测NB的带宽,而在本申请的方案中,不需要检测HNB的带宽,但需要检测NB的带宽。
在表2的第三行中,标准规范中只有NB和WB,需要1个比特,本发明增加了HNB,需要2个比特表示。在表2的第四行中,Nbw为带宽索引,标准规范中用0、1、2、3、4代表NB、WB、SSWB、SWB、FB,此处用0、1、2、3、4、5代表HNB、NB、WB、SSWB、SWB、FB。关于表2中的其他更新,参照上述的说明,原理一致,在此不进行赘述。
针对原始参数表中带宽NB对应的8kHz配置,增加起止带宽索引,如表2中阴影加粗部分,用来检测当前帧带宽是否为NB。标准规范中并没有直接检测NB的带宽,而是间接检测,举例来说,如果当前配置为采样率24kHz、帧长10ms,则其带宽可能是SSWB(12kHz)、WB(8kHz)或NB(4kHz),其标准检测方式为:首先检测是否为SSWB,如果是则结束,如果不是则再检测是否为WB,如果是则带宽为WB,如果不是则其为NB。由于现在增加了一个带宽配置HNB(对应2kHz带宽),所以新的检测方式为:检测是否为SSWB,如果是则结束,如果不是再检测是否为WB,如果是则结束,如果不是再检测是否为NB,如果是则带宽为NB,如果不是则带宽为HNB。
上述阴影部分的索引,以10ms、8000Hz的配置为例,Ibw start为{41,0,0,0},Ibw stop为{59,0,0,0},其中41对应谱系数索引41,对应频率2050Hz,59对应谱系数索引69,对应频率3450Hz即检测2050Hz与3450Hz间是否有相当的能量,如果有,则为NB。7.5ms、8000Hz的配置类同,不再赘述。具体的带宽检测方法与标准相同,只需要在执行带宽检测时使用上述更新的表格参数即可,不再赘述。
在图1所示的实施方式中,本申请的骨导语音的编码方法包括过程S102,预先在时域噪声整形编码系数表中增加骨导语音对应的最小带宽的参数描述,对时域噪声整形编码系数表进行更新。
在该实施方式中,在对带宽检测参数表进行更新后,需要对时域噪声整形编码系数表进行更新,通过增加骨导语音对应的最小带宽的参数描述,使得能够对骨导语音进行时域噪声整形处理。
可选的,预先在时域噪声整形编码系数表中增加骨导语音对应的最小带宽的参数描述,对时域噪声整形编码系数表进行更新,包括:根据LC3音频编码数据的音频特性和骨导语音对应的最小带宽,在时域噪声整形编码系数表中增加相应的参数配置,使得根据带宽检测的结果对骨导语音划分频段进行时域噪声整形分析。
在该可选实施例中,在对时域噪声整形编码系数表更新时,根据LC3音频编码数据的10ms帧长和7.5ms帧长的特点,以及骨导语音的最低带宽的要求,对时域噪声整形编码系数表进行更新,使得时域噪声整形模块能够对骨导语音配置并得到正确的结果。
具体的,在表3中示出了更新后的时域噪声整形编码系数表。
表3:更新后的时域噪声整形编码系数表
如表3所示,阴影及加粗部分为在帧长10ms或7.5ms下,骨导语音对应的配置。通过对时域噪声整形编码系数表进行更新,使得在时域噪声整形滤波时,根据带宽检测的结果划分频段进行时域噪声整形分析。此处的更新使得时域噪声整形模块能够对骨导语音配置并得到正确的结果。
在图1所示的实施方式中,本申请的骨导语音的编码方法包括过程S103,在LC3音频编码过程中,通过更新的带宽检测参数表和更新的时域噪声整形编码系数表对骨导语音进行编码,并在骨导语音频段进行对骨导语音的噪声电平估计过程,完成对骨导语音的编码。
在该实施方式中,在对骨导语音实际的编码过程中,利用更新后的带宽检测参数表对骨导语音进行完成带宽检测;利用更新后的时域噪声整形编码系数表完成对骨导语音的时域噪声整形过程。另外,在骨导语音的噪声电平估计过程时,利用更新的骨导语音对应的带宽截止频率完成对骨导语音的噪声电平估计。
具体的,表4示出了噪声电平估计的带宽截止频率。
表4:噪声电平估计的带宽截止频率表
在LC3对普通音频的编码过程中,编码音频能对应的带宽仅涉及NB(4kHz)、WB(8kHz)、SSWB(12kHz)、SWB(16kHz)以及FB(20kHz),因为骨导语音的最低带宽达到2KHz,因此增加HNB的频段,保证噪声电平估计过程的正常进行。
具体的,音频的编码和解码过程往往是整体的过程,在编码过程中,通过对各种参数表的更新,实现LC3编码器对骨导语音的正常编码外,在解码阶段,也同样需要进行相应的调整,进而完成对骨导语音编码结果的解码。
具体的,在LC3解码器对骨导语音的解码阶段,在噪声填充过程中,基于编码中更新的新的带宽截止频率表,填充噪声时根据截止频率,避免将谱能量泄露到截止频率外。在时域噪声整形解码过程中,根据更新的时域噪声整形解码起止谱系数索引表进行相应的处理过程,解码时根据带宽信息对谱系数进行滤波,避免谱能量泄露到有效带宽外。
具体的,表5示出了在解码时的时域噪声整形解码起止谱系数索引表的内容。
表5:时域噪声整形解码起止谱系数索引表
如表5所示,加粗阴影部分为针对骨导语音增加的内容。其中增加的两行参数分别针对10ms帧长和7.5ms帧长的编码数据。HNB表示骨导语音对应的带宽2KHz,start_freq(f)和stop_freq(f)分别代表起止谱系数索引。
具体的,图2是本申请骨导语音编解码过程的一个实例的示意图。
在图2所示的实例中,本申请的LC3音频编解码器可支持对骨导语音的编码,也支持对普通语音的编码。在对语音开始进行编码解码时,在语音的编码端和解码端进行编解码模式的协商,如果在音频的编码端和音频的解码端均支持骨导语音,且此时发射端也就是编码端进行编码的语音为骨导语音,则在编码端和解码端均选择骨导语音编解码模式进行对骨导语音的编解码过程。如果在编码端和解码端仅有编码端或解码端支持对骨导语音的编码或解码,则无法对骨导语音进行编解码,只能选择普通语音编解码模式对普通语音进行编解码过程。
本申请的骨导语音的编码方法,通过对LC3编码器中包括带宽检测参数表、时域噪声整形编码系数表等进行更新,使得LC3编码器对骨导语音编码时,能够对骨导语音的低频段部分进行识别,并进行相应的处理,实现骨导语音的编码,另外在对骨导语音的解码过程中,根据编码时对骨导语音的处理,在噪声填充及时域噪声整形解码过程中也均进行适当的调整,完成对骨导语音的解码,拓宽LC3音频编解码器的应用范围。
图3是在本申请一种骨导语音的编解码方法的一个实施方式的示意图。
在图3所示的实施方式中,本申请的骨导语音的编解码方法包括过程S301,预先在带宽检测参数表中,增加骨导语音的性质描述,并增加对骨导语音的最小带宽的参数描述,对带宽检测参数表进行更新;过程S302,预先在时域噪声整形编码系数表中增加骨导语音对应的最小带宽的参数描述,对时域噪声整形编码系数表进行更新;过程S303,在LC3音频编码的带宽检测过程中,通过更新的带宽检测参数表和更新的时域噪声整形编码系数表对骨导语音进行编码,并在骨导语音频段进行对骨导语音的噪声电平估计过程,完成对骨导语音的编码;过程S304,在对编码后的骨导语音解码时,根据更新的带宽截止频率对编码后的骨导语音进行噪声填充;过程S305,根据骨导语音的带宽,预先对时域噪声整形解码起止谱系数索引表进行更新,并利用更新后的时域噪声整形解码起止谱系数索引表对编码后的骨导语音进行解码。
可选的,预先在带宽检测参数表中,增加骨导语音的性质描述,并增加对骨导语音的最小带宽的参数描述,对带宽检测参数表进行更新,包括:根据LC3音频编码数据的音频特性和骨导语音的最小带宽检测要求,在带宽检测参数表中增加对骨导语音的描述,其中音频特性包括编码音频对应的帧长。
可选的,预先在带宽检测参数表中,增加骨导语音的性质描述,并增加对骨导语音的最小带宽的参数描述,对带宽检测参数表进行更新,包括:根据增加的骨导语音的最小带宽检测要求,对带宽检测参数表中不同帧长、不同采样率对应的带宽信息进行更新。
可选的,预先在时域噪声整形编码系数表中增加骨导语音对应的最小带宽的参数描述,对时域噪声整形编码系数表进行更新,包括:根据LC3音频编码数据的音频特性和骨导语音对应的最小带宽,在时域噪声整形编码系数表中增加相应的参数配置,使得根据带宽检测的结果对骨导语音划分频段进行时域噪声整形分析。
本申请的骨导语音的编解码方法,通过对LC3编码器中包括带宽检测参数表、时域噪声整形编码系数表等进行更新,使得LC3编码器对骨导语音编码时,能够对骨导语音的低频段部分进行识别,并进行相应的处理,实现骨导语音的编码,另外在对骨导语音的解码过程中,根据编码时,对骨导语音的处理,在噪声填充及时域噪声整形解码过程中也均进行适当的调整,完成对骨导语音的解码,拓宽LC3音频编解码器的应用范围。
图4是本申请骨导语音的编码装置的一个实施方式的示意图。
在图4所示的实施方式中,本申请的骨导语音的编码装置包括:带宽检测模块401,在LC3音频编码过程中,利用更新的带宽检测参数表对骨导语音进行带宽检测;时域噪声整形模块402,利用更新的时域噪声整形编码系数表对骨导语音进行编码;噪声电平估计模块403,在骨导语音频段进行对骨导语音的噪声电平估计过程。
可选的,预先在带宽检测参数表中,增加骨导语音的性质描述,并增加对骨导语音的最小带宽的参数描述,得到更新的带宽检测参数表,包括:根据LC3音频编码数据的音频特性和骨导语音的最小带宽检测要求,在带宽检测参数表中增加对骨导语音的描述,得到更新的带宽检测参数表,其中音频特性包括编码音频对应的帧长。
可选的,预先在时域噪声整形编码系数表中增加骨导语音对应的最小带宽的参数描述,得到更新的时域噪声整形编码系数表,包括:根据LC3音频编码数据的音频特性和骨导语音对应的最小带宽,在时域噪声整形编码系数表中增加相应的参数配置,得到更新的时域噪声整形编码系数表,使得在时域噪声整形模块中,根据带宽检测的结果对骨导语音划分频段进行时域噪声整形分析。
在实际的编码和解码过程中,是多种模块共同处理的结果,上述仅仅示出了针对骨导语音编码时,主要作出调整的模块,对于在对普通语音编码时有着相同处理过程的模块,本申请没有一一列出。
本申请的骨导语音的编解码装置,通过对LC3编码器中包括带宽检测参数表、时域噪声整形编码系数表等进行更新,使得LC3编码器对骨导语音编码时,能够对骨导语音的低频段部分进行识别,并进行相应的处理,实现骨导语音的编码,另外在对骨导语音的解码过程中,根据编码时,对骨导语音的处理,在噪声填充及时域噪声整形解码过程中也均进行适当的调整,完成对骨导语音的解码,拓宽LC3音频编解码器的应用范围。
在本申请的一个实施方式中,一种计算机可读存储介质,其存储有计算机指令,其中计算机指令被操作以执行任一实施例描述的骨导语音的编码方法或骨导语音的编解码方法。其中,该存储介质可直接在硬件中、在由处理器执行的软件模块中或在两者的组合中。
软件模块可驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可装卸盘、CD-ROM或此项技术中已知的任何其它形式的存储介质中。示范性存储介质耦合到处理器,使得处理器可从存储介质读取信息和向存储介质写入信息。
处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)、现场可编程门阵列(英文:Field Programmable Gate Array,简称:FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其任何组合等。通用处理器可以是微处理器,但在替代方案中,处理器可以是任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器或任何其它此类配置。在替代方案中,存储介质可与处理器成一体式。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替代方案中,处理器和存储介质可作为离散组件驻留在用户终端中。
在本申请的一个具体实施方式中,一种计算机设备,其包括处理器和存储器,存储器存储有计算机指令,其中:处理器操作计算机指令以执行任一实施例描述的骨导语音的编码方法或骨导语音的编解码方法。
在本申请所提供的实施方式中,应该理解到,所揭露的装置,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上仅为本申请的实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种骨导语音的编码方法,其特征在于,包括:
预先在带宽检测参数表中,增加骨导语音的性质描述,并增加对所述骨导语音的最小带宽的参数描述,对所述带宽检测参数表进行更新;
预先在时域噪声整形编码系数表中增加所述骨导语音对应的最小带宽的参数描述,对所述时域噪声整形编码系数表进行更新;
在LC3音频编码过程中,通过更新的所述带宽检测参数表和更新的所述时域噪声整形编码系数表对所述骨导语音进行编码,并在骨导语音频段进行对所述骨导语音的噪声电平估计过程,完成对所述骨导语音的编码。
2.根据权利要求1所述的骨导语音的编码方法,其特征在于,所述预先在带宽检测参数表中,增加骨导语音的性质描述,并增加对所述骨导语音的最小带宽的参数描述,对所述带宽检测参数表进行更新,包括:
根据LC3音频编码数据的音频特性和所述骨导语音的最小带宽检测要求,在所述带宽检测参数表中增加对所述骨导语音的描述,其中所述音频特性包括编码音频对应的帧长。
3.根据权利要求2所述的骨导语音的编码方法,其特征在于,所述预先在带宽检测参数表中,增加骨导语音的性质描述,并增加对所述骨导语音的最小带宽的参数描述,对所述带宽检测参数表进行更新,包括:
根据增加的所述骨导语音的最小带宽检测要求,对所述带宽检测参数表中不同帧长、不同采样率对应的带宽信息进行更新。
4.根据权利要求1所述的骨导语音的编码方法,其特征在于,所述预先在时域噪声整形编码系数表中增加所述骨导语音对应的最小带宽的参数描述,对所述时域噪声整形编码系数表进行更新,包括:
根据LC3音频编码数据的音频特性和所述骨导语音对应的最小带宽,在所述时域噪声整形编码系数表中增加相应的参数配置,使得根据带宽检测的结果对所述骨导语音划分频段进行时域噪声整形分析。
5.一种骨导语音的编解码方法,其特征在于,包括:
预先在带宽检测参数表中,增加骨导语音的性质描述,并增加对所述骨导语音的最小带宽的参数描述,对所述带宽检测参数表进行更新;
预先在时域噪声整形编码系数表中增加所述骨导语音对应的最小带宽的参数描述,对所述时域噪声整形编码系数表进行更新;
在LC3音频编码的带宽检测过程中,通过更新的所述带宽检测参数表和更新的所述时域噪声整形编码系数表对所述骨导语音进行编码,并在骨导语音频段进行对所述骨导语音的噪声电平估计过程,完成对所述骨导语音的编码;
在对编码后的所述骨导语音解码时,根据更新的带宽截止频率对编码后的所述骨导语音进行噪声填充;
根据所述骨导语音的带宽,预先对时域噪声整形解码起止谱系数索引表进行更新,并利用更新后的时域噪声整形解码起止谱系数索引表对编码后的所述骨导语音进行解码。
6.一种骨导语音的编码装置,其特征在于,包括:
带宽检测模块,在LC3音频编码过程中,利用更新的带宽检测参数表对骨导语音进行带宽检测;
时域噪声整形模块,利用更新的时域噪声整形编码系数表对所述骨导语音进行编码;
噪声电平估计模块,在骨导语音频段进行对所述骨导语音的噪声电平估计过程,其中
预先在所述带宽检测参数表中,增加骨导语音的性质描述,并增加对所述骨导语音的最小带宽的参数描述,得到更新的所述带宽检测参数表;
预先在所述时域噪声整形编码系数表中增加所述骨导语音对应的最小带宽的参数描述,得到更新的所述时域噪声整形编码系数表。
7.根据权利要求6所述的骨导语音的编码装置,其特征在于,所述预先在所述带宽检测参数表中,增加骨导语音的性质描述,并增加对所述骨导语音的最小带宽的参数描述,得到更新的所述带宽检测参数表,包括:
根据LC3音频编码数据的音频特性和所述骨导语音的最小带宽检测要求,在所述带宽检测参数表中增加对所述骨导语音的描述,得到更新的所述带宽检测参数表,其中所述音频特性包括编码音频对应的帧长。
8.根据权利要求6所述的骨导语音的编码装置,其特征在于,所述预先在所述时域噪声整形编码系数表中增加所述骨导语音对应的最小带宽的参数描述,得到更新的所述时域噪声整形编码系数表,包括:
根据LC3音频编码数据的音频特性和所述骨导语音对应的最小带宽,在所述时域噪声整形编码系数表中增加相应的参数配置,得到更新的所述时域噪声整形编码系数表,使得在所述时域噪声整形模块中,根据带宽检测的结果对所述骨导语音划分频段进行时域噪声整形分析。
9.一种计算机可读存储介质,其存储有计算机程序,其中所述计算机程序被操作以执行权利要求1-5中任一项所述的方法。
10.一种计算机设备,其包括处理器和存储器,所述存储器存储有计算机程序,其中所述处理器操作所述计算机程序以执行权利要求1-5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211700089.3A CN116129920A (zh) | 2022-12-28 | 2022-12-28 | 骨导语音的编码方法、编解码方法、装置、介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211700089.3A CN116129920A (zh) | 2022-12-28 | 2022-12-28 | 骨导语音的编码方法、编解码方法、装置、介质及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116129920A true CN116129920A (zh) | 2023-05-16 |
Family
ID=86293890
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211700089.3A Pending CN116129920A (zh) | 2022-12-28 | 2022-12-28 | 骨导语音的编码方法、编解码方法、装置、介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116129920A (zh) |
-
2022
- 2022-12-28 CN CN202211700089.3A patent/CN116129920A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10559313B2 (en) | Speech/audio signal processing method and apparatus | |
JP4810335B2 (ja) | 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置 | |
CN110706715B (zh) | 信号编码和解码的方法和设备 | |
KR101770237B1 (ko) | 오디오 데이터 처리 방법, 장치 및 시스템 | |
RU2469420C2 (ru) | Способ и устройство для формирования шумов | |
EP0967593A1 (en) | Audio coding and quantization method | |
CN101512639A (zh) | 用于语音/音频发送器和接收器的方法和设备 | |
EP2937861B1 (en) | Prediction method and coding/decoding device for high frequency band signal | |
US11587572B2 (en) | Stereo signal encoding method and apparatus | |
JP2018200488A (ja) | 符号化方法、復号化方法、符号化装置及び復号化装置 | |
JP2022548299A (ja) | オーディオ符号化方法および装置 | |
CN111681664A (zh) | 一种降低音频编码码率的方法、系统、存储介质及设备 | |
US20110010167A1 (en) | Method for generating background noise and noise processing apparatus | |
WO2013066244A1 (en) | Bandwidth extension of audio signals | |
CN112599140B (zh) | 一种优化语音编码速率和运算量的方法、装置及存储介质 | |
CN109215668B (zh) | 一种声道间相位差参数的编码方法及装置 | |
WO2012159370A1 (zh) | 语音增强方法和设备 | |
CN116129920A (zh) | 骨导语音的编码方法、编解码方法、装置、介质及设备 | |
JP7159351B2 (ja) | ダウンミックスされた信号の計算方法及び装置 | |
CN112992189B (zh) | 语音音频的检测方法及装置、存储介质及电子装置 | |
CN112735446B (zh) | 在lc3音频码流中添加额外信息的方法、系统及介质 | |
CN112992166A (zh) | 一种动态调整lc3音频编码速率的方法、装置及存储介质 | |
WO2022012677A1 (zh) | 音频编解码方法和相关装置及计算机可读存储介质 | |
CN117437925A (zh) | 优化音频编解码的方法、系统、介质及设备 | |
CN112951252B (zh) | 一种lc3音频码流的混音方法、装置、介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |