CN103714809A - 语音发送装置及其发送方法和语音接收装置及其接收方法 - Google Patents
语音发送装置及其发送方法和语音接收装置及其接收方法 Download PDFInfo
- Publication number
- CN103714809A CN103714809A CN201310445181.4A CN201310445181A CN103714809A CN 103714809 A CN103714809 A CN 103714809A CN 201310445181 A CN201310445181 A CN 201310445181A CN 103714809 A CN103714809 A CN 103714809A
- Authority
- CN
- China
- Prior art keywords
- unit
- frequency band
- frequency
- voice
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 28
- 238000001228 spectrum Methods 0.000 claims description 16
- 230000009466 transformation Effects 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 6
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 description 42
- 230000035945 sensitivity Effects 0.000 description 32
- 230000015654 memory Effects 0.000 description 20
- 238000010606 normalization Methods 0.000 description 18
- 238000012545 processing Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000013139 quantization Methods 0.000 description 8
- 230000002123 temporal effect Effects 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000006866 deterioration Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提供了一种语音发送装置、语音发送方法、语音接收装置和语音接收方法。该语音发送装置包括:频带限制单元,用于对输入的时序信号执行频带限制;编码单元,用于对从频带限制单元输出的时序信号进行编码;发送单元,用于发送从编码单元输出的码串;以及控制单元,用于控制频带限制单元中的频带限制操作。
Description
技术领域
本技术涉及语音发送装置、语音发送方法、语音接收装置和语音接收方法,更具体地,涉及可以应用于对语音信号进行编码和传输的语音发送系统的语音发送装置等。
背景技术
过去,已知对语音信号进行编码和传输的语音传输系统(例如,参见JP2005-233993A)。在语音编码中,通常根据各种编码方案确定输入语音信号被编码的带宽。
发明内容
在针对编码信息量具有宽编码带的编码方案的情况下,编码精度很可能总体上劣化,具体地,存在S/N灵敏度在可听频带内劣化的问题。另外,在按照编码信息量过多或不足而允许改变编码频带的编码方案的情况下,尤其存在可听频带的S/N灵敏度与频带灵敏度同时变得不稳定的问题,因此,编码质量不固定,并且整体质量劣化。
期望无论编码方案如何均可靠地传输语音信号。
根据本技术的实施例,提供了一种语音发送装置,包括:频带限制单元,用于对输入时序信号执行频带限制;编码单元,用于对从频带限制单元输出的时序信号进行编码;发送单元,用于发送从编码单元输出的码串;以及控制单元,用于控制频带限制单元中的频带限制操作。
根据本技术的实施例,频带限制单元对输入时序信号执行频带限制。频带限制单元可通过低通滤波器对输入时序信号执行滤波,并且获得频带受限制的时序信号。频带限制单元可对输入时序信号顺序地执行时间频率变换、频谱操作和频率时间变换,并且获得频带受限制的时序信号。
编码单元对从频带限制单元输出的时序信号进行编码。在这种情况下,可使用任何方案作为编码方案。例如,可使用按照编码信息量过多或不足而允许改变编码频带的编码方案。发送单元发送从编码单元输出的码串。可通过任何无线方案或有线方案执行该发送。
控制单元控制频带限制单元中的频带限制操作。例如,控制单元基于与接收装置共享的信息而执行该控制。在这种情况下,例如,控制单元可通过与接收装置进行的通信来获取共享信息。另外,例如,共享信息可以是装置信息、编解码器信息或比特率信息。
如上所述,在本技术中,在进行编码之前,对输入时序信号执行频带限制。因此,在针对编码信息量具有宽编码频带的编码方案的情况下,能够防止编码精度的劣化,并且能够提高可听频带的S/N灵敏度。另外,在本技术中,在按照编码信息量过多或不足而允许改变编码频带的编码方案的情况下,能够防止编码频带的变化,能够提高可听频带的频带灵敏度和S/N灵敏度,编码质量能够变得恒定,并且能够提高整体质量。
另外,在本技术中,基于与接收装置共享的信息控制频带限制单元中的频带限制操作。因此,例如,能够有效地操作频带限制单元,并且能够确保与接收装置中的频带扩展操作的同步。
在本技术中,例如,控制单元还可基于与接收装置共享的信息来控制频带限制单元中的限制起始频率。例如,控制单元可通过与接收装置进行的通信来获取共享的信息。另外,例如,共享信息可以是比特率信息或起始频率信息。在这种情况下,可以将限制起始频率设置为有效值,并且能够抑制频带灵敏度的不经济的劣化。另外,能够确保与接收装置中的频带扩展的起始频率同步。
根据本技术的另一实施例,提供了一种语音接收装置,包括:接收单元,用于接收码串;解码单元,用于对接收单元接收到的码串进行解码;频带扩展单元,用于对从解码单元输出的时序信号执行频带扩展;以及控制单元,用于基于与发送装置共享的信息来控制频带扩展单元中的频带扩展操作。
在本技术中,接收单元接收码串。可通过任意无线方案或有线方案来执行接收。解码单元对接收单元所接收到的码串进行解码。然后,频带扩展单元对从解码单元输出的时序信号执行频带扩展。
例如,频带扩展单元可对时序信号顺序地执行频带划分、子频带信号操作和频带合并,并且获得频带扩展的时序信号。另外,例如,频带扩展单元可对时序信号顺序地执行时间频率变换、频谱操作和频率时间变换,并获得频带扩展的时序信号。
控制单元控制频带扩展单元中的频带扩展操作。例如,控制单元基于与发送装置共享的信息执行该控制。在这种情况下,例如,控制单元可通过与发送装置进行的通信来获取共享信息。另外,例如,共享信息可以是装置信息、编解码器信息或比特率信息。
如上所述,在本技术中,在进行解码之后对时序信号执行频带扩展。因此,有限频带中的编码质量能够变得恒定,能够改善整体质量,并且能够实现宽频带灵敏度。另外,在本技术中,基于与发送装置共享的信息控制频带扩展单元中的频带扩展操作。另外,能够确保与发送装置中的频带限制操作同步,并且有效地操作频带扩展单元。
另外,在本技术中,例如,控制单元还可基于与发送装置共享的信息来控制频带扩展单元中的扩展起始频率。例如,控制单元可通过与发送装置进行的通信获取共享信息。另外,例如,共享信息可以是比特流信息或起始频率信息。在这种情况下,可以将扩展起始频率设置为有效值,并且能够抑制频带灵敏度的不经济的劣化。另外,能够确保与发送装置中的频带受限制的起始频率同步。
根据本技术的实施例,无论编码方案如何均能够可靠地发送语音信号。
附图说明
图1是示出根据实施例的语音传送系统的示例性配置的框图;
图2(a)和图2(b)是示出根据现有技术的语音传输系统的语音发送装置和语音接收装置的示例性配置的框图;
图3是示出构成语音发送装置的信号编码单元的示例性配置的框图;
图4是示出构成语音接收装置的信号解码单元的示例性配置的框图;
图5(a)至图5(e)是用于描述根据现有技术的语音传输系统的S/N灵敏度或频带灵敏度的图;
图6是示出根据实施例的语音传输系统中的语音发送装置的示例性配置的框图;
图7(a)至图7(c)是用于描述构成语音发送装置的频带限制单元的示例性配置的图;
图8(a)至图8(c)是用于描述构成语音发送装置的频带限制单元的另一示例性配置的图;
图9是示出根据实施例的语音传输系统中的语音接收装置的示例性配置的框图;
图10(a)至图10(c)是用于描述构成语音接收装置的频带扩展单元的示例性配置的图;
图11(a)至图11(c)是用于描述构成语音接收装置的频带扩展单元的另一示例性配置的图;
图12是示出控制单元中的频带限制和频带扩展的示例性开启/关闭控制处理的流程图;
图13是示出控制单元中的频带限制和频带扩展的另一示例性开启/关闭控制处理的流程图;
图14是示出对控制单元中的开启/关闭频带限制和频带扩展以及频带限制和频带扩展的起始频率进行控制的示例性控制处理的流程图;以及
图15(a)至图15(e)是用于描述根据实施例的语音传输系统的S/N灵敏度或频带灵敏度的图。
具体实施方式
下文中,将参照附图详细地描述本公开的优选实施例。应注意,在本说明书和附图中,以相同的附图标记表示基本上具有相同功能和结构的结构元件,并且省略了对这些结构元件的重复说明。
下文中,将描述用于执行本技术的模式(下文中,称为“实施例”)。该描述将按如下顺序进行:
1.实施例
2.变型示例
<1.实施例>
[语音传输系统的示例性配置]
图1示出根据实施例的语音传输系统10的示例性配置。语音传输系统10包括语音发送装置100和语音接收装置200。语音发送装置100对语音时序信号进行编码,并且以有线方式或无线方式发送所获得的码串。语音接收装置200以有线方式或无线方式接收语音码串,并且对所接收到的码串进行解码以获得时序信号。以下将描述语音发送装置100和语音接收装置200的详情。
首先,将描述根据现有技术的语音发送装置100和语音接收装置200的示例性配置。这里,为了方便,将语音发送装置100A和语音接收装置200A描述为根据现有技术的语音发送装置100和语音接收装置200。图2(a)示出根据现有技术的语音发送装置100A的示例性配置。语音发送装置100A包括信号编码单元101、发送缓存单元102、包合并单元103和包发送单元104。图2(b)示出根据现有技术的语音接收装置200A的示例性配置。语音接收装置200A包括包接收单元201、拆包单元202、接收缓存单元203和信号解码单元204。
信号编码单元101根据各种编码方案对语音输入时序信号进行编码,并且输出码串。发送缓存单元102缓存从信号编码单元101输出的码串,并输出所缓存的码串。包合并单元103根据各种传输方案对从发送缓冲单元102输出的、所缓存的码串进行打包,并输出传输包。包发送单元104将从包合并单元103输出的传输包发送至有线或无线传输路径。
包接收单元201接收通过有线或无线传输路径传输的传输包。拆包单元202根据各种传输方案对从包接收单元201输出的传输包进行拆包,并输出码串。接收缓存单元203缓存从拆包单元202输出的码串,并输出所缓存的码串。信号解码单元204根据各种编码方案对从接收缓存单元203输出的、所缓存的码串进行解码,并输出时序信号。
图3示出了信号编码单元101的示例性配置。以上已将信号编码单元101描述为根据各种编码方案执行编码,并且示例性配置代表作为这样的编码方案之一的子频带编解码器(SBC)的示例。信号编码单元101包括频带划分单元111、归一化单元112a至112d、量化单元113a至113d、码串编码单元114和比特分配计算单元115。
频带划分单元111对输入时序信号(诸如语音信号)执行频带划分,并输出频带划分后的时序信号。例如,频带划分单元111使用诸如多相正交滤波器(PQF)的分析滤波器来对输入时序信号执行频带划分,并输出N个划分后的时序信号。图3示出了N为4的示例。归一化单元112a至112d根据分别与时序信号的幅度对应的预定归一化信息idsf、使用归一化系数来对从频带划分单元111输出的各个频带的时序信号进行归一化,并输出归一化信息idsf和归一化的时序信号。
比特分配计算单元115基于从归一化单元112a至112d输出的归一化信息idsf等而针对每个频带执行比特分配计算,并输出量化信息idwl。量化单元113a至113d分别使用与从比特分配计算单元115输出的量化信息idwl对应的量化系数来对从归一化单元112a至112d输出的各个频带的时序信号进行量化,并输出量化后的时序信号。码串编码单元114对归一化信息idsf、量化信息idwl、量化后的时序信号等进行编码,并输出码串。
图4示出信号解码单元204的示例性配置。以上已将信号解码单元204描述为根据各种编码方案执行解码,并且示例性配置是对应于图3的信号编码单元101的配置。信号解码单元204包括码串解码单元211、逆量化单元212a至212d、逆归一化单元213a至213d以及频带合并单元214。
码串解码单元211对输入码串进行解码,并且重构并输出归一化信息idsf、量化信息idwl、量化后的时序信号等。逆量化单元212a至212d使用与重构后的量化信息idwl对应的逆量化系数来对从码串解码单元211输出的各个频带的、量化后的时序信号执行逆量化,并输出归一化后的时序信号。
逆归一化单元213a至213d使用与重构后的归一化信息idsf对应的逆归一化系数来对从逆量化单元212a至212d输出的各个频带的归一化后的时序信号执行逆归一化,并输出频带划分后的时序信号。频带合并单元214对从逆归一化单元213a至213d输出的频带划分后的时序信号执行频带合并,并输出语音时序信号。例如,频带合并单元214使用诸如IPQF的合并滤波器来对N个划分后的时序信号执行频带合并,并输出时序信号。
接下来,将描述图2(a)和图2(b)所示的语音发送装置100A和语音接收装置200A的操作。语音输入时序信号被提供至信号编码单元101。信号编码单元101根据各种编码方案对输入时序信号进行编码,并输出码串。
从信号编码单元101输出的码串被提供至发送缓存单元102。发送缓存单元102对码串进行缓存。然后,包合并单元103根据各种传输方案对由发送缓存单元102缓存的码串进行打包,并输出传输包。传输包被提供至包发送单元104。包发送单元104将传输包发送至有线或无线传输路径。
包接收单元201接收通过无线或有线传输路径传输的传输包。传输包被提供至拆包单元202。拆包单元202根据各种传输方案对传输包进行拆包,并输出码串。
从拆包单元202输出的码串被提供至接收缓存单元203。接收缓存单元203对码串进行缓存。然后,信号解码单元204根据各种编码方案对由接收缓存单元203缓存的码串进行解码,并输出输出时序信号。
在图2(a)所示的语音发送装置100A的信号编码单元101中,通常根据各种编码方案确定语音输入时序信号被编码的带宽。例如,在SBC的情况下,编码频带在奈奎斯特频率fn下为整个频带,并且当采样频率fs为48kHz时,奈奎斯特频率fn为24kHz。
对于在整个频带内具有频率特性的输入语音信号(参见图5(a)),当比特率相对高时,由于编码信息量充足,因此编码精度也足够(参见图5(b))。另一方面,当比特率相对低时,由于编码频带相对于编码信息量较宽,因此编码精度很可能总体上劣化,具体地,随着本底噪声(noisefloor)在可听频带内上升,S/N灵敏度劣化(参见图5(c))。
另外,例如当编码信息量不足时,例如以1/8频带(3kHz)或1/4频带(6kHz)为单位调整编码频带。由于该原因,当频带减小时,频带灵敏度降低,并且同时,具体地,本底噪声在可听频带内下降,因此,提高了S/N灵敏度(参见图5(d)→图5(e))。然而,当频带增加时,频带灵敏度增加,并且同时,本底噪声在可听频带内上升,因此,S/N灵敏度劣化(参见图5(e)→图5(d))。具体地,由于该原因,可听频带的S/N灵敏度与频带灵敏度同时变得不稳定,因此,编码质量不恒定,并且质量总体上劣化。
如上所述,在针对编码信息量具有宽编码频带的编码方案的情况下,存在编码精度很可能总体上劣化,具体地,存在可听频带内的S/N灵敏度劣化的问题。另外,在按照编码信息量过多或不足而允许改变编码频带的编码方案的情况下,特别地,存在可听频带的S/N灵敏度与频带灵敏度同时变得不稳定的问题,因此,编码质量不恒定,并且总体质量劣化。
接下来,将描述根据本技术的语音发送装置100和语音接收装置200。图6示出了语音发送装置100的示例性配置。在图6中,与图2(a)的部件相对应的部件由相同的附图标记表示,并且将适当地省略对其的详细描述。语音发送装置100包括信号编码单元101、发送缓存单元102、包合成单元103、包发送单元104、频带限制单元105和频道限制控制单元106。
频带限制单元105对语音输入时序信号执行频带限制,并且输出频带受限制的时序信号。频带限制控制单元106控制频带限制单元105中的频带限制操作,并且控制频带受限制的起始频率。当建立通信同步时,语音发送装置100和语音接收装置200进行协商并彼此共享信息。这里,共享信息的示例包括装置信息、编解码器信息和比特率信息。频带限制控制单元106基于如上所述与语音接收装置200共享的信息,控制频带限制单元105中的频带限制操作和频带受限制的起始频率。
频带限制单元105可具有各种配置。图7(a)示出了频带限制单元105的示例性配置。在该示例性配置中,频带限制单元105由低通滤波器单元(LPF单元)151构成。在这种情况下,低通滤波器单元151对如图7(b)所示的在整个频带内具有频率特性的输入语音信号执行滤波,并且生成如图7(c)所示的频带受限的语音信号。
图8(a)示出了频带限制单元105的另一示例性配置。在该示例性配置中,频带限制单元105由时间频率变换单元152、频谱操作单元153和频率时间变换单元154这一系列电路构成。时间频率变换单元152执行诸如离散傅里叶变换(DFT)的时间频率变换。频谱操作单元153通过频率轴上的频谱操作来执行频带限制。频率时间变换单元154执行诸如逆离散傅里叶变换(IDFT)的频率时间变换。在这种情况下,对如图8(b)所示的在整个频带内具有频率特性的频谱执行利用频谱操作的频带限制,并如图8(c)所示,生成频带受限制的语音信号的频谱。
返回参照图6,信号编码单元101根据各种编码方案对从频带限制单元105输出的语音时序信号进行编码,并输出码串。发送缓存单元102缓存从信号编码单元101输出的码串,并输出所缓存的码串。包合成单元103根据各种传输方案对从发送缓存单元102输出的、所缓存的码串进行打包,并输出传输包。包发送单元104将从包合成单元103输出的传输包发送至有线或无线传输路径。
图9示出语音接收装置200的示例性配置。在图9中,与图2(b)中的部件对应的部件由相同的附图标记表示,并且将适当地省略对其的详细描述。语音接收装置200包括包接收单元201、拆包单元202、接收缓存单元203、信号解码单元204、频带扩展单元205和频带扩展控制单元206。
包接收单元201接收通过有线或无线传输路径发送的传输包。拆包单元202根据各种传输方案对从包接收单元201输出的传输包进行拆包,并输出码串。接收缓存单元203缓存从拆包单元202输出的码串,并输出所缓存的码串。信号解码单元204根据各种编码方案对从接收缓存单元203输出的、所缓存的码串进行解码,并输出时序信号。
频带扩展单元205对从信号解码单元204输出的语音时序信号执行频带扩展,并输出频带扩展的语音输出时序信号。频带扩展控制单元206控制频带扩展单元205中的频带扩展操作,并控制频带扩展的起始频率。如上所述,当建立通信同步时,语音发送装置100和语音接收装置200彼此对共享信息(诸如装置信息、编解码器信息和比特率信息)进行协商。频带扩展控制单元206基于如上所述的与语音发送装置100共享的信息,来控制频带扩展单元205中的频带扩展操作和频带扩展的起始频率。
频带扩展单元205可具有各种配置。例如,JP2008-139844A公开了一种频带扩展技术。图10(a)示出了频带扩展单元205的示例性配置。在该示例性配置中,频带扩展单元205由频带划分滤波器单元251、扩展频带生成单元252和频带合并滤波器单元253这一系列电路构成。
频带划分滤波器单元251执行PQF等的频带划分滤波处理。扩展频带生成单元252通过基于时间轴上的子频带信号生成扩展信号并进行增益调整来执行频带扩展。频带合并滤波器单元253执行IPQF等的频带合并滤波处理。在这种情况下,如图10(b)所示,对频带受限制的语音信号执行基于子频带信号的扩展信号生成及增益调整,并且如图10(c)所示,生成频带扩展的语音信号。
图11(a)示出了频带扩展单元205的另一示例性配置。在该示例性配置中,频带扩展单元205由时间频率变换单元254、扩展频带生成单元255和频率时间变换单元256这一系列电路构成。时间频率变换单元254执行诸如DFT的时间频率变换。扩展频带生成单元255通过基于频率轴上的频谱生成扩展信号并进行增益调整来执行频带扩展。频率时间变换单元256执行诸如IDFT的频率时间变换。在这种情况下,如图11(b)所示,对频带受限制的语音信号的频谱通过基于频谱生成扩展信号并进行增益调整来执行频带扩展,并且如图11(c)所示,生成频带扩展的语音信号的频谱。
接下来,将描述图6和图9所示的语音发送装置100和语音接收装置200的操作。语音输入时序信号被提供到频带限制单元105。当开启频带限制操作时,频带限制单元105对语音输入时序信号执行频带限制。从频带限制单元105输出的时序信号被提供至信号编码单元101。
信号编码单元101根据各种编码方案对时序信号进行编码,并输出码串。码串被提供至发送缓存单元102。发送缓存单元102缓存码串。然后,包合成单元103根据各种传输方案对由发送缓存单元102缓存的码串进行打包,并输出传输包。传输包被提供至包发送单元104。包发送单元104将传输包发送至有线或无线传输路径。
包接收单元201接收通过有线或无线传输路径发送的传输包。传输包被提供至拆包单元202。拆包单元202根据各种传输方案对传输包进行拆包,并输出码串。
从拆包单元202输出的码串被提供至接收缓存单元203。接收缓存单元203缓存该码串。然后,信号解码单元204根据各种编码方案对由接收缓存单元203缓存的码串进行解码,并输出语音时序信号。该时序信号被提供至频带扩展单元205。当开启频带扩展操作时,频带扩展单元205对语音时序信号执行频带扩展。从频带扩展单元205输出的时序信号是输出时序信号。
将进一步描述语音发送装置100的频带限制控制单元106和语音接收装置200的频带扩展控制单元206中的控制处理。下文中,将频带限制控制单元106和频带扩展控制单元206简称为“控制单元”。
图12的流程图示出了控制单元中的频带限制和频带扩展的示例性开启/关闭控制处理。在步骤ST1中,控制单元开始控制处理并接着使得该处理进行到步骤ST2。在步骤ST2中,控制单元执行装置信息的协商,因此,在发送侧与接收侧之间共享装置信息。
接下来,在步骤ST3中,控制单元确定语音接收装置200是否是固定型或用于室内。这里,当语音接收装置200是固定型或用于室内时,由于容易检测编码质量的劣化,因此可以执行控制以便对输入时序信号和输出时序信号分别执行频带限制和频带扩展。然而,当语音接收装置200是便携式或用于室外时,由于不容易检测编码质量的劣化,因此可以执行控制而不对输入时序信号和输出时序信号分别执行频带限制和频带扩展。
当确定语音接收装置200是固定型或用于室内时,在步骤ST4中,控制单元执行频带限制和频带扩展。换言之,开启语音发送装置100中的频带限制单元105的频带限制操作,并且开启语音接收装置200中的频带扩展单元205的频带扩展操作。在步骤ST4之后,在步骤ST5中,控制单元结束该处理。另外,当在步骤ST3中确定语音接收装置200是便携式或用于室外时,控制单元直接使处理进行到步骤ST5,并且结束该处理。此时,关闭语音发送装置100中的频带限制单元105的频带限制操作,并且关闭语音接收装置200中的频带扩展单元205的频带扩展操作。
图13的流程图示出了控制单元中的频带限制和频带扩展的另一示例性开启/关闭控制处理。在步骤ST11中,控制单元开始控制处理并接着使处理进行至步骤ST12。在步骤ST12中,控制单元执行编解码器信息的协商,因此,在发送侧与接收侧之间共享编解码器信息。
接下来,在步骤ST13中,控制单元确定要使用的编码方案(编解码器)是否是编码频带变化并且难以从外部指定编码带宽的特定类型的编码方案(例如,SBC)。当确定要使用的编码方案(编解码器)是特定类型的编码方案时,可以执行控制以便对输入时序信号和输出时序信号分别执行频带限制和频带扩展。然而,当确定要使用的编码方案(编解码器)不是特定类型的编码方案时,可以执行控制而不对输入时序信号和输出时序信号分别执行频带限制和频带扩展。
当在步骤ST13中确定要使用的编码方案(编解码器)是特定类型的编码方案时,在步骤ST14中,控制单元执行频带限制和频带扩展。换言之,开启语音发送装置100中的频带限制单元105的频带限制操作,并且开启语音接收装置200中的频带扩展单元205的频带扩展操作。在步骤ST14之后,在步骤ST15中,控制单元结束该处理。另外,当在步骤ST13中确定要使用的编码方案(编解码器)不是特定类型的编码方案时,控制单元直接使该处理进行至步骤ST15,并结束该处理。此时,关闭语音发送装置100中的频带限制单元105的频带限制操作,并且关闭语音接收装置200中的频带扩展单元205的频带扩展操作。
图14的流程图示出了用于控制频带限制和频带扩展的开启/关闭以及控制单元中的频带限制和频带扩展的起始频率的示例性控制处理。在步骤ST21中,控制单元开始控制处理,并接着使得该处理进行至步骤ST22。在步骤ST22中,控制单元执行对比特率信息的协商,因此,在发送侧与接收侧之间共享比特率信息。
接下来,在步骤ST23中,控制单元确定要使用的编码方案(编解码器)的比特率是否低,例如,等于或小于256kbps。当比特率高时,由于给出了足够的编码信息量,因此可以执行控制而不对输入时序信号和输出时序信号分别执行频带限制和频带扩展。然而,当比特率低时,由于没有给出足够的编码信息量,因此可以执行控制以便对输入时序信号和输出时序信号分别执行频带限制和频带扩展。
当在步骤ST23中确定比特率等于或小于256kbps时,在步骤ST24中,控制单元执行频带限制和频带扩展。换言之,开启语音发送装置100中的频带限制单元105的频带限制操作,并且开启语音接收装置200中的频带扩展单元205的频带扩展操作。在步骤ST24之后,控制单元使得该处理进行至步骤ST25。
例如,在步骤ST25中,控制单元确定比特率是否等于或小于128kbps。当比特率等于或小于128kpbs时,在步骤ST26中,控制单元将频带限制和频带扩展的起始频率设置为例如15kHz,接着使得该处理进行至步骤ST27,从而,处理结束。当在步骤ST25中确定比特率不是等于或小于128kbps时,在步骤ST28中,控制单元将频带限制和频带扩展的起始频带设置为例如18kHz,接着使得该处理进行至步骤ST27,从而,处理结束。
同时,当在步骤ST23中确定比特率不是等于或小于256kbps时,控制单元使得该处理进行至步骤ST27,然后,结束该处理。此时,关闭语音发送装置100中的频带限制单元105的频带限制操作,并且关闭语音接收装置200中的频带扩展单元205的频带扩展操作。当然,此时,不需要设置频带限制和频带扩展的起始频率。
可以基于如图14的流程图所示的比特率信息设置频带限制和频带扩展的起始频率,并且例如通过由控制单元执行的起始频率信息的协商,基于在发送侧与接收侧之间共享的起始频率信息来设置频带限制和频带扩展的起始频率。另外,起始频率可以是预先设置的固定值。
如上所述,在图6所示的语音发送装置100中,频带限制单元105对如图15(a)所示的在整个频带内具有频率特性的输入语音信号执行频带限制,并且生成如图15(b)所示的频带受限制的语音信号。然后,信号编码单元101对频带受限制的信号进行编码,并且生成码串。
因此,如图15(c)所示,可以使频带灵敏度降低并稳定,并且同时,随着本底噪声下降,可以提高S/N灵敏度。因此,在针对编码信息量具有宽编码频带的编码方案的情况下,由于对输入语音信号执行频带限制,因此能够防止编码精度的劣化,具体地,能够提高可听频带内的S/N灵敏度。另外,在按照编码信息量过多或不足而允许改变编码频带的编码方案的情况下,能够防止编码频带的变化,能够使频带灵敏度稳定,具体地,能够提高可听频带内的S/N灵敏度,因此,编码质量恒定,并且能够改善整体质量。
另外,在图9所示的语音接收装置200中,如图15(d)所示,从信号解码单元204获得频带受限制的语音信号。在该语音信号中,如上所述那样使频带灵敏度降低并稳定,同时,随着本底噪声下降,提高了S/N灵敏度。由于频带扩展单元205对语音信号执行频带扩展,因此如图15(e)所示,能够增大通过频带限制而降低的频带灵敏度。因此,通过语音发送装置100和语音接收装置200的协作,有限频带内的编码质量能够变得恒定,能够改善整体质量,并且能够实现宽频带灵敏度。
另外,在图6所示的语音发送装置100和图9所示的语音接收装置200中,当建立通信同步时,执行协商,并且共享诸如装置信息、编解码器信息和比特率信息的信息。然后,基于共享信息执行频带限制单元105和频带扩展单元205中对频带限制操作和频带扩展操作的控制以及对频带限制和频带扩展的起始频率的控制。因此,能够确保频带限制单元105和频带扩展单元205的频带限制操作和频带扩展操作同步,能够使频带受限制的起始频率和频带扩展的起始频率匹配,并且能够有效地操作频带限制单元105和频带扩展单元205。
<2.修改示例>
结合语音发送装置100执行频带限制且语音接收装置200执行频带扩展的示例来描述了上述实施例。然而,当语音发送装置100执行频带限制时,语音接收装置200不一定执行频带扩展。即使当仅通过语音发送装置100执行频带限制时,也能获得上述效果。
另外,结合语音发送装置100和语音接收装置200彼此执行通信并共享信息的示例来描述了上述实施例。然而,例如,可在这些装置之间共享信息以便通过用户输入信息。
本领域的技术人员应该理解,可以根据设计要求和其他因素进行各种修改、组合、子组合和变更,只要它们落入所附权利要求或其等同方案的范围内即可。
另外,本技术还可以如下进行配置。
(1)一种语音发送装置,包括:
频带限制单元,用于对输入时序信号执行频带限制;
编码单元,用于对从所述频带限制单元输出的时序信号进行编码;
发送单元,用于发送从所述编码单元输出的码串;以及
控制单元,用于控制所述频带限制单元中的频带限制操作。
(2)根据(1)所述的语音发送装置,
其中,所述控制单元基于与接收装置共享的信息来控制所述频带限制单元中的频带限制操作。
(3)根据(2)所述的语音发送装置,
其中,所述控制单元通过与所述接收装置进行的通信获取共享信息。
(4)根据(2)或(3)所述的语音发送装置,
其中,共享信息是装置信息、编解码器信息和比特率信息中的任一个。
(5)根据(2)至(4)中任一项所述的语音发送装置,
其中,所述控制单元还基于与所述接收装置共享的信息来控制所述频带限制单元中的限制起始频率。
(6)根据(5)所述的语音发送装置,
其中,所述控制单元通过与所述接收装置进行的通信获取共享信息。
(7)根据(5)或(6)所述的语音发送装置,
其中,共享信息是比特率信息和起始频率信息中的任一个。
(8)根据(1)至(7)中任一项所述的语音发送装置,
其中,所述频带限制单元通过低通滤波器对所述输入时序信号执行滤波,并获得频带受限制的时序信号。
(9)根据(1)至(7)中任一项所述的语音发送装置,
其中,所述频带限制单元对所述输入时序信号顺序地执行时间频率变换、频谱操作和频率时间变换,并获得频带受限制的时序信号。
(10)一种语音发送方法,包括:
对输入时序信号执行频带限制;
对在所述频带限制步骤中所获得的时序信号进行编码;
对在所述编码步骤中所获得的码串进行打包和发送;以及
控制所述频带限制步骤中的频带限制操作。
(11)一种语音接收装置,包括:
接收单元,用于接收码串;
解码单元,用于对所述接收单元所接收的码串进行解码;
频带扩展单元,用于对从所述解码单元输出的时序信号执行频带扩展;以及
控制单元,用于基于与发送装置共享的信息来控制所述频带扩展单元中的频带扩展操作。
(12)根据(11)所述的语音接收装置,
其中,所述控制单元基于与发送装置共享的信息来控制所述频带扩展单元中的频带扩展操作。
(13)根据(12)所述的语音接收装置,
其中,所述控制单元通过与所述发送装置进行的通信获取共享信息。
(14)根据(12)或(13)所述的语音接收装置,
其中,共享信息是装置信息、编解码器信息和比特率信息中的任一个。
(15)根据(12)至(14)中任一项所述的语音接收装置,
其中,所述控制单元还基于与所述发送装置共享的信息来控制所述频带扩展单元中的扩展起始频率。
(16)根据(15)所述的语音接收装置,
其中,所述控制单元通过与所述发送装置进行的通信获取共享信息。
(17)根据(15)或(16)所述的语音接收装置,
其中,共享信息是比特率信息和起始频率信息中的任一个。
(18)根据(11)至(17)中任一项所述的语音接收装置,
其中,所述频带扩展单元对所述时序信号顺序地执行频带划分、子频带信号操作和频带合并,并且获得频带扩展的时序信号。
(19)根据(11)至(17)中任一项所述的语音接收装置,
其中,所述频带扩展单元对所述时序信号顺序地执行时间频率变换、频谱操作和频率时间变换,并且获得频带扩展的时序信号。
(20)一种语音接收方法,包括:
接收码串;
对所述接收步骤中所接收的码串进行解码;
对所述解码步骤中所获得的时序信号执行频带扩展;以及
控制所述频带扩展步骤中的频带扩展操作。
本公开包含与2012年10月3日向日本专利局提交的日本优先权专利申请JP2012-221744号中所公开的主题相关的主题,其全部内容通过引用并入于此。
Claims (20)
1.一种语音发送装置,包括:
频带限制单元,用于对输入时序信号执行频带限制;
编码单元,用于对从所述频带限制单元输出的时序信号进行编码;
发送单元,用于发送从所述编码单元输出的码串;以及
控制单元,用于控制所述频带限制单元中的频带限制操作。
2.根据权利要求1所述的语音发送装置,
其中,所述控制单元基于与接收装置共享的信息来控制所述频带限制单元中的频带限制操作。
3.根据权利要求2所述的语音发送装置,
其中,所述控制单元通过与所述接收装置进行的通信获取共享信息。
4.根据权利要求2所述的语音发送装置,
其中,共享信息是装置信息、编解码器信息和比特率信息中的任一个。
5.根据权利要求2所述的语音发送装置,
其中,所述控制单元还基于与所述接收装置共享的信息来控制所述频带限制单元中的限制起始频率。
6.根据权利要求5所述的语音发送装置,
其中,所述控制单元通过与所述接收装置进行的通信获取共享信息。
7.根据权利要求5所述的语音发送装置,
其中,共享信息是比特率信息和起始频率信息中的任一个。
8.根据权利要求1所述的语音发送装置,
其中,所述频带限制单元通过低通滤波器对所述输入时序信号执行滤波,并获得频带受限制的时序信号。
9.根据权利要求1所述的语音发送装置,
其中,所述频带限制单元对所述输入时序信号顺序地执行时间频率变换、频谱操作和频率时间变换,并获得频带受限制的时序信号。
10.一种语音发送方法,包括以下步骤:
对输入时序信号执行频带限制;
对在频带限制步骤中所获得的时序信号进行编码;
对在编码步骤中所获得的码串进行打包和发送;以及
控制频带限制步骤中的频带限制操作。
11.一种语音接收装置,包括:
接收单元,用于接收码串;
解码单元,用于对所述接收单元接收到的码串进行解码;
频带扩展单元,用于对从所述解码单元输出的时序信号执行频带扩展;以及
控制单元,用于基于与发送装置共享的信息来控制所述频带扩展单元中的频带扩展操作。
12.根据权利要求11所述的语音接收装置,
其中,所述控制单元基于与发送装置共享的信息来控制所述频带扩展单元中的频带扩展操作。
13.根据权利要求12所述的语音接收装置,
其中,所述控制单元通过与所述发送装置进行的通信获取共享信息。
14.根据权利要求12所述的语音接收装置,
其中,共享信息是装置信息、编解码器信息和比特率信息中的任一个。
15.根据权利要求12所述的语音接收装置,
其中,所述控制单元基于与所述发送装置共享的信息来控制所述频带扩展单元的扩展起始频率。
16.根据权利要求15所述的语音接收装置,
其中,所述控制单元通过与所述发送装置进行的通信获取共享信息。
17.根据权利要求15所述的语音接收装置,
其中,共享信息是比特率信息和起始频率信息中的任一个。
18.根据权利要求11所述的语音接收装置,
其中,所述频带扩展单元对所述时序信号顺序地执行频带划分、子频率信号操作和频带合并,并且获得频带扩展的时序信号。
19.根据权利要求11所述的语音接收装置,
其中,所述频带扩展单元对所述时序信号执行时间频率变换、频谱操作和频率时间变换,并且获得频带扩展的时序信号。
20.一种语音接收方法,包括以下步骤:
接收码串;
对在接收步骤中接收到的码串进行解码;
对在解码步骤中所获得的时序信号执行频带扩展;以及
控制频带扩展步骤中的频带扩展操作。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012-221744 | 2012-10-03 | ||
JP2012221744A JP2014074782A (ja) | 2012-10-03 | 2012-10-03 | 音声送信装置、音声送信方法、音声受信装置および音声受信方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103714809A true CN103714809A (zh) | 2014-04-09 |
Family
ID=50386008
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310445181.4A Pending CN103714809A (zh) | 2012-10-03 | 2013-09-26 | 语音发送装置及其发送方法和语音接收装置及其接收方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20140095154A1 (zh) |
JP (1) | JP2014074782A (zh) |
CN (1) | CN103714809A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106328153A (zh) * | 2016-08-24 | 2017-01-11 | 青岛歌尔声学科技有限公司 | 电子通信设备语音信号处理系统、方法和电子通信设备 |
CN112152652A (zh) * | 2019-06-28 | 2020-12-29 | 联发科技股份有限公司 | 通信装置及用于减轻通信装置中的干扰的方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3861770B2 (ja) * | 2002-08-21 | 2006-12-20 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
EP1543307B1 (en) * | 2002-09-19 | 2006-02-22 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and method |
CA2572805C (en) * | 2004-07-02 | 2013-08-13 | Matsushita Electric Industrial Co., Ltd. | Audio signal decoding device and audio signal encoding device |
US7386445B2 (en) * | 2005-01-18 | 2008-06-10 | Nokia Corporation | Compensation of transient effects in transform coding |
US7746807B2 (en) * | 2006-02-17 | 2010-06-29 | Nec Corporation | Band limiting method and wireless communication system |
CN1960354B (zh) * | 2006-04-27 | 2012-04-11 | 北京泰美世纪科技有限公司 | 多载波系统中连续导频编码的发送和接收方法及装置 |
US8032359B2 (en) * | 2007-02-14 | 2011-10-04 | Mindspeed Technologies, Inc. | Embedded silence and background noise compression |
KR101381513B1 (ko) * | 2008-07-14 | 2014-04-07 | 광운대학교 산학협력단 | 음성/음악 통합 신호의 부호화/복호화 장치 |
JP5424936B2 (ja) * | 2010-02-24 | 2014-02-26 | パナソニック株式会社 | 通信端末及び通信方法 |
JP2012103395A (ja) * | 2010-11-09 | 2012-05-31 | Sony Corp | 符号化装置、符号化方法、およびプログラム |
-
2012
- 2012-10-03 JP JP2012221744A patent/JP2014074782A/ja active Pending
-
2013
- 2013-09-26 US US14/037,456 patent/US20140095154A1/en not_active Abandoned
- 2013-09-26 CN CN201310445181.4A patent/CN103714809A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106328153A (zh) * | 2016-08-24 | 2017-01-11 | 青岛歌尔声学科技有限公司 | 电子通信设备语音信号处理系统、方法和电子通信设备 |
CN112152652A (zh) * | 2019-06-28 | 2020-12-29 | 联发科技股份有限公司 | 通信装置及用于减轻通信装置中的干扰的方法 |
CN112152652B (zh) * | 2019-06-28 | 2022-06-28 | 联发科技股份有限公司 | 通信装置及用于减轻通信装置中的干扰的方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2014074782A (ja) | 2014-04-24 |
US20140095154A1 (en) | 2014-04-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7218900B2 (en) | Radio transmitter and receiver | |
AU2005234181B2 (en) | Coding of audio signals | |
KR101621641B1 (ko) | 신호 코딩 및 디코딩 방법 및 장치 | |
US20080013763A1 (en) | Bluetooth transmission facility for hearing devices, and corresponding transmission method | |
JP5268952B2 (ja) | データパケットのシーケンスを伝送するための装置および方法ならびにデータパケットのシーケンスをデコードするためのデコーダおよび装置 | |
US9123328B2 (en) | Apparatus and method for audio frame loss recovery | |
CN101098168B (zh) | 用于听力装置的蓝牙传输装置和相应的传输方法 | |
KR101545792B1 (ko) | 트랜션트 프레임의 코딩 및 디코딩 | |
KR20190137181A (ko) | 다수의 오디오 신호들의 인코딩 | |
US8190440B2 (en) | Sub-band codec with native voice activity detection | |
CN102714776A (zh) | 具有音频编解码器的助听器和方法 | |
JP6204501B2 (ja) | 高周波帯域信号を予測するための方法、符号化デバイス、および復号デバイス | |
US20160035360A1 (en) | Method and Means of Encoding Background Noise Information | |
US10607624B2 (en) | Signal codec device and method in communication system | |
JP2003504654A (ja) | オーディオ信号の符号化効率を向上させる方法 | |
JPH04213235A (ja) | ベースバンド信号処理ユニット及び該ユニットを動作させる方法 | |
CN105874534B (zh) | 编码装置、解码装置、编码方法、解码方法及程序 | |
CN103714809A (zh) | 语音发送装置及其发送方法和语音接收装置及其接收方法 | |
CN102917141A (zh) | 一种评估语音质量的测试方法、装置及系统 | |
AU2018289986B2 (en) | Audio signal encoding and decoding | |
KR101418880B1 (ko) | 무선 인터폰 시스템 | |
US8117029B2 (en) | Method and apparatus for matching sound quality measurement sections of variable bandwidth multi-codec | |
Bhatt | Implementation and overall performance evaluation of CELP based GSM AMR NB coder over ABE | |
CN111181990A (zh) | 一种航天器网络音频传输装置 | |
KR100597487B1 (ko) | 음성 레벨 변경 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140409 |