CN1261713A - 接收装置和方法,通信装置和方法 - Google Patents
接收装置和方法,通信装置和方法 Download PDFInfo
- Publication number
- CN1261713A CN1261713A CN99127498A CN99127498A CN1261713A CN 1261713 A CN1261713 A CN 1261713A CN 99127498 A CN99127498 A CN 99127498A CN 99127498 A CN99127498 A CN 99127498A CN 1261713 A CN1261713 A CN 1261713A
- Authority
- CN
- China
- Prior art keywords
- speech
- frequency band
- signal
- sampling rate
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 48
- 238000004891 communication Methods 0.000 title claims description 8
- 238000005070 sampling Methods 0.000 claims abstract description 221
- 238000006243 chemical reaction Methods 0.000 claims description 33
- 238000001914 filtration Methods 0.000 claims description 27
- 238000001228 spectrum Methods 0.000 claims description 17
- 206010038743 Restlessness Diseases 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 6
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims 1
- 230000003252 repetitive effect Effects 0.000 claims 1
- 230000015572 biosynthetic process Effects 0.000 abstract description 2
- 230000005236 sound signal Effects 0.000 abstract description 2
- 238000004519 manufacturing process Methods 0.000 abstract 1
- 238000003786 synthesis reaction Methods 0.000 abstract 1
- 238000012545 processing Methods 0.000 description 33
- 230000014509 gene expression Effects 0.000 description 13
- 239000002131 composite material Substances 0.000 description 10
- 238000001514 detection method Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 8
- 230000005284 excitation Effects 0.000 description 8
- 230000001629 suppression Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 6
- 238000000605 extraction Methods 0.000 description 6
- 238000009499 grossing Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000013139 quantization Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 3
- 230000013011 mating Effects 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical compound [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- GOLXNESZZPUPJE-UHFFFAOYSA-N spiromesifen Chemical compound CC1=CC(C)=CC(C)=C1C(C(O1)=O)=C(OC(=O)CC(C)(C)C)C11CCCC1 GOLXNESZZPUPJE-UHFFFAOYSA-N 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/38—Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
- H04B1/40—Circuits
- H04B1/44—Transmit/receive switching
- H04B1/46—Transmit/receive switching by voice-frequency signals; by pilot signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
在接收机中,频带扩展器从一个意在产生具有包含在300到3400Hz的第一频带B1内的语言频率的语言声音信号的语言声音参数代码产生一个为3400到6000Hz的第二频带B2的语言声音参数来由LPC合成电路合成一个宽带LPC。之后,用上采样原来的语言声音得到的信号替换原来语言声音的低频带分量(300到3400Hz)。也就是说,把该语言声音供给一个高通滤波器,只维持该语言声音的高频带分量(3400到6000Hz)。抑制该高频带的高频分量,调整增益,然后在加法器中把原来的语言声音(300到3400Hz)加到上采样的语言声音(其采样速率为fs2)上。
Description
本发明涉及一种接收装置和方法以及一种通信装置和方法,其适于接收通过编码语言声音信号获得的和通过通信网络或广播网络传输的语言语音参数代码,并从该语言声音参数代码合成该语言声音信号。
在常规通信装置中,无论是输入到接收机的语言声音还是从其输出的语言声音,其采样速率均彼此相同,而其频率也都包含在同一语言频带内,因为电话线的传输频带例如限制在300到3400Hz的一个狭窄的范围,因此通过电话线传输的语言声音信号的语言频带是有限的。
然而,对于具有包含在某一语言频带内的语言频率的语言声音输出(该语言频带相似于以在有限语言频带内包含的语言频率传输的输入语言声音的语言频带),不能说它具有高质量。即是说,该输出语言声音声学特性不好。另外,使用常规通信装置的数字移动电话的声音质量也不尽人意。
因此,本发明的一个目的是,通过提供一种接收装置和方法以及一种通信装置和方法,其适应于提供具有改善的声学质量的语言声音输出,克服现有技术的上述缺点。
根据本发明,所提供的接收装置包括:
采样速率变换设备,用于变换一个语言声音信号的采样速率fs1为第二采样速率fs2(fs2>fs1),所述语言声音信号的语言频率包含在第一频带B1内,其从基于为产生具有第一采样速率fs1的语言声音信号而从发射机发射的一个信号产生的一个语言声音参数代码而产生;
频带外分量预测设备,用于根据所述语言声音参数代码预测具有第二频带B2内包含的一个语言频率的第二采样速率fs2的语言声音信号是在第一频带B1外的一个分量;
上述接收装置另外还包括相加设备,用于把第一频带B1内包含的语言频率的语言声音信号和由频带外分量预测设备预测的、具有第二频带B2内包含的语言频率的第二采样速率fs2的语言声音信号相加,前一语言声音信号是由采样速率变换设备以第二采样速率采样形成。
根据本发明,提供一种接收方法,包括步骤:
变换设备变换一个语言声音信号的采样速率fs1为第二采样速率fs2(fs2>fs1),所述语言声音信号的语言频率包含在第一频带B1内,其从基于为产生具有第一采样速率fs1的语言声音信号而从发射机发射的一个信号产生的一个语言声音参数代码而产生;
根据该语言声音参数代码预测具有在第二频带B2内包含的语言频率的第二采样速率fs2的一个语言声音信号是在第一频带B1外的一个分量。
根据本发明,提供一种通信装置,包括:
发射设备,用于以第一采样速率fs1编码输入语言声音信号以产生一个发射信号;
接收设备,用于从语言声音参数代码产生第二采样速率fs2(fs2>fs1)的语言声音信号,所述语言声音参数代码根据以第一采样速率fs1编码产生的发射信号产生。
上述接收设备另外包括采样速率变换设备,用于变换具有第一频带B1内的语言频率的语言声音信号的采样速率fs1为第二采样速率fs2(fs2>fs1),所述语言声音信号从基于为产生具有第一采样速率fs1的语言声音而由发射机发射的一个信号产生的声音参数代码产生;和预测设备,用于根据该语言声音参数代码预测具有第二频带B2内包含的一个语言频率的第二采样速率fs2的一个语言声音信号是在第一频带B1外的一个分量。
上述接收设备另外还包括相加设备,用于把具有第一频带B1内包含的一个语言频率的语言声音信号和由频带外分量预测设备预测的、具有第二频带B2内一个语言频率的第二采样速率fs2的语言声音信号相加,前一语言声音信号是由采样速率变换设备以第二采样速率fs2采样形成。
根据本发明,提供一种通信方法,包括步骤:
以第一采样速率fs1编码输入语言声音信号以产生一个发射信号;
根据基于由以第一采样速率fs1编码产生的发射信号产生的语言声音参数代码,预测具有包含在第二频带B2内的一个语言频率的第二采样速率fs2的一个语言声音信号是在第一频带B1外的一个分量。
根据本发明,把包含在第一频带B1内、使用基于发射到接收设备的发射信号产生的语言声音参数代码产生的第一采样速率fs1变换为第二采样速率fs2(fs2>fs1),并把该第二采样速率fs2加到包含在第二频带B2内具有第二采样速率fs2、使用语言声音参数代码预测的语言声音信号上,从而允许提供具有高采样速率的宽带语言声音。
结合参考附图,根据下面对本发明的优选实施例的详细说明,可以明显看出本发明的这些以及其它目的、特征和优点。
图1是根据本发明的接收机的一个实施例的方框图;
图2是适应通过一个基站给图1所示接收机发射音频参数代码的一个发射机的方框图;
图3表示与一个信号选择器一起形成在图1所示接收机中提供的信号处理器的一个PSI-CELP解码器;
图4是与该PSI-CELP解码器一起形成在图1所示接收机中提供的信号处理器的信号选择器的方框图;
图5是包含在图4所示信号选择器中的激励源频带扩宽电路的详细方框图;
图6是包含在图4所示信号选择器中的一个噪声衰减器的详细方框图;
图7是图4所示信号选择器的操作的详细流程图;
图8是产生在图4所示信号选择器中使用的一个代码簿中所用训练数据的过程的流程图;
图9是产生该代码簿的过程的流程图;
图10表示在图1所示接收机中提供的信号选择器的一个变体中包含的VSELP解码器;
图11是在图1所示接收机中提供的信号处理器的一个变体中包含的信号选择器的方框图;
图12是图1所示信号选择器的操作的详细流程图;
图13是在图1所示接收机中提供的信号处理器的另一变体中包含的信号选择器的方框图;
图14是在图1所示接收机中提供的信号处理器的又一变体中包含的解码器的方框图;
图15是在图1所示接收机中提供的信号处理器的再一变体中包含的信号选择器的方框图;
图16是在图4所示信号选择器中提供的噪声衰减器的方框图,在其后级连接有一个后滤波器;
图17是在图16所示信号选择器中包含的后滤波器的详细方框图;
图18解释该后滤波器的滤波因子更新周期和增益更新周期;
图19是一个移动电话的方框图,在该移动电话中和发射机集成提供包含使用每一信号选择器的信号处理器的接收机。
参考图1,其中图示出按照本发明的接收机的一个实施例。该接收机总体上用参考号码1指示。接收机1可以用在遵照个人数字蜂窝(PDC)标准(RCR STD-27)设计的当前盛行的数字移动电话中。
为产生第一采样速率fs1的语言声音信号,从由一个发射机通过一个基站发射的语言声音参数代码(其在后面说明),接收机1适于产生具有包含在第一频带B1内的一个语言频率的语言声音信号,其采样速率是第一采样速率fs1,具有包含在第二频带B2内的一个语言频率的语言声音信号,其采样速率是第二采样速率fs2(fs2>fs1),和具有包含在一个宽带BW(第一频带B1+第二频带B2)内的一个语言频率的语言声音信号,其采样速率是第二采样速率fs2,并提供这3个语言声音信号中选择的一个。第一采样速率fs1是8kHz,第二采样速率fs2是16kHz。第一语言频带B1的范围在300到3400Hz,第二语言频带B2的范围在3400到6000Hz。于是,宽语言频带BW的范围在300到6000Hz。
如图1所示。接收机1从基站通过天线2接收的语言声音参数代码通过RF接收机3和控制器4存储在信号处理器5的存储器5a中。
信号处理器5通过一个在其内提供的解码器解码存储在信号处理器5的存储器5a中的语言声音参数代码,以预定方式处理它,然后提供该处理过的信号作为输出。以下把接收机1的这一操作称为“实时通信方式”。另外,当用户使用也在接收机1中提供的电话应答功能来再现一个由电话应答功能自动记录的接收的消息语言声音信号时,信号处理器5将由该解码器解码也是在接收机1中提供的存储器13中存储的该语言声音信号的一个语言声音参数代码,将其以预定方式处理,并提供该处理的信号作为输出。以下把这一操作称为“消息重放方式”。
在实时通信和消息重放期间,来自信号处理器5的输出信号由D/A转换器6转换为模拟信号。该模拟信号通过去混叠(anti-aliasing)滤波器7,可变电阻器8和放大器9,然后从扬声器10作为输出提供。另外,在控制器4上例如连接有键盘11和LCD显示器12。
参考图2,其表示一个发射机,该发射机例如适于通过一个无线电发射线和基站发射语言声音参数代码。该发射机总的用参考号码15指示。发射机15可以用于按照PDC标准(RCR STD-27)设计的当前盛行的数字移动电话中。
如图2所示,提供给传声器16的语言声音信号通过放大器17,可变电阻18,去混叠滤波器19和A/D转换器20存储在信号处理器21的存储器21a中。
发射机15通过在信号处理器21中提供的语言声音编码器编码存储在存储器21a中的语言声音信号为语言声音参数代码,并将其作为输出提供。该语言声音参数代码通过控制器22,RF发射机23和天线24发射到基站。在控制器22上连接有键盘25和LCD显示器26。
信号处理器21中的语言声音编码器产生一个语言声音参数代码,其语言频率包含在由无线电传输线限制的一个窄频带内。一般,传输频带范围在300到3400Hz之间。基于传输信号的语言声音参数代码经由控制器22提供给RF发射机23。作为这种语言声音参数,例如有激励源相关的线性预测编码(LPC)残留或线性预测滤波器因子α,音调频率相关的延迟,20毫秒一帧内的帧功率R0,等等。
语言声音参数代码从发射机15通过基站发射。如果设定接收机1的电话应答功能,则该语言声音参数代码记录在接收机1的存储器13中,前面已经说明。
表1列出按照数字电话标准在一帧的全速率语言声音数据格式中的语言声音参数代码,表2列出在半速率语言声音数据格式中的语言声音参数代码。
表1
位15 | 位14 | 位13 | 位12 | 位11 | 位10 | 位9 | 位8 | 位7 | 位6 | 位5 | 位4 | 位3 | 位2 | 位1 | 位0 | |
字0 | CRC6 | CRC4 | CRC2 | CRC0 | RO3 | RO2 | LPC3.3 | LPC4.3 | LPC1.2 | LPC5.3 | 延迟2.6 | 延迟4.6 | 延迟2.5 | 延迟4.5 | 延迟2.4 | 延迟4.4 |
字1 | 延迟2.3 | 延迟4.3 | GSPO2.6 | GSPO4.6 | 延迟2.2 | 延迟4.2 | 延迟2.1 | 延迟4.1 | 延迟2.0 | 延迟4.0 | GSPO2.5 | GSPO4.5 | SOFI0 | GSPO1.4 | GSPO3.4 | LPC1.1 |
字2 | LPC3.1 | GSPO2.3 | GSPO4.3 | GSPO2.2 | GSPO4.2 | GSPO2.1 | GSPO4.1 | GSPO2.0 | GSPO4.0 | LPC6.2 | GSPO3.0 | GSPO1.0 | GSPO3.1 | GSPO1.1 | GSPO3.2 | GSPO1.2 |
字3 | GSPO3.3 | GSPO1.3 | LPC2.2 | GSPO4.4 | GSPO2.4 | LPC4.2 | RO1 | GSPO3.5 | GSPO1.5 | 延迟3.0 | 延迟1.0 | 延迟3.1 | 延迟1.1 | 延迟3.2 | 延迟1.2 | GSPO3.6 |
字4 | GSPO1.6 | 延迟3.3 | 延迟1.3 | 延迟3.4 | 延迟1.4 | 延迟3.5 | 延迟1.5 | 延迟3.6 | 延迟1.6 | LPC3.2 | LPC2.3 | LPC1.3 | LPC2.4 | LPC1.4 | RO4 | CRC1 |
字5 | CRC3 | CRC5 | 尾0 | 尾1 | 尾2 | 尾3 | 尾4 | LPC7.1 | 代码4.1 | 代码2.0 | 代码4.2 | LPC9.2 | 代码3.7 | 代码4.4 | LPC6.0 | LPC2.1 |
字6 | 代码2.4 | LPC5.0 | 代码1.6 | LPC6.1 | 代码1.1 | LPC1.0 | 代码1.4 | 代码1.5 | 代码3.0 | LPC7.2 | RO0 | 代码4.3 | 代码4.7 | 代码2.7 | 代码1.2 | LPC10.0 |
字7 | 代码4.0 | 代码4.5 | 代码1.3 | LPC8.2 | LPC3.0 | 代码3.6 | LPC8.1 | 代码2.6 | LPC10.1 | 代码3.1 | 代码1.8 | LPC4.0 | LPC5.1 | 代码3.4 | LPC4.1 | 代码1.7 |
字8 | LPC7.0 | 代码3.5 | 代码1.0 | LPC9.1 | 代码4.8 | 代码3.2 | 代码2.5 | 代码3.3 | 代码2.1 | 代码3.8 | 代码2.3 | 代码2.8 | LPC9.0 | LPC8.0 | 代码4.6 | 代码2.2 |
字9 | LPC2.0 | LPC5.3 | X | X | X | X | X | X | X | X | X | X | X | X | X | X |
表2
位15 | 位14 | 位13 | 位12 | 位11 | 位10 | 位9 | 位8 | 位7 | 位6 | 位5 | 位4 | 位3 | 位2 | 位1 | 位0 | |
字0 | CRC0 | CRC2 | CRC4 | CRC6 | CRC8 | LSP0.1 | LSP0.3 | LSP0.5 | LSP1.0 | LSP1.2 | LSP1.4 | LSP1.6 | POW0 | POW2 | POW4 | POW6 |
字1 | 延迟0.1 | 延迟0.3 | 延迟0.5 | 延迟0.7 | 延迟1.1 | 延迟1.3 | 延迟1.5 | 延迟1.7 | 延迟2.1 | 延迟2.3 | 延迟2.5 | 延迟2.7 | 延迟3.1 | 延迟3.3 | 延迟3.5 | 延迟3.7 |
字2 | 增益0.5 | 增益1.4 | 增益1.6 | 增益2.5 | 增益3.4 | 增益3.6 | 增益3.5 | 增益2.6 | 增益2.4 | 增益1.5 | 增益0.6 | 增益0.4 | 延迟3.6 | 延迟3.4 | 延迟3.2 | 延迟3.0 |
字3 | 延迟2.6 | 延迟2.4 | 延迟2.2 | 延迟2.0 | 延迟1.6 | 延迟1.4 | 延迟1.2 | 延迟1.0 | 延迟0.6 | 延迟0.4 | 延迟0.2 | 延迟0.0 | POW5 | POW3 | POW1 | LSP1.7 |
字4 | LSP1.5 | LSP1.3 | LSP1.1 | LSP0.6 | LSP0.4 | LSP0.2 | LSP0.0 | CRC7 | CRC5 | CRC3 | CRC1 | 尾0 | 尾1 | 尾2 | 尾3 | 尾4 |
字5 | 尾5 | 尾6 | LSP2.0 | LSP2.1 | LSP2.2 | LSP2.3 | LSP2.4 | LSP2.5 | LSP2.6 | LSP2.7 | LSP3.0 | LSP3.1 | LSP3.2 | LSP3.3 | LSP3.4 | LSP3.5 |
字6 | LSP3.6 | LSP3.7 | 增益0.0 | 增益0.1 | 增益0.2 | 增益0.3 | 代码0.0 | 代码0.1 | 代码0.2 | 代码0.3 | 代码0.4 | 代码0.5 | 代码0.6 | 代码0.7 | 代码0.8 | 代码0.9 |
字7 | 增益1.0 | 增益1.1 | 增益1.2 | 增益1.3 | 代码1.0 | 代码1.1 | 代码1.2 | 代码1.3 | 代码1.4 | 代码1.5 | 代码1.6 | 代码1.7 | 代码1.8 | 代码1.9 | 增益2.0 | 增益2.1 |
字8 | 增益2.2 | 增益2.3 | 代码2.0 | 代码2.1 | 代码2.2 | 代码2.3 | 代码2.4 | 代码2.5 | 代码2.6 | 代码2.7 | 代码2.8 | 代码2.9 | 增益3.0 | 增益3.1 | 增益3.2 | 增益3.3 |
字9 | 代码3.0 | 代码3.1 | 代码3.2 | 代码3.3 | 代码3.4 | 代码3.5 | 代码3.6 | 代码3.7 | 代码3.8 | 代码3.9 | X | X | X | X | X | X |
如前所述,用于本发明中的语言声音参数代码,除在激励源相关线性预测编码(LPC)残留或线性预测滤波器因子α、音调频率相关延迟、20毫秒一帧内的帧功率R0外,还包括例如CRC。这些语言声音参数代码以每帧10词的单元发射,其中一词包括16位。
当在消息重放方式时,该语言声音参数代码从存储器13读出,送往接收机1中的信号处理器5。
给示于图1的接收机1中的信号处理器5另外提供图3所示PSI-CELP解码器27和图4所示信号选择器32。
如果在图2所示接收机15中提供的信号处理器21的语言声音编码器采用PSI-CELP(音调同步刷新-CELP)编码方法的话,则PSI-CELP解码器27使用PSI-CELP方法解码基于该编码信号的语言声音以便发射,并在输出端子28提供解码的语言声音SndN、在输出端子29提供线性预测滤波器因子αN、和在输出端子30提供激励源NExcN。发射由PSI-CELP方法编码的信号以产生具有包含在300-3400Hz的第一频带B1内的一个语言频率的语言声音信号,其采样速率是8kHz的第一采样速率fs1。
信号选择器32包括采样速率变换设备,用于变换解码的语言声音SndN的采样速率为16kHz的第二采样速率,所述解码的语言声音SndN具有在第一频带B1(300到3400Hz)内包含的语言频率,由PSI-CELP解码器27根据为产生采样速率为8kHz的第一采样速率的语言声音信号而从发射机发射的PSI-CELP编码的信号而解码;包括噪声衰减器,用于使从语言声音参数代码产生的、采样速率为第一采样速率fs1的、具有包含在第一频带B1内的一个语言频率的语言声音信号经受第一噪声衰减处理,和使从采样速率变换设备提供的、采样速率为第二采样速率fs2的、具有包含在第一频带B1内的一个语言频率的语言声音信号经受第二噪声衰减处理;和包括用于按需选择来自噪声衰减器的第一噪声衰减输出或第二噪声衰减输出的设备。
另外,接收机1包括一个频带外分量预测设备,用于预测一个信号,该信号具有包含在3400到6000Hz的第二频带内的一个语言频率,其采样速率为16kHz的第二采样速率fs2,它由从PSI-CELP解码器27解码PSI-CELP编码的信号提供的线性预测滤波器因子αN和激励源NExcN供给;还包括用于把从采样速率变换设备供给的、具有包含在第一频带B1内的语言频率的第二采样速率fs2的语言声音信号加到由频带外分量预测设备预测的、其采样速率为第二采样速率fs2的、具有包含在第二频带B2内的语言频率的语言声音信号上的设备。噪声衰减器使来自相加设备的相加输出经受第三噪声衰减处理,而选择设备按需选择第一、第二和第三噪声衰减输出的任何一个。
噪声衰减器包括图4所示第一到第三电路47到49。这些噪声衰减电路47到49分别为第一噪声衰减处理(a)、第二噪声衰减处理(b)和第三噪声衰减处理(b)提供。提供分别用于第二噪声衰减处理(b)或第三噪声衰减处理(b)的电路48或49是为了把第一噪声衰减处理(a)(在电路47中)施加给一个样本,该样本具有这样一个语言频率,其为具有包含在第一频带B1或宽带BW内的一个语言频率的语言声音信号的语言频率的fs2/fs1,而其采样速率为第二采样速率fs2。注意,为噪声衰减电路添加的符号(a)和(b)意在区分采样速率为fs1的噪声衰减处理和采样速率为fs2的噪声衰减处理。
在图4中,前述采样速率变换设备表示为上采样(up-sampling)电路45,选择设备是选择开关150,相加设备是加法器46。频带外分量预测设备是图4中的信号选择器32除去上采样电路45,分别用于噪声衰减处理(a)、(b)和(b)的电路47、48和49,选择开关150和加法器46的剩余部分。
下面,进一步说明信号选择器32。
首先,频带外分量预测设备包括变换线性预测滤波器因子为一个自相关(αN->rN)的电路36,扩宽自相关(r)的语言频带的电路37,宽带代码簿(rWCB)38,变换自相关为一个线性预测滤波器因子(rW->αN)的电路39,LPC合成电路40,激励源频带扩宽电路41,高频带提取/抑制滤波器42,和乘法器43。
在输入端子34提供的线性预测滤波器因子αN供给αN/rN变换电路36,在这里线性预测滤波器因子αN变换为自相关rN,后者供给自相关(r)频带扩宽电路37。该自相关(r)频带扩宽电路37使用宽带代码簿(rWCB)38扩宽自相关(r)的频带。宽带代码簿(rWCB)38根据从一个宽带语言声音中抽取的自相关参数rW事先准备。
根据宽带代码簿(rWCB)38由自相关(r)频带扩宽电路37扩宽频带的自相关rW供给rW/αW变换电路39。rW/αW变换电路39再次变换频带扩宽的自相关参数rW为一个频带扩宽的线性预测滤波器因子αW,并将其供给LPC合成电路40。
LPC合成电路40基于来自rW/αW变换电路39的扩宽频带的或宽带线性预测滤波器因子αW和来自激励源频带扩宽电路41的频带扩宽激励源合成一个宽带语言声音。
LPC合成电路40的合成输出供给高频带提取/抑制滤波器42。该高频带提取/抑制滤波器42去除具有包含在频带300到3400Hz内的一个语言频率的信号分量,和抑制一个高频分量以提取具有包含在3400到6000Hz的第二频带B2内的一个语言频率的信号分量。从该滤波器42的输出供给乘法器43,它在这里被由端子44供给的增益相乘。乘法器43的输出(=滤波器输出和增益的乘积,在范围在3400到6000Hz的第二频带B2内)供给加法器46。
还给LPC合成电路40供给来自激励源频带扩宽电路41的频带扩宽的激励源。激励源频带扩宽电路41扩宽LPC残留信号(作为激励源NExcN给出)的频带作为关于从输入端子35供给的激励源的一个参数。图5详细表示出激励源频带扩宽电路41。
首先,经由输入端子35供给的激励源NExcN由上采样电路50上采样。该上采样电路50的输出从输出端子55通过LPF(低通滤波器)51和增强器(booster)52发送到LPC合成电路40。也就是说,通过上采样激励源NExcN产生的信号用作合成语言声音信号的频带扩宽的激励源。提供增强器52用于当检测到塞擦音或摩擦音时增强该频带扩宽的激励源,其增强程度根据来自塞擦音检测器54的输出控制。塞擦音检测器54通过输入端子53接收来自αN/rN变换器36的自相关rN,检测塞擦音或摩擦音。
来自如上构造的激励源频带扩宽电路41的激励源供给LPC合成电路40,后者将基于来自rW/αW变换器39的宽带线性预测滤波器因子αW和频带扩宽的激励源合成一个宽带语言声音。上述电路是频带外分量预测设备。
下面说明对解码的语言声音SndN实现第一噪声衰减处理的噪声衰减器,该解码的语言声音由图3所示解码器27通过输入端子33供给。
使用在日本未审查专利申请、号码为7-193548(本发明的申请已经递交)中公开的噪声衰减方法,噪声衰减器检测背景噪声并抑制它。该噪声衰减方法是这样的,根据从一个语言声音参数代码检测到的背景噪声区域内的噪声级产生一个控制信号,并根据该控制信号改变噪声衰减方式。该语言声音参数代码是基于为产生一个第一采样速率fs1的语言声音信号而从发射机发射的信号产生的。
现在参考图6,图中详细表示采用上述噪声衰减方法的噪声衰减器的构造。采样速率为8kHz、具有包含在300到3400Hz频带内的一个语言频率的解码的语言声音SndN通过输入端子141供给帧功率计算电路142。帧功率计算电路142从解码的语言声音SndN计算称为rms的平方根,作为具有例如20毫秒周期的每一帧的功率。由帧功率计算电路142计算的帧平均功率供给一个比例(scale)计算电路143,它计算一个比例作为抑制来自帧功率计算电路142计算的帧平均功率的噪声的一个因子。由比例计算电路143计算的比例传递给平滑电路144,它使该比例平滑。实现平滑处理以避免在具有例如每20毫秒160个样本的帧内所进行的输入语言声音信号分割之间的不连续。经受该平滑处理的比例发送到噪声衰减器145,在这里它用于去除来自扩宽频带的语言声音信号SndN的噪声。
给比例计算电路143供给由级鉴别电路147鉴别经由端子148供给的噪声级检测信号而产生的控制信号。根据该控制信号,为上述比例计算选择一个阈值。后面进一步说明上述构造的噪声衰减器的操作。
如图4所示,给上采样电路45提供采样速率变换设备以变换具有包含在300到3400Hz的第一频带B1内的一个语言频率的语言声音信号的采样速率fs1(8kHz)为16kHz的第二采样速率fs2,其语言频率包含在300到3400Hz的第一频带B1内的、采样速率(8kHz)已变换为16kHz的第二采样速率的语言声音信号分量供给加法器46和用于噪声衰减(b)的电路48。
在加法器46中,来自上采样电路45的语言声音信号分量加在来自乘法器43的语言声音信号分量,后者具有包含在3400到6000Hz的第二频带B2内的一个语言声音,其采样速率为16kHz的第二采样速率fs2,而从该地址处的加法输出供给用于噪声衰减处理(b)的噪声衰减电路49。
信号选择器32具有选择开关150作为选择设备,从下述信号中选择任一语言声音信号:具有包含在300到3400Hz的第一频带B1内的一个语言频率、其采样速率为8kHz的第一采样速率fs1、其中的噪声已由用于噪声衰减(a)的电路47衰减的语言声音信号;具有包含在300到3400Hz的第一频带B1内的一个语言频率、其采样速率为16kHz的第二采样速率fs2、其中的噪声已由用于噪声衰减(b)的电路48衰减的语言声音信号;具有包含在300到6000Hz的宽带BW内的一个语言频率、其采样速率为16kHz的第二采样速率fs2、其中的噪声已由用于噪声衰减(b)的电路49衰减的语言声音信号。
选择开关150有3个可选端子
a、
b和
c和一个选择杆
d。在其可选端子
a接收具有包含在300到3400Hz的第一频带B1内的一个语言频率、其采样速率为8kHz的第一采样速率fs1的语言声音信号,在其可选端子
b接收包含在300到3400Hz的第一频带B1内的、其采样速率为16kHz的第二采样速率fs2的语言声音信号,在其可选端子
c接收具有包含在300到6000Hz的宽带BW内的一个语言频率、其采样速率为16kHz的第二采样速率fs2的语言声音信号。通过根据从选择控制信号端子151来的一个选择控制信号移动选择开关150的选择杆
d到相应一个可选端子a、
b和
c之一,把一个希望的语言声音信号供给D/A转换器6。
下面说明上述信号选择器32的主要操作。
信号选择器32从意在产生具有包含在300到3400Hz的第一频带B1内的一个语言频率的语言声音信号的语言声音参数代码产生用于编码具有包含在3400到6000Hz的第二频带B2内的一个语言频率的语言声音的参数,并合成一个宽带LPC。然后信号选择器32用采样速率被上采样为16kHz的原来的语言声音替换作为原来语言声音的语言频带的低频带(300到3400Hz)。也就是说,信号选择器使该语言声音信号经受高通滤波只维持高频带(3400到6000Hz)分量,抑制该高频带的最高频率分量,调整增益,然后把范围在300到3400Hz内的语言频率的原来的语言声音加到上采样的原来的语言声音(具有第二采样速率fs2)上,以提供具有包含在宽带BW(300到6000Hz)内的一个语言频率的、采样速率为16kHz的第二采样速率fs2的语言声音信号。
为扩宽语言声音参数代码的频带,线性预测滤波器因子α和激励源NExcN两者都必须在语言频带中被扩宽。另外,为扩宽线性预测滤波器因子α的频带,必须准备作为一个可以转换为线性预测滤波器因子α的参数的自相关
r的一个代码簿,线性预测滤波器因子α也可以转换回自相关
r。自相关
r根据该代码簿通过量化或去量化而在语言频带中被扩宽。
下面首先说明线性预测滤波器因子α的频带扩宽。
考虑线性预测滤波器因子α是一个表示频谱包络的滤波器因子,一旦该线性预测滤波器因子α变换为作为表示另一频谱包络的一个参数的自相关
r,从该另一频谱包络可容易地预测一个高频带,则其频带被扩宽,然后把该宽带或扩展的自相关rW逆变为扩宽频带的或宽带线性预测滤波器因子α。为实现这一扩展,使用矢量量化。应该使窄带自相关rN经受矢量量化,而相应的宽带自相关应该从矢量量化自相关索引(index)确定。
因为在窄带自相关和宽带自相关之间存在一种固定关系,其在后面说明,因此准备宽带自相关的一个代码簿就足够了。窄带自相关可以由矢量量化该代码簿提供,而宽带自相关可以通过对窄带自相关去量化确定。
根据窄带信号通过限制宽带信号的语言频带而产生的假定,在宽带自相关和窄带自相关之间存在下面的关系(1):
Φ(xn)=Φ(xwh)=Φ(xw)Φ(h) (1)
式中,Φ是自相关,xn是窄带信号,xw是宽带信号,而h是一个带限滤波器(band limiting filter)的脉冲响应。
另外,根据在自相关和功率谱之间的关系可以给出下面的表达式(2):
Φ(h)=F-1(|H|2) (2)
假定提供另一个带限滤波器,其频率特性等于上述带限滤波器的功率特性,为H′。那么可以通过下面的表达式(3)给出表达式(2):
Φ(h)=F-1(|H|2)=F-1(H′)=h′ (3)
该新滤波器有和现有带限滤波器一样的通带和禁止带,而衰减特性是后一滤波器的平方。因此,可以说该新滤波器是一个带限滤波器。考虑到这些,窄带自相关可以通过宽带自相关和该带限滤波器的脉冲响应的卷积而简化,即是说,通过限制宽带自相关的频带而简化。也就是说,这可以用下述表达式(4)给出:
Φ(xn)=Φ(xw)h′ (4)
如前述可以看出,如果只准备宽带代码簿的话,则可以通过使用该代码簿计算产生为矢量量化窄带自相关必需的一个窄带矢量,而无须从一个窄带自相关准备任何代码簿。
因为每一宽带自相关rW的代码矢量随一个单调下降或逐渐上升和下降的曲线变化,因此即使其低频带通过带限滤波器H′,它也不会变化很大。因此,可以通过对宽带自相关rW的代码簿的直接量化获得窄带自相关rn。然而,因为采样速率为宽带的采样速率的一半,因此,在窄带和宽带自相关之间的比较应该每隔一级进行。
线性预测滤波器因子α可以以较高准确度分别对浊音(voicedsound)和清音(unvoiced sound)扩宽频带。于是对浊音和清音分别准备两个代码簿。
下面进一步说明激励源的频带扩宽。
在PSI-CELP方法中,包含在窄带中的一个激励源通过由图5中的上采样电路50填充0而上采样,并使用由假频(aliasing)而失真的1。该方法非常简单,但是由于原来语言声音功率的功率和在谐波结构中的差被保存,所以可以说由该方法如此准备的激励源有足够的质量。
宽带线性预测滤波器因子α和宽带激励源用于LPC合成电路40中以合成一个线性预测代码。
如果不进一步处理的话,则由宽带LPC合成的语言声音的质量很低。对于较高的质量,该语言声音使其低频带被作为从一个编码解码器输出而提供的原来的语言声音SndN替换。为此目的,在合成的语言声音中,抽取高于3400Hz的语言频带,同时该编码解码器的输出被上采样到16kHz的采样速率fs,并且把抽取的结果和上采样频率相加在一起。
用以在乘法器43乘以高频带的增益由增益控制器根据用户的品味调整,其可能彼此变化很大。为此目的,根据用户输入为高频带增益预先设定一值,参考该值执行用该增益的乘法。
另外,在上述相加前,使用高频带提取和抑制电路42滤波该高频带,在某种程度上抑制高于大约6kHz的分量,以提供易于听的语言声音。因为滤波器因子可选,而滤波由一个预先选择的滤波器进行,因此可根据用户品味选择高频带。可以通过用户指定进行滤波器选择。
注意,滤波器42的滤波不影响低频带功率特性,因此可以在上述相加完成后进行。否则,影响低频带功率特性的滤波器可以在相加后进行。这一操作将提供一个宽带语言声音。
根据上述操作理论,信号选择器32产生宽带语言声音信号,下面参考图7所示流程图说明。
在步骤S1,图4所示αN/rN变换器36变换由图3所示解码器27解码的线性预测滤波器因子αN为一个自相关rN。在步骤S2,判定由解码器27解码的语言声音SndN是浊音(V)还是清音(UV)。
如果在步骤S2的判定结果是该语言声音SndN是浊音(V),则在步骤S4使用在步骤S3确定的一个窄带浊音参数量化该浊音自相关rN,在步骤S3从每隔一级比较得到的宽带浊音(V)代码簿38确定窄带浊音参数。
另一方面,如果在步骤S2的判定结果是该语言声音SndN是清音(UV),则使用在步骤S3确定的一个窄带清音参数
r在步骤S4量化该清音自相关
r。
在步骤S5,分别使用宽带浊音或清音代码簿去量化浊音或清音自相关以提供一个宽带自相关rW。在步骤S6由rW/αW变换器39变换该宽带自相关rW为αW。
另一方面,来自解码器27的激励源在步骤S7由图5所示上采样电路50通过在样本之间填充0而上采样,并由去除假频处理扩宽语言频率。把该激励源作为一个宽带激励源供给LPC合成电路40。
在步骤S8,使宽带线性预测滤波器因子αW和宽带激励源在LPC合成电路40中经受LPC合成以提供一个宽带语言声音。
然而,该宽带语言声音仅是一个由预测得到的宽带信号,它包括由该预测引起的误差。即是说,其质量很差。特别在输入的窄带语言声音的一个语言频率范围(300到3400Hz)内应该和原来一样使用编码解码器输出的原来的语言声音SndN(输入语言声音)。
因此,从由LPC合成电路40合成的语言声音中,在步骤S9借助一个带止滤波器(BSP)的滤波,去除输入窄带语言声音的300到3400Hz的语言频带。
在步骤S13,从LPC合成电路40来的合成的语言声音由加法器46加到在步骤S10由上采样电路45上采样的原来的语言声音SndN上。在步骤S11,由相加产生的语言声音的高频带由高频带提取和抑制滤波器42滤波,它在某种程度上抑制高于约6kHz的分量,从而提供容易听的语言声音。滤波器42的滤波因子可选,如前所述。
另外在步骤S12,使用乘法器43按照用户品味调整该语言声音的高频带的增益。
下面说明用于信号选择器32中的代码簿的准备。
代码簿准备使用著名的GLA(广义Lloyd算法)方法进行。在该方法中,把宽带语言声音分为帧,每一帧持续预定时间长度,例如20毫秒。为每一帧确定高到某一预定阶数的自相关,例如高到6阶。每一帧的自相关用作训练数据以准备一个6阶代码簿。为此目的,判定该宽带语言声音是浊音还是清音,可以把浊音(V)自相关和清音(UV)自相关分开收集,分别为浊音和清音准备代码簿。在这种情况下,在线性预测滤波器因子α的频带扩宽期间参考这些代码簿。另外在这种情况下,判定该语言声音是浊音还是清音而使用相应代码簿。
在信号选择器32中,无论是宽带浊音还是清音代码簿都使用。下面参考图8和图9说明宽带浊音(V)和清音(UV)代码簿的准备。
首先为学习产生一个宽带语言声音,且在图8的步骤S31,该语言声音被分成每一个具有20毫秒周期的帧。接着在步骤S32,检查每一帧的能量及其跨零值,以判定其是浊音还是清音。
在步骤S33,为宽带浊音帧计算例如高到6阶的自相关参数r。在步骤S34,为宽带清音帧计算例如高到6阶的自相关参数r。
在图9的步骤S41,从每一帧的一阶到6阶自相关参数中抽取宽带参数。在步骤S42,使用GLA方法准备一阶到6阶的宽带浊音和清音代码簿。
如上所述,可以准备宽带浊音和清音代码簿。
下面说明噪声衰减器功能。
提供图6所示帧功率计算电路142以计算前述每帧解码的语言声音信号的平均功率rms。把该平均功率rms供给比例计算电路143。
比例计算电路143比较平均功率rms与一个阈值nr1,并根据比较结果计算一个比例。假定当平均功率rms大于阈值nr1时,比例为1,而当该平均功率小于阈值nr1时,该比例如下:
比例=rms/K (5)
式中K是一个常数(在该例中,K=nr1)。
否则,为所有平均功率rms计算表达式(5)。如果计算结果表示该比例小于1(比例<1),则使用表达式(5)计算的比例用解码的语言声音SndN相乘。这意味着,对平均功率rms小于阈值rm1的帧,解码的语言声音信号SndN用小于1的增益相乘。如果计算结果表示,该比例大于1(比例≥1),则解码的语言声音信号SndN作为输出提供,不进一步处理。因此,通过选择阈值nr1一个合适的值,对功率小的声音部分可以控制其增益小,例如噪声,这将导致相当大的噪声衰减。注意,使用表达式(5)的噪声抑制对输入信号的平均功率有一半的效果。
在噪声抑制过大或噪声抑制是结合使用将噪声抑制低于某预定级的电路而静噪的场合,应该设定一个小于上述阈值nr1(第一阈值)的第二阈值nr2,以对输入电平小于第二阈值nr2的声音部分得到低抑制,亦即减弱频带扩宽电路的效果。
由于输入信号是在其声音和噪声未分开的情况下处理的,存在一种趋势,即声音功率相对较小的输入信号部分诸如辅音将不作为声音提供。如果输入信号经受一种特别强的噪声衰减,则该趋势将被增强,这将引起某种语言声音听起来和原来非常不同。因此,必须考虑,输入信号相对于平均帧功率要进行多强的噪声衰减,以及一个声音要经受多大的噪声衰减。
如果上述处理在多个帧中进行,则语言声音帧将不连续,这将在用户听该声音时导致某种不自然。
考虑上述方面,应该为该比例设定一个开始时间和恢复时间,以便平滑例如每一帧,以便提供自然的声音。
也就是说,从图6明显看出,由比例计算电路243计算的比例由平滑电路144平滑一次,供给噪声衰减电路145。
提供平滑电路144以解决在噪声衰减处理中上述可能发生的问题。开始时间和恢复时间为此目的设定。开始时间为“0”,而恢复时间是变量。
也就是说,当当前帧的计算的声音功率大于前一帧的声音功率时,和原来一样使用该计算的声音功率。当它小于前一帧的声音功率时,使用一个具有预定特性的低通滤波器(LPF)将其平滑,以避免上述由于帧功率的变化产生的不自然的感觉。
噪声衰减电路145通过用经过平滑电路14提供的一个比例乘上解码的语言声音信号SndN来衰减输入信号SndN的噪声,并在其输出端子146上提供具有较小噪声的输出信号。
给比例计算电路143提供由级鉴别电路147鉴别经由端子148供给的一个噪声级检测信号而产生的一个控制信号。根据该控制信号,为上述比例计算选择一个阈值。也就是说,比例计算的阈值基于噪声级检测信号。
噪声级检测信号是背景噪声部分的一个声音级,该背景噪声部分从一个语言声音参数代码检测得到,后者基于一个为产生采样速率为第一采样速率fs1的语言声音信号而由发射机发射的一个信号产生。
为上述目的,应该提供一个噪声部分检测电路从语言声音参数代码检测背景噪声部分和提供一个噪声级检测电路以检测由噪声部分检测电路检测到的噪声部分的噪声级。噪声部分检测电路和噪声级检测电路两者都没有示出。由噪声级检测电路产生的噪声级检测信号在端子148提供。
噪声衰减器使用为产生采样速率为第一采样速率fs1(8kHz)的语言声音信号而从发射机发射的信号,以便衰减在用于第一噪声衰减处理(a)的电路47上解码的语言声音的噪声。分别用于第二噪声衰减处理(b)和第三噪声衰减处理(b)的电路48和49实际衰减采样速率为16kHz的第二采样速率fs2的语言声音的噪声。因此,在噪声衰减器中提供分别用于第二噪声衰减处理(b)和第三噪声衰减处理(b)的电路48和49是为了施加第一噪声衰减处理(a)(在电路47内)给一个样本,该样本的语言频率为具有包含在第一频带B1或宽带BW内的一个语言频率的语言声音信号的语言频率的两倍(=fs2/fs1),而其采样速率是16kHz的第二采样速率fs2。
这样,噪声衰减器可以由用于第一噪声衰减处理(a)的电路47衰减解码的语言声音信号中的噪声分量,而由分别用于第二噪声衰减处理(b)或第三噪声衰减处理(b)的电路48和49衰减其采样速率为16kHz的第二采样速率fs2、具有包含在第一频带B1和宽带BW内的一个语言频率的语言声音信号中的噪声分量。
图4中的信号选择器32可以把其噪声由分别用于第一、第二和第三噪声衰减处理(a)、(b)和(b)的电路47、48和49衰减的一个语言声音信号由选择开关150选择发送到D/A转换器6。所述语言声音信号指:采样速率为8kHz的采样速率、具有包含在第一频带B1(300到3400Hz)内的一个语言频率的语言声音信号;采样速率为16kHz的采样速率、具有包含在第一频带B1(300到3400Hz)内的一个语言频率的语言声音信号;采样速率为16kHz的采样速率、具有包含在宽带BW(300到6000Hz)内的一个语言频率的宽带语言声音信号。
因此,图1所示接收机1在用户选择接收到的信号之前,衰减接收到的由PSI-CELP方法处理的、具有包含在第一频带B1(300到3400Hz)内的语言频率的、其采样速率彼此不同(8kHz和16kHz)的语言声音信号中的噪声,和在接收到的由PSI-CELP方法处理的、具有包含在宽带BW(300到6000Hz)内的语言频率的、其采样速率为16kHz的语言声音信号中的噪声。这样用户可以有宽的语言声音选择。另外,可以根据情况扩宽接收到的语言声音信号的语言频带,将其处理为具有和输入时同样的频带,使得结合使用的电池不至于过分消耗。
注意,对于D/A转换器6采样速率可以固定在16kHz,以及以采样速率固定保持在16kHz选择一个具有包含在第一频带B1和宽带BW内的语言频率的语言声音信号。由于对于8和16kHz的各个采样速率D/A转换器6中使用的时钟可以不改变,因此对于为该时钟变化可以不提供任何硬件。
在上采样电路45中,当选择开关150在8和16kHz的采样速率的位置之间移动时清除滤波器输出,以防止产生噪声。
下面参考图10到12说明图1所示接收机1中提供的信号处理器5的变体。图10表示包含在图1所示接收机中提供的信号选择器的变体中的VSELP解码器。图11是包含在图1所示接收机中提供的信号处理器的一个变体中的信号选择器的方框图,图12是图1所示信号选择器的操作的详细流程图。该信号处理器5具有图10所示解码器58和图11所示的信号选择器65。
当在图2所示发射机15的信号处理器21中的语言声音编码器采用的编码方法是VSELP(矢量和激励线性预测)时,解码器58解码使用VSELP编码的语言声音信号以便发射,并将解码的语言声音SndN在输出59提供,线性预测滤波器因子αN在输出端子60提供,激励源1ExcN1在输出端子61提供,激励源2ExcN2在输出端子62提供。
如图11所示构造的信号选择器65,除提供一个激励源选择和频带扩宽电路68外,相似于图4所示信号选择器32。
在PSI-CELP方法中,编码解码器除别的信号外,处理浊音信号使之声学上平滑。然而在VSELP方法中,不进行这一处理,使得频带扩宽的语言声音听起来好象包含某种噪声。为避免这一点,使用激励源选择和频带扩宽电路68如图12处理该信号以产生一个宽带激励源。激励源选择和频带扩宽电路68结合到一个激励选择电路中。在图12所示流程图中步骤S87到S89替换图6所示的激励源处理。
用于VSELP的激励源如下产生:
β*bL[i]+γ*cl[i]
式中β是用在编码解码器中的一个参数(长期预测因子),bL[i]是一个长期滤波器状态,γ是一个增益,而cl[i]是一个激励代码矢量。上述表达式中的前一项表示一个音调分量,而后一项表示一个噪声分量。于是激励源分成两部分β*bL[i]和γ*cl[i]。如果在步骤S87判定,在一个预定时间范围内,前一部分的能量大,则可以考虑该激励源是具有强音调的浊音。于是如果在步骤S88判定激励源1的采样值大于预定值(是),则该激励源是一个脉冲链。如果判定无音调分量(否),则该激励源被抑制到零。如果在步骤S87判定前一项(音调分量)的能量不大,则执行常规步骤。在步骤S89,对如此产生的一个窄带激励源和在PSI-CELP方法中一样通过填充零进行上采样,从而提供一个宽带激励源。这样浊音的声学质量在VSELP方法中得到改善。
在步骤S95,由加法器46把该宽带激励源加到由上采样电路45在步骤S92进行上采样的原来的语言声音SndN上。在步骤S91,由相加产生的语言声音的高频带由高频带提取和抑制滤波器42滤波,它在某种程度上抑制高于大约6kHz的分量,从而提供容易听的语言声音。滤波器42的滤波因子可选,前面已经说明。
进一步在步骤S93,使用乘法器43根据用户品味调整该语言声音的高频带的增益。
另外,信号选择器65有一个噪声衰减器,它包括分别用于第一、第二和第三噪声衰减处理(a)、(b)和(b)的电路47、48和49。用于第一噪声衰减处理(a)的电路47可以衰减解码的语言声音信号中的噪声分量,用于第二和第三噪声衰减处理(b)的电路48和49可以衰减采样速率为16kHz的第二采样速率fs2、包含在第一频带B1和宽带BW中的语言声音信号中的噪声分量。
因此使用VSELP解码方法的信号选择器65也可以给D/A转换器6发送具有包含在第一频带B1(300到3400Hz)内的一个语言频率和采样速率为8kHz的语言声音信号,具有包含在第一频带B1内的一个语言频率和采样速率为16kHz的语言声音信号,具有包含在宽带BW内的一个语言频率和采样速率为16kHz的宽带语言声音信号,它们由选择开关150选择。
因此,图1所示接收机1在由用户选择接收到的信号之前,衰减由VSELP方法处理的接收到的语言声音信号中的噪声,该语言声音信号具有包含在第一频带(300到3400Hz)内的一个语言频率,其采样速率不同(8kHz或16kHz),和由VSELP方法处理的接收到的语言声音信号中的噪声,该语言声音信号具有包含在宽带(300到6000Hz)内的一个语言频率,其采样速率16kHz。这样用户可以对语言声音有宽的选择。另外接收到的由VSELP方法处理的语言声音信号可以根据情况扩宽语言频带,将其处理使之具有和输入时同样的频带,这样可以防止结合使用的电池消耗过多。
另外,在使用VSELP解码方法的信号选择器65中,当重放记录的消息以产生采样速率从8kHz变换为16kHz的一个高质量的宽带语言声音时,可以使用在消息记录方式期间记录在存储器13中的语言声音参数代码。
采样速率为8kHz的语言声音参数代码记录在存储器13中,而重放采样速率为16kHz的宽带语言声音。这样,可以以减少的记录容量记录一个消息语言声音而以高质量重放。
现在参考图13,图中以方框图的形式表示包含在图1所示接收机中提供的信号处理器的另一变体中的一个信号选择器。图14是包含在图1所示接收机中提供的信号处理器的再一变体中的解码器的方框图。图1所示接收机1中结合的信号处理器5可以包括图13所示信号选择器70和图14所示解码器。它放在这里作为另一变体。
图14所示解码器包括VSELP解码器77和PSI-CELP解码器81。根据编码由发射机发射的语言声音参数代码的VSELP或PSI-CELP方法,该语言声音参数代码要么供给VSELP解码器77,或者供给PSI-CELP解码器81,即是说,经由输入端子75接收的语言声音参数代码由选择开关76根据VSELP或PSI-CELP的编码方法种类在两者之间切换。
来自VSELP解码器77的两个激励源1ExcN1和2ExcN2分别经由输出端子78和79供给输入端子66和67。来自PSI-CELP解码器81的激励源NExcN经由输出端子82供给图13所示输入端子35。
来自VSELP解码器77或PSI-CELP解码器81的一个线性预测滤波器因子αv或αp由选择开关80根据编码该语言声音的编码方法选择,然后经由输出端子83供给图13中的输入端子34。
类似地,来自VSELP解码器77或PSI-CELP解码器81的一个解码的语言声音由选择开关84根据编码该语言声音的编码方法选择,然后经由输出端子85供给图13中的输入端子33。
在图13所示信号选择器70中,来自激励源选择和频带扩宽电路68或激励源频带扩宽电路41的激励源输出由可根据编码方法设定的一个选择开关71选择,并供给LPC合成电路40。
另外,信号选择器70有一个噪声衰减器,其由分别用于第一、第二和第三噪声衰减处理(a)、(b)和(b)的电路47、48和49组成。用于第一噪声衰减处理(a)的电路47可以衰减解码的语言声音信号中的噪声分量,用于第二和第三噪声衰减处理(b)的电路48和49可以衰减采样速率为16kHz的第二采样速率fs2、具有包含在第一频带B1和宽带BW中的一个语言频率的语言声音信号中的噪声分量。
因此,根据编码由发射机发射的信号的编码方法的种类,信号选择器70在用户选择接收到的信号之前,衰减具有在包含在第一频带B1(300到3400Hz)内的一个语言频率的、其采样速率彼此不同(8kHz或16kHz)的一个接收到的语言声音信号中的噪声,和在具有包含在宽带(300到6000Hz)内的一个语言频率,其采样速率为16kHz的一个接收到的语言声音信号中的噪声。这样用户可以对语言声音有宽的选择。另外接收到的语言声音信号可以根据情况扩宽频带,将其处理使之具有和输入时同样的频带,这样可以防止结合使用的电池消耗过多。
另外,在消息重放方式期间,信号选择器70可以使用在消息记录期间记录在存储器13中的一个语言声音参数代码产生其采样速率从8kHz转变为16kHz的一个宽带语言声音,更特别的是,可以使用记录在该存储器中的一个语言声音参数代码提供一个高质量宽带语言声音,其采样速率按照编码由发射机发射的信号的编码方法通过扩宽频带设定为两倍高(到16kHz)。
此外,图1所示接收机1中的信号处理器5可以包括一个信号选择器90,其示于图14。该信号选择器90也可以读在消息记录期间记录在图1所示存储器13中和在表1和2中示出的语言声音参数代码,以便在消息重放时重放采样速率为16kHz的宽带语言声音。
给信号选择器90的输入端子91供给从存储器13读取的作为LPC残留信号的激励源。另外,给输入端子92供给从存储器13读取的一个线性预测滤波器因子α。来自输入端子91的激励源送到LPC合成滤波器93和上采样电路100。来自输入端子92的线性预测滤波器因子送往LPC合成滤波器93。
LPC合成滤波器93使用来自输入端子92的线性预测滤波器因子根据来自输入端子91的激励源合成一个语言声音信号。由LPC合成滤波器93合成的信号供给用于第一噪声衰减处理(a)的电路161和在噪声衰减器中的上采样电路94。
用于第一噪声衰减处理(a)的电路161的作用和用于第一噪声衰减处理(a)的电路47类似,因此不再说明。
上采样电路94上采样由LPC合成滤波器93产生的语言声音信号的采样速率fs1。上采样的语言声音信号供给用于第二噪声衰减处理(b)的电路162和噪声衰减器的带通滤波器(BRF)95。
用于第二噪声衰减处理(b)的电路162的作用和用于第二噪声衰减处理(b)的电路48类似。亦即,它把具有类似图6所示结构的噪声衰减器的电路161的第一噪声衰减处理(a)施加于一个样本,其采样速率为16kHz,它是具有包含在第一频带B1或宽带BW内的一个语言频率的语言声音信号的采样速率的两倍(=fs2/fs1)。
带通滤波器(BPF)95只允许通过从上采样电路94输出的一个预定频带内的一个信号,并将其供给加法器96。通向上采样电路94、带通滤波器95和加法器96的路径是这样一条路径,包含在原来语言频带内的一个分量的信号沿该路径加到合成的语言声音信号上。
另外,一个线性预测滤波器因子从LPC合成滤波器93送往一个线性预测滤波器因子/自相关(α/γ)变换器97,它把线性预测滤波器因子变换为一个自相关。把该自相关送往一个窄带代码簿98和一个塞擦音检测器99。
另外,来自输入端子91的激励源由上采样电路100上采样,通过低通滤波器101和增强器102送往LPC合成滤波器103。提供增强器102在检测到塞擦音或摩擦音时增强该激励源。增强器102的增强比例根据塞擦音检测器99的输出控制。
窄带代码簿98存储从多个语言声音信号模式中先前获得的窄带语言信号的自相关作为代码矢量。在窄带代码簿98中,来自α/γ变换器97的一个自相关与在代码簿98中的自相关信息比较以使它们彼此匹配。被判定为最匹配来自变换器97的自相关的一个自相关信息的牵引被送往宽带代码簿104。
相应于窄带代码簿98,宽带代码簿104存储从和当产生窄带代码簿98时使用的具有同一模式的语言声音中获得的宽带语言信号的自相关信息作为代码矢量。在窄带代码簿98中,被判定为最匹配来自变换器的自相关的一个自相关信息的牵引被送往宽带代码簿104,从中读取相应于被判定为最匹配该自相关的窄带自相关信息的宽带自相关信息。
从宽带代码簿104读取的宽带自相关信息送往自相关/线性预测滤波器因子(γ/α)变换器105,它变换自相关为一个线性预测滤波器因子。该线性预测滤波器因子被送往LPC合成滤波器103。
LPC合成滤波器103提供LPC合成以合成宽带语言声音信号,后者被供给高频带提取和抑制滤波器106和乘法器107。
高频带提取和抑制滤波器106从来自LPC合成滤波器103合成的输出中去除输入的窄带语言声音信号的300到3400Hz的信号分量,抽取高于3400Hz的信号分量,并根据用户品味抑制高频分量。乘法器107用来自输出108的所调整的增益乘以高频带提取和抑制滤波器106的输出。
加法器96把通过带通滤波器(BPF)95的一个原来窄带语言声音信号分量加到来自乘法器107的乘积输出上以提供一个宽带语言声音信号。该宽带语言声音信号供给包括在噪声衰减器中用于第三噪声衰减处理(b)的电路163。
用于第三噪声衰减处理(b)的电路163的作用和用于第三噪声衰减处理(b)的电路49类似。亦即,类似于用于第二噪声衰减处理(b)的电路162,它把具有类似图6所示结构的噪声衰减器的电路161的第一噪声衰减处理(a)施加于一个样本,其采样速率为16kHz,该速率为具有包含在宽带BW内的一个语言频率的语言声音信号的采样速率的两倍(=fs2/fs1)。
用于第一噪声衰减处理(a)的电路161的输出、用于第二噪声衰减处理(b)的电路162的输出、和用于第三噪声衰减处理(b)的电路163的输出分别供给选择开关109的可选端子a、b和c。
更具体说,选择开关109在其可选端子
a接收具有包含在第一频带B1(300到3400Hz)内的一个语言频率的、其采样速率是8kHz的第一采样速率fs1的、经过噪声衰减的一个语言声音信号,在可选端子
b接收具有包含在第一频带B1(300到3400Hz)内的一个语言频率的、其采样速率是16kHz的第二采样速率fs2的、经过噪声衰减的一个语言声音信号,在可选端子
c接收具有包含在宽带BW(300到6000Hz)内的一个语言频率的、其采样速率是16kHz的第二采样速率fs2的、经过噪声衰减的一个语言声音信号。选择开关109另外还有一个选择杆
d。通过根据从选择控制信号端子129来的选择控制信号移动选择杆
d,选择开关109把以上述一种方式噪声衰减的语言声音信号供给D/A转换器6。
现在参考图15,其中以方框图的形式表示包含在图1所示接收机中提供的信号处理器的又一变体中的一个信号选择器90。如上所述,包含图15所示信号选择器90的接收机允许用户选择下述接收到的信号中的任何一个:具有包含在300到3400Hz的第一频带B1内的语言频率、其采样速率彼此不同(8kHz和16kHz)的语言声音信号,和具有包含在300到6000Hz的宽带内的一个语言频率、其采样速率为16kHz的语言声音信号,两者都经过噪声衰减。
注意,接收机1中的信号处理器5在每一信号选择器32、65、70和90中可以包括在每一噪声衰减处理的下游或上游连接的一个后滤波器。
后滤波器提供一种后滤波,意在使每一语言声音信号经受谱成形和声学质量改善,它通过在本发明的申请的日本未审专利公开、号码为9-127996中公开的语言声音解码方法和装置中应用的技术实现。
现在参考图16,其中给出在图4所示信号选择器32中提供的噪声衰减器的方框图,在其下游连接有一个后滤波器。如图所示,信号选择器32包括用于第一后滤波处理(a)的电路171、用于第二后滤波处理(b)的电路172和用于第三后滤波处理(b)的电路173,分别连接在用于第一噪声衰减处理的电路47、用于第二噪声衰减处理(b)的电路48和用于第三噪声衰减处理(b)的电路49的下游,且在其中应用语言声音解码方法和装置。图17是包括在图16所示信号选择器中的后滤波器的详细方框图。
如图17所示,后滤波器包括作为其基本部分的谱成形滤波器131。谱成形滤波器131包括构形成分(formant)增强滤波器132和高频带增强滤波器133。谱成形滤波器131的输出送往增益控制器134,后者修正由一次谱成形引起的增益改变。增益控制器134的增益由增益控制电路136决定。增益控制电路136通过比较向谱成形滤波器131的输入和从其的输出计算增益改变,并提供为增益控制器134的增益G的一个修正值。对谱成形滤波器131的输入是一个解码的语言声音信号SndN,其噪声已经由用于第一噪声衰减处理(a)的电路47衰减,谱成形滤波器131的输出是从后滤波器的输出,在端子137提供。
下面详细说明后滤波器的工作。
图17中的谱成形滤波器131的特性PF(Z)可以使用线性预测滤波器因子αi表示如下:
式中β、γ和k例如是0.6、0.8和0.3的常数。在表达式(6)中,分数表示构形成分增强滤波器132的特性,而[l-kz-1]部分表示高频带增强滤波器133的特性。
增益控制电路134的增益G可以表示如下:
式中x(i)是对谱成形滤波器131的输入,亦即输入宽带语言声音信号SndW,而y(i)是从谱成形滤波器131的输出
现在参考图18,其中解释后滤波器的滤波器因子更新周期和增益更新周期。如图所示,用于谱成形滤波器131的因子更新周期是用于LPC合成电路40的因子(αW)更新周期,亦即20个样本(2.5毫秒),而用于增益控制电路134的增益(G)更新周期是160个样本(20毫秒)。
这样,用于增益控制电路134的增益(G)更新周期设定的比为用于第一后滤波(a)的电路171的谱成形滤波器131的因子更新周期长以防止增益改变的负作用。
即是说,在通常的后滤波器中,用于谱成形滤波器的因子更新周期和用于增益控制电路的增益更新周期相同。假定增益更新周期是20个样本(2.5毫秒),则增益在一个音调周期内改变,引起咔哒噪声。通过设定较长增益更新周期,例如一帧160个样本(20毫秒),能够防止增益在后滤波器中改变。如果用于谱成形滤波器131的因子更新周期设定为长于160个样本(20毫秒)的话,则后滤波器的特性不能在短时间内赶上语言声音谱的改变,以致不能获得声学质量改善。然而,设定滤波器因子更新周期短到20个样本(2.5毫秒)将提供有效的后滤波。
用于第一后滤波处理(a)的电路171用于处理一个语言声音参数代码(例如α),其基于为产生采样速率是8kHz的第一采样速率fs1的一个语言声音信号而由发射机发射的一个信号。用于第二后滤波处理(b)的电路172和用于第三后滤波处理(b)的电路173用于处理一个语言声音信号,其采样速率是16kHz的第二采样速率fs2。亦即用于第二后滤波处理(b)的电路172和用于第三后滤波处理(b)的电路173实际上用于把图17所示第一后滤波处理施加到一个语言声音信号,其采样速率是16kHz,两倍于(=fs2/fs1)8kHz的第一采样速率。
第一后滤波允许有效改善经过噪声衰减的解码的语言声音信号的谱形状和声学质量。另外,分别用于第二和第三后滤波处理(b)的电路172和173可以有效地改善那些语言声音信号的谱形状和声学质量,它们具有包含在第一频带B1和宽带BW内的语言频率,经过噪声衰减,采样速率为16kHz的第二采样速率fs2。
这样,图16所示信号选择器32可以通过选择开关150给D/A转换器6发送其噪声分别由用于第一、第二和第三噪声衰减处理(a)、(b)和(b)的电路47、48和49衰减的、其谱形状和声学质量分别由用于第一、第二和第三后滤波处理(a)(b)(b)的电路171、172和173有效改善的语言声音信号,也就是说,根据需要选择的下述语言声音信号中的任何一个:具有包含在300到3400Hz的第一频带B1内的一个语言频率,其采样速率fs1为8kHz的语言声音信号;具有包含在300到3400Hz的第一频带B1内的一个语言频率、其采样速率为16kHz的语言声音信号;和具有包含在300到6000Hz的宽带BW内的一个语言频率、其采样速率为16kHz的语言声音信号。
注意,使用包括信号选择器32、65、70或90的信号处理的接收机可以与发射机集成在一起形成,以提供图19所示移动电话。图19是这种移动电话的方框图。该移动电话用参考标号110统指。移动电话110可作为PDC应用于当前盛行的数字移动电话。移动电话110具有这样一种电话应答功能,即语言声音参数代码记录在诸如半导体存储器、磁带等记录介质中,其从记录介质读出,而在自动消息记录方式期间发射并自动记录的语言声音可以使用第二采样速率fs2重放。
在移动电话110中,从传声器111进入的语言声音信号通过放大器112、可变电阻器113、去混叠滤波器114和A/D转换器115,然后存储在信号处理器116的存储器116a中。
在存储器116a中存储的语言声音信号由在信号处理器116中的语言声音编码器编码以提供一个语言声音参数代码。
该语言声音参数代码经由控制器117、RF发射放大器118和天线119发射给基站。
在信号处理器116中的语言声音编码器把语言声音参数代码经由控制器117供给RF放大器118,同时考虑由于传输路径的带宽有限而使频带变窄。
另外,从基站经由天线119接收到的语言声音参数代码通过RF放大器118和控制器117传递,然后存储在信号处理器122中的存储器122a中。
在信号处理器122的存储器122a中存储的语言声音参数代码由信号处理器122的一个解码器解码,然后在其作为输出提供之前以预定方式处理。另外,当重放在自动消息记录方式自动记录的一个接收到的语言声音时,存储在存储器130中的语言声音参数代码由信号处理器122的解码器解码,并在作为输出提供之前以预定方式处理。
从信号处理器122来的输出信号由D/A转换器123转换为模拟信号,通过去混叠滤波器124、可变电阻器125和放大器128,然后从扬声器127作为输出提供。
信号处理器122包括上述信号选择器32、65、70或90。因此,图19所示移动电话110可以有效改善那些宽带语言声音信号的谱形状和声学质量,该宽带语言声音信号的采样速率已在接收机中加倍,且信号中的噪声分量已经衰减。
另外,采样速率为8kHz的语言声音参数代码记录在存储器130中,而作为采样速率为16kHz的一个宽带语言声音重放,因此可以以小容量完成记录,重放高质量的语言声音。
注意,虽然在接收机和移动电话中使用半导体存储器作为记录介质记录语言声音参数代码,但是记录介质可以是诸如磁带等的任何其它类型。
另外注意,虽然在接收机和移动电话中语言声音参数代码记录在专用存储器13和存储器130中,但是根据本发明,可以共用控制器或信号处理器中的存储器记录语言声音参数代码。
上面说明,作为本发明的实施例的接收机、发射机和移动电话可以应用于用作PDC的数字移动电话。然而,它们也可以应用于宽带CDMA系统,亦即使用宽语言频带的移动通信系统。
Claims (25)
1.一种接收装置,包括:
采样速率变换设备,用于变换一个语言声音信号的采样速率fs1为第二采样速率fs2(fs2>fs1),所述语言声音信号的语言频率包含在第一频带B1内,其由基于为产生第一采样速率fs1的语言声音信号而从发射机发射的一个信号的语言声音参数代码产生;
频带外分量预测设备,用于根据所述语言声音参数代码预测具有包含在第二频带B2内的一个语言频率的第二采样速率fs2的一个语言声音信号为第一频带B1外的一个分量。
2.如权利要求1所述接收装置,另外包括:
相加设备,用于把具有第一频带B1内的语言频率的语言声音信号和具有第二频带B2内的语言频率的语言声音信号相加,以提供具有宽带BW内的语言频率的语言声音信号,前一语言声音信号是由采样速率变换设备以第二采样速率fs2采样形成,第二语言声音信号的采样速率是第二采样速率fs2,其由频带外分量预测设备预测。
3.如权利要求2所述接收装置,另外包括:
噪声衰减设备,用于衰减从相加设备来的相加输出的噪声。
4.如权利要求3所述接收装置,其中噪声衰减设备根据从语言声音参数代码中检测到的背景噪声分量的噪声级形成一个控制信号,并根据该控制信号把噪声衰减应用于相加输出,所述语言声音参数代码基于为产生第一采样速率fs1的语言声音信号而由发射机发射的一个信号产生。
5.如权利要求4所述接收装置,其中噪声衰减设备根据从语言声音参数代码中检测到的背景噪声分量的噪声级形成一个控制信号,并根据该控制信号重复噪声衰减fs2/fs1次,所述语言声音参数代码基于为产生第一采样速率fs1的语言声音信号而由发射机发射的一个信号产生。
6.如权利要求2所述接收装置,另外包括:
后滤波设备,用于对来自相加设备的相加输出进行后滤波。
7.如权利要求6所述接收装置,其中后滤波设备根据语言声音参数代码重复对相加输出后滤波fs2/fs1次,所述语言声音参数代码基于为产生第一采样速率fs1的语言声音信号而由发射机发射的一个信号产生。
8.如权利要求7所述接收装置,其中后滤波设备包括:
谱成形滤波器设备,给它提供解码的信号,其滤波器因子以第一周期更新;
增益控制设备,给它提供从谱成形设备来的输出,其增益以和第一周期不同的第二周期更新。
9.如权利要求8所述接收装置,其中后滤波设备设定第二周期长于第一周期。
10.如权利要求2所述接收装置,另外包括:
选择下述语言声音信号之一的设备,具有包含在频带B1内的语言频率、由采样速率变换设备以第二采样速率fs2采样形成的语言声音信号;具有包含在宽带BW内的语言频率、从相加设备提供的语言声音信号。
11.如权利要求10所述接收装置,其中选择设备选择第一采样速率fs1的一个语言声音信号,其语言频率包含在第一频带B1内,且从语言声音参数代码产生。
12.如权利要求1所述接收装置,另外包括:
记录介质,用于存储基于发射机发射的信号产生的语言声音参数代码;
包含在第一频带B1内的语言声音信号,其使用存储在记录介质中的语言声音参数代码产生。
13.如权利要求1所述接收装置,其中频带外分量预测设备包括:
扩宽作为语言声音参数代码的一个线性预测残留信号的频带的部件;
扩展线性预测滤波器因子频带到一个宽带的部件。
14.如权利要求13所述接收装置,其中扩展线性预测滤波器因子频带到一个宽带的部件包括:
变换该线性预测滤波器因子为一个自相关的第一变换器;
自相关频带扩宽设备,用于参考具有先前存储在该宽带内的自相关的一个代码簿扩宽来自第一变换器的自相关的频带;
变换来自自相关频带扩宽设备的频带扩宽的自相关为一个频带扩宽的线性预测滤波器因子的第二变换器。
15.如权利要求13所述接收装置,其中线性预测残留频带扩宽部件包括:
上采样该线性预测残留的上采样电路。
16.如权利要求1所述接收装置,其中发射信号是PSI-CELP编码的或VSELP编码的信号;以及
频带外分量预测设备使用由解码该PSI-CELP编码的或VSELP编码的信号为而产生的语言声音参数代码预测具有包含在第二频带B2内的一个语言频率的、第二采样速率fs2的语言声音信号为第一频带B1外的一个分量。
17.一种接收方法,包括步骤:
变换设备变换一个语言声音信号的采样速率fs1为第二采样速率fs2(fs2>fs1),所述语言声音信号的语言频率包含在第一频带B1内,其由基于为产生第一采样速率fs1的语言声音信号而从发射机发射的一个信号产生的一个语言声音参数代码产生;
根据所述语言声音参数代码预测具有在第二频带B2内的语言频率的第二采样速率fs2的一个语言声音信号是在第一频带B1外的一个分量。
18.一种通信装置,包括:
发射设备,用于以第一采样速率fs1编码输入语言声音信号以产生一个发射信号;
接收设备,用于从基于以第一采样速率fs1编码产生的发射信号产生的一个语言声音参数代码产生第二采样速率fs2(fs2>fs1)的语言声音信号。
19.如权利要求18所述通信装置,其中接收设备包括:
采样速率变换设备,用于变换具有包含在第一频带B1内的语言频率的语言声音信号的采样速率fs1为第二采样速率fs2(fs2>fs1),所述语言声音信号从基于为产生具有第一采样速率fs1的语言声音信号而由发射机发送的一个信号产生的一个语言声音参数代码产生;和预测设备,用于根据该语言声音参数代码预测具有第二频带B2内的一个语言频率的第二采样速率fs2的一个语言声音信号是在第一频带B1外的一个分量。
20.如权利要求19所述通信装置,其中接收设备包括相加设备,用于把具有第一频带B1内的一个语言频率的语言声音信号和由频带外分量预测设备预测的具有第二频带B2内一个语言频率的第二采样速率fs2的语言声音信号相加,前一语言声音信号是由采样速率变换设备以第二采样速率fs2采样形成。
21.如权利要求19所述通信装置,其中频带外分量预测设备包括:
扩宽作为语言声音参数代码的一个线性预测残留信号的频带的部件;
扩展线性预测滤波器因子频带为一个宽带的部件。
22.如权利要求21所述通信装置,其中扩展线性预测滤波器因子频带为一个宽带的部件包括:
变换该线性预测滤波器因子为一个自相关的第一变换器;
自相关频带扩宽设备,用于参考具有先前存储在该宽带内的自相关的一个代码簿扩宽来自第一变换器的自相关的频带;
变换来自自相关频带扩宽设备的频带扩宽的自相关为一个频带扩宽的线性预测滤波器因子的第二变换器。
23.如权利要求21所述通信装置,其中线性预测残留信号频带扩宽部件包括:
上采样该线性预测残留信号的上采样电路。
24.如权利要求19所述通信装置,其中发射信号是PSI-CELP编码的或VSELP编码的信号;
频带外分量预测设备使用由解码该PSI-CELP编码的或VSELP编码的信号而产生的语言声音参数代码预测具有第二频带B2内的语言频率的、第二采样速率fs2的语言声音信号为第一频带B1外的一个分量。
25.一种通信方法,包括步骤:
以第一采样速率fs1编码输入语言声音信号以产生一个发射信号;
根据基于以第一采样速率fs1编码而产生的一个发射信号产生的语言声音参数代码预测具有在第二频带B2内的语言频率的第二采样速率fs2的一个语言声音信号是在第一频带B1外的一个分量。
Applications Claiming Priority (10)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10353345A JP2000181495A (ja) | 1998-12-11 | 1998-12-11 | 受信装置及び方法、通信装置及び方法 |
JP353345/1998 | 1998-12-11 | ||
JP10353344A JP2000181494A (ja) | 1998-12-11 | 1998-12-11 | 受信装置及び方法、通信装置及び方法 |
JP353344/1998 | 1998-12-11 | ||
JP35483198A JP4135240B2 (ja) | 1998-12-14 | 1998-12-14 | 受信装置及び方法、通信装置及び方法 |
JP354831/1998 | 1998-12-14 | ||
JP361711/1998 | 1998-12-18 | ||
JP36171198A JP4135242B2 (ja) | 1998-12-18 | 1998-12-18 | 受信装置及び方法、通信装置及び方法 |
JP11007001A JP2000206997A (ja) | 1999-01-13 | 1999-01-13 | 受信装置及び方法、通信装置及び方法 |
JP7001/1999 | 1999-01-13 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1261713A true CN1261713A (zh) | 2000-08-02 |
Family
ID=27518772
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN99127498A Pending CN1261713A (zh) | 1998-12-11 | 1999-12-11 | 接收装置和方法,通信装置和方法 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP1008984A3 (zh) |
KR (1) | KR20000047944A (zh) |
CN (1) | CN1261713A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1678129B (zh) * | 2004-03-30 | 2010-12-01 | 雅马哈株式会社 | 啸叫频率分量加重方法及设备 |
US8000968B1 (en) | 2011-04-26 | 2011-08-16 | Huawei Technologies Co., Ltd. | Method and apparatus for switching speech or audio signals |
CN103177730A (zh) * | 2003-09-30 | 2013-06-26 | 松下电器产业株式会社 | 采样速率转换装置、编码装置、解码装置及它们的方法 |
CN104023188A (zh) * | 2014-05-28 | 2014-09-03 | 北京数字电视国家工程实验室有限公司 | 一种dtmb接收机的多带宽应用方法及对应的dtmb接收机 |
CN108198571A (zh) * | 2017-12-21 | 2018-06-22 | 中国科学院声学研究所 | 一种基于自适应带宽判断的带宽扩展方法及系统 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2351889B (en) | 1999-07-06 | 2003-12-17 | Ericsson Telefon Ab L M | Speech band expansion |
US6732070B1 (en) | 2000-02-16 | 2004-05-04 | Nokia Mobile Phones, Ltd. | Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching |
US6691085B1 (en) * | 2000-10-18 | 2004-02-10 | Nokia Mobile Phones Ltd. | Method and system for estimating artificial high band signal in speech codec using voice activity information |
US6615169B1 (en) | 2000-10-18 | 2003-09-02 | Nokia Corporation | High frequency enhancement layer coding in wideband speech codec |
US20020128839A1 (en) * | 2001-01-12 | 2002-09-12 | Ulf Lindgren | Speech bandwidth extension |
DE10102173A1 (de) * | 2001-01-18 | 2002-07-25 | Siemens Ag | Verfahren und Anordnung zum Umsetzen von parametrisch codier-ten Sprachsignalen verschiedener Bandbreite in Sprachsignale |
SE522553C2 (sv) * | 2001-04-23 | 2004-02-17 | Ericsson Telefon Ab L M | Bandbreddsutsträckning av akustiska signaler |
BRPI0607646B1 (pt) | 2005-04-01 | 2021-05-25 | Qualcomm Incorporated | Método e equipamento para encodificação por divisão de banda de sinais de fala |
PL1875463T3 (pl) | 2005-04-22 | 2019-03-29 | Qualcomm Incorporated | Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia |
EP1970900A1 (en) | 2007-03-14 | 2008-09-17 | Harman Becker Automotive Systems GmbH | Method and apparatus for providing a codebook for bandwidth extension of an acoustic signal |
US8688441B2 (en) * | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
US20090201983A1 (en) | 2008-02-07 | 2009-08-13 | Motorola, Inc. | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US9711156B2 (en) * | 2013-02-08 | 2017-07-18 | Qualcomm Incorporated | Systems and methods of performing filtering for gain determination |
CN104269173B (zh) * | 2014-09-30 | 2018-03-13 | 武汉大学深圳研究院 | 切换模式的音频带宽扩展装置与方法 |
CN110610717B (zh) * | 2019-08-30 | 2021-10-15 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 复杂频谱环境混合信号的分离方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2779886B2 (ja) * | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
US5455888A (en) * | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
JPH07193548A (ja) * | 1993-12-25 | 1995-07-28 | Sony Corp | 雑音低減処理方法 |
EP0732687B2 (en) * | 1995-03-13 | 2005-10-12 | Matsushita Electric Industrial Co., Ltd. | Apparatus for expanding speech bandwidth |
JP3653826B2 (ja) * | 1995-10-26 | 2005-06-02 | ソニー株式会社 | 音声復号化方法及び装置 |
JPH10124088A (ja) * | 1996-10-24 | 1998-05-15 | Sony Corp | 音声帯域幅拡張装置及び方法 |
JP4132154B2 (ja) * | 1997-10-23 | 2008-08-13 | ソニー株式会社 | 音声合成方法及び装置、並びに帯域幅拡張方法及び装置 |
-
1999
- 1999-12-07 KR KR1019990055298A patent/KR20000047944A/ko not_active Application Discontinuation
- 1999-12-09 EP EP99309902A patent/EP1008984A3/en not_active Withdrawn
- 1999-12-11 CN CN99127498A patent/CN1261713A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103177730A (zh) * | 2003-09-30 | 2013-06-26 | 松下电器产业株式会社 | 采样速率转换装置、编码装置、解码装置及它们的方法 |
CN1678129B (zh) * | 2004-03-30 | 2010-12-01 | 雅马哈株式会社 | 啸叫频率分量加重方法及设备 |
US8214218B2 (en) | 2010-04-28 | 2012-07-03 | Huawei Technologies Co., Ltd. | Method and apparatus for switching speech or audio signals |
US8000968B1 (en) | 2011-04-26 | 2011-08-16 | Huawei Technologies Co., Ltd. | Method and apparatus for switching speech or audio signals |
CN104023188A (zh) * | 2014-05-28 | 2014-09-03 | 北京数字电视国家工程实验室有限公司 | 一种dtmb接收机的多带宽应用方法及对应的dtmb接收机 |
CN104023188B (zh) * | 2014-05-28 | 2017-03-29 | 北京数字电视国家工程实验室有限公司 | 一种dtmb接收机的多带宽应用方法及对应的dtmb接收机 |
CN108198571A (zh) * | 2017-12-21 | 2018-06-22 | 中国科学院声学研究所 | 一种基于自适应带宽判断的带宽扩展方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
KR20000047944A (ko) | 2000-07-25 |
EP1008984A2 (en) | 2000-06-14 |
EP1008984A3 (en) | 2000-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1261713A (zh) | 接收装置和方法,通信装置和方法 | |
CN1127055C (zh) | 用于对宽带声音信号进行有效的编码的感觉加权设备与方法以及使用该设备的蜂窝通信系统 | |
CN1264138C (zh) | 复制语音信号、解码语音、合成语音的方法和装置 | |
RU2387025C2 (ru) | Способ и устройство для векторного квантования спектрального представления огибающей | |
CN1096148C (zh) | 信号编码方法和装置 | |
CN1158648C (zh) | 语音可变速率编码方法与设备 | |
CN1252681C (zh) | 一种码激励线性预测语音编码器的增益量化 | |
CN100338648C (zh) | 在基于线性预测的语音编码解码器中有效帧删除隐藏的方法和器件 | |
CN1193644C (zh) | 用频谱减少来降低双送话器信号噪声的系统和方法 | |
CN1185620C (zh) | 声音合成装置和方法以及电话装置 | |
CN1202514C (zh) | 编码和解码语音及其参数的方法、编码器、解码器 | |
CN1156872A (zh) | 语音编码的方法和装置 | |
CN1391689A (zh) | 宽带语音和音频信号解码器中的增益平滑 | |
CN1689069A (zh) | 声音编码设备和声音编码方法 | |
CN1871501A (zh) | 频谱编码装置、频谱解码装置、音响信号发送装置、音响信号接收装置及其使用方法 | |
CN1161751C (zh) | 语音分析方法和语音编码方法及其装置 | |
CN1155725A (zh) | 语音编码方法和装置 | |
CN1457425A (zh) | 用于语音编码的码本结构与搜索 | |
CN1145512A (zh) | 再现语音信号的方法和装置以及传输该信号的方法 | |
CN1679082A (zh) | 控制包含语音和其它类型音频素材的信号中的语音响度 | |
CN1918461A (zh) | 在存在背景噪声时用于语音增强的方法和设备 | |
CN1669074A (zh) | 话音增强装置 | |
CN1240978A (zh) | 音频信号编码装置、解码装置及音频信号编码、解码装置 | |
CN1281576A (zh) | 声音信号加工方法和声音信号加工装置 | |
CN1969319A (zh) | 信号编码 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |