JP2000181497A - Device and method for reception and device method for communication - Google Patents

Device and method for reception and device method for communication

Info

Publication number
JP2000181497A
JP2000181497A JP10361711A JP36171198A JP2000181497A JP 2000181497 A JP2000181497 A JP 2000181497A JP 10361711 A JP10361711 A JP 10361711A JP 36171198 A JP36171198 A JP 36171198A JP 2000181497 A JP2000181497 A JP 2000181497A
Authority
JP
Japan
Prior art keywords
band
signal
sampling frequency
filter
post
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10361711A
Other languages
Japanese (ja)
Other versions
JP4135242B2 (en
Inventor
Takahiro Mine
貴宏 嶺
Takashi Araki
貴志 荒木
Shiro Omori
士郎 大森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP36171198A priority Critical patent/JP4135242B2/en
Priority to KR1019990055298A priority patent/KR20000047944A/en
Priority to EP99309902A priority patent/EP1008984A3/en
Priority to CN99127498A priority patent/CN1261713A/en
Publication of JP2000181497A publication Critical patent/JP2000181497A/en
Application granted granted Critical
Publication of JP4135242B2 publication Critical patent/JP4135242B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To obtain a received voiced of improved auditory quality. SOLUTION: A postfilter 47 uses for processing a voice parameter code (e.g., α) based upon a transmitted signal sent from a transmitting device so as to generate a voice signal of 1st sampling frequency fs1 (8 KHz), but actually performs a post filter processing for a broadband voice signal of 2nd sampling frequency fs2 (16 KHz). For the purpose, the postfilter 47 performs the postfilter processing twice (=fs2/fs1) separately for 160 words each for the broadband voice signal of 320 samples (words) per frame (200 msec).

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、通信や放送によっ
て伝えられた、音声信号の音声パラメータ符号を使って
音声信号を合成する受信装置及び方法、通信装置及び方
法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a receiving apparatus and method for synthesizing an audio signal using an audio parameter code of an audio signal transmitted by communication or broadcasting, and a communication apparatus and method.

【0002】[0002]

【従来の技術】従来の通信装置では、受話側における入
力音声と出力音声のサンプリング周波数が同一であると
共に、音声周波数帯域も同一であった。これは、電話回
線の伝送帯域が例えば300〜3400Hzと狭く、電
話回線を介して送られてくる音声信号の周波数帯域が制
限されてしまうためである。
2. Description of the Related Art In a conventional communication device, a sampling frequency of an input voice and an output voice on a receiving side are the same, and a voice frequency band is also the same. This is because the transmission band of the telephone line is narrow, for example, 300 to 3400 Hz, and the frequency band of the audio signal transmitted via the telephone line is limited.

【0003】[0003]

【発明が解決しようとする課題】ところで、上記伝送帯
域が制限された、入力音声と同様の音声周波数帯域で出
力される音声では音質はあまり良好とは言えない。つま
り、聴覚的品質が劣る。また、ディジタル携帯電話の音
質についても不満がある。
By the way, the sound quality of the sound output in the same sound frequency band as the input sound whose transmission band is limited is not so good. That is, the auditory quality is inferior. They also complain about the sound quality of digital mobile phones.

【0004】本発明は、上記実情に鑑みてなされたもの
であり、聴覚的品質を向上させた受話音声を得ることの
できる受信装置及び方法、通信装置及び方法の提供を目
的とする。
[0004] The present invention has been made in view of the above circumstances, and has as its object to provide a receiving apparatus and method, a communication apparatus, and a method capable of obtaining a received voice with improved auditory quality.

【0005】[0005]

【課題を解決するための手段】本発明に係る受信装置
は、上記課題を解決するために、第1のサンプリング周
波数fs1の音声信号を生成するために送信装置から伝送
されてきた伝送信号に基づく音声パラメータ符号を使っ
て生成した第1の帯域B1の音声信号のサンプリング周
波数を第2のサンプリング周波数fs2(fs2>fs1)に
変換するサンプリングレート変換手段と、上記音声パラ
メータ符号を使って上記第1の帯域B1の帯域外成分で
ある第2の帯域B2の第2のサンプリング周波数fs2
音声信号を推測する帯域外成分推測手段と、上記サンプ
リングレート変換手段で第2のサンプリング周波数fs2
とされた第1の帯域B1の音声信号と、上記帯域外成分
推測手段で推測された第2のサンプリング周波数fs2
第2の帯域B2の音声信号を加算する加算手段と、上記
加算手段からの加算出力にポストフィルタ処理を施すポ
ストフィルタ手段とを備える。
In order to solve the above-mentioned problems, a receiving apparatus according to the present invention includes a transmitting signal transmitted from a transmitting apparatus to generate an audio signal having a first sampling frequency fs1. a sampling rate converting means for converting the sampling frequency of the first band B 1 of the audio signal to a second sampling frequency f s2 (f s2> f s1 ) generated using the speech parameters based code, the speech parameter codes and out-of-band component predicting unit to estimate the audio signal of the second sampling frequency f s2 of the second band B 2 is a band component of the first band B 1 with the second at the sampling rate converting means Sampling frequency f s2
A first audio signal having a bandwidth B 1 which is a, and adding means for adding the second audio signal having a bandwidth B 2 of the second sampling frequency f s2, which was estimated by the out-of-band components estimating means, the addition Post-filter means for performing post-filter processing on the added output from the means.

【0006】ここで、上記ポストフィルタ手段は、復号
化された信号が入力され、フィルタ係数が第1の周期で
更新されるスペクトル整形フィルタ手段と、このスペク
トル整形フィルタ手段からの出力が入力され、ゲインが
上記第1の周期とは異なる第2の周期で更新されるゲイ
ン調整手段とを有する。また、上記ポストフィルタ手段
は、上記第2の周期を上記第1の周期よりも長くする。
Here, the post-filter means receives a decoded signal as input, and receives a spectrum shaping filter means for updating a filter coefficient in a first cycle, and an output from the spectrum shaping filter means, Gain adjusting means for updating the gain in a second cycle different from the first cycle. Further, the post filter means makes the second cycle longer than the first cycle.

【0007】本発明に係る受信方法は、上記課題を解決
するために、第1のサンプリング周波数fs1の音声信号
を生成するために伝送されてきた伝送信号に基づく音声
パラメータ符号を使って生成した第1の帯域B1の音声
信号のサンプリング周波数を第2のサンプリング周波数
s2(fs2>fs1)に変換して得た変換出力である第2
のサンプリング周波数fs2の第1の帯域B1の音声信号
に、上記音声パラメータ符号を使って推測した上記第1
の帯域B1の帯域外成分である第2の帯域B2の第2のサ
ンプリング周波数fs2の音声信号を加算し、その加算出
力にポストフィルタ処理を施す。この方法では、上記第
1のサンプリング周波数fs1の音声信号を生成するため
に送信装置から伝送されてきた伝送信号に基づく音声パ
ラメータ符号に基づいて上記ポストフィルタ処理を上記
加算出力に対してfs2/fs1回施す。
[0007] In order to solve the above-mentioned problem, the receiving method according to the present invention generates the audio signal using the audio parameter code based on the transmission signal transmitted to generate the audio signal of the first sampling frequency f s1 . first band B 1 of the sampling frequency of the audio signal a second sampling frequency f s2 (f s2> f s1 ) is conversion obtained was converted output to the second
The first band B 1 of the audio signal having the sampling frequency f s2 of the first who guessed using the speech parameter codes
Second adding audio signal having the sampling frequency f s2 of band B 2 second is out-of-band component of the band B 1 of performs post filtering processing on the addition output. In this method, the post-filter processing is performed on the sum output by f s2 based on a voice parameter code based on a transmission signal transmitted from a transmission device to generate a voice signal of the first sampling frequency f s1. / Fs1 times.

【0008】本発明に係る通信装置は、上記課題を解決
するために、入力音声信号に第1のサンプリング周波数
s1による符号化処理を施して伝送信号を生成する送信
手段と、上記第1のサンプリング周波数fs1の音声信号
を生成するために伝送されてきた伝送信号に基づく音声
パラメータ符号を使って生成した第1の帯域B1の音声
信号のサンプリング周波数を第2のサンプリング周波数
s2(fs2>fs1)に変換して得た変換出力と、上記音
声パラメータ符号を使って推測した第2のサンプリング
周波数fs2の第2の帯域B2の音声信号とを加算した加
算出力に、ポストフィルタ処理を施す受信手段とを備え
る。
[0008] In order to solve the above-mentioned problems, a communication apparatus according to the present invention comprises: a transmitting means for performing an encoding process on an input audio signal at a first sampling frequency f s1 to generate a transmission signal; sampling frequency f sampling frequency of the first band B 1 of the audio signal generated using the speech parameters code based on the transmission signal transmitted to produce a speech signal s1 second sampling frequency f s2 (f s2> and converted output obtained by converting the f s1), the second adder output the audio signal of the band B 2 by adding of the second sampling frequency f s2 of guessed using the speech parameter codes, post Receiving means for performing a filtering process.

【0009】ここで、上記受信手段は、第1のサンプリ
ング周波数fs1の音声信号を生成するために伝送されて
きた伝送信号に基づく音声パラメータ符号を使って生成
した第1の帯域B1の音声信号のサンプリング周波数を
第2のサンプリング周波数fs 2(fs2>fs1)に変換す
るサンプリングレート変換手段と、上記音声パラメータ
符号を使って上記第1の帯域B1の帯域外成分である第
2の帯域B2の第2のサンプリング周波数fs2の音声信
号を推測する帯域外成分推測手段と、上記サンプリング
レート変換手段で第2のサンプリング周波数fs2とされ
た第1の帯域B1の音声信号と、上記帯域外成分推測手
段で推測された第2のサンプリング周波数fs2の第2の
帯域B2の音声信号を加算する加算手段と、上記加算手
段からの加算出力にポストフィルタ処理を施すポストフ
ィルタ手段とを備える。
Here, the receiving means is configured to generate a voice signal of a first band B 1 using a voice parameter code based on a transmission signal transmitted to generate a voice signal of a first sampling frequency f s1. a sampling rate converting means for converting the sampling frequency of the signal to a second sampling frequency f s 2 (f s2> f s1), second a band component of the first band B 1 with the speech parameter codes Out-of-band component estimating means for estimating the audio signal of the second sampling frequency f s2 of the second band B 2 , and the audio of the first band B 1 set to the second sampling frequency f s2 by the sampling rate converting means signal and, a second adding means for adding the audio signal of the band B 2 of the second sampling frequency f s2, which was estimated by the out-of-band components estimating means, the addition output from the addition means And a post-filtering means for performing post-filtering.

【0010】上記ポストフィルタ手段は、復号化された
信号が入力され、フィルタ係数が第1の周期で更新され
るスペクトル整形フィルタ手段と、このスペクトル整形
フィルタ手段からの出力が入力され、ゲインが上記第1
の周期とは異なる第2の周期で更新されるゲイン調整手
段とを有する。また、上記ポストフィルタ手段は、上記
第2の周期を上記第1の周期よりも長くする。
The above-mentioned post-filter means receives a decoded signal, and receives the output from the spectrum-shaping filter means for updating the filter coefficient in the first cycle. First
And a gain adjusting means updated in a second cycle different from the cycle of Further, the post filter means makes the second cycle longer than the first cycle.

【0011】また、本発明に係る通信方法は、上記課題
を解決するために、入力音声信号に第1のサンプリング
周波数fs1による符号化処理を施して伝送信号を生成す
ると共に、上記第1のサンプリング周波数fs1を生成す
るために伝送されてきた伝送信号に基づく音声パラメー
タ符号を使って生成した第1の帯域B1の音声信号のサ
ンプリング周波数を第2のサンプリング周波数fs2(f
s2>fs1)に変換して得た変換出力と、上記音声パラメ
ータ符号を使って推測した第2のサンプリング周波数f
s2の第2の帯域B2の音声信号とを加算した加算出力
に、ポストフィルタ処理を施す。
In order to solve the above-mentioned problems, the communication method according to the present invention performs an encoding process on an input audio signal at a first sampling frequency f s1 to generate a transmission signal, and generates the transmission signal. sampling frequency f sampling frequency of the first band B 1 of the audio signal generated using the speech parameters code based on the transmission signal transmitted to produce a s1 second sampling frequency f s2 (f
s2 > f s1 ) and the second sampling frequency f estimated using the above-mentioned speech parameter code.
a second adder output a sound signal having a bandwidth of B 2 by adding of s2, subjected to post-filtering.

【0012】[0012]

【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照しながら説明する。この実施の形態は、本
発明に係る受信装置の具体例となる、図1に示す受信装
置1である。この受信装置1は、パーソナルディジタル
セルラー(Personal Digital Cellular,PDC)とし
て、現在広く使用されている、ディジタル携帯電話の受
話側に適用できる。
Embodiments of the present invention will be described below with reference to the drawings. This embodiment is a receiving apparatus 1 shown in FIG. 1, which is a specific example of a receiving apparatus according to the present invention. The receiving device 1 can be applied to a receiving side of a digital mobile phone, which is currently widely used as a personal digital cellular (PDC).

【0013】受信装置1は、第1のサンプリング周波数
s1の音声信号を生成するために後述する送信装置から
基地局を介して伝送されてきた音声パラメータ符号か
ら、第2のサンプリング周波数fs2(fs2>fs1)の音
声信号を生成する。第1のサンプリング周波数fs1とし
ては8KHzを、第2のサンプリング周波数fs2として
は16KHzを用いる。
The receiving apparatus 1 obtains a second sampling frequency f s2 (from a voice parameter code transmitted from a transmitting apparatus to be described later via a base station to generate a voice signal of a first sampling frequency f s1 (f s2 ). fs2 > fs1 ) is generated. 8 KHz is used as the first sampling frequency f s1 and 16 KHz is used as the second sampling frequency f s2 .

【0014】アンテナ2を介して基地局から受信した音
声パラメータ符号は、RFアンプ(RF受信部)3、制
御部4を経由して信号処理装置5のメモリ5aに格納さ
れる。
The voice parameter code received from the base station via the antenna 2 is stored in the memory 5a of the signal processing device 5 via the RF amplifier (RF receiving unit) 3 and the control unit 4.

【0015】信号処理装置5のメモリ5aに格納された
音声パラメータ符号は、信号処理装置5の復号部で復号
処理された後、所定の信号処理が施されて出力される。
The speech parameter code stored in the memory 5a of the signal processing device 5 is decoded by a decoding unit of the signal processing device 5, and then subjected to predetermined signal processing and output.

【0016】信号処理装置5からの出力信号は、D/A
変換器6でアナログ信号とされた後、アンチエイリアシ
ングフィルタ7、ボリューム8及びアンプ9を経由して
スピーカ10から出力される。なお、制御部4には例え
ばキー操作部11とLCD表示部12が接続されてい
る。
The output signal from the signal processing device 5 is D / A
After being converted into an analog signal by the converter 6, the analog signal is output from the speaker 10 via the anti-aliasing filter 7, the volume 8 and the amplifier 9. The control unit 4 is connected to, for example, a key operation unit 11 and an LCD display unit 12.

【0017】図2には、上記音声パラメータ符号を例え
ば無線伝送路、及び基地局を介して送信する、送信装置
15の構成を示す。この送信装置15もPDCとして、
現在広く使用されている、ディジタル携帯電話の送話側
に適用できる。
FIG. 2 shows a configuration of a transmitting device 15 that transmits the above-mentioned voice parameter code via, for example, a radio transmission path and a base station. This transmitting device 15 is also a PDC,
It can be applied to the transmitting side of a digital mobile phone which is widely used at present.

【0018】マイクロホン16から入力された音声信号
は、アンプ17,ボリューム18,アンチエイリアシン
グフィルタ19及びA/D変換器20を経由して信号処
理装置21のメモリ21aに格納される。
The audio signal input from the microphone 16 is stored in the memory 21a of the signal processing device 21 via the amplifier 17, the volume 18, the anti-aliasing filter 19 and the A / D converter 20.

【0019】メモリ21aに格納された音声信号は、信
号処理装置21内部の音声符号化部で符号処理され、音
声パラメータ符号として出力される。この音声パラメー
タ符号は、制御部22及びRF(RF送信)アンプ23
及びアンテナ24を経由して基地局へ送信される。な
お、制御部22にはキー操作部25とLCD表示部26
が接続されている。
The voice signal stored in the memory 21a is subjected to code processing in a voice coding unit inside the signal processing device 21, and is output as a voice parameter code. This voice parameter code is transmitted to the control unit 22 and the RF (RF transmission) amplifier 23
And transmitted to the base station via the antenna 24. The control unit 22 includes a key operation unit 25 and an LCD display unit 26.
Is connected.

【0020】ここで、信号処理装置21内部の音声符号
化部は、無線伝送路により制限される狭帯域化を考慮し
た音声パラメータ符号を生成する。一般的には、300
Hz〜3400Hzの伝送帯域を考慮している。上記伝
送信号に基づく音声パラメータ符号は、制御部22を介
してRFアンプ23に供給される。
Here, the speech coding unit inside the signal processing device 21 generates a speech parameter code in consideration of the narrow band limited by the radio transmission path. Generally, 300
A transmission band of 3 Hz to 3400 Hz is considered. The voice parameter code based on the transmission signal is supplied to the RF amplifier 23 via the control unit 22.

【0021】音声パラメータ符号としては、励振源に関
する線形予測(LPC)残差や、線形予測係数αがあ
る。他には、ピッチ周波数に関するラグLAGや、例え
ば20msecのフレームにおけるフレームパワーR0等が
ある。
The speech parameter codes include a linear prediction (LPC) residual for the excitation source and a linear prediction coefficient α. Other examples include a lag LAG related to the pitch frequency and a frame power R0 in a frame of, for example, 20 msec.

【0022】図1の受信装置1内部の信号処理装置5
は、図3に示すデコーダ27と、図4に示す帯域幅拡張
部32とを備えてなる。
The signal processing device 5 inside the receiving device 1 of FIG.
Comprises a decoder 27 shown in FIG. 3 and a bandwidth extension unit 32 shown in FIG.

【0023】上記図2に示した送信装置15の信号処理
装置21における音声符号器での符号化方法がPSI−
CELP(Pitch Synchronus Innovation - CELP:ピッ
チ同期雑音励振源−CELP)符号化方式によるもので
あるとすれば、デコーダ27は、PSI−CELP符号
化による伝送信号を用いて音声をデコードし、出力端子
28にデコード音声SndNを、出力端子29に線形予
測係数αNを、出力端子30に励振源NExcNを供給す
る。ここで、PSI−CELP符号化による伝送信号
は、第1のサンプリング周波数fs1=8KHzの第1の
帯域B1=300〜3400Hzの音声信号を生成する
ために伝送されてきたものである。
The encoding method in the speech encoder in the signal processing device 21 of the transmitting device 15 shown in FIG.
If it is based on the CELP (Pitch Synchronous Innovation-CELP) coding method, the decoder 27 decodes the sound using the transmission signal based on the PSI-CELP coding, and outputs an output terminal 28. supplying an excitation source NExc N decoded audio Snd N, the linear prediction coefficient alpha N to the output terminal 29, an output terminal 30 to. Here, the transmission signal by the PSI-CELP coding is one that has been transmitted to produce a speech signal of the first band B 1 = ranging from 300 to 3400 Hz of the first sampling frequency f s1 = 8 KHz.

【0024】帯域幅拡張部32は、第1のサンプリング
周波数fs1(=8KHz)の音声信号を生成するために
送信装置から伝送されてきたPSI−CELP符号化に
よる伝送信号を基にデコーダ27が復号した第1の帯域
1(300〜3400Hz)のデコード音声SndN
サンプリング周波数を第2のサンプリング周波数f
s2(=16KHz)に変換するサンプリングレート変換
手段と、上記デコーダ27が上記PSI−CELP符号
化による伝送信号をデコードして得た線形予測係数αN
と、励振源NExcNとを使って第2のサンプリング周
波数fs2(=16KHz)の第2の帯域B2(3400
Hz〜6000Hz)の信号を推測する帯域外成分推測
手段と、上記サンプリングレート変換手段で第2のサン
プリング周波数fs2(=16KHz)とされた第1の帯
域B1(300〜3400Hz)の音声信号と、上記帯
域外成分推測手段で推測された第2のサンプリング周波
数fs2(=16KHz)の第2の帯域B2(3400H
z〜6000Hz)の音声信号を加算する加算手段と、
上記加算手段からの加算出力(300Hz〜6000H
z)にスペクトル整形、及び聴感上の品質向上のために
ポストフィルタ処理を施すポストフィルタ手段とを備え
る。
[0024] The bandwidth extension unit 32 allows the decoder 27 to generate a speech signal of the first sampling frequency f s1 (= 8 KHz) based on the PSI-CELP encoded transmission signal transmitted from the transmission device. The sampling frequency of the decoded audio Snd N of the decoded first band B 1 (300 to 3400 Hz) is changed to the second sampling frequency f
s2 (= 16 KHz), a sampling rate converter, and a linear prediction coefficient α N obtained by the decoder 27 decoding the transmission signal by the PSI-CELP coding.
And a second band B 2 (3400) of a second sampling frequency f s2 (= 16 KHz) using the excitation source NExc N and
Hz to 6000 Hz), and an audio signal of the first band B 1 (300 to 3400 Hz) which is set to the second sampling frequency f s2 (= 16 KHz) by the sampling rate converter. And a second band B 2 (3400H) of the second sampling frequency f s2 (= 16 KHz) estimated by the out-of-band component estimating means.
(z to 6000 Hz) audio signal;
The addition output from the addition means (300 Hz to 6000 H
z) is provided with post-filter means for performing post-filtering for spectral shaping and for improving the quality of hearing.

【0025】ここで、上記サンプリングレート変換手段
は図4におけるアップサンプル回路45である。また、
上記加算手段は加算器46であり、上記ポストフィルタ
手段はポストフィルタ47である。また、上記帯域外成
分推測手段は、図4において、アップサンプル回路45
と、加算器46と、ポストフィルタ47を除いた部分で
ある。
Here, the sampling rate conversion means is the up-sampling circuit 45 in FIG. Also,
The adding means is an adder 46, and the post filter means is a post filter 47. The out-of-band component estimating means includes an up-sampling circuit 45 in FIG.
, The adder 46 and the post filter 47.

【0026】以下、帯域幅拡張部32の構成を詳細に説
明する。先ず、上記帯域外成分推測手段について説明す
る。上記帯域外成分推測手段は、線形予測係数→自己相
関(αN→rN)変換回路36と、自己相関(r)広帯域
化部37と、広帯域コードブック(rwCB)38と、
自己相関→線形予測係数(rw→αw)変換部39と、L
PC合成部40と、励振源拡張部41と、高域抽出&抑
圧フィルタ42と、乗算器43とからなる。
Hereinafter, the configuration of the bandwidth extension unit 32 will be described in detail. First, the out-of-band component estimating means will be described. The out-of-band component estimating means includes a linear prediction coefficient → auto-correlation (α N → r N ) conversion circuit 36, an auto-correlation (r) broadband section 37, a wide band codebook (r w CB) 38,
An autocorrelation → linear prediction coefficient (r w → α w ) conversion unit 39;
It comprises a PC synthesis section 40, an excitation source expansion section 41, a high-frequency extraction and suppression filter 42, and a multiplier 43.

【0027】入力端子34から供給された線形予測係数
αNは、線形予測係数→自己相関(αN→rN)変換回路
36に供給される。このαN→rN変換回路36は、線形
予測係数αNを自己相関rNに変換し、自己相関(r)広
帯域化部37に供給する。自己相関(r)広帯域化部3
7は広帯域コードブック(rwCB)38を用いて自己
相関rを広帯域化(拡張化)する。広帯域コードブック
(rwCB)38は広帯域音から抽出した自己相関パラ
メータrwを用いて予め作成されている。
The linear prediction coefficient α N supplied from the input terminal 34 is supplied to a linear prediction coefficient → auto correlation (α N → r N ) conversion circuit 36. The α N → r N conversion circuit 36 converts the linear prediction coefficient α N into an autocorrelation r N and supplies it to the autocorrelation (r) widening unit 37. Autocorrelation (r) broadband unit 3
7 widens (extends) the autocorrelation r using a wideband codebook (r w CB) 38. The wideband codebook (r w CB) 38 is created in advance using the autocorrelation parameter r w extracted from the wide band sound.

【0028】広帯域コードブック(rwCB)38を用
い、自己相関(r)広帯域化部37が拡張した拡張自己
相関rwは自己相関→線形予測係数(rw→αw)変換部
39に供給される。rw→αw変換部39は拡張自己相関
wを拡張線形予測係数αwに再度変換してからLPC合
成部40に供給する。LPC合成部40はrw→αw変換
部39からの広帯域線形予測係数αwと後述する励振源
拡張部41からの拡張励振源に基づいて広帯域音声を合
成する。
[0028] Using the wide band code book (r w CB) 38, extended autocorrelation r w autocorrelation (r) broadband portion 37 is expanded in the autocorrelation → linear prediction coefficients (r w → α w) conversion unit 39 Supplied. The r w → α w conversion unit 39 converts the extended auto-correlation r w into the extended linear prediction coefficient α w again, and supplies it to the LPC synthesis unit 40. LPC synthesis section 40 synthesizes a wideband speech based on the extended excitation source from the excitation source extension 41 to be described later with r w α w wideband linear prediction coefficients from the conversion unit 39 alpha w.

【0029】上記LPC合成部40には、上述したよう
に励振源拡張部41からの拡張励振源も供給される。励
振源拡張部41は、入力端子35から供給された励振源
に関するパラメータとしてのLPC残差(このLPC残
差を励振源NExcNと記す。)を拡張する。この励振
源拡張部41の詳細な構成を図5に示す。
The extended excitation source from the excitation source extension unit 41 is also supplied to the LPC synthesis unit 40 as described above. Excitation source extension 41 extends the LPC residuals of the parameters relating to an excitation source supplied from an input terminal 35 (the LPC residuals referred to as the excitation source NExc N.). FIG. 5 shows a detailed configuration of the excitation source extension unit 41.

【0030】先ず、入力端子35を介して供給された励
振源NExcNは、アップサンプル回路50によりアッ
プサンプルされる。アップサンプル回路50の出力は、
LPF51、ブースト回路52を介して出力端子55か
らLPC合成部40に送られる。すなわち、励振源NE
xcNをアップサンプルした信号は、音声信号を合成す
る際の上記拡張励振源として用いられる。ブースト回路
52は、破擦音や摩擦音が検出された場合に、上記拡張
励振源をブーストするためのもので、そのブースト量は
破擦音検出回路54の出力により制御される。破擦音検
出回路54は、入力端子53を介して上記αN→rN変換
回路36からの自己相関rNを受け取り、破擦音や摩擦
音を検出する。
First, the excitation source NExc N supplied via the input terminal 35 is up-sampled by the up-sampling circuit 50. The output of the up-sampling circuit 50 is
The signal is sent from the output terminal 55 to the LPC synthesis section 40 via the LPF 51 and the boost circuit 52. That is, the excitation source NE
The signal obtained by up-sampling xc N is used as the extended excitation source when synthesizing the audio signal. The boost circuit 52 boosts the extended excitation source when an affricate or a fricative is detected, and the boost amount is controlled by an output of the affricate detector 54. The affricate detection circuit 54 receives the autocorrelation r N from the α N → r N conversion circuit 36 via the input terminal 53 and detects affricate and fricative noise.

【0031】LPC合成部40は、広帯域線形予測係数
αwと励振源拡張部41からの拡張励振源に基づいて広
帯域音声を合成する。このとき、LPC合成部40は、
広帯域線形予測係数αwを、2.5msec(20サン
プル)毎に更新しながら、拡張励振源に基づいた広帯域
音声を合成する。これは、一般的に残差波形をハーモニ
ック符号化復号化方法により分析合成すると、その合成
波形のエンベロープは非常になだらかでスムーズな波形
になり、LPC係数が20msec毎に急激に変化して
異音を発生することがあるのを防ぐためである。すなわ
ち、2.5msec毎にLPC係数が徐々に変化してゆ
くようにすれば異音の発生を防げるためである。
The LPC synthesis section 40 synthesizes a wideband speech based on the wideband linear prediction coefficient α w and the extended excitation source from the excitation source extension section 41. At this time, the LPC synthesis unit 40
Wideband linear prediction coefficient alpha w, while updated every 2.5 msec (20 samples), synthesized wideband speech based on the extended excitation source. Generally, when the residual waveform is analyzed and synthesized by the harmonic encoding / decoding method, the envelope of the synthesized waveform becomes a very smooth and smooth waveform, and the LPC coefficient changes abruptly every 20 msec, resulting in abnormal noise. This is to prevent the occurrence of a problem. That is, if the LPC coefficient is gradually changed every 2.5 msec, generation of abnormal noise can be prevented.

【0032】LPC合成回路40の合成出力は、高域抽
出&抑圧フィルタ42に供給される。高域抽出&抑圧フ
ィルタ42は、周波数帯域300Hz〜3400Hzの
信号成分を除去し、第2の帯域B2=3400Hz〜6
000Hzの信号成分を抽出するように、高い周波数成
分を抑圧する。このフィルタ42からのフィルタ出力に
は、端子44から供給されるゲインが乗算器43で乗算
される。乗算器43でゲインが乗算された出力(第2の
帯域B2=3400Hz〜6000Hz)は、加算器4
6に供給される。
The combined output of the LPC combining circuit 40 is supplied to a high-frequency extraction and suppression filter 42. The high-frequency extraction & suppression filter 42 removes a signal component in a frequency band of 300 Hz to 3400 Hz, and a second band B 2 = 3400 Hz to 6
High frequency components are suppressed so as to extract a signal component of 000 Hz. The filter output from the filter 42 is multiplied by a multiplier 43 by a gain supplied from a terminal 44. The output (second band B 2 = 3400 Hz to 6000 Hz) multiplied by the gain in the multiplier 43 is output to the adder 4
6.

【0033】また、帯域幅拡張部32は、上述したよう
に上記サンプリングレート変換手段として、入力端子3
3から供給された、第1の帯域B1=300〜3400
Hzのデコード音声SndNのサンプリング周波数をf
s1=8kHzからfs2=16kHzにアップサンプルす
るアップサンプル回路45を備えている。
Further, as described above, the bandwidth extension section 32 serves as the sampling rate conversion means as the input terminal 3.
3; first band B 1 = 300-3400
Hz of the sampling frequency of the decoded audio Snd N
An up-sampling circuit 45 for up-sampling from s1 = 8 kHz to fs2 = 16 kHz is provided.

【0034】そして、アップサンプル回路45でサンプ
リング周波数が第2のサンプリング周波数fs2=16k
Hzに変換された、第1の帯域B1=300Hz〜34
00Hzの音声信号成分と、乗算器43からの乗算出力
である、第2のサンプリング周波数fs2=16kHzの
第2の帯域B2=3400Hz〜6000Hzの音声信
号成分とを加算器46で加算する。
Then, the up-sampling circuit 45 sets the sampling frequency to the second sampling frequency f s2 = 16 k
Hz converted to the first band B 1 = 300 Hz to 34
The adder 46 adds the 00 Hz audio signal component and the audio signal component of the second band B 2 = 3400 Hz to 6000 Hz of the second sampling frequency f s2 = 16 kHz, which is a multiplied output from the multiplier 43.

【0035】さらに、加算器46からの加算出力とな
る、帯域300〜6000Hz、サンプリング周波数が
16kHzの広帯域音声信号Sndwを、ポストフィル
タ47に供給する。
Further, a wideband audio signal Snd w having a band of 300 to 6000 Hz and a sampling frequency of 16 kHz, which is an addition output from the adder 46, is supplied to the post filter 47.

【0036】このポストフィルタ47は、本件出願人が
既に出願した、特開平9−127996号公報に開示さ
れている、音声復号化方法及び装置で適用している技術
により、上記広帯域音声信号Sndwにスペクトル整形
及び聴感上の品質向上のためのポストフィルタ処理を施
す。
[0036] The post-filter 47, the present applicant has already filed by disclosed in Japanese Patent Laid-Open No. 9-127996, is applied in the speech decoding method and apparatus technology, the wideband speech signal Snd w Are subjected to spectral shaping and post-filter processing for improving the quality of hearing.

【0037】図6にはポストフィルタ47の詳細な構成
を示す。ポストフィルタ47の要部となるスペクトル整
形フィルタ131は、ホルマント強調フィルタ132と
高域強調フィルタ133とからなっている。このスペク
トル整形フィルタ131からの出力は、スペクトル整形
によるゲイン変化を補正するためのゲイン調整器134
に送られており、このゲイン調整器134のゲインG
は、ゲイン制御回路136により決定される。ゲイン制
御回路136は、スペクトル整形フィルタ131の入力
と出力とを比較してゲイン変化を計算し、ゲイン調整器
134のゲインGの補正値を算出する。ここで、スペク
トル整形フィルタ131の上記入力とは端子135を介
して供給される、上記広帯域音声信号Sndwであり、
上記出力とは端子137を介してこのポストフィルタ4
7から導出されるフィルタ出力である。
FIG. 6 shows a detailed configuration of the post filter 47. The spectrum shaping filter 131, which is a main part of the post filter 47, includes a formant emphasis filter 132 and a high-frequency emphasis filter 133. An output from the spectrum shaping filter 131 is a gain adjuster 134 for correcting a gain change due to spectrum shaping.
And the gain G of the gain adjuster 134
Is determined by the gain control circuit 136. The gain control circuit 136 compares the input and the output of the spectrum shaping filter 131 to calculate a gain change, and calculates a correction value of the gain G of the gain adjuster 134. Here, the input of the spectrum shaping filter 131 is the wideband audio signal Snd w supplied via the terminal 135,
The output is connected to the post filter 4 via a terminal 137.
7 is a filter output derived from FIG.

【0038】以上の構成の帯域幅拡張部32における、
主要な動作原理について以下に説明する。帯域幅拡張部
32は、300Hz〜3400Hzの第1の帯域B1
音声信号を生成するための音声パラメータ符号から30
0Hz〜6000Hzという広帯域用の音声符号化パラ
メータを生成し、広帯域LPC合成を行う。その後、原
音声の周波数帯域である低域(300Hz〜3400H
z)側を、原音声を16KHzにアップサンプルしたも
のに置換する。すなわち、高域通過フィルタを施し高域
(3400Hz〜6000Hz)のみを残し、この高域
成分の中でも高い周波数成分を抑圧し、さらにゲインを
調整し、その後、原音声(300Hz〜3400Hz)
をアップサンプル(第2のサンプリング周波数fs2)し
たものに加算する。
In the bandwidth extension unit 32 having the above configuration,
The principle of operation will be described below. Bandwidth extension unit 32, 30 from the speech parameter codes to generate a first audio signal having a bandwidth B 1 in 300Hz~3400Hz
A wideband speech coding parameter of 0 Hz to 6000 Hz is generated, and wideband LPC synthesis is performed. After that, the low frequency band (300 Hz to 3400 H
z) The side is replaced with the original sound upsampled to 16 KHz. That is, a high-pass filter is applied to keep only the high frequency band (3400 Hz to 6000 Hz), suppress high frequency components among these high frequency components, further adjust the gain, and then change the original sound (300 Hz to 3400 Hz).
To the up-sampled (second sampling frequency f s2 ).

【0039】ここで、音声パラメータ符号の広帯域化
(或いは拡張化)は、線形予測係数αNの広帯域化、励
振源NExcNの広帯域化の二つが必要である。また、
αNの広帯域化には、αと相互に変換可能なパラメータ
である自己相関rによるコードブックを予め作成してお
く必要がある。このコードブックによる量子化、逆量子
化によって自己相関rNが広帯域化される。
Here, to widen (or expand) the speech parameter code, it is necessary to broaden the linear prediction coefficient α N and the excitation source NExc N. Also,
In order to widen α N , it is necessary to create a code book based on autocorrelation r, which is a parameter that can be mutually converted with α. The band of the autocorrelation r N is widened by the quantization and inverse quantization by the code book.

【0040】先ず、線形予測係数αNの広帯域化につい
て説明する。αはスペクトル包絡を表すフィルタ係数で
あることに着目し、高域側を推定しやすい別のスペクト
ル包絡を表すパラメータである自己相関rNに一旦変換
し、これを広帯域化し、その後で広帯域(或いは拡張)
自己相関rwから広帯域(或いは拡張)線形予測係数αw
に逆変換する。拡張にはベクトル量子化を用いる。狭帯
域自己相関rnをベクトル量子化し、そのインデックス
から対応するrwを求めればよい。
First, the widening of the linear prediction coefficient α N will be described. Paying attention to that α is a filter coefficient representing a spectrum envelope, it is once converted into an autocorrelation r N which is a parameter representing another spectrum envelope which makes it easy to estimate the high-frequency side, and this is broadened. Extended)
Broadband from the autocorrelation r w (or extension) linear prediction coefficients α w
To the inverse. Vector quantization is used for extension. Narrowband autocorrelation r n to vector quantization, may be obtained the corresponding r w from that index.

【0041】狭帯域自己相関と広帯域自己相関には、後
述するように一定の関係が成り立つため、広帯域自己相
関によるコードブックのみを用意すればよく、狭帯域自
己相関をこれによりベクトル量子化でき、また逆量子化
により広帯域自己相関が求まる。
Since a certain relationship is established between the narrowband autocorrelation and the wideband autocorrelation as described later, only a codebook based on the wideband autocorrelation needs to be prepared, and the narrowband autocorrelation can be vector-quantized by this. Wideband autocorrelation is obtained by inverse quantization.

【0042】狭帯域信号を、広帯域信号を帯域制限した
ものとすれば、広帯域自己相関と狭帯域自己相関には以
下の(1)式に示す関係がある。
Assuming that the narrow-band signal is obtained by band-limiting the wide-band signal, the wide-band auto-correlation and the narrow-band auto-correlation have a relationship expressed by the following equation (1).

【0043】[0043]

【数1】 (Equation 1)

【0044】ここで、φは自己相関、xnは狭帯域信
号、xwは広帯域信号、hは帯域制限フィルタのインパ
ルス応答である。
Here, φ is an autocorrelation, xn is a narrow band signal, xw is a wide band signal, and h is an impulse response of a band limiting filter.

【0045】さらに、自己相関とパワースペクトルの関
係から、次の(2)式が得られる。
Further, the following equation (2) is obtained from the relationship between the autocorrelation and the power spectrum.

【0046】[0046]

【数2】 (Equation 2)

【0047】この帯域制限フィルタのパワー特性と等し
い周波数特性を持つ、もう一つの帯域制限フィルタを考
え、これをH’とすれば、上記(2)式は、次の(3)
式のようになる。
If another band-limiting filter having a frequency characteristic equal to the power characteristic of this band-limiting filter is considered, and this is set to H ′, the above equation (2) becomes the following equation (3)
It looks like an expression.

【0048】[0048]

【数3】 (Equation 3)

【0049】この新たなフィルタの通過域、阻止域は当
初の帯域制限フィルタと同等であり、減衰特性が2乗と
なる。したがって、この新たなフィルタもまた、帯域制
限フィルタといえる。これを考慮すると、狭帯域自己相
関は、広帯域自己相関と帯域制限のフィルタのインパル
ス応答との畳み込み、すなわち広帯域自己相関を帯域制
限したものと単純化される。すなわち、次の(4)式と
なる。
The pass band and the stop band of this new filter are the same as those of the original band limiting filter, and the attenuation characteristic is squared. Therefore, this new filter can also be said to be a band limiting filter. With this in mind, narrowband autocorrelation is simplified to the convolution of broadband autocorrelation with the impulse response of a band-limited filter, ie, band-limited wideband autocorrelation. That is, the following equation (4) is obtained.

【0050】[0050]

【数4】 (Equation 4)

【0051】以上より、狭帯域自己相関をベクトル量子
化するにあたっては、広帯域コードブックのみを用意す
れば、量子化時に必要な狭帯域ベクトルは演算により作
成が可能であり、狭帯域自己相関から予めコードブック
を用意しておく必要がないことが分かる。
As described above, when performing vector quantization of narrowband autocorrelation, if only a wideband codebook is prepared, a narrowband vector required at the time of quantization can be created by calculation. It turns out that there is no need to prepare a codebook.

【0052】さらに、各広帯域自己相関のrwコードベ
クタは単調減少もしくはなだらかに増減するカーブを持
つために、上記H’により低域通過させても大きな変化
がなく、rn量子化は、直接rwコードブックで行える。
ただし、サンプリング周波数が1/2のため、1次おき
に比較する必要がある。
[0052] Further, in order to have a curve r w code vector of each wide-band autocorrelation increase or decrease monotonically decreasing or gradually, the H 'by no significant change be passed through a low-pass, r n quantization directly It can be carried out in the r w code book.
However, since the sampling frequency is 1/2, it is necessary to compare every other order.

【0053】線形予測係数αNの拡張は有声音(V)と
無声音(UV)に分けることによって、さらに精度良い
拡張が可能であるため、これも行っている。これに伴い
コードブックもV用、UV用の二つを用いている。
The linear prediction coefficient α N is extended because it can be extended more accurately by dividing it into voiced sound (V) and unvoiced sound (UV). Accordingly, two codebooks for V and UV are used.

【0054】次に、励振源の拡張について説明する。P
SI−CELPにおいては狭帯域での励振源を、図5の
アップサンプル回路50でゼロ値を挿入することでアッ
プサンプルし、エイリアシング歪みを発生させたものを
用いる。この方法は非常に単純であるが、元の音声のパ
ワーや調波構造の差分が保存されるので、励振源として
は十分な品質であるといえる。
Next, expansion of the excitation source will be described. P
In the SI-CELP, an excitation source in a narrow band is upsampled by inserting a zero value in the upsampling circuit 50 in FIG. 5 to generate aliasing distortion. Although this method is very simple, it can be said that the quality is sufficient as an excitation source because the difference between the power and the harmonic structure of the original voice is preserved.

【0055】そして、以上で得られた広帯域αWと広帯
域励振源によりLPC合成回路40でLPC合成を行
う。
Then, LPC synthesis is performed by the LPC synthesis circuit 40 using the wideband α W obtained above and the wideband excitation source.

【0056】また、広帯域LPC合成された音声は、こ
のままでは品質が悪いので、低域側はコーデック出力の
オリジナル音声SndNで置換する。このために、合成
音のうち3400Hz以上を抽出し、一方でコーデック
出力をfs=16KHzにアップサンプルし、これらを
加算する。
Since the quality of the speech synthesized by the wideband LPC is poor as it is, the original speech Snd N of the codec output is replaced on the low frequency side. For this purpose, 3400 Hz or more is extracted from the synthesized sound, while the codec output is up-sampled to fs = 16 KHz, and these are added.

【0057】このとき、乗算器43で高域側に乗算する
ゲインをユーザの好みに応じてゲイン調整器で調整可能
としている。ユーザ毎の個人差が大きいため、この値を
可変にしている。高域側ゲインの値をユーザからの入力
により予め設定しておき、この値を参照し、乗算を行
う。
At this time, the gain by which the multiplier 43 multiplies the high frequency side can be adjusted by the gain adjuster according to the user's preference. This value is variable because individual differences between users are large. The value of the high-frequency gain is set in advance by an input from the user, and multiplication is performed with reference to this value.

【0058】また、加算前に高域側に対し、高域抽出&
抑圧フィルタ42で約6KHz以上の成分を若干抑圧す
るフィルタリングを施すことで、聴きやすい音にしてい
る。このフィルタ係数を選択可能とし、予め選択された
フィルタにより処理を行うことで、好みに応じ高域側の
周波数帯域を選択可能とした。このフィルタの選択もユ
ーザの入力により設定する。
Before addition, high-frequency extraction &
By applying a filtering that slightly suppresses a component of about 6 KHz or more by the suppression filter 42, a sound that is easy to hear is obtained. This filter coefficient is selectable, and processing is performed using a filter selected in advance, so that a higher frequency band can be selected as desired. The selection of this filter is also set by the user's input.

【0059】なお、このフィルタ42を用いての処理
は、低域側のパワー特性に影響を与えないため、加算後
に行っても良い。あるいは、あえて低域側にも影響のあ
るフィルタを加算後に施す事も可能である。以上により
広帯域音声が得られる。
The processing using the filter 42 does not affect the power characteristics on the low frequency side, and may be performed after the addition. Alternatively, it is also possible to apply a filter that also affects the low-frequency side after addition. As described above, a wideband sound can be obtained.

【0060】次に、以上の動作原理に基づいて、帯域幅
拡張部32が広帯域音声信号を生成する動作について図
7のフローチャートを用いて説明する。
Next, an operation in which the bandwidth extension unit 32 generates a wideband audio signal based on the above-described operation principle will be described with reference to a flowchart of FIG.

【0061】ステップS1で図4に示したαN→rN変換
回路36は、図3に示したデコーダ27によりデコード
された線形予測係数αNを自己相関rNに変換する。ま
た、デコーダ27でデコードされた音声信号SndN
ステップS2でV/UV判定される。
In step S1, the α N → r N conversion circuit 36 shown in FIG. 4 converts the linear prediction coefficient α N decoded by the decoder 27 shown in FIG. 3 into an autocorrelation r N. The audio signal Snd N decoded by the decoder 27 is subjected to V / UV determination in step S2.

【0062】このステップS2での判定結果がVである
と、ステップS4では有声音用自己相関rNを量子化す
る。この量子化は、ステップS3で求めた狭帯域V用パ
ラメータを用いる。すなわち、広帯域Vのコードブック
38から、1次おきに比較して求めた狭帯域V用パラメ
ータを用いる。
If the result of the determination in step S2 is V, in step S4 the voiced autocorrelation r N is quantized. This quantization uses the narrowband V parameter obtained in step S3. That is, the parameters for the narrow band V obtained by comparing every other order from the code book 38 of the wide band V are used.

【0063】一方、ステップS2での判定結果がUVで
あるときには、ステップS4ではステップS3で求めた
狭帯域UV用パラメータを用いて無声音用自己相関rを
量子化する。
On the other hand, when the judgment result in step S2 is UV, in step S4 the autocorrelation r for unvoiced sound is quantized using the narrow band UV parameter obtained in step S3.

【0064】そして、ステップS5でそれぞれ広帯域V
コードブック又は広帯域UVコードブックを用いて逆量
子化し、これにより広帯域自己相関rWが得られる。広
帯域自己相関rWはステップS6でrW→αW変換回路3
9によりαWに変換される。
Then, in step S5, the wide band V
Inverse quantization using a codebook or a wideband UV codebook, which results in a wideband autocorrelation r W. The broadband autocorrelation r W is calculated in step S6 by using r W → α W conversion circuit 3
9 to α W.

【0065】一方、デコーダ27からの励振源は、ステ
ップS7で図5に示したアップサンプル回路50により
サンプル間にゼロが詰められることでアップサンプルさ
れ、エイリアシングにより広帯域化される。これが広帯
域励振源として、LPC合成回路40に供給される。
On the other hand, the excitation source from the decoder 27 is up-sampled by padding zeros between samples by the up-sampling circuit 50 shown in FIG. 5 in step S7, and widened by aliasing. This is supplied to the LPC synthesis circuit 40 as a broadband excitation source.

【0066】そして、ステップS8で、LPC合成回路
40が広帯域αWと広帯域励振源とを、LPC合成し、
広帯域の音声信号が得られる。ここでは、広帯域線形予
測係数αwを、2.5msec(20サンプル)毎に更
新しながらLPC合成を行う。
Then, in step S8, the LPC synthesis circuit 40 performs LPC synthesis on the wide band α W and the wide band excitation source,
A wideband audio signal is obtained. Here, LPC synthesis is performed while updating the wideband linear prediction coefficient α w every 2.5 msec (20 samples).

【0067】しかし、このままでは予測によって求めら
れた広帯域信号にすぎず、予測による誤差が含まれてい
るので品質が悪い。特に入力狭帯域音声の周波数範囲
(300Hz〜3400Hz)に関しては、コーデック
出力のオリジナル音声SndN(入力音声)をそのまま利
用したほうが良い。
However, if this is the case, it is merely a wideband signal obtained by prediction, and the quality is poor because it contains errors due to prediction. In particular, regarding the frequency range of the input narrowband audio (300 Hz to 3400 Hz), it is better to use the original audio Snd N (input audio) output from the codec as it is.

【0068】したがって、LPC合成回路40からの合
成音のうち、入力狭帯域音声の周波数範囲300〜34
00HzをステップS9で高域抽出&抑圧フィルタ42
のバンドストップフィルタ(BSP)を用いたフィルタ
リングにより除去する。
Therefore, of the synthesized sounds from the LPC synthesizing circuit 40, the frequency range of the input narrow-band sound is 300 to 34.
00 Hz in step S9 for high frequency extraction & suppression filter 42
By using a band stop filter (BSP).

【0069】そして、ステップS10でアップサンプル
回路45により上記オリジナル音声SndNをアップサ
ンプルしたものと、ステップS13で加算器46により
加算する。このとき、ステップS11で高域側に対し、
約6KHz以上の成分を若干抑圧する高域抽出&抑圧フ
ィルタ42によりフィルタリングすることで、聴きやす
い音にしている。このフィルタ係数は上述したように選
択可能とされている。
Then, in step S10, the up-sampled original voice Snd N by the up-sampling circuit 45 is added by the adder 46 in step S13. At this time, in step S11,
By filtering with a high-frequency extraction and suppression filter 42 that slightly suppresses components of about 6 KHz or more, the sound is easy to hear. This filter coefficient can be selected as described above.

【0070】さらに、ステップS12では、乗算器43
を用いてユーザの好みに応じて高域側ゲインを調整可能
としている。
Further, in step S12, the multiplier 43
To adjust the high-frequency gain according to the user's preference.

【0071】なお、ここで、帯域幅拡張部32で用い
る、コードブックの作成について説明する。コードブッ
クの作成は一般によく知られたGLA(Generalized Llo
yd Algorithm)による方法である。広帯域音声を一定時
間、例えば20msecごとのフレームに区切り、そのフレ
ーム毎に、一定次例えば6次までの自己相関を求めてお
く。このフレーム毎の自己相関をトレーニングデータと
し、6次元のコードブックを作成する。このとき、有声
音、無声音の区別を行い、有声音の自己相関、無声音の
自己相関を別々に集め、それぞれのコードブックを作成
してもよい。この場合、帯域拡張処理中αの拡張時、コ
ードブックを参照するが、このときにも有声音、無声音
の判別を行い、対応するコードブックを利用する。
Here, the creation of a codebook used in the bandwidth extension unit 32 will be described. The creation of the codebook is generally well-known GLA (Generalized Llo
yd Algorithm). The wideband speech is divided into frames for a certain period of time, for example, every 20 msec, and the autocorrelation of a certain order, for example, the sixth order is obtained for each frame. Using the autocorrelation for each frame as training data, a six-dimensional codebook is created. At this time, the voiced sound and the unvoiced sound may be distinguished from each other, and the autocorrelation of the voiced sound and the autocorrelation of the unvoiced sound may be separately collected to create respective codebooks. In this case, the code book is referred to when α is expanded during the band expansion processing. At this time, a voiced sound or an unvoiced sound is determined, and the corresponding code book is used.

【0072】帯域幅拡張部32では、広帯域有声音用コ
ードブックと広帯域無声音用コードブックを用いてい
る。この広帯域有声音用コードブックの作成については
図8を、広帯域無声音用コードブックの作成については
図9を参照しながら説明する。
The bandwidth extension unit 32 uses a codebook for wideband voiced sound and a codebook for wideband unvoiced sound. The creation of the codebook for wideband voiced sounds will be described with reference to FIG. 8, and the creation of the codebook for wideband unvoiced sounds will be described with reference to FIG.

【0073】先ず、広帯域音声信号を学習用に用意し、
図8のステップS31で1フレーム20msecにフレーミ
ングする。次に、ステップS32で各フレームにおい
て、例えばフレームエネルギーやゼロクロスの値等を調
べることによって有声音(V)か無声音(UV)かの分
類を行う。
First, a wideband audio signal is prepared for learning,
In step S31 in FIG. 8, framing is performed for 20 msec per frame. Next, in step S32, for each frame, classification is performed as to whether it is a voiced sound (V) or an unvoiced sound (UV) by examining, for example, a frame energy, a value of zero crossing, and the like.

【0074】そして、ステップS33で広帯域有声音フ
レームにおいて、例えば6次までの自己相関パラメータ
rを計算する。また、ステップS34では広帯域無声音
フレームにおける、例えば6次までの自己相関パラメー
タrを求める。
Then, in step S33, for example, the autocorrelation parameter r up to the sixth order is calculated in the wideband voiced sound frame. In step S34, for example, the autocorrelation parameter r up to the sixth order in the wideband unvoiced sound frame is obtained.

【0075】この各フレームの6次の自己相関パラメー
タから、図9のステップS41で広帯域パラメータを抽
出し、GLAにより次元6の広帯域V(UV)コードブ
ックをステップS42で作成する。
A wideband parameter is extracted from the sixth-order autocorrelation parameters of each frame in step S41 of FIG. 9 and a wideband V (UV) codebook of dimension 6 is created in step S42 by GLA.

【0076】以上、例えばPSI−CELPによる復号
化方法を用いた帯域幅拡張部32では、サンプリング周
波数を8KHzから16KHzに変換した高品質の広帯
域音声信号を提供することができる。
As described above, the bandwidth extension unit 32 using the decoding method based on, for example, PSI-CELP can provide a high-quality wide-band audio signal whose sampling frequency has been converted from 8 KHz to 16 KHz.

【0077】さらに、この帯域幅拡張部32は、既に構
成を示したポストフィルタ47により、上記広帯域音声
信号にスペクトル整形及び聴感上の品質向上のためにポ
ストフィルタ処理を施すことができる。このポストフィ
ルタ47の動作について詳細に説明する。
Further, the bandwidth extending section 32 can perform post-filter processing on the wide-band audio signal for spectral shaping and improvement in audibility by the post-filter 47 whose configuration has been already described. The operation of the post filter 47 will be described in detail.

【0078】図6のスペクトル整形フィルタ131の特
性PF(Z)は、線形予測係数αiを用いると、次の
(5)式のように表せる。
The characteristic PF (Z) of the spectrum shaping filter 131 shown in FIG. 6 can be expressed by the following equation (5) using the linear prediction coefficient αi.

【0079】[0079]

【数5】 (Equation 5)

【0080】この(5)式の分数部分がホルマント強調
フィルタ特性を、(1−kz-1)の部分が高域強調フィ
ルタ特性をそれぞれ表す。また、β,γ,kは定数であ
り、一例としてβ=0.6,γ=0.8,k=0.3を挙げるこ
とができる。
The fractional part of the equation (5) represents the formant enhancement filter characteristic, and the part (1-kz -1 ) represents the high-frequency enhancement filter characteristic. Β, γ, and k are constants, for example, β = 0.6, γ = 0.8, and k = 0.3.

【0081】また、ゲイン調整回路134のゲインG
は、次の(6)式のように表せる。
The gain G of the gain adjustment circuit 134
Can be expressed as the following equation (6).

【0082】[0082]

【数6】 (Equation 6)

【0083】この式中のx(i)はスペクトル整形フィ
ルタ131の入力、すなわち上記広帯域音声信号Snd
wであり、y(i)はスペクトル整形フィルタの出力で
ある。
In this equation, x (i) is the input of the spectrum shaping filter 131, that is, the wideband audio signal Snd.
w and y (i) is the output of the spectral shaping filter.

【0084】ここで、上記スペクトル整形フィルタ13
1の係数の更新周期は、図10に示すように、LPC合
成部40の係数であるαwの更新周期と同じく、20サ
ンプル、2.5msecであるのに対し、ゲイン調整回
路134のゲインGの更新周期は、160サンプル、2
0msecである。
Here, the spectrum shaping filter 13
As shown in FIG. 10, the update cycle of the coefficient of 1 is 20 samples and 2.5 msec, similarly to the update cycle of the coefficient α w of the LPC synthesis unit 40. Update cycle is 160 samples, 2
It is 0 msec.

【0085】このように、ポストフィルタ47のスペク
トル整形フィルタ131の係数の更新周期に比較して、
ゲイン調整回路134のゲインGの更新周期を長くとる
ことにより、ゲイン調整の変動による悪影響を防止して
いる。
As described above, compared with the update cycle of the coefficient of the spectrum shaping filter 131 of the post filter 47,
By making the update cycle of the gain G of the gain adjustment circuit 134 long, an adverse effect due to the fluctuation of the gain adjustment is prevented.

【0086】すなわち、一般のポストフィルタにおいて
は、スペクトル整形フィルタの係数の更新周期とゲイン
の更新周期とを同じにしており、このとき、ゲインの更
新周期を20サンプル、2.5msecとすると、図1
0からも明らかなように、1ピッチ周期の中で変動する
ことにより、クリックノイズを生じる原因となる。そこ
で、ポストフィルタ47では、ゲインの切換周期をより
長く、例えば1フレーム分の160サンプル、20ms
ecとすることにより、ゲインの変動を防止することが
できる。また逆に、スペクトル整形フィルタ131の係
数の更新周期を160サンプル、20msecと長くす
るときには、短時間の音声スペクトルの変化にポストフ
ィルタ特性が追従できず、良好な聴感上の品質改善が行
えないが、このフィルタ係数の更新周期を20サンプ
ル、2.5msecと短くすることにより、効果的なポ
ストフィルタ処理が可能となる。
That is, in a general post filter, the update cycle of the coefficient of the spectrum shaping filter and the update cycle of the gain are the same. At this time, if the update cycle of the gain is 20 samples and 2.5 msec, 1
As is clear from 0, the fluctuation within one pitch period causes click noise. Therefore, in the post filter 47, the gain switching cycle is set longer, for example, 160 samples for one frame, 20 ms.
By setting ec, it is possible to prevent a change in gain. Conversely, when the update cycle of the coefficient of the spectrum shaping filter 131 is increased to 160 samples and 20 msec, the post-filter characteristic cannot follow a short-time change in the audio spectrum, and good audibility quality cannot be improved. By shortening the update cycle of the filter coefficient to 20 samples and 2.5 msec, effective post-filter processing can be performed.

【0087】ところで、このポストフィルタ47は、上
記第1のサンプリング周波数fs1(8KHz)の音声信
号を生成するために送信装置から伝送されてきた伝送信
号に基づく音声パラメータ符号(例えばα)を処理に用
いているが、実際にポストフィルタ処理を施すのは、第
2のサンプリング周波数fs2(16KHz)とされた上
記広帯域音声信号SndWに対してである。このため、
ポストフィルタ47は、上記図6に示した構成によるポ
ストフィルタ処理を1フレーム(20msec)当た
り、320サンプル(ワード)の上記広帯域音声信号S
ndWに、160ワード分ずつ2回(=fs2/fs1)に
分けて施している。
The post-filter 47 processes an audio parameter code (for example, α) based on a transmission signal transmitted from a transmission device to generate an audio signal of the first sampling frequency f s1 (8 KHz). However, the post-filter processing is actually performed on the wideband audio signal Snd W having the second sampling frequency f s2 (16 KHz). For this reason,
The post-filter 47 performs the post-filter processing by the configuration shown in FIG. 6 on the wideband audio signal S of 320 samples (word) per frame (20 msec).
nd W is applied twice (= fs2 / fs1 ) by 160 words.

【0088】このようなポストフィルタ47を用いるこ
とにより、帯域幅拡張部32は、広帯域音声信号のスペ
クトル整形及び聴感上の品質を効果的に向上できる。よ
って、帯域幅拡張部32を信号処理装置5として備えて
いる受信装置1は、聴覚的品質を向上させた受話音声を
得ることのできる。
By using such a post-filter 47, the bandwidth extending section 32 can effectively improve the spectral shaping and audible quality of a wideband audio signal. Therefore, the receiving device 1 including the bandwidth extension unit 32 as the signal processing device 5 can obtain a received voice with improved auditory quality.

【0089】次に、図1の受信装置1内部の信号処理装
置5の他の具体例について図11〜図13を用いて説明
する。この他の具体例は、図11に示すデコーダ58
と、図12に示す帯域幅拡張部65とを備えてなる。
Next, another specific example of the signal processing device 5 in the receiving device 1 of FIG. 1 will be described with reference to FIGS. Another specific example is the decoder 58 shown in FIG.
And a bandwidth extension unit 65 shown in FIG.

【0090】上記図2に示した送信装置15の信号処理
装置21における音声符号器での符号化方法がVSEL
P(Vector Sum Excited Linear Prediction:ベクトル
和励起線形予測)符号化方式によるものであるとすれ
ば、デコーダ58はVSELP符号化による伝送信号を
用いて音声をデコードして出力端子59にデコード音声
SndNを、出力端子60に線形予測係数αNを、出力端
子61に励振源1ExcN1を、出力端子62に励振源2
ExcN2を供給する。
The encoding method in the speech encoder in the signal processing device 21 of the transmitting device 15 shown in FIG.
If it is determined to be based on the P (Vector Sum Excited Linear Prediction) coding method, the decoder 58 decodes the sound using the transmission signal by the VSELP coding, and outputs the decoded sound Snd N to the output terminal 59. , The linear prediction coefficient α N at the output terminal 60, the excitation source 1Exc N1 at the output terminal 61, and the excitation source 2 at the output terminal 62.
Supply Exc N2 .

【0091】帯域幅拡張部65は図12に示すような構
成であり、上記図4に示した帯域幅拡張部32と異なる
のは励振源切換&拡張部68を設けている点である。
The bandwidth extending section 65 has a configuration as shown in FIG. 12, and is different from the bandwidth extending section 32 shown in FIG. 4 in that an excitation source switching & extending section 68 is provided.

【0092】PSI−CELPは、コーデック自体、特
に有声音Vを聴感上滑らかに聞こえるような処理を行っ
ているが、VSELPにはこれがなく、このために帯域
幅拡張したときに若干雑音が混入したように聞こえる。
そこで、広帯域励振源を作成する際に、励振源を切り換
える回路を内部に備えた励振源切換&拡張部68を用
い、図13に示すような処理を施す。この図13に示す
処理は、上記図7に示した励振源処理をステップS87
〜ステップS89のように変えたものである。
[0092] The PSI-CELP performs a process for allowing the codec itself, particularly the voiced sound V, to be heard in a perceptually smooth manner. Sounds like.
Therefore, when a broadband excitation source is created, a process as shown in FIG. 13 is performed by using an excitation source switching & extension unit 68 internally provided with a circuit for switching the excitation source. In the processing shown in FIG. 13, the excitation source processing shown in FIG.
To Step S89.

【0093】VSELPの励振源は、コーデックに利用
されるパラメータβ(長期予測係数), bL[i](長期フィル
タ状態),γ(利得), c1[i](励起コードベクタ)により、
β * bL[i] + γ * c1[i]として作成されるが、このう
ち前者がピッチ成分、後者がノイズ成分を表すので、こ
れをβ * bL[i]とγ * c1[i]に分け、ステップS87
で、一定の時間範囲において、前者のエネルギーが大き
い場合にはピッチが強い有声音と考えられるため、ステ
ップS88でYESに進み、励振源をパルス列とし、ピ
ッチ成分のない部分ではNOに進み0に抑圧した。ま
た、ステップS87でエネルギーが大きくない場合には
従来どおりとし、こうして作成された狭帯域励振源にス
テップS89でゼロ詰め処理によりPSI-CELP同様0を詰
めアップサンプルすることで広帯域励振源とした。これ
により、VSELPにおける有声音の聴感上の品質が向
上する。
The excitation source of VSELP is represented by parameters β (long-term prediction coefficient), bL [i] (long-term filter state), γ (gain), and c1 [i] (excitation code vector) used for the codec.
β * bL [i] + γ * c1 [i], the former of which represents the pitch component and the latter of which represents the noise component, these are referred to as β * bL [i] and γ * c1 [i]. Divide, step S87
In a certain time range, if the former energy is large, it is considered that the voiced sound has a strong pitch. Therefore, the process proceeds to YES in step S88, the pulse train is used as the excitation source, and the process proceeds to NO in the portion without the pitch component to 0. Oppressed. If the energy is not large in step S87, the conventional narrow band excitation source is filled up with zero by PZ-CELP in step S89 by zero padding in step S89 to obtain a wide band excitation source. As a result, the auditory quality of voiced sound in VSELP is improved.

【0094】そして、ステップS92でアップサンプル
回路45により上記オリジナル音声SndNをアップサ
ンプルしたものと、ステップS95で加算器46により
加算する。このとき、ステップS91で高域側に対し、
約6KHz以上の成分を若干抑圧する高域抽出&抑圧フ
ィルタ42によりフィルタリングを施すことで、聴きや
すい音にしている。このフィルタ係数は上述したように
選択可能としている。
Then, in step S92, the original sound Snd N is upsampled by the upsampling circuit 45 and added by the adder 46 in step S95. At this time, in step S91,
Filtering is performed by a high-frequency extraction and suppression filter 42 that slightly suppresses a component of about 6 KHz or more to make the sound easy to hear. This filter coefficient is selectable as described above.

【0095】さらに、ステップS93では、乗算器43
を用いてユーザの好みに応じて高域側ゲインを調整可能
としている。
Further, in step S93, the multiplier 43
To adjust the high-frequency gain according to the user's preference.

【0096】以上、VSELPによる復号化方法を用い
た帯域幅拡張部65でも、サンプリング周波数を8KH
zから16KHzに変換した高品質の広帯域音声信号を
提供することができる。
As described above, the bandwidth expansion unit 65 using the VSELP decoding method also sets the sampling frequency to 8 KH.
A high-quality wideband audio signal converted from z to 16 KHz can be provided.

【0097】さらに、この帯域幅拡張部65は、上記図
6に示したのと同様のポストフィル47を備えているの
で、広帯域音声信号のスペクトル整形及び聴感上の品質
を効果的に向上できる。よって、この帯域幅拡張部65
を備えた信号処理装置5は、聴覚的品質を向上させるこ
とができる。
Further, since the bandwidth extending section 65 has the same post-fill 47 as that shown in FIG. 6, the spectral shaping of the wideband audio signal and the quality of audibility can be effectively improved. Therefore, the bandwidth extension unit 65
Can improve the auditory quality.

【0098】上記図1の受信装置1内部の信号処理装置
5としては、図14に示す帯域幅拡張部70とその前段
の、図15に示すデコード部とからなる信号処理装置を
他の具体例としてもよい。
As the signal processing device 5 inside the receiving device 1 shown in FIG. 1, a signal processing device comprising a bandwidth extending unit 70 shown in FIG. 14 and a decoding unit shown in FIG. It may be.

【0099】図15に示したデコード部は、VSELP
デコーダ77とPSI−CELPデコーダ81とを備
え、送信装置側から伝送されてくる、伝送信号の符号化
方式に応じて、デコーダ77又は81への伝送信号の入
力を切り換える。つまり、入力端子75を介して受け取
った上記伝送信号を切換スイッチ76で、上記符号化方
式の種類、つまりVSELP又はPSI-CELPに応
じて切り換えている。
The decoding section shown in FIG.
It includes a decoder 77 and a PSI-CELP decoder 81, and switches the input of the transmission signal to the decoder 77 or 81 according to the encoding method of the transmission signal transmitted from the transmitting device side. That is, the transmission signal received via the input terminal 75 is switched by the changeover switch 76 in accordance with the type of the encoding method, that is, VSELP or PSI-CELP.

【0100】VSELPデコーダ77からの二つの励振
源1ExcN1及び励振源2ExcN2は出力端子78及び
79を介して図14の入力端子66及び67に供給され
る。また、PSI-CELPデコーダ81からの励振源
NExcNは出力端子82を介して図14の入力端子3
5に供給される。
The two excitation sources 1Exc N1 and 2Exc N2 from the VSELP decoder 77 are supplied to the input terminals 66 and 67 of FIG. Moreover, the excitation source NExc N from PSI-CELP decoder 81 input terminal 3 of FIG. 14 through the output terminal 82
5 is supplied.

【0101】また、VSELPデコーダ77又はPSI
−CELPデコーダ81からの線形予測係数αV又はαp
は上記符号化方式の種類に応じて切換スイッチ80によ
り選択されてから出力端子83を介して図14の入力端
子34に供給される。
The VSELP decoder 77 or PSI
-Linear prediction coefficient α V or α p from CELP decoder 81
Is selected by the changeover switch 80 in accordance with the type of the encoding method, and is supplied to the input terminal 34 of FIG.

【0102】同様に、VSELPデコーダ77又はPS
I−CELPデコーダ81からのデコード音声も上記符
号化方式の種類に応じて切換スイッチ84により選択さ
れてから出力端子85を介して図14の入力端子33に
供給される。
Similarly, the VSELP decoder 77 or PS
The decoded audio from the I-CELP decoder 81 is also selected by the changeover switch 84 in accordance with the type of the above-mentioned encoding method, and is then supplied to the input terminal 33 of FIG.

【0103】また、図14に示す、帯域幅拡張部70側
では、上記符号化方式の種類に応じて切り換わる切換ス
イッチ71により、励振源切換&拡張部68又は励振源
拡張部41からの励振源出力を切り換えて、LPC合成
部40に供給する。
Further, on the side of the bandwidth extension unit 70 shown in FIG. 14, the switching from the excitation source switching & extension unit 68 or the excitation source extension unit 41 is performed by the changeover switch 71 which switches according to the type of the encoding system. The source output is switched and supplied to the LPC synthesis unit 40.

【0104】したがって、この帯域幅拡張部70によれ
ば、送信装置側から伝送されてくる伝送信号の符号化方
式の種類に応じ、サンプリング周波数を2倍にした高品
質の帯域幅拡張を行うことができ、かつポストフィルタ
47を備えているので、広帯域音声信号のスペクトル整
形及び聴感上の品質を効果的に向上できる。よって、こ
の帯域幅拡張部70を備えた信号処理装置5は、聴覚的
品質を向上させることができる。
Therefore, according to the bandwidth extension unit 70, it is possible to perform high-quality bandwidth extension by doubling the sampling frequency according to the type of the encoding method of the transmission signal transmitted from the transmitting device. And the provision of the post-filter 47, it is possible to effectively improve the spectral shaping and audible quality of the wideband audio signal. Therefore, the signal processing device 5 including the bandwidth extension unit 70 can improve the auditory quality.

【0105】さらに、上記図1の受信装置1内部の信号
処理装置5は、図16に示すような帯域幅拡張部90を
備えてもよい。
Further, the signal processing device 5 inside the receiving device 1 shown in FIG. 1 may include a bandwidth extending unit 90 as shown in FIG.

【0106】帯域幅拡張部90の入力端子91には、L
PC残差である励振源が供給される。また、入力端子9
2には線形予測係数αが供給される。入力端子91から
の励振源は、LPC合成フィルタ93に送られると共
に、アップサンプル回路100に送られる。入力端子9
2からの線形予測係数はLPC合成フィルタ93に送ら
れる。
The input terminal 91 of the bandwidth extension section 90 has L
An excitation source that is a PC residual is supplied. Also, the input terminal 9
2 is supplied with a linear prediction coefficient α. The excitation source from the input terminal 91 is sent to the LPC synthesis filter 93 and also to the up-sampling circuit 100. Input terminal 9
The linear prediction coefficient from 2 is sent to the LPC synthesis filter 93.

【0107】LPC合成フィルタ93は、入力端子91
からの励振源を基に、入力端子92からの線形予測係数
を用いて音声信号を合成する。LPC合成フィルタ93
で合成された音声信号は、アップサンプル回路94に供
給される。
The LPC synthesis filter 93 has an input terminal 91
The speech signal is synthesized using the linear prediction coefficient from the input terminal 92 on the basis of the excitation source from. LPC synthesis filter 93
Is supplied to the up-sampling circuit 94.

【0108】アップサンプル回路94は、LPC合成フ
ィルタ93で合成された音声信号のサンプリング周波数
s1をアップサンプルする。アップサンプルされた上記
音声信号は、バンドパスフィルタ95で所定の帯域のみ
が通過され、加算器96に供給される。このアップサン
プル回路94、バンドパスフィルタ95、加算回路96
に通じる経路は、元の周波数帯域の成分の信号を合成さ
れた音声信号に付加するための経路である。
The up-sampling circuit 94 up-samples the sampling frequency f s1 of the audio signal synthesized by the LPC synthesis filter 93. The upsampled audio signal passes through only a predetermined band by a bandpass filter 95 and is supplied to an adder 96. This up-sampling circuit 94, band-pass filter 95, and adding circuit 96
Is a path for adding the signal of the component of the original frequency band to the synthesized audio signal.

【0109】また、LPC合成フィルタ93から線形予
測係数−自己相関変換回路97に線形予測係数が送られ
る。線形予測係数−自己相関変換回路97は、線形予測
係数を自己相関に変換するものである。この自己相関は
狭帯域コードブック98に送られると共に、破擦音検出
回路99に送られる。
Further, the linear prediction coefficient is sent from the LPC synthesis filter 93 to the linear prediction coefficient-autocorrelation conversion circuit 97. The linear prediction coefficient-autocorrelation conversion circuit 97 converts a linear prediction coefficient into an autocorrelation. This autocorrelation is sent to the narrow band codebook 98 and also to the affricate detection circuit 99.

【0110】また、入力端子91からの励振源は、アッ
プサンプル回路100でアップサンプルされ、ローパス
フィルタ101、ブースト回路102を介して、LPC
合成フィルタ103に送られる。ブースト回路102
は、破擦音や摩擦音が検出された場合に励振源をブース
トするためのもので、ブースト回路102のブースト量
は、破擦音検出回路99の出力により制御される。
The excitation source from the input terminal 91 is up-sampled by the up-sampling circuit 100 and is supplied to the LPC through the low-pass filter 101 and the boost circuit 102.
The signal is sent to the synthesis filter 103. Boost circuit 102
Is for boosting the excitation source when an affricate or fricative is detected, and the boost amount of the boost circuit 102 is controlled by the output of the affricate detector 99.

【0111】狭帯域コードブック98には、予め複数の
音声信号のパターンから得られた狭帯域音声信号の自己
相関情報がコードベクタとして格納されている。狭帯域
コードブック98で、線形予測係数−自己相関変換回路
97からの自己相関と、狭帯域コードブック98に格納
されている自己相関情報とが比較され、マッチング処理
が行われる。そして、最もマッチしている自己相関情報
のインデックスが広帯域コードブック104に送られ
る。
[0111] In the narrow band code book 98, autocorrelation information of narrow band audio signals obtained from a plurality of audio signal patterns is stored in advance as code vectors. In the narrowband codebook 98, the autocorrelation from the linear prediction coefficient-autocorrelation conversion circuit 97 is compared with the autocorrelation information stored in the narrowband codebook 98, and a matching process is performed. Then, the index of the best matching autocorrelation information is sent to wideband codebook 104.

【0112】広帯域コードブック104には、狭帯域コ
ードブック98と対応して、狭帯域コードブック98を
作成したときと同一のパターンの音声信号から得られる
広帯域音声信号の自己相関情報がコードベクタとして格
納されている。狭帯域コードブック98で最もマッチし
ている自己相関情報が判断されると、このインデックス
が広帯域コードブック104に送られ、広帯域コードブ
ック104により、最もマッチしていると判断された狭
帯域の自己相関情報に対応する広帯域の自己相関情報が
読み出される。
In the wideband codebook 104, corresponding to the narrowband codebook 98, autocorrelation information of a wideband audio signal obtained from an audio signal of the same pattern as when the narrowband codebook 98 was created is used as a code vector. Is stored. When the best matching autocorrelation information is determined in the narrowband codebook 98, this index is sent to the wideband codebook 104, and the wideband codebook 104 determines the narrowband autocorrelation information determined to be the best match. Broadband autocorrelation information corresponding to the correlation information is read.

【0113】広帯域コードブック104から読み出され
た広帯域の自己相関情報は、自己相関−線形予測係数変
換回路105に送られる。自己相関−線形予測係数変換
回路105により、自己相関から線形予測係数への変換
が行われる。この線形予測係数がLPC合成フィルタ1
03に送られる。
The wideband autocorrelation information read from the wideband codebook 104 is sent to an autocorrelation / linear prediction coefficient conversion circuit 105. The autocorrelation-linear prediction coefficient conversion circuit 105 converts the autocorrelation into a linear prediction coefficient. This linear prediction coefficient is the LPC synthesis filter 1
03 is sent.

【0114】LPC合成フィルタ103ではLPC合成
が行われ、これにより、広帯域音声信号が合成される。
LPC合成フィルタ103で合成された音声信号は、高
域抽出&抑圧フィルタ106及び乗算器107に供給さ
れる。
The LPC synthesis filter 103 performs LPC synthesis, thereby synthesizing a wideband audio signal.
The audio signal synthesized by the LPC synthesis filter 103 is supplied to a high-frequency extraction and suppression filter 106 and a multiplier 107.

【0115】高域抽出&抑圧フィルタ106は、LPC
合成フィルタ103からの合成出力から入力狭帯域音声
信号の周波数帯域300Hz〜3400Hzの信号成分
を除去し、3400Hz以上の信号成分を抽出すると共
に、ユーザの好みに応じて高い周波数成分を抑圧する。
乗算器107は、高域抽出&抑圧フィルタ106からの
フィルタ出力に端子108から調整されたゲインを乗算
する。
The high band extraction & suppression filter 106 is an LPC
A signal component in the frequency band of 300 Hz to 3400 Hz of the input narrow band audio signal is removed from the combined output from the combining filter 103 to extract a signal component of 3400 Hz or more, and suppresses a high frequency component according to the user's preference.
The multiplier 107 multiplies the filter output from the high-frequency extraction & suppression filter 106 by the gain adjusted from the terminal 108.

【0116】そして、加算器96は、乗算器107から
の乗算出力に、BPF95を介した元の狭帯域音声信号
成分を加算する。これにより、広帯域の音声信号が得ら
れる。
The adder 96 adds the original narrowband audio signal component via the BPF 95 to the multiplied output from the multiplier 107. Thereby, a wideband audio signal is obtained.

【0117】この音声信号は、ポストフィルタ109に
供給される。このポストフィルタ109は、上記図6に
示した構成をとり、上記広帯域音声信号のスペクトル整
形及び聴感上の品質を効果的に向上できる。
This audio signal is supplied to the post filter 109. The post filter 109 has the configuration shown in FIG. 6 and can effectively improve the spectral shaping and audibility of the wideband audio signal.

【0118】したがって、この図16に示した帯域幅拡
張部90を備える受信装置でも、サンプリング周波数を
2倍にした高品質の広帯域音声信号を生成し、さらに聴
感上の品質を向上できる。
Therefore, even the receiving apparatus including the bandwidth extending unit 90 shown in FIG. 16 can generate a high-quality wide-band audio signal with a doubling of the sampling frequency, and can further improve the perceived quality.

【0119】なお、上記受信装置1内部の信号処理装置
5は、各帯域幅拡張部32,65,70及び90内に、
ポストフィルタの後段又は前段に接続するように雑音低
減処理部を備えても良い。
Note that the signal processing device 5 inside the receiving device 1 is provided in each of the bandwidth extension units 32, 65, 70 and 90.
A noise reduction processing unit may be provided so as to be connected to the post-stage or the pre-stage of the post-filter.

【0120】この雑音低減処理部は、本件出願人が既に
出願した、特開平7−193548号公報に開示されて
いる、雑音低減処理方法を用いて、背景雑音を検出し、
抑圧する。この雑音低減処理方法は、上記第1のサンプ
リング周波数fs1の音声信号を生成するために送信装置
から伝送されてきた伝送信号に基づく音声パラメータ符
号から検出された背景雑音区間の雑音レベルに応じて制
御信号を形成し、この制御信号に基づいて雑音低減処理
の内容を変化させる。
This noise reduction processing section detects background noise by using a noise reduction processing method disclosed in Japanese Patent Application Laid-Open No. 7-193548, which has already been filed by the present applicant.
Oppress. This noise reduction processing method is based on a noise level of a background noise section detected from a voice parameter code based on a transmission signal transmitted from a transmission device to generate a voice signal of the first sampling frequency f s1. A control signal is formed, and the content of the noise reduction processing is changed based on the control signal.

【0121】図17には、上記雑音低減処理方法を適用
した雑音低減処理部49をポストフィルタ47の後段に
接続した帯域幅拡張部32を示す。また、図18には、
雑音低減処理部49の詳細な構成を示す。上記加算器4
6からの加算出力となる、帯域300〜6000Hz、
サンプリング周波数が16kHzの広帯域音声信号Sn
wは入力端子141を介して、フレームパワー計算回
路142に供給される。フレームパワー計算回路142
は、例えば周期20msecのフレーム毎のパワーとし
て、例えば自乗平均の平方根、いわゆるrms値を計算
する。このフレームパワー計算回路142で計算された
フレーム平均パワー値は、抑圧比計算回路143に供給
される。抑圧比計算回路143は、上記フレームパワー
計算回路142で計算されたフレーム平均パワーを用い
て、雑音を抑圧するための係数である抑圧比を計算す
る。抑圧比計算回路143で計算された抑圧比は、スム
ージング回路144に送られる。スムージング回路14
4は、抑圧比計算回路143で計算された抑圧比にスム
ージング処理を施す。このスムージング処理とは、例え
ば20msecで160サンプルのフレーム単位で分割
された入力音声信号のつながりの不連続性を避けるため
の処理である。このスムージング処理が施された抑圧比
は、ノイズリデュース回路145に送られ、このノイズ
リデュース回路145において上記広帯域音声信号Sn
wの雑音を除去するために用いられる。
FIG. 17 shows a bandwidth expansion unit 32 in which a noise reduction processing unit 49 to which the above-described noise reduction processing method is applied is connected to the post-filter 47. Also, in FIG.
4 shows a detailed configuration of the noise reduction processing unit 49. Adder 4 above
6, which is an added output from 6, a band of 300 to 6000 Hz,
Broadband audio signal Sn with a sampling frequency of 16 kHz
d w is supplied to the frame power calculation circuit 142 via the input terminal 141. Frame power calculation circuit 142
Calculates, for example, a square root of a root mean square, a so-called rms value, as the power for each frame having a period of 20 msec. The frame average power value calculated by the frame power calculation circuit 142 is supplied to the suppression ratio calculation circuit 143. The suppression ratio calculation circuit 143 calculates a suppression ratio, which is a coefficient for suppressing noise, using the frame average power calculated by the frame power calculation circuit 142. The suppression ratio calculated by the suppression ratio calculation circuit 143 is sent to the smoothing circuit 144. Smoothing circuit 14
4 performs a smoothing process on the suppression ratio calculated by the suppression ratio calculation circuit 143. The smoothing process is a process for avoiding discontinuity of connection between input audio signals divided in units of 160 samples in, for example, 20 msec. The suppression ratio that has been subjected to the smoothing processing is sent to the noise reduction circuit 145, where the noise reduction circuit 145 generates the wideband audio signal Sn.
Used to remove d w noise.

【0122】抑圧比計算回路143には、端子148を
介して入力された雑音レベル検出信号をレベル弁別回路
147で弁別して得られた制御信号が供給されており、
この制御信号に応じて、例えば上記抑圧比計算のしきい
値が切換制御されるようになっている。
The control signal obtained by discriminating the noise level detection signal input via the terminal 148 by the level discrimination circuit 147 is supplied to the suppression ratio calculation circuit 143.
In response to the control signal, for example, the threshold value of the above-described suppression ratio calculation is switched and controlled.

【0123】次に、この雑音低減処理部49の動作につ
いて詳細に説明する。図6のフレームパワー計算回路1
42は、上記フレーム当たりの上記広帯域音声信号Sn
wの平均パワーrmsを計算する。この平均パワーr
msは抑圧比計算回路143に供給される。
Next, the operation of the noise reduction processing section 49 will be described in detail. Frame power calculation circuit 1 of FIG.
42 is the wideband audio signal Sn per frame
Calculate the average power rms of d w . This average power r
ms is supplied to the suppression ratio calculation circuit 143.

【0124】抑圧比計算回路143は、平均パワーrm
sと、あるしきい値nr1とを比較し、その比較結果に
より、抑圧比scaleを計算する。すなわち、この抑圧比s
caleは、上記平均パワーrmsがしきい値nr1以上の
とき1とし、しきい値nr1よりも小さいとき、 scale=rms/K ・・・(7) とする。ここで、Kは定数である。この例の場合には、
K=nr1となる。
The suppression ratio calculation circuit 143 calculates the average power rm
s is compared with a certain threshold value nr1, and a suppression ratio scale is calculated based on the comparison result. That is, this suppression ratio s
cale is set to 1 when the average power rms is equal to or larger than the threshold value nr1, and is set to scale = rms / K (7) when the average power rms is smaller than the threshold value nr1. Here, K is a constant. In this case,
K = nr1.

【0125】あるいは、全てのrmsについて上記
(7)式を計算し、その計算結果としての抑圧比scale
が1よりも小(scale<1)となる場合には、この
(7)式で計算された抑圧比scaleを上記広帯域音声信
号Sndwに乗算する。これは、上記平均パワーrms
が上記しきい値rn1よりも小となるフレームにおいて
は、上記広帯域音声信号Sndwに1よりも小さいゲイ
ンを乗算することを意味する。また、この(7)式の結
果、抑圧比scaleが1以上(scale≧1)となる場合に
は、上記広帯域音声信号Sndwには何も処理を施さず
そのまま出力する。これは、抑圧比scaleが上記しきい
値となるフレームにおいては、上記広帯域音声信号Sn
wに1のゲインを乗算することを意味する。したがっ
て、このしきい値nr1を適切に選ぶことにより、雑音
部分のようなパワーの小さい部分ではゲインが小さく制
御されることになり、実質的に雑音低減の効果が得られ
る。なお、上記(7)式を用いた場合のノイズ抑圧の効
果は、入力信号の平均パワーに対して1/2倍となる。
Alternatively, the above equation (7) is calculated for all rms, and the suppression ratio scale
Is smaller than 1 (scale <1), the broadband audio signal Snd w is multiplied by the suppression ratio scale calculated by the equation (7). This is the average power rms
In a frame where is smaller than the threshold value rn1, it means that the wideband audio signal Snd w is multiplied by a gain smaller than 1. When the suppression ratio scale is 1 or more (scale ≧ 1) as a result of Expression (7), the wideband audio signal Snd w is output without any processing. This is because, in a frame in which the suppression ratio scale is equal to the threshold value, the wideband audio signal Sn
This means multiplying d w by a gain of 1. Therefore, by appropriately selecting the threshold value nr1, the gain is controlled to be small in a portion having a small power such as a noise portion, and the effect of substantially reducing noise is obtained. Note that the effect of noise suppression when using the above equation (7) is 倍 of the average power of the input signal.

【0126】また、ノイズの抑圧がききすぎる場合や、
一定レベル以下をミュートする回路と組み合わせて使用
する場合などにおいては、上記しきい値nr1(これを
第1のしきい値とする。)よりも小さい第2のしきい値
nr2を設定し、入力レベルがこの第2のしきい値nr
2よりも小さくなる領域で、抑圧を小さく、すなわちエ
キスパンダの伸長作用の強さを弱めることが好ましい。
Also, when noise suppression is too strong,
In the case of using in combination with a circuit for muting a certain level or lower, a second threshold value nr2 smaller than the above threshold value nr1 (this is set as a first threshold value) is set and input. The level is this second threshold value nr
In a region smaller than 2, it is preferable to reduce the suppression, that is, to weaken the strength of the expanding action of the expander.

【0127】ところで、入力された信号に対して音声と
雑音とを区別して処理しているわけではないので、子音
などの音声パワーが相対的に小さいところで音声が無く
なる傾向がある。特に強くノイズリデュースをかけたと
きにこの現象が顕著に現れ、音声の種類によってはかな
りの違和感を感じる。したがって、フレーム平均パワー
に対して、どの程度の強さでノイズリデュースをかける
か、またどのくらいの大きさからかけるかの検討が必要
になってくる。
By the way, since the input signal is not processed by discriminating between voice and noise, there is a tendency that the voice disappears when the power of voice such as consonant is relatively small. This phenomenon is particularly noticeable when a strong noise reduction is applied, and depending on the type of voice, a considerable sense of discomfort is felt. Therefore, it is necessary to consider how strong the noise reduction should be applied to the frame average power and from what size.

【0128】また、上記のような処理をフレーム単位で
行うと、フレームでの音声のつながりが不連続になり、
聞いたときに不自然感を感じてしまう。
When the above-described processing is performed in units of frames, the connection of audio in frames becomes discontinuous.
When you hear it, you feel unnatural.

【0129】これらのことを考慮して、上記抑圧比scal
eに対してアタックタイム、リカバリタイムを設定し、
例えばフレーム単位のスムージングを行うことにより、
上記不自然感が出ないようにすることが考えられる。
In consideration of the above, the above-mentioned suppression ratio scal
Set attack time and recovery time for e,
For example, by performing smoothing in frame units,
It is conceivable to prevent the unnatural feeling from appearing.

【0130】すなわち、上記図18の構成からも明らか
なように、抑圧比計算回路143で計算して求められた
抑圧比scaleは、一旦スムージング回路144によるス
ムージング処理を施した後、ノイズリデュース回路14
5に送るようにしている。
That is, as is clear from the configuration shown in FIG. 18, the suppression ratio scale calculated and calculated by the suppression ratio calculation circuit 143 is once subjected to a smoothing process by the smoothing circuit 144 and then to the noise reduction circuit 14.
I send it to 5.

【0131】このスムージング回路144は、上述した
ようなノイズ低減処理において生じる問題を解決するた
めに設けられたものであり、上記アタックタイム、リカ
バリタイムを設定している。この例では、アタックタイ
ムを“0”とし、リカバリータイムは可変としている。
The smoothing circuit 144 is provided to solve the above-described problem that occurs in the noise reduction processing, and sets the above-mentioned attack time and recovery time. In this example, the attack time is “0” and the recovery time is variable.

【0132】すなわち、計算した現在のフレームの音声
パワーが前のフレームより大きい時にはその値をそのま
ま使い、逆に小さい場合は所定の特性を備えるローパス
フィルタ(LPF)によりスムージングを行い、フレー
ムパワーの変化による処理の不自然感が出ないようにす
る。ノイズリデュース回路145は、上記広帯域音声信
号Sndwにスムージング回路144を介した抑圧比sca
leを乗算して入力信号Sndwの雑音低減処理を行い、
雑音が低減された出力信号を出力端子146から出力し
ている。
That is, when the calculated speech power of the current frame is larger than the previous frame, the value is used as it is. On the contrary, when the calculated speech power is smaller, smoothing is performed by a low-pass filter (LPF) having a predetermined characteristic to change the frame power. To avoid unnatural feeling of processing due to. The noise reduction circuit 145 supplies the wideband audio signal Snd w to the suppression ratio sca via the smoothing circuit 144.
le to reduce the noise of the input signal Snd w ,
An output signal with reduced noise is output from the output terminal 146.

【0133】ところで、上記抑圧比計算回路143に
は、端子148を介した雑音レベル検出信号をレベル弁
別回路147で弁別して得られた制御信号が供給されて
いる。この制御信号に応じて、上記抑圧比計算のしきい
値が切換制御されている。すなわち、抑圧比計算のしき
い値は、雑音レベル検出信号に基づいている。
The control signal obtained by discriminating the noise level detection signal via the terminal 148 by the level discrimination circuit 147 is supplied to the suppression ratio calculation circuit 143. In response to the control signal, the threshold for the above-described suppression ratio calculation is switched and controlled. That is, the threshold for the suppression ratio calculation is based on the noise level detection signal.

【0134】この雑音レベル検出信号は、上記第1のサ
ンプリング周波数fs1の音声信号を生成するために送信
装置から伝送されてきた伝送信号に基づく音声パラメー
タ符号から検出された背景雑音区間の音声レベルにより
表すことができる。
The noise level detection signal is a sound level of a background noise section detected from a sound parameter code based on a transmission signal transmitted from the transmitting device to generate a sound signal of the first sampling frequency f s1. Can be represented by

【0135】ここでは、図示を省略しているが、上記音
声パラメータ符号から背景雑音区間を検出する雑音区間
検出回路と、この雑音区間検出回路で検出された雑音区
間の雑音レベルを検出する雑音レベル検出回路が必要と
され、端子148には雑音レベル検出回路で検出された
雑音レベル検出信号が供給される。
Although not shown here, a noise section detection circuit for detecting a background noise section from the speech parameter code, and a noise level for detecting a noise level of the noise section detected by the noise section detection circuit are described. A detection circuit is required, and a noise level detection signal detected by the noise level detection circuit is supplied to a terminal 148.

【0136】また、この雑音低減処理部49は、上記第
1のサンプリング周波数fs1(8KHz)の音声信号を
生成するために送信装置から伝送されてきた伝送信号に
基づく音声パラメータ符号を処理に用いているが、実際
に雑音低減処理を施すのは、第2のサンプリング周波数
s2(16KHz)とされた上記広帯域音声信号Snd
Wに対してである。このため、雑音低減処理部49は、
上記図18に示した構成による雑音低減処理を1フレー
ム(20msec)当たり、320サンプル(ワード)
の上記広帯域音声信号SndWに、160ワード分ずつ
2回(=fs2/fs1)に分けて施している。
Further, the noise reduction processing unit 49 uses a voice parameter code based on a transmission signal transmitted from the transmitting apparatus to generate a voice signal of the first sampling frequency f s1 (8 KHz) for processing. However, the actual noise reduction processing is performed on the wideband audio signal Snd having the second sampling frequency f s2 (16 KHz).
W. For this reason, the noise reduction processing unit 49
The noise reduction processing by the configuration shown in FIG. 18 is 320 samples (words) per frame (20 msec).
Of the wide-band speech signal Snd W, is subjected divided into 160 words min twice (= f s2 / f s1) .

【0137】このようにして、雑音低減処理部49は、
上記広帯域音声信号中の雑音成分を低減できるので、帯
域幅拡張部32は、スペクトル整形及び聴感上の品質を
効果的に向上し、かつ、雑音成分を低減した上記広帯域
音声信号を出力できる。
As described above, the noise reduction processing section 49
Since the noise component in the wideband audio signal can be reduced, the bandwidth extension unit 32 can effectively improve the spectrum shaping and audibility, and can output the wideband audio signal with the noise component reduced.

【0138】なお、上記帯域幅拡張部32、65、70
又は90を備えた信号処理装置を用いた受信装置は、送
信装置と一体化され、図19に示すような、携帯電話装
置110を構成してもよい。この携帯電話装置110
も、PDCとして、現在広くしようされている、ディジ
タル携帯電話に適用できる。
Note that the bandwidth extension units 32, 65, 70
Alternatively, the receiving device using the signal processing device provided with 90 may be integrated with the transmitting device to constitute a mobile phone device 110 as shown in FIG. This mobile phone device 110
Can also be applied to digital mobile phones that are currently being widely used as PDC.

【0139】この携帯電話装置110で、マイクロホン
111から入力された音声信号は、アンプ112,ボリ
ューム113,アンチエイリアシングフィルタ114及
びA/D変換器115を経由して信号処理装置116の
メモリ116aに格納される。
In the portable telephone device 110, the audio signal input from the microphone 111 is stored in the memory 116a of the signal processing device 116 via the amplifier 112, the volume 113, the anti-aliasing filter 114, and the A / D converter 115. Is done.

【0140】メモリ116aに格納された音声信号は、
信号処理装置116内部の音声符号化部で符号処理さ
れ、音声パラメータ符号として出力される。
The sound signal stored in the memory 116a is
The audio signal is encoded by an audio encoding unit in the signal processing device 116 and output as an audio parameter code.

【0141】この音声パラメータ符号は、制御部117
及びRF(RF送信)アンプ118及びアンテナ119
を経由して基地局へ送信される。
This voice parameter code is transmitted to the control unit 117.
And RF (RF transmission) amplifier 118 and antenna 119
Is transmitted to the base station via.

【0142】ここで、信号処理装置116内部の音声符
号化部は、伝送路により制限される狭帯域化を考慮した
音声パラメータ符号を制御部117を介してRFアンプ
118に供給する。
Here, the audio encoding unit in the signal processing device 116 supplies an audio parameter code to the RF amplifier 118 via the control unit 117 in consideration of the narrow band limited by the transmission path.

【0143】また、アンテナ119を介して基地局から
受信した音声パラメータ符号は、RFアンプ118、制
御部117を経由して信号処理装置122のメモリ12
2aに格納される。
The voice parameter code received from the base station via the antenna 119 is transmitted to the memory 12 of the signal processing unit 122 via the RF amplifier 118 and the control unit 117.
2a.

【0144】信号処理装置122のメモリ122aに格
納された音声パラメータ符号は、信号処理装置122の
復号部で復号処理された後、所定の信号処理が施されて
出力される。
The voice parameter code stored in the memory 122a of the signal processing device 122 is decoded by the decoding unit of the signal processing device 122, subjected to predetermined signal processing, and output.

【0145】信号処理装置122から出力信号は、D/
A変換器123でアナログ信号とされた後、アンチエイ
リアシングフィルター124、ボリューム125及びア
ンプ128を経由してスピーカ127から出力される。
The output signal from the signal processing device 122 is D /
After being converted into an analog signal by the A converter 123, the analog signal is output from the speaker 127 via the anti-aliasing filter 124, the volume 125 and the amplifier 128.

【0146】ここで、信号処理装置122は、上記帯域
幅拡張部32、65、70又は90を備えてなる。した
がって、この図19に示した携帯電話装置110は、受
話側でサンプリング周波数を2倍にした高品質の広帯域
音声信号の、スペクトル整形及び聴感上の品質を効果的
に向上し、かつ、雑音成分を低減することができる。
Here, the signal processing device 122 includes the above-mentioned bandwidth extending unit 32, 65, 70 or 90. Therefore, the mobile phone device 110 shown in FIG. 19 can effectively improve the spectral shaping and audibility of a high-quality wideband audio signal whose sampling frequency is doubled on the receiving side, and can improve the noise component. Can be reduced.

【0147】なお、上記実施の形態では、受信装置、送
信装置、携帯電話装置を、PDCとして使用されている
ディジタル携帯電話装置に適用できるとして説明した
が、広帯域(ワイドバンド)CDMA方式、すなわち、
周波数帯域幅が広い移動体通信システムにも適用が可能
である。
In the above embodiment, the receiving device, the transmitting device, and the mobile phone device have been described as being applicable to a digital mobile phone device used as a PDC. However, a wideband (wideband) CDMA system, that is,
The present invention is also applicable to a mobile communication system having a wide frequency bandwidth.

【0148】[0148]

【発明の効果】本発明に係る受信装置及び受信方法は、
第1のサンプリング周波数fs1の音声信号を生成するた
めに伝送されてきた伝送信号に基づく音声パラメータ符
号を使って生成した第1の帯域B1の音声信号のサンプ
リング周波数を第2のサンプリング周波数fs2(fs2
s1)に変換して得た変換出力である第2のサンプリン
グ周波数fs2の第1の帯域B1の音声信号に、上記音声
パラメータ符号を使って推測した上記第1の帯域B1
帯域外成分である第2の帯域B2の第2のサンプリング
周波数fs2の音声信号を加算し、その加算出力にポスト
フィルタ処理を施すので、広帯域音声信号のスペクトル
整形及び聴感上の品質を効果的に向上できる。
The receiving apparatus and the receiving method according to the present invention provide:
First sampling frequency f sampling frequency of the first band B 1 of the audio signal generated using the speech parameters code based on the transmission signal transmitted to produce a speech signal s1 second sampling frequency f s2 ( fs2 >
f to a second first band B 1 of the audio signal having the sampling frequency f s2 is converted obtained was converted output s1), the sound parameter codes to use and guessed the first band of the band B 1 Since the audio signal of the second sampling frequency f s2 of the second band B 2 , which is an external component, is added and the added output is subjected to post-filter processing, the spectral shaping of the wide band audio signal and the quality in audibility are effectively improved. Can be improved.

【0149】また、本発明に係る通信装置及び通信方法
は、入力音声信号に第1のサンプリング周波数fs1によ
る符号化処理を施して伝送信号を生成すると共に、上記
第1のサンプリング周波数fs1を生成するために伝送さ
れてきた伝送信号に基づく音声パラメータ符号を使って
生成した第1の帯域B1の音声信号のサンプリング周波
数を第2のサンプリング周波数fs2(fs2>fs1)に変
換して得た変換出力と、上記音声パラメータ符号を使っ
て推測した第2のサンプリング周波数fs2の第2の帯域
2の音声信号とを加算した加算出力に、ポストフィル
処理を施すので、スペクトル整形及び聴感上の品質を効
果的に向上した広帯域音声信号を得ることができる。
Further, the communication apparatus and the communication method according to the present invention perform an encoding process on the input audio signal at the first sampling frequency f s1 to generate a transmission signal, and generate the transmission signal at the first sampling frequency f s1 . converts the sampling frequency of the first band B 1 of the audio signal generated using the speech parameters code based on the transmission signal transmitted to generate the second sampling frequency f s2 (f s2> f s1 ) a conversion output obtained, the second adder output the audio signal of the band B 2 by adding of the second sampling frequency f s2 of guessed using the speech parameter codes, so subjected to a post-fill process, the spectrum shaping In addition, it is possible to obtain a wideband audio signal whose audibility is effectively improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の形態となる受信装置の構成を示
すブロック図である。
FIG. 1 is a block diagram illustrating a configuration of a receiving device according to an embodiment of the present invention.

【図2】上記図1に示した受信装置に音声パラメータ符
号を基地局を介して送信する送信装置の構成を示すブロ
ック図である。
FIG. 2 is a block diagram showing a configuration of a transmitting apparatus for transmitting a voice parameter code to the receiving apparatus shown in FIG. 1 via a base station.

【図3】上記図1に示した受信装置内部の信号処理装置
を帯域幅拡張部と共に構成するPSI−CELPデコー
ダを示す図である。
FIG. 3 is a diagram showing a PSI-CELP decoder which configures a signal processing device inside the receiving device shown in FIG. 1 together with a bandwidth extension unit.

【図4】上記図1に示した受信装置内部の信号処理装置
をPSI−CELPデコーダと共に構成する帯域幅拡張
部を示すブロック図である。
FIG. 4 is a block diagram showing a bandwidth extension unit which configures the signal processing device inside the receiving device shown in FIG. 1 together with a PSI-CELP decoder.

【図5】上記図4に示した帯域幅拡張部に含まれる励振
源拡張部の詳細な構成を示すブロック図である。
FIG. 5 is a block diagram showing a detailed configuration of an excitation source extension unit included in the bandwidth extension unit shown in FIG. 4;

【図6】上記図4に示した帯域幅拡張部に含まれるポス
トフィルタの詳細な構成を示すブロック図である。
FIG. 6 is a block diagram illustrating a detailed configuration of a post filter included in the bandwidth extension unit illustrated in FIG. 4;

【図7】上記図4に示した帯域幅拡張部の詳細な動作を
説明するためのフローチャートである。
FIG. 7 is a flowchart illustrating a detailed operation of the bandwidth extension unit shown in FIG. 4;

【図8】上記図4に示した帯域幅拡張部で用いられるコ
ードブックに使われるトレーニングデータ生成処理を説
明するためのフローチャートである。
FIG. 8 is a flowchart for explaining a training data generation process used for a codebook used in the bandwidth extension unit shown in FIG. 4;

【図9】上記コードブックの生成を説明するためのフロ
ーチャートである。
FIG. 9 is a flowchart illustrating the generation of the code book.

【図10】上記ポストフィルタのフィルタ係数更新周期
とゲイン更新周期とを説明するための図である。
FIG. 10 is a diagram for explaining a filter coefficient update cycle and a gain update cycle of the post filter.

【図11】上記図1に示した受信装置内部の信号処理装
置の他の具体例に含まれるVSELPデコーダを示す図
である。
FIG. 11 is a diagram showing a VSELP decoder included in another specific example of the signal processing device inside the receiving device shown in FIG. 1;

【図12】上記図1に示した受信装置内部の信号処理装
置の他の具体例に含まれる帯域幅拡張部の構成を示すブ
ロック図である。
FIG. 12 is a block diagram showing a configuration of a bandwidth extension unit included in another specific example of the signal processing device inside the receiving device shown in FIG. 1;

【図13】上記図12に示した帯域幅拡張部の詳細な動
作を説明するためのフローチャートである。
FIG. 13 is a flowchart illustrating a detailed operation of the bandwidth extension unit shown in FIG. 12;

【図14】上記図1に示した受信装置内部の信号処理装
置のさらに他の具体例に含まれる帯域幅拡張部の構成を
示すブロック図である。
FIG. 14 is a block diagram showing a configuration of a bandwidth extension unit included in still another specific example of the signal processing device inside the receiving device shown in FIG. 1;

【図15】上記図1に示した受信装置内部の信号処理装
置のさらに他の具体例に含まれるデコード部の構成を示
すブロック図である。
FIG. 15 is a block diagram showing a configuration of a decoding unit included in still another specific example of the signal processing device inside the receiving device shown in FIG. 1;

【図16】上記図1に示した受信装置内部の信号処理装
置の、またさらに他の具体例に含まれる帯域幅拡張部の
構成を示すブロック図である。
FIG. 16 is a block diagram showing a configuration of a bandwidth extending unit included in still another specific example of the signal processing device inside the receiving device shown in FIG. 1 above.

【図17】上記図4に示した帯域幅拡張部内のポストフ
ィルタの後段に雑音低減処理部を接続した構成を示すブ
ロック図である。
FIG. 17 is a block diagram showing a configuration in which a noise reduction processing unit is connected at a stage subsequent to the post filter in the bandwidth extension unit shown in FIG. 4;

【図18】上記雑音低減処理部の詳細な構成を示すブロ
ック図である。
FIG. 18 is a block diagram illustrating a detailed configuration of the noise reduction processing unit.

【図19】上記各帯域幅拡張部を用いた信号処理装置を
含んだ受信装置を、送信装置と一体化して有してなる、
携帯電話装置の構成を示すブロック図である。
FIG. 19 includes a receiving device including a signal processing device using each of the above-described bandwidth extending units, integrated with a transmitting device.
FIG. 2 is a block diagram illustrating a configuration of a mobile phone device.

【符号の説明】[Explanation of symbols]

1 受信装置、15 送信装置、21 信号処理装置、
27 PSI−CELPデコーダ、32 帯域幅拡張
部、36 線形予測係数→自己相関(αN→rN)変換回
路、37 自己相関広帯域化部、38 広帯域コードブ
ック、39 自己相関→線形予測係数変換部、40 L
PC合成部、41 励振源拡張部、47ポストフィル
タ、49 雑音低減処理部
1 receiving device, 15 transmitting device, 21 signal processing device,
27 PSI-CELP decoder, 32 bandwidth extension unit, 36 linear prediction coefficient → autocorrelation (α N → r N ) conversion circuit, 37 autocorrelation wideband unit, 38 wideband codebook, 39 autocorrelation → linear prediction coefficient conversion unit , 40 L
PC synthesis unit, 41 excitation source expansion unit, 47 post filter, 49 noise reduction processing unit

───────────────────────────────────────────────────── フロントページの続き (72)発明者 大森 士郎 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 Fターム(参考) 5D045 CA01 CC02 CC07 5J064 AA01 BB10 BB12 BC01 BC07 BC08 BC12 BC18 BC19 BD02 9A001 EE05 GG11 HH15 KK60  ────────────────────────────────────────────────── ─── Continued on the front page (72) Inventor Shiro Omori 6-7-35 Kita-Shinagawa, Shinagawa-ku, Tokyo Sony Corporation F-term (reference) 5D045 CA01 CC02 CC07 5J064 AA01 BB10 BB12 BC01 BC07 BC08 BC12 BC18 BC19 BD02 9A001 EE05 GG11 HH15 KK60

Claims (27)

【特許請求の範囲】[Claims] 【請求項1】 第1のサンプリング周波数fs1の音声信
号を生成するために送信装置から伝送されてきた伝送信
号に基づく音声パラメータ符号を使って生成した第1の
帯域B1の音声信号のサンプリング周波数を第2のサン
プリング周波数fs2(fs2>fs1)に変換するサンプリ
ングレート変換手段と、 上記音声パラメータ符号を使って上記第1の帯域B1
帯域外成分である第2の帯域B2の第2のサンプリング
周波数fs2の音声信号を推測する帯域外成分推測手段
と、 上記サンプリングレート変換手段で第2のサンプリング
周波数fs2とされた第1の帯域B1の音声信号と、上記
帯域外成分推測手段で推測された第2のサンプリング周
波数fs2の第2の帯域B2の音声信号を加算する加算手
段と、 上記加算手段からの加算出力にポストフィルタ処理を施
すポストフィルタ手段とを備えることを特徴とする受信
装置。
1. A sampling of the first first band B 1 of the audio signal generated using the speech parameters code based on the transmission signal transmitted from the transmitting apparatus to generate an audio signal having the sampling frequency f s1 Sampling rate conversion means for converting a frequency to a second sampling frequency f s2 (f s2 > f s1 ); and a second band B which is an out-of-band component of the first band B 1 using the voice parameter code. (2) an out-of-band component estimating means for estimating an audio signal of a second sampling frequency f s2, an audio signal of a first band B 1 set to a second sampling frequency f s2 by the sampling rate converting means, adding means for adding second audio signal having a bandwidth B 2 of the second sampling frequency f s2, which was estimated by band components estimating means, Posutofu the addition output from said adding means Receiving device, characterized in that it comprises a post-filter means for performing filter processing.
【請求項2】 上記ポストフィルタ手段は、上記第1の
サンプリング周波数fs1の音声信号を生成するために送
信装置から伝送されてきた伝送信号に基づく音声パラメ
ータ符号に応じて上記ポストフィルタ処理を上記加算出
力に対してfs2/fs1回施すことを特徴とする請求項1
記載の受信装置。
2. The post-filtering means performs the post-filtering according to an audio parameter code based on a transmission signal transmitted from a transmitting device to generate an audio signal of the first sampling frequency f s1. 2. The method according to claim 1, wherein the addition output is performed fs2 / fs1 times.
The receiving device according to the above.
【請求項3】 上記ポストフィルタ手段は、復号化され
た信号が入力され、フィルタ係数が第1の周期で更新さ
れるスペクトル整形フィルタ手段と、このスペクトル整
形フィルタ手段からの出力が入力され、ゲインが上記第
1の周期とは異なる第2の周期で更新されるゲイン調整
手段とを有することを特徴とする請求項1記載の受信装
置。
3. A post-filter means, to which a decoded signal is input, and a spectrum shaping filter means for updating a filter coefficient in a first cycle; an output from the spectrum shaping filter means being input; 2. The receiving apparatus according to claim 1, further comprising: a gain adjusting unit that is updated in a second cycle different from the first cycle.
【請求項4】 上記ポストフィルタ手段は、上記第2の
周期を上記第1の周期よりも長くすることを特徴とする
請求項3記載の受信装置。
4. The receiving apparatus according to claim 3, wherein said post-filter means makes said second cycle longer than said first cycle.
【請求項5】 上記伝送信号はPSI−CELP符号化
又はVSELP符号化された信号であり、上記ポストフ
ィルタ手段は上記PSI−CELP符号化又はVSEL
P符号化された信号を復号して得られた音声パラメータ
符号に基づいたポストフィルタ処理を上記加算出力にf
s2/fs1回施すことを特徴とする請求項2記載の受信装
置。
5. The transmission signal is a PSI-CELP-coded or VSELP-coded signal, and the post-filter means is a PSI-CELP-coded or VSEL-coded signal.
Post-filter processing based on the speech parameter code obtained by decoding the P-coded signal
3. The receiving apparatus according to claim 2, wherein the reception is performed s2 / fs1 times.
【請求項6】 上記帯域外成分推測手段は、上記音声パ
ラメータ符号としての線形予測残差を帯域拡張する部分
と、上記音声パラメータ符号としての線形予測係数を広
帯域へ拡張する部分とからなることを特徴とする請求項
1記載の受信装置。
6. The out-of-band component estimating means includes a part for extending the band of the linear prediction residual as the speech parameter code, and a part for extending the linear prediction coefficient as the speech parameter code to a wide band. The receiving device according to claim 1, wherein:
【請求項7】 上記線形予測係数の広帯域への拡張部分
は、上記線形予測係数を自己相関に変換する第1変換部
と、第1変換部の自己相関を予め広帯域の自己相関を格
納したコードブックを参照することにより拡張する自己
相関拡張部と、この自己相関拡張部からの拡張自己相関
を拡張線形予測係数に変換する第2の変換部とを備える
ことを特徴とする請求項6記載の受信装置。
7. A wideband extension part of the linear prediction coefficient, wherein the first conversion part converts the linear prediction coefficient into an autocorrelation, and a code in which the autocorrelation of the first conversion part stores a wideband autocorrelation in advance. 7. An autocorrelation expansion unit that expands by referring to a book, and a second conversion unit that converts the expanded autocorrelation from the autocorrelation expansion unit into expanded linear prediction coefficients. Receiver.
【請求項8】 上記線形予測残差を帯域拡張する部分
は、上記線形予測残差をアップサンプルするアップサン
プル部を備えることを特徴とする請求項6記載の受信装
置。
8. The receiving apparatus according to claim 6, wherein the portion for band-expanding the linear prediction residual includes an up-sampling unit for up-sampling the linear prediction residual.
【請求項9】 上記伝送信号はPSI−CELP符号化
又はVSELP符号化された信号であり、上記帯域外成
分推測手段は上記PSI−CELP符号化又はVSEL
P符号化された信号を復号して得られた音声パラメータ
符号を使って上記第1の帯域B1の帯域外成分である第
2の帯域B2の第2のサンプリング周波数fs2の音声信
号を推測することを特徴とする請求項1記載の受信装
置。
9. The transmission signal is a PSI-CELP coded or VSELP coded signal, and the out-of-band component estimating means is configured to perform the PSI-CELP coded or VSEL
Using a voice parameter code obtained by decoding the P-coded signal, a voice signal of a second sampling frequency f s2 of a second band B 2 which is an out-of-band component of the first band B 1 is used. 2. The receiving device according to claim 1, wherein the receiving device estimates.
【請求項10】 上記ポストフィルタ手段の前段又は後
段に雑音低減処理手段を備えることを特徴とする請求項
1記載の受信装置。
10. The receiving apparatus according to claim 1, further comprising a noise reduction processing means provided before or after said post filter means.
【請求項11】 上記雑音低減処理手段は、上記第1の
サンプリング周波数fs1の音声信号を生成するために送
信装置から伝送されてきた伝送信号に基づく音声パラメ
ータ符号から検出された背景雑音区間の雑音レベルに応
じて制御信号を形成し、この制御信号に基づいた上記雑
音低減処理をfs2/fs1回行うことを特徴とする請求項
10記載の受信装置。
11. The noise reduction processing means according to claim 1, wherein said noise reduction processing means generates a speech signal of said first sampling frequency f s1 by converting a background noise section detected from a speech parameter code based on a transmission signal transmitted from a transmission device. The receiving apparatus according to claim 10, wherein a control signal is formed according to a noise level, and the noise reduction processing is performed fs2 / fs1 times based on the control signal.
【請求項12】 第1のサンプリング周波数fs1の音声
信号を生成するために伝送されてきた伝送信号に基づく
音声パラメータ符号を使って生成した第1の帯域B1
音声信号のサンプリング周波数を第2のサンプリング周
波数fs2(fs2>fs1)に変換して得た変換出力である
第2のサンプリング周波数fs2の第1の帯域B1の音声
信号に、上記音声パラメータ符号を使って推測した上記
第1の帯域B1の帯域外成分である第2の帯域B2の第2
のサンプリング周波数fs2の音声信号を加算し、その加
算出力にポストフィルタ処理を施すことを特徴とする受
信方法。
12. A sampling frequency of the first first band B 1 of the audio signal generated using the speech parameters code based on the transmission signal transmitted to produce the audio signal having the sampling frequency f s1 first the second sampling frequency f s2 second first band B 1 of the audio signal having the sampling frequency f s2 is (f s2> f s1) conversion obtained was converted into an output, infer with the speech parameter codes Of the second band B 2 , which is the out-of-band component of the first band B 1
A sound signal having a sampling frequency of fs2 , and post-filtering the added output.
【請求項13】 上記第1のサンプリング周波数fs1
音声信号を生成するために送信装置から伝送されてきた
伝送信号に基づく音声パラメータ符号に基づいて上記ポ
ストフィルタ処理を上記加算出力に対してfs2/fs1
施すことを特徴とする請求項12記載の受信方法。
13. The post-filter processing is performed on the sum output based on a voice parameter code based on a transmission signal transmitted from a transmission device to generate a voice signal of the first sampling frequency f s1. 13. The receiving method according to claim 12, wherein the processing is performed s2 / fs1 times.
【請求項14】 入力音声信号に第1のサンプリング周
波数fs1による符号化処理を施して伝送信号を生成する
送信手段と、 上記第1のサンプリング周波数fs1の音声信号を生成す
るために伝送されてきた伝送信号に基づく音声パラメー
タ符号を使って生成した第1の帯域B1の音声信号のサ
ンプリング周波数を第2のサンプリング周波数fs2(f
s2>fs1)に変換して得た変換出力と、上記音声パラメ
ータ符号を使って推測した第2のサンプリング周波数f
s2の第2の帯域B2の音声信号とを加算した加算出力
に、ポストフィルタ処理を施す受信手段とを備えること
を特徴とする通信装置。
14. A transmitting means for performing an encoding process on an input audio signal at a first sampling frequency f s1 to generate a transmission signal, and transmitting the audio signal at the first sampling frequency f s1 to generate the audio signal. the sampling frequency of the first band B 1 of the audio signal generated using the speech parameters code based on it has been transmitted signals a second sampling frequency f s2 (f
s2 > f s1 ) and the second sampling frequency f estimated using the above-mentioned speech parameter code.
A communication device comprising: receiving means for performing post-filter processing on an addition output obtained by adding an audio signal of a second band B2 of s2 .
【請求項15】 上記受信手段は、 第1のサンプリング周波数fs1の音声信号を生成するた
めに伝送されてきた伝送信号に基づく音声パラメータ符
号を使って生成した第1の帯域B1の音声信号のサンプ
リング周波数を第2のサンプリング周波数fs2(fs2
s1)に変換するサンプリングレート変換手段と、 上記音声パラメータ符号を使って上記第1の帯域B1
帯域外成分である第2の帯域B2の第2のサンプリング
周波数fs2の音声信号を推測する帯域外成分推測手段
と、 上記サンプリングレート変換手段で第2のサンプリング
周波数fs2とされた第1の帯域B1の音声信号と、上記
帯域外成分推測手段で推測された第2のサンプリング周
波数fs2の第2の帯域B2の音声信号を加算する加算手
段と、 上記加算手段からの加算出力にポストフィルタ処理を施
すポストフィルタ手段とを備えることを特徴とする請求
項14記載の通信装置。
15. The receiving means comprises a first band B 1 of the audio signal generated using the speech parameters code based on the transmission signal transmitted to produce a speech signal of a first sampling frequency f s1 At the second sampling frequency f s2 (f s2 >
f s1 ), and a voice signal having a second sampling frequency f s2 of a second band B 2 which is an out-of-band component of the first band B 1 using the voice parameter code. and out-of-band component predicting unit to estimate a first audio signal having a bandwidth of B 1, which is the second sampling frequency f s2 at the sampling rate converting means, a second sampling was estimated by the out-of-band components estimating means adding means for adding second audio signal having a bandwidth B 2 of frequency f s2, the communication of claim 14, characterized in that it comprises a post-filter means for performing post filtering processing to the addition output from said adding means apparatus.
【請求項16】 上記ポストフィルタ手段は、上記第1
のサンプリング周波数fs1の音声信号を生成するために
送信装置から伝送されてきた伝送信号に基づく音声パラ
メータ符号に応じて上記ポストフィルタ処理を上記加算
出力に対してfs2/fs1回施すことを特徴とする請求項
15記載の通信装置。
16. The first filter according to claim 1, wherein
Performing the post-filtering process f s2 / f s1 times on the added output according to a voice parameter code based on a transmission signal transmitted from the transmission device to generate a voice signal having a sampling frequency f s1. The communication device according to claim 15, characterized in that:
【請求項17】 上記ポストフィルタ手段は、復号化さ
れた信号が入力され、フィルタ係数が第1の周期で更新
されるスペクトル整形フィルタ手段と、このスペクトル
整形フィルタ手段からの出力が入力され、ゲインが上記
第1の周期とは異なる第2の周期で更新されるゲイン調
整手段とを有することを特徴とする請求項15記載の通
信装置。
17. The post-filter means, to which a decoded signal is input, a spectrum shaping filter means for updating a filter coefficient in a first cycle, an output from the spectrum shaping filter means, and a gain. 16. The communication apparatus according to claim 15, further comprising: a gain adjusting unit that is updated in a second cycle different from said first cycle.
【請求項18】 上記ポストフィルタ手段は、上記第2
の周期を上記第1の周期よりも長くすることを特徴とす
る請求項17記載の通信装置。
18. The post filter according to claim 18, wherein
18. The communication device according to claim 17, wherein a period of the communication device is longer than the first period.
【請求項19】 上記伝送信号はPSI−CELP符号
化又はVSELP符号化された信号であり、上記ポスト
フィルタ手段は上記PSI−CELP符号化又はVSE
LP符号化された信号を復号して得られた音声パラメー
タ符号に基づいたポストフィルタ処理を上記加算出力に
s2/fs1回施すことを特徴とする請求項16記載の通
信装置。
19. The transmission signal is a PSI-CELP-coded or VSELP-coded signal, and the post-filtering means is a PSI-CELP-coded or VSELP-coded signal.
17. The communication apparatus according to claim 16, wherein post-filter processing based on a voice parameter code obtained by decoding the LP-coded signal is performed fs2 / fs1 on the added output.
【請求項20】 上記受信手段の上記帯域外成分推測手
段は、上記音声パラメータ符号としての線形予測残差を
帯域拡張する部分と、上記音声パラメータ符号としての
線形予測係数を広帯域へ拡張する部分とからなることを
特徴とする請求項15記載の通信装置。
20. The out-of-band component estimating means of the receiving means includes: a part for extending the band of the linear prediction residual as the speech parameter code; and a part for extending the linear prediction coefficient as the speech parameter code to a wide band. The communication device according to claim 15, comprising:
【請求項21】 上記線形予測係数の広帯域への拡張部
分は、上記線形予測係数を自己相関に変換する第1変換
部と、第1変換部の自己相関を予め広帯域の自己相関を
格納したコードブックを参照することにより拡張する自
己相関拡張部と、この自己相関拡張部からの拡張自己相
関を拡張線形予測係数に変換する第2の変換部とを備え
ることを特徴とする請求項20記載の通信装置。
21. A part of the linear prediction coefficient extending to a wide band is a first conversion unit that converts the linear prediction coefficient into an autocorrelation, and a code in which the autocorrelation of the first conversion unit stores a wideband autocorrelation in advance. 21. The auto-correlation expansion unit that expands by referring to a book, and a second conversion unit that converts the expanded auto-correlation from the auto-correlation expansion unit into expanded linear prediction coefficients. Communication device.
【請求項22】 上記線形予測残差を帯域拡張する部分
は、上記線形予測残差をアップサンプルするアップサン
プル部を備えることを特徴とする請求項20記載の通信
装置。
22. The communication apparatus according to claim 20, wherein the portion that extends the band of the linear prediction residual includes an upsampler that upsamples the linear prediction residual.
【請求項23】 上記伝送信号はPSI−CELP符号
化又はVSELP符号化された信号であり、上記帯域外
成分推測手段は上記PSI−CELP符号化又はVSE
LP符号化された信号を復号して得られた音声パラメー
タ符号を使って上記第1の帯域B1の帯域外成分である
第2の帯域B2の第2のサンプリング周波数fs2の音声
信号を推測することを特徴とする請求項15記載の通信
装置。
23. The transmission signal is a PSI-CELP coded or VSELP coded signal, and the out-of-band component estimating means is configured to perform the PSI-CELP coded or VSELP coded signal.
An audio signal having a second sampling frequency f s2 of a second band B 2 , which is an out-of-band component of the first band B 1 , is converted using an audio parameter code obtained by decoding the LP-encoded signal. The communication device according to claim 15, wherein the communication device estimates.
【請求項24】 上記ポストフィルタ手段の前段又は後
段に雑音低減処理手段を備えることを特徴とする請求項
15記載の通信装置。
24. The communication apparatus according to claim 15, further comprising a noise reduction processing means provided before or after said post filter means.
【請求項25】 上記雑音低減処理手段は、上記第1の
サンプリング周波数fs1の音声信号を生成するために送
信装置から伝送されてきた伝送信号に基づく音声パラメ
ータ符号から検出された背景雑音区間の雑音レベルに応
じて制御信号を形成し、この制御信号に基づいた上記雑
音低減処理をfs2/fs1回行うことを特徴とする請求項
24記載の受信装置。
25. The noise reduction processing means according to claim 1, wherein said noise reduction processing means generates a speech signal having the first sampling frequency f s1 based on a speech parameter code based on a transmission signal transmitted from a transmission device. 25. The receiving apparatus according to claim 24, wherein a control signal is formed in accordance with the noise level, and the noise reduction processing is performed fs2 / fs1 times based on the control signal.
【請求項26】 入力音声信号に第1のサンプリング周
波数fs1による符号化処理を施して伝送信号を生成する
と共に、上記第1のサンプリング周波数fs1を生成する
ために伝送されてきた伝送信号に基づく音声パラメータ
符号を使って生成した第1の帯域B1の音声信号のサン
プリング周波数を第2のサンプリング周波数fs2(fs2
>fs1)に変換して得た変換出力と、上記音声パラメー
タ符号を使って推測した第2のサンプリング周波数fs2
の第2の帯域B2の音声信号とを加算した加算出力に、
ポストフィルタ処理を施すことを特徴とする通信方法。
And it generates a transmission signal by performing a coding process according to claim 26 first sampling frequency f s1 for the input speech signal, the transmission signal transmitted in order to generate the first sampling frequency f s1 the sampling frequency of the first band B 1 of the audio signal generated using the speech parameters code based the second sampling frequency f s2 (f s2
> F s1 ) and the second sampling frequency f s2 estimated using the above speech parameter code.
And a second audio signal having a bandwidth B 2 of the the sum output addition of,
A communication method comprising performing post-filter processing.
【請求項27】 上記第1のサンプリング周波数fs1
音声信号を生成するために送信装置から伝送されてきた
伝送信号に基づく音声パラメータ符号に基づいて上記雑
音低減処理を上記加算出力にfs2/fs1回施すことを特
徴とする請求項26記載の通信方法。
27. The noise reduction processing is performed on the added output by f s2 / f based on a voice parameter code based on a transmission signal transmitted from a transmitting device to generate a voice signal of the first sampling frequency f s1. The communication method according to claim 26, wherein fs1 is performed once.
JP36171198A 1998-12-11 1998-12-18 Receiving apparatus and method, communication apparatus and method Expired - Fee Related JP4135242B2 (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP36171198A JP4135242B2 (en) 1998-12-18 1998-12-18 Receiving apparatus and method, communication apparatus and method
KR1019990055298A KR20000047944A (en) 1998-12-11 1999-12-07 Receiving apparatus and method, and communicating apparatus and method
EP99309902A EP1008984A3 (en) 1998-12-11 1999-12-09 Windband speech synthesis from a narrowband speech signal
CN99127498A CN1261713A (en) 1998-12-11 1999-12-11 Reseiving device and method, communication device and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP36171198A JP4135242B2 (en) 1998-12-18 1998-12-18 Receiving apparatus and method, communication apparatus and method

Publications (2)

Publication Number Publication Date
JP2000181497A true JP2000181497A (en) 2000-06-30
JP4135242B2 JP4135242B2 (en) 2008-08-20

Family

ID=18474626

Family Applications (1)

Application Number Title Priority Date Filing Date
JP36171198A Expired - Fee Related JP4135242B2 (en) 1998-12-11 1998-12-18 Receiving apparatus and method, communication apparatus and method

Country Status (1)

Country Link
JP (1) JP4135242B2 (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004040552A1 (en) * 2002-10-31 2004-05-13 Nec Corporation Transcoder and coder conversion method
JP2004537739A (en) * 2000-10-18 2004-12-16 ノキア コーポレーション Method and system for estimating pseudo high band signal in speech codec
JP2005258226A (en) * 2004-03-12 2005-09-22 Toshiba Corp Method and device for wide-band voice sound decoding
US7486719B2 (en) 2002-10-31 2009-02-03 Nec Corporation Transcoder and code conversion method
JP2012058360A (en) * 2010-09-07 2012-03-22 Sony Corp Noise cancellation apparatus and noise cancellation method
JP2012181561A (en) * 2012-06-27 2012-09-20 Toshiba Corp Signal processing apparatus
JP2017521714A (en) * 2014-07-11 2017-08-03 オランジュ Post-processing state update with variable sampling frequency based on frame

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004537739A (en) * 2000-10-18 2004-12-16 ノキア コーポレーション Method and system for estimating pseudo high band signal in speech codec
WO2004040552A1 (en) * 2002-10-31 2004-05-13 Nec Corporation Transcoder and coder conversion method
US7486719B2 (en) 2002-10-31 2009-02-03 Nec Corporation Transcoder and code conversion method
JP2005258226A (en) * 2004-03-12 2005-09-22 Toshiba Corp Method and device for wide-band voice sound decoding
JP2012058360A (en) * 2010-09-07 2012-03-22 Sony Corp Noise cancellation apparatus and noise cancellation method
JP2012181561A (en) * 2012-06-27 2012-09-20 Toshiba Corp Signal processing apparatus
JP2017521714A (en) * 2014-07-11 2017-08-03 オランジュ Post-processing state update with variable sampling frequency based on frame

Also Published As

Publication number Publication date
JP4135242B2 (en) 2008-08-20

Similar Documents

Publication Publication Date Title
US6539355B1 (en) Signal band expanding method and apparatus and signal synthesis method and apparatus
KR100915733B1 (en) Method and device for the artificial extension of the bandwidth of speech signals
JP3653826B2 (en) Speech decoding method and apparatus
TWI579834B (en) Method and system for adjusting voice intelligibility enhancement
EP1008984A2 (en) Windband speech synthesis from a narrowband speech signal
JPH07193548A (en) Noise reduction processing method
US8311842B2 (en) Method and apparatus for expanding bandwidth of voice signal
US20040138876A1 (en) Method and apparatus for artificial bandwidth expansion in speech processing
WO2008032828A1 (en) Audio encoding device and audio encoding method
JP2002528775A (en) Method and apparatus for adaptive band pitch search in wideband signal coding
WO2006098274A1 (en) Scalable decoder and scalable decoding method
EP2954525B1 (en) Systems and methods of performing noise modulation and gain adjustment
JP2008216720A (en) Signal processing method, device, and program
JP2000200099A (en) Device and method for eliminating echo, and sound reproducing device
JPH1097296A (en) Method and device for voice coding, and method and device for voice decoding
EP2774148B1 (en) Bandwidth extension of audio signals
WO2005106850A1 (en) Hierarchy encoding apparatus and hierarchy encoding method
JP4135242B2 (en) Receiving apparatus and method, communication apparatus and method
JP2000206995A (en) Receiver and receiving method, communication equipment and communicating method
JP4135240B2 (en) Receiving apparatus and method, communication apparatus and method
JP2000206996A (en) Receiver and receiving method, communication equipment and communicating method
JP4099879B2 (en) Bandwidth extension method and apparatus
JP2000122679A (en) Audio range expanding method and device, and speech synthesizing method and device
JP2000099095A (en) Device and method for filtering voice signal, handset and telephone communication system
JP2000181494A (en) Device and method for reception and device and method for communication

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050804

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080417

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080513

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080526

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110613

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120613

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees