JP2003216196A - Speech encoding device and its method - Google Patents

Speech encoding device and its method

Info

Publication number
JP2003216196A
JP2003216196A JP2002333491A JP2002333491A JP2003216196A JP 2003216196 A JP2003216196 A JP 2003216196A JP 2002333491 A JP2002333491 A JP 2002333491A JP 2002333491 A JP2002333491 A JP 2002333491A JP 2003216196 A JP2003216196 A JP 2003216196A
Authority
JP
Japan
Prior art keywords
noise
signal
section
speech
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002333491A
Other languages
Japanese (ja)
Other versions
JP3571709B2 (en
Inventor
Yasushi Yamazaki
泰 山崎
Tomohiko Taniguchi
智彦 谷口
Tomonori Sato
知紀 佐藤
Hisashige Kimura
壽成 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2002333491A priority Critical patent/JP3571709B2/en
Publication of JP2003216196A publication Critical patent/JP2003216196A/en
Application granted granted Critical
Publication of JP3571709B2 publication Critical patent/JP3571709B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To enhance quality of speech when background noise such as outdoor noise is superposed in a digital mobile radio communication system such as a car telephone and a cellular telephone. <P>SOLUTION: A speech encoding device is provided with a noise superposed section detection means for judging whether a signal to be inputted from a telephone microphone is a signal of a speech section or a signal of a noise section, a speech encoder A for encoding the signal of the speech section and a speech encoder B for encoding the signal of the noise section, when the noise superposed section detection means detects the noise section, control information regarding a decoding processing of the noise section is determined and transmitted. <P>COPYRIGHT: (C)2003,JPO

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、自動車電話や携帯電話
等のデジタル移動無線通信システムにおいて、屋外等の
背景雑音が重畳する場合に符号化品質を向上させ、雑音
重畳音声の伝送品質を向上させる技術に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention, in a digital mobile radio communication system such as a car phone or a mobile phone, improves coding quality when background noise such as outdoors is superimposed and improves transmission quality of noise-superimposed voice. Regarding the technology to make.

【0002】近年では、通信技術の向上により、自動車
電話や携帯電話等のようなデジタル移動無線通信システ
ムが普及してきている。これにともない、音声信号を高
効率に圧縮する音声信号処理装置が要求されるようにな
ってきている。
In recent years, with the improvement of communication technology, digital mobile radio communication systems such as car phones and mobile phones have become widespread. Along with this, an audio signal processing device that compresses an audio signal with high efficiency has been required.

【0003】[0003]

【従来の技術】デジタル移動無線通信システムでは、無
線周波数を有効利用するため、4kHz帯域の音声信号
を4〜8kbps程度のビットレートで符号化すること
が望ましい。これに対応した音声符号化方式としては、
CELP方式が知られている。
2. Description of the Related Art In a digital mobile radio communication system, it is desirable to encode a voice signal of 4 kHz band at a bit rate of about 4 to 8 kbps in order to effectively use radio frequencies. As a voice coding method corresponding to this,
The CELP method is known.

【0004】CELP方式は、音声信号を線形予測理論
に基づいて分析し、周波数特性を表すパラメータを抽出
する。これと共に、駆動音源信号をベクトル量子化によ
り波形的に符号化している。また、受信側では、伝送路
上を送信されてくる符号化音声を送信側と逆の手順によ
り復号化している。
The CELP method analyzes a speech signal based on a linear prediction theory and extracts a parameter representing a frequency characteristic. At the same time, the driving excitation signal is waveform-wise encoded by vector quantization. Further, on the receiving side, the encoded voice transmitted on the transmission path is decoded by the procedure opposite to that on the transmitting side.

【0005】[0005]

【発明が解決しようとする課題】ところで、上記のCE
LP方式では、音声信号を低ビットレートに圧縮すると
同時に再生音声品質を維持するため、音声の生成モデル
に基づいた符号化(帯域圧縮)を行っているため、背景
雑音の重畳された音声信号を符号化する場合に、不自然
な再生音を出力することがある。すなわち、従来の方式
では、音声とは異なる性質を有する雑音信号に対して、
音声と同様の性質を有すると仮定した符号化処理を行っ
ている。このため、背景雑音のみの信号は、周波数の相
関性が無いにもかかわらず符号化処理を施され、不自然
な有音として再生されてしまう。
By the way, the above CE
In the LP system, since the audio signal is compressed to a low bit rate and at the same time the reproduced audio quality is maintained, encoding (band compression) based on the audio generation model is performed. When encoding, an unnatural reproduced sound may be output. That is, in the conventional method, for a noise signal having a property different from that of voice,
Encoding processing is performed on the assumption that it has the same properties as speech. For this reason, a signal having only background noise is encoded and reproduced as an unnatural sound even though there is no frequency correlation.

【0006】また、従来では、音声を符号化する際に、
音声の波形に基づいて適応符号帳を参照し、類似する波
形パターンのインデックス情報を検出している。しか
し、音声に雑音が重畳した場合には、適応符号帳に類似
した波形パターンが存在せず、あまり類似していない波
形パターンを選出せざるを得なかったため、これを復号
化した時に不自然な音声となって出力されるという問題
がある。
Further, conventionally, when encoding voice,
The adaptive codebook is referenced based on the waveform of the voice to detect index information of similar waveform patterns. However, when noise is superimposed on the voice, there is no waveform pattern similar to the adaptive codebook, and there is no choice but to select a waveform pattern that is not very similar, which is unnatural when decoded. There is a problem that it is output as voice.

【0007】ここで、背景雑音として空調音を例に挙げ
ると、空調音の原音のスペクトルは図13に示すように
略フラットな特性を示し、時間変動も少ない。これに対
し、空調音の再生音は図14に示すように、スペレクト
ル包絡のピークがフレーム毎に変動している。本発明の
発明者は、スペクトル包絡の変動が聴覚上の不自然さを
引き起こしていることに着目し、このスペクトル変動の
原因を究明した。すなわち、従来の復号器では、適応符
号帳と雑音符号帳から励起信号を生成し、この励起信号
を合成フィルタを介することにより復号処理を行ってい
るため、発明者は、スペクトル変動の原因が励起信号の
生成処理によるものか、あるいは合成フィルタによるも
のかを解析した。その結果、励起信号のスペクトルには
時間的変動が見られなかった。一方、合成フィルタの場
合には、図15に示すような変動が表れた。
When the air conditioning noise is taken as an example of the background noise, the spectrum of the original sound of the air conditioning noise shows a substantially flat characteristic as shown in FIG. 13, and the time variation is small. On the other hand, in the reproduced sound of the air conditioning sound, as shown in FIG. 14, the peak of the spectrum envelope fluctuates for each frame. The inventor of the present invention paid attention to the fact that the fluctuation of the spectrum envelope causes unnaturalness in hearing, and investigated the cause of this spectrum fluctuation. That is, in the conventional decoder, the excitation signal is generated from the adaptive codebook and the noise codebook, and the decoding process is performed by passing the excitation signal through the synthesis filter. We analyzed whether it was due to the signal generation processing or the synthesis filter. As a result, no temporal fluctuation was found in the spectrum of the excitation signal. On the other hand, in the case of the synthesis filter, the variation shown in FIG. 15 appeared.

【0008】そこで、本発明は、上記問題点に鑑みてな
されたものであり、雑音のみを含む信号と音声を含む信
号とを識別して、雑音のみを含む信号の符号化処理ある
いは復号化処理を差別化し、雑音のみを復号化する場合
に合成フィルタの特性を抑制することにより、聴覚的に
自然な再生音を出力する装置を提供することを第1の課
題とする。
Therefore, the present invention has been made in view of the above problems, and discriminates between a signal containing only noise and a signal containing voice, and an encoding process or a decoding process of a signal containing only noise. It is a first object of the present invention to provide a device that outputs a audibly natural reproduced sound by differentiating the noise and suppressing the characteristics of the synthesis filter when only noise is decoded.

【0009】また、音声に雑音が重畳した信号を符号化
する際に、雑音の影響を防止して、質の高い符号化処理
を行える技術を提供することを第2の課題とする。
A second object is to provide a technique capable of preventing the influence of noise and performing a high quality encoding process when encoding a signal in which noise is superimposed on voice.

【0010】[0010]

【課題を解決するための手段】本発明は上記課題を解決
するために以下のような手段を採用した。これを図面に
沿って説明する。
The present invention adopts the following means in order to solve the above problems. This will be described with reference to the drawings.

【0011】(第1の課題を解決する手段)まず、上記
第1の課題を解決する手段について図1の原理図に沿っ
て説明する。
(Means for Solving the First Problem) First, means for solving the first problem will be described with reference to the principle diagram of FIG.

【0012】本発明の音声復号化システムは、雑音重量
区間検出手段1、音声復号化手段2、雑音復号化手段
3、及び雑音制御手段4とを備えている。雑音重畳区間
検出手段1は、送信側で符号化された信号を監視し、音
声を含む音声区間であるか、あるいは雑音のみを含む雑
音区間であるかを識別する機能を有している。例えば、
雑音重畳区間検出手段1は、符号化信号から信号のパワ
ーを検出し、このパワーが予め設定されている閾値以上
であるか否かを判別するようにしてもよい。つまり、符
号化信号のパワーが閾値以上ならば音声区間と判別し、
符号化信号のパワーが閾値未満ならば雑音区間と判別す
るようにしてもよい。また、パワーの代わりに、符号化
信号のゲインを利用するようにしてもよい。
The speech decoding system of the present invention comprises a noise weight section detecting means 1, a speech decoding means 2, a noise decoding means 3 and a noise control means 4. The noise superposed section detecting means 1 has a function of monitoring the signal encoded on the transmitting side and discriminating whether the section is a voice section containing voice or a noise section containing only noise. For example,
The noise superimposition section detection means 1 may detect the power of the signal from the encoded signal and determine whether this power is equal to or greater than a preset threshold value. That is, if the power of the coded signal is equal to or higher than the threshold value, it is determined that the speech section,
If the power of the encoded signal is less than the threshold value, it may be determined to be a noise section. Further, the gain of the encoded signal may be used instead of the power.

【0013】音声復号化手段2は、雑音重畳区間検出手
段1が音声区間の符号化信号を判別した際に、この符号
化信号を波形信号に復号化する機能を有している。具体
的には、インデックス情報毎に波形パターンを登録する
符号帳3aと、この符号帳3aから読み出された波形パ
ターンを励起する駆動音源3bと、この駆動音源3bか
ら出力される励起信号にフィルタリング処理を施す合成
フィルタ3cとを備えている。
The speech decoding means 2 has a function of decoding the coded signal into a waveform signal when the noise superposed section detection means 1 discriminates the coded signal in the speech section. Specifically, a codebook 3a that registers a waveform pattern for each index information, a drive sound source 3b that excites the waveform pattern read from this codebook 3a, and an excitation signal that is output from this drive sound source 3b are filtered. And a synthesis filter 3c for processing.

【0014】雑音復号化手段3は、雑音重畳区間検出手
段1が雑音区間の符号化信号を判別した際に、この符号
化信号を波形信号へ復号化する機能を有している。具体
的には、インデックス情報毎に波形パターンを登録する
符号帳3aと、この符号帳3aから読み出された波形パ
ターンを励起する駆動音源3bと、この駆動音源3bか
ら出力される励起信号にフィルタリング処理を施す合成
フィルタ3cとを備えている。
The noise decoding means 3 has a function of decoding the coded signal into a waveform signal when the noise superimposed section detecting means 1 discriminates the coded signal in the noise section. Specifically, a codebook 3a that registers a waveform pattern for each index information, a drive sound source 3b that excites the waveform pattern read from this codebook 3a, and an excitation signal that is output from this drive sound source 3b are filtered. And a synthesis filter 3c for processing.

【0015】雑音制御手段4は、雑音重畳区間検出手段
1が雑音区間の符号化信号を判別した時に、雑音復号化
手段3の合成フィルタ3cのフィルタ係数を制御して、
雑音の周波数特性を抑制させる機能を有している。具体
的には、雑音制御手段4は、フィルタ係数に1以下に乗
算すべき1以下の正数値を決定する機能を有している。
The noise control means 4 controls the filter coefficient of the synthesis filter 3c of the noise decoding means 3 when the noise superimposition interval detection means 1 determines the coded signal in the noise interval,
It has the function of suppressing the frequency characteristics of noise. Specifically, the noise control unit 4 has a function of determining a positive value of 1 or less to be multiplied by 1 or less by the filter coefficient.

【0016】また、雑音復号化手段3及び音声復号化手
段2の後段に、合成フィルタ3cから出力される復号信
号の振幅を増幅させるポストフィルタ9を備えた場合に
は、このポストフィルタ9は、雑音復号化手段3から出
力される雑音区間の復号信号をそのまま通過させる機能
を有している。
When a post filter 9 for amplifying the amplitude of the decoded signal output from the synthesizing filter 3c is provided at the subsequent stage of the noise decoding means 3 and the speech decoding means 2, this post filter 9 is It has a function of passing the decoded signal in the noise section output from the noise decoding means 3 as it is.

【0017】次に、本発明の音声符号化システムについ
て説明する。本発明の音声符号化システムは、雑音重畳
区間検出手段5、音声符号化手段6、雑音符号化手段
7、及び制御情報生成手段8とを備えている。
Next, the speech coding system of the present invention will be described. The speech coding system of the present invention includes a noise superimposition section detection means 5, a speech coding means 6, a noise coding means 7, and a control information generation means 8.

【0018】雑音重畳区間検出手段5は、送信側で符号
化された符号化信号を監視して、音声を含む音声区間の
信号であるか、あるいは雑音のみを含む雑音区間の信号
であるかを識別する機能を有している。具体的には、符
号化信号に含まれる波形特性を分析して、信号のパワー
が閾値未満であるか否か、あるいは符号化のゲインが閾
値未満であるか否かを判別することにより、雑音区間を
識別するようにしてもよい。
The noise superposed section detection means 5 monitors the coded signal coded on the transmission side and determines whether the signal is a voice section signal containing voice or a noise section signal containing only noise. Has a function to identify. Specifically, by analyzing the waveform characteristics included in the encoded signal to determine whether the power of the signal is less than a threshold value or whether the gain of encoding is less than the threshold value, noise The section may be identified.

【0019】また、音声符号化手段6は、雑音重畳区間
検出手段5が音声区間を判別した際に、この区間の波形
を特定するインデックス情報へ符号化する機能を有して
いる。具体的には、音声符号化手段6は、インデックス
情報毎に波形パターンを登録する符号帳を備えている。
Further, the voice coding means 6 has a function of, when the noise superposed section detection means 5 discriminates the voice section, coding into the index information for specifying the waveform of this section. Specifically, the voice encoding unit 6 includes a codebook that registers a waveform pattern for each index information.

【0020】雑音符号化手段7は、雑音重畳区間検出手
段5が雑音区間を判別した際に、この区間の波形を特定
するインデックス情報へ符号化する機能を有している。
この符号化手段は、音声符号化手段6と同様に、インデ
ックス情報毎に波形パターンを登録する符号帳を備えて
いる。
The noise coding means 7 has a function of, when the noise superposed section detection means 5 discriminates the noise section, coding into the index information for specifying the waveform of this section.
Like the voice encoding means 6, this encoding means is provided with a codebook for registering a waveform pattern for each index information.

【0021】制御情報生成手段8は、雑音重畳区間検出
手段5が雑音区間を判別した場合に、この雑音区間の復
号化処理にかかる制御情報を生成し、この制御情報を雑
音区間の符号化信号に付加して受信側へ送信させる機能
を有している。具体的には、雑音の波形特性に基づいて
復号側で使用される合成フィルタのフィルタ係数を制御
する情報である。例えば、フィルタ係数に乗算すべき1
以下の正数値を制御情報とする。
The control information generation means 8 generates control information for decoding processing of this noise section when the noise superposed section detection means 5 determines the noise section, and uses this control information as a coded signal of the noise section. It has a function of being added to and transmitted to the receiving side. Specifically, it is information that controls the filter coefficient of the synthesis filter used on the decoding side based on the waveform characteristics of noise. For example, the filter coefficient should be multiplied by 1
The following positive values are used as control information.

【0022】(第2の課題を解決するための手段)次
に、上記第2の課題を解決する手段について図2の原理
図に沿って説明する。
(Means for Solving the Second Problem) Next, means for solving the second problem will be described with reference to the principle diagram of FIG.

【0023】この手段は、符号化システムに適用される
ものであり、雑音重畳区間検出手段10、逆フィルタ手
段11、雑音除去手段12、ピッチ周期検出手段13、
及び音声符号化手段14とを備えている。
This means is applied to the coding system, and includes the noise superimposition section detecting means 10, the inverse filter means 11, the noise removing means 12, the pitch period detecting means 13,
And voice encoding means 14.

【0024】雑音重畳区間検出手段10は、送話器から
入力される信号を監視し、音声のみを含む音声区間と、
雑音のみを含む雑音区間と、音声に雑音が重畳した雑音
重畳区間とを識別する機能を有している。
The noise superposed section detection means 10 monitors the signal input from the transmitter and detects a voice section containing only voice,
It has a function of discriminating between a noise section including only noise and a noise superposition section in which noise is superimposed on speech.

【0025】逆フィルタ手段11は、雑音重畳区間検出
手段10が雑音重畳区間を判別した時に、この雑音重畳
区間を線形予測分析して線形予測係数を求め、この線形
予測係数をフィルタ係数とする逆フィルタリング処理を
施す機能を有している。この逆フィルタ手段11から出
力される予測残差信号は、雑音除去手段12へ入力され
る。
The inverse filter means 11, when the noise-superimposed section detecting means 10 determines the noise-superimposed section, performs linear prediction analysis on the noise-superimposed section to obtain a linear prediction coefficient, and uses the linear prediction coefficient as a filter coefficient. It has a function of performing filtering processing. The prediction residual signal output from the inverse filter means 11 is input to the noise removing means 12.

【0026】雑音除去手段12は、予測残差信号から雑
音部分を除去する機能を有している。この雑音除去手段
12としては、例えば、ローパスフィルタを用いること
ができる。
The noise removing means 12 has a function of removing a noise portion from the prediction residual signal. As the noise removing means 12, for example, a low pass filter can be used.

【0027】ピッチ周期検出手段13は、雑音除去手段
12から出力される残差信号の自己相関関数を求め、こ
の自己相関関数が最大値となるピッチ周期を検出する機
能を有している。すなわち、予測残差信号を特定周期分
ずつずらしていき、各予測残差信号と元の予測残差信号
との相関が最大となる特定周期をピッチ周期として検出
する。
The pitch period detecting means 13 has a function of obtaining an autocorrelation function of the residual signal output from the noise removing means 12 and detecting a pitch period at which the autocorrelation function has a maximum value. That is, the prediction residual signal is shifted by a specific cycle, and the specific cycle in which the correlation between each prediction residual signal and the original prediction residual signal is maximum is detected as the pitch cycle.

【0028】そして、音声符号化手段14は、ピッチ周
期検出手段13が検出したピッチ周期に基づいて雑音重
畳区間の波形を符号化する機能を有している。
The voice coding means 14 has a function of coding the waveform of the noise superposed section based on the pitch cycle detected by the pitch cycle detection means 13.

【0029】[0029]

【作用】本発明の第1の課題を解決するシステムについ
て説明する。
A system for solving the first problem of the present invention will be described.

【0030】(第1の課題を解決するシステムの作用)
本発明の音声復号化システムでは、送信側で符号化され
た符号化信号を受信すると、雑音重畳区間検出手段1が
雑音のみを含む雑音区間の符号化信号であるか、音声含
む音声区間の符号化信号であるかを判別する。
(Operation of system for solving first problem)
In the voice decoding system of the present invention, when the coded signal coded on the transmitting side is received, the noise superposed section detection means 1 is a coded signal of a noise section containing only noise, or a code of a voice section containing speech. It is determined whether or not the signal is a digitized signal.

【0031】ここで、符号化信号が音声区間の符号化信
号であれば、この符号化信号は音声復号化手段2へ入力
される。音声符号化手段2は、符号化信号を波形信号へ
符号化する。
If the coded signal is a coded signal in the voice section, the coded signal is input to the voice decoding means 2. The voice encoding means 2 encodes the encoded signal into a waveform signal.

【0032】また、符号化信号が雑音区間の符号化信号
ならば、この符号化信号は雑音復号化手段3へ入力され
る。そして、雑音復号化手段3では、符号帳3aからイ
ンデックス情報に対応する波形パターンを検出し、この
波形パターンを駆動音源3bを介して励起させる。そし
て、励起信号は、合成フィルタへ3c入力される。これ
と同時に、雑音制御手段4は、合成フィルタ3cのフィ
ルタ係数に1以下の正数値を乗算して合成フィルタ3c
へ通知する。合成フィルタ3cは、雑音制御手段4から
通知されたフィルタ係数に基づいて前記励起信号にフィ
ルタリング処理を施し、復号化信号を出力する。これに
より、雑音区間の波形は、周波数特性を不自然に強調さ
れることなく再生される。
If the coded signal is a coded signal in the noise section, this coded signal is input to the noise decoding means 3. Then, the noise decoding means 3 detects a waveform pattern corresponding to the index information from the codebook 3a and excites this waveform pattern via the driving sound source 3b. Then, the excitation signal is input to the synthesis filter 3c. At the same time, the noise control means 4 multiplies the filter coefficient of the synthesis filter 3c by a positive value of 1 or less to synthesize the synthesis filter 3c.
Notify to. The synthesizing filter 3c performs a filtering process on the excitation signal based on the filter coefficient notified from the noise control means 4, and outputs a decoded signal. As a result, the waveform in the noise section is reproduced without unnaturally enhancing the frequency characteristic.

【0033】また、雑音復号化手段3は、雑音区間のゲ
インを”0”として処理するようにしてもよい。さら
に、合成フィルタ3cの後段にポストフィルタ9を備え
た場合には、ポストフィルタ9は、合成フィルタ3cか
ら出力される雑音波形のピークを強調せずに(何も処理
せずに)通過させる。
Further, the noise decoding means 3 may be processed by setting the gain of the noise section to "0". Further, when the post filter 9 is provided at the subsequent stage of the synthesis filter 3c, the post filter 9 passes the peak of the noise waveform output from the synthesis filter 3c without emphasizing it (without processing anything).

【0034】次に、本発明の音声符号化システムでは、
送話器から信号が入力されると、雑音重畳区間検出手段
5は、入力信号が音声を含む音声区間の信号であるか、
あるいは雑音のみを含む雑音区間の信号であるかを識別
する。
Next, in the speech coding system of the present invention,
When a signal is input from the transmitter, the noise superposed section detection means 5 determines whether the input signal is a signal in a voice section including voice,
Alternatively, it is identified whether the signal is in a noise section including only noise.

【0035】ここで、入力信号が音声区間の信号であれ
ば、音声符号化手段6は、音声区間の波形と類似する波
形パターンを判別し、この波形パターンを特定するイン
デックス情報へ符号化して受信側へ送信する。
If the input signal is a signal in the voice section, the voice encoding means 6 discriminates a waveform pattern similar to the waveform in the voice section, encodes this waveform pattern into index information for specifying, and receives the index information. Send to the side.

【0036】また、入力信号が雑音区間の信号であれ
ば、雑音符号化手段7は、雑音区間の波形と類似する波
形パターンを判別し、この波形パターンを特定するイン
デックス情報へ符号化する。これと同時に、制御情報生
成手段8は、雑音区間の復号処理に関する制御情報を生
成し、上記インデックス情報に付加する。具体的には、
制御情報生成手段8は、雑音区間の入力信号を線形予測
分析して周波数特性を判別し、求まったフィルタ係数に
1以下の正数値を乗算し、受信側で使用される合成フィ
ルタのフィルタ係数を決定する。そして、このフィルタ
係数を制御情報としてインデックス情報と共に受信側へ
送信する。
If the input signal is a signal in the noise section, the noise encoding means 7 discriminates a waveform pattern similar to the waveform in the noise section and encodes this waveform pattern into index information for specifying. At the same time, the control information generation means 8 generates control information regarding the decoding process of the noise section and adds it to the index information. In particular,
The control information generating means 8 performs linear prediction analysis on the input signal in the noise section to determine the frequency characteristic, multiplies the obtained filter coefficient by a positive value of 1 or less, and sets the filter coefficient of the synthesis filter used on the receiving side. decide. Then, this filter coefficient is transmitted as control information to the receiving side together with index information.

【0037】以下、本発明の第2の課題を解決するシス
テムについて説明する。 (第2の課題を解決するシステムの作用)本発明の音声
符号化システムでは、雑音重畳区間判別手段10が、送
話器から入力される信号を監視し、音声のみを含む音声
区間であるか、雑音のみを含む雑音区間であるか、ある
いは音声に雑音が重畳した雑音重畳区間であるかを判別
する。
A system for solving the second problem of the present invention will be described below. (Operation of the system for solving the second problem) In the voice coding system of the present invention, the noise superimposition section determination means 10 monitors the signal input from the transmitter and determines whether the voice section includes only the voice. , It is determined whether it is a noise section including only noise or a noise superposition section in which noise is superimposed on speech.

【0038】ここで、雑音重畳区間が判別されると、逆
フィルタ手段11は、雑音重畳区間の予測係数を求め、
この予測係数をフィルタ係数とするフィルタリング処理
を施して予測残差信号を出力する。この予測残差信号
は、雑音除去手段12へ入力され、雑音部分を除去され
る。
When the noise-superimposed section is determined, the inverse filter means 11 obtains the prediction coefficient of the noise-superimposed section,
Filtering processing using this prediction coefficient as a filter coefficient is performed and a prediction residual signal is output. This prediction residual signal is input to the noise removing means 12 and the noise portion is removed.

【0039】雑音除去手段12により雑音部分を除去さ
れた予測残差信号は、ピッチ周期検出手段13へ入力さ
れる。ピッチ周期検出手段13は、予測残差信号の自己
相関関数を求め、この自己相関関数が最大値となるピッ
チ周期を検出する。
The prediction residual signal from which the noise portion has been removed by the noise removing means 12 is input to the pitch cycle detecting means 13. The pitch period detecting means 13 obtains the autocorrelation function of the prediction residual signal, and detects the pitch period at which this autocorrelation function has the maximum value.

【0040】そして、音声符号化手段14は、ピッチ周
期検出手段13が検出したピッチ周期に基づいて雑音重
畳区間の波形と類似する波形パターンを判別し、この波
形パターンを特定するインデックス情報へ符号化する。
これにより、雑音の影響を受けずに音声信号の符号化を
行える。
Then, the voice encoding means 14 discriminates a waveform pattern similar to the waveform of the noise superposed section on the basis of the pitch period detected by the pitch period detection means 13, and encodes this waveform pattern into index information for specifying the waveform pattern. To do.
As a result, the audio signal can be encoded without being affected by noise.

【0041】[0041]

【実施例】本発明の実施例について図面に沿って説明す
る。 <実施例1>本発明の第1の実施例について図面に沿っ
て説明する。
Embodiments of the present invention will be described with reference to the drawings. <First Embodiment> A first embodiment of the present invention will be described with reference to the drawings.

【0042】図3は、本実施例1における音声復号化シ
ステムの構成を示すブロック図である。本実施例1にお
ける音声符号化システムは、雑音重畳区間検出手段とし
ての雑音重畳検出判定器1と、音声符号化手段としての
音声復号器A(2)と、雑音復号手段としての音声復号
器B(3)と、受信符号分離部15とを備えている。
FIG. 3 is a block diagram showing the structure of the speech decoding system according to the first embodiment. The speech coding system according to the first embodiment includes a noise superposition detection determiner 1 as a noise superposition section detecting means, a speech decoder A (2) as a speech coding means, and a speech decoder B as a noise decoding means. (3) and the reception code separation unit 15 are provided.

【0043】尚、音声復号器A(2)と音声復号器B
(3)とは、復号化方式としてCELP方式を採用する
ものとする。受信符号分離部15は、送信側から受信し
た符号化信号をパワー情報、インデックス情報、合成フ
ィルタ係数とに分離する機能を有している。
The speech decoder A (2) and the speech decoder B
The term (3) means that the CELP method is adopted as the decoding method. The reception code separation unit 15 has a function of separating the coded signal received from the transmission side into power information, index information, and a synthesis filter coefficient.

【0044】雑音重畳検出判定器1は、受信符号分離部
15が分離したパワー情報と予め設定されている閾値と
を比較し、パワー情報が閾値以上ならば符号化信号を音
声区間と判定し、パワー情報が閾値未満ならば符号化信
号を雑音区間と判定する機能を有している。さらに、雑
音重畳検出判定器1は、音声区間の符号化信号を音声復
号器A(2)へ入力させると共に雑音区間の符号化信号
を音声復号器B(3)へ入力させる機能とを有してい
る。
The noise superimposition detection / determination unit 1 compares the power information separated by the reception code separation unit 15 with a preset threshold value, and if the power information is greater than or equal to the threshold value, determines the coded signal as a voice section, If the power information is less than the threshold, it has a function of determining the coded signal as a noise section. Further, the noise superimposition detection / determination unit 1 has a function of inputting the coded signal of the voice section to the voice decoder A (2) and inputting the coded signal of the noise section to the voice decoder B (3). ing.

【0045】音声復号器A(2)は、音声区間の符号化
信号を復号化するものである。具体的には、従来のCE
LP方式の復号器と同様の構成及び機能を有しており、
説明は省略する。
The voice decoder A (2) decodes the coded signal in the voice section. Specifically, conventional CE
It has the same configuration and function as the LP type decoder,
The description is omitted.

【0046】音声復号器B(3)は、雑音区間の符号化
信号を復号化するものである。ここで、図4に、音声復
号器B(3)の内部構成と周辺構成とを示す。同図にお
いて、音声復号器B(3)は、適応符号帳30aと、雑
音符号帳31aと、駆動音源3bと、合成フィルタ3c
を備えている。そして、合成フィルタ3cには、本発明
の雑音制御手段としてのLPC係数補正部4が接続され
ている。
The voice decoder B (3) decodes the coded signal in the noise section. Here, FIG. 4 shows an internal configuration and a peripheral configuration of the speech decoder B (3). In the figure, the speech decoder B (3) includes an adaptive codebook 30a, a noise codebook 31a, a driving excitation 3b, and a synthesis filter 3c.
Is equipped with. The LPC coefficient correction unit 4 as the noise control means of the present invention is connected to the synthesis filter 3c.

【0047】適応符号帳30aは、周期性を有する波形
信号の波形パターンとインデックス情報とを登録するも
のであり、復号化した波形信号により波形パターンを更
新する機能を有している。
The adaptive codebook 30a is for registering the waveform pattern of a waveform signal having periodicity and index information, and has the function of updating the waveform pattern with the decoded waveform signal.

【0048】雑音符号帳31aは、周期性を持たない波
形信号の波形パターンとインデックス情報とを登録する
ものである。適応符号帳30aと雑音符号帳31aに
は、それぞれから読み出した波形パターンの増幅率(ゲ
イン)が規定されており、駆動音源3bは、適応符号帳
30aと雑音符号帳31aとから読み出された波形パタ
ーンを各々のゲインに従って励起する機能を有してい
る。
The random codebook 31a registers the waveform pattern of a waveform signal having no periodicity and index information. The adaptive codebook 30a and the noise codebook 31a define the amplification factors (gains) of the waveform patterns read from them, respectively, and the driving sound source 3b is read from the adaptive codebook 30a and the noise codebook 31a. It has a function of exciting the waveform pattern according to each gain.

【0049】合成フィルタ3cは、駆動音源3bから出
力される励起信号に対してフィルタリング処理を施し、
波形信号へ復号化するものである。合成フィルタ3cの
フィルタ係数は、送信側で決定される。すなわち、送信
側では、元の波形信号を線形予測分析して、線形予測係
数を算出し、この線形予測係数をフィルタ係数として受
信側へ送信する。これにより、音声復号器B(3)は、
符号化信号からフィルタ係数を検出し、このフィルタ係
数を合成フィルタ3cのフィルタ係数として用いる。
The synthesis filter 3c filters the excitation signal output from the driving sound source 3b,
It is for decoding into a waveform signal. The filter coefficient of the synthesis filter 3c is determined on the transmission side. That is, on the transmitting side, the original waveform signal is subjected to linear prediction analysis to calculate linear prediction coefficients, and the linear prediction coefficients are transmitted to the receiving side as filter coefficients. As a result, the speech decoder B (3)
A filter coefficient is detected from the encoded signal and this filter coefficient is used as the filter coefficient of the synthesis filter 3c.

【0050】LPC係数補正部4は、雑音重畳検出判定
器1の判定結果を受けて合成フィルタ3cのフィルタ係
数を補正する機能を有している。具体的には、以下の数
式に示すように、合成フィルタ3cのフィルタ係数に、
1以下の正数を乗算してフィルタ係数を補正する機能を
有している。 α’i=gi×αi (0.0<g≦1.0) これにより、合成フィルタ3cの周波数特性を略フラッ
トな特性とすることができる(図12参照)。
The LPC coefficient correcting section 4 has a function of receiving the judgment result of the noise superposition detection judging device 1 and correcting the filter coefficient of the synthesizing filter 3c. Specifically, as shown in the following formula, the filter coefficient of the synthesis filter 3c is
It has a function of correcting a filter coefficient by multiplying by a positive number of 1 or less. α′i = gi × αi (0.0 <g ≦ 1.0) As a result, the frequency characteristic of the synthesis filter 3c can be made substantially flat (see FIG. 12).

【0051】以下、音声復号化システムの動作について
説明する。音声復号化システムは、送信側で符号化され
た符号化信号を受信符号分離部15が受信する。
The operation of the speech decoding system will be described below. In the voice decoding system, the reception code separation unit 15 receives the coded signal coded on the transmission side.

【0052】受信符号分離部15は、符号化信号を、パ
ワー情報、インデックス情報、フィルタ係数とに分離
し、パワー情報を雑音重畳検出判定器1へ入力させる。
雑音重畳検出判定器1は、パワー情報が閾値以上である
か、あるいは閾値未満であるかを判別する。ここで、パ
ワー情報が閾値以上ならば、雑音重畳検出判定器1は、
符号化信号を音声区間の信号と判定し、受信符号分離部
15が分離したパワー情報、インデックス情報、及びフ
ィルタ係数を音声復号器A(2)へ入力させる。音声復
号器A(2)は、これらの情報に基づいて符号化信号を
音声波形へ復号化する。
The reception code separation unit 15 separates the coded signal into power information, index information and filter coefficients, and inputs the power information to the noise superimposition detection and determination unit 1.
The noise superposition detection determiner 1 determines whether the power information is equal to or more than the threshold value or less than the threshold value. Here, if the power information is greater than or equal to the threshold value, the noise superimposition detection determination unit 1
The encoded signal is determined to be a signal in the voice section, and the power information, the index information, and the filter coefficient separated by the reception code separator 15 are input to the voice decoder A (2). The voice decoder A (2) decodes the coded signal into a voice waveform based on these pieces of information.

【0053】一方、パワー情報が閾値未満の場合には、
雑音重畳検出判定器1は、符号化信号が雑音区間の信号
と判定し、受信符号分離部15が分離したパワー情報及
びインデックス情報を音声復号器B(3)へ入力させる
と同時に、フィルタ係数をLPC係数補正部4へ通知す
る。
On the other hand, when the power information is less than the threshold value,
The noise superimposition detection / determination unit 1 determines that the encoded signal is a signal in a noise section, inputs the power information and the index information separated by the reception code separation unit 15 to the speech decoder B (3), and at the same time sets the filter coefficient. Notify the LPC coefficient correction unit 4.

【0054】音声復号器B(3)では、インデックス情
報に基づいて適応符号帳30aあるいは雑音符号帳31
aを検索し、該当する波形パターンを検出する。そし
て、駆動音源3bは、波形パターンを各符号帳のゲイン
に従って励起し、励起信号を合成フィルタ3cへ入力さ
せる。
In the speech decoder B (3), the adaptive codebook 30a or the noise codebook 31 is used based on the index information.
A is searched for the corresponding waveform pattern. Then, the driving sound source 3b excites the waveform pattern according to the gain of each codebook, and inputs the excitation signal to the synthesis filter 3c.

【0055】ここで、LPC係数補正部4は、フィルタ
係数に1以下の正数値を乗算してフィルタ係数を補正す
る。そして、補正後のフィルタ係数を合成フィルタ3c
へ通知する。
Here, the LPC coefficient correcting section 4 corrects the filter coefficient by multiplying the filter coefficient by a positive value of 1 or less. Then, the corrected filter coefficient is used as the synthesis filter 3c.
Notify to.

【0056】合成フィルタ3cは、LPC係数補正部4
から通知されたフィルタ係数に従って駆動音源3bから
出力される励起信号をフィルタリング処理して雑音波形
へ復号化する。 以上、本実施例1によれば、雑音区間
の信号を符号化する際に、フィルタ係数を制御すること
により、合成フィルタ3cのスペクトルを略フラットな
特性とすることができ、雑音波形の特性を不自然に強調
させることを防止し、聴覚的に耳障りな雑音の再生を抑
制することができる。従って、携帯電話や自動車電話等
のような携帯移動通信の音声品質を向上させることがで
きる。
The synthesis filter 3c includes the LPC coefficient correction unit 4
The excitation signal output from the driving sound source 3b is filtered according to the filter coefficient notified from the above and decoded into a noise waveform. As described above, according to the first embodiment, the spectrum of the synthesis filter 3c can be made to have a substantially flat characteristic by controlling the filter coefficient when the signal in the noise section is encoded, and the characteristic of the noise waveform can be Unnatural enhancement can be prevented, and the reproduction of noise that is annoying to the ear can be suppressed. Therefore, it is possible to improve the voice quality of mobile communication such as mobile phones and car phones.

【0057】<実施例2>本実施例2では、本発明のシ
ステムを符号器に適用した例について説明する。図5
は、音声符号化システムの概略構成図である。
<Embodiment 2> In Embodiment 2, an example in which the system of the present invention is applied to an encoder will be described. Figure 5
FIG. 1 is a schematic configuration diagram of a voice encoding system.

【0058】同図において、音声符号化システムは、音
声符号器A(6)、音声符号器B(7)、及び雑音重畳
検出判定器5を備えている。雑音重畳検出判定器5は、
送話器から入力される波形信号のパワーを検出し、この
パワーが閾値以上であれば音声を含む音声区間の波形信
号と判定し、パワーが閾値未満ならば雑音のみを含む雑
音区間の波形信号と判定する機能を有している。そし
て、雑音重畳検出判定器5は、音声区間の波形信号を音
声符号器A(6)へ入力させ、雑音区間の波形信号を音
声符号器B(7)へ入力させる機能を有している。
In the figure, the speech encoding system comprises a speech encoder A (6), a speech encoder B (7), and a noise superposition detection decision unit 5. The noise superimposition detection / determination device 5 is
The power of the waveform signal input from the transmitter is detected. If this power is greater than or equal to the threshold value, it is determined to be the waveform signal in the voice section containing speech. If the power is less than the threshold value, the waveform signal in the noise section containing only noise. It has the function to judge. Then, the noise superimposition detection and determination unit 5 has a function of inputting the waveform signal of the voice section to the voice encoder A (6) and inputting the waveform signal of the noise section to the voice encoder B (7).

【0059】音声符号器A(6)は、音声区間の波形信
号を符号化する機能を有し、従来のCELP方式の符号
器である。音声符号器B(7)は、雑音区間の波形信号
を符号化する機能を有している。
The voice encoder A (6) has a function of encoding the waveform signal in the voice section and is a conventional CELP system encoder. The voice encoder B (7) has a function of encoding the waveform signal in the noise section.

【0060】ここで、図6に、音声符号器B(7)の内
部構成と周辺構成を示す。同図において、音声符号器B
(7)は、適応符号帳70a、雑音符号帳71a、駆動
音源7b、合成フィルタ7c、LPC分析部7e、及び
誤差最少化部7dを備えている。
FIG. 6 shows the internal structure and the peripheral structure of the speech coder B (7). In the figure, a speech coder B
(7) includes an adaptive codebook 70a, a noise codebook 71a, a driving sound source 7b, a synthesis filter 7c, an LPC analysis section 7e, and an error minimization section 7d.

【0061】適応符号帳70aは、周期性を有する波形
の波形パターンと、個々の波形パターンを特定するイン
デックス情報とを登録している。雑音符号帳71aは、
周期性を持たない波形の波形パターンと、個々の波形パ
ターンを特定するインデックス情報とを登録している。
The adaptive codebook 70a registers a waveform pattern of a waveform having periodicity and index information for identifying each waveform pattern. The noise codebook 71a is
A waveform pattern having a waveform having no periodicity and index information for identifying each waveform pattern are registered.

【0062】駆動音源7bは、適応符号帳70aから検
出された波形パターン、及び雑音符号帳71aから検出
された波形パターンを各符号帳のゲインに従って励起す
る機能を有している。
The driving sound source 7b has a function of exciting the waveform pattern detected from the adaptive codebook 70a and the waveform pattern detected from the noise codebook 71a according to the gain of each codebook.

【0063】合成フィルタ7cは、雑音区間の波形信号
の線形予測係数をフィルタ係数としたフィルタリング処
理を行う機能を有している。誤差最少化部7dは、合成
フィルタ7cから出力される波形信号と、入力された雑
音信号の波形とを比較して、インデックス情報と波形パ
ターンの増幅率(ゲイン)を最適化して雑音符号帳71
aの内容を更新する機能を有している。
The synthesis filter 7c has a function of performing a filtering process using the linear prediction coefficient of the waveform signal in the noise section as a filter coefficient. The error minimization unit 7d compares the waveform signal output from the synthesis filter 7c with the waveform of the input noise signal, optimizes the index information and the amplification factor (gain) of the waveform pattern, and then the noise codebook 71.
It has a function of updating the contents of a.

【0064】LPC分析部7eは、入力波形を線形予測
分析して線形予測係数を算出し、この線形予測係数をフ
ィルタ係数として合成フィルタ7cへ入力する機能を有
している。
The LPC analysis section 7e has a function of performing linear prediction analysis on the input waveform to calculate linear prediction coefficients and inputting the linear prediction coefficients to the synthesis filter 7c as filter coefficients.

【0065】さらに、音声符号器B(7)には、符号送
信部16とLPC係数補正部8とが接続されている。符
号送信部16は、音声符号器B(7)で符号化されたパ
ワー情報、インデックス情報、及びフィルタ係数とを受
信側へ送信する機能を有している。
Further, the code encoder B (7) is connected to the code transmitter 16 and the LPC coefficient corrector 8. The code transmitting unit 16 has a function of transmitting the power information, the index information, and the filter coefficient encoded by the voice encoder B (7) to the receiving side.

【0066】LPC係数補正部8は、前述の実施例1と
同様の機能を有しており、雑音区間の符号化信号を復号
化する際に使用される合成フィルタ7cのフィルタ係数
を補正する機能を有している。具体的には、フィルタ係
数に1以下の正数値を乗算して補正を行う。これに対応
して、符号送信部16は、LPC係数補正部8が補正し
たフィルタ係数を他の符号化信号と共に送信するものと
する。
The LPC coefficient correction unit 8 has the same function as that of the above-described first embodiment, and has a function of correcting the filter coefficient of the synthesis filter 7c used when decoding the coded signal in the noise section. have. Specifically, correction is performed by multiplying the filter coefficient by a positive value of 1 or less. In response to this, the code transmission unit 16 transmits the filter coefficient corrected by the LPC coefficient correction unit 8 together with other coded signals.

【0067】以下に、実施例2における音声符号化シス
テムの動作について説明する。送話器から波形信号が入
力されると、雑音重畳検出判定器5は、この波形信号の
パワーを検出し、閾値以上であるかあるいは閾値未満で
あるかを判別する。ここで、波形信号のパワーが閾値以
上ならば、雑音重畳検出判定器5は、波形信号を音声区
間の波形信号と判定し、この波形信号を音声符号器A
(6)へ入力させる。
The operation of the speech coding system according to the second embodiment will be described below. When the waveform signal is input from the transmitter, the noise superimposition detection determination unit 5 detects the power of the waveform signal and determines whether it is equal to or more than the threshold value or less than the threshold value. Here, if the power of the waveform signal is equal to or higher than the threshold value, the noise superimposition detection determination unit 5 determines that the waveform signal is a waveform signal in the voice section, and the waveform signal is determined by the voice encoder
Input to (6).

【0068】音声符号器A(6)では、符号帳を用いて
波形情報をインデックス情報、パワー情報、及びフィル
タ係数とに符号化し、受信側へ送信する。また、入力波
形のパワーが閾値未満の場合には、雑音重畳検出判定器
5は、波形信号が雑音区間の波形信号であると判定し、
この波形信号を音声符号器B(7)へ入力させる。
The voice encoder A (6) encodes the waveform information into index information, power information, and filter coefficient using a codebook, and transmits it to the receiving side. Further, when the power of the input waveform is less than the threshold value, the noise superimposition detection determination unit 5 determines that the waveform signal is a waveform signal in a noise section,
This waveform signal is input to the voice encoder B (7).

【0069】音声符号器B(7)では、適応符号帳70
aと雑音符号帳71aとを雑音区間の波形に基づいて検
索し、類似する波形パターンを検出する機能を有してい
る。さらに、音声符号器B(7)は、適応符号帳70a
あるいは雑音符号帳71aから読み出された波形パター
ンを駆動音源7bへ入力させる。
In the speech coder B (7), the adaptive codebook 70
It has a function of searching a and the noise codebook 71a based on the waveform of the noise section and detecting a similar waveform pattern. Further, the speech coder B (7) is adapted to the adaptive codebook 70a.
Alternatively, the waveform pattern read from the noise codebook 71a is input to the driving sound source 7b.

【0070】駆動音源7bは、波形パターンを励起して
合成フィルタ7cへ入力させる。ここで、LPC分析部
7eは、入力された波形信号を線形予測分析し、線形予
測係数を算出する。そして、LPC分析部7eは、線形
予測係数を合成フィルタ7cへ通知する。
The driving sound source 7b excites the waveform pattern and inputs it to the synthesis filter 7c. Here, the LPC analysis unit 7e performs a linear prediction analysis on the input waveform signal to calculate a linear prediction coefficient. Then, the LPC analysis unit 7e notifies the synthesis filter 7c of the linear prediction coefficient.

【0071】合成フィルタ7cは、線形予測係数をフィ
ルタ係数とするフィルタリング処理を、駆動音源7bか
ら入力された励起信号に対して施す。誤差最少化部7d
は、合成フィルタ7cから出力される復号信号と、入力
された波形信号とを比較し、双方の誤差を最少にするた
めに最適なインデックス情報と波形パターンのゲインと
を適応符号帳70a及び雑音符号帳71aへ通知する。
そして、各符号帳は、誤差最少化部7dから通知される
インデックス情報とゲインとに基づいて登録内容及びゲ
インを更新し、更新後のインデックス情報を符号送信部
16へ通知する。さらに、LPC係数補正部8は、LP
C分析部8が算出した線形予測係数(フィルタ係数)に
1以下の正数値を乗算してフィルタ係数を補正する。そ
して、LPC係数補正部8は補正後のフィルタ係数を符
号送信部16へ通知する。
The synthesis filter 7c performs a filtering process using the linear prediction coefficient as a filter coefficient on the excitation signal input from the driving sound source 7b. Error minimizing unit 7d
Compares the decoded signal output from the synthesizing filter 7c with the input waveform signal, and obtains the optimum index information and the gain of the waveform pattern to minimize the error between the two, the adaptive codebook 70a and the noise code. Notify the book 71a.
Then, each codebook updates the registered content and the gain based on the index information and the gain notified from the error minimizing unit 7d, and notifies the code transmitting unit 16 of the updated index information. Furthermore, the LPC coefficient correction unit 8
The linear prediction coefficient (filter coefficient) calculated by the C analysis unit 8 is multiplied by a positive value of 1 or less to correct the filter coefficient. Then, the LPC coefficient correction unit 8 notifies the code transmission unit 16 of the corrected filter coefficient.

【0072】符号送信部16は、音声符号器B(7)か
ら通知されたインデックス情報及びパワー情報と、LP
C係数補正部8から通知されたフィルタ係数とを受信側
へ通知する。
The code transmitting unit 16 receives the index information and the power information notified from the speech coder B (7) and LP.
The filter coefficient notified from the C coefficient correction unit 8 is notified to the receiving side.

【0073】これにより、受信側では、補正されたフィ
ルタ係数を用いて復号処理を行うことにより、合成フィ
ルタのスペクトルをフラットな特性とすることができ、
雑音区間の波形を不自然に復号化することを防止するこ
とができる。
As a result, on the receiving side, the spectrum of the synthesis filter can be made to have a flat characteristic by performing the decoding process using the corrected filter coefficient.
It is possible to prevent the waveform in the noise section from being unnaturally decoded.

【0074】以上、本実施例2によれば、雑音区間の復
号化処理を行う際に、合成フィルタのスペクトルをフラ
ットな特性にすることができ、雑音区間の周波数特性を
不自然にせず、聴覚的にも耳障りな雑音を抑制すること
ができる。
As described above, according to the second embodiment, when decoding the noise section, the spectrum of the synthesis filter can be made to have a flat characteristic, the frequency characteristic of the noise section is not unnatural, and the auditory sense is heard. The noise that is offensive to the ear can be suppressed.

【0075】<実施例3>以下に、本発明の第3の実施
例について図面に沿って説明する。図7に、本実施例3
における音声符号器Bの内部構成を示す。
<Third Embodiment> A third embodiment of the present invention will be described below with reference to the drawings. FIG. 7 shows the third embodiment.
3 shows the internal configuration of the speech coder B in FIG.

【0076】同図において、音声符号器B(7)は、前
述の実施例2の音声符号器B(7)に対して、適応符号
帳70a、雑音符号帳71a、駆動音源7b、合成フィ
ルタ7c、LPC分析部7e、及び誤差最少化部7dを
備えている。さらに、音声符号器B(7)には、符号送
信部16が接続されている。
In the figure, the speech coder B (7) is different from the speech coder B (7) of the second embodiment described above in the adaptive codebook 70a, the noise codebook 71a, the driving sound source 7b, and the synthesis filter 7c. , LPC analysis unit 7e, and error minimization unit 7d. Further, the code transmitter 16 is connected to the voice encoder B (7).

【0077】符号送信部16は、雑音区間のみを含む雑
音区間の符号化信号を送信する際に、適応符号帳70a
のインデックス情報として”0”を送信する機能を有し
ている。その他の構成及び機能は、前述の実施例2と同
様であり説明は、省略する。
The code transmitting section 16 transmits the adaptive codebook 70a when transmitting the coded signal in the noise section including only the noise section.
It has a function of transmitting "0" as the index information of. Other configurations and functions are similar to those of the above-described second embodiment, and description thereof will be omitted.

【0078】図8は、図7の音声符号器B(7)に対応
する音声復号器B(3)の構成を示すブロック図であ
る。音声復号器B(3)は、前述の実施例1の構成に対
して、適応符号帳30a、雑音符号帳31a、駆動音源
3b、合成フィルタ3c、及び適応ポストフィルタ17
を備えている。
FIG. 8 is a block diagram showing a configuration of a speech decoder B (3) corresponding to the speech encoder B (7) of FIG. The speech decoder B (3) has an adaptive codebook 30a, a noise codebook 31a, a driving excitation 3b, a synthesizing filter 3c, and an adaptive postfilter 17 in addition to the configuration of the first embodiment.
Is equipped with.

【0079】適応ポストフィルタ17は、波形の周期を
変更せずに振幅値を増幅させる機能を有している。ま
た、適応符号帳30aは、送信側から適応符号帳30a
のインデックス情報”0”を受信すると、適応符号帳3
0aのゲインを”0”とする。これにより、雑音区間の
波形信号が入力されると、雑音符号帳31aのインデッ
クス情報に基づいて雑音符号帳31aを検索し、該当す
る波形パターンを読み出す機能を有している。さらに、
適応ポストフィルタ17は、雑音区間の波形信号が入力
されると、この波形信号に対して何も処理を行わずに通
過させる。
The adaptive post filter 17 has a function of amplifying the amplitude value without changing the cycle of the waveform. Further, the adaptive codebook 30a is transmitted from the transmitting side by the adaptive codebook 30a.
When the index information “0” is received, the adaptive codebook 3
The gain of 0a is set to "0". Thus, when the waveform signal in the noise section is input, it has a function of searching the noise codebook 31a based on the index information of the noise codebook 31a and reading the corresponding waveform pattern. further,
When the waveform signal in the noise section is input, the adaptive post filter 17 passes the waveform signal without performing any processing.

【0080】本実施例3によれば、周期性の無い雑音波
形を雑音符号帳で符号化及び復号化することにより、復
号処理時には周期性の無いフラットな特性の雑音信号に
不自然な周期性を付加することなく、聴覚的に自然な波
形信号へ復号化することができる。
According to the third embodiment, the noise waveform having no periodicity is encoded and decoded by the noise codebook, so that the noise signal having a flat characteristic having no periodicity causes unnatural periodicity during the decoding process. Can be decoded into a waveform signal that is acoustically natural without adding.

【0081】<実施例4>図9に、本実施例4における
符号化器Bの構成を示す。符号化器B(7)は、適応符
号帳分析部18、雑音符号帳分析部19、駆動音源生成
部20、開ループピッチ分析部21を備えている。
<Fourth Embodiment> FIG. 9 shows the configuration of an encoder B according to the fourth embodiment. The encoder B (7) includes an adaptive codebook analysis unit 18, a noise codebook analysis unit 19, a driving excitation generation unit 20, and an open loop pitch analysis unit 21.

【0082】適応符号帳分析部18は、雑音符号帳71
aから検出された波形信号に対して、長期予測合成フィ
ルタ72でフィルタリング処理を行い、波形信号のピッ
チ周期を算出する閉ループ処理を行う機能を有している
(図10参照)。
The adaptive codebook analysis unit 18 uses the random codebook 71.
The waveform signal detected from a has a function of performing a filtering process by the long-term prediction synthesis filter 72 and performing a closed loop process of calculating the pitch period of the waveform signal (see FIG. 10).

【0083】一方、開ループピッチ分析部21は、音声
波形に雑音波形が重畳した雑音重畳区間を符号化する際
に起動されるものであり、短期予測逆フィルタ11、ロ
ーパスフィルタLPF12、自己相関検出部13b、相
関最大値検出部13c、及び遅延部13aとを備えてい
る(図11参照)。
On the other hand, the open loop pitch analysis section 21 is activated when encoding a noise superposed section in which a noise waveform is superposed on a speech waveform, and the short-term prediction inverse filter 11, low-pass filter LPF 12 and autocorrelation detection are performed. It includes a unit 13b, a maximum correlation value detection unit 13c, and a delay unit 13a (see FIG. 11).

【0084】短期予測逆フィルタ11は、波形信号の線
形予測係数をフィルタ係数とした逆フィルタリング処理
を行い、予測残差信号を出力する機能を有している。ロ
ーパスフィルタLPF12は、予測残差信号から雑音部
分の波形を除去する機能を有している。
The short-term prediction inverse filter 11 has a function of performing an inverse filtering process using a linear prediction coefficient of a waveform signal as a filter coefficient and outputting a prediction residual signal. The low-pass filter LPF12 has a function of removing the waveform of the noise part from the prediction residual signal.

【0085】遅延部13aは、予測残差信号の周期を、
特定周期ずつずらしていく機能を有している。自己相関
検出部13bは、元の予測残差信号と遅延部13aが特
定周期分ずらした予測残差信号との相関値を検出する機
能を有している。
The delay unit 13a changes the cycle of the prediction residual signal to
It has the function of shifting by a specific period. The autocorrelation detection unit 13b has a function of detecting the correlation value between the original prediction residual signal and the prediction residual signal shifted by the delay unit 13a by the specific period.

【0086】相関最大値検出部13cは、遅延部13a
が特定周期ずつずらしていき、最も相関が大きい遅延量
(周期)を検出する機能を有している。この遅延量は、
ピッチ周期として駆動音源7bへ通知される。そして、
駆動音源7bは、このピッチ周期に基づいて適用符号帳
70aから読み出された波形パターンを励起する。
The maximum correlation value detector 13c includes a delay unit 13a.
Has a function of detecting the amount of delay (cycle) having the largest correlation by shifting by a specific cycle. This delay is
The driving sound source 7b is notified of the pitch cycle. And
The driving sound source 7b excites the waveform pattern read from the applied codebook 70a based on this pitch period.

【0087】以上、本実施例4によれば、雑音が重畳し
た音声波形のピッチ周期を正確に検出することができ、
雑音の有無に左右されない質の高い符号化処理を行うこ
とができ、再生音声の品質を向上させることができる。
As described above, according to the fourth embodiment, the pitch period of the voice waveform on which noise is superimposed can be detected accurately,
It is possible to perform high-quality coding processing that is not affected by the presence or absence of noise, and improve the quality of reproduced speech.

【0088】[0088]

【発明の効果】本発明によれば、周波数特性の変化が少
ない雑音に、不自然な周波数特性が付加することを防止
し、再生時の違和感を低下させることができる。
According to the present invention, it is possible to prevent unnatural frequency characteristics from being added to noise with a small change in frequency characteristics, and to reduce discomfort during reproduction.

【0089】さらに、音声に雑音が重畳した信号を符号
化する際に、雑音成分を除去して正確なピッチ周期を検
出することにより、質の高い符号化を行える。従って、
本発明によれば、携帯電話や自動車電話等の移動通信シ
ステムの音声の品質向上に寄与することができる。
Furthermore, when encoding a signal in which noise is superimposed on speech, a noise component is removed and an accurate pitch period is detected, so that high-quality encoding can be performed. Therefore,
According to the present invention, it is possible to contribute to the improvement of voice quality in mobile communication systems such as mobile phones and car phones.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の原理図(1)FIG. 1 is a principle diagram of the present invention (1)

【図2】本発明の原理図(2)FIG. 2 is a principle diagram of the present invention (2)

【図3】実施例1における音声復号化システムの概略構
成図
FIG. 3 is a schematic configuration diagram of a speech decoding system according to the first embodiment.

【図4】音声復号器Bの内部構成ブロック図FIG. 4 is a block diagram of an internal configuration of a speech decoder B.

【図5】実施例2における音声符号化システムの概略構
成図
FIG. 5 is a schematic configuration diagram of a speech encoding system according to a second embodiment.

【図6】音声符号器Bの内部構成ブロック図FIG. 6 is a block diagram of an internal configuration of a speech coder B.

【図7】実施例3における音声符号器Bの内部構成ブロ
ック図
FIG. 7 is a block diagram of the internal configuration of a speech coder B according to the third embodiment.

【図8】実施例3における音声復号器Bの内部構成ブロ
ック図
FIG. 8 is a block diagram of the internal configuration of a speech decoder B according to the third embodiment.

【図9】実施例4における音声符号化システムの概略構
成図
FIG. 9 is a schematic configuration diagram of a speech encoding system according to a fourth embodiment.

【図10】適応符号帳分析部の内部構成を示すブロック
FIG. 10 is a block diagram showing an internal configuration of an adaptive codebook analysis unit.

【図11】開ループ分析部の内部構成ブロック図FIG. 11 is an internal configuration block diagram of an open loop analysis unit.

【図12】合成フィルタの周波数特性を示すスペクトルFIG. 12 is a spectrum showing frequency characteristics of a synthesis filter.

【図13】空調音の源音のスペクトルを示す図FIG. 13 is a diagram showing a spectrum of a source sound of an air conditioning sound.

【図14】空調音の再生音のスペクトルを示す図FIG. 14 is a diagram showing a spectrum of a reproduced sound of an air conditioning sound.

【図15】合成フィルタの周波数特性を示すスペクトルFIG. 15 is a spectrum showing frequency characteristics of a synthesis filter.

【符号の説明】[Explanation of symbols]

1・・雑音重畳区間検出手段 2・・音声復号化手段 3・・雑音復号化手段 3a・・符号帳 3b・・駆動音源 3c・・合成フィルタ 4・・雑音制御手段(LPC係数補正部) 5・・雑音重畳区間検出手段(雑音重畳検出判定器) 6・・音声符号化手段 7・・雑音符号化手段 7b・・駆動音源 7c・・合成フィルタ 7d・・誤差最少化部 7e・・LPC分析部 8・・制御情報生成手段(LPC係数補正部) 9・・ポストフィルタ 10・・雑音重畳区間検出手段 11・・逆フィルタ手段(短期予測逆フィルタ) 12・・雑音除去手段(ローパスフィルタLPF) 13・・ピッチ周期検出手段 13a・・遅延部 13b・・自己相関検出部 13c・・相関最大値検出部 14・・音声符号化手段 15・・受信符号分離部 16・・符号送信部 17・・適応ポストフィルタ 18・・適応符号帳分析部 19・・雑音符号帳分析部 20・・駆動音源生成部 21・・開ループピッチ分析部 30a・・適応符号帳 31a・・雑音符号帳 70a・・適応符号帳 71a・・雑音符号帳 72・・長期予測合成フィルタ 1 .. Noise superimposition section detection means ..Voice decoding means 3 ... Noise decoding means 3a ... Code book 3b ... Drive sound source 3c ... Synthesis filter 4. Noise control means (LPC coefficient correction unit) 5..Noise superposition section detection means (noise superposition detection judgment device) 6 ... Speech coding means 7 .. Noise coding means 7b ... Drive sound source 7c ... Synthesis filter 7d ... error minimization section 7e ... LPC analysis unit 8 ... Control information generation means (LPC coefficient correction unit) 9 ... Post filter ..Noise-superimposed section detection means 11. Inverse filter means (short-term predictive inverse filter) ..Noise removing means (low-pass filter LPF) ..Pitch cycle detection means 13a ... Delay unit 13b ... Auto-correlation detector 13c ... Correlation maximum value detection unit ..Voice coding means 15 ... Reception code separation unit 16 ... Code transmitter 17 ... Adaptive post filter 18 ... Adaptive codebook analysis unit 19-Noise codebook analysis unit 20. Drive source generator 21 ... Open loop pitch analysis section 30a ... Adaptive codebook 31a ... Noise codebook 70a ... Adaptive codebook 71a ... Noise codebook 72 ... Long-term prediction synthesis filter

───────────────────────────────────────────────────── フロントページの続き (72)発明者 佐藤 知紀 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 (72)発明者 木村 壽成 福岡県福岡市博多区博多駅前三丁目22番8 号 富士通九州ディジタル・テクノロジ株 式会社内 Fターム(参考) 5D045 CC02 CC07 5K067 AA24 BB03 BB04 BB21 DD45 EE02 EE10 EE16 FF16 FF25 FF26 GG01 GG11 HH22 HH23 HH24 KK13 KK15    ─────────────────────────────────────────────────── ─── Continued front page    (72) Inventor Tomoki Sato             4-1, Kamiodanaka, Nakahara-ku, Kawasaki-shi, Kanagawa             No. 1 within Fujitsu Limited (72) Inventor Tosei Kimura             3-22-8, Hakata Station, Hakata-ku, Fukuoka City, Fukuoka Prefecture             Issue Fujitsu Kyushu Digital Technology Co., Ltd.             Inside the company F-term (reference) 5D045 CC02 CC07                 5K067 AA24 BB03 BB04 BB21 DD45                       EE02 EE10 EE16 FF16 FF25                       FF26 GG01 GG11 HH22 HH23                       HH24 KK13 KK15

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 送話器から入力される信号が音声区間の
信号であるか、あるいは雑音区間の信号であるかを判定
する雑音重畳区間検出手段と、 該音声区間の信号を符号化する音声符号器Aと、 該雑音区間の信号を符号化する音声符号器Bとを設け、 該雑音重畳区間検出手段が雑音区間を判定した場合に、
この雑音区間の復号化処理にかかる制御情報を決定し、
この制御情報を送信することを特徴とする音声符号化装
置。
1. A noise superposed section detection means for determining whether a signal input from a transmitter is a signal in a voice section or a signal in a noise section, and a voice for encoding the signal in the voice section. An encoder A and a speech encoder B for encoding a signal in the noise section are provided, and when the noise superposed section detection means determines the noise section,
Determine the control information for the decoding process of this noise interval,
A speech coder that transmits this control information.
【請求項2】 前記制御情報は、受信側の復号化処理に
使用される合成フィルタのフィルタ係数であることを特
徴とする請求項1記載の音声符号化装置。
2. The speech coding apparatus according to claim 1, wherein the control information is a filter coefficient of a synthesizing filter used for decoding processing on the receiving side.
【請求項3】 前記制御情報は、受信側の復号化処理に
使用される合成フィルタのフィルタ係数に乗算すべき1
以下の正数値であることを特徴とする請求項1記載の音
声符号化装置。
3. The control information should be multiplied by 1 to a filter coefficient of a synthesis filter used in a decoding process on the receiving side.
The speech encoding device according to claim 1, wherein the following positive values are set.
【請求項4】 前記制御情報は、受信側の復号化処理に
使用される合成フィルタのフィルタ係数に乗算すべき1
以下の正数値であり、前記制御情報生成手段は、前記雑
音区間の周波数特性に基づいて、前記正数値を決定する
ことを特徴とする請求項1記載の音声符号化装置。
4. The control information is 1 to be multiplied by a filter coefficient of a synthesis filter used for decoding processing on the receiving side.
The audio encoding device according to claim 1, wherein the control information generating unit determines the positive value based on a frequency characteristic of the noise section, which is the following positive value.
【請求項5】 送話器から入力される信号が音声区間の
信号であるか、あるいは雑音区間の信号であるかを判定
するステップと、 該音声区間の信号を符号化するステップと、 該雑音区間の信号を符号化するステップと、 該判定するステップで雑音区間を判定した場合に、この
雑音区間の復号化処理にかかる制御情報を決定し、この
制御情報を送信するステップとを有することを特徴とす
る音声符号化方法。
5. A step of determining whether a signal input from a transmitter is a signal in a voice section or a signal in a noise section, a step of encoding a signal in the voice section, and the noise And a step of encoding a signal in a section, and determining a control information related to a decoding process of the noise section when the noise section is determined in the determining step and transmitting the control information. Characteristic speech coding method.
【請求項6】 前記制御情報は、受信側の復号化処理に
使用される合成フィルタのフィルタ係数であることを特
徴とする請求項5記載の音声符号化方法。
6. The speech coding method according to claim 5, wherein the control information is a filter coefficient of a synthesis filter used for decoding processing on the receiving side.
【請求項7】 前記制御情報は、受信側の復号化処理に
使用される合成フィルタのフィルタ係数に乗算すべき1
以下の正数値であることを特徴とする請求項5記載の音
声符号化方法。
7. The control information is 1 to be multiplied by a filter coefficient of a synthesis filter used for decoding processing on the receiving side.
The audio encoding method according to claim 5, wherein the following positive values are used.
【請求項8】 前記制御情報は、受信側の復号化処理に
使用される合成フィルタのフィルタ係数に乗算すべき1
以下の正数値であり、 更に、前記雑音区間の周波数特性に基づいて、前記正数
値を決定するステップを含むことを特徴とする請求項5
記載の音声符号化方法。
8. The control information is 1 to be multiplied by a filter coefficient of a synthesis filter used for decoding processing on the receiving side.
6. The following positive value, further comprising the step of determining the positive value based on the frequency characteristic of the noise section.
The described speech coding method.
JP2002333491A 2002-11-18 2002-11-18 Audio coding apparatus and method Expired - Lifetime JP3571709B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002333491A JP3571709B2 (en) 2002-11-18 2002-11-18 Audio coding apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002333491A JP3571709B2 (en) 2002-11-18 2002-11-18 Audio coding apparatus and method

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP26573594A Division JP3568255B2 (en) 1994-10-28 1994-10-28 Audio coding apparatus and method

Publications (2)

Publication Number Publication Date
JP2003216196A true JP2003216196A (en) 2003-07-30
JP3571709B2 JP3571709B2 (en) 2004-09-29

Family

ID=27655826

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002333491A Expired - Lifetime JP3571709B2 (en) 2002-11-18 2002-11-18 Audio coding apparatus and method

Country Status (1)

Country Link
JP (1) JP3571709B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100733713B1 (en) 2005-08-17 2007-06-28 엘지전자 주식회사 A multi-party system and method for requires reduced computational amount

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100733713B1 (en) 2005-08-17 2007-06-28 엘지전자 주식회사 A multi-party system and method for requires reduced computational amount

Also Published As

Publication number Publication date
JP3571709B2 (en) 2004-09-29

Similar Documents

Publication Publication Date Title
JP3102015B2 (en) Audio decoding method
JP4275855B2 (en) Decoding method and system with adaptive postfilter
JP4218134B2 (en) Decoding apparatus and method, and program providing medium
RU2262748C2 (en) Multi-mode encoding device
US7529664B2 (en) Signal decomposition of voiced speech for CELP speech coding
JP3483891B2 (en) Speech coder
JP5226777B2 (en) Recovery of hidden data embedded in audio signals
JP3522012B2 (en) Code Excited Linear Prediction Encoder
JP3568255B2 (en) Audio coding apparatus and method
US20080297380A1 (en) Signal decoding apparatus and signal decoding method
JP4464488B2 (en) Speech decoding apparatus, code error compensation method, speech decoding method
US6047253A (en) Method and apparatus for encoding/decoding voiced speech based on pitch intensity of input speech signal
JPH06202696A (en) Speech decoding device
JP5027966B2 (en) Articles of manufacture comprising a method and apparatus for vocoding an input signal and a medium having computer readable signals therefor
WO2004036551A1 (en) Preprocessing of digital audio data for mobile audio codecs
US20130085751A1 (en) Voice communication system encoding and decoding voice and non-voice information
JP2018511086A (en) Audio encoder and method for encoding an audio signal
JPWO2007043643A1 (en) Speech coding apparatus, speech decoding apparatus, speech coding method, and speech decoding method
EP1544848B1 (en) Audio enhancement in coded domain
JP3936370B2 (en) Speech decoding apparatus and method
JP3571709B2 (en) Audio coding apparatus and method
JP3660676B2 (en) Speech coding apparatus and method
JP3817562B2 (en) Speech decoding apparatus and method
JP3936369B2 (en) Speech decoding apparatus and method
JP2003216197A (en) Speech decoding device and its method

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040615

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040624

R150 Certificate of patent (=grant) or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080702

Year of fee payment: 4

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090702

Year of fee payment: 5

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100702

Year of fee payment: 6

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100702

Year of fee payment: 6

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110702

Year of fee payment: 7

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110702

Year of fee payment: 7

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120702

Year of fee payment: 8

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120702

Year of fee payment: 8

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130702

Year of fee payment: 9

EXPY Cancellation because of completion of term