JP3464371B2 - Improved method of generating comfort noise during discontinuous transmission - Google Patents

Improved method of generating comfort noise during discontinuous transmission

Info

Publication number
JP3464371B2
JP3464371B2 JP31395797A JP31395797A JP3464371B2 JP 3464371 B2 JP3464371 B2 JP 3464371B2 JP 31395797 A JP31395797 A JP 31395797A JP 31395797 A JP31395797 A JP 31395797A JP 3464371 B2 JP3464371 B2 JP 3464371B2
Authority
JP
Japan
Prior art keywords
speech coding
frame
parameter
distance
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP31395797A
Other languages
Japanese (ja)
Other versions
JPH10190498A (en
Inventor
ヤルビネン カリ
カパネン ペッカ
ルオッピラ ベサ
ロトラ−プッキラ ヤニ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Mobile Phones Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Mobile Phones Ltd filed Critical Nokia Mobile Phones Ltd
Publication of JPH10190498A publication Critical patent/JPH10190498A/en
Application granted granted Critical
Publication of JP3464371B2 publication Critical patent/JP3464371B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Noise Elimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a method that generates comfortable noise (CN) in a mobile terminal in a non-contiguous transmission (DTX) system. SOLUTION: This method for generating comfortable noise is to make the frequency characteristic of the comfortable noise close to actual background noise by making a random exciting signal pass through a spectrum controlled filter. In the form of other execution, a sending end identifies a voice coded parameter that does not satisfactorily represent actual background noise, and when such voice coded parameters are detected, the parameters are replaced with a mean value. In this method, an balancing operation is not disturbed by a faulty parameter.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は音声通信技術一般に
関するものであり、特に不連続送信(DTX)方式に関
し、不連続送信における快適化雑音(CN)の改善に関
する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates generally to voice communication technology, and more particularly to discontinuous transmission (DTX) system, and improvement of comfort noise (CN) in discontinuous transmission.

【0002】[0002]

【従来の技術および発明が解決しようとする課題】移動
通信システムにおいては、会話音声が一時的に途絶えて
いる間は、無線送信機を切断する不連続送信方式が用い
られている。このような不連続送信方式を用いることに
よって、移動局の消費電力を低減することができ、従っ
て、バッテリーの再充電間隔を長くすることができる。
さらに、不連続送信方式を用いると、一般に通信妨害レ
ベルが低下するので、通信品質が改善される。
2. Description of the Related Art In a mobile communication system, a discontinuous transmission system is used in which a radio transmitter is disconnected while conversation voice is temporarily interrupted. By using such a discontinuous transmission method, the power consumption of the mobile station can be reduced, and thus the recharging interval of the battery can be lengthened.
Further, the use of the discontinuous transmission method generally improves the communication quality because the communication interference level is lowered.

【0003】しかしながら、チャネルを完全に切断して
しまうと、音声信号に含まれて送信されていた背景雑音
も送信休止期間中において切断されてしまうので、受信
側においては不自然な音声信号(無信号状態)として感
じられる。
However, if the channel is completely cut off, the background noise included in the voice signal and transmitted is also cut off during the transmission pause period, so that the receiving side has an unnatural voice signal (no Signal condition).

【0004】この問題を解決する従来知られている方法
の一つとして、送信休止期間において送信を完全に切断
せずに、背景雑音の特徴パラメータを抽出し、これを無
声記述子(SID)フレームを用いて低送信速度で無線
送信する方法が知られている。受信側では、このパラメ
ータを用いて、送信側で実際に存在する背景雑音のスペ
クトル的および時間的実体をなるべく忠実に反映するよ
うに、背景雑音を再生する。このような背景雑音を特徴
づけるパラメータは快適化雑音(CN)パラメータと呼
ばれる。快適化雑音パラメータは通常は、音声符号化パ
ラメータの部分集合、特に、合成フィルタ係数および利
得パラメータを含んでいる。
As one of the conventionally known methods for solving this problem, the characteristic parameter of the background noise is extracted without completely disconnecting the transmission during the transmission pause period, and this is extracted as a silent descriptor (SID) frame. There is known a method of wirelessly transmitting at a low transmission rate using. On the receiving side, this parameter is used to reproduce the background noise so as to reflect the spectral and temporal substance of the background noise actually existing on the transmitting side as faithfully as possible. The parameter that characterizes such background noise is called the comfort noise (CN) parameter. The comfort noise parameters typically include a subset of speech coding parameters, in particular synthesis filter coefficients and gain parameters.

【0005】ある音声コーデックにおける快適化雑音算
定方法では、快適化雑音係数の一部のみが音声符号化パ
ラメータから抽出され、他の快適化雑音パラメータは、
例えば、音声符号器においては存在するが無線送信はさ
れない信号から抽出される。
In the comfort noise calculation method in a certain speech codec, only a part of the comfort noise coefficient is extracted from the speech coding parameters, and the other comfort noise parameters are
For example, it is extracted from the signal that is present in the speech coder but not transmitted wirelessly.

【0006】従来の不連続送信方式においては、平坦な
スペクトルを有する雑音(すなわち白色雑音)を用いて
励起信号を十分良好に近似することができると仮定され
ている。すなわち、従来の不連続送信方式においては、
快適化雑音は、局所的に発生させられた平坦なスペクト
ル特性を有する雑音を音声符号器合成フィルタを通すこ
とによって発生させられる。しかしながら実際には、こ
のような白色雑音を用いた方法では、高品質な快適化雑
音を生成することができない。その理由は、理想的な快
適化雑音のスペクトルは平坦ではなく、やや傾いたスペ
クトル特性を有しているか、あるいは場合によっては平
坦スペクトル特性からかなり著しくずれたスペクトル特
性を有するからである。背景雑音の種類にもよるが、最
適な快適化雑音のスペクトルは、例えば、低域通過型あ
るいは高域通過型の特性を有している。すなわち、従来
用いられている不規則励起(ランダム励起)信号(白色
雑音)は、最適化された望ましい雑音励起からずれがあ
り、そのため、受信側で発生した快適化雑音は、送信側
の背景雑音とは異なっているように認識される。例え
ば、発生した快適化雑音は、望ましい快適化雑音より
も、かなり「華々しい」感じになったり、あるいは逆に
「暗い」感じになってしまったりする。不連続送信にお
いては、背景雑音のスペクトルが、送信中(音声符号化
が行われている期間)と送信中断中(快適化雑音が発生
している期間)とで差異が生じる。このような背景雑音
の変化は、ユーザに通信品質の劣化として感じられる。
In conventional discontinuous transmission schemes, it is assumed that noise with a flat spectrum (ie white noise) can be used to approximate the excitation signal sufficiently well. That is, in the conventional discontinuous transmission method,
Comfort noise is generated by passing locally generated noise with flat spectral characteristics through a speech coder synthesis filter. However, in practice, such a method using white noise cannot generate high-quality comfort noise. The reason is that the spectrum of the ideal comfort noise is not flat and has a slightly tilted spectral characteristic or, in some cases, a spectral characteristic that deviates significantly from the flat spectral characteristic. Although depending on the type of background noise, the optimum comfort noise spectrum has, for example, a low-pass type or a high-pass type characteristic. That is, the conventionally used random excitation (random excitation) signal (white noise) deviates from the optimized desired noise excitation, so that the comfort noise generated on the receiving side is the background noise on the transmitting side. Is recognized as different from. For example, the comfort noise generated may be much more "brilliant" than the desired comfort noise, or vice versa. In discontinuous transmission, the background noise spectrum differs between during transmission (a period during which voice coding is performed) and during transmission interruption (a period during which comfort noise is generated). Such a change in background noise is perceived by the user as a deterioration in communication quality.

【0007】GSMシステムにおける全速(FR)、半
速(HR)、拡張全速(EFR)音声チャネルなどの、
音声符号化システムにおいては、快適化雑音パラメータ
の送信は低速度で行われる。例えば、FRおよびFER
チャネルにおいては、快適化雑音パラメータの送信速度
は、24フレームごとに一度(すなわち480ミリ秒ご
とに一回)であり、非常に低速である。すなわち、快適
化雑音パラメータは、1秒間にたった2回更新されるに
過ぎない。このように送信速度が低速であるために、背
景雑音のスペクトル特性あるいは時間的特性を十分に正
確に表現することができず、従って、不連続送信方式に
おいては、背景雑音の品質が必然的に劣化する。
[0007] Full speed (FR), half speed (HR), enhanced full speed (EFR) voice channels, etc. in GSM systems,
In a speech coding system, the comfort noise parameter transmission is slow. For example, FR and FER
In the channel, the comfort noise parameter transmission rate is once every 24 frames (ie once every 480 ms), which is very slow. That is, the comfort noise parameter is updated only twice per second. Since the transmission speed is low as described above, the spectral characteristics or temporal characteristics of the background noise cannot be expressed sufficiently accurately. Therefore, in the discontinuous transmission system, the quality of the background noise is inevitable. to degrade.

【0008】GSMなどのディジタルセルラーシステム
における不連続送信において発生する他の問題は音声バ
ーストの後の送信が実際に終了する前に、いくつかの音
声フレームがハングオーバすることと係わっている。音
声バーストが、ある閾値よりも低い場合には、音声バー
ストは背景雑音であると解釈され、この場合には、音声
バーストの後にハングオーバ期間が発生することはな
い。ハングオーバ期間は、送信を終了する前に、送信側
から受信側に対して快適化雑音パラメータメッセージ
(無声記述子(SID)フレーム)として送るべき、送
信側の背景雑音の評価特性値を算出するのに用いられ
る。上述したように、受信側では、この送信されてきた
背景雑音評価特性値を用いて、送信終了時において送信
側に存在していた背景雑音と類似の特性を有する快適化
雑音が発生する。
Another problem that occurs in discontinuous transmissions in digital cellular systems such as GSM is related to the hangover of some voice frames before the transmission actually ends after a voice burst. If the voice burst is below a certain threshold, the voice burst is interpreted as background noise, in which case there is no hangover period following the voice burst. The hangover period is to calculate the evaluation characteristic value of the background noise of the transmitting side, which should be sent from the transmitting side to the receiving side as a comfort noise parameter message (unvoiced descriptor (SID) frame) before the transmission is finished. Used for. As described above, the receiving side uses the transmitted background noise evaluation characteristic value to generate comfort noise having characteristics similar to the background noise existing on the transmitting side at the end of transmission.

【0009】GSM FRあるいはHRに類似の既知の
不連続送信方式においては、快適化雑音量子化は、非予
測方式によって行われる。従って、受信側では、音声バ
ーストの最後にハングオーバ期間が存在するかどうかを
知る必要がない。しかしながら、GSM EFRの場合
では、効率的な予測快適化雑音量子化方式が採用されて
おり、そのため、受信側において快適化雑音逆量子化を
行うにあたって、ハングオーバ期間が存在するかどうか
を判定する必要があり、そのためのプログラム命令を実
行するのにいくらかの計算負荷が費やされる。
In the known discontinuous transmission schemes similar to GSM FR or HR, comfort noise quantization is performed by a non-predictive scheme. Therefore, the receiver does not need to know if there is a hangover period at the end of the voice burst. However, in the case of GSM EFR, an efficient predictive comfort noise quantization method is adopted. Therefore, when performing comfort noise inverse quantization on the receiving side, it is necessary to determine whether or not a hangover period exists. , And some computational load is spent executing the program instructions for it.

【0010】送信側の背景雑音が一定ではなく、かなり
変動するような場合にはさらに以下のような問題が発生
する。すなわち、このような状況においては、平均化期
間のフレームのうちの1つあるいはいくつかのフレーム
の音声符号化パラメータの一部あるいはすべてのパラメ
ータが平均的な背景雑音を正しく表していないことが起
こる。同様の問題が、会話音声の最後が無声音である
と、音声状態検出(VAD)アルゴリズムによって判定
された場合、あるいは一定背景雑音が強いインパルス状
の雑音バーストを含む場合において発生する。既存の不
連続送信方式においては、平均化期間が短いので、上記
のような不適切な音声符号化パラメータが発生すると、
平均化処理の結果が著しく変わり、平均化された快適化
雑音パラメータは背景雑音の特徴を正確に表さなくな
る。そのため、快適化雑音と実際の背景雑音との間で、
レベルまたはスペクトルあるいはこれらの両方において
差異が生じる。従って、実際に通話が行われている期間
(音声と背景雑音が通常の方法で符号化される期間)
と、通話が中断されている期間(この期間の背景雑音は
快適化雑音によって生成される)との間で背景雑音が変
化したようにユーザが感じてしまい、これが通信品質を
損なうこととなる。
If the background noise on the transmitting side is not constant but fluctuates considerably, the following problems will occur. That is, in such a situation, it may happen that some or all of the speech coding parameters of one or some of the frames of the averaging period do not correctly represent the average background noise. . A similar problem occurs when the end of speech is unvoiced, as determined by the voice state detection (VAD) algorithm, or when the constant background noise contains a strong impulse-like noise burst. In the existing discontinuous transmission method, since the averaging period is short, if an inappropriate voice coding parameter as described above occurs,
The results of the averaging process change significantly, and the averaged comfort noise parameters no longer accurately represent the background noise features. So between the comfort noise and the actual background noise,
Differences occur in levels and / or spectra. Therefore, the period during which the call is actually being made (the period during which voice and background noise are coded in the usual way)
Then, the user feels as if the background noise has changed between the period during which the call is interrupted (the background noise during this period is generated by the comfort noise), which impairs the communication quality.

【0011】さらに具体的には、不連続送信ハングオー
バ期間において、音声状態判別アルゴリズムによって
「非音声フレーム」であると判定されたフレームが無線
送信される間に、最初の無声記述子フレームに対する快
適化雑音パラメータを算出するために用いられる音声符
号化パラメータが一時的に保存される。上記の最初の無
声記述子フレームは、不連続送信ハングオーバ期間が終
了すると直ちに送信される。不連続送信ハングオーバ期
間の長さは、平均化期間の長さによって定まる。従っ
て、システムのチャネルの使用を最小化するには、平均
化期間を比較的短い長さに固定しておく必要がある。
More specifically, during the discontinuous transmission hangover period, the comfort of the first unvoiced descriptor frame is improved while the frame determined by the voice state determination algorithm to be a "non-voice frame" is wirelessly transmitted. The speech coding parameters used to calculate the noise parameters are temporarily stored. The first unvoiced descriptor frame above is transmitted as soon as the discontinuous transmission hangover period expires. The length of the discontinuous transmission hangover period is determined by the length of the averaging period. Therefore, the averaging period should be fixed to a relatively short length in order to minimize system channel usage.

【0012】本発明について説明する前に、送信側にお
いて快適化雑音パラメータを発生させるのに従来用いら
れている回路と方法、および、受信側においてこれらの
パラメータに基づき快適化雑音を発生させるための回路
と方法について以下に説明する。まず、図1(a)〜1
(d)を参照する。
Prior to describing the present invention, the circuits and methods conventionally used to generate comfort noise parameters at the transmitter and the comfort noise generation at the receiver based on these parameters. The circuit and method are described below. First, FIGS. 1 (a) to 1
Reference is made to (d).

【0013】図1(a)において、線形予測符号化(L
PC)解析ブロック101によって、短期間スペクトル
パラメータ102が音声信号100から算出される。な
お、線形予測符号化(LPC)は当該技術においてよく
知られている技術である。ここでは簡単のため、合成フ
ィルタは短期間合成フィルタのみから成っているものと
仮定するが、GSM FR、EFR符号器などの、ほと
んどの従来のシステムにおいては、合成フィルタは、実
際には、短期間合成フィルタと長期間合成フィルタとを
直列接続して実現される。なお、長期間合成フィルタは
本発明を説明する上で必要ではない。また、従来の不連
続送信方式においては、快適化雑音を発生させる際には
長期間合成フィルタは通常は切断される。
In FIG. 1A, linear predictive coding (L
A PC) analysis block 101 calculates short-term spectrum parameters 102 from the audio signal 100. Note that linear predictive coding (LPC) is a technique well known in the art. For simplicity, it is assumed here that the synthesis filter consists only of short-term synthesis filters, but in most conventional systems such as GSM FR, EFR encoders, the synthesis filter is actually short-term. It is realized by connecting an inter-synthesis filter and a long-term synthesis filter in series. It should be noted that long term synthesis filters are not required to describe the invention. Further, in the conventional discontinuous transmission method, the synthesis filter is usually cut off for a long time when the comfort noise is generated.

【0014】LPC解析によって、各送信フレームごと
に、一組の短期間スペクトルパラメータ102が生成さ
れる。このときのフレーム長さはシステムによって異な
る。例えば、GSMチャネルでは、フレームサイズはす
べて20ミリ秒に設定されている。
The LPC analysis produces a set of short-term spectral parameters 102 for each transmitted frame. The frame length at this time differs depending on the system. For example, in the GSM channel, the frame sizes are all set to 20 ms.

【0015】音声信号は、逆フィルタ103を通され
て、ここで残差信号104が生成される。この逆フィル
タは以下に示す数式によって表現される特性を有してい
る。
The audio signal is passed through an inverse filter 103, where a residual signal 104 is produced. This inverse filter has the characteristic expressed by the following mathematical formula.

【0016】[0016]

【数11】 [Equation 11]

【0017】ここで、a(i)(i=1、・・・、M)
はフィルタ係数であり、線形予測符号化解析において生
成され、各フレームごとに更新される。フィルタパラメ
ータのフレーム間での変化がより滑らかになるように、
従来の音声符号化技術において用いられている内挿処理
が上記逆フィルタに適用されることもある。ここで逆フ
ィルタ103によって生成される残差信号104は、最
適励起信号であり、この信号を、受信側で、合成フィル
タ1/A(Z)112(図1(b))に通すことによっ
て、元の音声信号100が正確に復元される。励起利得
算出ブロック105によって、励起信号列のエネルギー
が測定され、スケーリング利得106が各送信フレーム
ごとに算出される。
Where a (i) (i = 1, ..., M)
Is a filter coefficient, which is generated in the linear predictive coding analysis and updated for each frame. To make the change of filter parameter between frames smoother,
The interpolation process used in the conventional speech coding technique may be applied to the inverse filter. The residual signal 104 generated here by the inverse filter 103 is the optimum excitation signal, and by passing this signal through the synthesis filter 1 / A (Z) 112 (FIG. 1 (b)) at the receiving side, The original audio signal 100 is accurately restored. The excitation gain calculation block 105 measures the energy of the excitation signal sequence and calculates the scaling gain 106 for each transmission frame.

【0018】数送信フレームにおける励起利得106と
短期間スペクトル係数102の平均から、背景雑音の平
均スペクトルと時間的特徴が抽出される。通常上記の平
均化処理は、GSM FRチャンネルの場合では4フレ
ームに対して行われ、一方GSM EFRチャネルの場
合には8フレームに対して行われる。平均化すべきパラ
メータはブロック107aおよび108a(図1(d)
を参照)に平均化期間の間バッファリング(一時的な記
憶)される。上記の平均化処理がブロック107および
108において行われ、背景雑音を特徴づける平均パラ
メータが発生する。ここで発生する平均パラメータとし
ては平均励起利得gmeanおよび平均短期間スペクトル係
数がある。最近の音声コーデックでは、一般に10個
(M=10)の短期間スペクトル係数が用いられ、これ
らは、GSM EFR不連続送信方式システムにおいて
行われいるように、ラインスペクトル対(LSP)係数
mean(i)(i=1、・・・、M)として表される。
これらのパラメータは、通常、送信される前に量子化さ
れるが、簡単のために、ここでは量子化についての説明
は省略する。なお、量子化は本発明の動作を理解する上
で本質的な部分ではない。
From the average of the excitation gain 106 and the short-term spectrum coefficient 102 in several transmission frames, the average background noise spectrum and temporal characteristics are extracted. Normally, the above averaging process is performed for 4 frames in the case of GSM FR channel, while it is performed for 8 frames in the case of GSM EFR channel. The parameters to be averaged are blocks 107a and 108a (FIG. 1 (d)).
Buffering (temporary storage) during the averaging period. The averaging process described above is performed in blocks 107 and 108 to generate an averaging parameter that characterizes the background noise. The average parameters generated here include the average excitation gain g mean and the average short-term spectrum coefficient. Modern speech codecs typically use 10 (M = 10) short-term spectral coefficients, which are line spectrum pair (LSP) coefficients f mean (as is done in GSM EFR discontinuous transmission system. i) (i = 1, ..., M).
These parameters are usually quantized before being transmitted, but for simplicity, the description of the quantization is omitted here. Note that the quantization is not an essential part for understanding the operation of the present invention.

【0019】図1(d)に示されているように、平均化
ブロック107および108はそれぞれバッファ107
a、108aを有し、これらのバッファを介して信号1
07b、108bが入力されるようになされている。バ
ッファ107aおよび108aについては、図4および
図5を参照しながら本発明について説明する際にさらに
詳細に述べる。
As shown in FIG. 1D, the averaging blocks 107 and 108 are respectively buffers 107.
a, 108a and through these buffers the signal 1
07b and 108b are input. Buffers 107a and 108a will be described in more detail when describing the present invention with reference to FIGS.

【0020】快適化雑音パラメータの算出および平均化
については、GSM推奨基準:GSM06.62「拡張
全速度(EFR)音声トラフィックチャネルにおける快
適化雑音の特徴」において詳細に記述されている。ま
た、不連続送信方式については、GSM推奨基準GSM
06.81「拡張全速度(EFR)音声トラフィックチ
ャネルにおける不連続送信(DTX)方式」に説明され
ており、また、音声状態検出(VAD)については、G
SM推奨基準GSM06.82「拡張全速度(EFR)
音声チャネルにおける音声状態検出(VAD)」に説明
されている。従って、これらの様々な機能についてはこ
こでは説明を省略する。
The calculation and averaging of comfort noise parameters is described in detail in the GSM Recommendation Criteria: GSM06.62 "Features of Comfort Noise in Enhanced Full Rate (EFR) Voice Traffic Channels". Regarding discontinuous transmission method, GSM recommended standard GSM
06.81 “Discontinuous Transmission (DTX) Scheme on Enhanced Full Rate (EFR) Voice Traffic Channels” and for voice condition detection (VAD), see G.
SM Recommended Standard GSM06.82 "Extended Full Speed (EFR)"
Voice State Detection (VAD) on Voice Channels ". Therefore, description of these various functions is omitted here.

【0021】図1(b)は、従来の音声通信システムに
おいて、受信側において快適化雑音を発生させるのに用
いられる従来の復号器を表すブロック図である。復号器
は、平均励起利得gmeanおよび一組の短期間スペクトル
係数fmean(i)(i=1、・・・、M)の2つの快適
化雑音パラメータを受信し、これらのパラメータに基づ
いて快適化雑音が発生する。受信側における快適化雑音
発生の動作は、かなり低速度でパラメータが用いられる
こと(例えばGSM FRおよびGSM EFRチャネ
ルにおいては480ミリ秒に一回)、および音声符号器
からの励起信号がないことを除いて音声復号動作と同じ
である。音声復号動作における、受信側の励起信号は、
複数の可能な励起信号列を含むコードブックから取得さ
れ、コードブックの特定の励起ベクトルに対応するイン
デックスが他の音声符号化パラメータと共に送信され
る。音声復号およびコードブックの参照動作について
は、例えば、ジャン ハグヴィスト、カリ ジャヴィネ
ン、カリペッカ エスローラ、ジュッカ ランタによる
米国特許第5,327,519号明細書「パルスパター
ン励起線形予測音声符号器」において詳細に開示されて
おり、これらのすべての内容をここに参照のために併合
するものとする。
FIG. 1 (b) is a block diagram showing a conventional decoder used to generate comfort noise at the receiving side in a conventional voice communication system. The decoder receives two comforting noise parameters of an average excitation gain g mean and a set of short-term spectral coefficients f mean (i) (i = 1, ..., M) and based on these parameters Comfort noise is generated. The behavior of comfort noise generation at the receiver side is that the parameters are used at a fairly low rate (eg once every 480 ms in GSM FR and GSM EFR channels) and that there is no excitation signal from the speech coder. The operation is the same as the voice decoding operation except. In the voice decoding operation, the excitation signal on the receiving side is
An index obtained from a codebook containing multiple possible excitation signal sequences and corresponding to a particular excitation vector in the codebook is transmitted along with other speech coding parameters. Speech decoding and codebook reference operations are disclosed in detail in, for example, US Pat. No. 5,327,519, "Pulse Pattern Excited Linear Predictive Speech Coder," by Jean-Hagwist, Karijavinen, Karipekka Esrolla, and Jucca Lanta. All of these contents are hereby incorporated by reference.

【0022】一方、快適化雑音の発生においては、コー
ドブックのインデックスは送信されず、その代わりにラ
ンダム励起信号(RE)発生器110を用いて励起信号
が得られる。ランダム励起信号発生器110は平坦なス
ペクトルを有する励起信号ベクトル114が発生する。
励起信号ベクトル114は、スケーリングユニット11
5によって、平均励起利得gmeanだけスケーリングされ
て、そのエネルギーが送信側における励起信号104の
平均利得に対応するようになされる。このようにして得
られたスケーリングされたランダム励起信号列111
は、音声合成フィルタ112に入力され、快適化雑音出
力信号113が発生する。その際、平均短期間スペクト
ル係数fmean(i)が音声合成フィルタ112において
用いられる。
On the other hand, in generating comfort noise, the codebook index is not transmitted, and instead a random excitation signal (RE) generator 110 is used to obtain the excitation signal. The random excitation signal generator 110 generates an excitation signal vector 114 having a flat spectrum.
The excitation signal vector 114 is the scaling unit 11
5 is scaled by the average excitation gain g mean so that its energy corresponds to the average gain of the excitation signal 104 at the transmitter. The scaled random excitation signal sequence 111 thus obtained
Is input to the speech synthesis filter 112, and the comfort noise output signal 113 is generated. At that time, the average short-term spectrum coefficient f mean (i) is used in the speech synthesis filter 112.

【0023】図1(c)は、図1(b)の従来技術によ
る復号器のいろいろな部分におけるスペクトルを示した
図である。ランダム励起信号発生器110は、平坦なス
ペクトルを有する乱数励起信号列114(およびスケー
リングされたランダム励起信号列111)を発生する。
このスペクトルは曲線Aによって示されている。音声合
成フィルタ112は、この励起信号を曲線Bで示されて
いるような非平坦スペクトルを有する信号に変える。
FIG. 1 (c) is a diagram showing spectra at various portions of the prior art decoder of FIG. 1 (b). The random excitation signal generator 110 generates a random excitation signal sequence 114 (and a scaled random excitation signal sequence 111) having a flat spectrum.
This spectrum is shown by curve A. The speech synthesis filter 112 transforms this excitation signal into a signal having a non-flat spectrum as shown by curve B.

【0024】従来の快適化雑音発生技術においては、上
述したように、多くの問題が存在する。これらの問題の
うちの一つは、上記のように、受信側において発生する
ランダム励起による快適化雑音が、適切に正しく励起さ
れた快適化雑音とはなっておらず、送信側の実際の背景
雑音とは異なっているように認識されることである。本
発明の目的は、このような問題を完全になくす、あるい
は低減することである。
As described above, there are many problems in the conventional comfort noise generation technology. One of these problems is that the comfort noise due to random excitation generated on the receiving side is not the properly excited comfort noise as described above, and the actual background on the transmitting side is It is to be perceived as different from noise. The object of the present invention is to eliminate or reduce such problems altogether.

【0025】本発明の第1の目的と利点は、不連続送信
において快適化雑音を発生させる改善された方法を提供
し、これによって不連続送信方式において発生する信号
劣化を最小にすることである。
A first object and advantage of the present invention is to provide an improved method of generating comfort noise in discontinuous transmission, thereby minimizing the signal degradation that occurs in discontinuous transmission schemes. .

【0026】本発明の他の目的と利点は、背景雑音の特
徴をより良く抽出することができる改善された快適化雑
音の発生方法を提供し、さらには、これによって、改善
された品質の快適化雑音および改善された品質の通信を
不連続送信方式において可能とすることである。
Another object and advantage of the present invention is to provide an improved method of generating comfort noise which is capable of better extracting background noise features, which further improves comfort of improved quality. Noise and improved quality communication in discontinuous transmission schemes.

【0027】本発明のさらに他の目的と利点は、不連続
送信において、短い平均化時間内に、実際の背景雑音を
よく表現することができる改善された快適化雑音の発生
方法を提供することである。
Yet another object and advantage of the present invention is to provide an improved method of generating comfort noise that can better represent actual background noise within a short averaging time in discontinuous transmission. Is.

【0028】[0028]

【課題を解決するための手段】 [Means for Solving the Problems]

【0029】[0029]

【0030】[0030]

【0031】[0031]

【0032】[0032]

【0033】さらに、本発明によれば、パラメータの平
均を求め、もし、平均化期間内に不良な音声符号化パラ
メータが存在するときには、そのすべてあるいは一部を
除去あるいは中央値と置換する。本発明の実施形態にお
いては、平均化期間内の個々のフレーム間の音声符号化
パラメータの互いの距離を測定し、これらのパラメータ
を測定された距離の順に整列し、平均化期間において他
のパラメータからの距離が最も大きいパラメータを識別
し、もし上記最大距離があらかじめ定められた閾値を越
えている場合には、上記の最大距離を有するパラメータ
を、上記の平均化期間内において他のパラメータとの距
離が最小であるパラメータ(すなわち中央値)と置き換
える。中央値を有するパラメータは、平均化期間におい
て得られるパラメータのうちで、背景雑音の特性を最も
忠実に表現する値を有していると見なすことができる。
上記の処理を行った後、音声符号化パラメータの平均
を、適当な任意の方法を用いて求める。なお、本発明の
実施例においては、不連続送信方式システムの受信側
で、どのように快適化雑音パラメータを受信して用いる
かの方法については限定しない。
Further, according to the present invention, the parameters are averaged, and if there is a bad speech coding parameter within the averaging period, all or part of it is removed or replaced with the median value. In the embodiment of the present invention, the distances between the speech coding parameters between the individual frames within the averaging period are measured, these parameters are arranged in the order of the measured distances, and other parameters are averaged during the averaging period. The parameter with the largest distance from is identified, and if the maximum distance exceeds a predetermined threshold value, the parameter with the maximum distance is compared with other parameters within the averaging period. Replace with the parameter with the smallest distance (ie, median). The parameter having the median value can be regarded as having a value that most faithfully represents the characteristic of the background noise among the parameters obtained during the averaging period.
After performing the above processing, the average of the speech coding parameters is obtained by using an appropriate arbitrary method. In the embodiments of the present invention, the method of receiving and using the comfort noise parameter on the receiving side of the discontinuous transmission system is not limited.

【0034】平均化期間内の不良CNパラメータを除去
することによって、快適化雑音の品質を改善することに
加えて、本発明の実施形態はさらに他の利点も有してい
る。例えば、従来技術による不連続送信システムにおい
ては、平均化期間内の不良パラメータによる悪影響を低
減するために、平均化期間を長くとることが必要であっ
た。本発明では、平均化における不良パラメータの影響
の低減処置が施されるので、従来技術において必要とさ
れる平均化期間の長さと比較して短い平均期間でよい。
また、従来技術においては、平均化期間が長いために、
ハングオーバ期間も長くなり、そのためにチャネルの使
用時間が増加してしまう。一方、本発明では、平均化期
間が短くて済むので、不連続送信ハングオーバ期間も短
くすることができ、従って、チャネルの使用時間も低減
される。さらに、従来技術の不連続送信システムでは、
平均化期間が長いために、CN平均化アルゴリズムを実
施するのに、かなり大容量のスタティックメモリを必要
とする。一方、本発明では、平均化期間が短く、CN平
均化アルゴリズムを実行するのに小容量のスタティック
メモリで十分である。
In addition to improving the quality of comfort noise by eliminating bad CN parameters within the averaging period, embodiments of the present invention also have other advantages. For example, in the discontinuous transmission system according to the related art, it is necessary to lengthen the averaging period in order to reduce the adverse effects of the bad parameters within the averaging period. According to the present invention, since the effect of reducing the influence of the bad parameter in the averaging is applied, the averaging period that is shorter than the length of the averaging period required in the conventional technique is sufficient.
Further, in the conventional technology, since the averaging period is long,
The hangover period also becomes longer, which increases the channel usage time. On the other hand, in the present invention, since the averaging period can be short, the discontinuous transmission hangover period can be shortened, and thus the channel use time can be reduced. Furthermore, in the prior art discontinuous transmission system,
Due to the long averaging period, a fairly large amount of static memory is required to implement the CN averaging algorithm. On the other hand, in the present invention, the averaging period is short, and a small capacity static memory is sufficient to execute the CN averaging algorithm.

【0035】[0035]

【発明の実施の形態】快適化雑音を符号化および復号化
する従来の技術についてはすでに述べた通りである。図
2(a)〜2(c)を参照し、本発明の第1の実施例に
よる回路と方法とを以下に説明する。なお、図2
(a)、2(b)におい、図1(a)、1(b)に対応
する要素には同様の参照番号が用いられている。
DETAILED DESCRIPTION OF THE INVENTION Prior art techniques for encoding and decoding comfort noise have been described above. A circuit and method according to a first embodiment of the present invention will be described below with reference to FIGS. 2 (a) -2 (c). Note that FIG.
In (a), 2 (b), similar reference numerals are used for elements corresponding to FIGS. 1 (a), 1 (b).

【0036】「無声記述子平均化期間」は、GSMで用
いられている用語であって、IS−641 Rev.A
の用語としては、「快適化雑音平均化期間」または「C
N平均化期間」が用いられている。以下の本発明の説明
において、これらの2つの用語は同義に用いられる。同
様に、「SIDフレーム」および「快適化雑音パラメー
タメッセージ」あるいは「CNパラメータメッセージ」
は同義に用いられる。
"Unvoiced descriptor averaging period" is a term used in GSM, and is defined in IS-641 Rev. A
The term "comfort noise averaging period" or "C
"N averaging period" is used. In the following description of the invention, these two terms are used synonymously. Similarly, "SID frame" and "comfort noise parameter message" or "CN parameter message"
Are used synonymously.

【0037】図2(a)は、本発明による、送信側にお
いて快適化雑音パラメータを生成する装置を示したブロ
ック図である。本発明特有の新規な部分は、従来の既知
の技術による部分と区別するために、本発明特有部分を
破線204で囲んで示してある。本発明のこの実施例に
おいては、逆フィルタ103から出力される残差信号1
04が、さらに分析されて(例えばLPC分析)さらに
一組のフィルタ係数が生成される。この第2の分析に
は、本発明では、ランダム励起(RE)線形予測符号化
(LPC)分析200が用いられ、ブロック101で行
われる線形予測符号化分析よりも一般に低次数である。
ランダム励起線形予測符号化分析ブロック200から出
力されたスペクトルパラメータ201は、平均化ブロッ
ク203によって、連続する数フレームに対して平均化
され、これにより、ランダム励起スペクトル制御(RE
SC)パラメータrmean(i)(i=1、・・・、R)
が求められる。このランダム励起スペクトル制御パラメ
ータによって、励起信号のスペクトルが特徴づけられ
る。
FIG. 2 (a) is a block diagram showing an apparatus for generating comfort noise parameters at the transmitting side according to the present invention. The novel parts specific to the present invention are shown enclosed by dashed lines 204 to distinguish them from parts of the prior art known in the art. In this embodiment of the invention, the residual signal 1 output from the inverse filter 103
04 is further analyzed (eg, LPC analysis) to produce a further set of filter coefficients. For this second analysis, the present invention uses a random excitation (RE) linear predictive coding (LPC) analysis 200, which is generally of lower order than the linear predictive coding analysis performed at block 101.
The spectral parameters 201 output from the random excitation linear predictive coding analysis block 200 are averaged by the averaging block 203 for several consecutive frames, whereby random excitation spectrum control (RE) is performed.
SC) Parameter r mean (i) (i = 1, ..., R)
Is required. The random excitation spectrum control parameter characterizes the spectrum of the excitation signal.

【0038】なお、ランダム励起スペクトル制御パラメ
ータは、音声符号化パラメータの部分集合ではなく、快
適化雑音発生においてのみ発生し用いられるパラメータ
である。なお、本発明の発明者らは、ランダム励起スペ
クトル制御パラメータ(R=1または2)を発生させる
のには、1次あるいは2次の線形予測符号化分析で十分
に良好な結果が得られることを見い出した。ただし、全
ポール線形予測符号化法以外のスペクトルモデルを用い
ることも可能である。あるいは、ランダム励起線形予測
符号化分析ブロック200による平均化処理を、線形予
測符号化パラメータ算出において自己相関係数を平均す
ることによって行うようにすることもできるしは、ある
いは、線形予測符号化係数の算出においてその他の適当
な平均化方法を用いて行うようにもできる。ランダム励
起スペクトル制御パラメータの平均化期間は、その他の
快適化雑音パラメータの平均化期間と同じであってよい
が、ただし、平均化期間が同じであることが必要という
わけではない。例えば、ランダム励起スペクトル制御パ
ラメータの平均化期間を、従来快適化雑音パラメータに
用いられている平均化期間よりも長く設定することが望
ましい。すなわち、平均化期間として7フレームを採用
する代わりに例えば10〜12フレームの、より長い平
均化期間を採用することが望ましい。
The random excitation spectrum control parameter is not a subset of speech coding parameters, but is a parameter generated and used only in comfort noise generation. It should be noted that the inventors of the present invention can obtain sufficiently good results in the linear predictive coding analysis of the first or second order to generate the random excitation spectrum control parameter (R = 1 or 2). Found out. However, it is also possible to use a spectrum model other than the all-pole linear predictive coding method. Alternatively, the averaging process by the random excitation linear predictive coding / analysis block 200 may be performed by averaging the autocorrelation coefficients in the linear predictive coding parameter calculation. Other suitable averaging methods may be used in the calculation of The averaging period of the random excitation spectrum control parameter may be the same as the averaging period of the other comfort noise parameters, although it does not have to be the same. For example, it is desirable to set the averaging period of the random excitation spectrum control parameter longer than the averaging period conventionally used for the comfort noise parameter. That is, instead of using 7 frames as the averaging period, it is desirable to use a longer averaging period of, for example, 10 to 12 frames.

【0039】起信号利得を算出するのに先だって、線形
予測符号化残差信号104は、第2の逆フィルタHRESC
(Z)202に供給されて処理される。このフィルタ2
02によって、線形予測符号化残差信号104は、一般
に、さらに平坦なスペクトルを有する残差信号205に
変換される。逆ランダム励起スペクトル制御フィルタH
RESC(Z)として、以下の形の全零フィルタを用いるこ
とが可能であるが、これに限られるわけではない。
Prior to calculating the back-to-back signal gain, the linear predictive coding residual signal 104 is fed to the second inverse filter H RESC.
(Z) 202 is supplied and processed. This filter 2
02 transforms the linear predictive coding residual signal 104 into a residual signal 205, which generally has a flatter spectrum. Inverse random excitation spectrum control filter H
As RESC (Z), it is possible to use an all-zero filter of the following form, but it is not limited to this.

【0040】[0040]

【数12】 [Equation 12]

【0041】次に、平坦化されたスペクトルを有する残
差信号205から、励起信号利得が算出される。その他
の点では、図2(a)の動作は上記の図1(a)の動作
と同様である。
Next, the excitation signal gain is calculated from the residual signal 205 having the flattened spectrum. In other respects, the operation of FIG. 2A is the same as the operation of FIG.

【0042】図2(b)は、本発明による、受信側にお
いて快適化雑音を発生させるのに用いられる復号器を表
したブロック図である。この復号器による励起信号21
2の形成は以下のようにして行われる。まず最初に、白
色雑音励起信号列114がランダム励起信号発生器11
0によって発生し、次にこれが、スケーリングブロック
115によってgmeanだけスケーリングされる。
FIG. 2 (b) is a block diagram illustrating a decoder used to generate comfort noise at the receiving side according to the present invention. Excitation signal 21 by this decoder
The formation of 2 is performed as follows. First, the white noise excitation signal sequence 114 is converted into the random excitation signal generator 11
Generated by 0, which is then scaled by scaling block 115 by g mean .

【0043】この、平坦なスペクトルを有する雑音信号
列111は、次に、ランダム励起スペクトル制御(RE
SC)フィルタ211によって処理され、所望のスペク
トルを有する励起信号が生成される。ランダム励起スペ
クトル制御フィルタ211は、図2(a)の符号器のラ
ンダム励起制御逆フィルタ202と逆の処理を行う。送
信側で、式(2)の特性を有するランダム励起スペクト
ル制御逆フィルタが用いられる場合には、受信側では、
次の式の特性を有する乱数制御スペクトル制御フィルタ
211が用いられる。
This noise signal sequence 111 having a flat spectrum is then subjected to random excitation spectrum control (RE
SC) filter 211 produces an excitation signal having the desired spectrum. The random excitation spectrum control filter 211 performs a process reverse to that of the random excitation control inverse filter 202 of the encoder shown in FIG. If a random excitation spectrum control inverse filter having the characteristic of equation (2) is used on the transmitting side, then on the receiving side,
A random number control spectrum control filter 211 having the characteristics of the following equation is used.

【0044】[0044]

【数13】 [Equation 13]

【0045】フィルタ係数b(i)(i=1、・・・、
R)を定義するランダム励起スペクトル制御パラメータ
mean(i)(i=1、・・・、R)が快適化雑音パラ
ータの一部として受信側に送られ、受信側では、ランダ
ム励起スペクトル制御フィルタ211がこのランダム励
起スペクトル制御パラメータを用いて、適切に重み付け
られた、従って一般には平坦ではないスペクトルを有す
る励起信号を生成し、これを合成フィルタ112に対し
て供給する。ランダム励起スペクトル制御パラメータr
mean(i)(i=1、・・・、R)は、フィルタ係数b
(i)(i=1、・・・、R)と同じであってもよく、
あるいは、効率的に量子化して送信できる、例えばライ
ンスペクトル対(LSP)係数などのその他の適当なパ
ラメータ表現を用いてもよい。図11(a)〜11
(g)に、ランダム励起スペクトル制御フィルタ211
の代表的な周波数応答を示す。
Filter coefficient b (i) (i = 1, ...,
The random excitation spectrum control parameter r mean (i) (i = 1, ..., R) that defines R) is sent to the receiving side as part of the comfort noise parameter, and the receiving side uses the random excitation spectrum control filter. 211 uses this random excitation spectrum control parameter to generate an excitation signal with an appropriately weighted, and therefore generally non-flat, spectrum and supplies it to synthesis filter 112. Random excitation spectrum control parameter r
mean (i) (i = 1, ..., R) is the filter coefficient b
(I) may be the same as (i = 1, ..., R),
Alternatively, any other suitable parametric representation, such as line spectrum pair (LSP) coefficients, that can be efficiently quantized and transmitted, may be used. 11 (a) to 11
(G) shows a random excitation spectrum control filter 211
2 shows a typical frequency response of.

【0046】以上に説明したように、本発明の快適化雑
音励起信号起発生器210は従来にない特徴を有するも
のである。すなわち、快適化雑音励起信号発生器210
は、ランダム励起信号発生器110を用いて平坦なスペ
クトルを有するランダム励起信号を発生させる。この平
坦なスペクトルを有する励起信号は、平均利得スケーラ
115によって適切なスケーリングが施された後、ラン
ダム励起ベクトル制御フィルタ211に供給される。快
適化雑音のスペクトルと背景雑音のスペクトルとのあい
だの不整合を防ぐために、適切なスペクトルを有する快
適化雑音を生成し、ランダム励起ベクトル制御フィルタ
211を介してランダム励起信号が供給される。次に、
そのスペクトルが上記のように制御された励起信号21
2に基づいて、音声合成フィルタ112は、送信側にお
いて実際に存在する背景雑音とスペクトルがよりよく一
致する快適化雑音を生成する。
As explained above, the comfort noise excitation signal generator 210 of the present invention has a characteristic which is not available in the prior art. That is, the comfort noise excitation signal generator 210
Uses a random excitation signal generator 110 to generate a random excitation signal having a flat spectrum. The excitation signal having the flat spectrum is supplied to the random excitation vector control filter 211 after being appropriately scaled by the average gain scaler 115. In order to prevent a mismatch between the comfort noise spectrum and the background noise spectrum, comfort noise having an appropriate spectrum is generated and a random excitation signal is provided via the random excitation vector control filter 211. next,
Excitation signal 21 whose spectrum is controlled as described above
Based on 2, the speech synthesis filter 112 produces comfort noise whose spectrum better matches the background noise actually present at the sender.

【0047】なお、ランダム励起スペクトル制御パラメ
ータは、音声信号処理に用いられる音声符号化パラメー
タの部分集合ではなく、快適化雑音生成においてのみ算
出されて用いられるパラメータである。すなわち、ラン
ダム励起スペクトル制御パラメータは、会話音声の休止
期間において、改善された快適化雑音を励起発生するた
めの目的のためにだけ算出されて送信される。また、符
号器のランダム励起スペクトル制御逆フィルタ202
と、復号器のランダム励起スペクトル制御フィルタ21
1は、ランダム励起信号のスペクトルを制御する目的だ
けに用いられる。
The random excitation spectrum control parameter is not a subset of speech coding parameters used for speech signal processing, but a parameter calculated and used only in comfort noise generation. That is, the random excitation spectrum control parameters are calculated and transmitted only for the purpose of exciting and generating improved comfort noise during the pauses of speech. Also, the random excitation spectrum control inverse filter 202 of the encoder
And the random excitation spectrum control filter 21 of the decoder
1 is used only for controlling the spectrum of the random excitation signal.

【0048】図2(c)は、本発明によって快適化雑音
が発生する際の、図2(b)の復号器内の信号のスペク
トルを示したものである。ランダム励起信号発生器11
0は、曲線Aで示されたような平坦なスペクトルを有す
る乱数列を生成する。このスペクトルは、図1(c)の
曲線Aで示されたものと同じである。信号114および
信号111のいずれも、このような平坦なスペクトルを
有している。すなわち、ブロック115によるスケーリ
ングによって、スペクトルの形状が影響を受けることが
ない。白色雑音列111は、ランダム励起スペクトル制
御フィルタ211に入力され、その出力の励起信号21
2が線形予測符号化合成フィルタに供給される。改善さ
れた特性を有する励起信号列212は、一般には、その
スペクトルは平坦ではない(曲線)。そのために、合
成フィルタ112の出力信号113のスペクトルは、例
えば図2(c)の曲線で示されたようになる。励起信
号列212は、低域通過型あるいは高域通過型、あるい
は、より複雑な周波数成分を含むものであってもよい
(ランダム励起スペクトル制御フィルタの次数に依存す
る)。スペクトルの制御は、上述のように、送信側にお
いて計算され、快適化雑音の一部として受信側に対して
送信されるランダム励起スペクトル制御パラメータによ
って定まる。
FIG. 2 (c) shows the spectrum of the signal in the decoder of FIG. 2 (b) when comfort noise is generated according to the present invention. Random excitation signal generator 11
0 produces a random number sequence with a flat spectrum as shown by curve A. This spectrum is the same as that shown by curve A in FIG. 1 (c). Both the signal 114 and the signal 111 have such a flat spectrum. That is, the scaling by block 115 does not affect the shape of the spectrum. The white noise sequence 111 is input to the random excitation spectrum control filter 211, and the output excitation signal 21
2 is supplied to the linear predictive coding synthesis filter. The excitation signal train 212 with improved properties generally has a non-flat spectrum (curve B 1 ). Therefore, the spectrum of the output signal 113 of the synthesis filter 112 becomes, for example, as shown by the curve C in FIG. The excitation signal sequence 212 may be a low-pass type or a high-pass type, or may include a more complicated frequency component (depending on the order of the random excitation spectrum control filter). The control of the spectrum is determined by the random excitation spectrum control parameters calculated at the transmitter and transmitted to the receiver as part of the comfort noise, as described above.

【0049】図3(a)および3(b)は、本発明のさ
らに別の実施例を示す図である。図3(a)を図2
(a)と比較してみると、本実施例の場合では励起信号
利得が、ランダム励起スペクトル制御逆フィルタ202
から出力される残差信号からではなく、線形予測符号化
残差信号104から算出される点で異なっている。従っ
て、図3(a)に示す本実施例においては、ランダム励
起スペクトル制御逆フィルタ202は必要ではない。図
3(a)の符号器に対応して、受信側において用いられ
る復号器を図3(b)に示す。図2(b)の復号器と比
較して、励起信号スケーリングブロック(ブロック11
5)が、ランダム励起スペクトル制御フィルタ211の
入力側から出力側に移動されている点が異なる。その他
の点では、図3(a)と図3(b)の符号器および復号
器は、図2(a)、2(b)の符号器、復号器の動作と
同様である。
3 (a) and 3 (b) are views showing still another embodiment of the present invention. FIG. 3 (a) to FIG.
When compared with (a), in the case of this embodiment, the excitation signal gain is the random excitation spectrum control inverse filter 202.
The difference is that it is calculated from the linear predictive coding residual signal 104, not from the residual signal output from. Therefore, the random excitation spectrum control inverse filter 202 is not necessary in this embodiment shown in FIG. A decoder used on the receiving side corresponding to the encoder of FIG. 3 (a) is shown in FIG. 3 (b). Compared to the decoder of FIG. 2 (b), the excitation signal scaling block (block 11
5) is moved from the input side of the random excitation spectrum control filter 211 to the output side. In other respects, the encoder and the decoder of FIGS. 3A and 3B are similar to the operations of the encoder and the decoder of FIGS. 2A and 2B.

【0050】図4は、本発明のさらに別の実施例によ
る、送信側において快適化雑音パラメータを算出する回
路を示すブロック図である。本実施例は、音声符号化パ
ラメータの一部あるいはすべてが、平均的な背景雑音か
ら著しくずれているフレームが平均期間中において1フ
レームあるいは数フレーム存在するときに発生する上記
の問題に対処するものである。本発明のこの実施例特有
の部分は破線300および310で囲み、従来技術によ
る部分とは区別してある。本発明のこの実施例において
は、ブロック107aおよび108aにバッファリング
された音声符号化パラメータは、まず、閾値中央値置換
処理を受けてから、平均化ブロック107および108
に入力されて、平均励起信号利得gmeanおよび平均短期
間スペクトル係数fmean(i)とが算出される。この処
理によって、平均化期間に、背景雑音の平均的な値から
一定以上にずれたパラメータが含まれている場合には、
そのパラメータは、実際の背景雑音を代表するパラメー
タの値、すなわち中央値と置き換えられる。
FIG. 4 is a block diagram showing a circuit for calculating comfort noise parameters at the transmitting side according to still another embodiment of the present invention. This embodiment addresses the above-mentioned problem that occurs when some or all of the speech coding parameters deviate significantly from the average background noise when one or several frames are present during the averaging period. Is. The parts specific to this embodiment of the invention are surrounded by dashed lines 300 and 310 to distinguish them from the prior art parts. In this embodiment of the invention, the speech coding parameters buffered in blocks 107a and 108a are first subjected to a threshold median replacement process and then averaged blocks 107 and 108.
And the average excitation signal gain g mean and the average short-term spectrum coefficient f mean (i) are calculated. By this processing, when the averaging period includes a parameter deviated from the average value of the background noise by a certain amount or more,
That parameter is replaced with the value of the parameter representing the actual background noise, ie the median.

【0051】まず最初に、ブロック107による平均化
処理の前に行われる、ブロック300によるスカラー励
起信号利得パラメータgの算出処理について説明する。
平均化期間の間の一連の励起信号利得の値107bが、
バッファブロック107aに一時的に記憶された後、こ
れらの値がブロック301に入力されて、値の大きさの
順に並べ替えられる。これらの一連の励起利得の値は、
それぞれにインデックスが与えられる。並べ替えられた
一連の利得パラメータ302は、中央値置換ブロック3
03に入力されて、これらの励起信号利得の値のうち
の、中央値からの差異があらかじめ定められた閾値を越
えるL個がその一連のパラメータの中心値と置き換えら
れる。個々のパラメータの値と中央値との差がブロック
304によって計算され、その差が閾値を越えた場合に
は、その励起信号利得の値に対応するインデックスが信
号305として中央値置換ブロック303に供給され
る。
First, the calculation processing of the scalar excitation signal gain parameter g by the block 300, which is performed before the averaging processing by the block 107, will be described.
A series of excitation signal gain values 107b during the averaging period
After being temporarily stored in the buffer block 107a, these values are input to the block 301 and rearranged in the order of the magnitude of the values. These series of pump gain values are
Each is given an index. The permuted series of gain parameters 302 is the median permutation block 3
Of these excitation signal gain values, L of which the difference from the median exceeds a predetermined threshold value are replaced with the median value of the series of parameters. The difference between the value of the individual parameter and the median is calculated by block 304, and if the difference exceeds a threshold value, the index corresponding to the value of the excitation signal gain is provided as signal 305 to median replacement block 303. To be done.

【0052】平均化期間の長さNは、好適には奇数の値
が選択される。この場合、並べ替えられた一連の励起利
得のうちの、第((N+1)/2)番目の値が中心値で
ある。置換されるパラメータの数を定める変数Lは、0
からN−1の値であり、あらかじめ定めておく(例えば
定数)。
An odd value is preferably selected for the length N of the averaging period. In this case, the ((N + 1) / 2) th value of the rearranged series of pump gains is the central value. The variable L that determines the number of parameters to be replaced is 0
To N-1 and is determined in advance (for example, a constant).

【0053】中心値からの差があらかじめ定められた閾
値を越えるような励起利得の値に対しては、セレクタ3
07が切り替えられて、中心値置換ブロック303の出
力信号308が励起利得の値309として平均化ブロッ
ク107に供給される。一方、中央値からの差があらか
じめ定められて閾値と越えないような個々の励起信号利
得の値に対しては、バッファブロック107aの出力が
入力パラメータの値309として直接平均化ブロック1
07に供給されるようにセレクタ307が切り替えられ
る。
For the value of the excitation gain such that the difference from the central value exceeds a predetermined threshold value, the selector 3
07 is switched, and the output signal 308 of the center value substitution block 303 is supplied to the averaging block 107 as the value 309 of the excitation gain. On the other hand, for the individual excitation signal gain values whose difference from the median value is predetermined and does not exceed the threshold value, the output of the buffer block 107a is used as the input parameter value 309 to directly average the averaging block 1.
The selector 307 is switched so as to be supplied to 07.

【0054】セレクタ307の選択状態は、閾値ブロッ
ク304から出力される信号306によって制御され
る。
The selection state of the selector 307 is controlled by the signal 306 output from the threshold value block 304.

【0055】次に、ブロック108による平均化処理の
前に、ブロック310によって行われるラインスペクト
ル対(LSP)係数f(k)(k=1、・・・、M)に
関する処理について説明する。平均化期間の間、一連の
LSP係数108bがブロック108aにバッファリン
グされた後、ブロック311に供給される。平均化期間
における第i番目のフレームのLSP係数fi(k)の
同じ平均化期間の第j番目のフレームのLSP係数fj
(k)とのスペクトル距離は、以下の式によって近似的
に表すことができる。
Next, the process for the line spectrum pair (LSP) coefficient f (k) (k = 1, ..., M) performed by the block 310 before the averaging process by the block 108 will be described. During the averaging period, a series of LSP coefficients 108b are buffered in block 108a and then provided to block 311. LSP coefficient f i (k) of the i-th frame in the averaging period LSP coefficient f j of the j-th frame in the same averaging period
The spectral distance from (k) can be approximately represented by the following formula.

【0056】[0056]

【数14】 [Equation 14]

【0057】ここで、Mは、線形予測符号化モデルの次
数であり、また、fi(k)は、平均化期間の第i番目
のフレームのk番目のLSPパラメータである。
Here, M is the order of the linear predictive coding model, and f i (k) is the k-th LSP parameter of the i-th frame in the averaging period.

【0058】長さNの平均化期間において、第i番目の
フレームのLSP係数fi(k)の、他のすべてのフレ
ームj=1、・・・、N(i≠j)のLSP係数に対す
るスペクトル距離ΔSiを求めるために、スペクトル距
離ΔRijの和を以下の式を用いてすべてのi=1、・・
・、Nに対して算出する。
In the averaging period of length N, the LSP coefficient f i (k) of the i-th frame is compared with the LSP coefficients of all other frames j = 1, ..., N (i ≠ j). In order to obtain the spectral distance ΔS i , the sum of the spectral distances ΔR ij is used for all i = 1, ...
・, Calculate for N.

【0059】[0059]

【数15】 [Equation 15]

【0060】ただし、ΔRij=0(すなち、自分自身か
らの距離は0)である。上記の式(4)および(5)で
表される処理は、ブロック311で行われる。
However, ΔR ij = 0 (that is, the distance from itself is 0). The processing represented by the above equations (4) and (5) is performed in block 311.

【0061】スペクトル距離は、その他のいろいろなL
PCフィルタによる表現で近似的に求めることが可能で
あり、その具体的な例は、例えば、エー エイチ グレ
イジュニア、ジェイ ディー マーケル、「音声処理に
おける距離測度」(、IEEE 音響、音声、および信
号処理に関するトランザクション、Vol.24、p.
380−391、1976年)に開示されている。ま
た、イミタンススペクトル対(ISP)を、ラインスペ
クトル対と同様に用いることもできる。これについて
は、例えば、ワイ ビストリッツ、エス ペレル「音声
符号化におけるイミタンススペクトル対(ISP)」
(音響、音声、信号処理に関するIEEE国際学会の会
報、ミネソタ州ミネアポリス、Vol.2、p.9−1
2、1993年4月27−30日)に開示されている。
Spectral distances are determined by various other L
It can be approximated by a PC filter expression, and specific examples thereof are, for example, AH Gray Jr., JD Markel, “Distance Measure in Speech Processing” (, IEEE Acoustics, Speech, and Signal Processing). Transaction, Vol. 24, p.
380-391, 1976). Also, the immittance spectrum pair (ISP) can be used similarly to the line spectrum pair. For this, see, for example, Wybistriz, Esperell, "Imittance Spectrum Pair (ISP) in Speech Coding".
(Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing, Minneapolis, Minnesota, Vol. 2, p. 9-1.
2, April 27-30, 1993).

【0062】ブロック311によって求められた、平均
化期間におけるLSPベクトルfiの各々のスペクトル
距離ΔSiは、ブロック313に供給される。この整列
ブロック313において、スペクトル距離が、その大き
さの順に並べ替えられる。なお、これらのスペクトル距
離は、それぞれ、インデックスによって、平均化期間の
LPSベクトルと関連づけられる。平均化期間におい
て、最も小さい距離ΔSiを有するベクトルfi(i=
1、・・・、N)は、その平均化期間の中央値ベクトル
medと見なされ、その距離は、ΔSmedで表される。
The spectral distance ΔS i of each LSP vector f i during the averaging period, determined by block 311, is supplied to block 313. In this alignment block 313, the spectral distances are sorted in order of their magnitude. Note that each of these spectral distances is associated with the LPS vector of the averaging period by the index. In the averaging period, vector f i (i with the smallest distance [Delta] S i =
, ..., N) is considered as the median vector f med of its averaging period and its distance is represented by ΔS med .

【0063】平均化期間における一連のLSP係数ベク
トルfiが、スペクトル距離の順序に従ってブロック3
13によって整列される。この、ブロック313によっ
て整列された一連のLSPベクトル314は、中央値置
換ブロック315に供給される。ブロック315におい
て、P個(0≦P≦N−1)のLSPベクトルfiが、
中央値fmedと置換される。これらのP個のベクトルの
インデックスが、ブロック316において、ΔSi(i
=1、2、・・・、N)と中央値ΔSmedとを比較する
ことによって求められる。ΔSi−ΔSmedが所定の閾値
よりも大きいfiのインデックスが、信号317によっ
て中央値置換ブロック315に伝えられる。
A series of LSP coefficient vectors f i in the averaging period are stored in block 3 according to the order of the spectral distance.
Aligned by 13. This series of LSP vectors 314 aligned by block 313 is provided to median replacement block 315. In block 315, LSP vector f i of P (0 ≦ P ≦ N-1 ) is,
It is replaced with the median f med . The indices of these P vectors are ΔS i (i
, 1, 2, ..., N) and the median ΔS med . The index of f i , where ΔS i −ΔS med is greater than a predetermined threshold, is conveyed by signal 317 to median replacement block 315.

【0064】あるi=1、2、・・・、Nにおいて、差
ΔSi−ΔSmedが閾値よりも大きいものに対しては、中
央値置換ブロック315からの出力信号320がパラメ
ータ321として平均化ブロック108に供給されるよ
うにセレクタ319が切り替えられる。一方、ΔSi
ΔSmedがすべてのi=1、2、・・・、Nで閾値より
も小さい場合には、平均化ブロック108への入力信号
321が、バッファブロック108aから直接に信号1
08bとして与えられるように、セレクタ319の位置
が切り替えられる。
For some i = 1, 2, ..., N, the output signal 320 from the median replacement block 315 is averaged as the parameter 321 for the difference ΔS i −ΔS med larger than the threshold value. The selector 319 is switched to be supplied to the block 108. On the other hand, ΔS i
If ΔS med is less than the threshold for all i = 1, 2, ..., N, the input signal 321 to the averaging block 108 is the signal 1 directly from the buffer block 108a.
The position of the selector 319 is switched, as provided as 08b.

【0065】セレクタ319の選択状態は、閾値ブロッ
ク316から出力される信号318によって制御され
る。
The selection state of the selector 319 is controlled by the signal 318 output from the threshold value block 316.

【0066】図5は、本発明の他の実施例を示す図であ
る。本発明のこの実施例特有の部分は破線400で囲
み、従来技術による部分とは区別してある。上記の図4
の実施例においては、励起信号利得gとLSPベクトル
iとの中央値はそれぞれが独立に処理されたが、図5
の実施例では、これらのパラメータは以下に説明するよ
うに同時に処理される。
FIG. 5 is a diagram showing another embodiment of the present invention. The parts specific to this embodiment of the invention are surrounded by the dashed line 400 to distinguish them from the prior art parts. Figure 4 above
In the embodiment of FIG. 5, the median values of the excitation signal gain g and the LSP vector f i are processed independently, but FIG.
In this embodiment, these parameters are processed simultaneously as described below.

【0067】あるフレームのパラメータが、中央値で置
換すべきものと判定されると、そのフレームの励起信号
利得gおよびLSPベクトルfiの両方ともが、中央を
有するフレームのそれぞれのパラメータと置換される。
When it is determined that the parameters of a frame should be replaced by the median, both the excitation signal gain g and the LSP vector f i for that frame are replaced with the respective parameters of the frame having the center. .

【0068】中央値置換を行うためのフレームの整列を
行うのに用いる、平均化期間内のi番目のフレームとj
番目のフレームのパラメータ間の近似的な距離ΔRij
表す式(4)の代わりに、励起信号利得gおよびLSP
ベクトルfiの両方が考慮された次の(6)式をここで
は用いる。
The i-th frame in the averaging period and j used to align the frames for median replacement
Instead of equation (4) representing the approximate distance ΔR ij between the parameters of the th frame, the excitation signal gain g and LSP
The following equation (6) in which both of the vectors f i are considered is used here.

【0069】[0069]

【数16】 [Equation 16]

【0070】ここで、Mは線形予測符号化モデルの次数
であり、fi(k)は平均化期間における第i番目のフ
レームの第k番目のLPSパラメータである。また、q
iは、第i番目のフレームの励起信号利得パラメータで
ある。
Here, M is the order of the linear predictive coding model, and f i (k) is the k-th LPS parameter of the i-th frame in the averaging period. Also, q
i is the excitation signal gain parameter of the i-th frame.

【0071】ΔTijをまず算出し、次に、式(5)を用
いて、長さがNである平均化期間内のフレームiのパラ
メータの、他のフレームj=1・・・N(i≠j)に対
する距離ΔSiをすべてのi=1、・・・、Nについて
求める。式(6)を用いて求められたΔTijを式(5)
に適用するにあたっては、式(5)の距離ΔRijの代わ
りにΔTijを用いる。上記の式(5)および(6)によ
る処理は、ブロック401によって実行される。中央値
置換処理を、励起信号利得あるいはスペクトル距離のど
ちらに重点をおいて行うかにより、上記式(6)におけ
る重み係数wを適宜選択する。この重み係数はユーザに
おいて経験的に求められた適切な値に設定される。
ΔT ij is first calculated, and then using equation (5), other frames j = 1 ... N (i) of the parameters of frame i within the averaging period of length N Find the distance ΔS i for ≠ j) for all i = 1, ..., N. ΔT ij obtained by using the equation (6) is given by the equation (5)
When applied to, the distance ΔR ij is used instead of the distance ΔR ij in the equation (5). The processing according to equations (5) and (6) above is performed by block 401. The weighting factor w in the above equation (6) is appropriately selected depending on which of the excitation signal gain and the spectral distance is to be applied to the median value replacement process. This weighting factor is set to an appropriate value empirically obtained by the user.

【0072】ブロック401によって求められた、平均
化期間における各フレームの距離ΔSiは、402とし
て整列ブロック403に対して供給される。整列ブロッ
ク403は、これらの値に従って距離の並べ替えを行
う。これらの距離はそれぞれが平均化期間内の1つのフ
レームとインデックスによって関連づけられている。平
均化期間内において、最小距離ΔSi(i=1、2、・
・・、N)を有するフレームは、その平均化期間のパラ
メータgmedおよびfmedに関する中央値フレームとして
採用され、その距離をΔSmedで表す。
The distance ΔS i of each frame in the averaging period obtained by the block 401 is supplied to the alignment block 403 as 402. The alignment block 403 rearranges the distances according to these values. Each of these distances is associated by index with one frame within the averaging period. Within the averaging period, the minimum distance ΔS i (i = 1, 2, ...
, N) is taken as the median frame for the parameters g med and f med of its averaging period and its distance is denoted ΔS med .

【0073】ブロック403によって整列すべき励起信
号利得は、信号107bとしてバッファ107aからブ
ロック403に供給され、一方、LSP係数が信号10
8bとしてバッファ108aからブロック403に供給
される。すでに述べたように、平均化期間の一連のパラ
メータは、ブロック403によってそのスペクトル距離
ΔSiの順に整列される。ブロック403によって整列
された一連のパラメータは、信号404と405とし
て、中央値置換ブロック406に供給され、ブロック4
06において、L個(0≦L≦N−1)のフレームのパ
ラメータgiおよびfiが、中央値フレームのパラメータ
medおよびfmedと置換される。これらのL個のベクト
ルのインデックスは、ブロック407がΔSi(i=
1、2、・・・、N)を中央値ΔSmedと比較すること
によって決定され、決定されたインデックスは信号40
8として中央値置換ブロック406に伝達される。ΔS
i−ΔSmedが所定の閾値よりも大きいとブロック407
が判断した場合には、中央値置換ブロック406は、対
応するパラメータgiおよびfiをgmedおよびfmedに置
き換える。なお、Lの値の最小値および最大値をあらか
じめ決定しておくようにしてもよい。
The excitation signal gain to be aligned by block 403 is provided from buffer 107a to block 403 as signal 107b, while the LSP coefficients are signal 10.
8b is supplied from the buffer 108a to the block 403. As already mentioned, the series of parameters of the averaging period are ordered by their block 403 in their spectral distance ΔS i . The set of parameters aligned by block 403 are provided as signals 404 and 405 to median replacement block 406 and block 4
At 06, the parameters g i and f i of the L (0 ≦ L ≦ N−1) frames are replaced with the parameters g med and f med of the median frame. For the indices of these L vectors, the block 407 determines ΔS i (i =
, 2, ..., N) is compared to the median ΔS med, and the determined index is the signal 40
8 is transmitted to the median substitution block 406. ΔS
If i −ΔS med is larger than a predetermined threshold, block 407.
If so, the median replacement block 406 replaces the corresponding parameters g i and f i with g med and f med . Note that the minimum value and the maximum value of the value of L may be determined in advance.

【0074】i=1、2、・・・、Nのうちのどれか
が、距離ΔSi-ΔSmedよりも大きい場合には、中央値
置換ブロック406から出力される信号411が平均化
ブロック108へパラメータ321として入力され、ま
た、中央値置換ブロック406から出力される信号41
2が平均化ブロック107へパラメータ309として入
力されるように、セレクタ410の位置が切り替えられ
る。一方、ΔSi−ΔSmedが、すべてのi=1、2、・
・・、Nで閾値よりも小さい場合には、平均化ブロック
108の入力信号321が、バッファブロック108a
から直接に信号108bとして与えられ、また、平均化
ブロック107の入力信号309が、バッファブロック
107aから直接に信号107bとして与えられるよう
に、セレクタ410の位置が切り替えられる。上記セレ
クタ410の位置は、閾値ブロック407からの信号4
09によって制御される。
If any of i = 1, 2, ..., N is greater than the distance ΔS i −ΔS med , the signal 411 output from the median replacement block 406 is the averaging block 108. Signal 41 input to the median substitution block 406 as a parameter 321 to
The position of the selector 410 is switched so that 2 is input to the averaging block 107 as the parameter 309. On the other hand, ΔS i −ΔS med is the same for all i = 1, 2, ...
.., N is smaller than the threshold value, the input signal 321 of the averaging block 108 is the buffer block 108a
The position of the selector 410 is switched so that the signal 108b is directly supplied from the buffer block 107a and the input signal 309 of the averaging block 107 is directly supplied as the signal 107b from the buffer block 107a. The position of the selector 410 corresponds to the signal 4 from the threshold block 407.
Controlled by 09.

【0075】上記のように、個々の距離の値から距離中
央値を差し引く(すなわち、ΔSi−ΔSmedを求める)
代わりに、個々の距離と距離中央値との差異を表すの
に、ブロック316および407において、例えば、個
々の距離を距離中央値で割った商(ΔSi/ΔSmed)を
用いるようにすることもでき、多くの場合、このように
商を用いる方がより好ましい。商を用いた場合には、個
々の距離の値の距離中央値からの相対的な変位すなわち
規格化変位が得られ、これは、ΔSiあるいはΔSmed
絶対値に依存せずに、相対的なずれを表現することがで
きる。
As described above, the median distance is subtracted from the individual distance values (that is, ΔS i −ΔS med is obtained).
Instead, use the quotient (ΔS i / ΔS med ) of the individual distances divided by the median distance, for example, in blocks 316 and 407 to represent the difference between the individual distances and the median distance. In many cases, it is more preferable to use the quotient in this way. When the quotient is used, the relative displacement or normalized displacement of the individual distance values from the median distance is obtained, which is independent of the absolute value of ΔS i or ΔS med. It is possible to express the gap.

【0076】次に、本発明の別の実施例について説明す
るが、その前にまず、図6のブロック図を参照しなが
ら、送信側の音声符号器不連続送信システムについて説
明する。A/D変換器600からの信号601は、音声
符号器602によってフレームごとに処理される。上記
の場合と同様に、フレームの長さは、通常20ミリ秒で
ある。また、音声信号601のサンプリング周波数は一
般に8kHzである。音声符号器602は入力音声をフ
レームごとに一組のパラメータ603に符号化する。こ
うして得られたパラメータは、ディジタル移動無線ユニ
ットの無線サブシステム611から受信(RX)側に向
けて送信される。
Next, another embodiment of the present invention will be described. Before that, first, the voice encoder discontinuous transmission system on the transmission side will be described with reference to the block diagram of FIG. The signal 601 from the A / D converter 600 is processed by the speech encoder 602 on a frame-by-frame basis. As in the above case, the frame length is typically 20 ms. The sampling frequency of the audio signal 601 is generally 8 kHz. Speech encoder 602 encodes the input speech frame by frame into a set of parameters 603. The parameters thus obtained are transmitted from the radio subsystem 611 of the digital mobile radio unit to the reception (RX) side.

【0077】不連続送信動作は、送信側の音声状態検出
装置によって間接的に制御される。音声状態検出装置6
04の基本的な機能は、音声信号中に存在する雑音と、
音声が存在せずに雑音のみが存在する場合の雑音とを識
別することである。音声状態検出装置604は、入力信
号が音声を含むのかあるいは全く音声を含んでいないの
かを連続的に監視判定する。音声状態検出装置604の
動作は、音声符号器602およびその内部変数605に
基づいて行われる。音声状態検出装置604は、音声が
存在する場合には1の値をとり、音声が存在しない場合
には0をとる2値の音声状態フラッグ606を出力す
る。音声状態検出装置604の動作は、標準GSM0
6.82に定められているように、フレームを単位とし
て行われる。
The discontinuous transmission operation is indirectly controlled by the voice state detecting device on the transmitting side. Voice state detection device 6
The basic function of 04 is the noise present in the voice signal,
It is to distinguish the noise when there is no voice but only noise. The voice state detection device 604 continuously monitors and determines whether the input signal contains voice or does not contain voice at all. The operation of the voice state detecting device 604 is performed based on the voice encoder 602 and its internal variable 605. The voice state detection device 604 outputs a binary voice state flag 606 that takes a value of 1 when voice is present and takes a value of 0 when voice is not present. The operation of the voice state detecting device 604 is based on the standard GSM0.
The frame is used as a unit as defined in 6.82.

【0078】それぞれが2値のSPフラッグ607と対
応づけられたトラフィックフレームが音声符号器不連続
送信ハンドラ612から、無線サブシステム611に連
続的に送られる。無線サブシステム611は、不連続送
信ハンドラ612から送られてきたトラフィックフレー
ムが音声フレーム(SPフラッグ=「1」)なのか、あ
るいはいわゆる無声識別子(SID)フレーム(すなわ
ち、快適化雑音パラメータメッセージ)(SPフラッグ
=「0」)なのかを、SPフラッグ607によって知る
ことができる。無線サブシステム611は、SPフラッ
グ607の状態に基づいたタイミングで、フレームを空
中へ電波として発信する。
Traffic frames, each associated with a binary SP flag 607, are continuously sent from the voice encoder discontinuous transmission handler 612 to the radio subsystem 611. The wireless subsystem 611 determines whether the traffic frame sent from the discontinuous transmission handler 612 is a voice frame (SP flag = "1") or a so-called unvoiced identifier (SID) frame (that is, a comfort noise parameter message) ( Whether the SP flag = “0”) can be known by the SP flag 607. The wireless subsystem 611 transmits the frame as a radio wave to the air at a timing based on the state of the SP flag 607.

【0079】上記の不連続送信における基本的な問題は
以下のようなものである。すなわち、音声と共に送信さ
れていた可聴背景雑音が、送信が休止されたときに消え
てしまうために、受信側では、背景雑音が不連続となっ
てしまう。送信と送信休止とが短時間内に頻繁に繰り返
されると、上記の背景雑音の不連続性は聞き苦しい不快
感を受信側のユーザに与える。自動車などの背景雑音が
大きい環境においては、この不自然さは特に目立ったも
のとなる。最悪の場合、この不連続性によって、音声が
判別できなくなることもある。
The basic problem in the above discontinuous transmission is as follows. That is, the audible background noise that was transmitted with the voice disappears when the transmission is paused, so that the background noise becomes discontinuous on the receiving side. If the transmission and the transmission pause are frequently repeated within a short period of time, the discontinuity of the background noise described above causes an unpleasant feeling to the receiving user. This unnaturalness becomes particularly noticeable in an environment where background noise is large, such as an automobile. In the worst case, this discontinuity may make speech indistinguishable.

【0080】この問題に対する既知の解決方法の一つと
して、送信が中断されたときに、受信側において、送信
側において存在する背景雑音と類似の雑音(すなわち快
適化雑音)を合成することが行われている。すでに述べ
たように、快適化雑音を発生させるのに必要なパラメー
タは、送信側の音声符号器(図6のブロック608)に
よって求められ、送信が中断される前にSIDフレーム
によって受信側に送信される。その後、低速度でパラメ
ータが繰り返し送信される。このようにすることによっ
て、受信側で発生する快適化雑音を、送信側の実際の背
景雑音の変化に対応させるようにすることが可能とな
る。
As one of the known solutions to this problem, when the transmission is interrupted, the receiving side can synthesize noise similar to the background noise present at the transmitting side (ie comfort noise). It is being appreciated. As already mentioned, the parameters needed to generate the comfort noise are determined by the sender's speech coder (block 608 in FIG. 6) and transmitted to the receiver by the SID frame before the transmission is interrupted. To be done. After that, the parameters are repeatedly transmitted at low speed. By doing so, it becomes possible to make the comfort noise generated on the receiving side correspond to the actual change of the background noise on the transmitting side.

【0081】送信側において決定される快適化雑音パラ
メータが、実際の可聴背景雑音のレベルとスペクトルの
エンベロープとを適切に表していれば、受信側において
高品質の快適化雑音を発生させることが可能であること
が知られている。背景雑音のこれらの特性は時間ととも
にわずかに変化する。従って、良好な快適化雑音を生成
するには、背景雑音のレベルとスペクトルのエンベロー
プを表すパラメータを音声符号器によって生成するにあ
たって、これらのパラメータをいくつかの音声フレーム
に対して平均化することが必要である。GSM全速音声
符号器および拡張全速符号器における不連続送信方式
(GSM06.31およびGSM06.81を参照)に
おいては、SID平均化期間の長さは、それぞれ、4フ
レームおよび8フレームであり、また1フレームの長さ
は20ミリ秒である。
If the comfort noise parameter determined at the transmitter properly represents the level of actual audible background noise and the envelope of the spectrum, it is possible to generate high quality comfort noise at the receiver. Is known to be. These characteristics of background noise change slightly over time. Therefore, in order to generate good comfort noise, the parameters representing the level of background noise and the envelope of the spectrum are generated by the speech coder and these parameters are averaged over several speech frames. is necessary. In the discontinuous transmission scheme in the GSM full-rate speech encoder and the extended full-rate encoder (see GSM06.31 and GSM06.81), the length of the SID averaging period is 4 frames and 8 frames, respectively, and 1 The frame length is 20 milliseconds.

【0082】音声バーストの終りに送信を中断する前
に、適化雑音パラメータを求め、これを最初のSIDフ
レームに含めて受信側に対して送信するようにするため
に、先に述べたように、ハングオーバ期間が用いられ
る。ハングオーバは、音声状態検出装置604によって
音声が存在しないと判定された期間(すなわちVADフ
ラッグ606=「0」)であって、かつ、音声フレーム
の送信がまだ停止されていない(すなわちSPフラッグ
607=「1」)期間である。この点に関しては、図7
も参照のこと。ハングオーバ期間においては、音声状態
検出装置604によって、音声が存在しないとの判定が
すでになされているので、音声フレームは雑音のみしか
含まない(音声を含まない)ことが保証されており、従
って、これらのハングオーバフレームの音声符号化パラ
メータを平均化することによって、快適化雑音パラメー
タを求めることができる。
Before the transmission is interrupted at the end of the voice burst, the optimized noise parameter is obtained and included in the first SID frame to be transmitted to the receiving side as described above. , A hangover period is used. The hangover is a period (that is, VAD flag 606 = “0”) in which it is determined that the voice is not present by the voice state detection device 604, and the transmission of the voice frame is not stopped yet (that is, the SP flag 607 =). "1") period. In this regard, FIG.
See also. During the hangover period, the voice state detection device 604 has already determined that there is no voice, so it is guaranteed that the voice frame contains only noise (not voice), and thus these The comfort noise parameter can be determined by averaging the speech coding parameters of the hangover frame of.

【0083】ハングオーバ期間の長さは、SID平均化
期間の長さによって定まる。すなわち、ハングオーバ期
間は、得られた快適化雑音パラメータをSIDフレーム
によって送信する前に、パラメータの平均化を行うのに
必要とされる十分な長さを有していることが必要であ
る。GSM全速音声符号器の不連続送信方式において
は、前のフレームのパラメータを用いてSIDフレーム
を更新する方法により快適化雑音を決定するために、ハ
ングオーバ期間の長さ(SID平均化期間の長さ)は、
4フレームでよい。一方、GSM拡張全速音声符号器の
不連続送信方式においては、ハングオーバ期間の長さ
は、7フレーム(SID平均化期間の長さ−1)であ
り、SID平均化期間の第8番目のフレームのパラメー
タは、音声符号器が最初のSIDフレームの処理を行っ
ている間に取得される。図7に、GSM拡張全速音声符
号化不連続送信方式におけるハングオーバ期間およびS
ID平均化期間の概念を示す。
The length of the hangover period is determined by the length of the SID averaging period. That is, the hangover period should have a sufficient length needed to average the obtained comfort noise parameters before transmitting them in the SID frame. In the discontinuous transmission method of the GSM full-speed speech encoder, the length of the hangover period (the length of the SID averaging period) is used to determine the comfort noise by the method of updating the SID frame using the parameters of the previous frame. ) Is
4 frames is enough. On the other hand, in the discontinuous transmission method of the GSM extended full speed speech encoder, the length of the hangover period is 7 frames (the length of the SID averaging period-1), and the length of the 8th frame of the SID averaging period is The parameters are obtained while the speech encoder is processing the first SID frame. FIG. 7 shows a hangover period and S in the GSM extended full-speed voice coding discontinuous transmission system.
The concept of the ID averaging period is shown.

【0084】ハングオーバ期間が終ると、最初のSID
フレームが送信される。快適化雑音算出アルゴリズムを
用いた、背景雑音の特性の評価が引き続いて行われ、更
新されたSIDフレームが、無線サブシステム611に
フレーム単位で送られる。このSIDフレームの送信
は、音声状態検出装置604が、会話音声が存在しない
と判定している間は、引き続いて行われる。SID平均
化期間が終了すると、送信側の不連続送信ハンドラ61
2は、SID平均化期間快適化雑音算出アルゴリズム6
08に対して、SID平均化期間が終了したことをフラ
ッグ609によって通知する。フラッグ609は、通常
は、リセット状態である「0」になっているが、更新さ
れたSIDフレームが無線サブシステム611に送られ
る際に「1」にセットされる。フラッグ609がセット
されると、快適化雑音算出アルゴリズム608は、パラ
メータの平均化を行って、無線サブシステム611によ
って用いられる更新されたSIDフレームを作成する。
更新されたSIDフレームは、無線サブシステム611
に送られるとともに、SIDメモリブロック610にも
書き込まれる。SIDメモリブロック610には、常に
最新のSIDフレームが記憶されており、後の処理で用
いられる。
At the end of the hangover period, the first SID
The frame is transmitted. The background noise characteristics are subsequently evaluated using the comfort noise calculation algorithm, and the updated SID frame is sent to the wireless subsystem 611 on a frame-by-frame basis. The SID frame is continuously transmitted while the voice state detecting device 604 determines that there is no conversation voice. When the SID averaging period ends, the discontinuous transmission handler 61 on the transmitting side
2 is the SID averaging period comfort noise calculation algorithm 6
08 is notified by a flag 609 that the SID averaging period has ended. The flag 609 is normally in a reset state of "0", but is set to "1" when the updated SID frame is sent to the wireless subsystem 611. When the flag 609 is set, the comfort noise calculation algorithm 608 averages the parameters to create an updated SID frame used by the wireless subsystem 611.
The updated SID frame is transmitted to the wireless subsystem 611.
And written to the SID memory block 610 as well. The latest SID frame is always stored in the SID memory block 610 and is used in the subsequent processing.

【0085】音声バーストが終ったときに、最後のSI
Dフレームが無線サブシステムに送られてから経過した
時間が24フレーム以下である場合には、上記最後のS
IDフレームがSIDメモリ610から繰り返し読み出
されて無線サブシステム611に送られる。上記の動作
は、更新された新しいSIDフレームが用意されるま
で、すなわち、次のSID平均化期間が終了するまで続
けられる。このようにすると、短いスパイク状の背景雑
音が音声であると誤認されたときに、新しいSIDフレ
ームを算出するためのハングオーバ期間を音声バースト
の最後に挿入する必要がないので、伝送効率を改善する
ことができる。
When the voice burst ends, the last SI
If the time elapsed since the D frame was sent to the wireless subsystem is 24 frames or less, the last S
The ID frame is repeatedly read from the SID memory 610 and sent to the wireless subsystem 611. The above operation is continued until an updated new SID frame is prepared, that is, until the next SID averaging period ends. This improves transmission efficiency because it is not necessary to insert a hangover period for calculating a new SID frame at the end of a voice burst when a short spiked background noise is mistaken for voice. be able to.

【0086】図8は、一例として、ハングオーバなしに
可能な限り最も長く続いた場合の音声バーストを示した
ものである。2値フラッグ613は、SIDメモリ61
0に、更新された新しいSIDフレームをSIDメモリ
610にいつ記憶するか、また、最も新しい更新された
SIDフレームをSIDメモリ610から無線サブシス
テム611にいつ送るかを知らせるのに用いられる。S
Pフラッグ607が「0」である場合、SIDメモリ6
10は、各フレームにおいて、SIDフレームを記憶す
べきなのか、あるいは送信すべきであるのかを決定す
る。
FIG. 8 shows, by way of example, a voice burst when it lasts as long as possible without a hangover. The binary flag 613 is the SID memory 61.
0 is used to indicate when to store an updated new SID frame in the SID memory 610 and when to send the latest updated SID frame from the SID memory 610 to the wireless subsystem 611. S
If the P flag 607 is "0", the SID memory 6
10 determines in each frame whether the SID frame should be stored or transmitted.

【0087】GSM拡張全速音声符号器不連続送信シス
テムにおいて、2値フラッグ614は、雑音算定アルゴ
リズムに、ハングオーバ期間の終了を知らせるためにも
必要である。フラッグ614は、通常は、「0」にリセ
ットされているが、音声バーストの後のハングオーバ期
間の後の最初のSIDフレームが送信される1フレーム
期間の間、「1」に立ち上げられる。
In the GSM enhanced full rate speech coder discontinuous transmission system, the binary flag 614 is also necessary to inform the noise estimation algorithm of the end of the hangover period. Flag 614, which is normally reset to "0", is raised to "1" for one frame period during which the first SID frame after the hangover period after the voice burst is transmitted.

【0088】図9は、不連続送信システムの受信(R
X)側における音声復号器を示すブロック図である。デ
ィジタル移動無線ユニットの無線サブシステム700か
ら入力される一連の音声符号化パラメータ701がフレ
ームごとに音声復号器702によって処理され、音声信
号703が合成される。得られた音声信号703はD/
A(ディジタル−アナログ)変換器704に供給され
る。D/A変換器704は受信側のユーザに対して可聴
音声信号を発生させる。
FIG. 9 shows the reception (R
It is a block diagram which shows the audio | voice decoder in the (X) side. A series of speech coding parameters 701 input from the radio subsystem 700 of the digital mobile radio unit are processed frame by frame by the speech decoder 702 to synthesize a speech signal 703. The obtained audio signal 703 is D /
It is supplied to the A (digital-analog) converter 704. The D / A converter 704 generates an audible voice signal for the receiving user.

【0089】受信側不連続送信システムは、無線サブシ
ステムから、2値SPフラッグ705を受け取る。この
フラッグは、送信側のSPフラッグと対照的に動作す
る。すなわち、音声フレームが受信された場合には、S
Pフラッグ=「1」となり、SIDフレームが受信され
るか、または送信が中断されるとSPフラッグ=「0」
となる。また、無線サブシステム700からの2値フラ
ッグ706によって、新たに受信されたSIDフレーム
の有無が、快適化雑音発生アルゴリズム707に対して
知らされる。すなわち、このフラッグは通常は「0」に
リセットされているが、SPフラッグ705が「0」の
ときに新しいSIDフレームが受信されると「1」にセ
ットされる。
The receiving side discontinuous transmission system receives the binary SP flag 705 from the radio subsystem. This flag operates in contrast to the sending SP flag. That is, if an audio frame is received, S
When the P flag is "1" and the SID frame is received or the transmission is interrupted, the SP flag is "0".
Becomes Also, a binary flag 706 from the radio subsystem 700 informs the comfort noise generation algorithm 707 of the presence or absence of a newly received SID frame. That is, this flag is normally reset to "0", but is set to "1" when a new SID frame is received while the SP flag 705 is "0".

【0090】SPフラッグ705=「0」であり、従っ
て、送信が休止状態にあるとき、音声復号器702の快
適化雑音発生ブロック707は、SIDフレームに含ま
れる送信側の背景雑音の特徴を表すデータに基づいて、
快適化雑音を発生させる。送信休止期間中においては、
更新されたSIDフレームが遅い繰り返し速度で送られ
て来るが、これらの更新SIDフレームの間の復号化快
適化雑音パラメータを内挿によって求めることによっ
て、より滑らかに快適化雑音の特性が変化するようにす
ることができる。
The SP flag 705 = "0", so when the transmission is dormant, the comfort noise generation block 707 of the speech decoder 702 represents the characteristic of the background noise on the transmitting side contained in the SID frame. Based on the data
Generate comfort noise. During the transmission suspension period,
Although the updated SID frame is sent at a slow repetition rate, it is possible to smoothly change the characteristics of the comfort noise by interpolating the decoded comfort noise parameter between these updated SID frames. Can be

【0091】GSM全速音声符号化不連続送信システム
においては、新たに更新SIDフレームを算出して無線
サブシステム611(図6)に送出するときには、背景
雑音の特性(レベルおよびスペクトル)を表すパラメー
タが、SID平均化期間の間、平均化された後、通常の
音声符号化モードにおけるのと同じ量子化方法を用いて
スカラー量子化される。同様に、SIDフレームが、G
SM全速音声復号器702に到着すると、無声記述子パ
ラメータが、通常の音声復号化モードに用いられるのと
同じ逆量子化方法(例えばGSM06.12を参照)を
用いて復号される。
In the GSM full-speed voice coding discontinuous transmission system, when a new updated SID frame is newly calculated and sent to the radio subsystem 611 (FIG. 6), the parameters indicating the characteristics (level and spectrum) of background noise are set. , SID is averaged during the SID averaging period and then scalar quantized using the same quantization method as in the normal speech coding mode. Similarly, if the SID frame is G
Upon arrival at the SM full speed speech decoder 702, the unvoiced descriptor parameters are decoded using the same dequantization method used in the normal speech decoding mode (see eg GSM06.12).

【0092】GSM拡張全速音声符号化不連続送信シス
テムにおいては、新しいSIDフレームの算出を行うと
きに、背景雑音のスペクトルを表すパラメータ(LSP
パラメータ)のSID平均化期間における平均が算出さ
れ、またベクトルの量子化が、通常の音声符号化モード
においてパラメータの量子化を行うのに用いられるのと
同じ量子化テーブルを用いて行われる。これらのスペク
トルパラメータは、復号器702によって、通常の音声
符号化モードにおいて用いられる予測逆量子化テーブル
と同じテーブルを用いて逆量子化される。また、新しい
SIDフレームを算出するにあたっては、背景雑音のレ
ベルを表すパラメータ(固定コードブック利得)がSI
D平均化期間において平均化された後に、通常の音声符
号化モードにおいて量子化に用いられるスカラ予測量子
化テーブルを用いて量子化される。復号器において、こ
れらのパラメータは、通常の音声復号モードにおいて用
いられる予測逆量子化テーブルと同じテーブルを用いて
逆量子化される。
In the GSM extended full-speed voice coding discontinuous transmission system, when calculating a new SID frame, a parameter (LSP) representing the spectrum of background noise is used.
The average of (parameters) in the SID averaging period is calculated, and the vector is quantized using the same quantization table that is used to quantize the parameters in the normal speech coding mode. These spectral parameters are dequantized by the decoder 702 using the same table as the predictive dequantization table used in the normal speech coding mode. When calculating a new SID frame, the parameter (fixed codebook gain) representing the level of background noise is set to SI.
After being averaged in the D averaging period, quantization is performed using a scalar prediction quantization table used for quantization in a normal speech coding mode. At the decoder, these parameters are dequantized using the same table as the predictive dequantization table used in the normal speech decoding mode.

【0093】しかし、予測量子化器を適応制御する場合
には、上記の量子化方法を、SIDフレームによって送
ろうとしている快適化雑音パラメータの量子化に用いる
には困難が存在する。その理由は、会話音声が途絶えた
ときに、送信が中断されるために、符号器および復号器
のそれぞれの量子化器および逆量子化の予測子のフレー
ムごとの同期を維持することが不可能であるからであ
る。しかし、量子化器の予測子の値を、符号器および復
号器において同じ方法で局所的に見積もることが以下に
述べるようにして可能である。すなわち、最も新しい7
個の音声フレームの量子化されたLSPおよび固定コー
ドブック利得パラメータを、符号器602および復号器
702の両方に局所的に記憶する。音声バーストの終わ
りのハングオーバ期間が終了したときに、これらの記憶
されたパラメータの平均値を求める。このようにして得
られた平均パラメータ、すなわち、基準LSPパラメー
タベクトルfref、基準固定コードブック利得g
c refは、符号器602と復号器702とで同じ値を有す
る。その理由は、量子化において、量子化LSPおよび
固定コードブック利得のいずれも、通常の音声符号化モ
ードにおいて、符号器602と復号器702とで同じ値
を有するからである。上記の基準LSPパラメータベク
トルfrefおよび基準固定コードブック利得gc refの平
均値は、次の音声バーストの後のハングオーバ期間まで
の間、凍結維持される。この凍結維持された平均値が、
量子化アルゴリズムの通常の予測子の代わりに、快適化
雑音パラメータの量子化に用いられる。
However, in the case of adaptively controlling the predictive quantizer, it is difficult to use the above quantization method for the quantization of the comfort noise parameter to be transmitted by the SID frame. The reason is that it is not possible to maintain the frame-by-frame synchronization of the quantizer and dequantizer predictors of the encoder and decoder, respectively, because the transmission is interrupted when the speech is interrupted. Because it is. However, it is possible to locally estimate the quantizer predictor value in the same way in the encoder and decoder, as described below. Ie the newest 7
The quantized LSP and fixed codebook gain parameters of the speech frame are stored locally in both encoder 602 and decoder 702. At the end of the hangover period at the end of the voice burst, the average value of these stored parameters is determined. The average parameters thus obtained, that is, the reference LSP parameter vector f ref , the reference fixed codebook gain g
c ref has the same value in the encoder 602 and the decoder 702. The reason is that in quantization, both the quantized LSP and the fixed codebook gain have the same value in the encoder 602 and the decoder 702 in the normal speech encoding mode. The average value of the above reference LSP parameter vector f ref and the reference fixed codebook gain g c ref is kept frozen until the hangover period after the next voice burst. This frozen average value is
It is used to quantize the comfort noise parameters instead of the normal predictor of the quantization algorithm.

【0094】図9に戻り、受信側の不連続送信ハンドラ
708は、SPフラッグ705を入力として受け取り、
音声バーストの後にハングオーバ期間が発生すると、1
フレームの期間だけ2値フラッグ709を「1」にセッ
トして出力する。なお、このフラッグ709は、その他
の期間においては「0」にリセットされている。フラッ
グ709は、GSM拡張全速音声復号器702の不連続
送信システムにおいて、快適化雑音発生アルゴリズム7
07に対して、平均化処理による基準LSPパラメータ
ベクトルfrefおよび基準固定コードブック利得gc ref
の更新をいつ行うべきかを知らせるのに用いられる(G
SM06.62を参照)。フラッグ709の値を決定す
る方法については、フィンランド特許出願第95325
2号明細書およびこれに対応する米国特許出願第08/
672,932号明細書(1996年6月28日出
願)、国際出願第PCT/FI96/00369号明細
書に開示されており、これらのすべてをここに参照併合
する。
Returning to FIG. 9, the discontinuous transmission handler 708 on the receiving side receives the SP flag 705 as an input,
1 if a hangover period occurs after a voice burst
The binary flag 709 is set to "1" and output only during the frame period. The flag 709 is reset to "0" in other periods. The flag 709 is used for the comfort noise generation algorithm 7 in the discontinuous transmission system of the GSM extended full speed speech decoder 702.
07, the reference LSP parameter vector f ref and the reference fixed codebook gain g c ref by the averaging process.
Used to signal when to update the
See SM06.62). For a method of determining the value of flag 709, see Finnish Patent Application No. 95325.
No. 2 and corresponding US patent application Ser. No. 08 /
No. 672,932 (filed June 28, 1996), International Application No. PCT / FI96 / 00369, all of which are incorporated herein by reference.

【0095】以上に説明したように、最近の音声符号器
においては、音声符号化パラメータは、予測法を用いた
量子化が行われている。すなわち、量子化器は、量子化
する値を可能な限り正確に予測しようと試みる。このよ
うな予測量子化器では、通常、実際のパラメータの値と
予測されたパラメータの値との差あるいは商が量子化さ
れて受信側に送信される。受信側の、上記の量子化と対
応する逆量子化器は、量子化器と同様な予測子を有して
いる。従って、受信した差あるいは商の値を予測値に加
算あるいは掛けることによって、送信側で量子化された
パラメータの値を再生することができる。
As described above, in recent speech encoders, the speech coding parameters are quantized using the prediction method. That is, the quantizer attempts to predict the quantized value as accurately as possible. In such a predictive quantizer, the difference or quotient between the actual parameter value and the predicted parameter value is usually quantized and transmitted to the receiving side. The inverse quantizer on the receiving side, which corresponds to the above quantization, has a predictor similar to that of the quantizer. Therefore, the value of the parameter quantized on the transmission side can be reproduced by adding or multiplying the received difference or quotient value to the predicted value.

【0096】このような予測量子化器では、通常、量子
化の結果を用いて各量子化の後に予測子の更新を行う適
合化が行われる。量子化器および逆量子化器のいずれの
予測子も互いの間の同期が維持されるように、上記の再
生された量子化パラメータの値を用いて更新される。
In such a predictive quantizer, the adaptation is usually performed by using the result of the quantization and updating the predictor after each quantization. The predictors of both the quantizer and dequantizer are updated with the values of the reconstructed quantization parameters so that they remain synchronized with each other.

【0097】しかしながら、このような予測量子化器の
適応を行う量子化方式を、SIDフレームによって送ら
れる快適化雑音パラメータを量子化するのに用いるには
困難が存在する。すなわち、会話音声が途絶えている間
は、送信が中断されてしまうので、符号器602および
復号器702の量子化器および逆量子化器の予測子をフ
レーム単位で同期をとることができない。
However, there are difficulties in using such a quantization scheme that adapts the predictive quantizer to quantize the comfort noise parameters sent by the SID frame. That is, since the transmission is interrupted while the conversational voice is interrupted, the quantizers of the encoder 602 and the decoder 702 and the predictors of the dequantizer cannot be synchronized on a frame-by-frame basis.

【0098】予測量子化器が通常の会話音声を符号化す
る際に用いるのと同一の量子化テーブルを、快適化雑音
パラメータの量子化に用いることがもし可能であれば、
その方が望ましい。そのためには、不連続送信中におけ
る予測を、適合化を行わずに行うようにする必要があ
る。量子化器が背景雑音特性の変化に対応してパラメー
タの値を符号化することができるようにするためには、
現在の背景雑音の平均パラメータの値に可能な限り近い
値を予測子が有していることが必要である。また、量子
化器および逆量子化器のいずれにおいても同一の予測値
が利用可能であることが望まれる。
The same quantization table used by the predictive quantizer to encode normal speech can be used to quantize comfort noise parameters, if possible:
That is preferable. For that purpose, it is necessary to perform prediction during discontinuous transmission without performing adaptation. To enable the quantizer to encode the value of the parameter in response to changes in the background noise characteristic,
It is necessary that the predictor has a value as close as possible to the value of the current background noise average parameter. Further, it is desirable that the same predicted value can be used in both the quantizer and the dequantizer.

【0099】すでに述べたように、SIDフレームによ
って送られる快適化雑音を量子化するにあたって、良好
な予測値を得る一つの方法は、通常の音声符号化モード
によって量子化されたパラメータの値をハングオーバ期
間の間、記憶して、この記憶された量子化されたパラメ
ータの値の平均値をハングオーバ期間の最後に求め、こ
のようにして得られた予測子の平均値を、次のハングオ
ーバ期間まで凍結保持するようにすることである。しか
し、この方法は、GSMあるいはこれに類似の不連続送
信方式においては、音声復号器702が、音声バースト
の最後のハングオーバ期間がいつ起こったかを知ること
ができないという問題がある。
As already mentioned, in quantizing the comfort noise sent by the SID frame, one way to obtain a good predictive value is to hang over the value of the parameter quantized by the normal speech coding mode. During the period, store and average the value of this stored quantized parameter at the end of the hangover period and freeze the average value of the predictor thus obtained until the next hangover period. It is to hold. However, this method has the problem that in GSM or similar discontinuous transmission schemes, the speech decoder 702 cannot know when the last hangover period of a speech burst has occurred.

【0100】上記の問題点に鑑み、本発明の目的とする
ところは、音声復号器702に対して、音声バーストの
最後のハングオーバ期間の発生を知らせる方法を提供す
ることである。上記目的は、好適には、音声符号器60
2から音声復号器702に対して、ハングオーバ期間情
報を副次情報としてSIDフレーム(すなわち、快適化
雑音パラメータメッセージ)によって送信することによ
って達成される。
In view of the above problems, it is an object of the present invention to provide a method for informing the speech decoder 702 of the occurrence of the last hangover period of a speech burst. The above purpose is preferably a speech coder 60.
2 to the speech decoder 702 by sending the hangover period information as side information in a SID frame (ie a comfort noise parameter message).

【0101】本発明のこの方法について、図10を用い
てさらに説明する。図10における方式では、2値フラ
ッグ709は、受信側不連続送信ハンドラによって発生
した値を用いるのではなく、送信チャネルを介してSI
Dフレームによって符号器602から送られてくる値が
用いられる。従って、本発明の予測方式で逆量子化を行
うのに、復号器702において局所的にフラッグ709
を発生させる必要がなく、従って、受信側の不連続送信
ハンドラブロック708は、もはや必要ではない。本発
明のこの方式では、フラッグ709は、ハングオーバ期
間の後の最初のSIDフレームにおいて「1」に立ち上
げられる。ただし、最初のSIDフレームに先行するハ
ングオーバ期間が存在しない場合には、最初のSIDフ
レームのフラッグ709は、「0」にリセットされる。
快適化雑音挿入期間中の2番目以降のSIDフレームで
は、フラッグ709は常に「0」にリセットされる。
This method of the present invention will be further described with reference to FIG. In the scheme in FIG. 10, the binary flag 709 does not use the value generated by the receiving side discontinuous transmission handler, but uses the SI via the transmission channel.
The value sent from the encoder 602 by the D frame is used. Therefore, in order to perform the inverse quantization by the prediction method of the present invention, the flag 709 is locally generated in the decoder 702.
Need not be generated, and therefore the discontinuous transmit handler block 708 on the receiving side is no longer needed. In this scheme of the invention, flag 709 is raised to "1" in the first SID frame after the hangover period. However, if the hangover period preceding the first SID frame does not exist, the flag 709 of the first SID frame is reset to "0".
In the second and subsequent SID frames during the comfort noise insertion period, the flag 709 is always reset to "0".

【0102】本発明のこの方法の利点は、音声復号器
が、音声バーストの最後にハングオーバ期間が存在する
かどうかを局所的に判定するための不連続送信ハンドラ
708を必要としないことである。そのために、受信側
の不連続送信ハンドラ708によって用いらたプログラ
ム命令が不用となり、音声復号器702の計算負荷が軽
減される。
An advantage of this method of the invention is that the speech decoder does not need the discontinuous transmit handler 708 to locally determine if there is a hangover period at the end of the speech burst. Therefore, the program instruction used by the discontinuous transmission handler 708 on the receiving side becomes unnecessary, and the calculation load of the speech decoder 702 is reduced.

【0103】本発明の、ハングオーバ期間の存在に関す
る情報を復号器702に対して供給する方法に関する他
の利点は、ハングオーバ期間が終わる度ごとに、符号器
602および復号器702において、疑似雑音励起信号
発生器を同期して再初期化することが可能となることで
ある。本発明の、ハングオーバ期間の存在に関する情報
を復号器702に対して供給する方法に関するさらに他
の利点は、ハングオーバ期間が音声バーストの最後に存
在するかあるいは存在しないかに応じて、受信した快適
化雑音パラメータの内挿処理を、いろいろな方法を用い
て行うことが可能となることであり、これにより、音声
バーストが短い場合に起こり得る、快適化雑音のレベル
あるいはスペクトルの階段状変化に起因する快適化雑音
の知覚的不自然さを低減することができる。
Another advantage of the method of the present invention in providing information about the presence of a hangover period to the decoder 702 is that the pseudo noise excitation signal is generated at the encoder 602 and the decoder 702 each time the hangover period ends. It is possible to reinitialize the generator synchronously. Yet another advantage of the method of the present invention for providing information about the presence of a hangover period to the decoder 702 is the received comfort depending on whether the hangover period is present or absent at the end of the voice burst. It will be possible to interpolate the noise parameters using various methods, which result from the level of comfort noise or a step change in the spectrum that can occur when the speech burst is short. The perceptual unnaturalness of comfort noise can be reduced.

【0104】本発明をさらに詳細に説明する前に、図1
2および13を参照しながら、本発明を適用可能な、無
線ユーザ端末、あるいは移動局10(例えばこれらに限
定されるわけではないがセルラ電話あるいは携帯電話な
ど)について説明する。移動局10は、基地局30と信
号を送受するためのアンテナ12を有している。基地局
30は、例えば、移動局交換局(MSC)34を含めた
基地局/移動局交換局機能(BMI)32を含むセルラ
通信網の一部である。MSC34は、移動局10が通話
を行う際に、移動局10と地上中継線との接続を行う。
本発明においては、移動局10が、送信側であり、一
方、地上局が受信側となっているものとする。また、基
地局30は、符号化された音声パラメータと不連続送信
方式快適化雑音パラメータを受信して処理するための適
当な受信機および音声復号器を後に述べるように備えて
いるものとする。
Prior to describing the invention in further detail, FIG.
With reference to 2 and 13, a wireless user terminal or a mobile station 10 (for example, but not limited to, a cellular phone or a mobile phone) to which the present invention is applicable will be described. The mobile station 10 has an antenna 12 for transmitting and receiving signals to and from the base station 30. The base station 30 is, for example, part of a cellular communication network including a base station / mobile station switching center function (BMI) 32 including a mobile switching center (MSC) 34. The MSC 34 connects the mobile station 10 to the ground relay line when the mobile station 10 makes a call.
In the present invention, it is assumed that the mobile station 10 is the transmitting side, while the ground station is the receiving side. It is also assumed that the base station 30 is equipped with a suitable receiver and speech decoder for receiving and processing the encoded speech parameters and the discontinuous transmission comfort noise parameters, as will be described later.

【0105】移動局は、変調器(MOD)14A、送信
機14、受信機16、復調器(DEMOD)16A、お
よび送信機14、受信機16と信号を送受するコントロ
ーラ18とから成っている。上記信号には、セルラーシ
ステムの無線インタフェース標準、およびユーザの音声
および/あるいはユーザが発生するデータに応じた信号
情報が含まれる。本発明においては、無線インタフェー
ス標準は、物理的および論理的フレーム構造に関する標
準を含んでいると仮定されている。ただし、本発明が、
これらの具体的な物理的、論理的フレーム構造に限定さ
れるわけではない。また、本発明は、IS−136ある
いはこれと類似の互換性のある移動局、あるいはTDM
A方式のシステムに対しての適用のみに限定されるわけ
ではない。また、本発明では、無線インタフェース標準
は、不連続送信モード動作をサポートしているものと仮
定されている。
The mobile station comprises a modulator (MOD) 14A, a transmitter 14, a receiver 16, a demodulator (DEMOD) 16A, a transmitter 14, a receiver 16 and a controller 18 for transmitting and receiving signals. The signals include signal information according to the cellular system's air interface standard and the user's voice and / or user generated data. In the present invention, air interface standards are assumed to include standards for physical and logical frame structure. However, the present invention is
It is not limited to these specific physical and logical frame structures. The present invention also provides a compatible mobile station, such as IS-136 or similar, or TDM.
The application is not limited to the A-type system. Also, in the present invention, the air interface standard is assumed to support discontinuous transmission mode operation.

【0106】また、コントローラ18は、移動局におい
て必要な音声および論理機能を実現するための回路も含
んでいる。例えば、コントローラ18は、ディジタル信
号処理装置、マイクロプロセッサ、A/D変換器、D/
A変換器、その他の各種の回路から成る。移動局の制御
および信号処理の機能が、これらのデバイスにそれぞの
能力に応じて割り当てられる。本発明による、不連続送
信において快適化雑音を発生させるための改善された方
法と装置において必要となる音声符号器およびその他の
機能を、コントローラ18が有しているものと仮定され
ている。これらの機能のすべては、ソフトウェアで実現
することも可能であり、また、すべてをハードウェアで
実現することも可能である。あるいは、ハードウェアと
ソフトウェアとの両方を用いて実現することも可能であ
る。
The controller 18 also includes circuits for implementing the voice and logic functions required in the mobile station. For example, the controller 18 includes a digital signal processing device, a microprocessor, an A / D converter, a D / D converter,
It is composed of an A converter and various other circuits. Mobile station control and signal processing functions are assigned to these devices according to their capabilities. It is assumed that the controller 18 has the speech coder and other functions required in the improved method and apparatus for generating comfort noise in discontinuous transmission according to the present invention. All of these functions can be realized by software, or all of them can be realized by hardware. Alternatively, it can be realized using both hardware and software.

【0107】また、ユーザインタフェースとして、通常
用いられているイヤホンあるいはスピーカー17、A/
D変換器および音声符号器と結合されたマイクロホン1
9などの音声トランスデューサ、遅延回路20、キーパ
ッド22などのユーザ入力デバイスが備えられており、
これらはすべてコントローラ18に接続されている。キ
ーパッド22は、移動局10を操作するのに必要な、通
常の数字(0−9)や関連したキー(#、*)22a、
およびその他のキー22bを有している。その他のキー
22bとしては、例えば、「送信」キー、各種のメニュ
ースクロールキー、ソフトキー、電源スイッチキーなど
がある。また、移動局10は、移動局の動作に必要な各
種の回路に対して電力を供給するためのバッテリ26を
有している。
As a user interface, the earphone or speaker 17, which is usually used, and A /
Microphone 1 coupled with D converter and speech coder
9, a voice transducer such as 9, a delay circuit 20, a user input device such as a keypad 22 are provided,
These are all connected to the controller 18. The keypad 22 is a standard numeral (0-9) or related key (#, *) 22a, which is necessary for operating the mobile station 10,
And other keys 22b. Other keys 22b include, for example, a "send" key, various menu scroll keys, soft keys, and a power switch key. In addition, the mobile station 10 has a battery 26 for supplying electric power to various circuits necessary for the operation of the mobile station.

【0108】さらに、移動局10は、各種のメモリを有
するが、これらのメモリはまとめてメモリ24として表
されている。これらのメモリには、移動局の動作におい
てコントローラ18が必要とする各種の定数や変数が記
憶される。例えば、メモリ24は、各種のセルラシステ
ムパラメータおよび番号割り当てモジュール(NAM)
を記憶する。また、メモリ24には、コントローラ18
の動作を制御するプログラムも記憶される(通常は、R
OMに記憶される)。さらに、メモリ24は、BMI3
2から受信されたユーザメッセージなどのデータをディ
スプレイに表示する前に記憶するのにも用いられる。ま
た、不連続送信動作において、快適化雑音パラメータを
送信するための以下に説明する方法を実行するためのル
ーチンもメモリ24に記憶される。
Further, the mobile station 10 has various memories, and these memories are collectively represented as a memory 24. These memories store various constants and variables required by the controller 18 in the operation of the mobile station. For example, the memory 24 may include various cellular system parameters and number assignment modules (NAM).
Memorize The memory 24 also includes a controller 18
A program that controls the operation of R is also stored (usually R
Stored in OM). Further, the memory 24 is a BMI3.
It is also used to store data received from the user, such as user messages, prior to displaying it on the display. Also stored in memory 24 is a routine for performing the method described below for transmitting comfort noise parameters in a discontinuous transmission operation.

【0109】移動局10は、車両に搭載された装置であ
ってもよく、また携帯型の装置であってもよい。移動局
10は、各種の無線インタフェース標準、変調方式、ア
クセス方式に基づくものであってよい。例えば、移動局
は、IS−136に限定されず、それ以外の任意の標
準、例えばGSM標準に基づいたものであってよい。す
なわち、本発明が、特定の方式の移動局や特定の無線イ
ンタフェース標準に限定されるものではないことは明ら
かであろう。
The mobile station 10 may be a device mounted on a vehicle or a portable device. The mobile station 10 may be based on various radio interface standards, modulation schemes, and access schemes. For example, the mobile station is not limited to IS-136 and may be based on any other standard, such as the GSM standard. That is, it will be apparent that the present invention is not limited to a particular type of mobile station or a particular air interface standard.

【0110】次に、具体的な例として、本発明をIS−
136に適用した場合の実施例について説明するが、本
発明がこの無線インタフェース標準のみに限定されるも
のではないことを、ここに繰り返して述べておく。
Next, as a specific example, the present invention will be described as IS-
Although an example in which the present invention is applied to 136 will be described, it is repeatedly mentioned here that the present invention is not limited to this wireless interface standard.

【0111】ディジタルトラフィックチャネル上におけ
る不連続送信方式(IS−136.1、Rev.A、第
2.3.11.2節)では、不連続送信高出力状態にお
いては、送信機14は、移動局10が受信した最新の出
力制御命令(初期トラフィックチャネル指定メッセー
ジ、ディジタルトラフィックチャネル(DTC)指定メ
ッセージ、ハンドオフメッセージ、専用DTCハンドオ
フメッセージ、あるいは物理レイヤ制御メッセージ)に
よって指定された出力レベルで、送信を行う。
In the discontinuous transmission method (IS-136.1, Rev. A, section 23.11.2) on the digital traffic channel, in the discontinuous transmission high power state, the transmitter 14 moves Transmit at the power level specified by the most recent power control command received by the station 10 (initial traffic channel designation message, digital traffic channel (DTC) designation message, handoff message, dedicated DTC handoff message, or physical layer control message). To do.

【0112】一方、不連続送信低出力状態においては、
送信機はオフ状態に維持される。CDVCCは、高速付
随制御チャネル(FACCH)メッセージを除いて、送
信されない。不連続送信低出力状態において、移動局1
0から送信されるすべての低速付随制御チャネル(SA
CCH)メッセージは、FACCHメッセージとして送
信され、その後、送信機14は、不連続送信(DTX)
が禁止されていなければ、オフ状態に戻る。
On the other hand, in the discontinuous transmission low output state,
The transmitter remains off. CDVCC is not transmitted except for the Fast Associated Control Channel (FACCH) message. In the discontinuous transmission low output state, the mobile station 1
All slow associated control channels (SA
CCH) message is transmitted as a FACCH message, after which transmitter 14 discontinues transmission (DTX).
If is not prohibited, it returns to the off state.

【0113】移動局10が、不連続送信高出力状態から
不連続送信低出力状態へ切り替わる場合には、高出力状
態において進行中のSACCHメッセージをすべて完結
終了させるか、あるいはSACCHメッセージ送信を中
断し、中断されたSACCHメッセージ全体を不連続送
信低出力状態でFACCHメッセージとして改めて再送
する。
When the mobile station 10 switches from the discontinuous transmission high output state to the discontinuous transmission low output state, all the SACCH messages in progress in the high output state are completed or terminated, or the SACCH message transmission is interrupted. , The entire interrupted SACCH message is retransmitted as a FACCH message again in the discontinuous transmission low output state.

【0114】移動局が、不連続高出力状態から不連続送
信低出力状態へと切り替わる際の遷移状態において、送
信途中のFACCHメッセージの送信が完全に終了する
までは、送信出力は、不連続送信高出力レベルに維持さ
れる。
[0114] In the transition state when the mobile station switches from the discontinuous high output state to the discontinuous transmission low output state, the transmission output is discontinuous transmission until the transmission of the FACCH message in the middle of transmission is completely completed. Maintained at high output level.

【0115】本発明の好適な実施例においては、移動局
10は、快適化雑音ブロック(6つのDTXハングオー
バスロット、およびこれに関連する快適化雑音パラメー
タメッセージとを含む)のすべての送信が終了するまで
は、遷移状態となっている。快適化雑音ブロックは、割
り込み中断されることなく送信される。他のどれかのF
ACCHメッセージスロットが、快適化雑音ブロックの
送信と同時に発生した場合には、移動局10は、FAC
CHメッセージあるいは快適化雑音ブロックのどちらか
を遅らせ、一方を先に送り、他方をその後で送るように
する。いずれの場合でも、FACCHメッセージは、快
適化雑音ブロックの送信に用いられるスロットに対して
割り込んだり進入したりしないように、グループ化ある
いは分離される。このようにすることによって、基地局
の音声/快適化雑音復号器が最良の品質の快適化雑音を
発生させることが可能となる。
In the preferred embodiment of the present invention, the mobile station 10 terminates all transmissions of the comfort noise block (including the six DTX hangover slots and associated comfort noise parameter messages). Until then, it is in a transition state. The comfort noise block is transmitted without interruption interruption. Any other F
If the ACCH message slot occurs at the same time as the transmission of the comfort noise block, the mobile station 10
Delay either the CH message or the comfort noise block so that one is sent first and the other later. In either case, the FACCH messages are grouped or separated so that they do not interrupt or enter the slot used to transmit the comfort noise block. This allows the speech / comfort noise decoder at the base station to generate the best quality comfort noise.

【0116】この点については、共譲渡された、係属中
の米国特許出願第08/936,755号明細書「不連
続送信における快適化雑音の送信」(1997年9月2
5日出願、セポ アラナラ、およびペッカ カパネン)
を参照のこと。
In this regard, co-assigned, pending US patent application Ser. No. 08 / 936,755 “Transmission of Comfort Noise in Discontinuous Transmission” (September 2, 1997).
5th application, Sepo Aranara, and Pekka Kapanen)
checking ...

【0117】具体的な実施例によれば、以下の表1に示
す、快適化雑音(CN)パラメータメッセージは、帰還
ディジタルトラフィックチャネル(RDTC)、さらに
具体的には、FACCH論理チャネル上で送信される。
快適化雑音パラメータメッセージは、38ビットからな
り、そのうちの26ビットが、IS−641音声コーデ
ックで用いられているのと同じスプリットベクトル量子
化(SVQ)コードブックを用いて量子化されるLSF
残差ベクトルを表すのに用いられる。なお、音声コーデ
ックの量子化/逆量子化アルゴリズムは、上記コードブ
ックを用いることが可能なように改められている。LS
Fパラメータは、送信側の背景雑音のスペクトルエンベ
ロープを、好適にはスペクトルの10次のLPCモデル
を用いて表す。
According to a specific embodiment, the comfort noise (CN) parameter message, shown in Table 1 below, is transmitted on the Return Digital Traffic Channel (RDTC), and more specifically on the FACCH logical channel. It
The comfort noise parameter message consists of 38 bits, 26 bits of which are LSF quantized using the same split vector quantization (SVQ) codebook used in the IS-641 speech codec.
Used to represent the residual vector. It should be noted that the quantization / inverse quantization algorithm of the voice codec has been revised so that the above codebook can be used. LS
The F parameter represents the spectral envelope of the background noise on the transmit side, preferably using a 10th order LPC model of the spectrum.

【0118】次の8ビットは、送信側の背景雑音のエネ
ルギを表す、快適化雑音エネルギ量子化インデクッスと
して用いられる。メッセージの残りの4ビットは、ラン
ダム励起スペクトル制御(RESC)情報要素を送るの
に用いられる。
The next 8 bits are used as a comfort noise energy quantization index that represents the energy of the background noise on the transmit side. The remaining 4 bits of the message are used to carry the Random Excitation Spectral Control (RESC) information element.

【0119】[0119]

【表1】 [Table 1]

【0120】すなわち、本発明は、従来の技術における
上述の問題を、送信側に存在する背景雑音と類似の合成
雑音を、受信側において発生させることによって解決し
ようとするものである。会話音声の送信を中断する前
に、送信側において、快適化雑音(CN)パラメータが
算出され、これが受信側に送信される。以後、一定の遅
い繰り返し速度で快適化雑音パラメータが送信される。
この方法によれば、送信側における雑音の変化に対して
快適化雑音を適合させるようにすることが可能となる。
本発明による不連続送信方式は、送信側における音声状
態検出(VAD)機能21(図12)と、送信側におい
て、コントローラ18を用いて音響背景雑音を評価し、
背景雑音の特徴パラメータを受信側に送信する機能と、
会話音声の送信が中断されている間、快適化雑音と呼ば
れる送信側の背景雑音と類似の雑音を受信側において発
生させる機能とを要する。
That is, the present invention is intended to solve the above-mentioned problems in the conventional technique by causing the receiving side to generate synthetic noise similar to the background noise existing on the transmitting side. Before the transmission of conversational speech is interrupted, the comfort noise (CN) parameter is calculated at the sender and this is sent to the receiver. After that, the comfort noise parameter is transmitted at a constant slow repetition rate.
According to this method, the comfort noise can be adapted to the change in noise on the transmission side.
The discontinuous transmission method according to the present invention evaluates acoustic background noise using the voice state detection (VAD) function 21 (FIG. 12) on the transmission side and the controller 18 on the transmission side,
A function to send characteristic parameters of background noise to the receiving side,
While the transmission of conversational voice is interrupted, it is necessary to have a function of generating noise called comfort noise, which is similar to background noise on the transmitting side, on the receiving side.

【0121】これらの機能に加えてさらに、受信側に到
達したパラメータが著しい誤差を有すると判断された場
合には、データを置換し、置換されたデータから音声あ
るいは快適化雑音の発生を行うようにし、受信側のユー
ザに不快感を与えないようにするものである。
In addition to these functions, if it is determined that the parameters reaching the receiving side have a significant error, the data is replaced and voice or comfort noise is generated from the replaced data. Therefore, the user on the receiving side is not made uncomfortable.

【0122】また、送信側における不連続送信機能によ
って、フラッグSPによる標識が付けられたトラフィッ
クフレームが無線送信機14から連続して送られる。こ
こで、SPフラッグ=「1」のときには、フレームが音
声フレームであることを示し、SPフラッグ=「0」で
あれば、フレームによって符号化された一組の快適化雑
音パラメータが送られていることを示す。無線インタフ
ェースにフレームを送信するタイミングは、SPフラッ
グに基づいて無線送信機14によって制御される。
Further, the traffic frame labeled with the flag SP is continuously sent from the wireless transmitter 14 by the discontinuous transmission function on the transmission side. Here, when the SP flag = "1", it indicates that the frame is a voice frame, and when the SP flag = "0", a set of comfort noise parameters encoded by the frame is sent. Indicates that. The timing of transmitting the frame to the wireless interface is controlled by the wireless transmitter 14 based on the SP flag.

【0123】本発明の好適な実施例においては、送信側
の不連続送信機能の正確な検証を可能とするために、移
動局10をリセットする前の、すべてのフレームは無限
に長い音声フレームであるかのように取り扱われる。従
って、リセット後の最初の6フレームは、VADフラッ
グ=「0」(すなわちハングオーバ期間、図14を参
照)であっても、常にSPフラッグ=「1」の標識が付
される。
In the preferred embodiment of the present invention, all frames are infinitely long voice frames prior to resetting the mobile station 10 to enable accurate verification of the discontinuous transmission capability of the sender. Treated as if there were. Therefore, the first 6 frames after reset are always marked with the SP flag = "1" even if the VAD flag = "0" (ie, the hangover period, see FIG. 14).

【0124】音声状態検出器(VAD)21は、マイク
ロホン19から入力される信号が会話音声を含んでいる
かどうかを連続的に監視し、フレームごとに、2値フラ
ッグ(VADフラッグ=「1」またはVADフラッグ=
「0」)を出力する。
The voice state detector (VAD) 21 continuously monitors whether or not the signal input from the microphone 19 contains conversational voice, and a binary flag (VAD flag = "1" or VAD flag =
"0") is output.

【0125】このVADフラッグによって、以下に述べ
る送信側不連続送信ハンドラ動作を介して、送信側にお
ける不連続送信動作の全体が間接的に制御される。
The VAD flag indirectly controls the entire discontinuous transmission operation on the transmission side through the discontinuous transmission handler operation on the transmission side described below.

【0126】VADフラッグ=「1」である場合には、
SPフラッグ=「1」が付された音声符号化出力フレー
ムが直接に無線送信機14に供給される。
When the VAD flag = "1",
The speech coded output frame with the SP flag = "1" is directly supplied to the wireless transmitter 14.

【0127】音声バーストが終了すると、(VADフラ
ッグ=「1」からVADフラッグ=「0」に遷移す
る)、その後の連続する7フレームが、更新された新し
い一組のCNパラメータを生成するために使われる。通
常は、音声バーストが終了した後の最初の6つの音声符
号化出力フレームが、SPフラッグ=「1」を付されて
無線送信機14に直接に供給され、これによって「ハン
グオーバ期間」が構成される。続いて、音声バースト終
了後の第7番目のフレームとして、最初の新しい一組の
CNパラメータが、SPフラッグ=「0」が付されて無
線送信機14に供給される(図14参照)。
At the end of the voice burst (transition from VAD flag = "1" to VAD flag = "0"), the following 7 consecutive frames will generate a new set of updated CN parameters. used. Normally, the first six voice coded output frames after the end of the voice burst are fed directly to the wireless transmitter 14 with the SP flag = "1", which constitutes a "hangover period". It Subsequently, as the seventh frame after the end of the voice burst, the first new set of CN parameters is supplied to the wireless transmitter 14 with SP flag = "0" (see FIG. 14).

【0128】ただし、音声バーストが終ったときに、直
前のCNパラメータが算出されれて無線送信機14に供
給されてから経過した時間が24フレーム以下である場
合には、新しく更新された一組のCNパラメータ(VA
Dフラッグ=「0」が付された連続する7フレーム)が
準備できるまで、上記の直前のCNパラメータが繰り返
し無線送信機14に供給される。このようにすることに
よって、スパイク状の短い背景雑音が会話音声であると
誤って解釈され、「ハングオーバ」が発生してCNパラ
メータの算出が開始されてしまうことによる、無線イン
タフェースの無駄な動作を少なくすることができる。図
15は、一例として、ハングオーバなしに可能な限り最
も長く続いた場合の音声バーストを示したものである。
However, when the time elapsed since the immediately preceding CN parameter was calculated and supplied to the radio transmitter 14 was 24 frames or less at the end of the voice burst, a newly updated set was obtained. CN parameter of (VA
The immediately preceding CN parameters are repeatedly supplied to the wireless transmitter 14 until the D flag = successive 7 frames with “0” added) are ready. By doing so, the spike-like short background noise is erroneously interpreted as a conversational voice, and a “hangover” occurs to start calculation of the CN parameter, resulting in unnecessary operation of the wireless interface. Can be reduced. FIG. 15 shows, as an example, a voice burst in the case of the longest possible duration without a hangover.

【0129】音声バーストの後の最初の一組のCNパラ
メータの算出がされて無線送信機14に供給された後に
も、VADフラッグ=「0」である間は、続けて、送信
側の不連続送信ハンドラは、更新されたCNパラメータ
を算出し、SPフラッグ=「0」を付して無線送信機1
4に供給する。
After the first set of CN parameters after the voice burst is calculated and supplied to the wireless transmitter 14, while the VAD flag is "0", the discontinuity of the transmitting side continues. The transmission handler calculates the updated CN parameter, attaches the SP flag = “0” to the wireless transmitter 1
Supply to 4.

【0130】SPフラッグ=「1」である場合には、音
声符号器は通常音声符号化モードで動作するが、一方、
SPフラッグ=「0」の場合には、CNパラメータを算
出するのに符号化機能のすべてが必要となるわけではな
いので、簡易モードで動作する。
If the SP flag = "1", the speech coder operates in the normal speech coding mode, while
When the SP flag = “0”, not all the coding functions are required to calculate the CN parameter, and therefore the simple mode is used.

【0131】無線送信機14では、以下の順序でトラフ
ィックフレームが送信される。すなわち、すべての、S
Pフラッグ=「1」が付されたフレーム;SPフラッグ
=「1」が付された1つ以上のフレームが送信された後
に現れる最初のSPフラッグ=「0」が付されたフレー
ム;SPフラッグ=「0」であり、かつ、CNパラメー
タ更新メッセージの送信のために用いられるフレーム。
The radio transmitter 14 transmits traffic frames in the following order. That is, all S
P flag = frame with "1"; SP flag = first SP flag that appears after one or more frames with "1" have been transmitted = frame with "0"; SP flag = A frame that is “0” and is used for transmitting the CN parameter update message.

【0132】これによって、話し手が話すのを止める
と、CNパラメータメッセージが送信され、不連続送信
低出力状態に遷移する。会話音声が中断している間、一
定の間隔で送信が再開されて、受信側において発生した
快適化雑音の更新を行うためのCNパラメータメッセー
ジが送信される。
As a result, when the speaker stops speaking, the CN parameter message is transmitted, and the discontinuous transmission low power state is entered. While the conversation voice is interrupted, the transmission is restarted at regular intervals, and the CN parameter message for updating the comfort noise generated at the receiving side is transmitted.

【0133】[0133]

【外1】 [Outer 1]

【0134】[0134]

【外2】 [Outside 2]

【0135】[0135]

【外3】 [Outside 3]

【0136】[0136]

【外4】 [Outside 4]

【0137】CNパラメータメッセージは、音声バース
トが終了し、無線送信が中断される前に必ず送信され、
従って、CNパラメータメッセージは、受信側における
快適化雑音発生の初期化を行う役割も担っている。
The CN parameter message is always sent before the end of the voice burst and interruption of radio transmission,
Therefore, the CN parameter message also plays a role of initializing the comfort noise generation on the receiving side.

【0138】CNパラメータメッセージおよび音声フレ
ームが無線送信経路に送信されるタイミングについて
は、図7および8を参照しながらすでに説明した。
The timing when the CN parameter message and the voice frame are transmitted on the radio transmission path has already been described with reference to FIGS. 7 and 8.

【0139】背景雑音の評価には、3つの異なる種類の
平均パラメータ、すなわちLSFパラメータ、ランダム
励起信号利得パラメータ、およびRESCパラメータの
平均値を求める過程が含まれる。快適化雑音パラメータ
メッセージに符号化される快適化雑音パラメータは、連
続したN=7フレームからなり、VAD=「0」が付さ
れた快適化雑音平均化期間において、以下に詳細に述べ
るようにして算出される。
The evaluation of background noise involves the process of averaging three different types of average parameters: LSF parameters, random excitation signal gain parameters, and RESC parameters. The comfort noise parameter encoded in the comfort noise parameter message consists of consecutive N = 7 frames, in the comfort noise averaging period with VAD = "0", as described in detail below. It is calculated.

【0140】快適化雑音平均化期間においてLSFパラ
メータの平均値を求める前に、まず、中央値置換処理を
平均値を求めようとしている一連のLSFパラメータに
対して行い、送信側の背景雑音の特性を良く表していな
いパラメータを除去する。最初に、快適化雑音期間にお
ける、LSFパラメータベクトルf(i)の他のLSF
パラメータベクトルf(j)(i=0・・・6、j=0
・・・6(i≠j))に対するベクトル距離を求め、次
の式を用いて近似する。
Before calculating the average value of the LSF parameters in the comfort noise averaging period, first, the median substitution process is performed on a series of LSF parameters for which the average value is to be calculated, and the characteristics of the background noise on the transmitting side are calculated. Remove parameters that do not represent First, another LSF of the LSF parameter vector f (i) in the comfort noise period
Parameter vector f (j) (i = 0 ... 6, j = 0
The vector distance for 6 (i ≠ j) is calculated and approximated using the following equation.

【0141】[0141]

【数17】 [Equation 17]

【0142】ここで、fi(k)は、フレームiのLS
Fパラメータベクトルf(i)の第k番目のLSFパラ
メータである。
Where f i (k) is the LS of frame i
It is the kth LSF parameter of the F parameter vector f (i).

【0143】快適化雑音平均化期間内の、LSFパラメ
ータベクトルf(i)の、他のすべてのフレームj=0
・・・N(j≠i)のLSFパラメータベクトルf
(j)に対するスペクトル距離ΔSiを求めるために、
スペクトル距離ΔRijの和を以下の式に従って、すべて
のi=0・・・6(j≠i)に対して求める。
All other frames j = 0 of the LSF parameter vector f (i) within the comfort noise averaging period.
... N (j ≠ i) LSF parameter vector f
To find the spectral distance ΔS i for (j),
The sum of the spectral distances ΔR ij is calculated for all i = 0 ... 6 (j ≠ i) according to the following formula.

【0144】[0144]

【数18】 [Equation 18]

【0145】快適化雑音平均化期間内のすべてのLSF
パラメータベクトルのうちで、最小スペクトル距離ΔS
iを有するLSFパラメータベクトルf(i)を、その
平均化期間の中央LSFパラメータベクトルfmedとし
て採用し、そのスペクトル距離をΔSmedで表す。中央
LSFパラメータベクトルは、平均化期間内におけるす
べてのLSFパラメータベクトルのうちで、背景雑音の
短期間スペクトル特性を最もよく表しているLSFパラ
メータベクトルであると見なすことができる。次に、快
適化雑音平均化期間内のLSFパラメータベクトルf
(j)のうちで、次の(6)式を満たすものがあるかど
うかを判定する。
All LSFs within the comfort noise averaging period
Among the parameter vectors, the minimum spectral distance ΔS
The LSF parameter vector f (i) with i is taken as the central LSF parameter vector f med for that averaging period and its spectral distance is denoted ΔS med . The central LSF parameter vector can be regarded as the LSF parameter vector that best represents the short-term spectral characteristics of the background noise among all the LSF parameter vectors in the averaging period. Next, the LSF parameter vector f within the comfort noise averaging period
In (j), it is determined whether or not there is one that satisfies the following expression (6).

【0146】[0146]

【数19】 [Formula 19]

【0147】ここで、THmed=2.25は、中央値置
換閾値である。もし、上記の式を満たすLSFパラメー
タベクトルが存在する場合には、LSFパラメータベク
トルfmeanの平均を算出する前に、その中の最大2個
(すなわち、THmedより大きいLSFベクトルの中の
上から2つ)を中央LSFパラメータベクトルと置換す
る。
Here, TH med = 2.25 is the median replacement threshold. If there is an LSF parameter vector that satisfies the above equation, a maximum of two (ie, from among the LSF vectors larger than TH med ) among them are calculated before calculating the average of the LSF parameter vector f mean. 2) with the central LSF parameter vector.

【0148】上記の中央値置換処理の結果得られた一組
のLSFパラメータベクトルをf′(n−i)で表す。
ここで、nは現在のフレームのインデックスであり、i
は平均化期間インデックス(i=0・・・・6)であ
る。
A set of LSF parameter vectors obtained as a result of the above median replacement process is represented by f '(ni).
Where n is the index of the current frame and i
Is an averaging period index (i = 0 ... 6).

【0149】ハングオーバ期間の終わりに中央値置換処
理を行うとき(最初の快適化雑音更新処理)、直前の6
つのフレーム(ハングオーバ期間内のi=1・・・・6
のフレーム)のすべてのLSFパラメータベクトルf
(n−i)は量子化された値を有しているが、最も新し
いフレームnのLSFパラメータベクトルf(n)は量
子化されていない値を有する。以後の快適化雑音の更新
において、ハングオーバ期間と重なるフレームの快適化
雑音平均化期間のLSFパラメータベクトルは、量子化
された値を有するが、快適化雑音平均化期間の最も新し
いフレームのパラメータベクトルは量子化されていない
値を有する。もし、最も新しい7つのフレームの期間
が、ハングオーバ期間と重なっていないならば、LSF
パラメータの中央値置換処理は、量子化されていないパ
ラメータの値のみを用いて行われる。
When the median replacement process is performed at the end of the hangover period (first comfort noise updating process), the immediately preceding 6
One frame (i = 1 ... 6 within the hangover period)
Frames L) of all LSF parameter vectors f
(N-i) has quantized values, but the LSF parameter vector f (n) of the newest frame n has unquantized values. In the subsequent comfort noise update, the LSF parameter vector of the comfort noise averaging period of the frame that overlaps the hangover period has a quantized value, but the parameter vector of the newest frame of the comfort noise averaging period is It has an unquantized value. If the period of the newest 7 frames does not overlap with the hangover period, then LSF
The parameter median replacement process is performed using only the non-quantized parameter values.

【0150】フレームnにおける平均LSFパラメータ
ベクトルfmeanは以下の式を用いて計算される。
The average LSF parameter vector f mean in frame n is calculated using the following equation.

【0151】[0151]

【数20】 [Equation 20]

【0152】ここで、f′(n−i)は、中央値置換処
理を行った後の、最も新しい7つのフレーム(i=0・
・・・6)のうちの1つのLSFパラメータベクトルで
あり、iは平均化期間インデックス、nはフレームイン
デックスである。
Here, f ′ (n−i) is the newest 7 frames (i = 0.multidot.i) after the median replacement process.
... 6) is one LSF parameter vector, i is an averaging period index, and n is a frame index.

【0153】フレームnの平均LSFパラメータベクト
ルfmeanは、好適には、音声符号器が通常の音声符号化
モードにおいて平均化されていないLSFパラメータベ
クトルを量子化するのに用いるのと同じ量子化テーブル
を用いて量子化される。ただし、量子化アルゴリズム
は、快適化雑音の量子化を行うのに適するように変更さ
れたものが用いられる。量子化しようとしているLSF
予測残差は、次の式に従って得られる。
The average LSF parameter vector f mean for frame n is preferably the same quantization table that the speech coder uses to quantize the non-averaged LSF parameter vector in the normal speech coding mode. Is quantized using. However, the quantization algorithm used is modified to be suitable for quantization of comfort noise. LSF about to quantize
The prediction residual is obtained according to the following formula.

【0154】[0154]

【数21】 [Equation 21]

【0155】[0155]

【外5】 [Outside 5]

【0156】[0156]

【外6】 [Outside 6]

【0157】[0157]

【数22】 [Equation 22]

【0158】[0158]

【外7】 [Outside 7]

【0159】[0159]

【外8】 [Outside 8]

【0160】さらに、各サブフレームに対するランダム
励起信号利得を、サブフレームのLP残差信号エネルギ
に基づいて以下のようにして計算する。
Further, the random excitation signal gain for each subframe is calculated as follows based on the LP residual signal energy of the subframe.

【0161】[0161]

【数23】 [Equation 23]

【0162】ここで、gcn(j)はサブフレームjのラ
ンダム励起信号利得の計算値、r(l)はサブフレーム
jの第l番目のLP残差信号サンプル、lはサンプルイ
ンデックス(l=0・・・・39)である。なお、式
(10)において、快適化雑音のレベルを、音声コーデ
ックによって符号化された背景雑音のレベルと整合させ
るために、スケーリング係数として1.286が用いら
れている。ただし、本発明がこのスケーリング係数の特
定の値に限定されるわけでなない。
Here, g cn (j) is the calculated value of the random excitation signal gain of subframe j, r (l) is the l-th LP residual signal sample of subframe j, and l is the sample index (l = 0 ... 39). In equation (10), a scaling factor of 1.286 is used to match the comfort noise level with the background noise level encoded by the speech codec. However, the present invention is not limited to this particular value of the scaling factor.

【0163】快適化雑音発生期間のサブフレーム励起信
号(疑似雑音)は、−1から+1の間の零以外の値をと
る10個のサンプルを含むので、LP残差信号のエネル
ギの計算値を10で割ることによって、ランダム励起信
号パルス1つ当たりのエネルギを求めることができる。
ランダム励起信号利得の計算値は、平均化され、更新さ
れたCNパラメータが必要となったとに、SP=「0」
が付された各フレームnの最初のサブフレームにおいて
更新される。
Since the sub-frame excitation signal (pseudo noise) during the comfort noise generation period includes 10 samples having a non-zero value between -1 and +1, the calculated value of the energy of the LP residual signal is calculated as follows. By dividing by 10, the energy per random excitation signal pulse can be determined.
The calculated values of the random excitation signal gains were averaged and SP = “0” when updated CN parameters were needed.
Is updated in the first subframe of each frame n marked with.

【0164】[0164]

【数24】 [Equation 24]

【0165】ここで、gcn(n)(1)はフレームnの
最初のサブフレームにおけるランダム励起信号利得の計
算値、gcn(n−i)(j)は過去の1フレーム(i=
1・・・・6)のサブフレームjにおけるランダム励起
信号利得の計算値である。現在のフレームの最初のサブ
フレームのみのランダム励起信号利得が、平均化処理に
用いられるので、現在のフレームの最初のサブフレーム
の処理が終了すれば、更新された一組の快適化雑音パラ
メータを送信することが可能となる。
Here, g cn (n) (1) is the calculated value of the random excitation signal gain in the first subframe of frame n, and g cn (n−i) (j) is the past one frame (i =
The calculated value of the random excitation signal gain in subframe j of 1 ... 6). Since the random excitation signal gain of only the first subframe of the current frame is used in the averaging process, once the processing of the first subframe of the current frame is finished, an updated set of comfort noise parameters is set. It becomes possible to send.

【0166】[0166]

【外9】 [Outside 9]

【0167】RESCパラメータの計算において、LP
残差r(n)は、平坦スペクトル特性から幾分かずれて
いるので、受信側において、平坦なスペクトルのランダ
ム励起信号を用いて快適化雑音を合成すると、快適化雑
音品質の劣化(背景雑音と快適化雑音との間のスペクト
ルの差異)が起こる。スペクトル特性をより良く一致す
るようにするには、快適化雑音平均化期間において、L
P残差信号に対してさらに2次のLP分析を行い、得ら
れた平均LP係数を快適化雑音パラメータメッセージに
含ませて受信側に送信し、これを用いて、受信側におい
て快適化雑音の発生を行うようにする。この方法は、ラ
ンダム励起スペクトル制御(RESC)と呼ばれる。こ
の方法で得られるLP係数は、RESCパラメータΛで
表す。
In calculating the RESC parameters, LP
Since the residual r (n) is slightly deviated from the flat spectrum characteristic, if the comfort noise is combined with the random excitation signal having the flat spectrum on the receiving side, the comfort noise quality is degraded (background noise). Difference between the noise and the comfort noise). To make the spectral characteristics better match, in the comfort noise averaging period, L
A second-order LP analysis is further performed on the P residual signal, and the obtained average LP coefficient is included in the comfort noise parameter message and transmitted to the receiving side. Let it happen. This method is called random excitation spectrum control (RESC). The LP coefficient obtained by this method is represented by the RESC parameter Λ.

【0168】フレームの各サブフレームのLP残差信号
r(n)は連結されて、20msのフレームのLP残差
信号の自己相関rres(k)(k=0・・・・2)が以
下の式によって求められる。
The LP residual signal r (n) of each subframe of the frame is concatenated so that the autocorrelation r res (k) (k = 0 ... 2) of the LP residual signal of the 20 ms frame is as follows. It is calculated by the formula.

【0169】[0169]

【数25】 [Equation 25]

【0170】上記の式を用いて自己相関を算出した後、
得られた自己相関を正規化して、正規化自己相関r′
res(k)を求める。
After calculating the autocorrelation using the above equation,
The obtained autocorrelation is normalized to obtain the normalized autocorrelation r ′.
Find res (k).

【0171】快適化雑音平均化期間の最も新しいフレー
ムに対して、最初のサブフレームのみから求められた自
己相関を用いて平均を行うようにすることによって、現
在のフレームの最初のサブフレームの処理が終了したと
きに、次に送るべき更新された快適化雑音パラメータを
準備することが可能になる。
Processing the first subframe of the current frame by averaging the newest frame of the comfort noise averaging period with the autocorrelation determined from only the first subframe. When is finished, it is possible to prepare updated comfort noise parameters to be sent next.

【0172】快適化雑音パラメータを更新する必要が起
こったときには、正規化自己相関の計算値を平均値を以
下の式を用いて求め、SP=「0」が付された各フレー
ムnの最初のサブセットにおいて更新する。
When it is necessary to update the comfort noise parameter, the calculated value of the normalized autocorrelation is calculated by using the following equation, and the first value of each frame n to which SP = "0" is added is calculated. Update in subset.

【0173】[0173]

【数26】 [Equation 26]

【0174】ここで、r′res(n)(1)は、フレー
ムnの最初のサブフレームにおける正規化自己相関、
r′res(n−i)は、過去のフレーム(i=1・・・
・6)の1フレームの正規化自己相関、nはフレームイ
ンデックスである。
Where r ′ res (n) (1) is the normalized autocorrelation in the first subframe of frame n,
r ′ res (n−i) is a past frame (i = 1 ...
6) Normalized autocorrelation of 1 frame, n is a frame index.

【0175】[0175]

【外10】 [Outside 10]

【0176】[0176]

【外11】 [Outside 11]

【0177】[0177]

【外12】 [Outside 12]

【0178】快適化雑音符号化アルゴリズムは、各快適
化雑音パラメータメッセージに対して表2に示したよう
に38ビットのデータを生成する。なお、これらの38
ビットのデータを、ベクトルcn[0・・・37]で表
す。快適化雑音ビットデータcn[0・・・37]は、
表2に示された順序で(特別なビットに注目しての整列
は行わない)FACCHチャネル符号器に供給される。
The comfort noise coding algorithm produces 38-bit data as shown in Table 2 for each comfort noise parameter message. In addition, these 38
The bit data is represented by the vector cn [0 ... 37]. The comfort noise bit data cn [0 ... 37] is
It is supplied to the FACCH channel encoder in the order shown in Table 2 (no special bit alignment is done).

【0179】[0179]

【表2】 [Table 2]

【0180】その内容(音声、快適化雑音パラメータメ
ッセージ、その他のFACCHメッセージ、あるいは無
信号)の如何にかかわらず、基地局30の無線受信機
は、受信した、3つのフラッグによって各種の処理機能
がそれぞれ指定されたトラフィックフレームを次々に受
信側不連続送信ハンドラに供給する。上記3つのフラッ
グは、不良音声フレーム指示(BFI)フラッグ、不良
快適化雑音パラメータ指示(BFI_CN)フラッグ、
快適化雑音更新フラッグ(CNU)であり、これらにつ
いては以下に、表3などにおいて説明する。これらのフ
ラッグは、トラフィックフレームをその目的別に区別す
るのに用いられる。この区分によって、表3に示されて
いるように、受信側不連続送信ハンドラは、受信したフ
レームをどのように処理すべきかを容易に知ることがで
きる。
Regardless of its content (voice, comfort noise parameter message, other FACCH message, or no signal), the wireless receiver of the base station 30 has various processing functions depending on the three flags received. The designated traffic frames are sequentially supplied to the receiving side discontinuous transmission handler. The above three flags are a bad voice frame indication (BFI) flag, a bad comfort noise parameter indication (BFI_CN) flag,
Comfort Noise Update Flags (CNU), which are described below, such as in Table 3. These flags are used to distinguish traffic frames by their purpose. This partition allows the receiving discontinuous transmission handler to easily know how to process the received frame, as shown in Table 3.

【0181】[0181]

【表3】 [Table 3]

【0182】2値BFIフラッグおよびBFI_CNフ
ラッグによって、トラフィックフレームが意味のある情
報ビットを含んでいる(BFIフラッグ=「0」かつB
FI_CNフラッグ=「1」)のか、あるいは意味のあ
る情報ビットを含んでいない(BFIフラッグ=「1」
かつBFI_CNフラッグ=「1」、あるいはBFIフ
ラッグ=「0」かつBFI_CNフラッグ=「0」)の
かが示される。本発明においては、FACCHフレーム
は、それが快適化雑音パラメータメッセージを含んでい
る場合を除いて、意味のあるビットを含んでいるとは見
なされないので、BFI SPフラッグ=「1」かつB
FI CNフラッグ=「1」である。
The binary BFI and BFI_CN flags allow the traffic frame to contain meaningful information bits (BFI flag = "0" and B
FI_CN flag = "1") or does not contain a meaningful information bit (BFI flag = "1")
Also, it is indicated whether the BFI_CN flag = “1” or the BFI flag = “0” and the BFI_CN flag = “0”). In the present invention, the FACCH frame is not considered to contain meaningful bits unless it contains a comfort noise parameter message, so the BFI SP flag = "1" and B
The FI CN flag = “1”.

【0183】2値CNUフラッグは、FACCHによっ
て送られる送信チャネル品質情報に従って整列されたト
ラフィックフレームに対してCNU=「1」の標識を付
す。
The binary CNU flag marks CNU = "1" for traffic frames aligned according to the transmission channel quality information sent by the FACCH.

【0184】受信側不連続送信ハンドラは、受信側の不
連続送信動作全体に係わる。受信側の不連続送信動作は
以下のように行われる。音声フレームが良好な音声フレ
ームであると判定された場合には、不連続送信ハンドラ
は、その音声フレームを直接に音声復号器に供給する。
音声フレームあるいは快適化雑音パラメータメッセージ
が欠落していると判定された場合には、置換およびミュ
ーティング処理を行う。妥当な快適化雑音パラメータメ
ッセージフレームが検出された場合には、これを用いて
快適化雑音の発生を、次の快適化雑音パラメータメッセ
ージ(CNU=「1」)あるいは次の良好な音声フレー
ムが検出されるまで続ける。上記の処理を行っている
間、受信側不連続送信ハンドラは、無線受信機から供給
されるフレームが使用不可能なものであれば、これをす
べて無視する。また、オプションとして以下の動作が可
能である。すなわち、最初の欠落快適化雑音パラメータ
メッセージが検出された場合には、そのパラメータを最
後に検出された妥当な快適化雑音パラメータメッセージ
のパラメータと置換し、その快適化雑音パラメータメッ
セージに対して通常の処理を行う。もし、2番目の欠落
快適化雑音パラメータメッセージが検出された場合に
は、ミューティング処理を行う。
The receiving side discontinuous transmission handler is involved in the entire receiving side discontinuous transmission operation. The discontinuous transmission operation on the receiving side is performed as follows. If the speech frame is determined to be a good speech frame, the discontinuous transmission handler feeds the speech frame directly to the speech decoder.
If it is determined that the voice frame or the comfort noise parameter message is missing, the replacement and muting process is performed. When a valid comfort noise parameter message frame is detected, it is used to detect the occurrence of comfort noise by the next comfort noise parameter message (CNU = "1") or the next good speech frame. Continue until done. During the above processing, the receiving side discontinuous transmission handler ignores all the frames supplied from the wireless receiver if they are unusable. In addition, the following operations are possible as options. That is, if the first missing comfort noise parameter message is detected, that parameter is replaced with the parameter of the last detected valid comfort noise parameter message and the normal Perform processing. If the second missing comfort noise parameter message is detected, the muting process is performed.

【0185】LPパラメータの平均化処理および復号処
理において、復号器が音声フレームを受信すると、最新
の6つの音声フレームのLPパラメータをメモリに保存
する。復号器は、符号器が最後に快適化雑音パラメータ
を更新してこれを無線送信機に供給してから後に受信し
たフレームの数をカウントする。このカウント数に基づ
いて、復号器は、音声バーストの最後にハングオーバ期
間が存在するかどうかを判定する(音声バーストの後の
最初の快適化雑音パラメータメッセージを受信したとき
に、最後に快適化雑音パラメータが更新されてから少な
くとも30フレームが経過していれば、その音声バース
トの最後にハングオーバ期間が存在していたと見なして
よい)。
In the LP parameter averaging process and the decoding process, when the decoder receives a voice frame, the LP parameters of the latest six voice frames are stored in the memory. The decoder counts the number of frames received after the encoder last updated the comfort noise parameter and provided it to the wireless transmitter. Based on this count, the decoder determines whether there is a hangover period at the end of the voice burst (when the first comfort noise parameter message after the voice burst is received, the comfort noise last is received). If at least 30 frames have elapsed since the parameters were updated, it may be considered that there was a hangover period at the end of the voice burst).

【0186】[0186]

【外13】 [Outside 13]

【0187】上記の基準パラメータを得るための平均化
処理は以下のようにして行われる。
The averaging process for obtaining the above-mentioned reference parameters is performed as follows.

【0188】音声フレームを受信すると、LSFパラメ
ータを復号化し、結果をメモリに保存する。快適化雑音
パラメータメッセージを受信し、かつ、音声バーストの
最後にハングオーバ期間が存在すると判定された場合に
は、保存されたLSFパラメータを、音声符号器におい
て行われるのと同様に以下のようにして平均化する。
When a voice frame is received, the LSF parameters are decoded and the result is stored in memory. If the comfort noise parameter message is received and it is determined that there is a hangover period at the end of the voice burst, the stored LSF parameters are as follows, as is done in the voice encoder. Average out.

【0189】[0189]

【数27】 [Equation 27]

【0190】[0190]

【外14】 [Outside 14]

【0191】[0191]

【外15】 [Outside 15]

【0192】[0192]

【数28】 [Equation 28]

【0193】[0193]

【外16】 [Outside 16]

【0194】各サブフレームにおいて、通常の音声復号
器の零ではない4つのパルスを含む固定コードブック励
起信号ベクトルが、会話音声が中断されている間、零で
はない10個のパルスを含むランダム励起信号ベクトル
と置換される。ランダム励起信号のパルス位置およびそ
の符号は、一様分布疑似乱数を用いて局所的に生成され
る。ランダム励起ベクトルにおける励起信号パルスはそ
の値として、+1および−1をとることができる。ラン
ダム励起信号発生アルゴリズムは、以下に示す疑似符号
に従って実行される。
In each subframe, a fixed codebook excitation signal vector containing four non-zero pulses of a conventional speech decoder is a random excitation containing 10 non-zero pulses during the interruption of speech speech. It is replaced with the signal vector. The pulse position of the random excitation signal and its sign are locally generated using a uniform distribution pseudo-random number. The excitation signal pulse in the random excitation vector can take +1 and -1 as its value. The random excitation signal generation algorithm is executed according to the pseudo code shown below.

【0195】 for(i=0;i<40;i++) code(i)=0; for(i=0;i<10;i++) { j=random(4); idx=j*10+i; if(random(2)==1) code(idx)=1; else code(idx)=−1; } ここで、code[0・・・39]は、固定コードブッ
ク励起信号バッファであり、またrandom(k)
は、[0・・・k−1]の範囲で一様に分布する疑似乱
数整数である。
For (i = 0; i <40; i ++) code (i) = 0; for (i = 0; i <10; i ++) {j = random (4); idx = j * 10 + i; if ( random (2) == 1) code (idx) = 1; else code (idx) =-1;} where code [0 ... 39] is a fixed codebook excitation signal buffer and random ( k)
Is a pseudorandom integer uniformly distributed in the range of [0 ... k-1].

【0196】受信したRESCパラメータインデックス
は復号されて、受信RESCパラメータλ(i)(i=
1、2)が得られる。発生したランダム励起信号は、以
下の式で表される特性を有するRESC合成フィルタに
よって濾波される。
The received RESC parameter index is decoded and the received RESC parameter λ (i) (i =
1, 2) are obtained. The generated random excitation signal is filtered by a RESC synthesis filter having the characteristics given by:

【0197】[0197]

【数29】 [Equation 29]

【0198】好適には、RESC合成フィルタは、格子
型フィルタを用いて実現される。RESC合成フィルタ
を通過したのち、ランダム励起信号は、スケーリング処
理が施されたのち、LP合成フィルタで濾波される。
Preferably, the RESC synthesis filter is realized by using a lattice type filter. After passing through the RESC synthesis filter, the random excitation signal is subjected to scaling processing and then filtered by the LP synthesis filter.

【0199】快適化雑音の発生は、音声復号アルゴリズ
ムを以下のように変更した方法を用いて行われる。すな
わち、固定コードブック利得の値を、快適化雑音パラメ
ータメッセージによって取得したランダム励起利得の値
で置換し、固定コードブック励起信号を、上記のよう
に、局所的に発生したランダム励起信号で置換する。ま
た、ランダム励起信号を、上記のように、RESC合成
フィルタで濾波する。各サブフレームの適応コードブッ
ク利得の値は0に設定する。各サブフレームのピッチ遅
延値は、例えば60に設定する。LPフィルタパラメー
タとしては、快適化雑音パラメータメッセージによって
受信されたパラメータを用いる。通常のLPパラメータ
量子化および固定コードブック利得量子化アルゴリズム
に用いられる予測子メモリは、SPフラッグ=「0」の
ときにリセットされ、音声が再び再開されたときに、量
子化器がその初期状態から再び動作を開始することがで
きるようになされる。音声復号器が以上のパラメータを
用いて通常の動作を行うことによって、快適化雑音が合
成される。妥当な快適化雑音パラメータメッセージを受
信するごとに、快適化雑音パラメータ(ランダム励起信
号利得、RESCパラメータ、LPフィルタパラメー
タ)が上記のように更新される。快適化雑音の更新にお
いて、変化をより円滑なものとするために、上記のパラ
メータは、快適化雑音更新期間において内挿される。受
信側不連続送信ハンドラが快適化雑音が発生していると
きに受信された使用不可能なフレームは、欠落快適化雑
音パラメータメッセージと呼ばれる。このようなフレー
ムが受信された場合には、快適化雑音メッセージを推測
する(快適化雑音更新フラッグCNU=「1」)。
The generation of comfort noise is performed using a method in which the speech decoding algorithm is modified as follows. That is, the fixed codebook gain value is replaced with the random excitation gain value obtained by the comfort noise parameter message, and the fixed codebook excitation signal is replaced with the locally generated random excitation signal as described above. . The random excitation signal is also filtered by the RESC synthesis filter, as described above. The value of the adaptive codebook gain of each subframe is set to 0. The pitch delay value of each subframe is set to 60, for example. The parameters received by the comfort noise parameter message are used as the LP filter parameters. The predictor memory used in conventional LP parameter quantization and fixed codebook gain quantization algorithms is reset when SP flag = "0" and when the speech is restarted again, the quantizer has its initial state. The operation can be started again from. The comfort noise is synthesized by the speech decoder performing the normal operation using the above parameters. Each time a valid comfort noise parameter message is received, the comfort noise parameters (random excitation signal gain, RESC parameters, LP filter parameters) are updated as described above. In order to make the change smoother in the comfort noise update, the above parameters are interpolated during the comfort noise update period. An unusable frame received when the receiving discontinuous transmission handler is experiencing comfort noise is called a missing comfort noise parameter message. If such a frame is received, a comfort noise message is inferred (comfort noise update flag CNU = "1").

【0200】上記のような欠落が単一の快適化雑音パラ
メータメッセージで生じた場合には、そのパラメータ
は、直前の妥当な快適化雑音パラメータメッセージのパ
ラメータで置き換えられ、このパラメータに対して上記
の処理が行われる。さらに、快適化雑音パラメータメッ
セージの欠落が生じた場合には、快適化雑音をミューテ
ィングし、出力レベルを次第に低下させ(−3dB/フ
レーム)、最終的に復号器の出力を零とする。上記のミ
ューティングは、ランダム励起信号利得を1フレーム当
たり−3dBの一定の割合で0まで低下させることによ
って行われる。この値は、さらに欠落が生じた場合に
は、そのまま維持される。
If such a drop occurs in a single comfort noise parameter message, then that parameter is replaced with the parameter of the previous valid comfort noise parameter message, and for this parameter the above Processing is performed. Furthermore, when the comfort noise parameter message is lost, the comfort noise is muted, the output level is gradually reduced (-3 dB / frame), and finally the output of the decoder is zero. The muting is performed by reducing the random excitation signal gain to 0 at a constant rate of -3 dB per frame. This value is maintained as it is when a further dropout occurs.

【0201】以上に、フレーム長さやフレーム数などの
具体的な値を仮定し、また具体的なメッセージの型(F
ACCH)を例として、本発明を説明したが、フレーム
の数、フレームの長さ、ハングオーバ期間の長さ、平均
化期間の長さ、メッセージの型などは、具体的なディジ
タル移動通信システムの仕様と要求に応じていろいろに
変更が可能である。また、以上では、図2(a)、2
(b)、3(a)、3(b)、4、5、10などの回路
ブロック図を用いて本発明を説明したが、これらの回路
ブロックのうちのあるものは、ディジタルセルラ電話1
0の一部として含まれる、適切にプログラムされたディ
ジタルデータプロセッサ(例えば、図12のコントロー
ラ18がその例である)を用いて実現することも可能で
ある。その例の一つとして、例えば、セレクタ307、
319、410は、図4、5ではスイッチとして示され
ているが、これらのセレクタはソフトウェアで完全に実
現することも可能である。
As described above, specific values such as the frame length and the number of frames are assumed, and the specific message type (F
The present invention has been described by taking the ACCH) as an example. And various changes can be made according to requirements. In addition, in the above, FIG.
Although the present invention has been described with reference to circuit block diagrams such as (b), 3 (a), 3 (b), 4, 5, 10 and the like, some of these circuit blocks may be digital cellular telephones 1.
It can also be implemented using a suitably programmed digital data processor (eg, controller 18 of FIG. 12 is an example) included as part of a zero. As one of the examples, for example, the selector 307,
Although 319 and 410 are shown as switches in FIGS. 4 and 5, these selectors can also be completely implemented in software.

【0202】また、システムによっては、快適化雑音の
発生において、RESCパラメータを送信側から受信側
に送信するのに用いられる快適化雑音パラメータメッセ
ージ(SIDフレーム)が予備ビットを含むようにする
場合もある。このような場合には、本発明のRESCフ
ィルタを固定係数を有する合成フィルタで置き換えるこ
とができる。固定フィルタ係数は、合成フィルタの周波
数応答特性が、その係数が送信された値によって定まる
通常のRESCフィルタの平均的な周波数応答となるよ
うに最適化される。あるいは、フィルタが知覚上好適な
快適化雑音を得るのに適した周波数応答特性を有するよ
うに、フィルタ係数と選定するようにもできる。
Further, depending on the system, when comfort noise is generated, the comfort noise parameter message (SID frame) used for transmitting the RESC parameter from the transmission side to the reception side may include a spare bit. is there. In such cases, the RESC filter of the present invention can be replaced by a synthesis filter with fixed coefficients. The fixed filter coefficients are optimized such that the frequency response characteristic of the synthesis filter is the average frequency response of a conventional RESC filter whose coefficients are determined by the value transmitted. Alternatively, the filter coefficients may be selected so that the filter has a frequency response characteristic suitable for obtaining a perceptually preferable comfort noise.

【0203】以上に、本発明を、具体的な実施例につい
て説明したが、本発明はこれらのみに限定されるわけで
はなく、本発明の範囲と精神から逸脱することなくいろ
いろな変形が可能であることは明白であろう。
Although the present invention has been described above with reference to specific embodiments, the present invention is not limited to these, and various modifications can be made without departing from the scope and spirit of the present invention. It will be obvious.

【図面の簡単な説明】[Brief description of drawings]

【図1a】送信側において、快適化雑音パラメータを発
生させるための従来の回路を表したブロック図である。
FIG. 1a is a block diagram illustrating a conventional circuit for generating a comfort noise parameter at a transmitting side.

【図1b】受信側において快適化雑音を発生させるのに
従来用いられている復号器を示すブロック図である。
FIG. 1b is a block diagram showing a decoder conventionally used to generate comfort noise at the receiving side.

【図1c】図1(b)の従来の復号器のいくつかの部分
における信号のスペクトルを表す図である。
1c is a diagram representing the spectrum of a signal in some parts of the conventional decoder of FIG. 1 (b).

【図1d】図1(a)の平均化ブロックをさらに詳細に
示す図である。
FIG. 1d shows the averaging block of FIG. 1 (a) in more detail.

【図2a】本発明による、送信側において快適化雑音パ
ラメータを発生させるための回路を示すブロック図であ
る。
FIG. 2a is a block diagram showing a circuit for generating comfort noise parameters at the transmitter side according to the present invention.

【図2b】本発明による、受信側において快適化雑音を
発生させるための回路を示すブロック図である。
FIG. 2b is a block diagram showing a circuit for generating comfort noise at the receiving side according to the present invention.

【図2c】図2(b)の復号器におけるスペクトルを表
す図である。
FIG. 2c is a diagram showing a spectrum in the decoder of FIG. 2 (b).

【図3a】本発明の第2の実施例による、送信側におい
て快適化雑音パラメータを発生させるための回路を示す
ブロック図である。
FIG. 3a is a block diagram showing a circuit for generating comfort noise parameters at a transmitter side according to a second embodiment of the invention.

【図3b】本発明の第2の実施例による、受信側におけ
る復号器を示すブロック図である。
FIG. 3b is a block diagram showing a decoder at a receiving side according to a second embodiment of the present invention.

【図4】本発明の実施例による、不連続送信方式ディジ
タル通信システムの送信側において快適化雑音パラメー
タを算定するための回路を示すブロックである。
FIG. 4 is a block diagram showing a circuit for calculating comfort noise parameters at a transmitter side of a discontinuous transmission digital communication system according to an embodiment of the present invention.

【図5】本発明の他の実施例による、不連続送信方式デ
ィジタル通信システムの送信側において快適化雑音パラ
メータを算定するための回路を示すブロックである。
FIG. 5 is a block diagram showing a circuit for calculating comfort noise parameters at a transmitter side of a discontinuous transmission digital communication system according to another embodiment of the present invention.

【図6】従来技術による音声符号器のブロック図であ
る。
FIG. 6 is a block diagram of a speech encoder according to the prior art.

【図7】図6の従来技術による音声符号器の出力の例を
示すタイミング図である。
7 is a timing diagram showing an example of the output of the speech encoder according to the prior art of FIG.

【図8】図6の従来技術による音声符号器の出力の他の
例を示すタイミング図である。
8 is a timing diagram showing another example of the output of the speech coder according to the related art of FIG.

【図9】従来技術による音声復号器を示すブロック図で
ある。
FIG. 9 is a block diagram showing a speech decoder according to the related art.

【図10】本発明の実施例による、音声復号器を示すブ
ロック図である。
FIG. 10 is a block diagram showing a speech decoder according to an embodiment of the present invention.

【図11a】RESCフィルタの典型的な周波数応答を
示す図である。
FIG. 11a shows a typical frequency response of a RESC filter.

【図11b】RESCフィルタの典型的な周波数応答を
示す図である。
FIG. 11b is a diagram showing a typical frequency response of a RESC filter.

【図11c】RESCフィルタの典型的な周波数応答を
示す図である。
FIG. 11c shows a typical frequency response of a RESC filter.

【図11d】RESCフィルタの典型的な周波数応答を
示す図である。
FIG. 11d shows a typical frequency response of a RESC filter.

【図11e】RESCフィルタの典型的な周波数応答を
示す図である。
FIG. 11e shows a typical frequency response of a RESC filter.

【図11f】RESCフィルタの典型的な周波数応答を
示す図である。
FIG. 11f shows a typical frequency response of a RESC filter.

【図11g】RESCフィルタの典型的な周波数応答を
示す図である。
FIG. 11g shows a typical frequency response of a RESC filter.

【図12】本発明を実施するのに適した移動局を示す図
である。
FIG. 12 shows a mobile station suitable for implementing the present invention.

【図13】本発明を実施するのに適した、地上局と無線
通信するための移動端末を示す図である。
FIG. 13 is a diagram of a mobile terminal for wirelessly communicating with a ground station, suitable for implementing the present invention.

【図14】通常のハングオーバ手順を示す図であり、N
elapsedは快適化雑音(CN)パラメータが最後に更新
されてから後のフレーム数を表し、Nelapsedは24以
上のときに限ってハングオーバが起こる。
FIG. 14 is a diagram showing a normal hangover procedure, in which N
elapsed represents the number of frames after the comfort noise (CN) parameter was last updated, and Nelapsed causes hangover only when 24 or more.

【図15】Nelapsedが24より小さい場合の、短音声
バーストの処理を示すタイミング図である。
FIG. 15 is a timing diagram showing processing of a short voice burst when Nelapsed is smaller than 24.

【符号の説明】[Explanation of symbols]

100 音声信号 101 線形予測符号化(LPC)解析ブロック 103 逆フィルタ 104 残差信号 105 励起利得算出ブロック 107、108 平均化ブロック 110 ランダム励起信号(RE)発生器 112 音声合成フィルタ 200 ランダム励起線形予測符号化分析ブロック 202 ランダム励起制御逆フィルタ 100 audio signals 101 Linear Predictive Coding (LPC) Analysis Block 103 Inverse filter 104 residual signal 105 pump gain calculation block 107, 108 averaging block 110 Random Excitation Signal (RE) Generator 112 Speech synthesis filter 200 Random excitation linear predictive coding analysis block 202 Random excitation control inverse filter

───────────────────────────────────────────────────── フロントページの続き (72)発明者 ベサ ルオッピラ フィンランド共和国、33720 タンペレ、 ビルップランポルク 20 べー (72)発明者 ヤニ ロトラ−プッキラ フィンランド共和国、タンペレ、フィン −33820、マンニコンカツ 3 アー 22 (56)参考文献 特開 平8−195700(JP,A) 国際公開96/32817(WO,A1) 国際公開96/32823(WO,A1) (58)調査した分野(Int.Cl.7,DB名) H04B 1/10 G10L 19/08 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Besar Oppira Finland, 33720 Tampere, Biruppuruppoluk 20 Be (72) Inventor Yani Rotora Pukkyra Finland, Tampere, Fin-33820, Mannicon Kats 3 Ar 22 ( 56) References JP-A-8-195700 (JP, A) International Publication 96/32817 (WO, A1) International Publication 96/32823 (WO, A1) (58) Fields investigated (Int.Cl. 7 , DB name) ) H04B 1/10 G10L 19/08

Claims (25)

(57)【特許請求の範囲】 (57) [Claims] 【請求項1】 不連続送信方式を用いたディジタル移動
端末において快適化雑音(CN)を発生する方法であっ
て、 音声が途絶えたときに、音声符号化パラメータの集合を
バッファリングするステップと、 平均化期間において、上記集合の中の背景雑音を良好に
表していない音声符号化パラメータを、背景雑音を良好
に表す音声符号化パラメータで置換するステップと、 上記音声符号化パラメータの集合の平均を求めるステッ
プとを含む方法。
1. A method for generating comfort noise (CN) in a digital mobile terminal using a discontinuous transmission method, which comprises buffering a set of speech coding parameters when speech is interrupted, In the averaging period, the step of replacing the speech coding parameters that do not well represent the background noise in the set with speech coding parameters that well represent the background noise, and the average of the set of speech coding parameters And a step of seeking.
【請求項2】 上記ステップに含まれる置換をするステ
ップが、 上記平均化期間内の個々のフレーム間で、互いの音声符
号化パラメータの距離を測定するステップと、 平均化期間内において、他のパラメータからの距離が最
大である音声符号化パラメータを識別するステップと、 もし、上記距離が、あらかじめ定められた閾値よりも大
きい場合には、上記の識別された音声符号化パラメータ
を、上記平均化期間内において他の音声符号化パラメー
タに対する測定距離が最小である音声符号化パラメータ
と置換するステップととを含む請求項記載の方法。
2. The step of performing the substitution included in the step includes the step of measuring the distances of the speech coding parameters from each other in the individual frames in the averaging period, and the other step in the averaging period. Identifying the speech coding parameter with the greatest distance from the parameter, and if the distance is greater than a predetermined threshold, the identified speech coding parameter is averaged with the averaged value. the method of claim 1 further comprising the step of Toto replacing speech coding parameters measured distance to the other speech coding parameters is the minimum in the period.
【請求項3】 上記ステップに含まれる置換をするステ
ップが、 上記平均化期間内の個々のフレーム間で、互いの音声符
号化パラメータの距離を測定するステップと、 平均化期間内において、他のパラメータからの距離が最
大である音声符号化パラメータを識別するステップと、 もし、上記距離が、あらかじめ定められた閾値よりも大
きい場合には、上記の識別された音声符号化パラメータ
を、中央値を有する音声符号化パラメータと置換するス
テップととを含む請求項記載の方法。
3. The replacing step included in the above step includes the steps of measuring the distances of speech coding parameters from each other in the individual frames within the averaging period, and other steps within the averaging period. Identifying the speech coding parameter with the greatest distance from the parameter, and if the distance is greater than a predetermined threshold, the identified speech coding parameter with the median value the method of claim 1 further comprising the step of Toto replacing the speech coding parameter having.
【請求項4】 上記の平均を求めるステップが、平均励
起信号利得gmeanと平均短期間スペクトル係数fmean
(i)を計算するステップとを含む請求項記載の方
法。
4. The step of obtaining the average includes the average excitation signal gain gmean and the average short-term spectrum coefficient fmean.
(I) The method of claim 1 further comprising calculating a.
【請求項5】 上記ステップに含まれる置換をするステ
ップが、 平均化期間の間にバッファリングされた励起信号利得値
の集合を形成するステップと、 上記バッファリングされた励起信号利得値の集合を整列
するステップと、 上記励起信号利得値の集合の中央値との差があらかじめ
定められた閾値を越えた励起信号利得値のうち、上記中
央値からの差が最も大きいL個の励起信号利得値を上記
中央値で置換する、中央値置換ステップとを含む請求項
記載の方法。
5. The step of permuting included in the step of forming a set of buffered excitation signal gain values during an averaging period; and a step of forming the set of buffered excitation signal gain values. Among the excitation signal gain values in which the difference between the aligning step and the median value of the set of excitation signal gain values exceeds a predetermined threshold value, the L excitation signal gain values having the largest difference from the median value. Replacing the median with the median.
The method described in 1 .
【請求項6】 上記平均化期間の長さNが奇数であり、
上記整列された励起信号利得値の集合の中央値が、上記
集合の第((N+1)/2)番目の要素の値である請求
記載の方法。
6. The length N of the averaging period is an odd number,
The method of claim 5 , wherein the median of the aligned set of excitation signal gain values is the value of the ((N + 1) / 2) th element of the set.
【請求項7】 平均化期間においてバッファリングされ
たラインスペクトル対(LSP)係数f(k)(k=
1、・・・、M)の集合を形成するステップと、 平均化期間の第i番目のフレームのLSP係数fi
(k)の同じく平均化期間の第j番目のフレームのLS
P係数fj(k)に対するスペクトル距離を求めるステ
ップとをさらに含む請求項記載の方法。
7. A buffered line spectrum pair (LSP) coefficient f (k) (k =
1, ..., M), and the LSP coefficient fi of the i-th frame in the averaging period
The LS of the j-th frame in the same averaging period of (k)
The method of claim 1, further comprising the step of determining the spectral distance to P coefficient fj (k).
【請求項8】 上記スペクトル距離を求めるステップ
が、次の式: 【数7】 (ただし、MはLPCモデルの次数、fi(k)は平均
化期間における第i番目のフレームの第k番目のLSP
パラメータ)に従って実行される請求項記載の方法。
8. The step of obtaining the spectral distance is performed by the following equation: (Where M is the order of the LPC model, fi (k) is the k-th LSP of the i-th frame in the averaging period.
Method according to claim 7, carried out according to (parameters).
【請求項9】 長さNの平均化期間において、第i番目
のフレームのLSP係数fi(k)の同じく平均化期間
のその他のすべてのフレーム(j=1、・・・、N、j
≠i)のLSP係数に対するスペクトル距離ΔSiを求
めるステップをさらに含む請求項記載の方法。
9. In the averaging period of length N, all other frames (j = 1, ..., N, j) of the LSP coefficient fi (k) of the i-th frame in the same averaging period.
8. The method according to claim 7 , further comprising the step of determining the spectral distance .DELTA.Si for the LSP coefficient of .noteq.i).
【請求項10】 上記スペクトル距離を求めるステップ
が、次の式: 【数8】 に従ってスペクトル距離ΔRijの和をすべてのi=1、
・・・、Nについて求めることによって実行される請求
記載の方法。
10. The step of determining the spectral distance is performed by the following equation: According to the sum of the spectral distances ΔRij for all i = 1,
..., The method of claim 9 performed by determining for N.
【請求項11】 平均化期間における各LSPベクトル
fiに対するスペクトル距離ΔSiを求めた後に、その値
に従ってスペクトル距離を整列するステップと、 上記平均化期間(i=1、2、・・・、N)内において
最も小さい距離ΔSiを有するベクトルfiを、上記平均
化期間の中央ベクトルfmedとし、その距離をΔSmedで
表すステップと、 P(0≦P≦N−1)個のLSPベクトルfiの中央値を
上記中央ベクトルfmedで置換するステップとをさらに
請求項記載の方法。
11. A step of, after obtaining a spectral distance ΔSi for each LSP vector fi in the averaging period, aligning the spectral distances according to the value, the averaging period (i = 1, 2, ..., N). The vector fi having the smallest distance ΔSi in is defined as the median vector fmed of the averaging period, and the distance is represented by ΔSmed, and the median value of P (0 ≦ P ≦ N−1) LSP vectors fi is The method of claim 9 , further comprising the step of replacing with the median vector fmed.
【請求項12】 上記識別するステップおよび置換する
ステップが、励起信号利得値gとラインスペクトル対
(LSP)ベクトルfiのそれぞれに対して独立に行わ
れる請求項記載の方法。
12. The method of claim 2 , wherein the identifying and replacing steps are performed independently for each of the excitation signal gain value g and the line spectrum pair (LSP) vector fi.
【請求項13】 上記識別するステップおよび置換する
ステップが、励起信号利得値gとラインスペクトル対
(LSP)ベクトルfiの両方に対して同時に行われる
請求項記載の方法。
13. The identifying step and the step of replacing the excitation signal gain value g and the line spectral pair (LSP) vectors simultaneously The method of claim 2, wherein the performed on both fi.
【請求項14】 あるフレームの音声符号化パラメータ
をパラメータの中央値で置換すべきであると判定された
場合には、そのフレームの励起信号利得値gとLSPベ
クトルfiの両方を、中央値パラメータを含むフレーム
のそれぞれに対応するパラメータで置換するステップを
含む請求項13記載の方法。
14. When it is determined that the speech coding parameter of a frame should be replaced by the median value of the parameters, both the excitation signal gain value g and the LSP vector fi of the frame are set to the median parameter. 14. The method of claim 13 including the step of substituting with parameters corresponding to each of the frames containing.
【請求項15】 平均化期間内の第i番目のフレームと
第j番目のフレームとの間の距離ΔTijを次の式: 【数9】 (ただし、MはLPCモデルの次数、fi(k)は平均
化期間内の第i番目のフレームの第k番目のLSPパラ
メータ、giは第i番目のフレームの励起信号利得パラ
メータ)に従って求める請求項14記載の方法。
15. The distance ΔTij between the i-th frame and the j-th frame in the averaging period is calculated by the following formula: (Where M is the order of the LPC model, fi (k) is the kth LSP parameter of the ith frame in the averaging period, and gi is the excitation signal gain parameter of the ith frame). 14. The method according to 14 .
【請求項16】 長さがNである平均化期間内のフレー
ムiの音声符号化パラメータのその他のすべてのフレー
ムj=1、・・・、N(j≠i)に対する距離ΔSi
を、すべてのi=1、・・・、Nについて、次の式: 【数10】 に従って求めるステップをさらに含む請求項15記載の
方法。
16. Distance ΔSi for all other frames j = 1, ..., N (j ≠ i) of the speech coding parameters of frame i within the averaging period of length N.
, For all i = 1, ..., N, the following equation: 16. The method of claim 15 , further comprising the step of determining according to.
【請求項17】 平均化期間内の各フレームに対する距
離ΔSiを求めた後、さらに、 上記距離をその値の順に整列するステップと、 上記平均化期間(i=1、2、・・・、N)内において
最も小さい距離ΔSiを有するフレームを、上記平均化
期間の中央フレームとし、その距離をΔSmed、またそ
の音声符号化パラメータをgmedおよびfmedで表すステ
ップとを実行する請求項16記載の方法。
17. A step of arranging the distances in order of the values after obtaining the distance ΔSi for each frame within the averaging period, and the averaging period (i = 1, 2, ..., N). 17. The method of claim 16 , wherein the frame with the smallest distance ΔSi in) is the central frame of the averaging period, the distance is ΔSmed, and its speech coding parameters are denoted by gmed and fmed.
【請求項18】 平均化期間(i=1、2、・・・、
N)内のフレームの音声符号化パラメータに対する中央
値置換処理を、L(0≦L≦N−1)個のフレームのパ
ラメータgiおよびfiを中央フレームのパラメータgme
dおよびfmedで置換することによって行う請求項17
載の方法。
18. An averaging period (i = 1, 2, ...,
The median value substitution process for the speech coding parameters of the frames in N) is performed by converting the parameters gi and fi of L (0≤L≤N-1) frames into the parameter gme of the central frame
18. The method according to claim 17, which is carried out by substituting d and fmed.
【請求項19】 個々の距離と距離中央値との差異を、
個々の距離を距離中央値で割った商ΔSi/ΔSmedで表
す請求項17記載の方法。
19. The difference between the individual distance and the median distance is calculated by:
18. The method of claim 17 , wherein the individual distances are represented by the quotient ΔSi / ΔSmed divided by the median distance.
【請求項20】 個々の距離と距離中央値との差異を、
個々の距離を距離中央値で割った商ΔSi/ΔSmedで表
す請求項11記載の方法。
20. The difference between the individual distances and the median distances,
A method according to claim 11 , characterized by the quotient ΔSi / ΔSmed divided by the median distance of the individual distances.
【請求項21】 通信網に対して不連続通信を行うディ
ジタル移動端末を含むシステムにおいて快適化雑音を発
生する装置であって、 音声が途絶えたときに、音声符号化パラメータの集合を
平均化期間においてバッファリングし、上記集合のうち
の背景雑音を良好に表さない音声符号化パラメータを背
景雑音を良好に表す音声符号化パラメータと置換するデ
ータ処理手段を含み、該データ処理手段が、上記音声符
号化パラメータの集合の平均値を求め、得られた音声符
号化パラメータの平均値の集合を上記通信網に対して送
信する装置。
21. An apparatus for generating comfort noise in a system including a digital mobile terminal which performs discontinuous communication with a communication network, wherein a set of speech coding parameters is used for averaging period when speech is interrupted. Buffering and replacing the speech coding parameters of the set that do not represent well the background noise with speech coding parameters that represent well the background noise, the data processing means comprising: An apparatus for obtaining an average value of a set of coding parameters and transmitting the obtained set of average values of the voice coding parameters to the communication network.
【請求項22】 上記データ処理手段が、上記集合の音
声符号化パラメータの置換を、上記音声符号化パラメー
タの集合を整列し、平均化期間内の個々のフレーム間の
音声符号化パラメータの互いの距離を測定し、上記平均
化期間内において他のパラメータからの距離が最大であ
る音声符号化パラメータを識別し、もし、上記最大距離
があらかじめ定められた閾値を越えている場合には、上
記の最大距離を有すると識別された音声符号化パラメー
タを、上記平均化距離内における他の音声符号化パラメ
ータとの距離が最小であると測定された音声符号化パラ
メータと置換する請求項21記載の装置。
22. The data processing means replaces the speech coding parameters of the set by aligning the set of speech coding parameters with each other of the speech coding parameters between individual frames within an averaging period. Measure the distance and identify the speech coding parameter that has the greatest distance from other parameters within the averaging period, and if the maximum distance exceeds a predetermined threshold, then 22. The apparatus of claim 21 , wherein speech coding parameters identified as having the greatest distance are replaced with speech coding parameters measured to have a minimum distance to other speech coding parameters within the averaged distance. .
【請求項23】 上記データ処理手段が、上記集合の音
声符号化パラメータの置換を、上記音声符号化パラメー
タの集合を整列し、平均化期間内の個々のフレーム間の
音声符号化パラメータの互いの距離を測定し、上記平均
化期間内において他のパラメータからの距離が最大であ
る音声符号化パラメータを識別し、もし、上記最大距離
があらかじめ定められた閾値を越えている場合には、上
記の最大距離を有すると識別された音声符号化パラメー
タを、中央値を有する音声符号化パラメータと置換する
請求項21記載の装置。
23. The data processing means replaces the speech coding parameters of the set by arranging the set of speech coding parameters such that the speech coding parameters between individual frames within an averaging period are mutually equal. Measure the distance and identify the speech coding parameter that has the greatest distance from other parameters within the averaging period, and if the maximum distance exceeds a predetermined threshold, then 22. The apparatus of claim 21 , wherein speech coding parameters identified as having a maximum distance are replaced with speech coding parameters having a median value.
【請求項24】 上記データ処理手段が、音声符号化パ
ラメータの励起信号利得値gとラインスペクトル対(L
SP)ベクトルfiに対してそれぞれ独立に識別と置換
を行う請求項21記載の装置。
24. The data processing means comprises an excitation signal gain value g of a speech coding parameter and a line spectrum pair (L).
The apparatus according to claim 21, wherein the SP) vector fi is identified and replaced independently.
【請求項25】 上記データ処理手段が、音声符号化パ
ラメータの励起信号利得値gとラインスペクトル対(L
SP)ベクトルfiに対して両方同時に識別と置換を行
う請求項21記載の装置。
25. The data processing means comprises an excitation signal gain value g of a voice coding parameter and a line spectrum pair (L
22. The apparatus of claim 21 , wherein both SP) vectors fi are identified and permuted simultaneously.
JP31395797A 1996-11-15 1997-11-14 Improved method of generating comfort noise during discontinuous transmission Expired - Lifetime JP3464371B2 (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US3104796P 1996-11-15 1996-11-15
US3132196P 1996-11-19 1996-11-19
US60/031,321 1996-11-19
US60/031,047 1996-11-19

Publications (2)

Publication Number Publication Date
JPH10190498A JPH10190498A (en) 1998-07-21
JP3464371B2 true JP3464371B2 (en) 2003-11-10

Family

ID=26706764

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31395797A Expired - Lifetime JP3464371B2 (en) 1996-11-15 1997-11-14 Improved method of generating comfort noise during discontinuous transmission

Country Status (1)

Country Link
JP (1) JP3464371B2 (en)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US7124079B1 (en) * 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
AR024520A1 (en) * 1998-11-24 2002-10-16 Ericsson Telefon Ab L M METHOD FOR CARRYING OUT THE DISCONTINUOUS TRANSMISSION (DTX) IN A COMMUNICATIONS SYSTEM, METHOD FOR TRANSMITTING PROTOCOL MESSAGES TO A SECOND COMPONENT IN A COMMUNICATION SYSTEM WHERE SPEECH DATA IS TRANSMITTED FROM A FIRST COMPONENT TO A SECOND COMPONENT METHOD
US6978236B1 (en) 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
JP2001242896A (en) * 2000-02-29 2001-09-07 Matsushita Electric Ind Co Ltd Speech coding/decoding apparatus and its method
JP3670217B2 (en) 2000-09-06 2005-07-13 国立大学法人名古屋大学 Noise encoding device, noise decoding device, noise encoding method, and noise decoding method
US7536298B2 (en) * 2004-03-15 2009-05-19 Intel Corporation Method of comfort noise generation for speech communication
JP2008502022A (en) * 2004-06-08 2008-01-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Audio encoding
JPWO2006008932A1 (en) * 2004-07-23 2008-05-01 松下電器産業株式会社 Speech coding apparatus and speech coding method
WO2008007700A1 (en) * 2006-07-12 2008-01-17 Panasonic Corporation Sound decoding device, sound encoding device, and lost frame compensation method
CN100555414C (en) * 2007-11-02 2009-10-28 华为技术有限公司 A kind of DTX decision method and device
JP5969513B2 (en) * 2011-02-14 2016-08-17 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン Audio codec using noise synthesis between inert phases
CN105225668B (en) 2013-05-30 2017-05-10 华为技术有限公司 Signal encoding method and equipment
CN104978970B (en) 2014-04-08 2019-02-12 华为技术有限公司 A kind of processing and generation method, codec and coding/decoding system of noise signal

Also Published As

Publication number Publication date
JPH10190498A (en) 1998-07-21

Similar Documents

Publication Publication Date Title
EP0843301B1 (en) Methods for generating comfort noise during discontinous transmission
US6816832B2 (en) Transmission of comfort noise parameters during discontinuous transmission
JP4313570B2 (en) A system for error concealment of speech frames in speech decoding.
US8380496B2 (en) Method and system for pitch contour quantization in audio coding
US5835889A (en) Method and apparatus for detecting hangover periods in a TDMA wireless communication system using discontinuous transmission
KR100675126B1 (en) Speech coding with comfort noise variability feature for increased fidelity
JP3464371B2 (en) Improved method of generating comfort noise during discontinuous transmission
JPH07311598A (en) Generation method of linear prediction coefficient signal
JPH07311596A (en) Generation method of linear prediction coefficient signal
JPH07325594A (en) Operating method of parameter-signal adaptor used in decoder
EP2127088B1 (en) Audio quantization
JP2003504669A (en) Coding domain noise control
EP1617417A1 (en) Voice coding/decoding method and apparatus
EP1199710A1 (en) Device for encoding/decoding voice and for voiceless encoding, decoding method, and recorded medium on which program is recorded
US20050102136A1 (en) Speech codecs
JP3225256B2 (en) Pseudo background noise generation method
JP3508850B2 (en) Pseudo background noise generation method
JP3519764B2 (en) Speech coding communication system and its device
JPH10341211A (en) Voice coding method and its system
JPH08110798A (en) Voice decoding method and device thereof
JPH07334195A (en) Device for encoding sub-frame length variable voice
JPH09297600A (en) Voice decoder

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080822

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080822

Year of fee payment: 5

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080822

Year of fee payment: 5

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080822

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090822

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090822

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100822

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110822

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110822

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120822

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130822

Year of fee payment: 10

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term