JP2003533902A - Controlling echo in the encoded domain - Google Patents

Controlling echo in the encoded domain

Info

Publication number
JP2003533902A
JP2003533902A JP2001508063A JP2001508063A JP2003533902A JP 2003533902 A JP2003533902 A JP 2003533902A JP 2001508063 A JP2001508063 A JP 2001508063A JP 2001508063 A JP2001508063 A JP 2001508063A JP 2003533902 A JP2003533902 A JP 2003533902A
Authority
JP
Japan
Prior art keywords
parameter
code
signal
digital signal
echo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001508063A
Other languages
Japanese (ja)
Other versions
JP2003533902A5 (en
Inventor
チャンドラン,ラビ
ジェイ. マーチョク,ダニエル
Original Assignee
テラブス オペレーションズ,インコーポレイティド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テラブス オペレーションズ,インコーポレイティド filed Critical テラブス オペレーションズ,インコーポレイティド
Publication of JP2003533902A publication Critical patent/JP2003533902A/en
Publication of JP2003533902A5 publication Critical patent/JP2003533902A5/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0014Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the source coding

Abstract

(57)【要約】 通信システム(10)は第1のパラメータを包含する複数のパラメータを有する圧縮のコードを使用して近接終端のデジタル信号を送信する。このパラメータは複数のオーディオの特徴を有する1つのオーディオの信号を代表する。このシステムはまた、圧縮のコードを使用して遠隔終端のデジタル信号を送信する。端子(20)は近接終端のデジタル信号を受信し、端子(36)は遠隔終端のデジタル信号を受信する。プロセッサ(40)は近接終端のデジタル信号に応答し少なくとも最初のパラメータを読む。プロセッサは少なくとも部分的に復号された近接終端の信号、および少なくとも部分的に復号された遠隔終端の信号を発生させる。そのような信号にもとづきプロセッサは第1のパラメータを調節しこの調節された第1のパラメータを近接終端のデジタル信号へ書込む。他の1つの端子(22)は調節された近接終端のデジタル信号を送信する。その結果、近接終端のデジタル信号におけるエコーは減少させられる。 (57) Abstract: A communication system (10) transmits a close-terminated digital signal using a compression code having a plurality of parameters including a first parameter. This parameter is representative of a single audio signal having multiple audio features. The system also transmits the digital signal at the remote end using a code of compression. Terminal (20) receives the near-terminated digital signal and terminal (36) receives the remote-terminated digital signal. The processor (40) reads at least the first parameter in response to the digital signal of the proximity termination. A processor generates at least partially decoded near-terminated signals and at least partially decoded remote-terminated signals. Based on such a signal, the processor adjusts the first parameter and writes the adjusted first parameter to the near-terminated digital signal. The other terminal (22) transmits the adjusted near-terminated digital signal. As a result, echoes in the digital signal at the near end are reduced.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】 関連出願に関する記載 これは、1990年7月2日提出の、名称「圧縮音声の符号化ドメインエンハ
ンスメント」と題した仮出願第60/142,136号に対応するユーティリテ
ィアプリケーションである。
Description of Related Application This is a utility application corresponding to Provisional Application No. 60 / 142,136, filed July 2, 1990, entitled "Coding Domain Enhancement of Compressed Speech."

【0002】 連邦政府支援の研究開発に関する宣言 適用されるものなし[0002] Federal Government Research and Development Declaration   None applicable

【0003】 発明の背景 本発明は、圧縮された音声の符号化されたドメインのエンハンスメントに関す
るもので、特に、符号化されたドメインのエコーの制御に関するものである。
BACKGROUND OF THE INVENTION The present invention relates to coded domain enhancement of compressed speech, and more particularly to coded domain echo control.

【0004】 本明細書は下記参考文献を参考とする。 [1]GSM 06.10「ディジタルセルラー通信システム(フェーズ2);フルレー
ト音声;パート2:トランス符号化」、ETS 300 580-2、1998年3月、第2版。 [2]GSM 06.60「ディジタルセルラー通信システム(フェーズ2);エンハン
スド・フルレート(EFR)音声トランス符号化」、1998年6月。 [3]GSM 08.62「ディジタルセルラー通信システム(フェーズ2+);音声符
号器のインバンド・タンデムフリーオペレーション(TFO)」、ETSI、2000年
3月。 [4]J.R.Deller,J.G.Proakis,J.H.L.Hansen「音声信号の個別時間処理」、
第7章、 Prentice-Hall Inc., 1987。 [5]GSM 06.12「欧州ディジタルセルラー通信システム(フェーズ2);フル
レート音声トラフィックチャネルにとって好適なノイズ面」、ETSI、1994年。
This specification refers to the following references. [1] GSM 06.10 "Digital Cellular Communication System (Phase 2); Full Rate Speech; Part 2: Trans Coding", ETS 300 580-2, March 1998, Second Edition. [2] GSM 06.60 "Digital Cellular Communication System (Phase 2); Enhanced Full Rate (EFR) Voice Trans Coding", June 1998. [3] GSM 08.62 “Digital Cellular Communication System (Phase 2+); In-Band Tandem Free Operation (TFO) of Voice Encoder”, ETSI, 2000
March. [4] JRDeller, JGProakis, JHLHansen "Individual time processing of audio signals",
Chapter 7, Prentice-Hall Inc., 1987. [5] GSM 06.12 "European Digital Cellular Communication System (Phase 2); Suitable Noise Surface for Full Rate Voice Traffic Channels", ETSI, 1994.

【0005】 GSMディジタルセルラーネットワークでは、移動局(送受器)と基地局の間
の音声伝送が圧縮された形または符号化された形で行われる。GSM FR[1
]やEFR[2]などの音声符号化技術が、音声を圧縮するのに使用される。音
声の圧縮に使用されるデバイスは、ボコーダと呼ばれる。符号化された音声が必
要とするビット数は、サンプル当たり2ビット未満である。この状況が図1に描
かれている。基地局相互間では、音声は符号化されていない形で伝送される(サ
ンプル当たり8ビットを必要とするPCMコンパンディングを使って)。
In GSM digital cellular networks, voice transmission between a mobile station (handset) and a base station takes place in compressed or coded form. GSM FR [1
] Or EFR [2] or other audio coding technique is used to compress the audio. The device used for voice compression is called a vocoder. The number of bits required for coded speech is less than 2 bits per sample. This situation is depicted in Figure 1. Voice is transmitted in uncoded form between base stations (using PCM companding, which requires 8 bits per sample).

【0006】 符号化音声および非符号化音声という用語は、次の通り説明することができる
。 非符号化音声:電話において代表的に使用されるディジタル音声信号サンプル
を指す。これらのサンプルは、サンプル当たり線形13ビットの形か、サンプル
当たり8ビットのμ法則またはA法則のPCMなどのコンパンドされた形かのど
ちらかで、代表的なビットレートは64kbpsである。
The terms coded speech and non-coded speech can be explained as follows. Uncoded Speech: Refers to digital speech signal samples typically used in telephones. These samples are either linear 13 bits per sample or 8 bits per sample in a compounded form such as μ-law or A-law PCM, with a typical bit rate of 64 kbps.

【0007】 符号化音声:GSM FRの場合13kbps、GSM EFRの場合12.2kb
psなどと、代表的に64kbpsよりはるかに低いビットレートを使用する圧縮オン
信号信号パラメータを指す(符号化パラメータとも呼ばれる)。圧縮方法は、単
純なPCMコンパンディング方式より費用がかかる。例を挙げると、圧縮方法は
線形予測符号化、符号励起式線形予測およびマルチバンド励起符号化である[4
]。
Coded voice: 13 kbps for GSM FR, 12.2 kb for GSM EFR
Refers to compressed on-signal signal parameters (also referred to as encoding parameters), which typically use bit rates much lower than 64 kbps, such as ps. The compression method is more expensive than the simple PCM companding scheme. By way of example, compression methods are linear predictive coding, code-excited linear prediction and multiband excitation coding [4].
].

【0008】 タンデムフリー・オペレーション(TFO)標準[3]が、近い将来、GSM
ディジタルセルラーネットワークにおいて展開される。TFO標準は、移動体相
互呼出しに適用される。TFOのもとで、音声信号は、短いネゴシエーション周
期の後に圧縮された形で移動体間を移送される。これは、移動体相互呼出しの間
のタンデムボイスコードを無くする。タンデムコードが無くされることは、オリ
ジナル信号が明瞭である場合に音声の質を良くすることが知られている。注意す
べきキーポイントは、音声伝送が移動体送受器の間で符号化されたまま残ること
で、図2に描かれている通りである。
The Tandem Free Operations (TFO) standard [3] will be in the near future in GSM
Deployed in digital cellular networks. The TFO standard applies to mobile cross-calls. Under TFO, audio signals are transported between mobiles in compressed form after a short negotiation period. This eliminates the tandem voice code during mobile inter-calls. The elimination of tandem codes is known to improve voice quality when the original signal is clear. The key point to note is that the voice transmission remains encoded between the mobile handsets, as depicted in FIG.

【0009】 TFOのもとで、送受器と基地局の間の伝送は符号化され、必要とするビット
数は音声サンプル当たり2ビット未満である。しかしながら、音声サンプル当た
り8ビットが依然、基地局間の伝送に使用可能である。基地局では、音声が復号
されてから、A法則コンパンドされるので、サンプル当たり8ビットが必要であ
る。それでも、オリジナルの符号化音声ビットは、A法則コンパンドされた各8
ビットサンプルの中の2つの最下位ビット(LSB)に取って代わるのに使用さ
れる。TFOが送受器間に一度確立されると、基地局は各8ビットサンプルの中
の2つのLSBをそれぞれの送受器に送り、6つの最上位ビットを捨てるだけと
なる。これで、ボコーダのタンデム化は回避されることになる。このプロセスは
図3に描かれている。
Under TFO, the transmission between the handset and the base station is coded, requiring less than 2 bits per voice sample. However, 8 bits per voice sample are still available for transmission between base stations. At the base station, 8 bits per sample are needed because the speech is decoded and then A-law expanded. Nevertheless, the original coded speech bits are each A-law compounded 8
Used to replace the two least significant bits (LSBs) in a bit sample. Once the TFO is established between the handsets, the base station only sends two LSBs in each 8-bit sample to each handset, discarding the six most significant bits. This avoids tandeming the vocoder. This process is depicted in Figure 3.

【0010】 エコー問題とその伝統的解決は図4に示されている。有線ネットワークでは、
4線式対2線式ハイブリッドにおけるインピーダンス不整合によってエコーが発
生する。不整合は、結果的に遠端信号の一部を近端信号の中に電気的に反映させ
ることになる。ネットワーク遅延とエンド経路のチャネルインパルス応答次第で
、エコーは、遠端聴取者の耳障りになることがある。エンド経路のインパルス応
答は、ネットワークのエコーキャンセラ(EC)によって評価され、エコー信号
の評価を作るのに使用される。評価結果は、次に、エコーを除去するために近端
信号から差し引かれる。EC処理の後、いかなる残留エコーも非線形プロセッサ
(NLP)によって除去される。
The echo problem and its traditional solution are shown in FIG. In a wired network,
Echoes are generated by impedance mismatch in a 4-wire vs. 2-wire hybrid. The mismatch results in a portion of the far-end signal being electrically reflected in the near-end signal. Depending on the network delay and the channel impulse response of the end path, the echo can be offensive to the far end listener. The end-path impulse response is evaluated by the echo canceller (EC) of the network and used to make the echo signal estimate. The evaluation result is then subtracted from the near-end signal to remove the echo. After EC processing, any residual echo is removed by a non-linear processor (NLP).

【0011】 ディジタルセルラー送受器の場合、エコーは、スピーカ(送話口)からマイク
ロホン(受話口)へのフィードバックによって発生する。音響フィードバックは
重大であり得るし、特にハンドフリー型電話の場合、エコーが耳障りになり得る
In the case of digital cellular handsets, echoes are generated by feedback from a speaker (speaker) to a microphone (earpiece). Acoustic feedback can be significant, and echoes can be jarring, especially for hands-free phones.

【0012】 図5は、ディジタルセルラー送受器におけるスピーカからマイクロホンへのフ
ィードバック経路を示す。図示された送受器は、送受器で実現したエラーキャン
セル機能を持たない。
FIG. 5 shows the feedback path from the speaker to the microphone in a digital cellular handset. The illustrated handset does not have the error cancellation function implemented in the handset.

【0013】 GSMネットワークにおけるTFOのもとで、エコーキャンセル機能をネット
ワーク内で実現させる場合は、伝統的アプローチのために符号化音声の復号、結
果的に生じる非符号化音声の処理、そして、その再符号化が必要となる。このよ
うな復号と再符号化が必要であるのは、伝統的なエコーキャンセラが非符号化音
声信号にしか働きかけないからである。このアプローチを図6に示す。このアプ
ローチの欠点をいくつか挙げるならば、下記の通りである。
Under TFO in a GSM network, if the echo cancellation function is to be implemented in the network, decoding of the coded speech, processing of the resulting uncoded speech, and its Re-encoding is required. Such decoding and re-encoding is necessary because traditional echo cancellers only work on uncoded speech signals. This approach is shown in FIG. Some of the drawbacks of this approach are:

【0014】 1.このアプローチは、2個の復号器と1個の符号器を必要とするので、かなり
の計算量となる。代表的には、符号器は復号器より計算の複雑さが1桁分大きい
。よって、符号器の存在は特にコンピュータにとって大きな負担となる。 2.復号と再符号化のプロセスによって導入される遅延は望ましくない。 3.ボコーダ・タンデム(すなわち直列に置かれた2対の符号器/復号器)がこ
のアプローチに導入され、周知の通り、これが量子化効果のゆえに音声の質を低
下させることになる。
1. This approach requires two decoders and one encoder, which is a significant amount of computation. Typically, encoders are one order of magnitude more computationally complex than decoders. Therefore, the existence of the encoder puts a heavy burden on the computer. 2. The delay introduced by the decoding and recoding process is undesirable. 3. A vocoder tandem (ie two pairs of encoders / decoders placed in series) was introduced into this approach, which, as is well known, would result in poor speech quality due to quantization effects.

【0015】 もうひとつの直進的アプローチでは、コンフォートノイズ発生を使ってエコー
をマスクしてよい。コンフォートノイズ発生は、無音抑制または断続伝送の目的
に使用される(例えば[5])。このような技術を使って、エコーを検出し次第
完全にマスクすることが可能である。しかしながら、このような技術は、特にダ
ブルトーク状態の間の“変動性(choppiness)”、ならびに、背景の
透明度の低さと不自然さという欠点を有する。
In another straightforward approach, comfort noise generation may be used to mask the echo. Comfort noise generation is used for silence suppression or intermittent transmission purposes (eg [5]). Using such techniques, it is possible to completely mask the echo as soon as it is detected. However, such techniques have the drawback of "chopping", especially during double-talk conditions, as well as poor transparency and unnaturalness of the background.

【0016】 提案された技術は、符号化音声に対して直接(すなわち、符号化パラメータの
直接修正によって)エコーコントロールを実行することができる。計算の複雑さ
と遅延が僅少に抑えられる。タンデム化効果は回避され、または最小限に抑えら
れ、エコーコントロール後により良い音質が知覚される結果となる。また、すぐ
れた背景透明度も達成される。
The proposed technique can perform echo control directly on coded speech (ie by direct modification of coding parameters). Minimal computational complexity and delay. Tandemization effects are avoided or minimized, resulting in a better perceived sound quality after echo control. Also, excellent background transparency is achieved.

【0017】 音声圧縮は、損失を伴うソースコーディングの範疇に属するもので、一般に音
声符号化と呼ばれる。音声符号化は、音声伝送に必要な帯域幅を最小にするため
に行われる。これは、帯域幅が乏しい無線電話において特に重要である。相対的
に帯域幅が豊かなパケットネットワークでは、音声符号化は依然、ネットワーク
の遅延およびジッタを最小限に抑える上で重要である。それは、音声通信がデー
タ通信と違って遅延をほとんど許容し得ないからである。従って、パケットサイ
ズが小さいほど、パケットネットワーク経由の伝送は容易となる。関連の4つの
ETSI GSM標準をテーブル1に挙げる。
Speech compression belongs to the category of lossy source coding and is commonly referred to as speech coding. Speech coding is done to minimize the bandwidth required for speech transmission. This is especially important in radio telephones where bandwidth is scarce. In relatively bandwidth-rich packet networks, voice coding is still important in minimizing network delay and jitter. This is because voice communication, unlike data communication, can hardly tolerate delay. Therefore, the smaller the packet size, the easier the transmission via the packet network. The four relevant ETSI GSM standards are listed in Table 1.

【0018】 テーブル1:GSM音声コーデックコーデックの名称 符号化の方法 ビット速度(kbits/sec) ハーフレート(HR) VSELP 5.6 フルレート(FR) RPE−LTP 13 エンハンスド・フルレート(EFR) ACELP 12.2 適応マルチレート(AMR) MR−ACELP 5.4〜12.2Table 1: GSM Voice Codec Codec Name Coding Method Bit Rate (kbits / sec) Half Rate (HR) VSELP 5.6 Full Rate (FR) RPE-LTP 13 Enhanced Full Rate (EFR) ACELP 12.2 Adaptive Multi-Rate (AMR) MR-ACELP 5.4-12.2.

【0019】 音声符号化では、1組の連続的なディジタル音声サンプルが音声フレームと呼
ばれる。GSM符号器は、20msのフレームサイズに働きかける(サンプリン
グ速度8kHzで160サンプル)。音声フレームが1つあるとすれば、音声符号
器が、音声合成モデルに関して小さい1組のパラメータを決定する。この音声パ
ラメータと音声合成モデルをもってすれば、オリジナルの音声フレームに酷似し
た形で現れ、酷似した音を発する音声フレームを再構築することができる。この
再構築は、音声復号器によって行われる。上に挙げたGSMボコーダでは、符号
化プロセスは復号プロセスよりはるかに計算が集約的である。
In speech coding, a set of consecutive digital speech samples is called a speech frame. The GSM encoder works on a frame size of 20 ms (160 samples at a sampling rate of 8 kHz). Given a single speech frame, the speech coder determines a small set of parameters for the speech synthesis model. With this voice parameter and voice synthesis model, it is possible to reconstruct a voice frame that appears in a form very similar to the original voice frame and emits a sound that is very similar. This reconstruction is done by the speech decoder. In the GSM vocoders listed above, the encoding process is much more computationally intensive than the decoding process.

【0020】 音声符号器によって決定される音声パラメータは、使用する音声合成モデルに
よって異なる。テーブル1に記載のGSM符号器は、線形予測符号化(LPC)
モデルを利用する。総称LPC音声合成モデルの単純化した形のブロック図を図
7に示す。このモデルは、モデルパラメータを適宜指定することによって音声に
似た信号を発生させるのに使用することができる。本例の音声合成モデルでは、
パラメータは、時変フィルタ係数、ピッチ周期、コードブック・ベクトルおよび
利得係数を含む。合成音声は次の通り発生させられる。コードブック・ベクトル
c(n)は、先ずコードブック利得係数Gによって適当な大きさに定められる。
ここで、nはサンプル時間を表す。
The speech parameters determined by the speech coder depend on the speech synthesis model used. The GSM encoders listed in Table 1 are linear predictive coding (LPC).
Use the model. A simplified block diagram of the generic LPC speech synthesis model is shown in FIG. This model can be used to generate a voice-like signal by specifying model parameters accordingly. In the speech synthesis model of this example,
The parameters include time-varying filter coefficients, pitch period, codebook vector and gain coefficient. Synthetic speech is generated as follows. The codebook vector c (n) is first set to an appropriate size by the codebook gain coefficient G.
Here, n represents the sample time.

【0021】 決められたコードブック・ベクトルは、次にピッチ合成フィルタによって濾過
される。このフィルタのパラメータは、ピッチ利得gおよびピッチ周期Tを含む
。濾過結果は、時折、合計励起べクトルu(n)と呼ばれる。その名が表す通り
、ピッチ合成フィルタは、発せられた音声の調波音質をもたらす。合計励起べク
トルは、次に、音声フレームのブロードスペクトル形状と対応する可聴周波信号
のブロードスペクトル形状とを指定するLPC合成フィルタによって濾過される
The determined codebook vector is then filtered by a pitch synthesis filter. The parameters of this filter include pitch gain g and pitch period T. The filtration result is sometimes referred to as the total excitation vector u (n). As the name implies, pitch synthesis filters provide the harmonic quality of emitted speech. The total excitation vector is then filtered by an LPC synthesis filter that specifies the broad spectrum shape of the speech frame and the corresponding broad spectrum shape of the audio signal.

【0022】 音声フレームごとに、パラメータは通常2回以上更新される。例えばGSM
FR符号器やEFR符号器では、コードブック・ベクトル、コードブック利得お
よびピッチ合成フィルタパラメータがサブフレーム(5ms)ごとに決められる
。LPC合成フィルタパラメータは、EFRではフレーム当たり2回(10ms
ごと)、FRではフレーム当たり1回決められる。
The parameters are usually updated twice or more for each voice frame. For example GSM
In the FR encoder and the EFR encoder, the codebook vector, codebook gain, and pitch synthesis filter parameter are determined for each subframe (5 ms). The LPC synthesis filter parameter is set to twice (10 ms) per frame in EFR.
Each time), FR determines once per frame.

【0023】 音声符号器において使用されるステップの代表的シーケンスは次の通りである
。 1.音声サンプルのフレームを獲得する。 2.サンプルのフレームにウィンドウ(例えばハミング・ウィンドウ)を掛け、
ラグMまで自己相関関数を決定する。 3.自己相関関数から反射係数および/またはLPC係数を決定する。(注記す
るならば、反射係数はLPCフィルタ係数のもうひとつの言い表し方である。)
A typical sequence of steps used in a speech coder is as follows. 1. Get a frame of audio samples. 2. Multiply the window (eg Hamming window) on the sample frame,
Determine the autocorrelation function up to lag M. 3. The reflection coefficient and / or LPC coefficient is determined from the autocorrelation function. (Note that reflection coefficient is another way of saying LPC filter coefficients.)

【0024】 4.反射係数、すなわちLPCフィルタ係数を、量子化に適した別の形に変換す
る(例えばログ・エリア比または線スペクトル周波数)。 5.変換されたLPC係数をベクトル量子化技術を使って量子化する。
[0024] 4. The reflection coefficient, or LPC filter coefficient, is transformed into another form suitable for quantization (eg log area ratio or line spectral frequency). 5. The transformed LPC coefficient is quantized using a vector quantization technique.

【0025】 6.何らかの補助的なエラー修正/検出ビット、フレーム指示ビットなどを追加
する。 7.符号化されたパラメータを伝送する。
6. Add some auxiliary error correction / detection bits, framing bits, etc. 7. Transmit the encoded parameters.

【0026】 下記の動作シーケンスが、代表的にサブフレームごとに音声符号器によって行
われる。 1.ピッチ周期を決める。 2.対応するピッチ利得を決める。 3.ピッチ周期とピッチ利得を量子化する。
The following operation sequence is typically performed by the speech coder for each subframe. 1. Determine the pitch period. 2. Determine the corresponding pitch gain. 3. Quantize pitch period and pitch gain.

【0027】 4.量子化LPC合成フィルタを通じてオリジナル音声信号を逆濾過し、LPC
残留信号を獲得する。 5.ピッチ合成フィルタを通じてLPC残留信号を逆濾過し、ピッチ残留分を獲
得する。 6.最良のコードブック・ベクトルを決める。
[0027] 4. Back-filter the original audio signal through a quantized LPC synthesis filter
Acquire the residual signal. 5. The LPC residual signal is back-filtered through the pitch synthesis filter to obtain the pitch residual. 6. Determine the best codebook vector.

【0028】 7.最良のコードブック利得を決める。 8.コードブック利得とコードブック・ベクトルを量子化する。 9.フィルタメモリを適宜更新する。[0028] 7. Determine the best codebook gain. 8. Quantize codebook gains and codebook vectors. 9. Update the filter memory as appropriate.

【0029】 音声復号器において使用されるステップの代表的シーケンスは下記の通りであ
る。 先ず、何らかのエラー修正/検出およびフレーム指示を実行する。 次に、サブフレームごとに下記を実行する。
A typical sequence of steps used in a speech decoder is as follows. First, some error correction / detection and framing is performed. Next, the following is executed for each subframe.

【0030】 1.受け取られたすべての符号化パラメータ(LPC係数、ピッチ周期、ピッチ
利得、コードブック・ベクトル、コードブック利得)を脱量子化する。 2.コードブック・ベクトルの大きさをコードブック利得によって定め、これを
ピッチ合成フィルタで濾過し、LPC励起信号を獲得する。 3.LPC励起信号をLPC合成フィルタで濾過し、予備音声信号を獲得する。
1. Dequantize all received coding parameters (LPC coefficients, pitch period, pitch gain, codebook vector, codebook gain). 2. The size of the codebook vector is defined by the codebook gain, which is filtered with a pitch synthesis filter to obtain the LPC excitation signal. 3. The LPC excitation signal is filtered by an LPC synthesis filter to obtain a preliminary voice signal.

【0031】 4.ポストフィルタを構築する(通常はLPC係数をベースとする)。 5.予備音声信号を濾過することによって量子化ノイズを減じ、それで、最終の
合成音声を獲得する。
4. Build a post filter (typically based on LPC coefficients). 5. Quantization noise is reduced by filtering the preliminary speech signal, thus obtaining the final synthesized speech.

【0032】 符号器によって伝送されたビットストリームにおける符号化パラメータの配置
の一例として、GSM FRボコーダを考慮する。GSM FRボコーダについ
ては、フレームを8kHzでサンプリングされた音声のサンプル160個分と定義
する。すなわち、フレームは長さ20msである。A法則PCMコンパンディン
グをもってすれば、160個のサンプルの伝送のために1280ビットが必要と
いうことになる。符号器は160個のサンプルを260ビットに圧縮する。各フ
レームの260ビットの中の様々な符号化パラメータの配置を図8に示す。
As an example of the placement of the coding parameters in the bitstream transmitted by the encoder, consider the GSM FR vocoder. For the GSM FR vocoder, a frame is defined as 160 voice samples sampled at 8 kHz. That is, the frame is 20 ms long. With A-law PCM companding, this would require 1280 bits for the transmission of 160 samples. The encoder compresses 160 samples to 260 bits. The placement of various coding parameters within the 260 bits of each frame is shown in FIG.

【0033】 符号化された各フレームの最初の36ビットは、LPC合成フィルタに相当す
るログ・エリア比からなる。残りの224ビットは、各々56ビットの4つのサ
ブフレームに分類することができる。各サブフレームの内部では、符号化パラメ
ータビットに先ずピッチ合成フィルタ関連のパラメータが含まれ、その後にコー
ドブック・ベクトル関連のパラメータおよびコードブック利得関連のパラメータ
が続く。
The first 36 bits of each encoded frame consist of a log area ratio corresponding to the LPC synthesis filter. The remaining 224 bits can be classified into 4 subframes of 56 bits each. Within each subframe, the coding parameter bits first include pitch synthesis filter related parameters, followed by codebook vector related parameters and codebook gain related parameters.

【0034】 発明の概要 好適な実施例は、第1パラメータを含む複数のパラメータからなる圧縮コード
を使って近端ディジタル信号を伝送するための通信システムにおいて有用である
。パラメータが表すのは、複数の可聴周波特性を有する可聴周波信号である。圧
縮コードは、複数の復号ステップによって復号できる。通信システムはまた、圧
縮コードを使って遠端ディジタル信号も送信する。このような環境においては、
近端ディジタル信号におけるエコーは、複数のパラメータのうち少なくとも第1
パラメータを近端ディジタル信号に応答して読取ることによって減じることがで
きる。複数の復号ステップのうち少なくとも1つが、近端ディジタル信号と遠端
ディジタル信号において行われ、これで、少なくとも部分的に復号された近端信
号と少なくとも部分的に復号された遠端信号が作成されることになる。
SUMMARY OF THE INVENTION The preferred embodiment is useful in a communication system for transmitting near-end digital signals using a compressed code consisting of a plurality of parameters including a first parameter. The parameter represents an audio signal having a plurality of audio characteristics. The compressed code can be decoded in multiple decoding steps. The communication system also transmits the far end digital signal using the compressed code. In such an environment,
The echo in the near-end digital signal is at least the first of the plurality of parameters.
The parameter can be reduced by reading in response to the near-end digital signal. At least one of the plurality of decoding steps is performed on the near-end digital signal and the far-end digital signal to produce an at least partially decoded near-end signal and an at least partially decoded far-end signal. Will be.

【0035】 第1パラメータは、少なくとも部分的に復号された近端信号と少なくとも部分
的に復号された遠端信号に応答して調整され、これで、調整済み第1パラメータ
が作成されることになる。第1パラメータは、近端ディジタル信号において調整
済み第1パラメータに取って代わられる。読取り、作成および調整は、望ましく
は、1つのプロセッサによって行われる。
The first parameter is adjusted in response to the at least partially decoded near-end signal and the at least partially decoded far-end signal, thereby producing an adjusted first parameter. Become. The first parameter replaces the adjusted first parameter in the near-end digital signal. Reading, creating and adjusting are preferably done by one processor.

【0036】 本発明の他の1つの実施例は、さらに、圧縮コードを使用する第1ビットと線
形コードを使用する第2ビットからなるコードサンプルを使って近端ディジタル
信号を伝送するための通信システムにおいて有用である。コードサンプルが表す
のは、複数の可聴周波特性を有する可聴周波信号である。通信システムはまた、
遠端ディジタル信号も送信する。このような環境においては、近端ディジタル信
号におけるいかなるエコーも、圧縮コードなしに、第1ビットと第2ビットを近
端ディジタル信号と遠端ディジタル信号に応答して調整することによって減じる
ことができる。
Another embodiment of the present invention is further a communication for transmitting a near-end digital signal using a code sample consisting of a first bit using a compressed code and a second bit using a linear code. Useful in systems. The code sample represents an audio signal having a plurality of audio characteristics. The communication system also
It also transmits the far-end digital signal. In such an environment, any echo in the near-end digital signal can be reduced by adjusting the first and second bits in response to the near-end and far-end digital signals without a compression code. .

【0037】 好適な実施例の詳細な説明 本発明の優先実施例を下記の略語を参考にして説明する。 ACELP Algebraic Code Excited Linear Prediction(代数コード励起線 形予測) AE Audio Enhancer(可聴周波エンハンサ) ALC Adaptive or Automatic Level Control(適応レベル制御または 自動レベル制御) CD Coded Domain or Compressed Domain(符号化ドメインまたは圧 縮ドメイン)[0037] Detailed description of the preferred embodiment   Preferred embodiments of the present invention will be described with reference to the following abbreviations. ACELP Algebraic Code Excited Linear Prediction               Shape prediction) AE Audio Enhancer (Audio Enhancer) ALC Adaptive or Automatic Level Control               (Automatic level control) CD Coded Domain or Compressed Domain               Reduction domain)

【0038】 CDEC Coded Domain Echo Control(符号化ドメインエコーコントロー ル) EFR Enhanced Full Rate(エンハンスド・フルレート) ETSI European Telecommunications Standards Institute(欧州電気 通信標準化協会) FR Full Rate(フルレート)[0038] CDEC Coded Domain Echo Control               Le) EFR Enhanced Full Rate (Enhanced Full Rate) ETSI European Telecommunications Standards Institute               Communication Standardization Association) FR Full Rate

【0039】 GSM Global System for Mobile Communications(汎欧州ディジタル 移動電話方式) ITU International Telecommunications Union(国際電気通信連合)
MR−ACELP Multi-Rate ACELP(ACELPマルチレート) PCM Pulse Code Modulation(ITU G.711)(パルス符号変調)
GSM Global System for Mobile Communications ITU International Telecommunications Union
MR-ACELP Multi-Rate ACELP PCM Pulse Code Modulation (ITU G.711) (Pulse Code Modulation)

【0040】 RPE−LTP Regular Pulse Excitation - Long Term Prediction(規則パ ルス励起−長期予測) TFO Tandem Free Operation(タンデムフリーオペレーション) VSELP Vector Sum Excitation Linear Prediction(ベクトル総和励起 線形予測)[0040] RPE-LTP Regular Pulse Excitation-Long Term Prediction                 Loose excitation-long-term prediction) TFO Tandem Free Operation VSELP Vector Sum Excitation Linear Prediction               Linear prediction)

【0041】 音声合成の伝達関数 デコーダにおける音声合成には多くの非線形性とヒューリスティックスとが関
与しているが、下記の近似的な伝達関数がその合成プロセスに特性づけられるこ
とが可能である。
Speech Synthesis Transfer Function Although many nonlinearities and heuristics are involved in speech synthesis in a decoder, the following approximate transfer function can be characterized in the synthesis process.

【数1】 [Equation 1]

【0042】 コードブックベクトルc(n)がH(z)によってフィルタリングされ、合成
音声が得られる。音声復号化のためのこの汎用LPC音声合成またはデコーダモ
デルに関して留意すべきキイポイントは、エコー制御を実現するために変更され
ることが可能な使用可能な符号化されたパラメータは、 1. c(n):コードブックベクトル、 2. G:コードブック利得、 3. g:ピッチ利得、 4. T:ピッチ周期 5. {a,k=1,...,M}:LPC係数 であるということである。
The codebook vector c (n) is filtered by H (z) to obtain synthesized speech. The key points to note about this generic LPC speech synthesis or decoder model for speech decoding are that the available coded parameters that can be modified to implement echo control are: c (n): codebook vector, 2. G: Codebook gain, 3. g p: pitch gain, 4. T: pitch period 5. {A k , k = 1 ,. . . , M}: LPC coefficients.

【0043】 殆どのLPCベースのボコーダは、上述のセットに類似したパラメータ、上述
の形式に変化されてもよいパラメータ、または、上述の形式に関係したパラメー
タを使用する。例えば、LPCベースのボコーダのLPC係数は、ログ−エリア
比率(log−area ratio)(例えば、GSM FR)または線スペ
クトル周波数(例えば、GSM EFR)を使用して表現されてもよい。これら
の形式の両方がLPC係数に変換されることが可能である。パラメータが上述の
形式に関係付けられている事例が、GSM FRボコーダにおけるブロック最大
パラメータである。ブロック最大は、式(1)によって記述されているモデルに
おけるコードブック利得に正比例していると見なされることが可能である。
Most LPC-based vocoders use parameters similar to the above set, parameters that may be changed to the above mentioned format, or parameters related to the above mentioned format. For example, the LPC coefficients of an LPC-based vocoder may be expressed using a log-area ratio (eg GSM FR) or line spectral frequency (eg GSM EFR). Both of these formats can be converted to LPC coefficients. An example where the parameters are related to the above format is the block maximum parameter in the GSM FR vocoder. The block maximum can be considered to be directly proportional to the codebook gain in the model described by equation (1).

【0044】 したがって、符号化パラメータ変更方法の説明は主として汎用音声デコーダモ
デルに限定されているが、こうした方法をあらゆるLPCベースのボコーダとお
そらくはさらに他のモデルとに適合させることは比較的容易である。
Thus, although the description of coding parameter modification methods is largely limited to general-purpose speech decoder models, it is relatively easy to adapt such methods to any LPC-based vocoder and possibly even other models. .

【0045】 さらに、エコー制御のために非符号化音声と共に使用されるセンタークリッピ
ング(center−clipping)のような非線形処理方法が、音声信号
の符号化パラメータ表現が著しく異なっているので、符号化パラメータには使用
不可能であるということも明らかなはずである。コードブックベクトル信号c(
n)でさえ、関与している大幅な量子化のためにセンタークリッピングに対して
応答しない。ボコーダの多くでは、コードブックベクトルサンプルの大多数がす
でにゼロであり、一方、非ゼロのパルスが高度に量子化される。したがって、こ
うした非線形処理アプローチは適用不可能であるか無効である。
Furthermore, non-linear processing methods such as center-clipping, which are used with uncoded speech for echo control, have significantly different coding parameter representations of speech signals, so that the coding parameters are It should also be clear that it cannot be used for. Codebook vector signal c (
Even n) does not respond to center clipping due to the significant quantization involved. In many vocoders, the majority of codebook vector samples are already zero, while non-zero pulses are highly quantized. Therefore, such non-linear processing approaches are either inapplicable or ineffective.

【0046】 本明細書および本請求項の範囲では、術語「線形コード」と「圧縮コード」は
次の意味を有する。 線形コード:線形コードとは、オーディオ信号の各サンプルに関する1つの符
号化パラメータすなわち符号化サンプルを結果的にもたらす方法を意味する。線
形コードの例は、PCM(A−lawおよびμ−law)、ADPCM(適応差
分パルス符号変調)、および、デルタ変調である。
Within the scope of this specification and the claims, the terms “linear code” and “compressed code” have the following meanings. Linear code: By linear code is meant a method that results in one coding parameter or coded sample for each sample of the audio signal. Examples of linear codes are PCM (A-law and μ-law), ADPCM (adaptive differential pulse code modulation), and delta modulation.

【0047】 圧縮コード:圧縮コードとは、オーディオ信号の各サンプルに関する1つ未満
の符号化パラメータを結果的にもたらす圧縮方法を意味する。典型的には、圧縮
コードは、オーディオ信号サンプルの各ブロックすなわち各フレームに関する小
さなセットの符号化パラメータを結果的にもたらす。圧縮コードの例は、GSM
ボコーダ(HR、FR、EFR)のような線形予測符号化ベースのボコーダであ
る。
Compressed code: By compressed code is meant a compression method that results in less than one coding parameter for each sample of the audio signal. Typically, the compressed code results in a small set of coding parameters for each block or frame of audio signal samples. An example of compressed code is GSM
It is a linear predictive coding based vocoder such as a vocoder (HR, FR, EFR).

【0048】 符号化されたドメインのエコーの制御 概観 図9は、音響エコーが存在する状況に関する符号化ドメインエコー制御(CD
EC)の新規の具体例を示す。通信システム10は、テーブル1に示したコーデ
ックによって使用されるコードのいずれかのような圧縮コードを使用してネット
ワーク24を経由して近接終端符号化ディジタル信号(near end co
ded digital signals)を伝送する。圧縮コードは、近接終
端スピーカヘッドセット12内の近接終端マイクロホン14によって生成された
線形オーディル信号からエンコーダ16によって生成される。圧縮コードは、図
8に示すパラメータのようなパラメータを含む。このパラメータは、オーディオ
レベルと電力を含む複数のオーディオ特性を含むオーディオ信号を表現する。圧
縮コードは様々な復号化ステップによって復号化可能である。後述するように、
システム10は、ネットワーク32を経由してシステム10によって伝送される
遠隔終端ディジタル信号(far end digital signals)
の存在を原因とする近接終端ディジタル信号中のエコーを制御する。このエコー
は、図8に示す圧縮コードパラメータの最小限の遅延と(復号化を行う場合には
)最小限の復号化とによって制御される。
Controlled Overview of Coded Domain Echo FIG. 9 shows a coded domain echo control (CD) for situations where acoustic echo is present.
EC) shows a new concrete example. Communication system 10 uses near-end encoded digital signals (near end co) via network 24 using compressed codes such as any of the codes used by the codecs shown in Table 1.
ded digital signals). The compressed code is generated by the encoder 16 from the linear-audile signal generated by the near-terminated microphone 14 in the near-terminated speaker headset 12. The compressed code contains parameters such as those shown in FIG. This parameter represents an audio signal that includes multiple audio characteristics including audio level and power. The compressed code can be decoded by various decoding steps. As described below,
The system 10 includes remote end digital signals transmitted by the system 10 via a network 32.
Controls echoes in near-terminated digital signals due to the presence of. This echo is controlled by the minimal delay of the compression code parameters shown in FIG. 8 and the minimal decoding (if decoding occurs).

【0049】 圧縮コードを使用する遠隔終端ディジタル信号は近接終端端子20によって受
け取られ、調整圧縮コードを使用するディジタル信号は、近接終端端子22によ
ってネットワーク24を経由して、調整圧縮コードのデコーダ(図示されていな
い)を含む遠隔終端ハンドセット(図示されていない)に伝送される。調整圧縮
コードがオリジナルの圧縮コードと互換性があるということに留意されたい。言
い換えると、符号化パラメータが変更または調整されている時に、この符号化パ
ラメータを調整圧縮コードと呼ぶが、この調整圧縮コードは依然としてオリジナ
ルの圧縮コードに対応する標準デコーダを使用して復号化可能である。線形遠隔
終端オーディオ信号が、デコーダ18と互換性がある圧縮コードを使用して遠隔
終端ディジタル信号を生成するために遠隔終端エンコーダ(図示されていない)
によって符号化され、ネットワーク32を経由して遠隔終端端子34に伝送され
る。近接終端ハンドセット12のデコーダ18が遠隔終端ディジタル信号を復号
化する。図9に示されているように、遠隔終端信号からのエコー信号は音響フィ
ードバックを介して近接終端ハンドセット12のエンコーダ16に進むだろう。
The remote termination digital signal using the compressed code is received by the proximity termination terminal 20, and the digital signal using the regulated compression code is passed by the proximity termination terminal 22 via the network 24 to a decoder of the regulated compression code (illustrated). (Not shown) to a remote termination handset (not shown). Note that the tailored compression code is compatible with the original compression code. In other words, when a coding parameter is changed or adjusted, we call this coding parameter a tailored compression code that is still decodable using the standard decoder corresponding to the original compression code. is there. A remote termination encoder (not shown) is provided for the linear remote termination audio signal to produce a remote termination digital signal using a compression code compatible with the decoder 18.
And is transmitted to the remote termination terminal 34 via the network 32. Decoder 18 of near-end handset 12 decodes the remote-end digital signal. As shown in FIG. 9, the echo signal from the remote termination signal will go to the encoder 16 of the near termination handset 12 via acoustic feedback.

【0050】 プロセッサ40は近接終端圧縮コードと遠隔終端圧縮コードとに対して様々な
操作を行う。プロセッサ40はマイクロプロセッサ、マイクロコントローラ、デ
ィジタル信号プロセッサ、または、算術的および論理的操作が可能な他のタイプ
の論理ユニットであってよい。
The processor 40 performs various operations on the near-terminated compressed code and the remote-terminated compressed code. Processor 40 may be a microprocessor, microcontroller, digital signal processor, or other type of logic unit capable of arithmetic and logical operations.

【0051】 各タイプのコーデックに関して、TFOおよび非TFOの際に、圧縮モードお
よび線形モードにおいて、異なった符号化ドメインエコー制御アルゴリズム44
が常にプロセッサ40によって実行される。部分デコーダ48が、端子20で受
け取られたパラメータの少なくとも最初のパラメータを読み取るためにプロセッ
サ40によって実行される。別の部分デコーダ46が、少なくとも部分的に復号
化された遠端信号を生成するためにプロセッサ40によって実行される。デコー
ダ48は少なくとも部分的に復号化された近接終端信号を生成する。(近接終端
信号と遠隔終端信号とによって使用される圧縮コードは互いに異なっていてもよ
く、したがって部分デコーダも互いに異なっていてもよいということに留意され
たい。)
For each type of codec, different coding domain echo control algorithms 44 in compressed and linear modes during TFO and non-TFO.
Are always executed by the processor 40. Partial decoder 48 is executed by processor 40 to read at least the first parameter of the parameters received at terminal 20. Another partial decoder 46 is executed by the processor 40 to generate the at least partially decoded far end signal. Decoder 48 produces an at least partially decoded near termination signal. (Note that the compression codes used by the near-end signal and the remote-end signal may be different from each other, and thus the partial decoders may also be different from each other.)

【0052】 部分復号化に基づいて、アルゴリズム44が、近接終端ディジタル信号中のエ
コーの量を少なくとも推定するエコー公算(尤度)信号(echo likel
ihood signal)を生成する。エコー尤度信号は、エコーの量が遠隔
終端音声信号に依存するので時間の経過に応じて変化する。エコー尤度信号は、
アルゴリズム44によって読み取られる1つまたは複数のパラメータを調整する
ためにアルゴリズム44によって使用される。調整されたパラメータは、端子2
2からネットワーク24に伝送される調整された近接終端ディジタル信号を形成
するために、近接終端ディジタル信号中に書き込まれる。言い換えると、その調
整されたパラメータは、当初に読み取られたパラメータの代わりに使用される。
ネットワークALC装置内に示されている部分デコーダ46、48は、プロセッ
サ40によって実行されるアルゴリズムであり、コーデックに依存している。
Based on partial decoding, the algorithm 44 estimates at least the amount of echo in the near-terminated digital signal by an echo likelihood signal (echo like signal).
ihood signal). The echo likelihood signal changes over time as the amount of echo depends on the remote termination voice signal. The echo likelihood signal is
Used by algorithm 44 to adjust one or more parameters read by algorithm 44. The adjusted parameter is the terminal 2
2 is written into the near-end digital signal to form a conditioned near-end digital signal transmitted to network 24. In other words, the adjusted parameters are used in place of the originally read parameters.
The partial decoders 46, 48 shown in the network ALC device are algorithms executed by the processor 40 and are codec dependent.

【0053】 部分デコーダは、圧縮コードを使用して圧縮された信号を操作する。プロセッ
サ40がTFO環境において実装される場合には、部分デコーダ46は圧縮コー
ドではなく線形コードを復号化するだろう。さらに、この場合には、部分デコー
ダ48が線形コードを復号化し、圧縮コードからオーディオ信号を実際に合成す
ることなしに圧縮コードから符合化パラメータを求めるだけだろう。 さらに、ブロック44、46、48は直結(hardwired)回路として
実現されてもよい。
The partial decoder manipulates the compressed signal using the compression code. If processor 40 is implemented in a TFO environment, partial decoder 46 will decode linear code rather than compressed code. Further, in this case, the partial decoder 48 would only decode the linear code and determine the coding parameters from the compressed code without actually synthesizing the audio signal from the compressed code. Furthermore, the blocks 44, 46, 48 may be implemented as hardwired circuits.

【0054】 図10は、図9の実施形態が、エコーが4ワイヤ−2ワイヤハイブリッド(4
−wire−to−2−wire hybrid)のために生じるシステムのた
めに使用可能であることを示す。
FIG. 10 shows that the embodiment of FIG.
-WIRE-TO-2-WIRE HYBRID) indicates that it is usable for the resulting system.

【0055】 CDEC装置/アルゴリズムが、近接終端から受け取ったビットストリーム中
の符号化パラメータを直接変更することによって、近接終端符号化音声からエコ
ー効果を取り除く。近接終端信号および遠隔終端信号の復号化は、近接終端に存
在するエコーの尤度を求めるために行われる。この尤度値を求めるために、復号
化された信号から幾つかの統計値が測定される。
The CDEC device / algorithm removes the echo effect from the near-end coded speech by directly changing the coding parameters in the bitstream received from the near-end. Decoding of the near-end signal and the far-end signal is performed in order to obtain the likelihood of the echo existing at the near-end. To determine this likelihood value, some statistics are measured from the decoded signal.

【0056】 部分的な復号 近接終端信号および遠隔終端信号の復号化は、符号化操作および復号化操作の
ために使用されるボコーダに応じて部分的復号化であっても完全復号化であって
もよい。部分復号化で十分である状況の幾つかの例を下記に示す。 1. 符号励起線形予測(CELP)ボコーダでは、後フィルタリング処理が
、LPCベースのモデルを使用して復号化された信号に対して行われる。この後
フィルタリング処理は量子化ノイズを減少させる。しかし、後フィルタリング処
理はエコーの尤度を求めるために必要な統計値の測定に大きな悪影響は与えない
ので、後フィルタリング段階を経済性のために省略することが可能である。
Partial Decoding The decoding of near-end signals and remote-end signals can be partial or full decoding depending on the vocoder used for the encoding and decoding operations. Good. Below are some examples of situations where partial decoding is sufficient. 1. In Code Excited Linear Prediction (CELP) vocoders, post-filtering processing is performed on the decoded signal using an LPC-based model. After this, the filtering process reduces the quantization noise. However, the post-filtering process does not have a significant adverse effect on the measurement of the statistical values needed to determine the likelihood of the echo, so that the post-filtering step can be omitted for economy.

【0057】 2. GSMネットワークにおけるTFOでは、CDEC装置が基地局とスイ
ッチ(A−インタフェースとして知られている)との間または2つのスイッチの
間に置かれてもよい。図3に示されているように、音声信号の各8ビットサンプ
ルの6つのMSBがPCMコードに対応するので、この状況では、符号化音声を
すべて符号化することを回避することが可能である。A−lawコンパンディン
グテーブルを使用して8ビット圧伸サンプルを13ビット線形音声サンプルに変
換するためには簡単なテーブルルックアップで十分である。このことが、適切な
デコーダを呼び出すことなしに音声信号の1つのバージョン(version)
を得るための経済的な方法を提供する。この方法で得られた音声信号は幾分かノ
イズを含むが、エコー尤度を求めるために必要な統計値の測定にとっては十分で
あることが発見されている。
2. In TFO in GSM networks, a CDEC device may be located between the base station and the switch (known as the A-interface) or between two switches. Since, as shown in FIG. 3, the 6 MSBs of each 8-bit sample of the speech signal correspond to the PCM code, it is possible in this situation to avoid coding the entire coded speech. . A simple table lookup is sufficient to convert 8-bit companded samples to 13-bit linear speech samples using the A-law companding table. This is a version of the audio signal without calling the appropriate decoder.
Provide an economical way to get. Although the speech signal obtained in this way contains some noise, it has been found to be sufficient for the measurement of the statistics needed to determine the echo likelihood.

【0058】 エコー尤度の決定 遠隔終端信号および近接終端信号の幾つかの(完全復号化または部分復号化さ
れた)非符号化バージョンが利用可能であると想定すると、幾つかの統計値が測
定され、近端信号中に存在するエコーの尤度を求めるために使用される。エコー
尤度が各音声サブフレーム毎に推定され、この場合にサブフレームの持続時間は
使用ボコーダに依存している。好ましいアプローチをこのセクションで説明する
Echo Likelihood Determination Assuming that some (fully or partially decoded) uncoded versions of the far-terminated signal and the near-terminated signal are available, some statistics are measured. And is used to determine the likelihood of the echo present in the near-end signal. The echo likelihood is estimated for each speech subframe, where the subframe duration depends on the vocoder used. The preferred approach is described in this section.

【0059】 エンドパス(end−path)の単純化されたモデルが図11に示されてい
る通りであると想定する。このエンドパスは、サンプルτ個分の一様な遅延とエ
コー反射減衰量(ERL)λとから成ると想定する。
Suppose a simplified model of end-path is as shown in FIG. This endpath is assumed to consist of a uniform delay of τ samples and an echo return loss (ERL) λ.

【0060】 このモデルでは、sNE(n)が近端非符号化信号であり、sFE(n)とが
遠端非符号化信号である。τの範囲がCDECの特定の具体化にとって既知であ
り、下記のように特定される。
In this model, s NE (n) is the near-end uncoded signal and s FE (n) is the far-end uncoded signal. The range of τ is known for a particular implementation of CDEC and is specified below.

【数2】 [Equation 2]

【0061】 この想定は妥当であるが、これは最大エンドパス遅延と最小エンドパス遅延と
が主として音声符号化と音声復号化とチャネル符号化とチャネル復号化と他の既
知の伝送遅延とに依存するからである。ERL範囲は、
This assumption is valid, since the maximum end path delay and the minimum end path delay depend mainly on speech coding, speech decoding, channel coding, channel decoding and other known transmission delays. Is. The ERL range is

【数3】 であると仮定される。[Equation 3] Is assumed to be

【0062】 エコーの公算(尤度)の推定のプロセスは次の変数を使用する。 PNEは近端信号の現在サブフレームの電力である。 PFE(0)は遠端信号の現在サブフレームの電力である。 PFE(m)は遠端信号の現在サブフレームの前のm番目のサブフレームの電
力である。言い換えると、遠端サブフレーム電力値の過去値のバッファが維持さ
れる。可能最大エンドパス遅延までの遠端信号のサブフレーム電力が使用可能で
あるように、バッファサイズはBmax=[τmax/N]である。ここでNは
サブフレーム中のサンプルの数である。
The process of estimating the likelihood (likelihood) of an echo uses the following variables. P NE is the power of the current subframe of the near-end signal. P FE (0) is the power of the current subframe of the far end signal. P FE (m) is the power of the m-th subframe before the current subframe of the far-end signal. In other words, a buffer of past far-end subframe power values is maintained. The buffer size is B max = [τ max / N] so that the far-end signal subframe power up to the maximum possible end-path delay is available. Here, N is the number of samples in the subframe.

【0063】 Rが近端サブフレーム電力の遠端サブフレーム電力に対する比率である。 ρが事前エコー公算(尤度)である。 ρが、事前エコー公算(尤度)を平滑化することによって得られるエコー尤度
である。
R is the ratio of near-end subframe power to far-end subframe power. ρ 1 is the likelihood of prior echo (likelihood). ρ is the echo likelihood obtained by smoothing the prior echo likelihood (likelihood).

【0064】 後述のステップを使用して各サブフレームに関してエコー公算(尤度)を推定
する。幾つかのボコーダ、特にGSM HRのような特に低いビットレートのボ
コーダでは、この処理がサブフレーム単位ではなくフレーム単位においてより適
切に行われることがある。
Estimate the echo likelihood (likelihood) for each subframe using the steps described below. For some vocoders, especially for particularly low bit rate vocoders such as GSM HR, this process may be better done on a frame-by-frame basis rather than a sub-frame basis.

【0065】 現在サブフレームに関するsNE(n)の電力をThe power of s NE (n) for the current subframe is

【数4】 として求める。[Equation 4] Ask as.

【0066】 現在サブフレームに関するsFE(n)の電力をThe power of s FE (n) for the current subframe is

【数5】 として求める。[Equation 5] Ask as.

【0067】 近端電力の遠端電力に対する比率を[0067]   The ratio of near-end power to far-end power

【数6】 ここにBmin=[τmin/N]、として求める。分母は、本質的に、予想エ
ンドパス遅延時間期間中に測定された最大遠端サブフレーム電力である。
[Equation 6] Here, B min = [τ min / N]. The denominator is essentially the maximum far-end subframe power measured during the expected endpath delay time period.

【0068】 バッファ内の遠端電力値をシフトし、すなわち、 PFE(Bmax)=PFE(Bmax−1);...;PFE(1)=PFE (0)である。Shift the far-end power value in the buffer: P FE (B max ) = P FE (B max −1) ;. . . P FE (1) = P FE (0).

【0069】 事前エコー公算(尤度)を[0069]   Pre-echo probability (likelihood)

【数7】 として求める。[Equation 7] Ask as.

【0070】 ρ=0.9ρ+0.1ρを使用して、事前エコー公算(尤度)を平滑化し、
エコー公算(尤度)を得る。
Smooth the a priori echo likelihood (likelihood) using ρ = 0.9ρ + 0.1ρ 1 ,
Obtain the likelihood of echo (likelihood).

【0071】 近端サブフレーム電力の遠端サブフレーム電力に対する比率の関数としての事
前エコー公算(尤度)のグラフを図12に示す。
A graph of the likelihood of prior echo (likelihood) as a function of the ratio of near-end subframe power to far-end subframe power is shown in FIG.

【0072】 符号化パラメータの変更 このセクションでは、エコー尤度に基づいた符号化パラメータの直接変更のた
めの好ましい方法を説明する。図7の汎用音声デコーダモデルの各符号化パラメ
ータの直接変更を最初に説明する。その次に、標準ベースのボコーダに関するパ
ラメータ変更のための対応する方法を説明する。標準ベースのボコーダの一例と
して、GSM FRボコーダを考察する。標準にしたがって各パラメータを変更
し量子化した後に、ビットストリーム中の適切なパラメータを適切に変更する。
このプロセス全体の好ましい実施形態を図13に示す。
Coding Parameter Modification This section describes a preferred method for direct modification of coding parameters based on echo likelihood. Direct modification of each coding parameter of the general-purpose speech decoder model of FIG. 7 will be described first. Then, corresponding methods for parameter changes for standards-based vocoders are described. As an example of a standards-based vocoder, consider the GSM FR vocoder. After modifying and quantizing each parameter according to the standard, modify the appropriate parameters in the bitstream appropriately.
A preferred embodiment of this entire process is shown in FIG.

【0073】 コードブック利得の変更 各サブフレームに関するコードブック利得パラメータGが、そのサブフレーム
に関するエコー尤度ρに依存する基準化因子によって減少させられる。Gnew によって表される変更されたコードブック利得パラメータが次式によって与えら
れる。 Gnew=(1−ρ)G (4)
Modifying Codebook Gain The codebook gain parameter G for each subframe is reduced by a scaling factor that depends on the echo likelihood ρ for that subframe. The modified codebook gain parameter represented by G new is given by: G new = (1−ρ) G (4)

【0074】 その次に、このパラメータをボコーダ標準にしたがって再量子化する。図7の
音声デコーダモデルでは、コードブック利得が合成信号の総レベルを制御し、し
たがって対応するオーディオ信号の総レベルを制御するということに留意された
い。一方、コードブック利得を減衰させることがエコーの減衰を結果的に生じさ
せる。
This parameter is then requantized according to the vocoder standard. Note that in the speech decoder model of FIG. 7, the codebook gain controls the total level of the composite signal and thus the corresponding audio signal. On the other hand, attenuating the codebook gain results in echo attenuation.

【0075】 GSM FRの場合には、ブロック最大パラメータXmaxは、図7の汎用モ
デルのコードブック利得パラメータに正比例している。したがって、変更された
ブロック最大パラメータは、 Xmax,new=(1−ρ)Xmax (5) として計算される。
For GSM FR, the block maximum parameter X max is directly proportional to the codebook gain parameter of the generic model of FIG. Therefore, the modified block maximum parameter is calculated as X max, new = (1−ρ) X max (5).

【0076】 その次に、標準において規定されている方法によってXmax,newが再量
子化される。その結果として得られる6ビット値がビットストリーム中の適切な
位置に再挿入される。
Then, X max, new is requantized by the method specified in the standard. The resulting 6-bit value is reinserted at the proper position in the bitstream.

【0077】 コードブックベクトルの変更 コードブックベクトルc(n)はパルスの位置および振幅をランダム化するこ
とによって変更される。コードブックベクトルのランダム化は結果的にエコーの
相関特性を消滅させる。これはエコーの「音声に似た」性質の多くを消滅させる
効果を有する。エコーの公算(尤度)が高いと判定される時には何時でも、好ま
しくはρ>0.8である時には、ランダム化が行われる。このランダム化は、あ
らゆる適切な疑似ランダムビット生成方法を使用して行われることが可能である
Codebook Vector Modification The codebook vector c (n) is modified by randomizing the position and amplitude of the pulse. The randomization of the codebook vector results in the elimination of the echo correlation properties. This has the effect of eliminating many of the "voice-like" properties of echo. Randomization is performed whenever it is determined that the likelihood of echo (likelihood) is high, preferably when ρ> 0.8. This randomization can be done using any suitable pseudo-random bit generation method.

【0078】 GSM FRの場合には、各サブフレームに関するコードブックベクトルは、
RPEグリッド位置パラメータ(2ビット)と13個のRPEパルス(各パルス
は3ビット)とによって決定される。疑似ランダムビット発生器を使用して、こ
れらの41個のビットが41個のランダムビットで置き換えられる。
For GSM FR, the codebook vector for each subframe is
It is determined by the RPE grid position parameter (2 bits) and 13 RPE pulses (each pulse is 3 bits). These 41 bits are replaced with 41 random bits using a pseudo-random bit generator.

【0079】 ピッチ合成フィルタの変更 ピッチ合成フィルタは音声信号のあらゆる周期の長期相関を実現し、有声音化
音声の高調波をモデル化するために特に重要である。図7で説明したこのフィル
タのモデルは、2つのパラメータ、すなわち、ピッチ周期Tとピッチ利得g
けを使用する。有声音化音声中は、ピッチ周期は幾つかのサブフレームまたはフ
レームにわたって比較的一定不変である。大半のボコーダにおけるピッチ利得は
ゼロから1または1よりわずかに大きな値(例えばGSM EFRでは1.2)
までの範囲内である。強い有声音化音声中は、ピッチ利得はその最大値であるか
またはそれに近い値である。
Pitch Synthesis Filter Modification Pitch synthesis filters are particularly important for achieving long-term correlation of every cycle of a speech signal and for modeling harmonics of voiced speech. The model of this filter described in FIG. 7 uses only two parameters: pitch period T and pitch gain g p . During voiced speech, the pitch period is relatively constant over some subframes or frames. Pitch gain in most vocoders is zero to 1 or slightly greater than 1 (eg 1.2 for GSM EFR)
It is within the range up to. During strong voiced speech, the pitch gain is at or near its maximum value.

【0080】 エコーが近端信号中だけに存在する場合には、そのエコーの有声音化された高
調波は一般的にピッチ合成フィルタによって適切にモデル化され、エコーの尤度
が高いことが検出される(ρ>0.8)。
If the echo is only present in the near-end signal, the voiced harmonics of that echo are generally well modeled by a pitch synthesis filter and it is detected that the likelihood of the echo is high. (Ρ> 0.8).

【0081】 フレーム周期中にエコーと近端音声の両方が近端信号中に存在する場合には、
エコーの尤度は適度なレベルにある(0.5≦ρ≦0.8)。こうした状況では
、符号化プロセスは一般的にこれら2つの信号のうちのより強い方の信号をモデ
ル化するということになる。大半の場合に近端音声がエコーよりも強いと想定す
ることが妥当である。これが当てはまる場合には、符号化プロセスは、その性質
のために、ピッチ合成フィルタによって主として近端音声高調波をモデル化し、
エコーの高調波はわずかしかモデル化しないかまたは全くモデル化しない傾向が
ある。
If both echo and near-end speech are present in the near-end signal during the frame period,
The likelihood of echo is at an appropriate level (0.5 ≦ ρ ≦ 0.8). In these situations, the encoding process will generally model the stronger of these two signals. In most cases it is reasonable to assume that the near-end speech is stronger than the echo. If this is the case, the encoding process, due to its nature, models mainly near-end speech harmonics with pitch synthesis filters,
Echo harmonics tend to model little or no modeling.

【0082】 有声音化エコーを除去またはマスキングするために、エコーの高調波性が消滅
させられる。これは、次のようにピッチ合成フィルタパラメータを変更すること
によって実現される。
To eliminate or mask the voiced echoes, the harmonic nature of the echo is eliminated. This is achieved by changing the pitch synthesis filter parameters as follows.

【0083】 エコーにおける長期相関が除去されるようにピッチ周期がランダム化され、し
たがって、エコーの有声音化性質が消滅させられる。エコーの尤度が高い時だけ
、好ましくはρ>0.8である時だけ、こうしたランダム化が行われる。
The pitch period is randomized so that the long-term correlation in the echo is removed, thus eliminating the voiced nature of the echo. Such randomization is performed only when the likelihood of the echo is high, preferably ρ> 0.8.

【0084】 オーディオ信号における高調波の強さまたは長期相関の強さを制御するために
、ピッチ利得が減少させられる。こうした利得の減衰が、エコーの尤度が少なく
とも適度である(ρ>0.5)時にだけ行われることが好ましい。
The pitch gain is reduced to control the strength of the harmonics or the strength of the long-term correlation in the audio signal. Such attenuation of gain is preferably performed only when the likelihood of the echo is at least moderate (ρ> 0.5).

【0085】 新たなピッチ利得が下記の通りに得られる。[0085]   A new pitch gain is obtained as follows.

【数8】 [Equation 8]

【0086】 このアプローチによって、適度なエコー尤度の際にはピッチ周期がランダム化
されないが、信号の有声音化品質が強くないようにピッチ利得が減衰させられて
もよいということに留意されたい。
Note that with this approach, the pitch period is not randomized during moderate echo likelihood, but the pitch gain may be attenuated so that the voiced quality of the signal is not strong. .

【0087】 図14は、ピッチ周期T=14を有するピッチ合成フィルタの大きさ周波数応
答(magnitude frequency response)を示す。点
線が高ピッチ利得(g=0.75)に関する応答であり、実線が、g=0.
3にピッチ利得が減衰させられる時に生じる状態を示す。オーディオ信号の高調
波と長期相関の強さは、このパラメータをこの仕方で変更することによって制御
されることが可能である。
FIG. 14 shows the magnitude frequency response of a pitch synthesis filter having a pitch period T = 14. Dotted line is a response for a high pitch gain (g p = 0.75), solid line, g p = 0.
Figure 3 shows the conditions that occur when the pitch gain is attenuated. The strength of the harmonics of the audio signal and the long-term correlation can be controlled by changing this parameter in this way.

【0088】 GSM FRボコーダでは、Nで表されている、サブフレームjのLTP遅
れパラメータが図7のモデルのピッチ周期Tに対応する。Nはビットストリー
ム中の7つのビットを取り上げ、40から120までの範囲内であることが可能
である。したがって、Nをランダム化する時には、この範囲内にある乱数でN が置き換えられなければならない。
In the GSM FR vocoder, the LTP delay parameter of subframe j , represented by N j , corresponds to the pitch period T of the model of FIG. N j picks up 7 bits in the bitstream and can be in the range 40 to 120. Therefore, when randomizing N j , a random number within this range must replace N j .

【0089】 bによって表されている、GSM FRボコーダのサブフレームjのLTP
利得パラメータが、図7のピッチ利得gに対応する。変更されたLTP利得パ
ラメータが、下記のように式(6)に類似した仕方で得られる。
LTP of GSM FR vocoder subframe j , represented by b j
The gain parameter corresponds to the pitch gain g p in FIG. 7. The modified LTP gain parameter is obtained in a manner similar to equation (6) below.

【数9】 [Equation 9]

【0090】 LPC合成フィルタの変更 図7の汎用音声デコーダモデルでは、LPC合成フィルタ変換関数は[0090] Change of LPC synthesis filter   In the general-purpose speech decoder model of FIG. 7, the LPC synthesis filter conversion function is

【数10】 である。このフィルタは、合成信号のための広域整形を実現する。このフィルタ
の大きさ周波数応答は、係数{a}を{β}で置換することによって平
坦化され、ここで0≦β≦1である。βは「スペクトラルモーフィングファクタ
(spectral morphing factor)」と呼ばれる。言い換
えると、変更された変換関数は
[Equation 10] Is. This filter provides wide area shaping for the composite signal. The magnitude frequency response of this filter is flattened by replacing the coefficients {a k } with {β k a k }, where 0 ≦ β ≦ 1. β is called the “spectral morphing factor”. In other words, the modified conversion function is

【数11】 である。β=0である時に、オリジナルのLPC合成フィルタが全通過フィルタ
の形に変形され、β=1である時には、オリジナルのフィルタは不変のままであ
るということに留意されたい。0から1までのβの全ての値の場合に、オリジナ
ルのフィルタの大きさ周波数応答は幾らかの平坦化を被り、β→0としてより大
きな平坦化を被る。フィルタの安定性がこの変形において維持されることに留意
されたい。
[Equation 11] Is. Note that when β = 0, the original LPC synthesis filter is transformed into an all-pass filter, and when β = 1, the original filter remains unchanged. For all values of β from 0 to 1, the magnitude frequency response of the original filter suffers some flattening, and β → 0 undergoes greater flattening. Note that the stability of the filter is maintained in this variant.

【0091】 エコーに対するこうしたスペクトラルモーフィングの効果は、信号中に存在す
るあらゆるフォルマント構造を減少させるかまたは除去することである。エコー
はバックグラウンドノイズのように聞こえるようにブレンドまたはモーフィング
される。一例として、有声音化音声セグメントに関するLPC合成フィルタの大
きさ周波数応答と、幾つかの異なるβ値の場合のその平坦化された変形とを図1
5に示す。
The effect of such spectral morphing on the echo is to reduce or eliminate any formant structure present in the signal. The echoes are blended or morphed to sound like background noise. As an example, FIG. 1 shows the magnitude frequency response of an LPC synthesis filter for voiced speech segments and its flattened variant for several different β values.
5 shows.

【0092】 この好ましい実施形態では、スペクトラルモーフィングファクタβは次のよう
に求められる。
In this preferred embodiment, the spectral morphing factor β is determined as follows.

【数12】 [Equation 12]

【0093】 同様のスペクトラルモーフィング方法が、反射係数、ログ−エリア比率、逆サ
イン関数、および、線スペクトル周波数のような、ボコーダで一般的に使用され
るLPCフィルタ係数の他の表現のために得られる。
Similar spectral morphing methods are obtained for other representations of LPC filter coefficients commonly used in vocoders, such as reflection coefficient, log-area ratio, inverse sine function, and line spectral frequency. To be

【0094】 例えば、GSM FRボコーダはLPC合成フィルタを表現するためにログ−
エリア比率を使用する。LAR(i)、i=1,2,...,8として表される
、フレームに対応する8つのログ−エリア比率の場合に、スペクトラルモーフィ
ングされたログ−エリア比率は下記の式を使用して得られ、
For example, the GSM FR vocoder uses a log-to represent LPC synthesis filter.
Use area ratio. LAR (i), i = 1, 2 ,. . . , 8 for eight log-area ratios corresponding to a frame, the spectrally morphed log-area ratio is obtained using the following equation:

【数13】 ここでβは式(8)によって求められる。[Equation 13] Here, β is obtained by the equation (8).

【0095】 この方法はLPCフィルタの大きさ周波数応答をスペクトル的に平坦化する。
あるいは、LARnoise(i)によって表される1組のログ−エリア比率に
よって表現されたバックグラウンドノイズのスペクトルのような予め決められた
スペクトルまたは大きさ周波数応答に対してログ−エリア比率をモーフィングす
るためには、適切なモーフィング式は下記の通りである。
This method spectrally flattens the magnitude frequency response of the LPC filter.
Alternatively, morph the log-area ratio to a predetermined spectrum or magnitude frequency response, such as the spectrum of background noise represented by a set of log-area ratios represented by LAR noise (i). To do this, the appropriate morphing formula is:

【数14】 [Equation 14]

【0096】 その次に、変更されたログ−エリア比率を、標準における仕様にしたがって量
子化する。ログ−エリア比率の変更に対するこうしたアプローチがLPC合成フ
ィルタの安定性を維持することに留意されたい。
The modified log-area ratio is then quantized according to the specifications in the standard. Note that such an approach to changing the log-area ratio maintains the stability of the LPC synthesis filter.

【0097】 バックグラウンドノイズのスペクトル予測と、ボコーダおよびLPCフィルタ
に対応するログ−エリア比率を含むフィルタ係数の表現とのためのアプローチの
典型的な一例が、快適ノイズ発生標準[5]とその中の引例とに示されている。
A typical example of an approach for spectral prediction of background noise and representation of filter coefficients including log-area ratios corresponding to vocoders and LPC filters is the Comfort Noise Generation Standard [5] and its And the reference to.

【0098】 線スペクトル周波数がLPC合成フィルタ(例えば、GSM EFR)を表現
するために使用される時には、ログ−エリア比率に関するアプローチに類似した
アプローチも適切である。線スペクトル周波数をf、i=1,...,Mで表
し、ここでMは、一様(典型的)であると想定されているLPC合成フィルタの
次数である。線スペクトル周波数が0からサンプリング周波数の1/2まで均一
に間隔が空けられている時には、その結果として得られるLPC合成フィルタは
全通過だろう(すなわち、平坦な大きさ周波数応答)。こうしたスペクトル的に
平坦なLPCフィルタに対応する線スペクトル周波数の組をfi,flat、i
=1,...,Mと表す。
When line spectral frequencies are used to represent LPC synthesis filters (eg GSM EFR), an approach similar to the one for log-area ratio is also suitable. The line spectrum frequencies are f i , i = 1 ,. . . , M, where M is the order of the LPC synthesis filter that is assumed to be uniform (typical). When the line spectral frequencies are uniformly spaced from 0 to 1/2 the sampling frequency, the resulting LPC synthesis filter will be all-pass (ie, flat magnitude frequency response). The set of line spectral frequencies corresponding to such a spectrally flat LPC filter is given by f i, flat
= 1 ,. . . , M.

【0099】 そのとき、スペクトル的にモーフィングされた線スペクトル周波数が、下記の
式を使用して得られ、
The spectrally morphed line spectral frequency is then obtained using the following equation:

【数15】 ここでβは式(8)によって求められる。[Equation 15] Here, β is obtained by the equation (8).

【0100】 この方法はLPC合成フィルタの大きさ周波数応答をスペクトル的に平坦化す
る。あるいは、fi,noiseによって表される1組の線スペクトル周波数に
よって表現されたバックグラウンドノイズスペクトルのような予め決められたス
ペクトルまたは大きさ周波数応答に対して線スペクトル周波数をモーフィングす
るためには、適切なモーフィング式は下記の通りである。
This method spectrally flattens the magnitude frequency response of the LPC synthesis filter. Alternatively, to morph the line spectral frequencies to a predetermined spectrum or magnitude frequency response, such as a background noise spectrum represented by a set of line spectral frequencies represented by f i, noise , A suitable morphing formula is as follows.

【数16】 [Equation 16]

【0101】 次いで、変更された線スペクトル周波数を標準における仕様にしたがって量子
化する。線スペクトル周波数の変更に対するこうしたアプローチがLPC合成フ
ィルタの安定性を維持することに留意されたい。バックグラウンドノイズスペク
トル予測と線スペクトル周波数を含むフィルタ係数の表現とのための適切な方法
が、快適ノイズ発生に関する対応するボコーダ標準に示されている。
The modified line spectrum frequency is then quantized according to the specifications in the standard. Note that such an approach to changing the line spectral frequency maintains the stability of the LPC synthesis filter. Suitable methods for background noise spectrum prediction and representation of filter coefficients containing line spectrum frequencies are given in the corresponding vocoder standard for comfort noise generation.

【0102】 最小遅延の技術 バッファリングと処理と伝送とにおける大きな遅延が、ネットワーク音声品質
増強処理を全く伴わないセルラネットワークにおいてすでに存在している。音声
増強のための符号化音声のさらに別のネットワーク処理が追加の遅延を付加する
だろう。この遅延を最小限にすることが音声品質にとって重要である。このセク
ションでは、この遅延を最小限にするための新規のアプローチを説明する。使用
する事例はGSM FRボコーダである。
Minimum Delay Techniques Large delays in buffering, processing and transmission already exist in cellular networks without any network voice quality enhancement processing. Further network processing of the coded speech for speech enhancement will add additional delay. Minimizing this delay is important for voice quality. This section describes a new approach to minimize this delay. The case used is the GSM FR vocoder.

【0103】 図8は、GSM FRエンコーダからの符号化パラメータが受け取られる順序
を示す。単純なアプローチは、各フレーム毎に260ビット全体をバッファリン
グすることと、その次に符号化ドメインエコー制御のためにこれらのバッファリ
ングされたビットを処理することとを含む。しかし、このことは、処理遅延に加
えて約20ミリ秒のバッファリング遅延を生じさせる。
FIG. 8 shows the order in which the coding parameters from the GSM FR encoder are received. A simple approach involves buffering the entire 260 bits for each frame, and then processing these buffered bits for coded domain echo control. However, this causes a processing delay plus a buffering delay of about 20 ms.

【0104】 次のようにしてこのバッファリング遅延を最小限にすることが可能である。最
初に、ビット92が受け取られた直後に第1のサブフレーム全体が復号化される
ことが可能であるということに留意されたい。したがって、この第1のサブフレ
ームが、約7.1ミリ秒(20ミリ秒×92/260)のバッファリング遅延の
後に処理されるだろう。したがって、バッファリング遅延は約13ミリ秒だけ減
少させられる。
This buffering delay can be minimized as follows. First, note that the entire first subframe may be decoded immediately after bit 92 is received. Therefore, this first subframe will be processed after a buffering delay of about 7.1 ms (20 ms × 92/260). Therefore, the buffering delay is reduced by about 13 ms.

【0105】 この新規の低遅延アプローチを使用すると、符号化LPC合成フィルタパラメ
ータが、フレームの第1のサブフレームの終点で利用可能な情報に基づいて変更
される。言い換えると、そのフレーム全体が、第1のサブフレームに基づいて計
算されたエコー尤度による影響を受ける。実施した実験では、この「早期の」判
断に起因した顕著なアーチファクトが発見されなかったが、これは、特に、エコ
ー尤度が幾つかの先行サブフレームと現在フレームとに効果的に基づいて平滑化
された量であるからである。
Using this new low delay approach, the coded LPC synthesis filter parameters are modified based on the information available at the end of the first subframe of the frame. In other words, the entire frame is affected by the echo likelihood calculated based on the first subframe. The experiments carried out did not find any noticeable artifacts due to this "early" decision, which is particularly smoothed based on the echo likelihood being effectively based on some previous subframes and the current frame. This is because it is a converted amount.

【0106】 誤り訂正/検出ビットおよびフレーム指示ビットの更新 本明細書で説明したエコー除去のための新規の符号化ドメイン処理方法を適用
する時には、符号化パラメータに対応するビットの一部または全部がビットスト
リーム中で変更される。これは、ビットストリーム中に埋め込まれているかも知
れない他の誤り訂正または検出ビットに悪影響を与える可能性もある。例えば、
音声エンコーダは、誤りのないフレームが受け取られることを確実にするように
デコーダが検査を行うための幾つかのチェックサムをビットストリーム中に埋め
込むかも知れない。こうしたチェックサムと、あらゆるパリティチェックビット
と、誤り訂正または検出ビットと、フレーム指示ビットとが、必要に応じて適切
な標準にしたがって更新される。
Error Correction / Detection Bits and Updating Frame Indication Bits When applying the novel coding domain processing method for echo cancellation described herein, some or all of the bits corresponding to the coding parameters may be applied. Changed in bitstream. This can also adversely affect other error correction or detection bits that may be embedded in the bitstream. For example,
The audio encoder may embed some checksums in the bitstream for the decoder to check to ensure that error-free frames are received. Such checksums, any parity check bits, error correction or detection bits, and framing bits are updated as needed according to the appropriate standard.

【0107】 GSMタンデムフリーオペレーション標準による動作 符号化パラメータだけが使用可能である場合には、部分的復号化または完全復
号化が上述のように行われてよく、それによって符号化パラメータがオーディオ
信号のバージョンを再構築するために使用される。しかし、GSM TFO環境
のような状況下で操作する時には、符号化パラメータに加えて追加の情報が使用
可能である。この追加の情報はオーディオ信号のA−law PCMサンプルの
6つのMSBである。この場合には、これらのPCMサンプルが、符号化パラメ
ータを使用することなしに遠端と近端の両方に関してオーディオ信号のバージョ
ンを再構築するために使用されてよい。このことが計算上の節約を結果的にもた
らす。
Operation according to the GSM Tandem Free Operations Standard If only the coding parameters are available, partial or full decoding may be performed as described above, whereby the coding parameters are of the audio signal. Used to rebuild the version. However, when operating under circumstances such as the GSM TFO environment, additional information is available in addition to the coding parameters. This additional information is the 6 MSBs of the A-law PCM sample of the audio signal. In this case, these PCM samples may be used to reconstruct a version of the audio signal for both the far end and the near end without using coding parameters. This results in computational savings.

【0108】 通信技術の専門家は、これらの好ましい実施形態が、添付した請求の範囲に規
定される本発明の真の精神と範囲から逸脱することなく修飾および変形されるこ
とができることを認識するであろう。
Those of skill in the communication arts will recognize that these preferred embodiments can be modified and varied without departing from the true spirit and scope of the invention as defined in the appended claims. Will.

【図面の簡単な説明】[Brief description of drawings]

【図1】 図1は、GSMディジタルセルラーネットワークにおける音声伝送のためのシ
ステムの概略的ブロック図である。
FIG. 1 is a schematic block diagram of a system for voice transmission in a GSM digital cellular network.

【図2】 図2は、タンデムフリーオペレーション(TFO)のもとでのGSMネットワ
ークにおける音声伝送のためのシステムの概略的ブロック図である。
FIG. 2 is a schematic block diagram of a system for voice transmission in a GSM network under Tandem Free Operation (TFO).

【図3】 図3は、タンデムフリーオペレーション(TFO)のもとでの音声伝送を図解
するグラフである。
FIG. 3 is a graph illustrating voice transmission under Tandem Free Operation (TFO).

【図4】 図4は、有線ネットワークにおけるエコー問題に対する伝統的解決の概略的ブ
ロック図である。
FIG. 4 is a schematic block diagram of a traditional solution to the echo problem in wired networks.

【図5】 図5は、ディジタルセルラーネットワークにおけるスピーカからマイクロホン
への音響フィードバックを図解する概略的ブロック図である。
FIG. 5 is a schematic block diagram illustrating acoustic feedback from a speaker to a microphone in a digital cellular network.

【図6】 図6は、符号化音声に対する伝統的なエコーキャンセルのアプローチの概略的
ブロック図である。
FIG. 6 is a schematic block diagram of a traditional echo cancellation approach for coded speech.

【図7】 図7は、総称線形予測コード(LPC)音声合成モデルまたは音声復号モデル
の概略的ブロック図である。
FIG. 7 is a schematic block diagram of a Generic Linear Predictive Code (LPC) speech synthesis model or speech decoding model.

【図8】 図8は、GSM FRのためのビットストリームにおける符号化パラメータの
配置の図解である。
FIG. 8 is an illustration of the placement of coding parameters in a bitstream for GSM FR.

【図9】 図9は、本発明に従って作られた音響エコー環境に対する符号化ドメインエコ
ーコントロールの優先形態の概略的ブロック図である。
FIG. 9 is a schematic block diagram of a preferred form of coded domain echo control for an acoustic echo environment made in accordance with the present invention.

【図10】 図10は、本発明に従って作られた4線式対2線式ハイブリッドに起因するエ
コーに対する符号化ドメインエコーコントロールのもうひとつの優先形態の概略
的ブロック図である。
FIG. 10 is a schematic block diagram of another preferred form of coded domain echo control for echoes resulting from a 4-wire vs. 2-wire hybrid made in accordance with the present invention.

【図11】 図11は、フラットな遅延および減衰を伴う単純化されたエンド経路モデルの
概略的ブロック図である。
FIG. 11 is a schematic block diagram of a simplified end path model with flat delay and attenuation.

【図12】 図12は、予備エコー尤度対比である近端サブフレーム対遠端サブフレームの
電力比を示すグラフである。
FIG. 12 is a graph showing a power ratio of a near-end subframe to a far-end subframe, which is a preliminary echo likelihood contrast.

【図13】 図13は、符号化ドメインエコーコントロール方法の優先形態を示すフローチ
ャートである。
FIG. 13 is a flowchart showing a priority mode of a coded domain echo control method.

【図14】 図14は、ピッチ合成フィルタの振幅−周波数レスポンスの一例を示すグラフ
である。
FIG. 14 is a graph showing an example of the amplitude-frequency response of the pitch synthesis filter.

【図15】 図15は、オリジナルのLPC合成フィルタおよびこのようなフィルタの平板
化バージョンの振幅−周波数レスポンスの一例を示すグラフである。
FIG. 15 is a graph showing an example of the amplitude-frequency response of an original LPC synthesis filter and a flattened version of such a filter.

───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,MZ,SD,SL,SZ,TZ,UG ,ZW),EA(AM,AZ,BY,KG,KZ,MD, RU,TJ,TM),AE,AG,AL,AM,AT, AU,AZ,BA,BB,BG,BR,BY,BZ,C A,CH,CN,CR,CU,CZ,DE,DK,DM ,DZ,EE,ES,FI,GB,GD,GE,GH, GM,HR,HU,ID,IL,IN,IS,JP,K E,KG,KP,KR,KZ,LC,LK,LR,LS ,LT,LU,LV,MA,MD,MG,MK,MN, MW,MX,MZ,NO,NZ,PL,PT,RO,R U,SD,SE,SG,SI,SK,SL,TJ,TM ,TR,TT,TZ,UA,UG,US,UZ,VN, YU,ZA,ZW Fターム(参考) 5D045 DA20 5J064 AA01 BA05 BA13 BB01 BB03 BC01 BC16 BD02 5K046 HH11 HH51 HH77 HH78 ─────────────────────────────────────────────────── ─── Continued front page    (81) Designated countries EP (AT, BE, CH, CY, DE, DK, ES, FI, FR, GB, GR, IE, I T, LU, MC, NL, PT, SE), OA (BF, BJ , CF, CG, CI, CM, GA, GN, GW, ML, MR, NE, SN, TD, TG), AP (GH, GM, K E, LS, MW, MZ, SD, SL, SZ, TZ, UG , ZW), EA (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM), AE, AG, AL, AM, AT, AU, AZ, BA, BB, BG, BR, BY, BZ, C A, CH, CN, CR, CU, CZ, DE, DK, DM , DZ, EE, ES, FI, GB, GD, GE, GH, GM, HR, HU, ID, IL, IN, IS, JP, K E, KG, KP, KR, KZ, LC, LK, LR, LS , LT, LU, LV, MA, MD, MG, MK, MN, MW, MX, MZ, NO, NZ, PL, PT, RO, R U, SD, SE, SG, SI, SK, SL, TJ, TM , TR, TT, TZ, UA, UG, US, UZ, VN, YU, ZA, ZW F-term (reference) 5D045 DA20                 5J064 AA01 BA05 BA13 BB01 BB03                       BC01 BC16 BD02                 5K046 HH11 HH51 HH77 HH78

Claims (61)

【特許請求の範囲】[Claims] 【請求項1】 第1のパラメータを包含する複数のパラメータを有する圧縮
のコードを使用して近接終端のデジタル信号を送信する通信システムであって該
パラメータは複数のオーディオの特徴を有する1つのオーディオの信号をあらわ
し該圧縮のコードは複数の復号の段階により復号されることが可能であり該通信
システムは圧縮のコードを使用して遠隔の終端の信号を送信するものにおける、
近接終端のデジタル信号におけるエコーを減少させる装置であって、該装置は1
つのプロセッサを具備し、該プロセッサは、該近接の終端のデジタルの信号に応
答して該複数のパラメータの少なくとも該第1のパラメータを読取り、該複数の
復号の段階の少なくとも1つを該近接の終端のデジタルの信号および該遠隔の終
端のデジタルの信号について実行し、少なくとも部分的に復号された近接の終端
の信号および少なくとも部分的に復号された遠隔の終端の信号を発生させ、およ
び、該少なくとも部分的に復号された近接の終端の信号および少なくとも部分的
に復号された遠隔の終端の信号に応答して該第1のパラメータを調節し、調節さ
れた第1のパラメータを発生させおよび該第1のパラメータを該近接の終端のデ
ジタルの信号における該調節された第1のパラメータで置換するものである、エ
コーを減少させる装置。
1. A communication system for transmitting a near-terminated digital signal using a compressed code having a plurality of parameters including a first parameter, the parameter being one audio having a plurality of audio characteristics. Of the compression code can be decoded by a plurality of decoding steps, and the communication system uses the compression code to transmit the remote termination signal,
A device for reducing echoes in a near-end digital signal, the device comprising:
One processor, the processor reading at least the first parameter of the plurality of parameters in response to a digital signal at the terminal of the proximity, and performing at least one of the plurality of decoding steps of the proximity of the plurality of parameters. Performing on the terminal digital signal and the remote terminal digital signal to generate an at least partially decoded near terminal signal and an at least partially decoded remote terminal signal, and Adjusting the first parameter in response to the at least partially decoded near end signal and the at least partially decoded remote end signal to generate the adjusted first parameter; and A device for reducing echoes, which replaces a first parameter with the adjusted first parameter in the digital signal at the end of the proximity. .
【請求項2】 該第1のパラメータは量子化された第1のパラメータであり
、該プロセッサは、調節された第1のパラメータを該近接の終端のデジタルの信
号へ書込む前に、該調節された第1のパラメータを量子化することにより該調節
された第1のパラメータを部分的に発生させる、請求項1記載の装置。
2. The first parameter is a quantized first parameter and the processor adjusts the adjusted first parameter before writing the adjusted first parameter to the digital signal at the proximal end. The apparatus of claim 1, wherein the adjusted first parameter is partially generated by quantizing the adjusted first parameter.
【請求項3】 該プロセッサは、該少なくとも部分的に復号された近接終端
の信号および該少なくとも部分的に復号された遠隔終端の信号に応答し該少なく
とも部分的に復号された近接終端の信号に存在するエコーの量をあらわすエコー
の公算の信号を発生させ、および該プロセッサは、該エコーの公算の信号に応答
し該第1のパラメータを調節する、請求項1記載の装置。
3. The processor is responsive to the at least partially decoded near-end signal and the at least partially decoded near-end signal to the at least partially decoded near-end signal. The apparatus of claim 1, wherein a probable echo signal is generated that is indicative of the amount of echo present, and the processor adjusts the first parameter in response to the probable echo signal.
【請求項4】 該特徴はスペクトルの形状を有し、該第1のパラメータはフ
ィルタ係数を表現するものを有し、該プロセッサは該エコーの公算の信号に応答
し該フィルタ係数を表現するものをマグニチュード周波数応答へ向かって調節す
る、請求項3記載の装置。
4. The feature has a spectral shape, the first parameter has a representation of filter coefficients, and the processor is responsive to a signal of likelihood of the echo to represent the filter coefficients. 4. The apparatus of claim 3, wherein is adjusted toward a magnitude frequency response.
【請求項5】 該フィルタ係数を表現するものはラインのスペクトルの周波
数を有する、請求項4記載の装置。
5. Apparatus according to claim 4, wherein the representation of the filter coefficients comprises the frequencies of the spectrum of the line.
【請求項6】 該フィルタ係数を表現するものはログの面積の比を有する、
請求項4記載の装置。
6. The representation of the filter coefficient has a ratio of log areas,
The device according to claim 4.
【請求項7】 該マグニチュード周波数応答は背景雑音に対応する、請求項
4記載の装置。
7. The apparatus of claim 4, wherein the magnitude frequency response corresponds to background noise.
【請求項8】 該特徴は該オーディオ信号の全体のレベルを有し、該第1の
パラメータはコードブックの利得を有する、請求項1記載の装置。
8. The apparatus of claim 1, wherein the feature comprises an overall level of the audio signal and the first parameter comprises a codebook gain.
【請求項9】 該第1のパラメータはコードブックのベクトルのパラメータ
を有する、請求項1記載の装置。
9. The apparatus of claim 1, wherein the first parameter comprises a vector of codebook parameters.
【請求項10】 該特徴はロングタームの相関の期間を有し、該第1のパラ
メータはピッチ期間のパラメータを有する、請求項1記載の装置。
10. The apparatus of claim 1, wherein the feature comprises a long term correlation period and the first parameter comprises a pitch period parameter.
【請求項11】 該特徴はロングタームの相関の強度を有し、該第1のパラ
メータはピッチ利得のパラメータを有する、請求項1記載の装置。
11. The apparatus of claim 1, wherein the feature has a long term correlation strength and the first parameter has a pitch gain parameter.
【請求項12】 該特徴はスペクトルの形状を有し、該第1のパラメータは
フィルタ係数を表現するものを有する、請求項1記載の装置。
12. The apparatus of claim 1, wherein the features have a spectral shape and the first parameter has a representation of filter coefficients.
【請求項13】 該フィルタ係数を表現するものはログの面積の比を有する
、請求項12記載の装置。
13. The apparatus of claim 12, wherein the representation of the filter coefficients comprises a ratio of log areas.
【請求項14】 該フィルタ係数を表現するものはラインのスペクトルの周
波数を有する、請求項12記載の装置。
14. The apparatus of claim 12, wherein the representation of the filter coefficients comprises the frequencies of the spectrum of the line.
【請求項15】 該フィルタ係数を表現するものはリニアプレディクティブ
の符号化合成のフィルタを有する、請求項12記載の装置。
15. The apparatus of claim 12, wherein the representation of the filter coefficients comprises a linear predictive coded synthesis filter.
【請求項16】 該第1のパラメータは該複数のオーディオの第1の特徴に
対応し、該複数の復号の段階は該第1の特徴を実質的に変化させることを回避す
る少なくとも1つの復号の段階を有し、該プロセッサは該少なくとも1つの復号
の段階を実行することを回避する、請求項1記載の装置。
16. The first parameter corresponds to a first characteristic of the plurality of audios, and the plurality of decoding steps avoids substantially changing the first characteristic. 2. The apparatus of claim 1, having the steps of: and the processor avoiding performing the at least one decoding step.
【請求項17】 該オーディオの特徴はパワーを有し、該第1の特徴はパワ
ーを有する、請求項16記載の装置。
17. The apparatus of claim 16, wherein the audio feature has power and the first feature has power.
【請求項18】 該少なくとも1つの復号の段階はポストフィルタ作動を有
する、請求項16記載の装置。
18. The apparatus of claim 16, wherein the at least one decoding step comprises post-filtering.
【請求項19】 該圧縮のコードは線形プレディクティブのコードを有する
、請求項1記載の装置。
19. The apparatus of claim 1, wherein the compression code comprises a linear predictive code.
【請求項20】 該圧縮のコードは規則的なパルスの励起対ロングタームの
プレディクティブのコードを有する、請求項1記載の装置。
20. The apparatus of claim 1, wherein the compression code comprises a regular pulse excitation versus a long term predictive code.
【請求項21】 該圧縮のコードはコード励起される線形のプレディクショ
ンのコードを有する、請求項1記載の装置。
21. The apparatus of claim 1, wherein the compression code comprises a code-excited linear prediction code.
【請求項22】 該第1のパラメータは時間にわたり受信される一連の第1
のパラメータを有し、該プロセッサは該近接終端のデジタルの信号に応答して該
一連の第1のパラメータを読取り、該プロセッサは該少なくとも部分的に復号さ
れた近接および遠隔の終端の信号および少なくとも複数の該一連の第1のパラメ
ータに応答して該調節された第1のパラメータを発生させる、請求項1記載の装
置。
22. The first parameter is a sequence of first received over time.
The processor reads the series of first parameters in response to the digital signal at the near-terminated end, the processor reading the at least partially decoded near-end and far-end signal and at least The apparatus of claim 1, wherein the adjusted first parameter is generated in response to a plurality of the series of first parameters.
【請求項23】 該圧縮のコードは該デジタル信号のフレーム内に配置され
、該フレームは複数のサブフレームを有し、該サブフレームの各々は該第1のパ
ラメータを有し、該プロセッサは該圧縮のコードに応答して該複数のサブフレー
ムの各々から少なくとも該第1のパラメータを読取り、該プロセッサは該第1の
パラメータを、該複数のサブフレームの各々における該調節された第1のパラメ
ータで置換する、請求項1記載の装置。
23. The compression code is arranged in a frame of the digital signal, the frame having a plurality of subframes, each of the subframes having the first parameter, the processor Responsive to a code of compression, reading at least the first parameter from each of the plurality of subframes, the processor including the first parameter of the adjusted first parameter in each of the plurality of subframes. The device according to claim 1, wherein
【請求項24】 該プロセッサは該サブフレームの第1のものから該第1の
パラメータを読取り、該第1のサブフレームの間、該近接終端のデジタル信号に
ついて少なくとも複数の該復号の段階を実行することを開始し、第1のサブフレ
ームに後続する1つのサブフレームを処理する前により小なる遅延を実現するよ
う該第1のパラメータを該調節された第1のパラメータで置換する、請求項23
記載の装置。
24. The processor reads the first parameter from a first one of the subframes and performs at least a plurality of the decoding steps on the near-terminated digital signal during the first subframe. And replacing the first parameter with the adjusted first parameter to achieve a smaller delay before processing a subframe subsequent to the first subframe. 23
The described device.
【請求項25】 該圧縮のコードは該デジタル信号のフレーム内に配置され
、該フレームは複数のサブフレームを有しこのサブフレームの各々は該第1のパ
ラメータを有し、該プロセッサは、該サブフレームの第1のものの期間に少なく
とも複数の該復号の段階を実行して該少なくとも部分的に復号された近接終端お
よび遠隔終端の信号を発生させ、該第1のパラメータを該第1のサブフレームに
後続して出現する該サブフレームの第2のものから読取り、該少なくとも部分的
に復号された近接終端および遠隔終端の信号および該第1のパラメータに応答し
て該調節された第1のパラメータを発生させ、および、該第2のサブフレームの
第1のパラメータを該調節された第1のパラメータで置換する、請求項1記載の
装置。
25. The compression code is arranged in a frame of the digital signal, the frame having a plurality of subframes, each of the subframes having the first parameter, the processor Performing at least a plurality of said decoding steps during a first one of the subframes to generate said at least partially decoded near-terminated and far-terminated signals, and setting said first parameter to said first sub-frame. Reading from a second one of the sub-frames that appear subsequent to the frame and responsive to the at least partially decoded near-end and remote-end signals and the first parameter, the adjusted first 2. The apparatus of claim 1, generating a parameter and replacing the first parameter of the second subframe with the adjusted first parameter.
【請求項26】 コードのサンプルを有する近接終端のデジタル信号を送信
する通信システムであって、該コードのサンプルは圧縮のコードを使用する第1
のビットおよび線形のコードを使用する第2のビットを有し、該コードのサンプ
ルはオーディオの信号を表わし該オーディオの信号は複数のオーディオの特徴を
有し、該システムはまた遠隔終端のデジタルの信号を送信するシステムにおける
、該圧縮のコードを符号化することなく近接終端のデジタル信号における該圧縮
のコードを復号することなく該近接終端のデジタル信号におけるエコーを減少さ
せる装置であって、該装置は該近接終端のデジタル信号および該遠隔終端のデジ
タル信号に応答して該第1のビットおよび該第2のビットを調節するものを具備
するエコーを減少させる装置。
26. A communication system for transmitting a near-terminated digital signal having code samples, the code samples using a compression code.
, And a second bit using a linear code, the sample of the code representing an audio signal, the audio signal having a plurality of audio features, and the system also includes a remotely terminated digital signal. An apparatus for reducing echoes in a near-end digital signal without decoding the compression code in the near-end digital signal without encoding the compression code in a system for transmitting signals, the apparatus comprising: Is an apparatus for reducing echoes comprising adjusting the first bit and the second bit in response to the near-end digital signal and the remote-end digital signal.
【請求項27】 圧縮のコードを復号することなく近接終端のデジタル信号
におけるエコーを減少させる装置であって、近接終端のデジタル信号および遠隔
終端のデジタル信号に応答して第1のビットおよび第2のビットを調節するプロ
セッサを具備する、請求項26記載の装置。
27. An apparatus for reducing echoes in a near-end digital signal without decoding a compression code, the first bit and the second bit in response to the near-end digital signal and the remote-end digital signal. 27. The apparatus of claim 26, comprising a processor that adjusts the bits of the.
【請求項28】 該線形のコードはパルスコード変調(PCM)のコードを
有する、請求項26記載の装置。
28. The apparatus of claim 26, wherein the linear code comprises a pulse code modulation (PCM) code.
【請求項29】 該圧縮のコードのサンプルは、移動可能の通信の標準のた
めにグローバルのシステムのタンデムフリーの作動に合致する、請求項26記載
の装置。
29. The apparatus of claim 26, wherein the sample code of compression conforms to tandem-free operation of global systems for mobile communication standards.
【請求項30】 該第1のビットは該サンプルの2つの最下位のビットを有
し、該第2のビットは該サンプルの6個の最上位のビットを有する、請求項26
記載の装置。
30. The first bit comprises the two least significant bits of the sample and the second bit comprises the six most significant bits of the sample.
The described device.
【請求項31】 該6個の最上位のビットはPCMコードを有する、請求項
29記載の装置。
31. The apparatus of claim 29, wherein the 6 most significant bits comprise a PCM code.
【請求項32】 第1のパラメータを包含する複数のパラメータを有する圧
縮のコードを使用して近接終端のデジタル信号を送信する通信システムであって
、該パラメータは複数のオーディオの特徴を有するオーディオの信号を表わし、
該圧縮のコードは複数の復号の段階により復号可能であり、該通信システムはま
た圧縮のコードを使用して遠隔終端の信号を送信するもの、における該近接終端
のデジタル信号におけるエコーを減少させる方法であって、該方法は、 該近接終端のデジタル信号に応答して該複数のパラメータの少なくとも第1の
パラメータを読取る段階、 該近接終端のデジタル信号および該遠隔終端のデジタル信号について該複数の
復号の段階の少なくとも1つを実行し、少なくとも部分的に復号された近接終端
の信号および少なくとも部分的に復号された遠隔終端の信号を発生させる段階、 該少なくとも部分的に復号された近接終端の信号および少なくとも部分的に復
号された遠隔終端の信号に応答して該第1のパラメータを調節し、調節された第
1のパラメータを発生させる段階、および、 該第1のパラメータを該近接終端の信号における該調節された第1のパラメー
タで置換する段階、 を具備するエコーを減少させる方法。
32. A communication system for transmitting a near-terminated digital signal using a compressed code having a plurality of parameters including a first parameter, the parameter of an audio having a plurality of audio characteristics. Represents a signal,
The compression code is decodable in multiple decoding steps, and the communication system also uses the compression code to transmit a remote-ended signal, in which the echo in the near-terminated digital signal is reduced. Wherein the method reads at least a first parameter of the plurality of parameters in response to the near-end digital signal, the plurality of decodings of the near-end digital signal and the remote-end digital signal. Performing at least one of the steps of generating at least partially decoded near-end signal and at least partially decoded near-end signal, said at least partially decoded near-end signal And adjusting the first parameter in response to the at least partially decoded remote termination signal to adjust the adjusted first parameter. Step for generating a meter, and a method of reducing echo comprises the step of replacing a first parameter which is the adjustment in a parameter of the first signal of the proximity end.
【請求項33】 該第1のパラメータは量子化された第1のパラメータであ
り、該調節は該調節された第1のパラメータを量子化することにより該調節され
た第1のパラメータを部分的に発生させる過程を有する、請求項31記載の方法
33. The first parameter is a quantized first parameter and the adjusting partially tunes the adjusted first parameter by quantizing the adjusted first parameter. 32. The method of claim 31, comprising the step of generating.
【請求項34】 該調節は、該少なくとも部分的に復号された近接終端の信
号および該少なくとも部分的に復号された遠隔終端の信号に応答して該部分的に
復号された近接終端の信号に存在するエコーの量を表わすエコーの公算の信号を
発生させる過程を有し、該調節は該エコーの公算の信号に応答して該第1のパラ
メータを調節する過程をさらに有する、請求項31記載の方法。
34. The adjustment to the partially decoded near-end signal in response to the at least partially decoded near-end signal and the at least partially decoded near-end signal. 32. The method of claim 31, further comprising the step of generating an echo probable signal representative of the amount of echo present, the adjusting further comprising the step of adjusting the first parameter in response to the echo probable signal. the method of.
【請求項35】 該特徴はスペクトルの形状を有し、該第1のパラメータは
フィルタ係数を表わすものを有し、該調節は該エコーの公算の信号に応答して該
フィルタ係数をマグニチュード周波数応答へ向かって調節する過程を有する、請
求項33記載の方法。
35. The feature has a spectral shape, the first parameter has a representation of a filter coefficient, and the adjustment is responsive to a signal of likelihood of the echo to adjust the filter coefficient to a magnitude frequency response. 34. The method of claim 33, comprising adjusting towards.
【請求項36】 該フィルタ係数を表わすものは、ラインスペクトルの周波
数を有する、請求項34記載の方法。
36. The method of claim 34, wherein the representation of the filter coefficients comprises the frequencies of the line spectrum.
【請求項37】 該フィルタ係数を表わすものは、ログの面積の比を有する
、請求項34記載の方法。
37. The method of claim 34, wherein the representation of the filter coefficients comprises a ratio of log areas.
【請求項38】 該マグニチュード周波数の応答は、背景の雑音に対応する
、請求項34記載の方法。
38. The method of claim 34, wherein the magnitude frequency response corresponds to background noise.
【請求項39】 該特徴は、該オーディオの信号の全体的なレベルを有し、
該第1のパラメータは、コードブットの利得を有する、請求項31記載の方法。
39. The feature comprises an overall level of the audio signal,
32. The method of claim 31, wherein the first parameter comprises a code butt gain.
【請求項40】 該第1のパラメータは、コードブックのベクトルのパラメ
ータを有する、請求項31記載の方法。
40. The method of claim 31, wherein the first parameter comprises a vector of codebook parameters.
【請求項41】 該特徴は、ロングタームの相関の期間を有し、該第1のパ
ラメータは、ピッチ期間のパラメータを有する、請求項31記載の方法。
41. The method of claim 31, wherein the feature comprises a long term correlation period and the first parameter comprises a pitch period parameter.
【請求項42】 該特徴は、ロングタームの相関の強度を有し、該第1のパ
ラメータはピッチ利得のパラメータを有する、請求項31記載の方法。
42. The method of claim 31, wherein the feature comprises a long-term correlation strength and the first parameter comprises a pitch gain parameter.
【請求項43】 該特徴は、スペクトルの形状を有し、該第1のパラメータ
はフィルタ係数を表わすものを有する、請求項31記載の方法。
43. The method of claim 31, wherein the feature has a spectral shape and the first parameter comprises one that represents a filter coefficient.
【請求項44】 該フィルタ係数を表わすものは、ログの面積の比を有する
、請求項42記載の方法。
44. The method of claim 42, wherein the representation of the filter coefficients comprises a ratio of log areas.
【請求項45】 該フィルタ係数を表わすものは、ラインスペクトルの周波
数を有する、請求項42記載の方法。
45. The method of claim 42, wherein the representation of the filter coefficients comprises the frequencies of the line spectrum.
【請求項46】 該フィルタ係数を表わすものは、線形のプレディクティブ
の符号化合成のフィルタを有する、請求項42記載の方法。
46. The method of claim 42, wherein the representation of the filter coefficients comprises a linear predictive coded synthesis filter.
【請求項47】 該第1のパラメータは該複数のオーディオの特徴の第1の
特徴に対応し、該複数の復号の段階は、該第1の特徴の実質的な変化を回避する
少なくとも1つの復号の段階を有し、該少なくとも複数の該復号の段階の該実行
は、該少なくとも1つの復号の段階の実行を回避する過程を有する、請求項31
記載の方法。
47. The first parameter corresponds to a first feature of the plurality of audio features, and the plurality of decoding steps avoids at least one substantial change in the first feature. 32. Decoding steps, wherein the performing the at least a plurality of decoding steps comprises the step of avoiding performing the at least one decoding step.
The method described.
【請求項48】 該オーディオの特徴は、パワーを有し、該第1の特徴はパ
ワーを有する、請求項46記載の方法。
48. The method of claim 46, wherein the audio feature comprises power and the first feature comprises power.
【請求項49】 該少なくとも1つの復号の段階は、ポストフィルタの過程
を有する、請求項46記載の方法。
49. The method of claim 46, wherein the at least one decoding step comprises post-filtering.
【請求項50】 該圧縮のコードは、線形のプレディクティブコードを有す
る、請求項31記載の方法。
50. The method of claim 31, wherein the compression code comprises a linear predictive code.
【請求項51】 該圧縮のコードは、規則的なパルスの励起−ロングターム
のプレディクションのコードを有する、請求項31記載の方法。
51. The method of claim 31, wherein the compression code comprises a regular pulse excitation-long term prediction code.
【請求項52】 該圧縮のコードは、コード−励起された線形のプレディク
ションのコードを有する、請求項31記載の方法。
52. The method of claim 31, wherein the compression code comprises a code-excited linear prediction code.
【請求項53】 該第1のパラメータは、時間にわたり受信された一連の第
1のパラメータを有し、該読取りは、該一連の第1のパラメータを読取る過程を
有し、該調節は、該少なくとも部分的に復号された近接終端および遠隔終端の信
号に、および少なくとも複数の該一連の第1のパラメータに応答して、該調節さ
れた第1のパラメータを発生させる過程を有する、請求項31記載の方法。
53. The first parameter comprises a series of first parameters received over time, the reading comprises reading the series of first parameters, and the adjusting comprises: 32. Generating the adjusted first parameter in response to at least partially decoded near and far end signals and in response to at least a plurality of the series of first parameters. The method described.
【請求項54】 該圧縮のコードは、該デジタル信号のフレーム内に配置さ
れ、該フレームは、複数のサブフレームであって各々が該第1のパラメータを有
するものを有し、該読取りは、該圧縮のコードに応答して該複数のサブフレーム
の各々から少なくとも該第1のパラメータを読取る過程を有し、該置換は、該第
1のパラメータを該複数のサブフレームの各々における該調節された第1のパラ
メータで置換する過程を有する、請求項31記載の方法。
54. The compression code is located within a frame of the digital signal, the frame having a plurality of subframes, each having the first parameter, and the reading: Responsive to the code of compression, reading at least the first parameter from each of the plurality of subframes, the permutation comprising adjusting the first parameter to the adjusted parameter in each of the plurality of subframes. 32. The method of claim 31, comprising replacing with the first parameter.
【請求項55】 該読取りは、該第1のパラメータを該サブフレームの第1
のものから読取る過程を有し、該実行は、該第1のサブフレームの期間に該近接
終端のデジタル信号について少なくとも複数の該復号の段階を実行することを開
始する過程を有し、該置換は、より小なる遅延を実現するよう第1のサブフレー
ムに後続する1つのサブフレームを処理する前に該第1のパラメータを該調節さ
れた第1のパラメータで置換する過程を有する、請求項53記載の方法。
55. The reading uses the first parameter of the first of the subframes.
The step of reading from the one of the subframes, the executing step comprising initiating performing at least a plurality of the decoding steps on the digital signal of the near termination during the first subframe, Comprising replacing the first parameter with the adjusted first parameter before processing a subframe subsequent to the first subframe to achieve a smaller delay. 53. The method according to 53.
【請求項56】 該圧縮のコードは、該デジタル信号のフレーム内に配置さ
れ、該フレームは複数のサブフレームを有しこのサブフレームの各々は該第1の
パラメータを有し、該実行は該サブフレームの第1のものの期間に少なくとも複
数の該復号の段階を実行し、該少なくとも部分的に復号された近接終端および遠
隔終端の信号を発生させる過程を有し、該読取りは、該第1のパラメータを該第
1のサブフレームに後続して出現する該サブフレームの第2のものから読取る過
程を有し、該調節は、該少なくとも部分的に復号された近接終端および遠隔終端
の信号および該第1のパラメータに応答して、該調節された第1のパラメータを
発生させる過程を有し、該置換は、該第2のサブフレームの該第1のパラメータ
を該調節された第1のパラメータで置換する過程を有する、請求項31記載の方
法。
56. The compression code is located within a frame of the digital signal, the frame having a plurality of subframes, each of the subframes having the first parameter, and the execution being the Performing at least a plurality of said decoding steps during a first one of the subframes to generate said at least partially decoded near-end and remote-end signals, said reading said first Parameter of the at least partially decoded near-end and remote-end signal and the at least partially decoded near-end and remote-end signals and Responsive to the first parameter, generating the adjusted first parameter, the permutation replacing the first parameter of the second subframe with the adjusted first parameter. Para 32. The method of claim 31, comprising the step of replacing with a meter.
【請求項57】 コードのサンプルを有する近接終端のデジタルの信号を送
信するシステムであって、該コードのサンプルは圧縮のコードを使用する第1の
ビットおよび線形のコードを使用する第2のビットを有し、該コードのサンプル
はオーディオの信号を表わし該オーディオの信号は複数のオーディオの特徴を有
し、該システムはまた遠隔終端のデジタルの信号を送信するもの、における、該
圧縮のコードを復号することなく該近接端のデジタルの信号におけるエコーを減
少させる方法であって、該方法は、 該近接終端のデジタルの信号および該遠隔終端のデジタル信号に応答して該第
1のビットおよび該第2のビットを調節する段階、 を具備する、エコーを減少させる方法。
57. A system for transmitting a near-terminated digital signal having code samples, the code samples being a first bit using a compression code and a second bit using a linear code. The sample of the code represents an audio signal, the audio signal having a plurality of audio features, the system also transmitting a remotely terminated digital signal, the compression code being A method of reducing echo in the near end digital signal without decoding, the method comprising: responsive to the near end digital signal and the remote end digital signal; Adjusting the second bit, the method comprising: reducing echoes.
【請求項58】 該線形のコードは、パルスコード変調の(PCM)コード
を有する、請求項56記載の方法。
58. The method of claim 56, wherein the linear code comprises a pulse code modulated (PCM) code.
【請求項59】 該圧縮のコードのサンプルは、移動可能の通信の標準用の
グローバルのシステムのタンデムフリーの作動に一致している、請求項56記載
の方法。
59. The method of claim 56, wherein the compression code sample is consistent with tandem-free operation of Global Systems for Mobile Communications Standards.
【請求項60】 該第1のビットは該サンプルの2つの最下位桁のビットを
有し、該第2のビットは該サンプルの6つの最上位桁のビットを有する、請求項
56記載の方法。
60. The method of claim 56, wherein the first bit comprises the two least significant bits of the sample and the second bit comprises the six most significant bits of the sample. .
【請求項61】 該6つの最上位桁のビットはPCMコードを有する、請求
項59記載の方法。
61. The method of claim 59, wherein the six most significant bits comprise a PCM code.
JP2001508063A 1999-07-02 2000-06-30 Controlling echo in the encoded domain Pending JP2003533902A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14213699P 1999-07-02 1999-07-02
US60/142,136 1999-07-02
PCT/US2000/018104 WO2001003316A1 (en) 1999-07-02 2000-06-30 Coded domain echo control

Publications (2)

Publication Number Publication Date
JP2003533902A true JP2003533902A (en) 2003-11-11
JP2003533902A5 JP2003533902A5 (en) 2004-12-24

Family

ID=22498680

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2001508064A Pending JP2003503760A (en) 1999-07-02 2000-06-30 Adaptive Code Domain Level Control for Compressed Speech
JP2001508667A Pending JP2003504669A (en) 1999-07-02 2000-06-30 Coding domain noise control
JP2001508063A Pending JP2003533902A (en) 1999-07-02 2000-06-30 Controlling echo in the encoded domain

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2001508064A Pending JP2003503760A (en) 1999-07-02 2000-06-30 Adaptive Code Domain Level Control for Compressed Speech
JP2001508667A Pending JP2003504669A (en) 1999-07-02 2000-06-30 Coding domain noise control

Country Status (5)

Country Link
EP (3) EP1190495A1 (en)
JP (3) JP2003503760A (en)
AU (3) AU6067100A (en)
CA (3) CA2378012A1 (en)
WO (3) WO2001003317A1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009514331A (en) * 2005-10-31 2009-04-02 テレフオンアクチーボラゲット エル エム エリクソン(パブル) Reduction of digital filter delay
JP2010503325A (en) * 2006-09-19 2010-01-28 アルカテル−ルーセント ユーエスエー インコーポレーテッド Packet-based echo cancellation and suppression
JP2014060597A (en) * 2012-09-18 2014-04-03 Oki Electric Ind Co Ltd Echo route delay measurement device, method and program

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1301018A1 (en) * 2001-10-02 2003-04-09 Alcatel Apparatus and method for modifying a digital signal in the coded domain
JP3946074B2 (en) * 2002-04-05 2007-07-18 日本電信電話株式会社 Audio processing device
JP3876781B2 (en) 2002-07-16 2007-02-07 ソニー株式会社 Receiving apparatus and receiving method, recording medium, and program
EP1521242A1 (en) * 2003-10-01 2005-04-06 Siemens Aktiengesellschaft Speech coding method applying noise reduction by modifying the codebook gain
US7613607B2 (en) 2003-12-18 2009-11-03 Nokia Corporation Audio enhancement in coded domain
US8874437B2 (en) 2005-03-28 2014-10-28 Tellabs Operations, Inc. Method and apparatus for modifying an encoded signal for voice quality enhancement
JP4915575B2 (en) * 2007-05-28 2012-04-11 パナソニック株式会社 Audio transmission system
JP4915576B2 (en) * 2007-05-28 2012-04-11 パナソニック株式会社 Audio transmission system
JP4915577B2 (en) * 2007-05-28 2012-04-11 パナソニック株式会社 Audio transmission system
WO2009029076A1 (en) * 2007-08-31 2009-03-05 Tellabs Operations, Inc. Controlling echo in the coded domain
CN102726034B (en) 2011-07-25 2014-01-08 华为技术有限公司 A device and method for controlling echo in parameter domain
TWI469135B (en) * 2011-12-22 2015-01-11 Univ Kun Shan Adaptive differential pulse code modulation (adpcm) encoding and decoding method
JP6816277B2 (en) * 2017-07-03 2021-01-20 パイオニア株式会社 Signal processing equipment, control methods, programs and storage media

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61206330A (en) * 1985-03-08 1986-09-12 Matsushita Electric Ind Co Ltd Echo canceller
JPH0766758A (en) * 1993-08-30 1995-03-10 Nippon Telegr & Teleph Corp <Ntt> Sound encoding/decoding type echo canceler
WO1998027668A1 (en) * 1996-12-19 1998-06-25 Northern Telecom Limited Method and apparatus for computing measures of echo

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US5140543A (en) * 1989-04-18 1992-08-18 Victor Company Of Japan, Ltd. Apparatus for digitally processing audio signal
US5097507A (en) * 1989-12-22 1992-03-17 General Electric Company Fading bit error protection for digital cellular multi-pulse speech coder
US5680508A (en) * 1991-05-03 1997-10-21 Itt Corporation Enhancement of speech coding in background noise for low-rate speech coder
US5828995A (en) * 1995-02-28 1998-10-27 Motorola, Inc. Method and apparatus for intelligible fast forward and reverse playback of time-scale compressed voice messages
JPH0954600A (en) * 1995-08-14 1997-02-25 Toshiba Corp Voice-coding communication device
JPH0993132A (en) * 1995-09-27 1997-04-04 Toshiba Corp Device and method for coding decoding
JPH10143197A (en) * 1996-11-06 1998-05-29 Matsushita Electric Ind Co Ltd Reproducing device
JP3283200B2 (en) * 1996-12-19 2002-05-20 ケイディーディーアイ株式会社 Method and apparatus for converting coding rate of coded audio data
US6064693A (en) * 1997-02-28 2000-05-16 Data Race, Inc. System and method for handling underrun of compressed speech frames due to unsynchronized receive and transmit clock rates
JP3317181B2 (en) * 1997-03-25 2002-08-26 ヤマハ株式会社 Karaoke equipment
US6112177A (en) * 1997-11-07 2000-08-29 At&T Corp. Coarticulation method for audio-visual text-to-speech synthesis
EP2154679B1 (en) * 1997-12-24 2016-09-14 BlackBerry Limited Method and apparatus for speech coding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61206330A (en) * 1985-03-08 1986-09-12 Matsushita Electric Ind Co Ltd Echo canceller
JPH0766758A (en) * 1993-08-30 1995-03-10 Nippon Telegr & Teleph Corp <Ntt> Sound encoding/decoding type echo canceler
WO1998027668A1 (en) * 1996-12-19 1998-06-25 Northern Telecom Limited Method and apparatus for computing measures of echo

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009514331A (en) * 2005-10-31 2009-04-02 テレフオンアクチーボラゲット エル エム エリクソン(パブル) Reduction of digital filter delay
JP2010503325A (en) * 2006-09-19 2010-01-28 アルカテル−ルーセント ユーエスエー インコーポレーテッド Packet-based echo cancellation and suppression
JP2014060597A (en) * 2012-09-18 2014-04-03 Oki Electric Ind Co Ltd Echo route delay measurement device, method and program

Also Published As

Publication number Publication date
AU6067100A (en) 2001-01-22
CA2378035A1 (en) 2001-01-11
JP2003503760A (en) 2003-01-28
CA2378062A1 (en) 2001-01-11
WO2001003317A1 (en) 2001-01-11
EP1208413A2 (en) 2002-05-29
WO2001003316A1 (en) 2001-01-11
WO2001002929A3 (en) 2001-07-19
EP1190495A1 (en) 2002-03-27
AU6063600A (en) 2001-01-22
CA2378012A1 (en) 2001-01-11
EP1190494A1 (en) 2002-03-27
WO2001002929A2 (en) 2001-01-11
AU6203300A (en) 2001-01-22
JP2003504669A (en) 2003-02-04

Similar Documents

Publication Publication Date Title
JP3842821B2 (en) Method and apparatus for suppressing noise in a communication system
CA2332596C (en) Improved lost frame recovery techniques for parametric, lpc-based speech coding systems
AU763471B2 (en) A method and device for adaptive bandwidth pitch search in coding wideband signals
US20060116874A1 (en) Noise-dependent postfiltering
JP2003533902A (en) Controlling echo in the encoded domain
WO1997018647A9 (en) Method and apparatus for suppressing noise in a communication system
JP2004512561A (en) Error concealment for decoding coded audio signals
JPH09204199A (en) Method and device for efficient encoding of inactive speech
JP2003533902A5 (en)
JP2003501925A (en) Comfort noise generation method and apparatus using parametric noise model statistics
US20030065507A1 (en) Network unit and a method for modifying a digital signal in the coded domain
US6424942B1 (en) Methods and arrangements in a telecommunications system
KR20090129450A (en) Method and arrangement for smoothing of stationary background noise
EP1020848A2 (en) Method for transmitting auxiliary information in a vocoder stream
EP1112568B1 (en) Speech coding
US20050071154A1 (en) Method and apparatus for estimating noise in speech signals
Chandran et al. Compressed domain noise reduction and echo suppression for network speech enhancement
JP2004519736A (en) ADPCM speech coding system with phase smearing and phase desmearing filters
JP3163567B2 (en) Voice coded communication system and apparatus therefor
MXPA01002332A (en) Speech coding with background noise reproduction

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070702

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100608

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101102