JP2003503760A - 圧縮音声の符号領域適応レベル制御 - Google Patents

圧縮音声の符号領域適応レベル制御

Info

Publication number
JP2003503760A
JP2003503760A JP2001508064A JP2001508064A JP2003503760A JP 2003503760 A JP2003503760 A JP 2003503760A JP 2001508064 A JP2001508064 A JP 2001508064A JP 2001508064 A JP2001508064 A JP 2001508064A JP 2003503760 A JP2003503760 A JP 2003503760A
Authority
JP
Japan
Prior art keywords
parameter
adjusted
characteristic
code
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001508064A
Other languages
English (en)
Inventor
チャンドラン,ラビ
イー. デューン,ブルース
ジェイ. マーコック,ダニエル
Original Assignee
テラブス オペレーションズ,インコーポレイティド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テラブス オペレーションズ,インコーポレイティド filed Critical テラブス オペレーションズ,インコーポレイティド
Publication of JP2003503760A publication Critical patent/JP2003503760A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0014Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the source coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Quality & Reliability (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

(57)【要約】 通信システム(10)が、第一パラメータを含む所定の複数のパラメータからなる圧縮符号を使用してデジタル信号を伝送する。その複数のパラメータは、第一パラメータに関連する第一特性を含む複数の音声特性を具備する音声信号を表示する。当該圧縮符号は、第一特性に関連するパラメータを復号する第一復号ステップを含む複数の復号ステップによって復号可能である。端末(20)がデジタル信号を受信する。プロセッサ(40)が、圧縮符号に応答して、少なくとも第一パラメータを読み取り、その第一パラメータから導出される第一パラメータ値を少なくとも生成する。そのプロセッサは、少なくとも第一復号ステップを実行して、音声信号の第一特性に関連する被復号信号を生成する。そのプロセッサは、また、第一特性の調整を表示する被調整第一パラメータ値を生成し、圧縮符号中に書き込まれる被調整第一パラメータを導出する。他の端末(22)がその被調整圧縮符号を伝送する。結果として、第一特性を調整するのに要する遅延が減少せしめられる。

Description

【発明の詳細な説明】
【0001】 (関連出願の相互参照) 本出願は、1999年7月2日に出願された「圧縮音声の符号領域強調」と題
された仮出願第60/142,136号に対応する実際の出願である。
【0002】 (従来技術) 本発明は、圧縮音声の符号領域強調に関し、特に符号領域適応レベル制御およ
び符号領域中のノイズ削減に関する。
【0003】 符号化音声のネットワーク強調は通常、処理信号の復号化、線形処理および再
符号化を必要とする。このような方法が図1に示されており、この方法は非常に
費用を要する方法である。更に、符号化処理は往々にして、音声強調方法よりも
一桁計算機的に集約したものである。
【0004】 音声圧縮は、遠距離通信、特にセル方式電話通信およびパケットネットワーク
上の音声においてますます使用されるようになっている。線形領域中で操作され
るこれまでのネットワーク音声強調技術は、幾つかの欠点を有している。例えば
、線形領域において動作するこれまでのネットワーク音声強調技術は、圧縮音声
の復号化を必要とし、これによって、必要な音声強調と再符号化を実行する。こ
の処理は計算機的に集約されたものであり、特に余計な量子ノイズを発生する傾
向があり、さらに余計な遅延をも生じる。
【0005】 最適な音声レベルを維持することは、公衆電話交換網(PSTN)において重
要な問題である。電話通信の顧客は、彼らの会話の理解を最大とするために快適
な視聴レベルを期待する。電話機から伝送された音声レベルは話し手の音量およ
びマイクに対する話し手の位置によって決まる。若し、電話機において音量制御
が可能であると、聞き手は音量を望ましいレベルまで手操作で調整する。しかし
ながら、歴史的な理由で、殆どの電話機は音量調節器を有していない。更に、聞
き手による直接の音量制御は、ネットワーク機器に対して適正なレベルを維持す
る必要性を指摘するものではない。更に、特に車両中の移動電話の場合において
、技術がハンドフリー電話機の方向に向かって進んでいるので、手操作による調
整は車両の運転者にとって面倒であり潜在的に危険でもある。
【0006】 音声品質を維持することは一般にネットワークサービスプロバイダの責任であ
り、電話機の製造者は通常、このような責任を追うことに対して比較的小さな役
割を演じてきた。伝統的にネットワークサービスプロバイダは、音声レベルに関
して機器とネットワークに対し厳格な仕様を提供して来た。しかしながら、国際
的な音声トラフィックの増加、規制緩和、激しい競争および顧客の大きな期待に
よって、ネットワークサービスプロバイダは、他のネットワークにおいて使用さ
れている仕様および機器に対して余り影響を与えることなく、適正な音声レベル
を確保する必要がある。
【0007】 例えばデジタルセル方式電話通信およびパケットネットワーク上の音声のよう
な、新しい技術およびプロトコルの広い導入によって、ネットワークにおける音
声レベルの制御は更に複雑化している。その主な理由の一つは、伝送経路上の音
声コーデック(符号器−復号器対)として知られる音声圧縮デバイスの存在であ
る。音声信号の自動レベル制御(ALC)は、音声コーデックが伝送経路上に存
在するとより困難になり、一方、線形領域中ではデジタル音声サンプルが直接処
理に対して適用可能である。
【0008】 図2は線形領域ALCデバイス202のネットワーク構成を示している。AL
Cデバイスは(ポートSinの)近端音声信号を処理する。(ポートRinの)
遠端信号はダブルトークを決定するために使用される。ALCデバイス202は
、一般的な伝送ネットワークにおいてデジタルの近端音声信号を処理し、さらに
現在の音声レベルを測定することによって、目的とする音声レベルを得るために
必要なゲインを決定する。適切なゲインを決定するために、多くのアルゴリズム
が考案されている。例えば、ALCデバイスは音声機能検出器を使用することが
可能で、さらに音声バーストの最初の段階でのみ新しいゲイン値を適用すること
ができる。更に、ゲインの最大値および最小値、さらにゲインの最大変化率を考
慮することもできる。一般に、ALCデバイスは、(1)現在の音声レベルを決
定するために近端信号上の出力測定用構成の何らかの形体を使用し、(2)音声
バーストの境界を決定する為に近端信号上で音声機能検出器を使用し、更に(3
)近端信号がエコーを含んでいるか否かを決定する為に近端および遠端信号上で
恐らくダブルトーク検出器を使用する。
【0009】 ALCデバイスは、現在の音声レベルを測定することによって目的の音声レベ
ルを得るために必要なゲインを決定する。デジタル化された各音声サンプルにゲ
インファクタが掛け合わされる。ダブルトーク情報は、エコーに基づいてゲイン
ファクタを間違って調整することを防ぐ為に使用される。レベル制御の為のTe
llabsアルゴリズム/製品は、ALC、スカルプチャードサウンド(SS)
および新TLC(Tellabsレベルコントロール)を含んでいる。これらの
アルゴリズムは、線形/PCM信号上で直接動作するため線形領域アルゴリズム
として分類される。
【0010】 近い将来、タンデムフリーオペレーション(TFO)標準が、移動通信に対す
るグローバルシステム(GSM)デジタルセル方式ネットワークにおいて展開さ
れるであろう。TFO標準は移動体から移動体への通話に適用される。TFOに
おいて、音声信号は、短い交渉期間の後で、移動体間で圧縮形状において伝達さ
れる。圧縮された音声はTFOフレーム中に含まれており、このフレームはネッ
トワークにおいてトランスコーダをバイパスする。これは、移動体から移動体へ
の通話の間のタンデム音声コーディックを排除する。このタンデムコーデックの
排除は、オリジナルの信号がきれいな場合に音声品質を向上するものとして知ら
れている。きれいな音声の場合であっても、音声レベルを適切な音量のレーザに
調整することが依然として希望される。このようなレベル制御のための従来の方
法は、音声の復号化、処理および再符号化を必要とし、その結果タンデム化を招
聘し、かつ計算機的に集約されたものとなる。符号領域アプローチはこのような
タンデム化を回避し、完全な再符号化の必要性を排除する。この明細書は、符号
領域における音声レベル制御の方法を説明する。特に、GSM FRおよびEF
R符号器に関連するレベル制御に注意が向けられている。
【0011】 (発明の簡単な要約) 好ましい実施例は、圧縮符号を使用するデジタル信号を伝送するための通信シ
ステムにおいて有用であり、この圧縮符号は第一のパラメータを含む予め決めら
れた複数のパラメータを含み、このパラメータは第一の特性を含む複数のオーデ
ィオ特性を備える1個のオーディオ信号を示し、前記第一のパラメータは前記第
一の特性に関係し、前記圧縮符号は前記第一の特性に関連したパラメータを復号
化するための第一の復号化ステップを含み、複数の復号化ステップによって復号
される。このような環境において、第一の特性は、デジタル信号に応答してすく
なくとも第一のパラメータを読み取ることによって調整され得る。少なくとも第
一のパラメータ値が第一のパラメータから導出される。第一の特性の調整を表す
調整された第一のパラメータ値は、デジタル信号と第一のパラメータ値に応答し
て生成される。調整された第一のパラメータは、調整された第一のパラメータ値
に応答して導出され、さらに圧縮符号の第一のパラメータは調整された第一のパ
ラメータによって置き換えられる。読み取り、導出、生成および置き換えのステ
ップは、プロセッサによって実行される。上述の技術の結果、第一の特性を調整
する為に必要な遅延が減少する。
【0012】 第二の好ましい実施例は、圧縮符号を用いた第一のビットと線形符号を用いた
第二のビットを含む符号サンプルを備えるデジタル信号を伝送するための通信シ
ステムにおいて有用である。符号サンプルは第一の特性を含む複数のオーディオ
特性を有するオーディオ信号を表す。このような環境において、第一の特性は、
圧縮符号を復号化することなく、第一のビットと第二のビットを第二のビットに
応答して調整することにより調整することができる。この調整は好ましくはプロ
セッサによって実行される。
【0013】 (実施例) 本発明を一個またはそれ以上の実施例について説明するが、本発明がこれらの
実施例に限定されるものでないことを理解すべきである。反対に、本発明は、添
付の請求の範囲の精神および範囲に含まれるものとして、全ての代替事例、修正
および等価事例を含む。
【0014】 以下の略語が好ましい実施例を理解する補助として提供される。
【表1】
【0015】 この明細書に対して、以下の文献を参照する。 [1]GSM06.10“Digital cellular telec
ommunication system(Phase 2);Full ra
te speech;Part 2:Transcoding”,1998年3
月 [2]GSM06.10“Digital cellular telec
ommunication system(Phase 2);Enhance
d Full rate(EFR) speech transcoding”
,1998年6月 [3]ITU−T Recommendation G.169 Draf
t 7,“Automatic Level Control Devices
”,1998年7月
【0016】 現代ネットワークにおいて、音声信号は伝送の前にデジタル的にサンプルされ
る。このようなデジタル(即ち、離散時間型計数値)信号はこの明細書において
、線形領域または線形モードであるとして言及される。このような線形領域信号
における音声レベルの調整は、所望の目標音声レベルを達成する為に、適当なゲ
インファクタを信号の各サンプルに掛け合わせることによって達成される。
【0017】 線形エコー即ち音響エコーは、ネットワークの終端路のタイプに依存して、近
端信号中に存在する。このようなエコーがかなりの出力を有し、かつエコーキャ
ンセラーによってキャンセルされていない場合、さらにダブルトーク検出器が必
要とされる。これは、ゲインが遠端音声信号のエコーによって不意に増加しない
ことを保証する。
【0018】 通常の電話機ネットワークにおいて搬送されるデジタル音声信号は、普通、伝
送の前に例えばパルス符号変調(PCM)のような基本形態の圧縮を受ける。こ
のような圧縮構成は計算処理および遅延に関して非常に安価である。圧縮された
デジタルサンプルを線形領域に変換すること、線形サンプルを処理すること、お
よびその後処理されたサンプルを伝送の前に圧縮することは、ALCデバイスに
とって比較的簡単な事柄である。これ自体、これらの信号は線形領域中に存在す
ると見なすことが効果的である。本出願の文脈において、圧縮または符号化され
た音声とは、計算機上のかなりの複雑さを必要とする進んだ圧縮技術を使用して
圧縮された音声を示す。
【0019】 この明細書および請求の範囲において、線形符号および圧縮符号と言う用語は
以下のものを意味する。 線形符号:線形符号によって、オーディオ信号の各サンプルに対して1個の
符号化されたパラメータまたは符号化されたサンプルを生じる圧縮技術を意味す
る。線形符号の例としては、PCM(A−lawおよびμ−law)ADPCM
(適応型差分パルス符号変調)およびデルタ変調がある。 圧縮符号:圧縮符号によって、オーディオ信号の各サンプルに対して1個以
下の符号化されたパラメータを結果として生じる技術を意味する。普通、圧縮符
号は、オーディオ信号サンプルの各ブロックまたはフレームに対して符号化され
たパラメータの小さなセットを結果として生じる。圧縮符号の例として、GSM
ボコーダ(HR,FR,EFR)のような線形予測符号化ベースのボコーダがあ
る。
【0020】 非可逆性ソース符号化のカテゴリーに入る音声圧縮は、一般に、音声符号化と
して言及される。音声符号化は、音声伝送のために必要な帯域幅を最小化するた
めに実行される。これは特に、帯域幅が乏しいリソースである無線電話機におい
て重要である。比較的帯域幅が豊富なパケットネットワークであっても、音声符
号化は、ネットワーク遅延とジッタを最小化するために重要である。これは、デ
ータとは異なって、音声通信は遅延に対する許容度が小さいからである。パケッ
トサイズが小さいほど、パケットネットワークを通した伝送を容易にする。幾つ
かの産業標準の音声コーディック(符号器−復号器対)を参考のために表1に列
挙する。
【0021】
【表2】
【0022】 音声の符号化において連続したデジタル音声サンプルのセットを音声フレーム
と言及する。音声フレームが与えられると、音声符号器は、音声合成モデルのた
めのパラメータの小セットを決定する。これらの音声パラメータおよび音声合成
モデルによって、オリジナルの音声フレームに非常に似て見えかつ似て響く音声
フレームが再構成される。この再構成は音声復号器によって実行される。殆どの
音声符号器において、符号化のプロセスは復号化のプロセスよりもかなり計算機
的に集約されたものであることに注意する必要がある。さらに、優れた品質の音
声符号化を達成するために必要なMIPは非常に高価である。デジタル信号処理
チップセットの処理能力は、近年に於いて、セルラー方式の電話ハンドセットの
ような応用において、音声符号の幅広い使用を可能とするに十分な程、進歩して
いる。
【0023】 音声符号器によって決定される音声パラメータは使用した音声合成モデルに依
存している。例えば、表1の符号器は線形予測符号化(LPC)モデルを使用す
る。LPC音声合成モデルの簡略化したブロック図を図3に示す。このモデルは
、モデルパラメータを適正に特定することによって、音声に似た信号を生成する
ために使用することができる。この音声合成例において、パラメータは、時間変
化フィルタ係数、ピッチ間隔、励起ベクトルおよびゲインファクタを含む。基本
的に、励起ベクトル、c(n)、はゲインファクタ、G、によってまず拡大縮小
される。その結果は、次にピッチ合成フィルタによってフィルタされる。ピッチ
合成フィルタのパラメータは、全励起ベクトル、u(n)、を獲得する為に、ピ
ッチゲイン、gp、およびピッチ期間、T、を含む。このベクトルはその後、L
PC合成フィルタによってフィルタされる。多重バンド励起モデルのような他の
モデルを同様に音声符号化において使用する。この文意において、音声パラメー
タは推定されたモデルと共に、圧縮を達成するためにデジタル音声信号中の冗長
度を取り除く手段を提供することに十分注意する必要がある。
【0024】 図3に示す様に、全体のDCゲインはGによって提供され、ALCは主にGを
変更することを含んでいる。
【0025】 通常の音声符号器によって各フレームにおいて生成される音声パラメータの内
の幾つかのパラメータは、そのフレームに対する音声信号のスペクトルおよび/
または波形に関係している。これらのパラメータは、LPC音声合成モデルの場
合、通常、LPC係数およびピッチ情報を含んでいる。スペクトル情報を提供す
るこれらのパラメータに加えて、音声フレームの出力またはエネルギに直接関係
するパラメータが、通常、存在する。これらの音声レベル関連パラメータ(SL
RP)は、符号化された音声のALCを実行する為のキイである。以下に、この
ようなSLRPの幾つかの例を示す。
【0026】 表1における最初の3個のコーディックについて以下に論議する。最初の3個
のコーディックは、全て、8kHzでサンプルされた音声を処理し、かつこのサ
ンプルが13ビット線形PCM値として獲得されたものであることを仮定してい
る。フレーム長は160サンプル(20ms)である。更に、それらは各フレー
ムを、それぞれが40サンプルの4個のサブフレームに分割する。これらのコー
ディックに対するSLRPを表2にリストする。
【0027】
【表3】
【0028】 符号器によって、SLRPは各サブフレームにおいて(例えば、GSM FR
およびEFR符号器)あるいはフレームに付き一回(例えばGSM HRコーデ
ィック)特定される。
【0029】 この明細書全体にわたって、上部にカラット記号を有する変数と同じ変数でカ
ラット記号を有さない変数は、量子化されていない値と量子化された値を示すも
のとして使用される。例えば、γgcおよび、
【数1】 は、GSM EFR標準中の量子化されていないゲイン補正ファクタと量子化
されたゲイン補正ファクタである。ALCデバイスにおいては、量子化されたS
LRP、
【数2】 のみが提供されることに注意すべきである。
【0030】 量子化パラメータおよび対応する非量子化パラメータは、量子化関数Q(.)
、即ち
【数3】 を介して関係している。我々はこの命名法をこの変換のみならず、文脈に応じ
て、ルックアップテーブルまたは式を使用して量子化された値のインデックスを
決定することを含めて、幾分自由に使用している。
【0031】 量子化関数は多数から1個への変換であって、反転可能なものではない。しか
しながら、我々は、適正なルックアップテーブルまたは式を用いて与えられたイ
ンデックスを対応する量子化値に変換することを示すために、‘逆’量子化関数
、Q-1(.)を使用する。
【0032】 図4に移ると、この図は線形領域から符号化された領域を区別する。線形領域
では、デジタル音声サンプルは処理のために直接用いられる。符号領域は音声符
号器の出力または音声復号器の入力を参照する。これらはチャンネルエラーが無
い場合、同一であるはずである。この文脈において、符号領域は音声パラメータ
とこれらのパラメータを量子化または逆量子化するたに用いられる、両方法を含
む。符号器によって決定される音声パラメータは伝送に先立って量子化プロセス
を経る。この量子化は、オリジナルのデジタル音声信号によって必要とされるも
のよりも低いビットレートを達成するために重要である。量子化プロセスは往々
にしてルックアップテーブルの使用を含んでいる。更に、異なる音声パラメータ
を異なる技術を用いて量子化することができる。
【0033】 符号領域において音声を処理することは、直接量子化された音声パラメータを
、各パラメータに対して量子化器によって許された量子化値の異なるセットに修
正することを含む。ALCの場合、修正されるパラメータはSLRPである。図
2の線形領域ALC構成に対する対応する符号領域が、図5に示される。図示す
る2方向の伝送に使用されるコーディックは同じ物でなくてよいことに注意すべ
きである。更に、使用されたコーディックは時間の変化と共に変化する。従って
符号領域ALCアルゴリズムは、このような変化する状況で安定して動作するこ
とが好ましい。
【0034】 単一の音声パラメータの量子化はスカラー量子化と呼ばれる。パラメータセッ
トが共に量子化される場合、このプロセスはベクトル量子化と呼ばれる。ベクト
ル量子化は通常、LPC係数のユニットに何らかの方法で互いに関連しているパ
ラメータセットに適用される。スカラー量子化は一般に、他のパラメータに対し
て比較的独立したパラメータに適用される。両者の量子化方法の混合が可能であ
る。SLRPが普通スカラー量子化であるため、最も一般的に使用されるスカラ
ー量子化技術に着目する。
【0035】 パラメータが即時に量子化される場合、この量子化プロセスはそのパラメータ
の過去及び将来の値から独立している。パラメータの現在値のみが量子化プロセ
スで使用される。量子化されるべきパラメータは、許された量子化レベルのセッ
トと比較される。あるきわどい値に基づいて与えられたパラメータに最も一致す
る量子化レベルが、そのパラメータを表すために選択される。普通、許された量
子化レベルは符号器および復号器の両者におけるルックアップテーブル内に格納
される。選択された量子化レベルのテーブルへのインデックスは符号器によって
復号器に送信される。代替的に、インデックスを与えると、量子化レベルは数式
を用いて決定することができる。量子化レベルは、SLRPの場合、普通均一で
はない間隔を有している。例えば、[0,32767]の範囲を有するGSM
FRコーディックにおけるブロック最大値、xmax、は、図6に示す様に64レ
ベルに量子化される。この量子化構成において、xmaxに最も近いがこれ以上で
あるレベルが選択される。量子化レベルを表す垂直軸は対数スケールでプロット
されていることに注意する必要がある。
【0036】 即時の量子化構成は、固定されたダイナミックレンジを使用することに基づく
大きな量子化エラーを蒙る。従って、適応型量子化器が音声符号化において、大
きな計算複雑性のコストにおいて量子化エラーを最小とするために、往々にして
使用される。適用型量子化器は前方適応または後方適用を使用する。前方適用構
成において、ダイナミックレンジに関する特別の副情報は、量子化テーブルイン
デックスに加えて復号器に周期的に送信され無ければならない。この結果、この
ような構成は普通、音声符号器において使用されない。如何なる副情報を伝送す
ることも必要が無いので、後方適応型量子化器が好ましい。一般に、2個の普遍
的なタイプの後方適応型量子化器が使用される。これらは、標準偏差ベースおよ
び作動量子化器である。これらを図7に示す。
【0037】 図7(a)の標準偏差ベースの量子化器構成において、以前のパラメータ値の
標準偏差が現在のパラメータ値γ(n)に対する正規化ファクタを決定する為に
使用される。正規化ファクタはγ(n)を量子化に先立って分割する。この正規
化手順は量子化関数Q(.)が単位変数に対して設計されることを可能とする。
正規化されかつ量子化された値、
【数4】 のルックアップテーブルインデックスが量子化器に送信され、ここで反転プロ
セスが実行される。正規化および反正規化プロセスが両立する為には、正規化フ
ァクタの量子化形状が、量子化器および反量子化器の両者において使用される。
この構造の変形において、量子化間隔の拡張または圧縮の決定は、単純に以前の
パラメータ入力のみに基づいている。
【0038】 図7(b)の後方適応型差分量子化構造において、現在及び過去のパラメータ
値間の相関関係が、有効に使用される。相関関係が高い場合、量子化ダイナミッ
クレンジにおける相当の削減が、予測エラー、r(n)を量子化することによって
達成される。予測エラーは、実際のパラメータ値と予測パラメータ値の間の差で
ある。同じ予測子γ(n)が量子化器および反量子化器の両者に対して使用される
べきである。以下の式で示される線形予測子P(z)が通常使用される。
【0039】
【数5】
【0040】 線形予測子P(z)が使用される場合、差分量子化構成は図7のように表せるこ
とが明白である。変換関数P(z)/[1−P(z)]を線形予測子、
【数6】 によって近似すると、簡単な方法が達成される。この簡単な差分技術は、ゲイン
相関ファクタ、γgc、関数の量子化のために、GSMEFRコーディックによっ
て使用される。このコーディックにおいて、固定係数[b1,b2,b3,b4
]=[0.68,0,58,0.34,0.19]を有する4次の線形予測子が
、符号器および復号器の両者において使用される。
【0041】 EFRコーディックにおいて、gc(n)は、サブフレームnにおいて励起ベクト
ルを評価する為に使用される。このゲインファクタは全体の信号レベルを決定す
る。このパラメータの量子化は図8に示す構成を利用しているが、その利用は間
接的である。実際の送信される‘ゲイン’パラメータは、事実上gc(n)と予測さ
れたゲインgc’(n)の間の相関ファクタである。
【数7】 によって定義される相関ファクタγgc(n)は、これが符号領域において直接ア
クセス可能な全体の音声レベルに関連する唯一のパラメータであるため、実際の
SLRPと見なされる。
【0042】 符号器において、現在のサブフレームに対する最適のgc(n)が決定されると、
これはγgc(n)を得るために予測ゲインによって除算される。予測ゲインは、
【数8】 によって与えられる。
【0043】
【数9】 を得るために、γgc(n)に32レベルの均一ではない量子化を実行する。対応
するルックアップテーブルインデックスが復号器に送信される。式(3)におい
て、
【数10】 は定数であり、E1(n)はサブフレーム励起ベクトルのみを示し、更に
【数11】 は以前に量子化された相関ファクタのみに依存する。その結果、一旦現在の励
起ベクトルが得られると、符号器が式(3)を用いたのと同じ方法で、復号器は
予測ゲインを得ることができる。相関ファクタ
【数12】 を受信すると、量子化ゲインファクタは、式(2)における定義を用いて、
【数13】 として計算される。
【0044】 SLRP、γgcの量子化が図9に示される。この図において、R(n)は、
【数14】 で与えられる予測エラーを示す。
【0045】 符号器から復号器に送信される実際の情報は、量子化R(n)パラメータ
【数15】 のルックアップテーブルインデックスを示すビットである。この詳細は単純化
のために図9においては省略されている。好ましいALC技術はチャンネルエラ
ーレートに影響しないので、送信及び受信パラメータは同じ物であると仮定して
いる。検出されていないかまたは相関しないエラーはALCが実行されるか否か
にかかわらずノイズの多い復号音声を生じる結果となるので、この仮定は有効で
ある。
【0046】 符号器におけるSLRPの量子化は、各サブフレームの平均除去励起ベクトル
エネルギを用いて間接的に実行される。E(n)は、サブフレームnにおける平均
除去励起ベクトルエネルギを(dBで)意味し、
【数16】 によって与えられる。
【0047】 ここで、N=40はサブフレーム長であり、
【数17】 は定数である。式(5)の2行目の中間の項は、平均励起ベクトルエネルギ、
1(n)、即ち
【数18】 である。
【0048】 励起ベクトル{c(i)}は、SLRPの決定に先立って復号器において復号さ
れる。励起ベクトルの復号は、SLRPの復号に関係しないことに注意すべきで
ある。E(n)が、ゲインファクタgcの関数であることがわかる。γgc(n)の
【数19】 への量子化は、間接的にgc
【数20】 とする量子化を引き起こす。この量子化ゲインファクタは励起ベクトルを評価
するために使用され、それによって復号器において合成される信号の全体のレベ
ルを設定する。
【数21】 は予測エネルギであって、
【数22】 によって与えられる。
【0049】 ゲインファクタ gcを復号化するための好ましい方法について次に述べる。第
一に、復号器は励起ベクトルを復号し、E1(n)を式(6)を用いて計算する。第
二に、予測エネルギを、式(7)を用いて以前に復号化されたゲイン相関ファク
タを用いて計算する。次に、予測ゲインg'(c)が式(3)を用いて計算される。
次に、現在のサブフレームに関して相関ファクタの受信されたインデックスを、
ルックアップテーブルから、
【数23】 を得るために使用する。最後に、量子化ゲインファクタを、
【数24】 として得る。
【数25】 に対する32量子化レベルを図10に示す。量子化レベルを示す図10の縦軸
は対数スケールでプロットされていることに注意すべきである。
【0050】 使用した特定のコーディックに拘わり無く、符号化領域中でALCを実行する
ために幾つかのアプローチが工夫されている。図5は符号化音声上で動作するA
LCデバイスの好ましい位置を示している。この図を参照して、ALCデバイス
の可能な実施方法について以下に議論する。
【0051】 ALCを実行する為の最も直接的な方法を図11に示す。符号化音声は線形量
子化に向かって復号され、ALCは通常の方法で線形量子化信号上で実行される
。その後線形音声は再符号化される。上述したように、このような技術は、MI
P、処理およびバッファ遅延に関して非常に費用がかかる。符号化プロセスは普
通復号プロセスよりも一桁よけいに費用がかかることに注意する必要がある。符
号化プロセスは、復号信号中に観測されうる量子化ノイズを付加する。このアプ
ローチでは、2個の符号器−復号器対がタンデムに配置されているが、量子化ノ
イズはほぼ2倍となる(ALCデバイスゲインが1の場合)。これによって、音
声品質に望ましくない劣化が生じる。
【0052】 SLRPが音声レベルを決定するので、SLRPを修正するだけのALC技術
を工夫することは非常に有益である。これによって、レベル修正音声信号の全再
符号化に関する計算の複雑性および品質劣化を回避することができる。SLRP
のみを修正する新規な符号領域ALCアプローチを、図12に示す。ALCアル
ゴリズムの詳細は使用した特定のコーディックによることに注意すべきである。
しかしながら、此処で説明したアプローチは一般に全てのコーディックに適用可
能である。
【0053】 このアプローチにおいて、量子化SLRPは符号領域信号(即ち圧縮符号信号
)から復号(即ち、読み出し)され、ALCアルゴリズムによって決定されるゲ
インファクタが乗算(即ち、調節)される。(この乗算の後、SLRPは調整済
みSLRP値とみなされる。)その結果は、次に再量子化される(即ち、調整済
みSLRPを形成する)。符号領域信号は、SLRPにおける変化を反映するよ
うに適正に修正される。(例えば、調整済みSLRPはオリジナルのSLRPに
対して置き換えられる。)例えば、符号領域信号上に使用されるエラー保護の全
形態は適正に回復されねばならない。ALCデバイスは、SLRPに適用される
べきゲインを決定する為に、音声レベル、音声活動およびダブルトーク活動の測
定を必要とする。このことは、符号領域信号をある程度復号することを必要とす
る。
【0054】 殆どのコーディックに対してALCを実行する為に、符号音声の部分的な復号
が必要である。十分に正確な音声レベル、音声活動およびダブルトーク測定を得
るために重要なその他のパラメータと同様に、SLRPを抽出(即ち、読み出す
)するために必要な程度に、音声が復号化される。部分的復号で十分な場合、次
のような状況を一例として含む。
【0055】 1)CELP復号器において、LPCベースモデルを使用して復号化した信
号上で、ポストフィルタリングプロセス(即ち復号化ステップ)を実行する。こ
のポストフィルタリングは量子化ノイズを削減する助けとなるが、しかし信号の
出力レベル全体を変更するものではない。従って、CELP符号音声の部分的復
号化において、ポストフィルタリングプロセス(即ち、復号化ステップ)は経済
上の理由で回避される。
【0056】 2)何らかの形の無音声抑制構成がセルラー方式電話およびパケットネット
ワーク上の音声においてしばしば使用される。これらの構成においては、符号化
音声フレームは音声活動中にのみ送信され、無音声の間は非常に少しの送信が実
行される。他端からのバックグランドノイズを擬似するために、復号器は自動的
に、無音声器官においてある程度の心地よいノイズを挿入する。GSMセルラー
ネットワークにおいて使用されているこのような構成の一例は、不連続送信(D
TX)と呼ばれる。無音声抑制を示す側面情報をモニタすることによって、AL
Cデバイス中の復号器は、無音声の間において信号を復号化することを完全に回
避することができる。このような場合、音声およびダブルトーク活動は、ALC
デバイスにおいて単純化されうる。
【0057】 3)GSMネットワークにおける音声コーデックに対して提案されたタンデ
ムフリーオペレーション(TFO)標準において、各チャンネルに対する符号音
声ビットは、64kbit/秒の基地局間の有線ネットワークを介して搬送される。
このビットストリームは8ビットのサンプルに分割される。各サンプルの最下位
2ビットは符号音声ビットを含み、上位6ビットは適正なPCMサンプルに対応
するビットを含んでいる。PCM情報を線形音声に変換することは、非常に安価
であり、線形音声信号に幾分のノイズを与える。線形領域ALCアルゴリズムに
おいて普通になされているように、必要な音声活動、ダブルトークおよび音声レ
ベル測定を実施する為に、このノイズを含んだ線形領域音声信号を使用すること
が可能である。従って、この場合、符号領域音声パラメータの最小量のみの復号
化が必要である。SLRPおよびSLRPの再量子化に必要なその他の全てのパ
ラメータを復号する必要がある。その他のパラメータは、SLRPの再量子化に
必要な程度にのみ符号化される。これは、後段の部分で示す例から明らかである
【0058】 以上のようにして、部分的な復号および再符号化のみを実行するALCデバイ
スを実現することが可能であり、それによって複雑性を最小としかつ量子化ノイ
ズを減少させることができる。しかしながら、図12に示すALCアプローチは
完全に最適ではなく、改善が必要である。この非最適性は、ゲイン決定のプロセ
スがSLRP再量子化に関係がないと言う、暗黙の仮定に基づいている。一般に
、この仮定は有効でないこともある。
【0059】 図12の方法の非最適性に対して3個の主要な理由がある。それらを以下にリ
ストする。第一に、再量子化は、通常希望の値とは異なる現実のSLRPを結果
として生じることに注意すべきである。従って、ゲイン決定ブロックによって適
用される所望のゲインは、信号が復号された場合に実現されるゲインとは異なっ
ている。復号化する場合、音声信号がそれぞれ過剰に増幅されあるいは過剰に抑
制されるため、この相違に基づいてオーバーフローまたはアンダーフローの問題
が生じる。第二に、現在および将来の所望のゲイン値を決定する為に、ALCア
ルゴリズムのあるものは過去の所望のゲイン値を利用することができる。この所
望のゲイン値は、実際の実ゲイン値を反映しないので、このようなアルゴリズム
は、図12に示すように適用された場合、誤って実行される。第三に、再量子化
プロセスは時に、SLRPにおいて望ましくない残響を結果として生じる。これ
は音声レベルを故意ではなく変更し、結果として歪んだ音声信号を生じる。この
ようなSLRP残響は、差分量子化のようなフィードバック量子化構成において
遭遇する。
【0060】 次に図13に進むと、オーバーフロー/アンダーフロー問題を克服する為に、
図13の反復構成をゲイン決定ブロック内に組み込むことができる。基本的に、
所望のゲイン値を決定した後、SLRPの再量子化の後で実ゲイン値が計算され
る。実ゲインは、オーバーフロー/アンダーフロー問題が発生しているか否かを
見る為にチェックされる。これは、例えば、オリジナルの音声レベルを実ゲイン
に掛け合わせることによって、新音声レベルが何であるかを決定することにより
達成することができる。あるいは、オーバーフロー/アンダーフローが実際に起
こっているか否かを見る為にALCデバイスにおいて音声復号器を使用すること
もできる。どちらの方法でも、実ゲイン値が高すぎるかあるいは低すぎるとみな
されると、新しいSLRPをそれぞれ、オーバーフロー/アンダーフローの危険
性がもはや存在しないとみなされるまで、減少しあるいは増加する。
【0061】 過去の所望のゲイン値が現在および将来のゲイン値を決定する為にアルゴリズ
ム中にフィードバックされるALCアルゴリズムにおいて、以下の修正がなされ
る。基本的に、フィードバックされるゲインは、SLRP再量子化プロセスの後
の実ゲインであって所望のゲインでは無い。図14に好ましいアプローチが示さ
れている。もし、所望のゲインがフィードバックループにおいて実ゲインの代わ
りに使用されると、制御装置は実際の復号音声信号レベルを追跡せず、その結果
誤ったレベルの制御が実行される。
【0062】 図13のオーバーフロー/アンダーフロー防止の反復構成は、図14のゲイン
決定ブロックに同様に組み込むことができる。
【0063】 最後に、フィードバックベースの量子化構成においてSLRP残響を回避する
為の方法を以下に詳細に説明する。一般に、これらの方法はゲイン決定とSLR
P再量子化技術の統合を含んでいる。
【0064】 従って、復号中のオーバーフロー/アンダーフロー問題を防止し、フィードバ
ックベースのALCシステムによる適正なトラッキングを保証し、さらにフィー
ドバック量子化構成によってもたらされる発振効果を回避する為に、ゲイン決定
ブロックとSLRP再量子化ブロックの共通の設計と実施が好ましい。図15は
、共通ゲイン決定およびSLRP再量子化を使用するALCデバイスの一般的構
造を示している。その詳細は、特定のALCデバイスに依存する。
【0065】 SLRPの再量子化の技術を以下に説明する。殆どの音声符号器において、S
LRPの量子化は、上記で説明した、即時のスカラー量子化または差分スカラー
量子化のいずれかを用いて実行される。これらの特別なケースに対するSLRP
の再量子化について説明するが、このアプローチはその他の量子化構成に対して
容易に拡張することができることに注意すべきである。図15のALCデバイス
構造におけるゲインとSLRP再量子化の共通決定は、ここに記載した再量子化
技術を利用することができる。
【0066】 量子化LRPのオリジナル値は、
【数26】 として示され、ここにnはフレームまたはサブフレームインデックスである。
m量子化テーブル値のセットは、
【数27】 で示される。音声符号器に依存して、これらの値は、その代わりに数式を用い
て定義される。ALCデバイスによって決定された所望ゲインは、g(n)で示され
る。SLRP再量子化の後の実ゲインは、
【数28】 で示される。即時のスカラー再量子化において、目標は、g(n)と、
【数29】 間の相違を最小化することである。基本的なアプローチは、量子化テーブルイ
ンデックスkを、
【数30】 として選択することを含んでいる。
【0067】 再量子化SLRPは、その結果、
【数31】 によって与えられる。
【0068】 オーバーフローおよびアンダーフローの防止を希望する場合は、図13に記載
する反復構成を使用することができる。オーバーフロー/アンダーフローの防止
に対する別のアプローチでは、再量子化SLRPを用いた音声サンプルの部分的
復号が、必要な程度にわたって実行される。これは、勿論、アルゴリズムにおい
てさらなる複雑性をもたらす。復号されたサンプルは、次に、オーバーフローま
たはアンダーフローが発生していないことを確かめるために、直接調査される。
【0069】 所定の受信
【数32】 に対して、m個の可能な実ゲイン値が存在することに注意すべきである。各量
子化テーブル値に対して、全ての実ゲインは予め計算され更に記憶される。これ
は、m2の実ゲイン値の格納を必要とし、mが通常は2の小さい数の累乗である
ため実現性がある。例えばGSM EFRコーディックではm=32であり、G
SM FRコーディックではm=64である。
【0070】 SLRP量子化テーブル値が(線形または対数的に)均一間隔である場合、ス
カラー量子化プロセスを単純化することができる。この単純化は、ALCデバイ
スにおいて所望のゲイン値の、別個のセットのみを許すことによって達成される
。これらの所望のゲイン値は、SLRP量子化値と同じ間隔を有していることが
好ましい。この場合、0dBもゲインの一個である。この結果、各テーブル値に対
して式(8)を評価する必要が無いように、所望のおよび実ゲイン値が常に整列
していることが保証される。これによって、再量子化が非常に簡略化される。S
LRP量子化テーブル間隔によって分割された所望のゲイン値に対応する値だけ
、SLRPのオリジナル量子化インデックスが単純に増加しあるいは減少する。
例えば、SLRP量子化テーブル間隔がΔで示されるものと仮定する。この場合
、SLRP量子化テーブル値が線形に均一間隔であると、許される所望ゲイン値
の個別セットは、1+{...、−2Δ、−Δ、0、Δ、2Δ、...}であり、SL
RP量子化テーブル値が対数的に均一間隔であると、0+{...、−2Δ、−Δ
、0、Δ、2Δ、...}である。所望のゲイン値が1+k1Δ(線形の場合)、ま
たはk1Δ(対数の場合)であると、再量子化SLRPのインデックスはSLR
Pのオリジナル量子化インデックスに単にk1を加えることによって得られる。
【0071】 この余り複雑ではない即時のスカラー再量子化技術は、SLRP量子化テーブ
ル値が均一間隔でない場合であっても適用することが可能であることに注意する
必要がある。この場合、Δは隣接する量子化テーブル値間の平均間隔であり、こ
の平均化は、これらの値の間の、線形または対数距離のいずれかを使用して適性
に実行される。
【0072】 現在のスカラー再量子化の例は、図16のGSMFRコーディックで示される
。このコーディックSLRPは、各サブフレームから送信されるブロック最大値
、Xmax,である。Q及びQ-1ブロックはそれぞれSLRP再量子化及び逆量子化
を表す。ブロック最大値のインデックスは、第1に、Xmaxを得るべく参照テー
ブルを使用して逆量子化され。次に、Xmaxは、参照テーブルを使用して再量子
化されるXmaxALCを得るべく所望のゲインで乗じられる。再量子化されたXmax
のインデックスは、送出前にビットストリームにて元の値に置き換えられる。こ
の再量子化技術は、GSMFR標準の被符号化領域ALCをインプリメントする
際に、図12〜15に示す全てのスキームの基本構成を形成する。
【0073】 差動スカラー再量子化の新規な技術を以下に議論する。GSMEFRコーディ
ックは、この再量子化技術を使用して被符号化領域ALCのインプリメンテーシ
ョンを説明する例として使用される。
【0074】 図17は、ALCで示される構成要素のみを備えた、一般的な被符号化領域A
LC技術を示す。(G(n))は符号器により決定される元の対数的ゲインを示
す。EFRコーディックの場合、G(n)は式(5)で規定されるE(n)に等
しく、R(n)は式(4)で規定される。ALCデバイスは所望のゲインである
ΔG(n)を決定する。SLRP、*R(n)(注! *は式及び図中の反転記
号^に対応する)は、ALCデバイスにより所望のゲインに基づいて修正される
。実現したゲイン、Δ*R(n)は元と修正されたSLRPの間の差異である。
【0075】
【数33】 これは安定条件のもとで、復号器で実現された実際のゲイン、即ち、(1+P 1 (1))Δ*R(n)、と相違することに注目すべきである。相違を明確化さ
せるために、前者のSLRPの「実現したゲイン」及び、後者の「実際に実現し
たゲイン」について言及する。実際に実現したゲインは、本質的に、安定状態の
元での復号処理におけるSLRP実ゲインの増幅されたバージョンである。安定
状態により、ΔG(n)は、Δ*R(n)が特定レベルでの通常の方法において
安定又は発振する十分に長い時間周期に対して、一定に保持されることを意味す
る。
【0076】 この方法は差動スカラー再量子化は基本的にALCデバイスにおける符号器の
動作を模倣しようとする。符号器及びALCデバイスにおける量子化器の存在が
無視されるならば、符号器及びALCデバイスの両方とも同じ伝達関数、1/(
1+P1(z))、及び、結果的に、*GALC(n) =G(n)+ΔG(n)、を持
った線形システムとなる。しかしながら、これらシステムを非線形にする量子化
器のために、この関係は単に近似的なものである。従って、復号化ゲインは、
【数34】 ここで、(ΔG(n)+量子化誤差)は、実際に実現したゲインである。
【0077】 ALCデバイスにおけるSLRP実ゲイン、Δ*R(n)、のフィードバック
は、意図しない発振効果の原因となる。例として、GSMEFRコーディックが
使用されたときにこれらの発振効果が示される。このコーディックに対して、P 1 (z)は4つの遅延要素を持つ。各要素は32の可能な値の1つを含む。従っ
て、ALCデバイスにおける非線形システムは、所定の時間にて100万以上の
可能な状態のいずれかにある。これは、この非線形システムの振る舞いがその初
期条件によって大きく影響されるからである。
【0078】 所望のゲイン、ΔG(n)、のステップに応答して実際に実現したゲインにお
ける残響を図示する。簡素化のために、元のSLRP,*R(n)は100以上
のサブフレームで一定であり、P1(z)のメモリは初期状態ではゼロと仮定す
る。図18(a)は所望のゲインのステップを示す。図18(b)は所望のゲイ
ンに重畳された実際の実ゲインを示す。初期条件及び元のSLRPは正確な振る
舞いを決定するが、ここで示される実際の実ゲインにおける残響は全く典型的な
ものである。
【0079】 図18(b)に示すSLRP実ゲインにおける残響は音声信号の変調の原因と
なり、結果的に可聴歪みの原因となる。従って、ALC仕様によれば、このよう
な残響は所望しないものとなる。残響は、図19に示すように、フィードバック
ループの外に量子化器を「移動する」ことにより除去することができる。(本実
施形態では、Δ*R(n)の計算は不要であるが、図17との比較が含まれる。
【0080】 フィードバックループの外に量子化器を配置することは、結果的に所望のゲイ
ンが重畳された、図18(c)に示す実際の実ゲインとなる。しかし、残響は除
去されるが、平均誤差(所望のゲインと実際の実ゲインとの平均的差)は、図1
8(b)に示すようにより高くなる。特に、これらの例では、再量子化器が安定
状態で動作中の平均誤差は0.39dBであり、フィードバックループに量子化
器が無い状態での平均誤差は1.03dBである。
【0081】 図19に示すALC装置は、図20のように簡素化することができ、結果的に
計算の節約になる。これは、線形システム、1/(1+P1(z))、を、定数
1/(1+P1(1))、に置き換えることでなされる。
【0082】 ALCの目的として、このような簡素化への行為は、所望のゲインが比較的稀
に変化するときには、十分に特別であるとしてしばしば見られている。比較的稀
な変化により、変化の間のサブフレームの平均的な数は、P1(z)のオーダー
よりも大きくなることを意味する。
【0083】 幾つかのALCアルゴリズムは、現在及び将来のゲイン値を利用する。このよ
うなフィードバックーベースのALCアルゴリズムでは、フィードバックされる
ゲインは、SLRP再量子化処理の後では、実際の実ゲインであるべきであり、
所望のゲインであるべきではない。このことは、既に、図14に関連して議論し
た。
【0084】 このようなフィードバックーベースのALCアルゴリズムに対する差動スカラ
ー再量子化は、図21で示すようにインプリメントされる。このインプリメント
では、ALCデバイスは、実際の実ゲインを決めるために復号器の作用をまねて
いる。
【0085】 図19に類似な簡素化されたALCデバイスのインプリメントは、図21(b
)に示され、線形システム、1/(1+P1(z))、は、一定な乗数、1/(
1+P1(1))、で置き換えることができる。さらなる簡素化は、実際の実ゲ
インの計算での精度が落ちるが、線形システム、1+P1(z)、を、一定の乗
数、1+P1(1)、で置き換えることによって、 図21(b)により達成す
ることができる。同様な方法で、図21(a)に示すインプリメントは線形シス
テムを、一定の乗数P1(1)で置き換えることにより簡素化することができる
【0086】 残響に対して寛容ではあるが、所望のゲインと実際の実ゲインの整合では高い
精度を要求する応用例では、フィードバックループ内に量子化器を持つ前述の方
法のいずれかが使用される。実際の実ゲインでの残響は許容できないが、所望の
ゲインと実際の実ゲインの整合では低い精度を認める応用では、フィードバック
ループの外に量子化器を持った前述の方法のいずれかの方法が使用されている。
【0087】 大きな緩衝や処理や送信における遅延は、既に音声符号器により受けている。
さらに、音声の強調を目的とした符号化音声の処理は、さらなる遅延として加え
られる。このようなさらなる遅延は、電話での会話が自然でないので、望むもの
ではない。さらに、さらなる遅延は、ハンドセットでのエコーキャンセルの効果
を減ずるか、性能上で所定レベルのエコーキャンセルの複雑性を増大させること
になる。
【0088】 線形領域でのALCのインプリメントは、復号化及び再符号化に対する緩衝及
び処理の要件によって、常に少なくとも遅延しているフレームに加えられること
に注目するべきである。表1に列記されたコーディックに対して、各フレームが
20ms長であることに注目すべきである。しかしながら、被符号化領域ALC
は、1フレームより少ない緩衝遅延で実行される。
【0089】 EFR符号器は、20ms音声フレームを244ビットに圧縮する。ALCデ
バイスの復号器では、第1のサンプルにおける最も早い点は、図23(a)に示
すように、91ビットの繰り返し後である。これは近似的に7.46msの緩衝
遅延を表す。まさに第1のサンプルばかりか、この点における第1のサブフレー
ムの全体を復号化するために、十分な情報が受信される。同様に、第1のサブフ
レームの全体は、FR復号器における緩衝遅延のおおよそ7.11ms後に復号
化される。
【0090】 両方の符号器に対して、残りのサブフレームは、復号化の以前に短時間の待ち
時間を必要とする。各サブフレームは、EFR及びFR符号化スキームの両方で
関連したSLRPを有することに注目すべきである。これは、一般的に、復号器
がサブフレームレベルで動作する場所におけるほとんどのコーディックについて
真実である。
【0091】 上述から、被符号化領域におけるALCはフレームごとよりもむしろサブフレ
ームごとに実行して実現される。サブフレームが復号化され、必要なレベルの測
定が更新されるやいなや、ALCデバイスにより計算された新たなSLRPは、
受信したビットストリームにおいて元のSLRPを置き換える。
【0092】 SLRPが復号化される以前の遅延は受信したビットストリームにおけるSL
RPに対応するビットの位置により決定される。FR及びEFRコーディックの
場合、第1のサブフレームに対するSLRPビットの位置はこの遅延で決定され
る。
【0093】 ほとんどのALCアルゴリズムは、そのサンプルを受信した後にのみ音声サン
プルに対するゲインを決定する。これは、ALCアルゴリズムによって、音声信
号がゲインが大きすぎてクリップしないか、非常に低いゲインによりアンダーフ
ローするかを確認できることである。
【0094】 しかしながら、粗いALCアルゴリズムでは、オーバーフロー及びアンダーフ
ローの両方が低い見込みを持つ事象である。このように、以前のサンプルからの
み導かれる情報に基づいて、サンプルに対するゲインを実際に決定することがで
きる。この概念は、幾つかの音声コーディックに対する被符号化領域ALCにお
ける近似的にゼロの緩衝遅延を達成するために使用される。
【0095】 基本的に、ALCアルゴリズムは、以前のサブフレームのみに基づいて現在の
サブフレームのゲインを決定するように設計されねばならない。この方法におい
て、緩衝遅延はSLRPを修正するためにほとんど必要ではない。所定のサブフ
レームで、SLRPに対応するビットが受信されるやいなや、それらはまず復号
化される。そして新たなSLRPが、元のSLRP及び以前のサブフレームのみ
からの情報に基づいて計算される。元のSLRPビットは新たなSLRPビット
と置き換えられる。現在のサブフレームを復号化するために必要な全てのビット
が受信されるまで、待つ必要はない。従って、アルゴリズムにより負う緩衝遅延
は、小さい処理遅延に依存している。音声レベルについての情報は、現在のサブ
フレームに対するSLRPの置き換え後にのみ現在のサブフレームから導かれる
【0096】 ほとんどのALCアルゴリズムはこのような遅延された形式にて動作するよう
に容易に変換される。オーバーフロー及びアンダーフローについて小さなリスク
があるが、このリスクは音声のサブフレーム(通常、約5ms)のみに対して隔
離される。例えば、大きなゲインが与えられことによりサブフレームのオーバー
フローの後に、次のサブフレームについて計算されたSLRPは、引き続くオー
バーフローの見込みを最小にするように適切に設定される。
【0097】 このような近似的ゼロの緩衝遅延の方法は、特にFRコーディックに適用可能
であり、これはこのコーディックに対するSLRPの復号化が復号のためのパラ
メータを含まないからである。EFRコーディックの場合、サブフレームの励起
ベクトルはSLRPを復号化するために必要とされ、より複雑な差動再量子化技
術がSLRPを再量子化するために使用されねばならない。この場合に、大きな
遅延の減少は、SLRPが現在のサブフレームに置き換わった後に、現在のサブ
フレームに基づいて音声レベルの更新を実行することにより達成される。
【0098】 GSMネットワークにおける提案のTFO標準に関連して、被符号化領域AL
Cを実行することは上述した。TFOの下では、ハンドセットと基地局との間の
送信は符号化され、音声サンプル当たり2ビット以下が必要である。しかしなが
ら、音声サンプル当たり8ビットが基地局の間の送信に利用されている。基地局
では、音声サンプル当たり8ビットが必要なように、音声は復号化され、A則に
よる拡張される。しかしながら、元の符号化音声ビットは、各8ビットA則拡張
サンプルにおいて、2つの最下位ビット(LSB)を置き換えるために使用され
る。一度TFOがハンドセットの間で確立されると、基地局は、各ハンドセット
に対して、各8ビットA則拡張サンプルにおける2つの最下位ビットのみを送信
し6MSBを捨てる。従って、ボコーダの並列配置が回避される。
【0099】 TFO標準によれば、受信したビットストリームは8ビットサンプルに分離さ
れる。各サンプルの2つの最下位ビットは被符号化音声ビットを含み、上位6ビ
ットは適切なPCMサンプルに対応するビットを含む。従って、線形音声サンプ
ルの雑音バージョンはこの場合ALCに利用できる。この雑音線形領域音声信号
を利用することは、線形領域ALCアルゴリズムにて通常なされるように、必要
なボイスの活用、二重トーク、及び音声レベルの測定等を実行するために可能で
ある。従って、この場合、被符号化領域の音声パラメータの復号化は最少量のみ
が必要である。SLRPの決定と再量子化に要求されるパラメータのみが復号化
されねばならない。音声信号の部分的な復号化は不要である。これは、雑音線形
領域の音声サンプルが、ボイスの活用及び二重トークの検出と同様に、音声レベ
ルを測定するために応答するからである。
【0100】 通信におけるこれらの技術は、上述した処理及びプロセスが、論理的で数学的
な動作を可能とする他の論理ユニットと同様に、マイクロプロセッサ、マイクロ
コントローラ又はデジタル信号プロセッサを含むプロセッサにより実行されるこ
とを認識すべきである。
【0101】 一般の被符号化領域ALC 好適な実施形態を述べる前に、被符号化領域ALCについて一般的に論ずる。
非可逆的ソース符号化のカテゴリに含まれる音声圧縮は音声符号化として言及さ
れるのが通常である。音声符号化は音声送信に必要な帯域幅を最小にするように
実行される。これは帯域幅が殆ど無い無線電話において非常に重要である。比較
的帯域幅が広いパケット網、音声符号化は、ネットワークの遅延及びジッターを
最小にするためにも重要である。これは、音声通信、種々の異なるデータは非常
に狭い遅延だからである。従って、小さなパケットサイズはパケットネットワー
クを介しての送信を容易にする。4つのETSI GSM標準の関連が表3に列
記されている。各標準は線形予測コードを規定している。表3は表1に規定され
た音声コーディックの一部である。
【0102】
【表4】 音声符号化において、連続的なデジタル音声のサンプルの組みは音声フレーム
とする。GSM符号器は20ms(サンプルレート8kHzで160サンプル)
のフレームサイズで動作する。所定の音声フレームに対して、音声符号器は音声
合成モデルに対してパラメータの小さな組みを決定する。これらの音声パラメー
タ及び音声合成モデルとともに、音声フレームは、元の音声フレームに非常に類
似するような音に再構成される。再構成は音声復号器により実行される。上記に
列記したGSM音声符号器において、符号化処理は復号化処理よりもはるかに計
算が多くなる。
【0103】 音声符号器により決定された音声パラメータは使用された音声合成モデルに依
存する。表3おGSM符号器は線形予測符号化(LSP)モデルを利用する。L
PC音声合成モデルの簡素化された構成が図3に示される。図3のモデルは、適
切なモデルパラメータを特定することにより音声類似信号を発生するために使用
される。このような音声合成モデルの例において、パラメータには、時間可変フ
ィルター係数、ピッチ周期、コードブックベクトル、及びゲイン係数を含む。合
成音声は、次のようにして発生される。適切なコードブックベクトル、c(n)
、が最初にコードブックゲイン係数Gによって計算される。ここで、nはサンプ
ル時間である。スケーリングされたコードブックベクトルは、ピッチ合成フィル
ターによりフィルターされ、そのときのパラメータはピッチゲインgp、及びピ
ッチ周期Tを含む。結果的には、全体励起ベクトルu(n)として何度か言及し
ている。その名称で意味するように、ピッチ合成フィルターは、ボイスにおける
音声の調和品質をもたらす。全体の励起ベクトルは、音声フレームの広域スペク
トル形状を特定するLPC合成フィルターによりフィルターされる。
【0104】 各音声フレームに対して、パラメータは通常、一度以上更新される。例えば、
GSMFR及びEFR符号器において、コードブックベクトル、コードブックゲ
イン及びピッチ合成フィルターのパラメータは各サブフレーム(5ms)ごとに
決定される。LPC合成フィルターのパラメータは、EFRにおいてフレーム当
たり2度(10msごとに)決定され、FRにおいてフレームごとに1度決定さ
れる。
【0105】 一般的な音声符号器は以下の一連の段階を実行する。 1.音声サンプルのフレームを獲得する。 2.ウインドウ(例えば、「ハミング」ウインドウ)により、サンプルフレーム
を乗算し、遅れMまでの自動訂正関数を決定する。 3.自動訂正関数からLPC係数を決定する。 4.LPC係数を異なるフォーム(例えば、ログ領域比又はラインスペクトラム
周波数)に変換する。 5.ベクトル量子化技術を使用して、変換されたLPC係数を量子化する。 6.以下の一連の動作が、通常、各サブフレームに対して行われる。 7.ピッチ周期を決定する。 8.対応するピッチゲインを決定する。 9.ピッチ周期及びピッチゲインを量子化する。 10.LP残余信号を得るために、量子化されたLP合成フィルターを介して、
元の音声信号の逆フィルターを行う。 11.ピッチ残余を得るために、ピッチ合成フィルターを介してLP残余信号の
逆フィルターを行う。 12.最適なコードブックベクトルを決定する。 13.最適なコードブックゲインを決定する。 14.コードブックゲイン及びコードブックベクトルを量子化する。 15.フィルターメモリを適切に更新する。 16.符号化パラメータを送信する。
【0106】 一般的な音声復号器は以下の一連の段階を実行する。
【0107】 1.全ての受信した符号化パラメータ(LPC係数、ピッチ周期、ピッチゲイン
、コードブックベクトル、コードブックゲイン)を逆量子化する。 2.コードブックゲインによりコードブックベクトルをスケーリングし、LP励
起信号を得るために、ピッチ合成フィルターを使用してフィルターリングする。 3.一次的な音声信号を得るために、LP合成フィルターを使用してLP励起信
号をフィルタリングする。 4.ポストフィルター(通常、LP係数に基づく)を構築する。 5.最終的な合成音声を得るために、量子化雑音を減少させるための一次的な音
声信号をフィルタリングする。
【0108】 多くの非線形性と発見的教授法(heuristics)が合成に含まれるが、いかにの近
似的伝達関数は、ALPの目的に対して十分に精度のある合成処理に属する。
【0109】
【数35】 結果的に合成音声となるH(n)によりフィルターされたコードブックc(n
)を考察する。注目すべきキーポイントはGが伝達関数のDCゲインを特定する
ことである。これは、Gが近似的な線形方法にて全体的な音声レベルを調整する
ために修正されることを意味する。従って、Gは「音声レベル関連パラメータ(
SLRP)」を意味する。
【0110】 表2に関連して以前に説明したように、GSM符号器は音声レベル関連パラメ
ータ(SLRP)を使用する。これらのSLRPは、図3の一般の音声合成モデ
ルにおけるGに対応する。所定のコーディックに関連して被符号化領域ALC(
CD−ALC)を実行するために、対応するSLRPのみがネットワークALC
デバイスにおける受信したビットストリームにて修正される必要がある。これは
、再符号化処理がかなり簡素化される利点を持つ。さらに、このアプローチは、
結果的に、信号に誘導された知覚的に重要な量子化に対して、最も少ない可能な
量を生じる。各コーディックに対して、異なる被符号化領域SLRPの修正アル
ゴリズムが案出される。ここで、FR及びEFR符号器に対する好適なアルゴリ
ズムを説明する。
【0111】 既に、図6〜10に関連して説明したように、一つの音声パラメータの量子化
は「スカラー量子化」と称される。パラメータの組みは互いい量子化されるとき
、処理は互いに「ベクトル量子化」と称される。ベクトル量子化は通常、LRP
係数のような方法で互いに関連したパラメータの組みに適用される。スカラー量
子化は通常、コードブックゲインのような他のパラメータから比較的独立したパ
ラメータに適用される。インプリメントされたCD−ALCの目的のために、議
論はスカラー量子化のみに限定する。
【0112】 FR及びEFR符号器の両方が各コードブックゲイン(これはSLRPとして
言及している)に対するスカラー量子化を利用する。FR符号器は、SLRP(
max)における一時的なスカラー量子化を実行する。即ち、SLRPの現在の
値は、比較的簡単な表参照方法である量子化処理にて使用される。EFR符号器
はSLRP(γgc)の適応差動スカラー量子化を実行する。この方法で、現在の
量子化された値は過去の量子化された値に依存する。CD−ALCへのモジュラ
ーアプローチを利用する本発明の好適な実施形態は図24に示される。通信シス
テム10は、表2で特定されたコーディックにより使用されるいずれかのコード
のような、圧縮コードを使用してネットワーク14上で近端ハンドセット12か
らの近端デジタル信号を送信する。圧縮コードは、近端ハンドセット12から発
生された線形可聴信号から符号器16によって発生される。圧縮コードは表2に
おけるSLRPのラベルの付されたパラメータのようなパラメータを備える。パ
ラメータは可聴レベルを含む複数の可聴特性を備えた可聴信号を表す。上述のよ
うに、可聴レベルは表2におけるSLRPのラベルの付されたパラメータに関連
する。圧縮コードは可聴レベルに関連したパラメータを復号化するための1つ又
はそれ以上の段階を含む種々の復号化の段階により復号化が可能である。説明し
たように、システム10は最小の遅延で可聴レベルを調整し、さらに可聴レベル
に関連した圧縮コードのパラメータを復号化する。
【0113】 圧縮コードを使用する近端デジタル信号は近端端子20で受信され、Sinポ
ートに送られ、そして調整された圧縮コードは近端端子22により送信され、圧
縮コードを有する復号器28を含む遠端ハンドセット26に、ネットワーク24
を経てSoutポートに送られる。線形の遠端可聴信号は、符号器16と同じ圧
縮コードを使用して遠デジタル信号を発生する遠端符号器30により符号化され
、遠端端子34にネットワーク32を経て送信されRinで受信される。ネット
ワーク34はまた端子36に遠端信号を送信し、Routポートで受信する。近
端ハンドセット12の復号器18は遠端デジタル信号を復号化する。図24に示
すように、遠端信号からのエコー信号は近端ハンドセット12の符号器16への
経路で見出せる。
【0114】 プロセッサ40は近端及び遠端圧縮コード上で種々の動作を実行する。プロセ
ッサ40はマイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッ
サ、又は数学的及び論理的な動作が可能な論理ユニットである。コーディックの
各タイプ、異なる被符号化領域SLRPの修正アルゴリズムはプロセッサ40に
より実行される。プロセッサ42により実行される線形領域レベル制御アルゴリ
ズム42は、非TFOと同様にTFOの間、固有のモード及び線形モードの下で
、全ての時間における動作である。部分的な復号器48は、圧縮コードにより表
される可聴信号の可聴レベルが決定される線形コードを形成するように十分な圧
縮コードを復号化する。復号器48は、表2で特定されるパラメータの1つのよ
うに、可聴レベルに関連した圧縮コードパラメータを読み出す。読み出されたパ
ラメータはパラメータ値を形成するために逆量子化される。線形領域レベル制御
アルゴリズムはレベル調整のためのゲイン係数を決定し、プロセッサ40内の所
定のメモリに書き込まれる。このゲイン係数はプロセッサ40により実行される
、適切なコーディック依存被符号化領域SLRPの修正アルゴリズム44により
読み出される。アルゴリズム44は、調整されたSLRPパラメータ値(即ち、
調整されたゲイン係数)を形成するために、読み出されたSLRPパラメータ(
即ち、ゲイン係数)を修正する。調整されたパラメータ値は、端子20で受信し
たビットストリームに記載された調整されたSLRPパラメータ値を形成するた
めに量子化される。言い換えれば、調整されたSLRPパラメータは元の読み出
されたSLRPに置き換えられる。ネットワークALCデバイス内に示される部
分的な復号器46及び48はプロセッサ40により実行されるアルゴリズムであ
り、コーディック依存である。GSMEFRの場合に、フィルタリング動作後の
復号器は不要である。GSMFRの場合では、完全な復号器がインプリメントさ
れる。
【0115】 モジュラーアプローチは、いずれか存在する又は新たな線形領域レベル制御ア
ルゴリズムが、被符号化領域SLRPの修正アルゴリズムとともに僅かに又は無
修正で併合される利点を有する。符号器特定レベル制御方法はより正確なレベル
調整をもたらす。しかしながら、固有モードから線形モード(又はその逆)に切
り換えるときの滑らかな遷移を確保するために、存在する線形領域レベル制御ア
ルゴリズムの重要な再設計を必要とする。幾つかの望まない人為的なものが、モ
ジュラーアプローチを使用したときの符号化モードと線形モードの間の切り換え
時にたまたま誘起される小さなリスクがあることに注目すべきである。
【0116】 好適な実施形態では最小の遅延技術を含む。大きな緩衝、処理及び送信遅延は
、いずれかのボイス品質の強調処理無しに、セルラーネットワークに既に存在す
る。さらに音声の強調を目的として符号化された音声のネットワーク処理は追加
の遅延を生じる。もし線形領域処理が、TFOの間に符号化音声上で実行され、
遅延(20ms)以上のフレームが復号化及び再符号化の緩衝及び処理要件によ
って加えられる。しかしながら、CD−ALCはFR及びEFR符号器の1フレ
ームより少ない緩衝遅延とともに実行される。
【0117】 CD−ALCの下での遅延の縮小はフレームごとよりも時間におけるサブフレ
ームのレベル制御を実行することにより、FR及びEFRに対して達成される。
サブフレームが復号器48により復号化され、必要なレベル測定が更新されるや
いなや、線形領域ALCアルゴリズムは、ゲイン係数を被符号化領域SLRPの
修正アルゴリズム44に送信する。パラメータが受信したビットストリームに配
置される方法によって、第1のサブフレームは、符号化が開始される以前に5m
s以上の遅延を必要とする。
【0118】 表5及び表6はサンプルの復号化が実行された最も早い可能な点を提供するも
のであり、ビットストリームは各々FR及びEFR符号器で受信され、図23の
構成に対応する。FRに対して260ビット/フレームあり、EFRに対して2
44ビット/フレームがある。表は、入来のビットは、簡素化のために、20m
s以上に拡張される。このような近似とともに、第1のサブフレームは、FRに
対して7.11msを必要とし、EFRに対して7.46msを必要とする。全
ての他のサブフレームはより少ない遅延を必要とする。
【0119】
【表5】
【0120】
【表6】
【0121】 GSMFRのCD−ALC GSMFRのCD−ALCの目的のために、ブロック最大値xmax(表2参照
)と称されるSLRPパラメータの修正のみを説明する。このパラメータは、式
(11)で与えられる音声合成の伝達関数においてGに対応する。このセクショ
ンは各フレームで受信された260ビットからこのパラメータの復号化を説明す
る。xmaxの決定についての関数的な説明に対して(参照(1)(セクション3
.1.18−3.1.22)の「RPE符号化セクション」を参照)。
【0122】 xmaxの決定のための対応擬似コードは参照(1)のセクション4.2.13
−4.2.17に記載されている。
【0123】 各フレーム受信された260ビットでは、xmaxが決定された特定のビットが
表7に示されている。各サブフレームで示す6ビットは、表3と表5で特定され
た64−ワード表のインデックスとして使用される。表7における「ブロック最
大値xmaxの量子化」では、インデックスはxmaxc によって示され、対応値はx
maxで示される。
【0124】
【表7】
【0125】 修正後にSLRPパラメータを符号化(即ち、量子化)するために、参照(1
)における表3と表5、「ブロック最大値xmax の量子化」が使用される。表は
各値の範囲での6個のインデックスを特定する。6個のインデックスは各サブフ
レームの適切な位置に再挿入される。
【0126】 量子化されたSLRPの値は図6に示される。量子化値の範囲は31から32
767である。これは約60dB(20log10(3276/31)のダイナミ
ックレンジを表す。
【0127】 SLRPの各サブフレームの処理は次のとおりである。
【0128】 (1)近端及び遠端圧縮被符号化音声サブフレームの両方が復号器46及び48
により完全に復号化される。即ち、端子20及び34に送信されるデジタル信号
は、可聴レベルを示す近端復号化信号及び遠端復号化信号を発生するために復号
器46及び48により完全に復号化される。さらに、x’max値が部分的に復号器
48により符号化近端信号から読み出される。(2つの端部の間のサブフレーム
境界の整列は重要ではない。)近端復号化信号及び遠端復号化信号は、固有の可
聴レベルを決定するために線形領域ALC(LD−ALC)アルゴリズム42に
より処理される。インプリメントに依存して、端子34にて受信された遠端信号
に基づいて二重トーク情報のみが実際にLD−ALCに渡される。
【0129】 (2)近端信号(Sinポート)の現在のサブフレームはLD−ALC42によ
りスケールされる。
【0130】 (3)現在のサブフレームの最後のサンプルを処理するために使用され、gALC
により示されるLD−ALCゲイン又はレベルはCD−ALC44に渡される。
これはCD−ALCにより読み出される所定のメモリに書き込むことにより達成
される。
【0131】 (4)CD−ALCは上述の表7により現在のサブフレームに対して6ビットテ
ーブルインデックスを抽出する。量子化x’max値は表3及び5と、参照(1)「
ブロック最大値xmax」を使用して決定される。一方、復号器は既にこの値を参
照しているので、復号器コードはCD−ALC44にこの値を渡すように修正さ
れる。
【0132】 (5)新たなブロック最大値(調整されたレベル値)は、 xmax.ngw=gALC X x’max として計算される。
【0133】 (6)xmax.ngwは表3及び5と、参照(1)「ブロック最大値xmax」を使用し
て量子化される。調整レベルパラメータを表す6ビットテーブルインデックスの
結果は、表7に従って符号化近端ビットストリームに戻って挿入される(例えば
、書き込まれるか置き換えられる) (7)CRC又はエラー制御符号化ビットのいずれも適切に更新される。
【0134】 GSMEFRに対するCD−ALC GSMEFRに対するCD−ALCの適切なフォームを以下に説明する。GS
MEFR符号器の量子化はFRとして直接的なものはない。従って、SLRPの
符号化及び復号化の概略をまず説明する。
【0135】 CD−ALCの目的に対して、コードブックゲイン、gc(表2)で称されるパ
ラメータの修正のみに関連する。このパラメータは、式(11)で与えられる音
声合成伝達関数におけるGに対応する。しかしながら、このパラメータは受信に
したビットストリームにて直接的に利用できない。スタティックな線形予測器を
使用して適応差動量子化の非直接的なフォームが、各サブフレームごとに、量子
化gcを行うために利用される。送信される「ゲイン」パラメータは、gcと予測ゲ
インg’cの実際の補正係数である。
【0136】
【数36】 γgcは実際の圧縮コードSLRPで考慮される。これは、被符号化領域にて直
接的にアクセスできる全体的音声レベルに関連したパラメータのみだからである
【0137】 符号器(例えば符号器16)において、一度、現在のフレームに対して最適な
gcが決定されると、γgc を得るために予測ゲインg’cにより分割される。サブ
フレームに対する予測ゲインnは以下の式で与えられる。
【0138】
【数37】 32レベルの非均一量子化は、*γgcを得るためにγgcで実行される。符号器
は*γgcに対応する参照テーブルインデックスを送信する。式(13)において
、*Eは定数であり、E1(n)はサブフレームの固定コードブックベクトルに
のみ依存し、そして*E(n)は以前に量子化された補正係数にのみ依存する。
従って、復号器は、式(13)を使用して符号器と同じ方法で予測ゲインg’c
計算し、一度、現在のサブフレームの固定コードブックベクトルが復号化される
。補正係数*γgcの復号化において量子化ゲイン係数は式(12)を使用して式
(14)で計算される。
【0139】
【数38】 SLRP及びγgcの適応差動量子化は、対数領域で実行される。処理は図25
に示され、R(n)は、 R(n)=E(n)−*E(n)=20logγgc(n) で与えられる予測誤差を示す。R(n)は図中のQで示すブロックによって*R
(n)に量子化される。量子化は、アレイ“qua_gain_code”で与えられる*γg c に対する32−ワード量子化を使用して実行され、“qua_gain_code”は参照(
2)に記載されるEFRでもたらされるビットツルーCコードファイル”gain_t
o.h”で特定される。
【0140】 固定係数をもった同様のスタティック線形予測P(z)は、符号器及び復号器
の両方で使用される。
【0141】 P(n) = 0.68z-1 + 0.58z-2 + 0.34z-3 + 0.19z-4 で与えられる。
【0142】 符号器におけるSLRPの量子化は、各フレームにおける平均移動コードブッ
クベクトルエネルギーを使用して間接的に実行される。E(n)はサブフレーム
nにおける平均移動コードブックベクトルエネルギー(dB)を示し、以下の式
で与えられる。
【0143】
【数39】 ここえ、平均コードブックベクトルエネルギーは以下の式で与えられる。
【0144】
【数40】 コードブックベクトル(c(i))はSLRPを復号化するために必要とされ
る。コードブックベクトルの復号化はSLRPの復号化とは独立であることに注
目すべきである。E(n)ゲイン係数gc の関数である。γgcから*γgcへの量
子化は間接的にgcから*gcへ結果的にはなる。この量子化ゲイン係数はコードブ
ックベクトルをスケールするために使用され、復号器(例えば復号器28)で合
成された可聴信号の全体的なレベルを設定する。*E(n)は以下の式による予
測エネルギーである。
【0145】
【数41】 ここで、(*R(n−i))は以前に量子化された値である。
【0146】 コードブックゲイン係数gcを復号化する処理のまとめを以下に示す。まず、復
号器は、励起ベクトルを復号化し、式(16)を使用してE1(n)を計算する
。次に、*E(n)が、式(17)を使用し以前に復号化されたゲイン補正係数
を使用して計算される。予測ゲインg’cが式(13)を使用して計算される。次
に、現在のサブフレームに対する補正係数の受信インデックスが参照テーブルか
ら*γgcを得るために使用される。最後に量子化ゲイン係数が式(14)により
得られる。
【0147】 各フレームで受信された244ビットでは、*γgcが決定される特定のビット
は表8に示される。各サブフレームに示された5ビットは、アレイ“qua_gain_c
ode”で与えられる*γgcに対する32−ワード量子化を使用して実行され、“q
ua_gain_code”は参照(2)に記載されるEFRでもたらされるビットツルーC
コードファイル”gain_to.h”で特定される。この情報は表9に示される。
【0148】
【表8】 量子化SLRP値は図10に示される。隣接する量子化レベル間の差異は図2
2に示される。量子化値の範囲は159から27485である。これは約45(
dB)のダイナミックレンジを表す(20log10(27485/159)。量子化SLRP値及
び対数のテーブルは表9に示される。このテーブルはSLRPを再符号化するた
めに必要である。
【0149】
【表9】
【0150】 SLRPのCD−ALC処理 各サブフレームにおけるSLRPのCD−ALC処理は以下のとおりである。
【0151】 (1)近端及び遠端圧縮被符号化音声サブフレームの両方が復号器46及び48
により完全に復号化される。即ち、端子20及び34に送信されるデジタル信号
は、近端復号化信号及び遠端復号化信号を発生するために復号器46及び48に
より完全に復号化される。さらに、γgcパラメータが部分的に復号器48により
符号化近端信号から読み出される。(2つの端部の間のサブフレーム境界の整列
は重要ではない。)近端復号化信号及び遠端復号化信号は、固有の可聴レベルを
決定するために線形領域ALC(LD−ALC)アルゴリズムにより処理される
。インプリメントに依存して、遠端信号に基づいて二重トーク情報のみが実際に
LD−ALCアルゴリズム42に渡される。
【0152】 (2)近端信号(Sinポート)の現在のサブフレームはLD−ALC42によ
りスケールされる。
【0153】 (3)現在のサブフレームの最後のサンプルを処理するために使用され、gALC
で示されるLD−ALCゲイン又はレベルはCD−ALC44に渡される。これ
はCD−ALCにより読み出される所定のメモリに書き込むことにより達成され
る。
【0154】 (4)CD−ALCは上述の表8により現在のサブフレームに対して5ビットテ
ーブルインデックスを抽出する。一方、復号器は既にこのインデックスを決定し
ているので、復号器コードはCD−ALC44にこの値を渡すように修正される
【0155】 (5)表9の5ビットテーブルインデックスは、逆量子化パラメータ値である、
*R(n)=20log10(*γgc)を決定するために使用される。
【0156】 (6)テーブルの参照は20log10(gALC)を決定するために実行される。これは
、gALCが取り得る可能値が予め決められているので可能であり、従って、予め
計算される。
【0157】 (7)Rnew(n)は新しいか又は調整されたSLRPを示す。4つの変数、(PastD
eltaR(0)), (PastDeltaR(1)), (PastDeltaR(2)), (PastDeltaR(3)), が必要と
され、これらは1つのサブフレームから次にメモリに保持される。これらの変数
は、呼の開始時点でゼロに初期化される。
【0158】 (8)予測dBゲイン、Gainpredicted(n)は、次の式(18)で計算される。
【0159】
【数42】
【0160】 (9)実際の量子化されないゲイン又はレベルGain actual (n) は所望の及び
予測ゲインの間の差異として以下の式(19)のように計算される。
【0161】
【数43】 (10)予測器の状態は、次の式(20)により次のサブフレームとともに使用
上で更新される。
【0162】
【数44】
【0163】 (11)Rnew(n) = *R(n) + Gainactual(n) で計算される。
【0164】 (12)Rnew(n)は,表9を使用して調整されたパラメータ*Rnew(n)を得るため
に量子化される。これは、表9において、Rnew(n)を*R(n)の32の可能値と比
較することによりなされる。*Rnew(n)は、Rnew(n)とテーブル値の間の絶対的な
差異に最も近い値に割り当てられる。*Rnew(n)に対応する5ビットテーブルイ
ンデックスは、表8に従って被符号化近端ビットストリームに戻って挿入される
(例えば、書き込まれるか又は置き換えられる。)
【0165】 (13)CRC又は誤り制御符号化ビットが適切に更新される。
【0166】 図26を参照して、再符号化スキームにおくれる理由を説明する。
【0167】 式(15)から、符号器において、E(n) = 20loggc + E1(n) - *Eで示される
。図25を図26にして考察する。ALCが符号化する前に実行されるとする。
20loggcは、20log(gc x gALC) = 20loggc + 20log gALCに、SLRP符号処理に
置き換えられる。目標は、元の符号器にアクセスしないネットワークにてALC
を実行することであり、符号化処理は図27に示すようにネットワークにて模倣
される。量子化器を除いて、符号器の処理は伝達関数1/(1+P(z))であ
る。CD−ALCデバイスにおける処理はこの線形伝達関数を持つ。これら2つ
の処理の出力は加えられ、その結果の合計はRnew(n)で示される。Rnew(n)は、20
log(gc x gALC)のALC処理された近似的に理想値に近い。Rnew(n)は*Rnew(n)
により量子化され、参照テーブルインデックスがビットフレームに再挿入される
。これはSLRPセクションのCD−ALC処理にて特定される方法である。
【0168】 ALCの適用例では、ゲイン係数の変化は一般に小さくサブフレームレートに
対して頻度はない。これは、20log gALCがサブフレームの大きな数に対して一定
に保たれる。P(n)のオーダーが小さいので、処理1/(1+P(z))の出
力はサブフレームの比較的小さい数で安定状態に達する。従って、1/(1+P
(z))を1/(1+P(1))=1/2.79に近似することは合理的である
【0169】 Rnew(n) = *R(n) + 20log gALC/2.79 を計算し、SLRPセクションのCD−
ALC処理における手順よりも簡素化される。しかしながら、大きな遷移が幾つ
かの適用例ではこの方法で観察される。
【0170】 LD−ALCアルゴリズムへの変形 以下のようなLD−ALCアルゴリズム(例えばTLC)への変形は、線形及
び負モード処理(例えば、ハンドオーバーの場合)の間で順調に移行される。
【0171】 (1)ゲイン係数調整段階は、通常のLD−ALC段階のサイズと同じGSMF
Rコーディックに関連する動作に対して±3dBに制限される。(LD−ALC
の幾つかのバージョンでは、6dB段階が可能であり、これは回避されるべきで
ある)従って、可能なdBゲイン値は(-3, - 6, 0, 3, 6, 9, 12, 15)に制限
される。
【0172】 (2)ゲイン係数調整段階は、GSMFRコーディックに関連する動作に対して
±3.39dBに制限される。(LD−ALCの幾つかのバージョンでは、6dB
段階が可能であり、これは回避されるべきである)。この段階サイズは遷移効果
を最小にし、精度を最大にするために、EFRに対して特に最適化される。従っ
て、可能なdBゲイン値は(-6.77, -3.39, 0, 3.39, 6.77, 10, 16)に制限さ
れる。
【0173】 以下はさらに性能を向上させる推奨例である。
【0174】 (1)いかなるゲインの変化もサブフレーム境界の開始点においてのみ生じるよ
うに制限されるべきである。これは、ゲインの変化が発生する例が線形(上限6
PCMビット)及び符号化信号の両方で等しいことが確保されるからである。
【0175】 (2)音声のサブフレーム(40サンプル)が時間的に効率的に処理される。
【0176】 CD−ALCの例の結果 CD−ALCアルゴリズムがゲインの調整を決定するためにLD−ALCアル
ゴリズムを利用するので、CD――ALCアルゴリズムの性能は、LD−ALC
性能により境界とされる上限となる。従って、LD-ALCアルゴリズムが、例え参照
(3)のG.169と一致しても、CD−ALCアルゴリズムはG.169で試
験されるべきである。
【0177】 このセクションに関して、一般的なレベル調整が結果的に例示されている。図
28に音声信号の一例が示される。
【0178】 図29は、CD-ALCがFRに関して使用される場合の結果を示す。上方のプロッ
トは、元の(点線)及び処理された(実線)信号のパワープロファイルを示す。
一定時間の40msが、パワープロファイルを得るために循環的な平均値の信号
で使用される。低いプロットは、各サブフレームの端部におけるLD−ALCゲ
イン(ブルー、点線)を示す。各サブフレームの端部における元のパワーと処理
されたパワーの比である。音声信号が強い領域では、信号の適用は所望のゲイン
に全く近い状態で対応する。
【0179】 通信の技術の当業者においては、好適な実施形態がさらに変形可能であり、請
求項に規定された本発明の精神と範囲を逸脱することなく変形が可能である。
【図面の簡単な説明】
【図1】 線形領域における符号音声のネットワーク強調のためのシステムの概略ブロッ
ク図である。
【図2】 自動レベル制御(ALC)のためのシステムの概略ブロック図である。
【図3】 線形予測符号(LPC)音声合成モデルの概略ブロック図である。
【図4】 線形領域デジタル音声サンプルから符号領域デジタル音声パラメータを識別す
る概略ブロック図である。
【図5】 符号領域ALCシステムの概略ブロック図である。
【図6】 ブロック最大化のためのGSMフルレートコーデック量子化を示すグラフであ
る。
【図7a】 後方適応型標準偏差ベースの量子化器の概略ブロック図である。
【図7b】 後方適応型差分ベースの量子化器の概略ブロック図である。
【図8】 線形予測子を用いた適応型差分量子化器の概略ブロック図である。
【図9】 GSM強調フルレートSLRP量子化器の概略ブロック図である。
【図10】 ゲイン訂正ファクタのためのGSM強調フルレートコーデック量子化レベルを
示すグラフである。
【図11】 ALCを実行する為の一技術の概略ブロック図である。
【図12】 符号領域ALCのための一技術の概略ブロック図である。
【図13】 オーバーフロー/アンダーフローを防ぐ為の一技術を示すフローチャートであ
る。
【図14】 過去のゲイン値を要求するALCアルゴリズムにおいて達成されたゲインのフ
ィードバックを使用するALCシステムの好ましい形の概略ブロック図である。
【図15】 符号領域ALCデバイスの一形状の概略ブロック図である。
【図16】 GSM FRコーディックのための即時のスカラー再量子化のためのシステム
の概略ブロック図である。
【図17】 GSM EFRコーディックのための差分スカラー再量子化のためのシステム
の概略ブロック図である。
【図18a】 所望のゲインにおける一ステップを示すグラフである。
【図18b】 フィードバックループにおける量子化器によって所望のゲイン上に重畳された
実際の達成ゲインを示すグラフである。
【図18c】 図19に示すフィードバックループの外側に量子化器を配置する結果によって
生じた所望のゲイン上に重畳された実際の達成ゲインを示すグラフである。
【図19】 フィードバックループの外側に配置された量子化器を示すALCデバイスの概
略ブロック図である。
【図20】 図19に示すALCデバイスの簡略化した形態の概略ブロック図である。
【図21a】 フィードバックループ中の量子化器によって過去のゲイン値を使用してALC
アルゴリズムのための符号領域ALCを実行する概略ブロック図である。
【図21b】 フィードバックループ外の量子化器によって過去のゲイン値を使用してALC
アルゴリズムのための符号領域ALCを実行する概略ブロック図である。
【図22】 EFRコーディックにおける隣接するRi値間の間隔、特にiに対するEFR
コーディックSLRP:(Ri+1−Ri)、を示すグラフである。
【図23a】 種々のビットが受信される時間およびバッファとして最も早い可能性がある復
号化が左から右に充填される時間を示す、EFR復号器の圧縮音声フレームの図
である。
【図23b】 種々のビットが受信される時間およびバッファとして最も早い可能性がある復
号化が左から右に充填される時間を示す、FR復号器の圧縮音声フレームの図で
ある。
【図24】 本発明に従って形成された符号領域ALCシステムの好ましい形状の概略ブロ
ック図である。
【図25】 GSM EFRにおけるSLRP量子化の好ましい形状の概略ブロック図であ
る。
【図26】 GSM EFRにおけるSLRP量子化の代替的形状の概略ブロック図である
【図27】 GSM EFRにおいてSLRPを再符号化するための好ましい形状の概略ブ
ロック図である。
【図28】 音声信号の一例を示すグラフである。
【図29a】 FRのためのCD−ALCによる音声レベル調整の一例を示すグラフである。
【図29b】 FRのためのCD−ALCによる音声レベル調整の一例を示すグラフである。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,MZ,SD,SL,SZ,TZ,UG ,ZW),EA(AM,AZ,BY,KG,KZ,MD, RU,TJ,TM),AE,AG,AL,AM,AT, AU,AZ,BA,BB,BG,BR,BY,BZ,C A,CH,CN,CR,CU,CZ,DE,DK,DM ,DZ,EE,ES,FI,GB,GD,GE,GH, GM,HR,HU,ID,IL,IN,IS,JP,K E,KG,KP,KR,KZ,LC,LK,LR,LS ,LT,LU,LV,MA,MD,MG,MK,MN, MW,MX,MZ,NO,NZ,PL,PT,RO,R U,SD,SE,SG,SI,SK,SL,TJ,TM ,TR,TT,TZ,UA,UG,US,UZ,VN, YU,ZA,ZW (72)発明者 マーコック,ダニエル ジェイ. アメリカ合衆国,ミシガン 49107,ブキ ャナン,ウエスト クリア レイク ロー ド 14984 Fターム(参考) 5D045 AB24 AB26 DA20 5J064 AA01 BA05 BB07 BC02 BC09 BC16 BC26 BC29 BD02 5K041 AA04 AA05 BB04 BB08 CC01 EE12 EE14 EE35 EE51

Claims (60)

    【特許請求の範囲】
  1. 【請求項1】 第一パラメータを含む所定の複数のパラメータからなる圧縮
    符号を使用するデジタル信号を伝送する通信システムであって、前記複数のパラ
    メータが、第一特性を含む複数の音声特性からなる音声信号を表示し、前記第一
    パラメータが、前記第一特性に関連し、前記圧縮符号が、前記第一特性に関連す
    る前記複数のパラメータを復号する第一復号ステップを含む複数の復号ステップ
    によって復号可能である、という通信システムにおいて、該第一特性を調整する
    装置であって、 前記デジタル信号に応答して、少なくとも前記第一パラメータを読み込み及び
    前記第一パラメータから導出される少なくとも第一パラメータ値を生成し、前記
    デジタル信号及び前記第一パラメータ値に応答して、前記第一特性の調整を表示
    する被調整第一パラメータ値を生成し、並びに前記被調整第一パラメータ値に応
    答して、被調整第一パラメータを導出し及び前記第一パラメータを前記被調整第
    一パラメータで置換するプロセッサ、を具備する装置。
  2. 【請求項2】 前記第一特性が前記音声信号のレベルからなる、請求項1に
    記載の装置。
  3. 【請求項3】 前記複数の復号ステップが、該第一特性の実質的変更を回避
    する少なくとも一つの復号ステップを更に具備し、かつ、前記プロセッサが、前
    記少なくとも一つの復号ステップを実行する、請求項1に記載の装置。
  4. 【請求項4】 前記少なくとも一つの復号ステップがポストフィルタリング
    からなる、請求項3に記載の装置。
  5. 【請求項5】 前記圧縮符号が線形予測符号からなる、請求項1に記載の装
    置。
  6. 【請求項6】 前記圧縮符号がレギュラパルス励起長期予測符号からなる、
    請求項1に記載の装置。
  7. 【請求項7】 前記デジタル信号が、複数のサブフレームを具備するフレー
    ムにて伝送され、かつ、前記第一パラメータが、前記サブフレームの一つに対し
    て符号ブックベクトル内の要素の最大絶対値からなる、請求項6に記載の装置。
  8. 【請求項8】 前記圧縮符号が、代数符号被励起線形予測符号からなる、請
    求項1に記載の装置。
  9. 【請求項9】 前記デジタル信号が、複数のサブフレームを具備するフレー
    ムにて伝送され、前記第一パラメータが、前記サブフレームの一つに対するゲイ
    ン補正ファクタからなる、請求項8に記載の装置。
  10. 【請求項10】 前記デジタル信号が、第一近端パラメータを含む所定の複
    数の近端パラメータからなる近端圧縮符号を使用する近端デジタル信号を具備し
    、前記近端パラメータが、近端第一特性を含む複数の近端音声特性を具備する近
    端音声信号を表示し、前記近端第一パラメータが、前記近端第一特性に関連付け
    られており、前記近端圧縮符号が、前記近端第一特性に関連する前記複数の近端
    パラメータを復号する第一復号ステップを含む複数の復号ステップによって復号
    可能であり、前記デジタル信号が、所定の複数の遠端パラメータからなる遠端圧
    縮符号を使用する遠端デジタル信号を更に具備し、前記複数の遠端パラメータが
    、遠端第一特性を含む複数の遠端音声特性を具備する遠端音声信号を表示し、前
    記遠端圧縮符号が、前記遠端第一特性に関連する前記遠端パラメータを復号する
    第一復号ステップを含む複数の復号ステップによって復号可能であり、 前記プロセッサが、前記近端デジタル信号及び前記遠端デジタル信号を受信し
    、 前記プロセッサが、前記近端デジタル信号に応答して、少なくとも前記近端第
    一パラメータを読み取り、及び、前記近端第一パラメータから導出される近端第
    一パラメータを生成し、 前記プロセッサが、前記近端デジタル信号に応答して、前記近端音声信号の前
    記近端第一特性に関連する近端被復号信号を生成すべく少なくとも前記第一復号
    ステップを実行し、 前記プロセッサが、前記遠端デジタル信号に応答して、前記遠端音声信号の前
    記遠端第一特性に関連する遠端被復号信号を生成すべく少なくとも前記第一復号
    ステップを実行し、 前記プロセッサが、前記近端被復号信号、前記遠端被復号信号及び前記近端第
    一パラメータ値に応答して、前記近端第一特性の調整を表示する被調整近端第一
    パラメータ値を生成し、 前記プロセッサが、前記被調整近端第一パラメータ値から被調整近端第一パラ
    メータを導出し、並びに、 前記プロセッサが、前記近端第一パラメータを前記被調整近端第一パラメータ
    で置換する、 請求項1に記載の装置。
  11. 【請求項11】 前記プロセッサが、前記被調整第一パラメータを導出する
    前に、オーバーフロー及びアンダーフロー状態に関して、前記被調整第一パラメ
    ータ値をテストする、請求項1に記載の装置。
  12. 【請求項12】 前記第一パラメータが被量子化第一パラメータであり、前
    記プロセッサが、前記被調整第一パラメータ値を量子化することによって前記被
    調整第一パラメータを導出する、請求項11に記載の装置。
  13. 【請求項13】 前記プロセッサが、前記量子化の間、差分スカラー量子化
    を使用する、請求項12に記載の装置。
  14. 【請求項14】 前記プロセッサが、前記量子化の間、フィードバックルー
    プ外の量子化器によって差分スカラー量子化を使用する、請求項13に記載の装
    置。
  15. 【請求項15】 前記第一パラメータが、時間を通して受信される一連の第
    一パラメータからなり、前記プロセッサが、前記デジタル信号に応答して、前記
    一連の第一パラメータを読み取り及び時間を通して一連の第一パラメータ値を生
    成し、並びに前記プロセッサが、前記被復号信号と少なくとも複数の前記一連の
    第一パラメータ値に応答して、前記被調整第一パラメータ値を生成する、請求項
    1に記載の装置。
  16. 【請求項16】 前記第一パラメータが被量子化第一パラメータであり、前
    記プロセッサが、前記被調整第一パラメータ値を量子化することによって前記被
    調整第一パラメータを導出する、請求項15に記載の装置。
  17. 【請求項17】 前記プロセッサが、前記量子化の間、差分スカラー量子化
    を使用する、請求項16に記載の装置。
  18. 【請求項18】 前記第一パラメータが被量子化第一パラメータであり、前
    記プロセッサが、前記被調整第一パラメータ値を量子化することによって前記被
    調整第一パラメータを導出する、請求項1に記載の装置。
  19. 【請求項19】 前記プロセッサが、前記量子化の間、差分スカラー量子化
    を使用する、請求項18に記載の装置。
  20. 【請求項20】 前記プロセッサが、即時スカラー量子化技術を使用して前
    記量子化を実行する、請求項18に記載の装置。
  21. 【請求項21】 前記圧縮符号が前記デジタル信号のフレーム内に配置され
    、前記フレームが、前記第一パラメータを各々具備する複数のサブフレームから
    なり、前記プロセッサが、前記デジタル信号に応答して、前記複数のサブフレー
    ムの各々から少なくとも前記第一パラメータを読み取り、前記プロセッサが、前
    記複数のサブフレームの各々内の前記被調整第一パラメータを用いて前記第一パ
    ラメータを置換する、請求項1に記載の装置。
  22. 【請求項22】 前記プロセッサが、より低い遅延を達成すべく、第一サブ
    フレームに続くサブフレームを処理する前に、第一サブフレームに対して、前記
    被調整第一パラメータで前記第一パラメータを置換する、請求項21に記載の装
    置。
  23. 【請求項23】 前記圧縮符号が前記デジタル信号のフレーム内に配置され
    、前記フレームが、前記第一パラメータを各々具備する複数のサブフレームから
    なり、前記プロセッサが、前記被復号信号を生成すべく前記サブフレームの第一
    の間、少なくとも前記第一復号ステップを実行して前記被復号信号を生成し、前
    記第一サブフレームに続いて出現する前記サブフレームの第二から前記第一パラ
    メータを読み取って前記第一パラメータ値を生成し、前記被復号信号及び前記第
    一パラメータ値に応答して前記被調整第一パラメータ値を生成し、前記第二サブ
    フレームの前記第一パラメータを前記被調整第一パラメータで置換する、請求項
    1に記載の装置。
  24. 【請求項24】 前記プロセッサが、少なくとも前記第一復号ステップを実
    行して前記音声信号の前記第一特性に関連する被復号信号を生成し、前記プロセ
    ッサが、前記被復号信号及び前記第一パラメータ値に応答して、前記被調整第一
    パラメータ値を生成する、請求項1に記載の装置。
  25. 【請求項25】 符号サンプルからなるデジタル信号を伝送する通信システ
    ムであって、前記符号サンプルが、圧縮符号を使用する第一ビット群及び線形符
    号を使用する第二ビット群から構成され、前記符号サンプルが音声信号を表示し
    、前記音声信号が、第一特性を含む複数の音声特性を有する、という通信システ
    ムにおいて、前記圧縮符号を復号することなく、該第一特性を調整する装置であ
    って、 前記第二ビット群に応答して、前記第一ビット群及び前記第二ビット群を調整
    することにより、前記第一特性を調整するプロセッサ、を具備する装置。
  26. 【請求項26】 前記線形符号がパルス符号変調(PCM)符号からなる、
    請求項25に記載の装置。
  27. 【請求項27】 前記第一特性が音声レベルからなる、請求項25に記載の
    装置。
  28. 【請求項28】 前記圧縮符号サンプルが、移動通信標準のための地球的シ
    ステムのタンデムフリー動作に従う、請求項25に記載の装置。
  29. 【請求項29】 前記第一ビット群が前記サンプルの二つの最下位ビットか
    らなり、前記第二ビット群が前記サンプルの6個の最上位ビットからなる、請求
    項25に記載の装置。
  30. 【請求項30】 前記6個の最上位ビットがPCM符号を構成する、請求項
    29に記載の装置。
  31. 【請求項31】 第一パラメータを含む所定の複数のパラメータからなる圧
    縮符号を使用してデジタル信号を伝送する通信システムであって、前記複数のパ
    ラメータが、第一特性を含む複数の音声特性を具備する音声信号を表示し、前記
    第一パラメータが、前記第一特性に関連し、前記圧縮符号が、前記第一特性に関
    連する前記複数のパラメータを復号する第一復号ステップを含む複数の復号ステ
    ップによって復号可能である、という通信システムにおいて、該第一特性を調整
    する方法であって、 前記デジタル信号に応答して少なくとも前記第一パラメータを読み取ることと
    、 前記第一パラメータから導出される少なくとも第一パラメータ値を生成するこ
    とと、 前記デジタル信号に応答して前記音声信号の前記第一特性に関連する被復号信
    号を生成すべく少なくとも前記第一復号ステップを実行することと、 前記デジタル信号及び前記第一パラメータ値に応答して前記第一特性の調整を
    表示する被調整第一パラメータ値を生成することと、 前記被調整第一パラメータ値に応答して被調整第一パラメータを導出すること
    と、 前記第一パラメータを前記被調整第一パラメータで置換することと、 を具備する方法。
  32. 【請求項32】 前記第一特性が前記音声信号のレベルからなる、請求項3
    1に記載の方法。
  33. 【請求項33】 前記複数の復号ステップが、該第一特性の実質的変更を回
    避する少なくとも一つの復号ステップを具備し、前記方法が、前記少なくとも一
    つの復号ステップを実行する、請求項31に記載の方法。
  34. 【請求項34】 前記少なくとも一つの復号ステップがポストフィルタリン
    グからなる、請求項33に記載の方法。
  35. 【請求項35】 前記圧縮符号が線形予測符号からなる、請求項31に記載
    の方法。
  36. 【請求項36】 前記圧縮符号がレギュラパルス励起長期予測符号からなる
    、請求項31に記載の方法。
  37. 【請求項37】 前記デジタル信号が、複数のサブフレームを具備するフレ
    ームにて伝送され、かつ、前記第一パラメータが、前記サブフレームの一つに対
    して符号ブックベクトル内の要素の最大絶対値からなる、請求項36に記載の方
    法。
  38. 【請求項38】 前記圧縮符号が、符号被励起線形予測符号からなる、請求
    項31に記載の方法。
  39. 【請求項39】 前記デジタル信号が、複数のサブフレームを具備するフレ
    ームにて伝送され、前記第一パラメータが、ゲイン補正ファクタからなる、請求
    項38に記載の方法。
  40. 【請求項40】 前記デジタル信号が、第一近端パラメータを含む所定の複
    数の近端パラメータからなる近端圧縮符号を使用する近端デジタル信号を具備し
    、前記近端パラメータが、近端第一特性を含む複数の近端音声特性を具備する近
    端音声信号を表示し、前記近端第一パラメータが、前記近端第一特性に関連付け
    られており、前記近端圧縮符号が、前記近端第一特性に関連する前記複数の近端
    パラメータを復号する第一復号ステップを含む複数の復号ステップによって復号
    可能であり、前記デジタル信号が、所定の複数の遠端パラメータからなる遠端圧
    縮符号を使用する遠端デジタル信号を更に具備し、前記複数の遠端パラメータが
    、遠端第一特性を含む複数の遠端音声特性を具備する遠端音声信号を表示し、前
    記遠端圧縮符号が、前記遠端第一特性に関連する前記遠端パラメータを復号する
    第一復号ステップを含む複数の復号ステップによって復号可能であり、 前記デジタル信号を前記受信することが、前記近端デジタル信号及び前記遠端
    デジタル信号を受信することからなり、 前記読み取ることが、少なくとも前記近端第一パラメータを読み取ることから
    なり、 第一パラメータを前記生成することが、前記近端第一パラメータから導出され
    る近端第一パラメータを生成することからなり、 少なくとも前記第一復号ステップを前記実行することが、前記近端デジタル信
    号に応答して、前記近端音声信号の前記近端第一特性に関連する近端被復号信号
    を生成すること、及び、前記遠端デジタル信号に応答して、前記遠端音声信号の
    前記遠端第一特性に関連する遠端被復号信号を生成することからなり、 被調整第一パラメータ値を前記生成することが、前記近端被復号信号、前記遠
    端被復号信号及び前記近端第一パラメータ値に応答して、前記近端第一特性の調
    整を表示する被調整近端第一パラメータ値を生成することからなり、 被調整第一パラメータを前記導出することが、前記被調整近端第一パラメータ
    値から被調整近端第一パラメータを導出することからなり、並びに、 前記置換することが、前記近端第一パラメータを前記被調整近端第一パラメー
    タで置換することからなる、 請求項31に記載の方法。
  41. 【請求項41】 前記被調整第一パラメータを導出する前に、オーバーフロ
    ー及びアンダーフロー状態に関して、前記被調整第一パラメータ値をテストする
    、請求項31に記載の方法。
  42. 【請求項42】 前記第一パラメータが被量子化第一パラメータであり、被
    調整第一パラメータを前記導出することが、前記被調整第一パラメータ値を量子
    化することからなる、請求項41に記載の装置。
  43. 【請求項43】 前記量子化の間、差分スカラー量子化を使用することを更
    に具備する、請求項42に記載の方法。
  44. 【請求項44】 差分スカラー量子化を前記使用することが、前記量子化の
    間、フィードバックループ外の量子化器を使用することからなる、請求項43に
    記載の方法。
  45. 【請求項45】 前記第一パラメータが、時間を通して受信される一連の第
    一パラメータからなり、少なくとも前記第一パラメータを前記読み取ることが、
    前記一連の第一パラメータを読み取ることからなり、第一パラメータ値を前記生
    成することが、時間を通して一連の第一パラメータ値を生成することからなり、
    被調整第一パラメータ値を前記生成することが、前記被復号信号と少なくとも複
    数の前記一連の第一パラメータ値に応答して、前記被調整第一パラメータ値を生
    成することからなる、請求項31に記載の方法。
  46. 【請求項46】 前記第一パラメータが被量子化第一パラメータであり、前
    記プロセッサが、被調整第一パラメータを前記導出することが、前記被調整第一
    パラメータ値を量子化することからなる、請求項45に記載の方法。
  47. 【請求項47】 前記量子化の間、差分スカラー量子化を使用することを更
    に具備する、請求項46に記載の方法。
  48. 【請求項48】 前記第一パラメータが被量子化第一パラメータであり、被
    調整第一パラメータを前記導出することが、前記被調整第一パラメータ値を量子
    化することからなる、請求項31に記載の方法。
  49. 【請求項49】 前記量子化の間、差分スカラー量子化を使用することを更
    に具備する、請求項48に記載の方法。
  50. 【請求項50】 前記量子化することが、即時スカラー量子化技術を使用す
    ることからなる、請求項48に記載の方法。
  51. 【請求項51】 前記圧縮符号が前記デジタル信号のフレーム内に配置され
    、前記フレームが、前記第一パラメータを各々具備する複数のサブフレームから
    なり、少なくとも前記第一パラメータを前記読み取ることが、前記複数のサブフ
    レームの各々から少なくとも前記第一パラメータを読み取ることからなり、前記
    置換することが、前記複数のサブフレームの各々内の前記被調整第一パラメータ
    を用いて前記第一パラメータを置換することからなる、請求項31に記載の方法
  52. 【請求項52】 前記置換することが、より低い遅延を達成すべく、第一サ
    ブフレームに続くサブフレームを処理する前に、第一サブフレームに対して、前
    記被調整第一パラメータで前記第一パラメータを置換することからなる、請求項
    51に記載の方法。
  53. 【請求項53】 前記圧縮符号が前記デジタル信号のフレーム内に配置され
    、前記フレームが、前記第一パラメータを各々具備する複数のサブフレームから
    なり、少なくとも前記第一復号ステップを前記実行することが、前記被復号信号
    を生成すべく前記サブフレームの第一の間、少なくとも前記第一復号ステップを
    実行することからなり、少なくとも前記第一パラメータを前記読み取ることが、
    前記第一サブフレームに続いて出現する前記サブフレームの第二から少なくとも
    前記第一パラメータを読み取ることからなり、第一パラメータを前記生成するこ
    とが、前記被復号信号及び前記第一パラメータ値に応じて前記被調整第一パラメ
    ータ値を生成することからなり、前記置換することが、前記第二サブフレームの
    前記第一パラメータを前記被調整第一パラメータで置換することからなる、請求
    項31に記載の方法。
  54. 【請求項54】 被調整第一パラメータを前記生成することが、前記圧縮符
    号に応答して前記音声信号の前記第一特性に関連する被復号信号を生成すべく少
    なくとも前記第一復号ステップを実行することからなり、被調整第一パラメータ
    を前記生成することが、前記被復号信号及び前記第一パラメータ値に応答するも
    のである、請求項31に記載の装置。
  55. 【請求項55】 符号サンプルからなるデジタル信号を伝送する通信システ
    ムであって、前記符号サンプルが、圧縮符号を使用する第一ビット群及び線形符
    号を使用する第二ビット群から構成され、前記符号サンプルが音声信号を表示し
    、前記音声信号が、第一特性を含む複数の音声特性を有する、という通信システ
    ムにおいて、前記圧縮符号を復号することなく、該第一特性を調整する方法であ
    って、 前記第二ビット群に応答して、前記第一ビット群及び前記第二ビット群を調整
    することにより、前記第一特性を調整すること、を具備する方法。
  56. 【請求項56】 前記線形符号がパルス符号変調(PCM)符号からなる、
    請求項55に記載の方法。
  57. 【請求項57】 前記第一特性が音声レベルからなる、請求項55に記載の
    方法。
  58. 【請求項58】 前記圧縮符号サンプルが、移動通信標準のための地球的シ
    ステムのタンデムフリー動作に従う、請求項55に記載の方法。
  59. 【請求項59】 前記第一ビット群が前記サンプルの二つの最下位ビットか
    らなり、前記第二ビット群が前記サンプルの6個の最上位ビットからなる、請求
    項55に記載の方法。
  60. 【請求項60】 前記6個の最上位ビットがPCM符号を構成する、請求項
    59に記載の方法。
JP2001508064A 1999-07-02 2000-06-30 圧縮音声の符号領域適応レベル制御 Pending JP2003503760A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14213699P 1999-07-02 1999-07-02
US60/142,136 1999-07-02
PCT/US2000/018293 WO2001003317A1 (en) 1999-07-02 2000-06-30 Coded domain adaptive level control of compressed speech

Publications (1)

Publication Number Publication Date
JP2003503760A true JP2003503760A (ja) 2003-01-28

Family

ID=22498680

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2001508063A Pending JP2003533902A (ja) 1999-07-02 2000-06-30 符号化されたドメインのエコーの制御
JP2001508064A Pending JP2003503760A (ja) 1999-07-02 2000-06-30 圧縮音声の符号領域適応レベル制御
JP2001508667A Pending JP2003504669A (ja) 1999-07-02 2000-06-30 符号化領域雑音制御

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2001508063A Pending JP2003533902A (ja) 1999-07-02 2000-06-30 符号化されたドメインのエコーの制御

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2001508667A Pending JP2003504669A (ja) 1999-07-02 2000-06-30 符号化領域雑音制御

Country Status (5)

Country Link
EP (3) EP1190494A1 (ja)
JP (3) JP2003533902A (ja)
AU (3) AU6063600A (ja)
CA (3) CA2378012A1 (ja)
WO (3) WO2001003316A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008294990A (ja) * 2007-05-28 2008-12-04 Panasonic Electric Works Co Ltd 音声伝送システム
JP2008292961A (ja) * 2007-05-28 2008-12-04 Panasonic Electric Works Co Ltd 音声伝送システム
JP2008292960A (ja) * 2007-05-28 2008-12-04 Panasonic Electric Works Co Ltd 音声伝送システム

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1301018A1 (en) * 2001-10-02 2003-04-09 Alcatel Apparatus and method for modifying a digital signal in the coded domain
JP3946074B2 (ja) * 2002-04-05 2007-07-18 日本電信電話株式会社 音声処理装置
JP3876781B2 (ja) 2002-07-16 2007-02-07 ソニー株式会社 受信装置および受信方法、記録媒体、並びにプログラム
EP1521242A1 (en) * 2003-10-01 2005-04-06 Siemens Aktiengesellschaft Speech coding method applying noise reduction by modifying the codebook gain
US7613607B2 (en) 2003-12-18 2009-11-03 Nokia Corporation Audio enhancement in coded domain
US8874437B2 (en) 2005-03-28 2014-10-28 Tellabs Operations, Inc. Method and apparatus for modifying an encoded signal for voice quality enhancement
WO2007053086A1 (en) * 2005-10-31 2007-05-10 Telefonaktiebolaget Lm Ericsson (Publ) Reduction of digital filter delay
US7852792B2 (en) * 2006-09-19 2010-12-14 Alcatel-Lucent Usa Inc. Packet based echo cancellation and suppression
WO2009029076A1 (en) * 2007-08-31 2009-03-05 Tellabs Operations, Inc. Controlling echo in the coded domain
WO2012106926A1 (zh) 2011-07-25 2012-08-16 华为技术有限公司 一种参数域回声控制装置和方法
TWI469135B (zh) * 2011-12-22 2015-01-11 Univ Kun Shan 調適性差分脈衝碼調變編碼解碼的方法
JP6011188B2 (ja) * 2012-09-18 2016-10-19 沖電気工業株式会社 エコー経路遅延測定装置、方法及びプログラム
EP3651365A4 (en) * 2017-07-03 2021-03-31 Pioneer Corporation SIGNAL PROCESSING DEVICE, CONTROL PROCESS, PROGRAM, AND INFORMATION SUPPORT

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143197A (ja) * 1996-11-06 1998-05-29 Matsushita Electric Ind Co Ltd 再生装置
JPH10178350A (ja) * 1996-12-19 1998-06-30 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声データの符号化レート変換方法および装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0683114B2 (ja) * 1985-03-08 1994-10-19 松下電器産業株式会社 エコ−キヤンセラ
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US5140543A (en) * 1989-04-18 1992-08-18 Victor Company Of Japan, Ltd. Apparatus for digitally processing audio signal
US5097507A (en) * 1989-12-22 1992-03-17 General Electric Company Fading bit error protection for digital cellular multi-pulse speech coder
US5680508A (en) * 1991-05-03 1997-10-21 Itt Corporation Enhancement of speech coding in background noise for low-rate speech coder
JP3353257B2 (ja) * 1993-08-30 2002-12-03 日本電信電話株式会社 音声符号化復号化併用型エコーキャンセラー
US5828995A (en) * 1995-02-28 1998-10-27 Motorola, Inc. Method and apparatus for intelligible fast forward and reverse playback of time-scale compressed voice messages
JPH0954600A (ja) * 1995-08-14 1997-02-25 Toshiba Corp 音声符号化通信装置
JPH0993132A (ja) * 1995-09-27 1997-04-04 Toshiba Corp 符号化・復号化装置及び方法
US5943645A (en) * 1996-12-19 1999-08-24 Northern Telecom Limited Method and apparatus for computing measures of echo
US6064693A (en) * 1997-02-28 2000-05-16 Data Race, Inc. System and method for handling underrun of compressed speech frames due to unsynchronized receive and transmit clock rates
JP3317181B2 (ja) * 1997-03-25 2002-08-26 ヤマハ株式会社 カラオケ装置
US6112177A (en) * 1997-11-07 2000-08-29 At&T Corp. Coarticulation method for audio-visual text-to-speech synthesis
CA2636552C (en) * 1997-12-24 2011-03-01 Mitsubishi Denki Kabushiki Kaisha A method for speech coding, method for speech decoding and their apparatuses

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143197A (ja) * 1996-11-06 1998-05-29 Matsushita Electric Ind Co Ltd 再生装置
JPH10178350A (ja) * 1996-12-19 1998-06-30 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声データの符号化レート変換方法および装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008294990A (ja) * 2007-05-28 2008-12-04 Panasonic Electric Works Co Ltd 音声伝送システム
JP2008292961A (ja) * 2007-05-28 2008-12-04 Panasonic Electric Works Co Ltd 音声伝送システム
JP2008292960A (ja) * 2007-05-28 2008-12-04 Panasonic Electric Works Co Ltd 音声伝送システム

Also Published As

Publication number Publication date
AU6203300A (en) 2001-01-22
CA2378012A1 (en) 2001-01-11
WO2001002929A3 (en) 2001-07-19
CA2378035A1 (en) 2001-01-11
AU6063600A (en) 2001-01-22
JP2003504669A (ja) 2003-02-04
EP1190495A1 (en) 2002-03-27
WO2001002929A2 (en) 2001-01-11
EP1190494A1 (en) 2002-03-27
JP2003533902A (ja) 2003-11-11
CA2378062A1 (en) 2001-01-11
WO2001003316A1 (en) 2001-01-11
AU6067100A (en) 2001-01-22
EP1208413A2 (en) 2002-05-29
WO2001003317A1 (en) 2001-01-11

Similar Documents

Publication Publication Date Title
RU2325707C2 (ru) Способ и устройство для эффективного маскирования стертых кадров в речевых кодеках на основе линейного предсказания
US7362811B2 (en) Audio enhancement communication techniques
US5794199A (en) Method and system for improved discontinuous speech transmission
US20060215683A1 (en) Method and apparatus for voice quality enhancement
US20070160154A1 (en) Method and apparatus for injecting comfort noise in a communications signal
JP2003503760A (ja) 圧縮音声の符号領域適応レベル制御
US6026356A (en) Methods and devices for noise conditioning signals representative of audio information in compressed and digitized form
US20060217969A1 (en) Method and apparatus for echo suppression
US20060217972A1 (en) Method and apparatus for modifying an encoded signal
US8874437B2 (en) Method and apparatus for modifying an encoded signal for voice quality enhancement
US20060217970A1 (en) Method and apparatus for noise reduction
US20060217988A1 (en) Method and apparatus for adaptive level control
US20060217983A1 (en) Method and apparatus for injecting comfort noise in a communications system
US20040243404A1 (en) Method and apparatus for improving voice quality of encoded speech signals in a network
US20060217971A1 (en) Method and apparatus for modifying an encoded signal
US20030065507A1 (en) Network unit and a method for modifying a digital signal in the coded domain
JP2003533902A5 (ja)
EP1020848A2 (en) Method for transmitting auxiliary information in a vocoder stream
JP3074680B2 (ja) 音声復号器のポスト雑音整形フィルタ
US20040054529A1 (en) Transmitter and receiver for speech coding and decoding by using additional bit allocation method
Chandran et al. Compressed domain noise reduction and echo suppression for network speech enhancement
US7584096B2 (en) Method and apparatus for encoding speech
CN100369108C (zh) 编码域中的音频增强的方法和设备
JP3163567B2 (ja) 音声符号化通信方式及びその装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070629

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100727

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101026

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101102

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110329