JP2003503760A - 圧縮音声の符号領域適応レベル制御 - Google Patents
圧縮音声の符号領域適応レベル制御Info
- Publication number
- JP2003503760A JP2003503760A JP2001508064A JP2001508064A JP2003503760A JP 2003503760 A JP2003503760 A JP 2003503760A JP 2001508064 A JP2001508064 A JP 2001508064A JP 2001508064 A JP2001508064 A JP 2001508064A JP 2003503760 A JP2003503760 A JP 2003503760A
- Authority
- JP
- Japan
- Prior art keywords
- parameter
- adjusted
- characteristic
- code
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B3/00—Line transmission systems
- H04B3/02—Details
- H04B3/20—Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/0001—Systems modifying transmission characteristics according to link quality, e.g. power backoff
- H04L1/0014—Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the source coding
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Quality & Reliability (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Abstract
Description
された仮出願第60/142,136号に対応する実際の出願である。
び符号領域中のノイズ削減に関する。
符号化を必要とする。このような方法が図1に示されており、この方法は非常に
費用を要する方法である。更に、符号化処理は往々にして、音声強調方法よりも
一桁計算機的に集約したものである。
上の音声においてますます使用されるようになっている。線形領域中で操作され
るこれまでのネットワーク音声強調技術は、幾つかの欠点を有している。例えば
、線形領域において動作するこれまでのネットワーク音声強調技術は、圧縮音声
の復号化を必要とし、これによって、必要な音声強調と再符号化を実行する。こ
の処理は計算機的に集約されたものであり、特に余計な量子ノイズを発生する傾
向があり、さらに余計な遅延をも生じる。
要な問題である。電話通信の顧客は、彼らの会話の理解を最大とするために快適
な視聴レベルを期待する。電話機から伝送された音声レベルは話し手の音量およ
びマイクに対する話し手の位置によって決まる。若し、電話機において音量制御
が可能であると、聞き手は音量を望ましいレベルまで手操作で調整する。しかし
ながら、歴史的な理由で、殆どの電話機は音量調節器を有していない。更に、聞
き手による直接の音量制御は、ネットワーク機器に対して適正なレベルを維持す
る必要性を指摘するものではない。更に、特に車両中の移動電話の場合において
、技術がハンドフリー電話機の方向に向かって進んでいるので、手操作による調
整は車両の運転者にとって面倒であり潜在的に危険でもある。
り、電話機の製造者は通常、このような責任を追うことに対して比較的小さな役
割を演じてきた。伝統的にネットワークサービスプロバイダは、音声レベルに関
して機器とネットワークに対し厳格な仕様を提供して来た。しかしながら、国際
的な音声トラフィックの増加、規制緩和、激しい競争および顧客の大きな期待に
よって、ネットワークサービスプロバイダは、他のネットワークにおいて使用さ
れている仕様および機器に対して余り影響を与えることなく、適正な音声レベル
を確保する必要がある。
な、新しい技術およびプロトコルの広い導入によって、ネットワークにおける音
声レベルの制御は更に複雑化している。その主な理由の一つは、伝送経路上の音
声コーデック(符号器−復号器対)として知られる音声圧縮デバイスの存在であ
る。音声信号の自動レベル制御(ALC)は、音声コーデックが伝送経路上に存
在するとより困難になり、一方、線形領域中ではデジタル音声サンプルが直接処
理に対して適用可能である。
Cデバイスは(ポートSinの)近端音声信号を処理する。(ポートRinの)
遠端信号はダブルトークを決定するために使用される。ALCデバイス202は
、一般的な伝送ネットワークにおいてデジタルの近端音声信号を処理し、さらに
現在の音声レベルを測定することによって、目的とする音声レベルを得るために
必要なゲインを決定する。適切なゲインを決定するために、多くのアルゴリズム
が考案されている。例えば、ALCデバイスは音声機能検出器を使用することが
可能で、さらに音声バーストの最初の段階でのみ新しいゲイン値を適用すること
ができる。更に、ゲインの最大値および最小値、さらにゲインの最大変化率を考
慮することもできる。一般に、ALCデバイスは、(1)現在の音声レベルを決
定するために近端信号上の出力測定用構成の何らかの形体を使用し、(2)音声
バーストの境界を決定する為に近端信号上で音声機能検出器を使用し、更に(3
)近端信号がエコーを含んでいるか否かを決定する為に近端および遠端信号上で
恐らくダブルトーク検出器を使用する。
ルを得るために必要なゲインを決定する。デジタル化された各音声サンプルにゲ
インファクタが掛け合わされる。ダブルトーク情報は、エコーに基づいてゲイン
ファクタを間違って調整することを防ぐ為に使用される。レベル制御の為のTe
llabsアルゴリズム/製品は、ALC、スカルプチャードサウンド(SS)
および新TLC(Tellabsレベルコントロール)を含んでいる。これらの
アルゴリズムは、線形/PCM信号上で直接動作するため線形領域アルゴリズム
として分類される。
るグローバルシステム(GSM)デジタルセル方式ネットワークにおいて展開さ
れるであろう。TFO標準は移動体から移動体への通話に適用される。TFOに
おいて、音声信号は、短い交渉期間の後で、移動体間で圧縮形状において伝達さ
れる。圧縮された音声はTFOフレーム中に含まれており、このフレームはネッ
トワークにおいてトランスコーダをバイパスする。これは、移動体から移動体へ
の通話の間のタンデム音声コーディックを排除する。このタンデムコーデックの
排除は、オリジナルの信号がきれいな場合に音声品質を向上するものとして知ら
れている。きれいな音声の場合であっても、音声レベルを適切な音量のレーザに
調整することが依然として希望される。このようなレベル制御のための従来の方
法は、音声の復号化、処理および再符号化を必要とし、その結果タンデム化を招
聘し、かつ計算機的に集約されたものとなる。符号領域アプローチはこのような
タンデム化を回避し、完全な再符号化の必要性を排除する。この明細書は、符号
領域における音声レベル制御の方法を説明する。特に、GSM FRおよびEF
R符号器に関連するレベル制御に注意が向けられている。
ステムにおいて有用であり、この圧縮符号は第一のパラメータを含む予め決めら
れた複数のパラメータを含み、このパラメータは第一の特性を含む複数のオーデ
ィオ特性を備える1個のオーディオ信号を示し、前記第一のパラメータは前記第
一の特性に関係し、前記圧縮符号は前記第一の特性に関連したパラメータを復号
化するための第一の復号化ステップを含み、複数の復号化ステップによって復号
される。このような環境において、第一の特性は、デジタル信号に応答してすく
なくとも第一のパラメータを読み取ることによって調整され得る。少なくとも第
一のパラメータ値が第一のパラメータから導出される。第一の特性の調整を表す
調整された第一のパラメータ値は、デジタル信号と第一のパラメータ値に応答し
て生成される。調整された第一のパラメータは、調整された第一のパラメータ値
に応答して導出され、さらに圧縮符号の第一のパラメータは調整された第一のパ
ラメータによって置き換えられる。読み取り、導出、生成および置き換えのステ
ップは、プロセッサによって実行される。上述の技術の結果、第一の特性を調整
する為に必要な遅延が減少する。
第二のビットを含む符号サンプルを備えるデジタル信号を伝送するための通信シ
ステムにおいて有用である。符号サンプルは第一の特性を含む複数のオーディオ
特性を有するオーディオ信号を表す。このような環境において、第一の特性は、
圧縮符号を復号化することなく、第一のビットと第二のビットを第二のビットに
応答して調整することにより調整することができる。この調整は好ましくはプロ
セッサによって実行される。
実施例に限定されるものでないことを理解すべきである。反対に、本発明は、添
付の請求の範囲の精神および範囲に含まれるものとして、全ての代替事例、修正
および等価事例を含む。
ommunication system(Phase 2);Full ra
te speech;Part 2:Transcoding”,1998年3
月 [2]GSM06.10“Digital cellular telec
ommunication system(Phase 2);Enhance
d Full rate(EFR) speech transcoding”
,1998年6月 [3]ITU−T Recommendation G.169 Draf
t 7,“Automatic Level Control Devices
”,1998年7月
る。このようなデジタル(即ち、離散時間型計数値)信号はこの明細書において
、線形領域または線形モードであるとして言及される。このような線形領域信号
における音声レベルの調整は、所望の目標音声レベルを達成する為に、適当なゲ
インファクタを信号の各サンプルに掛け合わせることによって達成される。
端信号中に存在する。このようなエコーがかなりの出力を有し、かつエコーキャ
ンセラーによってキャンセルされていない場合、さらにダブルトーク検出器が必
要とされる。これは、ゲインが遠端音声信号のエコーによって不意に増加しない
ことを保証する。
送の前に例えばパルス符号変調(PCM)のような基本形態の圧縮を受ける。こ
のような圧縮構成は計算処理および遅延に関して非常に安価である。圧縮された
デジタルサンプルを線形領域に変換すること、線形サンプルを処理すること、お
よびその後処理されたサンプルを伝送の前に圧縮することは、ALCデバイスに
とって比較的簡単な事柄である。これ自体、これらの信号は線形領域中に存在す
ると見なすことが効果的である。本出願の文脈において、圧縮または符号化され
た音声とは、計算機上のかなりの複雑さを必要とする進んだ圧縮技術を使用して
圧縮された音声を示す。
以下のものを意味する。 線形符号:線形符号によって、オーディオ信号の各サンプルに対して1個の
符号化されたパラメータまたは符号化されたサンプルを生じる圧縮技術を意味す
る。線形符号の例としては、PCM(A−lawおよびμ−law)ADPCM
(適応型差分パルス符号変調)およびデルタ変調がある。 圧縮符号:圧縮符号によって、オーディオ信号の各サンプルに対して1個以
下の符号化されたパラメータを結果として生じる技術を意味する。普通、圧縮符
号は、オーディオ信号サンプルの各ブロックまたはフレームに対して符号化され
たパラメータの小さなセットを結果として生じる。圧縮符号の例として、GSM
ボコーダ(HR,FR,EFR)のような線形予測符号化ベースのボコーダがあ
る。
して言及される。音声符号化は、音声伝送のために必要な帯域幅を最小化するた
めに実行される。これは特に、帯域幅が乏しいリソースである無線電話機におい
て重要である。比較的帯域幅が豊富なパケットネットワークであっても、音声符
号化は、ネットワーク遅延とジッタを最小化するために重要である。これは、デ
ータとは異なって、音声通信は遅延に対する許容度が小さいからである。パケッ
トサイズが小さいほど、パケットネットワークを通した伝送を容易にする。幾つ
かの産業標準の音声コーディック(符号器−復号器対)を参考のために表1に列
挙する。
と言及する。音声フレームが与えられると、音声符号器は、音声合成モデルのた
めのパラメータの小セットを決定する。これらの音声パラメータおよび音声合成
モデルによって、オリジナルの音声フレームに非常に似て見えかつ似て響く音声
フレームが再構成される。この再構成は音声復号器によって実行される。殆どの
音声符号器において、符号化のプロセスは復号化のプロセスよりもかなり計算機
的に集約されたものであることに注意する必要がある。さらに、優れた品質の音
声符号化を達成するために必要なMIPは非常に高価である。デジタル信号処理
チップセットの処理能力は、近年に於いて、セルラー方式の電話ハンドセットの
ような応用において、音声符号の幅広い使用を可能とするに十分な程、進歩して
いる。
存している。例えば、表1の符号器は線形予測符号化(LPC)モデルを使用す
る。LPC音声合成モデルの簡略化したブロック図を図3に示す。このモデルは
、モデルパラメータを適正に特定することによって、音声に似た信号を生成する
ために使用することができる。この音声合成例において、パラメータは、時間変
化フィルタ係数、ピッチ間隔、励起ベクトルおよびゲインファクタを含む。基本
的に、励起ベクトル、c(n)、はゲインファクタ、G、によってまず拡大縮小
される。その結果は、次にピッチ合成フィルタによってフィルタされる。ピッチ
合成フィルタのパラメータは、全励起ベクトル、u(n)、を獲得する為に、ピ
ッチゲイン、gp、およびピッチ期間、T、を含む。このベクトルはその後、L
PC合成フィルタによってフィルタされる。多重バンド励起モデルのような他の
モデルを同様に音声符号化において使用する。この文意において、音声パラメー
タは推定されたモデルと共に、圧縮を達成するためにデジタル音声信号中の冗長
度を取り除く手段を提供することに十分注意する必要がある。
変更することを含んでいる。
の幾つかのパラメータは、そのフレームに対する音声信号のスペクトルおよび/
または波形に関係している。これらのパラメータは、LPC音声合成モデルの場
合、通常、LPC係数およびピッチ情報を含んでいる。スペクトル情報を提供す
るこれらのパラメータに加えて、音声フレームの出力またはエネルギに直接関係
するパラメータが、通常、存在する。これらの音声レベル関連パラメータ(SL
RP)は、符号化された音声のALCを実行する為のキイである。以下に、この
ようなSLRPの幾つかの例を示す。
のコーディックは、全て、8kHzでサンプルされた音声を処理し、かつこのサ
ンプルが13ビット線形PCM値として獲得されたものであることを仮定してい
る。フレーム長は160サンプル(20ms)である。更に、それらは各フレー
ムを、それぞれが40サンプルの4個のサブフレームに分割する。これらのコー
ディックに対するSLRPを表2にリストする。
およびEFR符号器)あるいはフレームに付き一回(例えばGSM HRコーデ
ィック)特定される。
ラット記号を有さない変数は、量子化されていない値と量子化された値を示すも
のとして使用される。例えば、γgcおよび、
されたゲイン補正ファクタである。ALCデバイスにおいては、量子化されたS
LRP、
、即ち
て、ルックアップテーブルまたは式を使用して量子化された値のインデックスを
決定することを含めて、幾分自由に使用している。
しながら、我々は、適正なルックアップテーブルまたは式を用いて与えられたイ
ンデックスを対応する量子化値に変換することを示すために、‘逆’量子化関数
、Q-1(.)を使用する。
では、デジタル音声サンプルは処理のために直接用いられる。符号領域は音声符
号器の出力または音声復号器の入力を参照する。これらはチャンネルエラーが無
い場合、同一であるはずである。この文脈において、符号領域は音声パラメータ
とこれらのパラメータを量子化または逆量子化するたに用いられる、両方法を含
む。符号器によって決定される音声パラメータは伝送に先立って量子化プロセス
を経る。この量子化は、オリジナルのデジタル音声信号によって必要とされるも
のよりも低いビットレートを達成するために重要である。量子化プロセスは往々
にしてルックアップテーブルの使用を含んでいる。更に、異なる音声パラメータ
を異なる技術を用いて量子化することができる。
、各パラメータに対して量子化器によって許された量子化値の異なるセットに修
正することを含む。ALCの場合、修正されるパラメータはSLRPである。図
2の線形領域ALC構成に対する対応する符号領域が、図5に示される。図示す
る2方向の伝送に使用されるコーディックは同じ物でなくてよいことに注意すべ
きである。更に、使用されたコーディックは時間の変化と共に変化する。従って
符号領域ALCアルゴリズムは、このような変化する状況で安定して動作するこ
とが好ましい。
トが共に量子化される場合、このプロセスはベクトル量子化と呼ばれる。ベクト
ル量子化は通常、LPC係数のユニットに何らかの方法で互いに関連しているパ
ラメータセットに適用される。スカラー量子化は一般に、他のパラメータに対し
て比較的独立したパラメータに適用される。両者の量子化方法の混合が可能であ
る。SLRPが普通スカラー量子化であるため、最も一般的に使用されるスカラ
ー量子化技術に着目する。
の過去及び将来の値から独立している。パラメータの現在値のみが量子化プロセ
スで使用される。量子化されるべきパラメータは、許された量子化レベルのセッ
トと比較される。あるきわどい値に基づいて与えられたパラメータに最も一致す
る量子化レベルが、そのパラメータを表すために選択される。普通、許された量
子化レベルは符号器および復号器の両者におけるルックアップテーブル内に格納
される。選択された量子化レベルのテーブルへのインデックスは符号器によって
復号器に送信される。代替的に、インデックスを与えると、量子化レベルは数式
を用いて決定することができる。量子化レベルは、SLRPの場合、普通均一で
はない間隔を有している。例えば、[0,32767]の範囲を有するGSM
FRコーディックにおけるブロック最大値、xmax、は、図6に示す様に64レ
ベルに量子化される。この量子化構成において、xmaxに最も近いがこれ以上で
あるレベルが選択される。量子化レベルを表す垂直軸は対数スケールでプロット
されていることに注意する必要がある。
大きな量子化エラーを蒙る。従って、適応型量子化器が音声符号化において、大
きな計算複雑性のコストにおいて量子化エラーを最小とするために、往々にして
使用される。適用型量子化器は前方適応または後方適用を使用する。前方適用構
成において、ダイナミックレンジに関する特別の副情報は、量子化テーブルイン
デックスに加えて復号器に周期的に送信され無ければならない。この結果、この
ような構成は普通、音声符号器において使用されない。如何なる副情報を伝送す
ることも必要が無いので、後方適応型量子化器が好ましい。一般に、2個の普遍
的なタイプの後方適応型量子化器が使用される。これらは、標準偏差ベースおよ
び作動量子化器である。これらを図7に示す。
標準偏差が現在のパラメータ値γ(n)に対する正規化ファクタを決定する為に
使用される。正規化ファクタはγ(n)を量子化に先立って分割する。この正規
化手順は量子化関数Q(.)が単位変数に対して設計されることを可能とする。
正規化されかつ量子化された値、
セスが実行される。正規化および反正規化プロセスが両立する為には、正規化フ
ァクタの量子化形状が、量子化器および反量子化器の両者において使用される。
この構造の変形において、量子化間隔の拡張または圧縮の決定は、単純に以前の
パラメータ入力のみに基づいている。
値間の相関関係が、有効に使用される。相関関係が高い場合、量子化ダイナミッ
クレンジにおける相当の削減が、予測エラー、r(n)を量子化することによって
達成される。予測エラーは、実際のパラメータ値と予測パラメータ値の間の差で
ある。同じ予測子γ(n)が量子化器および反量子化器の両者に対して使用される
べきである。以下の式で示される線形予測子P(z)が通常使用される。
とが明白である。変換関数P(z)/[1−P(z)]を線形予測子、
相関ファクタ、γgc、関数の量子化のために、GSMEFRコーディックによっ
て使用される。このコーディックにおいて、固定係数[b1,b2,b3,b4
]=[0.68,0,58,0.34,0.19]を有する4次の線形予測子が
、符号器および復号器の両者において使用される。
ルを評価する為に使用される。このゲインファクタは全体の信号レベルを決定す
る。このパラメータの量子化は図8に示す構成を利用しているが、その利用は間
接的である。実際の送信される‘ゲイン’パラメータは、事実上gc(n)と予測さ
れたゲインgc’(n)の間の相関ファクタである。
クセス可能な全体の音声レベルに関連する唯一のパラメータであるため、実際の
SLRPと見なされる。
これはγgc(n)を得るために予測ゲインによって除算される。予測ゲインは、
するルックアップテーブルインデックスが復号器に送信される。式(3)におい
て、
起ベクトルが得られると、符号器が式(3)を用いたのと同じ方法で、復号器は
予測ゲインを得ることができる。相関ファクタ
のために図9においては省略されている。好ましいALC技術はチャンネルエラ
ーレートに影響しないので、送信及び受信パラメータは同じ物であると仮定して
いる。検出されていないかまたは相関しないエラーはALCが実行されるか否か
にかかわらずノイズの多い復号音声を生じる結果となるので、この仮定は有効で
ある。
エネルギを用いて間接的に実行される。E(n)は、サブフレームnにおける平均
除去励起ベクトルエネルギを(dBで)意味し、
E1(n)、即ち
れる。励起ベクトルの復号は、SLRPの復号に関係しないことに注意すべきで
ある。E(n)が、ゲインファクタgcの関数であることがわかる。γgc(n)の
するために使用され、それによって復号器において合成される信号の全体のレベ
ルを設定する。
一に、復号器は励起ベクトルを復号し、E1(n)を式(6)を用いて計算する。第
二に、予測エネルギを、式(7)を用いて以前に復号化されたゲイン相関ファク
タを用いて計算する。次に、予測ゲインg'(c)が式(3)を用いて計算される。
次に、現在のサブフレームに関して相関ファクタの受信されたインデックスを、
ルックアップテーブルから、
は対数スケールでプロットされていることに注意すべきである。
ために幾つかのアプローチが工夫されている。図5は符号化音声上で動作するA
LCデバイスの好ましい位置を示している。この図を参照して、ALCデバイス
の可能な実施方法について以下に議論する。
子化に向かって復号され、ALCは通常の方法で線形量子化信号上で実行される
。その後線形音声は再符号化される。上述したように、このような技術は、MI
P、処理およびバッファ遅延に関して非常に費用がかかる。符号化プロセスは普
通復号プロセスよりも一桁よけいに費用がかかることに注意する必要がある。符
号化プロセスは、復号信号中に観測されうる量子化ノイズを付加する。このアプ
ローチでは、2個の符号器−復号器対がタンデムに配置されているが、量子化ノ
イズはほぼ2倍となる(ALCデバイスゲインが1の場合)。これによって、音
声品質に望ましくない劣化が生じる。
を工夫することは非常に有益である。これによって、レベル修正音声信号の全再
符号化に関する計算の複雑性および品質劣化を回避することができる。SLRP
のみを修正する新規な符号領域ALCアプローチを、図12に示す。ALCアル
ゴリズムの詳細は使用した特定のコーディックによることに注意すべきである。
しかしながら、此処で説明したアプローチは一般に全てのコーディックに適用可
能である。
)から復号(即ち、読み出し)され、ALCアルゴリズムによって決定されるゲ
インファクタが乗算(即ち、調節)される。(この乗算の後、SLRPは調整済
みSLRP値とみなされる。)その結果は、次に再量子化される(即ち、調整済
みSLRPを形成する)。符号領域信号は、SLRPにおける変化を反映するよ
うに適正に修正される。(例えば、調整済みSLRPはオリジナルのSLRPに
対して置き換えられる。)例えば、符号領域信号上に使用されるエラー保護の全
形態は適正に回復されねばならない。ALCデバイスは、SLRPに適用される
べきゲインを決定する為に、音声レベル、音声活動およびダブルトーク活動の測
定を必要とする。このことは、符号領域信号をある程度復号することを必要とす
る。
が必要である。十分に正確な音声レベル、音声活動およびダブルトーク測定を得
るために重要なその他のパラメータと同様に、SLRPを抽出(即ち、読み出す
)するために必要な程度に、音声が復号化される。部分的復号で十分な場合、次
のような状況を一例として含む。
号上で、ポストフィルタリングプロセス(即ち復号化ステップ)を実行する。こ
のポストフィルタリングは量子化ノイズを削減する助けとなるが、しかし信号の
出力レベル全体を変更するものではない。従って、CELP符号音声の部分的復
号化において、ポストフィルタリングプロセス(即ち、復号化ステップ)は経済
上の理由で回避される。
ワーク上の音声においてしばしば使用される。これらの構成においては、符号化
音声フレームは音声活動中にのみ送信され、無音声の間は非常に少しの送信が実
行される。他端からのバックグランドノイズを擬似するために、復号器は自動的
に、無音声器官においてある程度の心地よいノイズを挿入する。GSMセルラー
ネットワークにおいて使用されているこのような構成の一例は、不連続送信(D
TX)と呼ばれる。無音声抑制を示す側面情報をモニタすることによって、AL
Cデバイス中の復号器は、無音声の間において信号を復号化することを完全に回
避することができる。このような場合、音声およびダブルトーク活動は、ALC
デバイスにおいて単純化されうる。
ムフリーオペレーション(TFO)標準において、各チャンネルに対する符号音
声ビットは、64kbit/秒の基地局間の有線ネットワークを介して搬送される。
このビットストリームは8ビットのサンプルに分割される。各サンプルの最下位
2ビットは符号音声ビットを含み、上位6ビットは適正なPCMサンプルに対応
するビットを含んでいる。PCM情報を線形音声に変換することは、非常に安価
であり、線形音声信号に幾分のノイズを与える。線形領域ALCアルゴリズムに
おいて普通になされているように、必要な音声活動、ダブルトークおよび音声レ
ベル測定を実施する為に、このノイズを含んだ線形領域音声信号を使用すること
が可能である。従って、この場合、符号領域音声パラメータの最小量のみの復号
化が必要である。SLRPおよびSLRPの再量子化に必要なその他の全てのパ
ラメータを復号する必要がある。その他のパラメータは、SLRPの再量子化に
必要な程度にのみ符号化される。これは、後段の部分で示す例から明らかである
。
スを実現することが可能であり、それによって複雑性を最小としかつ量子化ノイ
ズを減少させることができる。しかしながら、図12に示すALCアプローチは
完全に最適ではなく、改善が必要である。この非最適性は、ゲイン決定のプロセ
スがSLRP再量子化に関係がないと言う、暗黙の仮定に基づいている。一般に
、この仮定は有効でないこともある。
ストする。第一に、再量子化は、通常希望の値とは異なる現実のSLRPを結果
として生じることに注意すべきである。従って、ゲイン決定ブロックによって適
用される所望のゲインは、信号が復号された場合に実現されるゲインとは異なっ
ている。復号化する場合、音声信号がそれぞれ過剰に増幅されあるいは過剰に抑
制されるため、この相違に基づいてオーバーフローまたはアンダーフローの問題
が生じる。第二に、現在および将来の所望のゲイン値を決定する為に、ALCア
ルゴリズムのあるものは過去の所望のゲイン値を利用することができる。この所
望のゲイン値は、実際の実ゲイン値を反映しないので、このようなアルゴリズム
は、図12に示すように適用された場合、誤って実行される。第三に、再量子化
プロセスは時に、SLRPにおいて望ましくない残響を結果として生じる。これ
は音声レベルを故意ではなく変更し、結果として歪んだ音声信号を生じる。この
ようなSLRP残響は、差分量子化のようなフィードバック量子化構成において
遭遇する。
図13の反復構成をゲイン決定ブロック内に組み込むことができる。基本的に、
所望のゲイン値を決定した後、SLRPの再量子化の後で実ゲイン値が計算され
る。実ゲインは、オーバーフロー/アンダーフロー問題が発生しているか否かを
見る為にチェックされる。これは、例えば、オリジナルの音声レベルを実ゲイン
に掛け合わせることによって、新音声レベルが何であるかを決定することにより
達成することができる。あるいは、オーバーフロー/アンダーフローが実際に起
こっているか否かを見る為にALCデバイスにおいて音声復号器を使用すること
もできる。どちらの方法でも、実ゲイン値が高すぎるかあるいは低すぎるとみな
されると、新しいSLRPをそれぞれ、オーバーフロー/アンダーフローの危険
性がもはや存在しないとみなされるまで、減少しあるいは増加する。
ム中にフィードバックされるALCアルゴリズムにおいて、以下の修正がなされ
る。基本的に、フィードバックされるゲインは、SLRP再量子化プロセスの後
の実ゲインであって所望のゲインでは無い。図14に好ましいアプローチが示さ
れている。もし、所望のゲインがフィードバックループにおいて実ゲインの代わ
りに使用されると、制御装置は実際の復号音声信号レベルを追跡せず、その結果
誤ったレベルの制御が実行される。
決定ブロックに同様に組み込むことができる。
為の方法を以下に詳細に説明する。一般に、これらの方法はゲイン決定とSLR
P再量子化技術の統合を含んでいる。
ックベースのALCシステムによる適正なトラッキングを保証し、さらにフィー
ドバック量子化構成によってもたらされる発振効果を回避する為に、ゲイン決定
ブロックとSLRP再量子化ブロックの共通の設計と実施が好ましい。図15は
、共通ゲイン決定およびSLRP再量子化を使用するALCデバイスの一般的構
造を示している。その詳細は、特定のALCデバイスに依存する。
LRPの量子化は、上記で説明した、即時のスカラー量子化または差分スカラー
量子化のいずれかを用いて実行される。これらの特別なケースに対するSLRP
の再量子化について説明するが、このアプローチはその他の量子化構成に対して
容易に拡張することができることに注意すべきである。図15のALCデバイス
構造におけるゲインとSLRP再量子化の共通決定は、ここに記載した再量子化
技術を利用することができる。
m量子化テーブル値のセットは、
て定義される。ALCデバイスによって決定された所望ゲインは、g(n)で示され
る。SLRP再量子化の後の実ゲインは、
ンデックスkを、
する反復構成を使用することができる。オーバーフロー/アンダーフローの防止
に対する別のアプローチでは、再量子化SLRPを用いた音声サンプルの部分的
復号が、必要な程度にわたって実行される。これは、勿論、アルゴリズムにおい
てさらなる複雑性をもたらす。復号されたサンプルは、次に、オーバーフローま
たはアンダーフローが発生していないことを確かめるために、直接調査される。
子化テーブル値に対して、全ての実ゲインは予め計算され更に記憶される。これ
は、m2の実ゲイン値の格納を必要とし、mが通常は2の小さい数の累乗である
ため実現性がある。例えばGSM EFRコーディックではm=32であり、G
SM FRコーディックではm=64である。
カラー量子化プロセスを単純化することができる。この単純化は、ALCデバイ
スにおいて所望のゲイン値の、別個のセットのみを許すことによって達成される
。これらの所望のゲイン値は、SLRP量子化値と同じ間隔を有していることが
好ましい。この場合、0dBもゲインの一個である。この結果、各テーブル値に対
して式(8)を評価する必要が無いように、所望のおよび実ゲイン値が常に整列
していることが保証される。これによって、再量子化が非常に簡略化される。S
LRP量子化テーブル間隔によって分割された所望のゲイン値に対応する値だけ
、SLRPのオリジナル量子化インデックスが単純に増加しあるいは減少する。
例えば、SLRP量子化テーブル間隔がΔで示されるものと仮定する。この場合
、SLRP量子化テーブル値が線形に均一間隔であると、許される所望ゲイン値
の個別セットは、1+{...、−2Δ、−Δ、0、Δ、2Δ、...}であり、SL
RP量子化テーブル値が対数的に均一間隔であると、0+{...、−2Δ、−Δ
、0、Δ、2Δ、...}である。所望のゲイン値が1+k1Δ(線形の場合)、ま
たはk1Δ(対数の場合)であると、再量子化SLRPのインデックスはSLR
Pのオリジナル量子化インデックスに単にk1を加えることによって得られる。
ル値が均一間隔でない場合であっても適用することが可能であることに注意する
必要がある。この場合、Δは隣接する量子化テーブル値間の平均間隔であり、こ
の平均化は、これらの値の間の、線形または対数距離のいずれかを使用して適性
に実行される。
。このコーディックSLRPは、各サブフレームから送信されるブロック最大値
、Xmax,である。Q及びQ-1ブロックはそれぞれSLRP再量子化及び逆量子化
を表す。ブロック最大値のインデックスは、第1に、Xmaxを得るべく参照テー
ブルを使用して逆量子化され。次に、Xmaxは、参照テーブルを使用して再量子
化されるXmaxALCを得るべく所望のゲインで乗じられる。再量子化されたXmax
のインデックスは、送出前にビットストリームにて元の値に置き換えられる。こ
の再量子化技術は、GSMFR標準の被符号化領域ALCをインプリメントする
際に、図12〜15に示す全てのスキームの基本構成を形成する。
ックは、この再量子化技術を使用して被符号化領域ALCのインプリメンテーシ
ョンを説明する例として使用される。
LC技術を示す。(G(n))は符号器により決定される元の対数的ゲインを示
す。EFRコーディックの場合、G(n)は式(5)で規定されるE(n)に等
しく、R(n)は式(4)で規定される。ALCデバイスは所望のゲインである
ΔG(n)を決定する。SLRP、*R(n)(注! *は式及び図中の反転記
号^に対応する)は、ALCデバイスにより所望のゲインに基づいて修正される
。実現したゲイン、Δ*R(n)は元と修正されたSLRPの間の差異である。
せるために、前者のSLRPの「実現したゲイン」及び、後者の「実際に実現し
たゲイン」について言及する。実際に実現したゲインは、本質的に、安定状態の
元での復号処理におけるSLRP実ゲインの増幅されたバージョンである。安定
状態により、ΔG(n)は、Δ*R(n)が特定レベルでの通常の方法において
安定又は発振する十分に長い時間周期に対して、一定に保持されることを意味す
る。
動作を模倣しようとする。符号器及びALCデバイスにおける量子化器の存在が
無視されるならば、符号器及びALCデバイスの両方とも同じ伝達関数、1/(
1+P1(z))、及び、結果的に、*GALC(n) =G(n)+ΔG(n)、を持
った線形システムとなる。しかしながら、これらシステムを非線形にする量子化
器のために、この関係は単に近似的なものである。従って、復号化ゲインは、
は、意図しない発振効果の原因となる。例として、GSMEFRコーディックが
使用されたときにこれらの発振効果が示される。このコーディックに対して、P 1 (z)は4つの遅延要素を持つ。各要素は32の可能な値の1つを含む。従っ
て、ALCデバイスにおける非線形システムは、所定の時間にて100万以上の
可能な状態のいずれかにある。これは、この非線形システムの振る舞いがその初
期条件によって大きく影響されるからである。
ける残響を図示する。簡素化のために、元のSLRP,*R(n)は100以上
のサブフレームで一定であり、P1(z)のメモリは初期状態ではゼロと仮定す
る。図18(a)は所望のゲインのステップを示す。図18(b)は所望のゲイ
ンに重畳された実際の実ゲインを示す。初期条件及び元のSLRPは正確な振る
舞いを決定するが、ここで示される実際の実ゲインにおける残響は全く典型的な
ものである。
なり、結果的に可聴歪みの原因となる。従って、ALC仕様によれば、このよう
な残響は所望しないものとなる。残響は、図19に示すように、フィードバック
ループの外に量子化器を「移動する」ことにより除去することができる。(本実
施形態では、Δ*R(n)の計算は不要であるが、図17との比較が含まれる。
)
ンが重畳された、図18(c)に示す実際の実ゲインとなる。しかし、残響は除
去されるが、平均誤差(所望のゲインと実際の実ゲインとの平均的差)は、図1
8(b)に示すようにより高くなる。特に、これらの例では、再量子化器が安定
状態で動作中の平均誤差は0.39dBであり、フィードバックループに量子化
器が無い状態での平均誤差は1.03dBである。
計算の節約になる。これは、線形システム、1/(1+P1(z))、を、定数
1/(1+P1(1))、に置き換えることでなされる。
に変化するときには、十分に特別であるとしてしばしば見られている。比較的稀
な変化により、変化の間のサブフレームの平均的な数は、P1(z)のオーダー
よりも大きくなることを意味する。
うなフィードバックーベースのALCアルゴリズムでは、フィードバックされる
ゲインは、SLRP再量子化処理の後では、実際の実ゲインであるべきであり、
所望のゲインであるべきではない。このことは、既に、図14に関連して議論し
た。
ー再量子化は、図21で示すようにインプリメントされる。このインプリメント
では、ALCデバイスは、実際の実ゲインを決めるために復号器の作用をまねて
いる。
)に示され、線形システム、1/(1+P1(z))、は、一定な乗数、1/(
1+P1(1))、で置き換えることができる。さらなる簡素化は、実際の実ゲ
インの計算での精度が落ちるが、線形システム、1+P1(z)、を、一定の乗
数、1+P1(1)、で置き換えることによって、 図21(b)により達成す
ることができる。同様な方法で、図21(a)に示すインプリメントは線形シス
テムを、一定の乗数P1(1)で置き換えることにより簡素化することができる
。
精度を要求する応用例では、フィードバックループ内に量子化器を持つ前述の方
法のいずれかが使用される。実際の実ゲインでの残響は許容できないが、所望の
ゲインと実際の実ゲインの整合では低い精度を認める応用では、フィードバック
ループの外に量子化器を持った前述の方法のいずれかの方法が使用されている。
さらに、音声の強調を目的とした符号化音声の処理は、さらなる遅延として加え
られる。このようなさらなる遅延は、電話での会話が自然でないので、望むもの
ではない。さらに、さらなる遅延は、ハンドセットでのエコーキャンセルの効果
を減ずるか、性能上で所定レベルのエコーキャンセルの複雑性を増大させること
になる。
び処理の要件によって、常に少なくとも遅延しているフレームに加えられること
に注目するべきである。表1に列記されたコーディックに対して、各フレームが
20ms長であることに注目すべきである。しかしながら、被符号化領域ALC
は、1フレームより少ない緩衝遅延で実行される。
バイスの復号器では、第1のサンプルにおける最も早い点は、図23(a)に示
すように、91ビットの繰り返し後である。これは近似的に7.46msの緩衝
遅延を表す。まさに第1のサンプルばかりか、この点における第1のサブフレー
ムの全体を復号化するために、十分な情報が受信される。同様に、第1のサブフ
レームの全体は、FR復号器における緩衝遅延のおおよそ7.11ms後に復号
化される。
時間を必要とする。各サブフレームは、EFR及びFR符号化スキームの両方で
関連したSLRPを有することに注目すべきである。これは、一般的に、復号器
がサブフレームレベルで動作する場所におけるほとんどのコーディックについて
真実である。
ームごとに実行して実現される。サブフレームが復号化され、必要なレベルの測
定が更新されるやいなや、ALCデバイスにより計算された新たなSLRPは、
受信したビットストリームにおいて元のSLRPを置き換える。
RPに対応するビットの位置により決定される。FR及びEFRコーディックの
場合、第1のサブフレームに対するSLRPビットの位置はこの遅延で決定され
る。
プルに対するゲインを決定する。これは、ALCアルゴリズムによって、音声信
号がゲインが大きすぎてクリップしないか、非常に低いゲインによりアンダーフ
ローするかを確認できることである。
ローの両方が低い見込みを持つ事象である。このように、以前のサンプルからの
み導かれる情報に基づいて、サンプルに対するゲインを実際に決定することがで
きる。この概念は、幾つかの音声コーディックに対する被符号化領域ALCにお
ける近似的にゼロの緩衝遅延を達成するために使用される。
サブフレームのゲインを決定するように設計されねばならない。この方法におい
て、緩衝遅延はSLRPを修正するためにほとんど必要ではない。所定のサブフ
レームで、SLRPに対応するビットが受信されるやいなや、それらはまず復号
化される。そして新たなSLRPが、元のSLRP及び以前のサブフレームのみ
からの情報に基づいて計算される。元のSLRPビットは新たなSLRPビット
と置き換えられる。現在のサブフレームを復号化するために必要な全てのビット
が受信されるまで、待つ必要はない。従って、アルゴリズムにより負う緩衝遅延
は、小さい処理遅延に依存している。音声レベルについての情報は、現在のサブ
フレームに対するSLRPの置き換え後にのみ現在のサブフレームから導かれる
。
に容易に変換される。オーバーフロー及びアンダーフローについて小さなリスク
があるが、このリスクは音声のサブフレーム(通常、約5ms)のみに対して隔
離される。例えば、大きなゲインが与えられことによりサブフレームのオーバー
フローの後に、次のサブフレームについて計算されたSLRPは、引き続くオー
バーフローの見込みを最小にするように適切に設定される。
であり、これはこのコーディックに対するSLRPの復号化が復号のためのパラ
メータを含まないからである。EFRコーディックの場合、サブフレームの励起
ベクトルはSLRPを復号化するために必要とされ、より複雑な差動再量子化技
術がSLRPを再量子化するために使用されねばならない。この場合に、大きな
遅延の減少は、SLRPが現在のサブフレームに置き換わった後に、現在のサブ
フレームに基づいて音声レベルの更新を実行することにより達成される。
Cを実行することは上述した。TFOの下では、ハンドセットと基地局との間の
送信は符号化され、音声サンプル当たり2ビット以下が必要である。しかしなが
ら、音声サンプル当たり8ビットが基地局の間の送信に利用されている。基地局
では、音声サンプル当たり8ビットが必要なように、音声は復号化され、A則に
よる拡張される。しかしながら、元の符号化音声ビットは、各8ビットA則拡張
サンプルにおいて、2つの最下位ビット(LSB)を置き換えるために使用され
る。一度TFOがハンドセットの間で確立されると、基地局は、各ハンドセット
に対して、各8ビットA則拡張サンプルにおける2つの最下位ビットのみを送信
し6MSBを捨てる。従って、ボコーダの並列配置が回避される。
れる。各サンプルの2つの最下位ビットは被符号化音声ビットを含み、上位6ビ
ットは適切なPCMサンプルに対応するビットを含む。従って、線形音声サンプ
ルの雑音バージョンはこの場合ALCに利用できる。この雑音線形領域音声信号
を利用することは、線形領域ALCアルゴリズムにて通常なされるように、必要
なボイスの活用、二重トーク、及び音声レベルの測定等を実行するために可能で
ある。従って、この場合、被符号化領域の音声パラメータの復号化は最少量のみ
が必要である。SLRPの決定と再量子化に要求されるパラメータのみが復号化
されねばならない。音声信号の部分的な復号化は不要である。これは、雑音線形
領域の音声サンプルが、ボイスの活用及び二重トークの検出と同様に、音声レベ
ルを測定するために応答するからである。
な動作を可能とする他の論理ユニットと同様に、マイクロプロセッサ、マイクロ
コントローラ又はデジタル信号プロセッサを含むプロセッサにより実行されるこ
とを認識すべきである。
非可逆的ソース符号化のカテゴリに含まれる音声圧縮は音声符号化として言及さ
れるのが通常である。音声符号化は音声送信に必要な帯域幅を最小にするように
実行される。これは帯域幅が殆ど無い無線電話において非常に重要である。比較
的帯域幅が広いパケット網、音声符号化は、ネットワークの遅延及びジッターを
最小にするためにも重要である。これは、音声通信、種々の異なるデータは非常
に狭い遅延だからである。従って、小さなパケットサイズはパケットネットワー
クを介しての送信を容易にする。4つのETSI GSM標準の関連が表3に列
記されている。各標準は線形予測コードを規定している。表3は表1に規定され
た音声コーディックの一部である。
とする。GSM符号器は20ms(サンプルレート8kHzで160サンプル)
のフレームサイズで動作する。所定の音声フレームに対して、音声符号器は音声
合成モデルに対してパラメータの小さな組みを決定する。これらの音声パラメー
タ及び音声合成モデルとともに、音声フレームは、元の音声フレームに非常に類
似するような音に再構成される。再構成は音声復号器により実行される。上記に
列記したGSM音声符号器において、符号化処理は復号化処理よりもはるかに計
算が多くなる。
存する。表3おGSM符号器は線形予測符号化(LSP)モデルを利用する。L
PC音声合成モデルの簡素化された構成が図3に示される。図3のモデルは、適
切なモデルパラメータを特定することにより音声類似信号を発生するために使用
される。このような音声合成モデルの例において、パラメータには、時間可変フ
ィルター係数、ピッチ周期、コードブックベクトル、及びゲイン係数を含む。合
成音声は、次のようにして発生される。適切なコードブックベクトル、c(n)
、が最初にコードブックゲイン係数Gによって計算される。ここで、nはサンプ
ル時間である。スケーリングされたコードブックベクトルは、ピッチ合成フィル
ターによりフィルターされ、そのときのパラメータはピッチゲインgp、及びピ
ッチ周期Tを含む。結果的には、全体励起ベクトルu(n)として何度か言及し
ている。その名称で意味するように、ピッチ合成フィルターは、ボイスにおける
音声の調和品質をもたらす。全体の励起ベクトルは、音声フレームの広域スペク
トル形状を特定するLPC合成フィルターによりフィルターされる。
GSMFR及びEFR符号器において、コードブックベクトル、コードブックゲ
イン及びピッチ合成フィルターのパラメータは各サブフレーム(5ms)ごとに
決定される。LPC合成フィルターのパラメータは、EFRにおいてフレーム当
たり2度(10msごとに)決定され、FRにおいてフレームごとに1度決定さ
れる。
を乗算し、遅れMまでの自動訂正関数を決定する。 3.自動訂正関数からLPC係数を決定する。 4.LPC係数を異なるフォーム(例えば、ログ領域比又はラインスペクトラム
周波数)に変換する。 5.ベクトル量子化技術を使用して、変換されたLPC係数を量子化する。 6.以下の一連の動作が、通常、各サブフレームに対して行われる。 7.ピッチ周期を決定する。 8.対応するピッチゲインを決定する。 9.ピッチ周期及びピッチゲインを量子化する。 10.LP残余信号を得るために、量子化されたLP合成フィルターを介して、
元の音声信号の逆フィルターを行う。 11.ピッチ残余を得るために、ピッチ合成フィルターを介してLP残余信号の
逆フィルターを行う。 12.最適なコードブックベクトルを決定する。 13.最適なコードブックゲインを決定する。 14.コードブックゲイン及びコードブックベクトルを量子化する。 15.フィルターメモリを適切に更新する。 16.符号化パラメータを送信する。
、コードブックベクトル、コードブックゲイン)を逆量子化する。 2.コードブックゲインによりコードブックベクトルをスケーリングし、LP励
起信号を得るために、ピッチ合成フィルターを使用してフィルターリングする。 3.一次的な音声信号を得るために、LP合成フィルターを使用してLP励起信
号をフィルタリングする。 4.ポストフィルター(通常、LP係数に基づく)を構築する。 5.最終的な合成音声を得るために、量子化雑音を減少させるための一次的な音
声信号をフィルタリングする。
似的伝達関数は、ALPの目的に対して十分に精度のある合成処理に属する。
)を考察する。注目すべきキーポイントはGが伝達関数のDCゲインを特定する
ことである。これは、Gが近似的な線形方法にて全体的な音声レベルを調整する
ために修正されることを意味する。従って、Gは「音声レベル関連パラメータ(
SLRP)」を意味する。
ータ(SLRP)を使用する。これらのSLRPは、図3の一般の音声合成モデ
ルにおけるGに対応する。所定のコーディックに関連して被符号化領域ALC(
CD−ALC)を実行するために、対応するSLRPのみがネットワークALC
デバイスにおける受信したビットストリームにて修正される必要がある。これは
、再符号化処理がかなり簡素化される利点を持つ。さらに、このアプローチは、
結果的に、信号に誘導された知覚的に重要な量子化に対して、最も少ない可能な
量を生じる。各コーディックに対して、異なる被符号化領域SLRPの修正アル
ゴリズムが案出される。ここで、FR及びEFR符号器に対する好適なアルゴリ
ズムを説明する。
は「スカラー量子化」と称される。パラメータの組みは互いい量子化されるとき
、処理は互いに「ベクトル量子化」と称される。ベクトル量子化は通常、LRP
係数のような方法で互いに関連したパラメータの組みに適用される。スカラー量
子化は通常、コードブックゲインのような他のパラメータから比較的独立したパ
ラメータに適用される。インプリメントされたCD−ALCの目的のために、議
論はスカラー量子化のみに限定する。
言及している)に対するスカラー量子化を利用する。FR符号器は、SLRP(
xmax)における一時的なスカラー量子化を実行する。即ち、SLRPの現在の
値は、比較的簡単な表参照方法である量子化処理にて使用される。EFR符号器
はSLRP(γgc)の適応差動スカラー量子化を実行する。この方法で、現在の
量子化された値は過去の量子化された値に依存する。CD−ALCへのモジュラ
ーアプローチを利用する本発明の好適な実施形態は図24に示される。通信シス
テム10は、表2で特定されたコーディックにより使用されるいずれかのコード
のような、圧縮コードを使用してネットワーク14上で近端ハンドセット12か
らの近端デジタル信号を送信する。圧縮コードは、近端ハンドセット12から発
生された線形可聴信号から符号器16によって発生される。圧縮コードは表2に
おけるSLRPのラベルの付されたパラメータのようなパラメータを備える。パ
ラメータは可聴レベルを含む複数の可聴特性を備えた可聴信号を表す。上述のよ
うに、可聴レベルは表2におけるSLRPのラベルの付されたパラメータに関連
する。圧縮コードは可聴レベルに関連したパラメータを復号化するための1つ又
はそれ以上の段階を含む種々の復号化の段階により復号化が可能である。説明し
たように、システム10は最小の遅延で可聴レベルを調整し、さらに可聴レベル
に関連した圧縮コードのパラメータを復号化する。
ートに送られ、そして調整された圧縮コードは近端端子22により送信され、圧
縮コードを有する復号器28を含む遠端ハンドセット26に、ネットワーク24
を経てSoutポートに送られる。線形の遠端可聴信号は、符号器16と同じ圧
縮コードを使用して遠デジタル信号を発生する遠端符号器30により符号化され
、遠端端子34にネットワーク32を経て送信されRinで受信される。ネット
ワーク34はまた端子36に遠端信号を送信し、Routポートで受信する。近
端ハンドセット12の復号器18は遠端デジタル信号を復号化する。図24に示
すように、遠端信号からのエコー信号は近端ハンドセット12の符号器16への
経路で見出せる。
ッサ40はマイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッ
サ、又は数学的及び論理的な動作が可能な論理ユニットである。コーディックの
各タイプ、異なる被符号化領域SLRPの修正アルゴリズムはプロセッサ40に
より実行される。プロセッサ42により実行される線形領域レベル制御アルゴリ
ズム42は、非TFOと同様にTFOの間、固有のモード及び線形モードの下で
、全ての時間における動作である。部分的な復号器48は、圧縮コードにより表
される可聴信号の可聴レベルが決定される線形コードを形成するように十分な圧
縮コードを復号化する。復号器48は、表2で特定されるパラメータの1つのよ
うに、可聴レベルに関連した圧縮コードパラメータを読み出す。読み出されたパ
ラメータはパラメータ値を形成するために逆量子化される。線形領域レベル制御
アルゴリズムはレベル調整のためのゲイン係数を決定し、プロセッサ40内の所
定のメモリに書き込まれる。このゲイン係数はプロセッサ40により実行される
、適切なコーディック依存被符号化領域SLRPの修正アルゴリズム44により
読み出される。アルゴリズム44は、調整されたSLRPパラメータ値(即ち、
調整されたゲイン係数)を形成するために、読み出されたSLRPパラメータ(
即ち、ゲイン係数)を修正する。調整されたパラメータ値は、端子20で受信し
たビットストリームに記載された調整されたSLRPパラメータ値を形成するた
めに量子化される。言い換えれば、調整されたSLRPパラメータは元の読み出
されたSLRPに置き換えられる。ネットワークALCデバイス内に示される部
分的な復号器46及び48はプロセッサ40により実行されるアルゴリズムであ
り、コーディック依存である。GSMEFRの場合に、フィルタリング動作後の
復号器は不要である。GSMFRの場合では、完全な復号器がインプリメントさ
れる。
ルゴリズムが、被符号化領域SLRPの修正アルゴリズムとともに僅かに又は無
修正で併合される利点を有する。符号器特定レベル制御方法はより正確なレベル
調整をもたらす。しかしながら、固有モードから線形モード(又はその逆)に切
り換えるときの滑らかな遷移を確保するために、存在する線形領域レベル制御ア
ルゴリズムの重要な再設計を必要とする。幾つかの望まない人為的なものが、モ
ジュラーアプローチを使用したときの符号化モードと線形モードの間の切り換え
時にたまたま誘起される小さなリスクがあることに注目すべきである。
、いずれかのボイス品質の強調処理無しに、セルラーネットワークに既に存在す
る。さらに音声の強調を目的として符号化された音声のネットワーク処理は追加
の遅延を生じる。もし線形領域処理が、TFOの間に符号化音声上で実行され、
遅延(20ms)以上のフレームが復号化及び再符号化の緩衝及び処理要件によ
って加えられる。しかしながら、CD−ALCはFR及びEFR符号器の1フレ
ームより少ない緩衝遅延とともに実行される。
ームのレベル制御を実行することにより、FR及びEFRに対して達成される。
サブフレームが復号器48により復号化され、必要なレベル測定が更新されるや
いなや、線形領域ALCアルゴリズムは、ゲイン係数を被符号化領域SLRPの
修正アルゴリズム44に送信する。パラメータが受信したビットストリームに配
置される方法によって、第1のサブフレームは、符号化が開始される以前に5m
s以上の遅延を必要とする。
のであり、ビットストリームは各々FR及びEFR符号器で受信され、図23の
構成に対応する。FRに対して260ビット/フレームあり、EFRに対して2
44ビット/フレームがある。表は、入来のビットは、簡素化のために、20m
s以上に拡張される。このような近似とともに、第1のサブフレームは、FRに
対して7.11msを必要とし、EFRに対して7.46msを必要とする。全
ての他のサブフレームはより少ない遅延を必要とする。
)と称されるSLRPパラメータの修正のみを説明する。このパラメータは、式
(11)で与えられる音声合成の伝達関数においてGに対応する。このセクショ
ンは各フレームで受信された260ビットからこのパラメータの復号化を説明す
る。xmaxの決定についての関数的な説明に対して(参照(1)(セクション3
.1.18−3.1.22)の「RPE符号化セクション」を参照)。
−4.2.17に記載されている。
表7に示されている。各サブフレームで示す6ビットは、表3と表5で特定され
た64−ワード表のインデックスとして使用される。表7における「ブロック最
大値xmaxの量子化」では、インデックスはxmaxc によって示され、対応値はx
’ maxで示される。
)における表3と表5、「ブロック最大値xmax の量子化」が使用される。表は
各値の範囲での6個のインデックスを特定する。6個のインデックスは各サブフ
レームの適切な位置に再挿入される。
767である。これは約60dB(20log10(3276/31)のダイナミ
ックレンジを表す。
により完全に復号化される。即ち、端子20及び34に送信されるデジタル信号
は、可聴レベルを示す近端復号化信号及び遠端復号化信号を発生するために復号
器46及び48により完全に復号化される。さらに、x’max値が部分的に復号器
48により符号化近端信号から読み出される。(2つの端部の間のサブフレーム
境界の整列は重要ではない。)近端復号化信号及び遠端復号化信号は、固有の可
聴レベルを決定するために線形領域ALC(LD−ALC)アルゴリズム42に
より処理される。インプリメントに依存して、端子34にて受信された遠端信号
に基づいて二重トーク情報のみが実際にLD−ALCに渡される。
りスケールされる。
により示されるLD−ALCゲイン又はレベルはCD−ALC44に渡される。
これはCD−ALCにより読み出される所定のメモリに書き込むことにより達成
される。
ーブルインデックスを抽出する。量子化x’max値は表3及び5と、参照(1)「
ブロック最大値xmax」を使用して決定される。一方、復号器は既にこの値を参
照しているので、復号器コードはCD−ALC44にこの値を渡すように修正さ
れる。
て量子化される。調整レベルパラメータを表す6ビットテーブルインデックスの
結果は、表7に従って符号化近端ビットストリームに戻って挿入される(例えば
、書き込まれるか置き換えられる) (7)CRC又はエラー制御符号化ビットのいずれも適切に更新される。
MEFR符号器の量子化はFRとして直接的なものはない。従って、SLRPの
符号化及び復号化の概略をまず説明する。
ラメータの修正のみに関連する。このパラメータは、式(11)で与えられる音
声合成伝達関数におけるGに対応する。しかしながら、このパラメータは受信に
したビットストリームにて直接的に利用できない。スタティックな線形予測器を
使用して適応差動量子化の非直接的なフォームが、各サブフレームごとに、量子
化gcを行うために利用される。送信される「ゲイン」パラメータは、gcと予測ゲ
インg’cの実際の補正係数である。
接的にアクセスできる全体的音声レベルに関連したパラメータのみだからである
。
gcが決定されると、γgc を得るために予測ゲインg’cにより分割される。サブ
フレームに対する予測ゲインnは以下の式で与えられる。
は*γgcに対応する参照テーブルインデックスを送信する。式(13)において
、*Eは定数であり、E1(n)はサブフレームの固定コードブックベクトルに
のみ依存し、そして*E(n)は以前に量子化された補正係数にのみ依存する。
従って、復号器は、式(13)を使用して符号器と同じ方法で予測ゲインg’cを
計算し、一度、現在のサブフレームの固定コードブックベクトルが復号化される
。補正係数*γgcの復号化において量子化ゲイン係数は式(12)を使用して式
(14)で計算される。
に示され、R(n)は、 R(n)=E(n)−*E(n)=20logγgc(n) で与えられる予測誤差を示す。R(n)は図中のQで示すブロックによって*R
(n)に量子化される。量子化は、アレイ“qua_gain_code”で与えられる*γg c に対する32−ワード量子化を使用して実行され、“qua_gain_code”は参照(
2)に記載されるEFRでもたらされるビットツルーCコードファイル”gain_t
o.h”で特定される。
の両方で使用される。
クベクトルエネルギーを使用して間接的に実行される。E(n)はサブフレーム
nにおける平均移動コードブックベクトルエネルギー(dB)を示し、以下の式
で与えられる。
る。コードブックベクトルの復号化はSLRPの復号化とは独立であることに注
目すべきである。E(n)ゲイン係数gc の関数である。γgcから*γgcへの量
子化は間接的にgcから*gcへ結果的にはなる。この量子化ゲイン係数はコードブ
ックベクトルをスケールするために使用され、復号器(例えば復号器28)で合
成された可聴信号の全体的なレベルを設定する。*E(n)は以下の式による予
測エネルギーである。
号器は、励起ベクトルを復号化し、式(16)を使用してE1(n)を計算する
。次に、*E(n)が、式(17)を使用し以前に復号化されたゲイン補正係数
を使用して計算される。予測ゲインg’cが式(13)を使用して計算される。次
に、現在のサブフレームに対する補正係数の受信インデックスが参照テーブルか
ら*γgcを得るために使用される。最後に量子化ゲイン係数が式(14)により
得られる。
は表8に示される。各サブフレームに示された5ビットは、アレイ“qua_gain_c
ode”で与えられる*γgcに対する32−ワード量子化を使用して実行され、“q
ua_gain_code”は参照(2)に記載されるEFRでもたらされるビットツルーC
コードファイル”gain_to.h”で特定される。この情報は表9に示される。
2に示される。量子化値の範囲は159から27485である。これは約45(
dB)のダイナミックレンジを表す(20log10(27485/159)。量子化SLRP値及
び対数のテーブルは表9に示される。このテーブルはSLRPを再符号化するた
めに必要である。
により完全に復号化される。即ち、端子20及び34に送信されるデジタル信号
は、近端復号化信号及び遠端復号化信号を発生するために復号器46及び48に
より完全に復号化される。さらに、γgcパラメータが部分的に復号器48により
符号化近端信号から読み出される。(2つの端部の間のサブフレーム境界の整列
は重要ではない。)近端復号化信号及び遠端復号化信号は、固有の可聴レベルを
決定するために線形領域ALC(LD−ALC)アルゴリズムにより処理される
。インプリメントに依存して、遠端信号に基づいて二重トーク情報のみが実際に
LD−ALCアルゴリズム42に渡される。
りスケールされる。
で示されるLD−ALCゲイン又はレベルはCD−ALC44に渡される。これ
はCD−ALCにより読み出される所定のメモリに書き込むことにより達成され
る。
ーブルインデックスを抽出する。一方、復号器は既にこのインデックスを決定し
ているので、復号器コードはCD−ALC44にこの値を渡すように修正される
。
*R(n)=20log10(*γgc)を決定するために使用される。
、gALCが取り得る可能値が予め決められているので可能であり、従って、予め
計算される。
eltaR(0)), (PastDeltaR(1)), (PastDeltaR(2)), (PastDeltaR(3)), が必要と
され、これらは1つのサブフレームから次にメモリに保持される。これらの変数
は、呼の開始時点でゼロに初期化される。
予測ゲインの間の差異として以下の式(19)のように計算される。
上で更新される。
に量子化される。これは、表9において、Rnew(n)を*R(n)の32の可能値と比
較することによりなされる。*Rnew(n)は、Rnew(n)とテーブル値の間の絶対的な
差異に最も近い値に割り当てられる。*Rnew(n)に対応する5ビットテーブルイ
ンデックスは、表8に従って被符号化近端ビットストリームに戻って挿入される
(例えば、書き込まれるか又は置き換えられる。)
。図25を図26にして考察する。ALCが符号化する前に実行されるとする。
20loggcは、20log(gc x gALC) = 20loggc + 20log gALCに、SLRP符号処理に
置き換えられる。目標は、元の符号器にアクセスしないネットワークにてALC
を実行することであり、符号化処理は図27に示すようにネットワークにて模倣
される。量子化器を除いて、符号器の処理は伝達関数1/(1+P(z))であ
る。CD−ALCデバイスにおける処理はこの線形伝達関数を持つ。これら2つ
の処理の出力は加えられ、その結果の合計はRnew(n)で示される。Rnew(n)は、20
log(gc x gALC)のALC処理された近似的に理想値に近い。Rnew(n)は*Rnew(n)
により量子化され、参照テーブルインデックスがビットフレームに再挿入される
。これはSLRPセクションのCD−ALC処理にて特定される方法である。
対して頻度はない。これは、20log gALCがサブフレームの大きな数に対して一定
に保たれる。P(n)のオーダーが小さいので、処理1/(1+P(z))の出
力はサブフレームの比較的小さい数で安定状態に達する。従って、1/(1+P
(z))を1/(1+P(1))=1/2.79に近似することは合理的である
。
ALC処理における手順よりも簡素化される。しかしながら、大きな遷移が幾つ
かの適用例ではこの方法で観察される。
び負モード処理(例えば、ハンドオーバーの場合)の間で順調に移行される。
Rコーディックに関連する動作に対して±3dBに制限される。(LD−ALC
の幾つかのバージョンでは、6dB段階が可能であり、これは回避されるべきで
ある)従って、可能なdBゲイン値は(-3, - 6, 0, 3, 6, 9, 12, 15)に制限
される。
±3.39dBに制限される。(LD−ALCの幾つかのバージョンでは、6dB
段階が可能であり、これは回避されるべきである)。この段階サイズは遷移効果
を最小にし、精度を最大にするために、EFRに対して特に最適化される。従っ
て、可能なdBゲイン値は(-6.77, -3.39, 0, 3.39, 6.77, 10, 16)に制限さ
れる。
うに制限されるべきである。これは、ゲインの変化が発生する例が線形(上限6
PCMビット)及び符号化信号の両方で等しいことが確保されるからである。
ゴリズムを利用するので、CD――ALCアルゴリズムの性能は、LD−ALC
性能により境界とされる上限となる。従って、LD-ALCアルゴリズムが、例え参照
(3)のG.169と一致しても、CD−ALCアルゴリズムはG.169で試
験されるべきである。
28に音声信号の一例が示される。
トは、元の(点線)及び処理された(実線)信号のパワープロファイルを示す。
一定時間の40msが、パワープロファイルを得るために循環的な平均値の信号
で使用される。低いプロットは、各サブフレームの端部におけるLD−ALCゲ
イン(ブルー、点線)を示す。各サブフレームの端部における元のパワーと処理
されたパワーの比である。音声信号が強い領域では、信号の適用は所望のゲイン
に全く近い状態で対応する。
求項に規定された本発明の精神と範囲を逸脱することなく変形が可能である。
ク図である。
る概略ブロック図である。
る。
示すグラフである。
る。
ィードバックを使用するALCシステムの好ましい形の概略ブロック図である。
の概略ブロック図である。
の概略ブロック図である。
実際の達成ゲインを示すグラフである。
生じた所望のゲイン上に重畳された実際の達成ゲインを示すグラフである。
略ブロック図である。
アルゴリズムのための符号領域ALCを実行する概略ブロック図である。
アルゴリズムのための符号領域ALCを実行する概略ブロック図である。
コーディックSLRP:(Ri+1−Ri)、を示すグラフである。
号化が左から右に充填される時間を示す、EFR復号器の圧縮音声フレームの図
である。
号化が左から右に充填される時間を示す、FR復号器の圧縮音声フレームの図で
ある。
ック図である。
る。
。
ロック図である。
Claims (60)
- 【請求項1】 第一パラメータを含む所定の複数のパラメータからなる圧縮
符号を使用するデジタル信号を伝送する通信システムであって、前記複数のパラ
メータが、第一特性を含む複数の音声特性からなる音声信号を表示し、前記第一
パラメータが、前記第一特性に関連し、前記圧縮符号が、前記第一特性に関連す
る前記複数のパラメータを復号する第一復号ステップを含む複数の復号ステップ
によって復号可能である、という通信システムにおいて、該第一特性を調整する
装置であって、 前記デジタル信号に応答して、少なくとも前記第一パラメータを読み込み及び
前記第一パラメータから導出される少なくとも第一パラメータ値を生成し、前記
デジタル信号及び前記第一パラメータ値に応答して、前記第一特性の調整を表示
する被調整第一パラメータ値を生成し、並びに前記被調整第一パラメータ値に応
答して、被調整第一パラメータを導出し及び前記第一パラメータを前記被調整第
一パラメータで置換するプロセッサ、を具備する装置。 - 【請求項2】 前記第一特性が前記音声信号のレベルからなる、請求項1に
記載の装置。 - 【請求項3】 前記複数の復号ステップが、該第一特性の実質的変更を回避
する少なくとも一つの復号ステップを更に具備し、かつ、前記プロセッサが、前
記少なくとも一つの復号ステップを実行する、請求項1に記載の装置。 - 【請求項4】 前記少なくとも一つの復号ステップがポストフィルタリング
からなる、請求項3に記載の装置。 - 【請求項5】 前記圧縮符号が線形予測符号からなる、請求項1に記載の装
置。 - 【請求項6】 前記圧縮符号がレギュラパルス励起長期予測符号からなる、
請求項1に記載の装置。 - 【請求項7】 前記デジタル信号が、複数のサブフレームを具備するフレー
ムにて伝送され、かつ、前記第一パラメータが、前記サブフレームの一つに対し
て符号ブックベクトル内の要素の最大絶対値からなる、請求項6に記載の装置。 - 【請求項8】 前記圧縮符号が、代数符号被励起線形予測符号からなる、請
求項1に記載の装置。 - 【請求項9】 前記デジタル信号が、複数のサブフレームを具備するフレー
ムにて伝送され、前記第一パラメータが、前記サブフレームの一つに対するゲイ
ン補正ファクタからなる、請求項8に記載の装置。 - 【請求項10】 前記デジタル信号が、第一近端パラメータを含む所定の複
数の近端パラメータからなる近端圧縮符号を使用する近端デジタル信号を具備し
、前記近端パラメータが、近端第一特性を含む複数の近端音声特性を具備する近
端音声信号を表示し、前記近端第一パラメータが、前記近端第一特性に関連付け
られており、前記近端圧縮符号が、前記近端第一特性に関連する前記複数の近端
パラメータを復号する第一復号ステップを含む複数の復号ステップによって復号
可能であり、前記デジタル信号が、所定の複数の遠端パラメータからなる遠端圧
縮符号を使用する遠端デジタル信号を更に具備し、前記複数の遠端パラメータが
、遠端第一特性を含む複数の遠端音声特性を具備する遠端音声信号を表示し、前
記遠端圧縮符号が、前記遠端第一特性に関連する前記遠端パラメータを復号する
第一復号ステップを含む複数の復号ステップによって復号可能であり、 前記プロセッサが、前記近端デジタル信号及び前記遠端デジタル信号を受信し
、 前記プロセッサが、前記近端デジタル信号に応答して、少なくとも前記近端第
一パラメータを読み取り、及び、前記近端第一パラメータから導出される近端第
一パラメータを生成し、 前記プロセッサが、前記近端デジタル信号に応答して、前記近端音声信号の前
記近端第一特性に関連する近端被復号信号を生成すべく少なくとも前記第一復号
ステップを実行し、 前記プロセッサが、前記遠端デジタル信号に応答して、前記遠端音声信号の前
記遠端第一特性に関連する遠端被復号信号を生成すべく少なくとも前記第一復号
ステップを実行し、 前記プロセッサが、前記近端被復号信号、前記遠端被復号信号及び前記近端第
一パラメータ値に応答して、前記近端第一特性の調整を表示する被調整近端第一
パラメータ値を生成し、 前記プロセッサが、前記被調整近端第一パラメータ値から被調整近端第一パラ
メータを導出し、並びに、 前記プロセッサが、前記近端第一パラメータを前記被調整近端第一パラメータ
で置換する、 請求項1に記載の装置。 - 【請求項11】 前記プロセッサが、前記被調整第一パラメータを導出する
前に、オーバーフロー及びアンダーフロー状態に関して、前記被調整第一パラメ
ータ値をテストする、請求項1に記載の装置。 - 【請求項12】 前記第一パラメータが被量子化第一パラメータであり、前
記プロセッサが、前記被調整第一パラメータ値を量子化することによって前記被
調整第一パラメータを導出する、請求項11に記載の装置。 - 【請求項13】 前記プロセッサが、前記量子化の間、差分スカラー量子化
を使用する、請求項12に記載の装置。 - 【請求項14】 前記プロセッサが、前記量子化の間、フィードバックルー
プ外の量子化器によって差分スカラー量子化を使用する、請求項13に記載の装
置。 - 【請求項15】 前記第一パラメータが、時間を通して受信される一連の第
一パラメータからなり、前記プロセッサが、前記デジタル信号に応答して、前記
一連の第一パラメータを読み取り及び時間を通して一連の第一パラメータ値を生
成し、並びに前記プロセッサが、前記被復号信号と少なくとも複数の前記一連の
第一パラメータ値に応答して、前記被調整第一パラメータ値を生成する、請求項
1に記載の装置。 - 【請求項16】 前記第一パラメータが被量子化第一パラメータであり、前
記プロセッサが、前記被調整第一パラメータ値を量子化することによって前記被
調整第一パラメータを導出する、請求項15に記載の装置。 - 【請求項17】 前記プロセッサが、前記量子化の間、差分スカラー量子化
を使用する、請求項16に記載の装置。 - 【請求項18】 前記第一パラメータが被量子化第一パラメータであり、前
記プロセッサが、前記被調整第一パラメータ値を量子化することによって前記被
調整第一パラメータを導出する、請求項1に記載の装置。 - 【請求項19】 前記プロセッサが、前記量子化の間、差分スカラー量子化
を使用する、請求項18に記載の装置。 - 【請求項20】 前記プロセッサが、即時スカラー量子化技術を使用して前
記量子化を実行する、請求項18に記載の装置。 - 【請求項21】 前記圧縮符号が前記デジタル信号のフレーム内に配置され
、前記フレームが、前記第一パラメータを各々具備する複数のサブフレームから
なり、前記プロセッサが、前記デジタル信号に応答して、前記複数のサブフレー
ムの各々から少なくとも前記第一パラメータを読み取り、前記プロセッサが、前
記複数のサブフレームの各々内の前記被調整第一パラメータを用いて前記第一パ
ラメータを置換する、請求項1に記載の装置。 - 【請求項22】 前記プロセッサが、より低い遅延を達成すべく、第一サブ
フレームに続くサブフレームを処理する前に、第一サブフレームに対して、前記
被調整第一パラメータで前記第一パラメータを置換する、請求項21に記載の装
置。 - 【請求項23】 前記圧縮符号が前記デジタル信号のフレーム内に配置され
、前記フレームが、前記第一パラメータを各々具備する複数のサブフレームから
なり、前記プロセッサが、前記被復号信号を生成すべく前記サブフレームの第一
の間、少なくとも前記第一復号ステップを実行して前記被復号信号を生成し、前
記第一サブフレームに続いて出現する前記サブフレームの第二から前記第一パラ
メータを読み取って前記第一パラメータ値を生成し、前記被復号信号及び前記第
一パラメータ値に応答して前記被調整第一パラメータ値を生成し、前記第二サブ
フレームの前記第一パラメータを前記被調整第一パラメータで置換する、請求項
1に記載の装置。 - 【請求項24】 前記プロセッサが、少なくとも前記第一復号ステップを実
行して前記音声信号の前記第一特性に関連する被復号信号を生成し、前記プロセ
ッサが、前記被復号信号及び前記第一パラメータ値に応答して、前記被調整第一
パラメータ値を生成する、請求項1に記載の装置。 - 【請求項25】 符号サンプルからなるデジタル信号を伝送する通信システ
ムであって、前記符号サンプルが、圧縮符号を使用する第一ビット群及び線形符
号を使用する第二ビット群から構成され、前記符号サンプルが音声信号を表示し
、前記音声信号が、第一特性を含む複数の音声特性を有する、という通信システ
ムにおいて、前記圧縮符号を復号することなく、該第一特性を調整する装置であ
って、 前記第二ビット群に応答して、前記第一ビット群及び前記第二ビット群を調整
することにより、前記第一特性を調整するプロセッサ、を具備する装置。 - 【請求項26】 前記線形符号がパルス符号変調(PCM)符号からなる、
請求項25に記載の装置。 - 【請求項27】 前記第一特性が音声レベルからなる、請求項25に記載の
装置。 - 【請求項28】 前記圧縮符号サンプルが、移動通信標準のための地球的シ
ステムのタンデムフリー動作に従う、請求項25に記載の装置。 - 【請求項29】 前記第一ビット群が前記サンプルの二つの最下位ビットか
らなり、前記第二ビット群が前記サンプルの6個の最上位ビットからなる、請求
項25に記載の装置。 - 【請求項30】 前記6個の最上位ビットがPCM符号を構成する、請求項
29に記載の装置。 - 【請求項31】 第一パラメータを含む所定の複数のパラメータからなる圧
縮符号を使用してデジタル信号を伝送する通信システムであって、前記複数のパ
ラメータが、第一特性を含む複数の音声特性を具備する音声信号を表示し、前記
第一パラメータが、前記第一特性に関連し、前記圧縮符号が、前記第一特性に関
連する前記複数のパラメータを復号する第一復号ステップを含む複数の復号ステ
ップによって復号可能である、という通信システムにおいて、該第一特性を調整
する方法であって、 前記デジタル信号に応答して少なくとも前記第一パラメータを読み取ることと
、 前記第一パラメータから導出される少なくとも第一パラメータ値を生成するこ
とと、 前記デジタル信号に応答して前記音声信号の前記第一特性に関連する被復号信
号を生成すべく少なくとも前記第一復号ステップを実行することと、 前記デジタル信号及び前記第一パラメータ値に応答して前記第一特性の調整を
表示する被調整第一パラメータ値を生成することと、 前記被調整第一パラメータ値に応答して被調整第一パラメータを導出すること
と、 前記第一パラメータを前記被調整第一パラメータで置換することと、 を具備する方法。 - 【請求項32】 前記第一特性が前記音声信号のレベルからなる、請求項3
1に記載の方法。 - 【請求項33】 前記複数の復号ステップが、該第一特性の実質的変更を回
避する少なくとも一つの復号ステップを具備し、前記方法が、前記少なくとも一
つの復号ステップを実行する、請求項31に記載の方法。 - 【請求項34】 前記少なくとも一つの復号ステップがポストフィルタリン
グからなる、請求項33に記載の方法。 - 【請求項35】 前記圧縮符号が線形予測符号からなる、請求項31に記載
の方法。 - 【請求項36】 前記圧縮符号がレギュラパルス励起長期予測符号からなる
、請求項31に記載の方法。 - 【請求項37】 前記デジタル信号が、複数のサブフレームを具備するフレ
ームにて伝送され、かつ、前記第一パラメータが、前記サブフレームの一つに対
して符号ブックベクトル内の要素の最大絶対値からなる、請求項36に記載の方
法。 - 【請求項38】 前記圧縮符号が、符号被励起線形予測符号からなる、請求
項31に記載の方法。 - 【請求項39】 前記デジタル信号が、複数のサブフレームを具備するフレ
ームにて伝送され、前記第一パラメータが、ゲイン補正ファクタからなる、請求
項38に記載の方法。 - 【請求項40】 前記デジタル信号が、第一近端パラメータを含む所定の複
数の近端パラメータからなる近端圧縮符号を使用する近端デジタル信号を具備し
、前記近端パラメータが、近端第一特性を含む複数の近端音声特性を具備する近
端音声信号を表示し、前記近端第一パラメータが、前記近端第一特性に関連付け
られており、前記近端圧縮符号が、前記近端第一特性に関連する前記複数の近端
パラメータを復号する第一復号ステップを含む複数の復号ステップによって復号
可能であり、前記デジタル信号が、所定の複数の遠端パラメータからなる遠端圧
縮符号を使用する遠端デジタル信号を更に具備し、前記複数の遠端パラメータが
、遠端第一特性を含む複数の遠端音声特性を具備する遠端音声信号を表示し、前
記遠端圧縮符号が、前記遠端第一特性に関連する前記遠端パラメータを復号する
第一復号ステップを含む複数の復号ステップによって復号可能であり、 前記デジタル信号を前記受信することが、前記近端デジタル信号及び前記遠端
デジタル信号を受信することからなり、 前記読み取ることが、少なくとも前記近端第一パラメータを読み取ることから
なり、 第一パラメータを前記生成することが、前記近端第一パラメータから導出され
る近端第一パラメータを生成することからなり、 少なくとも前記第一復号ステップを前記実行することが、前記近端デジタル信
号に応答して、前記近端音声信号の前記近端第一特性に関連する近端被復号信号
を生成すること、及び、前記遠端デジタル信号に応答して、前記遠端音声信号の
前記遠端第一特性に関連する遠端被復号信号を生成することからなり、 被調整第一パラメータ値を前記生成することが、前記近端被復号信号、前記遠
端被復号信号及び前記近端第一パラメータ値に応答して、前記近端第一特性の調
整を表示する被調整近端第一パラメータ値を生成することからなり、 被調整第一パラメータを前記導出することが、前記被調整近端第一パラメータ
値から被調整近端第一パラメータを導出することからなり、並びに、 前記置換することが、前記近端第一パラメータを前記被調整近端第一パラメー
タで置換することからなる、 請求項31に記載の方法。 - 【請求項41】 前記被調整第一パラメータを導出する前に、オーバーフロ
ー及びアンダーフロー状態に関して、前記被調整第一パラメータ値をテストする
、請求項31に記載の方法。 - 【請求項42】 前記第一パラメータが被量子化第一パラメータであり、被
調整第一パラメータを前記導出することが、前記被調整第一パラメータ値を量子
化することからなる、請求項41に記載の装置。 - 【請求項43】 前記量子化の間、差分スカラー量子化を使用することを更
に具備する、請求項42に記載の方法。 - 【請求項44】 差分スカラー量子化を前記使用することが、前記量子化の
間、フィードバックループ外の量子化器を使用することからなる、請求項43に
記載の方法。 - 【請求項45】 前記第一パラメータが、時間を通して受信される一連の第
一パラメータからなり、少なくとも前記第一パラメータを前記読み取ることが、
前記一連の第一パラメータを読み取ることからなり、第一パラメータ値を前記生
成することが、時間を通して一連の第一パラメータ値を生成することからなり、
被調整第一パラメータ値を前記生成することが、前記被復号信号と少なくとも複
数の前記一連の第一パラメータ値に応答して、前記被調整第一パラメータ値を生
成することからなる、請求項31に記載の方法。 - 【請求項46】 前記第一パラメータが被量子化第一パラメータであり、前
記プロセッサが、被調整第一パラメータを前記導出することが、前記被調整第一
パラメータ値を量子化することからなる、請求項45に記載の方法。 - 【請求項47】 前記量子化の間、差分スカラー量子化を使用することを更
に具備する、請求項46に記載の方法。 - 【請求項48】 前記第一パラメータが被量子化第一パラメータであり、被
調整第一パラメータを前記導出することが、前記被調整第一パラメータ値を量子
化することからなる、請求項31に記載の方法。 - 【請求項49】 前記量子化の間、差分スカラー量子化を使用することを更
に具備する、請求項48に記載の方法。 - 【請求項50】 前記量子化することが、即時スカラー量子化技術を使用す
ることからなる、請求項48に記載の方法。 - 【請求項51】 前記圧縮符号が前記デジタル信号のフレーム内に配置され
、前記フレームが、前記第一パラメータを各々具備する複数のサブフレームから
なり、少なくとも前記第一パラメータを前記読み取ることが、前記複数のサブフ
レームの各々から少なくとも前記第一パラメータを読み取ることからなり、前記
置換することが、前記複数のサブフレームの各々内の前記被調整第一パラメータ
を用いて前記第一パラメータを置換することからなる、請求項31に記載の方法
。 - 【請求項52】 前記置換することが、より低い遅延を達成すべく、第一サ
ブフレームに続くサブフレームを処理する前に、第一サブフレームに対して、前
記被調整第一パラメータで前記第一パラメータを置換することからなる、請求項
51に記載の方法。 - 【請求項53】 前記圧縮符号が前記デジタル信号のフレーム内に配置され
、前記フレームが、前記第一パラメータを各々具備する複数のサブフレームから
なり、少なくとも前記第一復号ステップを前記実行することが、前記被復号信号
を生成すべく前記サブフレームの第一の間、少なくとも前記第一復号ステップを
実行することからなり、少なくとも前記第一パラメータを前記読み取ることが、
前記第一サブフレームに続いて出現する前記サブフレームの第二から少なくとも
前記第一パラメータを読み取ることからなり、第一パラメータを前記生成するこ
とが、前記被復号信号及び前記第一パラメータ値に応じて前記被調整第一パラメ
ータ値を生成することからなり、前記置換することが、前記第二サブフレームの
前記第一パラメータを前記被調整第一パラメータで置換することからなる、請求
項31に記載の方法。 - 【請求項54】 被調整第一パラメータを前記生成することが、前記圧縮符
号に応答して前記音声信号の前記第一特性に関連する被復号信号を生成すべく少
なくとも前記第一復号ステップを実行することからなり、被調整第一パラメータ
を前記生成することが、前記被復号信号及び前記第一パラメータ値に応答するも
のである、請求項31に記載の装置。 - 【請求項55】 符号サンプルからなるデジタル信号を伝送する通信システ
ムであって、前記符号サンプルが、圧縮符号を使用する第一ビット群及び線形符
号を使用する第二ビット群から構成され、前記符号サンプルが音声信号を表示し
、前記音声信号が、第一特性を含む複数の音声特性を有する、という通信システ
ムにおいて、前記圧縮符号を復号することなく、該第一特性を調整する方法であ
って、 前記第二ビット群に応答して、前記第一ビット群及び前記第二ビット群を調整
することにより、前記第一特性を調整すること、を具備する方法。 - 【請求項56】 前記線形符号がパルス符号変調(PCM)符号からなる、
請求項55に記載の方法。 - 【請求項57】 前記第一特性が音声レベルからなる、請求項55に記載の
方法。 - 【請求項58】 前記圧縮符号サンプルが、移動通信標準のための地球的シ
ステムのタンデムフリー動作に従う、請求項55に記載の方法。 - 【請求項59】 前記第一ビット群が前記サンプルの二つの最下位ビットか
らなり、前記第二ビット群が前記サンプルの6個の最上位ビットからなる、請求
項55に記載の方法。 - 【請求項60】 前記6個の最上位ビットがPCM符号を構成する、請求項
59に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14213699P | 1999-07-02 | 1999-07-02 | |
US60/142,136 | 1999-07-02 | ||
PCT/US2000/018293 WO2001003317A1 (en) | 1999-07-02 | 2000-06-30 | Coded domain adaptive level control of compressed speech |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003503760A true JP2003503760A (ja) | 2003-01-28 |
Family
ID=22498680
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001508063A Pending JP2003533902A (ja) | 1999-07-02 | 2000-06-30 | 符号化されたドメインのエコーの制御 |
JP2001508064A Pending JP2003503760A (ja) | 1999-07-02 | 2000-06-30 | 圧縮音声の符号領域適応レベル制御 |
JP2001508667A Pending JP2003504669A (ja) | 1999-07-02 | 2000-06-30 | 符号化領域雑音制御 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001508063A Pending JP2003533902A (ja) | 1999-07-02 | 2000-06-30 | 符号化されたドメインのエコーの制御 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001508667A Pending JP2003504669A (ja) | 1999-07-02 | 2000-06-30 | 符号化領域雑音制御 |
Country Status (5)
Country | Link |
---|---|
EP (3) | EP1190494A1 (ja) |
JP (3) | JP2003533902A (ja) |
AU (3) | AU6063600A (ja) |
CA (3) | CA2378012A1 (ja) |
WO (3) | WO2001003316A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008294990A (ja) * | 2007-05-28 | 2008-12-04 | Panasonic Electric Works Co Ltd | 音声伝送システム |
JP2008292961A (ja) * | 2007-05-28 | 2008-12-04 | Panasonic Electric Works Co Ltd | 音声伝送システム |
JP2008292960A (ja) * | 2007-05-28 | 2008-12-04 | Panasonic Electric Works Co Ltd | 音声伝送システム |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1301018A1 (en) * | 2001-10-02 | 2003-04-09 | Alcatel | Apparatus and method for modifying a digital signal in the coded domain |
JP3946074B2 (ja) * | 2002-04-05 | 2007-07-18 | 日本電信電話株式会社 | 音声処理装置 |
JP3876781B2 (ja) | 2002-07-16 | 2007-02-07 | ソニー株式会社 | 受信装置および受信方法、記録媒体、並びにプログラム |
EP1521242A1 (en) * | 2003-10-01 | 2005-04-06 | Siemens Aktiengesellschaft | Speech coding method applying noise reduction by modifying the codebook gain |
US7613607B2 (en) | 2003-12-18 | 2009-11-03 | Nokia Corporation | Audio enhancement in coded domain |
US8874437B2 (en) | 2005-03-28 | 2014-10-28 | Tellabs Operations, Inc. | Method and apparatus for modifying an encoded signal for voice quality enhancement |
WO2007053086A1 (en) * | 2005-10-31 | 2007-05-10 | Telefonaktiebolaget Lm Ericsson (Publ) | Reduction of digital filter delay |
US7852792B2 (en) * | 2006-09-19 | 2010-12-14 | Alcatel-Lucent Usa Inc. | Packet based echo cancellation and suppression |
WO2009029076A1 (en) * | 2007-08-31 | 2009-03-05 | Tellabs Operations, Inc. | Controlling echo in the coded domain |
WO2012106926A1 (zh) | 2011-07-25 | 2012-08-16 | 华为技术有限公司 | 一种参数域回声控制装置和方法 |
TWI469135B (zh) * | 2011-12-22 | 2015-01-11 | Univ Kun Shan | 調適性差分脈衝碼調變編碼解碼的方法 |
JP6011188B2 (ja) * | 2012-09-18 | 2016-10-19 | 沖電気工業株式会社 | エコー経路遅延測定装置、方法及びプログラム |
EP3651365A4 (en) * | 2017-07-03 | 2021-03-31 | Pioneer Corporation | SIGNAL PROCESSING DEVICE, CONTROL PROCESS, PROGRAM, AND INFORMATION SUPPORT |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10143197A (ja) * | 1996-11-06 | 1998-05-29 | Matsushita Electric Ind Co Ltd | 再生装置 |
JPH10178350A (ja) * | 1996-12-19 | 1998-06-30 | Kokusai Denshin Denwa Co Ltd <Kdd> | 符号化音声データの符号化レート変換方法および装置 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0683114B2 (ja) * | 1985-03-08 | 1994-10-19 | 松下電器産業株式会社 | エコ−キヤンセラ |
US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
US5140543A (en) * | 1989-04-18 | 1992-08-18 | Victor Company Of Japan, Ltd. | Apparatus for digitally processing audio signal |
US5097507A (en) * | 1989-12-22 | 1992-03-17 | General Electric Company | Fading bit error protection for digital cellular multi-pulse speech coder |
US5680508A (en) * | 1991-05-03 | 1997-10-21 | Itt Corporation | Enhancement of speech coding in background noise for low-rate speech coder |
JP3353257B2 (ja) * | 1993-08-30 | 2002-12-03 | 日本電信電話株式会社 | 音声符号化復号化併用型エコーキャンセラー |
US5828995A (en) * | 1995-02-28 | 1998-10-27 | Motorola, Inc. | Method and apparatus for intelligible fast forward and reverse playback of time-scale compressed voice messages |
JPH0954600A (ja) * | 1995-08-14 | 1997-02-25 | Toshiba Corp | 音声符号化通信装置 |
JPH0993132A (ja) * | 1995-09-27 | 1997-04-04 | Toshiba Corp | 符号化・復号化装置及び方法 |
US5943645A (en) * | 1996-12-19 | 1999-08-24 | Northern Telecom Limited | Method and apparatus for computing measures of echo |
US6064693A (en) * | 1997-02-28 | 2000-05-16 | Data Race, Inc. | System and method for handling underrun of compressed speech frames due to unsynchronized receive and transmit clock rates |
JP3317181B2 (ja) * | 1997-03-25 | 2002-08-26 | ヤマハ株式会社 | カラオケ装置 |
US6112177A (en) * | 1997-11-07 | 2000-08-29 | At&T Corp. | Coarticulation method for audio-visual text-to-speech synthesis |
CA2636552C (en) * | 1997-12-24 | 2011-03-01 | Mitsubishi Denki Kabushiki Kaisha | A method for speech coding, method for speech decoding and their apparatuses |
-
2000
- 2000-06-30 WO PCT/US2000/018104 patent/WO2001003316A1/en not_active Application Discontinuation
- 2000-06-30 JP JP2001508063A patent/JP2003533902A/ja active Pending
- 2000-06-30 AU AU60636/00A patent/AU6063600A/en not_active Abandoned
- 2000-06-30 AU AU62033/00A patent/AU6203300A/en not_active Abandoned
- 2000-06-30 WO PCT/US2000/018165 patent/WO2001002929A2/en not_active Application Discontinuation
- 2000-06-30 WO PCT/US2000/018293 patent/WO2001003317A1/en not_active Application Discontinuation
- 2000-06-30 JP JP2001508064A patent/JP2003503760A/ja active Pending
- 2000-06-30 AU AU60671/00A patent/AU6067100A/en not_active Abandoned
- 2000-06-30 JP JP2001508667A patent/JP2003504669A/ja active Pending
- 2000-06-30 CA CA002378012A patent/CA2378012A1/en not_active Abandoned
- 2000-06-30 EP EP00946994A patent/EP1190494A1/en not_active Withdrawn
- 2000-06-30 CA CA002378035A patent/CA2378035A1/en not_active Abandoned
- 2000-06-30 CA CA002378062A patent/CA2378062A1/en not_active Abandoned
- 2000-06-30 EP EP00946954A patent/EP1208413A2/en active Pending
- 2000-06-30 EP EP00948555A patent/EP1190495A1/en not_active Withdrawn
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10143197A (ja) * | 1996-11-06 | 1998-05-29 | Matsushita Electric Ind Co Ltd | 再生装置 |
JPH10178350A (ja) * | 1996-12-19 | 1998-06-30 | Kokusai Denshin Denwa Co Ltd <Kdd> | 符号化音声データの符号化レート変換方法および装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008294990A (ja) * | 2007-05-28 | 2008-12-04 | Panasonic Electric Works Co Ltd | 音声伝送システム |
JP2008292961A (ja) * | 2007-05-28 | 2008-12-04 | Panasonic Electric Works Co Ltd | 音声伝送システム |
JP2008292960A (ja) * | 2007-05-28 | 2008-12-04 | Panasonic Electric Works Co Ltd | 音声伝送システム |
Also Published As
Publication number | Publication date |
---|---|
AU6203300A (en) | 2001-01-22 |
CA2378012A1 (en) | 2001-01-11 |
WO2001002929A3 (en) | 2001-07-19 |
CA2378035A1 (en) | 2001-01-11 |
AU6063600A (en) | 2001-01-22 |
JP2003504669A (ja) | 2003-02-04 |
EP1190495A1 (en) | 2002-03-27 |
WO2001002929A2 (en) | 2001-01-11 |
EP1190494A1 (en) | 2002-03-27 |
JP2003533902A (ja) | 2003-11-11 |
CA2378062A1 (en) | 2001-01-11 |
WO2001003316A1 (en) | 2001-01-11 |
AU6067100A (en) | 2001-01-22 |
EP1208413A2 (en) | 2002-05-29 |
WO2001003317A1 (en) | 2001-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2325707C2 (ru) | Способ и устройство для эффективного маскирования стертых кадров в речевых кодеках на основе линейного предсказания | |
US7362811B2 (en) | Audio enhancement communication techniques | |
US5794199A (en) | Method and system for improved discontinuous speech transmission | |
US20060215683A1 (en) | Method and apparatus for voice quality enhancement | |
US20070160154A1 (en) | Method and apparatus for injecting comfort noise in a communications signal | |
JP2003503760A (ja) | 圧縮音声の符号領域適応レベル制御 | |
US6026356A (en) | Methods and devices for noise conditioning signals representative of audio information in compressed and digitized form | |
US20060217969A1 (en) | Method and apparatus for echo suppression | |
US20060217972A1 (en) | Method and apparatus for modifying an encoded signal | |
US8874437B2 (en) | Method and apparatus for modifying an encoded signal for voice quality enhancement | |
US20060217970A1 (en) | Method and apparatus for noise reduction | |
US20060217988A1 (en) | Method and apparatus for adaptive level control | |
US20060217983A1 (en) | Method and apparatus for injecting comfort noise in a communications system | |
US20040243404A1 (en) | Method and apparatus for improving voice quality of encoded speech signals in a network | |
US20060217971A1 (en) | Method and apparatus for modifying an encoded signal | |
US20030065507A1 (en) | Network unit and a method for modifying a digital signal in the coded domain | |
JP2003533902A5 (ja) | ||
EP1020848A2 (en) | Method for transmitting auxiliary information in a vocoder stream | |
JP3074680B2 (ja) | 音声復号器のポスト雑音整形フィルタ | |
US20040054529A1 (en) | Transmitter and receiver for speech coding and decoding by using additional bit allocation method | |
Chandran et al. | Compressed domain noise reduction and echo suppression for network speech enhancement | |
US7584096B2 (en) | Method and apparatus for encoding speech | |
CN100369108C (zh) | 编码域中的音频增强的方法和设备 | |
JP3163567B2 (ja) | 音声符号化通信方式及びその装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070629 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100727 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20101026 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20101102 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110329 |