JP2003504669A - 符号化領域雑音制御 - Google Patents

符号化領域雑音制御

Info

Publication number
JP2003504669A
JP2003504669A JP2001508667A JP2001508667A JP2003504669A JP 2003504669 A JP2003504669 A JP 2003504669A JP 2001508667 A JP2001508667 A JP 2001508667A JP 2001508667 A JP2001508667 A JP 2001508667A JP 2003504669 A JP2003504669 A JP 2003504669A
Authority
JP
Japan
Prior art keywords
parameter
signal
gain
adjusted
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001508667A
Other languages
English (en)
Inventor
チャンドラン,ラビ
ジェイ. マーコック,ダニエル
Original Assignee
テラブス オペレーションズ,インコーポレイティド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テラブス オペレーションズ,インコーポレイティド filed Critical テラブス オペレーションズ,インコーポレイティド
Publication of JP2003504669A publication Critical patent/JP2003504669A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0014Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the source coding

Abstract

(57)【要約】 通信システム(8)は、第1のパラメータを含む複数のパラメータを備える圧縮符号を用いてディジタル信号を送信する。このパラメータは、雑音特性を含む複数のオーディオ特性を備えるオーディオ信号を表している。圧縮符号は複数の復号化ステップにより復号可能である。プロセッサ(150)が圧縮符号に応答して少なくとも第1のパラメータを読む。このような信号に基づいて、プロセッサは第1のパラメータを調整し、調整された第1のパラメータを圧縮符号に書き込む。この結果、雑音状況は効果的に管理できる。

Description

【発明の詳細な説明】
【0001】 [関連出願の相互参照] 1999年7月2日出願された名称が「圧縮音声の符号化領域強化」である仮
出願番号 60/142,136 に対応する特許である。
【0002】 [発明の背景] 本発明は、圧縮音声の符号化領域強化に関し、特に符号化領域の雑音制御に関
する。
【0003】 この明細書では次の参考文献を参照する。 [1]GSM 06.10「デジタルセルラー電気通信システム(フェイズ2)
、フルレート音声、第2部、トランスコーディング」ETS 300 580−
2、1998年3月。 [2]GSM 06.60「デジタルセルラー電気通信システム(フェイズ2)
、エンハンストフルレート(ESR)、音声トランスコーディング」ETS 3
00 580−2、1998年6月。 [3]GSM 08.62「デジタルセルラー携帯電気通信システム(フェイズ
2+)、音声コーデックのインバンドタンデムフリーオペレーション(TFO)
」ETSI、2000年3月。 [4]J.R.デラー、J.G.プローキンス、J.H.L.ハンセン「音声信
号の離散時間処理」第7章、プリンストンホールInc、1987年。 [5]S.V.バッセイ「上級信号処理及びデジタル雑音低減」第9章、ワイリ
ー(ISBN0471958751)1996年。
【0004】 この明細書では、次の略語を参照する。
【表1】
【0005】 符号化音声のネットワーク強化は、通常復号化、線形処理及び処理された信号
の再符号化を要求する。このような方法は非常に高価である。さらに、符号化プ
ロセスはしばしば、音声強化方法よりもコンピュータ計算上大きなオーダーであ
る。
【0006】 音声圧縮は電気通信特に携帯電話技術及びパケットネットワーク上の音声にお
いてますます用いられている。線形領域で動作する過去のネットワーク技術はい
くつかの欠点を有する。たとえば、線形領域で動作する過去のネットワーク技術
は、圧縮音声の復号化、必要な強化の実行及び音声の再符号化を要求するもので
ある。この処理はコンピュータ計算上困難なもので、特に付加的な量子化雑音を
生む傾向があり、付加的な遅延を引き起こす可能性がある。
【0007】 最適レベルに音声レベルを維持することは、公衆電話交換網(PSTN)にお
ける重要な問題である。電話技術利用者は彼らの会話の理解を最大限にする心地
よい聴取レベルを期待している。電話装置から送信される音声レベルは話者の音
量と、マイクロホンに相対的な話者の位置とに依存する。音量調節が電話装置に
利用できれば、聴取者は手動で所望のレベルに調節することができるだろう。し
かしながら、歴史的な理由により、多くの電話装置は音量調節機能をもたない。
また、聴取者による直接の音量調節は、ネットワーク機器に対して適切なレベル
を維持するという要求に応えるものではない。さらに、特に自動車における移動
体電話の場合、技術がハンドフリー電話技術の段階に進歩しているので、手動調
節は運転者にとって、やっかいで危険なものと考えられる。
【0008】 音質を維持する責任は一般的に、電話装置製造業者が比較的マイナーな役割し
か果たしていないネットワークサービスプロバイダの役割である。伝統的に、ネ
ットワークサービスプロバイダは、音声レベルについて装置とネットワークに対
してきつい仕様を与えていた。しかしながら、増加する国際的な通話量、規制緩
和、激烈な競争そして増大する利用者の期待に起因して、ネットワークサービス
プロバイダは、他のネットワークで用いられる仕様及び装置に大きな影響を与え
ることなく、適切な音声レベルを確保しなければならない。
【0009】 デジタル携帯電話技術やパケットネットワーク上の音声のような新技術とプロ
トコルの広範な導入とともに、ネットワークにおける音声レベルの制御がより複
雑になっている。主要な理由の一つは、伝送路での音声コーデック(符号器−複
合器対)として知られている音声圧縮装置の存在である。音声コーデックが伝送
路に存在し、一方、線形領域では、デジタル音声サンプルが直接処理に利用可能
である場合、音声信号の自動レベル制御(ALC)及び雑音低減はより困難なも
のとなる。
【0010】 計算コストを低減し、遅延を低減し、付加的な量子化雑音を低減する符号化領
域信号処理のアプローチに対する要求が、当該産業において古くから存在してい
た。
【0011】 [GSMデジタルセルラーネットワーク] GSMデジタルセルラーネットワークにおいては、移動体局(送受話器)と基
地局間の音声伝送は圧縮形式又は符号化形式で行われている。GSM FR[1
]とEFR[2]のような音声符号化技術は音声を圧縮するために用いられてい
る。音声を圧縮するために用いられる装置はボコーダと呼ばれる。符号化音声は
サンプルあたり2ビット以下を要する。この状況を図1に示す。基地局間では、
音声は非符号化形式(サンプルあたり8ビットを要する圧伸PCMを用いる)で
送信される。
【0012】 符号化音声及び非符号化音声の用語は次のとおり定義されることに注意された
い。 非符号化音声:代表的には電話技術に用いられるデジタル音声信号サンプルを
いう。これらのサンプルは、サンプルあたり線形13ビットの形式か、又はサン
プルあたり8ビットのμ−則又はA−則PCM形式かのいずれかであり、代表的
なビットレートは64kbpsである。
【0013】 符号化音声:代表的には、GSM FRの場合13kbps、GSM EFR
の場合12.2kbpsのような64kbpsよりかなり下のビットレートを使
用する圧縮音声信号パラメータ(符号化パラメータともいう)をいう。圧縮方法
は単純PCM圧伸スキームより大規模であり、圧縮方法の例として、線形予測符
号化、符号励振線形予測そして多重バンド励振符号化がある。
【0014】 [タンデムフリーオペレーション(TFO)] タンデムフリーオペレーション(TFO)標準[3]は、近未来におけるGS
Mデジタルセルラーネットワークにおいて備えられる予定である。TFO標準は
移動体から移動体への呼に適用される。TFOの下では、音声信号は、短い交渉
期間後に圧縮形式で移動体間を伝わる。これにより、移動体から移動体への呼の
間にタンデム音声コーデックを除去する。原信号がクリーンであれば、タンデム
コーデックの除去によって音質を改善することが知られている。注目すべきキー
ポイントは、移動体送受話器間では音声送信は符号化されたままであることで、
これは図2に示されている。
【0015】 TFOの下では、送受話器と基地局間の送信は、音声サンプルごとに2ビット
以下で、符号化される。しかしながら、基地局間の送信には音声サンプルごとに
8ビットが利用される。基地局では、音声は復号化され、A−則圧伸される。そ
こでサンプルあたり8ビットが必要となる。しかしながら、原符号化音声ビット
が、各8ビットA−則圧伸サンプルにおいて最下位の2ビット(LSBs)を置
き換えるために用いられる。いったんTFOが送受話器間で確立すると、基地局
は、個々の送受話器に対して、各8ビットサンプル中の2LSBsを送るだけで
、6MSBsを捨てる。したがって、ボコーダタンデミングは避けられる。この
プロセスは、3図で説明されている。
【0016】 [雑音問題の背景と従来の解決策] 周囲のバックグラウンド雑音は電話技術の応用に影響与える主要な障害である
。雑音の多い環境で動作する携帯電話の場合に、このような付加的な雑音が特に
きびしい。電話技術サービスプロバイダは、かれらのネットワークにおいて雑音
低減装置を用いて、音質の改良を行い、通話時間をより長くするように勧め、顧
客の満足度を増加させようとしている。雑音は、デジタル携帯送受話器の場合に
はその源で取り扱われるべきだが、送受話器モデルには費用とパワーの限界によ
って、そのような機能を提供するものはほとんどない。そのような機能が提供さ
れても、それらはサービスプロバイダの要求に合致するものではないであろう。
したがって、サービスプロバイダはネットワーク音声強化装置を、規制緩和とよ
り高まる顧客の期待に直面している彼らの競争にとって必須のものと考えている
。ひどいバックグラウンドの雑音状態の存在下でしばしば動作される携帯電話の
使用の爆発的増加は、またネットワークにおける雑音低減装置の使用を増加させ
てきた。
【0017】 従来の雑音の低減方法は図4に示されている。これはスペクトルサブトラクシ
ョンと呼ばれる周知の技術に基づく。
【0018】 スペクトルサブトラクション手法では、雑音の多い信号は、たとえば離散フー
リエ変換を用いて、異なる周波数帯域に分割される。無音検出器は音声のギャッ
プを分離するために用いられる。そのような無音セグメントの間、ノイズスペク
トル(すなわち各周波数帯のノイズパワー)が推定される。また、すべての時間
で各周波数帯のノイズ信号パワーが推定される。これらのパワー推定は、測定時
間中の各周波数帯における信号対雑音比のような情報を与える。これらのパワー
推定に基づいて、各周波数成分が減衰される。位相情報は変えない。 結果の大きさと位相の情報は再度組み合わされる。逆離散フーリエ変換を用いて
、雑音低減信号が再構成される。
【0019】 前記のような技術は、雑音低減処理について非符号化音声信号を必要とする。
そのような雑音低減処理からの出力もまた非符号化信号となる。GSMネットワ
ークのTFOの下で、ネットワークに雑音低減が実現されれば、従来の手法では
、符号化音声を復号化し、生じる非符号化音声を処理し、そしてそれを再符号化
することを要する。従来の技術は非符号化音声信号に関して実行することができ
るだけであるから、復号化と再符号化が必要となる。この手法を図5に示す。こ
の手法のいくつかの欠点は次のとおりである。
【0020】 この手法は2個の復号器と1個の符号器のために計算機処理上高価なものであ
る。代表的には、符号化器は復号器より計算機処理上少なくとも一桁以上複雑で
ある。このように、特に符号化器の存在が、主要な計算機処理上の重荷となる。
【0021】 復号化及び再符号化処理によりもたらされる遅延は望ましいものではない。
【0022】 ボコーダタンデム(すなわち、直列に配置された2個の符号器/復号器対)は
、この手法において導入される。これにより量子化効果に起因する音質の低下を
もたらすことが知られている。
【0023】 提案する技術は(たとえば符号化パラメータの直接的な修正による)符号化さ
れた音声に関し直接的に雑音低減を図ることを可能にする。タンデム効果は避け
られるか、最小限にされ、雑音低減後のよりよく聴取できる品質を達成する。
【0024】 [音声符号化] [概観] 音声圧縮は、損失性のソース符号化のカテゴリーに入るが、一般に音声符号化
と呼ばれる。音声符号化は音声送信に必要な帯域幅を最小限にするように行われ
る。これは帯域幅が不足している無線電話技術においては特に重要である。比較
的豊富な帯域幅をもつパケットネットワークについても、音声符号化はネットワ
ーク遅延やジッタを最小限にするために重要である。音声通信にとっては、デー
タ通信と異なり、遅延は非常に耐えがたい。したがって、より小さなパケットサ
イズにより、パケットネットワークを通る送信を容易にする。関連する4つのE
TSI GSM標準を表1に掲載する。
【0025】 表1:GSM音声コーデック
【表2】
【0026】 音声符号化では、連続するデジタル音声サンプルの1セットを音声フレームと
いう。GSM符号化器は20ms(8kHzサンプリングレートで160サンプ
ル)のフレームサイズで動作する。音声フレームが与えられると、音声符号化器
は音声合成モデルのためのパラメータの小セットを決定する。これらの音声パラ
メータと音声合成モデルとともに、音声フレームが、原音声フレームに非常によ
く似ているように思え、かつ聞こえるように、再構成される。この再構成は音声
復号器により行われる。前記表のGSMボコーダにおいては、符号化処理が復号
化処理より計算機にとってきびしい処理である。
【0027】 音声符号化器によって決定される音声パラメータは、用いられる音声合成モデ
ルに依存する。表1におけるGSM符号化器は線形予測符号化(LSP)モデル
を利用している。一般のLPC音声合成モデルの単純化した表示のブロック図が
図6に示されている。適切にモデルパラメータを特定することによって音声類似
信号を生成するために、このモデルが使用される。この例の音声合成モデルでは
、パラメータは、時変フィルタ係数、ピッチ周期、コードブックベクトルそして
ゲインファクタを含む。合成音声は以下のようにして生成される。適切なコード
ブックベクトルc(n)が、まずコードブックゲインファクタgcによってスケ
ーリングされる。次に、スケーリングされたコードブックベクトルは、ピッチゲ
インgp、ピッチ周期Tをパラメータとして含むピッチ合成フィルタによってフ
ィルタリングされる。この結果はときに全励振ベクトルu(n)と呼ばれる。こ
の名前によって、ピッチ合成フィルタは発声された音声の高調波品質を与えるこ
とを暗に含んでいる。次に全励振ベクトルは、音声フレームの広いスペクトル形
状を特定するLPC合成フィルタによってフィルタリングされる。
【0028】 各音声フレームに対して、パラメータは普通1回以上更新される。たとえば、
GSM FR及びEFR符号化器において、コードブックベクトル、コードブッ
クゲインそしてピッチ合成フィルタパラメータは、すべてのサブフレーム(5m
s)ごとに決定される。LPC合成フィルタパラメータは、EFRにおいてはフ
レームごと(10msごとに)に2回、FRにおいてはフレームごとに1回、決
定される。
【0029】 [符号化ステップ] ここに音声符号化器に用いられる代表的なステップのシーケンスの要約を示す
。 音声サンプルの1フレームを得る。 サンプルのフレームに窓(たとえばハミング窓)をかけ、遅れmで自己相関関
数を決定する。
【0030】 自己相関関数から反射係数及び/又はLPC係数を決定する。(反射係数がL
PC係数の代替表現であることに注意。) 反射係数及び/又はLPC係数を量子化に適当な異なる形式(たとえば対数領
域における比又は線スペクトル周波数)に変換する。 ベクトル量子化技術を用いて、変換されたLPC係数を量子化する。
【0031】 次の演算のシーケンスは各サブフレームで行われる代表的なものである。 ピッチ周期を決定する。 対応するピッチゲインを決定する。 ピッチ周期及びピッチゲインを量子化する。
【0032】 LPC残差信号を得るために、量子化されたLPC合成フィルタを通って原音
声信号を逆フィルタリングする。 残差ピッチを得るために、ピッチ合成フィルタを通ってLPC残差信号を逆フ
ィルタリングする。 最良のコードブックベクトルを決定する。 最良のコードブックゲインを決定する。 コードブックゲインとコードブックベクトルを量子化する。 フィルタメモリを適切に更新する。 付加的誤り訂正/検出、フレームビットその他を付加する。 符号化パラメータを送信する。
【0033】 [復号ステップ] ここに音声復号器における代表的なステップのシーケンスを示す。 誤り訂正/検出およびフレーミングを実行する。 各サブフレームについて、 受信符号化パラメータ(LPC係数、ピッチ周期、ピッチゲイン、コードブッ
クベクトル、コードブックゲイン)のすべてを非量子化する。
【0034】 LPC励振信号を得るために、コードブックゲインによってコードブックベク
トルをスケーリングし、ピッチ合成フィルタを用いてそれをフィルタリングする
。 予備的音声信号を得るために、LPC合成フィルタを用いてLPC励振信号を
フィルタリングする。 フィルタリング後(一般にLPC係数に基づく)を再構成する。 最終的な合成音声を得るために、予備的音声信号をフィルタリングして量子化
雑音を低減させる。
【0035】 [ビットストリームにおける符号化パラメータの配置] エンコーダにより送信されるビットストリームにおける符号化パラメータの配
置の一例として、GSM FRボコーダが考えられる。GSM FRボコーダに
とっては、1フレームは8kHzでサンプリングされる音声の160サンプルと
して定義されている。すなわち、1フレームは20msの長さである。A−則P
CM圧伸によると、160サンプルは、送信のために1280ビットを要する。
符号器は160サンプルを260ビットに圧縮する。各フレームの260ビット
種々の符号化パラメータの配置は、図7に示されている。各符号化フレームの先
頭36ビットはLPC合成フィルタの対応する対数領域比を構成する。残りの2
24ビットは、各56ビットごとの4つのサブフレームに分けられる。各サブフ
レーム内では、符号化パラメータビットがパラメータに関連するピッチ合成フィ
ルタを含み、その後にパラメータに関連するコードブックベクトルとゲインが続
く。
【0036】 [音声合成伝達関数と代表的な符号化パラメータ] 多くの非線形性や発見的技術が復号器での音声合成に含まれれるが、次の近似
伝達関数が音声合成過程によるものである。
【数1】
【0037】 コードブックベクトルc(n)は、H(z)によってフィルタリングされ、合
成音声に至る。音声復号化の一般的LPCモデルについて注意すべきキーポイン
トは、雑音の低減を行うために修正される必要がある利用可能な符号化パラメー
タは、次に示すものであるということである。 c(n):コードブックベクトル g:コードブックゲイン g:ピッチゲイン T:ピッチ周期 {a,k=1,・・,M}:LPC係数
【0038】 多くのLPCを基礎としたボコーダは、上記のセットの類似のパラメータ、上
記形式に変換可能なパラメータ、もしくは上記形式に関連するパラメータ、を用
いている。たとえば、LPCを基礎としたボコーダのLPC係数は、対数領域比
(たとえばGSM FR)を用いるか、又は線スペクトル周波数(たとえばGS
M EFR)を用いて表現される。これらの形式の両方ともにLPC係数に変換
できる。上記形式に関連するパラメータがGSM FR ボコーダのブロック最
大パラメータである場合の1例、ブロック最大は式(1A)に記述されたモデル
のコードブックゲインに直接に比例するとみなすことができる。
【0039】 このように、符号化パラメータ修正のこの論議は、おおよそ一般的な音声合成
復号器に限られているが、どのようなLPCに基礎をおくボコーダに対しても、
そしておそらくその他のモデルに対しても、これらの方法を仕立てることは比較
的簡単である。
【0040】 [旧音声処理技術の符号化領域への適用] 雑音低減のための非符号化音声に用いられるスペクトルサブトラクションのよ
うな技術は、符号化パラメータに用いられることができないことは明らかである
。なぜなら、音声信号の符号化パラメータ表現は著しく相違するものである。
【0041】 発明の要約 本発明は第1のパラメータを含む所定の複数のパラメータを備えた前記圧縮符
合を用いてディジタル信号を送信するための通信システムにおいて有用である。
これらのパラメータは、雑音特性を含む複数のオーディオ特性を有するオーディ
オ信号である。圧縮符号は複数の復号化ステップにより復号化可能である。この
ような環境において、本発明の一つの実施例により、少なくとも第1のパラメー
タを読み出すことにより、また圧縮符号と第1のパラメータに応答して調整され
た第1のパラメータを生成することにより、雑音特性を管理できる。第1のパラ
メータを調整された第1のパラメータで置換される。読み出し、生成及び置換は
プロセッサにより好適に行われる。
【0042】 本発明はまた、符号サンプルを備えるディジタル信号を送信するための通信シ
ステムにおいて、さらに圧縮符号を用いる第1のビットと線形符号を用いる第2
のビットを備えるものに有用である。これらの符号サンプルは雑音特性を含む複
数のオーディオ特性を有するオーディオ信号を表している。このような環境にお
いて、本発明の第2の実施例により、第2のビットに応答して第1のビットと第
2のビットを調整することにより、圧縮符号を復号化することなしに雑音特性を
管理できる。
【0043】 [好適な実施形態の詳細な説明] 本発明は1以上の実施形態について説明されるが、本発明はこれらの実施形態
に限定されないと理解されるべきである。それだけでなく、本発明は、特許請求
の範囲に含まれる、すべての代替のもの、変形したもの及び均等のものを含む。
例えば、本明細書に記載されたALC技術は、更にNR技術への応用ができる。
【0044】 現代のネットワークでは、音声信号は、送信の前にディジタルにサンプルされ
る。そのようなディジタル(即ち、離散時間、離散値)信号は、本明細書では、
線形領域にあると言う。そのような線形領域信号にある音声レベルの調整は、所
望の目標音声レベルに達するために、信号の各サンプルに適当なゲインファクタ
を乗じることにより達成される。
【0045】 通常は電話通信ネットワークで搬送されるディジタル音声信号は、通常、送信
の前に、パルスコード変調(PCM)のような基本形の圧縮を受ける。そのよう
な圧縮方法は、計算及び遅延の点で非常に安価である。圧縮されたディジタルサ
ンプルを線形領域に変換し、その線形サンプルを処理し、そして送信の前に処理
されたサンプルを圧縮することは、ALC又はNR装置にとって比較的扱いやす
いことである。これらの信号は、事際上線形領域にあると考えることができる。
本明細書では、圧縮化又は符号化音声は、かなりの計算上の複雑さを要求する高
度な圧縮技術を使用して圧縮する音声といえる。
【0046】 特に、本明細書及びクレームでは、線形符号化及び圧縮符号化は、以下の意味
を持つ。 線形符号:線形符号により、我々は、可聴周波信号の各サンプルに対する1つ
の符号化パラメータ又は符号化サンプルをもたらす圧縮技術を意味する。線形符
号の例は、PCM(A-則及びμ-則)ADPCM(適応差分パルス符号変調)、
及びデルタ変調である。
【0047】 圧縮符号:圧縮符号により、我々は、可聴周波信号の各サンプルに対する1以
下の符号化パラメータをもたらす技術を意味する。通常は、圧縮符号は、可聴周
波信号の各サンプルの各ブロック又はフレームに対する少ないセットの符号化パ
ラメータをもたらす。圧縮符号の例は、線形予測符号化に基づくGSMボコーダ
(HR,FR,EFR)のようなボコーダである。
【0048】 音声圧縮(これは非可逆ソース符号化のカテゴリにあるものである)は、一般
的に、音声符号化といわれる。音声符号化は、音声送信に必要なバンド幅を小さ
くするために実行される。これは、バンド幅資源が不十分である無線電話通信で
は特に重要である。比較的バンド幅が豊富なパケットネットワークでは、音声符
号化は、ネットワーク遅延及びジッタを少なくするために、重要である。これは
、データとは違って音声通信は、遅延が極度に許されないことによる。それで、
より小さいパケットサイズは、パケットネットワークを介する伝達を容易にする
。いくつかの工業規格のコーデック(符号器−復号器の対)を、参照のためにテ
ーブル1に掲載する。
【0049】 音声符号化では、1セットの連続するディジタル音声サンプルは、音声フレー
ムと呼ばれる。音声フレームが与えられると、音声復号器は、音声合成モデルの
ために小さなセットのパラメータを決定する。音声パラメータ及び音声合成モデ
ルでもって、原音声フレームに酷似して現われ、聞こえる音声フレームが再構築
される。この再構築は、音声復号器により実行される。多くの音声符号器では、
符号化処理は、復号化処理より以上に計算上厳しいということに注意されるべき
である。更に、高品質の音声復号化を達成するために必要な秒当たり百万の命令
(MIPs)は、非常に高価である。ディジタル信号処理チップセットの処理能
力が、携帯電話機のようなアプリケーションでの音声符号化を広範囲に使用可能
とするのに十分進歩したのは近年になってからである。
【0050】 音声符号器により決定される音声パラメータは、使用した音声合成モデルに依
存する。例えば、テーブル1の符号器は、線形予測符号化(LPC)モデルを利
用する。(より詳細には、これらの符号器は、符号化励振線形予測即ちCELP
符号器の部類に属する。)LPC音声合成モデルを簡単化したブロック図が図6
に示されている。このモデルは、モデルパラメータを適切に指定することにより
、音声らしい信号を発生するために使用できる。この例の音声合成モデルでは、
パラメータは、時変フィルタ係数、ピッチ周期、励振ベクトル及びゲインファク
タを含む。基本的に、励振ベクトルc(n)は、最初にゲインファクタGにより計
られる。その結果は、ピッチ合成フィルタにより濾波され、そのフィルタのパラ
メータは、すべての励振ベクトルu(n)を得るためのピッチゲインg、ピッチ
周期Tを含む。これは、LPC合成フィルタにより濾波される。マルチバンド励
振モデルのようなほかのモデルは、更に音声符号化で使用される。これに関して
、仮定モデルと共にある音声パラメータは、圧縮を達成するため、ディジタル音
声信号の冗長性を除去する手段を提供することに注意するとよい。
【0051】 図6に示すように、全体のDCゲインはGにより与えられ、そして、ALCは
、本来的に修正Gを含む。更に、ゲインファクタgは、雑音のある音声の場合
に、もし必要ならば、雑音低減の所定の度合いを得るために修正される。
【0052】 通常の音声符号器により各フレームに生成される音声パラメータの間では、い
くつかのパラメータが、そのフレームにおける音声信号のスペクトル及び/又は
波形に関係する。これらのパラメータは、LPC音声合成モデルの場合に、LP
C係数とピッチ情報とを通常は含む。スペクトル情報を与えるこれらのパラメー
タに加えて、通常は、音声フレームのパワー即ちエネルギに直接関係するパラメ
ータがある。音声レベルに関するパラメータ(SLRP)は、符号化音声のAL
Cを実行するためのキーである。そのようなSLRPのいくつかの例が以下に示
される。
【0053】 今、テーブル1の最初の3つのGSMコーデックについて論ずる。最初の3つ
の符号器のすべては、8kHzでサンプルされた音声を処理し、サンプルは、13
ビット線形PCM値で得られたと仮定する。フレーム長は160サンプル(20
ms)である。更に、それらは、各フレームを、各40サンプルの4つのサブフ
レームに分割する。これらのコーデックのためのSLRPがテーブル2に掲載さ
れている。
【0054】 テーブル2.GSM音声コーデックの音声レベルに関するパラメータ(SLRP
【表3】 符号器に応じて、SLRPは、サブフレーム(例、GSM・FR及びEFRコ
ーデック)ごとに、又はフレーム(例、GSM・HRコーデック)ごとに1回指
定される。
【0055】 本明細書を通して、山形記号を上に付けた又は付けていない同一変数が、非量
子化及び量子化を表すために使用される。例えばγgc及びγgcは、GSM・EF
R規格の非量子化及び量子化ゲイン修正係数である。量子化SLRPγgcのみが
ALC装置で有効であることに留意されたい。
【0056】 量子化及び対応の非量子化パラメータは、量子化関数Q(.)と関係付けられる
(例、γgc=Q(γgc))。我々は、内容によっては、この変換だけでなく、参
照テーブル又は式を使用して量子化値のインデックスの定義を含めるように、比
較的自由に記号を使用する。 (p25)
【0057】 量子化関数は、多対1変換であり、可逆ではない。しかしながら、我々は、適
当な参照テーブル又は式を使用して、所定のインデックスを対応する量子化値に
変換することを表すため、「逆」量子化関数Q-1(.)を使用する。
【0058】 図8は、線形領域から符号化領域を区別する。線形領域では、ディジタル音声
サンプルは、直接処理に適用される。符号化領域は、音声符号器の出力又は音声
復号器の入力をさし、これはチャネルエラーがなければ同一である。これに関し
て、符号化領域は、音声パラメータと、これらのパラメータの量子化又は逆量子
化を使用する方法との両方を含む。符号器により決定される音声パラメータは、
送信の前に量子化処理を受ける。この量子化は、原ディジタル音声信号により要
求されるより低いビットレートを達成するために重要である。量子化処理は、多
くの場合、参照テーブルの使用を含む。更に、異なる音声パラメータは、異なる
技術を使用して量子化されることができる。
【0059】 符号化領域の音声処理は、量子化音声パラメータを、各パラメータに対する量
子化器により許容される量子化値の異なるセットに直接修正することを含む。A
LCの場合、修正されたパラメータは、SLRPである。雑音低減(NR)のよ
うなほかのアプリケーションに対しては、ほかのパラメータが使用できる。
【0060】 単一音声パラメータの量子化は、スカラー量子化と呼ばれる。1組のパラメー
タが一緒に量子化されるときは、その処理はベクトル量子化と呼ばれる。ベクト
ル量子化は、通常、LPC係数のような相互に何らかの関係がある1組のパラメ
ータに適用される。スカラー量子化は、一般的に、ほかのパラメータと比較的無
関係なパラメータに適用される。両方の量子化方法を用いることもまた可能であ
る。SLRPは通常はスカラー量子化であるので、ごく一般的に使用されるスカ
ラー量子化に焦点を合わせる。
【0061】 パラメータが瞬時量子化されるとき、量子化処理は、パラメータの過去及び将
来の値とは無関係である。パラメータの現在の値のみが量子化処理に使用される
。量子化されるパラメータは、1組の許可された量子化レベルと比較される。近
さ(closeness measure)に関して所定のパラメータにベストマッチする量子化
レベルが、そのパラメータを表すために選ばれる。通常、許可された量子化レベ
ルは、符号器及び復号器の両方の参照テーブルに格納される。選択された量子化
レベルのテーブルへのインデックスは、符号器から復号器へ送信される。あるい
は、インデックスが与えられたとすると、量子化レベルは数式を使用して定義さ
れてもよい。量子化レベルは、通常、SLRPの場合は、不均一な間隔とされる
。例えば、[0,32767]の範囲を持つGSM・FRコーデックにおけるブロック
最大値χmaxは、図9に示す64のレベルに量子化される。この量子化スキーム
において、χmaxに近いがそれ以上のレベルが選択される。量子化レベルを表す
縦軸は、対数目盛りで描かれていることに注意されたい。
【0062】 瞬時量子化スキームは、固定ダイナミックレンジを使用することにより普通以
上の量子化エラーを招く。したがって、計算をより複雑にするという犠牲を払っ
ても量子化エラーを低減するために、多くの場合、音声復号化において適応量子
化器が使用される。適応量子化器はフォワード適応、バックワード適応に利用で
きる。フォワード適応スキームでは、ダイナミックレンジに関する特別なサイド
情報は、量子化テーブルインデックスに加えて復号器に周期的に送信されなけれ
ばならない。したがって、そのようなスキームは、通常は音声復号器には使用さ
れない。バックワード適応量子化器は、サイド情報の送信を要求しないので、好
適である。標準偏差及び差分の一般的な2種のバックワード適応量子化器が普通
に使用される。これらは図10に描かれている。
【0063】
【外1】
【0064】 図10(b)のバックワード適応差分量子化スキームでは、現在及び以前のパラ
メータ値の間の相関が、好都合に使用される。相関が高い場合、量子化ダイナミ
ックレンジの大きな低減は、予測エラーr(n) の量子化により達成できる。予測
エラーは、実際のパラメータ及び予測パラメータ値の間の差分である。(n) に対
する同一予測器が、量子化器及び逆量子化器の両方で使用されなければならない
。以下の式を有する線形予測器P(z)が使用される。
【数2】
【0065】 すでに示したように、差分量子化スキームは図10のように表すことができ、
そこでは線形予測器P(z)が使用される。我々が伝達関数P(z)/[1-P(z)] を線
形予測器P1(z)=Σp k=1bkz-kにより近似するならば、より簡単に実行できると
いうことに注意されたい。このより簡単な差分技術は、ゲイン修正係数γgcの関
数の量子化のためにGSM・EFRコーデックで使用される。このコーデックで
は、固定係数[b1,b2,b3,b4]=[0.68,0.58,0.34,0.19] を持つ4次の線形予測器が
符号器及び復号器の両方で使用される。
【0066】 EFR符号器では、gc(n)は、サブフレームnでの励振ベクトルをスケーリン
グするために使用されるゲインファクタを表す。このゲインファクタは、全体の
信号レベルを決める。このパラメータの量子化は、図11に示すスキームを利用
するが、これはむしろ間接的である。送信される実際の「ゲイン」パラメータは
、実際にはgc(n)と予測ゲインgc'(n)の間の修正係数である。
【数3】 として定義される修正係数γgc(n)は、符号化領域で直接アクセスできる全体の
音声レベルに関する唯一のパラメータであるので、実際のSLRPと考えられる
【0067】
【外2】
【0068】 SLRPγgcの量子化が図12に示されている。この図では、R(n) は、
【数4】 で与えられる予測誤差を表す。
【0069】
【外3】
【0070】 符号器でのSLRPの量子化は、各サブフレームの平均除去励振ベクトルエネ
ルギを使用することによって、間接的に実行される。E(n) は、各サブフレーム
nの平均除去励振ベクトルエネルギ(dB)を表し、次式で与えられる。
【数5】
【0071】
【外4】
【0072】 励振ベクトル{c(i)}は、SLRPの決定に先立つ符号器において好適である。
励振ベクトルの復号化は、SLRPの復号化に無関係であると注意されたい。E
(n) はゲインファクタgc の関数であることが理解できる。γgc(n)のγgc(n)へ
の量子化は、間接的にgc のgc への量子化の原因となる。復号器における全体
的な信号合成のレベルのセッティングにより、量子化ゲインファクタは励振ベク
トルをスケーリングするために使用される。予測エネルギは次式で与えられる。
【数6】 ここで、{R(n-I)}は、以前の量子化値である。
【0073】
【外5】
【0074】 通信の当業者なら、SLPRに関連して説明される量子化技術はNRパラメー
タに等しく適用されることを知っている。
【0075】 大部分のコーデックに対して、符号化音声の部分復号化のみがALCを実行す
るのに必要である。十分に正確な音声レベル、ボイスアクティビティ及びダブル
トーク測定を基本的に得るために必須の他のパラメータと同様に、SLRPの抽
出に必要な程度まで、音声が復号化される。単に部分符号化で足りる状況の例は
以下のものを含む。
【0076】 1)CELP復号器では、ポストフィルタリング処理は、LPCベースモデル
を使用して復号化される信号に関して実行される。このポストフィルタリングは
、量子化雑音の低減を助けるが、信号の全体パワーレベルは変えない。したがっ
て、CELP符号化音声の部分復号化では、ポストフィルタリング処理は経済性
のために省略することができる。
【0077】 2)無音抑制スキームのいくつかの形が、携帯電話通信及びボイスオーバパケ
ットネットワークで多用される。これらのスキームで、符号化音声フレームがボ
イスアクティビティの間のみ送信され、無音の間では非常にわずかの送信しか実
行されない。復号器は、他端からのバックグランド雑音に似せるため、無音期間
の間いくらかの安全な雑音を自動的に挿入する。GSMセルラネットワークで使
用されたそのようなスキームの1例は、不連続送信(DTX)と呼ばれる。無音
抑制を示すサイド情報をモニタすることにより、ALC装置の復号器は、無音の
間の信号復号化を完全に回避することができる。そのような場合、ボイス及びダ
ブルトークアクティビティの決定は、ALC装置で更に単純化される。
【0078】 3)GMSネットワークの音声コーデックのための、提案されているタンデム
フリーオペレーション(TFO)規格では、各チャネルの符号化音声ビットは、
64kbit/secで基地局間の有線ネットワークを通して搬送される。このビットス
トリームは、8ビットサンプルに分割される。各サンプルの2つの最下位ビット
は符号化音声ビットを含み、上位の6ビットは、適当なPCMサンプルに対応し
たビットを含む。PCM情報の線形音声への変換は、非常に安価であるが、線形
音声信号の幾分かの雑音を含むある変形を与える。線形領域ALCアルゴリズム
で通常実行される、必要なボイスアクティビティ、ダブルトーク及び音声レベル
測定を実行するために、この雑音のある線形領域音声信号を使用することは、可
能である。したがって、この場合、最小量のPCMサンプルの変換のみが必要で
ある。SLRPの再量子化に要求されるSLRP及びそのほかのパラメータは、
変換する必要がある。ほかのパラメータは、SLRPの再量子化に必要な限度で
のみ符号化される。これは、後述の項に続く例から明らかになる。
【0079】 したがって、我々は、部分復号化及び再符号化を実行するだけで、複雑さを減
少し量子化雑音を低減するALC装置を提供することが可能だと考える。しかし
ながら、図14に示したALC方法は改良することができる。サブ最適性(sub-
optimality)は、ゲイン決定の処理がSLRP再量子化と無関係であるという暗
黙の前提による。普通、この仮定は有効ではない。
【0080】 図14に示されたALC方法もなおNRに適用可能だということは通信の当業
者なら理解できる。
【0081】 図14の方法の改良するには3つの主要素がある。第1に、再量子化は、通常
は、所望の値と相違する実現されるSLRPをもたらすということに注意された
い。したがって、ゲイン決定ブロックにより利用される所望のゲインは、信号が
復号化されたとき実現されるゲインとは異なる。復号化時、音声信号はそれぞれ
過増幅又は過抑制されるため、この相違によりオーバフロー又はアンダフローの
問題が生じる。第2に、いくつかのALCアルゴリズムは、現在及び将来の所望
ゲイン値を決定するために、過去の所望ゲインを利用する。所望ゲイン値は、実
際の実現されたゲイン値を反映しないので、そのようなアルゴリズムは、図14
に示されるとおり適用されると、誤る可能性がある。第3に、再量子化処理は、
SLRPでの好ましくない残響を時々もたらす。これは、音声レベルを意図せず
に変調し、音声信号を歪ませることになる。そのようなSLRP残響は、差分量
子化のようなフィードバック量子化スキームでみられる。
【0082】 図15に転ずると、オーバフロー/アンダフローの問題を解決するために、図
15の双方向技術をゲイン決定ブロックに組み込むことができる。基本的に、所
望のゲイン値を決定した後、SLRPの再量子化後の実現されるゲイン値が計算
される。実現されるゲインは、オーバフロー又はアンダフロー問題が発生したか
否かを見分けるためにチェックされる。これは、例えば、実現されるゲインに原
音声レベルを乗じた新音声レベルを決定することにより達成できる。あるいは、
オーバフロー又はアンダフロー問題が実際に発生したか否かを見分けるため、音
声復号器がALC装置で使用できる。いずれの方法でも、もし、実現されるゲイ
ン値が高すぎる又は低すぎると思われるならば、オーバフロー/アンダフローの
危機がなくなったと判断されるまで、新SLRPは、それぞれ低減又は増加され
る。
【0083】 所望のゲイン値が現在及び将来のゲイン値を決めるためにアルゴリズムにフィ
ードバックされるALCアルゴリズムにおいて、以下の修正をすることができる
。基本的に、フィードバックされるゲインはSLRP再量子化処理後の実現され
るゲインであって、所望のゲインではない。好ましいアプローチは図16に示さ
れている。所望のゲインが実現されるゲインの代わりにフィードバックループに
用いられるなら、コントローラは実際の復号音声信号レベルをトラッキングせず
、誤ったレベルコントロールとなる。
【0084】 図15のアンダーフロー/オーバーフロー防止のための反復スキームは図16
のゲイン決定ブロックに組み込むことができることに注意されたい。
【0085】 最後に、フィードバックベース量子化スキームにおけるSLRP反響音を避け
る方法を以下に詳細に検討する。一般に、これらの方法は、好ましくはゲイン決
定及び再量子化技術の集積を含んでいる。
【0086】 ゲイン決定ブロック及びSLRP再量子化ブロックの結合設計と実施は、復号
化の間のオーバーフローとアンダーフロー問題を防止するために好ましく、フィ
ードバックベースのALCシステムによる適切なトラッキングを確実にし、フィ
ードバック量子化スキームにより生じる振動効果を回避する。図17は、ゲイン
決定とSLRP再量子化の結合を用いるALC装置の一般的構成を示している。
詳細は個々のALC装置に依存する。
【0087】 SLRPの再量子化の技術を以下に述べる。ほとんどの音声符号器において、
SLRPの量子化は瞬時スカラー量子化(instantaneous scalar quantization
)又は差分スカラー量子化のいずれかを用いて実行でき、それは上記に述べた。
これら個々のケースのSLRPの再量子化は、そのアプローチが他の量子化スキ
ームに容易に拡張できることを注記して記載する。図17のALC装置構成にお
けるゲインとSLRP再量子化の結合の決定は、ここで述べる再量子化技術を利
用することができる。
【0088】
【外6】
【0089】 オーバフロー及びアンダーフローの防止を望むなら、図15に記載された反復ス
キームを用いることができる。オーバフロー及びアンダーフロー防止の別のアプ
ローチにおいて、再量子化SLRPを用いた音声サンプルの部分復号を必要な範
囲で実行することができる。これはもちろん、余分なアルゴリズムの複雑さを伴
う。復号されたサンプルは、オーバフロー又はアンダーフローが生じていないこ
とを確認するため、直接点検することができる。
【0090】
【外7】
【0091】 SLRP量子化テーブル値が一様に間隔が空けられていれば(線形に又は対数関
数的に)、スカラー再量子化プロセスを単純化することができる。この単純化は
、ALC装置において別個のセットの所望のゲイン値のみを許容することによっ
て達成される。これらの所望のゲイン値は好ましくは、0dBがゲインの1つで
ある、SLRP量子化値として同じ間隔を持っている。これは、所望のそして実
現されるゲイン値が、式(8)が各テーブル値について数値を求められないよう
にするため、常に調節されることを確実にする。そのため、再量子化は大きく単
純化される。SLRPの当初の量子化インデックスは、SLRP量子化テーブル
間隔によって分割された所望のゲイン値に対応した値によって単純に増加し又は
減少する。例えば、SLRP量子化テーブル間隔がΔで表されるとする。すると
容認された所望のゲイン値の離散セットは、もしSLRP量子化テーブル値が一
様に線形に間隔を有していれば、1+{.., −2,−,0,,2,..}であり、
もしSLRP量子化テーブル値が一様に対数関数的に間隔を有していれば、0+
{.., −2,−,0,,2,..}である。もし所望のゲイン値が1+kΔ(線
形の場合)又はkΔ(対数的な場合)、再量子化されたSLRPのインデック
スは単にSLRPの原量子化インデックスにkを加えることにより得られる。
【0092】 この低複雑度の瞬時スカラー再量子化技術は、SLRP量子化テーブル値が一様
に間隔を有していなくとも適用できる。この場合、Δは隣接する量子化テーブル
値間の平均間隔であり、該平均はこれらの値間の線形又は対数関数的間隔のいず
れかを用いて適切に行うことができる。
【0093】 瞬時スカラー再量子化の例は、図18にGSM FRCODECについて示されてい
る。このCODECのSLRPはブロック最高xmaxであり、すべてのサブフレー
ムに伝送される。Q及びQ−1ブロックは、それぞれSLRP再量子化及び逆量
子化を表している。ブロック最高のインデックスは、xmaxを得るためルック
アップテーブルを用いて最初逆量子化される。それから、xmaxはルックアッ
プテーブルを用いて再量子化されるxmax,ALCを得るため、所望のゲイン
が乗ぜられる。再量子化されたxmaxのインデックスは、送られる前にビット
ストリームにおいて原の値に取って代わる。この再量子化技術は、GSM FR
標準についての符号化領域ALCを実行するとき、図14−17において述べら
れたすべての技術の基本的要素を形成する。
【0094】 この技術がNR関連パラメータのような他のパラメータに適用可能であるが、S
LRPに対する上記技術の適用を以下に記載する。GSM EFRCODECは、再
量子化技術を用いて符号化領域ALCの実行を示すための例として用いられる。
【0095】
【外8】
【0096】
【外9】
【0097】
【外10】
【0098】 ALC装置において実現されるゲイン、ΔR(n)のフィードバックは、望ま
ない振動効果を引き起こすことができる。例として、GSM EFRコーデック
が用いられるとき、これらの振動効果をデモンストレートする。このコーデック
について、P(z)が4つの遅延素子を持っていることを思い出してほしい。
各素子は、32の値の1つを含むことができる。そのため、ALC装置における
非線形システムは、何時でも百万を超える状態のいずれの1つであることができ
る。このことは、この非線形システムの動作が初期条件によって重く影響される
ため述べられている。
【0099】 所望のゲイン、ΔG(n)におけるステップに応答して実際に実現されるゲイン
の反響音が描かれる。単純化のため、原のSLRP、R(n)は100を超える
サブフレームについて一定であり、P(z)のメモリは当初0であると仮定す
る。図20(a)は所望のゲインにおけるステップを示している。図20(b)
は所望のゲインに重ねられた実際に実現されるゲインを示している。初期条件及
び原SLRPは正確な動作を決定するが、ここに示された実際の実現されるゲイ
ンにおける反響音は全く典型的なものである。
【0100】 図20(b)に示されたSLRP実現されるゲインの反響音は音声信号の変調を
もたらし、聞こえる歪みとなる。そのため、ALCの仕様によっては、このよう
な反響音は望ましくないかもしれない。反響音は、図20に示されているように
量子化器をフィードバックループの外側に動かすことによって取り除くことがで
きる。(この実施例において、計算は不要であるが、しかし図19と比較のため
含まれている。)
【0101】 量子化器をフィードバックループの外側に置くことは、所望のゲインに重ねら
れた、図20(c)に示された実際の実現されるゲインとなる。反響音は取り除
かれるが、平均エラー(即ち、所望のゲインと実現されるゲインの平均の差)は
図20(b)に示されたものより高いということが注記されるべきである。特に
この例では、フィードバックループに量子化器を有した及び有しない再量子化器
の安定状態の操作の間の平均エラーは、それぞれ0.39dB及び1.03dB
である。
【0102】 計算を節約した結果、図22に示すように図21のALC装置は単純化される。
これは線形システムY[1+P(z)]を定数、1/[1+P(1)]で置
き換えることによってなされる。
【0103】 ALCのために、このより単純な実行は、しばしば、特に所望のゲインが相対的
にめったに変化しないときに十分に見られる。めったに起こらない変化によって
、変化の間のサブフレームの平均数はP(z)のオーダーより大きいことを意
味している。
【0104】 いくつかのALCアルゴリズムは現在及び将来のゲイン値を決定するために過去
のゲイン値を利用することができる。このようなフィードバックに基づくALC
アルゴリズムにおいて、フィードバックされるゲインは、SLRP再量子化処理
後に実際に実現されるゲインであり、所望のゲインではない。このことは図16
と関連して上記に述べた。
【0105】 このようなフィードバックに基づくALCアルゴリズムのための差分スカラー再
量子化は、図23に示されているように実施できる。これらの実施において、A
LC装置は実際に実現されるゲインを決めるために復号器の動作を真似ている。
【0106】 もし図21に似た単純化されたALC装置の実施が図23(b)で望まれるなら
、線形システム1/[1+P(z)]は定乗数、1/[1+P(1)]で置
き換えることができる。さらなる単純化が、実際に実現されるゲインの計算の正
確さはいくらか減少するが、線形システム、1+P(z)を定乗数、[1+P (1)]で置き換えることにより達成できる。類似の方法で、図23(a)に
示された実施は、線形システムを定乗数P(1)で置き換えることによって単
純化される。
【0107】 反響音に寛容であるが、しかし所望のゲイン及び実際に実現されるゲインのマ
ッチングにおいてより高い正確さを求める応用において、フィードバックループ
内に量子化器を有する先に述べた方法のいずれも用いることができる。実際に実
現するゲインにおいて反響音を許容することができないが、しかし所望のゲイン
及び実際に実現されるゲインのマッチングにおいてより低い正確さを許容するこ
とができる応用のために、量子化器をフィードバックループの外側に有する先に
述べた方法のいずれも用いることができる。しかしながら、もし正確さと反響音
の回避の両者がALCの場合におけるように必要であれば、異なったアプローチ
が必要である。
【0108】 現在の方法は、図21,22、又は23(b)のように量子化器をフィードバ
ックループの外側に置くことにより、実際に実現されるゲインの反響音を回避し
ている。加えて、所望のゲインと実際に実現されるゲインの間の平均エラーは、
所望のゲイン値を実際に実現される可能なゲイン値のセット、所与の現在の原S
LRP値、R(n)に属させて制限することによって最小化される。
【0109】
【外11】
【0110】
【外12】
【0111】
【外13】
【0112】 このように、一般に間隔Δを有したSLRP値の各々一様に間隔を空けたサブ
セットについて、所望のゲイン値は、対応する現在の原SLRPがそのサブセッ
トに属するなら、Δ[1+P(1)]の倍数に選択される。
【0113】 大きなバッファリング、処理、及び伝送遅延は、すでに音声符号器によって生
じている。音声強化のための符号化音声のさらなる処理は追加の遅延を加える。
このような追加の遅延は、電話の会話を潜在的に不自然なものとするので望まし
くない。さらに、追加の遅延は送受話器のエコーキャンセルの効率を減じ、又は
所与のレベルの実行についてエコーキャンセラーの必要な複雑さを増やす。線形
領域におけるALCの実施は、復号及び再復号のためのバッファリング及び処理
要件のために、常に少なくとも1つのフレームの遅延を加えることに注意される
べきである。テーブル1にリストされたコーデックについて、各フレームは20
msの長さであることを注意されたい。しかしながら、符号化ALCは1フレー
ムより相当小さいバッファリング遅延で実行できる。通信の分野の者は同じ原理
をNRに適用できることを認識している。
【0114】 EFR符号器は20msの音声フレームを244ビットに圧縮する。ALC装
置の復号器において、最初のサンプルが復号化できる最も早い点は、図25(a
)に示されているように、ビット91を受けた後である。このことは、およそ7
.46msのバッファリング遅延を表している。十分な情報が、最初のサンプル
でなくこの点における最初のサブフレーム全体を復号するために受けることがわ
かる。同様に、最初のサブフレーム全体がFR復号器における約7.11msの
バッファリング遅延の後に復号できる。
【0115】 符号器と復号器の両者について、残りのサブフレームが復号の前により短い待
ち時間を要求する。各サブフレームはEFR及びFR符号化スキームの両者にお
いて関連したSLRPを持っていることに注意されたい。このことは一般的に、
符号器がサブフレームレベルで操作する場合ほとんどの他のコーデックについて
事実である。
【0116】 上記より、符号化領域におけるALC及びNRは、フレーム毎よりむしろサブ
フレーム毎に行うことができることが理解できる。サブフレームが復号され、必
要なレベルの測定が更新されるやすぐ、ALC装置によって計算された新しいS
LRPは、受信したビットストリームの原のSLRPを置き換えることができる
【0117】 SLRPで生じた遅延は、受信したビットストリームにおけるSLRPに対応
するビットの位置によって決定される。FR及びEFRコーデックの場合、最初
のサブフレームについてのSLRPビットの位置はこの遅延を決める。
【0118】 ほとんどのALCアルゴリズムは、サンプルを受信した後にのみ音声サンプル
のゲインを決める。このことはALCアルゴリズムが、あまりに大きなゲインの
ために音声信号がクリップされない、又は非常に低いゲインのためアンダーフロ
ーすることを確実にする。しかしながら、強いアルゴリズムにおいて、オーバー
フローとアンダーフローの両者は、低い可能性を持った事項である。このように
、先のサンプルからのみ得た情報に基づいてサンプルのゲインを実際に決めるこ
とができる。この概念は、いくつかの音声コーデックについてのコード化領域A
LCにおいて0に近いバッファリング遅延を達成するために用いられる。同じ原
理がNRアルゴリズムに適用できることは、通信分野の者であれば認識している
【0119】 基本的に、ALCアルゴリズムは、先のサブフレームのみに基づいて現在のサ
ブフレームのゲインを決定するように設計されなければならない。このように、
SLRPを修正するためにバッファリング遅延はほとんど必要ない。所与のサブ
フレームにおけるSLRPに対応するビットを受けるとすぐ、それらは最初に復
号される。新しいSLRPは、原のSLRP及び先のサブフレームのみからの情
報に基づいて計算される。当初のSLRPビットは新しいSLRPビットに置き
換えられる。現在のサブフレームを復号するに必要なすべてのビットが受信され
るまで待つ必要はない。そのため、アルゴリズムによって生じるバッファリング
遅延は、小さな処理遅延に依存している。音声レベルについての情報は、現在の
サブフレームについてのSLRPの置き換えの後にのみ現在のサブフレームから
得られる。同じ原理がNRアルゴリズムに適用できることは、通信分野の者であ
れば認識している。
【0120】 ほとんどのALCアルゴリズムは、この遅延方式で操作するため容易に変換で
きる。小さなリスクのオーバーフローとアンダーフローがあるが、このようなリ
スクは音声のサブフレーム(通常約5ms)のみに分離される。例えば、大きな
ゲインが適用されたことによるサブフレームにおけるオーバーフローの後、次の
サブフレームについて計算されたSLRPは、続くオーバーフローの可能性を最
小化するために適切に設定される。同じ原理がNRアルゴリズムに適用できるこ
とは、通信分野の者であれば認識している。
【0121】 ゼロに近いバッファリング遅延方法は特にFRコーデックに適用可能である。
なぜなら、このCODECについてのSLRPの復号化は他のパラメータの復号化を
伴わないからである。EFRのCODECの場合、サブフレーム励振ベクトルは、S
LRPを復号するために必要であり、より複雑な差分再量子化技術はSLRPを
再量子化するために使用されなければならない。この場合でも、遅延の著しい減
少は、SLRPが現在のサブフレームに置き換えられた後に現在のサブフレーム
に基づいて音声レベル更新を実行することによって達成される。同じ原理がNR
アルゴリズムに適用できることは、通信分野の者であれば認識している。
【0122】 GSMネットワークにおいて提案されたTFO標準と共に符号化領域ALCを
実行することは上記に述べた。この標準に従って、受信したビットストリームは
8ビットサンプルに分割できる。各サンプルの2つの少なくとも重要なビットは
、符号化音声を含み、一方上側6ビットは適当なPCMサンプルに対応するビッ
トを含む。そのため、線形音声サンプルの雑音バージョンは、この場合のALC
装置に利用可能である。線形領域ALCアルゴリズムにおいて通常なされている
必要なボイスアクティビティ、ダブルトーク、音声レベル測定を実行するため、
雑音線形領域音声信号を用いることは可能である。この場合、符号化音声パラメ
ータを復号化する最小の量のみ必要である。SLRPの決定と再量子化のために
必要とされるパラメータのみ復号されなければならない。音声信号の部分復号は
、雑音線形領域音声サンプルが、音声レベルボイスアクティビティとダブルトー
ク検出を実行すると同様に音声レベルを測定することに依存できるので、不要で
ある。
【0123】 本発明の目的は、処理された信号の再符号化を必要とする同様の質を有した線
形領域技術を用いるよりコンピュータへの依存がより少ない方法を介して、符号
化された領域の雑音低減を実行する方法を得ることである。信号特性における所
望の変化を有効にするパラメータを修正するために符号化領域で利用可能な柔軟
性は、量子化のために制限されるかもしれない。異なる音声パラメータ及び産業
標準音声符号器により用いられる対応する量子化方法の調査は行われた。異なる
音声パラメータの修正は順次検討され、雑音低減を達成するためそれらを利用す
る方法が検討される。
【0124】 音声の変動的性格のため、「短時間」測定が所与の時間に音声についての情報
を得るために用いられることが好ましい。例えば、音声信号の短時間パワー又は
エネルギーは、信号の大きさの変化を推量する有用な手段である。好ましい方法
はリカーシブな平均化技術を利用することである。この技術において、離散時間
信号s(n)の短時間パワー、P(n)は以下のように定義される。 P(n)=BP(n−1)+α5(n) (11)
【0125】 入力が5(n)で出力がP(n)であるリカーシブ平均化フィルターの伝達
関数、H(z)は、
【数7】 である。 なお、このフィルタのDCゲインは、H(1)=α/(1−B)であること
に注意されたい。このIIRフィルタはフォゲッティングファクター(forgettin
g factor)として考えることができる極を有している。βが1(unity)に近づくほ
ど、短時間電力変化は遅くなる。このように、より新しいサンプルの電力が電力
量に組み込まれる速度はβを通して制御される。DCゲインパラメータαは通常
、単一ゲインフィルタを得やすくするため、1−βにセットされる。
【0126】 ある状況では、2乗平均(RMS)短時間電力は、より望ましいかもしれない
。ディジタル信号処理器におけるコスト効果的実施のために、平方根操作は、そ
の平方よりむしろ以下のようにs(n)の大きさを平均することによってRMS
電力に対する概算を用いることによって避けられる。 P(n)=βP(n−1)+α|s(n)| (13)
【0127】 リカーシブな平均化の結果としての無限の長さのウインドウが望ましくなけれ
ば、サイズNの分析ウインドウの電力は、例えば、以下のように平均化すること
ができる。
【数8】
【0128】 VADアルゴリズムは多くの音声処理アプリケーションにとって本質的なもの
である。VAD方法の広い多様性が開発されてきた。背後の雑音から音声を区別
することは、音声についての基本的前提である。ほとんどのVADアルゴリズム
は、音声と無音又は背後の雑音を区別するための異なる方法において、これらの
前提のいくつか又は全部を利用している。
【0129】 最初の前提は、音声レベルは通常背後の雑音レベルより大きいということであ
る。このことはしばしば、用いられる最も重要な基準であり、多くのVADアル
ゴリズムはこの前提にのみ基づいている。この前提を用いて、音声の存在を、閾
値に対して信号電力測定を比較することにより検出することができる。
【0130】 第2の前提は、音声は変動するのに対して雑音は相対的に変動しないことであ
る。この前提を用いて、多くのスキームが信号ピッチ測定における信号スペクト
ラム又は変化の量の安定に基づいて工夫されている。
【0131】 VADアルゴリズムの開発はこの仕様の範囲外である。多くの複雑な強いアル
ゴリズムはすでに利用でき、復号された音声に直接適用できる。このように、必
要な場合、音声と背後の雑音を区別する良い知識が利用可能である。
【0132】 単一帯域雑音低減システムは、考えられる最も基本的な雑音低減システムであ
る。図26に示された方法において、2つの短時間電力測定、P(u)とP (n)が実行される。前者は全電力と呼ばれ、音声と背後の雑音の合計である。
後者は雑音電力である。両電力の大きさは、式(11)で与えられたリカーシブ
な平均化フィルタを用いて達成することができる。全電力量は連続して更新され
る。雑音電力の大きさは、VADによって決められたように音声の不在の間のみ
更新される。雑音のない音声電力、P(n)は、どの時でも次のように推定さ
れる。 P(n)=P(n)−P(n) (15)
【0133】 理論上、雑音抑制は以下で与えられるゲイン、g(n)によってもたらされる
【数9】 式(16)を使用することによって、減衰後に保持される雑音信号y(n)の比率
は、雑音のない音声信号とほぼ同じ電力を有する。その信号がたまたま雑音だけ
を含んでいる場合には、そのゲインは、ゼロに減少される。他方の極端では、何
も雑音がない場合には、そのゲインは、1になる。この例では、雑音のない音声
信号の推定s(n)が得られる。
【0134】 実際問題として、式(15)は、現実には、推定エラーにより所望信号の電力
に関する値が負になり得ることに注意されたい。そのような結果を避けるために
、常に負にならないことを確実にするのに、追加の発見的方法が使われる。
【0135】 信号帯域の雑音抑制技術に関連する重大な欠点は、音声信号による雑音変調の
問題である。音声がないときには、その雑音は、全体として抑制することができ
る。しかしながら、雑音は、音声が発せられるときはいつも聞こえる。ここで、
その効果は、その雑音が音声に従っているということと、雑音の量が音声の発生
(burst)の大きさに概ね比例しているということである。この迷惑なアーチフ
ァクトは、0.1のような小さいが0でない値へ、可能な最も低いゲインを制限
することによって、制限された程度までに(除去されていないが)弱くすること
ができる。雑音の変調は、この解決策によって迷惑でないものになる。
【0136】 考慮された全てのパラメータの中で、ピッチゲインgとコードブックゲイン
は、おそらく、直接の修正を最も受けやすいものである。これらのゲインパ
ラメータは、その他のパラメータから相対的に独立しており、通常、個別に量子
化される。さらに、それらは、通常、(コードブック励振とは違って)量子化さ
れた値の好適な範囲を有している。好適な実施形態では、雑音の低減を達成する
ために、これらの2つのパラメータを使用している。
【0137】 上で述べたように、符号化領域雑音の低減に必要な再符号化のコンピュータ処
理コストは、全符号化よりも数オーダー低い大きさである。これは、ピッチゲイ
ンとコードブックゲインのみが、再量子化されなければならない場合には、正し
い。再量子化プロセスは、しばしば、量子化されたゲイン値のテーブルをサーチ
することと、二乗距離を最小化する値を見出すことを含んでいる。ゲインパラメ
ータ(又は、修正されるべきいかなる他のパラメータ)が、差分スカラ量子化ス
キームを使用して量子化される場合には、僅かに多くの複雑な事態が起こる。こ
の場合でも、そのような再符号化のコストは、通常、まだ、数オーダーの大きさ
で低いものである。差分量子化パラメータに対する再量子化が、ここで、述べら
れる。
【0138】 単一の信号音声パラメータの量子化は、スカラ量子化といわれる。一組のパラ
メータが一緒に量子化される場合に、そのプロセスは、ベクトル量子化と呼ばれ
る。ベクトル量子化は、通常、LPC係数のような、何らかの方法で、互いに関
連付けられる一組のパラメータに適用される。スカラ量子化は、一般に、g
、そしてTのように、他のパラメータと相対的に独立しているパラメータに
適用される。両方のタイプの量子化の混合も、可能である。
【0139】 パラメータが、瞬時に量子化される場合には、その量子化プロセスは、パラメ
ータの過去と未来の値と独立している。パラメータの現在の値だけが、量子化プ
ロセスに使用される。量子化されるべきパラメータは、一組の許可された量子化
レベルと比較される。ある近さの尺度(closeness measure)に関して所定のパ
ラメータと最もよく一致する量子化レベルが、そのパラメータを代表するために
選択される。通常、許可された量子化レベルは、符号器と復号器の両方について
ルックアップテーブルに格納される。選択された量子化レベルのテーブルへのイ
ンデックスは、符合器によって復号器へ送られる。
【0140】
【外14】
【0141】 ベクトル量子化は、一組のパラメータの共同の量子化を含む。その最も簡単な
形式において、ベクトルは、テーブルからの一組の許容ベクトルと比較される。
スカラ量子化と同様に、通常、二乗平均誤差が、量子化テーブルから最も近いベ
クトルを選択するために使用される。重み付けされた二乗平均誤差は、しばしば
、知覚的にさらに重要であると知られているベクトル成分を強調するのに使用さ
れる。
【0142】 ベクトル量子化は、通常、励振信号とLPCパラメータに適用される。LPC
係数の場合に、係数のレンジは、少なくとも理論的には制限されない。これは、
表現におけるわずかな誤差による安定化問題と同様に、量子化前よりさらに適切
なパラメータ領域へのLPC係数の最初の変換をもたらす。その変換によって、
既知の有限のレンジを有し、不安定性を防止し、又は、少なくともその可能性を
低減する一組のパラメータでLPC係数が表現されることが可能となる。利用で
きる方法は、対数領域比と逆正弦関数を含んでいる。LPC係数の計算上より多
くの複雑さをもつ表現は、線スペクトル対(LSP)表現である。LSPは、L
PC係数の擬似周波数表現を提供し、LP合成フィルタの安定性を保証する簡単
な方法のような他の望ましい特性を有するとともに、他の変換技術より以上に、
符号化効率を改善することができるが分かっている。
【0143】 ゲインパラメータとピッチ周期は、この方法で時々量子化される。例えば、G
SM EFR符号器は、コードブックゲインを差分的に量子化する。差分再量子
化に関する一般技術が、ここで述べられる。
【0144】 G(n)が、再量子化されるべきパラメータであり、量子化スキームで使用され
る線形予測器が、図28に示されるP(z)で表示されるものと仮定する。量子化
された差分R(n)は、符号器から復号器へ正しく送信される実際の符号化領域パ
ラメータである。このパラメータは、好ましくは、ネットワーク音声強化装置に
よってインタセプトされ、そして、できる限り、新しい値P(z)に修正される。
この方法の動作が、図28を参照して説明される。
【0145】 音声強化アルゴリズムが、量ΔG(n)によって修正されるG(n)を要求したと
仮定する。ネットワーク装置の差分再量子化スキームは、基本的に、符号器の動
作を模写しようとする。この技術の背景にある基本的考えが、異なるシステム間
の相互接続と同様に、フィギュアにおける全ての量子化器を最初に無視すること
によって理解される。そこで、符号器は、ネットワークにおけるシステムが、と
もに同一の線形システムであると見られる。符号器が、その入力としてG(n)を
有する一方、ネットワーク装置がその入力としてΔG(n)を有する。それらは、
好ましくは、同一の線形システムであるので、その2つのシステムは、概念的に
結合され、その入力として(G(n)+ΔG(n))を有する単一のシステムを効果的
に生じる。そのように、一つのシステムは、好ましくは、出力Rnew(n)を含み
、それは、好ましくは、 Rnew(n)=R(n)+ΔR(n) (17) によって与えられる。しかしながら、これらのシステムを非線形にする量子化に
よると、この関係は、近似となるだけである。ここで、実際に復号化されたパラ
メータは、好ましくは、 Gnew(n)=G(n)+ΔG(n)+量子化誤差 (18) によって与えられ、ΔG(n)+量子化誤差は、ネットワーク音声強化装置によっ
て達成されたパラメータにおいて、実際に実現される変更である。
【0146】 ネットワーク再量子化装置において、量ΔR(n)のフィードバックは、G(n)
が長時間変化しない場合には、望ましくない発振作用を起こすことになる。これ
は、特に、G(n)がゲインパラメータである場合、音声信号に望ましくない結果
をもたらし得る。CSM EFRコーデックの場合に、G(n)は、コードブック
ゲインの対数に相当する。無音期間では、G(n)は長期間同一の量子化レベルに
留まる。そのような無音の間、適当な量ΔG(n)によってG(n)を修正すること
により、ネットワーク装置で信号の減衰が試みられると、雑音の準周期変調が、
弱いものではあるが妨害となるバズを引き起こすことになるであろう。
【0147】 例として、GSM EFRコーデックが使用される場合の発振作用が説明され
る。この線形予測器P(z)は、好ましくは、4つの遅延素子を有し、その各々は
、32の可能値のうちの一つを引き受ける。ここで、ALC装置における非線形
システムは、いかなる所定の時間においても百万以上の可能な状態のいずれか一
つにあることができる。これは、この非線形システムの動作がその初期条件によ
って重大に影響されるという理由から言及されている。
【0148】 実際の実現されたゲインGnew(n)における反響音が、ここで、所望のゲイン
における一つのステップΔG(n)に対応して示される。簡単のために、送信され
た原パラメータR(n)が、100サブフレーム以上で一定であり、P(z)のメモ
リは、初期にはゼロであるとする。図29(a)は、所望のゲインにおけるステッ
プを示している。図29(b)は、所望のゲインに重ねられた実際の実現されたゲ
インを示している。初期条件とG(n)の値は、正確な動作を決定するが、ここに
示された実際の実現されたゲインでの反響音は、代表的なものである。
【0149】 反響音は、図30に示されるように、フィードバックループ外で量子化器を「
動かす」ことによって、除去されることができる(図30において、コンピュー
タ計算は、不必要であるが、図28との比較のために含まれる。)。量子化器を
フィードバックループ外に配置することで、図29(c)に示されるように、所望
のゲインに重ねられ、実際の実現されたゲインになる。反響音が除去されるが、
平均誤差(即ち、所望のものと実際のもののゲインとの平均的差分)は、図29
(b)に示されるそれよりも高くなる。特に、この例に関して、フィードバックル
ープに量子化器を入れる場合と入れない場合における再量子化器の定常状態で動
作している間の平均誤差は、それぞれ、0.39dBと1.03dBである。
【0150】 従って、差分量子化パラメータの正確な制御と発振作用の間には、トレードオ
フが存在する。しかしながら、ボイスアクティビティ検出器の使用を通して、正
確なスキームと、反響音はないが正確でないスキームとをスイッチすることがで
きる。無音期間には、反響音のないスキームが使用される一方、その間、フィー
ドバックループにある量子化器によるより正確なスキームが音声期間に使用され
る。それらのスキームをスイッチングするとき、予測器の状態は、同様に、適切
に更新される。
【0151】 図31に示されるように、反響音のない技術が簡単化され、コンピュータ計算
においていくらか節約されることになる点も示される。これは、線形システム1
/〔1+P(z)〕の代わりに、定数1/〔1+P(1)〕と置き換えることによっ
てなされる。この実施例は、パラメータが比較的まれしか変更されない場合には
、特に十分であることがよく見出される。まれな変更ということは、それらの変
更間でのサブフレームの平均数が、P(z)のオーダーよりもっと大きいことを意
味している。
【0152】 さらにより精巧な量子化スキームが使用される場合でも、これらのパラメータ
を符号化するコストは、まだ、相対的に小さいものである。パラメータが差分量
子化されるときでも、パラメータ修正が実際的にどのように果たされるのかを理
解することによって、符号化領域雑音の低減と残響の抑制とに関連した問題が扱
われる。
【0153】 複雑ではなく、遅延が小さい符号化領域雑音の低減方法が、ここで、述べられ
る。雑音低減を達成するために使用される種々の符号化領域パラメータが、上で
述べられた。これらのパラメータについて、2つのゲインパラメータ、ピッチゲ
インgとコードブックゲインgが、直接の修正を受け入れ易い。従って、好
適な実施形態は、これらのパラメータを含む。
【0154】 単なる例として、従来使用されている5msの期間であるサブフレーム周期が
、仮定される。電話アプリケーションに使用されている8000Hzの代表的な
サンプリングレートでは、サブフレームは、40サンプルからなる。サンプルイ
ンデックスは、nを使用して表示され、そのサブフレームのインデックスは、_
_を使用して表示される。符号化パラメータは、サブフレーム当たり高々一度更
新され、そのサブフレームにある全てのサンプルに適用するので、これらの符号
化パラメータが、mを使用して単純にインデックスされても、混同がない。更新
され、又はフレーム全体に適用する他の変数も、この仕方でインデックスされる
。フレーム内の個々のサンプルは、通常、nを使用してインデックスされる。し
かしながら、一つより多いサブフレームが一つの式によって圧伸されている(sp
anned)ならば、そのとき、音声サンプルs(n,m)として、一つのサンプルを
インデックスすることも意味のあることである。
【0155】 ハイブリッドで、パラメトリックな時間領域符号化技術に使用される音声合成
モデルが、サブフレームmでの次の式によって与えられる全伝達関数H(z)に
よる時変システムとして考えられる。
【数10】 ここでは、固定コードブック(FCB)によって提供される励振源を用いている
。実際の具体例に近い他の観点が、図32に示される。FCB出力は、C’(n)
として示される。図32において、長周期予測器(LTP)又はピッチ合成フィ
ルタのバッファが示される。LTPが伝達関数
【数11】 を有することを思い起こす。ここで、gとTの両方が、通常、サブフレーム毎
に更新される。この伝達関数に従って、LP励振が、サブフレーム毎に、
【数12】 として計算され、ここで、b’(n)は、LTPバッファから得られる。LP励振
サンプルu(n)の直前に計算されたサブフレームは、好ましくは、LTPバッフ
ァの左端部にシフトされる。これらのサンプルも、符号化された音声を復元する
ために、LP合成フィルタを励振するのに使用される。
【0156】 音声合成モデルのこの観点を使用すると、LP合成フィルタ励振u(n)の2つ
のソースは、はっきりと見分けられる。b(n)及びc(n)として表示されるこれ
らの2つの励振ソースは、それぞれ、ピッチ励振、コードブック励振と呼ばれる
。この2つのソースの観点により、LTPも、しばしば、適応コードブックと呼
ばれ、その常に変化するバッファ内容によって、FCBと対照をなしている。明
らかに、LTPの出力は、FCBの出力から独立していない。ここで、スペクト
ル減算概念は、好ましくは、その2つのソースに直接適用されない。しかしなが
ら、符号化器が符号化領域パラメータを最適化する仕方により、2つのソースは
、異なる特性を有する。この特性における差異が、雑音低減技術を導き出すのに
利用される。
【0157】 雑音を低減するために、符号化器から受信されるゲインファクタgとg
修正される。この修正は、これらのゲインファクタに雑音低減ファクタγとγ を乗算することによって達成され、それぞれ、調整ゲイン値が生成される。こ
れは、復号器で、次式によって与えられる修正時変フィルタとなる。
【数13】
【0158】 好適なネットワーク雑音低減装置が、図33に示される。この実施形態では、
2つの復号器がある。一つの復号器20は、基準復号器と呼ばれ、図14に示さ
れた音声符号器のように、符合器から受信した符号化音声の復号を行う。復号器
20によって達成される復号は、特定のコーデックによって完全であるか部分的
である。本実施形態に関しては、完全復号化を行い、雑音のある音声出力y(n)
を生成するものとする。しかしながら、上で述べたように、本実施形態は、部分
復号化でも動作する。本質的に、例えば、雑音特性の電力に実質上影響を及ぼす
復号化が避けられ、それによって、時間を節約することができる。
【0159】 図33の下半分は、送信先復号器120を示す。この復号器を使用して、符号
化されたパラメータが最適化される。この送信先復号器は、受信する送受話器の
ように、送信先にある実際の復号器を模倣している。それは、導電体148上に
、推定された雑音の無い音声出力を生成する。明瞭化するために分離して描かれ
ているが、基準復号器と送信先復号器のモデルにおけるいくつかの部分が、共有
される。例えば、固定コードブック(FCB)信号は、両方の復号器について同
一となっている。
【0160】 通信の当業者には、復号器20と120が図14の次のブロックを提示してい
ることが分かる。 部分又は完全復号化ブロック、 音声レベル測定ブロック、 ゲイン決定ブロック、 入力SLRPとゲインを有する乗算関数、 SLRP再量子化、そして、 修正SLRP。
【0161】 さらに、図14で参照されるボイスアクティビティ関数が、図33の実施形態
に組み込まれている。結果として、図33に示された音声復号器12は、図14
に示された音声復号器と同じタイプである。
【0162】 特に、図33の復号器は、図7で述べられたパラメータのように、種々の圧縮
コードパラメータを使用する通信システム8において役に立ち、コードブックゲ
イン、ピッチゲイン、そして、コードブックRPEパルスを含んでいる。そのよ
うなパラメータは、種々のオーディオ特性を有するオーディオ信号を表現し、雑
音特性と信号対雑音比(SNR)の信号を含んでいる。図33の装置は、雑音特
性を管理するための有効な技術を提供する。復号器20と120は、全体的に1
50で示されるプロセッサによって実行され、VAD関数を有する雑音低減制御
器160を含んでいる。プロセッサ150は、論理的な、そして数学的な操作が
できる他の論理ユニットと同様に、マイクロプロセッサ、マイクロコントローラ
、又は、ディジタル信号処理装置からなる。復号器20と120は、ソフトウエ
ア、ハードウエア、又はソフトウエアとハードウエアの組み合わせによって実行
される。
【0163】 プロセッサ150は、符号器によってネットワーク11上に送られたディジタ
ル信号の圧縮コードに応答する。復号器20と120のそれぞれは、コードブッ
クゲインとピッチゲインのように、図7で記述されたタイプの所定の圧縮コード
パラメータを読み込む。プロセッサ150は、雑音特性の電力を測定する必要が
ある場合には、部分符号化を実行するために、その圧縮コードに応答する。その
復号化は、雑音電力を測定する仕事を簡単にする線形領域で復号化された信号を
生じる。
【0164】 基準復号器20は、端部13で圧縮符号化ディジタル信号を受信する。復号器
20は、乗算関数24におけるコードブックゲインgによって乗算又はスケー
リングされるコードブックベクトルC’(n)を発生する固定コードブック(FC
B)関数22を含んでいる。コードブックゲインは、端部13で受信した圧縮さ
れたコード信号からプロセッサ150によって読み込まれる。乗算関数は、ピッ
チ合成フィルタ26に供給されるスケーリングされたコードブックベクトルc(
n)を発生する。プロセッサ150は、式31で示されたスケーリングされたコ
ードブックベクトルの電力Pを計算する。その電力は、ピッチゲインを調整す
るのに使用される。プロセッサ150は、雑音特性へのスケーリングされたコー
ドブックベクトルの貢献を弱めるために、コードブックゲインを減少する。
【0165】 フィルタ26は、サンプルベクトルを発生するために、スケーリングされたコ
ードブックベクトルc(n)に応答する長周期予測器(LTP)バッファ28を含
む。そのサンプルは、加算関数32によって処理されるスケーリングされたサン
プルbref(n)を発生するために、乗算関数30でピッチゲインgによってス
ケーリングされる。プロセッサ150は、式30−33に示されるように、雑音
特性を管理するために、スケーリングされたサンプルの貢献を増加するようにピ
ッチゲインを増加する。プロセッサ150は、スケーリングされたサンプルPbr ef の電力を決める。同様な電力Pが、復号器120によって発生される。その
2つの電力が、式30と33によって示されるように、ピッチゲインを調整する
のに使用される。
【0166】 フィルタ26は、その出力に、全コードブック励振ベクトル又はLPC励振ベ
クトルu(n)を発生する。プロセッサは、ベクトルu(n)の電力Pを計算し、
そして、式32に示されるように、ピッチゲインを調整するのに使用する。
【0167】 ベクトルu(n)は、図6に示されたものの様なLPC合成フィルタを励振する
。フィルタ36の出力は、制御器160に戻される。
【0168】 復号器120は、復号器20と関連して記述された関数と同じである多くの関
数を含んでいる。この様な関数は、100によってインデックスされる番号をも
つ。例えば、コードブック22は、コードブック122と同じである。符号器1
20は、復号器20には含まれていない乗算関数140と142を含む。乗算関
数140は、式33に規定される入力として、γを受信する。式30に示され
るように、γの値は、一部は前述した電力の比に依存している。乗算関数14
2は、式28に規定される入力として、γを受信する。乗算関数140と14
2の結果として、復号器120は、ピッチ合成フィルタ26と異なるピッチ合成
フィルタ144を使用する。
【0169】 一般的な式と、特定の式21−33によって説明されるように、プロセッサは
、端子13で受信した信号の雑音特性を管理するために、コードブックゲイン及
び/又はピッチゲインを調整する。調整されたゲイン値は、前述した仕方で量子
化され、量子化されたパラメータは、端子16を通して、出力ネットワーク15
に送信される。
【0170】 前述の基礎的な単一信号帯域の雑音低減器は、符号化領域で実行される。g (m)は、式19で与えられた時変フィルタのDCゲインであるので、このDCゲ
インは、次式のように、γ(m)を設定することによって修正される。
【数14】 ここで、P(m)とP(m)は、それぞれ、サブフレームmでの雑音電力と全電
力の推定である。Eもまた、単一帯域の雑音低減器によって供給される最大損失
である。通常、それは、0.1のような小さい値に設定される。その様なDCゲ
イン制御システムは、雑音電力が音声信号に同調して変動するという理由で、厳
しい雑音変調に悩まされる。これは、知覚的に苦しませるものであり、これを補
償する一つの方法は、雑音変調量と雑音抑制量とを交換することになる。
【0171】 式(20)における方法より優れている符号化領域の雑音低減方法を得ること
ができる。2つのパラメータγとγが、時変フィルタH(z)において制御
される。復号器の再帰的性質によって、雑音低減を実現する両ゲインファクタの
結合最適化は、むしろ複雑である。これは、__の現在値の修正が未来値g
密接に関係しているからである。ここで、そのような最適化では、好ましくは、
lが時変ピッチ周期T(m)に依存するものとし、γ(m)とγ(m+l)が決め
られる。準(sub-optimal)最適化でも、未来における少なくともいくつかのサ
ブフレームについて符号化パラメータの知識が要求される。これは、フレームの
境界を交叉することを要求し、厳しい実際の影響を有している。第1に、より多
くのバッファリングが要求される。さらに重要なのは、セルラーやパケットネッ
トワークでは特に容認できない追加的遅延を受けることである。このようにして
、その問題は、好ましくは、未来フレームの知識を要求しない仕方でアプローチ
される。
【0172】 技術の背後にある基礎的考え方が、最初に述べられる。ボイスアクティビティ
復号器によって示されるような無音期間では、γを制御することによるH(
z)のDCゲインの制限によって、信号の最大減衰を行うのが安全である。音声
の開始端と下降端において、γには、適切に上昇と下降が考慮される。しかし
ながら、発声された音声の区間では、LTP励振出力が、生じる信号電力の大き
な量に寄与し、FCB励振出力に関連するよりよいSNRを有する。従って、発
声された音声の区間では、FCB出力の減衰の限られた量を実行する。雑音低減
した復号化音声信号における電力の最終的な損失を補償するために、γが注意
深く増強される。γとγは、2つ段階で最適化される。
【0173】 最初に、γの最適化が考慮される。効果的に雑音を低減するために、γ
、好ましくは、0<E</のように、ゼロ又はある最大損失近くまで作動される
。高損失を使用することによるトレードオフは、復号化された音声信号も、減衰
されることである。γ=1であることを要求する復号化音声レベルを維持する
ことと、γ=Eでることを要求する効果的な雑音低減を得ることとの間におけ
るこの綱引きを反映することが、次のようなコスト関数Fを用いて述べられる。
【数15】 ここで、λとλは、決められるべき適当な重みである。このコスト関数を最
小化することによって、DCゲイン低減の最適量が達成される。ここで、一貫し
て良い結果を与えることが分かっている適当な一組の重みが考慮される。それで
もやはり、同様にうまく行える他の適当な重みが、定式化される。
【0174】 無音の区間では、雑音抑制の最大量を実現したい。従って、λは、好ましく
は、無音の区間では大きく、音声のある区間では小さくする。その様な重み付け
を実現する適当な連続的尺度は、基準復号器を使用するSNR尺度であり、SN
refとして示される。最初の重みは、次のように設定される。
【数16】
【0175】 ボイスアクティビティ復号器は、基準復号器の出力信号y(n)における音声区
間から無音区間を区分けするのに使用される。バックグランドの雑音電力P
、復号化された音声信号y(n)における無音の区間で推定される。15999/
16000における極と一様なDCゲインによる式(11)の再帰的平均化は、
そのような無音の区間でのバックグランドの雑音電力を更新する適当な手段であ
ることが分かる。雑音が比較的に定常であると考えられるので、この大きな時定
数が適当である。信号y(n)の電力Pは、同様の再帰的平均化又は他の手段を
使用して測定される。再帰的平均化が、利用される場合には、127/128で
の極と一様なDCゲインを用いた平均化が適当であることが分かった。そのとき
、SNRrefは、次式として推定される。
【数17】
【0176】 ここで、最大関数は、生じ得るSNRrefに対する無意味な負の値を許可しな
い。雑音電力推定アルゴリズムは、絶えずPwは0より大であることが保証され
ているものと仮定する。
【0177】 λ1のみが使用され、λ2が1ユニット(unit)に設定されるなら、γcはSN
refとともに上昇し下降する。しかしながら、典型的にはより高いSNRをま
た有する音声が発せられる間、γcは好ましくはある程度にまで減衰される。こ
れは、音声が発せられる間、FCBが大部分の雑音信号をモデル化するので、音
声が発せられる間、雑音の全体の量を減少させる。ゆえに、単一バンド雑音減少
システムにおいて生じる典型的な雑音変調が減少する。発生された音声の存在を
反映する適切なパラメータは必要である。図33に示される、PbとPcが基準デ
コーダ信号bref(n)とcref(n)の短時間電力である比率、Pb,ref/Pc,r ef は、発生された音声の存在を反映する。代わりに、音声における相関量をまた
反映するピッチゲインgp(m)が、使用できる。ここでピッチゲインがピッチ
合成フィルタを決定するエンコーダでの最適化処理の結果であることを思い起こ
す。本質において、この処理は、実施されるシーケンスに最もよく相関するLT
Pバッファからの過去のシーケンスを見つける。それゆえ、相関が高ければ、次
にピッチゲインもまた対応して高い。このように、残りの重みはピッチゲインに
反比例するよう特定される。
【数18】 λ2をこのように特定化することにより、発生された音声の強調を止めている
間、γcを1に接近させて維持する。
【0178】 パラメータλは、好ましくは経験的に決定される。音声強化アルゴリズムにお
ける知覚テストに基づきチューニングされることが要求されるパラメータを有す
ることは極めて普通である。
【0179】 このように、最小化されるべき結果としてのコスト関数は、下式で表される。
【数19】 γcに関してFの微分をとり、それを0に設定すると、γcの最適値は、下式で
決定される。
【数20】 ここで、λは経験的に最適化される。さて、γcはなお一般的にSNRrefに同
期して上昇し下降する。しかしながら、γcは、たとえSNRrefが大きくても、
さらにgpもまた大きければ、より小さくなる。
【0180】
【外15】
【0181】 ピッチ合成フィルタは、基本的にくし形フィルタである。ピッチ期間がT=4
0のときに得られるくし形フィルタの振幅周波数応答の1kHzレンジが、図3
4に示される。1つは0.1のピッチゲインに対応し、他の1つは0.9に対応
する2つの曲線が示されている。ピッチゲインおよびピッチ周期のみがピッチ合
成フィルタを特定化するために使用されるので、スペクトルの山や谷の両方でゲ
イン量を同時に制御するのに利用できるDCゲインファクタはないことを注意す
る。他の注意すべき点は、1より大なるピッチゲインを許す符合器があることで
ある。理論的には、この結果、不安定なくし形フィルタとなる。しかしながら、
最適化処理が合成信号を原音声信号に一致させようとする方式により、実際には
不安定にはならない。他の視点として、実際には不安定とはならないように設計
されたFCB出力を考慮するというものがある。
【0182】 γpに原ピッチゲインgpを掛け算することにより、電力における不安定または
少なくとも好ましくない大きな変動を引き起こす。γpを適用することによるく
し形フィルタのスペクトルの山における振幅周波数応答の増加Ipeakは、下式に
より与えられる。
【数21】
【0183】 Ipeakの典型的な値は、雑音の多い音声信号において音声が発生されている間
共通であるgpの2つの値に対し図35に示されている。この図から、スペクト
ルの山で大ゲインが誘起できることが判る。スペクトルの谷が減衰されているこ
とも注意すべきことである。
【0184】 雑音減衰のレベルが、スペクトルの谷の減衰により達成されるものもある。し
かしながら、同時に、LTPのスペクトルの山にある雑音は、増幅される。全体
として、このことは、結果的に、ハーモニック特性を有するように形成された雑
音を引き起こす。このようなハーモニック形成雑音は、かなりの量が存在するな
らば、特性上、話者の声を鼻声にし得る。したがって、γpを増加(ブースト)
するとき、多大な注意を払うべきである。電力損失を補償する増幅度は、gp
1のときにのみ達成されるべきであり、増幅されたピッチゲインはγpp<1を
満たすべきである。
【0185】 好ましくは、LTP励振出力における電力損失を補償することができる。この
電力損失の補償を正確に達成するため、γpに対する第1の取り得る値は、下式
で計算される。
【数22】
【0186】 これは、ときには全LP励振において不安定を引き起こす。電力損失を補償し
、安定を確保するため、γp,1は、γp,2=√(Pu,ref/Pu)で計算されるγp,2
比較される。しかしながら、これは、Puがγpに依存するので、試行錯誤処理を
含む。代替えとして、PuをPu=γc 2c+γp2bとして近似する。次に、安定
条件が下式で特定化でき、
【数23】 γpの第2の取り得る値は、下式で与えられる。
【数24】 それから、γpは、式(30)と(32)における2つの量の最小として決定
されるべきである。結果としてのフィルタが安定であること保証する他のチェッ
クが実行できる。この場合、γpは、好ましくは次式として選択される。
【数25】
【0187】 しかしながら、不安定の危険性が小さいので、この最後のチェックは、避けて
もよい。さらに、式(32)における基準は、結果としてのLTP出力が安定と
なることを保証する。
【0188】 符号化された領域雑音減少(CDNR)に関する2つの他の実施例を図36に
関連させて以下に説明する。2つの実施例のうちの1つにおいて、コードブック
ゲインパラメータ(gc)のみが修正される。第2の実施例において、コードブ
ックゲインおよびピッチゲイン(g)はともに修正される。第1実施例は雑音
の低レベルに対して適しており、一方第2実施例は高雑音条件に対して適してい
る。
【0189】 [コードブックゲイン減衰器によるCDNR] 図36は、CNDRの新規な実施例を示す。音声の各フレームに対応する符号
化された音声パラメータを与えると、符号化されていない音声は、適切な複合器
を用いて再構成される。フレームが音声または無音に対応するか否かを決定する
ため、無音(silence)検出器(音声アクティビティ検出器とも称する)が使用
される。フレームが無音のとき、バックグラウンドの雑音電力が推定される。全
ての時間に対して、信号の全電力が推定される。信号対雑音比を計算する場合の
ように、全電力および雑音電力を用いて、信号における雑音の相対量を推定でき
る。これらの電力推定に基づき、逆量子化コードブックゲインパラメータは、減
衰され、次いで再び量子化される。この新しい量子化コードブックゲインパラメ
ータは、ビットストリームでオリジナルのものを置き換える。
【0190】 コードブックゲインパラメータの注意深い減衰は、雑音の多い符号化音声の場
合、雑音の減衰をもたらす。多くの減衰方法論が公式化され得る。方法を説明す
る前に、使用される表記についてまず説明する。
【0191】 雑音の多い非符号化音声、y(n)が下式で与えられるものと仮定する。 y(n)=s(n)+ w(n) (34) ここで、s(n)はクリーンな非符号化音声であり、w(n)は付加雑音であ
る。電力推定、Py(n)およびPw(n)は、それぞれ雑音の多い非符号化音声
電力およびその雑音電力である。図36において、Py(n)は、「全電力推定
」とラベル付けされたブロックで測定され、Pw(n)は、「雑音電力推定」と
ラベル付けされたブロックで測定される。電力推定は、種々な方法で達成できる
。一例をあげれば、下式により与えられる再帰的アプローチがある。 Py(n)=βPy(n)+(1−β)||y(n)|| ここで、β=0.992 そして、雑音に対する同様な式が下式により与えられる。 Pw(n)=βPw(n)+(1−β)||w(n)|| ここで、β=0.99975
【0192】 コードブックファクタ、gcは、減衰コードブックゲインファクタを得るため
減衰ファクタγcにより掛け算される。γcを決定する2つの選択的な代替方法は
下式のようである。
【数26】
【0193】 たいていのボコーダにおいて、コードブックゲインパラメータは、すべてのサ
ブフレームで規定される。そのような場合、式は、対応するサブフレームの最後
のサンプル中に計算された電力推定を用いて評価される。上記アプローチの両方
において、減衰ファクタは、非符号化音声の信号対雑音比に依存する。式(35
)において、μの適切な値は、約1〜1.5である。式(36)において、μの
適切な値は、0.8である。
【0194】 [ゲインファクタの最適化によるCDNR] [部分復号化] 信号の複号化は、符号化および複合化操作に使用されるボコーダに依存して全
体または部分に対する。部分復号が満たす状況の例を以下にリストする。
【0195】 コード励起線形予測(CELP)ボコーダにおいて、フィルタ後処理は、LP
Cベースモデルを用いて複号化された信号に対し実行される。このフィルタ後処
理は、量子化雑音を減少させる。しかしながら、この処理は電力推定に重大な影
響を及ぼさないのでフィルタ後段階は経済的な観点から避けることができる。
【0196】 GSMネットワークにおけるTFO下で、CDNRデバイスは、基地局とスイ
ッチ(Aインタフェースとして知られる)との間または2つのスイッチ間に置か
れる。音声信号の各8ビットサンプルの6MSBが図3に示されるようなPCM
コードに対応するので、この状況下で符号化された音声を全部いっしょに復号化
することを避けることができる。簡単なルックアップテーブルは、A則圧伸テー
ブルを用いて8ビット圧伸サンプルを13ビット線形音声サンプルに変換するの
に十分である。これは、適切な復号器の助けを借りず音声信号の変形を得るため
の経済的な方法を与えてくれる。このように得られた音声信号は、幾分か雑音を
有するが、電力推定の測定には十分であることが判ってきたことは注意すべき点
である。
【0197】 [符号化パラメータ修正] [最小遅延技術] 大バッファリング、処理および転送の遅延は、ネットワーク音声品質強化処理
を持たないセルラネットワーク内にすでに存在する。音声強化目的のための符号
化音声の他のネットワーク処理は、さらなる遅延を加える。この遅延を最小にす
ることは、音声品質にとって重要である。このセクションにおいて、この遅延を
最小にする新規なアプローチが論じられる。例に用いたのはGSMFRボコーダ
である。
【0198】 図7は、GSMFR復号器から符号化されたパラメータが受信される順を示す
。まっすぐなアプローチは、各フレームに対し全260ビットまでのバッファリ
ングと、それから、符号化された領域エコー制御の目的のためのこれらのバッフ
ァされたビットの処理と、を含む。しかしながら、これは、処理遅延に加えて、
約20msのバッファリング遅延を引き起こす。
【0199】 バッファリング遅延を以下のように最小化することができる。まず、ビット9
2が受信されるや否や第1サブフレームが全て復号化できることを注意する。そ
れゆえ、第1サブフレームは、バッファリングの遅延の約7.1ms(20ms
×92/260)後に処理できる。したがって、バッファリング遅延は、約13
msだけ減少される。
【0200】 この新規な低遅延アプローチを用いるとき、符号化されたLPC合成フィルタ
パラメータはフレームの第1サブフレームの最後で利用可能な情報に基づき修正
される。換言すれば、全フレームは、第1サブフレームに基づき計算されたエコ
ーの可能性により影響される。試行された実験において、この「早い」決定によ
る顕著なアーチファクトは見つからなかった。
【0201】 [エラー修正/検出ビットおよびフレーミングビットの更新] この明細書に記載した雑音を除去または低減する新規な符号化領域処理技術を
適用するとき、符号化されたパラメータに対応するビットの全てがビットストリ
ームで修正されるものがある。これは、ビットストリームに埋め込まれ得る他の
誤り訂正または検出のビットに影響を及ぼす。例えば、音声符号器は、エラーの
ないフレームが受信されることの保証を確認するため復号器に対するビットスト
リーム内にチェックサムを埋込むことができる。このようなチェックサムは、何
等かのパリティチェックビット、誤り訂正または検出ビットおよびフレームビッ
ト同様、必要ならば、適切な標準にしたがって更新される。
【0202】 図38は、コードブックベクトルパラメータの修正による符号化領域雑音の低
減技術を示す。好ましいモードにおいて、雑音低減は、2つの段階で遂行される
。第1の段階は、先に説明したコードブックゲインの修正を含む。
【0203】 第2段階において、コードブックベクトルは、雑音を最小にするため最適化さ
れる。本質において、各サブフレームに対し、原受信コードブックベクトルから
変化される数個のコードブックベクトルパターンが試行される。各コードブック
ベクトルパターンに対し部分復号化が遂行され、雑音電力が推定される。最善の
コードブックベクトルパターンは、雑音電力を最小化するものとして決定される
。実際上、一定回反復または試行が遂行される。
【0204】 例えば、GSMFRボコーダ(参照[1])において、各サブフレームに対す
るコードブックベクトルパターンは、40の位置をもち、そのうち13の位置は
零でないパルスを含む。好ましいモードにおいて、13の零でないパルスの位置
は修正されない。これらの増幅度のみが各トライアルにおいて変化する。零でな
いパルスは、xM(i),i=0,1,2,…,12で表記される。各パルスが
次の増幅度:±28672,±20480,±12288,±4096の1つの
みをもつことを注意する。コードベクトル最適化を以下のステップにより説明す
る。
【0205】 原コードブックベクトル、修正されたコードブックゲインパラメータおよび原
パラメータの残りを用いて信号の部分復号化を行う。 復号化された信号における雑音電力を推定し、この値を保存する。 i=0,j=1を設定する。
【0206】 原コードブックベクトルにおいて、修正されたコードブックベクトルを得るよ
うに、より小さいが同一サインの増幅度のjレベルとなるように、第i番目のパ
ルスxM(i)を修正する。所与のサインに対しすでに最低レベルであるなら、
そのサインを交換する。
【0207】 修正されたコードブックベクトル、修正されたコードブックゲインパラメータ
および原パラメータの残りを用いて、その信号の部分符号化を行う。 復号化された信号における雑音電力を推定し、その値を保存する。 i=1,2,…,12に対しステップ2〜4を繰返す。 i=0,j=2を設定し、jのこの新しい値に対しステップ2〜5を繰返す。
【0208】 この時点で、部分復号化は、27回実行されたことになる。雑音量の最小化を
もたらしたコードブックベクトルを選ぶ。
【0209】 コードブックベクトルの最適化のための上記サーチ技術を修正し、あるいはコ
ードブック励起線形予測(CELP)ボコーダで使用されるような他のコードブ
ックベクトルサーチ技術を実施することは簡単なことである。
【0210】 [LPCパラメータの表現の修正によるCDNR] LPCパラメータの表現のため一般的に使用される技術を一例として考慮する
。ラインスペクトル対(LSPs)または周波数(LSFs)と称するこの表現は
、量子化、安定性および解釈(interpretation)の点で良好な特性をもつので多
くのボコーダ、例えばGSMEFRにおいて広く使用されるようになった。LS
Fsは、LPCパラメータの擬似周波数表現である。これにより、量子化技術を
知覚的に重要であるものとして知られたスペクトル特性に関する情報と一体化で
きる。LSFsの他の利点は、LPC合成フィルタの円滑なフレーム対フレーム
補間を促進することにある。
【0211】 他の例として、LPCパラメータはまた、GSMFRボコーダにおける対数領
域比により表現される。
【0212】 LSFsを、音声強化の目的のため直接修正できる。符号化された領域雑音低
減システムにおいて使用するため所望の周波数応答を達成すべく、直接LSFs
を適合させる技術を以下に説明する。この一般的な技術は、例えばGSMEFR
符号器から受信したLSFsを修正するために適用できる。
【0213】 符号化された領域雑音低減技術において、適用技術は、スペクトルサブトラク
ション原理により所望のスペクトルを達成するため、LSFsのタームで表現さ
れる、LPC合成フィルタのスペクトル形状(次式)を変更するために使用でき
る。
【数27】
【0214】 LPC合成フィルタ伝達関数の分母の多項式、
【数28】 は係数pを有し、次に非対称および対称多項式が次式により導かれる。
【数29】 A(z)が、A(z)=1/2[P(z)+Q(z)]で戻されることを注意
する。
【0215】 これらの補助多項式の根は、LSPsであり、これらの角周波数はLSFsと称
する。基本的に、各多項式は、格子構造から導かれる(p+1)番目の予測器の
伝達関数として考えることができる。これらの予測器の各々の第1のp段階は、
A(z)と同一応答を有する。P(z)およびQ(z)は、それぞれが反射係数
−1および+1を有するもう一つの段階を有する。
【0216】 これらの補助多項式は、興味深い特性を有する。A(z)に最小位相を与える
と、P(z)およびQ(z)の2つの重要な特性が証明される。第1に、これら
の両方の多項式の零点は単位円上にある。第2に、P(z)およびQ(z)の零
点が交互に組合(interlace)される。さらに、量子化処理を介して零点が交互
に組合されたまま残されると、最小位相であることが保証されたA(z)が得ら
れる。
【0217】 これらの有用な特性に加えて、LSFsは量子化技術の設計にしばしば役立つ
擬似周波数変換(interpretation)を有する。図39はランダムに発生されたL
SFsの組および10の係数を有する対応する線形予測器の周波数応答を示す。
実線の縦線は、P(z)の根の角度を示し、一方破線はQ(z)の根の角度を示
す。これらの角度が、全てが単位円上にあるこれらの多項式のルートを完全に特
定することを注意する。
【0218】 LSFsのゆるやかなスペクトル変換(interpretation)は、鋭い谷がLSFs
により除外される傾向にあることを観察することから生じる。したがって、音声
において知覚的に需要である、LPC合成フィルタ1/A(z)の各フォーマン
ト領域の鋭い山は、接近した間隔をもった一対のLSFsに対応する傾向がある
【0219】 さて、所望のスペクトル応答を達成するため、LSFsの直接適合のための新
規な技術を導く。pの偶数オーダのみに議論を留めておく。これは、音声符号器
が通常偶数オーダのA(z)関数を用いるので、主な制限ではない。A(z)に
おける係数に奇数を使用することは、通常DC成分が音声処理および符号化の前
に取り除かれるので、無駄となる。
【0220】 第1に、多項式、P(z)およびQ(z)が下式のように因数分解される。
【数30】 ここで、ci=−2cosθc,iかつdi=−2cosθd,iである。 {θc,i,θd,i}は、ラジアンにおいて特定化されたLSFsである。{ci,di}
は、コサイン領域におけるLSFsと呼ばれる。A(z)が最小位相のとき、L
SFsが適切にソートされ、ラベル付けされていれば、 0≦θc,1<θd,1<θc,2<θd,2<…<θc,p/2<θd,p/2≦π が真であることを注意する。
【0221】 A(z)の周波数応答を平方した電力または振幅は、下式で表される。 |A(ω)|2=0.25|P(ω)|2+0.25|Q(ω)|2 ここで、|P(ω)|2と|Q(ω)|2は、下式で与えられる。
【数31】
【0222】 次に、コサイン領域、{ci,di}におけるLSFsに適合させるため、最も急
勾配の下降方法を用いて一組の周波数{ωk}で特定される電力周波数応答を達成
する。特定電力周波数応答が、N個の異なる周波数で{Ak 2}で与えられるもの
と仮定する。次に、{Ak 2}と、{ci,di}の関数としての周波数{ωk}でのA
(z)における実際の電力周波数応答{|A(ωk)|2}との間で二乗誤差につ
いて記す。この誤差関数は、下式で表される。
【数32】
【0223】 最も急勾配の下降方法によれば、下式の第n番目の反復における値により、(
n+1)番目の反復におけるコサイン領域でのLSFsを更新できる。
【数33】 ここで、μは適切なステップサイズパラメータである。 好ましいモードにおいて、μの値は、0.00002に設定される。
【0224】 符号化パラメータを直接修正する方法、特にLPCパラメータの表現であるラ
インスペクトル周波数を説明してきた。この方法を用いて、LPC合成フィルタ
の周波数応答は、所望の周波数応答をもつように修正できる。雑音低減の目的の
ため、LPC合成フィルタの所望の周波数応答は、例えばスペクトルサブトラク
ションのような標準の雑音低減技術に基づいて計算できる。要約すると、圧縮コ
ードパラメータは、雑音の影響を低減すべく修正される。より特定的には、LP
C係数またはこれらの表現(例えばラインスペクトル周波数または対数−弧(lo
g-arc)比の1つが、雑音により影響されるスペクトル領域における雑音を低減
すべく修正される。
【0225】 通信分野における通常の知識を有する者が、上述した好ましい実施例が、特許
請求の範囲において規定した本発明の真の精神および範囲から逸脱することなく
、修正もしくは変更できることは認識すべきである。例えば、明細書に記載した
ALC技術はまたNR技術に応用される。
【図面の簡単な説明】
【図1】 GSMディジタル・セルラ・ネットワーク内の音声伝送用システムの概略的ブ
ロック図である。
【図2】 タンデム・フリー・オペレーション(TFO)下でのGSMネットワーク内の
音声伝送用システムの概略的ブロック図である。
【図3】 タンデム・フリー・オペレーション(TFO)下での音声伝送を示すグラフで
ある。
【図4】 スペクトルサブトラクションを用いた従来の雑音低減アプローチの概略的ブロ
ック図である。
【図5】 従来のアプローチを用いる符号化音声の雑音低減を示す概略的ブロック図であ
る。
【図6】 包括的なLPC音声合成モデル又は音声復号化モデルの概略的ブロック図であ
る。
【図7】 GSMFRのビットストリーム内の符号化されたパラメータの構成を示すブロ
ック図である。
【図8】 符号化領域ディジタル音声パラメータを線形領域ディジタル音声サンプルから
区別する概略的ブロック図である。
【図9】 ブロック最大のフルレートCODEC量子化を示すグラフである。
【図10a】 後方適応標準偏差ベース量子化器の概略的ブロック図である。
【図10b】 後方適応差分ベース量子化器の概略的ブロック図である。
【図11】 線形予測器を用いる適応差分量子化器の概略的ブロック図である。
【図12】 GSM強化フルレートコードブックゲイン(パラメータに関係する音声レベル
)量子化器の概略的ブロック図である。
【図13】 ゲイン修正ファクタのGSM強化フルレート量子化レベルを示すグラフである
【図14】 符号化領域ALCの一つの技術の概略的ブロック図である。
【図15】 オーバフロー/アンダーフローの防止のための技術を示す流れ図である。
【図16】 過去のゲイン値を要求するALCアルゴリズムにおいて実現されたゲインのフ
ィードバックを用いるALCシステムの好ましい形態の概略的ブロック図である
【図17】 符号化領域のALC装置の一つの形態の概略的ブロック図である。
【図18】 GSM FR コーデックの瞬時スカラー再量子化のためのシステムの概略的
ブロック図である。
【図19】 GSM EFR コーデックのための差分スカラー再量子化システムの概略的
ブロック図である。
【図20a】 所望のゲインにおけるステップを示すグラフである。
【図20b】 フィードバック・ループ内の量子化器で所望のゲインに重ね合わせられた実際
に実現されたゲインを示すグラフである。
【図20c】 図19に示したフィードバック・ループの外側に量子化器を配置することによ
り得られる、所望のゲインに重ね合わせられた実際に実現されたゲインを示すグ
ラフである。
【図21】 フィードバック・ループの外側に配置された量子化器を示すALC装置の概略
的ブロック図である。
【図22】 図21に示したALC装置の簡素化されたバージョンの概略的ブロック図であ
る。
【図23a】 フィードバック・ループ内の量子化器で過去のゲイン値のフィードバックを用
いるALCアルゴリズムのための符号化領域ALC実行の概略的ブロック図であ
る。
【図23b】 フィードバック・ループの外側の量子化器で過去のゲイン値のフィードバック
を用いるALCアルゴリズムのための符号化領域ALC実行の概略的ブロック図
である。
【図24】 EFR符号内の隣接R値の間の間隔を示し、特にiに対するEFR符号SL
RPs:(Ri+1−R)を示すグラフである。
【図25a】 各種のビットが受信される時間と、バッファが左から右に満たされるときのサ
ンプルの最先の可能なデコーディングとを示すEFR符号器の圧縮音声フレーム
の図である。
【図25b】 各種のビットが受信される時間と、バッファが左から右に満たされるときのサ
ンプルの最先の可能なデコーディングとを示すEFR符号器の圧縮音声フレーム
の図である。
【図26】 単一帯域線形領域雑音低減技術を示す概略的ブロック図である。
【図27】 差分スカラー量子化技術の概略的ブロック図である。
【図28】 差分量子化パラメータの差分最量子化のシステムの概略的ブロック図である。
【図29】 差分量子化によって起きる反響音を示すグラフである。
【図30】 反響音のない差分再量子化のシステムの概略的ブロック図である。
【図31】 反響音のない簡素化された差分再量子化の簡素化されたシステムの概略的ブロ
ック図である。
【図32】 音声合成の二重ソース図の概略的ブロック図である。
【図33】 ネットワーク雑音低減の好ましい形態の概略的ブロック図である。
【図34】 くし形フィルタの振幅周波数応答を示すグラフである。
【図35】 ピッチゲイン制御によるくし形フィルタにおけるスペクトルピーク応答の増大
を示すグラフである。
【図36】 コードブックゲイン減衰を用いる符号化領域の雑音低減システムの一つの好適
な形態の概略的ブロック図である。
【図37】 本発明による符号化領域の雑音低減方法の一つの好適な形態の概略的ブロック
図である。
【図38】 コードブックベクトルパラメータの変形による符号化領域雑音低減のシステム
の概略的ブロック図である。
【図39】 線スペクトル周波数のスペクトル判定を示すグラフである。
【手続補正書】
【提出日】平成14年1月23日(2002.1.23)
【手続補正2】
【補正対象書類名】図面
【補正対象項目名】図1
【補正方法】変更
【補正の内容】
【図1】
【手続補正3】
【補正対象書類名】図面
【補正対象項目名】図2
【補正方法】変更
【補正の内容】
【図2】
【手続補正4】
【補正対象書類名】図面
【補正対象項目名】図3
【補正方法】変更
【補正の内容】
【図3】
【手続補正5】
【補正対象書類名】図面
【補正対象項目名】図4
【補正方法】変更
【補正の内容】
【図4】
【手続補正6】
【補正対象書類名】図面
【補正対象項目名】図5
【補正方法】変更
【補正の内容】
【図5】
【手続補正7】
【補正対象書類名】図面
【補正対象項目名】図6
【補正方法】変更
【補正の内容】
【図6】
【手続補正8】
【補正対象書類名】図面
【補正対象項目名】図7
【補正方法】変更
【補正の内容】
【図7】
【手続補正9】
【補正対象書類名】図面
【補正対象項目名】図8
【補正方法】変更
【補正の内容】
【図8】
【手続補正10】
【補正対象書類名】図面
【補正対象項目名】図9
【補正方法】変更
【補正の内容】
【図9】
【手続補正11】
【補正対象書類名】図面
【補正対象項目名】図10A
【補正方法】変更
【補正の内容】
【図10A】
【手続補正12】
【補正対象書類名】図面
【補正対象項目名】図10B
【補正方法】変更
【補正の内容】
【図10B】
【手続補正13】
【補正対象書類名】図面
【補正対象項目名】図11
【補正方法】変更
【補正の内容】
【図11】
【手続補正14】
【補正対象書類名】図面
【補正対象項目名】図12
【補正方法】変更
【補正の内容】
【図12】
【手続補正15】
【補正対象書類名】図面
【補正対象項目名】図13
【補正方法】変更
【補正の内容】
【図13】
【手続補正16】
【補正対象書類名】図面
【補正対象項目名】図14
【補正方法】変更
【補正の内容】
【図14】
【手続補正17】
【補正対象書類名】図面
【補正対象項目名】図15
【補正方法】変更
【補正の内容】
【図15】
【手続補正18】
【補正対象書類名】図面
【補正対象項目名】図16
【補正方法】変更
【補正の内容】
【図16】
【手続補正19】
【補正対象書類名】図面
【補正対象項目名】図17
【補正方法】変更
【補正の内容】
【図17】
【手続補正20】
【補正対象書類名】図面
【補正対象項目名】図18
【補正方法】変更
【補正の内容】
【図18】
【手続補正21】
【補正対象書類名】図面
【補正対象項目名】図19
【補正方法】変更
【補正の内容】
【図19】
【手続補正22】
【補正対象書類名】図面
【補正対象項目名】図20a
【補正方法】変更
【補正の内容】
【図20a】
【手続補正23】
【補正対象書類名】図面
【補正対象項目名】図20b
【補正方法】変更
【補正の内容】
【図20b】
【手続補正24】
【補正対象書類名】図面
【補正対象項目名】図20c
【補正方法】変更
【補正の内容】
【図20c】
【手続補正25】
【補正対象書類名】図面
【補正対象項目名】図21
【補正方法】変更
【補正の内容】
【図21】
【手続補正26】
【補正対象書類名】図面
【補正対象項目名】図22
【補正方法】変更
【補正の内容】
【図22】
【手続補正27】
【補正対象書類名】図面
【補正対象項目名】図23a
【補正方法】変更
【補正の内容】
【図23a】
【手続補正28】
【補正対象書類名】図面
【補正対象項目名】図23b
【補正方法】変更
【補正の内容】
【図23b】
【手続補正29】
【補正対象書類名】図面
【補正対象項目名】図25a
【補正方法】変更
【補正の内容】
【図25a】
【手続補正30】
【補正対象書類名】図面
【補正対象項目名】図25b
【補正方法】変更
【補正の内容】
【図25b】
【手続補正31】
【補正対象書類名】図面
【補正対象項目名】図26
【補正方法】変更
【補正の内容】
【図26】
【手続補正32】
【補正対象書類名】図面
【補正対象項目名】図27
【補正方法】変更
【補正の内容】
【図27】
【手続補正33】
【補正対象書類名】図面
【補正対象項目名】図28
【補正方法】変更
【補正の内容】
【図28】
【手続補正34】
【補正対象書類名】図面
【補正対象項目名】図29a
【補正方法】変更
【補正の内容】
【図29a】
【手続補正35】
【補正対象書類名】図面
【補正対象項目名】図29b
【補正方法】変更
【補正の内容】
【図29b】
【手続補正36】
【補正対象書類名】図面
【補正対象項目名】図29c
【補正方法】変更
【補正の内容】
【図29c】
【手続補正37】
【補正対象書類名】図面
【補正対象項目名】図30
【補正方法】変更
【補正の内容】
【図30】
【手続補正38】
【補正対象書類名】図面
【補正対象項目名】図31
【補正方法】変更
【補正の内容】
【図31】
【手続補正39】
【補正対象書類名】図面
【補正対象項目名】図32
【補正方法】変更
【補正の内容】
【図32】
【手続補正40】
【補正対象書類名】図面
【補正対象項目名】図33
【補正方法】変更
【補正の内容】
【図33】
【手続補正41】
【補正対象書類名】図面
【補正対象項目名】図34
【補正方法】変更
【補正の内容】
【図34】
【手続補正42】
【補正対象書類名】図面
【補正対象項目名】図35
【補正方法】変更
【補正の内容】
【図35】
【手続補正43】
【補正対象書類名】図面
【補正対象項目名】図36
【補正方法】変更
【補正の内容】
【図36】
【手続補正44】
【補正対象書類名】図面
【補正対象項目名】図37
【補正方法】変更
【補正の内容】
【図37】
【手続補正45】
【補正対象書類名】図面
【補正対象項目名】図38
【補正方法】変更
【補正の内容】
【図38】
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04B 14/04 G10L 9/14 J (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,MZ,SD,SL,SZ,TZ,UG ,ZW),EA(AM,AZ,BY,KG,KZ,MD, RU,TJ,TM),AE,AG,AL,AM,AT, AU,AZ,BA,BB,BG,BR,BY,BZ,C A,CH,CN,CR,CU,CZ,DE,DK,DM ,DZ,EE,ES,FI,GB,GD,GE,GH, GM,HR,HU,ID,IL,IN,IS,JP,K E,KG,KP,KR,KZ,LC,LK,LR,LS ,LT,LU,LV,MA,MD,MG,MK,MN, MW,MX,MZ,NO,NZ,PL,PT,RO,R U,SD,SE,SG,SI,SK,SL,TJ,TM ,TR,TT,TZ,UA,UG,US,UZ,VN, YU,ZA,ZW Fターム(参考) 5D045 AB26 DA02 5J064 AA00 BA04 BA13 BB07 BC02 BC08 BC09 BC11 BC16 BC17 BC19 BC28 BD02 5K041 AA05 BB02 CC01 EE24 EE38 HH11 JJ38

Claims (66)

    【特許請求の範囲】
  1. 【請求項1】 複数のパラメータはオーディオ信号であり、前記オーディオ
    信号は雑音特性を含む複数のオーディオ特性を有しており、圧縮符号は複数の復
    号化ステップにより復号化可能であり、第1のパラメータを含む所定の前記複数
    のパラメータを備えた前記圧縮符号を用いてディジタル信号を送信するための通
    信システムにおいて、 前記ディジタル信号の圧縮符号に応答して少なくとも前記第1のパラメータを
    読み出し、前記圧縮符号及び前記第1のパラメータに応答して調整された第1の
    パラメータを生成し、前記第1のパラメータを前記調整された第1のパラメータ
    で置き換える、プロセッサを備える、前記雑音を管理する装置。
  2. 【請求項2】 前記プロセッサは、第1の復号化ステップを実行して第1の
    デコーダ信号を生成してその結果雑音のある音声信号を得、第2の復号化ステッ
    プを実行して第2のデコーダ信号を生成してその結果推定された雑音のない音声
    信号を得ることにより、前記複数の復号化ステップを実行し、前記プロセッサは
    、少なくとも前記第1のデコーダ信号と前記第2のデコーダ信号と前記第1のパ
    ラメータとに応答して前記調整された第1のパラメータを生成する、請求項1記
    載の装置。
  3. 【請求項3】 前記第1のパラメータはコードブックゲインを備え、前記プ
    ロセッサは前記コードブックゲインを修正して、前記雑音特性に対するコードブ
    ックベクトルの寄与度を修正する、請求項1記載の装置。
  4. 【請求項4】 前記第1のパラメータはコードブックゲインを備え、前記複
    数のパラメータは更にピッチゲインを備え、前記複数の特性は更に信号対雑音比
    を備え、前記プロセッサは前記コードブックゲイン、前記ピッチゲイン及び前記
    信号対雑音比に応答して前記調整された第1のパラメータを生成し、前記調整さ
    れた第1のパラメータは調整されたコードブックゲインを備える、請求項1記載
    の装置。
  5. 【請求項5】 前記信号対雑音比は雑音のある信号電力と前記オーディオ信
    号の雑音電力とに関与している比を備えている、請求項4記載の装置。
  6. 【請求項6】 前記第1のパラメータはピッチゲインを備え、前記複数のパ
    ラメータは更にコードブックゲインを備え、前記プロセッサはコードブックベク
    トルを生成することにより前記複数の復号化ステップを実行し、前記プロセッサ
    は前記コードブックゲインによって前記コードブックベクトルをスケーリングし
    てスケーリングされたコードブックベクトルを生成し、前記プロセッサは前記ス
    ケーリングされたコードブックベクトルに応答してピッチ周期に基づく第1の複
    数のサンプルを生成する少なくとも第1のバッファを備え、前記プロセッサは前
    記ピッチゲインによって前記第1のサンプルをスケーリングして第1のスケーリ
    ングされたサンプルを生成し、前記プロセッサは、前記雑音特性を管理するため
    に、前記ピッチゲインを修正して前記第1のスケーリングされたサンプルの寄与
    度を修正する、請求項1記載の装置。
  7. 【請求項7】 前記第1のパラメータはピッチゲインを備え、前記複数の特
    性は更に信号対雑音比を備え、前記プロセッサは前記ピッチゲイン及び前記信号
    対雑音比に応答して前記調整された第1のパラメータを生成し、前記調整された
    第1のパラメータは調整されたピッチゲインを備える、請求項1記載の装置。
  8. 【請求項8】 前記信号対雑音比は、雑音のある信号電力と前記オーディオ
    信号の雑音電力とに関与している比を備える、請求項7記載の装置。
  9. 【請求項9】 前記第1のパラメータはピッチゲインを備え、前記複数のパ
    ラメータは更にコードブックゲインを備え、前記プロセッサは、前記複数の復号
    化ステップを実行してコードブックベクトルを生成し、前記プロセッサは前記コ
    ードブックゲインによって前記コードブックベクトルをスケーリングしてスケー
    リングされたコードブックベクトルを生成し、前記プロセッサは前記スケーリン
    グされたコードブックベクトルの電力を表す電力信号を生成し、前記プロセッサ
    は前記ピッチゲイン及び前記電力信号に応答して前記調整された第1のパラメー
    タを生成し、前記調整された第1のパラメータは調整されたピッチゲインを備え
    ている、請求項1記載の装置。
  10. 【請求項10】 前記第1のパラメータはピッチゲインを備え、前記プロセ
    ッサはピッチ周期に基づいて少なくとも第1のサンプルを生成する少なくとも第
    1のバッファを備え、前記プロセッサは前記ピッチゲインによって前記第1のサ
    ンプルをスケーリングして少なくとも第1のスケーリングされたサンプルを生成
    し、前記プロセッサは前記第1のスケーリングサンプルの電力を表す第1の電力
    信号を生成し、前記プロセッサは少なくとも前記ピッチゲイン及び前記第1の電
    力信号に応答して前記調整された第1のパラメータを生成し、前記調整された第
    1のパラメータは調整されたピッチゲインを備える、請求項1記載の装置。
  11. 【請求項11】 前記プロセッサは前記第1の電力信号に部分的に応答して
    ピッチ周期に基づいて第2のサンプルを生成する第2のバッファを備え、前記プ
    ロセッサは前記ピッチゲインにより前記第2のサンプルをスケーリングして第2
    のスケーリングされたサンプルを生成し、前記プロセッサは前記第2のスケーリ
    ングされたサンプルの電力を表す第2の電力信号を生成し、前記プロセッサは前
    記ピッチゲイン、前記第1の電力信号及び前記第2の電力信号に応答して前記調
    整された第1のパラメータを生成する、請求項10記載の装置。
  12. 【請求項12】 前記第1のバッファ及び前記第2のバッファはそれぞれ、
    長時間予測バッファを備えている、請求項11記載の装置。
  13. 【請求項13】 前記第1のパラメータはピッチゲインを備え、前記複数の
    パラメータは更にコードブックゲインを備え、前記プロセッサはピッチ合成フィ
    ルタを備え、前記プロセッサは前記複数の復号化ステップを実行して第1のベク
    トルを生成し、前記プロセッサは前記コードブックゲインによって前記第1のベ
    クトルをスケーリングしてスケーリングされたコードブックベクトルを生成し、
    前記プロセッサは前記第1のベクトルの電力を表す電力信号を生成し、前記ピッ
    チゲインおよび前記電力信号に応答して前記調整された第1のパラメータを生成
    し、そして前記調整された第1のパラメータは調整されたピッチゲインを備える
    、請求項1記載の装置。
  14. 【請求項14】 前記第1のベクトルはコードブック励振ベクトルを備え、
    前記第2のベクトルはLPC励振ベクトルを備える、請求項13記載の装置。
  15. 【請求項15】 前記第1のパラメータは振幅の可変セットを用いるパルス
    を備えるコードブックベクトルを備え、前記プロセッサは前記セットを分析して
    前記セットにより表される前記雑音特性の電力を識別し、前記プロセッサは第1
    のセット以外の前記セットにより表される電力より少ない電力を表す前記第1の
    セットを識別し、そして前記プロセッサは前記パルスを前記第1のセットにした
    がって調整して前記調整されたパラメータを生成する、請求項1記載の装置。
  16. 【請求項16】 前記複数の復号化ステップは更に実質的に雑音特性の管理
    に影響を与えない少なくとも一つの復号化ステップを備え、前記プロセッサは前
    記少なくとも一つの復号化ステップの実行を避ける、請求項1記載の装置。
  17. 【請求項17】 前記少なくとも一つの復号化ステップはポスト・フィルタ
    リングを備える、請求項16記載の装置。
  18. 【請求項18】 前記圧縮符号は線形予測符号を備える、請求項1記載の装
    置。
  19. 【請求項19】 前記圧縮符号は正規パルス励振−長時間予測符号を備える
    、請求項1記載の装置。
  20. 【請求項20】 前記圧縮符号は符号励振線形予測符号を備える、請求項1
    記載の装置。
  21. 【請求項21】 前記第1のパラメータは量子化された第1のパラメータで
    あり、前記プロセッサは、前記第1のパラメータを前記調整された第1のパラメ
    ータで置換する前に、部分的に前記調整された第1のパラメータを量子化するこ
    とにより前記調整された第1のパラメータを生成する、請求項1記載の装置。
  22. 【請求項22】 前記圧縮符号は前記ディジタル信号のフレーム内に配置さ
    れ、前記フレームは複数のサブフレームを備え、該サブフレームの各々は前記第
    1のパラメータを備え、前記プロセッサは前記圧縮符号に応答して前記複数のサ
    ブフレームの各々から少なくとも前記第1のパラメータを読み出し、そして前記
    プロセッサは前記第1のパラメータを前記複数のサブフレームの各々の中の前記
    調整された第1のパラメータで置換する、請求項1記載の装置。
  23. 【請求項23】 前記プロセッサは、第1のサブフレームに続くサブフレー
    ムを処理する前に前記第1のパラメータを前記調整された第1のパラメータで置
    換してより少ない遅延を達成する、請求項22記載の装置。
  24. 【請求項24】 前記圧縮符号は前記ディジタル信号のフレーム内に配置さ
    れ、前記フレームは複数のサブフレームを備え、該サブフレームの各々は前記第
    1のパラメータを備え、前記プロセッサは前記サブフレームの最初の間に前記復
    号化ステップを実行して複数の前記復号化信号を生成し、前記第1のサブフレー
    ムに続いて生じる前記サブフレームの2番目から前記第1のパラメータを読み出
    し、前記複合化信号および前記第1のパラメータに応答して前記調整された第1
    のパラメータを生成し、そして前記第2のサブフレームの前記第1のパラメータ
    を前記調整された第1のパラメータで置換する、請求項1記載の装置。
  25. 【請求項25】 前記プロセッサは前記圧縮符号に応答して複数の前記復号
    化ステップの少なくとも一つを実行して復号化信号を生成し、前記プロセッサは
    前記復号化信号及び前記第1のパラメータに応答して前記調整された第1のパラ
    メータを生成する、請求項1記載の装置。
  26. 【請求項26】 前記第1のパラメータは、コードブックベクトル、コード
    ブックゲイン、ピッチゲイン、及び線スペクトル周波数及び対数領域比を含むL
    PC係数表示、から成るグループから選択される、請求項1記載の装置。
  27. 【請求項27】 前記オーディオ信号は前記雑音特性により影響されるスペ
    クトル領域を有し、前記第1のパラメータはLPC係数の表示を備え、前記プロ
    セッサは前記圧縮符号及び前記表示に応答して雑音に影響される前記スペクトル
    領域を決定し、且つ、前記調整された第1のパラメータを生成して、前記領域内
    の前記雑音特性を管理し、前記調整された第1のパラメータはLPC係数の調整
    された表示を備える、請求項1記載の装置。
  28. 【請求項28】 前記LPC係数の表示は線スペクトル周波数及びログエリ
    ア比からなるグループから選択される、請求項27記載の装置。
  29. 【請求項29】 符号サンプルは圧縮符号を用いる第1のビットと線形符号
    を用いる第2のビットとを備え、前記符号サンプルはオーディオ信号を表し、前
    記オーディオ信号は雑音特性を含む複数のオーディオ特性を有する、前記符号サ
    ンプルを備えるディジタル信号を送信する通信システムにおいて、 前記第2のビットに応答して前記第1のビット及び前記第2のビットを調整し
    、それにより前記ディジタル信号内の雑音特性が制御される、前記圧縮符号の復
    号化をしないで雑音特性を管理する装置。
  30. 【請求項30】 前記線形符号はパルス符号変調(PCM)符号を備える、
    請求項29記載の装置。
  31. 【請求項31】 前記圧縮符号サンプルは、移動体通信標準のためのグロー
    バルシステムのタンデムフリー動作に適合する、請求項29記載の装置。
  32. 【請求項32】 前記第1のビットは前記サンプルの2つの最下位ビットを
    備え、前記第2のビットは前記サンプルの6個の最上位ビットを備える、請求項
    29記載の装置。
  33. 【請求項33】 前記6個の最上位ビットはPCM符号を備える、請求項3
    2記載の装置。
  34. 【請求項34】 複数のパラメータはオーディオ信号であり、前記オーディ
    オ信号は雑音特性を含む複数のオーディオ特性を有しており、圧縮符号は複数の
    復号化ステップにより復号化可能であり、第1のパラメータを含む所定の前記複
    数のパラメータを備えた前記圧縮符号を用いてディジタル信号を送信するための
    通信システムにおいて、 少なくとも前記第1のパラメータを読み出すこと、 前記圧縮符号及び前記第1のパラメータに応答して調整された第1のパラメー
    タを生成すること、及び 前記第1のパラメータを前記調整された第1のパラメータで置換すること、 を備える、雑音特性を管理する方法。
  35. 【請求項35】 第1の復号化ステップを実行して第1のデコーダ信号を生
    成してその結果雑音のある音声信号を得、第2の復号化ステップを実行して第2
    のデコーダ信号を生成してその結果推定された雑音のない音声信号を得ることに
    より、前記複数の復号化ステップを実行すること、及び 少なくとも前記第1のデコーダ信号と前記第2のデコーダ信号と前記第1のパ
    ラメータとに応答して前記調整された第1のパラメータを生成すること、 をさらに備える、請求項34記載の方法。
  36. 【請求項36】 前記第1のパラメータはコードブックゲインを備え、前記
    方法は前記コードブックゲインを修正して、前記雑音特性に対するコードブック
    ベクトルの寄与度を修正すること、をさらに備える請求項34記載の方法。
  37. 【請求項37】 前記第1のパラメータはコードブックゲインを備え、前記
    複数のパラメータは更にピッチゲインを備え、前記複数の特性は更に信号対雑音
    比を備え、前記生成することは、前記コードブックゲイン、前記ピッチゲイン及
    び前記信号対雑音比に応答して前記調整された第1のパラメータを生成すること
    を備え、前記調整された第1のパラメータは調整されたコードブックゲインを備
    える、請求項34記載の方法。
  38. 【請求項38】 前記信号対雑音比は雑音のある信号電力と前記オーディオ
    信号の雑音電力とに関与している比を備えている、請求項37記載の方法。
  39. 【請求項39】 前記第1のパラメータはピッチゲインを備え、前記複数の
    パラメータは更にコードブックゲインを備え、前記生成することは、コードブッ
    クベクトルを生成することにより前記複数の復号化ステップを実行すること、前
    記コードブックゲインによって前記コードブックベクトルをスケーリングしてス
    ケーリングされたコードブックベクトルを生成すること、前記スケーリングされ
    たコードブックベクトルに応答してピッチ周期に基づく第1の複数のサンプルを
    生成すること、前記ピッチゲインによって前記第1のサンプルをスケーリングし
    て第1のスケーリングされたサンプルを生成すること、及び前記雑音特性を管理
    するために、前記ピッチゲインを修正して前記第1のスケーリングされたサンプ
    ルの寄与度を修正すること、を備える請求項34記載の方法。
  40. 【請求項40】 前記第1のパラメータはピッチゲインを備え、前記複数の
    特性は更に信号対雑音比を備え、前記生成することは、前記ピッチゲイン及び前
    記信号対雑音比に応答して前記調整された第1のパラメータを生成することを備
    え、前記調整された第1のパラメータは調整されたピッチゲインを備える、請求
    項34記載の方法。
  41. 【請求項41】 前記信号対雑音比は、雑音のある信号電力と前記オーディ
    オ信号の雑音電力とに関与している比を備える、請求項40記載の方法。
  42. 【請求項42】 前記第1のパラメータはピッチゲインを備え、前記複数の
    パラメータは更にコードブックゲインを備え、前記生成することは、前記複数の
    復号化ステップを実行してコードブックベクトルを生成すること、前記コードブ
    ックゲインによって前記コードブックベクトルをスケーリングしてスケーリング
    されたコードブックベクトルを生成すること、前記スケーリングされたコードブ
    ックベクトルの電力をあらわす電力信号を精製すること、及び前記ピッチゲイン
    及び前記電力信号に応答して前記調整された第1のパラメータを生成すること、
    を備え、前記調整された第1のパラメータは調整されたピッチゲインを備える、
    請求項34記載の方法。
  43. 【請求項43】 前記第1のパラメータはピッチゲインを備え、前記生成す
    ることは、ピッチ周期に基づいて少なくとも第1のサンプルを生成すること、前
    記ピッチゲインによって前記第1のサンプルをスケーリングして少なくとも第1
    のスケーリングされたサンプルを生成すること、前記第1のスケーリングサンプ
    ルの電力を表す第1の電力信号を生成すること、及び少なくとも前記ピッチゲイ
    ン及び前記第1の電力信号に応答して前記調整された第1のパラメータを生成す
    ることを備え、前記調整された第1のパラメータは調整されたピッチゲインを備
    える、請求項34記載の方法。
  44. 【請求項44】 前記生成することは更に、前記第1の電力信号に部分的に
    応答してピッチ周期に基づいて第2のサンプルを生成すること、前記ピッチゲイ
    ンにより前記第2のサンプルをスケーリングして第2のスケーリングされたサン
    プルを生成すること、前記第2のスケーリングされたサンプルの電力を表す第2
    の電力信号を生成すること、及び前記ピッチゲイン、前記第1の電力信号及び前
    記第2の電力信号に応答して前記調整された第1のパラメータを生成すること、
    を備える請求項43記載の方法。
  45. 【請求項45】 前記システムは1つ以上の長時間予測バッファを備えてお
    り、前記第1及び第2のサンプルを生成することは前記1つ以上のバッファを使
    用することを含む、請求項44記載の方法。
  46. 【請求項46】 前記第1のパラメータはピッチゲインを備え、前記複数の
    パラメータは更にコードブックゲインを備え、前記プロセッサはピッチ合成フィ
    ルタを備え、前記生成することは、前記複数の復号化ステップを実行して第1の
    ベクトルを生成すること、前記コードブックゲインによって前記第1のベクトル
    をスケーリングしてスケーリングされたコードブックベクトルを生成すること、
    ピッチ合成フィルタリングによって前記スケーリングされたコードブックベクト
    ルをフィルアリングして第2のベクトルを生成すること、前記第2のベクトルの
    電力を表す電力信号を生成すること、及び前記ピッチゲインおよび前記電力信号
    に応答して前記調整された第1のパラメータを生成すること、を備え、そして前
    記調整された第1のパラメータは調整されたピッチゲインを備える、請求項34
    記載の方法。
  47. 【請求項47】 前記第1のベクトルはコードブック励振ベクトルを備え、
    前記第2のベクトルはLPC励振ベクトルを備える、請求項46記載の方法。
  48. 【請求項48】 前記第1のパラメータは振幅の可変セットを用いるパルス
    を備えるコードブックベクトルを備え、前記生成することは、前記セットを分析
    して前記セットにより表される前記雑音特性の電力を識別すること、前記プロセ
    ッサは第1のセット以外の前記セットにより表される電力より少ない電力を表す
    前記第1のセットを識別すること、及び前記パルスを前記第1のセットにしたが
    って調整して前記調整されたパラメータを生成すること、を備える請求項34記
    載の方法。
  49. 【請求項49】 前記複数の復号化ステップは更に実質的に雑音特性の管理
    に影響を与えない少なくとも一つの復号化ステップを備え、前記生成することは
    、前記少なくとも一つの復号化ステップの実行を避ける、請求項34記載の方法
  50. 【請求項50】 前記少なくとも一つの復号化ステップはポスト・フィルタ
    リングを備える、請求項49記載の方法。
  51. 【請求項51】 前記圧縮符号は線形予測符号を備える、請求項34記載の
    方法。
  52. 【請求項52】 前記圧縮符号は正規パルス励振−長時間予測符号を備える
    、請求項34記載の方法。
  53. 【請求項53】 前記圧縮符号は符号励振線形予測符号を備える、請求項3
    4記載の方法。
  54. 【請求項54】 前記第1のパラメータは量子化された第1のパラメータで
    あり、前記生成することは、前記第1のパラメータを前記調整された第1のパラ
    メータで置換する前に、部分的に前記調整された第1のパラメータを量子化する
    ことにより前記調整された第1のパラメータを生成することを備える、請求項3
    4記載の方法。
  55. 【請求項55】 前記圧縮符号は前記ディジタル信号のフレーム内に配置さ
    れ、前記フレームは複数のサブフレームを備え、該サブフレームの各々は前記第
    1のパラメータを備え、前記読み出すことは、前記圧縮符号に応答して前記複数
    のサブフレームの各々から少なくとも前記第1のパラメータを読み出ことを備え
    、そして前記置換することは、前記第1のパラメータを前記複数のサブフレーム
    の各々の中の前記調整された第1のパラメータで置換することを備える、請求項
    34記載の方法。
  56. 【請求項56】 前記置換することは、第1のサブフレームに続くサブフレ
    ームを処理する前に前記第1のパラメータを前記調整された第1のパラメータで
    置換してより少ない遅延を達成することを備える、請求項55記載の方法。
  57. 【請求項57】 前記圧縮符号は前記ディジタル信号のフレーム内に配置さ
    れ、前記フレームは複数のサブフレームを備え、該サブフレームの各々は前記第
    1のパラメータを備え、前記生成することは、前記サブフレームの最初の間に前
    記復号化ステップの実行を開始して複数の前記復号化信号を生成することを備え
    、前記読み出すことは、前記第1のサブフレームに続いて生じる前記サブフレー
    ムの2番目から前記第1のパラメータを読み出すことを備え、前記生成すること
    は更に、前記複合化信号および前記第1のパラメータに応答して前記調整された
    第1のパラメータを生成することを備え、そして前記置換することは、前記第2
    のサブフレームの前記第1のパラメータを前記調整された第1のパラメータで置
    換することを備える、請求項34記載の方法。
  58. 【請求項58】 前記生成することは、複数の前記復号化ステップの少なく
    とも一つを実行して前記圧縮符号に応答して復号化信号を生成すること、及び前
    記復号化信号及び前記第1のパラメータに応答して前記調整された第1のパラメ
    ータを生成すること、を備える請求項34記載の方法。
  59. 【請求項59】 前記第1のパラメータは、コードブックベクトル、コード
    ブックゲイン、ピッチゲイン、及び線スペクトル対及び線スペクトル周波数を含
    むLPC係数表示、から成るグループから選択される、請求項34記載の方法。
  60. 【請求項60】 前記オーディオ信号は前記雑音特性により影響されるスペ
    クトル領域を有し、前記第1のパラメータはLPC係数の表示を備え、前記生成
    することは、前記圧縮符号及び前記表示に応答して雑音に影響される前記スペク
    トル領域を決定すること、及び、前記調整された第1のパラメータを生成して、
    前記領域内の前記雑音特性を管理すること、を備え、前記調整された第1のパラ
    メータはLPC係数の調整された表示を備える、請求項34記載の方法。
  61. 【請求項61】 前記LPC係数の表示は線スペクトル周波数及び対数領域
    比からなるグループから選択される、請求項60記載の方法。
  62. 【請求項62】 符号サンプルは圧縮符号を用いる第1のビットと線形符号
    を用いる第2のビットとを備え、前記符号サンプルはオーディオ信号を表し、前
    記オーディオ信号は雑音特性を含む複数のオーディオ特性を有する、前記符号サ
    ンプルを備えるディジタル信号を送信する通信システムにおいて、 前記第2のビットに応答して前記第1のビット及び前記第2のビットを調整し
    、それにより前記ディジタル信号内の雑音特性が制御される、前記圧縮符号の復
    号化をしないで雑音特性を管理する方法。
  63. 【請求項63】 前記線形符号はパルス符号変調(PCM)符号を備える、
    請求項29記載の方法。
  64. 【請求項64】 前記符号サンプルは、移動体通信標準のためのグローバル
    システムのタンデムフリー動作に適合する、請求項62記載の方法。
  65. 【請求項65】 前記第1のビットは前記サンプルの2つの最下位ビットを
    備え、前記第2のビットは前記サンプルの6個の最上位ビットを備える、請求項
    62記載の方法。
  66. 【請求項66】 前記6個の最上位ビットはPCM符号を備える、請求項6
    5記載の方法。
JP2001508667A 1999-07-02 2000-06-30 符号化領域雑音制御 Pending JP2003504669A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14213699P 1999-07-02 1999-07-02
US60/142,136 1999-07-02
PCT/US2000/018165 WO2001002929A2 (en) 1999-07-02 2000-06-30 Coded domain noise control

Publications (1)

Publication Number Publication Date
JP2003504669A true JP2003504669A (ja) 2003-02-04

Family

ID=22498680

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2001508063A Pending JP2003533902A (ja) 1999-07-02 2000-06-30 符号化されたドメインのエコーの制御
JP2001508064A Pending JP2003503760A (ja) 1999-07-02 2000-06-30 圧縮音声の符号領域適応レベル制御
JP2001508667A Pending JP2003504669A (ja) 1999-07-02 2000-06-30 符号化領域雑音制御

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2001508063A Pending JP2003533902A (ja) 1999-07-02 2000-06-30 符号化されたドメインのエコーの制御
JP2001508064A Pending JP2003503760A (ja) 1999-07-02 2000-06-30 圧縮音声の符号領域適応レベル制御

Country Status (5)

Country Link
EP (3) EP1190494A1 (ja)
JP (3) JP2003533902A (ja)
AU (3) AU6063600A (ja)
CA (3) CA2378012A1 (ja)
WO (3) WO2001003316A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019009204A1 (ja) * 2017-07-03 2019-01-10 パイオニア株式会社 信号処理装置、制御方法、プログラム及び記憶媒体

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1301018A1 (en) * 2001-10-02 2003-04-09 Alcatel Apparatus and method for modifying a digital signal in the coded domain
JP3946074B2 (ja) * 2002-04-05 2007-07-18 日本電信電話株式会社 音声処理装置
JP3876781B2 (ja) 2002-07-16 2007-02-07 ソニー株式会社 受信装置および受信方法、記録媒体、並びにプログラム
EP1521242A1 (en) * 2003-10-01 2005-04-06 Siemens Aktiengesellschaft Speech coding method applying noise reduction by modifying the codebook gain
US7613607B2 (en) 2003-12-18 2009-11-03 Nokia Corporation Audio enhancement in coded domain
US8874437B2 (en) 2005-03-28 2014-10-28 Tellabs Operations, Inc. Method and apparatus for modifying an encoded signal for voice quality enhancement
WO2007053086A1 (en) * 2005-10-31 2007-05-10 Telefonaktiebolaget Lm Ericsson (Publ) Reduction of digital filter delay
US7852792B2 (en) * 2006-09-19 2010-12-14 Alcatel-Lucent Usa Inc. Packet based echo cancellation and suppression
JP4915575B2 (ja) * 2007-05-28 2012-04-11 パナソニック株式会社 音声伝送システム
JP4915576B2 (ja) * 2007-05-28 2012-04-11 パナソニック株式会社 音声伝送システム
JP4915577B2 (ja) * 2007-05-28 2012-04-11 パナソニック株式会社 音声伝送システム
WO2009029076A1 (en) * 2007-08-31 2009-03-05 Tellabs Operations, Inc. Controlling echo in the coded domain
WO2012106926A1 (zh) 2011-07-25 2012-08-16 华为技术有限公司 一种参数域回声控制装置和方法
TWI469135B (zh) * 2011-12-22 2015-01-11 Univ Kun Shan 調適性差分脈衝碼調變編碼解碼的方法
JP6011188B2 (ja) * 2012-09-18 2016-10-19 沖電気工業株式会社 エコー経路遅延測定装置、方法及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0954600A (ja) * 1995-08-14 1997-02-25 Toshiba Corp 音声符号化通信装置
JPH0993132A (ja) * 1995-09-27 1997-04-04 Toshiba Corp 符号化・復号化装置及び方法
WO1999034354A1 (en) * 1997-12-24 1999-07-08 Mitsubishi Denki Kabushiki Kaisha Sound encoding method and sound decoding method, and sound encoding device and sound decoding device

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0683114B2 (ja) * 1985-03-08 1994-10-19 松下電器産業株式会社 エコ−キヤンセラ
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US5140543A (en) * 1989-04-18 1992-08-18 Victor Company Of Japan, Ltd. Apparatus for digitally processing audio signal
US5097507A (en) * 1989-12-22 1992-03-17 General Electric Company Fading bit error protection for digital cellular multi-pulse speech coder
US5680508A (en) * 1991-05-03 1997-10-21 Itt Corporation Enhancement of speech coding in background noise for low-rate speech coder
JP3353257B2 (ja) * 1993-08-30 2002-12-03 日本電信電話株式会社 音声符号化復号化併用型エコーキャンセラー
US5828995A (en) * 1995-02-28 1998-10-27 Motorola, Inc. Method and apparatus for intelligible fast forward and reverse playback of time-scale compressed voice messages
JPH10143197A (ja) * 1996-11-06 1998-05-29 Matsushita Electric Ind Co Ltd 再生装置
JP3283200B2 (ja) * 1996-12-19 2002-05-20 ケイディーディーアイ株式会社 符号化音声データの符号化レート変換方法および装置
US5943645A (en) * 1996-12-19 1999-08-24 Northern Telecom Limited Method and apparatus for computing measures of echo
US6064693A (en) * 1997-02-28 2000-05-16 Data Race, Inc. System and method for handling underrun of compressed speech frames due to unsynchronized receive and transmit clock rates
JP3317181B2 (ja) * 1997-03-25 2002-08-26 ヤマハ株式会社 カラオケ装置
US6112177A (en) * 1997-11-07 2000-08-29 At&T Corp. Coarticulation method for audio-visual text-to-speech synthesis

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0954600A (ja) * 1995-08-14 1997-02-25 Toshiba Corp 音声符号化通信装置
JPH0993132A (ja) * 1995-09-27 1997-04-04 Toshiba Corp 符号化・復号化装置及び方法
WO1999034354A1 (en) * 1997-12-24 1999-07-08 Mitsubishi Denki Kabushiki Kaisha Sound encoding method and sound decoding method, and sound encoding device and sound decoding device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019009204A1 (ja) * 2017-07-03 2019-01-10 パイオニア株式会社 信号処理装置、制御方法、プログラム及び記憶媒体
US11031023B2 (en) 2017-07-03 2021-06-08 Pioneer Corporation Signal processing device, control method, program and storage medium

Also Published As

Publication number Publication date
AU6203300A (en) 2001-01-22
CA2378012A1 (en) 2001-01-11
WO2001002929A3 (en) 2001-07-19
CA2378035A1 (en) 2001-01-11
AU6063600A (en) 2001-01-22
EP1190495A1 (en) 2002-03-27
WO2001002929A2 (en) 2001-01-11
EP1190494A1 (en) 2002-03-27
JP2003533902A (ja) 2003-11-11
JP2003503760A (ja) 2003-01-28
CA2378062A1 (en) 2001-01-11
WO2001003316A1 (en) 2001-01-11
AU6067100A (en) 2001-01-22
EP1208413A2 (en) 2002-05-29
WO2001003317A1 (en) 2001-01-11

Similar Documents

Publication Publication Date Title
US7693710B2 (en) Method and device for efficient frame erasure concealment in linear predictive based speech codecs
US7165035B2 (en) Compressed domain conference bridge
JP2004287397A (ja) 相互使用可能なボコーダ
JPH09152900A (ja) 予測符号化における人間聴覚モデルを使用した音声信号量子化法
JP2003504669A (ja) 符号化領域雑音制御
US6052659A (en) Nonlinear filter for noise suppression in linear prediction speech processing devices
US6424942B1 (en) Methods and arrangements in a telecommunications system
US20030065507A1 (en) Network unit and a method for modifying a digital signal in the coded domain
JP2003524796A (ja) 音声コーダにおける線スペクトル情報量子化方法を交錯するための方法および装置
US20030195745A1 (en) LPC-to-MELP transcoder
JP2003533902A5 (ja)
US20130054230A1 (en) Estimation of speech energy based on code excited linear prediction (celp) parameters extracted from a partially-decoded celp-encoded bit stream and applications of same
EP1544848A2 (en) Audio enhancement in coded domain
US7584096B2 (en) Method and apparatus for encoding speech
CN100369108C (zh) 编码域中的音频增强的方法和设备
JPH0438169B2 (ja)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070618

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100727

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101221