JP4659216B2 - 忠実度改善のためのコンフォートノイズ変動特性に基づく音声符号化 - Google Patents
忠実度改善のためのコンフォートノイズ変動特性に基づく音声符号化 Download PDFInfo
- Publication number
- JP4659216B2 JP4659216B2 JP2000584461A JP2000584461A JP4659216B2 JP 4659216 B2 JP4659216 B2 JP 4659216B2 JP 2000584461 A JP2000584461 A JP 2000584461A JP 2000584461 A JP2000584461 A JP 2000584461A JP 4659216 B2 JP4659216 B2 JP 4659216B2
- Authority
- JP
- Japan
- Prior art keywords
- background noise
- noise parameter
- parameter
- variation characteristic
- values
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 claims description 30
- 230000003595 spectral effect Effects 0.000 claims description 22
- 238000004891 communication Methods 0.000 claims description 18
- 239000003607 modifier Substances 0.000 claims description 18
- 230000005540 biological transmission Effects 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 4
- 239000013598 vector Substances 0.000 description 19
- 238000001228 spectrum Methods 0.000 description 12
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 230000003068 static effect Effects 0.000 description 5
- 238000013139 quantization Methods 0.000 description 4
- 230000001755 vocal effect Effects 0.000 description 2
- 206010019133 Hangover Diseases 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Mobile Radio Communication Systems (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Noise Elimination (AREA)
Description
【発明の属する技術分野】
本願は、米国特許法第119条(e)(1)にもとづく、1998年11月23日出願の米国特許仮出願第60/109,555号の優先権を主張する。
本発明は、音声符号化、詳細には、音声非活動状態の期間に人工的背景雑音が作成される音声符号化に関する。
【0002】
【従来の技術】
音声コーダおよび復号化器は、従来、それぞれ無線送信機および無線受信機に備えられており、無線リンクによって任意の送信機と受信機との間の音声通信を可能にするために協働する。音声コーダと音声復号化器の組合せはしばしば音声コーデックと呼ばれる。移動無線電話(例えば携帯電話)は、一般に音声コーダを有する無線送信機および音声復号化器を有する無線受信機を備える従来の通信装置の実例である。
【0003】
従来のブロックベース音声コーダにおいて、入力音声信号は、フレームと呼ばれるブロックに分割される。普通の4kHzテレフォニー帯域用の場合、典型的なフレーム長は20msまたは160サンプルである。フレームは、一般に長さ5msまたは40サンプルのサブフレームにさらに分割される。
【0004】
従来の線形予測合成分析(LPAS)コーダは、音声発生関連モデルを使用する。入力音声信号から、声道、ピッチなどを記述するモデルパラメータが抽出される。ゆっくり変化するパラメータは一般に、すべてのフレームについて計算される。そのようなパラメータの例には、音声を発生させた装置における声道を記述するSTP(短時間予測)パラメータが含まれる。STPパラメータの1例が、入力音声信号のスペクトル形状を表現する線形予測係数(LPC)である。より急速に変化するパラメータの例には、一般にサブフレームごとに計算されるピッチおよびイノベーション形状(innovation shape)/ゲインパラメータが含まれる。
【0005】
抽出されたパラメータは、適切な公知のスカラ/ベクトル量子化技法を用いて量子化される。線形予測係数などのSTPパラメータは、しばしば、線スペクトル周波数(LSFs)といったより量子化に適する表現に変換される。量子化の後、パラメータは通信チャネルによって復号化器に送られる。
【0006】
従来のLPAS復号化器では、一般に上述の逆が行われ、音声信号が合成される。通常、知覚品質を高めるためにポストフィルタリング技法が合成音声信号に適用される。
【0007】
多くの共通の背景雑音形式について、音声に必要であるよりもはるかに低いビットレートにより、信号の十分に良好なモデルが得られる。現行の移動通信システムは、伝送ビットレートを背景雑音において相応に調整することによってこのことを利用する。連続伝送技法を使用する従来のシステムでは、可変レート(VR)音声コーダはその最低ビットレートを使用することができる。従来の不連続伝送(DTX)方式では、話者が不活動の時に、送信機は符号化音声フレームの送信を停止する。規則的または不規則な間隔(一般に500msごと)で、送信機は、復号化器におけるコンフォートノイズの作成に適切な音声パラメータを送る。コンフォートノイズ作成(CNG)のためのそれらのパラメータは、無音デスクリプタ(SID)フレームと時には呼ばれるものに従来通りに符号化される。受信機では、復号化器は、従来のコンフォートノイズ挿入(CNI)アルゴリズムによって人工的雑音を合成するためにSIDフレームで受信されたコンフォートノイズパラメータを使用する。
【0008】
従来のDTXシステムの復号化器においてコンフォートノイズが作成される場合、雑音は、非常に静的で、アクティブ(非DTX)モードで作成される背景雑音と相当異なるものとして知覚されることが多い。この知覚の理由は、DTXのSIDフレームが通常の音声フレームほどの頻度で受信機に送信されないからである。DTXモードを有するLPASコーデックでは、背景雑音のスペクトルおよびエネルギーは一般に、数フレームについて推定され(例えば平均され)、その後、推定されたパラメータが量子化されチャンネルによって復号化器に送信される。図1は、上記の推定された背景雑音(コンフォートノイズ)パラメータを作成する例示的な従来技術のコンフォートノイズ符号化器を図示している。量子化されたコンフォートノイズパラメータは一般に、100〜500msごとに送られる。
【0009】
規則的な音声フレームを送らずに低更新レートでSIDフレームを送信する利点は2つある。例えば移動無線トランシーバの電池の寿命は消費電力の低下により延長し、また、送信機により作成する妨害は減少し、より高いシステム容量を提供する。
【0010】
従来の復号化器において、コンフォートノイズパラメータは、図2に例示するように受信され復号化され得る。復号化器は、音声パラメータを通常通りに受信するほどの頻度で新しいコンフォートノイズパラメータを受信しないので、SIDフレームで受信されるコンフォートノイズパラメータは一般に、コンフォートノイズ合成においてパラメータのスムーズな展開を可能にするために23で補間される。25で略示する合成動作において、復号化器は合成フィルタ27に対し、ゲイン基準化された不規則雑音(例えば白色雑音)励振および補間されたスペクトルパラメータを入力する。その結果、作成されたコンフォートノイズSc(n)は、符号化器端(図1参照)の背景雑音s(n)が性質が変化しているか否かにかかわらず、高度に定常な(「静的な」)ものとして知覚されることになる。この問題は、街の雑音やざわめき(例えばレストランの騒音)といった強い変動特性を伴う背景においてより大きく発現するが、自動車の騒音といった状況でも存在する。
【0011】
この「静的な」コンフォートノイズの問題を解決するための従来の1方策は単に、DTXコンフォートノイズパラメータの更新レートを増大させる(例えば、より高いSIDフレームレートを使用する)ことである。この解決策による例示的問題は、送信機がより頻回に動作しなければならないので、(例えば移動トランシーバの)電池消費量が増大し、システム容量がSIDフレームレートの増加のために減少することである。従って、静的な背景雑音を受容することが従来システムでは普通である。
【0012】
【発明が解決しようとする課題】
従って、従来のコンフォートノイズ作成に関係する上記の不利益を回避することが望ましい。
【0013】
【課題を解決するための手段】
本発明によれば、従来通り作成されたコンフォートノイズパラメータは、符号化器で得られた実際の背景雑音の特性にもとづき修正される。修正パラメータから作成されるコンフォートノイズは、従来作成されたコンフォートノイズよりも静的ではなく知覚され、符号化器で得られた実際の背景雑音とより類似している。
【0014】
【発明の実施の形態】
図3は、本発明に従ってコンフォートノイズパラメータを修正するためのコンフォートノイズパラメータ修正器30を例示する。図3の実施例において、修正器30は、入力33で、例えば図2の補間器23からのスペクトルおよびエネルギーパラメータ出力といった、従来の補間されたコンフォートノイズパラメータを受信する。修正器30はまた、入力31でも、符号化器で得られた背景雑音に関係するスペクトルおよびエネルギーパラメータを受信する。修正器30は、31で受信した背景雑音パラメータにもとづき、受信したコンフォートノイズパラメータを修正し、35で修正されたコンフォートノイズパラメータを作成する。修正コンフォートノイズパラメータはその後、例えば従来のコンフォートノイズ合成動作で使用するために図2のコンフォートノイズ合成部25に供給され得る。35で供給された修正コンフォートノイズパラメータは、合成部25が、音声符号化器に付与された実際の背景雑音をより忠実に再現するコンフォートノイズを作成できるようにする。
【0015】
図4は、図3のコンフォートノイズパラメータ修正器30の例示的な実施形態を例示する。修正器30は、背景雑音のスペクトルおよびエネルギーパラメータを受信するために入力31と結合された変動特性推定器41を含む。変動特性推定器41は、背景雑音パラメータの変動特性特性を推定し、背景雑音パラメータの変動特性を示す情報を43で出力する。変動特性情報は、その平均値に関するパラメータの変動特性、例えばパラメータの分散、または平均値からの最大偏差を特性化できる。
【0016】
43での変動特性情報はまた、相関特性、パラメータの経時的進展、またはパラメータの経時的変動特性の他の測度も指示し得る。時間変動特性情報の例には、パラメータの変化率(速いまたは遅い変化)、パラメータの分散、平均の最大偏差、パラメータの変動特性を特徴づける他の統計測度といった単純な測度から、自己相関特性、パラメータから推定される自己回帰(AR)予測変数のフィルタ係数といったより高度な測度が含まれる。単純な変化率測度の1例は、零交叉率、すなわち、パラメータ値のシーケンスにおいて最初のパラメータ値から最後のパラメータ値まで見た時にパラメータの符号が変わる回数をカウントすることである。推定器41から43で出力された情報は結合器45に入力され、これは、43での出力情報を33で受信された補間コンフォートノイズパラメータと結合し、修正されたコンフォートノイズパラメータを35で作成する。
【0017】
図5は、図4の変動特性推定器41の例示的な実施形態を例示する。図5の推定器は、背景雑音のスペクトルおよびエネルギーパラメータを受信するための入力31と結合された平均変動特性決定器51を含む。平均変動特性決定器51は上述のような平均変動特性特性を決定できる。例えば、図3の背景雑音バッファ37が8フレーム、32のサブフレームを含む場合、バッファされたスペクトルおよびエネルギーパラメータの変動特性は、次のように分析できる。バッファされたスペクトルパラメータの平均(または代表)値は、(SIDフレームを作成するためにDTX符号化器において従来行われているように)計算され、バッファされたスペクトルパラメータ値から減算することにより、スペクトル偏差値のベクトルを得ることができる。同様に、バッファされたエネルギーパラメータの平均サブフレーム値は、(SIDフレームを作成するためにDTX符号化器において従来行われているように)計算された後、バッファされたサブフレームエネルギーパラメータ値から減算することにより、エネルギー偏差値のベクトルを得ることができる。このようにして、スペクトルおよびエネルギーの偏差ベクトルは、スペクトルおよびエネルギーパラメータの平均除去された値よりなる。スペクトルおよびエネルギー偏差ベクトルは、変動特性決定器51から通信路52によって偏差ベクトル記憶装置55に伝達される。
【0018】
また、背景雑音パラメータを受信するために、係数計算器53も入力31に結合されている。例示的な係数計算器53は、個々のスペクトルおよびエネルギーパラメータに関し従来のAR推定を実行するために動作可能である。AR推定から得られたフィルタ係数は、係数計算器53から通信路54を経てフィルタ57に伝達される。53で計算されたフィルタ係数は、スペクトルおよびエネルギーパラメータについて例えば個々の全極形フィルタを定義することができる。
【0019】
1実施形態において、係数計算器53は、スペクトルおよびエネルギーパラメータの両方について一次AR推定を実行し、従来通りに個々のパラメータのフィルタ係数a1=Rxx(1)/Rxx(0)を計算する。Rxx(0)およびRxx(1)の値は、以下の通りその特定のパラメータの従来の自己相関値である。
【数1】
これらのRxx計算において、xは背景雑音(例えば、スペクトルまたはエネルギー)パラメータを表す。a1の正の値は一般に、パラメータがゆっくり変化することを示し、負の値は一般に急速な変動を示す。
【0020】
1実施形態によれば、スペクトルパラメータの各フレーム、およびエネルギーパラメータの各サブフレームについて、対応する偏差ベクトルからの成分x(k)は、例えば、(記憶装置55のSELECT入力を経て)ランダムに選択され、対応するフィルタ係数を用いてフィルタ57によってフィルタリングされ得る。フィルタからの出力はその後、例えば乗算器といった基準化装置59によって一定の倍率で基準化される。図5でxp(k)として指示されている基準化された出力は、図4の結合器45の入力43に供給される。
【0021】
図5Aに略示した1実施形態では、37でバッファされたパラメータを受信するために零交叉率決定器50が31で結合されている。決定器50は、スペクトルおよびエネルギーパラメータの個々の零交叉率を決定する。すなわち、37でバッファされたエネルギーパラメータのシーケンス、また37でバッファされたスペクトルパラメータのシーケンスについて、零交叉率決定器50は、バッファされたシーケンスにおいて最初のパラメータ値から最後のパラメータ値まで見た時に関係するパラメータ値の符号が変化する回数を個々のシーケンスにおいて決定する。この零交叉率情報はその後、図5のSELECT信号を制御するために56で使用され得る。
【0022】
例えば、SELECT信号は、所与の偏差ベクトルについて、そのパラメータに関係する零交叉率が相対的に高い(相対的に高いパラメータ変動特性を示す)場合、偏差ベクトルの成分x(k)をより頻回に(フレームまたはサブフレームごとほど頻繁に)ランダムに選択するように、また、関係する零交叉率が相対的に低い(相対的に低いパラメータ変動特性を示す)場合は、偏差ベクトルの成分x(k)をそれほど頻回ではなく(例えばフレームまたはサブフレームごとほど頻繁にではなく)ランダムに選択するように制御することができる。他の実施形態では、所与の偏差ベクトルの成分x(k)の選択の頻度は、事前に決定された所要の値に設定できる。
【0023】
図4の結合器は、基準化出力xp(k)を従来のコンフォートノイズパラメータと結合するために動作する。結合は、スペクトルパラメータの場合はフレームベースで、エネルギーパラメータの場合はサブフレームベースで実行される。1例では、結合器45は、信号xp(k)を従来のコンフォートノイズパラメータに単に付加する加算器とすることができる。従って、図5の基準化出力xp(k)は、コンフォートノイズ合成部25(図2〜4参照)に入力される修正(または摂動)コンフォートノイズパラメータを作成するために、33で受信された従来のコンフォートノイズパラメータを摂動させるために結合器45によって使用される摂動信号であるとみなすことができる。
【0024】
従来のコンフォートノイズ合成部25は、摂動コンフォートノイズパラメータを従来通りに使用できる。従来のパラメータの摂動により、作成されたコンフォートノイズは、自動車の騒音と同様、ざわめきや市街の雑音といったより可変性のある背景の知覚品質を著しく高める準ランダム変動特性を有する。
【0025】
摂動信号xp(k)は、1例において次のように表現できる。
【数2】
ここに、βxは倍率、b0xおよびa1xはフィルタ係数、γxは帯域幅拡張係数である。
【0026】
図5の破線は、フィルタ動作を省略し、摂動信号xp(k)が基準化偏差ベクトル成分よりなる実施形態を例示している。
【0027】
ある実施形態において、図3〜5の修正器30は、完全に音声復号化器内に設けられており(図9参照)、他の実施形態では、図3〜5の修正器は音声符号化器と音声復号化器との間に分散される(図9の破線参照)。修正器30が完全に復号化器内に設けられる実施形態では、図3に示した背景雑音パラメータは、復号化器においてそうしたものとして識別されなければならない。これは、伝送チャネルによって符号化器から受信される所定量(フレームおよびサブフレーム)のスペクトルおよびエネルギーパラメータを37でバッファすることによって実現できる。DTX方式では、復号化器で従来通りに得られる暗黙情報が、バッファ37が背景雑音に関係するパラメータだけを含んでいる時を決定するために使用できる。例えば、バッファ37がNフレームをバッファすることができ、(従来通り)DTXモードのために伝送が中断される前に音声セグメントの後にNフレームのハングオーバが使用される場合、DTXモードにスイッチされる前のそれらの最後のNフレームは、背景雑音のスペクトルおよびエネルギーパラメータだけを含んでいるとわかる。それらの背景雑音パラメータはその後、上述の通り修正器30によって使用できる。
【0028】
修正器30が符号化器と復号化器との間に分散される実施形態では、平均変動特性決定器51および係数計算器53は符号化器に設けることができる。従って、そのような実施形態の通信路52および54は、従来のコンフォートノイズパラメータを符号化器から復号化器に送信するために使用される従来の通信路と類似である(図1および2参照)。詳細には、図6の例に図示する通り、経路52および54は、量子化器(図1も参照)、通信チャネル(図1および2も参照)および逆量子化部(図2も参照)を経て、記憶装置55およびフィルタ57へそれぞれ進行する(図5も参照)。ARフィルタ係数と同様にスカラ値の量子化の公知の技法が、平均変動特性およびARフィルタ係数情報に関して使用できる。
【0029】
符号化器は、従来の手段によって、背景雑音のスペクトルおよびエネルギーパラメータが平均変動特性決定器51および係数計算器53による処理に使用可能な時を知る。それらの同じスペクトルおよびエネルギーパラメータが符号化器によって従来通りに使用され従来のコンフォートノイズパラメータを作成するからである。従来の符号化器は通常、多数のフレームについて平均エネルギーおよび平均スペクトルを計算し、それらの平均スペクトルおよびエネルギーパラメータは、コンフォートノイズパラメータとして復号化器に送られる。係数計算器53からのフィルタ係数および平均変動特性決定器51からの偏差ベクトルが、図6に例示する通り符号化器から伝送チャネルを経て復号化器に送信されなければならないので、修正器が符号化器と復号化器との間に分散された場合、余分な帯域幅が必要になる。対照的に、修正器が完全に復号化器に設けられた場合には、いかなる余分な帯域幅もその実施に必要とされない。
【0030】
図7は、図3〜5の修正器の実施形態により実行され得る上述の例示的動作を例示している。最初に71で、(例えば図3のバッファ37における)使用可能なスペクトルおよびエネルギーパラメータが、音声または背景雑音と関係するかどうかが判定される。使用可能なパラメータが背景雑音に関係する場合、平均変動特性および時間変動特性といった背景雑音の特性が73で推定される。その後75で、補間されたコンフォートノイズパラメータが背景雑音の推定特性に従って摂動される。75での摂動プロセスは、77で背景雑音が検出される限り続行される。77で音声活動が検出されれば、71で別の背景雑音パラメータの使用可能性が待機される。
【0031】
図8は、図7の推定ステップ73において実行され得る例示的動作を例示している。処理は、81において、前述のバッファされたNフレームに対応する、NフレームおよびkNサブフレームを考慮する。1実施形態において、N=8およびk=4である。N個の成分を有するスペクトル偏差のベクトルが83で得られ、kn個の成分を有するエネルギー偏差のベクトルが85で得られる。87で、それらの偏差ベクトルのうちの各々から1成分が(例えばランダムに)選択される。89で、フィルタ係数が計算され、選択されたベクトル成分が相応にフィルタリングされる。88で、フィルタリングされたベクトル成分は、図7のステップ75で使用される摂動信号を作成するために基準化される。図8の破線は、図5の破線の実施形態、すなわちフィルタリングが省略され、基準化偏差ベクトル成分が摂動パラメータとして使用される実施形態に対応する。
【0032】
図9は、図3〜8のコンフォートノイズパラメータ修正器の実施形態が実施できる例示的な音声通信システムを図示している。送信機XMTRは、伝送チャネル95を介して受信機RCVRの音声復号化器93と結合される音声符号化器91を備える。図9の送信機および受信機の一方または両方は、例えば無線電話、または無線通信システムの他の構成要素の一部とし得る。チャンネル95は、例えば無線通信チャンネルを含み得る。図9に例示するように、図3〜8の修正器の実施形態は復号化器内に実施されるか、または図5および6に関して上述した通り符号化器と復号化器との間に分散させることができる(破線参照)。
【0033】
上述の図3〜9の実施形態が、従来の音声コーデックにおいて、例えばソフトウェア、ハードウェア、または両方による適切な変更態様によって容易に実施できることは、当業者にとって明白であろう。
【0034】
上述した本発明は、(一部の実施形態ではいかなる付加的な帯域幅または電力コストも伴わず)背景雑音の自然さを改善する。それにより、音声コーデックにおける音声と非音声モードとの間のスイッチはよりシームレスになり、従って人間の耳にとってより受け入れられやすいものとなる。
【0035】
本発明の例示的な実施の形態を以上詳細に説明したが、それは、多様な実施の形態において実施できる本発明の範囲を限定するものではない。
【図面の簡単な説明】
【図1】 従来の音声符号化器におけるコンフォートノイズパラメータの作成を略示する。
【図2】 従来の音声復号化器におけるコンフォートノイズの作成を略示する。
【図3】 本発明に従ってコンフォートノイズを作成する際に使用するコンフォートノイズパラメータ修正器を例示する。
【図4】 図3の修正器の例示的な実施形態を図示する。
【図5】 図4の変動特性推定器の例示的な実施形態を図示する。図5Aは、図5のSELECT信号の例示的な制御を図示する。
【図6】 図3〜5の修正器の例示的な実施形態を図示しており、ここで図5の変動特性推定器は復号化器および符号化器においてそれぞれ部分的に設けられている。
【図7】 図3から6の修正器により実行できる例示的動作を図示する。
【図8】 図7の推定ステップの実例を図示する。
【図9】 図3から8の修正器の実施形態を実施できる音声通信システムを図示する。
Claims (31)
- 通信チャネル(95)から音声および雑音情報を受信する音声復号化器(93)においてコンフォートノイズを作成する方法であって、コンフォートノイズを作成するために音声復号化器(93)によって通常使用される複数のコンフォートノイズパラメータ値(33)を供給する過程を有し、
背景雑音パラメータ(37)の変動特性を示す変動特性情報(43)を取得する過程(73)と、
該変動特性情報に応答して、修正されたコンフォートノイズパラメータ値(35)を作成するためにコンフォートノイズパラメータ値(33)を修正する過程と(75,30)、
該修正されたコンフォートノイズパラメータ値(35)を使用してコンフォートノイズを作成(25)する過程とを有し、該変動特性情報は該背景雑音パラメータが、時間と平均値のうちの少なくとも1つに関してどのように変化するかを示すものであることを特徴とする方法。 - 背景雑音パラメータ(37)がスペクトルパラメータである請求項1記載の方法。
- 背景雑音パラメータ(37)がエネルギーパラメータである請求項1記載の方法。
- 前記取得する過程(73)が、背景雑音スペクトルパラメータおよび背景雑音エネルギーパラメータの変動特性を示す変動特性情報(43)を得ることを含む、請求項1記載の方法。
- 前記取得する過程(73)が、背景雑音パラメータ(37)の複数の値から背景雑音パラメータの平均値を計算すること(83,85)と、前記平均値を個々の背景雑音パラメータ値(37)から減算し(83,85)、複数の偏差値を作成することを含む、請求項1記載の方法。
- 前記取得する過程(73)が、背景雑音パラメータ(37)の複数の値から背景雑音パラメータの平均値を計算すること(83,85)と、前記平均値を個々の背景雑音パラメータ値(37)から減算し(83,85)、複数の偏差値を求め、該偏差値のうちの1個をランダムに選択(87)し、ランダムに選択した偏差値を倍率により基準化(88)し、基準化された偏差値を作成する過程を含み、前記修正する過程(75,30)が前記基準化された偏差値をコンフォートノイズパラメータ値(33)のうちの1個と結合し(75,45)1個の修正されたコンフォートノイズパラメータ値(35)を作成する過程を含む、請求項1記載の方法。
- 前記音声復号化器(93)が無線通信装置に備えられている請求項1記載の方法。
- 音声復号化器(93)が携帯電話に備えられている請求項7記載の方法。
- 前記取得する過程(73)が、前記音声復号化器(93)により、前記音声復号化器の中の修正器から変動特性情報(43)を得る過程を含み、通信チャネル(95)を介した変動特性の伝達のために余分の帯域幅を必要としない、請求項1記載の方法。
- 前記取得する過程(73)が、前記音声復号化器(93)により、通信チャネル(95)によって音声符号化器(91)から変動特性情報(43)を受信する過程を含む、請求項1記載の方法。
- 前記変動特性情報(43)が、背景雑音パラメータが背景雑音パラメータの平均値に対してどのように変化するかを示す平均変動特性情報を含む、請求項1記載の方法。
- 前記取得する過程(73)が、ある期間にわたる背景雑音パラメータの平均値を計算する(83,85)ために背景雑音パラメータの複数の値を使用することと、前記平均値を少なくとも数個の背景雑音パラメータ値と比較し背景雑音パラメータの平均除去された値を作成することを含む、請求項11記載の方法。
- 前記取得する過程(73)が、フィルタ係数(54)を計算する(89,53)ために背景雑音パラメータの複数の値を使用する過程と、前記フィルタ係数に従って少なくとも数個の背景雑音パラメータの平均除去された値をフィルタリングする過程(89,57)とを含む、請求項12記載の方法。
- 前記フィルタ係数(54)を計算する(89,53)ために背景雑音パラメータ(37)の複数の値を使用する過程が、自己回帰予測変数フィルタのフィルタ係数を計算することを含む、請求項13記載の方法。
- 前記変動特性情報(43)が、背景雑音パラメータ(37)がどのように経時的に変化するかを示す時間変動特性情報を含む、請求項11記載の方法。
- 前記変動特性情報(43)が、背景雑音パラメータ(37)がどのように経時的に変化するかを示す時間変動特性情報を含む、請求項1記載の方法。
- 通信チャネル(95)から音声および雑音情報を受信する音声復号化器(93)におけるコンフォートノイズの作成に使用される修正されたコンフォートノイズパラメータ(35)を作成する装置であって、コンフォートノイズを作成するために音声復号化器(93)によって通常使用される複数のコンフォートノイズパラメータ値(33)を供給する第1の入力(33)と、背景雑音パラメータ(37)を供給する第2の入力(31)と、
前記第1(33)および第2(31)の入力と結合されており、背景雑音パラメータ(37)の変動特性特性(43)に応答し、修正されたコンフォートノイズパラメータ値(35)を作成するためにコンフォートノイズパラメータ値(33)を修正する修正器(30)と、
前記修正器(30)と結合されており、コンフォートノイズの作成に使用される前記修正されたコンフォートノイズパラメータ値(35)を供給する出力部(35)とを具備し、背景雑音パラメータの変動特性は、少なくとも時間と平均値に関して背景雑音パラメータがどのように変化するかを示すことを特徴とする装置。 - 背景雑音パラメータ(37)がスペクトルパラメータである請求項17記載の装置。
- 背景雑音パラメータ(37)がエネルギーパラメータである請求項17記載の装置。
- 前記修正器(30)が、前記第2の入力(31)と結合され、背景雑音パラメータ(37)に応答し、前記変動特性特性(43)を作成する変動特性推定器(41)を備える請求項17記載の装置。
- 前記変動特性推定器(41)が、背景雑音パラメータ(37)が背景雑音パラメータの平均値に対してどのように変化するかを示す平均変動特性情報を作成する平均変動特性決定器(51)を含む、請求項20記載の装置。
- 前記平均変動特性決定器(51)が音声復号化器(93)に備えられている請求項21記載の装置。
- 前記平均変動特性決定器(51)が、通信チャネル(95)によって音声復号化器(93)と通信するように動作可能である音声符号化器(91)に備えられている請求項21記載の装置。
- 前記平均変動特性決定器(51)が、ある期間にわたる背景雑音パラメータの平均値を計算するために背景雑音パラメータ(37)の複数の値に応答し、前記平均値を少なくとも数個の背景雑音パラメータ値(37)と比較し背景雑音パラメータの平均除去された値を作成するように動作可能である請求項21記載の装置。
- 前記変動特性特性(43)が、背景雑音パラメータ(37)がどのように経時的に変化するかを示す時間変動特性情報を含む、請求項24記載の装置。
- 前記変動特性推定器(41)が、背景雑音パラメータ(37)の複数の値に応答してフィルタ係数(54)を計算するための係数計算器(53)を備え、前記時間変動特性情報は前記フィルタ係数を含むものである、請求項25記載の装置。
- 前記フィルタ係数(54)が自己回帰予測変数フィルタのフィルタ係数である請求項26記載の装置。
- 前記係数計算器(53)と結合されそれから前記フィルタ係数(54)を受信し、かつ、前記平均変動特性決定器(51)と結合され、前記フィルタ係数に従って少なくとも数個の平均除去された背景雑音パラメータ値(x(k))をフィルタリングするフィルタ(57)を備える、請求項26記載の装置。
- 前記係数計算器(53)が音声復号化器(93)に備えられている請求項26記載の装置。
- 前記係数計算器(53)が、通信チャネル(95)によって音声復号化器(93)との通信に動作可能である音声符号化器(91)に備えられている請求項26記載の装置。
- 前記変動特性特性(43)が、背景雑音パラメータ(37)がどのように経時的に変化するかを示す時間変動特性情報を含む、請求項20記載の装置。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10955598P | 1998-11-23 | 1998-11-23 | |
US60/109,555 | 1998-11-23 | ||
US09/391,768 | 1999-09-08 | ||
US09/391,768 US7124079B1 (en) | 1998-11-23 | 1999-09-08 | Speech coding with comfort noise variability feature for increased fidelity |
PCT/SE1999/002023 WO2000031719A2 (en) | 1998-11-23 | 1999-11-08 | Speech coding with comfort noise variability feature for increased fidelity |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003529950A JP2003529950A (ja) | 2003-10-07 |
JP4659216B2 true JP4659216B2 (ja) | 2011-03-30 |
Family
ID=26807080
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000584461A Expired - Lifetime JP4659216B2 (ja) | 1998-11-23 | 1999-11-08 | 忠実度改善のためのコンフォートノイズ変動特性に基づく音声符号化 |
Country Status (12)
Country | Link |
---|---|
US (1) | US7124079B1 (ja) |
EP (1) | EP1145222B1 (ja) |
JP (1) | JP4659216B2 (ja) |
KR (1) | KR100675126B1 (ja) |
CN (1) | CN1183512C (ja) |
AR (1) | AR028468A1 (ja) |
AU (1) | AU760447B2 (ja) |
BR (1) | BR9915577A (ja) |
CA (1) | CA2349944C (ja) |
DE (1) | DE69917677T2 (ja) |
TW (1) | TW469423B (ja) |
WO (1) | WO2000031719A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10692509B2 (en) | 2013-05-30 | 2020-06-23 | Huawei Technologies Co., Ltd. | Signal encoding of comfort noise according to deviation degree of silence signal |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
US20070110042A1 (en) * | 1999-12-09 | 2007-05-17 | Henry Li | Voice and data exchange over a packet based network |
US6662155B2 (en) * | 2000-11-27 | 2003-12-09 | Nokia Corporation | Method and system for comfort noise generation in speech communication |
US20030120484A1 (en) * | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
US7305340B1 (en) * | 2002-06-05 | 2007-12-04 | At&T Corp. | System and method for configuring voice synthesis |
DE60210437D1 (de) * | 2002-07-02 | 2006-05-18 | Teltronic S A U | Verfahren zur Synthese von Komfortgeräusch-Rahmen |
FR2861247B1 (fr) | 2003-10-21 | 2006-01-27 | Cit Alcatel | Terminal de telephonie a gestion de la qualite de restituton vocale pendant la reception |
DE102004063290A1 (de) * | 2004-12-29 | 2006-07-13 | Siemens Ag | Verfahren zur Anpassung von Comfort Noise Generation Parametern |
FR2881867A1 (fr) * | 2005-02-04 | 2006-08-11 | France Telecom | Procede de transmission de marques de fin de parole dans un systeme de reconnaissance de la parole |
US8874437B2 (en) * | 2005-03-28 | 2014-10-28 | Tellabs Operations, Inc. | Method and apparatus for modifying an encoded signal for voice quality enhancement |
PL1897085T3 (pl) * | 2005-06-18 | 2017-10-31 | Nokia Technologies Oy | System i sposób adaptacyjnej transmisji parametrów szumu łagodzącego w czasie nieciągłej transmisji mowy |
US20070038443A1 (en) * | 2005-08-15 | 2007-02-15 | Broadcom Corporation | User-selectable music-on-hold for a communications device |
US7610197B2 (en) * | 2005-08-31 | 2009-10-27 | Motorola, Inc. | Method and apparatus for comfort noise generation in speech communication systems |
CN101246688B (zh) * | 2007-02-14 | 2011-01-12 | 华为技术有限公司 | 一种对背景噪声信号进行编解码的方法、系统和装置 |
WO2008108721A1 (en) * | 2007-03-05 | 2008-09-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and arrangement for controlling smoothing of stationary background noise |
GB2454470B (en) * | 2007-11-07 | 2011-03-23 | Red Lion 49 Ltd | Controlling an audio signal |
US20090154718A1 (en) * | 2007-12-14 | 2009-06-18 | Page Steven R | Method and apparatus for suppressor backfill |
DE102008009719A1 (de) * | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen |
US8290141B2 (en) * | 2008-04-18 | 2012-10-16 | Freescale Semiconductor, Inc. | Techniques for comfort noise generation in a communication system |
CN102089808B (zh) * | 2008-07-11 | 2014-02-12 | 弗劳恩霍夫应用研究促进协会 | 音频编码器、音频解码器、用于编码及解码音频信号的方法 |
MX2013009305A (es) * | 2011-02-14 | 2013-10-03 | Fraunhofer Ges Forschung | Generacion de ruido en codecs de audio. |
JP5849106B2 (ja) | 2011-02-14 | 2016-01-27 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 低遅延の統合されたスピーチ及びオーディオ符号化におけるエラー隠しのための装置及び方法 |
TWI480857B (zh) | 2011-02-14 | 2015-04-11 | Fraunhofer Ges Forschung | 在不活動階段期間利用雜訊合成之音訊編解碼器 |
TWI488176B (zh) | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 音訊信號音軌脈衝位置之編碼與解碼技術 |
SG185519A1 (en) | 2011-02-14 | 2012-12-28 | Fraunhofer Ges Forschung | Information signal representation using lapped transform |
RU2560788C2 (ru) | 2011-02-14 | 2015-08-20 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для обработки декодированного аудиосигнала в спектральной области |
CN105304090B (zh) | 2011-02-14 | 2019-04-09 | 弗劳恩霍夫应用研究促进协会 | 使用对齐的前瞻部分将音频信号编码及解码的装置与方法 |
JP5625126B2 (ja) | 2011-02-14 | 2014-11-12 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム |
PT2676270T (pt) | 2011-02-14 | 2017-05-02 | Fraunhofer Ges Forschung | Codificação de uma parte de um sinal de áudio utilizando uma deteção de transiente e um resultado de qualidade |
JP5800915B2 (ja) | 2011-02-14 | 2015-10-28 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | オーディオ信号のトラックのパルス位置の符号化および復号化 |
US20140278393A1 (en) | 2013-03-12 | 2014-09-18 | Motorola Mobility Llc | Apparatus and Method for Power Efficient Signal Conditioning for a Voice Recognition System |
US20140270249A1 (en) | 2013-03-12 | 2014-09-18 | Motorola Mobility Llc | Method and Apparatus for Estimating Variability of Background Noise for Noise Suppression |
DK3217399T3 (en) * | 2016-03-11 | 2019-02-25 | Gn Hearing As | Kalman filtering based speech enhancement using a codebook based approach |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06242796A (ja) * | 1992-11-27 | 1994-09-02 | Nec Corp | 音声符号化装置 |
JPH10190498A (ja) * | 1996-11-15 | 1998-07-21 | Nokia Mobile Phones Ltd | 不連続伝送中に快適雑音を発生させる改善された方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5630016A (en) | 1992-05-28 | 1997-05-13 | Hughes Electronics | Comfort noise generation for digital communication systems |
US5485522A (en) * | 1993-09-29 | 1996-01-16 | Ericsson Ge Mobile Communications, Inc. | System for adaptively reducing noise in speech signals |
SE501981C2 (sv) * | 1993-11-02 | 1995-07-03 | Ericsson Telefon Ab L M | Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler |
US5657422A (en) | 1994-01-28 | 1997-08-12 | Lucent Technologies Inc. | Voice activity detection driven noise remediator |
US5794199A (en) * | 1996-01-29 | 1998-08-11 | Texas Instruments Incorporated | Method and system for improved discontinuous speech transmission |
US5960389A (en) | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
US5893056A (en) | 1997-04-17 | 1999-04-06 | Northern Telecom Limited | Methods and apparatus for generating noise signals from speech signals |
-
1999
- 1999-09-08 US US09/391,768 patent/US7124079B1/en not_active Expired - Lifetime
- 1999-11-06 TW TW088119423A patent/TW469423B/zh not_active IP Right Cessation
- 1999-11-08 BR BR9915577-0A patent/BR9915577A/pt not_active IP Right Cessation
- 1999-11-08 KR KR1020017006293A patent/KR100675126B1/ko active IP Right Grant
- 1999-11-08 DE DE69917677T patent/DE69917677T2/de not_active Expired - Lifetime
- 1999-11-08 WO PCT/SE1999/002023 patent/WO2000031719A2/en active IP Right Grant
- 1999-11-08 CN CNB998136204A patent/CN1183512C/zh not_active Expired - Lifetime
- 1999-11-08 CA CA002349944A patent/CA2349944C/en not_active Expired - Lifetime
- 1999-11-08 AU AU15911/00A patent/AU760447B2/en not_active Expired
- 1999-11-08 JP JP2000584461A patent/JP4659216B2/ja not_active Expired - Lifetime
- 1999-11-08 EP EP99958572A patent/EP1145222B1/en not_active Expired - Lifetime
- 1999-11-23 AR ARP990105964A patent/AR028468A1/es active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06242796A (ja) * | 1992-11-27 | 1994-09-02 | Nec Corp | 音声符号化装置 |
JPH10190498A (ja) * | 1996-11-15 | 1998-07-21 | Nokia Mobile Phones Ltd | 不連続伝送中に快適雑音を発生させる改善された方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10692509B2 (en) | 2013-05-30 | 2020-06-23 | Huawei Technologies Co., Ltd. | Signal encoding of comfort noise according to deviation degree of silence signal |
Also Published As
Publication number | Publication date |
---|---|
US7124079B1 (en) | 2006-10-17 |
WO2000031719A3 (en) | 2003-03-20 |
JP2003529950A (ja) | 2003-10-07 |
CN1183512C (zh) | 2005-01-05 |
AU760447B2 (en) | 2003-05-15 |
CN1354872A (zh) | 2002-06-19 |
EP1145222A2 (en) | 2001-10-17 |
AR028468A1 (es) | 2003-05-14 |
DE69917677D1 (de) | 2004-07-01 |
KR20010080497A (ko) | 2001-08-22 |
AU1591100A (en) | 2000-06-13 |
EP1145222A3 (en) | 2003-05-14 |
DE69917677T2 (de) | 2005-06-02 |
KR100675126B1 (ko) | 2007-01-26 |
CA2349944A1 (en) | 2000-06-02 |
EP1145222B1 (en) | 2004-05-26 |
BR9915577A (pt) | 2001-11-13 |
CA2349944C (en) | 2010-01-12 |
TW469423B (en) | 2001-12-21 |
WO2000031719A2 (en) | 2000-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4659216B2 (ja) | 忠実度改善のためのコンフォートノイズ変動特性に基づく音声符号化 | |
US10573327B2 (en) | Method and system using a long-term correlation difference between left and right channels for time domain down mixing a stereo sound signal into primary and secondary channels | |
AU763409B2 (en) | Complex signal activity detection for improved speech/noise classification of an audio signal | |
US6615169B1 (en) | High frequency enhancement layer coding in wideband speech codec | |
JP2004525540A (ja) | 音声通信中に快適ノイズを発生するための方法およびシステム | |
JP4438127B2 (ja) | 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体 | |
JP2003501925A (ja) | パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置 | |
US6424942B1 (en) | Methods and arrangements in a telecommunications system | |
JP2016500453A (ja) | 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加 | |
JP2003504669A (ja) | 符号化領域雑音制御 | |
JP4309060B2 (ja) | 背景雑音の再生成を伴う音声符号化 | |
RU2237296C2 (ru) | Кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения | |
US20050071154A1 (en) | Method and apparatus for estimating noise in speech signals | |
JP2541484B2 (ja) | 音声符号化装置 | |
JPH07210199A (ja) | 音声符号化方法および音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080624 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080924 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090908 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20091201 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20091208 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100305 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101130 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101227 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140107 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4659216 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |