JP2003501925A - パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置 - Google Patents

パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置

Info

Publication number
JP2003501925A
JP2003501925A JP2001502113A JP2001502113A JP2003501925A JP 2003501925 A JP2003501925 A JP 2003501925A JP 2001502113 A JP2001502113 A JP 2001502113A JP 2001502113 A JP2001502113 A JP 2001502113A JP 2003501925 A JP2003501925 A JP 2003501925A
Authority
JP
Japan
Prior art keywords
noise
encoder
receiver
comfort noise
modeling parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001502113A
Other languages
English (en)
Inventor
フィリップ, マーク ジョンソン,
レランド, スコット ブローバウム,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ericsson Inc
Original Assignee
Ericsson Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ericsson Inc filed Critical Ericsson Inc
Publication of JP2003501925A publication Critical patent/JP2003501925A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Transmitters (AREA)
  • Circuits Of Receivers In General (AREA)

Abstract

(57)【要約】 ノイズ又は情報信号を特徴付けし、その後その特徴を信号の再構成に用いる方法及び装置において、信号のパラメトリックモデルがそのモデルのパラメータに関連する少なくとも1つの高次統計値によって補われる。例えば、DTX通信において、送信機背景ノイズが、推定平均スペクトル振幅の連続フレームであって、その各々に推定平均スペクトル振幅に対する推定標準偏差が添付された連続するフレームによって特徴付けされる。再構成時、推定標準偏差がスペクトル振幅の無作為化及びこの無作為化による再構成ノイズの音質向上に用いられる。再構成されたノイズの品質は平均スペクトル振幅を伝送前及び/又は受信時に平均化、平滑化又は他のフィルタリングを行うことにより更に向上する。

Description

【発明の詳細な説明】
【0001】 (発明が属する技術分野) 本発明は通信システムに関し、特に、通信システムにおけるコンフォートノイ
ズの生成に関する。
【0002】 (背景技術) ディジタル無線通信システム(例えば、セルラ電話システム、陸上移動無線シ
ステム、衛星電話システム、航空電話システム等を含む)において、無線が発生
する低音量の音声ノイズの受信が必要となることがある。例えば、ディジタル無
線通話中、無線受信機が一時的に無線送信機から有意な音声情報を受信しない期
間が存在しうる。そのような期間において、無線受信機のユーザが誤って通話が
切断されたものと思わないよう、受信無線機が音声ノイズを生成することが望ま
しい。このようなノイズを当技術分野及び本明細書においてコンフォートノイズ
と呼ぶ。
【0003】 コンフォートノイズの生成が特に有利である少なくとも2つの基本的な理由が
存在する。まず1つは、通信リンクの品質が非常に悪化したが、依然として動作
可能である場合、ひどく歪んだ音声が受信無線機のユーザに伝達されないよう、
受信無線機における音声パスをミュートすることが好ましい場合がある。しかし
、受信機のスピーカを完全にミュートすると、リンクが完全に動作不能であり、
復帰の可能性がないものと受信機ユーザが誤って判断しかねないため、代わりに
無線受信機がコンフォートノイズを生成、再生することが可能である。そうすれ
ば、一般に質の悪い音声に付随する大きなポップノイズ及びアーチファクト無し
に、受信機が依然として動作可能であることを受信機ユーザに伝えることができ
る。
【0004】 コンフォートノイズはまた、間欠伝送(又はDTX:Discontinuous Transmis
sion)通信システムにおいて非常に有益である。DTXシステムでは、送信機が
出力信号に音声が含まれるか否かを検出し、出力信号が音声を含まない場合には
伝送を中断又は伝送レートを削減する。このようなDTX期間中、受信機ユーザ
が受信機と送信機との間の通信パスが依然として継続中かつ動作可能であること
を認識できるよう、受信機が何らかの形式のコンフォートノイズを再生すること
が望ましい。
【0005】 これら2つの場合のいずれにおいても、受信機で生成されるコンフォートノイ
ズは、送信機で存在する背景ノイズとできる限り合致することが一般に好ましい
。換言すれば、コンフォートノイズの生成プロセスは受信機ユーザに対してトラ
ンスペアレントであるべきである。このような目的で、送信機に存在する背景ノ
イズをサンプリングし、サンプリングしたノイズの特性を表す1つ又は複数のパ
ラメータを周期的に受信機へ伝送して、受信機での合致したコンフォートノイズ
生成に用いることが可能である。しかしながら、従来技術においては、本来発生
している背景ノイズと、生成されたコンフォートノイズとの間には知覚できる差
異が依然として存在していた。よって、通信システムにおける更に改良されたコ
ンフォートノイズの生成方法及び装置が求められている。
【0006】 (発明の概要) 本発明は高品質で自然な音感のコンフォートノイズを実現するため、ノイズモ
デルそのものに関し、パラメトリック背景ノイズモデルに関する1つ又はさらに
高い次元の統計値を用いる技術を提供することにより、上述した要求及び他の要
求を満たす。従来のシステムが周期的に推定したノイズモデリングパラメータの
みに基づいてコンフォートノイズを生成するのに対し、本発明の実施形態におい
ては更に正確で良好な音質のコンフォートノイズが生成できるよう、ノイズモデ
リングパラメータを好適な統計値で補う。さらに、本発明によれば、得られるコ
ンフォートノイズの音質を更に向上するため、ノイズモデリングパラメータの平
均化、平滑化又は他のフィルタリング処理を、通信リンクの送信側及び/又は受
信側で行うことが可能である。
【0007】 代表的な実施形態において、DTX送信機で複数の背景ノイズスペクトル振幅
の平均値が周期的に推定され、これもまたDTX送信機で推定される1つの標準
偏差値とともにDTX受信機へ送信される。DTX受信機において、周期的に受
信する平均スペクトル振幅が複数のDTXフレームをまたがって平滑化され、平
滑化された値が受信した標準偏差を用いてディザリングされる。ディザリングさ
れた平均値はDTX受信機におけるコンフォートノイズの生成に用いられる。
【0008】 瞬時スペクトル振幅ではなく平均スペクトル振幅を送信することによって、代
表的な実施形態は送信機におけるスペクトルの不規則性が受信機において急峻な
スペクトル変動を生成することを回避している。加えて、受信機において受信し
た平均値を複数のフレームに渡って平滑することで、コンフォートノイズの更新
が比較的頻繁でないことから生じうる、急峻で、しばしば認知できるスペクトル
遷移を削減する。さらに、推定された標準偏差を平滑化された平均値のディザリ
ングに用いることで、コンフォートノイズ特性がフレーム毎に微妙に変化し、よ
り無作為なスペクトルを実現する。その結果、より自然な音質のコンフォートノ
イズが得られる。
【0009】 本発明による代表的な無線送信機は入力ノイズ信号をサンプリングし、出力と
してサンプリングされたノイズ信号のパラメトリックノイズモデルであり、少な
くとも1つのサンプルされたノイズ信号を表す少なくとも1つのモデリングパラ
メータを含むパラメトリックノイズモデルを供給するように構成された符号化器
を含む。符号化器はまた出力として、少なくとも1つのモデリングパラメータに
関する統計値であって、各モデリングパラメータの次元よりも大きな次元を有す
る統計値を供給する。符号化器は例えば、マルチバンド駆動符号化器(multi-ban
d excitation coder)、準同型符号化器(homomorphic encoder)又は正弦変換符号
化器(sinusoidal transform coder)でよい。加えて、パラメトリックモデルは複
数の推定平均スペクトル振幅及び、推定平均スペクトル振幅に対する推定標準偏
差値でよい統計値を含むことが可能である。信号の再構成を向上するため、符号
化器は少なくとも1つのモデリングパラメータ及び統計値を周期的に更新及びフ
ィルタリングすることが可能である。統計値の次元は各ノイズパラメータの次元
よりも大きく、コンフォートノイズ生成器は、無線受信機のユーザにコンフォー
トノイズを供給するため、少なくとも1つのノイズモデリングパラメータ及び統
計値を復号化する。各ノイズモデリングパラメータは、例えば、推定平均スペク
トル振幅であって良く、また統計値は少なくとも1つの推定平均スペクトル振幅
に対する推定標準偏差値であって良い。加えて、コンフォートノイズ生成器は少
なくとも1つのノイズモデリングパラメータ及び推定値の更新を周期的に受信及
びフィルタすることが可能である。さらに、コンフォートノイズ生成器はフィル
タリングされた少なくとも1つのノイズモデリングパラメータの更新を、コンフ
ォートノイズを供給するため統計値に従って処理することが可能である。例えば
、コンフォートノイズ生成器は推定標準偏差値を受信した平均スペクトル振幅の
フィルタリングされた更新のディザリングに用いることが可能である。
【0010】 以下、本発明の上述した、またそれ以外の機能及び利点を図示した実施形態例
を参照して説明する。本技術分野の当業者は説明される実施形態が説明を目的と
して供され、多数の等価実施形態が予期されることを理解するであろう。
【0011】 (発明の詳細な説明) 以下、間欠伝送(DTX)通信システムに関し本発明の典型的な実施形態を説
明する。DTXは例えば周知のPDC(Pacific Digital Cellular)、D−AMP
S(Digital Advanced Mobile Phone System:IS641Aを含む)、GMS(Global S
ystem for Mobile Communications)、及びACeS(Asian Cellular Satellite)
規格で用いられている。公に入手可能なこれら規格の仕様には各規格に特有なD
TXの利用法の詳細が示されている。
【0012】 DTXと関連して、本発明の典型的な実施形態はまた、マサチューセッツ工科
大学で最初に開発されたマルチバンド駆動(MBE:登録商標)音声符号化アル
ゴリズムに関して説明される。MBEアルゴリズム(及び、より最近ではその後
継アルゴリズムであるIMBE及びAMBE(いずれも登録商標))は低ビット
レート(すなわち、4.8kbps未満)を必要とするディジタル通信システム
においては非常にポピュラーである。例えば、衛星電話通信の分野にお周知のイ
リジウム、インマルサットM、インマルサット ミニ−M、ICO(インマルサ
ット−P)、Optus及びACeSシステムの各々にいて、何らかの形のMB
Eが用いられている。MBEベースのアルゴリズムはまた陸上移動無線(例えば
APCO−25)及び航空分野においても用いられている。MBEアルゴリズム
の詳細な説明については、例えば、B.S. Atal等による”Advances in Speech Co
ding”(Kluwer Academic Publishers 1991)、A.M.Kondozによる”Digital Speec
h:Coding for Low Bit Rate Systems”(Wiley & Sons 1994)及び国際公開特許第
WO94/12972号(1994/06)、調和振幅の量子化方法及び装置(M
ethod and Apparatus for Quantization of Harmonic Amplitudes)を参照された
い。
【0013】 典型的な実施形態はDTX及びMBEに関して明らかに有用であるが、本技術
分野の当業者は本発明のある観点は他の通信及びディジタル信号処理用途に等し
く利用可能であることを理解するであろう。例えば、開示される、信号の特性を
記述又はモデリングする方法及びその後信号の生成又はシミュレートに用いるモ
デルパラメータは、DTXシステム内部でのコンフォートノイズ供給のみならず
、任意の信号の記録及び/又は再生にも利用可能である。さらに、開示されるパ
ラメトリック及び統計的信号モデリング技術は周波数領域MBE音声符号化アル
ゴリズムだけでなく、任意の信号符号化アルゴリズムに対して容易に適用可能で
ある。例えば、開示される技術は(準同型ボコーダ及び正弦変換符号化器に用い
られるような)他の周波数領域アルゴリズム及び(周知の符号駆動線形予測符号
化(CELP)アルゴリズム及びVCELPアルゴリズムのような)時間領域ア
ルゴリズムに直接適用可能である。
【0014】 本発明の典型的な実施形態に戻って、図1及び図2は、DTX送信機100及
び互換性のあるDTX受信機200をそれぞれ示す。図1に示すように、典型的
なDTX送信機100は音声有無検出器(VAD)110、音声符号化器120
、無音記述(silence description)符号化器(SID)130、チャネル符号化
器140及び、第1及び第2の送信スイッチ150、155を含む。図2におい
て、典型的なDTX受信機200は、チャネル復号化器210、フレーム検証プ
ロセッサ220、音声フレームバッファ230、コンフォートノイズフレームバ
ッファ240、音声復号化器250及び受信スイッチ260を含む。本技術分野
の当業者は以下に説明する図1及び図2の要素の機能を様々なハードウェア構成
、例えば汎用ディジタルコンピュータ、標準ディジタル信号処理部品、及び1つ
又は複数のASICを用いて実施可能であることを理解するであろう。
【0015】 動作中、(例えば、ユーザ音声信号の連続するPCMサンプルの集まりである
)音声フレームがDTX送信機100の音声有無検出器110、音声符号化器1
20及びSID符号化器130に供給される。音声有無検出器110はその音声
フレームを分析し、そのフレームが音声情報を含むか否かを判定する。音声情報
を含む場合、第1の送信スイッチ150が音声符号化器120の出力とチャネル
符号化器140の入力とを接続するように設定され、音声符号化器120は音声
フレームを(以下に説明する技術を用いて)チャネル符号化器140に入力する
ための符号化を指示される。さもなくば、送信スイッチ150はSID符号化器
130の出力をチャネル符号化器140の入力に接続するように設定され、SI
D符号化器130はSIDフレームを(これもまた以下に説明する技術を用いて
)チャネル符号化器140へ入力するため符号化するように指示される。実際に
は、音声符号化器120及びSID符号化器130の動作は1つの符号化装置に
まとめることができる。
【0016】 音声符号化器120からの音声フレーム又はSID符号化器130からのSI
Dフレームを受信すると、チャネル符号化器140は通信チャネル(例えばエア
インタフェース)上で伝送するためのフレームを準備するため、周知のチャネル
符号化方法を用いる。音声信号が音声を含む期間中、第2の送信スイッチは依然
として閉じたままであり、連続する音声フレームは符号化及び伝送される。しか
し、音声有無検出器110が会話の中断を判定した場合には、限られた数(一般
に1つ又は2つ)のSIDフレームが符号化及び伝送される。その後、音声有無
検出器110が会話の再開を示すまで、SID更新フレームが周期的(例えば、
250ミリ秒から1秒毎に)符号化及び伝送される。その際、音声符号化器12
0は音声が再び中断するまで音声信号フレームを生成することを確認する。
【0017】 受信機200において、チャネル復号化器210は入来フレーム(すなわち、
チャネル復号化器210はチャネル符号化器140によって実施される符号化プ
ロセスの逆を実施する)を受信及び復号化し、復号化したフレームを検証プロセ
ッサ220、音声フレームバッファ230及びコンフォートノイズフレームバッ
ファ240へ供給する。DTX期間中、大部分の受信フレームは無効であり、従
ってRF干渉及び受信機雑音によって生成されたランダムデータで満たされてい
る。しかし、場合によっては有効なSID更新フレームがDTX中に送信され、
また有効な音声フレームの伝送はいつでも再開可能である。
【0018】 この曖昧さを処理するため、検証プロセッサ220は各受信フレームの内容に
ついて分析する。受信フレームが無効であれば、受信スイッチ260はコンフォ
ートノイズフレームバッファ240を音声復号化器250の入力へ接続するよう
に設定され、コンフォートノイズフレームバッファ240はノイズフレームをコ
ンフォートノイズ生成のために音声復号化器250へ供給するように指示される
。受信フレームが有効なSID更新の場合、受信フレームはノイズフレームがコ
ンフォートノイズ生成用に音声復号化器250へ供給される前に、コンフォート
ノイズフレームバッファ240の内容を更新するのに用いられる。最後に、受信
フレームが有効な音声フレームを表す場合には、受信スイッチ260が音声フレ
ームバッファ230を音声復号化器へ接続するように設定され、受信フレームは
受信機ユーザへの提示のため合成されるべく音声復号化器250へ送信される。
【0019】 図3は上述したDTX動作を説明する図である。図において、音声信号は無音
区間で分離される第1及び第2の音声バースト310、320を含む。第1の音
声バースト310の間、有効音声フレーム315が継続的に伝送される。しかし
、第1の音声バースト310の終了直後、かつ無音区間全体を通じて周期的に、
有効SIDフレーム330が音声フレームの代わりに伝送される。そして、第2
の音声バースト320の開始時、有効音声フレーム325が再び継続的に伝送さ
れる。
【0020】 このようなDTX動作は従来の連続伝送に対して重要な利点を提供し、従って
DTXは今日のディジタル無線システムにおける共通機能となっている。例えば
、DTXは頻繁な伝送を必要としないため、送信無線機の節電を可能とする。よ
り具体的には、送信電力増幅器(PA)が送信機電力の大半を消費するのが典型
的なので、DTXモードの間電力増幅器をOFFにすることで大幅な電力節約が
実現できる。加えて、DTXはエアインタフェーススペクトルに伝送されるRF
エネルギーを低減する。その結果、多元アクセスシステムにおいて他のユーザか
ら観測される平均RF干渉が削減され、これらユーザから見た搬送波対干渉(C
/I)比も同様に改善される。C/Iの増加は無線端末の性能を向上させ、逆に
言えばシステムの容量を増加させる(すなわち、所定の周波数割り当てにおいて
サポートできるユーザ数が増加する)。
【0021】 図1及び図2に関して説明したように、DTXシステムにおける音声信号はサ
ンプリングされ、(例えば、音声符号化器120によって)符号化され、その後
符号化された値は音声信号の合成又は再構成のために(例えば音声復号化器25
0によって)復号化される。符号化器及び復号化器の組み合わせはしばしば本技
術分野においてコーデック又はボコーダと呼ばれ、音声符号化及び復号化機能を
達成するためボコーダ内に任意の複数の周知技術を実装することができる。
【0022】 そのような技術は一般的に2種類のうちの1種類に分類することができる。す
なわち、波形符号化技術とパラメトリック符号化技術が存在する。波形ボコーダ
は音声信号それ自体の量子化及び符号化を試み、一方パラメトリックボコーダは
音声信号用のモデル(モデルは複数のパラメータから構成される)を仮定する。
典型的に、パラメトリックボコーダは音声信号のサンプルを受信し、サンプルを
フレームにグループ分けし、サンプルのフレームをモデルに合わせ、それからモ
デルパラメータのための値を量子化及び符号化する)。このようにして、パラメ
トリックボコーダは、波形ボコーダよりも低い情報(すなわち、ビット)レート
において所望の音声品質を生成することができる。
【0023】 ロバストで一般的なパラメトリックボコーダは上述したMBEボコーダである
。多くの音声符号化器と同様、MBE復号化器はサンプルされた音声信号を20
msのフレームに分割する。各音声フレームについて、MBEモデルパラメータ
のセットが計算される。モデルパラメータ(例えば、基本ピッチ周波数及び複数
の有声化判定)はフレームの知覚できる内容を記述し、従ってその後の、元の音
声信号と知覚的に似た合成音声信号の生成に使用できる。音声を含まないフレー
ム(例えば、DTX送信機でサンプルされた背景ノイズのみを含むフレーム)に
対しては、MBEモデルがスペクトル振幅のセットを生成し、それは(例えば、
DTX受信機におけるコンフォートノイズ合成等の)フレームの再生成に使用で
きる。
【0024】 従来のDTXシステムにおいて、最新のSID更新はDTX期間中、コンフォ
ートノイズを生成するために直接かつ繰り返し用いられる。換言すれば、合成の
ために最新のSIDフレーム(例えば、スペクトル振幅を有するMBEフレーム
)が何度も音声復号化器250へ送信される。その結果、DTX受信機は受信機
におけるコンフォートノイズ特性をSID更新を受信するたびに送信機での背景
ノイズの特性に強制的に合致させる。さらに、コンフォートノイズスペクトルは
SID更新を次に受信するまでの間固定される。このような従来技術には少なく
とも2つの大きな短所がある。
【0025】 まず、送信機における背景ノイズが一定の場合を考える。そして、当然ながら
平均ノイズスペクトルはずっと一定である。しかし、これはスペクトル変動につ
いて述べているのではない。実際のノイズ環境の大半において、瞬時スペクトル
値は連続的に変化し、平均値の周囲にランダム分布を形成する。聴取者はスペク
トル平均及びスペクトル変動の両方を知覚する。スペクトル平均が背景ノイズの
音の強さを示すのに対し、スペクトル変動はノイズの活性を示す。従来のコンフ
ォートノイズ生成方法は(例えば、コンフォートノイズ更新の間のMBEスペク
トル振幅を固定することで)平均スペクトルのみを説明するため、そのような方
法はしばしばDTX期間に生成されたコンフォートノイズと連続音声伝送期間中
に符号化された背景ノイズとの間の知覚的なミスマッチを引き起こす。
【0026】 次に、コンフォートノイズ更新を次に受信するまでの期間中、送信機の背景ノ
イズが一定でない場合を考える。このような場合、コンフォートノイズ更新を受
信した際に(例えば、MBEスペクトル振幅の優勢なセットがスペクトル振幅の
更新されたセットと置き換えられる場合等)、急峻な遷移が起こりうる。DTX
送信機において、背景ノイズの音量及び/又はスペクトル特性の変化は一般にい
くつかのフレームの期間をまたがって発生する。しかし、DTX受信機は比較的
少ないSID更新しか得られないため、そのような変化は受信機において非常に
唐突に反映され、従ってDTX機能のトランスペアレンシーを低下させると共に
受信機ユーザを知覚的に不快にさせるおそれがある。
【0027】 本発明は送信機背景ノイズの音量及び活性の両方を取得(capture)する方法及
び装置を提供する。より一般的には、本発明は所望の任意の信号の知覚可能な特
性を取得する技術を提供する。そのようにするため、信号のパラメトリックモデ
ル(例えば、送信機背景ノイズを表すMBEスペクトル振幅のセット)が、その
パラメトリックモデルに関する1つ又は複数次元高い統計値で補われる。例えば
、DTX伝送の場合、SIDフレームのMBEスペクトル振幅(平均ノイズスペ
クトルの粗い推定と考えることができる)が背景ノイズスペクトルの変動推定値
によって補完されてもよい。元の信号を再生成(例えばコンフォートノイズを生
成)するために、1又は複数次元高い統計値(例えば変動推定値)をモデルパラ
メータ(例えばスペクトル振幅)と併せて用いることによって、より正確で知覚
的に好ましい結果が達成される。さらに、本発明は、再構成された信号の更なる
向上のために、平滑化、平均化又は他のフィルタリングを行うことの可能なモデ
ルパラメータを開示する。そのようなフィルタリングはモデルパラメータが生成
される際(例えば、DTX伝送の前又は記憶媒体への記録前)、及び/又はパラ
メータが信号再構成に用いられる際(例えばDTX受信又は記憶媒体からの再生
時)に行うことが可能である。以下、上述したMBE音声符号化モデルを用いる
DTX伝送システムにおけるコンフォートノイズ生成に関し、一般性を損なうこ
となく、本発明の様々な機能及び長所を説明する。
【0028】 上述したように、DTX SIDフレームにおけるMBEスペクトル振幅は平
均ノイズスペクトルの粗い推定と考えることができる。しかし、本発明によれば
、連続するスペクトル振幅フレームをフィルタリングすることによって、平均ス
ペクトルの高品質な推定を得ることが可能である。例えば、各音声不活性期間の
開始時において、DTX音声有効性検出器(例えば図1の検出器110)は一般
に音声が不活性であることが明らかになる迄の期間待機する。待機期間(一般に
約4〜6フレーム続く)は本技術分野においてハングオーバ期間(hangover peri
od)として知られ、連続するフレームを平均する機会を提供する。換言すれば、
スペクトル手段のセットは、以下の式の通り、MBEスペクトル振幅をハングオ
ーバ期間内で平均化することによって算出することができる。
【0029】
【数1】
【0030】 ここで、Mi(k)は番号iのボコーダフレームの瞬時スペクトル振幅を、Pは
各フレーム内のスペクトル振幅数を、そしてNはハングオーバ期間におけるフレ
ーム数をそれぞれ表す。スペクトル手段はSIDフレーム更新として音声不活性
期間の開始時に送信されても良い。
【0031】 実際には、瞬時スペクトル振幅Miは対数尺度で定量化され、瞬時スペクトル
振幅に関わる全ての計算はこの得られた対数値を用いて実施される。しかし、ス
ペクトル振幅の量子化は本発明の理解においてさほど重要ではないため、そのよ
うな量子化処理の詳細な説明は簡潔さのために省略する。MBEモデルパラメー
タの量子化の詳細については、上に引用した国際公開公報WO9412972を
参照のこと。
【0032】 本発明によれば、各SIDフレーム更新が正確に送信機の優勢な背景ノイズの
特徴を示すよう、DTX期間中、平均推定値の精度向上(リファイン)がはから
れる。例えば、平均振幅の移動平均は以下のように算出できる。
【0033】
【数2】
【0034】 本技術分野の当業者はこれが各スペクトル振幅に適用される、αがフィルタ平
均係数又はメモリであるような一次自己回帰(AR)フィルタであることに気が
つくであろう。ARフィルタは平均値推定値の継続的な更新が得られるよう、ス
ペクトル振幅に対して適用される。ARプロセスは少ないメモリ資源で良好なフ
ィルタリングを提供するという利点を有する。さらに、ARフィルタの出力は必
要以上の遅延が発生しないよう、過去のフレームよりも現在のフレームを重く重
み付ける。経験的な検討の結果、α=1/16のフィルタメモリによって良好な
結果が得られる。
【0035】 代わりに、SID更新の間に発生する全てのスペクトル振幅を上述のように最
初のハングオーバ期間に関して平均化することも可能である。しかし、そのよう
にすると、上述したARフィルタによる方法に比較して計算がより複雑になり、
かつかなりの量のメモリを余計に必要とする。加えて、そのような連続的な平均
化は一次AR方法と比較してより顕著な遅延を生成する傾向がある。
【0036】 本発明によれば、MBEスペクトル振幅は高品質な平均値推定を提供するため
にフィルタリングされるだけでなく、ノイズスペクトルの分散推定によって補足
される。分散はスペクトル平均に関する瞬時スペクトル振幅の分布を定量化し、
従ってモデル化されたノイズの活性の指標を与える。数学的に、確率変数xの分
散は以下のように算出される σ2 x=E{(x−μx2
【0037】 ここで、E{}は期待値演算子であり、μx=E{x}はxの平均値である。
そして、xの標準偏差は分散の平方根として定義され、分散と同様xの活性に関
する情報を与える。
【0038】 典型的な実施形態において、1つの標準偏差パラメータが計算され、SIDフ
レーム内の全スペクトル振幅の特徴づけに用いられる。例えば、特定のSIDフ
レームiについての瞬時標準偏差は以下のように推定できる。
【0039】
【数3】
【0040】 ここで、Pは各フレーム内のスペクトル振幅の数、M(k)は瞬時スペクト
ル振幅、Mバー(k)は上述したとおりフィルタリング又は平均化されたスペ
クトル振幅推定値である。
【0041】 都合の良いことに、瞬時標準偏差推定はフィルタリングされたMBEスペクト
ル振幅とともにSIDフレームで伝送可能であり、受信機における高品質なコン
フォートノイズの生成(以下に説明する)に用いられる。代わりに、連続する瞬
時標準偏差推定をフィルタリング又は平滑化し、フィルタリングされた標準偏差
推定をフィルタリングされたスペクトル振幅とともに伝送しても良い。例えば、
瞬時標準偏差推定を以下のように一次ARプロセスを用いて平滑化することが可
能である。
【0042】
【数4】
【0043】 ここで、αはフレーム単位の更新係数又はフィルタメモリである。瞬時標準
偏差値のフィルタリングは普通でない、又は異常なスペクトル振幅サンプルの影
響を低減する。
【0044】 各DTX期間の開始時、第1の標準偏差推定を瞬時標準偏差値と等しく設定す
ることが可能である。代わりに、第1の推定を直前のDTX期間から最後のフィ
ルタリング推定と同一とすることもできる。加えて、前回の推定及び現在の瞬時
値との重み付けされた結合を第1推定の提供に用いることができる。
【0045】 典型的な実施形態によれば、更新係数αは固定されず、各フレームに対して
適合される。これは固定された更新係数が所定の場合において質の悪い分散推定
を与えうるという事実によるものである。例えば、送信機の背景ノイズが対象と
なる周波数の大半又は全部に渡って振幅が増加したと仮定する。換言すれば、雑
音が一定でないと仮定する。平均スペクトル振幅推定は実際のスペクトル振幅を
フィルタリングすることで得られ、実際のスペクトル振幅の変化はある遅延の後
推定平均スペクトル振幅中に表れる。例えば、実際のスペクトル振幅のボリュー
ム増加は一般に2,3フレームが通過するまでは平均スペクトル振幅推定には表
れない。
【0046】 この遅延期間において、実際のスペクトル振幅と推定された平均スペクトル振
幅との差は非常に重要となりうる。しかし、そのような差異は平均値推定器に起
因するもので、スペクトルの実際の無作為性によるものではない。差異は合計さ
れ、分散推定器へ入力されるため、固定更新係数が用いられる場合、分散推定は
人為的に誇張されても良い。従って、本発明によれば、更新係数はフレーム単位
で動的に適合される。そのようにするため、各フレームiに対する品質変数q を以下のように算出することが可能である。
【0047】
【数5】
【0048】 上に定義した品質変数はスペクトルの定常性(stationarity)を示す。全体的な
ボリューム変化が存在する限り、全ての振幅差(magunitude differences)は同一
の符号を有する傾向にあり、従って高い総和及び低い変数値qを導く。しかし
、スペクトルが全く静止している場合、一般的に正方向における振幅差と同じ数
の負方向への振幅差が存在し、従って低い総和及び高い変数値qが導かれる。
【0049】 そのため、品質因子qが高い場合、瞬時分散推定において確信を持つことが
可能であり、その瞬時推定を平滑化された標準偏差推定の更新に用いることは合
理的である。しかし、品質因子が低い場合、瞬時分散推定は不確実であり、その
瞬時推定を平滑化された推定の更新には用いないことが好ましい。この方法は下
式に従って品質ベクトルqによって制御される適応更新係数αを適用するこ
とで定量化される。 α=qα ここで、αは最大許容更新係数を表す定数(すなわち、qは0から1の範囲で
示されるためである)。経験的な検討により最大限度α=1/32 が品質の良い結果を示す。
【0050】 上述したように、平滑化された標準偏差推定は、DTX受信機におけるコンフ
ォートノイズ生成のためにSIDフレーム内で平均スペクトル振幅とともに伝送
される。もちろん、標準偏差推定よりもむしろ分散推定を平滑化して送信するこ
とも可能である。分散推定か標準偏差推定のいずれを用いるかは設計上の選択事
項である。
【0051】 独立した標準偏差(又は分散)推定をスペクトル振幅の各々について算出する
ことも可能であることにまた注意されたい。しかし、そうすると、多数の追加パ
ラメータを送信することになるであろう。さらに、注目するノイズ源の大半がそ
れらのスペクトルに渡って類似の分散を有する傾向があることが経験上示されて
いる。従って、大半の場合は1つの項で十分である。
【0052】 DTX受信機において、(典型的な実施形態によれば、48MBEフレーム毎
、又は960ms毎に送信される)SIDフレームは、生成されるべきコンフォ
ートノイズのスペクトルの基礎を形成する。上述の通り、各SIDフレームは推
定平均スペクトル振幅のセット及び1つの推定標準偏差又は分散を含んでいる。
本発明によれば、平均スペクトル振幅は標準偏差値に従って、音声復号化器(例
えば図2の復号化器250)に入力するための強化スペクトル振幅を提供するた
めに処理される。有利なことに、強化スペクトル振幅によって送信機における背
景ノイズと厳密に合致する合成コンフォートノイズが得られる。
【0053】 まず、更新から次の更新の間、平均スペクトル振幅をフィルタリングすること
より、SID更新における急峻なスペクトル変化を回避する。例えば、Mold
k)(上述の通りk=1からPまで)が前に受信したSIDフレームからの平均
スペクトル振幅を表し、Mnew(k)が今受信したSIDフレームからの平均ス
ペクトル振幅を表すものと仮定する。いきなりMold(k)からMnew(k)へ遷
移させずに、複数のNフレームに渡ってスペクトル振幅を遷移させる。例えば、
直線ランプ関数又は、多項式や指数関数を含む他の遷移関数を使用できる。典型
的な直線ランプ関数は以下のように与えられる。
【0054】
【数6】
【0055】 ランピングの後、更新された平均スペクトル振幅Mnew(k)が次のSIDフ
レーム更新を受信するまで用いられる。経験的な検討により、N=16とした複
数フレームの期間でランピング又は遷移を行うと良い結果が得られることが示さ
れている。
【0056】 コンフォートノイズ特性の固定度を抑制するため、標準偏差推定に基づく無作
為な因子をランピングされたスペクトル振幅の各々に加える。典型的な実施形態
によれば、加算される乱数は正規分布出力を有する疑似乱数発生器を用いて生成
される。疑似乱数は標準偏差推定に従って縮尺され、所与のフレームに対する無
作為化されたスペクトル振幅は Mrandomized(k)=Mramped(k)+σx(k) で与えられる。ここで、x(k)はvar(x)=1を有する正規分布疑似乱数
発生器の出力、σは送信機で算出され、SIDフレーム内で送信される標準偏差
推定である。
【0057】 ここで、標準偏差推定を送信機で算出し、受信機に送信しなくてもよいよう、
標準偏差σは受信機において固定することが可能であることに注意すべきである
。しかし、そうすると生成されたコンフォートノイズにおける活性量もまた固定
され、送信機において存在する背景ノイズの活性に追従できなくなるであろう。
しかし、このような実施形態でも、無作為な因子を全く含まない現在の方法より
は良好に動作するであろう。
【0058】 有利なことに、無作為化されたスペクトル振幅を品質の良いコンフォートノイ
ズ生成のために音声復号化器へ送信することも可能である。しかし、本発明によ
れば、無作為化されたスペクトル振幅を複数フレームに渡ってフィルタリングす
ることにより、コンフォートノイズ特性を更に改善することが可能である。ここ
で、上述した無作為なノイズのランピングされたスペクトル振幅への加算が、送
信機における背景ノイズ処理がフレーム間で独立又は無相関であると仮定してい
ることに注意すべきである。実際には、スペクトル振幅をそれらの平均値に関し
てディザリングする無作為性はフレーム間でいくらかの相関を有する。これは時
間領域における有色ノイズのスペクトル等価物である。本発明はこの現象を、以
下のように、無作為化されたスペクトル振幅を複数フレーム間で平滑化すること
によって補償する。
【0059】
【数7】
【0060】 本技術分野の当業者は、これを無作為化された各スペクトル振幅に対して適用
される一次ARフィルタとして認識可能であろう。ここで、βはフィルタ更新係
数又はメモリである。経験的な検討はβ=0.5の更新係数が良好な結果を得る
ことを示している。代替平滑方法(例えば、高次ARフィルタや移動平均フィル
タ)をまた実施することも可能である。
【0061】 図4は上述したコンフォートノイズ生成方法を示すフローチャート400であ
る。図4のステップは例えば、図2のDTX受信機200で実施することが可能
である。ステップ410で、有効なMBEフレームを受信したか否かが判定され
る。受信フレームが有効でなければ、コンフォートノイズフレーム(すなわち、
強化されたスペクトル振幅)が(前に受信したSID更新の一部に基づいて)ス
テップ420で算出され、ステップ430において、最終結果であるコンフォー
トノイズフレームが合成される。受信フレームが有効ならば、ステップ440に
おいて受信フレームが音声フレームであるか否かの判定がなされる。もしそうな
ら、ステップ430で音声フレームが合成される。さもなくば、受信フレームは
有効なVID更新であると仮定され、ステップ450においてそのように保存さ
れる。さらに、SID更新がステップ430で合成される。
【0062】 図5は本発明による典型的なコンフォートノイズフレーム生成器500を示す
図である。典型的な発生器を使用することが可能であり、例えば図4のコンフォ
ートノイズフレーム生成ステップ420を実施するため、典型的な発生器を使用
することが可能である。図示の通り、典型的な生成器500は旧コンフォートノ
イズフレームバッファ510と、新コンフォートノイズフレームバッファ520
と、疑似乱数発生器530と、遅延バッファ540と、第1から第5の乗算器5
50、552、554、556、558及び、第1及び第2の加算装置560、
562を含む。本技術分野における当業者は、以下に説明される図5の部品の機
能が様々なハードウェア構成、例えば汎用ディジタルコンピュータ、標準ディジ
タル信号処理部品、及び1つ又は複数のASIC(特定用途向け集積回路)を用
いて実施可能であることを理解するであろう。
【0063】 実際には、旧コンフォートノイズフレームバッファ510、新コンフォートノ
イズフレームバッファ520及び疑似乱数生成器530の出力が第1、第2及び
第3の乗算器550、552、554を介してそれぞれ重み付けされ、重み付け
された出力フレームが第1の加算装置560を介して合計される。従って、第1
の加算装置によって出力されるフレームは上述の通りランピング及び無作為化さ
れる。そして、ランピング及び無作為化されたフレームは、強化されたコンフォ
ートノイズを提供するため、第4及び第5の乗算器556、558、第2の加算
装置562及び遅延バッファ540を介してフィルタリングされる。図に示すよ
うに、強化されたコンフォートノイズフレーム(各々が強化されたスペクトル振
幅を含む)を音声復号化器250へ合成のために入力することが可能である。
【0064】 図6〜図11は従来技術によるコンフォートノイズ生成方法と比較して本発明
の利点を証明する。特に、図6はDTX送信機における標準的な背景ノイズに関
するスペクトル振幅の典型的なタイムシーケンス(すなわち連続したフレーム)
を示している。そして、図7は図6のスペクトル振幅を処理するために従来の方
法を用いて生成したコンフォートノイズフレームのタイムシーケンスを示す。ま
た、図8〜図11は同一のスペクトル振幅を、上述した本発明の実施形態を用い
て処理して生成したコンフォートノイズフレームのタイムシーケンスを示す。特
に、図8は図6のスペクトル振幅(例えばDTX送信機におけるにおけるスペク
トル振幅)の平滑化を示し、図9は(例えばDTX受信機での受信に応答して)
平滑化された図8のスペクトル振幅のランピングを示す。そして、図10はラン
ピングされた図9のスペクトル振幅の無作為化を、また図11では乱数化された
図10のスペクトル振幅に対する最終フィルタリング及び強化を示している。好
都合なことに、図11のスペクトル特性が、図7と比較して明らかにより似通っ
ていることは明らかである。
【0065】 一般に、本発明はノイズ又は他の信号に対する特性付けの改良された方法及び
装置を提供し、その後信号を再構成するために特性を用いる。本発明によれば、
信号のパラメータモデルが、モデルのパラメータに関する、少なくとも1つのよ
り高次元の統計により補償される。DTX通信において、送信機背景ノイズが連
続する推定平均スペクトル振幅の連続するフレームによって特徴づけられ、個々
のフレームには1つの推定標準偏差値が付随する。再構成時、推定標準偏差値は
推定平均スペクトル振幅を無作為化するために用いられ、それによって再構成さ
れたノイズの音質を向上させる。再構成されたノイズの品質は、伝送前及び/又
は受信時にスペクトル振幅を平均化、平滑化又は他のフィルタリングすることで
さらに強化される。都合の良いことに、再構成された雑音のスペクトル特性は、
元のスペクトル特性と非常によく似ている。
【0066】 本技術分野の当業者は本発明が説明を目的としてここで述べられた特定の典型
的な実施形態に対して限定されず、また多くの代替実施形態がここに予期されて
いることを理解するであろう。従って、本発明の範囲は上述の説明ではなく添付
した請求項によって定義され、また請求項の意味に呼応する全ての等価物は本発
明に包含されることが意図されている。
【図面の簡単な説明】
【図1】 本発明による背景ノイズモデリング方法を実施可能な典型的なDTX送信機の
例を示すブロック図である。
【図2】 本発明によるコンフォートノイズ方法を実施可能な典型的なDTX受信機の例
を示すブロック図である。
【図3】 本発明の方法を実施可能なDTX通信システム用の典型的な音声信号とそれに
対応する典型的なDTXフレームのタイミングを示す図である。
【図4】 本発明による典型的なコンフォートノイズ生成方法を説明するフローチャート
である。
【図5】 本発明による典型的なコンフォートノイズフレーム生成器のブロック図である
【図6】 DTX送信機における代表的な背景ノイズを表す複数のスペクトル振幅の時間
プロットを示す図である。
【図7】 図6の複数のスペクトル振幅に基づき、従来の方法によって生成された複数の
スペクトル振幅の時間プロットであって、DTX受信機で生成されるコンフォー
トノイズを示す図である。
【図8】 図6の複数のスペクトル振幅を本発明に従ってフィルタリング又は平滑化して
得られた推定平均スペクトル振幅であって、DTX送信機における背景ノイズを
表す推定平均スペクトル振幅の時間プロットを示す図である。
【図9】 図8の複数のスペクトル振幅をDTX受信機で受信し、その後本発明に従って
フィルタリングして得られたスペクトル振幅であって、DTX送信機における背
景ノイズを表すスペクトル振幅の時間プロットを示す図である。
【図10】 図9の複数のスペクトル振幅を本発明に従って無規則化又はディザリングして
得られたスペクトル振幅であって、DTX受信機で生成されたコンフォートノイ
ズを表すスペクトル振幅の時間プロットを示す図である。
【図11】 図10の複数のスペクトル振幅を本発明に従ってフィルタリング又は平滑化し
て得られたスペクトル振幅であって、DTX受信機において生成される強化コン
フォートノイズを表すスペクトル振幅の時間プロットを表す図である。
【手続補正書】特許協力条約第34条補正の翻訳文提出書
【提出日】平成13年5月11日(2001.5.11)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0004
【補正方法】変更
【補正の内容】
【0004】 コンフォートノイズはまた、間欠伝送(又はDTX:Discontinuous Transmis
sion)通信システムにおいて非常に有益である。DTXシステムでは、送信機が
出力信号に音声が含まれるか否かを検出し、出力信号が音声を含まない場合には
伝送を中断又は伝送レートを削減する。このようなDTX期間中、受信機ユーザ
が受信機と送信機との間の通信パスが依然として継続中かつ動作可能であること
を認識できるよう、受信機が何らかの形式のコンフォートノイズを再生すること
が望ましい。 欧州特許出願EP 0 786 760号は背景ノイズ特性の符号化及び復号化段階でのコ ンフォートノイズ生成の方法を開示する。ノイズパラメータ生成器は音声サンプ ルの自己相関値を算出する。そして、背景ノイズの自己相関は自己相関値の重み 付けされた平均値として計算される。重み付けされた平均値はノイズパラメータ として通信チャネルを通して伝送される。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0005
【補正方法】変更
【補正の内容】
【0005】 受信機で生成されるコンフォートノイズは、送信機で存在する背景ノイズとで きる限り合致することが一般に好ましい。 換言すれば、コンフォートノイズの生
成プロセスは受信機ユーザに対してトランスペアレントであるべきである。この
ような目的で、送信機に存在する背景ノイズをサンプリングし、サンプリングし
たノイズの特性を表す1つ又は複数のパラメータを周期的に受信機へ伝送して、
受信機での合致したコンフォートノイズ生成に用いることが可能である。しかし
ながら、従来技術においては、本来発生している背景ノイズと、生成されたコン
フォートノイズとの間には知覚できる差異が依然として存在していた。よって、
通信システムにおける更に改良されたコンフォートノイズの生成方法及び装置が
求められている。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,MZ,SD,SL,SZ,TZ,UG ,ZW),EA(AM,AZ,BY,KG,KZ,MD, RU,TJ,TM),AE,AG,AL,AM,AT, AU,AZ,BA,BB,BG,BR,BY,CA,C H,CN,CR,CU,CZ,DE,DK,DM,DZ ,EE,ES,FI,GB,GD,GE,GH,GM, HR,HU,ID,IL,IN,IS,JP,KE,K G,KP,KR,KZ,LC,LK,LR,LS,LT ,LU,LV,MA,MD,MG,MK,MN,MW, MX,NO,NZ,PL,PT,RO,RU,SD,S E,SG,SI,SK,SL,TJ,TM,TR,TT ,TZ,UA,UG,UZ,VN,YU,ZA,ZW (72)発明者 ジョンソン, フィリップ, マーク アメリカ合衆国 ノースカロライナ州 27603, ローリー, クレストシーン トレイル 2830 (72)発明者 ブローバウム, レランド, スコット アメリカ合衆国 ノースカロライナ州 27513, キャリー, バッテリー ポイ ント プレイス 103 Fターム(参考) 5D045 CA01 DA20 5K060 BB04 CC04 DD04 HH00 HH39 5K061 AA09 BB10 BB12 CC00 CC45

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】 無線送信機であって、 入力ノイズ信号をサンプリングし、前記サンプルされたノイズ信号のパラメト
    リックモデルを出力として提供する符号化器であり、前記パラメトリックモデル
    が少なくとも1つの、前記サンプルされたノイズ信号を表すモデリングパラメー
    タを含む符号化器を有し、 前記符号化器が、前記少なくとも1つのモデリングパラメータに関する統計値
    を出力として提供し、前記統計値の次元が各モデリングパラメータの次元よりも
    大きいことを特徴とする無線送信機。
  2. 【請求項2】 前記符号化器がマルチバンド駆動符号化器、準同型符号化器
    及び正弦波変換符号化器の1つであることを特徴とする請求項1記載の無線送信
    機。
  3. 【請求項3】 前記パラメトリックモデルが複数の推定平均スペクトル振幅
    を含むことを特徴とする請求項1記載の無線送信機。
  4. 【請求項4】 前記統計値が前記スペクトル振幅に対する推定標準偏差であ
    ることを特徴とする請求項3記載の無線送信機。
  5. 【請求項5】 前記符号化器が前記少なくとも1つのモデリングパラメータ
    及び前記統計値を周期的に更新することを特徴とする請求項1記載の無線送信機
  6. 【請求項6】 前記符号化器が前記少なくとも1つのモデリングパラメータ
    の連続する更新をフィルタリングすることを特徴とする請求項5記載の無線送信
    機。
  7. 【請求項7】 各モデリングパラメータ更新が推定平均スペクトル振幅であ
    ることを特徴とする請求項6記載の無線送信機。
  8. 【請求項8】 前記符号化器が前記統計値の連続する更新をフィルタリング
    することを特徴とする請求項5記載の無線送信機。
  9. 【請求項9】 前記符号化器が前記1つのモデリングパラメータ及び前記統
    計値の連続する更新をフィルタリングし、前記送信機がフィルタリングされた更
    新を無線受信機に送信することを特徴とする請求項5記載の無線送信機。
  10. 【請求項10】 前記無線送信機が間欠伝送(DTX)装置であり、前記フ
    ィルタリングされた更新が無音記述(SID)フレーム内部で前記無線受信機へ
    送信されることを特徴とする請求項9記載の無線送信機。
  11. 【請求項11】 ノイズ信号を表す、少なくとも1つのノイズモデリングパ
    ラメータと、前記少なくとも1つのノイズモデリングパラメータに関連する統計
    値とを受信するコンフォートノイズ生成器であり、前記統計値の次元が前記ノイ
    ズモデリングパラメータの各々の次元よりも大きいコンフォートノイズ生成器を
    有する無線受信機であって、 前記コンフォートノイズ生成器が前記少なくとも1つのノイズモデリングパラ
    メータ及び前記統計値を復号化し、前記無線受信機のユーザにコンフォートノイ
    ズを供給することを特徴とする無線受信機。
  12. 【請求項12】 各ノイズモデリングパラメータが推定平均スペクトル振幅
    であることを特徴とする請求項11記載の無線受信機。
  13. 【請求項13】 前記統計値が前記少なくとも1つのスペクトル振幅の推定
    標準偏差であることを特徴とする請求項12記載の無線受信機。
  14. 【請求項14】 前記コンフォートノイズ生成器が前記少なくとも1つのノ
    イズモデリングパラメータ及び前記統計値を周期的に受信することを特徴とする
    請求項11記載の無線受信機。
  15. 【請求項15】 前記コンフォートノイズ生成器が前記少なくとも1つのノ
    イズモデリングパラメータの連続する更新をフィルタリングすることを特徴とす
    る請求項14記載の無線受信機。
  16. 【請求項16】 前記コンフォートノイズ生成器が前記少なくとも1つのノ
    イズモデリングパラメータの連続する更新のフィルタリングにおいてランピング
    関数を適用することを特徴とする請求項15記載の無線受信機。
  17. 【請求項17】 前記コンフォートノイズを提供するため、前記コンフォー
    トノイズ生成器が前記少なくとも1つのノイズモデリングパラメータの前記フィ
    ルタリングされた更新を前記統計値に従って処理することを特徴とする請求項1
    5記載の無線受信機。
  18. 【請求項18】 各ノイズモデリングパラメータが推定平均スペクトル振幅
    であり、前記統計値が前記少なくとも1つの推定平均スペクトル振幅に対する推
    定標準偏差であり、前記コンフォートノイズ生成器が前記少なくとも1つの推定
    平均スペクトル振幅の前記フィルタリングされた更新を、前記推定標準偏差に従
    ってディザリングすることを特徴とする請求項17記載の無線受信機。
  19. 【請求項19】 前記コンフォートノイズ生成器が、連続するディザリング
    された更新の間の修正を与えるために、前記少なくとも1つのスペクトル振幅の
    前記ディザリングされた更新をフィルタリングすることを特徴とする請求項15
    記載の無線受信機。
  20. 【請求項20】 前記コンフォートノイズ生成器が前記少なくとも1つのノ
    イズモデリングパラメータ及び前記統計値の前記周期的な更新をを無線送信機か
    ら受信することを特徴とする請求項14記載の無線受信機。
  21. 【請求項21】 前記無線受信機が間欠伝送(DTX)装置であり、前記コ
    ンフォートノイズ生成器が前記少なくとも1つのノイズモデリングパラメータ及
    び前記統計値を、前記送信機が送信する無音記述(SID)フレーム内部で受信
    することを特徴とする請求項20記載の無線受信機。
JP2001502113A 1999-06-07 2000-05-19 パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置 Withdrawn JP2003501925A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US32668099A 1999-06-07 1999-06-07
US09/326,680 1999-06-07
PCT/US2000/013829 WO2000075919A1 (en) 1999-06-07 2000-05-19 Methods and apparatus for generating comfort noise using parametric noise model statistics

Publications (1)

Publication Number Publication Date
JP2003501925A true JP2003501925A (ja) 2003-01-14

Family

ID=23273227

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001502113A Withdrawn JP2003501925A (ja) 1999-06-07 2000-05-19 パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置

Country Status (6)

Country Link
JP (1) JP2003501925A (ja)
CN (1) CN1145928C (ja)
AU (1) AU5032000A (ja)
DE (1) DE10084675T1 (ja)
MY (1) MY133505A (ja)
WO (1) WO2000075919A1 (ja)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007065636A (ja) * 2005-08-31 2007-03-15 Motorola Inc 音声通信システムにおいて快適雑音を生成する方法および装置
US8296132B2 (en) 2007-09-28 2012-10-23 Huawei Technologies Co., Ltd. Apparatus and method for comfort noise generation
CN102760441A (zh) * 2007-06-05 2012-10-31 华为技术有限公司 一种背景噪声编码/解码装置、方法和通信设备
JP2014505907A (ja) * 2011-02-14 2014-03-06 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 不活性相の間のノイズ合成を用いるオーディオコーデック
JP2014510307A (ja) * 2011-02-14 2014-04-24 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオコーデックにおけるノイズ生成
US9047859B2 (en) 2011-02-14 2015-06-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
KR20150107331A (ko) * 2014-03-14 2015-09-23 국방과학연구소 시계열 데이터베이스의 프라이버시 보호에서 상관 관계 보존을 위한 노이즈 생성 방법 및 장치
US9384739B2 (en) 2011-02-14 2016-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding
US9536530B2 (en) 2011-02-14 2017-01-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
US9583110B2 (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
US9595262B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Linear prediction based coding scheme using spectral domain noise shaping
US9595263B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding and decoding of pulse positions of tracks of an audio signal
US9620129B2 (en) 2011-02-14 2017-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
JP2021001964A (ja) * 2019-06-21 2021-01-07 株式会社日立製作所 異常音検知システム、擬似音生成システム、および擬似音生成方法

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4464484B2 (ja) * 1999-06-15 2010-05-19 パナソニック株式会社 雑音信号符号化装置および音声信号符号化装置
SG102694A1 (en) * 2002-09-06 2004-03-26 Building And Construction Auth Facade integrity testing apparatus and method
US7499856B2 (en) * 2002-12-25 2009-03-03 Nippon Telegraph And Telephone Corporation Estimation method and apparatus of overall conversational quality taking into account the interaction between quality factors
CN101303855B (zh) * 2007-05-11 2011-06-22 华为技术有限公司 一种舒适噪声参数产生方法和装置
CN101320563B (zh) * 2007-06-05 2012-06-27 华为技术有限公司 一种背景噪声编码/解码装置、方法和通信设备
CN101453517B (zh) * 2007-09-28 2013-08-07 华为技术有限公司 噪声生成装置、及方法
DE102008009718A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
CN100550133C (zh) 2008-03-20 2009-10-14 华为技术有限公司 一种语音信号处理方法及装置
US8380497B2 (en) 2008-10-15 2013-02-19 Qualcomm Incorporated Methods and apparatus for noise estimation
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
EP2980790A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for comfort noise generation mode selection
CN106328151B (zh) * 2015-06-30 2020-01-31 芋头科技(杭州)有限公司 一种环噪消除系统及其应用方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
UA41913C2 (uk) * 1993-11-30 2001-10-15 Ейті Енд Ті Корп. Спосіб шумозаглушення у системах зв'язку
US5794199A (en) * 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission
US5893056A (en) * 1997-04-17 1999-04-06 Northern Telecom Limited Methods and apparatus for generating noise signals from speech signals

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4643517B2 (ja) * 2005-08-31 2011-03-02 モトローラ・インコーポレイテッド 音声通信システムにおいて快適雑音を生成する方法および装置
JP2007065636A (ja) * 2005-08-31 2007-03-15 Motorola Inc 音声通信システムにおいて快適雑音を生成する方法および装置
CN102760441B (zh) * 2007-06-05 2014-03-12 华为技术有限公司 一种背景噪声编码/解码装置、方法和通信设备
CN102760441A (zh) * 2007-06-05 2012-10-31 华为技术有限公司 一种背景噪声编码/解码装置、方法和通信设备
US8296132B2 (en) 2007-09-28 2012-10-23 Huawei Technologies Co., Ltd. Apparatus and method for comfort noise generation
JP2012247810A (ja) * 2007-09-28 2012-12-13 Huawei Technologies Co Ltd ノイズ生成装置、方法、及びコンピュータ可読記録媒体
US9153236B2 (en) 2011-02-14 2015-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
US9384739B2 (en) 2011-02-14 2016-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding
US9047859B2 (en) 2011-02-14 2015-06-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
JP2017223968A (ja) * 2011-02-14 2017-12-21 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオコーデックにおけるノイズ生成
JP2014505907A (ja) * 2011-02-14 2014-03-06 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 不活性相の間のノイズ合成を用いるオーディオコーデック
US9620129B2 (en) 2011-02-14 2017-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
JP2016026319A (ja) * 2011-02-14 2016-02-12 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオコーデックにおけるノイズ生成
JP2014510307A (ja) * 2011-02-14 2014-04-24 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオコーデックにおけるノイズ生成
US9536530B2 (en) 2011-02-14 2017-01-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
US9583110B2 (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
US9595262B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Linear prediction based coding scheme using spectral domain noise shaping
US9595263B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding and decoding of pulse positions of tracks of an audio signal
KR101589038B1 (ko) 2014-03-14 2016-01-27 국방과학연구소 시계열 데이터베이스의 프라이버시 보호에서 상관 관계 보존을 위한 노이즈 생성 방법 및 장치
KR20150107331A (ko) * 2014-03-14 2015-09-23 국방과학연구소 시계열 데이터베이스의 프라이버시 보호에서 상관 관계 보존을 위한 노이즈 생성 방법 및 장치
JP2021001964A (ja) * 2019-06-21 2021-01-07 株式会社日立製作所 異常音検知システム、擬似音生成システム、および擬似音生成方法
JP7385381B2 (ja) 2019-06-21 2023-11-22 株式会社日立製作所 異常音検知システム、擬似音生成システム、および擬似音生成方法

Also Published As

Publication number Publication date
DE10084675T1 (de) 2002-06-06
WO2000075919A1 (en) 2000-12-14
AU5032000A (en) 2000-12-28
MY133505A (en) 2007-11-30
CN1367918A (zh) 2002-09-04
CN1145928C (zh) 2004-04-14

Similar Documents

Publication Publication Date Title
JP2003501925A (ja) パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置
US5812965A (en) Process and device for creating comfort noise in a digital speech transmission system
US8483854B2 (en) Systems, methods, and apparatus for context processing using multiple microphones
EP1337999B1 (en) Method and system for comfort noise generation in speech communication
EP1088205B1 (en) Improved lost frame recovery techniques for parametric, lpc-based speech coding systems
US6539355B1 (en) Signal band expanding method and apparatus and signal synthesis method and apparatus
US7680653B2 (en) Background noise reduction in sinusoidal based speech coding systems
US8065141B2 (en) Apparatus and method for processing signal, recording medium, and program
EP2793227B1 (en) Audio data processing method and apparatus
MX2013009305A (es) Generacion de ruido en codecs de audio.
JP2003529950A (ja) 忠実度改善のためのコンフォートノイズ変動特性に基づく音声符号化
JPH0713600A (ja) 駆動同期時間符号化ボコーダおよび方法
US20090222264A1 (en) Sub-band codec with native voice activity detection
US6424942B1 (en) Methods and arrangements in a telecommunications system
JPH0946233A (ja) 音声符号化方法とその装置、音声復号方法とその装置
US7603271B2 (en) Speech coding apparatus with perceptual weighting and method therefor
JP2003533902A (ja) 符号化されたドメインのエコーの制御
EP1112568B1 (en) Speech coding
CN106683681B (zh) 处理丢失帧的方法和装置
US20040167772A1 (en) Speech coding and decoding in a voice communication system
JP2000132192A (ja) 信号処理方法及び装置、並びに帯域幅拡張方法及び装置
JPH06291679A (ja) オーディオ信号のためのしきい値制御量子化決定法
JPH08223125A (ja) 音声復号装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070807