JP2004525540A - 音声通信中に快適ノイズを発生するための方法およびシステム - Google Patents
音声通信中に快適ノイズを発生するための方法およびシステム Download PDFInfo
- Publication number
- JP2004525540A JP2004525540A JP2002544707A JP2002544707A JP2004525540A JP 2004525540 A JP2004525540 A JP 2004525540A JP 2002544707 A JP2002544707 A JP 2002544707A JP 2002544707 A JP2002544707 A JP 2002544707A JP 2004525540 A JP2004525540 A JP 2004525540A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- value
- stationary
- comfort noise
- component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Abstract
Description
[発明の分野]
本発明は概して音声通信に関し、さらに詳しくは不連続送信法(discontinuous tramsmission)における快適ノイズ発生に関する。
【0002】
[発明の背景]
通常の電話の会話中、ある時間において一方のユーザがしゃべり、他方のユーザが聞く。時には、いずれのユーザもしゃべらない。無言の期間は、平均の音声活動性(speech activity)が50%を下回る状況を引き起こす。この無言の期間中、背景からの音響ノイズだけが聞こえる。背景ノイズは、普通、何ら情報を与える内容を有しておらず、正確な背景ノイズを送信側(TX)から受信側(RX)に伝送する必要はない。移動通信において、不連続伝送法(discontinuous tramsmission:DTX)として知られる手順は、移動装置の電力を省くために、この事実を利用している。とくにTX DTX機構は、移動局(MS)から基地局への無線伝送が、移動局における省電力と、無線インタフェースにおける全干渉レベルの低減のために、音声休止中の時間のほとんどの時間に送信を遮断する低状態(DTXLow)を有する。DTXを用いる際の基本的な問題は、音声期間中の音声に伴う背景音響ノイズが無線伝送が断に切り換えられるときに消え、背景ノイズの不連続を引き起こすことである。DTX切り換えが即座に起こり得るので、この現象が聞き手にとってひじょうに不快なものとなり得ることが知られている。そのうえさらに、音声活動性検知器(Voice activity detector:VAD)がノイズをたまたま音声に分類した場合、背景ノイズには、音声合成のあいだに(音声として)再構成される部分もあれば、無通話と扱われる部分もある。
【0003】
背景ノイズの突然の発生と消滅は非常に邪魔であり不快であるだけでなく、とくに移動車両の内部など、ノイズのエネルギーレベルが高いとき、会話の明瞭度が減少する。この妨害効果を低減するために、送信側の背景ノイズに類似した合成ノイズが受信側で発生される。聴取をより快適にするので、当該合成ノイズは快適ノイズ(confort noise)と呼ばれる。
【0004】
受信側が送信側の背景ノイズをシミュレートするために、送信側で快適ノイズパラメータが評価され、無声時情報(silence descuription:SID)フレームを用いて受信側に伝送される。この伝送はDTXLowへ移り変わる前で、かつ移動局で規定される1伝送速度分だけ送れて起こる。TX DTXハンドラHは、計算するためにパラメータの種類を決定し、音声フレームまたはSIDフレームのいずれを発生するかを決定する。図1は、TX DTXの論理的な動作を記載している。この動作は音声活動性検知器の支援により実行され、現在のフレームが音声を含むか否かを示す。VADアルゴリズムの出力は、音声が検知される場合、「真」とマークされるブール(2進数)フラグ(Boolean flag)であり、そうでない場合、「偽」とマークされるブールフラグである。また、TX DTX(ハンドラ)は、音声エンコーダと快適ノイズ発生モジュールとを含んでいる。
【0005】
TX DTXハンドラーの基本的な動作は、つぎのとおりである。ブール音声(SP)フラグは、フレームが音声フレームまたはSIDフレームのいずれかを示す。音声期間のあいだ、SPフラグは「真」に設定され、音声フレームが、音声(ないしは音声)符号化アルゴリズムを用いて発生する。VADフラグが「偽」に変更される前に、充分に長い期間の音声期間が続くと、ハングオーバ期間(図2参照)が存在する。この期間は背景ノイズパラメータの平均値の計算のために用いられる。ハングオーバ期間のあいだ、通常の音声フレームは、符号化された信号が背景ノイズだけを含んでいても、受信側に伝送される。SPフラグの値は、ハングオーバ期間中「真」のままである。ハングオーバ期間の後、快適ノイズ(CN)期間が開始する。CN期間のあいだ、SPフラグは「偽」とマークされ、SIDフレームが発生する。
【0006】
ハングオーバ期間のあいだ、各フレームのスペクトルSと出力レベルEとが減少される。ハングオーバの後、減少されたパラメータSabeとEabeの平均が計算される。平均される期間の長さは、ハングオーバの長さより1フレーム長い。それゆえ、第1の快適ノイズパラメータは、ハングオーバ期間と、その後の第1のフレームからの平均である。
【0007】
快適ノイズ期間のあいだ、SIDフレームがフレーム毎に発生するが、すべてが送られるとは限らない。TX(送信)無線サブシステム(RSS)が、SPフラグに基づくSIDフレーム伝送のスケジューリング(scheduling)を制御する。音声期間が終了すると、その後の最初のSIDフレームの後に伝送が遮断される。そののち、1つのSIDフレームが、快適ノイズの推定値を更新するために伝送される。
【0008】
図3はRX(受信)DTXの論理的な動作を記載している。受信されたフレーム中にエラーが検知される場合、不良フレーム表示(BFI)が「真」に設定される。送信側のSPフラグと同様に、受信側のSIDフラグが、受信されたフレームがSIDフレームか、または音声フレームかを示すために使用される。
【0009】
RX DTXハンドラーは、RX DTX動作全体のために責任を負っている。当該RX DTXハンドラーは、受信されたフレームが有効なフレームか、無効のフレームか(それぞれ、BFI=0またはBFI=1)、および受信されたフレームがSIDフレームか、音声フレームか(それぞれ、SID=1またはSID=0)を分類する。有効な音声フレームが受信されると、RX DTXハンドラーが、当該有効な音声フレームを直接音声デコーダに渡す。誤った音声フレームが受信されるか、または該フレームが音声期間中に喪失すると、音声デコーダは、音声合成のために最新の良好な音声フレームから音声に関するパラメータを使用し、同時にデコーダは出力信号を徐々に弱めることを開始する。
【0010】
有効なSIDフレームが受信されると、新たな有効なSIDフレームが受信されるまで、快適ノイズが発生される。しかしながら、受信されたフレームが無効なSIDフレームに分類されると、最後の有効なSIDフレームが使用される。快適ノイズの期間中、デコーダは、送信されていないSIDフレーム間の伝送チャネルノイズを受信する。当該フレームの間の信号を合成するために、快適ノイズの更新の間に以前受信された有効な2つのSIDフレームから挿入されたパラメータによって快適ノイズが発生される。RX DTXハンドラーは、CN期間のあいだ送信されなかったフレームを無視する。なぜなら、伝送の中断によるものと考えられるからである。
【0011】
快適ノイズは、背景ノイズから分析された情報を用いて発生される。背景ノイズは、背景ノイズのソース(source)に依存して、ひじょうにさまざまな特徴を有することができる。それゆえ、すべてのタイプの背景ノイズの特徴を適切に記述する1組のパラメータを見出し、少数のビットを用いて1秒毎に数回伝送され得る一般的な方法はない。音声通信における音声合成は人間の音声発生システムに基づいており、音声合成アルゴリズムは、快適ノイズのために同じ方法で用いることはできない。そのうえ、通話に関するパラメータとちがってSID中のパラメータはフレーム毎に送られるわけではない。人間の聴覚システムが、位相応答に対してよりも信号の振幅スペクトルに対して集中することは知られている。したがって快適ノイズのためには、背景ノイズの平均スペクトルと平均パワーについての情報を伝送するだけで充分である。そのため、不快ノイズはこれらの2つのパラメータに基づいて生成される。このタイプの快適ノイズの発生は、時間領域においてはおおくの歪を導入するが、周波数領域においては背景ノイズに似ている。これは、音声期間と快適ノイズ期間との間の過渡期間中の不快感を減少するのに充分である。良好に作用する快適ノイズの発生は、非常に感情を鎮める効果を有しており、快適ノイズはそれ自体の注意を惹かない。快適ノイズの発生は伝送速度を減少させながら、導入する知覚のエラーは少ないので、このコンセプトは好ましいものとして受け入れられている。しかしながら、発生された快適ノイズの特徴が実際の背景ノイズと著しく異なっている場合、快適ノイズと背景ノイズとの間の過渡状態は、普通、聴覚的に認識される。
【0012】
先行技術において、合成線形予測(LP)フィルタおよびエネルギー係数は、最新の2つのSIDフレーム(図4参照)間のパラメータを内挿することによって得られる。この内挿はフレーム毎に行なわれる。フレームの内部では、各サブフレームの快適ノイズのコードブック(codebook)ゲインは同一である。快適ノイズのパラメータは、SIDフレーム伝送時に受信されたパラメータから内挿されている。SIDフレームは第k番目のフレーム毎に送信される。第n番目のフレームの後に送信されたSIDフレームは第(n+k)番目のレームである。CNパラメータは各フレーム毎に内挿され、当該内挿されたパラメータは、第n番目のSIDフレームから第(n+k)番目のSIDフレームに、第(n+k)フレームが受信されたときに変更される。内挿はつぎのとおり行なわれる。
【0013】
【数1】
【0014】
ここに、kは内挿期間、S’(n+i)は第(n+i)番目のフレームのスペクトルパラメータベクトルで、i=0、…、k−1である、S(n)は最新に更新されたスペクトルパラメータベクトルであり、S(n−k)は第2の最新に更新されたスペクトルパラメータベクトルである。同様に、受信されたエネルギーはつぎのように内挿される。
【0015】
【数2】
【0016】
ここに、kは内挿期間、E’(n+i)は第(n+i)番目のレームの受信されたエネルギーで、i=0、…、k−1である、E(n)は最新に更新された受信されたエネルギーであり、E(n−k)は第2の最新に更新された受信されたエネルギーである。この方法によって、快適ノイズはゆっくりと滑らかに変化し、あるセットのパラメータから他のセットのパラメータに変わる。この先行技術の解決策のブロックダイアグラムが図4に示されている。GSR FER(移動通信エンハンスト・フルレートのためのグローバルシステム)コーデックは、LSF領域における合成(LP)フィルタ係数を伝送することにより、このアプローチを用いている。これら2つのパラメータは、式1および2にしたがって内挿される。ただし、k=24である。GSM EFR CN発生の詳細な説明は、デジタル無線通信システム(フェイズ2+)、コンフォートノイズ アスペクツ フォア エンハンスト フルレイト トラフィック チャネルズ(イーティーエス・イーエヌ300 72第8.0.0刊(2000年7月))から見出される。
【0017】
その代わりに、エネルギーディザリング(乱数の挿入)およびスペクトルディザリングブロックが、当該パラメータにランダムな要素を挿入するために用いられる。その目的は、実際の背景ノイズにおけるスペクトルおよびエネルギーレベルでゆらぎ(fluctuation)をシミュレートすることである。スペクトルディザリングブロックの動作はつぎのとおりである(図5参照)。
【0018】
【数3】
【0019】
ここに、Sはこの場合におけるLSFベクトルであり、Lは定数であり、rand(−L,L)は−LとLとの間の値を発生しているランダム関数であり、Save’’(i)は快適ノイズスペクトル表示のために用いられるLSF(線形スペクトル周波数)ベクトルであり、Save’(i)は背景ノイズの平均化されたスペクトル情報(LSF領域)であり、Mは合成フィルタ(LP)の次数である。同様に、エネルギーディザリングはつぎのとおり伝えられる。
【0020】
【数4】
【0021】
エネルギーディザリングおよびスペクトル(LP)ディザリングブロックは、先行技術の解決策においては一定の大きさでディザリングを実行する。合成(LP)フィルタ係数は、またこの第2の先行技術のシステムの記載中LSF領域で表されることを注意されるべきである。しかしながら、他のいかなる表現を使用してもよい(例えば、ISP領域)。
【0022】
IS−641などの先行技術のいくつかのシステムは、快適ノイズ発生の際のエネルギーディザリングブロックを採用していない。IS−641の快適ノイズ発生の詳細な説明は、TDMAセルラー/PCS−無線インタフェース・エンハンスト・フル−レート音声コーデック、改訂A(TIA/EIA IS−641−A)に見ることができる。
【0023】
前述の先行技術の解決策は、いくつかのタイプの背景ノイズに良好に作用するが、他のタイプのノイズには上手く作用しない。定常的な背景ノイズのタイプ(自動車のノイズや風などの背景ノイズ)に対して、非ディザリング・アプローチは良好に実行するが、ディザリング・アプローチは良好に実行しない。これは、背景ノイズは実際には定常的であるが、ディザリング・アプローチは、快適ノイズ発生のためにランダムなゆらぎ(jitter)をスペクトルパラメータに導入するからである。非定常の背景ノイズのタイプ(街路またはオフィスのノイズ)に対しては、ディザリング・アプローチが、合理的に良好に作用するが、非ディザリング・アプローチは良好に作用しない。よって、ディザリング・アプローチは、背景ノイズが時間の経過と共にゆらぐ背景ノイズの非定常的な特徴をシミュレートするのにより適しており、非ディザリング・アプローチは、定常的な快適ノイズを発生するのにより適している。快適ノイズを発生するために、いずれかのアプローチを用いると、合成された背景ノイズと真の背景ノイズとの間の過渡状態が、多くの場合に可聴(耳障り)である。合成された背景ノイズと真の背景ノイズとの間の過渡状態における可聴性が、真の背景ノイズが定常的であるか、非定常的であるかにかかわらず低減されるか、または実質的に除去され得る快適ノイズを発生するための方法およびシステムを提供することが有益であり、望まれている。国際公開第00/31719号パンフレットは、快適ノイズパラメータの修正のために使用される可変性情報を計算するための方法を記載している。とくに、可変性情報の算出はデコーダによって実行される。計算全体はデコーダによって実行され、快適ノイズ期間のあいだ、可変性情報は1つの快適ノイズフレーム(第24番目のフレーム毎)についてのみ存在するので、計算による遅延は長くなるであろう。また、計算はエンコーダとデコーダとの間に分割され得るが、エンコーダからデコーダに情報を送るための伝送チャネルに、より高いビット速度が要求される。快適ノイズを修正するための簡単な方法を提供すことが有益である。
【0024】
[発明の要旨]
本発明の主な目的は、音声期間中の真の背景ノイズと非音声期間中に発生した快適ノイズとのあいだの過渡状態における聴覚的な認識を低減または実質的に除去することである。この目的は、背景ノイズの特徴に基づいて快適ノイズを発生することによって達成される。
【0025】
したがって、本発明の第1の態様は、音声期間と非音声期間とを有する音声通信において快適ノイズを発生する方法であって、当該音声通信を行なうために、音声入力を表わす信号が送信側のフレームから受信側のフレームに供給され、当該音声入力が音声成分および非音声成分を有し、該非音声成分が定常または非定常に分類することができ、
前記方法が、
非音声成分が定常または非定常のいずれであるかを決定し、
定常である非音声成分を表わす第1の値と、非定常である非音声成分を表わす第2の値とを有するさらなる信号を送信側に供給し、
前記さらなる信号が第1の値または第2の値のいずれを有するかに基づいて、送信側から受信されたさらなる信号に応答して、非音声期間中に快適ノイズを受信側で発生する
ことを特徴とする方法である。
【0026】
本発明によれば、前記信号はスペクトルパラメータベクトルと前記非音声成分のスペクトルから評価されたエネルギーレベルとを含み、前記快適ノイズは該スペクトルパラメータベクトルおよびエネルギーレベルに基づいて生成される。前記さらなる信号が第2の値を有する場合、前記快適ノイズが発生される前に、ランダムな値がスペクトルパラメータベクトルに挿入される。
【0027】
本発明によれば、決定する工程は前記スペクトルパラメータベクトル間のスペクトル距離に基づいて実行される。好ましくは、総和の値を与えるために平均期間にわたって前記スペクトル距離の総和が求められ、当該総和が所定の値より小さい場合、前記非音声成分が定常と分類され、当該総和が所定の値より大きいか、または等しい場合、前記非音声成分が非定常と分類される。前記スペクトルパラメータベクトル(114)が、線形スペクトル周波数(LSF)ベクトル、イミタンススペクトル周波数(ISF)ベクトルなどであり得る。
【0028】
本発明の第2の態様によれば、音声入力を表わす音声に関するパラメータを供給するための送信側と、該音声に関するパラメータに基づいて音声入力を再構成するための受信側とを有する通信ネットワークによる音声通信中に快適ノイズを発生するためのシステムであって、
該音声通信が音声期間と非音声期間とを有し、該音声入力が音声成分と非音声成分とを有し、該非音声成分が定常と非定常に分類され、当該快適ノイズが非音声期間中に与えられ、
前記システムが、
前記送信側に設けられ、定常である非音声成分を表わす第1の値または
非定常である非音声成分を表わす第2の値を有する信号を供給するために、前記非音声成分が定常であるか、または非定常であるかを決定するための手段と、
前記受信側に設けられ、前記信号に応答して、前記信号が第2の値を有する場合にのみ快適ノイズにランダムな成分を挿入するための手段
とを備えてなることを特徴とするシステムである。
【0029】
本発明の第3の態様によれば、音声入力を表わす音声パラメータを供給するためのエンコーダと、供給された音声パラメータに応答して、該音声パラメータに基づいて音声入力を再構成するためのデコーダとを有する音声通信に用いるための音声コーダであって、
前記エンコーダが、音声入力に応答して、該音声入力の非音声成分を表わすスペクトルパラメータベクトルとエネルギーパラメータとを発生するためのスペクトル分析モジュールを備え、
前記デコーダが、前記スペクトルパラメータベクトルおよびエネルギーパラメータに基づいて非音声成分を置き換えるために非音声期間に快適ノイズを発生するための手段を備え、
前記エンコーダに設けられ、スペクトルパラメータベクトルとエネルギーパラメータに応答して前記非音声成分が定常であるか、または非定常であるかを決定し、定常である非音声成分を表わす第1の値と、非定常である非音声成分を表わす第2の値とを有する信号を与えるためのノイズ検出器モジュールと、
前記信号に応答して、前記非音声成分が非定常である場合にのみ快適ノイズを修正するために、スペクトルパラメータベクトルおよびエネルギーパラメータの要素にランダムな成分を挿入するためのディザリングモジュール
とを備えてなる
ことを特徴とする音声コーダである。
【0030】
本発明は図1〜7と関連づけて明細書を読むと明らかになるであろう。
【0031】
[発明を実施するための最良の形態]
本発明による快適ノイズジェネレータシステム1は、図6に示されている。図6に示されているように、快適ノイズジェネレータシステム1は、エンコーダ10とデコーダ12とからなる。エンコーダ10において、スペクトル解析モジュール20は、入力音声信号100から線形予測パラメータ(linear prediction parameter(LP))112を抽出するために使用される。同時に、エネルギー計算モジュール24は、入力音声信号100からエネルギーレベル係数(factor)を計算するために使用される。スペクトル平均化モジュール22は、LPパラメータ112から、平均スペクトルパラメータベクトル114を計算する。同じように、エネルギー平均化モジュール26は、エネルギーレベル係数122から、受信されたエネルギー124を計算する。平均パラメータの計算は、デジタルセルラー無線通信システム(Phase 2+)で発表されているような、コンフォートノイズ アスペクツ フォア エンハンスト フルレイト スピーチトラフィック チャネルズ(ETSI EN 300 728 v8.0.0(2000−07))という方法が知られている。平均スペクトルパラメータベクトル114と平均の受信エネルギー124は、先行技術のように、送信側にあるエンコーダ10から受信側にあるデコーダ12へと送信される。
【0032】
本発明によるとエンコーダ10において、検出機モジュール28は、スペクトルパラメータベクトル114および受信エネルギー124からの背景ノイズが定常的であるか非定常的であるかどうかを決定する。背景ノイズが定常的であるか非定常的であるかどうかを示す情報は、エンコーダ10からデコーダ12へと、「定常性フラグ(stationarity−flag)」130の形で送信される。定常性フラグ130は、2進数(binary digit)で送られ得る。例えば、背景ノイズが定常的であると分類されたときは、定常性フラグが設定され、定常性フラグ130は1という値を与えられる。そうでないときには、定常性フラグが設定されず、定常性フラグ130は0という値を与えられる。図4および図5に示されている先行技術のように、スペクトル内挿器30とエネルギー内挿器36は、従来のSIDフレームから等式1および2により新しいSIDフレーム中にS’(n+i)とE’(n+i)をそれぞれ内挿する。内挿されたスペクトルパラメータベクトルS’aveは、参照数字116により表される。内挿された受信エネルギーE’aveは、参照数字126により表される。検出器モジュール28によって、背景ノイズが非定常的であると分類された場合、フラグ130の値は0であると指示される。式3によると、スペクトルディザリングモジュール32は、ランダム成分をスペクトルパラメータベクトル116に挿入することによって、実際の背景ノイズのゆらぎ(flucfation)をシミュレートする。式4によると、エネルギーディザリングモジュール38は、ランダムディザリングを受信エネルギー126に挿入する。ディザリングされたスペクトルパラメータベクトルS’’aveは、参照数字118で示され、ディザリングされた受信エネルギーE’’aveは、参照数字128で示される。しかしながら、背景ノイズが定常的であると分類された場合、固定フラグ130は設定される。スペクトラルディザリングモジュール32とエネルギーディザリングモジュール38は、実質的にバイパスされ、その結果、S’’ave=S’aveおよびE’’ave=E’aveとなる。そのような場合、信号118は信号116と同一である。また、信号128は信号126と同一である。どちらの場合も、信号128はスケーリング(増幅)モジュール40へ送られる。平均エネルギーE’’aveに基づいて、スケーリングモジュール40は快適ノイズのエネルギーを変更する。その結果、デコーダ12により与えられる快適ノイズ150のエネルギーレベルは、エンコーダ10における背景ノイズのエネルギーとほぼ等しくなる。図6に示されるように、励振(excitation)として用いられるランダムホワイトノイズベクトルを発生するために、ランダムノイズジェネレータ50が使用される。ホワイトノイズは参照数字140により表され、また、レベル調整(scaled)または変更されたホワイトノイズは参照数字142で表される。入力100の平均背景ノイズを表している信号118または平均スペクトルパラメータベクトルS’’aveは、合成フィルタモジュール34に供給される。信号118とレベル調整されたエキサイテーション142に基づいて、合成フィルタモジュール34は、快適ノイズ150を供給する。
【0033】
それぞれのスペクトルパラメータ(LSFまたはISF)ベクトルf(i)から他のスペクトルパラメータベクトルf(j)へのスペクトル距離ΔDiに基づいて、背景ノイズが定常的か非定常的かに分類され得る。iおよびjの範囲は、CN平均期間(ldtx)の範囲内で、i=0,...,ldtx−1,j=0,...,ldtx−1,i≠jである。平均期間は、典型的には8である。スペクトル距離は、近似的に次の式で示される。
【0034】
【数5】
【0035】
ここで、すべてのi=0,...,ldtx−1,i≠jに関し、さらに
【0036】
【数6】
【0037】
またfi(k)は、フレームiにおけるスペクトルパラメータベクトルf(i)のk番目のスペクトルパラメータであり、Mは合成フィルタ(LP)の次数である。
【0038】
平均期間が8の場合、合計スペクトル距離は、
【0039】
【数7】
【0040】
DSが小さい場合、背景ノイズが定常的であるということを示すために定常性フラグが設定される(フラグ130の値は1である)。そうでない場合は、背景ノイズが非定常的であるということを示すために、固定フラグが設定されない(フラグ130の値は0である)。好ましくは、合計スペクトル距離DSは、固定小数点演算においては、67108864と等しくなり得る定数であり、浮動小数点(演算)においては、およそ5147609と等しくなり得る定数に対して比較される。定常性フラグが設定されるか否かは、DSがそのような定数よりも小さいか否かによる。
【0041】
さらに、フレーム間のパワー変化を考慮に入れることができる。フレーム間のパワー変化を考慮に入れるために、2つの連続的なフレーム間のエネルギー比E(i)/E(i+l)を計算する。当該技術分野において知られているように、VAD=0で示されたそれぞれのフレームのフレームエネルギーは、つぎのように計算される。
【0042】
【数8】
【0043】
ここで、s(n)は現在のフレームiのハイパスフィルタされた入力音声信号である。これらのエネルギー比の2つ以上が充分に大きい場合、DSが小さいことにより定常性フラグが以前から設定されていたとしても、定常性フラグはリセットされる(フラグ130の値が0になる)。このような比較は、それぞれのフレームの対数的な領域におけるフレームエネルギーと、平均された対数的なエネルギーとの比較に等しい。したがって、enlog(i)の偏差の絶対値(absolute deviation)の和がnelogの平均値より大きい場合、DSが小さいことにより定常的フラグが以前から設定されていたとしても、定常性フラグはリセットされる。絶対偏差の総和が、固定小数点演算において180(浮動小数点においては1.406)より大きい場合、定常性フラグはリセットされる。スペクトルパラメータベクトルにディザリングを挿入するとき、式3により、より低いスペクトル成分に挿入されるディザリングの量が、より高いスペクトル成分(LSFもしくはISFの要素)に挿入されるディザリングの量より少ないことが好まれる。このことにより、式3のスペクトルへのディザリングの挿入をつぎのような形式に変更する。
【0044】
【数9】
【0045】
ここで、L(i)は、高周波数成分に対してiの関数として増加する。また、Mは合成フィルタ(LP)の次数である。例として、AMR広帯域コーデックに利用される場合、L(i)ベクトルは、つぎの値を有することができる。
【0046】
【外1】
【0047】
(3rdジェネレーションパートナーシッププロジェクト、テクニカルスペシフィケーショングループサービシズアンドシステムアスペクツ、マンダトリスピーチコーデックスピーチプロセシングファンクションズ、AMRワイドバンドスピーチコーデック、トランスコーディングファンクションズを参照(3G TS 26.190 version 0.02))
【0048】
ISF領域は、スペクトルの表現に使用され、またベクトル(i−M−2)の最後から2番目の要素は、もっとも高い周波数とベクトルの最初の要素(i=0)を表しているということに留意すべきである。LSF領域においては、ベクトル(i−M−1)の最後の要素は、もっとも高い周波数とベクトルの最初の要素(i=0)を表している。
【0049】
エネルギーパラメータのためのディザの挿入はスペクトルディザリングに類似しており、式4により計算され得る。対数的な領域においては、エネルギーパラメータに対してのディザの挿入はつぎのように表される。
【0050】
【数10】
【0051】
図7は、本発明による非音声期間中の快適ノイズの発生方法を示したフローチャートである。フローチャート200に示されているように平均スペクトルパラメータベクトルS’aveと平均受信エネルギーE’aveは、ステップ202において計算される。ステップ204において、合計スペクトル距離DSが計算される。ステップ206において、DSが予め規定された値(例えば、固定小数点演算では67108864)よりも小さくない場合、定常性フラグは設定されない。したがって、ステップ232において、S’aveとE’aveとはディザリングが挿入されることによりS’’aveとE’’aveとになる。DSが予め規定された値よりも小さい場合、定常性フラグが設定される。(この場合、)232において、ディザリング処理はバイパスされる、もしくはS’’ave=S’aveおよびE’’ave=E’aveとなる。フレーム間のエネルギー変化の測定のために、選択的にステップ208が実行される。ステップ230での決定にしたがってエネルギー変化が大きい場合、定常性フラグがリセットされて処理はステップ232へのループを戻る。ステップ234において、S’’aveとE’’aveに基づいて快適ノイズが生成される。
【0052】
3つの異なる背景ノイズの型を、本発明による方法を用いて検査した。車のノイズについては、快適ノイズのフレームの95%が定常的であるとして分類された。オフィスのノイズについては、快適ノイズのフレームの36.9%が定常的であるとして分類され、街路のノイズについては、快適ノイズのフレームの25.8%が定常的であるとして分類された。このことは、とても良い結果である。なぜならば、車のノイズは主として定常的な背景ノイズであるが、オフィスのノイズおよび街路のノイズは主として非定常的な背景ノイズの型である。
【0053】
本発明による固定フラグに関する計算は、全てエンコーダ中で実行されるということに留意すべきである。そのため、国際公開00/31719号パンフレットに開示されているようなデコーダのみでの方法(デコーダのみで計算を行なう方法)と比較すると、計算の遅延は本質的には減少する。その上、本発明による方法は、快適ノイズの変更のための情報をエンコーダからデコーダへ送るためにわずか1ビットしか使用しない。対照的に、国際公開00/31719号パンフレットに開示されているような、計算をエンコーダとデコーダとの間で分担する場合は送信チャネルにはるかに高いビット速度が必要とされる。
【0054】
本発明は本発明の好ましい実施例に関して述べられているが、本発明の形態および詳細について、前述のものおよび様々な他の変更、省略および変形は、本発明の範囲から外れることなく考え出され得るということは、当業者によって理解されるだろう。
【図面の簡単な説明】
【図1】
典型的な送信側の不連続送信ハンドラを示すブロックダイアグラムである。
【図2】
音声活性検出器とブール(2進)音声フラグとの同期を示すタイミングダイアグラムである。
【図3】
典型的な受信側の不連続送信ハンドラを示すブロックダイアグラムである。
【図4】
非ディザリング・アプローチを使用した快適ノイズ発生システムの従来技術を示すブロックダイアグラムである。
【図5】
ディザリング・アプローチを使用した快適ノイズ発生システムの従来技術を示すブロックダイアグラムである。
【図6】
本発明による快適ノイズ発生システムを示すブロックダイアグラムである。
【図7】
本発明による快適ノイズの発生の方法を示すフローチャートである。
Claims (25)
- 音声期間と非音声期間とを有する音声通信において快適ノイズ(150)を発生する方法(200)であって、当該音声通信を行なうために、音声入力を表わす信号(114、124)が送信側のフレームから受信側のフレームに供給され、当該音声入力が音声成分および非音声成分を有し、該非音声成分が定常または非定常に分類することができ、
前記方法が、
非音声成分が定常または非定常のいずれであるかを決定し(204)、
定常である非音声成分を表わす第1の値と、非定常である非音声成分を表わす第2の値とを有するさらなる信号(130)を送信側に供給し(206)、
前記さらなる信号(130)が第1の値または第2の値のいずれを有するかに基づいて、送信側から受信されたさらなる信号に応答して、非音声期間中に快適ノイズ(150)を受信側で発生する(202、232)
ことを特徴とする方法。 - 前記非音声成分が送信側の背景ノイズであることを特徴とする請求項1記載の方法。
- 前記さらなる信号が第2の値を有する場合、快適ノイズにランダム成分が設けられることを特徴とする請求項1記載の方法。
- スペクトルパラメータベクトル(114)と、前記非音声成分のスペクトルから評価されたエネルギーレベル(124)とを含む前記信号が、前記快適ノイズ(150)が該スペクトルパラメータベクトル(114)およびエネルギーレベル(124)に基づいて生成されることを特徴とする請求項1記載の方法。
- 前記さらなる信号(130)が第2の値を有する場合、前記快適ノイズ(150)が発生される前に、ランダムな値をスペクトルパラメータベクトル(114)に挿入する(32)ことを特徴とする請求項4記載の方法。
- 前記さらなる信号(130)が第2の値を有する場合、快適ノイズ(150)が発生される前に、前記スペクトルパラメータベクトル(114)の要素内にランダムな値の第1セットを挿入し(32)、前記エネルギーレベル(124)に第2のランダムな値を挿入する(38)ことを特徴とする請求項4記載の方法。
- 非音声成分を表わす複数のスペクトルパラメータベクトル(114)を含む前記信号が、前記決定する工程(204)が前記スペクトルパラメータベクトル(114)間のスペクトル距離(Ds)に基づいて実行されることを特徴とする請求項1記載の方法。
- 総和の値を与えるために平均期間にわたって前記スペクトル距離(Ds)の総和が求められ、当該総和が所定の値より小さい場合、前記非音声成分が定常と分類され、当該総和が所定の値より大きいか、または等しい場合、前記非音声成分が非定常と分類されることを特徴とする請求項7記載の方法。
- 前記スペクトルパラメータベクトル(114)が線形スペクトル周波数(LSF)ベクトルであることを特徴とする請求項7記載の方法。
- 前記スペクトルパラメータベクトル(114)が、イミタンススペクトル周波数(ISF)ベクトルである請求項7記載の方法。
- 前記さらなる信号が第1の値を有する場合に、フレーム間のエネルギーレベルの変化を計算する工程をさらに含み、該エネルギーレベルの変化が所定の値を超えた場合、前記さらなる信号が第2の値をもつように変化し、前記快適ノイズ(150)が発生される前に前記スペクトルパラメータベクトル(114)にランダムな値のベクトルを挿入する(232)ことを特徴とする請求項4記載の方法。
- 前記さらなる信号(130)が第1の値を有する場合に、フレーム間のエネルギーレベルの変化を計算する工程を含み、当該エネルギーレベルの変化が所定の値を超えた場合、前記さらなる信号が第2の値を有するように変化し、前記快適ノイズ(150)が生成される前に、スペクトルパラメータベクトル(114)およびエネルギーレベル(124)にランダムな値のベクトルを挿入する(232)ことを特徴とする請求項4記載の方法。
- 前記さらなる信号(130)が、非音声成分が定常であるか、非定常であるかを表示するために、送信側から受信側に送られるフラグを含み、前記さらなる信号(130)が第1の値を有するときに当該フラグが設定され、前記さらなる信号(130)が第2の値を有するときには当該フラグが設定されないことを特徴とする請求項4記載の方法。
- 前記フラグが設定されない場合、快適ノイズ(150)が生成される前に、スペクトルパラメータベクトル(114)にランダムな値を挿入する(232)ことを特徴とする請求項13記載の方法。
- 前記さらなる信号が第1の値を有する場合にフレーム間のエネルギーレベルの変化を計算し、
該エネルギーレベルの変化が所定の超えているか否かを決定し、
当該変化が所定の値を超えている場合、前記フラグの設定を取消す
ことを特徴とする請求項13記載の方法。 - 前記フラグが設定されていないときに、快適ノイズが生成される前に、スペクトルパラメータベクトル(114)にランダムな値を挿入する(232)ことを特徴とする請求項15記載の方法。
- 前記ランダムな値が−LとLとの間の範囲にあり、Lが所定の値であることを特徴とする請求項5記載の方法。
- 前記所定の値が実質的に100+0.8Hzに等しいことを特徴とする請求項17記載の方法。
- 前記第2のランダムな値が−75と75との間の範囲にあることを特徴とする請求項6記載の方法。
- 前記ランダムな値が−LとLとの間の範囲にあり、Lが高周波数を表わす要素と共に増加する値であることを特徴とする請求項5記載の方法。
- 前記さらなる信号が2進数のフラグであり、前記第1の値が1であり、前記第2の値が0であることを特徴とする請求項1記載の方法。
- 前記さらなる信号が2進数のフラグであり、前記第1の値が0であり、前記第2の値が1であることを特徴とする請求項1記載の方法。
- 音声入力(100)を表わす音声に関するパラメータ(114、124)を供給するための送信側と、該音声に関するパラメータ(114、124)に基づいて音声入力を再構成するための受信側とを有する通信ネットワークによる音声通信中に快適ノイズ(150)を発生するためのシステム(10、12)であって、
該音声通信が音声期間と非音声期間とを有し、該音声入力が音声成分と非音声成分とを有し、該非音声成分が定常と非定常に分類され、当該快適ノイズ(150)が非音声期間中に与えられ、
前記システムが、
前記送信側に設けられ、定常である非音声成分を表わす第1の値または
非定常である非音声成分を表わす第2の値を有する信号(130)を供給するために、前記非音声成分が定常であるか、または非定常であるかを決定するための手段(28)と、
前記受信側に設けられ、前記信号(130)に応答して、前記信号が第2の値を有する場合にのみ快適ノイズ(150)にランダムな成分を挿入するための手段とを備えてなることを特徴とするシステム。 - 音声入力(100)を表わす音声パラメータ(114、124)を供給するためのエンコーダ(10)と、供給された音声パラメータ(114、124)に応答して、該音声パラメータに基づいて音声入力を再構成するためのデコーダ(12)とを有する音声通信に用いるための音声コーダであって、
前記エンコーダ(10)が、音声入力(100)に応答して、該音声入力の非音声成分を表わすスペクトルパラメータベクトル(114)とエネルギーパラメータ(124)とを発生するためのスペクトル分析モジュール(20、24)を備え、
前記デコーダ(12)が、前記スペクトルパラメータベクトルおよびエネルギーパラメータに基づいて非音声成分を置き換えるために非音声期間に快適ノイズ(150)を発生するための手段(30、36)を備え、
前記エンコーダ(10)に設けられ、スペクトルパラメータベクトル(114)とエネルギーパラメータ(124)に応答して前記非音声成分が定常であるか、または非定常であるかを決定し、定常である非音声成分を表わす第1の値と、非定常である非音声成分を表わす第2の値とを有する信号(130)を与えるためのノイズ検出器モジュール(28)と、
前記信号(130)に応答して、前記非音声成分が非定常である場合にのみ快適ノイズを修正するために、スペクトルパラメータベクトル(114)およびエネルギーパラメータ(124)の要素にランダムな成分を挿入するためのディザリングモジュール(32、28)
とを備えてなる
ことを特徴とする音声コーダ。 - 音声期間と非音声期間とを有する音声通信に快適ノイズ(150)を発生するための方法であって、音声入力を表わす信号(114、124)が、音声通信を行なうために、送信側から受信側に供給され、前記音声入力が音声成分と非音声成分とを有し、該非音声成分が定常または非定常と分類され、前記快適ノイズが非音声期間に発生され、
前記方法が、
前記送信側において、非音声成分が定常であるか、または非定常であるかを決定する工程(204)と、
送信側において、前記決定の結果を表わすさらなる信号(130)を発生する工程(206)と、
送信側から受信されたさらなる信号(130)に応答して、前記非音声成分がさらなる信号(130)に基づく非定常である場合、前記受信側において快適ノイズを修正する工程(232)
とを含む
ことを特徴とする方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US25317000P | 2000-11-27 | 2000-11-27 | |
PCT/IB2001/002235 WO2002043048A2 (en) | 2000-11-27 | 2001-11-26 | Method and system for comfort noise generation in speech communication |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2004525540A true JP2004525540A (ja) | 2004-08-19 |
JP2004525540A5 JP2004525540A5 (ja) | 2006-01-05 |
JP3996848B2 JP3996848B2 (ja) | 2007-10-24 |
Family
ID=22959162
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002544707A Expired - Lifetime JP3996848B2 (ja) | 2000-11-27 | 2001-11-26 | 音声通信中に快適ノイズを発生するための方法およびシステム |
Country Status (13)
Country | Link |
---|---|
US (1) | US6662155B2 (ja) |
EP (1) | EP1337999B1 (ja) |
JP (1) | JP3996848B2 (ja) |
KR (1) | KR20040005860A (ja) |
CN (1) | CN1265353C (ja) |
AT (1) | ATE336059T1 (ja) |
AU (1) | AU2002218428A1 (ja) |
BR (1) | BR0115601A (ja) |
CA (1) | CA2428888C (ja) |
DE (1) | DE60122203T2 (ja) |
ES (1) | ES2269518T3 (ja) |
WO (1) | WO2002043048A2 (ja) |
ZA (1) | ZA200303829B (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011085851A (ja) * | 2009-10-19 | 2011-04-28 | Nec Corp | 音声復号化切替えシステムおよび音声復号化切替え方法 |
JP2012247810A (ja) * | 2007-09-28 | 2012-12-13 | Huawei Technologies Co Ltd | ノイズ生成装置、方法、及びコンピュータ可読記録媒体 |
JP2017182087A (ja) * | 2013-04-05 | 2017-10-05 | ドルビー・インターナショナル・アーベー | 先進量子化器 |
JP2017199025A (ja) * | 2013-05-30 | 2017-11-02 | 華為技術有限公司Huawei Technologies Co.,Ltd. | 信号符号化方法及びデバイス |
JP2019124951A (ja) * | 2014-07-28 | 2019-07-25 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 快適雑音生成モード選択のための装置および方法 |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3451998B2 (ja) * | 1999-05-31 | 2003-09-29 | 日本電気株式会社 | 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体 |
JP2001242896A (ja) * | 2000-02-29 | 2001-09-07 | Matsushita Electric Ind Co Ltd | 音声符号化/復号装置およびその方法 |
US7012901B2 (en) * | 2001-02-28 | 2006-03-14 | Cisco Systems, Inc. | Devices, software and methods for generating aggregate comfort noise in teleconferencing over VoIP networks |
US7031916B2 (en) * | 2001-06-01 | 2006-04-18 | Texas Instruments Incorporated | Method for converging a G.729 Annex B compliant voice activity detection circuit |
JP4063508B2 (ja) * | 2001-07-04 | 2008-03-19 | 日本電気株式会社 | ビットレート変換装置およびビットレート変換方法 |
CN100466671C (zh) * | 2004-05-14 | 2009-03-04 | 华为技术有限公司 | 语音切换方法及其装置 |
JP4381291B2 (ja) * | 2004-12-08 | 2009-12-09 | アルパイン株式会社 | 車載用オーディオ装置 |
DE102004063290A1 (de) * | 2004-12-29 | 2006-07-13 | Siemens Ag | Verfahren zur Anpassung von Comfort Noise Generation Parametern |
US20070038443A1 (en) * | 2005-08-15 | 2007-02-15 | Broadcom Corporation | User-selectable music-on-hold for a communications device |
US20070136055A1 (en) * | 2005-12-13 | 2007-06-14 | Hetherington Phillip A | System for data communication over voice band robust to noise |
US7573907B2 (en) * | 2006-08-22 | 2009-08-11 | Nokia Corporation | Discontinuous transmission of speech signals |
US20080059161A1 (en) * | 2006-09-06 | 2008-03-06 | Microsoft Corporation | Adaptive Comfort Noise Generation |
KR100834679B1 (ko) * | 2006-10-31 | 2008-06-02 | 삼성전자주식회사 | 음성 인식 오류 통보 장치 및 방법 |
PL2118889T3 (pl) * | 2007-03-05 | 2013-03-29 | Ericsson Telefon Ab L M | Sposób i sterownik do wygładzania stacjonarnego szumu tła |
CN101303855B (zh) * | 2007-05-11 | 2011-06-22 | 华为技术有限公司 | 一种舒适噪声参数产生方法和装置 |
US20090043577A1 (en) * | 2007-08-10 | 2009-02-12 | Ditech Networks, Inc. | Signal presence detection using bi-directional communication data |
US9495971B2 (en) * | 2007-08-27 | 2016-11-15 | Telefonaktiebolaget Lm Ericsson (Publ) | Transient detector and method for supporting encoding of an audio signal |
CN101651752B (zh) * | 2008-03-26 | 2012-11-21 | 华为技术有限公司 | 解码的方法及装置 |
CN101335000B (zh) | 2008-03-26 | 2010-04-21 | 华为技术有限公司 | 编码的方法及装置 |
US8577677B2 (en) * | 2008-07-21 | 2013-11-05 | Samsung Electronics Co., Ltd. | Sound source separation method and system using beamforming technique |
US9253568B2 (en) * | 2008-07-25 | 2016-02-02 | Broadcom Corporation | Single-microphone wind noise suppression |
CN102044241B (zh) * | 2009-10-15 | 2012-04-04 | 华为技术有限公司 | 一种实现通信系统中背景噪声的跟踪的方法和装置 |
CN102044246B (zh) * | 2009-10-15 | 2012-05-23 | 华为技术有限公司 | 一种音频信号检测方法和装置 |
US10230346B2 (en) | 2011-01-10 | 2019-03-12 | Zhinian Jing | Acoustic voice activity detection |
DE102011076484A1 (de) * | 2011-05-25 | 2012-11-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Tonwiedergabevorrichtung mit hörszenariosimulation |
CN103093756B (zh) * | 2011-11-01 | 2015-08-12 | 联芯科技有限公司 | 舒适噪声生成方法及舒适噪声生成器 |
CN103137133B (zh) * | 2011-11-29 | 2017-06-06 | 南京中兴软件有限责任公司 | 非激活音信号参数估计方法及舒适噪声产生方法及系统 |
US20140278380A1 (en) * | 2013-03-14 | 2014-09-18 | Dolby Laboratories Licensing Corporation | Spectral and Spatial Modification of Noise Captured During Teleconferencing |
US9978392B2 (en) * | 2016-09-09 | 2018-05-22 | Tata Consultancy Services Limited | Noisy signal identification from non-stationary audio signals |
US10325588B2 (en) * | 2017-09-28 | 2019-06-18 | International Business Machines Corporation | Acoustic feature extractor selected according to status flag of frame of acoustic signal |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE501981C2 (sv) * | 1993-11-02 | 1995-07-03 | Ericsson Telefon Ab L M | Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler |
FI100932B (fi) * | 1995-04-12 | 1998-03-13 | Nokia Telecommunications Oy | Äänitaajuussignaalien lähetys radiopuhelinjärjestelmässä |
FR2739995B1 (fr) * | 1995-10-13 | 1997-12-12 | Massaloux Dominique | Procede et dispositif de creation d'un bruit de confort dans un systeme de transmission numerique de parole |
US5960389A (en) * | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
US5991718A (en) * | 1998-02-27 | 1999-11-23 | At&T Corp. | System and method for noise threshold adaptation for voice activity detection in nonstationary noise environments |
WO2000011649A1 (en) | 1998-08-24 | 2000-03-02 | Conexant Systems, Inc. | Speech encoder using a classifier for smoothing noise coding |
US6823303B1 (en) | 1998-08-24 | 2004-11-23 | Conexant Systems, Inc. | Speech encoder using voice activity detection in coding noise |
FI105635B (fi) | 1998-09-01 | 2000-09-15 | Nokia Mobile Phones Ltd | Menetelmä taustakohinainformaation lähettämiseksi tietokehysmuotoisessa tiedonsiirrossa |
US7124079B1 (en) | 1998-11-23 | 2006-10-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech coding with comfort noise variability feature for increased fidelity |
-
2001
- 2001-10-02 US US09/970,091 patent/US6662155B2/en not_active Expired - Lifetime
- 2001-11-26 DE DE60122203T patent/DE60122203T2/de not_active Expired - Lifetime
- 2001-11-26 EP EP01997800A patent/EP1337999B1/en not_active Expired - Lifetime
- 2001-11-26 BR BR0115601-2A patent/BR0115601A/pt active IP Right Grant
- 2001-11-26 AU AU2002218428A patent/AU2002218428A1/en not_active Abandoned
- 2001-11-26 ES ES01997800T patent/ES2269518T3/es not_active Expired - Lifetime
- 2001-11-26 CA CA002428888A patent/CA2428888C/en not_active Expired - Lifetime
- 2001-11-26 CN CNB01822203XA patent/CN1265353C/zh not_active Expired - Lifetime
- 2001-11-26 KR KR10-2003-7007026A patent/KR20040005860A/ko active Search and Examination
- 2001-11-26 JP JP2002544707A patent/JP3996848B2/ja not_active Expired - Lifetime
- 2001-11-26 AT AT01997800T patent/ATE336059T1/de active
- 2001-11-26 WO PCT/IB2001/002235 patent/WO2002043048A2/en active IP Right Grant
-
2004
- 2004-05-16 ZA ZA200303829A patent/ZA200303829B/en unknown
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012247810A (ja) * | 2007-09-28 | 2012-12-13 | Huawei Technologies Co Ltd | ノイズ生成装置、方法、及びコンピュータ可読記録媒体 |
JP2011085851A (ja) * | 2009-10-19 | 2011-04-28 | Nec Corp | 音声復号化切替えシステムおよび音声復号化切替え方法 |
JP2017182087A (ja) * | 2013-04-05 | 2017-10-05 | ドルビー・インターナショナル・アーベー | 先進量子化器 |
US10311884B2 (en) | 2013-04-05 | 2019-06-04 | Dolby International Ab | Advanced quantizer |
JP2017199025A (ja) * | 2013-05-30 | 2017-11-02 | 華為技術有限公司Huawei Technologies Co.,Ltd. | 信号符号化方法及びデバイス |
US10692509B2 (en) | 2013-05-30 | 2020-06-23 | Huawei Technologies Co., Ltd. | Signal encoding of comfort noise according to deviation degree of silence signal |
JP2019124951A (ja) * | 2014-07-28 | 2019-07-25 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 快適雑音生成モード選択のための装置および方法 |
JP2021113976A (ja) * | 2014-07-28 | 2021-08-05 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 快適雑音生成モード選択のための装置および方法 |
JP7258936B2 (ja) | 2014-07-28 | 2023-04-17 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 快適雑音生成モード選択のための装置および方法 |
Also Published As
Publication number | Publication date |
---|---|
DE60122203D1 (de) | 2006-09-21 |
US20020103643A1 (en) | 2002-08-01 |
CN1265353C (zh) | 2006-07-19 |
JP3996848B2 (ja) | 2007-10-24 |
BR0115601A (pt) | 2004-12-28 |
AU2002218428A1 (en) | 2002-06-03 |
EP1337999B1 (en) | 2006-08-09 |
ZA200303829B (en) | 2004-07-28 |
ATE336059T1 (de) | 2006-09-15 |
EP1337999A2 (en) | 2003-08-27 |
CA2428888A1 (en) | 2002-05-30 |
CA2428888C (en) | 2007-10-30 |
ES2269518T3 (es) | 2007-04-01 |
US6662155B2 (en) | 2003-12-09 |
WO2002043048A2 (en) | 2002-05-30 |
KR20040005860A (ko) | 2004-01-16 |
DE60122203T2 (de) | 2007-08-30 |
WO2002043048A3 (en) | 2002-12-05 |
CN1513168A (zh) | 2004-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3996848B2 (ja) | 音声通信中に快適ノイズを発生するための方法およびシステム | |
JP4659216B2 (ja) | 忠実度改善のためのコンフォートノイズ変動特性に基づく音声符号化 | |
KR101018952B1 (ko) | 음성 통신 시스템에서의 컴포트 노이즈 생성 방법 및 장치 | |
JPH09503874A (ja) | 減少レート、可変レートの音声分析合成を実行する方法及び装置 | |
EP0786760A2 (en) | Speech coding | |
EP1328928A2 (en) | Apparatus for bandwidth expansion of a speech signal | |
JP2003501925A (ja) | パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置 | |
JP2018084834A (ja) | 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加 | |
KR20080080893A (ko) | 음성신호의 대역폭 확장 제어 방법 및 장치 | |
US20100106490A1 (en) | Method and Speech Encoder with Length Adjustment of DTX Hangover Period | |
WO2000025301A1 (en) | Method and arrangement for providing comfort noise in communications systems | |
JP2003504669A (ja) | 符号化領域雑音制御 | |
CN103680509A (zh) | 一种语音信号非连续传输及背景噪声生成方法 | |
JP4309060B2 (ja) | 背景雑音の再生成を伴う音声符号化 | |
US20050071154A1 (en) | Method and apparatus for estimating noise in speech signals | |
US20050102136A1 (en) | Speech codecs | |
US20060025990A1 (en) | Method and system for improving voice quality of a vocoder | |
CN100369108C (zh) | 编码域中的音频增强的方法和设备 | |
CN117223054A (zh) | 经解码的声音信号中的多声道舒适噪声注入的方法及设备 | |
CN112334980A (zh) | 自适应舒适噪声参数确定 | |
JPH07210199A (ja) | 音声符号化方法および音声符号化装置 | |
Ross et al. | Voice Codec for Floating Point Processor | |
BRPI0115601B1 (pt) | Method for generating comfort noise in voice communication, system, voice decoder and voice encoder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050713 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20051222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060627 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20060925 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20061002 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070717 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070803 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100810 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3996848 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100810 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110810 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110810 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120810 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130810 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |