JP5793636B2 - コンフォート・ノイズの生成 - Google Patents

コンフォート・ノイズの生成 Download PDF

Info

Publication number
JP5793636B2
JP5793636B2 JP2015520857A JP2015520857A JP5793636B2 JP 5793636 B2 JP5793636 B2 JP 5793636B2 JP 2015520857 A JP2015520857 A JP 2015520857A JP 2015520857 A JP2015520857 A JP 2015520857A JP 5793636 B2 JP5793636 B2 JP 5793636B2
Authority
JP
Japan
Prior art keywords
parameters
sid
parameter
subset
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015520857A
Other languages
English (en)
Other versions
JP2015525896A (ja
Inventor
トフトガード, トマス ジャンソン
トフトガード, トマス ジャンソン
Original Assignee
テレフオンアクチーボラゲット エル エム エリクソン(パブル)
テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エル エム エリクソン(パブル), テレフオンアクチーボラゲット エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Publication of JP2015525896A publication Critical patent/JP2015525896A/ja
Application granted granted Critical
Publication of JP5793636B2 publication Critical patent/JP5793636B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Noise Elimination (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • User Interface Of Digital Computer (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

提案技術は、概して、コンフォート・ノイズ(CN:Comfort Noise)の生成、特に、コンフォート・ノイズ制御パラメータの生成に関する。
会話に使用される符号化システムにおいては、符号化効率を高めるために不連続送信(DTX)を使用することが一般的である。これは、例えば、一方の人が話しているときには他方の人は聞いているといった様に、会話に含まれる多くの無音により動機付けられている。DTXを使用することで、音声符号化器は、平均して50%の期間のみアクティブになる。この様な特徴を持つコーデックの例は、3GPPのAMR−NBコーデックや、ITU−T G.718のコーデックである。
DTX動作において、アクティブなフレームは、通常の符号化モードで符号化される一方、アクティブ領域間の、非アクティブな信号期間は、コンフォート・ノイズで表現される。信号記述パラメータが抽出され、符号化器で符号化され、無音挿入記述子(SID:Silence Insertion Description)フレームで復号器に送信される。SIDフレームは、アクティブな音声符号化モードより、削減されたフレーム・レート及び低いビット・レートで送信される。SIDフレーム間では、信号特性の情報は送信されない。低いSIDレートにより、コンフォート・ノイズは、アクティブな信号フレームの符号化と比較して比較的変化の少ない特性を示す。復号器において、受信パラメータは復号され、コンフォート・ノイズを特徴付けるために使用される。
高品質DTX動作のため、つまり、音声品質の劣化を生じなくするため、入力信号の音声期間を検出することが重要である。これは、音声アクティビティ検出器(VAD)又はサウンド・アクティビティ検出器(SAD)により行われる。図1は、(実装に応じて5〜30msである)データ・フレームの入力信号を分析し、各フレームについてのアクティビティの決定を行う、一般的なVADのブロック図である。
主アクティビティ決定(主VAD決定)は、主音声検出器12において、特徴抽出器10によって推定された現フレームの特徴と、背景推定部14によって以前の入力フレームから推定された背景特徴との比較により行われる。所定の閾値より差が大きいことは、アクティビティの主決定の原因となる。ハングオーバ付加部16において、主決定は、過去の主決定に基づき、最終アクティビティ決定(最終VAD決定)を形成するために拡張される。ハングオーバを利用する主な理由は、音声セグメントの中間や最終段のクリッピングのリスクを減らすことである。
例えば、G.718の線形予測(LP)に基づく音声コーデックにおいて、アクティブなフレームのために、似た表現を使用してエンベロープ及びフレームのエネルギーをモデル化することは合理的である。DTX動作の異なるモード間での共通の機能により、コーデックのメモリの要求条件や複雑さを低減することができるので、これは利点である。
その様なコーデックにおいて、コンフォート・ノイズは、そのLP係数(自己回帰(AR)係数としても知られている)及びLPの残留エネルギーにより表現できる。つまり、LPモデルへの入力とする信号は、基準音声セグメントを与える。復号器において、残留信号がランダム・ノイズとして、励起生成器で生成され、ランダム・ノイズは、コンフォート・ノイズを形成するCNパラメータによって成形される。
LP係数は、典型的には、ウィンドウされた(Windowed)音声セグメントx[n]、n=0、・・・、N−1、の自己相関r[k]を以下の様に計算することにより得られる。
ここで、Pは、事前に定義したモデルの次数である。LP係数aは、例えば、レビンソン−ダービン・アルゴリズムを使用した自己相関シーケンスから得られる。
その様なコーデックが使用される通信システムにおいて、LP係数は、符号化器から復号器に効率的に伝送されるべきである。このため、量子化ノイズによりあまり影響されない、よりコンパクトな表現が通常使用される。例えば、LP係数は、ライン・スペクトラム・ペア(LSP)に変換される。他の実装において、LP係数は、イミッタンス・スペクトラム・ペア(ISP)、ライン・スペクトラム周波数(LSP)又はイミッタンス・スペクトラム周波数(ISF)領域に変換される。
LP残留は、基準信号を、以下で定義されるインバースLP合成フィルタA[z]によりフィルタすることで得られる。
結果、フィルタされた残留信号s[n]は、以下の式で与えられる。
ここで、エネルギーは、以下の式で定義される。
SIDフレームの低い伝送レートにより、CNパラメータは、ノイズ特性を急速に変更しない様に、徐々に変化させるべきである。例えば、G.718コーデックは、SIDフレーム間のエネルギーの変更を制限し、これを処理するためLSP係数を補間する。
SIDフレームの代表CNパラメータを見つけるために、LSP係数及び残留エネルギーが、データを含まないフレームを含むフレーム毎に計算される(この様に、データを含まないフレームに対し、既に述べたパラメータは決定されるが伝送はされない。)。SIDフレームにおいて、LSP係数の中央値と残留エネルギーの平均値が計算され、符号化され、復号器に送信される。コンフォート・ノイズを不自然に静的にしないため、ランダムな変化、例えば、残留エネルギーの変化がコンフォート・ノイズ・パラメータに付加される。この技術は、例えば、G.718コーデックで使用されている。
さらに、コンフォート・ノイズ特性は常に基準背景ノイズに適合していないので、コンフォート・ノイズを少し減衰させることで、聞き手のこれに対する注意を減少できる。認識される音声品質は結果として高くなる。さらに、アクティブな信号フレームの符号化されたノイズは、符号化されていない基準ノイズより低いエネルギーとなる。よって、減衰は、アクティブ及び非アクティブなフレームのノイズ表現のより良いエネルギー適合のために望ましい。減衰は、典型的には、0〜5dBの範囲であり、固定的な値でも、アクティブな符号化モードのビット・レートに応じた値でも良い。
高効率DTXシステムにおいて、より積極的なVADが使用され、信号の高エネルギー部分(背景ノイズ・レベルに対して)は、よって、コンフォート・ノイズで表現できる。この場合、SIDフレーム間のエネルギーの変化を制限することは、認識される劣化につながる。高エネルギー部分をより良く処理するため、システムは、これらの環境のためにCNパラメータの瞬間的な大きな変化を許容できる。
自然で滑らかなコンフォート・ノイズの変化を得るために、CNパラメータのロー・パス・フィルタ又は補間が非アクティブなフレームで実行される。1つ以上のアクティブなフレームの後に続く最初のSIDフレーム(以下、第1SIDと呼ぶ。)のために、LSP補間及びエネルギー平滑化は、以前の(つまり、アクティブな信号セグメント以前の)非アクティブなフレームからのCNパラメータに基づくことが最も良い。
SID又はデータを含まない各非アクティブなフレームのため、LSPベクトルqが以前のLSP係数から以下の通り補間される。
=αq SID+(1−α)qi−l (5)
ここで、iは非アクティブなフレームのフレーム番号であり、α∈[0,1]は、平滑化ファクタであり、q SIDは、現SID及び以前のSIDフレーム以後の総てのデータを含まないフレームのパラメータより計算されるLSP係数の中央値である。G.718コーデックは、平滑化ファクタα=0.1を使用している。
同様に、残留エネルギーEは以下の通り、SID又はデータを含まないフレームで補間される。
=βE SID+(1−β)Ei−l (6)
ここで、β∈[0,1]は、平滑化ファクタであり、E SIDは、現SID及び以前のSIDフレーム以後の総てのデータを含まないフレームの平均エネルギーである。G.718コーデックは、平滑化ファクタβ=0.3を使用している。
上述した補間の問題は、第1SIDのために、補間メモリ(Ei−l及びqi−l)が、例えば、VADによって非アクティブと分類された、無音の音声フレームといった、以前の高エネルギー・フレームに関連するかもしれないということである。その場合、第1SIDの補間は、近接したアクティブなモードのハングオーバ・フレームでの符号化ノイズを表さないノイズ特性から開始される。同じ問題は、背景ノイズの特性がアクティブな信号セグメント(例えば、音声信号のセグメント)の間に変換する場合にも生じる。
従来技術に関する問題の例を図2に示す。DTX動作で符号化されたノイズの多い音声信号のスペクトル写真は、(音声の様な)アクティブな符号化オーディオ・セグメントの前後の2つのコンフォート・ノイズのセグメントを示している。最初のCNセグメントからのノイズ特性が第1SIDの補間に使用されると、ノイズ特性の急激な変化が生じることが分かる。ある程度の時間が経過すると、コンフォート・ノイズは、アクティブな符号化音声によく適合しているが、悪い遷移は、認識される音声品質の明らかな劣化をもたらす。
高い平滑化ファクタα及びβを使用することで、現SIDの特性にCNパラメータを合わせることができるが、これは依然問題を生じさせる。第1SIDのパラメータは、それに続くSIDフレームとは異なり、ノイズ期間で平均化できないので、CNパラメータは、現フレームの信号特性に基づくのみである。それらパラメータは、補間メモリの長期特性より現フレームの背景ノイズを良く表すかもしれない。しかし、これらSIDパラメータは異常値であり、長期ノイズ特性を表していないかもしれない。この場合、ノイズ特性の急激で不自然な変化が生じ、認識される音声品質を低くする。
提案する技術は、上述した問題の少なくとも1つを解決する。
提案する技術の第1側面は、CN制御パラメータの生成方法を含む。本方法は、
・所定サイズのバッファにSIDフレーム及びアクティブなハングオーバ・フレームのCNパラメータを格納するステップと、
・格納されたCNパラメータの経時及び残留エネルギーに基づきSIDフレームに関連するCNパラメータのサブセットを決定するステップと、
・アクティブな信号フレームの後に続く第1SIDフレームのCN制御パラメータを決定するために、決定したCNパラメータのサブセットを使用するステップと、
を含む。
提案する技術の第2側面は、CN制御パラメータを生成するコンピュータ・プログラムを含む。コンピュータ・プログラムは、コンピュータが実行すると、当該コンピュータに、
・所定サイズのバッファにSIDフレーム及びアクティブなハングオーバ・フレームのCNパラメータを格納させ、
・格納されたCNパラメータの経時及び残留エネルギーに基づきSIDフレームに関連するCNパラメータのサブセットを決定させ、
・アクティブな信号フレームの後に続く第1SIDフレームのCN制御パラメータを決定するために、決定したCNパラメータのサブセットを使用させる、
コンピュータが読み取り可能なコード部を含む。
提案する技術の第3側面は、コンピュータ可読記憶媒体と、コンピュータ可読記憶媒体に格納された第2側面のコンピュータ・プログラムと、を含むコンピュータ・プログラム製品を含む。
提案する技術の第4側面は、CN制御パラメータを生成するコンフォート・ノイズ制御器を含む。装置は、
・SIDフレーム及びアクティブなハングオーバ・フレームのCNパラメータを格納する様に構成された所定サイズのバッファと、
・格納されたCNパラメータの経時及び残留エネルギーに基づきSIDフレームに関連するCNパラメータのサブセットを決定する様に構成されたサブセット選択器と、
・アクティブな信号フレームの後に続く第1SIDフレームのCN制御パラメータを決定するために、決定したCNパラメータのサブセットを使用する様に構成されたコンフォート・ノイズ制御パラメータ抽出器と、
を含む。
提案する技術の第5側面は、第4側面のコンフォート・ノイズ制御器を有する復号器を含む。
提案する技術の第6側面は、第5側面の復号器を有するネットワーク・ノードを含む。
提案する技術の第7側面は、第4側面のコンフォート・ノイズ制御器を有するネットワーク・ノードを含む。
提案する技術の利点は、DTXモードのコーデックの動作において、アクティブ及び非アクティブな符号化モード間の切り替えでの音声品質を改良することである。コンフォート・ノイズのエンベロープ及び信号エネルギーは、以前のSID及びVADハングオーバ・フレームの同様のエネルギーの以前の信号特性に適合する。
提案する技術と、それらの更なる目的及び利点は、図面を用いて行う以下の記述により、より良く理解される。
一般的なVADのブロック図。 従来技術によるDTX解決法に従い復号されたノイズの多い音声信号のスペクトラム写真の例。 コーデックの符号化システムのブロック図。 提案技術によるコンフォート・ノイズ生成方法を実行する復号器の例示的な形態を示すブロック図。 提案技術により復号されたノイズの多い音声信号のスペクトラム写真の例。 提案技術による方法の例示的な形態を示すフローチャート。 提案技術による方法の別の例示的な形態を示すフローチャート。 提案技術によるコンフォート・ノイズ制御器の例示的な形態を示すブロック図。 提案技術によるコンフォート・ノイズ制御器の別の例示的な形態を示すブロック図。 提案技術によるコンフォート・ノイズ制御器の別の例示的な形態を示すブロック図。 コンピュータによりその機能が実現される復号器の例示的な形態の幾つかの構成要素を示す図。 提案技術によるコンフォート・ノイズ制御器を含むネットワーク・ノードを示すブロック図。
以下の実施形態は、非アクティブな信号表現のためのコンフォート・ノイズを伴うDTXを使用する音声通信アプリケーションのための音声符号化器及び復号器に関する。システムは、アクティブ及び非アクティブな信号フレーム両方の符号化にLPを利用し、アクティビティの決定にVADを利用するものとする。
図3に示す符号化器において、VAD18は、符号化器20が符号化に利用するアクティビティ決定を出力する。さらに、VADハングオーバ決定は、ビットストリーム多重化器(MUX)22によりビットストリームに挿入され、アクティブなフレーム(ハングオーバ・フレーム及び非ハングオーバ・フレーム)及びSIDフレームの符号化パラメータと共に復号器に送信される。
開示する実施形態は、音声復号器の一部である。その様な復号器100を図4に示す。ビットストリーム分離器(DEMUX)24は、受信ビットストリームを符号化パラメータ及びVADハングオーバ決定に分離する。分離された信号は、モード選択器26に転送される。受信した符号化パラメータは、パラメータ復号器28で復号される。復号されたパラメータは、モード選択器26からのアクティブなフレームを復号するため、アクティブ・フレーム復号器30が使用する。
復号器100は、SID及びアクティブなモードのハングオーバ・フレームのためのCNパラメータを受信して格納する様に構成された所定サイズMのバッファ200と、格納されたCNパラメータの経時に基づき、格納されたCNパラメータの内のSIDに関連するCNパラメータを判定する様に構成されたユニット300と、残留エネルギー測定に基づき、判定されたCNパラメータの内のSIDに関連するCNパラメータを判定する様に構成されたユニット400と、SIDに関連すると判定されたCNパラメータを、アクティブな信号フレームの後に続く第1SIDフレームのために使用する様に構成されたユニット500と、を備えている。
バッファのパラメータは、関連性を見るため、時間的に新しいものに制限される。よって、関連するバッファ・サブセットの選択に利用されるバッファのサイズは、アクティブな符号化のより長い期間の間に減少される。さらに、保存されるパラメータは、SID及びアクティブに符号化されたハングオーバ・フレームの間に新しい値に置き換えられる。
循環バッファの利用により、バッファの複雑さ及び容量の要求条件が緩和される。その様な実装において、既に保存された要素は、新しい要素を追加するときに移動させる必要はない。最後に追加したパラメータ又はパラメータ・セットの位置は、新しい要素を保存するためのバッファ・サイズと共に利用される。新しい要素を追加したとき、古い要素は上書きされる。
バッファは、先のSID及びハングオーバ・フレームのパラメータを保持しているので、必然ではないが恐らく背景ノイズを含む以前の音声フレームの信号特性を示している。関連すると考えられるパラメータの数は、情報が保存されてからのバッファのサイズ及び時間、或いは、対応するフレーム数で定義される。
開示する技術は、例えば、図4の復号器が実行する以下の複数のアルゴリズム・ステップで記述される。
1a.ステップ1a(図4のステップ1aと示されたユニットが実行)−SID及びハングオーバ・フレームのためのバッファ更新
各SID及びアクティブなハングオーバ・フレームのために、量子化されたLSP係数ベクトルq及び対応する量子化された残留エネルギーEがバッファQ={q ,・・・,q M−1}及びE={E ,・・・,E M−1}内の(バッファ200に)保存される。つまり、
である。
バッファ位置のインデクスj∈{0,M−1}は、各バッファ更新により1だけ増加され、インデクスがバッファ・サイズMを超えるとリセットされる。つまり、
j=0 if j>M−1 (8)
である。
以下に記述する様に、Q及びEの最後に保存されたK個のサブセットQ及びEは、それぞれ、保存されたパラメータのセットを定義する。
1b.ステップ1b(図4のステップ1bと示されたユニットが実行)−アクティブな非ハングオーバ・フレームのためのバッファ更新
アクティブなフレームの復号の間、サブセットQ及びEのサイズがフレーム毎に、以下の式に従いγ−1の割合で減少される。
ここで、Kは、以前のSID及びハングオーバ・フレームで保存された要素の数であり、
及びpは、連続するアクティブな非ハングオーバ・フレームの数である。減少割合は時間に関連し、ここで、20msのフレームにはγ=25が適している。これは、アクティブなフレームの復号の間、0.5秒毎に1つの要素を減少させることに相当する。減少割合の定数γは、任意の値
として潜在的に定義できるが、現在の背景ノイズを適切に表現しない古いノイズ特性がサブセットQ及びEに含まれない様に、選択すべきである。値は、例えば、背景ノイズの期待される変動に基づき選択されるべきである。さらに、連続するアクティブなフレームの長いシーケンスが予想されない限り、音声バーストの自然な長さ及びVADの振る舞いが考慮される。典型的な定数は、20msのフレームに対してγ≦500であり、10秒より短い。式(9)の代わりとして、以下のよりコンパクトな形を使用できる。
K=K−η n・γ≦p<(η+1)・γ (10)
ここで、Kは、バッファ200に格納されているSIDフレーム及びアクティブなハングオーバ・フレームのCNパラメータの数であり、γは所定の定数であり、ηは、非負の整数である。
ステップ2(図4のステップ2と示されたユニットが実行)−関連するバッファ要素の選択
アクティブなフレームの後に続く第1SIDで、バッファEのサブセットが、残留エネルギーに基づき選択される。サイズLのサブセットE={E ,・・・,E L−l}⊆Eは以下の式で定義される。
ここで、
は、最後に保存された残留エネルギーであり、γ及びγは、それぞれ、アクティブから非アクティブなフレームに遷移するときのノイズを表すと考えられる残留エネルギーの所定の下限及び上限であり(例えば、γ=200で、γ=20)、k〜kK−1は、kが最後に保存されたCNパラメータであり、kK−1は、最も先に保存されたCNパラメータである。
典型的に、γは、範囲γ∈[0,100]から選択され、高い値は、最後に格納された残留エネルギー
と比較して高い残留エネルギーを含んでいる。これは、コンフォート・ノイズの大きな上昇をもたらし、音声品質劣化につながる。大きなエネルギーは、通常、背景ノイズを良く表すものではないので、これら信号特性を音声フレームから除くことが好ましい。エネルギーの逓減は通常気にならないので、γは、γより少しい大きい値、例えば、範囲γ∈[50,500]から選択される。さらに、音声信号特性を含む可能性は、
より小さい残留エネルギーを含むフレームの方が、
より大きい残留エネルギーを含むフレームより小さい。エネルギーE は、線形領域と同様に、対数領域、例えば、dBで表現できる。対数領域でのエネルギーでは、式(11)で特定した様に、関連するバッファ要素の選択は、線形領域でのエネルギーE と同様に記述される。
ここで、log(γ )=−γであり、log(γ )=γである。バッファEのサブセットを特定する適切な境界は、例えば、γ =0.7、γ =1.03、或いは、γ ∈[0.5,0.9]、γ =∈[1.0,1.25]である。LSPバッファQの対応するベクトルは、サブセットQ={q ,・・・,q L−1}を定義する。
スッテプ3(図4のステップ3と示されたユニットが実行)−代表コンフォート・ノイズ・パラメータの決定
代表残留エネルギーを見つけるため、サブセットEの重み付け平均が以下の様に計算される。
ここで、w は、重みサブセットの要素である。
={w ∈w} for ∀j|E ∈E
最大バッファ・サイズM=8に適切な重みセットは、
={0.2,0.16,0.128,0.1024,0.08192,0.065536,0.0524288,0.01048576}である。
これは、残留エネルギーEにおいて最近のエネルギーが大きな重みを有することを意味し、アクティブ及び非アクティブなフレーム間でのエネルギー遷移を滑らかにする。
サブセットQのLSPベクトルの中で、中央のLSPベクトルがサブセット・バッファEの総てのLSPベクトル間の距離を以下の式に従い計算するために使用される。
ここで、q [p]は、ベクトルq の要素である。
各LSPベクトルに対して、他のベクトルとの距離が加算される。つまり、
中央のLSPベクトルは、サブセット・バッファにおいて、他のベクトルとの距離が最も小さいベクトルとして与えられる。つまり、
=q∈Q|S≦S,l≠m}for l,m=0,・・・,L−1(16)
幾つかのベクトルが同じ距離であると、中央のベクトルはそれらから任意の方法で選択される。サブセットQの平均ベクトルを、代わりに、代表LSPベクトルとして決定しても良い。
スッテプ4(図4のステップ4と示されたユニットが実行)−第1SIDフレームのためのコンフォート・ノイズ・パラメータの補間
LSP中央値又は平均ベクトルqと、平均残留エネルギーEは、式(5)及び(6)で述べた様に、以下の式と共に第1SIDフレームのCNパラメータの補間に使用される。
SID及びE SIDの値は、パラメータ復号器28から得られる。第1SIDフレームの平滑化ファクタα∈[0,1]及びβ∈[0,1]は、CNパラメータのその後のSIDフレーム及びデータを含まないフレームの補間で使用されるファクタとは異なり得る。さらに、ファクタは、例えば、サブセットQ及びEのサイズといった、決定されたパラメータq及びEの信頼度を示す尺度に依存する。例えば、適切なパラメータは、α=0.2、β=0.2又は0.05である。第1SIDフレームのコンフォート・ノイズ・パラメータは、モード選択器26からのデータを含まないフレームを、励起生成器34での励起に基づくノイズで埋める制御のため、コンフォート・ノイズ生成器32により使用される。
サブセットQ及びEが空であると、最後に抽出されたSIDパラメータが、より古いノイズパラメータの補間なしに直接使用され得る。
補間に使用される、送信されたLSPベクトルq SIDは、現フレームのLP分析から通常、符号化器において直接取得される。つまり、以前のフレームは考慮されない。送信された残留エネルギーE SIDは、好ましくは、復号器において信号合成に使用されるLSPパラメータに対応するLSPパラメータを使用して取得される。これらLSPパラメータは、対応する符号化器側のバッファを使用し、ステップ1〜4を実行することで符号化器において得ることができる。この様に符号化器を動作させることは、復号器で合成するLPパラメータは符号化器で知られていることにより、符号化され送信された残留エネルギーの制御により、復号器の出力のエネルギーは、入力信号のエネルギーに適合され得る。
図5は、提案技術により復号したノイズの多い音声信号のスペクトラムの写真の例である。図5のスペクトラムは、図2に対応、つまり、符号化器側での同じ入力信号に対するスペクトラムである。従来技術(図2)のスペクトラムと提案解決法(図5)のスペクトラムを比較すると、アクティブな符号化音声と、2番目のコンフォート・ノイズ領域間の遷移は、後者の方が滑らかであることが分かる。この例では、VADハングオーバ・フレームでの信号特性のサブセットを滑らかな遷移を得るために使用した。アクティブなフレームのより短いセグメントの他の信号のために、パラメータ・バッファは、SIDフレームと時間的に近いパラメータを含むかもしれない。
アクティブなフレームの後に続く唯1つのSIDフレームが存在するかもしれないが、平滑化/補間により、後に続くSIDフレームのCNパラメータには間接的に影響する。
図6は、提案技術による方法の例示的なフローチャートである。ステップS1で、SIDフレーム及びアクティブなハングオーバ・フレームのCNパラメータを所定サイズのバッファに格納する。ステップS2で、格納されたCNパラメータの経時及び残留エネルギーに基づき、SIDフレームに関連するCNパラメータのサブセットを決定する。ステップ3で、アクティブな信号フレームの後に続く第1SIDフレームのためのCN制御パラメータを決定するために、決定したCNパラメータのサブセットを使用する。(言い換えると、決定したCNパラメータのサブセットに基づき、アクティブな信号フレームの後に続く第1SIDフレームのCN制御パラメータを決定する。)
図7は、提案技術による方法の別の例示的なフローチャートである。図は、各フレームで実行する方法ステップを示している。バッファの異なる部分(図4の200の様な)は、フレームがアクティブな非ハングオーバ・フレームであるか、SID/ハングオーバ・フレームであるかに応じて更新される。(図4のモード選択器26に対応するステップAとして記載)。フレームがSID又はハングオーバ・フレームであると、ステップ1a(図4でステップ1aとして示すユニットに対応)で、例えば、サブセクション1aで述べた様に、バッファを新しいCNパラメータで更新する。フレームが、アクティブな非ハングオーバ・フレームであると、ステップ1b(図4でステップ1bとして示すユニットに対応)で、連続するアクティブな非ハングオーバ・フレームの数に基づき、格納されたCNパラメータの制限された経時のサブセットのサイズを、例えば、サブセクション1bで述べた様に更新する。ステップ2(図4でステップ2として示すユニットに対応)で、残留エネルギーに基づき、経時が制限されたサブセットからCNパラメータのサブセットを、例えば、サブセクション2で述べた様に選択する。ステップ3(図4でステップ3として示すユニットに対応)で、CNパラメータのサブセットから、代表CNパラメータを、サブセクション3で述べた様に決定する。ステップ4(図4でステップ4として示すユニットに対応)で、代表CNパラメータを復号されたCNパラメータで、例えば、サブセクション4で述べた様に補間する。ステップBで、現フレームを次のフレームと取り換え、取り替えたフレームに対してこれら手順を繰り返す。
図8は、提案技術によるコンフォート・ノイズ制御器50の例示的なブロック図である。所定サイズのバッファ200は、SIDフレーム及びアクティブなハングオーバ・フレームのためのCNパラメータを格納する様に構成されている。サブセット選択器50Aは、格納されたCNパラメータの経時及び残留エネルギーに基づき、SIDフレームに関連するCNパラメータのサブセットを決定する様に構成されている。コンフォート・ノイズ制御パラメータ抽出器50Bは、アクティブな信号フレームの後に続く第1SIDフレーム(第1SID)のためのCN制御パラメータを決定するために、決定したCNパラメータのサブセットを使用する様に構成されている。
図9は、提案技術によるコンフォート・ノイズ制御器50の別の例示的なブロック図である。SID及びハングオーバ・フレーム・バッファ更新器52は、SIDフレーム及びハングオーバ・フレームのために、バッファ200を例えば、サブセクション1aで述べた様に新しいCNパラメータq、Eに更新する様に構成されている。非ハングオーバ・フレーム・バッファ更新器54は、アクティブな非ハングオーバ・フレームために、サブセクション1bで述べた様に、連続するアクティブな非ハングオーバ・フレームの数pに基づき、格納されたCNパラメータの経時が制限されたサブセットQ、EのサイズKを更新する様に構成されている。バッファ要素選択器300は、例えば、サブセクション2で述べた様に、残留エネルギーに基づき、経時が制限されたサブセットQ、EからCNパラメータのサブセットQ,Cを選択する様に構成されている。コンフォート・ノイズ・パラメータ推定器400は、サブセクション3で述べた様に、CNパラメータのサブセットQ,Cから、代表CNパラメータq,Eを決定する様に構成されている。コンフォート・ノイズ・パラメータ補間器500は、サブセクション4で述べた様に、代表CNパラメータq,Eを復号されたCNパラメータq SID,E SIDで補間する様に構成されている。第1SIDフレームのために得られたコンフォート・ノイズ制御パラメータq,Eは、励起生成器34からの励起に基づくノイズで、データを含まないフレームを埋める制御のために、コンフォート・ノイズ生成器32で使用される。
記述したステップ、機能、手順及び/又はブロックは、汎用電子回路、アプリケーションに特化した回路を含む、個別回路やIC技術の様な、従来技術で使用するハードウェアで実現され得る。
或いは、記述した少なくとも幾つかのステップ、機能、手順及び/又はブロックは、適切なプロセッサ装置により実行されるソフトウェアとして実現され得る。この装置は、例えば、1つ以上のマイクロ・プロセッサ、1つ以上のDSP、1つ以上のASIC、ビデオ・アクセラレータ・ハードウェア、或いは、フィールド・プルグラマブル・ゲート・アレイ(FPGA)の様な、1つ以上の適切なプログラマブル論理回路により実現され得る。それらの組み合わせでも実現可能である。
移動端末やPC等のネットワーク・ノードに既に存在する一般的な処理能力を再利用することも可能であることが理解されるべきである。例えば、既存のソフトウェアの再ブログラミングや、新しいソフトウェア・コンポーネントを追加することにより為され得る。
図10は、提案技術によるコンフォート・ノイズ制御器50の別の例示的なブロック図である。この例は、CN制御パラメータを生成するコンピュータ・プログラムを実行するマイクロ・プロセッサといった、プロセッサ62に基づく。プログラムは、メモリ64に格納されている。プログラムは、所定サイズのバッファにSIDフレーム及びアクティブなハングオーバ・フレームのCNパラメータを格納するためのコード部66と、格納されたCNパラメータの経時及び残留エネルギーに基づき、SIDフレームに関連するCNパラメータのサブセットを決定するコード部68と、アクティブな信号フレームの後に続く第1SIDフレームのためのCN制御パラメータを決定するために、決定したCNパラメータのサブセットを使用するコード部70と、を有する。プロセッサ62は、システム・バスを介してメモリ64と通信する。入力p、q、E、q SID、E SIDは、プロセッサ62及びメモリ64に接続されるI/Oバスを制御する入出力(I/О)制御器72が受信する。プログラムにより得られたCN制御パラメータq,Eは、メモリ64からI/Oバスを介してI/O制御器72により出力される。
本実施形態によると、非アクティブな信号を示すコンフォート・ノイズを生成する復号器が提供される。復号器は、DTXモードで動作でき、移動端末又はPCに実装されるコンピュータ・プログラム製品によって、移動端末に実装され得る。コンピュータ・プログラム製品は、サーバから移動端末にダウンロードできる。
図11は、復号器100の例示的な幾つかの構成要素を示し、復号器の機能は、コンピュータにより実現される。コンピュータは、コンピュータ・プログラム製品に保存されたコンピュータ・プログラムに含まれるソフトウェア命令を実行できるプロセッサ62を含む。さらに、コンピュータは、例えば、EEPROM、フラッシュメモリ、ディスクドライブ、RAMといった、不揮発性メモリ64又は揮発性メモリの形態で少なくとも1つのコンピュータ・プログラム製品を含んでいる。コンピュータ・プログラムは、所定サイズのバッファに、SID及びアクティブなハングオーバ・フレームのためのCNパラメータ格納でき、格納されたCNパラメータの経時及び残留エネルギーの測定値に基づき、格納されたCNパラメータのどれが、SIDに関連するかを判定し、アクティブな信号フレームの後に続く第1SIDのCNパラメータを推定するのに、SIDに関連すると判定したCNパラメータを使用する。
図12は、提案技術によるコンフォート・ノイズ制御器50を含むネットワーク・ノード80を示すブロック図である。ネットワーク・ノード80は、典型的には、移動端末やPCの様なユーザ装置(UE)である。コンフォート・ノイズ制御器50は、点線で示す復号器100内に設けられる。代わりに、上述した様に符号化器に設けることもできる。
提案技術での上述した実施形態において、LP係数aはLSP領域に変換されていた。しかし、同様の原理が、LSF、ISP又はISF領域に変換するLSP係数に適用され得る。
コンフォート・ノイズの減衰を伴うコーデックのため、VADハングオーバ・フレームの間に、アクティブな符号化信号を徐々に減衰させることの利点がある。コンフォート・ノイズのエネルギーは、最後のアクティブな符号化フレームによりよく適合するので、認識される音声品質をさらに改良することができる。減衰ファクタλは、ハングオーバ・フレーム毎に以下の様に計算され、LP残留に適用できる。
s[n]=λ・s[n] (18)
λ=max(0.6,1/(1+0.1pHO)) (19)
ここで、pHOは、連続するVADハングオーバ・フレームの数である。代わりに、λは、以下の式により計算され得る。
ここで、L=0.6及びL=6は、減衰量及び減衰速度を最大に制御する。最大の減衰量は、典型的には、L=[0.5,1)の範囲から選択され、減衰レート制御パラメータLは、例えば、L=L・PFULL HO/(1−L)の様に選択され、ここで、PFULL HOは、最大減衰量とするために必要なフレーム数である。PFULL HOは、例えば、有り得るVADハングオーバ・フレームの連続数(VADに加えるハングオーバに依存)の平均値又は最大値に設定され得る。典型的には、PFULL HO={1,・・・,15}フレームの範囲である。
ここで記述した技術は、アクティブな信号セグメントの後に続く最初のCNフレームを処理する他の解決策と共に動作させることができることを理解すべきである。例えば、(背景ノイズ・レベルに対して)高いエネルギーのフレームのためにCNパラメータの大きな変化が許容されているアルゴリズムの補完とすることができる。これらのフレームのために、以前のノイズ特性は、現SIDフレームの更新にそれほど影響を与えない。記述した技術は、高いエネルギーのフレームとして検出されなかったフレームに使用され得る。
当業者は、発明の範囲から逸脱することなく、提案技術に種々の修正及び変更を加えることができることを理解すべきであり、本発明の範囲は特許請求の範囲により定義される。
略語
ACELP 代数符号励振線形予測
AMR 適応多重レート
AMR NB 適応多重レート 狭帯域
AR 自己回帰
ASIC 特定用途向け集積回路
CN コンフォート・ノイズ
DFT 離散フーリエ変換
DSP ディジタル信号プロセッサ
DTX 不連続送信
EEPROM 電気的に消去可能なPROM
FPGA フィールド・プログラマブル・ゲート・アレイ
ISF イミッタンス・スペクトラム周波数
ISP イミッタンス・スペクトラム・ペア
LP 線形予測
LSF ライン・スペクトラム周波数
LSP ライン・スペクトラム・ペア
MDCT 修正離散コサイン変換
RAM ランダム・アクセス・メモリ
SAD 音声アクティビティ復号器
SID 無音挿入記述子
UE ユーザ装置
VAD 音声アクティビティ検出器

Claims (15)

  1. コンフォート・ノイズ(CN)制御パラメータの生成方法であって、
    所定サイズ(M)のバッファ(200)に無音挿入記述子(SID)フレーム及びアクティブなハングオーバ・フレームのCNパラメータ(q ,E )を格納するステップ(S1;1a)と、
    前記格納されたCNパラメータの経時及び残留エネルギーに基づきSIDフレームに関連するCNパラメータのサブセット(Q,E)を決定するステップ(S2,1b,2)と、
    アクティブな信号フレームの後に続く第1SIDフレーム(第1SID)のCN制御パラメータ(q,E)を決定するために、前記決定したCNパラメータのサブセット(Q,E)を使用するステップ(S3,3,4)と、
    を含み、
    前記方法は、さらに、
    SIDフレーム及びアクティブなハングオーバ・フレームのために、前記バッファ(200)を新しいCNパラメータ(q ,E )で更新するステップ(1a)と、
    アクティブな非ハングオーバ・フレームのために、連続するアクティブな非ハングオーバ・フレームの数p に基づき、前記格納されたCNパラメータの経時が制限されたサブセット(Q ,E )のサイズKを更新するステップ(1b)と、
    残留エネルギーに基づき、前記経時が制限されたサブセット(Q ,E )から前記CNパラメータのサブセット(Q ,E )を選択するステップ(2)と、
    前記CNパラメータのサブセット(Q ,E )から代表CNパラメータ(q ,E )を決定するステップ(3)と、
    前記代表CNパラメータ(q ,E )を復号されたCNパラメータ(q SID ,E SID )で補間するステップと、
    を含むことを特徴とする生成方法。
  2. アクティブな非ハングオーバ・フレームのために、前記経時が制限されたサブセット(Q,E)のサイズKを、
    K=K−η for η・γ≦p<(η+1)・γ
    と更新し(1b)、
    ここで、
    は、前記バッファ(200)に格納されたSIDフレーム及びアクティブなハングオーバ・フレームのCNパラメータの数であり、
    γは、所定の定数であり、
    ηは、非負の整数である、
    ことを特徴とする請求項に記載の生成方法。
  3. 前記経時が制限されたサブセット(Q,E)から、
    のCNパラメータのみを含む前記CNパラメータのサブセット(Q,E)を選択(2)し、
    ここで、
    は、最後に保存された残留エネルギーであり、
    γ及びγは、それぞれ、アクティブから非アクティブなフレーム遷移する際のノイズを表現すると考えられる残留エネルギーの所定の下限値及び上限値であり、
    ,・・・,kK−1は、kが最後に格納されたCNパラメータであり、kK−1が最も先に格納されたCNパラメータの様に並べられていることを特徴とする請求項又はに記載の生成方法。
  4. 前記CNパラメータのサブセット(Q,E)から代表CNパラメータq,Eを決定(3)し、
    ここで、
    は、自己回帰(AR)係数を示す前記CNパラメータのサブセット(Q,E)のベクトル・セットQの中央ベクトルであり、
    は、前記選択したCNパラメータのサブセット(Q,E)の残留エネルギーのセットEの重み付けされた平均残留エネルギーであることを特徴とする請求項からのいずれか1項に記載の生成方法。
  5. 前記中央ベクトルq〜は、前記AR係数を、ライン・スペクトラム・ペアとして表現することを特徴とする請求項4に記載の生成方法。
  6. コンフォート・ノイズ(CN)制御パラメータを生成するための、コンピュータが読み取り可能なコード部を有するコンピュータ・プログラムであって、
    前記コンピュータ・プログラムをコンピュータで実行することで、前記コンピュータに、
    所定サイズ(M)のバッファ(200)に無音挿入記述子(SID)フレーム及びアクティブなハングオーバ・フレームのCNパラメータ(q ,E )を格納(66;S1;1a)させ、
    前記格納されたCNパラメータの経時及び残留エネルギーに基づきSIDフレームに関連するCNパラメータのサブセット(Q,E)を決定(68;S2;1b,2)させ、
    アクティブな信号フレームの後に続く第1SIDフレーム(第1SID)のCN制御パラメータ(q,E)を決定するために、前記決定したCNパラメータのサブセット(Q,E)を使用(68;S3;3,4)させ
    前記コンピュータ・プログラムは、前記コンピュータで実行することで、前記コンピュータに、
    SIDフレーム及びアクティブなハングオーバ・フレームのために、前記バッファ(200)を新しいCNパラメータ(q ,E )で更新させ、
    アクティブな非ハングオーバ・フレームのために、連続するアクティブな非ハングオーバ・フレームの数p に基づき、前記格納されたCNパラメータの経時が制限されたサブセット(Q ,E )のサイズKを更新させ、
    残留エネルギーに基づき、前記経時が制限されたサブセット(Q ,E )から前記CNパラメータのサブセット(Q ,E )を選択させ、
    前記CNパラメータのサブセット(Q ,E )から代表CNパラメータ(q ,E )を決定させ、
    前記代表CNパラメータ(q ,E )を復号されたCNパラメータ(q SID ,E SID )で補間させる、
    コンピュータが読み取り可能なコード部を有することを特徴とするコンピュータ・プログラム。
  7. 求項に記載のコンピュータ・プログラムを格納していることを特徴とするコンピュータ可読記憶媒体
  8. コンフォート・ノイズ(CN)制御パラメータを生成するコンフォート・ノイズ制御器(50)であって、
    無音挿入記述子(SID)フレーム及びアクティブなハングオーバ・フレームのCNパラメータ(q ,E )を格納する様に構成された所定サイズ(M)のバッファ(200)と、
    前記格納されたCNパラメータの経時及び残留エネルギーに基づき、SIDフレームに関連するCNパラメータのサブセット(Q,E)を決定する様に構成されたサブセット選択器(50A;54,300)と、
    アクティブな信号フレームの後に続く第1SIDフレーム(第1SID)のCN制御パラメータ(q,E)を決定するために、前記決定したCNパラメータのサブセット(Q,E)を使用する様に構成されたコンフォート・ノイズ制御パラメータ抽出器(50B;400,500)と、
    SIDフレーム及びアクティブなハングオーバ・フレームのために、前記バッファ(200)を新しいCNパラメータ(q ,E )で更新する様に構成されたSID及びハングオーバ・フレーム・バッファ更新器(52)と、
    アクティブな非ハングオーバ・フレームのために、連続するアクティブな非ハングオーバ・フレームの数p に基づき、前記格納されたCNパラメータの経時が制限されたサブセット(Q ,E )のサイズKを更新する様に構成された非ハングオーバ・フレーム・バッファ更新器(54)と、
    残留エネルギーに基づき、前記経時が制限されたサブセット(Q ,E )から前記CNパラメータのサブセット(Q ,E )を選択する様に構成されたバッファ要素選択器(300)と、
    前記CNパラメータのサブセット(Q ,E )から代表CNパラメータ(q ,E )を決定する(3)様に構成されたコンフォート・ノイズ・パラメータ推定器(400)と、
    前記代表CNパラメータ(q ,E )を復号されたCNパラメータ(q SID ,E SID )で補間する様に構成されたコンフォート・ノイズ・パラメータ補間器(500)と
    を備えていることを特徴とするコンフォート・ノイズ制御器。
  9. 前記バッファ要素選択器(300)は、アクティブな非ハングオーバ・フレームのために、前記経時が制限されたサブセット(Q,E)のサイズKを、
    K=K−η for η・γ≦p<(η+1)・γ
    と更新する様に構成され、
    ここで、
    は、前記バッファ(200)に格納されたSIDフレーム及びアクティブなハングオーバ・フレームのCNパラメータの数であり、
    γは、所定の定数であり、
    ηは、非負の整数である、
    ことを特徴とする請求項に記載のコンフォート・ノイズ制御器(50)。
  10. 前記バッファ要素選択器(300)は、
    前記経時が制限されたサブセット(Q,E)から
    のCNパラメータのみを含む前記CNパラメータのサブセット(Q,E)を選択する様に構成され、
    ここで、
    は、最後に保存された残留エネルギーであり、
    γ及びγは、それぞれ、アクティブから非アクティブなフレーム遷移する際のノイズを表現すると考えられる残留エネルギーの所定の下限値及び上限値であり、
    ,・・・,kK−1は、kが最後に格納されたCNパラメータであり、kK−1が最も先に格納されたCNパラメータの様に並べられていることを特徴とする請求項又はに記載のコンフォート・ノイズ制御器(50)。
  11. 前記コンフォート・ノイズ・パラメータ推定器(400)は、前記CNパラメータのサブセット(Q,E)から代表CNパラメータq,Eを決定する様に構成され、
    ここで、
    は、自己回帰(AR)係数を示す前記CNパラメータのサブセット(Q,E)のベクトル・セットQの中央ベクトルであり、
    は、前記選択したCNパラメータのサブセット(Q,E)の残留エネルギーのセットEの重み付けされた平均残留エネルギーであることを特徴とする請求項から10のいずれか1項に記載のコンフォート・ノイズ制御器(50)。
  12. 請求項から11のいずれか1項に記載のコンフォート・ノイズ制御器(50)を含むことを特徴とする復号器(100)。
  13. 請求項12に記載の復号器(100)を含むことを特徴とするネットワーク・ノード(80)。
  14. 請求項から11のいずれか1項に記載のコンフォート・ノイズ制御器(50)を含むことを特徴とするネットワーク・ノード(80)。
  15. 前記ネットワーク・ノードは移動端末であることを特徴とする請求項13又は14に記載のネットワーク・ノード(80)。
JP2015520857A 2012-09-11 2013-05-07 コンフォート・ノイズの生成 Active JP5793636B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261699448P 2012-09-11 2012-09-11
US61/699,448 2012-09-11
PCT/EP2013/059514 WO2014040763A1 (en) 2012-09-11 2013-05-07 Generation of comfort noise

Publications (2)

Publication Number Publication Date
JP2015525896A JP2015525896A (ja) 2015-09-07
JP5793636B2 true JP5793636B2 (ja) 2015-10-14

Family

ID=48289221

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015520857A Active JP5793636B2 (ja) 2012-09-11 2013-05-07 コンフォート・ノイズの生成

Country Status (24)

Country Link
US (5) US9443526B2 (ja)
EP (2) EP2823479B1 (ja)
JP (1) JP5793636B2 (ja)
KR (1) KR101648290B1 (ja)
CN (1) CN104584120B (ja)
AP (1) AP2015008251A0 (ja)
AU (1) AU2013314636B2 (ja)
BR (1) BR112015002826B1 (ja)
CA (1) CA2884471C (ja)
CL (1) CL2015000540A1 (ja)
DK (1) DK2823479T3 (ja)
ES (2) ES2547457T3 (ja)
HK (1) HK1206861A1 (ja)
HU (1) HUE027963T2 (ja)
IN (1) IN2014DN08789A (ja)
MA (1) MA37890B1 (ja)
MX (1) MX340634B (ja)
MY (1) MY185490A (ja)
PH (1) PH12014502232A1 (ja)
PL (2) PL2823479T3 (ja)
PT (1) PT2823479E (ja)
RU (2) RU2658544C1 (ja)
SG (1) SG11201500595TA (ja)
WO (1) WO2014040763A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX340634B (es) * 2012-09-11 2016-07-19 Ericsson Telefon Ab L M Generacion de confort acustico.
PL3550562T3 (pl) * 2013-02-22 2021-05-31 Telefonaktiebolaget Lm Ericsson (Publ) Sposoby i urządzenia dla zawieszenia DTX w kodowaniu audio
CN104217723B (zh) * 2013-05-30 2016-11-09 华为技术有限公司 信号编码方法及设备
US9775110B2 (en) * 2014-05-30 2017-09-26 Apple Inc. Power save for volte during silence periods
CN106575511B (zh) 2014-07-29 2021-02-23 瑞典爱立信有限公司 用于估计背景噪声的方法和背景噪声估计器
GB2532041B (en) * 2014-11-06 2019-05-29 Imagination Tech Ltd Comfort noise generation
EP3815082B1 (en) * 2018-06-28 2023-08-02 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive comfort noise parameter determination
US10805191B2 (en) 2018-12-14 2020-10-13 At&T Intellectual Property I, L.P. Systems and methods for analyzing performance silence packets
CN116348951A (zh) * 2020-07-30 2023-06-27 弗劳恩霍夫应用研究促进协会 用于编码音频信号或用于解码经编码音频场景的设备、方法及计算机程序
WO2024056701A1 (en) * 2022-09-13 2024-03-21 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive stereo parameter synthesis

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5630016A (en) * 1992-05-28 1997-05-13 Hughes Electronics Comfort noise generation for digital communication systems
US5794199A (en) * 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission
US6269331B1 (en) * 1996-11-14 2001-07-31 Nokia Mobile Phones Limited Transmission of comfort noise parameters during discontinuous transmission
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
AU1352999A (en) 1998-12-07 2000-06-26 Mitsubishi Denki Kabushiki Kaisha Sound decoding device and sound decoding method
GB2356538A (en) * 1999-11-22 2001-05-23 Mitel Corp Comfort noise generation for open discontinuous transmission systems
US7610197B2 (en) * 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
US20100106490A1 (en) * 2007-03-29 2010-04-29 Jonas Svedberg Method and Speech Encoder with Length Adjustment of DTX Hangover Period
CN101335000B (zh) * 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
EP4243017A3 (en) * 2011-02-14 2023-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method decoding an audio signal using an aligned look-ahead portion
AU2012218778B2 (en) * 2011-02-15 2016-10-20 Voiceage Evs Llc Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a celp codec
MX340634B (es) * 2012-09-11 2016-07-19 Ericsson Telefon Ab L M Generacion de confort acustico.

Also Published As

Publication number Publication date
US20160293170A1 (en) 2016-10-06
US10381014B2 (en) 2019-08-13
US10891964B2 (en) 2021-01-12
PT2823479E (pt) 2015-10-08
US20170352354A1 (en) 2017-12-07
PL2823479T3 (pl) 2015-10-30
HUE027963T2 (en) 2016-11-28
CA2884471A1 (en) 2014-03-20
PH12014502232B1 (en) 2014-12-15
JP2015525896A (ja) 2015-09-07
EP2927905B1 (en) 2017-07-12
ES2547457T3 (es) 2015-10-06
MY185490A (en) 2021-05-19
RU2658544C1 (ru) 2018-06-22
EP2823479A1 (en) 2015-01-14
EP2823479B1 (en) 2015-07-08
MX2015003060A (es) 2015-07-14
US9779741B2 (en) 2017-10-03
US11621004B2 (en) 2023-04-04
US20190318752A1 (en) 2019-10-17
KR101648290B1 (ko) 2016-08-12
US9443526B2 (en) 2016-09-13
WO2014040763A1 (en) 2014-03-20
MA37890B1 (fr) 2017-11-30
DK2823479T3 (en) 2015-10-12
MA37890A1 (fr) 2016-12-30
IN2014DN08789A (ja) 2015-05-22
AU2013314636B2 (en) 2016-02-25
ES2642574T3 (es) 2017-11-16
RU2609080C2 (ru) 2017-01-30
SG11201500595TA (en) 2015-04-29
CL2015000540A1 (es) 2015-07-31
RU2014150326A (ru) 2016-07-10
BR112015002826A2 (pt) 2018-05-22
HK1206861A1 (zh) 2016-01-15
AU2013314636A1 (en) 2015-03-19
AP2015008251A0 (en) 2015-02-28
BR112015002826B1 (pt) 2021-05-04
CA2884471C (en) 2016-12-20
CN104584120A (zh) 2015-04-29
PL2927905T3 (pl) 2017-12-29
CN104584120B (zh) 2016-08-31
US20150235648A1 (en) 2015-08-20
MX340634B (es) 2016-07-19
KR20150054716A (ko) 2015-05-20
US20210166704A1 (en) 2021-06-03
PH12014502232A1 (en) 2014-12-15
EP2927905A1 (en) 2015-10-07

Similar Documents

Publication Publication Date Title
JP5793636B2 (ja) コンフォート・ノイズの生成
KR102237718B1 (ko) 시간 영역 디코더에서 양자화 잡음을 감소시키기 위한 디바이스 및 방법
CN107818789B (zh) 解码方法和解码装置
RU2701075C1 (ru) Устройство обработки аудиосигнала, способ обработки аудиосигнала и программа обработки аудиосигнала
JP6584431B2 (ja) 音声情報を用いる改善されたフレーム消失補正
RU2742739C1 (ru) Выбор задержки основного тона
TWI587287B (zh) 柔和噪音產生模式選擇之裝置與方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150626

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150731

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150810

R150 Certificate of patent or registration of utility model

Ref document number: 5793636

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250