JP2010520503A - 通信ネットワークにおける方法及び装置 - Google Patents

通信ネットワークにおける方法及び装置 Download PDF

Info

Publication number
JP2010520503A
JP2010520503A JP2009551925A JP2009551925A JP2010520503A JP 2010520503 A JP2010520503 A JP 2010520503A JP 2009551925 A JP2009551925 A JP 2009551925A JP 2009551925 A JP2009551925 A JP 2009551925A JP 2010520503 A JP2010520503 A JP 2010520503A
Authority
JP
Japan
Prior art keywords
post
post filter
spectral
reconstructed
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009551925A
Other languages
English (en)
Other versions
JP5291004B2 (ja
Inventor
ヴォロディア グランチャロフ,
Original Assignee
テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Publication of JP2010520503A publication Critical patent/JP2010520503A/ja
Application granted granted Critical
Publication of JP5291004B2 publication Critical patent/JP5291004B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/013Adapting to target pitch
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephonic Communication Services (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Abstract

本発明は、ポストフィルタと、音声デコーダで再構成された音声の知覚品質を改善するポストフィルタに関連するポストフィルタ制御部とに関する。ポストフィルタ制御部は、デコーダで再構成された音声信号の定常性を測定する手段と、測定された定常性に基づいて、ポストフィルタ制御パラメータに対する係数を決定する手段と、ポストフィルタが決定された係数をポストフィルタ制御パラメータに適用することによって再構成された音声の信号を処理して改善された音声の信号を得ることができるように、決定された係数をポストフィルタに送信する手段とを有する。

Description

本発明は、音声(speech)及びオーディオ(audio)符号化において使用されるポストフィルタのアルゴリズムに関する。具体的には、本発明は、改良されたポストフィルタを提供する方法及び装置に関する。
音声又はオーディオを送信する通信ネットワークにおいて、図3に示すように、原音声100又はオーディオは、送信機におけるエンコーダ101で符号化され、符号化されたビットストリーム102が受信機に送信される。受信機では、符号化されたビットストリーム102がデコーダ103で復号化され、再構成音声(又はオーディオ)104信号として原音声又はオーディオ信号が再構成される。音声・オーディオ符号化は、再構成した音声の品質を損なう量子化雑音を発生する。このために、ポストフィルタ・アルゴリズム105が採用される。現状技術のポストフィルタ・アルゴリズム105は、なるべく聞こえないように、量子化雑音を形成する。それ故、従来のポストフィルタは、強調された音声信号106を提供して、デコーダで再構成された音声信号の知覚品質を改善している。ポストフィルタ技術の概要については、非特許文献1に見ることができる。
従来のポストフィルタでは、信号マスキングの概念を有効に使用している。信号マスキングは、人間の聴覚系の重要な現象である。その意味するところは、音は、より強力な音が存在すると聞こえない、ということである。一般的には、マスキング閾値はそのトーンの周波数でピークを持ち、そのピークの両側で単調に減少する。これは、トーン周波数(音声ホルマント)に近傍の雑音成分は、ずっと離れた(スペクトルの谷の)他の雑音成分よりも高い強度を持っていてもよい、ということを意味する。この理由により、従来のポストフィルタは、自己回帰(AR)係数及び/又はピッチ周期の形式において、音声のフォルマント及び/又はピッチ構造に対して、フレーム単位で適応化する。
最も一般的なポストフィルタは、フォルマント(短期)・ポストフィルタ及びピッチ(長期)・ポストフィルタである。フォルマント・ポストフィルタは、フォルマント周波数を強調し、スペクトルの谷を減衰することにより、量子化雑音の影響を軽減する。これを図1に示すが、連続線はポストフィルタリング前の信号の自己回帰包絡を示し、破線はポストフィルタリング後の信号の自己回帰包絡を示す。ピッチ・ポストフィルタは、図2に示すピッチ高調波ピークでの周波数成分を強調する。図2の実線はポストフィルタリング前の信号のスペクトル、破線はポストフィルタリング後の信号のスペクトルを示す。図1及び2のプロットは狭帯域信号からの30msブロックに関する。また注意すべきは、図1及び2のプロットは実際のポストフィルタのパラメータを示すものではなく、単にポストフィルタリングの概念を示す、ということである。
フォルマント及び/又はピッチは、マスクされた(又は少し聴こえる、あるいは、完全に聴こえる)信号の部分を示すと暗示する1フレームに、どれだけのエネルギが分配されているかを示している。それ故、従来のポストフィルタ・パラメータ適応は、信号マスキング概念を有効に使用しており、フォルマント周波数及びピッチ高調波ピークのような音声構造に適応する。これらはイン・フレーム特徴(例えば、ピッチ高調波ピークを与えるピッチ周期及びフォルマントを決定する自己回帰係数)であり、音声は現在のフレーム(例えば、20ms音声)の間は定常的であるという仮定の下で計算したものである。
信号マスキングに加えて、重要な心理音響現象は、信号動特性が高ければ、歪みから受ける不快さは少ない、ということである。このことは、音声信号の速い変化によって雑音が聴覚的にマスクされる、ということを意味する。音声信号の速い変化によって雑音を聴覚的にマスクするというこの概念は、非特許文献2では音声符号化のために、そして、非特許文献3では音声品質改善のために既に使用されている。非特許文献2では、線スペクトル周波数(LSF)量子化に、スペクトル動特性への適応化が使用されている。非特許文献3では、背景雑音低減のための前処理部でスペクトル動特性への適応化が使用されている。
J. H. Chen, A. Gersho, "Adaptive postfiltering for quality enhancement of coded speech", IEEE Trans. Speech Audio Process., vol. 3, pp. 58-71, 1985 H. Knagenhjelm, W. B. Kleijin, "Spectral dynamics is more important than spectral distortion", ICASSP, vol. 1, pp. 732-735, 1995 T. Quateri, R. Dunn, "Speech enhancement based on auditory spectral change", ICASSP, vol. 1, pp. 257-260, 2002 3GPP2 C.S0052-A: "Source-Controlled Variable-Rate Multimode Wideband Speech Codec(VMR-WB), Service Option 62 or 63 for Spread Spectrum Systems", 2005
しかしながら、従来のポストフィルタの手法では、音声情報内容が高いときは抑圧は小さくし、信号が定常状態モードにある場合に抑圧を強く行うべきである、という事実を考慮に入れていない。
したがって、本発明は、再構成音声の知覚品質を改善することである。
本発明は、改善したポストフィルタ制御パラメータにより、この目的を達成し、信号定常性に基づいて決定した係数を従来のポストフィルタ制御パラメータに適用して、改善したポストフィルタ制御パラメータを達成している。
本発明の第1の側面によれば、ポストフィルタ制御のための方法が提供される。この方法は、音声デコーダで再構成された音声の知覚品質を改善するもので、前記デコーダで再構成された音声の信号の定常性を測定するステップと、前記測定された定常性に基づいて、ポストフィルタ制御パラメータに対する係数を決定するステップと、ポストフィルタが前記決定された係数を前記ポストフィルタ制御パラメータに適用することによって前記再構成された音声の信号を処理して改善された音声の信号を得ることができるように、前記決定された係数を前記ポストフィルタに送信するステップとを有する。
本発明の第2の側面によれば、音声デコーダで再構成された音声の知覚品質を改善するための、ポストフィルタにおいて実行される方法が提供される。この方法は、ポストフィルタのために決定された係数を受信するステップと、改善された音声の信号を得るために、前記決定された係数をポストフィルタ制御パラメータに適用することによって前記再構成された音声の信号を処理するステップとを有し、前記係数は、デコーダで再構成された音声の信号の定常性の尺度に基づいて決定されることを特徴とする。
本発明の第3の側面によれば、音声デコーダで再構成された音声の知覚品質を改善するためのポストフィルタに関連するポストフィルタ制御装置が提供される。このポストフィルタ制御装置は、前記デコーダで再構成された音声の信号の定常性を測定する手段と、前記測定された定常性に基づいて、ポストフィルタ制御パラメータに対する係数を決定する手段と、ポストフィルタが前記決定された係数を前記ポストフィルタ制御パラメータに適用することによって前記再構成された音声の信号を処理して改善された音声の信号を得ることができるように、前記決定された係数を前記ポストフィルタに送信する手段とを有する。
本発明の第4の側面によれば、音声デコーダで再構成された音声の知覚品質を改善するためのポストフィルタが提供される。このポストフィルタは、前記ポストフィルタのために決定された係数を受信する手段と、改善された音声の信号を得るために、前記決定された係数をポストフィルタ制御パラメータに適用することによって前記再構成された音声の信号を処理する処理手段とを有し、前記係数は、デコーダで再構成された音声の信号の定常性の尺度に基づいて決定されることを特徴とする。
本発明によれば、スペクトル動特性に対するポストフィルタ・パラメータの適応を、従来のポストフィルタと互換性のある簡単な方法で実現することができる。
従来技術による、再構成信号に及ぼすフォルマント・ポストフィルタの効果を示す図。 従来技術による、再構成信号に及ぼすピッチ・ポストフィルタの効果を示す図。 従来技術によるポストフィルタを有するエンコーダ−デコーダを概略的に示す図。 本発明の実施形態のポストフィルタ制御部を有する、図1によるエンコーダ−デコーダを概略的に示す図。 本発明の実施形態によるポストフィルタ制御部及びポストフィルタを概略的に示す図。 本発明による方法を示すフローチャート。
本発明の基本的概念は、復号した音声信号のスペクトル動特性に適応するよう既存のポストフィルタを修正することである。(なお、本明細書で音声(speech)という用語を使用していても、それは、あらゆるオーディオ信号にも関連するものである。)スペクトル動特性は信号の定常性の評価尺度を意味し、隣接する2つの音声セグメントのスペクトル密度間のユークリッド距離として定義される。もし2つの音声セグメント間のユークリッド距離が高ければ、ユークリッド距離が低い場合の状況に比較して、減衰を弱めるべきである。
本発明による修正ポストフィルタにより、例えばフォルマント遷移及び母音開始の間で、動特性が低い場合にはより多くの雑音を抑圧し、動特性が高い場合には抑圧を小さくするということが可能となる。
これは、量子化雑音の平均レベルは短時間で急速に変化はしないであろうという事実を想定しているが、信号の幾つかの部分では雑音が他の部分よりも聞こえるであろう。
注意すべきは、ポストフィルタ制御部は、信号マスキング現象によって動機付けされる従来のポストフィルタ適応を置換するのではなく、人間の聴覚系の付加的な特徴を活用した補完的な適応であり、これによって、従来のポストフィルタの品質を改善する、ということである。
したがって、本発明によれば、ポストフィルタを復号化信号のスペクトル動特性に適応させるためのポストフィルタ制御部が使用される。本発明の実施形態を図4に示す。図4では、デコーダ201及びポストフィルタ202が示されている。符号化ビットストリーム203がデコーダ201に入力され、デコーダ201は、符号化ビットストリーム203を復号化し音声信号204を再構成する。ポストフィルタ制御部206は、信号定常性を測定し、係数208(以下、Kと表示する)を決定してポストフィルタ202に送信する。ポストフィルタ202は、復号化信号のスペクトル動特性にポストフィルタが適応するよう、従来のポストフィルタ・パラメータをポストフィルタ制御部206からの係数208によって変更して使用し、再構成された音声信号を処理する。
以下に、一つの実施形態によるポストフィルタ制御部の実装を開示する。この実装は、米国特許出願公開第2005/0165603A1号に記載されたピッチ・ポストフィルタに基づいている。また、このポストフィルタについては、非特許文献4の154ページ(式6.3.1−1及び6.3.1−2)に記載されている。このピッチ・ポストフィルタは次の形式を持つ。
^sf(k) = (1-α)^s(k)+(α/2)(^s(k-T)+^s(k+T))
ただし、^sfは、ポストフィルタ出力205、
^s は、ポストフィルタ入力204、
T は、ピッチ周期、
k は、1フレームにおける音声サンプルのインデクス、
αは、減衰制御パラメータ208である(これは、非特許文献4のように、正規化ピッチ相関の関数とすることができる。)。
少なくとも、全てのポストフィルタは、改善された音声を得るため調整された制御パラメータαを持つ。なお、この制御パラメータは、非特許文献4に記載されたαに限定されない。αのこの調整はリスニングテストに基づいてもよい。上述したピッチ・ポストフィルタでは、ピッチは有声フレームに存在するので、制御パラメータαの値は、ピッチがどれだけ安定であるか(有声性の程度)に依存する。
演算量の観点から、隣接フレーム間のスペクトル距離を計算する代わりに、この実装では、イミタンス・スペクトル周波数(ISF)距離を計算する。ISFは自己回帰係数(線形予測係数とも呼ばれる)の表現である。
もう一つの一般に使用される表現は、線スペクトル周波数(LSF)である。隣接フレームのISF又はLSF間の距離は、スペクトル動特性の近似である。これらはスペクトル包絡のパラメトリック表現だからである。
非特許文献4の第151頁では、ISF距離を計算して下記の安定性係数θに変換している。
Figure 2010520503
この安定性係数θはまさにISF距離の正規化であり、従って、本発明の実施形態におけるスペクトル動特性を決定するために使用される。もっとも、LSFのような他の評価尺度をスペクトル動特性を決定するために使用してもよい。式中“past”という表示は、それが前の音声フレームからのISFベクトルであることを示している。このθと、θ_smoothと表示されるθのローパスバージョンを使用して、2個のパラメータΨ1及びΨ2を決定する。θ_smoothは、現フレーム及び前フレームよりも前からの信号定常性を測定するので、重要である。これらの2個のパラメータΨ1及びΨ2を使用して、減衰制御パラメータのための係数Kを決定する。この実施形態によれば、この係数は、
K = (1+0.15Ψ1-2.0Ψ2)
で表され、新たなパラメータαstab_adapt=Kαである。
上式から決定されるαstab_adaptは従来の制御パラメータを置き換える。Kは、Ψ1とΨ2との線形結合として定義される。Ψ1は現フレームと前フレームとの間のスペクトル距離を表す。Ψ2は、その距離が過去の複数フレームのローパス距離(θsmooth)に対してどれだけ離れているかを表す。
すなわち、
αstab_adapt = (1+0.15Ψ1-2.0Ψ2
Ψ2 = |θsmooth-θ|
Ψ1 = √θ
θsmooth = 0.8θ+0.2θpast smooth
したがって、本発明は、図5に示されるようなポストフィルタ制御部に関する。ポストフィルタ制御部300は、デコーダで再構成された音声の信号の定常性を測定する手段301と、測定した定常性に基づき、ポストフィルタ制御パラメータに対する係数Kを決定する手段302と、決定された係数をポストフィルタに送信する手段303とを有する。これにより、ポストフィルタは、決定された係数を用いて再構成された音声の信号を処理し、改善された音声の信号を得ることが可能になる。
また、本発明のポストフィルタ304は、ポストフィルタ・プロセッサ305と、ポストフィルタのために決定された係数Kを受信する手段306とを有し、そして、ポストフィルタ・プロセッサ305は、改善された音声の信号を得るために、デコーダで再構成された音声の信号の測定された定常性に基づいて決定された係数Kを適用して再構成された音声の信号を処理する手段307を有する。
さらに、本発明は、ポストフィルタ・プロセッサにおける方法にも関する。本方法を図6aのフローチャートに示す。本方法は以下のステップを備える。
401.デコーダで再構成された音声の信号の定常性を測定する。
402.測定した定常性に基づき、ポストフィルタ制御パラメータに対する係数を決定する。
403.決定した係数をポストフィルタに送信する。これによりポストフィルタは、決定した係数をポストフィルタ制御パラメータに対して適用することにより、再構成された音声の信号を処理して、改善された音声の信号を得ることができる。
また、図6bのフローチャートに示すように、ポストフィルタのための方法が提供される。本方法は以下のステップを備える。
404.ポストフィルタのために決定された係数を受信する。
405.デコーダで再構成された音声の信号の測定された定常性に基づいて決定された係数を、ポストフィルタ制御パラメータに適用することにより、再構成された音声の信号を処理して、改善された音声の信号を得る。
本発明は、上述した好適な実施形態に限定されない。各種の代替、変更、均等物を使用することが可能である。したがって、本発明の範囲が上述の実施形態に限定されると解釈するべきではない。本発明の範囲は添付の特許請求の範囲によって定義される。

Claims (20)

  1. 音声デコーダで再構成された音声の知覚品質を改善するための方法であって、
    前記デコーダで再構成された音声の信号の定常性を測定するステップと、
    前記測定された定常性に基づいて、ポストフィルタ制御パラメータに対する係数を決定するステップと、
    ポストフィルタが前記決定された係数を前記ポストフィルタ制御パラメータに適用することによって前記再構成された音声信号を処理して改善された音声信号を得ることができるように、前記決定された係数を前記ポストフィルタに送信するステップと、
    を有することを特徴とする方法。
  2. 前記決定された係数は、スペクトル動特性の近似に基づくことを特徴とする請求項1に記載の方法。
  3. 前記スペクトル動特性の近似は、イミタンス・スペクトル周波数であることを特徴とする請求項2に記載の方法。
  4. 前記決定された係数は、現フレームと前フレームとの間のスペクトル距離の尺度である第1のパラメータと、前記スペクトル距離が過去の複数フレームのローパス・スペクトル距離θsmoothに対してどれだけ離れているかの尺度である第2のパラメータとの線形結合であることを特徴とする請求項1乃至3のいずれか1項に記載の方法。
  5. 前記ポストフィルタ制御パラメータは、正規化ピッチ相関の関数であることを特徴とする請求項1に記載の方法。
  6. 音声デコーダで再構成された音声の知覚品質を改善するための、ポストフィルタにおいて実行される方法であって、
    前記ポストフィルタのために決定された係数を受信するステップと、
    改善された音声信号を得るために、前記決定された係数をポストフィルタ制御パラメータに適用することによって前記再構成された音声の信号を処理するステップと、
    を有し、
    前記係数は、前記デコーダで再構成された音声の信号の定常性の尺度に基づいて決定されることを特徴とする方法。
  7. 前記決定された係数は、スペクトル動特性の近似に基づくことを特徴とする請求項6に記載の方法。
  8. 前記スペクトル動特性の近似は、イミタンス・スペクトル周波数であることを特徴とする請求項7に記載の方法。
  9. 前記決定された係数は、現フレームと前フレームとの間のスペクトル距離の尺度である第1のパラメータと、前記スペクトル距離が過去の複数フレームのローパス・スペクトル距離θsmoothに対してどれだけ離れているかの尺度である第2のパラメータとの線形結合であることを特徴とする請求項6乃至8のいずれか1項に記載の方法。
  10. 前記ポストフィルタ制御パラメータは、正規化ピッチ相関の関数であることを特徴とする請求項6に記載の方法。
  11. 音声デコーダで再構成された音声の知覚品質を改善するためのポストフィルタに関連するポストフィルタ制御装置であって、
    前記デコーダで再構成された音声の信号の定常性を測定する手段と、
    前記測定された定常性に基づいて、ポストフィルタ制御パラメータに対する係数を決定する手段と、
    前記ポストフィルタが前記決定された係数を前記ポストフィルタ制御パラメータに適用することによって前記再構成された音声の信号を処理して改善された音声の信号を得ることができるように、前記決定された係数を前記ポストフィルタに送信する手段と、
    を有することを特徴とするポストフィルタ制御装置。
  12. スペクトル動特性の近似に基づいて前記係数を決定する手段を有することを特徴とする請求項11に記載のポストフィルタ制御装置。
  13. 前記スペクトル動特性の近似は、イミタンス・スペクトル周波数であることを特徴とする請求項12に記載のポストフィルタ制御装置。
  14. 前記決定された係数は、現フレームと前フレームとの間のスペクトル距離の尺度である第1のパラメータと、前記スペクトル距離が過去の複数フレームのローパス・スペクトル距離θsmoothに対してどれだけ離れているかの尺度である第2のパラメータとの線形結合であることを特徴とする請求項11乃至13のいずれか1項に記載のポストフィルタ制御装置。
  15. 前記ポストフィルタ制御パラメータは、正規化ピッチ相関の関数であることを特徴とする請求項11に記載のポストフィルタ制御装置。
  16. 音声デコーダで再構成された音声の知覚品質を改善するためのポストフィルタであって、
    前記ポストフィルタのために決定された係数を受信する手段と、
    改善された音声の信号を得るために、前記決定された係数をポストフィルタ制御パラメータに適用することによって前記再構成された音声の信号を処理するプロセッサと、
    を有し、
    前記係数は、前記デコーダで再構成された音声の信号の定常性の尺度に基づいて決定されることを特徴とするポストフィルタ。
  17. 前記決定された係数は、スペクトル動特性の近似に基づくことを特徴とする請求項16に記載のポストフィルタ。
  18. 前記スペクトル動特性の近似は、イミタンス・スペクトル周波数であることを特徴とする請求項17に記載のポストフィルタ。
  19. 前記決定された係数は、現フレームと前フレームとの間のスペクトル距離の尺度である第1のパラメータと、前記スペクトル距離が過去の複数フレームのローパス・スペクトル距離θsmoothに対してどれだけ離れているかの尺度である第2のパラメータとの線形結合であることを特徴とする請求項16乃至18のいずれか1項に記載のポストフィルタ。
  20. 前記ポストフィルタ制御パラメータは、正規化ピッチ相関の関数であることを特徴とする請求項16に記載のポストフィルタ。
JP2009551925A 2007-03-02 2007-11-01 通信ネットワークにおける方法及び装置 Active JP5291004B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US89267007P 2007-03-02 2007-03-02
US60/892,670 2007-03-02
PCT/EP2007/061796 WO2008107027A1 (en) 2007-03-02 2007-11-01 Methods and arrangements in a telecommunications network

Publications (2)

Publication Number Publication Date
JP2010520503A true JP2010520503A (ja) 2010-06-10
JP5291004B2 JP5291004B2 (ja) 2013-09-18

Family

ID=39027449

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009551925A Active JP5291004B2 (ja) 2007-03-02 2007-11-01 通信ネットワークにおける方法及び装置

Country Status (9)

Country Link
US (3) US20100145692A1 (ja)
EP (2) EP2535894B1 (ja)
JP (1) JP5291004B2 (ja)
CN (1) CN101622668B (ja)
DK (1) DK2535894T3 (ja)
ES (2) ES2394515T3 (ja)
MX (1) MX2009008055A (ja)
PL (1) PL2535894T3 (ja)
WO (1) WO2008107027A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013533983A (ja) * 2010-07-02 2013-08-29 ドルビー・インターナショナル・アーベー 選択的バスポストフィルタ
JP2016513270A (ja) * 2013-01-29 2016-05-12 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 符号化信号を処理する装置および方法、並びに符号化信号を生成するエンコーダおよび方法
JP7504216B2 (ja) 2020-04-24 2024-06-21 テレフオンアクチーボラゲット エルエム エリクソン(パブル) 低域ポストフィルタの低コストな適応化

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013073230A (ja) * 2011-09-29 2013-04-22 Renesas Electronics Corp オーディオ符号化装置
US9978392B2 (en) * 2016-09-09 2018-05-22 Tata Consultancy Services Limited Noisy signal identification from non-stationary audio signals
CN115188388B (zh) * 2022-07-11 2024-05-17 北京百瑞互联技术股份有限公司 一种音频后置滤波方法、装置、存储介质及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61184912A (ja) * 1985-02-12 1986-08-18 Nec Corp 定数可変型聴感的重み付けフイルタ
JPH1097299A (ja) * 1996-09-24 1998-04-14 Sony Corp ベクトル量子化方法、音声符号化方法及び装置、並びに音声復号化方法
JPH10116097A (ja) * 1996-10-11 1998-05-06 Olympus Optical Co Ltd 音声再生装置
WO2005081231A1 (en) * 2004-02-23 2005-09-01 Nokia Corporation Coding model selection

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3035565A1 (de) * 1980-09-20 1982-05-06 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren zur nichtlinearen zeitanpassung von signalverlaeufen
JP2595495B2 (ja) * 1982-09-03 1997-04-02 日本電気株式会社 パタンマッチング装置
US4624008A (en) * 1983-03-09 1986-11-18 International Telephone And Telegraph Corporation Apparatus for automatic speech recognition
CA1299750C (en) * 1986-01-03 1992-04-28 Ira Alan Gerson Optimal method of data reduction in a speech recognition system
US5533052A (en) * 1993-10-15 1996-07-02 Comsat Corporation Adaptive predictive coding with transform domain quantization based on block size adaptation, backward adaptive power gain control, split bit-allocation and zero input response compensation
US5715372A (en) * 1995-01-10 1998-02-03 Lucent Technologies Inc. Method and apparatus for characterizing an input signal
US5774849A (en) * 1996-01-22 1998-06-30 Rockwell International Corporation Method and apparatus for generating frame voicing decisions of an incoming speech signal
SE506034C2 (sv) * 1996-02-01 1997-11-03 Ericsson Telefon Ab L M Förfarande och anordning för förbättring av parametrar representerande brusigt tal
EP0909442B1 (en) * 1996-07-03 2002-10-09 BRITISH TELECOMMUNICATIONS public limited company Voice activity detector
US6075475A (en) * 1996-11-15 2000-06-13 Ellis; Randy E. Method for improved reproduction of digital signals
SE9700772D0 (sv) * 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
US5987406A (en) * 1997-04-07 1999-11-16 Universite De Sherbrooke Instability eradication for analysis-by-synthesis speech codecs
FR2764469B1 (fr) * 1997-06-09 2002-07-12 France Telecom Procede et dispositif de traitement optimise d'un signal perturbateur lors d'une prise de son
JP3601653B2 (ja) * 1998-03-18 2004-12-15 富士通株式会社 情報検索装置および方法
US6556967B1 (en) * 1999-03-12 2003-04-29 The United States Of America As Represented By The National Security Agency Voice activity detector
CA2290037A1 (en) * 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
US6633845B1 (en) * 2000-04-07 2003-10-14 Hewlett-Packard Development Company, L.P. Music summarization system and method
US6959056B2 (en) * 2000-06-09 2005-10-25 Bell Canada RFI canceller using narrowband and wideband noise estimators
AU2002222406A1 (en) * 2001-01-17 2002-07-30 Koninklijke Philips Electronics N.V. Robust checksums
US7010052B2 (en) * 2001-04-16 2006-03-07 The Ohio University Apparatus and method of CTCM encoding and decoding for a digital communication system
US6941263B2 (en) * 2001-06-29 2005-09-06 Microsoft Corporation Frequency domain postfiltering for quality enhancement of coded speech
FR2835125B1 (fr) * 2002-01-24 2004-06-18 Telediffusion De France Tdf Procede d'evaluation d'un signal audio numerique
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
DE60325595D1 (de) * 2002-07-01 2009-02-12 Koninkl Philips Electronics Nv Von der stationären spektralleistung abhängiges audioverbesserungssystem
GB2392358A (en) * 2002-08-02 2004-02-25 Rhetorical Systems Ltd Method and apparatus for smoothing fundamental frequency discontinuities across synthesized speech segments
FI20021936A (fi) * 2002-10-31 2004-05-01 Nokia Corp Vaihtuvanopeuksinen puhekoodekki
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
WO2004084181A2 (en) * 2003-03-15 2004-09-30 Mindspeed Technologies, Inc. Simple noise suppression model
EP1610676A4 (en) * 2003-03-26 2010-06-16 Biotechplex Corp INSTANT AUTONOMOUS NERVOUS FUNCTION AND CARDIAC PREDICTABILITY BASED ON ANALYSIS OF HEART AND PULSE FREQUENCY VARIABILITY
US7363221B2 (en) * 2003-08-19 2008-04-22 Microsoft Corporation Method of noise reduction using instantaneous signal-to-noise ratio as the principal quantity for optimal estimation
GB0326263D0 (en) * 2003-11-11 2003-12-17 Nokia Corp Speech codecs
EP1852851A1 (en) 2004-04-01 2007-11-07 Beijing Media Works Co., Ltd An enhanced audio encoding/decoding device and method
CN1677493A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
WO2006020560A2 (en) * 2004-08-09 2006-02-23 Nielsen Media Research, Inc Methods and apparatus to monitor audio/visual content from various sources
KR100631608B1 (ko) * 2004-11-25 2006-10-09 엘지전자 주식회사 음성 판별 방법
EP1686561B1 (en) * 2005-01-28 2012-01-04 Honda Research Institute Europe GmbH Determination of a common fundamental frequency of harmonic signals
JP5203933B2 (ja) * 2005-04-21 2013-06-05 ディーティーエス・エルエルシー オーディオ雑音を減少させるシステムおよび方法
PL1897085T3 (pl) * 2005-06-18 2017-10-31 Nokia Technologies Oy System i sposób adaptacyjnej transmisji parametrów szumu łagodzącego w czasie nieciągłej transmisji mowy
EP1931169A4 (en) * 2005-09-02 2009-12-16 Japan Adv Inst Science & Tech POST-FILTER FOR A MICROPHONE MATRIX
CA2972808C (en) * 2008-07-10 2018-12-18 Voiceage Corporation Multi-reference lpc filter quantization and inverse quantization device and method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61184912A (ja) * 1985-02-12 1986-08-18 Nec Corp 定数可変型聴感的重み付けフイルタ
JPH1097299A (ja) * 1996-09-24 1998-04-14 Sony Corp ベクトル量子化方法、音声符号化方法及び装置、並びに音声復号化方法
JPH10116097A (ja) * 1996-10-11 1998-05-06 Olympus Optical Co Ltd 音声再生装置
WO2005081231A1 (en) * 2004-02-23 2005-09-01 Nokia Corporation Coding model selection
JP2007523388A (ja) * 2004-02-23 2007-08-16 ノキア コーポレイション エンコーダ、エンコーダを有するデバイス、エンコーダを有するシステム、オーディオ信号を符号化する方法、モジュール、およびコンピュータプログラム製品

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9595270B2 (en) 2010-07-02 2017-03-14 Dolby International Ab Selective post filter
US9396736B2 (en) 2010-07-02 2016-07-19 Dolby International Ab Audio encoder and decoder with multiple coding modes
JP2013533983A (ja) * 2010-07-02 2013-08-29 ドルビー・インターナショナル・アーベー 選択的バスポストフィルタ
US9343077B2 (en) 2010-07-02 2016-05-17 Dolby International Ab Pitch filter for audio signals
US9830923B2 (en) 2010-07-02 2017-11-28 Dolby International Ab Selective bass post filter
US9552824B2 (en) 2010-07-02 2017-01-24 Dolby International Ab Post filter
US9558753B2 (en) 2010-07-02 2017-01-31 Dolby International Ab Pitch filter for audio signals
US9858940B2 (en) 2010-07-02 2018-01-02 Dolby International Ab Pitch filter for audio signals
US11996111B2 (en) 2010-07-02 2024-05-28 Dolby International Ab Post filter for audio signals
US9224403B2 (en) 2010-07-02 2015-12-29 Dolby International Ab Selective bass post filter
US9558754B2 (en) 2010-07-02 2017-01-31 Dolby International Ab Audio encoder and decoder with pitch prediction
US10236010B2 (en) 2010-07-02 2019-03-19 Dolby International Ab Pitch filter for audio signals
US10811024B2 (en) 2010-07-02 2020-10-20 Dolby International Ab Post filter for audio signals
US11183200B2 (en) 2010-07-02 2021-11-23 Dolby International Ab Post filter for audio signals
US11610595B2 (en) 2010-07-02 2023-03-21 Dolby International Ab Post filter for audio signals
JP2016513270A (ja) * 2013-01-29 2016-05-12 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 符号化信号を処理する装置および方法、並びに符号化信号を生成するエンコーダおよび方法
JP7504216B2 (ja) 2020-04-24 2024-06-21 テレフオンアクチーボラゲット エルエム エリクソン(パブル) 低域ポストフィルタの低コストな適応化

Also Published As

Publication number Publication date
US9076453B2 (en) 2015-07-07
US20130132075A1 (en) 2013-05-23
US8731917B2 (en) 2014-05-20
ES2533626T3 (es) 2015-04-13
JP5291004B2 (ja) 2013-09-18
CN101622668A (zh) 2010-01-06
US20100145692A1 (en) 2010-06-10
MX2009008055A (es) 2009-08-18
US20140249808A1 (en) 2014-09-04
EP2535894A1 (en) 2012-12-19
CN101622668B (zh) 2012-05-30
DK2535894T3 (en) 2015-04-13
EP2115742B1 (en) 2012-09-12
EP2115742A1 (en) 2009-11-11
WO2008107027A1 (en) 2008-09-12
EP2535894B1 (en) 2015-01-07
ES2394515T3 (es) 2013-02-01
PL2535894T3 (pl) 2015-06-30

Similar Documents

Publication Publication Date Title
CN109545236B (zh) 改进时域编码与频域编码之间的分类
JP4112027B2 (ja) 再生成位相情報を用いた音声合成
US9454974B2 (en) Systems, methods, and apparatus for gain factor limiting
KR101345695B1 (ko) 대역폭 확장 출력 데이터를 생성하기 위한 장치 및 방법
EP1997101B1 (en) Method and system for reducing effects of noise producing artifacts
US8391212B2 (en) System and method for frequency domain audio post-processing based on perceptual masking
US20060116874A1 (en) Noise-dependent postfiltering
US9589576B2 (en) Bandwidth extension of audio signals
JPH1097296A (ja) 音声符号化方法および装置、音声復号化方法および装置
US9076453B2 (en) Methods and arrangements in a telecommunications network
US10672411B2 (en) Method for adaptively encoding an audio signal in dependence on noise information for higher encoding accuracy

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101001

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120730

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130603

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130606

R150 Certificate of patent or registration of utility model

Ref document number: 5291004

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250