JP4376489B2 - コード化音声の品質向上のための周波数領域ポストフィルタリングの方法、装置及び記録媒体 - Google Patents

コード化音声の品質向上のための周波数領域ポストフィルタリングの方法、装置及び記録媒体 Download PDF

Info

Publication number
JP4376489B2
JP4376489B2 JP2002192639A JP2002192639A JP4376489B2 JP 4376489 B2 JP4376489 B2 JP 4376489B2 JP 2002192639 A JP2002192639 A JP 2002192639A JP 2002192639 A JP2002192639 A JP 2002192639A JP 4376489 B2 JP4376489 B2 JP 4376489B2
Authority
JP
Japan
Prior art keywords
gain
linear prediction
frequency domain
vector
prediction coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002192639A
Other languages
English (en)
Other versions
JP2003108196A (ja
Inventor
ウォン ホン
カッパーマン ウラジミール
ガーショ アレン
エー.カリル ホサム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2003108196A publication Critical patent/JP2003108196A/ja
Application granted granted Critical
Publication of JP4376489B2 publication Critical patent/JP4376489B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、コード化音声の品質向上のための周波数領域ポストフィルタリングの方法、装置及び記録媒体に関する。より詳細には、信号の品質を向上するための信号フィルタリングの技術分野に関し、合成音声信号をポストフィルタして音声信号の品質を向上する、コード化音声の品質向上のための周波数領域ポストフィルタリングの方法、装置及び記録媒体に関する。
【0002】
【従来の技術】
電子信号の生成は、電子技術および電気技術のすべての領域に行き渡っている。電気信号を使用して実在の量をエミュレートし、送信し、または再現するとき、信号の品質が重要となる。例えば、音声はしばしば、マイクロフォンまたは他の音声変換器を介して受信され、電気的表現または信号に変換される。この変換の直接的な結果として導入される人工的雑音に加えて、他の人工的雑音が伝送中、符号化中、および/または復号化中に信号中に導入されることがある。このような雑音はしばしば人間にとって可聴であり、実際に、聴取者の気をそらし、または不快にさせる程度にまで、再現した音声信号よりも優位となることがある。
【0003】
音声コーダ、特に低ビットレートで動作する音声コーダは、可聴となる可能性のある量子化雑音を導入し、それによって回復される音声の品質を損なう傾向がある。一般にはポストフィルタを使用して、そのような信号のフォルマントおよび微細構造を高めることによってコード化音声信号中の雑音をマスクする。一般には、信号の強力なフォルマント領域中の雑音は不可聴であるのに対して、信号の2つの隣接するフォルマントの間の谷領域の雑音は、谷領域の信号対雑音比(SNR)が低いので知覚可能である。現在の線形予測(LP)モデリング方法は、谷よりも山をより正確に表し、かつ利用可能なビットが谷の信号を十分に表すには不十分であるので、谷領域のSNRは、低ビットレートコーデックの状況ではさらに低くなることがある。したがって、可聴な雑音レベルを低減するために、音声ポストフィルタが山を保持しながら谷を減衰することが望ましい。
【0004】
Juin−Hwey Chenらは、短期ポストフィルタにカスケード接続されたポールゼロ(pole-zero)長期ポストフィルタからなる適応ポストフィルタリングアルゴリズムを提案した。この短期ポストフィルタは、スペクトル谷の雑音を減衰するように、LPモデルのパラメータから導出される。これらのパラメータは、線形予測コーディング係数、またはLPC(linear predictive coding)係数、またはLPCパラメータと呼ばれる。加えて、Wangらは、スペクトル谷の雑音を抑制するための周波数領域適応ポストフィルタリングアルゴリズムを発表した。前述のポストフィルタリングアルゴリズムは、大きなスペクトルひずみを導入することなく雑音を低減するが、特に8kbps未満で動作するような低ビットレートコーダの状況において、フォルマント間の深い谷ではなく、浅い谷の知覚可能な雑音を低減するには十分ではない。この欠点の主な理由は、ポストフィルタ自体の周波数応答がスペクトルエンベロープの詳細な微細構造に十分に追従せず、近接するフォルマント間の浅い谷をマスクしてしまうことである。
【0005】
典型的な初期の時間領域LPCポストフィルタリングアーキテクチャを図1に示す。入力ビットストリームは、おそらく符号器から送信され、復号器100で受信される。復号器100に関連するビットストリーム復号器110は、着信ビットストリームを復号化する。このステップにより、ビットストリームがその論理構成要素または仮想チャネルコンテントに分離される。例えば、ビットストリーム復号器110は、線形予測ベースのコーデックに対するコード化励起信号から、LPC係数を分離する。復号化されたLPC係数は、時間領域ポストフィルタ130の第1ステージであるフォルマントフィルタ131に送られる。音声シンセサイザ120によって生成される合成音声信号は、フォルマントフィルタ131と、その後に続くピッチフィルタ132に入力され、信号の調波ピッチ構造が高められる。ピッチフィルタに縦続接続されたチルト補償モジュール133は、一般にフォルマントフィルタのバックグラウンドチルトを除去し、ポストフィルタの望ましくないひずみを回避するために設けられる。最後に、隣接するフレームでの信号出力の不連続を解消するために、利得コントローラ134で利得制御が信号に適用される。
【0006】
【発明が解決しようとする課題】
しかしながら、従来の音声ポストフィルタリングシステムで表されるポストフィルタアーキテクチャの周波数応答は、音声スペクトルの詳細な微細構造に十分に追従せず、かつスペクトルエンベロープの山および谷を必ずしも十分には分解しない。
【0007】
本発明は、このような問題に鑑みてなされたもので、その目的とするところは、合成音声信号をポストフィルタして音声信号の品質を向上する、コード化音声の品質向上のための周波数領域ポストフィルタリングの方法、装置及び記録媒体を提供することにある。
【0008】
【課題を解決するための手段】
本発明は、周波数領域でポストフィルタする方法であって、ポストフィルタがLPCから導出される方法を提供する。さらに、スペクトル構造を効率的に向上させるために、LPCスペクトルの非線形変換を適用してポストフィルタを導出する。バックグラウンドスペクトルチルトの非線型変換による不規則なスペクトル膨張を回避するために、チルト計算および補償は、フォルマントポストフィルタを適用する前に実施することが好ましい。最後に、エイリアシングを回避するために、本発明は時間領域でのアンチエイリアシング手順を提供する。最初の実施結果は、この方法が信号品質、特に音声スペクトルの低出力領域に起因する信号の部分の品質を著しく改善することを示している。
【0009】
一般には、音声信号および他の信号の信号フィルタリングは、時間領域または周波数領域で実行することができる。時間領域では、フィルタ適用は、信号を表すベクトルと、フィルタのインパルス応答を表すベクトルを組み合わせるたたみこみを実行し、フィルタした信号に対応する第3ベクトルを生成することと同等である。それとは対照的に、周波数領域では、フィルタを信号に適用する操作は、単に信号のスペクトルにフィルタのスペクトルを掛けることと同等である。したがって、フィルタのスペクトルが詳細に信号のスペクトルを保持する場合、信号のフィルタリングは、信号の微細構造およびフォルマントを保持する。具体的には、音声スペクトルに存在する谷は、フィルタ後のスペクトルから決して完全に消滅せず、かつ谷の代わりにローカルピークに変換されることもないことになる。これは、本発明のポストフィルタがスペクトル中の点の順序を保持する性質を有するためである。フィルタ前のスペクトル中の、近隣より大きいスペクトル点は、フィルタ後のスペクトル中でも依然として大きいが、その2つの点の間の差はフィルタにより変化する可能性がある。
【0010】
したがって、本明細書で説明するポストフィルタは、全体的なスペクトルチルトを生成することなく信号のスペクトルエンベロープの山および谷に追従する周波数応答を利用する。このようなポストフィルタは、携帯電話送受信技術、インターネットメディア技術、および低ビットレートコーデックを使用する他の記憶装置または伝送コンテキストを含む様々な技術的コンテキストで有利に利用することができる。
【0011】
【発明の実施の形態】
以下、図面を参照して本発明の実施形態を詳細に説明する。
【0012】
本発明は一般に、音声品質を向上するためにポストフィルタリングを実行する方法およびシステムに関する。この方法およびシステムでは、ポストフィルタが、周波数領域での1組のLPC係数の非線形変換から導出される。導出されたポストフィルタは、周波数領域で合成音声信号にフォルマントフィルタ利得を掛けることによって適用される。一実施形態では、本発明は、合成音声信号をポストフィルタするための復号器で実施される。本発明の代替実施形態によれば、ポストフィルタを導出するために使用されるLPC係数は、符号器から送信することができ、または復号器で合成音声から独立に導出することができる。
【0013】
必須ではないが、本発明は、コンピュータによって実行されるプログラムモジュールなどの命令を使用して実施することができる。一般にプログラムモジュールは、特定のタスクを実行し、または特定の抽象データ型を実装する、ルーチン、オブジェクト、コンポーネント、データ構造などを含む。用語「プログラム」は、1つまたは複数のプログラムモジュールを含む。
【0014】
本発明は、携帯電話、パーソナルコンピュータ(PC)、ハンドヘルドデバイス、マルチプロセッサシステム、マイクロプロセッサベースのプログラム可能な家庭用電化製品、ネットワークPC、ミニコンピュータ、メインフレームコンピュータなどを含む様々なタイプのマシン上で実施することができる。本発明は、通信ネットワークを介してリンクされる構成要素によってタスクが実行される、分散システムでも利用することができる。分散システムでは、協働するモジュールは、ローカル位置とリモート位置のどちらにも位置することができる。
【0015】
本発明の実施形態を使用することができる例示的電話システムを、図2を参照しながら説明する。この電話システムは、雲状に表されるネットワーク210を介して互いに通信するコーデック200、220を備える。ネットワーク210は、ルータ、ゲートウェイ、ハブなど、多くの周知の構成要素を含むことができ、コーデック200が有線媒体および/または無線媒体を介して通信することを可能にする。各コーデック200、220は、一般に符号器201、復号器202、およびポストフィルタ203を備える。
【0016】
コーデック200および220は、ホスティング装置が他の装置と通信することを可能にする通信接続も含むか、またはその通信接続に関連することが好ましい。通信接続は通信媒体の例である。通信媒体は、一般にコンピュータ可読命令、データ構造、プログラムモジュール、または他のデータを搬送波または他の移送機構などの変調データ信号で具体化し、かつどのような情報送達媒体も含む。本明細書で使用する、コンピュータ可読媒体という用語は、記憶媒体と通信媒体のどちらも含む。本明細書で説明するコーデック要素は、コンピュータ可読媒体中に完全にあるようにしてもよい。コーデック200および220は、本明細書の後で一般的に論じるような入出力装置と関連付けることもできる。
【0017】
図3を参照すると、本明細書で説明するシステムを実装することができる例示的ポストフィルタ303が示されている。この最も基本的な構成では、ポストフィルタ303は、周波数領域フォルマントフィルタ310と共に、入力合成音声信号
【0018】
【外1】
Figure 0004376489
【0019】
およびLPC係数αを使用する。ポストフィルタは、追加の特徴または機能を有することもできる。例えば、ピッチフィルタ320および利得コントローラ330も実装し、以下で説明するように使用することが好ましい。
【0020】
音声信号の符号化および復号化は、一般に望ましくない雑音を信号中に導入することが知られている。信号周波数スペクトルでは、このような雑音は音声信号と重なり合い、特に、連続するフォルマント間の谷領域で人間にとって可聴となる。適切に設計され、実装されるポストフィルタは、この望ましくない雑音を除去する助けとなる。理想的なポストフィルタは、注目の信号の周波数スペクトルに追従する周波数応答を有するポストフィルタである。ほとんどの現在のコーデックは、線形予測の係数が信号周波数スペクトルに追従する線形予測の原理に基づいている。本発明は、これから論じる他の革新的な手順に加えて、この関係を利用して音声ポストフィルタを導出するが、本発明はLPCパラメータの独立な生成も可能にする。
【0021】
本発明に従って周波数領域ポストフィルタリングを実行することのできる広範な方法が存在する。一実施形態によれば、周波数領域ポストフィルタリングはポストフィルタ内で順次実行される。図4(a)を参照すると、周波数領域フォルマントフィルタ410は、フーリエ変換モジュール411、フォルマントフィルタリングモジュール412、および逆フーリエ変換モジュール413を備える。当業者は理解するであろうが、このフーリエ変換モジュールおよび逆フーリエ変換モジュールは、フォルマントフィルタリングモジュール412が時間領域と周波数領域の間で信号を転送する目的で利用可能である。変換モジュール411および413のフーリエ変換および逆フーリエ変換は、標準離散的フーリエ変換(DFT)に従って実行されることが好ましい。
【0022】
フォルマントフィルタリングモジュール412は周波数領域利得を生成し、対象信号を時間領域に戻す前に、生成した利得を適用することによって入力合成音声信号をフィルタする。図4(b)に、フォルマントフィルタリングモジュール412の構成要素をさらに示す。フォルマントフィルタリングモジュール412は、LPCチルト計算モジュール415、LPCチルト補償モジュール420、利得計算モジュール430、および利得適用モジュール440を備える。これらのモジュールの動作を図6、7に関連して以下で詳細に説明するが、ここでも簡単に説明する。
【0023】
一般には、符号化LPCスペクトルはチルトしたバックグラウンドを有する。このチルトは、チルト補償せずにポストフィルタの計算に使用する場合、信号ひずみが許容されないものとなる可能性がある。具体的には、ポストフィルタが本発明のように非線形変換を使用するとき、このチルトしたバックグラウンドは、ポストフィルタリング中に望ましくない仕方で増幅される可能性がある。このような変換をチルトしたスペクトルに適用することは、チルトを非線型に変換する効果も有することになり、チルトしていないスペクトルを後で得ることがより難しくなる。したがって、非線型変換の前にスペクトルのバックグラウンドチルトを除去することが好ましい。本発明によれば、チルト補償モジュール420は、LPCスペクトルチルト計算モジュール415によって推定されるチルトに従って、チルトしたバックグラウンドを適切に除去する。
【0024】
利得計算モジュール430は、大きさおよび位相応答を含む周波数領域フォルマントフィルタ利得を計算する。ここで、利得適用モジュール440は、周波数領域で音声信号に対して増大的に利得を適用する。
【0025】
図4(c)を参照すると、利得計算モジュールは、時間領域LPC表示モジュール431、モデリングモジュール432、LPC非線形変換モジュール433、位相計算モジュール434、利得組合せモジュール435、およびアンチエイリアシングモジュール436を備える。
【0026】
LPC表示モジュール431は、LPCスペクトルの時間領域ベクトル表示を作成する。その後、ベクトルは次の処理のために周波数領域に変換される。モデリングモジュール432は、当業者に周知のいくつかの適切なモデルのうちの1つに基づいて周波数領域ベクトルをモデリングする(全極モデリング)。本発明の実施形態では、LPCスペクトルの逆を使用して利得を計算する。
【0027】
LPC非線形変換モジュール433は、逆LPCスペクトルの大きさの非線形変換を実施することによってフォルマントフィルタ利得の大きさを計算する。以下でより詳細に説明するように、本発明の一実施形態によれば、0〜1の間のスケーリング因子を有するスケーリング関数が非線形変換関数として使用される。スケーリング関数のパラメータは、動的環境、例えば入力音声信号のタイプや符号化速度に従って調節可能である。位相計算モジュール434は、フォルマントフィルタ利得に対する位相応答を計算する。一実施形態によれば、位相計算モジュール434は、ヒルベルト変換、具体的には移相器を介して位相応答を計算する。あるいは他の位相計算器、例えばヒルベルト変換のコタンジェント変換実装を使用することもできる。LPC非線形変換モジュール433および位相計算モジュール434によって供給されるフォルマントフィルタ利得の大きさおよび位相を使用して、利得組合せモジュール435は周波数領域で利得を生成する。アンチエイリアシングモジュール436を提供して、信号をポストフィルタするときにエイリアシングを回避することが好ましい。不可欠ではないが、時間領域でアンチエイリアシング操作を実施することが好ましい。
【0028】
本発明によれば、周波数領域ポストフィルタはLPCスペクトルから導出され、例えば周波数領域フォルマント利得を生成する。この導出は一連の数学的手順を含む。この数学的手順のすべてまたは一部を担当する別々の計算ユニットを提供することが望ましい。本発明の別の実施形態では、別々のLPC評価ユニットを提供し、図5(a)に示すLPC係数を導出する。
【0029】
図5(a)を参照すると、周波数領域フォルマントフィルタ500は、フーリエ変換モジュール511、逆フーリエ変換モジュール513、利得適用モジュール540、およびLPC評価ユニット521を備える。フーリエ変換モジュール511、逆フーリエ変換モジュール513、および利得適用モジュール540は、図4(a)、(b)の類似の符号で参照されるモジュールと同じでよい。本発明によれば、LPC評価ユニット521は、LPCチルト計算モジュール510、LPCチルト補償モジュール520、および利得計算モジュール530を備える。これらの構成要素は、図4(b)の類似の符号で参照される構成要素と同じでよい。
【0030】
動作の際、図5(a)、(b)で説明する代替実施形態は、図4(a)、(b)、(c)によって示す実施形態とはわずかに異なる。具体的には、利得適用モジュール540は入力として合成音声信号を受け取り、出力としてフィルタした合成音声信号を供給する。フーリエ変換モジュールおよび逆フーリエ変換モジュール511および513は、利得適用モジュールが事前フィルタした音声信号を周波数領域に変換し、事後フィルタした音声信号を時間領域に変換する目的で利用可能である。LPC評価ユニット521はLPC係数を受け取るか、または計算し、時間領域と周波数領域間の変換が必要なときに変換モジュール511および513にアクセスし、計算した利得を利得適用モジュール540に戻す。
【0031】
図6および7を参照すると、本発明の実施形態に従ってポストフィルタリングを実行するための例示的ステップが示されている。合成された音声信号
【0032】
【外2】
Figure 0004376489
【0033】
およびLPC係数αをステップ601で受け取る。符号化LPCスペクトルは一般に、フォルマントポストフィルタを直接計算するために使用するとき、余分なひずみを誘発するチルトしたバックグラウンドを有するので、まず任意のスペクトルチルトを計算し、それを補正することが好ましい。未補正のチルトは、ポストフィルタの計算中に、特にその計算が非線形変換を含むとき、望ましくない仕方で増幅する可能性がある。したがって、ステップ603および605は、それぞれLPCスペクトルチルトを計算し、それに対してスペクトルを補償する。これらのステップを実行するために使用可能な例示的な数学的手順は以下の通りである。以下の数学的手順の構成および細部を変更しても同じ結果を達成できることを当業者は理解されよう。PをLPC多項式係数の次数として、LPC係数α(i=0,1..Pかつα=1)に対して、LPCスペクトルのチルトμは以下のように定義される。
【0034】
【数1】
Figure 0004376489
【0035】
上式でR(1)およびR(0)は、以下で定義されるLPCパラメータの自己相関値である。
【0036】
【数2】
Figure 0004376489
【0037】
LPC次数Pは、当業者には明らかである通り、サンプル周波数に応じて選択される。この実施形態では、8kHzおよび11.025kHzサンプリング速度に対してP=10を使用し、16kHzおよび22.05kHzサンプリング速度に対してP=16を使用する。計算したチルトμが与えられる場合、LPC係数αは以下のように補償される。
【0038】
【数3】
Figure 0004376489
【0039】
ステップ607では、Aと示す、時間領域でチルト補償したαのベクトル表示をゼロパディングによって得、好都合のサイズのベクトルを形成する。このようなベクトルについての例示的な長さは128であるが、他の類似のベクトル長、または全く異なるベクトル長を同様に使用することができる。
【0040】
ステップ609から623では、大きさおよび位相応答を含むフォルマントポストフィルタ利得を計算する。具体的には、ステップ609で、ベクトルAをフーリエ変換を介して周波数領域ベクトルA′(k)に変換する。ステップ613では、周波数領域ベクトルA′(k)の大きさの逆数をとり、対数目盛(dB)に変換することによってA′(k)を変更する。このステップによる伝達関数をH(k)と示す。数学的な効率および都合のため、ステップ615でまずH(k)を以下の例のように
【0041】
【外3】
Figure 0004376489
【0042】
に正規化する。
【0043】
【数4】
Figure 0004376489
【0044】
上式で、Hmax(k)およびHmin(k)は、それぞれH(k)の最大値および最小値である。
【0045】
ステップ615では、以下のようなスケーリング関数を介して非線型に正規化関数
【0046】
【外4】
Figure 0004376489
【0047】
を変換する。
【0048】
【数5】
Figure 0004376489
【0049】
上式でcは定数である。cの例示的な値は音声信号に対して1.47であり、非音声信号に対して1.3である。スケーリング因子γは、動的環境条件に従って調節することができる。例えば、異なるタイプの音声コーダや、異なる符号化速度では、任意選択でこの定数に関して異なる値を使用することができる。スケーリング因子γに関する例示的な値は0.25であるが、他のスケーリング因子でも、許容される結果、またはより良好な結果を得ることができる。非線形変換のステップに関して上記のスケーリング関数を使用するものとして本発明を説明したが、別法として他の非線形変換関数も使用することができる。このような関数には、適切な指数関数および多項式関数が含まれる。
【0050】
次いで、ステップ615で得た関数T(k)を使用して利得の位相応答を推定する。本発明によれば、ステップ617から623は、ヒルベルト移相器を実装して利得の位相応答θ(k)を計算する。具体的には、ステップ617では、ヒルベルト移相器が時間領域で実施されるので、フーリエ変換を実施することによって関数T(k)を時間領域に伝達する。ステップ619では、T(n)にjを掛けることによって位相応答θ(n)を得る。ただしjはj=−1と定義される。ステップ621では、計算した利得の位相応答θ(n)を、周波数領域でさらに処理するために周波数領域位相応答θ(k)に変換する。
【0051】
ステップ623では、周波数領域フォルマントフィルタ利得F(k)が、大きさ成分および位相成分を組み合わせることによって以下のように得られる。
【0052】
【数6】
Figure 0004376489
【0053】
上式でqおよびgは、
【0054】
【数7】
Figure 0004376489
【0055】
と定義される定数である。上式でlnは自然対数である。
【0056】
ステップ625から631を実行して時間領域でアンチエイリアシングを実施する。具体的には、ステップ625では、周波数領域利得F(k)を逆フーリエ変換の実行を介して時間領域利得f(n)に変換する。すなわちF(k)の逆フーリエ変換はf(n)に等しい。ステップ627では、以下のようにフーリエ変換長Nおよび入力音声セグメント長Mに従ってf(n)の係数をゼロにすることによって第2関数g(n)を定義する。
【0057】
【数8】
Figure 0004376489
【0058】
ステップ629は、以下のようにg(n)に標準的な正規化手順を適用するものである。
【0059】
【数9】
Figure 0004376489
【0060】
最後にステップ631で、フーリエ変換を介して時間領域関数g(n)を周波数領域に伝達することによってアンチエイリアシング後の周波数領域利得G(k)を得る。すなわち、g(n)のフーリエ変換はG(k)に等しい。
【0061】
周波数領域フォルマント利得G(k)を計算した後、ステップ633から637を実行して入力合成音声信号
【0062】
【外5】
Figure 0004376489
【0063】
のフィルタリングを実施する。具体的には、ステップ633では、まず信号
【0064】
【外6】
Figure 0004376489
【0065】
を周波数領域信号
【0066】
【外7】
Figure 0004376489
【0067】
に伝達する。周波数領域でのポストフィルタリングが信号に各周波数についての利得を掛けることによって実施されることを想起して、ステップ635で
【0068】
【外8】
Figure 0004376489
【0069】
に周波数領域フォルマントフィルタ利得G(k)を掛け、ポストフィルタした音声信号
【0070】
【外9】
Figure 0004376489
【0071】
を得る。次いで、ステップ637で
【0072】
【外10】
Figure 0004376489
【0073】
を時間領域に変換することによって、ポストフィルタした音声信号
【0074】
【外11】
Figure 0004376489
【0075】
を得る。
【0076】
図8を参照すると、本発明の実施形態を実施するための1つの例示的システムは、コンピューティング装置700などのコンピューティング装置を含む。その最も基本的な構成において、コンピューティング装置700は、一般に少なくとも1つのプロセッサ702およびメモリ704を含む。コンピューティング装置の厳密な構成およびタイプに応じて、メモリ704は、揮発性(RAMなど)、不揮発性(ROM、フラッシュメモリなど)、またはその2つの組合せとすることができる。この最も基本的な構成を図8の線706で示す。加えて装置700は、追加の特徴/機能も有することができる。例えば装置700は、限定はしないが磁気ディスクまたは光ディスク、あるいはテープを含む(取外し可能および/または取外し不能な)追加の記憶装置も含むことができる。このような追加の記憶装置を、図8の取外し可能記憶装置708および取外し不能記憶装置710で示す。コンピュータ記憶媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、または他のデータなどの情報を記憶するための何らかの方法または技術で実装される、揮発性媒体および不揮発性媒体、ならびに取外し可能媒体および取外し不能媒体を含む。メモリ704、取外し可能記憶装置708、および取外し不能記憶装置710は、コンピュータ記憶媒体の全て例である。コンピュータ記憶媒体には、限定はしないが、RAM、ROM、EEPROM、フラッシュメモリ、または他のメモリ技術、CDROM、DVD(digital versatile disc)、または他の光記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置、または他の磁気記憶装置、あるいは、所望の情報を記憶するために使用することができ、装置700でアクセスすることができる他のどんな媒体も含まれる。このようなどんなコンピュータ記憶媒体も装置700の一部とすることができる。
【0077】
装置700は、他の装置と通信することを可能とする1つまたは複数の通信接続712も含むことができる。通信接続712は通信媒体の例である。通信媒体は一般に、コンピュータ可読命令、データ構造、プログラムモジュール、または他のデータを、搬送波または他の移送機構などの被変調データ信号で具体化し、その通信媒体には任意の情報送達媒体が含まれる。用語「被変調データ信号」は、その特性集合のうちの1つまたは複数を有する信号、または情報をその中に符号化するように変化した信号を意味する。例えば、限定はしないが、通信媒体には、有線ネットワークまたは直接配線接続などの有線媒体、ならびに音響、RF(radio frequency)、赤外線、および他の無線媒体などの無線媒体が含まれる。上記で論じたように、本明細書で使用する、コンピュータ可読媒体という用語は、記憶媒体と通信媒体のどちらも含む。
【0078】
装置700は、キーボード、マウス、ペン、音声入力装置、タッチ入力装置などの1つまたは複数の入力装置714も含むことができる。ディスプレイ、スピーカ、プリンタなどの1つまたは複数の出力装置716も含むことができる。これらの装置はすべて当技術分野で周知であり、ここでさらに論じる必要はない。
【0079】
ポストフィルタリングを実行する、新しく、かつ有用な方法およびシステムが本明細書で説明されたことを当業者は理解されよう。しかし、本発明の原理を適用することができる多くの可能な実施形態に鑑みて、図面に関連して本明細書で説明した実施形態は例示のために示したものにすぎず、発明の範囲を限定するものではないことを理解されたい。例えば、本発明の趣旨から逸脱することなく、例示した実施形態の構成および細部を変更できることを当業者は理解されよう。例えば、非線型変換について、0〜1のスケーリング因子を有するスケーリング関数を利用するものとして本発明を説明している。しかし、他の変換関数および変換因子も利用することができる。例えば指数関数および多項式関数も本発明内で使用することができる。さらに、利得の位相応答を計算するためにヒルベルト移相器を指定しているが、コタンジェント変換技法など、関数の位相応答を計算するための他の技法も使用することができる。時間領域から周波数領域への変換を実施する際、本明細書はDFTを規定しているが、高速フーリエ変換(FFT)、さらには標準フーリエ変換など他の変換技法も同様に利用することができる。本発明をソフトウェアモジュールまたはコンポーネントによって説明したが、これをハードウェア構成要素で等しく置換できることを当業者は理解されよう。したがって本明細書で説明した本発明では、このようなすべての実施形態が、頭記の特許請求の範囲およびその均等物の範囲内にあることが企図される。
【0080】
【発明の効果】
以上、説明したように、本発明によれば、合成音声信号をポストフィルタして音声信号の品質を向上することが可能となる。
【図面の簡単な説明】
【図1】典型的な従来技術の時間領域ポストフィルタリングアーキテクチャを示す概略図である。
【図2】ネットワークリンクしたコーデックのアーキテクチャ図である。
【図3】本発明の実施形態による周波数領域ポストフィルタの単純化した構成図である。
【図4】本発明の実施形態による周波数領域フォルマントフィルタの構成要素を示す構成図で、(a)は周波数領域フォルマントフィルタ、(b)はフォルマントフィルタリングモジュール、(c)は利得計算モジュールの図である。
【図5】本発明の代替実施形態による周波数領域フォルマントフィルタの構成要素を示す構成図で、(a)は周波数領域フォルマントフィルタ、(b)はLPC評価ユニットの図である。
【図6】本発明の実施形態によるポストフィルタリングを実行する際に実行されるステップを示す流れ図である。
【図7】本発明の実施形態によるポストフィルタリングを実行する際に実行されるステップを示す流れ図である。
【図8】本発明の実施形態を実行することができるコンピューティング装置によって使用されるコンピューティング装置アーキテクチャを示す概略図である。
【符号の説明】
100 復号器
110 ビットストリーム復号器
120 音声シンセサイザ
130 時間領域ポストフィルタ
131 フォルマントフィルタ
132 ピッチフィルタ
133 チルト補償モジュール
134 利得コントローラ
200、220 コーデック
201 符号器
202 復号器
203 ポストフィルタ
210 ネットワーク
303 ポストフィルタ
310 周波数領域フォルマントフィルタ
320 ピッチフィルタ
330 利得コントローラ
410 周波数領域フォルマントフィルタ
411 フーリエ変換モジュール
412 フォルマントフィルタリングモジュール
413 逆フーリエ変換モジュール
412 フォルマントフィルタリングモジュール
415 LPCチルト計算モジュール
420 LPCチルト補償モジュール
430 利得計算モジュール
431 LPC表示モジュール
432 モデリングモジュール
433 LPC非線形変換モジュール
434 位相計算モジュール
435 利得組合せモジュール
436 アンチエイリアシングモジュール
440 利得適用モジュール
500 周波数領域フォルマントフィルタ
510 LPCチルト計算モジュール
511 フーリエ変換モジュール
513 逆フーリエ変換モジュール
520 LPCチルト補償モジュール
521 LPC評価ユニット
530 利得計算モジュール
540 利得適用モジュール
700 コンピューティング装置
702 プロセッサ
704 メモリ
708 取外し可能記憶装置
710 取外し不能記憶装置
712 通信接続
714 入力装置
716 出力装置

Claims (19)

  1. 音声信号の人の知覚品質を高めるために、前記音声信号の線形予測係数を使用して前記音声信号をポストフィルタする方法であって、
    周波数領域で前記線形予測係数のスペクトルの非線型変換を実行することによってポストフィルタを生成するステップと、
    生成した前記ポストフィルタを、周波数領域で合成音声信号に適用するステップと、
    フィルタした周波数領域前記合成音声信号を、時間領域で音声信号に変換するステップとを備え、
    前記ポストフィルタを生成するステップは、
    前記線形予測係数のスペクトルを時間領域のベクトルによって表すステップと、
    前記時間領域のベクトルをフーリエ変換によって周波数領域のベクトルに変換するステップと、
    前記周波数領域のベクトルを反転するステップと、
    全極モデルのベクトルの大きさに従って、大きさおよび位相応答を含む利得を計算するステップとをさらに含むことを特徴とする方法。
  2. ポストフィルタを生成するステップは、
    時間領域で前記線形予測係数のスペクトルのチルトを計算するステップと、
    時間領域で計算した前記チルトを使用して前記線形予測係数のスペクトルを補償するステップと
    をさらに備えたことを特徴とする請求項1に記載の方法。
  3. 前記補償するステップは、ゼロパディング技法を、前記線形予測係数に適用するステップをさらに備えたことを特徴とする請求項2に記載の方法。
  4. 前記利得を計算するステップは、
    前記全極モデルのベクトルの大きさを正規化するステップと、
    前記全極モデルのベクトルの前記正規化した大きさに対する非線型変換を実施して、前記利得の大きさを得るステップと、
    前記利得の前記位相応答を推定するステップと、
    前記利得の大きさと推定した位相応答とを組み合わせることによって前記利得を形成するステップと
    をさらに備えたことを特徴とする請求項1に記載の方法。
  5. 前記位相応答を推定するステップは、前記利得に対して高速フーリエ変換ベースの移相器を実行するステップをさらに備えたことを特徴とする請求項4に記載の方法。
  6. ポストフィルタを生成するステップは、利得を計算するステップの後に、時間領域でアンチエイリアシング手順を実行するステップをさらに備えたことを特徴とする請求項1に記載の方法。
  7. 前記全極モデルは、周波数領域線の形予測係数のベクトルの、大きさの逆数の対数によって表されることを特徴とする請求項1に記載の方法。
  8. 前記非線型変換関数は、0〜1の間のスケーリング因子を有するスケーリング関数を含むことを特徴とする請求項4に記載の方法。
  9. 音声信号の線形予測係数のスペクトルを使用して合成音声信号をポストフィルタするステップを実行するためのコンピュータ可読命令を有するコンピュータ読み取り可能な記録媒体であって、
    前記線形予測係数のスペクトルのチルトを計算するステップと、
    計算した前記チルトを使用して前記線形予測係数のスペクトルを補償するステップと、
    補償した前記線形予測係数のスペクトルの非線形変換を周波数領域で実行することによってポストフィルタを生成するステップと、
    生成した前記ポストフィルタを、周波数領域で前記合成音声信号に適用するステップと
    を備え、
    前記ポストフィルタを生成するステップは、
    前記線形予測係数を時間領域のベクトルによって表すステップと、
    前記時間領域のベクトルをフーリエ変換によって周波数領域のベクトルに変換するステップと、
    前記周波数領域のベクトルを全極モデルのベクトルに変換するステップと、
    前記全極モデルのベクトルの大きさに従って、大きさおよび位相応答を含む利得を計算するステップとをさらに含むことを特徴とするコンピュータ読み取り可能な記録媒体。
  10. 前記利得を計算するステップは、
    前記全極モデルのベクトルの大きさを正規化するステップと、
    前記全極モデルのベクトルの正規化した大きさに対する非線形変換を実施し、前記利得の大きさを得るステップと、
    前記利得の前記位相応答を推定するステップと、
    前記利得の大きさと推定した位相応答とを組み合わせることによって前記利得を形成するステップと
    を備えたことを特徴とする請求項9に記載のコンピュータ読み取り可能な記録媒体。
  11. 前記位相応答を推定するステップは、高速フーリエ変換ベースの移相器を実行するステップをさらに備えたことを特徴とする請求項10に記載のコンピュータ読み取り可能な記録媒体。
  12. ポストフィルタを生成するステップは、時間領域でアンチエイリアシング手順を実行するステップをさらに備えたことを特徴とする請求項9に記載のコンピュータ読み取り可能な記録媒体。
  13. 前記全極モデルは、前記周波数領域のベクトルの、大きさの逆数の対数によって表されることを特徴とする請求項9に記載のコンピュータ読み取り可能な記録媒体。
  14. 前記非線形変換関数は、0〜1の間のスケーリング因子を有するスケーリング関数を含むことを特徴とする請求項10に記載のコンピュータ読み取り可能な記録媒体。
  15. 音声信号の人の知覚品質を高めるために、前記音声信号の複数の線形予測係数を使用して前記音声信号をポストフィルタする装置であって、
    フーリエ変換を実施するように動作可能なフーリエ変換モジュールと、
    逆フーリエ変換を実施するように動作可能な逆フーリエ変換モジュールと、
    フォルマントフィルタ利得を有するフォルマントフィルタであって、前記利得が、前記線形予測係数の非線形変換を実行することによって周波数領域で計算されるフォルマントフィルタと
    を備え、
    前記フォルマントフィルタは、
    前記線形予測係数のスペクトルのチルトを計算するための線形予測係数チルト計算モジュールと、
    前記線形予測係数のスペクトルの計算した前記チルトに従って前記線形予測係数を補償するための線形予測係数チルト補償モジュールと、
    チルト補償の後に前記線形予測係数の非線形変換を実行することによって周波数領域でフォルマントフィルタ利得を計算するためのフォルマント利得計算モジュールであって、前記利得は、大きさおよび位相応答を含むフォルマント利得計算モジュールと、
    前記周波数領域で前記利得と前記音声信号を掛けることによって前記フォルマントフィルタ利得を音声信号に適用するための利得適用モジュールとをさらに含むことを特徴とする装置。
  16. 前記フォルマント利得計算モジュールは、
    時間領域のベクトルによって前記線形予測係数を表すための線形予測係数表示モジュールと、
    LPC係数を表す前記時間領域のベクトルから変換される周波数領域のベクトルを、事前定義モデルに従ってモデリングし、大きさを生成するモデリングモジュールと、
    前記大きさに対する非線形変換を実行し、前記フォルマントフィルタ利得の大きさを生成するための線形予測係数非線形変換モジュールと、
    非線形変換後のモデルの大きさに従って、前記フォルマントフィルタ利得の位相応答を計算するための位相計算モジュールと、
    前記フォルマントフィルタ利得の大きさと位相応答とを組み合わせるためのフォルマントフィルタ利得組合せモジュールと、
    前記フォルマントフィルタの適用によって引き起こされるエイリアシングを防止するためのアンチエイリアシングモジュールと
    をさらに備えたことを特徴とする請求項15に記載の装置。
  17. 前記線形予測係数表示モジュールは、ゼロパディング技法によって前記線形予測係数を表すように適合されることを特徴とする請求項16に記載の装置。
  18. 前記線形予測係数非線型変換モジュールは、0〜1の間のスケーリング因子を有するスケーリング関数をさらに備えたことを特徴とする請求項16に記載の装置。
  19. 前記位相計算モジュールは、時間領域でのヒルベルト移相器をさらに備えたことを特徴とする請求項16に記載の装置。
JP2002192639A 2001-06-29 2002-07-01 コード化音声の品質向上のための周波数領域ポストフィルタリングの方法、装置及び記録媒体 Expired - Fee Related JP4376489B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/896,062 US6941263B2 (en) 2001-06-29 2001-06-29 Frequency domain postfiltering for quality enhancement of coded speech
US09/896,062 2001-06-29

Publications (2)

Publication Number Publication Date
JP2003108196A JP2003108196A (ja) 2003-04-11
JP4376489B2 true JP4376489B2 (ja) 2009-12-02

Family

ID=25405563

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002192639A Expired - Fee Related JP4376489B2 (ja) 2001-06-29 2002-07-01 コード化音声の品質向上のための周波数領域ポストフィルタリングの方法、装置及び記録媒体

Country Status (5)

Country Link
US (2) US6941263B2 (ja)
EP (1) EP1271472B1 (ja)
JP (1) JP4376489B2 (ja)
AT (1) ATE355591T1 (ja)
DE (1) DE60218385T2 (ja)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7315815B1 (en) 1999-09-22 2008-01-01 Microsoft Corporation LPC-harmonic vocoder with superframe structure
US6941263B2 (en) * 2001-06-29 2005-09-06 Microsoft Corporation Frequency domain postfiltering for quality enhancement of coded speech
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US8625680B2 (en) * 2003-09-07 2014-01-07 Microsoft Corporation Bitstream-controlled post-processing filtering
US7478040B2 (en) * 2003-10-24 2009-01-13 Broadcom Corporation Method for adaptive filtering
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
US7707034B2 (en) 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
CN101199005B (zh) * 2005-06-17 2011-11-09 松下电器产业株式会社 后置滤波器、解码装置以及后置滤波处理方法
US8027242B2 (en) * 2005-10-21 2011-09-27 Qualcomm Incorporated Signal coding and decoding based on spectral dynamics
US7720677B2 (en) * 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
US7774396B2 (en) 2005-11-18 2010-08-10 Dynamic Hearing Pty Ltd Method and device for low delay processing
ATE504884T1 (de) * 2006-01-24 2011-04-15 Verayo Inc Signalgeneratorbasierte vorrichtungssicherheit
JP5460057B2 (ja) * 2006-02-21 2014-04-02 ウルフソン・ダイナミック・ヒアリング・ピーティーワイ・リミテッド 低遅延処理方法及び方法
US7590523B2 (en) * 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
US8392176B2 (en) 2006-04-10 2013-03-05 Qualcomm Incorporated Processing of excitation in audio coding and decoding
WO2008032828A1 (fr) * 2006-09-15 2008-03-20 Panasonic Corporation Dispositif de codage audio et procédé de codage audio
JP4757158B2 (ja) * 2006-09-20 2011-08-24 富士通株式会社 音信号処理方法、音信号処理装置及びコンピュータプログラム
ES2394515T3 (es) * 2007-03-02 2013-02-01 Telefonaktiebolaget Lm Ericsson (Publ) Métodos y adaptaciones en una red de telecomunicaciones
CN101303858B (zh) * 2007-05-11 2011-06-01 华为技术有限公司 实现基音增强后处理的方法及装置
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
KR100922897B1 (ko) * 2007-12-11 2009-10-20 한국전자통신연구원 Mdct 영역에서 음질 향상을 위한 후처리 필터장치 및필터방법
WO2010009098A1 (en) * 2008-07-18 2010-01-21 Dolby Laboratories Licensing Corporation Method and system for frequency domain postfiltering of encoded audio data in a decoder
WO2010032405A1 (ja) * 2008-09-16 2010-03-25 パナソニック株式会社 音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム
PT3364411T (pt) * 2009-12-14 2022-09-06 Fraunhofer Ges Forschung Dispositivo de quantização de vetor, dispositivo de codificação de voz, método de quantização de vetor e método de codificação de voz
CA2827266C (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
PL2661745T3 (pl) 2011-02-14 2015-09-30 Fraunhofer Ges Forschung Urządzenie i sposób do ukrywania błędów w zunifikowanym kodowaniu mowy i audio
ES2529025T3 (es) 2011-02-14 2015-02-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para procesar una señal de audio decodificada en un dominio espectral
EP4243017A3 (en) 2011-02-14 2023-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method decoding an audio signal using an aligned look-ahead portion
JP5712288B2 (ja) 2011-02-14 2015-05-07 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 重複変換を使用した情報信号表記
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
CA2903681C (en) 2011-02-14 2017-03-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
CN102930872A (zh) * 2012-11-05 2013-02-13 深圳广晟信源技术有限公司 用于宽带语音解码中基音增强后处理的方法及装置
MY180912A (en) * 2013-01-29 2020-12-11 Fraunhofer Ges Forschung Noise filling without side information for celp-like coders
US9685173B2 (en) * 2013-09-06 2017-06-20 Nuance Communications, Inc. Method for non-intrusive acoustic parameter estimation
US9870784B2 (en) 2013-09-06 2018-01-16 Nuance Communications, Inc. Method for voicemail quality detection
CA2940657C (en) 2014-04-17 2021-12-21 Voiceage Corporation Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
US10741195B2 (en) * 2016-02-15 2020-08-11 Mitsubishi Electric Corporation Sound signal enhancement device
CN111833891B (zh) * 2020-07-21 2024-05-14 北京百瑞互联技术股份有限公司 一种lc3编解码系统、lc3编码器及其优化方法
CN114171035A (zh) * 2020-09-11 2022-03-11 海能达通信股份有限公司 抗干扰方法及装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US5067158A (en) * 1985-06-11 1991-11-19 Texas Instruments Incorporated Linear predictive residual representation via non-iterative spectral reconstruction
US4969192A (en) 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US5701390A (en) * 1995-02-22 1997-12-23 Digital Voice Systems, Inc. Synthesis of MBE-based coded speech using regenerated phase information
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
JP3653826B2 (ja) * 1995-10-26 2005-06-02 ソニー株式会社 音声復号化方法及び装置
KR0155315B1 (ko) * 1995-10-31 1998-12-15 양승택 Lsp를 이용한 celp보코더의 피치 검색방법
US6047254A (en) * 1996-05-15 2000-04-04 Advanced Micro Devices, Inc. System and method for determining a first formant analysis filter and prefiltering a speech signal for improved pitch estimation
US6073092A (en) * 1997-06-26 2000-06-06 Telogy Networks, Inc. Method for speech coding based on a code excited linear prediction (CELP) model
US6098036A (en) * 1998-07-13 2000-08-01 Lockheed Martin Corp. Speech coding system and method including spectral formant enhancer
US6493665B1 (en) * 1998-08-24 2002-12-10 Conexant Systems, Inc. Speech classification and parameter weighting used in codebook search
US6823303B1 (en) * 1998-08-24 2004-11-23 Conexant Systems, Inc. Speech encoder using voice activity detection in coding noise
US6385573B1 (en) * 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
US6480822B2 (en) 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
US6449592B1 (en) * 1999-02-26 2002-09-10 Qualcomm Incorporated Method and apparatus for tracking the phase of a quasi-periodic signal
US6505152B1 (en) * 1999-09-03 2003-01-07 Microsoft Corporation Method and apparatus for using formant models in speech systems
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US6941263B2 (en) * 2001-06-29 2005-09-06 Microsoft Corporation Frequency domain postfiltering for quality enhancement of coded speech

Also Published As

Publication number Publication date
US6941263B2 (en) 2005-09-06
ATE355591T1 (de) 2006-03-15
DE60218385T2 (de) 2007-06-14
JP2003108196A (ja) 2003-04-11
EP1271472B1 (en) 2007-02-28
EP1271472A2 (en) 2003-01-02
US20030009326A1 (en) 2003-01-09
DE60218385D1 (de) 2007-04-12
EP1271472A3 (en) 2003-11-05
US7124077B2 (en) 2006-10-17
US20050131696A1 (en) 2005-06-16

Similar Documents

Publication Publication Date Title
JP4376489B2 (ja) コード化音声の品質向上のための周波数領域ポストフィルタリングの方法、装置及び記録媒体
RU2387025C2 (ru) Способ и устройство для векторного квантования спектрального представления огибающей
US9043214B2 (en) Systems, methods, and apparatus for gain factor attenuation
US7379866B2 (en) Simple noise suppression model
JP3653826B2 (ja) 音声復号化方法及び装置
US9251800B2 (en) Generation of a high band extension of a bandwidth extended audio signal
US6654716B2 (en) Perceptually improved enhancement of encoded acoustic signals
EP2502230B1 (en) Improved excitation signal bandwidth extension
JP2009530685A (ja) Mdct係数を使用する音声後処理
JP4302978B2 (ja) 音声コーデックにおける擬似高帯域信号の推定システム
JP3881946B2 (ja) 音響符号化装置及び音響符号化方法
JP6321684B2 (ja) サブバンドの時間的平滑化を用いて周波数増強信号を生成する装置および方法
JPH1097296A (ja) 音声符号化方法および装置、音声復号化方法および装置
US7603271B2 (en) Speech coding apparatus with perceptual weighting and method therefor
EP1619666B1 (en) Speech decoder, speech decoding method, program, recording medium
EP3281197B1 (en) Audio encoder and method for encoding an audio signal
JP2004302259A (ja) 音響信号の階層符号化方法および階層復号化方法
CN111326166B (zh) 语音处理方法及装置、计算机可读存储介质、电子设备
EP1564723A1 (en) Transcoder and coder conversion method
JP3230790B2 (ja) 広帯域音声信号復元方法
JP2004151423A (ja) 帯域拡張装置及び方法
JPH0736484A (ja) 音響信号符号化装置
JPH11194799A (ja) 楽音符号化装置および楽音復号化装置および楽音符号化復号化装置およびプログラム記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050614

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050614

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081017

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090115

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090421

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090721

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090811

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090909

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120918

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120918

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130918

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees