JP2003108196A - コード化音声の品質向上のための周波数領域ポストフィルタリングの方法、装置及び記録媒体 - Google Patents

コード化音声の品質向上のための周波数領域ポストフィルタリングの方法、装置及び記録媒体

Info

Publication number
JP2003108196A
JP2003108196A JP2002192639A JP2002192639A JP2003108196A JP 2003108196 A JP2003108196 A JP 2003108196A JP 2002192639 A JP2002192639 A JP 2002192639A JP 2002192639 A JP2002192639 A JP 2002192639A JP 2003108196 A JP2003108196 A JP 2003108196A
Authority
JP
Japan
Prior art keywords
gain
linear prediction
prediction coefficient
vector
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002192639A
Other languages
English (en)
Other versions
JP4376489B2 (ja
Inventor
Hong Wang
ウォン ホン
Vladimir Cuperman
カッパーマン ウラジミール
Allen Gersho
ガーショ アレン
Hosam A Khalil
エー.カリル ホサム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2003108196A publication Critical patent/JP2003108196A/ja
Application granted granted Critical
Publication of JP4376489B2 publication Critical patent/JP4376489B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

(57)【要約】 【課題】 低ビットレートのコーデックから得られる合
成音声のために、周波数領域でポストフィルタリングを
実行して、音声信号の品質を向上する。 【解決手段】 この方法はLPCチルト計算および補償
モジュール(415、420)、フォルマントフィルタ
利得計算モジュール430、アンチエイリアシングモジ
ュール436を含む。フォルマントフィルタ利得計算
は、LPC表示431、全極モデリング432、非線形
変換433、位相計算434を利用する。ポストフィル
タを導出するために使用されるLPCは、符号器から送
信することができ、または復号器または受信機内の合成
音声信号または他の音声信号から推定することができ
る。本発明は、リンクした復号器および符号器で実装す
ることができる。LPCを処理し、または導出すること
を担当する別々のLPC評価ユニットを本発明内で実装
することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、コード化音声の品
質向上のための周波数領域ポストフィルタリングの方
法、装置及び記録媒体に関する。より詳細には、信号の
品質を向上するための信号フィルタリングの技術分野に
関し、合成音声信号をポストフィルタして音声信号の品
質を向上する、コード化音声の品質向上のための周波数
領域ポストフィルタリングの方法、装置及び記録媒体に
関する。
【0002】
【従来の技術】電子信号の生成は、電子技術および電気
技術のすべての領域に行き渡っている。電気信号を使用
して実在の量をエミュレートし、送信し、または再現す
るとき、信号の品質が重要となる。例えば、音声はしば
しば、マイクロフォンまたは他の音声変換器を介して受
信され、電気的表現または信号に変換される。この変換
の直接的な結果として導入される人工的雑音に加えて、
他の人工的雑音が伝送中、符号化中、および/または復
号化中に信号中に導入されることがある。このような雑
音はしばしば人間にとって可聴であり、実際に、聴取者
の気をそらし、または不快にさせる程度にまで、再現し
た音声信号よりも優位となることがある。
【0003】音声コーダ、特に低ビットレートで動作す
る音声コーダは、可聴となる可能性のある量子化雑音を
導入し、それによって回復される音声の品質を損なう傾
向がある。一般にはポストフィルタを使用して、そのよ
うな信号のフォルマントおよび微細構造を高めることに
よってコード化音声信号中の雑音をマスクする。一般に
は、信号の強力なフォルマント領域中の雑音は不可聴で
あるのに対して、信号の2つの隣接するフォルマントの
間の谷領域の雑音は、谷領域の信号対雑音比(SNR)
が低いので知覚可能である。現在の線形予測(LP)モ
デリング方法は、谷よりも山をより正確に表し、かつ利
用可能なビットが谷の信号を十分に表すには不十分であ
るので、谷領域のSNRは、低ビットレートコーデック
の状況ではさらに低くなることがある。したがって、可
聴な雑音レベルを低減するために、音声ポストフィルタ
が山を保持しながら谷を減衰することが望ましい。
【0004】Juin−Hwey Chenらは、短期
ポストフィルタにカスケード接続されたポールゼロ(po
le-zero)長期ポストフィルタからなる適応ポストフィ
ルタリングアルゴリズムを提案した。この短期ポストフ
ィルタは、スペクトル谷の雑音を減衰するように、LP
モデルのパラメータから導出される。これらのパラメー
タは、線形予測コーディング係数、またはLPC(line
ar predictive coding)係数、またはLPCパラメータ
と呼ばれる。加えて、Wangらは、スペクトル谷の雑
音を抑制するための周波数領域適応ポストフィルタリン
グアルゴリズムを発表した。前述のポストフィルタリン
グアルゴリズムは、大きなスペクトルひずみを導入する
ことなく雑音を低減するが、特に8kbps未満で動作
するような低ビットレートコーダの状況において、フォ
ルマント間の深い谷ではなく、浅い谷の知覚可能な雑音
を低減するには十分ではない。この欠点の主な理由は、
ポストフィルタ自体の周波数応答がスペクトルエンベロ
ープの詳細な微細構造に十分に追従せず、近接するフォ
ルマント間の浅い谷をマスクしてしまうことである。
【0005】典型的な初期の時間領域LPCポストフィ
ルタリングアーキテクチャを図1に示す。入力ビットス
トリームは、おそらく符号器から送信され、復号器10
0で受信される。復号器100に関連するビットストリ
ーム復号器110は、着信ビットストリームを復号化す
る。このステップにより、ビットストリームがその論理
構成要素または仮想チャネルコンテントに分離される。
例えば、ビットストリーム復号器110は、線形予測ベ
ースのコーデックに対するコード化励起信号から、LP
C係数を分離する。復号化されたLPC係数は、時間領
域ポストフィルタ130の第1ステージであるフォルマ
ントフィルタ131に送られる。音声シンセサイザ12
0によって生成される合成音声信号は、フォルマントフ
ィルタ131と、その後に続くピッチフィルタ132に
入力され、信号の調波ピッチ構造が高められる。ピッチ
フィルタに縦続接続されたチルト補償モジュール133
は、一般にフォルマントフィルタのバックグラウンドチ
ルトを除去し、ポストフィルタの望ましくないひずみを
回避するために設けられる。最後に、隣接するフレーム
での信号出力の不連続を解消するために、利得コントロ
ーラ134で利得制御が信号に適用される。
【0006】
【発明が解決しようとする課題】しかしながら、従来の
音声ポストフィルタリングシステムで表されるポストフ
ィルタアーキテクチャの周波数応答は、音声スペクトル
の詳細な微細構造に十分に追従せず、かつスペクトルエ
ンベロープの山および谷を必ずしも十分には分解しな
い。
【0007】本発明は、このような問題に鑑みてなされ
たもので、その目的とするところは、合成音声信号をポ
ストフィルタして音声信号の品質を向上する、コード化
音声の品質向上のための周波数領域ポストフィルタリン
グの方法、装置及び記録媒体を提供することにある。
【0008】
【課題を解決するための手段】本発明は、周波数領域で
ポストフィルタする方法であって、ポストフィルタがL
PCから導出される方法を提供する。さらに、スペクト
ル構造を効率的に向上させるために、LPCスペクトル
の非線形変換を適用してポストフィルタを導出する。バ
ックグラウンドスペクトルチルトの非線型変換による不
規則なスペクトル膨張を回避するために、チルト計算お
よび補償は、フォルマントポストフィルタを適用する前
に実施することが好ましい。最後に、エイリアシングを
回避するために、本発明は時間領域でのアンチエイリア
シング手順を提供する。最初の実施結果は、この方法が
信号品質、特に音声スペクトルの低出力領域に起因する
信号の部分の品質を著しく改善することを示している。
【0009】一般には、音声信号および他の信号の信号
フィルタリングは、時間領域または周波数領域で実行す
ることができる。時間領域では、フィルタ適用は、信号
を表すベクトルと、フィルタのインパルス応答を表すベ
クトルを組み合わせるたたみこみを実行し、フィルタし
た信号に対応する第3ベクトルを生成することと同等で
ある。それとは対照的に、周波数領域では、フィルタを
信号に適用する操作は、単に信号のスペクトルにフィル
タのスペクトルを掛けることと同等である。したがっ
て、フィルタのスペクトルが詳細に信号のスペクトルを
保持する場合、信号のフィルタリングは、信号の微細構
造およびフォルマントを保持する。具体的には、音声ス
ペクトルに存在する谷は、フィルタ後のスペクトルから
決して完全に消滅せず、かつ谷の代わりにローカルピー
クに変換されることもないことになる。これは、本発明
のポストフィルタがスペクトル中の点の順序を保持する
性質を有するためである。フィルタ前のスペクトル中
の、近隣より大きいスペクトル点は、フィルタ後のスペ
クトル中でも依然として大きいが、その2つの点の間の
差はフィルタにより変化する可能性がある。
【0010】したがって、本明細書で説明するポストフ
ィルタは、全体的なスペクトルチルトを生成することな
く信号のスペクトルエンベロープの山および谷に追従す
る周波数応答を利用する。このようなポストフィルタ
は、携帯電話送受信技術、インターネットメディア技
術、および低ビットレートコーデックを使用する他の記
憶装置または伝送コンテキストを含む様々な技術的コン
テキストで有利に利用することができる。
【0011】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態を詳細に説明する。
【0012】本発明は一般に、音声品質を向上するため
にポストフィルタリングを実行する方法およびシステム
に関する。この方法およびシステムでは、ポストフィル
タが、周波数領域での1組のLPC係数の非線形変換か
ら導出される。導出されたポストフィルタは、周波数領
域で合成音声信号にフォルマントフィルタ利得を掛ける
ことによって適用される。一実施形態では、本発明は、
合成音声信号をポストフィルタするための復号器で実施
される。本発明の代替実施形態によれば、ポストフィル
タを導出するために使用されるLPC係数は、符号器か
ら送信することができ、または復号器で合成音声から独
立に導出することができる。
【0013】必須ではないが、本発明は、コンピュータ
によって実行されるプログラムモジュールなどの命令を
使用して実施することができる。一般にプログラムモジ
ュールは、特定のタスクを実行し、または特定の抽象デ
ータ型を実装する、ルーチン、オブジェクト、コンポー
ネント、データ構造などを含む。用語「プログラム」
は、1つまたは複数のプログラムモジュールを含む。
【0014】本発明は、携帯電話、パーソナルコンピュ
ータ(PC)、ハンドヘルドデバイス、マルチプロセッ
サシステム、マイクロプロセッサベースのプログラム可
能な家庭用電化製品、ネットワークPC、ミニコンピュ
ータ、メインフレームコンピュータなどを含む様々なタ
イプのマシン上で実施することができる。本発明は、通
信ネットワークを介してリンクされる構成要素によって
タスクが実行される、分散システムでも利用することが
できる。分散システムでは、協働するモジュールは、ロ
ーカル位置とリモート位置のどちらにも位置することが
できる。
【0015】本発明の実施形態を使用することができる
例示的電話システムを、図2を参照しながら説明する。
この電話システムは、雲状に表されるネットワーク21
0を介して互いに通信するコーデック200、220を
備える。ネットワーク210は、ルータ、ゲートウェ
イ、ハブなど、多くの周知の構成要素を含むことがで
き、コーデック200が有線媒体および/または無線媒
体を介して通信することを可能にする。各コーデック2
00、220は、一般に符号器201、復号器202、
およびポストフィルタ203を備える。
【0016】コーデック200および220は、ホステ
ィング装置が他の装置と通信することを可能にする通信
接続も含むか、またはその通信接続に関連することが好
ましい。通信接続は通信媒体の例である。通信媒体は、
一般にコンピュータ可読命令、データ構造、プログラム
モジュール、または他のデータを搬送波または他の移送
機構などの変調データ信号で具体化し、かつどのような
情報送達媒体も含む。本明細書で使用する、コンピュー
タ可読媒体という用語は、記憶媒体と通信媒体のどちら
も含む。本明細書で説明するコーデック要素は、コンピ
ュータ可読媒体中に完全にあるようにしてもよい。コー
デック200および220は、本明細書の後で一般的に
論じるような入出力装置と関連付けることもできる。
【0017】図3を参照すると、本明細書で説明するシ
ステムを実装することができる例示的ポストフィルタ3
03が示されている。この最も基本的な構成では、ポス
トフィルタ303は、周波数領域フォルマントフィルタ
310と共に、入力合成音声信号
【0018】
【外1】
【0019】およびLPC係数αを使用する。ポストフ
ィルタは、追加の特徴または機能を有することもでき
る。例えば、ピッチフィルタ320および利得コントロ
ーラ330も実装し、以下で説明するように使用するこ
とが好ましい。
【0020】音声信号の符号化および復号化は、一般に
望ましくない雑音を信号中に導入することが知られてい
る。信号周波数スペクトルでは、このような雑音は音声
信号と重なり合い、特に、連続するフォルマント間の谷
領域で人間にとって可聴となる。適切に設計され、実装
されるポストフィルタは、この望ましくない雑音を除去
する助けとなる。理想的なポストフィルタは、注目の信
号の周波数スペクトルに追従する周波数応答を有するポ
ストフィルタである。ほとんどの現在のコーデックは、
線形予測の係数が信号周波数スペクトルに追従する線形
予測の原理に基づいている。本発明は、これから論じる
他の革新的な手順に加えて、この関係を利用して音声ポ
ストフィルタを導出するが、本発明はLPCパラメータ
の独立な生成も可能にする。
【0021】本発明に従って周波数領域ポストフィルタ
リングを実行することのできる広範な方法が存在する。
一実施形態によれば、周波数領域ポストフィルタリング
はポストフィルタ内で順次実行される。図4(a)を参
照すると、周波数領域フォルマントフィルタ410は、
フーリエ変換モジュール411、フォルマントフィルタ
リングモジュール412、および逆フーリエ変換モジュ
ール413を備える。当業者は理解するであろうが、こ
のフーリエ変換モジュールおよび逆フーリエ変換モジュ
ールは、フォルマントフィルタリングモジュール412
が時間領域と周波数領域の間で信号を転送する目的で利
用可能である。変換モジュール411および413のフ
ーリエ変換および逆フーリエ変換は、標準離散的フーリ
エ変換(DFT)に従って実行されることが好ましい。
【0022】フォルマントフィルタリングモジュール4
12は周波数領域利得を生成し、対象信号を時間領域に
戻す前に、生成した利得を適用することによって入力合
成音声信号をフィルタする。図4(b)に、フォルマン
トフィルタリングモジュール412の構成要素をさらに
示す。フォルマントフィルタリングモジュール412
は、LPCチルト計算モジュール415、LPCチルト
補償モジュール420、利得計算モジュール430、お
よび利得適用モジュール440を備える。これらのモジ
ュールの動作を図6、7に関連して以下で詳細に説明す
るが、ここでも簡単に説明する。
【0023】一般には、符号化LPCスペクトルはチル
トしたバックグラウンドを有する。このチルトは、チル
ト補償せずにポストフィルタの計算に使用する場合、信
号ひずみが許容されないものとなる可能性がある。具体
的には、ポストフィルタが本発明のように非線形変換を
使用するとき、このチルトしたバックグラウンドは、ポ
ストフィルタリング中に望ましくない仕方で増幅される
可能性がある。このような変換をチルトしたスペクトル
に適用することは、チルトを非線型に変換する効果も有
することになり、チルトしていないスペクトルを後で得
ることがより難しくなる。したがって、非線型変換の前
にスペクトルのバックグラウンドチルトを除去すること
が好ましい。本発明によれば、チルト補償モジュール4
20は、LPCスペクトルチルト計算モジュール415
によって推定されるチルトに従って、チルトしたバック
グラウンドを適切に除去する。
【0024】利得計算モジュール430は、大きさおよ
び位相応答を含む周波数領域フォルマントフィルタ利得
を計算する。ここで、利得適用モジュール440は、周
波数領域で音声信号に対して増大的に利得を適用する。
【0025】図4(c)を参照すると、利得計算モジュ
ールは、時間領域LPC表示モジュール431、モデリ
ングモジュール432、LPC非線形変換モジュール4
33、位相計算モジュール434、利得組合せモジュー
ル435、およびアンチエイリアシングモジュール43
6を備える。
【0026】LPC表示モジュール431は、LPCス
ペクトルの時間領域ベクトル表示を作成する。その後、
ベクトルは次の処理のために周波数領域に変換される。
モデリングモジュール432は、当業者に周知のいくつ
かの適切なモデルのうちの1つに基づいて周波数領域ベ
クトルをモデリングする(全極モデリング)。本発明の
実施形態では、LPCスペクトルの逆を使用して利得を
計算する。
【0027】LPC非線形変換モジュール433は、逆
LPCスペクトルの大きさの非線形変換を実施すること
によってフォルマントフィルタ利得の大きさを計算す
る。以下でより詳細に説明するように、本発明の一実施
形態によれば、0〜1の間のスケーリング因子を有する
スケーリング関数が非線形変換関数として使用される。
スケーリング関数のパラメータは、動的環境、例えば入
力音声信号のタイプや符号化速度に従って調節可能であ
る。位相計算モジュール434は、フォルマントフィル
タ利得に対する位相応答を計算する。一実施形態によれ
ば、位相計算モジュール434は、ヒルベルト変換、具
体的には移相器を介して位相応答を計算する。あるいは
他の位相計算器、例えばヒルベルト変換のコタンジェン
ト変換実装を使用することもできる。LPC非線形変換
モジュール433および位相計算モジュール434によ
って供給されるフォルマントフィルタ利得の大きさおよ
び位相を使用して、利得組合せモジュール435は周波
数領域で利得を生成する。アンチエイリアシングモジュ
ール436を提供して、信号をポストフィルタするとき
にエイリアシングを回避することが好ましい。不可欠で
はないが、時間領域でアンチエイリアシング操作を実施
することが好ましい。
【0028】本発明によれば、周波数領域ポストフィル
タはLPCスペクトルから導出され、例えば周波数領域
フォルマント利得を生成する。この導出は一連の数学的
手順を含む。この数学的手順のすべてまたは一部を担当
する別々の計算ユニットを提供することが望ましい。本
発明の別の実施形態では、別々のLPC評価ユニットを
提供し、図5(a)に示すLPC係数を導出する。
【0029】図5(a)を参照すると、周波数領域フォ
ルマントフィルタ500は、フーリエ変換モジュール5
11、逆フーリエ変換モジュール513、利得適用モジ
ュール540、およびLPC評価ユニット521を備え
る。フーリエ変換モジュール511、逆フーリエ変換モ
ジュール513、および利得適用モジュール540は、
図4(a)、(b)の類似の符号で参照されるモジュー
ルと同じでよい。本発明によれば、LPC評価ユニット
521は、LPCチルト計算モジュール510、LPC
チルト補償モジュール520、および利得計算モジュー
ル530を備える。これらの構成要素は、図4(b)の
類似の符号で参照される構成要素と同じでよい。
【0030】動作の際、図5(a)、(b)で説明する
代替実施形態は、図4(a)、(b)、(c)によって
示す実施形態とはわずかに異なる。具体的には、利得適
用モジュール540は入力として合成音声信号を受け取
り、出力としてフィルタした合成音声信号を供給する。
フーリエ変換モジュールおよび逆フーリエ変換モジュー
ル511および513は、利得適用モジュールが事前フ
ィルタした音声信号を周波数領域に変換し、事後フィル
タした音声信号を時間領域に変換する目的で利用可能で
ある。LPC評価ユニット521はLPC係数を受け取
るか、または計算し、時間領域と周波数領域間の変換が
必要なときに変換モジュール511および513にアク
セスし、計算した利得を利得適用モジュール540に戻
す。
【0031】図6および7を参照すると、本発明の実施
形態に従ってポストフィルタリングを実行するための例
示的ステップが示されている。合成された音声信号
【0032】
【外2】
【0033】およびLPC係数αをステップ601で
受け取る。符号化LPCスペクトルは一般に、フォルマ
ントポストフィルタを直接計算するために使用すると
き、余分なひずみを誘発するチルトしたバックグラウン
ドを有するので、まず任意のスペクトルチルトを計算
し、それを補正することが好ましい。未補正のチルト
は、ポストフィルタの計算中に、特にその計算が非線形
変換を含むとき、望ましくない仕方で増幅する可能性が
ある。したがって、ステップ603および605は、そ
れぞれLPCスペクトルチルトを計算し、それに対して
スペクトルを補償する。これらのステップを実行するた
めに使用可能な例示的な数学的手順は以下の通りであ
る。以下の数学的手順の構成および細部を変更しても同
じ結果を達成できることを当業者は理解されよう。Pを
LPC多項式係数の次数として、LPC係数α(i=
0,1..Pかつα=1)に対して、LPCスペクト
ルのチルトμは以下のように定義される。
【0034】
【数1】
【0035】上式でR(1)およびR(0)は、以下で
定義されるLPCパラメータの自己相関値である。
【0036】
【数2】
【0037】LPC次数Pは、当業者には明らかである
通り、サンプル周波数に応じて選択される。この実施形
態では、8kHzおよび11.025kHzサンプリン
グ速度に対してP=10を使用し、16kHzおよび2
2.05kHzサンプリング速度に対してP=16を使
用する。計算したチルトμが与えられる場合、LPC係
数αは以下のように補償される。
【0038】
【数3】
【0039】ステップ607では、Aと示す、時間領域
でチルト補償したαのベクトル表示をゼロパディング
によって得、好都合のサイズのベクトルを形成する。こ
のようなベクトルについての例示的な長さは128であ
るが、他の類似のベクトル長、または全く異なるベクト
ル長を同様に使用することができる。
【0040】ステップ609から623では、大きさお
よび位相応答を含むフォルマントポストフィルタ利得を
計算する。具体的には、ステップ609で、ベクトルA
をフーリエ変換を介して周波数領域ベクトルA′(k)
に変換する。ステップ613では、周波数領域ベクトル
A′(k)の大きさの逆数をとり、対数目盛(dB)に
変換することによってA′(k)を変更する。このステ
ップによる伝達関数をH(k)と示す。数学的な効率お
よび都合のため、ステップ615でまずH(k)を以下
の例のように
【0041】
【外3】
【0042】に正規化する。
【0043】
【数4】
【0044】上式で、Hmax(k)およびH
min(k)は、それぞれH(k)の最大値および最小
値である。
【0045】ステップ615では、以下のようなスケー
リング関数を介して非線型に正規化関数
【0046】
【外4】
【0047】を変換する。
【0048】
【数5】
【0049】上式でcは定数である。cの例示的な値は
音声信号に対して1.47であり、非音声信号に対して
1.3である。スケーリング因子γは、動的環境条件に
従って調節することができる。例えば、異なるタイプの
音声コーダや、異なる符号化速度では、任意選択でこの
定数に関して異なる値を使用することができる。スケー
リング因子γに関する例示的な値は0.25であるが、
他のスケーリング因子でも、許容される結果、またはよ
り良好な結果を得ることができる。非線形変換のステッ
プに関して上記のスケーリング関数を使用するものとし
て本発明を説明したが、別法として他の非線形変換関数
も使用することができる。このような関数には、適切な
指数関数および多項式関数が含まれる。
【0050】次いで、ステップ615で得た関数T
(k)を使用して利得の位相応答を推定する。本発明に
よれば、ステップ617から623は、ヒルベルト移相
器を実装して利得の位相応答θ(k)を計算する。具体
的には、ステップ617では、ヒルベルト移相器が時間
領域で実施されるので、フーリエ変換を実施することに
よって関数T(k)を時間領域に伝達する。ステップ6
19では、T(n)にjを掛けることによって位相応答
θ(n)を得る。ただしjはj=−1と定義される。
ステップ621では、計算した利得の位相応答θ(n)
を、周波数領域でさらに処理するために周波数領域位相
応答θ(k)に変換する。
【0051】ステップ623では、周波数領域フォルマ
ントフィルタ利得F(k)が、大きさ成分および位相成
分を組み合わせることによって以下のように得られる。
【0052】
【数6】
【0053】上式でqおよびgは、
【0054】
【数7】
【0055】と定義される定数である。上式でlnは自
然対数である。
【0056】ステップ625から631を実行して時間
領域でアンチエイリアシングを実施する。具体的には、
ステップ625では、周波数領域利得F(k)を逆フー
リエ変換の実行を介して時間領域利得f(n)に変換す
る。すなわちF(k)の逆フーリエ変換はf(n)に等
しい。ステップ627では、以下のようにフーリエ変換
長Nおよび入力音声セグメント長Mに従ってf(n)の
係数をゼロにすることによって第2関数g(n)を定義
する。
【0057】
【数8】
【0058】ステップ629は、以下のようにg(n)
に標準的な正規化手順を適用するものである。
【0059】
【数9】
【0060】最後にステップ631で、フーリエ変換を
介して時間領域関数g(n)を周波数領域に伝達する
ことによってアンチエイリアシング後の周波数領域利得
G(k)を得る。すなわち、g(n)のフーリエ変換
はG(k)に等しい。
【0061】周波数領域フォルマント利得G(k)を計
算した後、ステップ633から637を実行して入力合
成音声信号
【0062】
【外5】
【0063】のフィルタリングを実施する。具体的に
は、ステップ633では、まず信号
【0064】
【外6】
【0065】を周波数領域信号
【0066】
【外7】
【0067】に伝達する。周波数領域でのポストフィル
タリングが信号に各周波数についての利得を掛けること
によって実施されることを想起して、ステップ635で
【0068】
【外8】
【0069】に周波数領域フォルマントフィルタ利得G
(k)を掛け、ポストフィルタした音声信号
【0070】
【外9】
【0071】を得る。次いで、ステップ637で
【0072】
【外10】
【0073】を時間領域に変換することによって、ポス
トフィルタした音声信号
【0074】
【外11】
【0075】を得る。
【0076】図8を参照すると、本発明の実施形態を実
施するための1つの例示的システムは、コンピューティ
ング装置700などのコンピューティング装置を含む。
その最も基本的な構成において、コンピューティング装
置700は、一般に少なくとも1つのプロセッサ702
およびメモリ704を含む。コンピューティング装置の
厳密な構成およびタイプに応じて、メモリ704は、揮
発性(RAMなど)、不揮発性(ROM、フラッシュメ
モリなど)、またはその2つの組合せとすることができ
る。この最も基本的な構成を図8の線706で示す。加
えて装置700は、追加の特徴/機能も有することがで
きる。例えば装置700は、限定はしないが磁気ディス
クまたは光ディスク、あるいはテープを含む(取外し可
能および/または取外し不能な)追加の記憶装置も含む
ことができる。このような追加の記憶装置を、図8の取
外し可能記憶装置708および取外し不能記憶装置71
0で示す。コンピュータ記憶媒体は、コンピュータ可読
命令、データ構造、プログラムモジュール、または他の
データなどの情報を記憶するための何らかの方法または
技術で実装される、揮発性媒体および不揮発性媒体、な
らびに取外し可能媒体および取外し不能媒体を含む。メ
モリ704、取外し可能記憶装置708、および取外し
不能記憶装置710は、コンピュータ記憶媒体の全て例
である。コンピュータ記憶媒体には、限定はしないが、
RAM、ROM、EEPROM、フラッシュメモリ、ま
たは他のメモリ技術、CDROM、DVD(digital ver
satiledisc)、または他の光記憶装置、磁気カセット、
磁気テープ、磁気ディスク記憶装置、または他の磁気記
憶装置、あるいは、所望の情報を記憶するために使用す
ることができ、装置700でアクセスすることができる
他のどんな媒体も含まれる。このようなどんなコンピュ
ータ記憶媒体も装置700の一部とすることができる。
【0077】装置700は、他の装置と通信することを
可能とする1つまたは複数の通信接続712も含むこと
ができる。通信接続712は通信媒体の例である。通信
媒体は一般に、コンピュータ可読命令、データ構造、プ
ログラムモジュール、または他のデータを、搬送波また
は他の移送機構などの被変調データ信号で具体化し、そ
の通信媒体には任意の情報送達媒体が含まれる。用語
「被変調データ信号」は、その特性集合のうちの1つま
たは複数を有する信号、または情報をその中に符号化す
るように変化した信号を意味する。例えば、限定はしな
いが、通信媒体には、有線ネットワークまたは直接配線
接続などの有線媒体、ならびに音響、RF(radio freq
uency)、赤外線、および他の無線媒体などの無線媒体
が含まれる。上記で論じたように、本明細書で使用す
る、コンピュータ可読媒体という用語は、記憶媒体と通
信媒体のどちらも含む。
【0078】装置700は、キーボード、マウス、ペ
ン、音声入力装置、タッチ入力装置などの1つまたは複
数の入力装置714も含むことができる。ディスプレ
イ、スピーカ、プリンタなどの1つまたは複数の出力装
置716も含むことができる。これらの装置はすべて当
技術分野で周知であり、ここでさらに論じる必要はな
い。
【0079】ポストフィルタリングを実行する、新し
く、かつ有用な方法およびシステムが本明細書で説明さ
れたことを当業者は理解されよう。しかし、本発明の原
理を適用することができる多くの可能な実施形態に鑑み
て、図面に関連して本明細書で説明した実施形態は例示
のために示したものにすぎず、発明の範囲を限定するも
のではないことを理解されたい。例えば、本発明の趣旨
から逸脱することなく、例示した実施形態の構成および
細部を変更できることを当業者は理解されよう。例え
ば、非線型変換について、0〜1のスケーリング因子を
有するスケーリング関数を利用するものとして本発明を
説明している。しかし、他の変換関数および変換因子も
利用することができる。例えば指数関数および多項式関
数も本発明内で使用することができる。さらに、利得の
位相応答を計算するためにヒルベルト移相器を指定して
いるが、コタンジェント変換技法など、関数の位相応答
を計算するための他の技法も使用することができる。時
間領域から周波数領域への変換を実施する際、本明細書
はDFTを規定しているが、高速フーリエ変換(FF
T)、さらには標準フーリエ変換など他の変換技法も同
様に利用することができる。本発明をソフトウェアモジ
ュールまたはコンポーネントによって説明したが、これ
をハードウェア構成要素で等しく置換できることを当業
者は理解されよう。したがって本明細書で説明した本発
明では、このようなすべての実施形態が、頭記の特許請
求の範囲およびその均等物の範囲内にあることが企図さ
れる。
【0080】
【発明の効果】以上、説明したように、本発明によれ
ば、合成音声信号をポストフィルタして音声信号の品質
を向上することが可能となる。
【図面の簡単な説明】
【図1】典型的な従来技術の時間領域ポストフィルタリ
ングアーキテクチャを示す概略図である。
【図2】ネットワークリンクしたコーデックのアーキテ
クチャ図である。
【図3】本発明の実施形態による周波数領域ポストフィ
ルタの単純化した構成図である。
【図4】本発明の実施形態による周波数領域フォルマン
トフィルタの構成要素を示す構成図で、(a)は周波数
領域フォルマントフィルタ、(b)はフォルマントフィ
ルタリングモジュール、(c)は利得計算モジュールの
図である。
【図5】本発明の代替実施形態による周波数領域フォル
マントフィルタの構成要素を示す構成図で、(a)は周
波数領域フォルマントフィルタ、(b)はLPC評価ユ
ニットの図である。
【図6】本発明の実施形態によるポストフィルタリング
を実行する際に実行されるステップを示す流れ図であ
る。
【図7】本発明の実施形態によるポストフィルタリング
を実行する際に実行されるステップを示す流れ図であ
る。
【図8】本発明の実施形態を実行することができるコン
ピューティング装置によって使用されるコンピューティ
ング装置アーキテクチャを示す概略図である。
【符号の説明】
100 復号器 110 ビットストリーム復号器 120 音声シンセサイザ 130 時間領域ポストフィルタ 131 フォルマントフィルタ 132 ピッチフィルタ 133 チルト補償モジュール 134 利得コントローラ 200、220 コーデック 201 符号器 202 復号器 203 ポストフィルタ 210 ネットワーク 303 ポストフィルタ 310 周波数領域フォルマントフィルタ 320 ピッチフィルタ 330 利得コントローラ 410 周波数領域フォルマントフィルタ 411 フーリエ変換モジュール 412 フォルマントフィルタリングモジュール 413 逆フーリエ変換モジュール 412 フォルマントフィルタリングモジュール 415 LPCチルト計算モジュール 420 LPCチルト補償モジュール 430 利得計算モジュール 431 LPC表示モジュール 432 モデリングモジュール 433 LPC非線形変換モジュール 434 位相計算モジュール 435 利得組合せモジュール 436 アンチエイリアシングモジュール 440 利得適用モジュール 500 周波数領域フォルマントフィルタ 510 LPCチルト計算モジュール 511 フーリエ変換モジュール 513 逆フーリエ変換モジュール 520 LPCチルト補償モジュール 521 LPC評価ユニット 530 利得計算モジュール 540 利得適用モジュール 700 コンピューティング装置 702 プロセッサ 704 メモリ 708 取外し可能記憶装置 710 取外し不能記憶装置 712 通信接続 714 入力装置 716 出力装置
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ホン ウォン アメリカ合衆国 98004 ワシントン州 ベルビュー 103 アベニュー ノースイ ースト 37 ナンバー508 (72)発明者 ウラジミール カッパーマン アメリカ合衆国 93117 カリフォルニア 州 ゴレタ シエロ アベニュー 5635 (72)発明者 アレン ガーショ アメリカ合衆国 93111 カリフォルニア 州 サンタ バーバラ ビア ジェニータ 4604 (72)発明者 ホサム エー.カリル アメリカ合衆国 98005 ワシントン州 ベルビュー ノースイースト 8 ストリ ート 12224 ナンバー108 Fターム(参考) 5J064 AA01 BA16 BB03 BC01 BC02 BC08 BC09 BC11 BC18 BD02 BD03

Claims (23)

    【特許請求の範囲】
  1. 【請求項1】 音声信号の人の知覚品質を高めるため
    に、前記音声信号の線形予測係数を使用して前記音声信
    号をポストフィルタする方法であって、 周波数領域で前記線形予測係数のスペクトルの非線型変
    換を実行することによってポストフィルタを生成するス
    テップと、 生成した前記ポストフィルタを、周波数領域で合成音声
    信号に適用するステップと、 フィルタした周波数領域前記合成音声信号を、時間領域
    で音声信号に変換するステップとを備えたことを特徴と
    する方法。
  2. 【請求項2】 ポストフィルタを生成するステップは、 時間領域で前記線形予測係数のスペクトルのチルトを計
    算するステップと、 時間領域で計算した前記チルトを使用して前記線形予測
    係数のスペクトルを補償するステップとをさらに備えた
    ことを特徴とする請求項1に記載の方法。
  3. 【請求項3】 前記補償するステップは、ゼロパディン
    グ技法を適用するステップをさらに備えたことを特徴と
    する請求項2に記載の方法。
  4. 【請求項4】 ポストフィルタを生成するステップは、 前記線形予測係数のスペクトルを時間領域のベクトルに
    よって表すステップと、 前記時間領域のベクトルをフーリエ変換によって周波数
    領域のベクトルに変換するステップと、 前記周波数領域のベクトルを反転するステップと、 全極モデルのベクトルの大きさに従って、大きさおよび
    位相応答を含む利得を計算するステップとをさらに備え
    たことを特徴とする請求項1に記載の方法。
  5. 【請求項5】 前記利得を計算するステップは、 前記全極モデルのベクトルの大きさを正規化するステッ
    プと、 前記全極モデルのベクトルの前記正規化した大きさに対
    する非線型変換を実施して、前記利得の大きさを得るス
    テップと、 前記利得の前記位相応答を推定するステップと、 前記利得の大きさと推定した位相応答とを組み合わせる
    ことによって前記利得を形成するステップとをさらに備
    えたことを特徴とする請求項4に記載の方法。
  6. 【請求項6】 前記位相応答を推定するステップは、前
    記利得に対して高速フーリエ変換ベースの移相器を実行
    するステップをさらに備えたことを特徴とする請求項5
    に記載の方法。
  7. 【請求項7】 ポストフィルタを生成するステップは、
    利得を計算するステップの後に、時間領域でアンチエイ
    リアシング手順を実行するステップをさらに備えたこと
    を特徴とする請求項1に記載の方法。
  8. 【請求項8】 前記全極モデルは、周波数領域線の形予
    測係数のベクトルの、大きさの逆数の対数によって表さ
    れることを特徴とする請求項4に記載の方法。
  9. 【請求項9】 前記非線型変換関数は、0〜1の間のス
    ケーリング因子を有するスケーリング関数を含むことを
    特徴とする請求項5に記載の方法。
  10. 【請求項10】 音声信号の線形予測係数のスペクトル
    を使用して合成音声信号をポストフィルタするステップ
    を実行するためのコンピュータ可読命令を有するコンピ
    ュータ読み取り可能な記録媒体であって、 前記線形予測係数のスペクトルのチルトを計算するステ
    ップと、 計算した前記チルトを使用して前記線形予測係数のスペ
    クトルを補償するステップと、 補償した前記線形予測係数のスペクトルの非線形変換を
    周波数領域で実行することによってポストフィルタを生
    成するステップと、 生成した前記ポストフィルタを、周波数領域で前記合成
    音声信号に適用するステップとを備えたことを特徴とす
    るコンピュータ読み取り可能な記録媒体。
  11. 【請求項11】 ポストフィルタを生成するステップ
    は、 前記線形予測係数を時間領域のベクトルによって表すス
    テップと、 前記時間領域のベクトルをフーリエ変換によって周波数
    領域のベクトルに変換するステップと、 前記周波数領域のベクトルを全極モデルのベクトルに変
    換するステップと、 前記全極モデルのベクトルの大きさに従って、大きさお
    よび位相応答を含む利得を計算するステップとをさらに
    備えたことを特徴とする請求項10に記載のコンピュー
    タ読み取り可能な記録媒体。
  12. 【請求項12】 前記利得を計算するステップは、 前記全極モデルのベクトルの大きさを正規化するステッ
    プと、 前記全極モデルのベクトルの正規化した大きさに対する
    非線形変換を実施し、前記利得の大きさを得るステップ
    と、 前記利得の前記位相応答を推定するステップと、 前記利得の大きさと推定した位相応答とを組み合わせる
    ことによって前記利得を形成するステップとを備えたこ
    とを特徴とする請求項11に記載の前記コンピュータ読
    み取り可能な記録媒体。
  13. 【請求項13】 前記位相応答を推定するステップは、
    高速フーリエ変換ベースの移相器を実行するステップを
    さらに備えたことを特徴とする請求項12に記載のコン
    ピュータ読み取り可能な記録媒体。
  14. 【請求項14】 ポストフィルタを生成するステップ
    は、時間領域でアンチエイリアシング手順を実行するス
    テップをさらに備えたことを特徴とする請求項10に記
    載のコンピュータ読み取り可能な記録媒体。
  15. 【請求項15】 前記全極モデルは、前記周波数領域の
    ベクトルの、大きさの逆数の対数によって表されること
    を特徴とする請求項11に記載のコンピュータ読み取り
    可能な記録媒体。
  16. 【請求項16】 前記非線形変換関数は、0〜1の間の
    スケーリング因子を有するスケーリング関数を含むこと
    を特徴とする請求項12に記載のコンピュータ読み取り
    可能な記録媒体。
  17. 【請求項17】 音声信号の人の知覚品質を高めるため
    に、前記音声信号の複数の線形予測係数を使用して前記
    音声信号をポストフィルタする装置であって、 フーリエ変換を実施するように動作可能なフーリエ変換
    モジュールと、 逆フーリエ変換を実施するように動作可能な逆フーリエ
    変換モジュールと、 フォルマントフィルタ利得を有するフォルマントフィル
    タであって、前記利得が、前記線形予測係数の非線形変
    換を実行することによって周波数領域で計算されるフォ
    ルマントフィルタとを備えたことを特徴とする装置。
  18. 【請求項18】 前記フォルマントフィルタは、 前記線形予測係数のスペクトルのチルトを計算するため
    の線形予測係数チルト計算モジュールと、 前記線形予測係数のスペクトルの計算した前記チルトに
    従って前記線形予測係数を補償するための線形予測係数
    チルト補償モジュールと、 チルト補償の後に前記線形予測係数の非線形変換を実行
    することによって周波数領域でフォルマントフィルタ利
    得を計算するためのフォルマント利得計算モジュールで
    あって、前記利得は、大きさおよび位相応答を含むフォ
    ルマント利得計算モジュールと、 前記周波数領域で前記利得と前記音声信号を掛けること
    によって前記フォーマットフィルタ利得を音声信号に適
    用するための利得適用モジュールとをさらに備えたこと
    を特徴とする請求項17に記載の装置。
  19. 【請求項19】 前記フォルマント利得計算モジュール
    は、 時間領域のベクトルによって前記線形予測係数を表すた
    めの線形予測係数表示モジュールと、 LPC係数を表す前記時間領域のベクトルから変換され
    る周波数領域のベクトルを、事前定義モデルに従ってモ
    デリングし、大きさを生成するモデリングモジュール
    と、 前記大きさに対する非線形変換を実行し、前記フォルマ
    ントフィルタ利得の大きさを生成するための線形予測係
    数非線形変換モジュールと、 非線形変換後のモデルの大きさに従って、前記フォルマ
    ントフィルタ利得の位相応答を計算するための位相計算
    モジュールと、 前記フォルマントフィルタ利得の大きさと位相応答とを
    組み合わせるためのフォルマントフィルタ利得組合せモ
    ジュールと、 前記フォルマントフィルタの適用によって引き起こされ
    るエイリアシングを防止するためのアンチエイリアシン
    グモジュールとをさらに備えたことを特徴とする請求項
    18に記載の装置。
  20. 【請求項20】 前記線形予測係数表示モジュールは、
    ゼロパディング技法によって前記線形予測係数を表すよ
    うに適合されることを特徴とする請求項19に記載の装
    置。
  21. 【請求項21】 前記線形予測係数非線型変換モジュー
    ルは、0〜1の間のスケーリング因子を有するスケーリ
    ング関数をさらに備えたことを特徴とする請求項19に
    記載の装置。
  22. 【請求項22】 前記位相計算モジュールは、時間領域
    でのヒルベルト移相器をさらに備えたことを特徴とする
    請求項19に記載の装置。
  23. 【請求項23】 信号の線形予測係数を処理し、フォル
    マントフィルタに関する周波数領域のフォルマントフィ
    ルタ利得を供給するための、ポストフィルタと共に使用
    するための装置であって、 前記線形予測係数のチルトを計算するための線形予測係
    数チルト計算モジュールと、 前記線形予測係数のスペクトルの計算したチルトに従っ
    て前記線形予測係数のスペクトルを補償するための線形
    予測係数チルト補償モジュールと、 前記線形予測係数に従って前記周波数領域のフォルマン
    トフィルタ利得を計算するためのフォルマントフィルタ
    利得計算モジュールであって、前記利得が大きさおよび
    位相応答を含むフォルマントフィルタ利得計算モジュー
    ルとを備えたことを特徴とする装置。
JP2002192639A 2001-06-29 2002-07-01 コード化音声の品質向上のための周波数領域ポストフィルタリングの方法、装置及び記録媒体 Expired - Fee Related JP4376489B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/896,062 2001-06-29
US09/896,062 US6941263B2 (en) 2001-06-29 2001-06-29 Frequency domain postfiltering for quality enhancement of coded speech

Publications (2)

Publication Number Publication Date
JP2003108196A true JP2003108196A (ja) 2003-04-11
JP4376489B2 JP4376489B2 (ja) 2009-12-02

Family

ID=25405563

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002192639A Expired - Fee Related JP4376489B2 (ja) 2001-06-29 2002-07-01 コード化音声の品質向上のための周波数領域ポストフィルタリングの方法、装置及び記録媒体

Country Status (5)

Country Link
US (2) US6941263B2 (ja)
EP (1) EP1271472B1 (ja)
JP (1) JP4376489B2 (ja)
AT (1) ATE355591T1 (ja)
DE (1) DE60218385T2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009508146A (ja) * 2005-05-31 2009-02-26 マイクロソフト コーポレーション オーディオコーデックポストフィルタ
JP2009512895A (ja) * 2005-10-21 2009-03-26 クゥアルコム・インコーポレイテッド スペクトル・ダイナミックスに基づく信号コーディング及びデコーディング
JP2009530685A (ja) * 2006-03-20 2009-08-27 マインドスピード・テクノロジーズ・インコーポレイテッド Mdct係数を使用する音声後処理
US8392176B2 (en) 2006-04-10 2013-03-05 Qualcomm Incorporated Processing of excitation in audio coding and decoding
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
US11282530B2 (en) 2014-04-17 2022-03-22 Voiceage Evs Llc Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7315815B1 (en) 1999-09-22 2008-01-01 Microsoft Corporation LPC-harmonic vocoder with superframe structure
US6941263B2 (en) * 2001-06-29 2005-09-06 Microsoft Corporation Frequency domain postfiltering for quality enhancement of coded speech
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US8625680B2 (en) * 2003-09-07 2014-01-07 Microsoft Corporation Bitstream-controlled post-processing filtering
US7478040B2 (en) * 2003-10-24 2009-01-13 Broadcom Corporation Method for adaptive filtering
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
WO2006134992A1 (ja) * 2005-06-17 2006-12-21 Matsushita Electric Industrial Co., Ltd. ポストフィルタ、復号化装置及びポストフィルタ処理方法
US7720677B2 (en) * 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
US7774396B2 (en) 2005-11-18 2010-08-10 Dynamic Hearing Pty Ltd Method and device for low delay processing
EP1977511B1 (en) * 2006-01-24 2011-04-06 Verayo, Inc. Signal generator based device security
JP5460057B2 (ja) * 2006-02-21 2014-04-02 ウルフソン・ダイナミック・ヒアリング・ピーティーワイ・リミテッド 低遅延処理方法及び方法
WO2008032828A1 (fr) * 2006-09-15 2008-03-20 Panasonic Corporation Dispositif de codage audio et procédé de codage audio
JP4757158B2 (ja) * 2006-09-20 2011-08-24 富士通株式会社 音信号処理方法、音信号処理装置及びコンピュータプログラム
CN101622668B (zh) 2007-03-02 2012-05-30 艾利森电话股份有限公司 电信网络中的方法和装置
CN101303858B (zh) * 2007-05-11 2011-06-01 华为技术有限公司 实现基音增强后处理的方法及装置
KR100922897B1 (ko) * 2007-12-11 2009-10-20 한국전자통신연구원 Mdct 영역에서 음질 향상을 위한 후처리 필터장치 및필터방법
ES2396173T3 (es) * 2008-07-18 2013-02-19 Dolby Laboratories Licensing Corporation Método y sistema para post-filtrado en el dominio frecuencia de datos de audio codificados en un decodificador
CN101983402B (zh) * 2008-09-16 2012-06-27 松下电器产业株式会社 声音分析装置、方法、系统、合成装置、及校正规则信息生成装置、方法
ES2686889T3 (es) * 2009-12-14 2018-10-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dispositivo de cuantificación vectorial, dispositivo de codificación de voz, procedimiento de cuantificación vectorial y procedimiento de codificación de voz
PL2676268T3 (pl) 2011-02-14 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
AU2012217158B2 (en) 2011-02-14 2014-02-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
EP4243017A3 (en) 2011-02-14 2023-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method decoding an audio signal using an aligned look-ahead portion
ES2535609T3 (es) 2011-02-14 2015-05-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de audio con estimación de ruido de fondo durante fases activas
BR112013020324B8 (pt) 2011-02-14 2022-02-08 Fraunhofer Ges Forschung Aparelho e método para supressão de erro em fala unificada de baixo atraso e codificação de áudio
CN103493129B (zh) 2011-02-14 2016-08-10 弗劳恩霍夫应用研究促进协会 用于使用瞬态检测及质量结果将音频信号的部分编码的装置与方法
CN102930872A (zh) * 2012-11-05 2013-02-13 深圳广晟信源技术有限公司 用于宽带语音解码中基音增强后处理的方法及装置
ES2732560T3 (es) * 2013-01-29 2019-11-25 Fraunhofer Ges Forschung Llenado de ruido sin información secundaria para codificadores tipo celp
US9685173B2 (en) * 2013-09-06 2017-06-20 Nuance Communications, Inc. Method for non-intrusive acoustic parameter estimation
US9870784B2 (en) 2013-09-06 2018-01-16 Nuance Communications, Inc. Method for voicemail quality detection
JP6279181B2 (ja) * 2016-02-15 2018-02-14 三菱電機株式会社 音響信号強調装置
CN111833891B (zh) * 2020-07-21 2024-05-14 北京百瑞互联技术股份有限公司 一种lc3编解码系统、lc3编码器及其优化方法
CN114171035A (zh) * 2020-09-11 2022-03-11 海能达通信股份有限公司 抗干扰方法及装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US5067158A (en) * 1985-06-11 1991-11-19 Texas Instruments Incorporated Linear predictive residual representation via non-iterative spectral reconstruction
US4969192A (en) 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US5701390A (en) * 1995-02-22 1997-12-23 Digital Voice Systems, Inc. Synthesis of MBE-based coded speech using regenerated phase information
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
JP3653826B2 (ja) * 1995-10-26 2005-06-02 ソニー株式会社 音声復号化方法及び装置
KR0155315B1 (ko) * 1995-10-31 1998-12-15 양승택 Lsp를 이용한 celp보코더의 피치 검색방법
US6047254A (en) * 1996-05-15 2000-04-04 Advanced Micro Devices, Inc. System and method for determining a first formant analysis filter and prefiltering a speech signal for improved pitch estimation
US6073092A (en) * 1997-06-26 2000-06-06 Telogy Networks, Inc. Method for speech coding based on a code excited linear prediction (CELP) model
US6098036A (en) * 1998-07-13 2000-08-01 Lockheed Martin Corp. Speech coding system and method including spectral formant enhancer
US6823303B1 (en) * 1998-08-24 2004-11-23 Conexant Systems, Inc. Speech encoder using voice activity detection in coding noise
US6493665B1 (en) * 1998-08-24 2002-12-10 Conexant Systems, Inc. Speech classification and parameter weighting used in codebook search
US6385573B1 (en) * 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
US6480822B2 (en) 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
US6449592B1 (en) * 1999-02-26 2002-09-10 Qualcomm Incorporated Method and apparatus for tracking the phase of a quasi-periodic signal
US6505152B1 (en) * 1999-09-03 2003-01-07 Microsoft Corporation Method and apparatus for using formant models in speech systems
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US6941263B2 (en) * 2001-06-29 2005-09-06 Microsoft Corporation Frequency domain postfiltering for quality enhancement of coded speech

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009508146A (ja) * 2005-05-31 2009-02-26 マイクロソフト コーポレーション オーディオコーデックポストフィルタ
JP2012163981A (ja) * 2005-05-31 2012-08-30 Microsoft Corp オーディオコーデックポストフィルタ
JP2009512895A (ja) * 2005-10-21 2009-03-26 クゥアルコム・インコーポレイテッド スペクトル・ダイナミックスに基づく信号コーディング及びデコーディング
US8027242B2 (en) 2005-10-21 2011-09-27 Qualcomm Incorporated Signal coding and decoding based on spectral dynamics
JP2009530685A (ja) * 2006-03-20 2009-08-27 マインドスピード・テクノロジーズ・インコーポレイテッド Mdct係数を使用する音声後処理
US8095360B2 (en) 2006-03-20 2012-01-10 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
US8392176B2 (en) 2006-04-10 2013-03-05 Qualcomm Incorporated Processing of excitation in audio coding and decoding
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
US11282530B2 (en) 2014-04-17 2022-03-22 Voiceage Evs Llc Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
US11721349B2 (en) 2014-04-17 2023-08-08 Voiceage Evs Llc Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates

Also Published As

Publication number Publication date
US20030009326A1 (en) 2003-01-09
US6941263B2 (en) 2005-09-06
ATE355591T1 (de) 2006-03-15
DE60218385T2 (de) 2007-06-14
EP1271472A3 (en) 2003-11-05
DE60218385D1 (de) 2007-04-12
JP4376489B2 (ja) 2009-12-02
US20050131696A1 (en) 2005-06-16
EP1271472B1 (en) 2007-02-28
US7124077B2 (en) 2006-10-17
EP1271472A2 (en) 2003-01-02

Similar Documents

Publication Publication Date Title
JP4376489B2 (ja) コード化音声の品質向上のための周波数領域ポストフィルタリングの方法、装置及び記録媒体
US7379866B2 (en) Simple noise suppression model
EP0673013B1 (en) Signal encoding and decoding system
KR100947421B1 (ko) 이득 계수 평활화를 위한 시스템, 방법, 및 장치
US5752222A (en) Speech decoding method and apparatus
US7216074B2 (en) System for bandwidth extension of narrow-band speech
US6654716B2 (en) Perceptually improved enhancement of encoded acoustic signals
US6691085B1 (en) Method and system for estimating artificial high band signal in speech codec using voice activity information
JP3881946B2 (ja) 音響符号化装置及び音響符号化方法
JP2009530685A (ja) Mdct係数を使用する音声後処理
JP2004101720A (ja) 音響符号化装置及び音響符号化方法
JPH11249699A (ja) 音声パラメータの合同量子化
JP5222452B2 (ja) 音響信号の符号化の知覚的改善
JP2003323199A (ja) 符号化装置、復号化装置及び符号化方法、復号化方法
JPH1097296A (ja) 音声符号化方法および装置、音声復号化方法および装置
US7603271B2 (en) Speech coding apparatus with perceptual weighting and method therefor
JPH056197A (ja) 音声合成装置用ポストフイルタ
JP2004302259A (ja) 音響信号の階層符号化方法および階層復号化方法
JP4287840B2 (ja) 符号化装置
EP1564723A1 (en) Transcoder and coder conversion method
JP3163206B2 (ja) 音響信号符号化装置
JP3230790B2 (ja) 広帯域音声信号復元方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050614

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050614

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081017

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090115

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090421

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090721

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090811

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090909

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120918

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120918

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130918

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees