JP2019164348A

JP2019164348A - オーディオ信号を処理するための方法および装置、オーディオデコーダならびにオーディオエンコーダ

Info

Publication number: JP2019164348A
Application number: JP2019054137A
Authority: JP
Inventors: エマニュエルラベリ; Ravelli Emmanuel; マヌエルジャンダー; Jander Manuel; グジェゴジュピェトルズィク; Pietrzyk Grzegorz; マルティーンディーツ; Dietz Martin; マルクゲイヤー; Marc Gayer
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2014-07-28
Filing date: 2019-03-22
Publication date: 2019-09-26
Anticipated expiration: 2035-07-03
Also published as: EP3175452A1; JP6503051B2; ES2773690T3; EP4235667B1; PT3407351T; MX2017001245A; SG11201700684YA; EP4030426B1; EP4447048A3; EP4030426C0; US11869525B2; AR101287A1; EP4235667A2; MX362737B; ES2685984T3; EP3407351A1; KR101997006B1; EP4030426A1; BR112017001362A2; EP4235667A3

Abstract

【課題】フィルタされたオーディオフレームの中の不連続点を除去するための方法を提供する。【解決手段】オーディオ信号１００のフィルタ処理された過去フレームとフィルタ処理された現フレームとの間の不連続点は、線形予測フィルタ処理１０２，１１０，１１２を使用して除去される。【選択図】図５

Description

本発明は、オーディオ信号の分野に関し、より具体的には、複数のオーディオフレームを含むオーディオ信号を処理するための方法に関し、連続的なフィルタ処理されたオーディオフレームの間の不連続点が低減されるか、または除かれる。

オーディオ信号処理の分野において、オーディオ信号は、さまざまな理由、たとえば、長期予測フィルタが、オーディオ信号におけるハーモニックスのセットを完全に減衰するか、または、さらに抑制するために、オーディオ信号エンコーダで用いられうるために、フィルタ処理されうる。

オーディオ信号は、複数のオーディオフレームを含み、フレームは、長期予測フィルタを用いてフィルタ処理される。オーディオ信号の２つの連続フレームを考慮する場合、過去フレームおよび現フレーム、パラメータｃのセットを有する線形フィルタＨ（ｚ）が、オーディオ信号をフィルタ処理するために使用される。より具体的には、過去フレームは、いわゆるフィルタ処理された過去フレームを作り出すパラメータｃ₀の最初のセットを使用して、フィルタＨ（ｚ）を用いてフィルタ処理される。現フレームは、フィルタ処理された現フレームを作り出すパラメータｃ₁のセットを使用して、フィルタＨ（ｚ）を用いてフィルタ処理される。図１は、周知の方法に従ってオーディオ信号の連続フレームを処理するためのブロック図である。複数のオーディオフレームを含むオーディオ信号１００が供給される。オーディオ信号１００は、フィルタブロック１０２に供給され、そして、オーディオ信号１００の現フレームｎがフィルタ処理される。オーディオ信号１００の側のフィルタブロックは、オーディオ信号の現フレームのためのフィルタパラメータｃ_nのセットを受信する。フィルタブロック１０２は、オーディオ信号の現フレームｎをフィルタ処理し、そして、連続的にフィルタ処理されたフレームを含むフィルタ処理されたオーディオ信号１０４を出力する。図１において、フィルタ処理された現フレームｎ、フィルタ処理された過去フレームｎ−１およびフィルタ処理された最後から２番目のフレームｎ−２が概略的に表現される。フィルタ処理されたフレームは、フィルタ処理されたフレームの間のフィルタ処理によって取り込まれうる不連続点１０６ａ，１０６ｂを概略的に示すために、その間のそれぞれのギャップを用いて、図１において、概略的に表現される。フィルタブロック１０２は、過去フレームｎ−１および現フレームｎのためのそれぞれのフィルタパラメータｃ₀およびｃ₁を用いて、オーディオ信号のフレームのフィルタ処理をもたらす。一般に、フィルタブロック１０２は、線形フィルタＨ（ｚ）でありえ、この種の線形フィルタＨ（ｚ）の１つの例は、上述した長期予測フィルタ

Ｈ（ｚ）＝１−ｇ・ｚ^-T

である。ここで、フィルタパラメータは、ゲイン「ｇ」およびピッチラグ「Ｔ」である。より一般的な形において、長期予測フィルタは、以下のように記載されうる。

Ｈ（ｚ）＝１−ｇ・Ａ（ｚ）・ｚ^-T

ここで、Ａ（ｚ）はＦＩＲフィルタである。長期予測フィルタは、オーディオ信号においてハーモニックスのセットを完全に減衰するか、または、さらに抑制するために、使用されうる。しかしながら、この種の長期予測フィルタを使用する場合、そして、過去フレームのフィルタパラメータｃ₀が、現フレームのフィルタパラメータｃ₁と異なる場合、フィルタ処理された過去フレームｎ−１とフィルタ処理された現フレームｎとの間において、不連続点１０６ａ，１０６ｂ（図１を参照）を取り入れる高い確率がある。この不連続点は、フィルタ処理されたオーディオ信号１０４において、たとえば、「クリック」において、アーティファクトを作り出しうる。

それゆえに、今回は、望まれていないアーティファクトを作り出しうる不連続点を結果として得る連続フレームのフィルタ処理の有する上記した課題からみて、可能な不連続点を除去する技術が必要である。オーディオ信号のフィルタ処理されたフレームの不連続点の除去を取り扱っているいくつかの技術方法は、公知技術である。

線形フィルタＨ（ｚ）がＦＩＲフィルタである場合において、現フレームは、フィルタ処理された現フレームを作り出すために現フレームのフィルタパラメータｃ₁を用いてフィルタ処理される。加えて、現フレームの最初の部分は、フィルタ処理されたフレーム部分を作り出すために過去フレームのフィルタパラメータｃ₀を用いてフィルタ処理され、そうすると、重畳加算またはクロスフェード演算がフィルタ処理された現フレームおよびフィルタ処理されたフレーム部分の最初の部分を通じて実行される。図２は、不連続点を除去するために連続的なオーディオフレームを処理するためのこの種の従来の方法のブロック図を示す。図１と比較したとき、フィルタブロック１０２は、重畳加算またはクロスフェード演算を実行するためのさらなる処理ブロック１０８を含む。フィルタ処理されたオーディオ信号１０４において、図１のギャップのない連続的なフィルタ処理されたフレームｎ，ｎ−１，およびｎ−２を示している図２において概略的に示されるように、連続的なフィルタされたフレームの間の不連続点がないか、低減されうる。

他の従来技術の方法において、フィルタＨ（ｚ）は、再帰的要素を有するフィルタ、たとえば、ＩＩＲフィルタでありうる。この種の場合において、図２に関して上記のとおりの方法は、サンプルごとに適用される。第１のステップにおいて、処理は、第１のフィルタ処理されたサンプルを得ている過去フレームｎ−１のフィルタパラメータｃ₀を用いてフィルタ処理された現フレームｎの最初の部分の第１のサンプルから始める。サンプルは、第２のフィルタ処理されたサンプルを作り出す現フレームｎのフィルタパラメータｃ₁でフィルタ処理される。それから、重畳加算またはクロスフェード演算が、フィルタ処理された現フレームｎのサンプルに対応して得る第１および第２のフィルタ処理されたサンプルに基づいて実行される。それから、次のサンプルが処理され、そして、現フレームｎの最初の部分の最後のサンプルが処理されるまで、上記ステップは繰り返される。現フレームｎの残りのサンプルは、現フレームｎのフィルタパラメータｃ₁を用いて処理される。

連続的なフィルタ処理されたフレームから不連続点を除去するための上述の周知の方法のための例は、たとえば、変換コーダに関連して米国特許第５０１２５１７号（特許文献１）において、スピーチ帯域拡大に関連して欧州特許第０７３２６８７号（特許文献２）において、変換オーディオコーダに関連して米国特許第５９９９８９９号（特許文献３）において、または、復号化されたスピーチポストフィルタに関連して米国特許第７３５３１６８号（特許文献４）において記載されている。

上記の方法は、望まれていない信号の不連続点を除去するために効率的である一方、これらの方法は、効果的であるための現フレーム（最初の部分）の特定部分を動作するので、フレーム部分の長さが、十分に長く、たとえば、２０ｍｓのフレーム長さの場合、フレーム部分または最初の部分の長さは、５ｍｓの長さと同じくらいでありうる。特定の場合、これは、あまりに長く、特に、状況において、過去フレームのフィルタパラメータｃ₀が現フレームに当てはまらず、これは、付加的なアーティファクトを結果として得る。１つの例は、急速に変化するピッチを有するハーモニックオーディオ信号であり、そして、長期予測フィルタは、ハーモニックスの振幅を低減するように設計される。その場合において、ピッチラグは、あるフレームから次のフレームまで異なる。現フレームにおける推定されたピッチを有する長期予測フィルタは、現フレームにおけるハーモニックスの振幅を効果的に低減するが、しかし、オーディオ信号のピッチが異なる他のフレーム（たとえば、次のフレームの最初の部分）において使用される場合、それは、ハーモニックスの振幅を低減しないだろう。信号における非調和に関連した要素の振幅を低減することによって、信号における歪みを取り込むように、事態を悪化さえさせうる。

米国特許第５０１２５１７号明細書欧州特許第０７３２６８７号明細書米国特許第５９９９８９９号明細書米国特許第７３５３１６８号明細書

フィルタされたオーディオ信号におけるいかなる潜在的な歪みを作り出すことなく、フィルタされたオーディオフレームの中の不連続点を除去するための改良された方法を提供することが本発明の基本的な目的である。

この目的は、独立クレームに記載の方法および装置によって達成される。

本発明は、オーディオ信号を処理する方法を提供し、方法は、線形予測フィルタ処理を使用してオーディオ信号のフィルタ処理された過去フレームとフィルタ処理された現フレームとの間の不連続点を除去するステップを含む。

線形予測フィルタは、

として定義され、Ｍはフィルタの次数であり、ａ_mは、フィルタ係数（ａ₀＝１を有する）である。この種のフィルタは、線形予測符号化（ＬｉｎｅａｒＰｒｅｄｉｃｔｉｖｅＣｏｄｉｎｇ；ＬＰＣ）としても公知である。

実施態様によれば、方法は、オーディオ信号の現フレームをフィルタ処理するステップと、線形予測フィルタの初期状態が、過去フレームの最後の部分に基づいて定義される、所定の信号を線形予測フィルタ処理することによって得られる信号で、フィルタ処理された現フレームの最初の部分を修正することによって不連続点を除去するステップと、を含む。

実施形態によれば、線形予測フィルタの初期状態は、現フレームをフィルタ処理するためのフィルタパラメータのセットを用いてフィルタ処理された、フィルタ処理されていない過去フレームの最後の部分に基づいて定義される。

実施形態によれば、方法は、フィルタ処理されたまたはフィルタ処理されていないオーディオ信号における線形予測フィルタを推定するステップを含む。

実施形態によれば、線形予測フィルタを推定するステップは、レビンソン−ダービン・アルゴリズムを用いて、オーディオ信号の過去または現フレーム基づくか、または、オーディオ信号のフィルタ処理された過去のフレームに基づくフィルタを推定するステップを含む。

実施形態によれば、線形予測フィルタは、オーディオ・コーデックの線形予測フィルタを含む。

実施形態によれば、不連続点を除去するステップは、フィルタ処理された現フレームの最初の部分を処理するステップを含み、現フレームの最初の部分は、現フレームにおけるサンプルの合計以下である所定のサンプル数を有し、そして、現フレームの最初の部分を処理するステップは、フィルタ処理された現フレームの最初の部分からゼロ入力応答（ｚｅｒｏ−ｉｎｐｕｔ−ｒｅｓｐｏｎｓｅ；ＺＩＲ）の最初の部分を取り去るステップを含む。

実施形態によれば、方法は、フィルタ処理された現フレームを作り出すために、ＦＩＲフィルタのような非再帰フィルタを用いて、オーディオ信号の現フレームをフィルタ処理するステップを含む。

実施形態によれば、方法は、ＩＩＲフィルタのような再帰フィルタを用いてサンプルごとにオーディオ信号のフィルタ処理されていない現フレームを処理するステップを含み、そして、現フレームの最初の部分のサンプルを処理するステップは、
フィルタ処理されたサンプルを作り出すために、現フレームのフィルタパラメータを用いて再帰フィルタによりサンプルをフィルタ処理するステップと、
フィルタ処理された現フレームの対応するサンプルを作り出すために、フィルタ処理されたサンプルから対応するＺＩＲサンプルを取り去るステップと、を含む。

実施形態によれば、フィルタ処理するステップおよび取り去るステップは、現フレームの最初の部分内の最後のサンプルが処理されるまで、繰り返され、方法は、現フレームのフィルタパラメータを用いて、再帰フィルタにより現フレーム内の残りのサンプルをフィルタ処理するステップをさらに含む。

実施形態によれば、方法は、ＺＩＲを生成するステップを含み、ＺＩＲを生成するステップは、
フィルタ処理された信号の第１部分を作り出すために、フィルタおよび現フレームをフィルタ処理するために使用されるフィルタパラメータを用いて、フィルタ処理されていない過去フレームのＭ個の最後のサンプルをフィルタ処理するステップであって、Ｍは、線形予測フィルタの次数である、フィルタ処理するステップと、
フィルタ処理された信号の第２部分を生成するために、過去フレームのフィルタパラメータを用いてフィルタ処理された、フィルタ処理された過去フレームのＭ個の最後のサンプルを、フィルタ処理された信号の第１部分から取り去るステップと、
線形予測フィルタおよびフィルタ処理された信号の第２部分に等しい初期状態を用いてゼロサンプルのフレームをフィルタ処理することによって、線形予測フィルタのＺＩＲを生成するステップと、を含む。

実施形態によれば、方法は、その振幅が急速にゼロに減少するようなＺＩＲのウィンドウ処理を含む。

本発明は、前述の追加の不必要な歪みを結果として得る信号の不連続点を除去するための従来の方法において認識された問題が、主に、過去フレームのためのフィルタパラメータに基づいて現フレームまたは少なくともその部分の処理に起因するといった発明者の知見に基づく。本発明の方法によれば、これは回避される。すなわち、本発明の方法は、過去フレームのフィルタパラメータを用いて現フレームの部分をフィルタ処理せず、前述の課題を回避する。実施形態によれば、不連続点を除去するために、ＬＰＣ（ｌｉｎｅａｒｐｒｅｄｉｃｔｉｖｅｆｉｌｔｅｒ）フィルタ（線形予測フィルタ）が不連続点を除去するために使用される。ＬＰＣフィルタは、オーディオ信号において推定され、したがって、ＬＰＣフィルタを用いた場合、オーディオ信号のスペクトル形状が不連続点をマスキングするために、オーディオ信号のスペクトル形状の良好なモデルである。実施形態において、ＬＰＣフィルタは、フィルタ処理されていないオーディオ信号に基づくか、または、前述の線形フィルタＨ（ｚ）によってフィルタ処理されたオーディオ信号に基づいて、推定されうる。実施形態によれば、ＬＰＣフィルタは、オーディオ信号、たとえば、現フレームおよび／または過去フレーム、ならびにレビンソン−ダービン・アルゴリズムを用いることによって推定されうる。それは、レビンソン−ダービン・アルゴリズムを用いて、フィルタ処理された過去のフレーム信号のみに基づいて、計算されることもできる。

さらに、他の実施形態において、オーディオ信号を処理するためのオーディオ・コーデックは、線形フィルタＨ（ｚ）を使用し、そして、変換ベースのオーディオ・コーデックにおける量子化ノイズを形づくるために、たとえば、量子化されるか、または、されない、ＬＰＣフィルタを使用することもできる。この種の実施形態において、この既存のＬＰＣフィルタが、新規なＬＰＣフィルタを推定するために必要な付加的な複雑さのない不連続点を平滑化するために、直接使用されうる。

以下に、本発明の実施形態は、添付の図面を参照して説明される。

図１は、従来の方法に従うオーディオ信号の連続フレームを処理するためのブロック図を示す。図２は、不連続点を除去するための連続オーディオフレームを処理するのための他の従来の方法のブロック図を示す。図３は、エンコーダ側および／またはデコーダ側でのオーディオ信号の連続フレームの間の不連続点を除去するための本発明の方法を実施しているオーディオ信号を送信するためのシステムの簡略化したブロック図を示す。図４は、実施形態によるオーディオ信号の連続フレームの間の不連続点を除去するための本発明の方法を表現しているフロー図を示す。図５は、不連続点の除去にもかかわらず、出力信号において望まれていない歪みを回避している本発明の実施形態による現オーディオフレームを処理するための概略ブロック図を示す。図６は、ＺＩＲを生成するための図５のブロックの機能を表しているフロー図を示す。図７は、フィルタブロックが、ＩＩＲフィルタのような再帰フィルタを含む場合におけるフィルタ処理された現フレームの最初の部分を処理するための図５におけるブロックの機能を表しているフロー図を示す。図８は、フィルタブロックが、ＦＩＲフィルタのような非再帰フィルタを含む場合におけるフィルタ処理された現フレームの最初の部分を処理するための図５におけるブロックの機能を表しているフロー図を示す。

以下において、発明の方法の実施形態は、より詳細に説明される。そして、なお、添付の図面において、同じまたは類似の機能を有する要素は、同じ参照番号によって表示される。

図３は、エンコーダ側および／またはデコーダ側での発明の方法を実施しているオーディオ信号を送信するためのシステムの簡略化したブロック図を示す。図３のシステムは、オーディオ信号２０４を入力装置２０２において受信しているエンコーダ２００を含む。エンコーダは、オーディオ信号２０４を受信している符号化プロセッサ２０６を含み、エンコーダの出力装置２０８で供給される符号化オーディオ信号を生成する。符号化プロセッサは、不連続点を回避するために受信されるオーディオ信号の連続オーディオフレームを処理するための発明の方法を実施するためにプログラムされるか、または構築されうる。他の実施形態において、エンコーダは、送信システムの一部であることを必要としないが、符号化されたオーディオ信号を生成することは独立型装置であるか、または、オーディオ信号送信器の一部でありうる。実施形態によれば、エンコーダ２００は、２１２で示されるように、オーディオ信号の無線通信を許容するためのアンテナ２１０を含みうる。他の実施形態において、エンコーダ２００は、たとえば、参照符合２１４で示されるように、有線の接続線を用いて、出力装置２０８で供給される符号化オーディオ信号を出力しうる。

図３のシステムは、たとえば、有線２１４またはアンテナ２５４を介して、エンコーダ２５０によって処理される符号化オーディオ信号を受信する入力装置２５２を有するデコーダ２５０をさらに含む。エンコーダ２５０は、符号化信号において作動し、出力装置２６０で復号化オーディオ信号２５８を供給している復号化プロセッサ２５６を含む。復号化プロセッサ２５６は、不連続点が回避されるというような方法で、フィルタ処理される連続フレームにおける発明の方法に従って作動するために実施されうる。他の実施形態において、デコーダは、送信システムの一部である必要はなく、むしろ、符号化オーディオ信号を復号化するための独立型装置でもよく、あるいは、オーディオ信号受信器の一部でもよい。

以下において、符号化プロセッサ２０６および復号化プロセッサ２５６のうちの少なくとも１つにおいて実施されうる本発明の方法の実施形態が、さらに詳細に記載される。図４は、本発明の方法の実施形態に従うオーディオ信号の現フレームを処理するためのフロー図を示す。現フレームの処理が記載され、そして、過去フレームが後述する同じ技術を用いて既に処理されると仮定される。本発明によれば、ステップＳ１００において、オーディオ信号の現フレームが受信される。現フレームは、たとえば、図１および図２（フィルタブロック１０２を参照）に関して上記のとおりの方法において、ステップＳ１０２において、フィルタ処理される。本発明の方法によれば、フィルタ処理された過去フレームｎ−１とフィルタ処理された現フレームｎとの間の不連続点（図１または図２を参照）は、ステップＳ１０４で示されるように線形予測フィルタ処理を用いて除去される。実施形態によれば、線形予測フィルタは、

として定義され、Ｍはフィルタの次数であり、ａ_mは、フィルタ係数（ａ₀＝１を有する）である。この種のフィルタは、線形予測符号化（ＬｉｎｅａｒＰｒｅｄｉｃｔｉｖｅＣｏｄｉｎｇ；ＬＰＣ）としても公知である。実施形態によれば、フィルタ処理された現フレームは、フィルタ処理された現フレームの少なくとも一部に線形予測フィルタ処理を適用することによって処理される。不連続点は、線形予測符号化フィルタの初期状態が、過去フレームの最後の部分に基づいて定義される、所定の信号を線形予測フィルタ処理することによって得られる信号で、フィルタ処理された現フレームの最初の部分を修正することによって除去されうる。線形予測符号化フィルタの初期状態は、現フレームのためのフィルタパラメータのセットを用いてフィルタ処理された過去フレームの最後の部分に基づいて定義されうる。本発明の方法は、過去フレームのために使用されるフィルタ係数を用いてオーディオ信号の現フレームをフィルタ処理する必要はなく、それによって、それらが、図２に関して上記の従来技術の方法において経験があるように、現フレームおよび過去フレームのためのフィルタパラメータの不適当な組み合わせのために起こる課題を回避するとして、有利である。

図５は、不連続点を除去するにもかかわらず、出力信号において望まれていない歪みを回避する本発明の実施形態によるオーディオ信号の現オーディオフレームを処理するための概略ブロック図を示す。図５において、図１および図２におけるように同じ参照符合が使用される。オーディオ信号１００の現フレームｎが受信され、そして、オーディオ信号１００の各フレームは、複数のサンプルを有する。オーディオ信号１００の現フレームｎは、フィルタブロック１０２によって処理される。図１および図２の従来技術の方法と比較した場合、図５に関して記載されるように実施形態によれば、フィルタ処理された現フレームは、ブロック１１０によって概略的に示されるようにＺＩＲサンプルに基づいてさらに処理される。過去フレームｎ−１に基づいて、そして、ＬＰＣフィルタに基づく、本実施形態によれば、ＺＩＲサンプルは、ブロック１１２によって概略的に示されるように、作り出される。

処理ブロック１１０および１１２の機能は、これから、より詳細に記載される。図６は、ＺＩＲサンプルを生成するための処理ブロック１１２の機能を表しているフロー図を示す。前述のように、オーディオ信号１００のフレームは、それぞれのフレームのために選択され、あるいは決定されたフィルタパラメータｃを用いて線形フィルタＨ（ｚ）によりフィルタ処理される。フィルタＨ（ｚ）は、たとえば、ＩＩＲフィルタである再帰フィルタであり、または、たとえば、ＦＩＲフィルタである非再帰フィルタでありうる。処理ブロック１１２において、量子化されるか、あるいは量子化されないＬＰＣフィルタが用いられる。ＬＰＣフィルタは、次数Ｍであり、そして、フィルタ処理されたあるいはフィルタ処理されていないオーディオ信号に推定されるか、またはオーディオ・コーデックにおいて使用されもしたＬＰＣフィルタでありうる。ステップＳ２００において、過去フレームｎ−１のＭ（Ｍ＝ＬＰＣフィルタの次数）個の最後のサンプルは、また、現フレームｎのフィルタパラメータまたは係数ｃ₁を用いて、フィルタＨ（ｚ）によりフィルタ処理される。ステップＳ２００は、このことにより、フィルタ処理された信号の第１部分を作り出す。ステップＳ２０２において、フィルタ処理された過去フレームｎ−１（過去フレームｎ−１のフィルタパラメータまたは係数ｃ₀を用いてフィルタ処理された過去フレームのＭ個の最後のサンプル）のＭ個の最後のサンプルは、ステップＳ２００によって供給されたフィルタ処理された信号の第１部分から取り去られ、それによって、フィルタ処理された信号の第２部分が作り出される。ステップＳ２０４において、次数Ｍを有するＬＰＣフィルタが、適用され、より詳しくは、ＬＰＣフィルタのゼロ入力応答（ＺＩＲ）が、ゼロサンプルのフレームをフィルタ処理することによって、ステップＳ２０４において生成される。ここで、フィルタの初期状態は、フィルタ処理された信号の第２部分に等しく、それによって、ＺＩＲを生成する。実施形態によれば、ＺＩＲは、その振幅が急速にゼロに減少するようなウィンドウ処理をしうる。

図５に関して上記されるように、ＺＩＲは、処理ブロック１１０において適用され、その機能は、線形フィルタＨ（ｚ）として、ＩＩＲフィルタのような再帰フィルタを用いた場合のために、図７のフロー図に関して記載される。図５に関して記載される実施形態によれば、望まれていない歪みを回避するとともに、現フレームおよび過去フレームの間の不連続点を除去するために、現フレームｎのフィルタ処理ステップは、サンプルごとに現フレームｎを処理（フィルタ処理）するステップを含む。ここで、最初の部分のサンプルは、本発明の方法により処理される。さらに具体的には、現フレームｎの最初の部分のＭ個のサンプルが処理され、最初のステップＳ３００において、変数ｍが０にセットされる。次のステップＳ３０２において、現フレームｎのサンプルｍは、フィルタＨ（ｚ）および現フレームｎのためのフィルタ係数またはパラメータｃ₁を用いてフィルタ処理される。このように、従来の方法の他に、本発明の方法によれば、現フレームは、過去フレームから係数を使用してフィルタ処理されず、結果として、現フレームからのみの係数が、不連続点が除去される事実にもかかわらず、従来の方法において存在する望まれていない歪みを回避する。ステップＳ３０２は、フィルタ処理されたサンプルｍを得て、そして、ステップＳ３０４において、サンプルｍに対応するＺＩＲサンプルは、フィルタ処理された現フレームｎの対応するサンプルを得ているフィルタ処理されたサンプルｍから取り去られる。ステップＳ３０６において、現フレームｎの最初の部分の最後のサンプルＭが処理されるかどうかが決定される。最初の部分のすべてのＭ個のサンプルが処理されたわけではない場合、変数ｍは増加し、そして、方法ステップＳ３０２からＳ３０６が現フレームｎの次のサンプルに対して繰り返される。一旦、最初の部分の全てのＭ個のサンプルが処理されると、ステップＳ３０８において、現フレームｎの残っているサンプルが、現フレームのフィルタパラメータｃ₁を用いてフィルタ処理され、それにより、連続フレームの間の不連続点の除去することに望まれていない歪みを回避している発明の方法に従って、処理されるフィルタ処理された現フレームｎを供給する。

他の実施形態によれば、線形フィルタＨ（ｚ）は、ＦＩＲフィルタのような非再帰フィルタであり、そして、ＺＩＲは、図５に関して上述のとおり、処理ブロック１１０において適用される。この実施形態の機能は、図８のフロー図に関して記載される。ステップＳ４００において、現フレームｎは、現フレームのためのフィルタ係数またはパラメータｃ₁を用いてフィルタＨ（ｚ）によりフィルタ処理される。このように、従来の方法の他に、本発明の実施形態によれば、現フレームは、過去フレームからの係数を用いてフィルタ処理されず、結果として、現フレームからの係数のみで、不連続点を除去するという事実にもかかわらず、従来の方法において存在する望まれていない歪みを回避する。ステップＳ４０２において、ＺＩＲの最初の部分は、フィルタ処理された現フレームの対応する最初の部分から取り去られ、それによって、本発明の方法に従ってフィルタ処理され／処理される最初の部分を有するフィルタ処理された現フレームｎを供給し、そして、現フレームのためのフィルタ係数またはパラメータｃ₁を用いてフィルタ処理された部分のみを残し、それによって、連続フレームの間の不連続点の除去に応じて望まれていない歪みを回避する。

本発明の方法は、オーディオ信号がフィルタ処理された場合に、上述のとおりのような状況において適用されうる。実施形態によれば、本発明の方法は、たとえば、信号ハーモニックスの間の符号化ノイズのレベルを低減するためのオーディオ・コーデックポストフィルタを用いる場合、デコーダ側でも適用されうる。デコーダ側でオーディオフレームを処理するために、実施形態によれば、ポストフィルタは、以下の式でありえ、

Ｈ（ｚ）＝（１−Ｂ（ｚ））／（１−Ａ（ｚ）・Ｚ^-T）

ここで、Ｂ（ｚ）およびＡ（ｚ）は２つのＦＩＲフィルタであり、そして、Ｈ（ｚ）フィルタパラメータは、ＦＩＲフィルタＢ（ｚ）およびＡ（ｚ）の係数であり、そして、Ｔはピッチラグを示す。この種の筋書きにおいて、たとえば、過去のフィルタのフレームパラメータｃ₀が現フレームのフィルタパラメータｃ₁と異なる場合、フィルタは、２つのフィルタ処理されたフレームの間の不連続点を取り込むこともでき、そして、この種の不連続点は、たとえば、「クリック」のようなフィルタ処理されたオーディオ信号１０４におけるアーティファクトを作り出しうる。この不連続点は、詳細に上述したように、フィルタ処理された現フレームを処理することによって除去される。

記載された概念のいくつかの態様が、装置との関連で記載されるが、これらの態様も、対応する方法の説明を表わすことは明らかであり、ブロックあるいはデバイスは、方法のステップ、または方法のステップの特徴に対応する。類似して、方法のステップとの関連で記載される態様は、装置に対応する、ブロック、アイテムまたは特徴の説明を表す。

特定の実現要求に応じて、本発明の実施の形態は、ハードウェアにおいて、または、ソフトウェアにおいて、実行されうる。その実現態様は、それぞれの方法が実行されるように、プログラミング可能なコンピュータ・システムと協働するか、（または、協働することができる、）そこに格納された電子的に読み込み可能な制御信号を有するデジタル記憶媒体、たとえば、フロッピー（登録商標）ディスク、ＤＶＤ、ブルーレイディスク、ＣＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、またはＦＬＡＳＨメモリを使用して実行されうる。従って、デジタル記憶媒体は、コンピュータ読み込み可能でもよい。

本発明による若干の実施の形態は、本願明細書において記載される方法のうちの１つが実行されるように、プログラミング可能なコンピュータ・システムと協働することができる電子的に読み込み可能な信号を有するデータキャリアを含む。

通常、本発明の実施の形態は、プログラムコードを有するコンピュータ・プログラム製品として実施され、コンピュータ・プログラム製品がコンピュータ上で実行する場合、プログラムコードは、方法のうちの１つを実行するために作動される。プログラムコードは、機械可読キャリアに、たとえば、格納されうる。

他の実施の形態は、機械可読キャリアに格納され、本願明細書において記載される方法のうちの１つを実行するためのコンピュータ・プログラムを含む。

換言すれば、従って、コンピュータ・プログラムがコンピュータ上で実行する場合、本発明の方法の実施の形態は、本願明細書において記載される方法のうちの１つを実行するためのプログラムコードを含むコンピュータ・プログラムである。

従って、本発明の方法の更なる実施の形態は、その上に記録され、本願明細書において記載される方法のうちの１つを実行するためのコンピュータ・プログラムを含むデータキャリア（または、デジタル記憶媒体、またはコンピュータ可読媒体）である。

従って、本発明の方法の更なる実施の形態は、本願明細書において記載される方法のうちの１つを実行するためのコンピュータ・プログラムを表しているデータストリームまたは一連の信号である。たとえば、データストリームまたは一連の信号は、データ通信接続、たとえば、インターネットを介して転送されるように構成されうる。

更なる実施の形態は、本願明細書において記載される方法のうちの１つを実行するために構成され、または適応される処理手段、たとえば、コンピュータ、またはプログラミング可能な論理回路を含む。

更なる実施の形態は、その上にインストールされ、本願明細書において記載される方法のうちの１つを実行するためのコンピュータ・プログラムを有するコンピュータを含む。

いくつかの実施の形態において、プログラミング可能な論理回路（たとえば、現場でプログラム可能なゲートアレイ（ＦＰＧＡ：ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ））が、本願明細書において記載されるいくつかまたは全ての機能を実行するために使用されうる。いくつかの実施の形態において、現場でプログラム可能なゲートアレイは、本願明細書において記載される方法の１つを実行するために、マイクロプロセッサと協働しうる。一般に、方法は、いくつかのハードウェア装置によって、好ましくは実行される。

上述した実施の形態は、本発明の原則の例を表すだけである。本願明細書において記載される装置の修正および変更は、他の当業者にとって明らかであるものと理解される。従って、間近に迫った特許請求の範囲だけによってのみ制限され、ならびに、本願発明の記述および説明によって表された明細書の詳細な記載によっては、制限されないことが真意である。

Claims

オーディオ信号（１００）を処理する方法であって、前記方法は、
線形予測フィルタ処理を使用して前記オーディオ信号のフィルタ処理された過去フレームとフィルタ処理された現フレームとの間の不連続点（１０６ａ，１０６ｂ）を除去するステップ（Ｓ１０２，Ｓ１０４，Ｓ３００−Ｓ３０８，Ｓ４００−Ｓ４０２）を含む、方法。
前記オーディオ信号の前記現フレームをフィルタ処理するステップと、前記線形予測フィルタの初期状態が、前記過去フレームの最後の部分に基づいて定義される、所定の信号を線形予測フィルタ処理することによって得られる信号で、フィルタ処理された前記現フレームの最初の部分を修正することによって前記不連続点を除去するステップと、
を含む、請求項１に記載の方法。
前記線形予測フィルタの前記初期状態は、前記現フレームをフィルタ処理するためのフィルタパラメータの前記セットを用いてフィルタ処理された、フィルタ処理されていない前記過去フレームの最後の部分に基づいて定義される、請求項２に記載の方法。
前記フィルタ処理されたまたはフィルタ処理されていない前記オーディオ信号（１００）に対する前記線形予測フィルタを推定するステップをさらに含む、請求項１ないし請求項３のいずれかに記載の方法。
前記線形予測フィルタを推定するステップは、レビンソン−ダービン・アルゴリズムを用いて、前記オーディオ信号（１００）の前記過去および／または現フレームに基づいて、または、前記オーディオ信号（１００）のフィルタ処理された前記過去フレームに基づいて、前記フィルタを推定するステップを含む、請求項４に記載の方法。
前記線形予測フィルタは、オーディオ・コーデックの線形予測フィルタを含む、請求項１ないし請求項３のいずれかに記載の方法。
前記不連続点を除去するステップは、フィルタ処理された前記現フレームの前記最初の部分を処理するステップを含み、前記現フレームの前記最初の部分は、前記現フレーム内のサンプルの合計数以下である所定のサンプル数を有し、そして、前記現フレームの前記最初の部分を処理するステップは、フィルタ処理された前記現フレームの前記最初の部分からゼロ入力応答（ＺＩＲ）の最初の部分を取り去るステップ（Ｓ３０４，Ｓ４０２）を含む、請求項１ないし請求項６のいずれかに記載の方法。
フィルタ処理された前記現フレームを作り出すために、ＦＩＲフィルタのような非再帰フィルタを用いて、前記オーディオ信号の前記現フレームをフィルタ処理するステップ（Ｓ４００）を含む、請求項７に記載の方法。
ＩＩＲフィルタのような再帰フィルタを用いてサンプルごとに前記オーディオ信号のフィルタ処理されていない前記現フレームを処理するステップを含み、そして、前記現フレームの前記最初の部分のサンプルを処理するステップは、
フィルタ処理されたサンプルを作り出すために、前記現フレームの前記フィルタパラメータを用いて前記再帰フィルタにより前記サンプルをフィルタ処理するステップ（Ｓ３０２）と、
フィルタ処理された前記現フレームの前記対応するサンプルを作り出すために、前記フィルタ処理されたサンプルから対応するＺＩＲサンプルを取り去るステップ（Ｓ３０４）と、
を含む、請求項７に記載の方法。
フィルタ処理するステップ（Ｓ３０２）および取り去るステップ（Ｓ３０４）は、前記現フレームの前記最初の部分内の前記最後のサンプルが処理されるまで繰り返され、そして、前記方法は、前記現フレームの前記フィルタパラメータを用いて、前記再帰フィルタにより前記現フレーム内の前記残りのサンプルをフィルタ処理するステップ（Ｓ３０６）をさらに含む、請求項９に記載の方法。
前記ＺＩＲを生成するステップを含み、
前記ＺＩＲを生成するステップは、
フィルタ処理された信号の第１部分を作り出すために、前記フィルタおよび前記現フレームをフィルタ処理するために使用される前記フィルタパラメータを用いて、フィルタ処理されていない前記過去フレームのＭ個の前記最後のサンプルをフィルタ処理するステップ（Ｓ２００）であって、Ｍは、前記線形予測フィルタの次数である、フィルタ処理するステップと、
フィルタ処理された信号の第２部分を生成するために、前記過去フレームの前記フィルタパラメータを用いてフィルタ処理された、フィルタ処理された前記過去フレームの前記Ｍ個の最後のサンプルを、フィルタ処理された信号の前記第１部分から取り去るステップ（Ｓ２０２）と、
前記線形予測フィルタおよびフィルタ処理された信号の前記第２部分に等しい初期状態を用いてゼロサンプルのフレームをフィルタ処理することによって、線形予測フィルタのＺＩＲを生成するステップ（Ｓ２０４）と、
を含む、請求項７ないし請求項１０のいずれかに記載の方法。
その振幅が急速にゼロに減少するようなＺＩＲのウィンドウ処理を含む、請求項１１に記載の方法。
コンピュータ上で実行される場合、請求項１ないし請求項１２のいずれかに記載の方法を実行する命令を格納しているコンピュータ可読媒体を含む、非一時的コンピュータ・プログラム製品。
オーディオ信号（１００）を処理するための装置であって、前記装置は、
線形予測フィルタ処理を使用して前記オーディオ信号のフィルタ処理された過去フレームとフィルタ処理された現フレームとの間の不連続点を除去するためのプロセッサ（１０２，１１０，１１２）を含む、装置。
オーディオ信号（１００）を処理するための装置であって、前記装置は、請求項１ないし請求項１２のうちの１つの前記方法に従って作動するように構成される、装置。
請求項１４または請求項１５の装置を含む、オーディオデコーダ（２５０）。
請求項１４または請求項１５の装置を含む、オーディオエンコーダ（２００）。