JP6509928B2

JP6509928B2 - フレーム型データの可変分解能処理

Info

Publication number: JP6509928B2
Application number: JP2017042066A
Authority: JP
Inventors: ヨウ、ユリ
Original assignee: デジタルライズテクノロジーシーオー．，エルティーディー．
Priority date: 2006-08-18
Filing date: 2017-03-06
Publication date: 2019-05-08
Anticipated expiration: 2027-08-17
Also published as: US20080059202A1; WO2008022566A1; US20140249805A1; JP2010501153A; KR20090076894A; JP2017129872A; EP2054874A4; JP2012068670A; EP2054874A1; JP5868136B2; JP6106637B2; US9431018B2; KR101045429B1; JP4871999B2; JP2014225032A; US8744862B2; EP2054874B1

Description

この出願は、２００６年８月１８日に出願された米国仮特許出願第６０／８２２，７６０号、発明の名称「可変分解能フィルタリング」の利益を主張するものであり、その全文が本明細書に記載されているかのごとく、参照することにより本明細書に組み込まれている。

本発明は、例えば、音声信号の処理のような信号処理に関する。

従来の信号処理技術の多くは、フレーム型である。そのような技術において、データのストリームは離散的なフレーム群に分割され、そのようなフレームそれぞれにおけるデータは通常、極めて均一に処理される。一例において、入力音声信号が同一長のフレーム群に分割される。その後、各フレームは特定の方法で処理される。各フレームに対して決定されるべき共通の処理パラメータは、ブロック長、又は、換言すると、処理を目的としてフレームを何個の同一サイズのブロックに分割すべきかということである。ブロック長によって、元の領域（例えば、音声信号に関する時間）及び周波数（又は他の変換）領域における分解能が決まる。より具体的には、ブロック長が短いほど、元の領域における分解能が大きく、周波数領域における分解能が小さい。

音声信号は、多くの場合、それぞれが、著しいトランジェントによって中断された多くのトーン周波数成分を含む準定常エピソード群からなる。従って、そのような音声信号の個々のフレームは、多くの場合、トランジェントに対応する少数のサンプルを含むであろうが、それらサンプルの大多数は信号の準定常部分に対応する。

音声信号におけるトランジェントが少数のサンプル分という短さであり得るので、トランジェントを含むことが検出されたフレーム内で用いられるブロックサイズも、理想的には、ほんの少数のサンプル分とし、それによってフィルタの時間分解能をトランジェントに一致させるべきである。残念ながら、同一フレーム内で様々なブロックサイズを用いることは、一般には実用的でない。検出されたトランジェントを有するフレーム内の全てのブロックをほんの少数のサンプル分の幅とすると、フレーム内の周波数分解能は極端に低下し、そのため、フレームにおける残りのサンプルにとって不適当である。すなわち、そのような他のサンプルは、それらがトランジェントから充分に離れているとすれば、準定常であり、従って、高周波数分解能を用いて処理される方がよい。この矛盾は、従来、同一フレームにおけるトランジェントサンプルにとっても準定常サンプルにとっても最適でない折衷的なブロックサイズに帰着していた。

図１に、入力サンプル群１２のフレームを処理するための従来システムのブロック図を示す。最初に、過渡検出器（トランジェント検出器）１４においてサンプル群１２を解析し、フレームにトランジェントが含まれるかどうか判断する。

その検出に基づき、モジュール１６においてウィンドウ関数を選択する。この点に関し、音声符号化アルゴリズムには、多くの場合、様々な時間・周波数分解能を有するフィルタバンクが用いられる。一般に用いられるフィルタバンクの１つに、以下の基底関数で書き表すことができるインパルス応答を有するＭＤＣＴ（ＭｏｄｉｆｉｅｄＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ）（変形離散コサイン変換）がある。

但し、ｋ＝０，１，．．．，Ｍ−１、ｎ＝０，１，．．．，２Ｍ−１、そして、ｗ（ｎ）は長さ２Ｍのウィンドウ関数である。例えば、Ｈ．Ｓ．Ｍａｌｖａｒ、「ＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇｗｉｔｈＬａｐｐｅｄＴｒａｎｓｆｏｒｍｓ」、ＡｒｔｅｃｈＨｏｕｓｅ、１９９２年（本明細書において、Ｍａｌｖａｒと呼ぶ）を参照のこと。

この場合、時間・周波数分解能はＭによって決まり、これは本明細書においてブロックサイズと呼ばれることがある。大きいＭは、高周波数分解能であるが低時間分解能であることを意味し、小さいＭは、高時間分解能と低周波数分解能を意味する。

（図１に示されているような）モジュール１６を実施することを目的として、従来の符号化アルゴリズムには、典型的には２つのブロックサイズが用いられる。モジュール１４においてトランジェントが検出されていなかった場合、フレーム全体を包含する単一ブロックとして実現される大ブロックサイズが用いられる。代替的に、トランジェントが検出されていた場合、フレームを包含する所定数のブロック群として実現される小ブロックサイズが用いられる。

これら２つのブロックサイズに対応する主要なウィンドウ関数は、それぞれ、ウィンドウ関数３０（図２に示され、ＷＩＮ＿ＬＯＮＧ＿ＬＯＮＧ２ＬＯＮＧと表示されている）及びウィンドウ関数４０（図３に示され、ＷＩＮ＿ＳＨＯＲＴ＿ＳＨＯＲＴ２ＳＨＯＲＴと表示されている）である。ＭＤＣＴをこれら２つの主要なウィンドウ関数間で適切に切り換えることを可能にするために、（例えば、Ｍａｌｖａｒに記載されているような）完全な復元の条件として、３つの移行ウィンドウ関数、例えば、ウィンドウ関数５０（図１６に示され、ＷＩＮ＿ＬＯＮＧ＿ＬＯＮＧ２ＳＨＯＲＴと表示されている）、ウィンドウ関数６０（図５に示され、ＷＩＮ＿ＬＯＮＧ＿ＳＨＯＲＴ２ＬＯＮＧと表示されている）、及びウィンドウ関数７０（図６に示され、ＷＩＮ＿ＬＯＮＧ＿ＳＨＯＲＴ２ＳＨＯＲＴと表示されている）を用いることが要求される。このような３つの移行ウィンドウ関数５０、６０及び７０は全て、ロングブロックに用いられる（すなわち、フレーム全体を包含する）ことに言及する。

従って、従来技術において、フレームには、単一のロングブロック（及び対応するロングウィンドウ３０、５０、６０又は７０）又は同一のショートブロック群のシーケンス（及び対応する同一のショートウィンドウ群４０）が割り当てられる。各ブロックがブロックとブロックの間の間隔より長いため、結果として、図７に示すウィンドウ関数群のシーケンス８０のような、各ウィンドウが、現在のブロックのＭ個の新たなサンプルをその前のブロックにおけるＭ個のサンプルと共に包含する、ロングウィンドウとショートウィンドウの重複シーケンスとなる。参照のため、図面において、ウィンドウ関数３０、４０、５０、６０又は７０に対応する各ブロックの中央をそれぞれ３１、４１、５１、６１又は７１と指定する。

このような従来技術において、トランジェントを含まないフレームに対するウィンドウ関数は、モジュール１４によって行われるそのような現在のフレームに関する検出のみならず、その前及びその次のフレームに関して行われる同様の検出にも基づいて選択されることに言及する。すなわち、ウィンドウ関数５０、６０及び７０は、トランジェントフレームと非トランジェントフレームの間の移行ウィンドウ関数として用いられる。

図１を再び参照し、モジュール１７において、モジュール１６にて選択されたウィンドウ関数を、その後、現在のフレームに関する入力サンプル群１２に適用する（トランジェントフレームに対して複数回）。すなわち、ブロック毎に、一組の加重値を得るために、サンプル値にそのブロックに対応するウィンドウ関数値を乗じる。

それらの加重値を、その後、モジュール１９において、選択されたウィンドウ関数を用いて処理し、出力値２２を得る。モジュール１９において行われる処理の具体的な種類は、所望の用途によって異なることがある。例えば、音声信号については、この処理は解析、符号化、及び／又は強調を含む可能性がある。

本発明は、この問題及び他の問題に、とりわけ、トランジェントを含むことが検出されたフレーム内で複数の様々なウィンドウ関数を用いることにより、取り組むものである。好ましい実施形態において、本発明は、検出されたトランジェントを有する単一データフレーム内に少なくとも２段階の分解能を提供する。そのような複数の分解能は、フレーム内でブロックサイズを変更することなく得られることがより好ましい。

その結果、例えば、トランジェントの近傍においてより高い分解能を用い、フレームの他の部分においてより低い分解能を用いることができる。本明細書において、「分解能」という用語は、無条件で用いられている場合、元の（例えば、時間の）領域における分解能を指す。周波数（又は他の変換）領域における分解能は元の領域における分解能に反比例して変化するため、本発明のこれらの実施形態において、トランジェントを含まないフレームの部分に関してより高い周波数の（又は他の変換領域の）分解能が得られる。更に、ブロックサイズを一定に保つことによって、一般には、処理構造を複雑にすることなく上記利点を達成することができる。

従って、ある点において、本発明は、データのフレームと、前記フレーム内でトランジェントが発生することを示す指標と、前記フレーム内の前記トランジェントの位置とを得る、フレーム型データの処理を目的とする。前記トランジェントの指標に基づいて、前記フレームに対してブロックサイズを設定し、それによって前記フレーム内に複数の同一サイズのブロックを効果的に定義する。更に、前記トランジェントの位置に基づいて、前記複数の同一サイズのブロックのうちの異なるブロックに対して異なるウィンドウ関数を選択し、前記選択されたウィンドウ関数を適用することによって前記データのフレームを処理する。

好ましい実施形態において、前記ブロックは互いに重なり合い、各ウィンドウ関数も、好ましくは、完全な復元のための条件を満足するような方法で、各隣接するウィンドウ関数と重なり合う。上記特性は、フレーム内の隣接するブロック及びウィンドウ関数、並びに、隣接するフレームにおける隣接するブロック及びウィンドウ関数に当てはまることが好ましい。

何れにせよ、前記ウィンドウ関数は、前記トランジェントを含む、前記同一サイズのブロックのうちの識別された1つのブロック内により高い分解能をもたらすように選択されることが好ましい。更に、このことは、前記識別されたブロック内で、前記ウィンドウ関数のうち、他のものより狭いトランジェントウィンドウ関数を用いることによって（例えば、前記ブロック内ではあるが前記トランジェントウィンドウ関数外にあるサンプルをゼロにすることによって）達成されることが好ましい。言い換えると、前記ブロックの幅は前記フレームに渡って一定である一方で、それらのブロック内で前記ウィンドウ関数の幅を変化させて、所望に応じて、前記フレームの各ブロックに対して所望の分解能トレードオフ（例えば、時間／周波数）を達成することができる。

この点に関し、ウィンドウ関数の幅は多数の様々な方法で定義することができる。例えば、それは、前記ウィンドウ関数の非ゼロ部分の長さ、規定の閾値を超える前記ウィンドウ関数の部分の長さ、又はある規定の割合の前記ウィンドウ関数の内容（例えば、エネルギー）を含む前記ウィンドウ関数の部分の長さ、と定義することができる。

従って、ウィンドウ関数の幅は、標準形態を圧縮又は展開し、その後、ブロック内ではあるが圧縮形態に含まれないサンプルは全てゼロにすることによって変化させることができる。代替的には、前記幅は、一部において、それらのエネルギーがより小さなセグメントに集中している様々な形態を用いることによって変化させることができる。

別の点において、本発明は、フレームのデータと、前記フレーム内でトランジェントが発生することを示す指標と、前記フレーム内の前記トランジェントの位置とを得る、フレーム型データの処理を目的とする。前記トランジェントを含む区域内により高い分解能がもたらされるように、前記フレーム内で用いられる様々なウィンドウ関数を選択し、前記選択されたウィンドウ関数を適用することによって前記データのフレームを処理する。

上記概要は、本発明の特定の態様を簡潔に説明することのみを意図したものである。本発明のより完全な理解は、請求項、及び以下の好ましい実施形態の詳細な説明を、添付の図面と共に参照することによって得ることができる。

図１は、トランジェントの存在に基づいてデータフレーム内の時間分解能を変更するための従来システムのブロック図である。図２は、長ブロックサイズを有するフレームが、同様に長ブロックサイズを有する２つのフレームに挟まれた場合の、そのフレームに対する従来のウィンドウ関数を示す。図３は、短ブロックサイズを有するフレームに対する従来のウィンドウ関数を示す。図４は、長ブロックサイズを有するフレームが、長ブロックサイズを有するフレームに先行され、短ブロックサイズを有するフレームに後続される場合の、そのフレームに対する従来の移行ウィンドウ関数を示す。図５は、長ブロックサイズを有するフレームが、短ブロックサイズを有するフレームに先行され、長ブロックサイズを有するフレームに後続される場合の、そのフレームに対する従来の移行ウィンドウ関数を示す。図６は、長ブロックサイズを有するフレームが、短ブロックサイズを有するフレームに先行され、短ブロックサイズを有するフレームに後続される場合の、そのフレームに対する従来の移行ウィンドウ関数を示す。図７は、トランジェントを含むフレームが両側でトランジェントを含まない２つのフレームに接する例示的な従来のウィンドウ関数群のシーケンスを示す。図８は、本発明の代表的な実施形態に係るブリーフウィンドウ関数ＷＩＮ＿ＳＨＯＲＴ＿ＢＲＩＥＦ２ＢＲＩＥＦを示す。図９は、本発明の代表的な実施形態に係る移行ウィンドウ関数ＷＩＮ＿ＳＨＯＲＴ＿ＳＨＯＲＴ２ＢＲＩＥＦを示す。図１０は、本発明の代表的な実施形態に係る移行ウィンドウ関数ＷＩＮ＿ＳＨＯＲＴ＿ＢＲＩＥＦ２ＳＨＯＲＴを示す。図１１は、本発明の代表的な実施形態に係る移行ウィンドウ関数ＷＩＮ＿ＬＯＮＧ＿ＬＯＮＧ２ＢＲＩＥＦを示す。図１２は、本発明の代表的な実施形態に係る移行ウィンドウ関数ＷＩＮ＿ＬＯＮＧ＿ＢＲＩＥＦ２ＬＯＮＧを示す。図１３は、本発明の代表的な実施形態に係る移行ウィンドウ関数ＷＩＮ＿ＬＯＮＧ＿ＢＲＩＥＦ２ＢＲＩＥＦを示す。図１４は、本発明の代表的な実施形態に係る移行ウィンドウ関数ＷＩＮ＿ＬＯＮＧ＿ＳＨＯＲＴ２ＢＲＩＥＦを示す。図１５は、本発明の代表的な実施形態に係る移行ウィンドウ関数ＷＩＮ＿ＬＯＮＧ＿ＢＲＩＥＦ２ＳＨＯＲＴを示す。図１６は、本発明の代表的な実施形態に係るウィンドウ関数を選択するための技術を示すフローチャートである。図１７は、本発明に係る第１の例示的なウィンドウ関数シーケンスを示す。図１８は、本発明に係る第２の例示的なウィンドウ関数シーケンスを示す。図１９は、本発明に係る第３の例示的なウィンドウ関数シーケンスを示す。図２０は、本発明に係る第４の例示的なウィンドウ関数シーケンスを示す。

本発明は、従来システムのウィンドウ関数選択素子１６における改良を主な目的とする。本発明の１つの特徴は、新たな「ブリーフウィンドウ関数」、例えば、図８に示されるようなウィンドウ関数１００の導入である。ＷＩＮ＿ＳＨＯＲＴ＿ＢＲＩＥＦ２ＢＲＩＥＦと表示されているこのウィンドウ関数１００は、従来のウィンドウ関数ＷＩＮ＿ＳＨＯＲＴ＿ＳＨＯＲＴ２ＳＨＯＲＴ４０と同様に、ショートブロック内で用いられることが意図されている。実際、下記により詳細に説明されている通り、本発明の好ましい実施形態において、ウィンドウ関数ＷＩＮ＿ＳＨＯＲＴ＿ＢＲＩＥＦ２ＢＲＩＥＦ１００は、ウィンドウ関数ＷＩＮ＿ＳＨＯＲＴ＿ＳＨＯＲＴ２ＳＨＯＲＴ４０と同じフレーム内での使用が意図されている。

しかし、従来のウィンドウ関数とは異なり、ブリーフウィンドウ関数１００は、その時間分解能を向上させるために、多数の先行及び遅行ゼロ重みを用いることにより、それが占有する（図８における端点１０２及び１０３を有する）ブロックの全体長さの中心部分のみを信号整形に使う。例えば、ショートブロック長さ＝２５６サンプルである場合、ブリーフウィンドウ関数１００は、好ましくは、中心の１６０サンプル内で非ゼロであり（この場合、それは対称でもある）、そのようなサンプルのうちの最初の１６個及び最後の１６個が、ブリーフウィンドウ関数１００に隣接する各移行ウィンドウ関数と重なり合い、ウィンドウの最初の４８サンプル及び最後の４８サンプルにゼロ重みが付いている。

本発明の好ましい実施形態において、このブリーフウィンドウ関数１００は、音声フレーム内のトランジェントサンプルが（例えば、トランジェントサンプルを含むブロックにおいて）検出されている場合にのみ用いられ、一方、通常のショートウィンドウ関数（例えば、従来のウィンドウ関数４０）、又は本発明によって提供される新たな移行関数のうちの１つが、フレームの残りの部分における準定常サンプルに適用される。これにより、従来技術に比べ、以下の可能性がもたらされる。

・著しくより大きなブロックサイズを用いることができ、この場合、準定常サンプルに対する周波数分解能が向上し、一方、トランジェントサンプル周辺の時間分解能は不変のままである。

・ブロックサイズを不変のままとすることができ、この場合、準定常サンプルに対する周波数分解能が不変であり、一方、トランジェントサンプル周辺の時間分解能は向上する。

・若干より大きいブロックサイズを用いることができ、この場合、準定常サンプルに対する周波数分解能が若干向上し、一方、トランジェントサンプル周辺の時間分解能も若干向上する。
上記選択肢の何れであっても、相反する時間−周波数分解能要件に対処する折衷的解決策が改善される。

ウィンドウ関数１００を他の２つの主要なウィンドウ関数、すなわち、ＷＩＮ＿ＬＯＮＧ＿ＬＯＮＧ２ＬＯＮＧ３０及びＷＩＮ＿ＳＨＯＲＴ＿ＳＨＯＲＴ２ＳＨＯＲＴ４０と共に（例えば、完全な復元の条件を満足するために）用い易くするために、付加的な移行ウィンドウ関数が導入されることが好ましい。そのような移行ウィンドウ関数の例を以下に挙げる。但し、最初に、本開示においては一般に以下の専門語が用いられていることに言及しておく。
ＷＩＮ＿ＢｌｏｃｋＬｅｎｇｔｈ＿ＰｒｉｏｒＷＦ２ＳｕｂｓＷＦ、但し、ＢｌｏｃｋＬｅｎｇｔｈは現在のウィンドウ関数に占有されているブロックの長さ（例えば、ロング又はショート）を示し、ＰｒｉｏｒＷＦは、直前のブロックにおけるウィンドウ関数の種類（例えば、ロング、ショート又はブリーフ）を識別し、ＳｕｂｓＷＦは、直後のブロックにおけるウィンドウ関数の種類（例えば、ロング、ショート又はブリーフ）を識別する。

移行ウィンドウ関数１１０（図９に示され、ＷＩＮ＿ＳＨＯＲＴ＿ＳＨＯＲＴ２ＢＲＩＥＦと表示されている）は、トランジェントを含む別のショートブロックの直前のショートブロック内で用いられる。すなわち、それはウィンドウ関数ＷＩＮ＿ＳＨＯＲＴ＿ＢＲＩＥＦ２ＢＲＩＥＦ１００の直前にある。

ウィンドウ関数１２０（図１０に示され、ＷＩＮ＿ＳＨＯＲＴ＿ＢＲＩＥＦ２ＳＨＯＲＴと表示されている）は、トランジェントを含む別のショートブロックの直後のショートブロック内で用いられる。すなわち、それはウィンドウ関数ＷＩＮ＿ＳＨＯＲＴ＿ＢＲＩＥＦ２ＢＲＩＥＦ１００の直後にある。

ウィンドウ関数１３０（図１１に示され、ＷＩＮ＿ＬＯＮＧ＿ＬＯＮＧ２ＢＲＩＥＦと表示されている）は、トランジェントを含むショートブロックの直前のロングブロック内で用いられる。すなわち、それはトランジェントを含む次のフレームの直前のフレームを包含し、このトランジェントは次のフレームのまさに最初のブロック内にある。

ウィンドウ関数１４０（図１２に示され、ＷＩＮ＿ＬＯＮＧ＿ＢＲＩＥＦ２ＬＯＮＧと表示されている）は、トランジェントを含むショートブロックの直後のロングブロック内で用いられる。すなわち、それは、トランジェントを含む先行フレームの直後のフレームを包含し、このトランジェントは先行フレームのまさに最後のブロック内にある。

ウィンドウ関数１５０（図１３に示され、ＷＩＮ＿ＬＯＮＧ＿ＢＲＩＥＦ２ＢＲＩＥＦと表示されている）は、トランジェントを含む２つのショートブロックの間に挟まれたロングブロック内で用いられる。すなわち、それはトランジェントを含む２つのフレームの間のフレームを包含し、先行フレームにおけるトランジェントがそのまさに最後のブロック内にあり、次のフレームにおけるトランジェントがそのまさに最初のブロック内にある。

ウィンドウ関数１６０（図１４に示され、ＷＩＮ＿ＬＯＮＧ＿ＳＨＯＲＴ２ＢＲＩＥＦと表示されている）は、トランジェントを含む２つのフレームの間のフレームを包含するロングブロック内で用いられ、先行フレームにおけるトランジェントがそのまさに最後のブロック以外のどこかにあり、次のフレームにおけるトランジェントがそのまさに最初のブロック内にある。

ウィンドウ関数１７０（図１５に示され、ＷＩＮ＿ＬＯＮＧ＿ＢＲＩＥＦ２ＳＨＯＲＴと表示されている）は、トランジェントを含む２つのフレームの間のフレームを包含するロングブロック内で用いられ、先行フレームにおけるトランジェントはそのまさに最後のブロックにあり、次のフレーム内のトランジェントはそのまさに最初のブロック以外のどこかにある。

各場合において、ウィンドウ関数は、完全な復元の条件を満足するような方法で、両側の隣接するウィンドウ関数と重なり合うように設計されることが好ましい。用いられ得るウィンドウ関数の具体的な例を以下に挙げる。

図１６は、本発明の代表的な実施形態に係るウィンドウ関数を選択するための技術を示すフローチャートである。一般的に、図１６に示されている全プロセスは自動化される（例えば、ソフトウェア、ファームウェア、専用ハードウェア、又はそれらの任意の組み合わせにおいて実行される）であろう。

最初に、ステップ２０２において、データのフレームを得る。この点に関し、本発明に従って、種々様々な種類のデータを処理してもよい。本開示を通して、多くの場合、データは音声信号に対応するものと仮定される。しかし、このことは制限的であると解釈されるべきではなく、得られるデータはむしろ、画像信号、映像信号、又は、熱、圧力、放射、運動、距離、任意の生物学的機能、天候及び／又は任意の地質学的現象を表す信号といった、任意の他の物理学的現象を表すものであってもよい。

また、データフレームは（例えば、データが通信チャンネルを通じて受信されている場合におけるように）データのソースによって定義されていてもよいことに留意すべきである。代替的には、例えば、データは、連続ストリームにおいて受信され、処理を目的として（例えば、内部的に）フレーム群にセグメント化されてもよい。何れにせよ、本処理は（限定的ではないが）特に、個々のフレームに分離されたデータに適用可能である。上記に示した通り、フレーム型処理によって、データストリーム全体の個々の部分を、幾つかの特定の点について均一に処理することができる。

本発明の好ましい実施形態において、各フレームは均一なブロックサイズを有する。この点に関し、ブロックは、フレームに対する基本信号処理単位と定義されることが好ましい。例えば、フレーム内のデータを、（例えば、離散コサイン変換又は高速フーリエ変換を用いて）、元の領域（例えば、音声信号の場合は時間領域）から周波数領域へ、又は一組の直交関数によって定義される任意の他の変換領域へ（例えば、信号処理モジュール１９において）変換されるべきである場合、変換領域内での変換及びそれに続く全ての処理は、ブロック毎に別個に行われることが好ましい。

従って、好ましい実施形態において、フレームは単一ブロックに包含されていてもよく、代替的には、複数の同一サイズのブロックに包含されていてもよい。従来技術におけるように、ブロックサイズは、フレーム全体を包含する大ブロックサイズと、フレーム全体に均一に分散された複数の連続ブロックをもたらす小ブロックサイズ、の２つのみであるであることがより好ましい。

更に、さもなければ起こるであろう境界の問題に取り組むために、従来技術におけるように、本発明のブロックは（例えば、完全な復元の条件を満足するような方法で）互いに重なり合うことが好ましい。概念上、各ブロックは（例えば、モジュール１９において）次に処理されるべき多数のコアサンプルと、そのようなコアサンプルに隣接する多数の境界サンプルとを含むと考えることができる。好ましい実施形態において、コアサンプルはシーケンスにおける新たなサンプルであり、境界サンプルは先行ブロックからの履歴サンプルである。他方、フレームは、連続し、重なり合っていないことが好ましい。結果として、フレームの始めにあるブロックが先行フレームと重なり合う。単一ブロックに包含されているフレームについては、その単一ブロックが先行フレーム全体と重なり合う。

データフレームそのものを得ることに加え、ステップ２０２では（例えば、過渡検出器１４から）トランジェント標識も得る。好ましい実施形態において、得られたトランジェント標識は、現在のフレームにトランジェントが存在するかどうか、もし存在するならフレームのどこに存在するのかを示す。現在のフレームにおいて２つ以上のトランジェントが検出された場合、そのようなトランジェントそれぞれの位置が得られる（例えば、過渡検出器１４によって識別され、その後、過渡検出器１４から受信される）ことが好ましい。説明を簡略化するため、本開示においては、一般性を喪失することなく、各フレームにおいて検出されるトランジェントは（あるとしても）１つだけと仮定することがある。

実際のトランジェントの検出は、例えば、任意の既存技術を用いて行うことができる。通常、トランジェントは、非常に短い時間に渡って高周波数成分におけるスパイクとして顕在化し、よってこのことを基に検出することができる。何れにせよ、多くの場合、閾値が規定され、それを下回った場合、信号活動はトランジェントと見なされるであろう。

図１６を再び参照し、ステップ２０３において、現在のフレームにトランジェントが存在するかどうか判断する。この判断は、過渡検出器１４によって提供される情報に基づいて簡単明瞭であることが好ましい。トランジェントが存在しない場合、処理はステップ２０５に進む。トランジェントが存在する場合、処理はステップ２１０に進む。

ステップ２０５において、現在のフレームにトランジェントが含まれないという判断に基づいて、ブロックサイズを設定する。好ましい実施形態において、このような場合、単一ブロックを用いてフレーム全体を包含する。このブロックに、現在のフレームにおけるコアサンプルとしての全てのサンプル、及び先行フレーム（群）からの一部又は全てのサンプルが含まれることがより好ましい。例示的なブロックサイズとしては２，０４８サンプル、すなわち、先行フレームからの１，０２４コアサンプル（フレームサイズも１，０２４サンプル）と１，０２４サンプルである。

次に、ステップ２０７において、現在のフレームに対してウィンドウ関数を（単一ブロックがフレーム全体を包含するものと仮定して）選択する。好ましい実施形態において、このステップには、直前及び直後のフレーム群／ブロック群の評価が含まれる。ウィンドウ関数の数が増えているため、従来技術に比べ、適切なウィンドウシーケンスの決定は典型的には若干複雑化しているが、基本的な原則は比較的簡単明瞭である。具体的には、ロングウィンドウ関数が選択され、その具体的な形態はその前及び次のフレームにおけるトランジェントの存在及び位置によって決まる。具体的な選択は、以下の通り行われることが好ましい。

ステップ２０７において適切なウィンドウ関数が選択されると、それはステップ１７において（例えば、上述した通り）適用される。

他方、ステップ２０３において、現在のフレームにトランジェントが存在すると判断されていた場合、処理は、ブロックサイズを「小」に設定するステップ２１０に進んでいたであろう。１，０２４サンプルというフレームサイズに関する一例は、２５６サンプルというブロックサイズ、すなわち、先行ブロックと（フレームが８ブロックに包含されるように）重なり合う１２８コアサンプルと１２８サンプルである。本実施形態は、２つの起こり得る状況（トランジェントあり／トランジェントなし）それぞれに関して単一ブロックサイズを意図しているが、他の実施形態においては、任意の所望の基準に基づいて様々なブロックサイズを選択してもよく、フレームは様々なサイズのブロック群からなっていてもよいことに留意すべきである。

何れにせよ、ブロックサイズが確立されると、処理は、現在のフレーム内の様々なブロックに対して様々なウィンドウ関数が選択されるステップ２１２に進む。現在のフレームに少なくとも１つのトランジェントが含まれることが分かっているため、ＷＩＮ＿ＳＨＯＲＴ＿ＢＲＩＥＦ２ＢＲＩＥＦウィンドウ関数１００が（識別された位置（群）において）少なくとも１度用いられるであろう。ブリーフウィンドウ関数とショートウィンドウ関数のシーケンスが、以下の原則に従って、現在のフレームのショートブロックに対して選択されることがより好ましい。

・ブロックの時間分解能を向上させるために、ＷＩＮ＿ＳＨＯＲＴ＿ＢＲＩＥＦ２ＢＲＩＥＦが、トランジェントが発生するブロックにおけるサンプルに適用される。

・トランジェントを含むウィンドウの直前にあるウィンドウに対するウィンドウ関数が「…２ＢＲＩＥＦ」という形態の指定を有する。

・トランジェントを含むウィンドウの直後にあるウィンドウに対するウィンドウ関数が「…＿ＢＲＩＥＦ２…」という形態の指定を有する。

従って、以下のウィンドウ関数の組み合わせは何れも許容される。

フレーム内にウィンドウ関数を配置するためのＣで書かれた具体的な手順は、本開示の「ウィンドウ関数選択ルーチン」という見出しの節に記載されている。しかし、一般的には、トランジェント前移行ウィンドウ関数は、それ自体のブロック長（ロング又はショート）及びその直前のウィンドウ関数（ロング、ショート又はブリーフ）の性質に基づいて、上記表の左欄から選択される。同様に、トランジェント後移行ウィンドウ関数は、それ自体のブロック長（ロング又はショート）及びその直後のウィンドウ関数（ロング、ショート又はブリーフ）の性質に基づいて、上記表の右欄から選択される。（ｉ）トランジェント前（トランジェントブロックの直前のブロック）、（ｉｉ）トランジェント（トランジェントを含むブロック）、（ｉｉｉ）トランジェント後（トランジェントブロックの直後のブロック）、（ｉｖ）フレームの最初のブロック、又は（ｖ）フレームの最後のブロック、でない現在のフレーム内の各ブロックには、ＷＩＮ＿ＳＨＯＲＴ＿ＳＨＯＲＴ２ＳＨＯＲＴ４０のウィンドウ関数が割り当てられることが好ましい。現在のフレームにおける最初のブロックは（それがトランジェント前、トランジェント又はトランジェント後ブロックでないものと仮定して）、ＷＩＮ＿ＳＨＯＲＴ＿ＰｒｉｏｒＷＦ２ＳＨＯＲＴのウィンドウ関数が割り当てられることが好ましく、現在のフレームの最後のブロックは（それがトランジェント前、トランジェント又はトランジェント後ブロックでないものと仮定して）、ＷＩＮ＿ＳＨＯＲＴ＿ＳＨＯＲＴ２ＳｕｂｓＷＦのウィンドウ関数が割り当てられることが好ましい。

ステップ２１２が完了すると、処理をステップ１７に進め、選択されたウィンドウ関数を適用する。ステップ１７が完了すると、処理をステップ２０２に戻し、次のフレームの処理を行う。

図１６に示すフローチャートは、本来、性質上概念的なものであることが理解されるべきである。実際、上記に示した通り、１つのフレームに対するウィンドウ関数（群）の選択は、典型的には、隣接するフレーム群におけるトランジェントの存在及び位置に影響されるであろう。従って、１つのフレームに対するウィンドウ関数（群）の選択は、１つ以上の他のフレーム群に対するウィンドウ関数（群）の選択と同時に行われてもよい。少なくとも、現在のフレームに対する選択は、次のフレームに適用されるであろうウィンドウ関数を見越して行われることが好ましい。

図１６に示されたフローチャートの部分２１６は、（図１における）従来のウィンドウ関数選択モジュール１６において行われる対応する処理に代えて用いることができることに言及する。その結果、本発明の技術は、典型的には、従来システムに対する改良点として容易に取り入れることができる。

本発明が用いられてもよい１つの用途として、音声符号化／復号化がある。そのようなシステム内で、符号器は、典型的には、それが現在のフレームを符号化するのに用いたウィンドウ関数を、復号器が同じウィンドウ関数を用いてフレームを復号することができるように、復号器に知らせる。従来技術に関し、この目的を達成するためには、一般に、ウィンドウ関数インデックスが１つだけ復号器に送信されればよく、その理由は以下の通りである。

・検出されたトランジェントを有しないフレームに対しては、ロングウィンドウ関数群のうち１つだけが用いられ、よってそれが復号器に知らされる必要がある。

・１つ以上のトランジェントを含むフレームに対しては、フレーム内の全てのウィンドウ関数が同じ、すなわち、ＷＩＮ＿ＳＨＯＲＴ＿ＳＨＯＲＴ２ＳＨＯＲＴ４０である。そのような（検出されたトランジェントを有しない２つのフレームの間に挟まれた）フレーム７０が図７に示されている。

上記所説は本発明の技術にも当てはまる。すなわち、復号器が符号器と同じウィンドウ関数群を用いてフレームを復号化するために、ウィンドウ関数インデックスは１つだけ復号器に送信されればよい。これは以下の理由による。

・検出されたトランジェントを有しないフレームに対しては、本技術においても、ロングウィンドウ関数群のうちのどの１つが用いられるのかを復号器に知らせるだけでよい。

・検出されたトランジェントを有するフレームに対しては、符号器は、現在のフレームの最初のブロックにおいてトランジェントが存在するかどうか、及び次のフレームの最初のブロックにおいてトランジェントが存在するかどうかを復号器に知らせるだけでよく、その後、フレーム全体に対するウィンドウ関数群のシーケンスを、本明細書に記載された手順を用いて決定することができる。好ましい実施形態において、ＷＩＮ＿ＳＨＯＲＴ＿ＢＲＩＥＦ２ＢＲＩＥＦウィンドウ関数１００がトランジェントを有するブロックに対して用いられているため、この情報を伝達するのに以下の専門語を用いてもよい。
ＷＩＮ＿ＳＨＯＲＴ＿ＣｕｒｒｅｎｔＳｕｂｓ、但し、Ｃｕｒｒｅｎｔ（ＳＨＯＲＴ＝いいえ、ＢＲＩＥＦ＝はい）は、現在のフレームの最初のブロックにおいてトランジェントが存在するかどうかを識別し、Ｓｕｂｓ（ＳＨＯＲＴ＝いいえ、ＢＲＩＥＦ＝はい）は、次のフレームの最初のブロックにおいてトランジェントが存在するかどうかを識別する。例えば、ＷＩＮ＿ＳＨＯＲＴ＿ＢＲＩＥＦ２ＢＲＩＥＦは、現在のフレームの最初のブロック及び次のフレームの最初のブロックにおいてトランジェントが存在することを示し、ＷＩＮ＿ＳＨＯＲＴ＿ＢＲＩＥＦ２ＳＨＯＲＴは、現在のフレームの最初のブロックにおいてトランジェントが存在するが、次のフレームの最初のブロックにおいては存在しないことを示す。

図１７〜２０は、本発明に係る例示的なウィンドウ関数シーケンスを示す。そのようなシーケンスそれぞれにおいて、（ＷＩＮ＿ＳＨＯＲＴ＿ＢＲＩＥＦ２ＢＲＩＥＦウィンドウ関数１００と示されているような）少なくとも１つのトランジェントを有するフレームが、両側のトランジェントを含まない２つのフレームに囲まれている。しかし、これらの例は限定的であると解釈されるべきではなく、それぞれが少なくとも１つのトランジェントを有する連続フレームも許容される。

例示的実施
広く用いられているウィンドウ関数の１つに以下の正弦関数がある。

ロングウィンドウ関数はＭ＝Ｌ、ショートウィンドウ関数はＭ＝Ｓ、及びブリーフウィンドウ関数はＭ＝Ｂ、但し、Ｌ＞Ｓ＞Ｂである場合、以下のウィンドウ関数を定義することができる。

好適な一組のウィンドウ長パラメータはＬ＝１０２４、Ｓ＝１２８、及びＢ＝３２である。但し、他のパラメータをその代わりに用いてもよい。

システム環境
一般的に、明確にそうでないことが示されている場合を除いて、本明細書に記載されている全てのシステム、方法、及び技術は、１つ以上のプログラム可能な汎用コンピューティングデバイスの使用により実行可能である。そのようなデバイスは、典型的には、例えば、共通のバス等により相互接続された以下の部品の少なくとも一部を含むであろう：１つ以上の中央処理装置（ＣＰＵ）；読み出し専用メモリー（ＲＯＭ）；ランダムアクセスメモリー（ＲＡＭ）；（例えば、シリアルポート、パラレルポート、ＵＳＢ接続、又はファイアワイヤ接続のようなハードワイヤード接続を用いた、又はブルートゥースや８０２．１１プロトコルのような無線プロトコルを用いた）他のデバイスとインターフェースをとるための入力／出力ソフトウェア及び回路；（例えば、イーサネット（登録商標）カードのようなハードワイヤード接続、又は、符号分割多元接続（ＣＤＭＡ）、グローバル・システム・フォー・モバイル・コミュニケーションズ（ＧＳＭ（登録商標））、ブルートゥース、８０２．１１プロトコル、又は任意の他のセルラー系や非セルラー系システムのような無線プロトコルを用いた）、本発明の多くの実施形態において、次にインターネット又は任意の他のネットワークに接続する、１つ以上のネットワークを接続するためのソフトウェア及び回路；表示装置（例えば、陰極線管表示装置、液晶表示装置、有機発光表示装置、ポリマー発光表示装置、又は任意の他の薄膜表示装置）；他の出力デバイス（例えば、１つ以上のスピーカー、ヘッドフォンセット、及びプリンター）；１つ以上の入力デバイス（例えば、マウス、タッチパッド、タブレット、タッチセンサー表示装置や他のポインティングデバイス、キーボード、キーパッド、マイクロフォン、及びスキャナー）；大容量記憶装置（例えば、ハードディスクドライブ）；リアルタイムクロック；（例えば、ＲＡＭ、磁気ディスク、磁気テープ、光磁気ディスク、光ディスク等からの読出し及びそれらへの書込みのための）リムーバブル記憶読出し／書込みデバイス；及び（例えば、ファックスを送る、又はダイアル呼出し接続を介してインターネット又は任意の他のコンピュータネットワークに接続するための）モデム。操作において、上記方法及び機能を、そのような汎用コンピュータによって行う範囲において実施するための工程は、典型的には、まず大容量記憶装置（例えば、ハードディスク）に記憶され、ＲＡＭにダウンロードされた後、ＲＡＭのＣＰＵにより実行される。しかし、場合によっては、工程は、まずＲＡＭ又はＲＯＭに記憶される。

本発明の実施において用いられる好適なデバイスは、種々の製造元から入手され得る。種々の実施形態において、タスクのサイズ及び複雑性に応じ、様々な種類のデバイスが用いられる。好適なデバイスには、本体コンピュータ、多重プロセッサコンピュータ、ワークステーション、パーソナルコンピュータ、及び、ＰＤＡ，無線電話、又は任意の他の機器又はデバイスといった更に小型のコンピュータが含まれ、これらは独立型であっても、ネットワークにハードワイヤードされていても、ネットワークに無線接続されていてもよい。

更に、これまで汎用のプログラム可能なデバイスについて説明してきたが、他の実施形態においては、１つ以上の専用プロセッサ又はコンピュータがそれに代えて（又はそれに加えて）用いられる。一般に、特にそうでない旨の言及がある場合を除き、上記に述べた機能は全て、ソフトウェア、ハードウェア、ファームウェア、又はこれらの任意の組み合わせにおいて実施可能であり、この特定の実施事項は公知の技術トレードオフに基づいて選択されることに留意すべきである。より具体的には、当業者が容易に理解するであろうように、上記に述べた機能が、一定の、予め設定された、又は論理的な方法で実施される場合、それはプログラミング（例えば、ソフトウェア又はファームウェア）、論理素子（ハードウェア）の適切な配置、又はこれら２つの任意の組み合わせを通して達成され得る。

本発明がまた、この発明の方法及び機能を行うためのプログラム命令が記憶される機械可読媒体にも関連していることが理解されるべきである。そのような媒体には、例示として、磁気ディスク、磁気テープ、ＣＤＲＯＭ及びＤＶＤＲＯＭのような光学的に読み取り可能な媒体、又はＰＣＭＣＩＡカードのような半導体メモリ、種々のメモリカード、ＵＳＢメモリデバイス等が含まれる。何れにせよ、媒体は、小型ディスクドライブや小型ディスク、ディスケット、カセット、カートリッジ、カード、スティック等のような携帯アイテムの形態であってもよく、又は、ハードディスクドライブ、コンピュータや他のデバイスに備えられたＲＯＭやＲＡＭのような比較的より大型の、あるいは固定されたアイテムの形態であってもよい。

上記説明においては、電子計算機コンピュータ及びデバイスに主に重点が置かれている。しかし、電子的、光学的、生物学的、及び化学的処理の任意の組み合わせを用いたデバイスといった、任意の他の演算デバイス又は他の種類のデバイスを用いてもよいことが理解されるべきである。

更なる検討事項
上記に、本発明の幾つかの様々な実施形態を、それぞれが特定の特徴を含むものとして述べた。しかし、当業者が理解するであろうように、どの１つの実施形態の記述に関して述べられた特徴もその実施形態に限定されず、その他の実施形態の何れにおいても種々の組み合わせで含まれ、及び／又は配置されてもよいことが意図されている。

同様に、上記記述において、機能は、特定のモジュール又は素子に起因している場合がある。しかし、機能は一般に、所望により、様々なモジュール又は素子の間で再分散されてもよく、場合によっては、特定の素子又はモジュールの必要性が完全になくなり、及び／又は新たな素子又はモジュールの追加が必要となる。機能の正確な分散は、当業者が理解するであろうように、本発明の具体的な実施形態を参照し、公知の技術トレードオフに従って行われることが好ましい。

従って、本発明を、その例示的な実施形態及び添付の図面に関して詳細に説明してきたが、本発明の精神及び範囲から逸脱することなく、本発明の種々の適合及び変更が達成され得ることが当業者に明らかであるべきである。従って、本発明は、図面に示され、上記に述べられた厳密な実施形態に限定されない。むしろ、本発明の精神から逸脱しない全てのそのような変形例が、その範囲に含まれ、本明細書に添付されている請求項によってのみ限定されると考えられることが意図されている。

ウィンドウ関数選択ルーチン

但し：

Claims

コンピュータに、フレーム型データを処理する方法を実行させるためのコンピュータプログラムであって、前記方法が、
（ａ）データのフレームを取得するステップと、
（ｂ）前記フレームに対してブロックサイズを設定し、それによって前記フレーム内に複数の同一サイズのブロックを定義するステップと、
（ｃ）前記複数の同一サイズのブロックのうちの異なるブロックに対して異なるウィンドウ関数を選択するステップと、
（ｄ）ステップ（ｃ）において選択された前記ウィンドウ関数を適用することによって前記データのフレームを処理するステップと
を備え、
ステップ（ｃ）においては、トランジェントを含むブロックに対してブリーフウィンドウ関数が選択され、該ブリーフウィンドウ関数は、当該トランジェントを含むフレーム内の他のウィンドウ関数と比べて狭く、ブロックのより小さな部分にエネルギーのより多くが集中しており、
前記フレームは、データのストリームが分割された、同一の長さの離散的で連続する重なり合わないフレームのシーケンスの１つであり、
前記離散的で連続する重なり合わないフレームは均一に処理される
ことを特徴とするコンピュータプログラム。
前記ウィンドウ関数が、完全な復元のための条件を満足するような方法で互いに重なり合うことを特徴とする請求項１に記載のコンピュータプログラム。
前記方法が、前記離散的で連続する重なり合わないデータのフレームの様々なフレームに対して、ステップ（ａ）〜（ｄ）を複数回繰り返すステップを更に備えることを特徴とする請求項１または２に記載のコンピュータプログラム。
ステップ（ｃ）において選択された前記ウィンドウ関数は、標準トランジェントフレームウィンドウ関数と、（ｉ）トランジェント前移行ウィンドウ関数及び（ｉｉ）トランジェント後移行ウィンドウ関数のうちの少なくとも１つとを更に含むことを特徴とする請求項１乃至３のいずれか１項に記載のコンピュータプログラム。
前記ブリーフウィンドウ関数は、先行ゼロ重みの第１のシーケンスで始まり、遅行ゼロ重みの第２のシーケンスで終わることを特徴とする請求項１乃至４のいずれか１項に記載のコンピュータプログラム。
前記方法が、前記フレームの各ブロック内のデータを別個に変換することにより、元の領域から第２の領域へ該フレーム内のデータを変換するステップを更に備えることを特徴とする請求項１乃至５のいずれか１項に記載のコンピュータプログラム。
前記ブリーフウィンドウ関数は、ゼロ重みの第１のセグメントと、これに続く第１のサイン関数により規定される重みと、これに続く等しい重みのセグメントと、これに続く第２のサイン関数により規定される重みと、これに続くゼロ重みの第２のセグメントとを含むことを特徴とする請求項１乃至６のいずれか１項に記載のコンピュータプログラム。
前記ブリーフウィンドウ関数の重みは、Ｓ＞Ｂについて、

により定められることを特徴とする請求項１乃至７のいずれか１項に記載のコンピュータプログラム。
Ｓ＝１２８、Ｂ＝３２であることを特徴とする請求項８に記載のコンピュータプログラム。
前記方法が、前記同一の長さの離散的で連続する重なり合わないフレームのシーケンスからの第２のフレームを包含する単一のウィンドウ関数を割り当てるステップをさらに備えることを特徴とする請求項１乃至９のいずれか１項に記載のコンピュータプログラム。
前記フレームは８個のブロックにより包含され、前記第２のフレームは単一のブロックにより包含され、
前記ブロックの各々に対してウィンドウ関数が割り当てられる
ことを特徴とする請求項１０に記載のコンピュータプログラム。
前記同一の長さの離散的で連続する重なり合わないフレームのシーケンスにおいて与えられたフレームの各々について、当該与えられたフレームにトランジェントが存在するか否かに基づきブロックサイズが設定されることを特徴とする請求項１乃至１１のいずれか１項に記載のコンピュータプログラム。