JP7266689B2

JP7266689B2 - ハイレゾリューションオーディオ符号化

Info

Publication number: JP7266689B2
Application number: JP2021540408A
Authority: JP
Inventors: ガオ，ヤン
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2019-01-13
Filing date: 2020-01-13
Publication date: 2023-04-28
Anticipated expiration: 2040-01-13
Also published as: BR112021013720A2; CN113302684A; KR20210111815A; US20210343303A1; WO2020146869A1; US11749290B2; JP2022517234A; KR102664768B1; EP3903308A1; CN113302684B; CA3126486A1; EP3903308A4; AU2020205729A1

Description

本開示は信号処理に関し、より具体的にはオーディオ信号符号化の効果を改善することに関する。

ハイレゾリューション（ハイレゾ）オーディオは、高精細度オーディオ又はＨＤオーディオとしても知られ、一部のレコーディングされた音楽の小売業者や高忠実度サウンド再生機器のベンダにより使用されるマーケティング用語である。その最も簡素な表現では、ハイレゾオーディオは、１６ビット／４４．１ｋＨｚで指定されるコンパクトディスク（ＣＤ）よりも高いサンプリング周波数及び／又はビット深度を有する音楽ファイルを指す傾向がある。ハイレゾオーディオファイルの主な主張される利点は、圧縮オーディオフォーマットより優れた音質である。再生すべきファイル上により多くの情報があり、ハイレゾオーディオは、より多くのディテール及びテクスチャを誇る傾向があり、聴き手を元のパフォーマンスにより近づける。

しかしながら、ハイレゾオーディオはマイナス面、すなわちファイルサイズを伴う。ハイレゾファイルは、典型的にはサイズが数十メガバイトとなる可能性があり、少数のトラックが、デバイス上の記憶装置をすぐに使い尽くす可能性がある。記憶装置は従来よりもはるかに安価であるが、そのファイルのサイズは依然として、ハイレゾオーディオを圧縮なくＷｉ－Ｆｉ又はモバイルネットワーク上でストリーミングするのに扱いにくくしている。

いくつかの実装において、本明細書は、オーディオ信号符号化の効果を改善する手法について記載する。

第１の実装において、長期予測（ＬＴＰ）を実行する方法が、少なくとも所定数のフレームについての入力オーディオ信号のピッチゲイン及びピッチラグを決定するステップと、少なくとも上記所定数のフレームについて、上記入力オーディオ信号の上記ピッチゲインが所定閾値を超えたこと、及び上記入力オーディオ信号の上記ピッチラグの変化が所定範囲内であったことを決定するステップと、少なくとも上記所定数のフレームについて、上記入力オーディオ信号のピッチゲインが上記所定閾値を超えたこと、及び上記ピッチラグの上記変化が上記所定範囲内であったことを決定したことに応答して、上記入力オーディオ信号の現在のフレームに対してピッチゲインを設定してパッケージロス隠蔽（ＰＬＣ）を改善するステップと、を含む。

第２の実装において、電子デバイスが、命令を含む非一時的メモリ記憶装置と、上記メモリ記憶装置と通信する１つ以上のハードウェアプロセッサと、を含み、上記１つ以上のハードウェアプロセッサは上記命令を実行して、少なくとも所定数のフレームについての入力オーディオ信号のピッチゲイン及びピッチラグを決定し、少なくとも上記所定数のフレームについて、上記入力オーディオ信号の上記ピッチゲインが所定閾値を超えたこと、及び上記入力オーディオ信号の上記ピッチラグの変化が所定範囲内であったことを決定し、少なくとも上記所定数のフレームについて、上記入力オーディオ信号のピッチゲインが上記所定閾値を超えたこと、及び上記ピッチラグの上記変化が上記所定範囲内であったことを決定したことに応答して、上記入力オーディオ信号の現在のフレームに対してピッチゲインを設定してＰＬＣを改善する。

第３の実装において、非一時的コンピュータ読取可能媒体が、ＬＴＰを実行するコンピュータ命令を記憶し、上記コンピュータ命令は、１つ以上のハードウェアプロセッサにより実行されたときに上記１つ以上のハードウェアプロセッサに動作を実行させ、上記動作は、少なくとも所定数のフレームについての入力オーディオ信号のピッチゲイン及びピッチラグを決定することと、少なくとも上記所定数のフレームについて、上記入力オーディオ信号の上記ピッチゲインが所定閾値を超えたこと、及び上記入力オーディオ信号の上記ピッチラグの変化が所定範囲内であったことを決定することと、少なくとも上記所定数のフレームについて、上記入力オーディオ信号のピッチゲインが上記所定閾値を超えたこと、及び上記ピッチラグの上記変化が上記所定範囲内であったことを決定したことに応答して、上記入力オーディオ信号の現在のフレームに対してピッチゲインを設定してＰＬＣを改善することと、を含む。

前述の実装は、コンピュータにより実施される方法、コンピュータにより実施される方法を実行するためのコンピュータ読取可能命令を記憶する非一時的コンピュータ読取可能媒体、及び、コンピュータにより実施される方法と非一時的コンピュータ読取可能媒体に記憶された命令とを実行するように構成されたハードウェアプロセッサに相互動作可能に結合されたコンピュータメモリを含むコンピュータにより実施されるシステムを使用して実装可能である。

本明細書の主題事項の１つ以上の実施形態の詳細は、添付の図面及び以下の説明に記載されている。主題事項の他の特徴、態様、及び利点は、明細書、図面、及び特許請求の範囲から明らかになる。

いくつかの実装によるＬ２ＨＣ（低遅延及び低複雑性ハイレゾリューションコーデック）エンコーダの一例示的な構造を示す。いくつかの実装によるＬ２ＨＣデコーダの一例示的な構造を示す。いくつかの実装によるローローバンド（ＬＬＢ）エンコーダの一例示的な構造を示す。いくつかの実装によるＬＬＢデコーダの一例示的な構造を示す。いくつかの実装によるローハイバンド（ＬＨＢ）エンコーダの一例示的な構造を示す。いくつかの実装によるＬＨＢデコーダの一例示的な構造を示す。いくつかの実装による、ハイローバンド（ＨＬＢ）及び／又はハイハイバンド（ＨＨＢ）サブバンドのためのエンコーダの一例示的な構造を示す。いくつかの実装による、ＨＬＢ及び／又はＨＨＢサブバンドのためのデコーダの一例示的な構造を示す。いくつかの実装による高ピッチ信号の一例示的なスペクトル構造を示す。いくつかの実装による高ピッチ検出の一例示的なプロセスを示す。いくつかの実装による高ピッチ信号の知覚的重み付けを実行する一例示的な方法を示すフローチャートである。いくつかの実装による残差量子化エンコーダの一例示的な構造を示す。いくつかの実装による残差量子化デコーダの一例示的な構造を示す。いくつかの実装による信号の残差量子化を実行する一例示的な方法を示すフローチャートである。いくつかの実装による有声発話の一例を示す。いくつかの実装による長期予測（ＬＴＰ）制御を実行する一例示的なプロセスを示す。いくつかの実装によるオーディオ信号の一例示的なスペクトルを示す。いくつかの実装による長期予測（ＬＴＰ）を実行する一例示的な方法を示すフローチャートである。いくつかの実装による線形予測符号化（ＬＰＣ）パラメータの量子化の一例示的な方法を示すフローチャートである。いくつかの実装によるオーディオ信号の一例示的なスペクトルを示す。いくつかの実装による電子デバイスの一例示的な構造を示す図である。

様々な図面における同様の参照番号及び指定は同様の要素を示す。

最初に、１つ以上の実施形態の例示的な実装が以下で提供されるが、開示されるシステム及び／又は方法は、現在知られ又は存在しているかに関わらず任意の数の手法を使用して実施され得ることを理解されたい。本開示は、本明細書で例示及び説明される例示的な設計及び実装を含む以下で例示される例示的な実装、図面、及び手法に決して限定されるべきでなく、添付の特許請求の範囲の範囲内でそれらの同等物の十分な範囲と共に修正され得る。

ハイレゾリューション（High-resolution）（ハイレゾ（hi-res））オーディオは、高精細度オーディオ又はＨＤオーディオとしても知られ、一部のレコーディングされた音楽の小売業者や高忠実度サウンド再生機器のベンダにより使用されるマーケティング用語である。ハイレゾオーディオは、ハイレゾ標準をサポートするより多くの製品、ストリーミングサービス、さらにはスマートフォンのリリースのおかげで、ゆっくりだが確実にメインストリームに至っている。しかしながら、高精細度ビデオと異なり、ハイレゾオーディオには単一のユニバーサルスタンダードが存在しない。ＤｉｇｉｔａｌＥｎｔｅｒｔａｉｎｍｅｎｔＧｒｏｕｐ、ＣｏｎｓｕｍｅｒＥｌｅｃｔｒｏｎｉｃｓＡｓｓｏｃｉａｔｉｏｎ、及びＴｈｅＲｅｃｏｒｄｉｎｇＡｃａｄｅｍｙはレコードレーベルと共に、ハイレゾオーディオを「ＣＤより良好な品質の音楽ソースからマスタリングされたレコーディングからのサウンドのフルレンジを再生することができるロスレス（Lossless）オーディオ」として公式に定義している。その最も簡素な表現では、ハイレゾオーディオは、１６ビット／４４．１ｋＨｚで指定されるコンパクトディスク（ＣＤ）よりも高いサンプリング周波数及び／又はビット深度を有する音楽ファイルを指す傾向がある。サンプリング周波数（又は、サンプリングレート）は、アナログ－デジタル変換プロセスの間に信号のサンプルが１秒あたりに取られる回数を指す。ビットが多いほど、最初のインスタンス（instance）で信号をより正確に測定することができる。したがって、ビット深度を１６ビットから２４ビットに進めることで、品質の顕著な飛躍を果たすことができる。ハイレゾオーディオファイルは通常、２４ビットで９６ｋＨｚ（又は、さらにはそれ以上）のサンプリング周波数を使用する。いくつかの場合、８８．２ｋＨｚのサンプリング周波数もまたハイレゾオーディオファイルに使用することもできる。さらに、ＨＤオーディオとラベル付けされた４４．１ｋＨｚ／２４ビットのレコーディングも存在する。

いくつかの異なるハイレゾオーディオファイルフォーマットが、それら独自の互換性要件を有して存在する。ハイレゾリューションオーディオを記憶できるファイルフォーマットは、一般的なＦＬＡＣ（フリーロスレスオーディオコーデック（Free Lossless Audio Codec））及びＡＬＡＣ（アップルロスレスオーディオコーデック（Apple Lossless Audio Codec））フォーマットを含み、これらの双方は、圧縮されているが、理論上で情報が失われないことを意味する方法において圧縮されている。他のフォーマットは、非圧縮のＷＡＶ及びＡＩＦＦフォーマット、ＤＳＤ（スーパーオーディオＣＤに使用されるフォーマット）、並びにより最近のＭＱＡ（マスタクオリティ認証（Master Quality Authenticated））を含む。以下は、主なファイル形式の分類である。

ＷＡＶ（ハイレゾ）：全てのＣＤがエンコードされる標準フォーマット。優れた音質だがそれは非圧縮であり、巨大なファイルサイズ（特に、ハイレゾファイルの場合）を意味する。それは不十分なメタデータサポート（すなわち、アルバムアートワーク、アーティスト、及び曲名情報）を有する。

ＡＩＦＦ（ハイレゾ）：ＷＡＶに対するアップルの代替物であり、より良好なメタデータサポートを有する。それはロスレスであり非圧縮である（ゆえに、大きいファイルサイズである）が、大いに一般的なわけではない。

ＦＬＡＣ（ハイレゾ）：このロスレス圧縮フォーマットは、ハイレゾサンプルレートをサポートし、ＷＡＶの約半分のスペースを占め、メタデータを記憶する。それはロイヤリティフリーで広くサポートされており（しかしアップルではサポートされていない）、ハイレゾアルバムをダウンロード及び記憶するのに好適なフォーマットと考えられる。

ＡＬＡＣ（ハイレゾ）：アップル独自ロスレス圧縮フォーマットもまた、ハイレゾを行い、メタデータを記憶し、ＷＡＶの半分のスペースを占める。ＦＬＡＣに対する、ｉＴｕｎｅｓ及びｉＯＳフレンドリーの代替物である。

ＤＳＤ（ハイレゾ）：スーパーオーディオＣＤに使用されるシングルビットフォーマット。それは２．８ＭＨｚ、５．６ＭＨｚ、及び１１．２ＭＨｚの種類があるが、広くサポートされているわけではない。

ＭＱＡ（ハイレゾ）：時間ドメインにより重点を置いてハイレゾファイルをパッケージ化するロスレス圧縮フォーマット。それはＴｉｄａｌＭａｓｔｅｒｓハイレゾストリーミングに使用されるが、製品にわたり限られたサポートを有する。

ＭＰ３（ハイレゾでない）：一般的なロッシー（lossy）圧縮フォーマットは、小さいファイルサイズを保証するが最良の音質からはほど遠い。スマートフォンやｉＰｏｄに音楽を記憶するのに便利だが、ハイレゾをサポートしていない。

ＡＡＣ（ハイレゾでない）：ＭＰ３に対する代替物で、ロッシーであり圧縮されているが、より良好に聞こえる。ｉＴｕｎｅｓダウンロード、ＡｐｐｌｅＭｕｓｉｃストリーミング（２５６ｋｂｐｓで）、及びＹｏｕＴｕｂｅストリーミングに使用される。

ハイレゾオーディオファイルの主な主張される利点は、圧縮オーディオフォーマットより優れた音質である。ＡｍａｚｏｎやｉＴｕｎｅｓなどのサイトからのダウンロード、及びＳｐｏｔｉｆｙなどのストリーミングサービスは、比較的低いビットレートを有する圧縮ファイルフォーマットを使用し、例えば、ＡｐｐｌｅＭｕｓｉｃでは２５６ｋｂｐｓのＡＡＣファイル、及びＳｐｏｔｉｆｙでは３２０ｋｂｐｓのＯｇｇＶｏｒｂｉｓストリームなどである。ロッシー圧縮の使用は、エンコーディングプロセスでデータが失われることを意味し、これは次いで、簡便さ及びより小さいファイルサイズのために解像度（resolution）が犠牲にされることを意味する。これは音質への影響を有する。例えば、最高品質のＭＰ３は３２０ｋｂｐｓのビットレートを有し、一方、２４ビット／１９２ｋＨｚファイルは９２１６ｋｂｐｓのデータレートを有する。音楽ＣＤは１４１１ｋｂｐｓである。したがって、ハイレゾの２４ビット／９６ｋＨｚ又は２４ビット／１９２ｋＨｚのファイルは、ミュージシャンやエンジニアがスタジオで作業していた音質をより厳密に再現するべきである。再生すべきファイル上により多くの情報があり、ハイレゾオーディオは、より多くのディテール及びテクスチャを誇る傾向があり、再生システムが十分透過的であれば、聴き手を元のパフォーマンスにより近づける。

ハイレゾオーディオはマイナス面、すなわちファイルサイズを伴う。ハイレゾファイルは、典型的にはサイズが数十メガバイトとなる可能性があり、少数のトラックが、デバイス上の記憶装置をすぐに使い尽くす可能性がある。記憶装置は従来よりもはるかに安価であるが、そのファイルのサイズは依然として、ハイレゾオーディオを圧縮なくＷｉ－Ｆｉ又はモバイルネットワーク上でストリーミングするのに扱いにくくしている。

ハイレゾオーディオを再生及びサポートすることができるかなり様々な製品が存在する。それは全て、システムがどれほど大きく又は小さいか、予算はどれほどか、及び曲を聴くのにどんな方法が最も使用されるかに依存する。ハイレゾオーディオをサポートする製品のいくつかの例を以下に記載する。

スマートフォン

スマートフォンは、ハイレゾ再生をますますサポートしつつある。しかし、これはフラッグシップのＡｎｄｒｏｉｄモデルに限定され、例えば、現行のサムスンＧａｌａｘｙＳ９及びＳ９＋、及びＮｏｔｅ９（これらは全てＤＳＤファイルをサポートする）、並びにソニーのＸｐｅｒｉａＸＺ３などである。ＬＧのＶ３０及びＶ３０ＳＴｈｉｎＱのハイレゾをサポートする電話機は現在、ＭＱＡ互換を提供するものであり、一方、サムスンのＳ９電話機は、ドルビーアトモス（Dolby Atmos）さえサポートしている。アップルのｉＰｈｏｎｅはこれまでのところ、すぐに使える（out of the box）ハイレゾオーディオをサポートしていないが、これを中心とした、適切なアプリを使用し、次いでデジタル－アナログコンバータ（ＤＡＣ）をプラグ接続するか又はｉＰｈｏｎｅのＬｉｇｈｔｎｉｎｇコネクタを用いてＬｉｇｈｔｎｉｎｇヘッドフォンを使用するかのいずれかによる方法がある。

タブレット

ハイレゾ再生タブレットも存在し、サムスンＧａｌａｘｙタブＳ４のようなものを含む。ＭＷＣ２０１８では、複数の新しい互換モデルが出されており、ファーウェイのＭ５シリーズやオンキョーの興味深いＧｒａｎｂｅａｔタブレットが含まれる。

ポータブル音楽プレーヤ

あるいは、様々なソニーウォークマンやアステル＆ケルンの受賞したポータブルプレーヤなどの、専用のポータブルハイレゾ音楽プレーヤがある。これらの音楽プレーヤは、マルチタスクのスマートフォンより多くのストレージ空間とはるかに良好な音質を提供する。そして、従来のポータブルからほど遠いが、驚くほど高価なソニーＤＭＰ－Ｚ１のデジタル音楽プレーヤは、ハイレゾ及びダイレクトストリームデジタル（direct stream digital、ＤＳＤ）の才能を詰め込まれている。

デスクトップ

デスクトップソリューションの場合、ラップトップ（Ｗｉｎｄｏｗｓ、Ｍａｃ、Ｌｉｎｕｘ）が、ハイレゾ音楽を記憶及び再生するための主要ソースである（結局、これは、ハイレゾのダウンロードサイトからの曲がいずれにしてもダウンロードされる場所である）。

ＤＡＣ

ＵＳＢ又はデスクトップＤＡＣ（ＣｙｒｕｓｓｏｕｎｄＫｅｙ又はＣｈｏｒｄＭｏｊｏなど）は、コンピュータ又はスマートフォン（そのオーディオ回路は音質に関して最適化される傾向がない）に記憶されたハイレゾファイルから優れた音質を得るのに良い方法である。即時の音響強化のために、ソースとヘッドフォンの間に妥当なデジタル－アナログコンバータ（ＤＡＣ）を単にプラグ接続する。

非圧縮オーディオファイルは、フルのオーディオ入力信号を、入ってくるデータのフルロードを記憶できるデジタルフォーマットにエンコードする。それらは、大きいファイルサイズを犠牲にして最高の品質及びアーカイブ機能を提供し、多くの場合、それらの広範な使用を妨げている。ロスレスエンコーディングは、非圧縮とロッシーとの間の中間の立場として存在する。それは、縮小されたサイズで、非圧縮オーディオファイルと同様又は同じオーディオ品質を与える。ロスレスコーデックは、デコードにおいて非圧縮情報を復元する前に、エンコードにおいて入ってくるオーディオを非破壊的な方法で圧縮することによりこれを達成する。ロスレスエンコードされたオーディオのファイルサイズは依然として、多くのアプリケーションに対して大きすぎる。ロッシーファイルは、非圧縮又はロスレスとは別様にエンコードされる。アナログ－デジタル変換の本質的な機能は、ロッシーエンコーディング手法において同じままである。ロッシーは、非圧縮から分化している。ロッシーコーデックは、元の音波に可能な限り近い主観的なオーディオ品質を保つよう試みると同時に、元の音波に含まれる情報のうち相当な量を捨てる。このため、ロッシーオーディオファイルは非圧縮オーディオファイルよりかなり小さく、ライブオーディオシナリオでの使用を可能にする。ロッシーオーディオファイルと非圧縮オーディオファイルの間に主観的な品質の差がない場合、ロッシーオーディオファイルの品質は「透過的（transparent）」と見なすことができる。近年、いくつかのハイレゾリューションロッシーオーディオコーデックが開発されており、その中で、ＬＤＡＣ（ソニー）及びＡｐｔＸ（クアルコム）は最も一般的なものである。ＬＨＤＣ（Ｓａｖｉｔｅｃｈ）もまた、それらの１つである。

消費者及びハイエンドオーディオ企業は、最近これまでになく、Ｂｌｕｅｔｏｏｔｈオーディオについて話題にしてきている。それがワイヤレスヘッドセット、ハンズフリーのイヤーピース、自動車、又はコネクテッドホームであれば、良質のＢｌｕｅｔｏｏｔｈオーディオについてのますます多くのユースケースが存在する。複数の企業が、ほどほどのパフォーマンスのすぐに使えるＢｌｕｅｔｏｏｔｈソリューションを超えるソリューションをカバーしている。クアルコムのａｐｔＸは、すでに多くのＡｎｄｒｏｉｄフォンにカバーされているが、マルチメディア大手のソニーは、「ＬＤＡＣ」と呼ばれるその独自のハイエンドソリューションを有する。この技術は、以前はソニーのＸｐｅｒｉａシリーズのハンドセットでのみ利用可能であったが、Ａｎｄｒｏｉｄ８．０Ｏｒｅｏの公開により、Ｂｌｕｅｔｏｏｔｈコーデックは、他のＯＥＭＳが希望する場合にそれらが実装するためのコアＡＯＳＰコードの一部として利用可能になる。最も基本的なレベルでは、ＬＤＡＣは、Ｂｌｕｅｔｏｏｔｈを介した無線での２４ビット／９６ｋＨｚの（ハイレゾ）オーディオファイルの転送をサポートする。最も近い競合コーデックはクアルコムのａｐｔＸＨＤであり、これは２４ビット／４８ｋＨｚのオーディオデータをサポートする。ＬＤＡＣには３つの異なるタイプの接続モードがあり、品質優先、標準、及び接続優先である。これらの各々は異なるビットレートを提供し、それぞれ、９９０ｋｂｐｓ、６６０ｋｂｐｓ、及び３３０ｋｂｐｓで計量されている（weighing in）。したがって、利用可能な接続のタイプに依存して、様々な品質レベルがある。しかし、ＬＤＡＣの最低ビットレートは、ＬＤＡＣが誇るフルの２４ビット／９６ｋＨｚの品質を与えないことは明らかである。ＬＤＡＣは、ソニーにより開発されたオーディオ符号化技術であり、これは、２４ビット／９６ｋＨｚで最大９９０ｋｂｉｔ／ｓまでのＢｌｕｅｔｏｏｔｈ接続を通じたオーディオのストリーミングを可能にする。それは、ヘッドフォン、スマートフォン、ポータブルメディアプレーヤ、アクティブスピーカ、及びホームシアターを含む様々なソニー製品で使用されている。ＬＤＡＣはロッシーコーデックであり、これは、より効率的なデータ圧縮を提供するためにＭＤＣＴに基づく符号化方式を採用している。ＬＤＡＣの主な競合相手は、クアルコムのａｐｔＸ－ＨＤ技術である。高品質標準低複雑性サブバンドコーデック（subband codec、ＳＢＣ）は最大３２８ｋｂｐｓで記録し（clocks in）、クアルコムのａｐｔＸは３５２ｋｂｐｓであり、ａｐｔＸＨＤは５７６ｋｂｐｓである。次いで理論上、９９０ｋｂｐｓのＬＤＡＣは、世の中のいずれの他のＢｌｕｅｔｏｏｔｈコーデックよりも多くのさらなるデータを伝送する。そして、ローエンドの接続優先設定でさえＳＢＣ及びａｐｔＸと競合し、これは、最も一般的なサービスから音楽をストリーミングする者の要求を満たす。ソニーのＬＤＡＣには、２つの主要な部分がある。第１の部分は、９９０ｋｂｐｓに達するために十分高いＢｌｕｅｔｏｏｔｈ転送速度を達成することであり、第２の部分は、ハイレゾリューションオーディオデータを最小限の品質のロスでこの帯域幅に押し込むことである。ＬＤＡＣは、Ｂｌｕｅｔｏｏｔｈの任意の拡張データレート（Enhanced Data Rate、ＥＤＲ）技術を使用して、通常のＡ２ＤＰ（アドバンストオーディオ配信プロファイル（Advanced Audio Distribution Profile）プロファイル制限を超えてデータ速度を強化する。しかし、これはハードウェア依存である。ＥＤＲ速度は通常、Ａ２ＤＰオーディオプロファイルにより使用されるわけではない。

オリジナルのａｐｔＸアルゴリズムは、心理音響的聴覚マスキング手法なしに、時間ドメインの適応的差分パルス符号変調（adaptive differential pulse-code modulation、ＡＤＰＣＭ）原理に基づいていた。クアルコムのａｐｔＸオーディオ符号化は最初、半導体製品として、部品名がＡＰＴＸ１００ＥＤのカスタムプログラミングされたＤＳＰ集積回路として商業市場に導入されており、これは当初、放送自動化機器製造業者により採用された。該製造業者は、ラジオ番組中の自動的な再生のため、例えば、したがってディスクジョッキーのタスクを置き換えるために、ＣＤ品質のオーディオをコンピュータハードディスクドライブに記憶する手段を必要とした。１９９０年代初頭のその商業的な導入以来、リアルタイムオーディオデータ圧縮のためのａｐｔＸアルゴリズムの範囲は、専門的なオーディオ、テレビジョン及びラジオ放送、並びに家電製品、特に、ワイヤレスオーディオ、ゲーム及びビデオのための低レイテンシワイヤレスオーディオ、並びにオーディオオーバーＩＰ（audio over IP）におけるアプリケーションのために、ソフトウェア、ファームウェア、及びプログラマブルハードウェアの形式で利用可能になっている知的財産と共に拡大し続けている。さらに、ＡｐｔＸコーデックは、ＳＢＣ（サブバンド符号化）の代わりに使用することができ、サブバンド符号化方式は、短距離無線パーソナルエリアネットワーク標準であるＢｌｕｅｔｏｏｔｈのＡ２ＤＰのためにＢｌｕｅｔｏｏｔｈＳＩＧにより義務付けられたロッシーステレオ／モノオーディオストリーミングに関する。ＡｐｔＸは、高性能のＢｌｕｅｔｏｏｔｈ周辺機器でサポートされている。今日では、標準ａｐｔＸと拡張ａｐｔＸ（Ｅ－ａｐｔＸ）の双方が、多くの放送機器メーカのＩＳＤＮ及びＩＰ双方のオーディオコーデックハードウェアで使用されている。２００７年には、ａｐｔＸファミリーに対して、最大８：１までの圧縮を提供するａｐｔＸＬｉｖｅの形式の追加が導入された。そして２００９年４月には、ａｐｔＸ－ＨＤ、ロッシーだがスケーラブルな適応的オーディオコーデックが発表された。ＡｐｔＸは以前、２０１０年にＣＳＲｐｌｃにより買収されるまでａｐｔ－Ｘと名付けられていた。ＣＳＲはその後、２０１５年８月にクアルコムにより買収された。ａｐｔＸオーディオコーデックは、消費者及び自動車のワイヤレスオーディオアプリケーションに、とりわけ、「ソース」デバイス（スマートフォン、タブレット、又はラップトップなど）と「シンク」アクセサリ（例えば、Ｂｌｕｅｔｏｏｔｈステレオスピーカ、ヘッドセット、又はヘッドフォン）との間のＢｌｕｅｔｏｏｔｈＡ２ＤＰ接続／ペアリングを通じたロッシーステレオオーディオのリアルタイムストリーミングに使用されている。この技術は、Ｂｌｕｅｔｏｏｔｈ標準で義務付けられたデフォルトのサブバンド符号化（ＳＢＣ）を超えるａｐｔＸオーディオ符号化の音響効果を導き出すために、送信機と受信機の双方に組み込まれなければならない。拡張ａｐｔＸは、専門的なオーディオ放送アプリケーションに４：１の圧縮比での符号化を提供し、ＡＭ、ＦＭ、ＤＡＢ、ＨＤラジオに適する。

拡張ａｐｔＸは、１６、２０、又は２４ビットのビット深度をサポートする。４８ｋＨｚでサンプリングされたオーディオの場合、Ｅ－ａｐｔＸのビットレートは３８４ｋｂｉｔ／ｓ（デュアルチャネル）である。ＡｐｔＸ－ＨＤは、５７６ｋｂｉｔ／ｓのビットレートを有する。それは、最大４８ｋＨｚまでのサンプリングレートの高精細度オーディオと、最大２４ビットまでのサンプル解像度をサポートする。名前が示唆するのと異なり、このコーデックは依然としてロッシーと考えられる。しかしながら、それは、平均又はピーク圧縮データレートが制約されたレベルに制限されなければならないアプリケーションについて「ハイブリッド」符号化方式を可能にする。これは、帯域幅制約に起因して完全ロスレス符号化が不可能であるオーディオのセクションについて、「ニアロスレス（near lossless）」符号化の動的な適用を伴う。「ニアロスレス」符号化は、高精細度オーディオ品質を維持し、最大２０ｋＨｚまでのオーディオ周波数と少なくとも１２０ｄＢのダイナミックレンジを保有する。その主な競合相手は、ソニーにより開発されたＬＤＡＣコーデックである。ａｐｔＸ－ＨＤにおける別のスケーラブルなパラメータは、符号化レイテンシである。それは、圧縮及び計算複雑性のレベルなどの他のパラメータに対して動的にトレードすることができる。

ＬＨＤＣは、低レイテンシ及び高精細度オーディオコーデック（low latency and high-definition audio codec）の略であり、Ｓａｖｉｔｅｃｈ社により発表されている。ＢｌｕｅｔｏｏｔｈＳＢＣオーディオフォーマットと比較し、ＬＨＤＣは、３倍を超えるデータを伝送できるようにして、最も現実的で高精細度のワイヤレスオーディオを提供し、無線オーディオデバイスと有線オーディオデバイスとの間にそれ以上オーディオ品質の不均衡のないことを達成することができる。伝送されるデータの増加により、ユーザは、より多くのディテールとより良い音場を体験し、音楽の情感に浸ることができる。しかしながら、多くの実際のアプリケーションでは、３倍を超えるＳＢＣデータレートは高すぎる可能性がある。

図１は、いくつかの実装によるＬ２ＨＣ（低遅延及び低複雑性ハイレゾリューションコーデック（Low delay & Low complexity High resolution Codec））エンコーダ１００の一例示的な構造を示す。図２は、いくつかの実装によるＬ２ＨＣデコーダ２００の一例示的な構造を示す。一般に、Ｌ２ＨＣは、合理的に低いビットレートで「透過的な」品質を提供することができる。いくつかの場合、エンコーダ１００及びデコーダ２００は、信号コーデックデバイス内に実装されてもよい。いくつかの場合、エンコーダ１００及びデコーダ２００は、異なるデバイスに実装されてもよい。いくつかの場合、エンコーダ１００及びデコーダ２００は、任意の適切なデバイスに実装されてもよい。いくつかの場合、エンコーダ１００及びデコーダ２００は、同じアルゴリズム遅延（例えば、同じフレームサイズ、又は同数のサブフレーム）を有してもよい。いくつかの場合、サンプルにおけるサブフレームサイズは固定することができる。例えば、サンプリングレートが９６ｋＨｚ又は４８ｋＨｚである場合、サブフレームサイズは１９２又は９６サンプルとすることができる。各フレームは、１、２、３、４、又は５つのサブフレームを有することができ、これらは、異なるアルゴリズム遅延に対応する。いくつかの例において、エンコーダ１００の入力サンプリングレートが９６ｋＨｚであるとき、デコーダ２００の出力サンプリングレートは９６ｋＨｚ又は４８ｋＨｚでもよい。いくつかの例において、サンプリングレートの入力サンプリングレートが４８ｋＨｚであるとき、デコーダ２００の出力サンプリングレートはさらに９６ｋＨｚ又は４８ｋＨｚでもよい。いくつかの場合、エンコーダ１００の入力サンプリングレートが４８ｋＨｚであり、デコーダ２００の出力サンプリングレートが９６ｋＨｚである場合に、ハイバンドが人工的に（artificially）追加される。

いくつかの例において、エンコーダ１００の入力サンプリングレートが８８．２ｋＨｚであるとき、デコーダ２００の出力サンプリングレートは８８．２ｋＨｚ又は４４．１ｋＨｚでもよい。いくつかの例において、エンコーダ１００の入力サンプリングレートが４４．１ｋＨｚであるとき、デコーダ２００の出力サンプリングレートはさらに８８．２ｋＨｚ又は４４．１ｋＨｚでもよい。同様に、エンコーダ１００の入力サンプリングレートが４４．１ｋＨｚであり、デコーダ２００の出力サンプリングレートが８８．２ｋＨｚであるとき、ハイバンドがさらに人工的に追加されてもよい。９６ｋＨｚ又は８８．２ｋＨｚの入力信号をエンコードするのは同じエンコーダである。さらに、４８ｋＨｚ又は４４．１ｋＨｚの入力信号をエンコードするのも同じエンコーダである。

いくつかの場合、Ｌ２ＨＣエンコーダ１００において、入力信号ビット深度は３２ｂ、２４ｂ、又は１６ｂでもよい。Ｌ２ＨＣデコーダ２００において、出力信号ビット深度も３２ｂ、２４ｂ、又は１６ｂでもよい。いくつかの場合、エンコーダ１００におけるエンコーダビット深度とデコーダ２００におけるデコーダビット深度は異なってもよい。

いくつかの場合、符号化モード（例えば、ＡＢＲ＿ｍｏｄｅ）はエンコーダ１００において設定することができ、実行中にリアルタイムで修正することができる。いくつかの場合、ＡＢＲ＿ｍｏｄｅ＝０は高ビットレートを示し、ＡＢＲ＿ｍｏｄｅ＝１は中ビットレートを示し、ＡＢＲ＿ｍｏｄｅ＝２は低ビットレートを示す。いくつかの場合、ＡＢＲ＿ｍｏｄｅ情報は、２ビットを費やすことによりビットストリームチャネルを通じてデコーダ２００に送ることができる。デフォルトのチャネル数は、それがＢｌｕｅｔｏｏｔｈイヤホンアプリケーションに関するとき、ステレオ（２つのチャネル）とすることができる。いくつかの例において、ＡＢＲ＿ｍｏｄｅ＝２の平均ビットレートは３７０～４００ｋｂｐｓでもよく、ＡＢＲ＿ｍｏｄｅ＝１の平均ビットレートは４５０～５５０ｋｂｐｓでもよく、ＡＢＲ＿ｍｏｄｅ＝０の平均ビットレートは５５０～７１０ｋｂｐｓでもよい。いくつかの場合、全てのケース／モードの最大瞬間ビットレートが９９０ｋｂｐｓ未満でもよい。

図１に示すように、エンコーダ１００は、プリエンファシス（pre-emphasis）フィルタ１０４、直交ミラーフィルタ（quadrature mirror filter、ＱＭＦ）分析フィルタバンク１０６、ローローバンド（low low band、ＬＬＢ）エンコーダ１１８、ローハイバンド（low high band、ＬＨＢ）エンコーダ１２０、ハイローバンド（high low band、ＨＬＢ）エンコーダ１２２、ハイハイバンド（high high band、ＨＨＢ）エンコーダ１２３、及びマルチプレクサ１２６を含む。元の入力デジタル信号１０２は、最初、プリエンファシスフィルタ１０４により予め強調される（pre-emphasized）。いくつかの場合、プリエンファシスフィルタ１０４は、定数ハイパスフィルタでもよい。プリエンファシスフィルタ１０４は、ほとんどの音楽信号が高周波数バンドエネルギーよりはるかに高い低周波数バンドエネルギーを含むため、ほとんどの音楽信号に有用である。高周波数バンドエネルギーの増加は、高周波数バンド信号の処理精度を高めることができる。

プリエンファシスフィルタ１０４の出力は、ＱＭＦ分析フィルタバンク１０６を通過して、４つのサブバンド信号、ＬＬＢ信号１１０、ＬＨＢ信号１１２、ＨＬＢ信号１１４、及びＨＨＢ信号１１６を生成する。一例において、元の入力信号は９６ｋＨｚのサンプリングレートで生成される。この例において、ＬＬＢ信号１１０は０～１２ｋＨｚのサブバンドを含み、ＬＨＢ信号１１２は１２～２４ｋＨｚのサブバンドを含み、ＨＬＢ信号１１４は２４～３６ｋＨｚのサブバンドを含み、ＨＨＢ信号１１６は３６～４８ｋＨｚのサブバンドを含む。図示のように、４つのサブバンド信号の各々は、ＬＬＢエンコーダ１１８、ＬＨＢエンコーダ１２０、ＨＬＢエンコーダ１２２、及びＨＨＢエンコーダ１２４によりそれぞれエンコードされて、エンコードされたサブバンド信号を生成する。４つのエンコードされたこれらは、マルチプレクサ１２６により多重化されて、エンコードされたオーディオ信号を生成することができる。

図２に示すように、デコーダ２００は、ＬＬＢデコーダ２０４、ＬＨＢデコーダ２０６、ＨＬＢデコーダ２０８、ＨＨＢデコーダ２１０、ＱＭＦ合成フィルタバンク２１２、後処理コンポーネント２１４、及びデエンファシス（de-emphasis）フィルタ２１６を含む。いくつかの場合、ＬＬＢデコーダ２０４、ＬＨＢデコーダ２０６、ＨＬＢデコーダ２０８、及びＨＨＢデコーダ２１０の各１つが、それぞれ、チャネル２０２からエンコードされたサブバンド信号を受信し、デコードされたサブバンド信号を生成することができる。４つのデコーダ２０４～２１０からのデコードされたサブバンド信号は、ＱＭＦ合成フィルタバンク２１２を通じて再び加算されて、出力信号を生成することができる。出力信号は、必要に応じて後処理コンポーネント２１４により後処理され、次いでデエンファシスフィルタ２１６により強調解除され（de-emphasized）て、デコードされたオーディオ信号２１８を生成することができる。いくつかの場合、デエンファシスフィルタ２１６は定数フィルタでもよく、エンファシスフィルタ１０４の逆フィルタでもよい。一例において、デコードされたオーディオ信号２１８は、エンコーダ１００の入力オーディオ信号（例えば、オーディオ信号１０２）と同じサンプリングレートでデコーダ２００により生成されてもよい。この例において、デコードされたオーディオ信号２１８は、９６ｋＨｚのサンプリングレートで生成される。

図３及び図４は、それぞれ、ＬＬＢエンコーダ３００及びＬＬＢデコーダ４００の例示的な構造を示す。図３に示すように、ＬＬＢエンコーダ３００は、高スペクトル傾き検出コンポーネント３０４、傾きフィルタ３０６、線形予測符号化（linear predictive coding、ＬＰＣ）分析コンポーネント３０８、逆ＬＰＣフィルタ３１０、長期予測（long-term prediction、ＬＴＰ）条件コンポーネント３１２、高ピッチ検出コンポーネント３１４、重み付けフィルタ３１６、高速ＬＴＰ寄与（fast LTP contribution）コンポーネント３１８、加算機能ユニット３２０、ビットレート制御コンポーネント３２２、初期残差量子化（initial residual quantization）コンポーネント３２４、ビットレート調整コンポーネント３２６、及び高速量子化最適化（fast quantization optimization）コンポーネント３２８を含む。

図３に示すように、ＬＬＢサブバンド信号３０２は、最初、スペクトル傾き検出コンポーネント３０４により制御される傾きフィルタ３０６を通過する。いくつかの場合、傾きフィルタリングされたＬＬＢ信号が、傾きフィルタ３０６により生成される。次いで、傾きフィルタリングされたＬＬＢ信号は、ＬＬＢサブバンド内のＬＰＣフィルタパラメータを生成するために、ＬＰＣ分析コンポーネント３０８によりＬＰＣ分析され得る。いくつかの場合、ＬＰＣフィルタパラメータは、量子化され、ＬＬＢデコーダ４００に送られてもよい。逆ＬＰＣフィルタ３１０を使用して、傾きフィルタリングされたＬＬＢ信号をフィルタリングし、ＬＬＢ残差信号を生成することができる。この残差信号ドメインにおいて、重み付けフィルタ３１６は、高ピッチ信号のために加えられる。いくつかの場合、重み付けフィルタ３１６は、高ピッチ検出コンポーネント３１４による高ピッチ検出に依存してオン又はオフに切り替えることができ、その詳細は後でより詳細に説明される。いくつかの場合、重み付きＬＬＢ残差信号を、重み付けフィルタ３１６により生成することができる。

図３に示すように、重み付きＬＬＢ残差信号は、参照信号となる。いくつかの場合、元の信号に強い周期性が存在するとき、ＬＴＰ（長期予測）寄与が、ＬＴＰ条件３１２に基づいて高速ＬＴＰ寄与コンポーネント３１８により導入され得る。エンコーダ３００において、ＬＴＰ寄与は、加算機能ユニット３２０により重み付きＬＬＢ残差信号から減算されて、第２の重み付きＬＬＢ残差信号を生成することができ、これは、初期ＬＬＢ残差量子化コンポーネント３２４の入力信号となる。いくつかの場合、初期ＬＬＢ残差量子化コンポーネント３２４の出力信号は、高速量子化最適化コンポーネント３２８により処理されて、量子化されたＬＬＢ残差信号３３０を生成することができる。いくつかの場合、量子化ＬＬＢ残差信号３３０はＬＴＰパラメータ（ＬＴＰが存在するとき）と共に、ビットストリームチャネルを通じてＬＬＢデコーダ４００に送られ得る。

図４は、ＬＬＢデコーダ４００の一例示的な構造を示す。図示のように、ＬＬＢデコーダ４００は、量子化残差コンポーネント４０６、高速ＬＴＰ寄与コンポーネント４０８、ＬＴＰ切り替えフラグコンポーネント４１０、加算機能ユニット４１４、逆重み付けフィルタ４１６、高ピッチフラグコンポーネント４２０、ＬＰＣフィルタ４２２、逆傾きフィルタ４２４、及び高スペクトル傾きフラグコンポーネント４２８を含む。いくつかの場合、量子化残差コンポーネント４０６からの量子化された残差信号と高速ＬＴＰ寄与コンポーネント４０８からのＬＴＰ寄与信号は、加算機能ユニット４１４により一緒に加算されて、逆重み付けフィルタ４１６への入力信号としての重み付きＬＬＢ残差信号を生成することができる。

いくつかの場合、逆重み付けフィルタ４１６を使用して、重み付けを除去し、ＬＬＢ量子化残差信号のスペクトル平坦性を回復することができる。いくつかの場合、回復されたＬＬＢ残差信号は、逆重み付けフィルタ４１６により生成され得る。回復されたＬＬＢ残差信号は、ＬＰＣフィルタ４２２により再度フィルタリングされて、信号ドメインにおけるＬＬＢ信号を生成することができる。いくつかの場合、傾きフィルタ（例えば、傾きフィルタ３０６）がＬＬＢエンコーダ３００に存在する場合、ＬＬＢデコーダ４００内のＬＬＢ信号は、高スペクトル傾きフラグコンポーネント４２８により制御される逆傾きフィルタ４２４によりフィルタリングされてもよい。いくつかの場合、デコードされたＬＬＢ信号４３０は、逆傾きフィルタ４２４により生成され得る。

図５及び図６は、ＬＨＢエンコーダ５００及びＬＨＢ６００デコーダの例示的な構造を示す。図５に示すように、ＬＨＢエンコーダ５００は、ＬＰＣ分析コンポーネント５０４、逆ＬＰＣフィルタ５０６、ビットレート制御コンポーネント５１０、初期残差量子化コンポーネント５１２、及び高速量子化最適化コンポーネント５１４を含む。いくつかの場合、ＬＨＢサブバンド信号５０２は、ＬＨＢサブバンド内のＬＰＣフィルタパラメータを生成するために、ＬＰＣ分析コンポーネント５０４によりＬＰＣ分析され得る。いくつかの場合、ＬＰＣフィルタパラメータは、量子化し、ＬＨＢデコーダ６００に送ることができる。ＬＨＢサブバンド信号５０２は、エンコーダ５００内の逆ＬＰＣフィルタ５０６によりフィルタリングされ得る。いくつかの場合、ＬＨＢ残差信号が、逆ＬＰＣフィルタ５０６により生成され得る。ＬＨＢ残差信号は、ＬＨＢ残差量子化の入力信号となり、初期残差量子化コンポーネント５１２及び高速量子化最適化コンポーネント５１４により処理されて、量子化されたＬＨＢ残差信号５１６を生成することができる。いくつかの場合、量子化ＬＨＢ残差信号５１６は、その後、ＬＨＢデコーダ６００に送られ得る。図６に示すように、ビット６０２から得られた量子化残差６０４は、ＬＨＢサブバンドのためのＬＰＣフィルタ６０６により処理されて、デコードされたＬＨＢ信号６０８を生成することができる。

図７及び図８は、ＨＬＢ及び／又はＨＨＢサブバンドのためのエンコーダ７００及びデコーダ８００の例示的な構造を示す。図示のように、エンコーダ７００は、ＬＰＣ分析コンポーネント７０４、逆ＬＰＣフィルタ７０６、ビットレート切り替えコンポーネント７０８、ビットレート制御コンポーネント７１０、残差量子化コンポーネント７１２、及びエネルギーエンベロープ（energy envelope）量子化コンポーネント７１４を含む。一般に、ＨＬＢとＨＨＢの双方が、比較的高い周波数領域に位置する。いくつかの場合、それらは２つの可能な方法でエンコード及びデコードされる。例えば、ビットレートが十分に高い（例えば、９６ｋＨｚ／２４ビットステレオ符号化に対して７００ｋｂｐｓより高い）場合、それらはＬＨＢのようにエンコード及びデコードされてもよい。一例において、ＨＬＢ又はＨＨＢサブバンド信号７０２は、ＨＬＢ又はＨＨＢサブバンド内のＬＰＣフィルタパラメータを生成するために、ＬＰＣ分析コンポーネント７０４によりＬＰＣ分析され得る。いくつかの場合、ＬＰＣフィルタパラメータは、量子化され、ＨＬＢ又はＨＨＢデコーダ８００に送られてもよい。ＨＬＢ又はＨＨＢサブバンド信号７０２は、逆ＬＰＣフィルタ７０６によりフィルタリングされて、ＨＬＢ又はＨＨＢ残差信号を生成することができる。ＨＬＢ又はＨＨＢ残差信号は、残差量子化のターゲット信号となり、残差量子化コンポーネント７１２により処理されて、量子化されたＨＬＢ又はＨＨＢ残差信号７１６を生成することができる。量子化ＨＬＢ又はＨＨＢ残差信号７１６は、その後、デコーダ側（例えば、デコーダ８００）に送られ、残差デコーダ８０６及びＬＰＣフィルタ８１２により処理されて、デコードされたＨＬＢ又はＨＨＢ信号８１４を生成することができる。

いくつかの場合、ビットレートが比較的低い（例えば、９６ｋＨｚ／２４ビットステレオ符号化に対して５００ｋｂｐｓより低い）場合、ＨＬＢ又はＨＨＢサブバンドのためのＬＰＣ分析コンポーネント７０４により生成されたＬＰＣフィルタのパラメータは依然として量子化され、デコーダ側（例えば、デコーダ８００）に送られ得る。しかしながら、ＨＬＢ又はＨＨＢ残差信号は、いかなるビットも費やすことなく生成されてもよく、残差信号の時間ドメインエネルギーエンベロープのみが量子化され、かなり低いビットレート（例えば、エネルギーエンベロープをエンコードするために３ｋｂｐｓ未満）でデコーダに送られる。一例において、エネルギーエンベロープ量子化コンポーネント７１４は、逆ＬＰＣフィルタからＨＬＢ又はＨＨＢ残差信号を受信し、出力信号を生成し、これはその後、デコーダ８００に送られ得る。次いで、エンコーダ７００からの出力信号は、エネルギーエンベロープデコーダ８０８及び残差生成コンポーネント８１０により処理されて、ＬＰＣフィルタ８１２への入力信号を生成することができる。いくつかの場合、ＬＰＣフィルタ８１２は、残差生成コンポーネント８１０からＨＬＢ又はＨＨＢ残差信号を受信し、デコードされたＨＬＢ又はＨＨＢ信号８１４を生成することができる。

図９は、高ピッチ信号の一例示的なスペクトル構造９００を示す。一般に、通常の発話信号は、比較的高いピッチのスペクトル構造を有することはまれである。しかしながら、音楽信号及び歌声信号は、高ピッチスペクトル構造をしばしば含む。図示のように、スペクトル構造９００は、比較的高い第１のハーモニック周波数（harmonic frequency）Ｆ０（例えば、Ｆ０＞５００Ｈｚ）と、比較的低い背景スペクトルレベルを含む。この場合、スペクトル構造９００を有するオーディオ信号は、高ピッチ信号とみなされてもよい。高ピッチ信号の場合、０ＨｚとＦ０との間の符号化誤差は、聴覚マスキング効果のないことに起因して容易に聴取され得る。誤差（例えば、Ｆ１とＦ２との間の誤差）は、Ｆ１及びＦ２のピークエネルギーが正しい限り、Ｆ１及びＦ２によりマスクされ得る。しかしながら、ビットレートが十分に高くない場合、符号化誤差は回避されない可能性がある。

いくつかの場合、ＬＴＰにおける正しい短ピッチ（高ピッチ）ラグを見つけることは、信号品質を改善するのに役立つ可能性がある。しかしながら、「透過的な」品質を達成するには十分でない可能性がある。ロバストな方法で信号品質を改善するために、適応的重み付けフィルタを導入することができ、これは、かなり低い周波数を強化し、より高い周波数において符号化誤差を増加させることを犠牲にしてかなり低い周波数における符号化誤差を低減する。いくつかの場合、適応的重み付けフィルタ（例えば、重み付けフィルタ３１６）は、以下のように一次極フィルタ（one order pole filter）とすることができる。

そして、逆重み付けフィルタ（例えば、逆重み付けフィルタ４１６）は、以下のように一次ゼロフィルタ（one order zero filter）とすることができる。

いくつかの場合、適応的重み付けフィルタは、高ピッチケースを改善するために示され得る。しかしながら、それは、他のケースでは品質を低減する可能性がある。したがって、いくつかの場合、適応的重み付けフィルタは、高ピッチケースの検出に基づいて（例えば、図３の高ピッチ検出コンポーネント３１４を使用して）オン及びオフに切り替えることができる。高ピッチ信号を検出するための多くの方法が存在する。１つの方法が、図１０を参照して以下で説明される。

図１０に示すように、現在のピッチゲイン１００２、平滑化ピッチゲイン１００４、ピッチラグ長１００６、及びスペクトル傾き１００８を含む４つのパラメータを高ピッチ検出コンポーネント１０１０により使用して、高ピッチ信号が存在するか否かを判定することができる。いくつかの場合、ピッチゲイン１００２は、信号の周期性を示す。いくつかの場合、平滑化ピッチゲイン１００４は、ピッチゲイン１００２の正規化された値を表す。一例において、正規化ピッチゲイン（例えば、平滑化ピッチゲイン１００４）が０と１との間である場合、正規化ピッチゲインの高い値（例えば、正規化ピッチゲインが１に近いとき）は、スペクトルドメインにおける強いハーモニックの存在を示してもよい。平滑化ピッチゲイン１００４は、周期性が（単に局所的でなく）安定していることを示し得る。いくつかの場合、ピッチラグ長１００６が短い（例えば、３ｍｓ未満である）場合、それは第１のハーモニック周波数Ｆ０が大きい（高い）ことを意味する。スペクトル傾き１００８は、ＬＰＣパラメータの第１の反射係数又は１サンプル距離におけるセグメント信号相関により測定され得る。いくつかの場合、スペクトル傾き１００８は、かなり低い周波数領域が有意なエネルギーを含むか否かを示すために使用されてもよい。かなり低い周波数領域（例えば、Ｆ０より低い周波数）のエネルギーが比較的高い場合、高ピッチ信号は存在しない可能性がある。いくつかの場合、高ピッチ信号が検出されたとき、重み付けフィルタが適用されてもよい。そうでない場合、高ピッチ信号が検出されないとき、重み付けフィルタは適用されなくてもよい。

図１１は、高ピッチ信号の知覚的重み付けを実行する一例示的な方法１１００を示すフローチャートである。いくつかの場合、方法１１００は、オーディオコーデックデバイス（例えば、ＬＬＢエンコーダ３００）により実施されてもよい。いくつかの場合、方法１１００は、任意の適切なデバイスにより実施することができる。

方法１１００はブロック１１０２で開始でき、これにおいて、信号（例えば、図１の信号１０２）が受信される。いくつかの場合、信号はオーディオ信号であり得る。いくつかの場合、信号は１つ以上のサブバンド成分を含み得る。いくつかの場合、信号は、ＬＬＢ成分、ＬＨＢ成分、ＨＬＢ成分、及びＨＨＢ成分を含んでもよい。一例において、信号は９６ｋＨｚのサンプリングレートで生成され、４８ｋＨｚの帯域幅を有し得る。この例において、信号のＬＬＢ成分は０～１２ｋＨｚのサブバンドを含んでもよく、ＬＨＢ成分は１２～２４ｋＨｚのサブバンドを含んでもよく、ＨＬＢ成分は２４～３６ｋＨｚのサブバンドを含んでもよく、ＨＨＢ成分は３６～４８ｋＨｚのサブバンドを含んでもよい。いくつかの場合、信号は、プリエンファシスフィルタ（例えば、プリエンファシスフィルタ１０４）及びＱＭＦ分析フィルタバンク（例えば、ＱＭＦ分析フィルタバンク１０６）により処理されて、４つのサブバンド内のサブバンド信号を生成することができる。この例では、４つのサブバンドについて、それぞれ、ＬＬＢサブバンド信号、ＬＨＢサブバンド信号、ＨＬＢサブバンド信号、及びＨＨＢサブバンド信号が生成され得る。

ブロック１１０４において、１つ以上のサブバンド信号のうち少なくとも１つの残差信号が、１つ以上のサブバンド信号のうち少なくとも１つに基づいて生成される。いくつかの場合、１つ以上のサブバンド信号のうち少なくとも１つは、傾きフィルタリングされて、傾きフィルタリングされた信号を生成することができる。一例において、１つ以上のサブバンド信号のうち少なくとも１つは、ＬＬＢサブバンド内のサブバンド信号（例えば、図３のＬＬＢサブバンド信号３０２）を含んでもよい。いくつかの場合、傾きフィルタリングされた信号は、逆ＬＰＣフィルタ（例えば、逆ＬＰＣフィルタ３１０）によりさらに処理されて、残差信号を生成することができる。

ブロック１１０６において、１つ以上のサブバンド信号のうち少なくとも１つは高ピッチ信号であることが決定される。いくつかの場合、１つ以上のサブバンド信号のうち少なくとも１つは、１つ以上のサブバンド信号のうち少なくとも１つの現在のピッチゲイン、平滑化ピッチゲイン、ピッチラグ長、又はスペクトル傾きのうち少なくとも１つに基づいて、高ピッチ信号であると決定される。

いくつかの場合、ピッチゲインは信号の周期性を示し、平滑化ピッチゲインはピッチゲインの正規化された値を表す。いくつかの例において、正規化されたピッチゲインは、０と１との間でもよい。これらの例において、正規化ピッチゲインの高い値（例えば、正規化ピッチゲインが１に近いとき）は、スペクトルドメインにおける強いハーモニックの存在を示してもよい。いくつかの場合、短いピッチラグ長は、第１のハーモニック周波数（例えば、図９の周波数Ｆ０９０６）が大きい（高い）ことを意味する。第１のハーモニック周波数Ｆ０が比較的高く（例えば、Ｆ０＞５００Ｈｚ）、背景スペクトルレベルが比較的低い（例えば、所定閾値を下回る）である場合、高ピッチ信号が検出され得る。いくつかの場合、スペクトル傾きは、ＬＰＣパラメータの第１の反射係数又は１つのサンプル距離におけるセグメント信号相関により測定され得る。いくつかの場合、スペクトル傾きは、かなり低い周波数領域が有意なエネルギーを含むか否かを示すために使用されてもよい。かなり低い周波数領域（例えば、Ｆ０より低い周波数）におけるエネルギーが比較的高い場合、高ピッチ信号は存在しない可能性がある。

ブロック１１０８において、１つ以上のサブバンド信号のうち少なくとも１つが高ピッチ信号であると決定したことに応答して、１つ以上のサブバンド信号のうち少なくとも１つの残差信号に対して重み付け演算が実行される。いくつかの場合、高ピッチ信号が検出されたとき、重み付けフィルタ（例えば、重み付けフィルタ３１６）が残差信号に適用され得る。いくつかの場合、重み付き残差信号が生成され得る。いくつかの場合、高ピッチ信号が検出されないとき、重み付け演算は実行されなくてもよい。

上述のように、高ピッチ信号の場合、低周波数領域における符号化誤差は、聴覚マスキング効果のないことに起因して知覚的に感知可能であり得る。ビットレートが十分に高くない場合、符号化誤差は回避されない可能性がある。適応的重み付けフィルタ（例えば、重み付けフィルタ３１６）及び本明細書に記載される重み付け方法は、低周波数領域において符号化誤差を低減し、信号品質を改善するために使用され得る。しかしながら、いくつかの場合、これは、より高い周波数における符号化誤差を増加させる可能性があり、これは、高ピッチ信号の知覚的品質に対して無意味な可能性がある。いくつかの場合、適応的重み付けフィルタは、高ピッチ信号の検出に基づいて条件付きでオン及びオフにされ得る。上述のように、重み付けフィルタは、高ピッチ信号が検出されたときオンにされてもよく、高ピッチ信号が検出されないときオフにされてもよい。このようにして、高ピッチでないケースの品質は損なわれない可能性があると同時に、高ピッチケースの品質は依然として改善され得る。

ブロック１１１０において、ブロック１１０８で生成された重み付き残差信号に基づいて量子化された残差信号が生成される。いくつかの場合、重み付き残差信号はＬＴＰ寄与と共に加算機能ユニットで処理されて、第２の重み付き残差信号を生成することができる。いくつかの場合、第２の重み付き残差信号は量子化されて、量子化残差信号を生成することができ、これは、デコーダ側（例えば、図４のＬＬＢデコーダ４００）にさらに送られ得る。

図１２及び図１３は、残差量子化エンコーダ１２００及び残差量子化デコーダ１３００の例示的な構造を示す。いくつかの例において、残差量子化エンコーダ１２００及び残差量子化デコーダ１３００は、ＬＬＢサブバンド内の信号を処理するために使用され得る。図示のように、残差量子化エンコーダ１２００は、エネルギーエンベロープ符号化コンポーネント１２０４、残差正規化コンポーネント１２０６、第１の大ステップ（large step）符号化コンポーネント１２１０、第１の微細ステップ（fine step）コンポーネント１２１２、ターゲット最適化コンポーネント１２１４、ビットレート調整コンポーネント１２１６、第２の大ステップ符号化コンポーネント１２１８、及び第２の微細ステップ符号化コンポーネント１２２０を含む。

図示のように、ＬＬＢサブバンド信号１２０２は、最初、エネルギーエンベロープ符号化コンポーネント１２０４により処理され得る。いくつかの場合、ＬＬＢ残差信号の時間ドメインエネルギーエンベロープが、エネルギーエンベロープ符号化コンポーネント１２０４により決定され、量子化され得る。いくつかの場合、量子化された時間ドメインエネルギーエンベロープは、デコーダ側（例えば、デコーダ１３００）に送られ得る。いくつかの例において、決定されたエネルギーエンベロープは、残差ドメインにおいて１２ｄＢ～１３２ｄＢのダイナミックレンジを有することができ、かなり低いレベル及びかなり高いレベルをカバーする。いくつかの場合、１つのフレーム内のあらゆるサブフレームが、１つのエネルギーレベル量子化を有し、フレーム内のピークサブフレームエネルギーは、ｄＢドメインにおいて直接符号化され得る。同じフレーム内の他のサブフレームエネルギーは、ピークエネルギーと現在のエネルギーとの間の差を符号化することにより、ハフマン符号化アプローチで符号化されてもよい。いくつかの場合、１つのサブフレーム継続時間が約２ｍｓほどに短い可能性があるため、エンベロープ精度は人間の耳のマスキング原理に基づいて許容できてもよい。

量子化時間ドメインエネルギーエンベロープを有した後、ＬＬＢ残差信号は、次いで、残差正規化コンポーネント１２０６により正規化され得る。いくつかの場合、ＬＬＢ残差信号は、量子化時間ドメインエネルギーエンベロープに基づいて正規化され得る。いくつかの例において、ＬＬＢ残差信号は、正規化されたＬＬＢ残差信号を生成するために、量子化時間ドメインエネルギーエンベロープで除算され（divided）得る。いくつかの場合、正規化ＬＬＢ残差信号は、初期量子化のための初期ターゲット信号１２０８として使用され得る。いくつかの場合、初期量子化は、符号化／量子化の２つの段階を含んでもよい。いくつかの場合、符号化／量子化の第１段階は大ステップハフマン符号化（large step Huffman coding）を含み、符号化／量子化の第２段階は微細ステップ一様符号化（fine step uniform coding）を含む。図示のように、正規化ＬＬＢ残差信号である初期ターゲット信号１２０８は、最初、大ステップハフマン符号化コンポーネント１２１０により処理され得る。ハイレゾリューションオーディオコーデックでは、あらゆる残差サンプルが量子化され得る。ハフマン符号化は、特別な量子化インデックス確率分布を利用することによりビットを節約することができる。いくつかの場合、残差量子化ステップサイズが十分大きいとき、量子化インデックス確率分布はハフマン符号化に適切なものとなる。いくつかの場合、大ステップ量子化からの量子化結果は、準最適（sub-optimal）であり得る。ハフマン符号化の後、より小さい量子化ステップで一様量子化が加えられ得る。図示のように、微細ステップ一様符号化コンポーネント１２１２は、大ステップハフマン符号化コンポーネント１２１０からの出力信号を量子化するために使用され得る。したがって、正規化ＬＬＢ残差信号の符号化／量子化の第１段階は、比較的大きい量子化ステップを選択し、なぜならば、量子化された符号化インデックスの特別な分布がより効率的なハフマン符号化をもたらすためであり、符号化／量子化の第２段階は、比較的小さい量子化ステップを用いて比較的簡素な一様符号化を使用して、第１段階の符号化／量子化からの量子化誤差をさらに低減する。

いくつかの場合、初期残差信号は、残差量子化が誤差を有さないか又は十分小さい誤差を有する場合、理想的なターゲット参照であり得る。符号化ビットレートが十分に高くない場合、符号化誤差は常に存在し、無意味でない可能性がある。したがって、この初期残差ターゲット参照信号１２０８は、量子化について知覚的に準最適であり得る。初期残差ターゲット参照信号１２０８は知覚的に準最適であるが、それは迅速な量子化誤差推定を提供することができ、これは、符号化ビットレートを（例えば、ビットレート調整コンポーネント１２１６により）調整するために使用され得るだけでなく、知覚的に最適化されたターゲット参照信号を構築するためにも使用され得る。いくつかの場合、知覚的に最適化されたターゲット参照信号は、初期残差ターゲット参照信号１２０８と初期量子化の出力信号（例えば、微細ステップ一様符号化コンポーネント１２１２の出力信号）に基づいて、ターゲット最適化コンポーネント１２１４により生成され得る。

いくつかの場合、最適化ターゲット参照信号は、現在のサンプルの誤差影響を最小化するだけでなく前のサンプル及び将来のサンプルの誤差影響も最小化する方法で構築されてもよい。さらに、それは、人間の耳の知覚的マスキング効果を考慮するためにスペクトルドメインにおける誤差分布を最適化することができる。

最適化ターゲット参照信号がターゲット最適化コンポーネント１２１４により構築された後、第１段階のハフマン符号化及び第２段階の一様符号化が再度実行されて、第１の（初期の）量子化結果を置き換え、より良好な知覚的品質を得ることができる。この例では、最適化ターゲット参照信号に対して第１の段階のハフマン符号化及び第２段階の一様符号化を実行するために、第２の大ステップハフマン符号化コンポーネント１２１８及び第２の微細ステップの一様符号化コンポーネント１２２０が使用され得る。初期ターゲット参照信号及び最適化ターゲット参照信号の量子化は、以下でより詳細に論じられる。

いくつかの例において、量子化されていない残差信号又は初期ターゲット残差信号は、ｒ_ｉ（ｎ）により表されてもよい。ターゲットとしてｒ_ｉ（ｎ）を使用し、残差信号は初期量子化されて、

として示される第１の量子化残差信号を得ることができる。ｒ_ｉ（ｎ）、

、及び知覚的重み付けフィルタのインパルス応答ｈ_ｗ（ｎ）に基づいて、知覚的に最適化されたターゲット残差信号ｒ_ｏ（ｎ）を評価することができる。ｒ_ｏ（ｎ）を更新又は最適化ターゲットとして使用し、残差信号は再度量子化されて、

として示される第２の量子化残差信号を得ることができ、これは、第１の量子化残差信号

を置き換えるために知覚的に最適化されている。いくつかの場合、ｈ_ｗ（ｎ）は、多くの可能な方法で、例えば、ＬＰＣフィルタに基づいてｈ_ｗ（ｎ）を推定することにより決定されてもよい。

いくつかの場合、ＬＬＢサブバンドのＬＰＣフィルタは、以下のように表され得る。

知覚的重み付きフィルタＷ（ｚ）は、次のように定義できる。

ここで、αは、定数係数であり、０＜α＜１である。γは、ＬＰＣフィルタの第１の反射係数、又は単に定数であり、－１＜γ＜１とすることができる。フィルタＷ（ｚ）のインパルス応答は、ｈ_ｗ（ｎ）として定義され得る。いくつかの場合、ｈ_ｗ（ｎ）の長さはαとγの値に依存する。いくつかの場合、αとγがゼロに近いとき、ｈ_ｗ（ｎ）の長さは短くなり、急速にゼロに減衰する。計算複雑性の観点から、短いインパルス応答ｈ_ｗ（ｎ）を有することが最適である。ｈ_ｗ（ｎ）が十分に短くない場合、それはハーフハミング窓（half-hamming window）又はハーフハニング窓（half-hanning window）と乗算されて、ｈ_ｗ（ｎ）を急速にゼロに減衰させることができる。インパルス応答ｈ_ｗ（ｎ）を有した後、知覚的重み付き信号ドメインにおけるターゲットは、次のように表され得る。

これは、ｒ_ｉ（ｎ）とｈ_ｗ（ｎ）の間の畳み込みである。知覚的重み付き信号ドメインにおける初期量子化された残差

の寄与は、次のように表すことができる。

残差ドメインにおける誤差は以下である。

これは、それが直接残差ドメインにおいて量子化されているとき最小化される。しかしながら、知覚的重み付き信号ドメインにおける誤差は以下である。

これは、最小化されない可能性がある。したがって、量子化誤差は、知覚的重み付き信号ドメインにおいて最小化される必要があり得る。いくつかの場合、全ての残差サンプルは連帯的に（jointly）量子化され得る。しかしながら、これは付加的な複雑さを引き起こす可能性がある。いくつかの場合、残差は、サンプルごと（sample by sample）の方法で量子化され得るが、知覚的に最適化され得る。例えば、現在のフレーム内の全てのサンプルについて、

が初期設定され得る。ｍでのサンプルが量子化されていないことを除き全てのサンプルが量子化されていると仮定し、今のｍでの知覚的に最良の値は、ｒ_ｉ（ｍ）でなく次のようになるはずである。

ここで、＜Ｔ_ｇ’（ｎ），ｈ_ｗ（ｎ）＞は、ベクトル｛Ｔ_ｇ’（ｎ）｝とベクトル｛ｈ_ｗ（ｎ）｝の間の相互相関を表し、ベクトル長は、インパルス応答ｈ_ｗ（ｎ）の長さに等しく、｛Ｔ_ｇ’（ｎ）｝のベクトル開始点はｍである。||ｈ_ｗ（ｎ）||は、ベクトル｛ｈ_ｗ（ｎ）｝のエネルギーであり、これは、同じフレーム内で一定のエネルギーである。Ｔ_ｇ’（ｎ）は、次のように表すことができる。

知覚的に最適化された新しいターゲット値ｒ_Ｏ（ｍ）がひとたび決定されると、それは再度量子化されて、大ステップハフマン符号化及び微細ステップ一様符号化を含む初期量子化と同様の方法で

を生成することができる。次いで、ｍは次のサンプル位置に移動する。上記処理はサンプルごとに繰り返され、一方、式（７）及び（８）は、全てのサンプルが最適に量子化されるまで新しい結果で更新される。各ｍについての各更新の間、

内のほとんどのサンプルは変更されないため、式（８）は再計算される必要がない。式（７）の分母は定数であり、そのため、除算は定数乗算になり得る。

図１３に示すように、デコーダ側では、大ステップハフマンデコーディング１３０２及び微細ステップ一様デコーディング１３０４からの量子化値が、加算機能ユニット１３０６により一緒に加算されて、正規化された残差信号を形成する。正規化残差信号は、時間ドメインにおいてエネルギエンベロープデコーディングコンポーネント１３０８により処理されて、デコードされた残差信号１３１０を生成することができる。

図１４は、信号の残差量子化を実行する一例示的な方法１４００を示すフローチャートである。いくつかの場合、方法１４００は、オーディオコーデックデバイス（例えば、ＬＬＢエンコーダ３００又は残差量子化エンコーダ１２００）により実施されてもよい。いくつかの場合、方法１４００は、任意の適切なデバイスにより実施することができる。

方法１４００はブロック１４０２で開始し、これにおいて、入力残差信号の時間ドメインエネルギーエンベロープが決定される。いくつかの場合、入力残差信号は、ＬＬＢサブバンド内の残差信号（例えば、ＬＬＢ残差信号１２０２）であり得る。

ブロック１４０４において、入力残差信号の時間ドメインエネルギーエンベロープが量子化されて、量子化された時間ドメインエネルギーエンベロープを生成する。いくつかの場合、量子化された時間ドメインエネルギーエンベロープは、デコーダ側（例えば、デコーダ１３００）に送られ得る。

ブロック１４０６において、入力残差信号が、量子化された時間ドメインエネルギーエンベロープに基づいて正規化されて、第１のターゲット残差信号を生成する。いくつかの場合、ＬＬＢ残差信号は、量子化された時間ドメインエネルギーエンベロープにより除算されて、正規化されたＬＬＢ残差信号を生成することができる。いくつかの場合、正規化されたＬＬＢ残差信号は、初期量子化のための初期ターゲット信号として使用され得る。

ブロック１４０８において、第１の量子化が第１のビットレート（bit rate）において第１のターゲット残差信号に対して実行されて、第１の量子化された残差信号を生成する。いくつかの場合、第１の残差量子化は、サブ量子化／符号化の２つの段階を含み得る。第１段階のサブ量子化は、第１の量子化ステップで第１のターゲット残差信号に対して実行されて、第１のサブ量子化出力信号を生成することができる。第２段階のサブ量子化は、第２の量子化ステップで第１のサブ量子化出力信号に対して実行されて、第１の量子化された残差信号を生成することができる。いくつかの場合、第１の量子化ステップは、サイズが第２の量子化ステップより大きい。いくつかの例において、第１段階のサブ量子化は大ステップハフマン符号化でもよく、第２段階のサブ量子化は微細ステップ一様符号化でもよい。

いくつかの場合、第１のターゲット残差信号は、複数のサンプルを含む。第１の量子化は、第１のターゲット残差信号に対してサンプルごとに実行されてもよい。いくつかの場合、これは量子化の複雑さを低減し得、それにより量子化効率を改善する。

ブロック１４１０において、第１の量子化された残差信号及び第１のターゲット残差信号に少なくとも基づいて、第２のターゲット残差信号が生成される。いくつかの場合、第２のターゲット残差信号は、第１のターゲット残差信号、第１の量子化された残差信号、及び知覚的重み付けフィルタのインパルス応答ｈ_ｗ（ｎ）に基づいて生成されてもよい。いくつかの場合、第２のターゲット残差信号である、知覚的に最適化されたターゲット残差信号が、第２の残差量子化のために生成され得る。

ブロック１４１２において、第２の残差量子化が、第２のビットレート（bit rate）において第２のターゲット残差信号に対して実行されて、第２の量子化された残差信号を生成する。いくつかの場合、第２のビットレートは、第１のビットレートと異なり得る。一例において、第２のビットレートは、第１のビットレートより高くてもよい。いくつかの場合、第１のビットレートにおける第１の残差量子化からの符号化誤差は、無意味でない可能性がある。いくつかの場合、符号化ビットレートは、符号化レートを低減するために、第２の残差量子化で調整（例えば、上昇）されてもよい。

いくつかの場合、第２の残差量子化は第１の残差量子化と同様である。いくつかの例において、第２の残差量子化もまた、サブ量子化／符号化の２つの段階を含んでもよい。これらの例において、第１段階のサブ量子化は、大きい量子化ステップで第２のターゲット残差信号に対して実行されて、サブ量子化出力信号を生成することができる。第２段階のサブ量子化は、小さい量子化ステップでサブ量子化出力信号に対して実行されて、第２の量子化された残差信号を生成することができる。いくつかの場合、第１段階のサブ量子化は大ステップハフマン符号化でもよく、第２段階のサブ量子化は微細ステップ一様符号化でもよい。いくつかの場合、第２の量子化された残差信号は、ビットストリームチャネルを通じてデコーダ側（例えば、デコーダ１３００）に送られ得る。

図３～図４に示すように、ＬＴＰは、より良好なＰＬＣのために条件付きでオン及びオフされてもよい。いくつかの場合、コーデックビットレートが透過的な品質を達成するほど十分に高くないとき、ＬＴＰは、周期的及びハーモニック信号に対してかなり有用である。ハイレゾリューションコーデックでは、ＬＴＰ適用のために２つの問題が解決される必要があり得る。（１）従来のＬＴＰは高サンプリングレート環境においてかなり高い計算複雑性のコストがかかる可能性があるため、計算複雑性を低減すべきである、及び（２）ＬＴＰはフレーム間相関を利用し、伝送チャネルでのパケットロスが発生したとき誤差伝搬を引き起こす可能性があるため、パケットロス隠蔽（packet loss concealment、ＰＬＣ）の悪影響は制限されるべきである。

いくつかの場合、ピッチラグ探索は、ＬＴＰに付加的な計算複雑性を加える。符号化効率を改善するために、ＬＴＰにおいてより効率的であることが望ましい可能性がある。ピッチラグ探索の一例示的なプロセスが、図１５～図１６を参照して以下に記載される。

図１５は、有声発話の一例を示し、ピッチラグ１５０２は、２つの隣接する周期サイクル間の距離（例えば、ピークＰ１とＰ２の間の距離）を表す。いくつかの音楽信号は、強い周期性を有するだけでなく、安定したピッチラグ（ほぼ一定のピッチラグ）も有することがある。

図１６は、より良好なパケットロス隠蔽のためにＬＴＰ制御を実行する一例示的なプロセス１６００を示す。いくつかの場合、プロセス１６００は、コーデックデバイス（例えば、エンコーダ１００、又はエンコーダ３００）により実施されてもよい。いくつかの場合、プロセス１６００は、任意の適切なデバイスにより実施されてもよい。プロセス１６００は、ピッチラグ（これは、略称で「ピッチ」と後述される）探索と、ＬＴＰ制御を含む。一般に、ピッチ探索は、多数のピッチ候補に起因して従来の方法では高サンプリングレートにおいて複雑になり得る。本明細書に記載されるプロセス１６００は、３つのフェーズ／ステップを含み得る。第１のフェーズ／ステップの間、信号（例えば、ＬＬＢ信号１６０２）は、周期性が主に低周波数領域にあるため、ローパスフィルリングされ得る（１６０４）。次いで、フィルタリングされた信号はダウンサンプリングされて、高速初期ラフピッチ探索（fast initial rough pitch searching）１６０８のための入力信号を生成することができる。一例において、ダウンサンプリングされた信号は、２ｋＨｚのサンプリングレートで生成される。低サンプリングレートにおけるピッチ候補の総数は高くないため、ラフピッチ探索結果は、低サンプリングレートでの全てのピッチ候補を探索することにより、高速な方法で得ることができる。いくつかの場合、初期ピッチ探索１６０８は、短い窓を用いた正規化相互相関（normalized cross-correlation）又は大きい窓を用いた自己相関（auto-correlation）を最大化する従来のアプローチを使用して行われてもよい。

初期ピッチ探索結果は比較的粗い可能性があるため、複数の初期ピッチの近傍（neighborhood）における相互相関アプローチによる微細（fine）探索は、高サンプリングレート（例えば、２４ｋＨｚ）において依然として複雑な可能性がある。したがって、第２のフェーズ／ステップ（例えば、高速微細ピッチ探索１６１０）の間、ピッチ精度は、単に低サンプリングレートでの波形ピーク位置を見ることにより波形ドメインにおいて増加され得る。次いで、第３のフェーズ／ステップ（例えば、最適化された微細ピッチ探索１６１２）の間、第２のフェーズ／ステップからの微細ピッチ探索結果は、高サンプリングレートで小さい探索範囲内で相互相関アプローチを用いて最適化され得る。

例えば、第１のフェーズ／ステップ（例えば、初期ピッチ探索１６０８）の間、初期ラフピッチ探索結果は、探索された全てのピッチ候補に基づいて得られてもよい。いくつかの場合、ピッチ候補近傍は、初期ラフピッチ探索結果に基づいて定義されてもよく、より精密なピッチ探索結果を得るために第２のフェーズ／ステップに使用されてもよい。第２のフェーズ／ステップ（例えば、高速微細ピッチ探索１６１０）の間、波形ピーク位置は、第１のフェーズ／ステップで決定されたとおりのピッチ候補に基づいて、及びピッチ候補近傍内で決定されてもよい。図１５に示す一例において、図１５の第１のピーク位置Ｐ１は、初期ピッチ探索結果から定義される限定された探索範囲（例えば、第１のフェーズ／ステップから約１５％の変動と決定されたピッチ候補近傍）内で決定されてもよい。図１５の第２のピーク位置Ｐ２は、同様の方法で決定されてもよい。Ｐ１とＰ２の間の位置差は、初期ピッチ推定よりはるかに精密なピッチ推定となる。いくつかの場合、第２のフェーズ／ステップから得られたより精密なピッチ推定値を使用して、最適化された微細ピッチラグを発見するために第３のフェーズ／ステップで使用できる第２のピッチ候補近傍、例えば、第２のフェーズ／ステップから約１５％の変動と決定されたピッチ候補近傍を定義することができる。第３のフェーズ／ステップ（例えば、最適化された微細ピッチ探索１６１２）の間、最適化された微細ピッチラグは、かなり小さい探索範囲（例えば、第２のピッチ候補近傍）内で正規化相互相関アプローチを用いて探索することができる。

いくつかの場合、ＬＴＰが常にオンである場合、ＰＬＣは、ビットストリームパケットが失われたときの有りうる誤差伝搬に起因して準最適な可能性がある。いくつかの場合、ＬＴＰは、それがオーディオ品質を効率的に改善でき、ＰＬＣに有意に影響を与えないとき、オンにされてもよい。実際には、ＬＴＰは、ピッチゲインが高く安定しているとき効率的であり得、これは、高周期性が（１フレームについてだけでなく）少なくともいくつかのフレームについて存続することを意味する。いくつかの場合、高周期性信号領域において、ＰＬＣは、ＰＬＣが常に周期性を使用して前の情報を現在の失われたフレームにコピーするとき、比較的簡素で、効率的である。いくつかの場合、安定したピッチラグは、さらに、ＰＬＣへの悪影響を低減し得る。安定したピッチラグは、ピッチラグ値が少なくともいくつかのフレームについて有意に変化しないことを意味し、おそらく近い将来の安定したピッチを結果としてもたらす。いくつかの場合、ビットストリームパケットの現在のフレームが失われたとき、ＰＬＣは、現在のフレームを回復するために前のピッチ情報を使用してもよい。したがって、安定ピッチラグは、ＰＬＣのための現在のピッチ推定に役立ち得る。

図１６を参照して例を続け、ＬＴＰをオン又はオフにすることを判断する前に、周期性検出１６１４及び安定性検出１６１６が実行される。いくつかの場合、ピッチゲインが安定して高く、ピッチラグが比較的安定しているとき、ＬＴＰがＯＮにされてもよい。例えば、ブロック１６１８に示すように、ピッチゲインは、高度に周期的かつ安定したフレームに対して設定されてもよい（例えば、ピッチゲインは、０．８より安定して高い）。いくつかの場合、図３を参照し、ＬＴＰ寄与信号が生成され、重み付き残差信号と組み合わせられて、残差量子化のための入力信号を生成することができる。一方、ピッチゲインが安定して高くなく、かつ／あるいはピッチラグが安定していない場合、ＬＴＰはＯＦＦにされてもよい。

いくつかの場合、ＬＴＰは、さらに、ビットストリームパケットが失われたときの有りうる誤差伝搬を回避するために、ＬＴＰが前にいくつかのフレームについてオンにされていた場合、１つ又は２つのフレームについてオフにされてもよい。一例において、ブロック１６２０に示すように、ピッチゲインは、例えば、ＬＴＰが前にいくつかのフレームについてオンにされていたとき、より良好なＰＬＣのために条件付きでゼロにリセットされ得る。いくつかの場合、ＬＴＰがオフにされているとき、可変ビットレート符号化システムにおいて、もう少し大きい符号化ビットレートが設定されてもよい。いくつかの場合、ＬＴＰがオンにされるよう判断されたとき、ブロック１６２２に示すように、ピッチゲイン及びピッチラグが量子化され、デコーダ側に送られ得る。

図１７は、オーディオ信号の例示的なスペクトログラム（spectrograms）を示す。図示のように、スペクトログラム１７０２は、オーディオ信号の時間－周波数プロットを示す。スペクトログラム１７０２は、多くのハーモニックを含むように示されており、これは、オーディオ信号の高周期性を示している。スペクトログラム１７０４は、オーディオ信号の元のピッチゲインを示す。ピッチゲインは、時間のほとんどで安定して高いように示されており、これもまた、オーディオ信号の高周期性を示している。スペクトログラム１７０６は、オーディオ信号の平滑化されたピッチゲイン（ピッチ相関）を示す。この例において、平滑化ピッチゲインは、正規化されたピッチゲインを表す。スペクトログラム１７０８は、ピッチラグを示し、スペクトログラム１７１０は、量子化されたピッチゲインを示す。ピッチラグは、時間のほとんどで比較的安定しているように示されている。図示のように、ピッチゲインは周期的にゼロにリセットされており、これは、誤差伝搬を回避するために、ＬＴＰがオフにされていることを示す。量子化ピッチゲインもまた、ＬＴＰがオフにされているときゼロに設定される。

図１８は、ＬＴＰを実行する一例示的な方法１８００を示すフローチャートである。いくつかの場合、方法１８００は、オーディオコーデックデバイス（例えば、ＬＬＢエンコーダ３００）により実施されてもよい。いくつかの場合、方法１８００は、任意の適切なデバイスにより実施することができる。

方法１８００はブロック１８０２で開始し、これにおいて、入力オーディオ信号が第１のサンプリングレートで受信される。いくつかの場合、オーディオ信号は、複数の第１のサンプルを含むことができ、複数の第１のサンプルは、第１のサンプルレートで生成される。一例において、複数の第１のサンプルは、９６ｋＨｚのサンプリングレートで生成されてもよい。

ブロック１８０４において、オーディオ信号がダウンサンプリングされる。いくつかの場合、オーディオ信号の複数の第１のサンプルがダウンサンプリングされて、第２のサンプリングレートで複数の第２のサンプルを生成することができる。いくつかの場合、第２のサンプリングレートは、第１のサンプリングレートより低い。この例において、複数の第２のサンプルは、２ｋＨｚのサンプリングレートで生成されてもよい。

ブロック１８０６において、第２のサンプリングレートにおいて第１のピッチラグが決定される。低サンプリングレートにおけるピッチ候補の総数は高くないため、ラフピッチ結果は、低サンプリングレートでの全てのピッチ候補を探索することにより高速な方法で得ることができる。いくつかの場合、第２のサンプリングレートにおける複数の第２のサンプルに基づいて、複数のピッチ候補が決定され得る。いくつかの場合、複数のピッチ候補に対して、第１のピッチラグが決定され得る。いくつかの場合、第１のピッチラグは、第１の窓を用いた正規化相互相関又は第２の窓を用いた自己相関を最大化することにより決定されてもよく、第２の窓は、第１の窓より大きい。

ブロック１８０８において、ブロック１８０６で決定された第１のピッチラグに基づいて、第２のピッチラグが決定される。いくつかの場合、第１のピッチラグに基づいて、第１の探索範囲が決定され得る。いくつかの場合、第１の探索範囲内で、第１のピーク位置と第２のピーク位置が決定され得る。いくつかの場合、第２のピッチラグは、第１のピーク位置及び第２のピーク位置に基づいて決定され得る。例えば、第１のピーク位置と第２のピーク位置との間の位置差を使用して、第２のピッチラグを決定してもよい。

ブロック１８１０において、ブロック１８０８で決定された第２のピッチラグに基づいて、第３のピッチラグが決定される。いくつかの場合、第２のピッチラグを使用して、ピッチ候補近傍を定義することができ、これは、最適化された微細ピッチラグの発見に使用できる。例えば、第２のピッチラグに基づいて、第２の探索範囲が決定されてもよい。いくつかの場合、第３のピッチラグは、第３のサンプリングレートで第２の探索範囲内で決定され得る。いくつかの場合、第３のサンプリングレートは、第２のサンプリングレートより高い。この例において、第３のサンプリングレートは２４ｋＨｚでもよい。いくつかの場合、第３のピッチラグは、第３のサンプリングレートで第２の探索範囲内で正規化相互相関アプローチを使用して決定されてもよい。いくつかの場合、第３のピッチラグは、入力オーディオ信号のピッチラグとして決定され得る。

ブロック１８１２において、少なくとも所定数のフレームについて、入力オーディオ信号のピッチゲインが所定閾値を超えたこと、及び入力オーディオ信号のピッチラグの変化が所定範囲内であったことが決定される。ＬＴＰは、ピッチゲインが高く安定しているとき、より効率的であり得、これは、高周期性が（１フレームについてだけでなく）少なくともいくつかのフレームについて存続することを意味する。いくつかの場合、安定したピッチラグは、さらに、ＰＬＣへの悪影響を低減し得る。安定したピッチラグは、ピッチラグ値が少なくともいくつかのフレームについて有意に変化しないことを意味し、おそらく近い将来の安定したピッチを結果としてもたらす。

ブロック１８１４において、少なくとも所定数の前のフレームについて、入力オーディオ信号のピッチゲインが所定閾値を超えたこと、及び第３のピッチラグの変化が所定範囲内であったことを決定したことに応答して、入力オーディオ信号の現在のフレームに対してピッチゲインが設定される。したがって、ピッチゲインは、高度に周期的かつ安定したフレームに対して設定されて、ＰＬＣに影響を与えずに信号品質を改善する。

いくつかの場合、少なくとも所定数の前のフレームについて、入力オーディオ信号のピッチゲインが所定閾値を下回っていること、及び／又は第３のピッチラグの変化が所定範囲内でなかったことを決定したことに応答して、ピッチゲインは、入力オーディオ信号の現在のフレームに対してゼロに設定される。したがって、誤差伝搬が低減され得る。

上述のように、ハイレゾリューションオーディオコーデックでは、あらゆる残差サンプルが量子化される。これは、フレームサイズが１０ｍｓから２ｍｓに変わるとき、残差サンプル量子化の計算複雑性及び符号化ビットレートは有意に変化しない可能性があることを意味する。しかしながら、ＬＰＣなどのいくつかのコーデックパラメータの計算複雑性と符号化ビットレートは、フレームサイズが１０ｍｓから２ｍｓに変わるとき、劇的に増加する可能性がある。通常、ＬＰＣパラメータは、フレーム毎に量子化され、送信される必要がある。いくつかの場合、現在のフレームと前のフレームとの間のＬＰＣ差分符号化はビットを節約する可能性があるが、それはビットストリームパケットが伝送チャネルで失われたとき誤差伝搬を引き起こす可能性もある。したがって、低遅延コーデックを達成するために、短いフレームサイズが設定され得る。いくつかの場合、フレームサイズが２ｍｓのように短いとき、フレーム時間継続時間はビットレート又は複雑性の分母であるため、ＬＰＣパラメータの符号化ビットレートはかなり高くなり得、計算複雑性もまた高くなり得る。

図１２に示す時間ドメインエネルギーエンベロープ量子化を参照する一例において、サブフレームサイズが２ミリ秒である場合、１０ミリ秒のフレームは５つのサブフレームを含むべきである。通常、各サブフレームは、量子化される必要のあるエネルギーレベルを有する。１つのフレームが５つのサブフレームを含むので、５つのサブフレームのエネルギーレベルは、時間ドメインエネルギーエンベロープの符号化ビットレートが制限されるように連帯的に量子化されてもよい。いくつかの場合、フレームサイズがサブフレームサイズに等しく、あるいは１つのフレームが１つのサブフレームを含むとき、符号化ビットレートは、各エネルギーレベルが独立して量子化される場合、有意に増加する可能性がある。これらの場合、連続フレーム間のエネルギーレベルの差分符号化は、符号化ビットレートを低減し得る。しかしながら、そのようなアプローチは、ビットストリームパケットが伝送チャネルで失われたときそれが誤差伝搬を引き起こす可能性があるため、準最適であり得る。

いくつかの場合、ＬＰＣパラメータのベクトル量子化は、より低いビットレートをもたし得る。しかしながら、それは、さらなる計算負荷を要する可能性がある。ＬＰＣパラメータの簡素なスカラー量子化は、より低い複雑性を有し得るが、より高いビットレートを必要とし得る。いくつかの場合、ハフマン符号化から利益を得る特別なスカラー量子化が使用されてもよい。しかしながら、この方法は、かなり短いフレームサイズ又はかなり低い遅延符号化には十分でない可能性がある。ＬＰＣパラメータの新しい量子化方法が、図１９～図２０を参照して以下で説明される。

ブロック１９０２において、オーディオ信号の現在のフレームと前のフレームとの間の差分スペクトル傾き及びエネルギー差のうち少なくとも１つが決定される。図２０を参照し、スペクトログラム２００２は、オーディオ信号の時間－周波数プロットを示している。スペクトログラム２００４は、オーディオ信号の現在のフレームと前のフレームとの間の差分スペクトル傾きの絶対値を示す。スペクトログラム２００６は、オーディオ信号の現在のフレームと前のフレームとの間のエネルギー差の絶対値を示す。スペクトログラム２００８は、コピー判断を示しており、１は、現在のフレームが前のフレームから量子化されたＬＰＣパラメータをコピーすることを示し、０は、現在のフレームがＬＰＣパラメータを再度量子化／送信することを意味する。この例において、差分スペクトル傾き及びエネルギー差の双方の絶対値は、ほとんどの時間の間、比較的かなり小さく、それらは、終わり（右側）で比較的大きくなる。

ブロック１９０４において、オーディオ信号の安定性が検出される。いくつかの場合、オーディオ信号のスペクトル安定性は、オーディオ信号の現在のフレームと前のフレームとの間の差分スペクトル傾き及び／又はエネルギー差に基づいて決定され得る。いくつかの場合、オーディオ信号のスペクトル安定性は、さらに、オーディオ信号の周波数に基づいて決定されてもよい。いくつかの場合、差分スペクトル傾きの絶対値は、オーディオ信号のスペクトルに基づいて決定され得る（例えば、スペクトログラム２００４）。いくつかの場合、オーディオ信号の現在のフレームと前のフレームとの間のエネルギー差の絶対値もまた、オーディオ信号のスペクトルに基づいて決定されてもよい（例えば、スペクトログラム２００６）。いくつかの場合、差分スペクトル傾きの絶対値の変化及び／又はエネルギー差の絶対値の変化が、少なくとも所定数のフレームについて所定範囲内であったと決定された場合、オーディオ信号のスペクトル安定性が検出されたと決定されてもよい。

ブロック１９０６において、オーディオ信号のスペクトル安定性を検出したことに応答して、前のフレームのための量子化されたＬＰＣパラメータが、オーディオ信号の現在のフレームにコピーされる。いくつかの場合、オーディオ信号のスペクトルがかなり安定しており、それがあるフレームから次のフレームへ意味あるように変化しないとき、現在のフレームのための現在のＬＰＣパラメータは、符号化／量子化されなくてもよい。その代わりに、前の量子化されたＬＰＣパラメータが現在のフレームにコピーされてもよく、なぜならば、量子化されていないＬＰＣパラメータは、前のフレームから現在のフレームへ、ほぼ同じ情報を保持するためである。このような場合、量子化されたＬＰＣパラメータが前のフレームからコピーされていることをデコーダに伝えるために、１ビットのみが送られてもよく、現在のフレームに対してかなり低いビットレートとかなり低い複雑性を結果としてもたらす。

オーディオ信号のスペクトル安定性が検出されない場合、ＬＰＣパラメータは、再度量子化及び符号化されるように強制され得る。いくつかの場合、オーディオ信号の現在のフレームと前のフレームとの間の差分スペクトル傾きの絶対値の変化が、少なくとも所定数のフレームについて所定範囲内でなかったと決定された場合、オーディオ信号のスペクトル安定性が検出されないと決定されてもよい。いくつかの場合、エネルギー差の絶対値の変化が少なくとも所定数のフレームについて所定範囲内でなかったと決定された場合、オーディオ信号のスペクトル安定性が検出されないと決定されてもよい。

ブロック１９０８において、量子化されたＬＰＣパラメータが現在のフレームの前の少なくとも所定数のフレームについてコピーされたことが決定される。いくつかの場合、量子化されたＬＰＣパラメータがいくつかのフレームについてコピーされた場合、ＬＰＣパラメータは、再度量子化及び符号化されるように強制されてもよい。

ブロック１９１０において、量子化されたＬＰＣパラメータが少なくとも所定数のフレームについてコピーされたと決定したことに応答して、現在のフレームのためのＬＰＣパラメータに対して量子化が実行される。いくつかの場合、量子化されたＬＰＣパラメータをコピーするための連続フレームの数は、ビットストリームパケットが伝送チャネルで失われたときの誤差伝搬を回避するために制限される。

いくつかの場合、ＬＰＣコピーの判断（スペクトログラム２００８に示される）は、時間ドメインエネルギーエンベロープの量子化に役立ち得る。いくつかの場合、コピー判断が１であるとき、現在のフレームと前のフレームとの間の差分エネルギーレベルが符号化されて、ビットを節約してもよい。いくつかの場合、コピー判断が０であるとき、エネルギーレベルの直接量子化が実行されて、ビットストリームパケットが伝送チャネルで失われたときの誤差伝搬を回避してもよい。

図２１は、一実装による、本開示に記載される電子デバイス２１００の一例示的な構造を示す図である。電子デバイス２１００は、１つ以上のプロセッサ２１０２、メモリ２１０４、エンコーディング回路２１０６、及びデコーディング回路２１０８を含む。いくつかの実装において、電子デバイス２１００は、本開示に記載されるステップのうち任意の１つ又は組み合わせを実行するための１つ以上の回路をさらに含むことができる。

記載された主題事項の実装は、１つ以上の特徴を単独で又は組み合わせて含むことができる。

第１の実装において、長期予測（ＬＴＰ）を実行する方法が、少なくとも所定数のフレームについての入力オーディオ信号のピッチゲイン及びピッチラグを決定するステップと、少なくとも上記所定数のフレームについて、上記入力オーディオ信号の上記ピッチゲインが所定閾値を超えたこと、及び上記入力オーディオ信号の上記ピッチラグの変化が所定範囲内であったことを決定するステップと、少なくとも上記所定数のフレームについて、上記入力オーディオ信号のピッチゲインが上記所定閾値を超えたこと、及び上記ピッチラグの上記変化が上記所定範囲内であったことを決定したことに応答して、上記入力オーディオ信号の現在のフレームに対してピッチゲインを設定してパッケージロス隠蔽（package loss concealment、ＰＬＣ）を改善するステップと、を含む。

前述及び他の記載の実装は各々、任意で、以下の特徴の１つ以上を含むことができる。

第１の特徴は、以下の特徴のうち任意のものと組み合わせ可能であり、当該方法は、複数の第１のサンプルを含む上記入力オーディオ信号を受信するステップであり、上記複数の第１のサンプルは第１のサンプリングレートで生成される、ステップと、上記複数の第１のサンプルをダウンサンプリングして第２のサンプリングレートで複数の第２のサンプルを生成するステップであり、上記第２のサンプリングレートは上記第１のサンプリングレートより低い、ステップと、上記第２のサンプリングレートにおける上記複数の第２のサンプルに基づいて複数のピッチ候補を決定するステップと、上記複数のピッチ候補に基づいて第１のピッチラグを決定するステップと、をさらに含む。

第２の特徴は、前の又は以下の特徴のうち任意のものと組み合わせ可能であり、上記複数のピッチ候補に基づいて上記第１のピッチラグを決定するステップは、第１の窓を用いた正規化相互相関又は第２の窓を用いた自己相関を最大化することにより上記第１のピッチラグを決定するステップを含み、上記第２の窓は上記第１の窓より大きい。

第３の特徴は、前の又は以下の特徴のうち任意のものと組み合わせ可能であり、当該方法は、上記決定された第１のピッチラグに基づいて第１の探索範囲を決定するステップと、上記第１の探索範囲内で第１の波形ピーク位置及び第２の波形ピーク位置を決定するステップと、上記第１の波形ピーク位置及び上記第２の波形ピーク位置に基づいて第２のピッチラグを決定するステップと、をさらに含む。

第４の特徴は、前の又は以下の特徴のうち任意のものと組み合わせ可能であり、当該方法は、上記第２のピッチラグに基づいて第２の探索範囲を決定するステップと、第３のサンプリングレートで上記第２の探索範囲内で第３のピッチラグを決定するステップであり、上記第３のサンプリングレートは上記第２のサンプリングレートより高い、ステップと、上記入力オーディオ信号の上記ピッチラグを上記第３のピッチラグとして決定するステップと、をさらに含む。

第５の特徴は、前の又は以下の特徴のうち任意のものと組み合わせ可能であり、上記第３のサンプリングレートで上記第２の探索範囲内で上記第３のピッチラグを決定するステップは、上記第３のサンプリングレートで上記第２の探索範囲内で正規化相互相関アプローチを使用して上記第３のピッチラグを決定するステップを含む。

第６の特徴は、前の又は以下の特徴のうち任意のものと組み合わせ可能であり、当該方法は、少なくとも上記所定数のフレームについて、上記入力オーディオ信号の上記ピッチゲインが上記所定閾値を下回ること、又は上記ピッチラグの上記変化が上記所定範囲内でなかったことのうち少なくとも１つを決定したことに応答して、上記入力オーディオ信号の上記現在のフレームに対してピッチゲインをゼロに設定してＰＬＣを改善するステップ、をさらに含む。

第７の特徴は、前の又は以下の特徴のうち任意のものと組み合わせ可能であり、当該方法は、上記入力オーディオ信号の上記ピッチゲインが少なくとも上記所定数のフレームについて上記所定閾値より連続的に高いこと、又は上記ピッチラグの上記変化が少なくとも上記所定数のフレームについて上記所定範囲内であったことのうち少なくとも１つを決定したことに応答して、上記入力オーディオ信号の上記現在のフレームに対してピッチゲインをゼロに人工的にリセットしてＰＬＣを改善するステップ、をさらに含む。

第１の特徴は、以下の特徴のうち任意のものと組み合わせ可能であり、上記１つ以上のハードウェアプロセッサはさらに上記命令を実行して、複数の第１のサンプルを含む上記入力オーディオ信号を受信し、上記複数の第１のサンプルは第１のサンプリングレートで生成され、上記複数の第１のサンプルをダウンサンプリングして第２のサンプリングレートで複数の第２のサンプルを生成し、上記第２のサンプリングレートは上記第１のサンプリングレートより低く、上記第２のサンプリングレートにおける上記複数の第２のサンプルに基づいて複数のピッチ候補を決定し、上記複数のピッチ候補に基づいて第１のピッチラグを決定する。

第２の特徴は、前の又は以下の特徴のうち任意のものと組み合わせ可能であり、上記複数のピッチ候補に基づいて上記第１のピッチラグを決定することは、第１の窓を用いた正規化相互相関又は第２の窓を用いた自己相関を最大化することにより上記第１のピッチラグを決定することを含み、上記第２の窓は上記第１の窓より大きい。

第３の特徴は、前の又は以下の特徴のうち任意のものと組み合わせ可能であり、上記１つ以上のハードウェアプロセッサはさらに上記命令を実行して、上記決定された第１のピッチラグに基づいて第１の探索範囲を決定し、上記第１の探索範囲内で第１の波形ピーク位置及び第２の波形ピーク位置を決定し、上記第１の波形ピーク位置及び上記第２の波形ピーク位置に基づいて第２のピッチラグを決定する。

第４の特徴は、前の又は以下の特徴のうち任意のものと組み合わせ可能であり、上記１つ以上のハードウェアプロセッサはさらに上記命令を実行して、上記第２のピッチラグに基づいて第２の探索範囲を決定し、第３のサンプリングレートで上記第２の探索範囲内で第３のピッチラグを決定し、上記第３のサンプリングレートは上記第２のサンプリングレートより高く、上記入力オーディオ信号の上記ピッチラグを上記第３のピッチラグとして決定する。

第５の特徴は、前の又は以下の特徴のうち任意のものと組み合わせ可能であり、上記第３のサンプリングレートで上記第２の探索範囲内で上記第３のピッチラグを決定することは、上記第３のサンプリングレートで上記第２の探索範囲内で正規化相互相関アプローチを使用して上記第３のピッチラグを決定することを含む。

第６の特徴は、前の又は以下の特徴のうち任意のものと組み合わせ可能であり、上記１つ以上のハードウェアプロセッサはさらに上記命令を実行して、少なくとも上記所定数のフレームについて、上記入力オーディオ信号の上記ピッチゲインが上記所定閾値を下回ること、又は上記ピッチラグの上記変化が上記所定範囲内でなかったことのうち少なくとも１つを決定したことに応答して、上記入力オーディオ信号の上記現在のフレームに対してピッチゲインをゼロに設定してＰＬＣを改善する。

第７の特徴は、前の特徴のうち任意のものと組み合わせ可能であり、上記１つ以上のハードウェアプロセッサはさらに上記命令を実行して、上記入力オーディオ信号の上記ピッチゲインが少なくとも上記所定数のフレームについて上記所定閾値より連続的に高いこと、又は上記ピッチラグの上記変化が少なくとも上記所定数のフレームについて上記所定範囲内であったことのうち少なくとも１つを決定したことに応答して、上記入力オーディオ信号の上記現在のフレームに対してピッチゲインをゼロに人工的にリセットしてＰＬＣを改善する。

第１の特徴は、以下の特徴のうち任意のものと組み合わせ可能であり、上記動作は、複数の第１のサンプルを含む上記入力オーディオ信号を受信することであり、上記複数の第１のサンプルは第１のサンプリングレートで生成される、ことと、上記複数の第１のサンプルをダウンサンプリングして第２のサンプリングレートで複数の第２のサンプルを生成することであり、上記第２のサンプリングレートは上記第１のサンプリングレートより低い、ことと、上記第２のサンプリングレートにおける上記複数の第２のサンプルに基づいて複数のピッチ候補を決定することと、上記複数のピッチ候補に基づいて第１のピッチラグを決定することと、をさらに含む。

第３の特徴は、前の又は以下の特徴のうち任意のものと組み合わせ可能であり、上記動作は、上記決定された第１のピッチラグに基づいて第１の探索範囲を決定することと、上記第１の探索範囲内で第１の波形ピーク位置及び第２の波形ピーク位置を決定することと、上記第１の波形ピーク位置及び上記第２の波形ピーク位置に基づいて第２のピッチラグを決定することと、をさらに含む。

第４の特徴は、前の又は以下の特徴のうち任意のものと組み合わせ可能であり、上記動作は、上記第２のピッチラグに基づいて第２の探索範囲を決定することと、第３のサンプリングレートで上記第２の探索範囲内で第３のピッチラグを決定することであり、上記第３のサンプリングレートは上記第２のサンプリングレートより高い、ことと、上記入力オーディオ信号の上記ピッチラグを上記第３のピッチラグとして決定することと、をさらに含む。

第６の特徴は、前の又は以下の特徴のうち任意のものと組み合わせ可能であり、上記動作は、少なくとも上記所定数のフレームについて、上記入力オーディオ信号の上記ピッチゲインが上記所定閾値を下回ること、又は上記ピッチラグの上記変化が上記所定範囲内でなかったことのうち少なくとも１つを決定したことに応答して、上記入力オーディオ信号の上記現在のフレームに対してピッチゲインをゼロに設定してＰＬＣを改善すること、をさらに含む。

第７の特徴は、前の特徴のうち任意のものと組み合わせ可能であり、上記動作は、上記入力オーディオ信号の上記ピッチゲインが少なくとも上記所定数のフレームについて上記所定閾値より連続的に高いこと、又は上記ピッチラグの上記変化が少なくとも上記所定数のフレームについて上記所定範囲内であったことのうち少なくとも１つを決定したことに応答して、上記入力オーディオ信号の上記現在のフレームに対してピッチゲインをゼロに人工的にリセットしてＰＬＣを改善すること、をさらに含む。

本開示においていくつかの実施形態が提供されたが、開示されたシステム及び方法は、本開示の主旨又は範囲から逸脱することなく多くの他の特定の形態で具現化され得ることが理解され得る。本例は、限定的なものでなく例示的なものとみなされるべきであり、その意図は、本明細書に与えられた詳細に限定されるものではない。例えば、様々な要素又はコンポーネントが別のシステムに組み合わせられ又は統合されてもよく、あるいは、特定の特徴が省略されてもよく、又は実装されなくてもよい。

さらに、様々な実施形態において個別又は別個として記載及び例示された手法、システム、サブシステム、及び方法は、本開示の範囲から逸脱することなく他のシステム、コンポーネント、手法、又は方法と組み合わせられ又は統合され得る。変更、置換、及び改変の他の例は当業者により確認可能であり、本明細書に開示された主旨及び範囲から逸脱することなく行われ得る。

本発明の実施形態及び本明細書に記載された機能動作の全ては、デジタル電子回路で、又は本明細書に開示された構造及びそれらの構造的同等物を含むコンピュータソフトウェア、ファームウェア、若しくはハードウェアで、又はこれらの１つ以上の組み合わせで実施され得る。本発明の実施形態は、１つ以上のコンピュータプログラム製品、すなわち、データ処理装置による実行のため又はデータ処理装置の動作を制御するためにコンピュータ読取可能媒体上にエンコードされたコンピュータプログラム命令の１つ以上のモジュールとして実施されてもよい。コンピュータ読取可能媒体は、非一時的コンピュータ読取可能記憶媒体、マシン読取可能記憶デバイス、マシン読取可能記憶基板、メモリデバイス、マシン読取可能伝搬信号に影響を与える物質の組成、又はこれらの１つ以上の組み合わせでもよい。用語「データ処理装置」は、例えば、プログラマブルプロセッサ、コンピュータ、又は複数のプロセッサ若しくはコンピュータを含む、データを処理するための全ての装置、デバイス、及びマシンを包含する。装置は、ハードウェアに加えて、問題のコンピュータプログラムのための実行環境を作り出すコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、又はこれらの１つ以上の組み合わせを構成するコードを含んでもよい。伝搬信号は、人工的に生成された信号、例えば、適切な受信器装置への送信のために情報をエンコードするために生成されるマシン生成の電気、光、又は電磁信号である。

コンピュータプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、又はコードとしても知られる）は、コンパイル型又はインタプリタ型言語を含む任意の形式のプログラミング言語で書かれてよく、それは、スタンドアロンプログラムとして、又はコンピューティング環境での使用に適したモジュール、コンポーネント、サブルーチン、若しくは他のユニットとしてを含む、任意の形態でデプロイされてよい。コンピュータプログラムは、必ずしもファイルシステム内のファイルに対応するわけではない。プログラムは、他のプログラム又はデータを保持するファイルの一部分（例えば、マークアップ言語文書に記憶される１つ以上のスクリプト）に、問題のプログラム専用の単一ファイルに、又は複数の協調ファイル（例えば、１つ以上のモジュール、サブプログラム、又はコードの部分を記憶するファイル）に記憶されてもよい。コンピュータプログラムは、１つのコンピュータ上で、又は複数のコンピュータ上で実行されるようにデプロイされてもよく、該複数のコンピュータは、１つのサイトに配置され、又は複数のサイトにわたり分散され、通信ネットワークにより相互接続される。

本明細書に記載されるプロセス及び論理フローは、入力データに対して動作し出力を生成することにより機能を実行するために１つ以上のコンピュータプログラムを実行する１つ以上のプログラマブルプロセッサにより実行されてもよい。プロセス及び論理フローはさらに、専用論理回路、例えば、ＦＰＧＡ（フィールドプログラマブルゲートアレイ）又はＡＳＩＣ（特定用途向け集積回路）により実行されてもよく、装置が、専用論理回路、例えば、ＦＰＧＡ（フィールドプログラマブルゲートアレイ）又はＡＳＩＣ（特定用途向け集積回路）として実装されてもよい。

コンピュータプログラムの実行に適したプロセッサは、例えば、汎用及び専用双方のマイクロプロセッサ、並びに任意の種類のデジタルコンピュータの任意の１つ以上のプロセッサを含む。一般に、プロセッサは、読取専用メモリ若しくはランダムアクセスメモリ又は双方から命令及びデータを受信する。コンピュータの必須要素は、命令を実行するプロセッサと、命令及びデータを記憶する１つ以上のメモリデバイスである。一般に、コンピュータはさらに、データを記憶する１つ以上の大容量記憶デバイス、例えば、磁気、磁気光ディスク、又は光ディスクを含み、あるいはこれらからデータを受信し又はこれらにデータを転送するために動作上結合され、あるいは双方をなす。しかしながら、コンピュータは、そのようなデバイスを有する必要はない。さらに、コンピュータは、別のデバイス、例えば、いくつか例を挙げるとタブレットコンピュータ、携帯電話、パーソナルデジタルアシスタント（ＰＤＡ）、モバイルオーディオプレーヤ、グローバルポジショニングシステム（ＧＰＳ）受信機に埋め込まれてもよい。コンピュータプログラム命令及びデータを記憶するのに適したコンピュータ読取可能媒体は、例として、半導体メモリデバイス、例えば、ＥＰＲＯＭ、ＥＥＰＲＯＭ、及びフラッシュメモリデバイス；磁気ディスク、例えば、内部ハードディスク又はリムーバブルディスク；光磁気ディスク；並びにＣＤＲＯＭ及びＤＶＤ－ＲＯＭディスクを含む、全ての形態の不揮発性メモリ、媒体、及びメモリデバイスを含む。プロセッサ及びメモリは、専用論理回路により補足され、あるいはこれに組み込まれてもよい。

ユーザとの対話を提供するために、本発明の実施形態は、ユーザに情報を表示するディスプレイデバイス、例えば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）モニタと、ユーザがコンピュータに入力を提供することができるキーボード及びポインティングデバイス、例えば、マウス又はトラックボールとを有するコンピュータ上で実施されてもよい。他の種類のデバイスを使用して、ユーザとの対話を同様に提供してもよく、例えば、ユーザに提供されるフィードバックは、任意の形式の感覚フィードバック、例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバックでもよく、ユーザからの入力は、音響、発話、又は触覚入力を含む任意の形式で受けてもよい。

本発明の実施形態は、コンピューティングシステムにおいて実施されてもよく、該コンピューティングシステムは、バックエンドコンポーネント、例えば、データサーバを含み、あるいはミドルウェアコンポーネント、例えば、アプリケーションサーバを含み、あるいはフロントエンドコンポーネント、例えば、ユーザが本発明の実装と対話することができるグラフィカルユーザインターフェース又はウェブブラウザを有するクライアントコンピュータを含み、あるいは１つ以上のこのようなバックエンド、ミドルウェア、又はフロントエンドコンポーネントの任意の組み合わせである。システムのコンポーネントは、デジタルデータ通信の任意の形態又は媒体、例えば通信ネットワークにより相互接続されてもよい。通信ネットワークの例は、ローカルエリアネットワーク（「ＬＡＮ」）及びワイドエリアネットワーク（「ＷＡＮ」）、例えばインターネットを含む。

コンピューティングシステムは、クライアント及びサーバを含んでもよい。クライアントとサーバは、一般に、互いに離れており、通常、通信ネットワークを介して対話する。クライアントとサーバの関係は、それぞれのコンピュータ上で実行され、互いにクライアント－サーバ関係を有するコンピュータプログラムによって生じる。

いくつかの実装が上記で詳細に説明されたが、他の修正が可能である。例えば、クライアントアプリケーションは、デリゲートにアクセスするものとして説明されているが、他の実装において、デリゲートは、１つ以上のプロセッサにより実装される他のアプリケーション、例えば、１つ以上のサーバ上で実行されるアプリケーションなどにより用いられてもよい。さらに、図に示された論理フローは、所望の結果を達成するために、図示された特定の順序又は順番を必要としない。さらに、他のアクションが提供されてもよく、あるいはアクションが記述されたフローから消去されてもよく、他のコンポーネントが記述されたシステムに追加され、又は記述されたシステムから除去されてもよい。したがって、他の実装は、以下の特許請求の範囲の範囲内にある。

本明細書は多くの具体的な実装詳細を含むが、これらは、いずれかの発明の又は請求され得るものの範囲に対する限定とみなされるべきではなく、むしろ、特定の発明の特定の実施形態に特有であり得る特徴の説明とみなされるべきである。別個の実施形態の文脈において本明細書に記載される特定の特徴は、単一の実施形態において組み合わせて実施することもできる。逆に、単一の実施形態の文脈において記載される様々な特徴は、複数の実施形態において別個に、又は任意の適切なサブコンビネーションで実施することもできる。さらに、特徴は、特定の組み合わせにおいて作用するものとして上述され、さらには最初にそのようなものとして請求されることがあるが、請求された組み合わせからの１つ以上の特徴を、いくつかの場合に組み合わせから切り取ることができ、請求された組み合わせは、サブコンビネーション又はサブコンビネーションのバリエーションに向けられてもよい。

同様に、図面には特定の順序で動作が示されているが、これは、所望の結果を達成するために、このような動作を図示された特定の順序で又は順番に実行すること、又は、例示された全ての動作を実行することを要求するものとして理解されるべきではない。特定の状況では、マルチタスキング及び並列処理が有利であり得る。さらに、上述の実施形態における様々なシステムモジュール及びコンポーネントの分離は、全ての実施形態においてそのような分離を要求するものとして理解されるべきでなく、説明されたプログラムコンポーネント及びシステムは、一般に、単一のソフトウェア製品に一緒に統合でき、又は複数のソフトウェア製品にパッケージ化できることを理解されたい。

主題事項の特定の実施形態が説明された。他の実施形態が以下の特許請求の範囲の範囲内である。例えば、特許請求の範囲に記載されたアクションは異なる順序で実行され、依然として所望の結果を達成することができる。一例として、添付の図面に示されたプロセスは、所望の結果を達成するために、図示された特定の順序又は順番を必ずしも必要としない。特定の実装では、マルチタスキング及び並列処理が有利であり得る。

Claims

長期予測（ＬＴＰ）を実行するための、コンピュータにより実施される方法であって、
入力オーディオ信号の現在のフレームの前の複数のフレームについて、前記入力オーディオ信号のピッチゲイン及びピッチラグを決定するステップと、
前記複数のフレームについて、前記入力オーディオ信号の前記ピッチゲインが所定閾値を超えたこと、及び前記入力オーディオ信号の前記ピッチラグの変化が所定範囲内であったことを決定するステップと、
前記複数のフレームについて、前記入力オーディオ信号のピッチゲインが前記所定閾値を超えたこと、及び前記ピッチラグの前記変化が前記所定範囲内であったことを決定したことに応答して、前記入力オーディオ信号の前記現在のフレームに対してピッチゲインを設定してパケットロス隠蔽（ＰＬＣ）を改善するステップと、
を含む、コンピュータにより実施される方法。
複数の第１のサンプルを含む前記入力オーディオ信号を受信するステップであり、前記複数の第１のサンプルは第１のサンプリングレートで生成される、ステップと、
前記複数の第１のサンプルをダウンサンプリングして第２のサンプリングレートで複数の第２のサンプルを生成するステップであり、前記第２のサンプリングレートは前記第１のサンプリングレートより低い、ステップと、
前記第２のサンプリングレートにおける前記複数の第２のサンプルに基づいて複数のピッチ候補を決定するステップと、
前記複数のピッチ候補に基づいて第１のピッチラグを決定するステップと、
をさらに含む請求項１に記載のコンピュータにより実施される方法。
前記複数のピッチ候補に基づいて前記第１のピッチラグを決定するステップは、第１の窓を用いた正規化相互相関又は第２の窓を用いた自己相関を最大化することにより前記第１のピッチラグを決定するステップを含み、前記第２の窓は前記第１の窓より大きい、請求項２に記載のコンピュータにより実施される方法。
前記決定された第１のピッチラグに基づいて第１の探索範囲を決定するステップと、
前記第１の探索範囲内で第１の波形ピーク位置及び第２の波形ピーク位置を決定するステップと、
前記第１の波形ピーク位置及び前記第２の波形ピーク位置に基づいて第２のピッチラグを決定するステップと、
をさらに含む請求項２に記載のコンピュータにより実施される方法。
前記第２のピッチラグに基づいて第２の探索範囲を決定するステップと、
第３のサンプリングレートで前記第２の探索範囲内で第３のピッチラグを決定するステップであり、前記第３のサンプリングレートは前記第２のサンプリングレートより高い、ステップと、
前記入力オーディオ信号の前記ピッチラグを前記第３のピッチラグとして決定するステップと、
をさらに含む請求項４に記載のコンピュータにより実施される方法。
前記第３のサンプリングレートで前記第２の探索範囲内で前記第３のピッチラグを決定するステップは、前記第３のサンプリングレートで前記第２の探索範囲内で正規化相互相関アプローチを使用して前記第３のピッチラグを決定するステップを含む、請求項５に記載のコンピュータにより実施される方法。
前記複数のフレームについて、前記入力オーディオ信号の前記ピッチゲインが前記所定閾値を下回ること、又は前記ピッチラグの前記変化が前記所定範囲内でなかったことのうち少なくとも１つを決定したことに応答して、前記入力オーディオ信号の前記現在のフレームに対してピッチゲインをゼロに設定してＰＬＣを改善するステップ、
をさらに含む請求項１に記載のコンピュータにより実施される方法。
前記入力オーディオ信号の前記ピッチゲインが前記複数のフレームについて前記所定閾値より連続的に高いこと、又は前記ピッチラグの前記変化が前記複数のフレームについて前記所定範囲内であったことのうち少なくとも１つを決定したことに応答して、前記入力オーディオ信号の前記現在のフレームに対してピッチゲインをゼロに人工的にリセットしてＰＬＣを改善するステップ、
をさらに含む請求項１に記載のコンピュータにより実施される方法。
電子デバイスであって、
命令を含む非一時的メモリ記憶装置と、
前記メモリ記憶装置と通信する１つ以上のハードウェアプロセッサと、を含み、
前記１つ以上のハードウェアプロセッサは前記命令を実行して、
入力オーディオ信号の現在のフレームの前の複数のフレームについて、前記入力オーディオ信号のピッチゲイン及びピッチラグを決定し、
前記複数のフレームについて、前記入力オーディオ信号の前記ピッチゲインが所定閾値を超えたこと、及び前記入力オーディオ信号の前記ピッチラグの変化が所定範囲内であったことを決定し、
前記複数のフレームについて、前記入力オーディオ信号のピッチゲインが前記所定閾値を超えたこと、及び前記ピッチラグの前記変化が前記所定範囲内であったことを決定したことに応答して、前記入力オーディオ信号の前記現在のフレームに対してピッチゲインを設定してパケットロス隠蔽（ＰＬＣ）を改善する、
電子デバイス。
前記１つ以上のハードウェアプロセッサはさらに前記命令を実行して、
複数の第１のサンプルを含む前記入力オーディオ信号を受信し、前記複数の第１のサンプルは第１のサンプリングレートで生成され、
前記複数の第１のサンプルをダウンサンプリングして第２のサンプリングレートで複数の第２のサンプルを生成し、前記第２のサンプリングレートは前記第１のサンプリングレートより低く、
前記第２のサンプリングレートにおける前記複数の第２のサンプルに基づいて複数のピッチ候補を決定し、
前記複数のピッチ候補に基づいて第１のピッチラグを決定する、
請求項９に記載の電子デバイス。
前記複数のピッチ候補に基づいて前記第１のピッチラグを決定することは、第１の窓を用いた正規化相互相関又は第２の窓を用いた自己相関を最大化することにより前記第１のピッチラグを決定することを含み、前記第２の窓は前記第１の窓より大きい、請求項１０に記載の電子デバイス。
前記１つ以上のハードウェアプロセッサはさらに前記命令を実行して、
前記決定された第１のピッチラグに基づいて第１の探索範囲を決定し、
前記第１の探索範囲内で第１の波形ピーク位置及び第２の波形ピーク位置を決定し、
前記第１の波形ピーク位置及び前記第２の波形ピーク位置に基づいて第２のピッチラグを決定する、
請求項１０に記載の電子デバイス。
前記１つ以上のハードウェアプロセッサはさらに前記命令を実行して、
前記第２のピッチラグに基づいて第２の探索範囲を決定し、
第３のサンプリングレートで前記第２の探索範囲内で第３のピッチラグを決定し、前記第３のサンプリングレートは前記第２のサンプリングレートより高く、
前記入力オーディオ信号の前記ピッチラグを前記第３のピッチラグとして決定する、
請求項１２に記載の電子デバイス。
前記第３のサンプリングレートで前記第２の探索範囲内で前記第３のピッチラグを決定することは、前記第３のサンプリングレートで前記第２の探索範囲内で正規化相互相関アプローチを使用して前記第３のピッチラグを決定することを含む、請求項１３に記載の電子デバイス。
前記１つ以上のハードウェアプロセッサはさらに前記命令を実行して、
前記複数のフレームについて、前記入力オーディオ信号の前記ピッチゲインが前記所定閾値を下回ること、又は前記ピッチラグの前記変化が前記所定範囲内でなかったことのうち少なくとも１つを決定したことに応答して、前記入力オーディオ信号の前記現在のフレームに対してピッチゲインをゼロに設定してＰＬＣを改善する、
請求項９に記載の電子デバイス。
前記１つ以上のハードウェアプロセッサはさらに前記命令を実行して、
前記入力オーディオ信号の前記ピッチゲインが前記複数のフレームについて前記所定閾値より連続的に高いこと、又は前記ピッチラグの前記変化が前記複数のフレームについて前記所定範囲内であったことのうち少なくとも１つを決定したことに応答して、前記入力オーディオ信号の前記現在のフレームに対してピッチゲインをゼロに人工的にリセットしてＰＬＣを改善する、
請求項９に記載の電子デバイス。
プログラムを記録したコンピュータ読取可能記憶媒体であって、前記プログラムはコンピュータに請求項１乃至８のうちいずれか１項に記載の方法を実行させる、コンピュータ読取可能記憶媒体。
コンピュータに請求項１乃至８のうちいずれか１項に記載の方法を実行させるように構成されたコンピュータプログラム。