JP2015519615A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2015519615A5 JP2015519615A5 JP2015516683A JP2015516683A JP2015519615A5 JP 2015519615 A5 JP2015519615 A5 JP 2015519615A5 JP 2015516683 A JP2015516683 A JP 2015516683A JP 2015516683 A JP2015516683 A JP 2015516683A JP 2015519615 A5 JP2015519615 A5 JP 2015519615A5
- Authority
- JP
- Japan
- Prior art keywords
- signal
- output
- audio
- lossless
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005070 sampling Methods 0.000 claims description 69
- 230000005236 sound signal Effects 0.000 claims description 53
- 238000007906 compression Methods 0.000 claims description 35
- 230000000875 corresponding Effects 0.000 claims description 28
- 238000007493 shaping process Methods 0.000 claims description 22
- 238000001914 filtration Methods 0.000 claims description 7
- 230000003068 static Effects 0.000 claims description 7
- 230000002441 reversible Effects 0.000 claims description 4
- RZVAJINKPMORJF-UHFFFAOYSA-N p-acetaminophenol Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 claims 7
- 238000010586 diagram Methods 0.000 description 12
- 238000000034 method Methods 0.000 description 12
- 239000002131 composite material Substances 0.000 description 11
- 230000000694 effects Effects 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000006011 modification reaction Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000003139 buffering Effects 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 241001442055 Vipera berus Species 0.000 description 2
- 230000003044 adaptive Effects 0.000 description 2
- 230000000996 additive Effects 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000000051 modifying Effects 0.000 description 2
- 230000003595 spectral Effects 0.000 description 2
- 230000001360 synchronised Effects 0.000 description 2
- 241000287523 Ara Species 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000001808 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Description
本発明は、デジタルオーディオ信号に関し、特に標準PCM再生との互換性を持つ損失のない帯域幅拡張スキームに関する。
多くのオーディオ愛好家やミュージシャンが、現行媒体の44.1kHz又は48kHzよりもかなり高い平均周波数でサンプリングされ、かつ16ビットよりも多いビット数の分解能で量子化されたオーディオであると通常は理解される、「高分解能」デジタルオーディオを要望している。
損失のある圧縮がなされたオーディオは、需要者市場でありふれたものであるが、経験は、「透明」であると主張されるシステムの経験でさえも、損失のある圧縮がなされたオーディオに対する疑問へと、多くの人々を導いてきた。1つの例外は、一定のビット深度への、単純な、非適応的な、ノイズシェーピングされ、ディザリングされた、再量子化である。適切な注意を払えば、これは、(入力と出力との間の差違の1次及び2次の統計に従い、)一定のノイズを付加することに等しい(J. Vanderkooy and S. P. Lipshitz, “Digital Dither: Signal Processing with Resolution Far below the Least Significant Bit” in Proc. AES 7th Int. Conf. on Audio in Digital Times (Toronto, Ont., Canada, 1989), pp. 87-96.参照)。そのようなノイズは、アナログ媒体及びデジタル媒体の双方における数十年にわたる経験の結果、「良性」であると考えられている。
2つの音楽配布媒体が大量消費市場で優勢である。1つはコンパクトディスク(CD)であり、これは、44.1kHzのサンプリング周波数と、16ビットのビット深度とを持つ。他の1つはインターネットダウンロードであり、これは、一般にコンピュータ又はパーソナルプレーヤを通じて聞かれる。大抵のダウンロードは損失のある圧縮がなされているが、コンピュータ又はプレーヤは、ほぼ必ず、44.1kHz及び48kHzのサンプリング周波数で非圧縮のPCM(Pulse Code Modulation)信号を扱うことができる。多くは24ビットのビット深度を扱うことができるが、いくつかのパーソナルプレーヤは16ビットに制限されている。
オーディオ愛好家バージョン(一般に96kHzのサンプリング周波数を持つ)と、大量消費市場プレーヤで再生可能なフォーマットとの双方でオーディオ録音を発行することは、商業的には魅力がない。標準大量消費市場プレーヤで再生可能な録音でありながら、特別なデコーダが追加の帯域幅を再生することを可能にする隠れた情報をも含む録音を発行する可能性が、過去に何度も探られてきた(MITSUYA KOMAMURA “Wide-Band and Wide-Dynamic-Range Recording and Reproduction of Digital Audio” J.Audio Eng. soc. Vol.43, No.1/2,1995 January/Februaryを含む)。しかしながら、今までのところ、オリジナルの高サンプリングレート信号の、損失のない再生への要求に注意を向けつつも、いすれも標準PCM再生互換性を提供していない。また、2つの異なるビット深度(例えば16ビットプレーヤと24ビットプレーヤとの双方)で、デコーダがリスナに如何にして最適な経験を提供するかという問題を、いずれも考えてこなかった。
国際公開第2007/128662号には、エンコードされた損失のあるデータストリームと、損失のない拡張データストリームとを用いた、ソース信号の損失のないエンコードのための方法及び装置が開示されている。他の文献(M van der Veen et al: “High Capacity Reversible Watermarking for Audio”, Security and Watermarking of Multimedia Contents V, Proceedings of SPIE-IS&T Electronic Imaging, SPIE vol. 5020, 1 January 2003, pages 1-11)には、入力信号のダイナミックレンジが制限され、かつウォーターマークビットのエンコードに不使用部分のビットが用いられる、デジタルオーディオ信号のための可逆的なウォーターマーク技術が記載されている。
本発明の第1の観点によれば、損失のないオーディオエンコーダは、第1のサンプリングレートで入力デジタルオーディオ信号を受け取り、かつ、それから、複数のサンプルを有しかつ第1のサンプリングレートよりも低い第2のサンプリングレートを持つPCMデジタルオーディオ出力を生成するように構成され、
複数のサンプルの各々は、上位部分と下位部分とを持ち、
上位部分と下位部分とは、いずれも、第1のデコーダが損失なしで入力デジタルオーディオ信号を再生できるようにする情報を含み、
標準PCMストリームとして解釈されたとき、上位部分は、低減された帯域幅を持つ入力デジタルオーディオ信号のバージョンの損失のある表現を提供し、
上位部分は、前記低減された帯域幅よりも大きい帯域幅を持つ入力デジタルオーディオ信号の損失のある表現を第2のデコーダが再生できるようにする情報を含み、
入力デジタルオーディオ信号は、高周波数出力と低周波数出力とを持つ損失のない帯域分割器に結合され、高周波数出力は、損失のある圧縮出力と復元出力とを持つ圧縮ユニットに結合され、
上位部分は、低周波数出力及び損失のある圧縮出力に応じて引き出され、下位部分は、復元出力に応じて引き出される。
複数のサンプルの各々は、上位部分と下位部分とを持ち、
上位部分と下位部分とは、いずれも、第1のデコーダが損失なしで入力デジタルオーディオ信号を再生できるようにする情報を含み、
標準PCMストリームとして解釈されたとき、上位部分は、低減された帯域幅を持つ入力デジタルオーディオ信号のバージョンの損失のある表現を提供し、
上位部分は、前記低減された帯域幅よりも大きい帯域幅を持つ入力デジタルオーディオ信号の損失のある表現を第2のデコーダが再生できるようにする情報を含み、
入力デジタルオーディオ信号は、高周波数出力と低周波数出力とを持つ損失のない帯域分割器に結合され、高周波数出力は、損失のある圧縮出力と復元出力とを持つ圧縮ユニットに結合され、
上位部分は、低周波数出力及び損失のある圧縮出力に応じて引き出され、下位部分は、復元出力に応じて引き出される。
本発明での使用のために設計されたものでない標準『遺産』PCM再生装置は、一般に、ここでは『上位部分』と称される、一般に44.1kHz又は48kHzの第2のサンプリングレートでサンプリングされたオーディオストリームの各サンプルの上位16ビットのみを受け取り又は再生し、およそ0〜20kHzの帯域幅で損失のある表現をリスナへ提供する。第2のデコーダは、同じ16ビットの44.1kHz又は48kHzストリームから、拡張された帯域幅が再生されることを可能にする。第1のデコーダは、一般に、24ビットストリームを受け取り、かつ、各サンプルの『下位部分』へ、すなわち16番目を超えるビットへもアクセスすることを見込んでいる。この追加情報は、88kHz又は96kHzのような、第1の、より高いサンプリングレートで、そして0〜40kHzのような、より広いオーディオ帯域幅を持つ、入力オーディオ信号の損失のない再生が提供されることを可能にする。
以下の説明では、復元出力又は復元信号が、修整出力又は修整信号として、より口語的な表現として参照されることがある。
好ましくは、第1の損失のある表現は、時不変のフィルタリング効果と、サンプリングレートの低減効果と、時不変のノイズフロアを課す再量子化効果とを除いて、入力デジタルオーディオ信号の正確な表現である。もしサンプリングレートの低減を伴う量子化を含む全ての量子化が、一定のビット深度に対してかつ適切なディザを伴って実行されるならば、『損失のある』表現は、CD品質と同等の標準的な表現であり得て、数年前にも『オーディオ愛好家』向けの再生と考えられたであろう。これは、スペクトル的なノイズフロアと時折入力信号に応じた帯域幅とを動的に採用する、伝統的な『損失のあるコーデック』と対照的である。
好ましくは、圧縮ユニットは、損失のある圧縮出力に結合された出力を持つ、損失のある圧縮ユニットを備える。
損失のない帯域分割器は、オリジナル信号スペクトラムの一般には二半部の取り扱いを分割し、下半部はPCMとして伝達され、上半部は圧縮されたフォーマットで伝達されるための鍵である。
ある実施形態では、各上位部分は、16バイナリビットからなる。ある実施形態では、各下位部分は、8バイナリビットからなる。
ある実施形態では、第2のサンプリングレートは、第1のサンプリングレートの半分である。特に好ましい第2のサンプリングレートは、48kHz及び44.1kHzを含む。
本発明のエンコーダでは、第2のデコーダは、第1のサンプリングレートに対応するナイキスト周波数に等しいオーディオ帯域幅を再生し得る。あるいは、第2のデコーダは、第1のサンプリングレートに対応するナイキスト周波数の4分の3に等しい帯域幅を再生し得る。
「ナイキスト周波数」という用語は、デジタルシステムのサンプリングレートの半分を意味するものと、通常は理解されている。したがって、一般に、第1のサンプリングレートは96kHzであり、第2のサンプリングレートは48kHzであり、第1のサンプリングレートに対応するナイキスト周波数もまた48kHzであって、第2のデコーダは、48kHzであるナイキスト周波数までの信号の損失のある再生を提供する。他の構成は、第2のデコーダが36kHzまでの損失のある再生を提供することを可能にする。その利点は、0〜24kHzの範囲でノイズフロアが若干低い点にある。
ある実施形態では、圧縮ユニットは、損失のある圧縮ユニットに結合された入力と、復元出力に結合された出力とを持つ、損失のない圧縮ユニットを更に備える。損失のない圧縮器は、最下位ユニットにおけるビットの使用を最適化する。あるいは、もし修整出力が既に圧縮された形式又は『パックされた』形式であれば、別個の損失のない圧縮器は不要である。
下位部分は、帯域分割器の低周波数出力に応じても引き出され得る。これは、帯域分割器の低周波数出力の全体が上位部分中に伝達された場合よりも精密に量子化されたオリジナル信号を、第1のデコーダが損失なしで再生することを可能にする。
好ましくは、損失のない帯域分割器の低周波数出力は、上位部分に結合された第1の出力と、下位部分に結合された第2の出力とを持つ分割器に結合されている。好ましくは、分割器は、ノイズシェーピングフィルタを備える。分割器は、帯域分割器のLF出力の量子化されかつ好ましくはノイズシェーピングされた表現を上位部分へ提供する。一方、その第2の出力は、量子化により除去された情報を第1のデコーダが再生することを可能にする。
ある実施形態では、上位部分の中の複数のビットは、損失のない帯域分割器の低周波数出力に結合された第1の入力と、損失のある圧縮ユニットの圧縮出力に結合された第2の入力とを持つ減算器の出力に応じて引き出されることが好ましい。上位部分は、第2のデコーダの動作をサポートするために、圧縮出力を含まなければならない。しかしながら、圧縮出力は、オーディオ信号ではなくでデータ信号であって、減算器の目的は、遺産装置により再生されたオーディオ信号への、このデータ信号の効果を補償することにある。
本発明の第2の観点によれば、第1の観点による損失のないオーディオエンコーダに結合されたノイズシェーパを備えた装置が提供される。通常、このノイズシェーパは、96kHzで動作して、48kHzのサンプリング周波数にて24ビット出力ワードの制約下で、入力信号が損失なしで伝達されるように、エンコーダへの入力信号のワード幅を低減する。
本発明の第3の観点によれば、ウォーターマーク出力を供給する損失なしの可逆的なウォーターマークエンコーダに結合された、第1の観点による損失のないオーディオエンコーダを備えた装置が提供される。しかも、当該装置は、コンフィギュレーションパラメータに応じてエンコーディングを実行し、かつ、ウォーターマークエンコーダは、デコーダによる使用のためにウォーターマーク出力の中にコンフィギュレーションパラメータを埋め込む。
当該装置は、損失のないオーディオエンコーダの入力に量子化された信号を供給するノイズシェーパを更に備え得る。当該ノイズシェーパは、あるビット深度まで量子化し、コンフィギュレーションパラメータは、ビット深度を含む。また、当該装置は、下位部分の情報保持容量を超えないようにオーディオ品質を最大化するために、量子化のビット深度を選択する選択ユニットを更に備え得る。
このように、本発明は、高品質・広帯域幅信号がベースバンドPCM伝送チャンネルを介して伝達され得て、伝送チャンネルがトップ16ビットを伝達するのみであっても良好な動作をし、エンコードされたストリームが、信号をベースバンドPCMと解釈する遺産装置によりデコードされた際に、帯域制限されたオーディオの妥当な抽出を更に提供するシステムを提供する。
本発明の第4の観点によれば、対応する第1の観点のオーディオエンコーダにより第2のサンプリングレートで生成された複数の入力サンプルを有するPCM入力デジタルオーディオ信号を受け取るように構成されたオーディオデコーダが提供される。当該オーディオデコーダは、PCM入力デジタルオーディオ信号から、第2のサンプリングレートよりも高い第1のサンプリングレートを持つ出力デジタルオーディオ信号を生成するように更に構成され、
出力デジタルオーディオ信号と比較信号との間の差違は、0〜5kHzの周波数範囲で、静的な統計でスペクトル的にシェーピングされたノイズであって、比較信号は、入力デジタルオーディオ信号から、フィルタリングの動作及び第1のサンプリングレートへのリサンプリングの動作により生成され、
出力デジタルオーディオ信号と第2の出力信号との間の差違は、0〜5kHzの周波数範囲で、静的な統計でスペクトル的にシェーピングされたノイズであって、第2の出力信号は、デコーダに送られるとき、各サンプルから下位部分を除去する以外はPCM入力デジタルオーディオ信号と一致する信号から作られ、
出力デジタルオーディオ信号は、エンコーダに提供されたデジタルオーディオ入力信号の正確なレプリカである。
出力デジタルオーディオ信号と比較信号との間の差違は、0〜5kHzの周波数範囲で、静的な統計でスペクトル的にシェーピングされたノイズであって、比較信号は、入力デジタルオーディオ信号から、フィルタリングの動作及び第1のサンプリングレートへのリサンプリングの動作により生成され、
出力デジタルオーディオ信号と第2の出力信号との間の差違は、0〜5kHzの周波数範囲で、静的な統計でスペクトル的にシェーピングされたノイズであって、第2の出力信号は、デコーダに送られるとき、各サンプルから下位部分を除去する以外はPCM入力デジタルオーディオ信号と一致する信号から作られ、
出力デジタルオーディオ信号は、エンコーダに提供されたデジタルオーディオ入力信号の正確なレプリカである。
したがって、第4の観点のデコーダは、第1の観点による対応するエンコーダとともに使用されることが意図されている。当該エンコーダの出力は、単純なPCM信号と解釈されたときに、スペクトル的にシェーピングされてはいるが時間とともに変化することのないノイズフロアのような、オーディオ愛好家の基準を満足し得る。デコーダは、出力信号を生成するために、フィルタリング動作、リサンプリング動作及び量子化動作を実行する。比較信号は、デコーダのフィルタリング動作及びリサンプリング動作を模倣することにより、ただしデコーダの量子化なしで高精度で、生成され得る。その結果、出力デジタル信号と比較信号との間の差違は、デコーダにより持ち込まれた量子化歪みを抜き出す。デコーダへの入力は、好ましくはオーディオ愛好家の基準を満足する信号であるので、比較信号もまたオーディオ愛好家の基準を満足し、よって比較信号と出力信号との間の差違は、オーディオ愛好家の基準を満足し、かつ、したがって静的な統計でスペクトル的にシェーピングされたノイズに等価である量子化歪みのみを含むことになる。このことは、聴取により、又はスペクトラムアナライザの使用により、テストされ得る。
本発明の第5の観点によれば、第2のサンプリングレートで複数の入力サンプルを有するPCM入力デジタルオーディオ信号を受け取り、かつ、それから、第2のサンプリングレートよりも高い第1のサンプリングレートを持つ出力デジタルオーディオ信号を生成するように構成されたオーディオデコーダが提供される。当該デコーダは、
高周波数入力と低周波数入力とを持ち、出力デジタルオーディオ信号を供給する、損失のない帯域合成器と、
損失のある入力と、復元入力と、出力とを持ち、出力は損失のない帯域合成器の高周波数入力に結合された伸張ユニットとを備え、
各入力サンプルは、上位部分と下位部分とを有し、
帯域合成器の低周波数入力は、上位部分に応じて引き出され、
伸張ユニットの損失のある入力は、上位部分に応じて、かつ下位部分から独立して引き出され、
伸張ユニットの復元入力は、下位部分に応じて、かつ上位部分から独立して引き出される。
高周波数入力と低周波数入力とを持ち、出力デジタルオーディオ信号を供給する、損失のない帯域合成器と、
損失のある入力と、復元入力と、出力とを持ち、出力は損失のない帯域合成器の高周波数入力に結合された伸張ユニットとを備え、
各入力サンプルは、上位部分と下位部分とを有し、
帯域合成器の低周波数入力は、上位部分に応じて引き出され、
伸張ユニットの損失のある入力は、上位部分に応じて、かつ下位部分から独立して引き出され、
伸張ユニットの復元入力は、下位部分に応じて、かつ上位部分から独立して引き出される。
帯域合成器及び伸張ユニットは、対応するエンコーダで実行された帯域分割動作及び圧縮動作を逆転させるために必要とされる。完全な損失のない再生は、完全な入力サンプルがデコーダに提供されることを要求するが、下位部分がない場合には損失のある再生をサポートすることも要求される。この理由から、伸張への損失のある入力はストリームの上位部分から送られ、帯域合成器への低周波数入力は実質的に上位部分から取られ、下位部分への依存は低周波数信号の分解能を改善するためのみであることもまた、要求される。
好ましくは、帯域合成器の低周波数入力は、上位部分の中に含まれる全ビットに応じて引き出される。上位部分は、損失のない帯域合成器へ高周波数入力を提供する伸張ユニットへ送られるビットを含む。したがって、低周波数入力を引き出す際には、これらのビットを除外するのが自然であろう。これらのビットは、上位部分を標準PCMデコーダでデコードする遺産リスナの耳に入る信号に影響を及ぼす。しかしながら、それらのビットが低周波数入力に寄与することを可能にすることが好ましい。エンコーダは、本発明のデコーダと標準PCMデコーダとの一致を結果としてもたらす態様で、『負の埋め込みデータ』の原理に従って他のビットを調整することにより、これらのビットを補償することができる。
好ましくは、帯域合成器の低周波数入力もまた、下位部分に応じている。このことは、下位部分がデコーダで使用可能である場合に改善されるように、その分解能の信号が帯域合成器の低周波数入力に提供されることを可能にする。
更に、出力デジタルオーディオ信号と比較信号との間の差違は、0〜5kHzの周波数範囲で、静的な統計でスペクトル的にシェーピングされたノイズであって、比較信号は、PCM入力デジタルオーディオ信号から、フィルタリングの動作及び第1のサンプリングレートへのリサンプリングの動作により生成されることが好ましい。したがって、本発明の第4の観点に関して上記した利点の1つは、本発明の第5の観点により提供される利点と結合され得る。
好ましくは、オーディオデコーダは、対応するオーディオエンコーダにより生成された信号を受け取るように構成され、出力デジタルオーディオ信号は、対応するオーディオエンコーダに提供されたデジタルオーディオ入力信号の正確なレプリカである。
このように、第4の観点に関して上記した他の利点は、本発明の第5の観点により提供される利点と結合され得る。
当業者により評価されるように、本発明の損失のないオーディオエンコーダの他の採用も可能である。更に、他の観点によれば、対応するデコーダは、エンコーダとデコーダとを備えた通信システムと考えられる。
本発明の実施例を、添付の図面を参照しながら詳細に説明する。
損失のある帯域幅拡張
需要者オーディオのための商業的な「スケーラブル」伝送システムが、米国特許第6226616号明細書(You et. al.: “Sound Quality of Established Low Bit-Rate Audio Coding Systems without loss of Decoder Compatibility”)に掲載された。損失のある圧縮がなされたオーディオ信号を表すデータストリームを、標準SPDIFデジタルオーディオインターフェイスで転送され得る16ビットワードへパッケージ化する確立したシステムから始めて、強化されたシステムは、より高いオーディオ品質を可能にするために、オリジナルシステムのために設計されたデコーダと互換性を持つ態様で、更に「拡張ストリーム」を同じフォーマットへパックするというオプションを提供する。しかしながら、PCMストリームを伝達するのにSPDIFがしばしば用いられるが、この場合の『互換性』は、所有者デコーダの確立したインフラストラクチャに関するものであって、特別なデコーダなしにPCMストリームを再生するために採用された装置に関するものではなく、このことが本発明の目的である。
需要者オーディオのための商業的な「スケーラブル」伝送システムが、米国特許第6226616号明細書(You et. al.: “Sound Quality of Established Low Bit-Rate Audio Coding Systems without loss of Decoder Compatibility”)に掲載された。損失のある圧縮がなされたオーディオ信号を表すデータストリームを、標準SPDIFデジタルオーディオインターフェイスで転送され得る16ビットワードへパッケージ化する確立したシステムから始めて、強化されたシステムは、より高いオーディオ品質を可能にするために、オリジナルシステムのために設計されたデコーダと互換性を持つ態様で、更に「拡張ストリーム」を同じフォーマットへパックするというオプションを提供する。しかしながら、PCMストリームを伝達するのにSPDIFがしばしば用いられるが、この場合の『互換性』は、所有者デコーダの確立したインフラストラクチャに関するものであって、特別なデコーダなしにPCMストリームを再生するために採用された装置に関するものではなく、このことが本発明の目的である。
図1(a)及び図1(b)は、上記文献でKomamuraが提案したスキームと同様の、PCM互換性を持つ帯域幅拡張スキームを示している。図1(a)のエンコーダでは、帯域分割器3が、例えば96kHzのレートでサンプリングされて潜在的に周波数範囲0〜48kHzの情報を伝えるオリジナル信号2を受け取る。帯域分割器は、直交ミラーフィルタ(Quadrature Mirror Filter)のような既知の方法を使用して、各々低周波数0〜24kHzの情報と高周波数24〜48kHzの情報とを伝える低周波数(LF)信号15と高周波数(HF)信号28とに信号2を分割する。LF信号とHF信号との各々は、48kHzで、すなわちオリジナルサンプリングレートの半分のレートでサンプリングされる。HFストリームは、既知の方法を用いた損失のある圧縮4がなされて、少数ビット、例えば1、2又は3ビットを持つデータストリーム7となる。一方、LFストリームは、切り捨てられ又はノイズシェーピング5がなされて、多数ビット、例えば15、14又は13ビットを持つ信号6となる。図1(a)は、データストリーム7が3ビットを持ち、信号6が13ビットを持つ例を示している。そして、図1(a)に示すように、2つのストリームからのサンプルを、16ビットサンプル、つまりビットB1〜B16を持つ単一の複合出力ストリーム8へパックするのが直接的である。16ビット出力ストリームは、低いレート、例えば48kHzのサンプルを含み、サンプルストリーム8の再生も可能な標準需要者装置を用いて転送されかつ格納され得る。
Komamuraの提案は、損失のある圧縮の基礎としてADPCM(Adaptive Differential Pulse Code Modulation)を用いる。Komamuraは、24kHzのレートでHFストリームの表現を提供するために、ADPCMユニットの前にダウンサンプラを置く。この表現は次に1サンプルあたり2ビットに圧縮され、当該2ビットはシリアル化されて48kHzの1ビットストリームとなる。したがって、HF情報は最終16ビット出力のうちの1ビットのみを占め、15ビットのLF分解能を可能にする。ダウンサンプリング自体は損失のある処理であるので、Komamuraのダウンサンプラ及びADPCMユニットは、損失のある圧縮ユニット4であると考え得る。ダウンサンプリングの結果、デコーダは、48kHzまでの、又は36kHzまでの周波数の明瞭な再生を提供することができる。
図1(b)は、図1(a)に対応するデコーダを示している。ここでは、ストリーム6及び7が、各々転送されたストリーム8のトップ13ビットB1〜B13及びボトム3ビットB14〜B16からアンパックされる。伸張ユニット9は、帯域分割器3によって作られたLF信号15及びHF信号28に実質的に同様のLF信号及びHF信号が帯域合成器10に送られるように、圧縮ユニット4の動作を逆転させる。帯域合成器10は、周波数範囲0〜24kHzにおけるオーディオ品質が主としてノイズシェーパ5により制限され、かつ超音波範囲24〜48kHzでは圧縮ユニット4と伸張ユニット9との結合動作により歪みが持ち込まれる、出力信号11を作るために、これら2つの信号を再結合させる。
デコーダを持たずにストリーム8をPCMオーディオとして再生する『遺産』リスナは、主として帯域分割器からのノイズシェーピングされた(又は切り捨てられた)LF出力を耳にするが、これは、オリジナル信号2のダウンサンプリングされた低品質バージョンとして受け容れ可能であろう。しかしながら、圧縮されたHF信号7を含むストリーム8の最下位3ビットは、遺産リスナのプレーヤのオーディオ出力にも寄与する。理想圧縮器の出力はノイズ様であって、そのほか冗長を含み、原理的には改善された圧縮を与えるように除去され得るものである。実用上は、音の歪みを除去して圧縮器の出力を真にノイズ様にするように、明示的スクランブルを提供することが必要であり得る。本明細書では、もし必要なら圧縮器4がそのようなスクランブルを内部に含むものとする。これにより、その出力が統計的に独立なバイナリビットからなることを保証する。
本明細書を通じた他の仮定は、圧縮及び伸張といった処理が瞬時的であることである。実用上は、これらの処理は信号ディレイを招く。したがって、並列信号パスにディレイ補償が持ち込まれなければならない。明瞭性のために、処理ユニットの正常な動作にとって便利であり又は必要である場合には、そのようなディレイ補償は図面から省略され、同様に図面はブロック中に信号サンプリングを組織化することを妨げない。
負の埋め込みデータを用いた帯域幅拡張
図2(a)では、損失のある圧縮器4の出力はデータ信号であるが、図1(a)に関して説明したように、それはオーディオ信号として遺産リスナの耳にも入る。このような二重解釈は、図2(a)にて認識される。つまり、ユニット12は、実用上は存在しなくてもよいが、信号7がデータ信号とPCMオーディオ信号との二重解釈を持つことを強調するために含められており、信号7は、オーディオ信号として解釈される場合には、右詰めされたものと考えられて、16ビットワードのボトム3ビット、すなわちビットB14〜B16を占め、当該ワードの他のビットはゼロである。
図2(a)では、損失のある圧縮器4の出力はデータ信号であるが、図1(a)に関して説明したように、それはオーディオ信号として遺産リスナの耳にも入る。このような二重解釈は、図2(a)にて認識される。つまり、ユニット12は、実用上は存在しなくてもよいが、信号7がデータ信号とPCMオーディオ信号との二重解釈を持つことを強調するために含められており、信号7は、オーディオ信号として解釈される場合には、右詰めされたものと考えられて、16ビットワードのボトム3ビット、すなわちビットB14〜B16を占め、当該ワードの他のビットはゼロである。
したがって、オーディオ信号として解釈された信号7は、減算器13へ送られる結果、ノイズシェーパ5は、出力ワード8のトップ13ビットB1〜B13に配置される、修飾された13ビット信号6’を作るために、LF信号とは逆位相で信号7を受け取る。遺産リスナは、信号6’及び7の和である、PCMオーディオ信号として解釈された出力ワード8の全体を耳にする。したがって、遺産リスナは、完全なワード8のボトム3ビットを介して直接に、またワード8のトップ13ビットにてノイズシェーパを介した逆位相で、圧縮器信号7を耳にする。したがって、これらの圧縮器信号7の2つの表現は、打ち消し合う。これは、M. A. Gerzon and P. G. Craven, “A High-Rate Buried Data Channel for Audio CD,” J. Audio Eng. Soc. Volume 43 Issue 1/2 pp. 3-22; February 1995に記載された『負の埋め込みデータ』の例である。
内部的には、ノイズシェーパ5は、13ビット量子化器とノイズシェーピングフィルタとを含む。圧縮器からのノイズを打ち消すのと同様に、負の埋め込みデータは、13ビット量子化器のための負のディザを提供する。加法性ノイズ以外の量子化歪みは、いまや13ビットレベルではなく、16ビットレベルである。13ビットレベルにおける加法性ノイズは、ノイズシェーピングフィルタによりシェーピングされて、潜在的に2ビット以上の知覚的利点を提供する一方、負のディザは、従来のTPDFディザよりも4.77dBだけ小さいノイズを持ち込む。ゆえに、知覚されるパフォーマンスは、TPDFディザを用いる16ビットシステムのパフォーマンスと等価である。
対応するデコーダは、図2(b)に示されている。このデコーダは、帯域合成器10へのLF入力が、トップ13ビットのみではなくて16ビット複合信号の全体から送られることを除いて、図1(b)のデコーダと同様である。したがって、このLF信号は、信号6’及び7の結合であり、遺産リスナの耳に入るものと同様であって、リスナは負のディザと同様の利点を享受する。
Gerzon及びCravenによる上記参考文献は、非整数ビットの他のデータをPCM信号のボトムビットの中に「埋め込む」方法をも記載している。特に、2チャンネル(ステレオ)ストリームの各チャンネルに半整数ビットを埋め込むのが直接的である。簡単のために、本明細書では整数を仮定するが、ここに記載した着想が非整数ビットの圧縮データとともに使用可能であることは明らかであろう。
損失のない帯域幅拡張 − 一般的検討
図3(a)及び図3(b)は、各々単純な損失のない帯域幅拡張システムのためのエンコーダ及びデコーダを示している。図3(a)及び図3(b)と図1(a)及び図1(b)との間の構造的類似性は明白であるが、損失のない再生のための要求は、追加の制約を課し、かつ、損失のある場合には生じることのなかった、量子化の観点への注意深い配慮を必要とする。
図3(a)及び図3(b)は、各々単純な損失のない帯域幅拡張システムのためのエンコーダ及びデコーダを示している。図3(a)及び図3(b)と図1(a)及び図1(b)との間の構造的類似性は明白であるが、損失のない再生のための要求は、追加の制約を課し、かつ、損失のある場合には生じることのなかった、量子化の観点への注意深い配慮を必要とする。
損失のないシステムは情報を捨てることが許されないので、伝送チャンネルは、少なくとも伝達されるべき信号中の情報と同じ大きさの情報保持容量を持たねばならない。損失のない圧縮での経験は、16ビット以上の分解能を持つ96kHzオーディオ信号における冗長が一般に約8ビットであることを示唆している。したがって、16ビットの96kHz信号は、1サンプルあたり8ビットのデータレートに圧縮され得る。そして、24ビットの96kHz信号は、16ビットに圧縮され得る。したがって、16ビットの96kHz信号は、通常、16ビットの48kHzチャンネルを通じて転送され得る。しかしながら、それは互換性を持たない。なぜなら、最適に圧縮された信号は、PCM信号として解釈された場合には、フルスケールのホワイトノイズとして現れるからである。PCM互換性の要求は、PCM信号中への冗長を課し、したがってより大きいワード幅を必要とする。
したがって、一般に、16ビットの96kHz信号を16ビットの48kHzチャンネルへ損失なしでかつPCM互換性をもってパックすることは不可能である。また、一般に、24ビットの96kHz信号を24ビットの48kHzチャンネルへ損失なしでかつPCM互換性をもってパックすることも不可能である。しかしながら、16ビットの96kHz信号の、24ビットの48kHzチャンネルへの、PCM互換性を持つ損失のないパッキングは、通常は実行可能である。
現在、『96/24』(すなわち,サンプリングレート96kHz、ビット深度24ビット)が、CD(Compact Didc)の『44/16』からの次ステップとして広く認識されている。しかしながら、Gerzonによって1995年に、ノイズシェーピングにとって96kHzサンプリングが大いに有利であって、CDで広く用いられてきた44.1kHzシェーパよりも、高周波数ノイズスペクトラムにおける緩やかな上昇をもって大きい知覚的改善を可能にすることが現実化された。Gerzonの96kHzシェーパのための係数は、ほぼ5ビットの知覚的改善を提供するものであって、Acoustic Renaissance for Audio, “A Proposal for High-Quality Application of High-Density CD Carriers” private publication (1995 April); reprinted in Stereophile (1995 Aug.); in Japanese in J. Japan Audio Soc., vol. 35 (1995 Oct.); available for download at www.meridian- audio.com/araに与えられている。Stuartは、人の聴覚能力を考慮した注意深い分析を提供しており(“Coding for High-Resolution Audio Systems” J. Audio Eng. Soc., Vol. 52, No. 3, 2004 March,特に図16参照)、これから、TPDFディザをもって(ただし、ノイズシェーピングなしで)20.5ビットに適切に量子化された44.1kHzサンプリングのデジタルシステムは、配布媒体としての十分なダイナミックレンジを常に提供する、ということが結論付けられよう。96kHzサンプリングが採用される場合には、ノイズシェーピングされないときのノイズスペクトル密度が、更に3.4dBだけ低減される。適切なノイズシェーピングを伴う16ビットの96kHzチャンネルは、配布フォーマットとして全面的に適切であって、ある余裕をもってオーディオ愛好家の要求を満足する、との結論付けが可能である。
したがって、情報理論の議論とともに音響心理学の議論を考慮すれば、24ビットのような大きいビット深度を持ち得る96kHz入力信号を、16ビットのような小さいビット深度へ再量子化することは、必要であり、かつ許容される。ゆえに、図3(a)には96kHzノイズシェーパ1が示され、『A』で識別される量子化された信号2を供給するように、不特定の分解能を持つ96kHz入力信号を、例えば17ビットに再量子化する。帯域分割器3は、損失のない分割器であって、また17ビットの低周波数出力15と、18ビットと表示された分解能を持つ高周波数出力28とを作る。ただし、18ビットの全てを与えることは、現実のオーディオ信号ではまれであろう。したがって、24ビット出力ワード16を仮定したとき、低周波数出力は出力ワード16のうちの17ビットB1〜B17を占め、残る7ビットB18〜B24は、損失のない圧縮器14で作られた、高周波数信号28の損失なしで圧縮されたバージョンである。
図3(b)のデコーダでは、損失のない伸張ユニット9が、高周波数信号28のレプリカとして信号28aを再生する。そして、損失のない帯域合成器10は、損失のない帯域分割器3により作られた信号15及び28と同様の信号を受け取り、その結果、信号2の損失のないレプリカとして、出力信号11を再生することができる。したがって、信号11もまた『A』で識別される。
量子化は損失のある処理なので、図3(a)及び図3(b)に示された全処理が損失のない処理ではあり得ず、損失がないのは、エンコーダ中の信号2からデコーダの出力11までのパスである。したがって、図3(a)及び図3(b)のエンコーダ及びデコーダにより提供される処理は、全体として、入力信号のノイズシェーピングされたバージョンを届ける。ここで、ノイズシェーピング1は、ディザを含みかつ一定のビット深度を持つオーディオ愛好家の基準を満足するように選択され得る。
「リフティング」を用いた損失のない帯域分割器及び帯域合成器
図3(a)及び図3(b)の構成は、損失のない帯域分割器3及び帯域合成器10を必要とする。ここで、『損失のない』とは、処理の中の量子化誤差を考慮に入れた、ビット的に正確な再生のことである。そのような損失のない帯域分割器及び帯域合成器を構成する方法はいくつかある。図4(a)及び図4(b)に示されたものは、「リフティング」原理に基づくものである(Calderbank, Daubechies, Sweldon and Yeo: “Wavelet Transforms That Map Integers to Integers” Applied and Computational Harmonic Analysis, vol. 5, pp 332-369 (1998),特にその図4及び図5参照)。
図3(a)及び図3(b)の構成は、損失のない帯域分割器3及び帯域合成器10を必要とする。ここで、『損失のない』とは、処理の中の量子化誤差を考慮に入れた、ビット的に正確な再生のことである。そのような損失のない帯域分割器及び帯域合成器を構成する方法はいくつかある。図4(a)及び図4(b)に示されたものは、「リフティング」原理に基づくものである(Calderbank, Daubechies, Sweldon and Yeo: “Wavelet Transforms That Map Integers to Integers” Applied and Computational Harmonic Analysis, vol. 5, pp 332-369 (1998),特にその図4及び図5参照)。
図4(a)の帯域分割器では、96kHzのような『2x』サンプリングレートでサンプリングされた入力ストリームが、各々48kHzのような『1x』サンプリングレートで奇数番サンプルと偶数番サンプルとの別個のストリームを作るためにデインターリーブされる。これら2つのストリームは、ほとんど又は全く共起関係にはなく、2xストリーム中のオリジナルの低周波数信号は、偶数ストリームに対する奇数ストリームにて、1xサンプルの半分だけ遅れて又は進んで現れる。
ここで、2つのリフティングステップが適用される。1つのリフティングステップは、ある信号の関数を他の信号に加算する。つまり、
X’=X + f(Y)
Y’=Y
であって、これを単純に逆転させれば、
X=X’ − f(Y’)
Y=Y’
となる。これら2つの場合の間で関数fが正確に一致(状態変数の量子化又は初期化を含む。)するという条件では、損失がない。
X’=X + f(Y)
Y’=Y
であって、これを単純に逆転させれば、
X=X’ − f(Y’)
Y=Y’
となる。これら2つの場合の間で関数fが正確に一致(状態変数の量子化又は初期化を含む。)するという条件では、損失がない。
図4(a)の第1のリフティングステップでは、『X』は奇数番サンプルのストリームで識別され、『Y』は偶数番サンプルのストリームで識別される。奇数ストリームから偶数ストリームを引き算すると実質的に低周波数が打ち消されるが、最善の打ち消しのためには、半サンプルシフトの修正が必要である。したがって、偶数番サンプルに半サンプルディレイを適用したい。これは、偶数のタップを持つ対称FIRフィルタによって近似され得るが、それは因果的でなく、フィルタ『f』は、実際には、あるnに対して(n+1/2)サンプルディレイを実行し、奇数パスにはnサンプルの補償ディレイが存在する。次式は、n=2で2.5サンプルのディレイを持つようなフィルタの例である。
10〜20タップの長さのフィルタが、『HF』ストリームを供給するのに妥当であり得る。このフィルタは、オリジナルスペクトラム、すなわち24kHzよりもかなり低い周波数のうちのボトム側の半分のほとんどを、良好に阻止する。
2xストリームが96kHzでサンプリングされるものと再び仮定すれば、オリジナルスペクトラムのトップ側の半分は、ともにデインターリーブユニットから逆位相で現れる偶数及び奇数ストリームの双方にて、0〜24kHzにエイリアスを生じる。したがって、24〜48kHzの範囲のオリジナル信号は、第1のリフティング動作により振幅が2倍になり、1xのHF出力は、潜在的に2x入力の振幅の2倍の振幅を持つ。これは、図3(a)にてHF出力28が17ビットではなくて18ビットを持つものとして示されている理由である。
図4(a)中の第1のリフティングステップは、奇数サンプルストリームに影響を及ぼさず、その結果、奇数サンプルストリームは、オリジナルの2xスペクトラムのトップ側及びボトム側の両半部からの信号を、同程度に伝える。第2のリフティングステップの目的は、偶数ストリームからHF出力を引き算することにより、オリジナルの高周波数情報を除去することにある。再び『半サンプルディレイ』フィルタ(実際にはn−1/2サンプル)が時間合わせのために必要とされるとともに、HF出力の2倍になった振幅を補償するために0.5をかける乗算が必要とされる。
図4(b)は、図4(a)のリフティングステップの順序が逆転されることを、右から左への信号の流れで強調した、対応する帯域合成器を示す。1xサンプリングレートでの『奇数』及び『偶数』の結果は、2xサンプリングレートでオリジナルストリームを損失なしに再生するために、インターリーブされる。
2つのリフティング動作は、1対のストリーム(LF,HF)を供給する。このストリームでは、クロスオーバー近傍のLFストリームの正確な応答は理想的でなく、カットオフ前に若干上昇し得る。これが問題であると考えられる場合には、調整されたフィルタ構造とともに3つのリフティング動作を使用することで、問題を回避し得る。
各量子化Q1,Q2は、もし帯域分割器への入力が−1から+1までの信号範囲を占める17ビット信号である場合には、オリジナルのステップサイズ、例えば2−16に一致すべきである。図4(a)における帯域分割器のLF出力及びHF出力も、そのようなオリジナルのステップサイズに量子化される。
損失のない再生のため、デコーダ中の各量子化Q1,Q2は、エンコーダ中の対応ブロックと同様の動作、例えば両者とも切り上げ、又は両者とも切り下げという動作をしなければならない。
損失のない帯域幅拡張 − 単一の互換性
図3(a)に戻って、損失のない帯域分割器3に17ビット入力が与えられるとき、その合計出力ビット数(半分のサンプリングレートで)は、17+18=35ビットであって、これは、要求される24ビット出力ワードに明らかに適合しない。
図3(a)に戻って、損失のない帯域分割器3に17ビット入力が与えられるとき、その合計出力ビット数(半分のサンプリングレートで)は、17+18=35ビットであって、これは、要求される24ビット出力ワードに明らかに適合しない。
HF信号が潜在的に18ビットの情報を含む一方、実用上、そのピークレベルは、「力強い」商業的録音であっても、理論最大値より35dB以上も低い。損失のない圧縮がビット数を低減する手段として示されていることは、明らかである。損失のない圧縮器は、元来、可変のデータレートを作り出し、これは、実用上は、例えばFIFO(First In First Out)バッファを用いたバッファリングにより平滑化される必要がある。一般に、帯域分割により作られたHF信号は、標準オーディオ信号よりも「バースト的」に現れるので、バッファリングはより重要でさえある。明瞭性のために、図面にはここに必要なバッファが示されていないが、MLP圧縮システムの場合と同様に、損失のない圧縮器及び伸張器の各々にそのようなバッファが組み込まれていることを仮定している。もちろん、FIFOバッファリングはディレイを持ち込むので、時間合わせを維持するように、(LF信号パスのような)並列信号パスにて一定のディレイを加えることが必要である。ただし、再び明瞭性のために、そのような一定のディレイは図面から省略されている。
商業的な96kHz録音の970例からなるコーパスに基づくテストは、0.3秒のFIFOバッファで、複合LFと損失なし圧縮HFとの情報は、もし15ビットと18ビットとの間のビット深度に量子化されるならば、97.6%のケースで24ビットに適合することを示している。
したがって、一般には、異なる量子化深度でのエンコーディング試行は、各アイテムがエンコードされる際に使用されるべき最大の量子化深度を確立するのに用いられ得る。96kHz量子化を粗くすることは、複合情報により必要とされるビット幅を2つの方法で低減する、すなわち、
・ 直接には、LF信号が粗く量子化されるので、
・ 間接には、HF信号が、粗く量子化される結果、少ないビットからなるので、
ということが判る。
・ 直接には、LF信号が粗く量子化されるので、
・ 間接には、HF信号が、粗く量子化される結果、少ないビットからなるので、
ということが判る。
しかしながら、粗い量子化は、またHF信号の中のシェーピングされたノイズを増加させる。これが重大な効果をもたらすかどうかは、HFパスの信号中でノイズが、つまり時間とともに変化し得るものが、そしていかなる時点でも損失のないエンコーダのFIFOバッファ中に格納されたデータに寄与する各瞬間で異なるものが優勢であるかどうかにかかっている。経験的に、96kHz量子化を1ビットだけ粗くすることは、48kHzでの複合情報を1.5ビットだけ低減し得ることが知られている。
16ビットのオリジナル素材の場合、複合情報は、しばしば24ビットに直接適合する。この場合には、図3(a)に示されている前段の量子化器は除去され得る。
既に示されているように、図3(b)の『A』で示されているデコーダの出力11は、同じく『A』で示されているエンコーダ中の信号2の、損失のないレプリカである。したがって、デコードされた出力11を耳にしたリスナは、単に16ビットのみへの量子化であっても20ビット量子化又は21ビット量子化と等価なノイズ密度を0〜7kHzの範囲で提供し得る、96kHzノイズシェーパの利益を享受する。
デコーダを持たない『遺産』リスナは、PCM信号として解釈されたエンコーダ出力を耳にする。したがって、主として帯域分割器のLF出力が、しかし潜在的には損失のない圧縮器の出力もが、24ビットワードのうちのボトムビットにてPCM信号として解釈される。既に言及したように、この出力は、それが未だノイズ様の信号でない場合には、ランダム化されなければならない。
また、遺産リスナは、図4(a)中の量子化器Q1及びQ2によって作られる量子化歪みを体験する。これらが帯域分割器のLF出力に結合されているからである。これらの歪みは、ディザの使用により良性にされ、かつノイズシェーピングにより知覚的に低減され得る。しかしながら、損失のない再生を維持するため、図4(b)のデコーダは、その量子化器Q1及びQ2にて同様のノイズシェーピングと同様の同期したディザとを用いなければならない。更に、ノイズシェーパが状態変数を有する場合には、デコーダ及びエンコーダで同様に、これらの変数を初期化することが必要であり得る。
二重の互換性:単純なアプローチ
図5(a)は、図3(a)及び図1(a)に示された着想を結合したエンコーダを示しており、次の3つの聴取オプションを提供する。すなわち、
・ 遺産リスナは、1xサンプリングレートで信号の13ビット表現を耳にするが、図2(a)及び図2(b)の、ノイズシェーピングの利益と負のディザの利点とは得られない、
・ 複合信号のトップ16ビットのみにアクセスするリスナは、13ビット表現の損失のある帯域幅拡張を享受するために、図1(b)のデコーダを使用し得る、
・ 全24ビットにアクセスするリスナは、『A』点にて、すなわち96kHzシェーパの結果として臨界的な周波数範囲0〜7kHzで17ビット又は18ビットの分解能をもって、13ビット信号の完全な帯域幅を持つ損失のない再生を享受するために、図5(b)のデコーダを使用し得る、
というオプションである。
図5(a)は、図3(a)及び図1(a)に示された着想を結合したエンコーダを示しており、次の3つの聴取オプションを提供する。すなわち、
・ 遺産リスナは、1xサンプリングレートで信号の13ビット表現を耳にするが、図2(a)及び図2(b)の、ノイズシェーピングの利益と負のディザの利点とは得られない、
・ 複合信号のトップ16ビットのみにアクセスするリスナは、13ビット表現の損失のある帯域幅拡張を享受するために、図1(b)のデコーダを使用し得る、
・ 全24ビットにアクセスするリスナは、『A』点にて、すなわち96kHzシェーパの結果として臨界的な周波数範囲0〜7kHzで17ビット又は18ビットの分解能をもって、13ビット信号の完全な帯域幅を持つ損失のない再生を享受するために、図5(b)のデコーダを使用し得る、
というオプションである。
信号『A』が13ビットに量子化されているので、帯域分割器3は、出力ワード16のトップ13ビットB1〜B13に直接に適合する13ビットのLF出力15を作るためにも構成され得る。HF出力28は、損失のある圧縮4がなされ、かつ出力ワード16の第14〜第16ビットB14〜B16へと桁合わせ12がなされる。したがって、16ビットリスナのために、出力ワード16の上位部分8は、上記2つの黒丸により与えられるように、図1(a)にて16ビットワード8が提供したのと同じデコーディングオプションを提供する。
24ビットリスナのための損失のないエンコーディングをサポートするために、図5(a)のエンコーダと同様のエンコーダは、圧縮された信号27を供給するように、HF信号28の損失のない圧縮14を提供し得る。そして、圧縮された信号27は、出力ストリーム16の下位部分17、すなわちB17〜B24に位置する。しかしながら、エンコーダのために改善がなされて、図5(b)のデコーダ中で使用される損失のある伸張ユニット9のレプリカ9’を組み入れ、損失のない圧縮ユニット14に送られる『修整』信号を形成するようにユニット9’の出力を非圧縮のHF信号28から減算18する。損失のある圧縮及び伸張の適切な設計があれば、減算18は、損失のある圧縮された信号7が消耗するデータレートにほぼ等しい大きさだけ、圧縮された修整信号27のデータレートを低減し得る。
図5(b)のデコーダは、修整信号のレプリカを供給するように、圧縮されたストリーム27を伸張19し、その修整信号のレプリカは、エンコーダ中の減算18を補償するために、損失のある伸張器9の出力に加算20されて、帯域分割器出力28のレプリカ28aを供給する。したがって、帯域合成器10は、帯域分割器3からの信号15及び28と同じ信号15及び28aの供給を受け、信号2の正確なレプリカ『A』である出力11を供給することができる。
一般に、図5(a)に示された伸張、減算、及び損失のない圧縮は、データレートが不十分であって、修整信号を直接に提供するための損失のある圧縮器を採用することにより、修整信号のよりコンパクトな表現が通常は引き出され得る。例えば、Yuらは、損失のあるMPEG4コーデックが、MPEG−SLSとして損失のない動作に、いかにして効率良く拡張されるかを示している(Yu, Geiger, Rahardja, Herre, Lin, and Huang: “MPEG-4 Scalable to Lossless Audio Coding”, Audio Eng. Soc. 117th Convention 2004 October 28-31 San Francisco, AES preprint # 6183)。
したがって、図6(a)では、これら全ての処理が単一の圧縮ユニット21の内部で実行されることが仮定され、圧縮ユニット21が効率良くパックされた修整信号を生成するので、別個の損失のない圧縮器の要求は生じない。逆の処理が図6(b)中の伸張ユニット22の内部で実行されることが同様に仮定され、伸張ユニット22は、標準的な損失のある圧縮された信号7と修整信号とを入力として受け取る。
したがって、ある好ましくない実施形態では、圧縮ユニット21は、図5(a)中の破線で囲まれた枠内に示された内部サブユニットを含み、同様に伸張ユニット22は、図5(b)中の破線で囲まれた枠内の内部サブユニットを含み得るが、これは次善の構成である。
図6(a)及び図6(b)は、HF信号及びLF信号の各々の量子化深度の間の異なる関係をも示している。96kHz量子化は15ビットへの量子化であるが、損失のない帯域分割器のLF出力15は、単に13ビットのみへ量子化され、一方のHF出力は、18ビットへ量子化される。このような量子化深度の不均等は、図5(a)の帯域分割器のLF出力から最下位2ビットを取り、それらのビットをHFワードのボトムへ加えることにより達成され得る。より洗練された方法のためには、上記Calderbankらの文献の2.3章“Different Expansion Factors for the High and Low Pass Channels”を参照されたい。この変更は16ビットリスナの助けにはならないが、長いHFワードから引き出された修整信号が依然として8ビットに適合するように十分に圧縮されているならば、24ビットリスナは、追加2ビットの分解能の利益が得られる。
本明細書及び図面では、13ビット及び15ビットのような96kHz量子化ビット深度が示されているが、それは単なる例示であって、それに限定することを意図したものではない。同じことは、96kHzの周波数自体にも言える。同様に、損失のある圧縮出力として示された3ビットは例であって、より少ないビット数への圧縮が実用上は使用可能である。
改良された二重の互換性
図6(a)及び図6(b)のスキームは、24ビットリスナにとって優れたパフォーマンスを提供するが、遺産リスナにとって、またデコーダを持った16ビットリスナにとっては、図2(a)のエンコーダを用いた場合よりもパフォーマンスが悪くなる。図6(a)及び図6(b)は、図2(a)及び図2(b)のスキームにより提供される、LF信号をノイズシェーピングする利点と、LF信号のための負のディザとして、圧縮されたHF信号を使用する利点とを失うからである。図7(a)のエンコーダは、これらの利点を回復して、複合ワード16の次の3つの聴取可能性を提供するように設計されている。すなわち、
・ 遺産リスナにより、そのプレーヤが上位部分8を標準16ビットPCM信号として解釈する、
・ リスナにより16ビット上位部分のみが受け取られて、図2(b)のデコーダが使用される、
・ リスナにより全24ビットが受け取られて、図7(b)のデコーダが使用される、
という可能性である。
図6(a)及び図6(b)のスキームは、24ビットリスナにとって優れたパフォーマンスを提供するが、遺産リスナにとって、またデコーダを持った16ビットリスナにとっては、図2(a)のエンコーダを用いた場合よりもパフォーマンスが悪くなる。図6(a)及び図6(b)は、図2(a)及び図2(b)のスキームにより提供される、LF信号をノイズシェーピングする利点と、LF信号のための負のディザとして、圧縮されたHF信号を使用する利点とを失うからである。図7(a)のエンコーダは、これらの利点を回復して、複合ワード16の次の3つの聴取可能性を提供するように設計されている。すなわち、
・ 遺産リスナにより、そのプレーヤが上位部分8を標準16ビットPCM信号として解釈する、
・ リスナにより16ビット上位部分のみが受け取られて、図2(b)のデコーダが使用される、
・ リスナにより全24ビットが受け取られて、図7(b)のデコーダが使用される、
という可能性である。
出力ワードの下位部分17とそれを供給する信号パスとを削除し、ノイズシェーピングされた分割器5’をノイズシェーパ5に置き換えるならば、図7(a)のエンコーダは、図2(a)のエンコーダと等価になるという点に注意すべきである。したがって、図2(a)及び図2(b)のスキームを参照して既になされた説明は、遺産であるか図2(b)のデコーダを使用するかにかかわらず16ビットリスナにも通用するので、これら2つの場合の正常なデコーディングが保証される。そこで、ここでは、リスナは複合ワードの全24ビットを受け取るとの仮定のもとに、図7(b)とともに図7(a)の動作に説明を集中することとする。
図7(a)の新規な特徴は、ノイズシェーピングされた出力6’と、ノイズシェーピング処理で除去された情報を含む『LSB』信号23とを提供するノイズシェーピングされた分割器5’である。信号23は、出力ワード16の下位部分17のうちビットB17〜B20のいくつかへ導かれる。その結果、図7(b)のデコーダでは、信号6’及び23の双方が、ノイズシェーピングされた合成器24にて使用可能となり、当該合成器24は、信号26のレプリカとして信号26aを再生する。信号7は、図7(a)のエンコーダ中の信号15のレプリカとしてLF信号15aを供給するために、信号26aに加算25される。
図7(b)中の伸張器22は、図6(b)の場合と同様に機能して、HF信号28の損失のない再生であるHF信号28aを提供する。したがって、損失なしで再生されたLF信号及びHF信号を受け、帯域合成器10は、信号2の損失のないレプリカとして出力信号11を再生することができる。
エンコーダは、複合ワードの上位部分8と下位部分17との間でLF信号15の情報を分けるので、当該エンコーダは、図6(a)のエンコーダの場合よりも高精度の96kHz信号2を扱うことができる。図7(a)及び図7(b)は、17ビットを持つ信号2に対してシステムがどのように構成されるかを示している。信号2が16ビットの場合には、信号26も16ビットを持ち、信号23は3ビットを持ち、したがって『修整(パックされた)』信号27は5ビットになる。信号2が18ビットの場合には、信号26も18ビットを持ち、信号23は5ビットを持ち、したがって『修整(パックされた)』信号27は3ビットになる。
各々ノイズシェーピングされた分割器5’及び合成器24は、種々の方法で実装され得る。図8(a)及び図8(b)は、各々の例を提供する。
図8(a)では、13ビット量子化器31は、インパルス応答がゼロ遅延項を持たず、かつ伝達関数がH(z)−1であるフィルタ33を用いて、ノイズシェーピングされる。関数Hの最適化は、文献にて広く議論されてきた。H(z)=1−0.886z−1+0.391z−2なるH(z)が1つの選択であるが、更に多くの『アグレッシブな』シェーパが、2ビット以上の知覚的改善をもたらすものとして知られている。出力6’を作るためのサブユニット30,31,32及び33の動作もまた、広く議論されてきた。
標準的な実務では、フィルタ33の出力が入力信号から直接に引き算される。しかしながら、ここでは、ノイズシェーピングが損失のある処理であるので、24ビットデコーダがシェーパの効果を『元に戻す』ことができなければならない。図7(b)を参照すれば、合成器24は、いずれもエンコーダの分割器5’からの出力である、『MSB』6’と『LSB』23との双方を受け取る。もしノイズシェーピングがなければ、合成器は、MSBとLSBとを(適切に桁合わせしたうえで)加算することによって、信号26を再生することができたであろう。もしノイズシェーピングからの信号修飾がLSBの決定関数であるなら、合成器は、入力26を再生することもできる。もしHが、量子化された係数を持つ有限インパルス応答フィルタであるなら、当該修飾が決定的であるように準備することは、最も容易である。更に、このフィルタ33の出力は、入力と同じビット幅に、すなわち図示のように17ビットに量子化36がなされるべきである。さもなければ、LSB出力のビット幅は増加するであろう。更にまた、17ビットレベルでのディザリングがなされない量子化歪みが遺産リスナ及び16ビットリスナの耳に入る信号に持ち込まれることを回避するため、17ビットへの量子化は、ディザリング35がなされるべきである。このディザは決定的でなければならず、またディザ生成器35,35aは、エンコーダとデコーダとの間で同期していなければならない。
これらの条件が与えられるなら、図8(b)の合成器は、ユニット33a,34a,35a,36aにて、『LSB』信号23から、図8(a)の分割器にてユニット33,34,35及び36により作られたノイズシェーピング修飾38のレプリカ38aを作ることができる。加算器32aは、量子化器3’により信号37から取り出された下位ビット23を加算し、加算器30aは、減算器30の効果を補償し、これにより信号26のレプリカ26aを作る。
図7(a)及び図7(b)に戻って、信号2のビット数が16ビットよりも少ない場合には、システムは、次のようにして改善され得る。すなわち、ノイズシェーピングされた分割器5’は16ビット入力26を受け取るように構成され、その結果、その16ビットのうちのボトムビットは、減算器13により持ち込まれる符号が逆転される点を除いて、対応するボトムビットの圧縮された信号7のみを含み得る。図8(a)では、これらのビットもまた、分割器を通して伝播し、ノイズシェーピング修飾38が引き算されている点を除いて、信号23の中に現れる。ゆえに、その信号38の情報を持つデコーダは、これらのビットを推論し得る。したがって、これらのビットは、信号7及び信号23の両者において二重に、複合ワードへ効果的に提供される。このため、エンコーダは、信号23から冗長なビットを除去するように変形され得る。このとき、デコーダは、除去されたビットを回復する。信号2が15ビット信号の場合には、『LSB』信号23から最下位の1ビットのみがエンコーダにより除去され、その1ビットは、
− 図8(b)中の信号38aの最下位ビット出力と、
− 図7(b)中の信号7の最下位ビットと
の排他的ORとして回復され得る。
− 図8(b)中の信号38aの最下位ビット出力と、
− 図7(b)中の信号7の最下位ビットと
の排他的ORとして回復され得る。
この処理は、再帰的である。なぜなら、このようにしてある特定のサンプリング時に引き出された、回復された分割器LSBは、ノイズシェーピングフィルタ33aを通した伝播のゆえに、次のサンプリング時に信号38aに影響を及ぼすからである。したがって、ノイズシェーピングフィルタ33及び33aの中の各々の状態変数が同じ値に初期化されることを、保証することが必要である。ストリームの開始時に、エンコーダ及びデコーダの双方にて、これらの変数をゼロに設定するのが自然であろう。
エンコードされた複合ワードのうちの下位部分の割り付けは、実装者の裁量による。例えば、シェーパからのLSBとパックされた修整信号とは、全体動作にいかなる効果をも及ぼすことなく、交換され得る。図9は、破線で囲まれた枠内に示されたように、出力複合ワードの上位部分8を直接に提供する16ビット信号29を供給する分割器を組み入れた、エンコーダの関連部分を示している。解析により、図7(a)中の対応する要素12,13及び5’を図9に置き換えれば、複合ワード16に何の変更もないことが判る。当業者ならば、ステップサイズが必ずしも正確な2のべき乗によらない量子化に、量子化1及び31が置き換えられ得ることをも実現するであろう。この場合には、信号のうちのいくつかはバイナリでなくn値であって、最高効率のために、これらの信号は、複合ワードの中にエントロピ符号化がなされ得る。しかしながら、PCM互換性のため、『MSB』信号6’は、標準バイナリフォーマットにて整数として表現され、かつエントロピ符号化がなされないべきである。
ある状況にて、20ビットオーディオなら伝達可能であるが、24ビットオーディオは伝達不可能であるという事態を考慮すれば、三重の互換性を提供するとの要求もあり得る。すなわち、24ビットリスナのための損失のない拡張された帯域幅再生を提供するだけでなく、遺産リスナと、デコーダを持つ16ビットリスナと、デコーダを持つ20ビットリスナとの間のバランスした利点をも提供するとの要求である。これは、24ビット複合ワードのうちの下位部分の更なる細分と、既に説明した原理の更なる応用とによって、達成され得る。
本明細書における16ビット及び24ビットへの参照は、単に現在の実務で一般的なワード幅を反映したものであって、本発明は、これより長い又は短いワード幅の、異なるワード幅の値であっても、等しく好適に適用され得る。
以上を要約すれば、様々なデコーディングオプションとともにPCM互換性を持つストリームを提供するシステムを説明してきた。オリジナルの高サンプリングレート信号の損失のない再生を実現するためにはデコーダが必要であり、したがって遺産リスナに提供される信号は「損失のある」信号であると説明したが、損失のある信号への減縮は、時不変のフィルタリング動作と、サンプリングレート低減動作と、時不変のノイズフロアを課す再量子化動作とを用いるだけで、オーディオ愛好家仲間で「良性」であると称される態様で実行される。
Claims (25)
- 第1のサンプリングレートで入力デジタルオーディオ信号(2)を受け取り、かつ、それから、複数のサンプル(16)を有しかつ前記第1のサンプリングレートよりも低い第2のサンプリングレートを持つPCMデジタルオーディオ出力を生成するように構成された、損失のないオーディオエンコーダであって、
前記複数のサンプル(16)の各々は、上位部分(8)と下位部分(17)とを持ち、
前記上位部分(8)と前記下位部分(17)とは、いずれも、第1のデコーダが損失なしで前記入力デジタルオーディオ信号(2)を再生できるようにする情報を含み、
標準PCMストリームとして解釈されたとき、前記上位部分(8)は、低減された帯域幅を持つ前記入力デジタルオーディオ信号のバージョンの第1の損失のある表現を提供し、
前記上位部分(8)は、前記第1の損失のある表現の帯域幅よりも大きい帯域幅を持つ前記入力デジタルオーディオ信号の第2の損失のある表現を第2のデコーダが再生できるようにする情報を含み、
前記入力デジタルオーディオ信号(2)は、高周波数出力(28)と低周波数出力(15)とを持つ損失のない帯域分割器(3)に結合され、前記高周波数出力(28)は、損失のある圧縮出力(7)と復元出力(27)とを持つ圧縮ユニット(21)に結合され、
前記上位部分(8)は、前記低周波数出力(15)及び前記損失のある圧縮出力(7)に応じて引き出され、前記下位部分(17)は、前記復元出力(27)に応じて引き出されるオーディオエンコーダ。 - 請求項1記載の損失のないオーディオエンコーダにおいて、
前記第1の損失のある表現は、時不変のフィルタリングと、サンプリングレートの低減と、時不変のノイズフロアを課す再量子化とのうちの1つ以上のみにかけられた、前記入力デジタルオーディオ信号(2)の正確な表現であるオーディオエンコーダ。 - 請求項1又は2に記載の損失のないオーディオエンコーダにおいて、
各上位部分は、16バイナリビットからなるオーディオエンコーダ。 - 先行する請求項のいずれか1項に記載の損失のないオーディオエンコーダにおいて、
各下位部分は、8バイナリビットからなるオーディオエンコーダ。 - 先行する請求項のいずれか1項に記載の損失のないオーディオエンコーダにおいて、
前記第2のサンプリングレートは、前記第1のサンプリングレートの半分であるオーディオエンコーダ。 - 請求項1〜5のいずれか1項に記載の損失のないオーディオエンコーダにおいて、
前記第2のサンプリングレートは、48kHzであるオーディオエンコーダ。 - 請求項1〜5のいずれか1項に記載の損失のないオーディオエンコーダにおいて、
前記第2のサンプリングレートは、44.1kHzであるオーディオエンコーダ。 - 請求項1〜7のいずれか1項に記載の損失のないオーディオエンコーダにおいて、
前記第2のデコーダは、前記第1のサンプリングレートに対応するナイキスト周波数に等しいオーディオ帯域幅を再生するオーディオエンコーダ。 - 請求項1〜7のいずれか1項に記載の損失のないオーディオエンコーダにおいて、
前記第2のデコーダは、前記第1のサンプリングレートに対応するナイキスト周波数の4分の3に等しい帯域幅を再生するオーディオエンコーダ。 - 先行する請求項のいずれか1項に記載の損失のないオーディオエンコーダにおいて、
前記圧縮ユニット(21)は、前記損失のある圧縮出力(7)に結合された出力を持つ、損失のある圧縮ユニット(4)を備えたオーディオエンコーダ。 - 請求項10記載の損失のないオーディオエンコーダにおいて、
前記圧縮ユニット(21)は、前記損失のある圧縮ユニット(4)に結合された入力と、前記復元出力(27)に結合された出力とを持つ、損失のない圧縮ユニット(14)を更に備えたオーディオエンコーダ。 - 先行する請求項のいずれか1項に記載の損失のないオーディオエンコーダにおいて、
前記下位部分(17)は、前記帯域分割器(3)の低周波数出力(15)に応じて引き出されるオーディオエンコーダ。 - 先行する請求項のいずれか1項に記載の損失のないオーディオエンコーダにおいて、
前記損失のない帯域分割器(3)の低周波数出力(15)は、前記上位部分(8)に結合された第1の出力(6’)と、前記下位部分(17)に結合された第2の出力(23)とを持つ分割器(5’)に結合されているオーディオエンコーダ。 - 請求項13記載の損失のないオーディオエンコーダにおいて、
前記分割器(5’)は、ノイズシェーピングフィルタを備えたオーディオエンコーダ。 - 先行する請求項のいずれか1項に記載の損失のないオーディオエンコーダにおいて、
前記上位部分(8)の中の複数のビットは、前記損失のない帯域分割器(3)の前記低周波数出力(15)に結合された第1の入力と、前記圧縮出力(7)に結合された第2の入力とを持つ減算器(13)の出力に応じて引き出されるオーディオエンコーダ。 - 先行する請求項のいずれか1項に記載の損失のないオーディオエンコーダに結合されたノイズシェーパ(1)を備えた装置。
- ウォーターマーク出力を供給する損失なしの可逆的なウォーターマークエンコーダに結合された、請求項1〜15のいずれか1項に記載の損失のないオーディオエンコーダを備えた装置であって、
前記装置は、コンフィギュレーションパラメータに応じてエンコーディングを実行し、かつ、前記ウォーターマークエンコーダは、デコーダによる使用のために前記ウォーターマーク出力の中に前記コンフィギュレーションパラメータを埋め込む装置。 - 請求項17記載の装置において、
前記損失のないオーディオエンコーダの入力に量子化された信号を供給するノイズシェーパを更に備え、
前記ノイズシェーパは、あるビット深度まで量子化し、前記コンフィギュレーションパラメータは、前記ビット深度を含む装置。 - 請求項18記載の装置において、
前記下位部分の情報保持容量を超えないようにオーディオ品質を最大化するために、前記量子化のビット深度を選択する選択ユニットを更に備えた装置。 - 対応する請求項1記載のオーディオエンコーダにより第2のサンプリングレートで生成された複数の入力サンプル(16)を有するPCM入力デジタルオーディオ信号を受け取るように構成されたオーディオデコーダであって、
前記オーディオデコーダは、前記PCM入力デジタルオーディオ信号から、前記第2のサンプリングレートよりも高い第1のサンプリングレートを持つ出力デジタルオーディオ信号(11)を生成するように更に構成され、
前記出力デジタルオーディオ信号と比較信号との間の差違は、0〜5kHzの周波数範囲で、静的な統計でスペクトル的にシェーピングされたノイズであって、前記比較信号は、前記入力デジタルオーディオ信号から、フィルタリングの動作及び前記第1のサンプリングレートへのリサンプリングの動作により生成され、
前記出力デジタルオーディオ信号と第2の出力信号との間の差違は、0〜5kHzの周波数範囲で、静的な統計でスペクトル的にシェーピングされたノイズであって、前記第2の出力信号は、前記デコーダに送られるとき、各サンプルから下位部分を除去する以外は前記PCM入力デジタルオーディオ信号と一致する信号から作られ、
前記出力デジタルオーディオ信号(11)は、前記エンコーダに提供されたデジタルオーディオ入力信号(2)の正確なレプリカであるオーディオデコーダ。 - 第2のサンプリングレートで複数の入力サンプル(16)を有するPCM入力デジタルオーディオ信号を受け取り、かつ、それから、前記第2のサンプリングレートよりも高い第1のサンプリングレートを持つ出力デジタルオーディオ信号(11)を生成するように構成されたオーディオデコーダであって、
前記デコーダは、
高周波数入力(28a)と低周波数入力(15a)とを持ち、前記出力デジタルオーディオ信号(11)を供給する、損失のない帯域合成器(10)と、
損失のある入力(7)と、復元入力(27)と、出力(28a)とを持ち、前記出力は前記損失のない帯域合成器(10)の前記高周波数入力に結合された伸張ユニット(22)とを備え、
各入力サンプル(16)は、上位部分(8)と下位部分(17)とを有し、
前記帯域合成器(10)の前記低周波数入力(15)は、前記上位部分(8)に応じて引き出され、
前記伸張ユニット(22,9)の前記損失のある入力(7)は、前記上位部分(8)に応じて、かつ前記下位部分(17)から独立して引き出され、
前記伸張ユニット(22,19)の前記復元入力(27)は、前記下位部分(17)に応じて、かつ前記上位部分(8)から独立して引き出されるオーディオデコーダ。 - 請求項21記載のオーディオデコーダにおいて、
前記帯域合成器(10)の前記低周波数入力(15)は、前記上位部分(8)の中に含まれる全ビットに応じて引き出されるオーディオデコーダ。 - 請求項21又は22に記載のオーディオデコーダにおいて、
前記帯域合成器(10)の前記低周波数入力(15)もまた、前記下位部分(17)に応じているオーディオデコーダ。 - 請求項21〜23のいずれか1項に記載のオーディオデコーダにおいて、
前記出力デジタルオーディオ信号(11)と比較信号との間の差違は、0〜5kHzの周波数範囲で、静的な統計でスペクトル的にシェーピングされたノイズであって、前記比較信号は、前記PCM入力デジタルオーディオ信号から、フィルタリングの動作及び前記第1のサンプリングレートへのリサンプリングの動作により生成されるオーディオデコーダ。 - 請求項21〜24のいずれか1項に記載のオーディオデコーダにおいて、
対応するオーディオエンコーダにより生成された信号を受け取るように構成され、
前記出力デジタルオーディオ信号(11)は、前記対応するオーディオエンコーダに提供されたデジタルオーディオ入力信号(2)の正確なレプリカであるオーディオデコーダ。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1210373.5 | 2012-06-12 | ||
GBGB1210373.5A GB201210373D0 (en) | 2012-06-12 | 2012-06-12 | Doubly compatible lossless audio sandwidth extension |
PCT/GB2013/051548 WO2013186561A2 (en) | 2012-06-12 | 2013-06-12 | Doubly compatible lossless audio bandwidth extension |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2015519615A JP2015519615A (ja) | 2015-07-09 |
JP2015519615A5 true JP2015519615A5 (ja) | 2016-08-04 |
JP6264699B2 JP6264699B2 (ja) | 2018-01-24 |
Family
ID=46605804
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015516683A Active JP6264699B2 (ja) | 2012-06-12 | 2013-06-12 | 二重の互換性を持つ損失のないオーディオ帯域幅拡張 |
Country Status (8)
Country | Link |
---|---|
US (1) | US9548055B2 (ja) |
EP (1) | EP2859548B1 (ja) |
JP (1) | JP6264699B2 (ja) |
KR (1) | KR102202833B1 (ja) |
CN (1) | CN104508740B (ja) |
CA (1) | CA2898923C (ja) |
GB (3) | GB201210373D0 (ja) |
WO (1) | WO2013186561A2 (ja) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2495918B (en) * | 2011-10-24 | 2015-11-04 | Malcolm Law | Lossless buried data |
GB201210373D0 (en) | 2012-06-12 | 2012-07-25 | Meridian Audio Ltd | Doubly compatible lossless audio sandwidth extension |
EP2980795A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
GB2547877B (en) | 2015-12-21 | 2019-08-14 | Graham Craven Peter | Lossless bandsplitting and bandjoining using allpass filters |
GB2546963B (en) * | 2015-12-23 | 2020-10-21 | Law Malcolm | Transparent lossless audio watermarking enhancement |
US10395664B2 (en) | 2016-01-26 | 2019-08-27 | Dolby Laboratories Licensing Corporation | Adaptive Quantization |
CN106205627B (zh) * | 2016-07-14 | 2019-10-18 | 暨南大学 | 基于边信息预测和直方图平移的数字音频可逆水印算法 |
CN106528040A (zh) * | 2016-11-02 | 2017-03-22 | 福建星网视易信息系统有限公司 | 改进安卓设备音质的方法及装置 |
US10354667B2 (en) | 2017-03-22 | 2019-07-16 | Immersion Networks, Inc. | System and method for processing audio data |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
US20200133254A1 (en) * | 2018-05-07 | 2020-04-30 | Strong Force Iot Portfolio 2016, Llc | Methods and systems for data collection, learning, and streaming of machine signals for part identification and operating characteristics determination using the industrial internet of things |
US20210127125A1 (en) * | 2019-10-23 | 2021-04-29 | Facebook Technologies, Llc | Reducing size and power consumption for frame buffers using lossy compression |
CN115512711A (zh) * | 2021-06-22 | 2022-12-23 | 腾讯科技(深圳)有限公司 | 语音编码、语音解码方法、装置、计算机设备和存储介质 |
CN116974453B (zh) * | 2023-09-25 | 2023-12-08 | 北京灵汐科技有限公司 | 信号处理方法、信号处理装置、信号处理器、设备及介质 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0400222A1 (en) * | 1989-06-02 | 1990-12-05 | ETAT FRANCAIS représenté par le Ministère des Postes, des Télécommunications et de l'Espace | Digital transmission system using subband coding of a digital signal |
US5596647A (en) * | 1993-06-01 | 1997-01-21 | Matsushita Avionics Development Corporation | Integrated video and audio signal distribution system and method for use on commercial aircraft and other vehicles |
JP3312538B2 (ja) * | 1995-08-18 | 2002-08-12 | 日本ビクター株式会社 | 音響信号処理装置 |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
EP0798866A2 (en) * | 1996-03-27 | 1997-10-01 | Kabushiki Kaisha Toshiba | Digital data processing system |
JPH09261068A (ja) * | 1996-03-27 | 1997-10-03 | Toshiba Corp | データ圧縮/復号/伝送/受信/記録/再生の方法と装置 |
JP3405109B2 (ja) * | 1996-04-17 | 2003-05-12 | 日本ビクター株式会社 | エンコード装置、デコード装置及び記録媒体並びにデジタルオーディオ信号の再生装置 |
KR100251453B1 (ko) * | 1997-08-26 | 2000-04-15 | 윤종용 | 고음질 오디오 부호화/복호화장치들 및 디지털다기능디스크 |
US6226616B1 (en) | 1999-06-21 | 2001-05-01 | Digital Theater Systems, Inc. | Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility |
JP2003280694A (ja) * | 2002-03-26 | 2003-10-02 | Nec Corp | 階層ロスレス符号化復号方法、階層ロスレス符号化方法、階層ロスレス復号方法及びその装置並びにプログラム |
US7424434B2 (en) | 2002-09-04 | 2008-09-09 | Microsoft Corporation | Unified lossy and lossless audio compression |
US7395210B2 (en) * | 2002-11-21 | 2008-07-01 | Microsoft Corporation | Progressive to lossless embedded audio coder (PLEAC) with multiple factorization reversible transform |
JP4679049B2 (ja) * | 2003-09-30 | 2011-04-27 | パナソニック株式会社 | スケーラブル復号化装置 |
US7392195B2 (en) * | 2004-03-25 | 2008-06-24 | Dts, Inc. | Lossless multi-channel audio codec |
EP2228791B1 (en) * | 2004-03-25 | 2015-05-06 | DTS, Inc. | Scalable lossless audio codec and authoring tool |
US20070078645A1 (en) * | 2005-09-30 | 2007-04-05 | Nokia Corporation | Filterbank-based processing of speech signals |
EP1852848A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
EP1852849A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
EP1883067A1 (en) * | 2006-07-24 | 2008-01-30 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
RU2483366C2 (ru) * | 2008-07-11 | 2013-05-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен | Устройство и способ декодирования кодированного звукового сигнала |
CN102725791B (zh) * | 2009-11-19 | 2014-09-17 | 瑞典爱立信有限公司 | 用于音频编解码中的响度和锐度补偿的方法和设备 |
US8374858B2 (en) * | 2010-03-09 | 2013-02-12 | Dts, Inc. | Scalable lossless audio codec and authoring tool |
GB201210373D0 (en) | 2012-06-12 | 2012-07-25 | Meridian Audio Ltd | Doubly compatible lossless audio sandwidth extension |
-
2012
- 2012-06-12 GB GBGB1210373.5A patent/GB201210373D0/en not_active Ceased
-
2013
- 2013-06-12 EP EP13733412.4A patent/EP2859548B1/en active Active
- 2013-06-12 GB GB1310486.4A patent/GB2503110B/en active Active
- 2013-06-12 CN CN201380038662.1A patent/CN104508740B/zh active Active
- 2013-06-12 WO PCT/GB2013/051548 patent/WO2013186561A2/en active Application Filing
- 2013-06-12 US US14/406,110 patent/US9548055B2/en active Active
- 2013-06-12 JP JP2015516683A patent/JP6264699B2/ja active Active
- 2013-06-12 KR KR1020157000750A patent/KR102202833B1/ko active IP Right Grant
- 2013-06-12 CA CA2898923A patent/CA2898923C/en active Active
- 2013-06-13 GB GBGB1310497.1A patent/GB201310497D0/en not_active Ceased
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6264699B2 (ja) | 二重の互換性を持つ損失のないオーディオ帯域幅拡張 | |
JP2015519615A5 (ja) | ||
ES2537820T3 (es) | Códec de audio sin pérdidas escalable y herramienta de autoría | |
KR101135726B1 (ko) | 인코더, 디코더, 인코딩 방법, 디코딩 방법 및 기록 매체 | |
US8374858B2 (en) | Scalable lossless audio codec and authoring tool | |
JP4997098B2 (ja) | スケーラブル可逆オーディオ・コーデック及びオーサリング・ツール | |
JP2009536363A (ja) | ロッシー符号化されたデータ・ストリームおよびロスレス拡張データ・ストリームを使用する、ソース信号のロスレス符号化を行う方法および装置 | |
KR20020002241A (ko) | 디지털 오디오장치 | |
KR100891666B1 (ko) | 믹스 신호의 처리 방법 및 장치 | |
US20060212614A1 (en) | Cd playback augmentation for higher resolution and multi-channel sound | |
JP2007142547A (ja) | 符号化方法及び復号化方法とその符号器及び復号器 | |
KR100433984B1 (ko) | 디지털 오디오 부호화/복호화 장치 및 방법 | |
KR20040086879A (ko) | 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치 | |
JP2001337698A (ja) | 符号化装置および符号化方法並びに復号化装置および復号化方法 | |
JP2004094090A (ja) | オーディオ信号圧縮伸長装置及び方法 | |
JP2003308013A (ja) | データ変換方法およびデータ変換装置、データ復元方法およびデータ復元装置、データフォーマット、記録媒体、並びにプログラム |