JP4939424B2 - 複素値のフィルタ・バンクを用いたオーディオ信号の符号化及び復号化 - Google Patents
複素値のフィルタ・バンクを用いたオーディオ信号の符号化及び復号化 Download PDFInfo
- Publication number
- JP4939424B2 JP4939424B2 JP2007538599A JP2007538599A JP4939424B2 JP 4939424 B2 JP4939424 B2 JP 4939424B2 JP 2007538599 A JP2007538599 A JP 2007538599A JP 2007538599 A JP2007538599 A JP 2007538599A JP 4939424 B2 JP4939424 B2 JP 4939424B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- subband
- time domain
- generating
- band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 109
- 238000000034 method Methods 0.000 claims description 63
- 238000012545 processing Methods 0.000 claims description 46
- 230000015572 biosynthetic process Effects 0.000 claims description 43
- 238000003786 synthesis reaction Methods 0.000 claims description 43
- 230000036961 partial effect Effects 0.000 claims description 25
- 238000005070 sampling Methods 0.000 claims description 18
- 238000006243 chemical reaction Methods 0.000 claims description 17
- 230000004044 response Effects 0.000 claims description 15
- 230000005540 biological transmission Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 2
- 241000287463 Phalacrocorax Species 0.000 claims 1
- 238000001228 spectrum Methods 0.000 description 24
- 230000009466 transformation Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000003595 spectral effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000009467 reduction Effects 0.000 description 3
- 238000000844 transformation Methods 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【0001】
本発明は、オーディオ信号の符号化及び/又は復号化に関し、特にオーディオ信号の波形符号化/復号化に関する。
【背景技術】
【0002】
種々のソース信号のディジタル符号化は、この数十年間に、アナログの表現及び通信がディジタル信号の表現及び通信によって一層置き換えられるにつれて一層重要になってきている。例えば、GSM(ジーエスエム)などの移動体電話システムは、ディジタル音声符号化に基づいている。又、ビデオや音楽などのメディア・コンテンツの配信は一層、ディジタル・コンテンツ符号化に基づいてきている。
【0003】
従来、オーディオ符号化は、下にある波形がディジタル化され、効率的に符号化される波形符号化を主に用いている。例えば、通常の波形符号器は、信号を周波数サブバンド領域に変換するフィルタ・バンクを備えている。心理音響学モデルに基づいて、マスキング閾値が施され、結果として生じるサブバンド値が効率的に量子化され、例えば、ハフマン符号を用いて符号化される。
【0004】
波形符号器の例には、周知のMPEG-1レイヤ3(多くの場合、MP3として表す)符号化手法又はAAC(アドバンスト・オーディオ・コーディング)符号化手法がある。
【0005】
近年、下にある波形を直接符号化するものでないが、むしろ、いくつかのパラメータによって符号化信号を特徴付けるいくつかの符号化手法が提案されている。例えば、音声符号化の場合、符号器及び復号器は、人間の声道のモデルに基づき得るものであり、波形を符号化するかわりに、上記モデルの種々のパラメータ及び励起信号を符号化することができる。前述の手法は一般にパラメトリック符号化手法として表される。
【0006】
更に、波形符号化及びパラメトリック符号化を組み合わせて特に効率的でかつ高品質の符号化を実現することができる。前述のシステムでは、パラメータは、信号の一部を、波形符号化された信号の別の一部を参照して表すことができる。例えば、低周波が波形符号化され、高周波が、高周波の特性を低周波に対して表すパラメトリック拡張によって符号化される符号化手法が提案されている。別の例として、例えば、モノ信号が波形符号化され、パラメトリック拡張が、個々のチャネルがコモン信号とどのように異なるかを示すパラメータ・データを有するマルチチャネル信号符号化が提案されている。
【0007】
パラメトリック拡張符号化手法の例には、スペクトル帯域複製(SBR)手法、パラメトリック・ステレオ(PS)手法や空間オーディオ符号化(SAC)手法がある。
【0008】
現在、SAC手法が、マルチチャネル・オーディオ信号を効率的に符号化するよう開発されている。この手法は、PS符号化手法に部分的に基づいている。PSパラダイムと同様に、SACは、M個のチャネルを有するマルチチャネル信号を、N個のチャネル(N<M)を有する信号と、空間キューを表すわずかな量のパラメータとによって効率的に表すことが可能であるという概念に基づいている。典型的なアプリケーションには、波形符号化されたモノ信号又はステレオ信号としての通常の5.1信号表現に空間パラメータを加えたものを符号化することがある。空間パラメータをモノ又はステレオのコア・ビット・ストリームの補助データ部分に埋め込んで後方互換拡張を構成することが可能である。
【0009】
SBR手法及びPS手法と同様に、SACは、複素(疑似)直交ミラー・フィルタを用いて、時間領域表現を周波数領域表現に変換する(逆も同様である)。前述のフィルタ・バンクの特性には、複素値サブバンド領域信号が、効果的に2倍にオーバサンプリングされることがある。これによって、エイリアシング歪みをもたらすことのないサブバンド領域信号の後処理演算が可能になる。
【0010】
パラメトリック拡張の通常の特性の別のものには、通常の条件下では、前述の手法が、トランスペアレントなオーディオの品質レベルを達成するものでない(すなわち、多少の品質劣化がもたらされる)ということがある。
【0011】
トランスペアレントなオーディオの品質に向けてSBR、PSやSACのようなパラメトリック拡張を拡張するために、波形符号器を用いて複素サブバンド領域信号の特定の部分(例えば、特定数のバンド)を符号化することが望ましい。
【0012】
簡単な手法は、まず前述の複素サブバンド領域部分を時間領域に変換し戻す工程を有する。既存の波形符号器(例えば、AAC)を次いで、結果として生じる時間領域信号に施すことが可能である。しかし、前述の手法には、いくつかの欠点が伴う。
【0013】
特に、結果として生じる符号器及び復号器の計算量は大きく、種々の変換を用いた、周波数領域と時間領域との間で繰り返される変換が理由で、大きな計算負荷を有している。例えば、パラメトリック拡張が、QMF合成後に得られる時間領域信号の符号化を利用する場合、対応する復号器は、完全な波形復号器(例えば、AAC派生復号器)を有しており、それに加えて、解析QMFバンクを有している。これは、計算量の点でコストがかかる。
【0014】
更に、使用されるパラメトリック拡張と、パラメトリック拡張によって符号化される信号エレメントの波形符号化との間の相関を有することが有利になる。
【0015】
例として、システムが、例えば、AAC及びSBR(HE-AAC)符号化、又はAAC及びSAC符号化を有することができる。システムが、SBR拡張又はSAC拡張を波形符号化によってエンハンスすることを可能にする場合、QMF合成後に得られる時間領域信号を符号化するためにAACも用いることが当然の帰結になる。しかし、同じ拡張(例えば、MPEG-IレイヤII及びSBRの組み合わせ)を用いた別のシステムは好ましくは、別の波形符号化システム(すなわち、MPEG-IレイヤII)を用いる。よって、波形符号化エンハンスメントをコア符号器にではなくパラメータ拡張ツールに結合することが効果的になる。
【0016】
よって、改良されたシステムが効果的になる。特に、柔軟性の向上、計算量の削減、計算負荷の削減、施される符号化の種々のエレメント間の相互運用の容易化、オーディオ品質の向上(例えば、スケーラブルなオーディオ品質)、及び/又は性能の向上を可能にする符号化/又は復号化システムが効果的になる。
【発明の開示】
【発明が解決しようとする課題】
【0017】
よって、本発明は、好ましくは、上記欠点の1つ又は複数のものを単独で、又は何れかの組み合わせで緩和、軽減又は解消しようとするものである。
【課題を解決するための手段】
【0018】
本発明の局面によれば、時間領域オーディオ信号を波形復号化によって生成する復号器が提供される。復号器は、符号化データ・ストリームを受信する手段と、符号化データ・ストリームのデータ値を復号化することによって第1のサブバンド信号を生成する手段であって、第1のサブバンド信号が、時間領域オーディオ信号をクリティカル・サンプリングしたサブバンド領域信号表現に対応する手段と、サブバンド処理によって第2のサブバンド信号を第1のサブバンド信号から生成する変換手段であって、第2のサブバンド信号が、時間領域オーディオ信号を非クリティカル・サンプルした複素サブバンド領域表現に対応する変換手段と、時間領域オーディオ信号を第2のサブバンド信号から生成する合成フィルタ・バンクとを備える。
【0019】
本発明は、復号器の改良を可能にし得る。計算量を削減した復号器を達成することができ、かつ/又は計算リソース要件を削減することができる。特に、合成フィルタ・バンクを、時間領域オーディオ信号のパラメトリック拡張の復号化にも波形復号化にも用いることができる。波形復号化とパラメトリック復号化との共通性を達成することが可能である。特に、合成フィルタ・バンクは通常、SBR、PSやSACなどのパラメトリック拡張符号化手法におけるパラメトリック復号化に用いることが可能である。
【0020】
変換プロセッサは、如何なる変換(例えば、第1のサブバンド信号を時間領域に戻す)も必要とすることなくサブバンド処理によって第2のサブバンド信号を生成するよう構成される。
【0021】
復号器は、合成フィルタ・バンクの合成演算の前に第2のサブバンド信号に対して非エイリアス信号処理を行う手段を更に備え得る。
【0022】
本発明の任意的な特徴によれば、第1のサブバンド信号の各サブバンドは複数の部分サブバンドを備えており、変換手段は、第2のサブバンド信号のサブバンドを第1のサブバンド信号の部分サブバンドから生成する第2の合成フィルタ・バンクを備えている。
【0023】
これによって、第1のサブバンド信号を変換する効率的な手段が提供され得る。上記特徴によって、合成フィルタ・バンクのサブバンド・フィルタの周波数応答を補償する効率的であり、かつ/又は計算量の少ない手段に対する備えをなし得る。
【0024】
本発明の任意的な特徴によれば、第2のサブバンド信号の各サブバンドは、エイリアス・バンド及び非エイリアス・バンドを備えており、変換手段は、第1のサブバンド信号の部分サブバンドを第2のサブバンド信号の第1のサブバンド・バンドのエイリアス部分サブバンド、及び第2のサブバンド信号の第2のサブバンドの非エイリアス・サブバンドに分離し、エイリアス・サブバンド及び非エイリアス・サブバンドは、時間領域信号において対応する周波数区間を有する。
【0025】
これによって、第1のサブバンド信号を変換する効率的な手段が提供され得る。特に、時間領域オーディオ信号内の同じ周波数から生じる種々のサブバンドにおける信号構成部分が単一の信号構成部分から生成されることを可能にし得る。
【0026】
本発明の任意的な特徴によれば、分離手段はバタフライ構造を有している。バタフライ構造は、1つのゼロ値入力及び1つの部分サブバンド・データ値入力を用いて、第2のサブバンドの別々のサブバンドに対応する2つの出力値を生成することができる。
【0027】
本発明の別の局面によれば、時間領域オーディオ信号を符号化する符号器が提供される。符号器は、時間領域オーディオ信号を受信する手段と、第1のサブバンド信号を時間領域オーディオ信号から生成する第1のフィルタ・バンクであって、第1のサブバンド信号が、時間領域信号を非クリティカル・サンプリングした複素サブバンド領域表現に対応する第1のフィルタ・バンクと、第2のサブバンド信号を第1のサブバンド信号からサブバンド処理によって生成する変換手段であって、第2のサブバンド信号が、時間領域オーディオ信号をクリティカル・サンプリングしたサブバンド領域表現に対応する変換手段と、第2のサブバンド信号のデータ値を符号化することによって波形符号化データ・ストリームを生成する手段とを提供する。
【0028】
本発明は、符号器の改良を可能にし得る。計算量を削減した符号器を達成することができ、かつ/又は計算リソース要件を削減することができる。波形符号化とパラメトリック符号化との共通性を達成することが可能である。特に、第1のフィルタ・バンクは、通常、SBR、PSやSACなどのパラメトリック拡張符号化手法におけるパラメトリック符号化に用いられるQMFフィルタ・バンクであり得る。
【0029】
復号化オーディオ品質の改良を達成することができる。例えば、時間領域オーディオ信号は、パラメトリック符号化からの残差信号であり得る。波形符号化信号は、透明性の向上をもたらす情報を供給することが可能である。
【0030】
変換プロセッサは、如何なる変換(例えば、第1のサブバンド信号を時間領域に戻す)も必要とすることなくサブバンド処理によって第2のサブバンド信号を生成するよう構成される。
【0031】
本発明の任意的な特徴によれば、符号器は、第1のサブバンド信号を用いて時間領域オーディオ信号をパラメトリック符号化する手段を更に備える。
【0032】
本発明は、パラメトリック符号化及び波形符号化をともに用いて、下にある信号の効率的であり、かつ/又は高品質の符号化を可能にし得る。機能をパラメトリック符号化と波形符号化との間で共有することができる。パラメトリック符号化は、SBR、PSやSAC符号化などのパラメトリック拡張符号化であり得る。符号器によって特に、パラメトリック拡張符号化の一部又は全てのサブバンドの波形符号化に対する備えをなし得る。
【0033】
本発明の任意的な特徴によれば、変換手段は、第1のサブバンド信号のサブバンド毎に複数のサブバンドを生成する第2のフィルタ・バンクを備える。
【0034】
これによって、第1のサブバンド信号を変換する効率的な手段が提供され得る。上記特徴によって、第1のサブバンドのサブバンド・フィルタの周波数応答を補償する効率的であり、かつ/又は計算量の少ない手段に対する備えをなし得る。
【0035】
本発明の任意的な特徴によれば、第2のフィルタ・バンクは奇数でスタックされる。
【0036】
これにより、性能を向上させ、複素サブバンド領域内の、正の周波数と負の周波数との間の分離の向上を可能にすることができる。
【0037】
本発明の任意的な特徴によれば、各サブバンドは、サブバンドのエイリアス・バンドに対応する特定のエイリアス部分サブバンドと、サブバンドの非エイリアス・バンドに対応する特定の非エイリアス部分サブバンドとを備えており、変換手段は、第1のサブバンド・バンドのエイリアス部分サブバンドを第2のサブバンドの非エイリアス部分サブバンドと合成する合成手段を備えており、エイリアス部分サブバンド及び非エイリアス部分サブバンドは、時間領域信号において対応する周波数区間を有する。
【0038】
これによって、第1のサブバンド信号を変換する効率的な手段が提供され得る。特に、時間領域オーディオ信号内の同じ周波数から生じる種々のサブバンドにおける信号構成部分が単一の信号構成部分に合成されることを可能にし得る。これによって、データ・レートの削減が可能になり得る。
【0039】
本発明の任意的な特徴によれば、エイリアス・バンド内のエネルギを削減するよう合成手段が構成される。
【0040】
このことによって、性能が向上し得るものであり、かつ/又はデータ・レートの削減が可能になり得る。特に、エイリアス・バンド内のエネルギを最小にすることができ、エイリアス・バンドを無視することができる。
【0041】
特に、合成手段は、第2のサブバンドのエイリアス・サブバンドによって第1のサブバンド・バンドの非エイリアス部分サブバンドを補償する手段を更に備え得る。特に、合成手段は、第2のサブバンドのエイリアス・サブバンドの係数を第1のサブバンドの非エイリアス部分サブバンドから減算する手段を備え得る。
【0042】
本発明の任意的な特徴によれば、合成手段は、第1のサブバンド内の第1のエイリアス部分サブバンド及び第2のサブバンド内の第1の非エイリアス部分サブバンドの非エイリアス和信号を生成する手段を備える。
【0043】
このことによって、効率的な実現形態及び/又は高性能が可能になり得る。
【0044】
本発明の任意的な特徴によれば、合成手段は、非エイリアス和信号を生成するバタフライ構造を備える。
【0045】
このことによって、特に効率的な実現形態及び/又は高性能が可能になり得る。バタフライ構造は特に、1つの出力値のみが生成されるハーフ・バタフライ構造であり得る。
【0046】
本発明の任意的な特徴によれば、バタフライ構造の少なくとも1つの係数は、第1のフィルタ・バンクのフィルタの周波数応答によって変わってくる。
【0047】
このことによって、特に効率的な実現形態及び/又は高性能が可能になり得る。
【0048】
本発明の任意的な実施例によれば、符号化データ・ストリーム内のエイリアス・バンドのデータ値を備えないよう変換手段が構成される。
【0049】
このことによって、特定のデータ・レートの場合の、高い符号化オーディオ品質が可能になり得る。
【0050】
本発明の任意的な特徴によれば、符号器は、第2の信号への変換に先行して第1のサブバンド信号に対して非エイリアス信号処理を行う手段を更に備える。
【0051】
このことによって、性能が向上し得る。本発明は、エイリアシング・エラーをもたらすことなく個々のサブバンドの信号処理を行うことを可能にする一方で、クリティカル・サンプリングされた出力信号を有する波形符号器の効率的な実現形態を可能にし得る。
【0052】
本発明の任意的な特徴によれば、符号器は、第2の信号への変換に先行して第1のサブバンド信号を位相補償する手段を更に備える。
【0053】
このことによって、性能が向上し、かつ/又は効率的な実現形態に対する備えがなされ得る。
【0054】
本発明の任意的な特徴によれば、第1のフィルタ・バンクはQMFフィルタ・バンクである。
【0055】
本発明によって、SBR、PS、SACなどの多くのパラメトリック符号化手法において用いられるQMFフィルタを用いた効率的な波形符号化が可能になり得る。よって、波形符号化手法及びパラメトリック符号化手法の互換性の向上、及び/若しくは機能の向上、並びに/又は、相互運用性の向上を達成することが可能である。
【0056】
本発明の別の局面によれば、時間領域オーディオ信号を波形復号化によって生成する方法が提供される。方法は、符号化データ・ストリームを受信する工程と、符号化データ・ストリームのデータ値を復号化することによって第1のサブバンド信号を生成する工程であって、第1のサブバンド信号が、時間領域オーディオ信号をクリティカル・サンプリングしたサブバンド領域信号表現に対応する工程と、サブバンド処理によって第2のサブバンド信号を第1のサブバンド信号から生成する工程であって、第2のサブバンド信号が、時間領域オーディオ信号を非クリティカル・サンプリングした複素サブバンド領域表現に対応する工程と、合成フィルタ・バンクが時間領域オーディオ信号を第2のサブバンド信号から生成する工程を備える。
【0057】
本発明の別の局面によれば、時間領域オーディオ信号を符号化する方法が提供される。方法は、時間領域オーディオ信号を受信する工程と、第1のフィルタ・バンクが第1のサブバンド信号を時間領域オーディオ信号から生成する工程であって、第1のサブバンド信号が、時間領域信号を非クリティカル・サンプリングした複素サブバンド領域表現に対応する工程と、第2のサブバンド信号を第1のサブバンド信号からサブバンド処理によって生成する工程であって、第2のサブバンド信号が、時間領域オーディオ信号をクリティカル・サンプリングしたサブバンド領域表現に対応する工程と、第2のサブバンド信号のデータ値を符号化することによって波形符号化データ・ストリームを生成する工程とを提供する。
【0058】
本発明の別の局面によれば、オーディオ信号を受信する受信器が提供される。受信器は、符号化データ・ストリームを受信する手段と、符号化データ・ストリームのデータ値を復号化することによって第1のサブバンド信号を生成する手段であって、第1のサブバンド信号が、時間領域オーディオ信号をクリティカル・サンプリングしたサブバンド領域信号表現に対応する手段と、サブバンド処理によって第2のサブバンド信号を第1のサブバンド信号から生成する変換手段であって、第2のサブバンド信号が、時間領域オーディオ信号を非クリティカル・サンプリングした複素サブバンド領域表現に対応する変換手段と、時間領域オーディオ信号を第2のサブバンド信号から生成する合成フィルタ・バンクとを備える。
【0059】
本発明の別の局面によれば、符号化オーディオ信号を送信する送信器が提供される。送信器は、時間領域オーディオ信号を受信する手段と、第1のサブバンド信号を時間領域オーディオ信号から生成する第1のフィルタ・バンクであって、第1のサブバンド信号が、時間領域信号を非クリティカル・サンプリングした複素サブバンド領域表現に対応する第1のフィルタ・バンクと、第2のサブバンド信号を第1のサブバンド信号からサブバンド処理によって生成する変換手段であって、第2のサブバンド信号が、時間領域オーディオ信号をクリティカル・サンプリングしたサブバンド領域表現に対応する変換手段と、第2のサブバンド信号のデータ値を符号化することによって波形符号化データ・ストリームを生成する手段と、波形符号化データ・ストリームを送信する手段とを備える。
【0060】
本発明の別の局面によれば、時間領域オーディオ信号を送信する送信システムが提供される。送信システムは、送信器及び受信器を備える。送信器は、時間領域オーディオ信号を受信する手段と、第1のサブバンド信号を時間領域オーディオ信号から生成する第1のフィルタ・バンクであって、第1のサブバンド信号が、時間領域信号を非クリティカル・サンプリングした複素サブバンド領域表現に対応する第1のフィルタ・バンクと、第2のサブバンド信号を第1のサブバンド信号からサブバンド処理によって生成する変換手段であって、第2のサブバンド信号が、時間領域オーディオ信号をクリティカル・サンプリングしたサブバンド領域表現に対応する変換手段と、第2のサブバンド信号のデータ値を符号化することによって波形符号化データ・ストリームを生成する手段と、波形符号化データ・ストリームを送信する手段とを備える。受信器は、波形符号化データ・ストリームを受信する手段と、符号化データ・ストリームのデータ値を復号化することによって第3のサブバンド信号を生成する手段であって、第3のサブバンド信号が、時間領域オーディオ信号をクリティカル・サンプリングしたサブバンド領域信号表現に対応する手段と、サブバンド処理によって第4のサブバンド信号を第3のサブバンド信号から生成する変換手段であって、第4のサブバンド信号が、時間領域オーディオ信号を非クリティカル・サンプルした複素サブバンド領域表現に対応する変換手段と、時間領域オーディオ信号を第4のサブバンド信号から生成する合成フィルタ・バンクとを備える。
【0061】
本発明の別の局面によれば、オーディオ信号を受信する方法が提供される。方法は、符号化データ・ストリームを受信する工程と、符号化データ・ストリームのデータ値を復号化することによって第1のサブバンド信号を生成する工程であって、第1のサブバンド信号が、時間領域オーディオ信号をクリティカル・サンプリングしたサブバンド領域信号表現に対応する工程と、サブバンド処理によって第2のサブバンド信号を第1のサブバンド信号から生成する工程であって、第2のサブバンド信号が、時間領域オーディオ信号を非クリティカル・サンプルした複素サブバンド領域表現に対応する工程と、合成フィルタ・バンクが時間領域オーディオ信号を第2のサブバンド信号から生成する工程とを備える。
【0062】
本発明の別の局面によれば、符号化オーディオ信号を送信する方法が提供される。方法は、時間領域オーディオ信号を受信する工程と、第1のフィルタ・バンクが第1のサブバンド信号を時間領域オーディオ信号から生成する工程であって、第1のサブバンド信号が、時間領域信号を非クリティカル・サンプリングした複素サブバンド領域表現に対応する工程と、第2のサブバンド信号を第1のサブバンド信号からサブバンド処理によって生成する工程であって、第2のサブバンド信号が、時間領域オーディオ信号をクリティカル・サンプリングしたサブバンド領域表現に対応する工程と、第2のサブバンド信号のデータ値を符号化することによって波形符号化データ・ストリームを生成する工程と、波形符号化データ・ストリームを送信する工程とを提供する。
【0063】
本発明の別の局面によれば、時間領域オーディオ信号を送信し、受信する方法が提供される。方法は、送信器が、時間領域オーディオ信号を受信する工程と、第1のフィルタ・バンクが第1のサブバンド信号を時間領域オーディオ信号から生成する工程であって、第1のサブバンド信号が、時間領域信号を非クリティカル・サンプリングした複素サブバンド領域表現に対応する工程と、第2のサブバンド信号を第1のサブバンド信号からサブバンド処理によって生成する工程であって、第2のサブバンド信号が、時間領域オーディオ信号をクリティカル・サンプリングしたサブバンド領域表現に対応する工程と、第2のサブバンド信号のデータ値を符号化することによって波形符号化データ・ストリームを生成する工程と、波形符号化データ・ストリームを送信する工程と、受信器が、波形符号化データ・ストリームを受信する工程と、符号化データ・ストリームのデータ値を復号化することによって第3のサブバンド信号を生成する工程であって、第3のサブバンド信号が、時間領域オーディオ信号をクリティカル・サンプリングしたサブバンド領域信号表現に対応する工程と、サブバンド処理によって第4のサブバンド信号を第3のサブバンド信号から生成する工程であって、第4のサブバンド信号が、時間領域オーディオ信号を非クリティカル・サンプリングした複素サブバンド領域表現に対応する工程と、合成フィルタ・バンクが時間領域オーディオ信号を第4のサブバンド信号から生成する工程とを備える。
【0064】
本発明の別の局面によれば、前述の方法の何れかを実行するコンピュータ・プログラムを提供する。
【発明を実施するための最良の形態】
【0065】
本発明の前述並びにその他の局面、特徴及び利点は、以下に記載する実施例から明らかであり、そうした実施例を参照しながら明らかになるであろう。
【0066】
本発明の実施例は、添付図面を参照して、例としてのみ説明する。
【実施例】
【0067】
図1は、本発明の特定の実施例による、オーディオ信号の通信のための送信システム100を示す。送信システム100は、特にインターネットであり得るネットワーク105を介して受信器103に結合された送信器101を備える。
【0068】
この特定例では、送信器101が信号記録装置であり、受信器が信号プレイヤ装置103であるが、他の実施例では、送信器及び受信器を他のアプリケーションに、かつ他の目的に用いることができる。例えば、送信器101及び/又は受信器103は、トランスコーリング機能の一部であり得るものであり、例えば、他の信号のソース又は送信先とのインタフェースを備え得る。
【0069】
信号記録機能がサポートされる特定例では、送信器101は、アナログ信号(サンプリング及びアナログ・ディジタル変換によってディジタルPCM信号に変換される)を受信するディジタイザ107を備える。
【0070】
送信器101は図1の符号器109に結合される。符号器109は、符号化アルゴリズムによってPCM信号を符号化する。符号器100はネットワーク送信器111に結合される。ネットワーク送信器111は符号化信号を受信し、インターネット105とインタフェースする。ネットワーク送信器は、符号化信号を受信器103にインターネット105を介して送信し得る。
【0071】
受信器103はネットワーク受信器113を備える。ネットワーク受信器113は、インターネット105とインタフェースしており、送信器101から符号化信号を受信するよう構成される。
【0072】
ネットワーク受信器111は復号器115に結合される。復号器115は符号化信号を受信し、復号化アルゴリズムによってこれを復号化する。
【0073】
信号再生機能がサポートされる特定例では、受信器103は、復号化オーディオ信号を復号器115から受信し、これをユーザに提示する信号プレイヤ117を更に備える。特に、信号プレイヤ113は、復号化オーディオ信号の出力に必要なディジタル・アナログ変換器、増幅器及びスピーカを備え得る。
【0074】
図2は、図1の符号器109を更に詳細に示す。符号器109は、符号化対象の時間領域オーディオ信号を受信する受信器201を備える。オーディオ信号は、何れかの外部ソース又は内部ソースから(局所信号記憶装置などから)受信することができる。
【0075】
受信器は第1のフィルタ・バンク203に結合される。第1のフィルタ・バンク203は、別々の複数のサブバンドを備えるサブバンド信号を生成する。特に、第1のフィルタ・バンク203は、SBR、PSやSACなどのパラメトリック符号化手法によって知られているQMFフィルタ・バンクであり得る。よって、第1のフィルタ・バンク203は、時間領域信号を非クリティカル・サンプリングした複素サブバンド領域表現に対応する第1のサブバンド信号を生成する。この特定例では、第1のサブバンド信号は、複素変調QMFフィルタの場合周知である2のオーバサンプリング係数を有している。
【0076】
各QMFバンドは、2倍にオーバサンプリングされるので、エイリアシング歪みを何らもたらすことなく個々のサブバンドに対して多くの信号処理演算を行うことが可能である。例えば、個々のサブバンドそれぞれは、例えば、スケーリングすることができ、かつ/又は、他のサブバンドを加算又は減算等することが可能である。よって、特定の実施例では、符号器109は、QMFサブバンドに対して非エイリアス信号処理演算を行う手段を更に備える。
【0077】
第1のサブバンド信号は、SBR、PSやSACなどのパラメトリック拡張符号器によって通常生成されるサブバンド信号に対応する。よって、第1のサブバンド信号を用いて、時間領域信号のパラメトリック拡張符号化を生成することができる。更に、図2の符号器109における同じサブバンド信号は、時間領域信号の波形符号化にも用いられる。よって、符号器109は、信号のパラメトリック符号化及び波形符号化のために同じフィルタ・バンク203を用いることが可能である。
【0078】
第1のサブバンド信号の複素値サブバンド領域表現の波形符号化における主たる課題は、これがコンパクトな表現を表さない(すなわち、2倍にオーバサンプリングされる)ことである。符号器109は、修正離散コサイン変換(MDCT)(MDCTの説明については、例えば、H. Malvarによる「Signal Processing with Lapped Transform, Artech House, Boston, London, 1992」を参照のこと)を元の時間領域信号に直接施すと得られる表現に近似する表現に複素サブバンド領域表現を直接変換する。MDCTに似たこの表現はクリティカル・サンプリングされる。そういうものとして、この信号は、結果として生じる表現を効率的に符号化し、効率的な波形符号化をもたらすために施すことが可能な既知の知覚オーディオ符号化手法に適している。
【0079】
特に、符号器109は、第1のサブバンド信号の個々のサブバンドに複素変換を施すことによって第2のサブバンド信号を第1のサブバンド信号から生成する変換プロセッサ205を備える。第2のサブバンド信号は、時間領域オーディオ信号をクリティカル・サンプリングしたサブバンド領域表現に対応する。
【0080】
よって、符号器109では、変換プロセッサ205は、通常の現行のパラメトリック拡張符号器と互換のQMFフィルタ・バンク出力を、通常の波形符号器において通常生成されるサブバンド信号に厳密に対応するクリティカル・サンプリングされた、MDCTに似たサブバンドに変換する。
【0081】
よって、QMF変換及びMDCT変換を用いるかわりに、第1のサブバンド信号をサブバンド領域において直接処理して第2のサブバンド信号を生成する。第2のサブバンド信号は、通常の波形符号器のMDCT信号として扱うことが可能である。よって、サブバンド信号を符号化するための既知の手法を施すことが可能であり、例えば、パラメトリック拡張符号化からの残差信号の効率的な波形符号化を達成することが可能である(時間領域への変換を要することなく)。よって、QMF合成フィルタの要件を不要にすることが可能である。
【0082】
この例では、符号器109は、変換プロセッサ205に結合される符号化プロセッサ207を備える。符号化プロセッサ207は、クリティカル・サンプリングされた、MDCTに似た第2のサブバンド信号を変換プロセッサ205から受信し、例えば、量子化、スケール係数、ハフマン符号化等をはじめとする通常の波形符号化手法を用いてこれを符号化する。結果として生じる符号化データは、符号化データ・ストリームに埋め込まれる。データ・ストリームは、例えば、パラメトリック符号化データなどの他の符号化データを更に備えることが可能である。
【0083】
以下に更に詳細に説明するように、変換プロセッサ205は、第1のフィルタ・バンク203の基本フィルタ(又はプロトタイプ・フィルタ)の情報を利用して、非エイリアス・バンド(又はパス・バンド)内の別々のサブバンドからの信号成分を合成し、エイリアス・バンド(又はストップバンド)からの信号成分を除去する。よって、サブバンド毎のエイリアス・バンド周波数成分を無視することが可能である。これによって、オーバサンプリングなしのクリティカル・サンプリングされた信号がもたらされる。
【0084】
特に、後述するように、変換プロセッサ205は、QMFフィルタ・バンクのサブバンド毎に複数のサブバンドを生成する第2のフィルタを備える。よって、サブバンドは更なる部分サブバンドに分けられる。QMFフィルタ間の重なりが理由で、時間領域信号の特定の信号成分(例えば、特定の周波数における正弦波)によって、別々の2つのQMFサブバンド内に信号成分がもたらされ得る。第2のフィルタ・バンクは、前述のサブバンドを、信号成分が第1のQMFサブバンドの一部分サブバンドにおいて表され、第2のQMFサブバンドの一部分サブバンドにおいて表されるように更に分割する。前述の2つの部分サブバンド信号のデータ値は合成器に供給される。合成器は2つの信号を合成して単一の信号成分を生成する。この信号成分は次いで符号化プロセッサ207によって符号化される。
【0085】
図3は、変換プロセッサ205の特定のエレメントの例を示す。特に、図3は、第1のQMFサブバンドの第1の変換フィルタ・バンク301、及び第2のQMFサブバンドの第2の変換フィルタを示す。同じ周波数に対応する部分サブバンドからの信号が次いで合成器305に供給される。合成器305は、部分サブバンドの単一の出力データ値を生成する。
【0086】
復号器115は符号器109の逆演算を行うことができる。図4は、復号器115を更に詳細に示す。
【0087】
復号器は、符号器109によって符号化された信号をネットワーク受信器113から受信する受信器401を備える。符号化信号は復号化プロセッサ403に転送される。復号化プロセッサ403は符号化プロセッサ207の波形符号化を復号化する。それによって、クリティカル・サンプリングされたサブバンド信号が再現される。この信号は復号化変換プロセッサ405に供給される。変換プロセッサ405は、変換プロセッサ205の逆演算を行うことによって、非クリティカル・サンプリングされたサブバンド信号を再現する。非クリティカル・サンプリングされた信号は次いで、QMF合成フィルタ407に供給される。QMF合成フィルタ407は、元の時間領域オーディオ符号化信号の復号化バージョンを生成する。
【0088】
特に、復号化変換プロセッサ405は、エイリアス・バンドにも非エイリアス・バンドにも信号バンドを備える部分サブバンド内の信号成分を再現するスプリッタ(逆バタフライ構造など)を備える。部分サブバンド信号は次いで、符号器109の変換フィルタ・バンク301、303に対応する合成フィルタ・バンクに供給される。前述のフィルタ・バンクの出力は、非クリティカル・サンプリングされたサブバンド信号に対応する。
【0089】
本発明の特定の実施例を以下に更に詳細に説明する。実施例の説明は、図5の符号器構造500を参照して説明する。符号器構造500は特に、図1の符号器109において実現することができる。
【0090】
符号器構造500は、64個のバンドの解析QMFフィルタ・バンク501を備える。
【0091】
QMF解析サブバンド・フィルタは以下のように説明することが可能である。実数値線形位相プロトタイプ・フィルタp(y)を前提とすれば、M個のバンドの複素変調解析フィルタ・バンクは、解析フィルタ
【0092】
【数1】
(サブバンド係数k=0,1,…,M−1)によって定義することが可能である。位相パラメータθは、以下の解析に対する重要性を有する。通常選ぶのは(N+M)/2である。ここで、Nはプロトタイプ・フィルタの次数である。
【0093】
実数値離散時間信号x(v)を前提とすれば、サブバンド信号vk(n)は、x(v)をhk(v)によってフィルタリング(畳み込み)し、次いで、図6(符号器109及び復号器115のQMF解析フィルタ・バンク及びQMF合成フィルタ・バンクの演算を示す)の左側によって示すようにM分の1に結果をダウンサンプリングすることによって得られる。
【0094】
図6の右側に示すように、合成演算が、まず、QMFサブバンド信号をM倍にアップサンプリングする工程、続いて、式(1)と同様なタイプの複素変調フィルタによってフィルタリングする工程、結果を加算する工程、及び、最後に実数部分を2倍する工程を備えるものとする。前述の場合、実数値入力信号x(v)のほぼ完全な再構成は、P. Ekstrandによる「Bandwidth extension of audio signals by spectral band replication, Proc. 1st IEEE Benelux Workshop on Model based Processing and Coding of Audio (MPCA-2000), pp. 53-58, Leuven, Belgium, November 15 2002」に記載されているような実数値線形位相プロトタイプ・フィルタp(v)の適切な設計によって得ることが可能である。
【0095】
以下では、
【0096】
【数2】
を離散時間信号z(n)の離散時間フーリエ変換とする。
【0097】
QMFバンクのほぼ完全な再構成特性に加えて、P(ω)(p(v)のフーリエ変換)が周波数区間[−π/M,π/M]の外で事実上ゼロになるものとする。
【0098】
ダウンサンプリングされた複素サブバンド領域信号のフーリエ変換は、
【0099】
【数3】
によって表される。ここで、kはサブバンド係数であり、Mはサブバンドの数である。プロトタイプ・フィルタの周波数応答が制限されるという前提によって、式(2)における和は、ω毎に一項しか有していない。
【0100】
対応する定型化絶対周波数応答を図7及び図8に示す。
【0101】
特に、図7は、ダウンサンプリング前の複素QMFバンク501の最初の数周波数バンドの定型化周波数応答を示す。図8は、偶数の(上の)サブバンドk及び奇数の(下の)サブバンドkについて、ダウンサンプリングされた複素QMFバンクの定型化周波数応答を示す。よって、図8に示すように、QMFフィルタ・バンドの中央はダウンサンプリング後、偶数サブバンドの場合、π/2にエイリアシングされ、非偶数サブバンドの場合、−π/2にエイリアシングされる。
【0102】
図8は、複素QMFバンクのオーバサンプリングの効果を示す。偶数係数kのバンド及び奇数係数kのバンドそれぞれの場合、周波数スペクトルの負の部分及び正の部分は、(元の実数値の)信号を再構成するために必要でない。ダウンサンプリングされたフィルタ・バンクの周波数スペクトルの前述の部分はエイリアス・バンド又はストップ・バンドとして表す一方、その他の部分はパス・バンド又は非エイリアス・バンドとして示す。エイリアス・バンドは、その他のサブバンドのスペクトルのパス・バンドにも存在している情報を有している。この特定の特性を用いて、効率的な符号化機構を得る。
【0103】
エイリアス・バンド及び非エイリアス・バンドは冗長な情報を備えており、一方を他方から判定することが可能である。更に、エイリアス・バンド及び非エイリアス・バンドの相補的解釈を用いることが可能である。
【0104】
以下に示すように、ダウンサンプリングされた解析フィルタ・バンク501の各出力において特定のタイプの更なるフィルタ・バンク503を施し、更なるフィルタ・バンク501の出力間に特定のバタフライ構造505を施すことによって、QMF解析フィルタ・バンクのエイリアス・バンド(又はストップ・バンド)に対応するエネルギをゼロ、又はごくわずかな値に削減することが可能である。
【0105】
その結果、情報の半分(すなわち、フィルタ・バンク出力の半分)を廃棄することが可能である。その結果、クリティカル・サンプリングされた表現が得られる。この表現は、元の時間領域サンプルのMDCT変換によって達成される表現に非常に似ており、よって、MP3やAACなどの通常の波形符号器によって生成されるサブバンド信号に厳密に似ている。よって、波形符号化手法を、波形符号化プロセッサ507内のクリティカル・サンプリングされた信号に直接施すことが可能であり、時間領域への変換、及びこれに続くMDCTサブバンド生成に対する要件が何ら必要でない。結果として生じる符号化データが次いで、ビット・ストリーム内にビットストリーム・プロセッサ509によって備えられる。
【0106】
図9は、2つの正弦波を有する信号の場合のQMFサブバンド生成の効果を示す。
【0107】
複素周波数領域(例えば、FFTによって得られるものなど)では、各正弦波は、正の周波数として、かつ負の周波数としてスペクトル内に現れる。ここで、8個のバンドの複素QMFバンクを前提とする(図5の例では、64個のバンドのバンクが用いられる)。ダウンサンプリング前に、正弦波は、スペクトルA乃至Hに示すように現れる。図示したように、各正弦波は2つのサブバンドに存在している(例えば、低周波スペクトル線は第1のQMFサブバンドに対応するスペクトルA、並びに第2のQMFサブバンドに対応するスペクトルBに存在している。
【0108】
QMFバンクのダウンサンプリングの処理は、図9の下部分に示す。ここで、スペクトルIは、ダウンサンプリング前のスペクトルを示す。ダウンサンプリング処理は、以下のように解釈することが可能である。まず、スペクトルがM個のスペクトルA乃至Hに分離される。ここで、Mは、第1のサブバンド及び第2のサブバンドそれぞれについてI及びKにおいて示すようにダウンサンプリング係数(M=8)である。個々の分離スペクトルそれぞれをもう一度、完全な周波数範囲に拡張する(伸長する)。次いで、個々の分離スペクトル及び拡張スペクトル全てを加算する。よって、第1のサブバンド及び第2のサブバンドそれぞれについてスペクトルJ及びLにおいて示すようなスペクトルがもたらされる。
【0109】
要約すれば、サブバンド間の周波数区間を超える帯域幅を有する個々のサブバンドそれぞれのフィルタにより、時間領域信号の信号成分によって、別々の2つのサブバンドにおいて信号成分がもたらされる。更に、前述の信号成分のうちの1つがサブバンドのうちの1つのエイリアス・バンドに収まり、1つが別のサブバンドの非エイリアス・バンドに収まる。
【0110】
よって、スペクトルJ及びLに示すように、複素QMFバンクの最終出力スペクトルでは、成分はなお2つのサブバンド内に存在している。例えば、低周波スペクトル線は、第1のサブバンドのパス・バンド、並びに第2のサブバンドのストップ・バンドに存在している。何れも場合にもスペクトル線の大きさは、(シフトさせられた)プロトタイプ・フィルタの周波数応答によって表される。
【0111】
図5の実施例によれば、各変換がサブバンドの出力に施される更なる組の複素変換(フィルタ・バンク503)が加えられる。これを用いて、前述のサブバンドの周波数スペクトルを複数のサブバンドに更に分離する。
【0112】
QMFサブバンドのパス・バンド内の各サブバンドを次いで、隣接QMFサブバンド内のエイリアス・バンドの対応するサブバンドと合成する。この例では、スペクトルJに低周波正弦波を備える部分サブバンドを、スペクトルL内の低周波正弦波と合成する。これによって、時間領域信号の同じ低周波信号から生じる信号成分が単一の信号成分に合成される。
【0113】
更に、QMFプロトタイプ・フィルタの周波数応答を補償するために、各サブバンドからの値が合成前に周波数応答の相対振幅によって重み付けされる(QMFプロトタイプ・フィルタの振幅応答は各部分サブバンド内で一定である)。
【0114】
ストップ・バンド内の信号成分は無視することが可能であるか、又は、パス・バンドからの値によって補償し、それによってエイリアス・バンド内のエネルギを事実上削減することができる。よって、変換プロセッサ207の演算は、周波数毎に生じる2つの信号成分のエネルギを、QMFサブバンドのうちの1つのパス・バンド内の単一の信号成分に集中させることに対応するものとしてみなすことが可能である。よって、エイリアス・バンド又はストップ・バンドにおける信号値を無視することが可能であるので、2分の1に効率的にダウンサンプリングすることを達成し、それによって、クリティカル・サンプリングされた信号をもたらすことが可能である。
【0115】
以下に示すように、信号成分の合成(及びエイリアス・バンド内の信号成分の打ち消し)はバタフライ構造を用いることによって達成することが可能である。
【0116】
基本的に、(フィルタ・バンク503によって)別の(50%が重なる)複素変換をサブバンド信号に施すことによって、2倍の別のアップサンプリングがもたらされる。しかし、選ばれた変換は、特定の対称特性を有しており、それによって、データの50%の削減が可能になる。結果として生じる変換は、MDCTを実数データに施し、MDSTを虚数データに施すことに同等であるとみなすことが可能である。何れも、クリティカル・サンプリングされた変換であり、よって、アップサンプリングは何ら行われない。
【0117】
更に詳細には、フィルタ・バンク503は、R=2Q個のバンドを有する複素変調フィルタ・バンクであり得る。サブバンド毎のフィルタ・バンク503の定型化周波数応答の例を図10にサブバンドk毎に示す。分かり得るように、フィルタ・バンクは、奇数でスタックされており、DC値を中心としたサブバンドは何ら有していない。むしろ、この例では、サブバンドの中心周波数は、ゼロ付近で対称であり、第1のサブバンドの中心周波数は、サブバンド周波数オフセットの約半分である。
この第2のバンクにおけるダウンサンプリング係数はQであり、これは、解析フィルタ
【数4】
【0118】
(r=−Q、−Q+1、…,、Q−1)によって定義される。ここで、実数値プロトタイプ・ウィンドウw(v)は、w(v)=w(−v−1−Q)であるようなものである。このウィンドウは、(3)の実数部分又は(3)の虚数部分にフィルタが等しいフィルタ・バンク内の解析から完全な再構成を達成することが可能であるように企図することが可能である。前述の場合、R=2Q個のサブバンドのQのみでよい(正の周波数又は負の周波数)。顕著な例には、修正離散コサイン変換MDCTがある。
【0119】
しかし、図5の実施例では、複素値信号z(n)は代わりにフィルタ503によって解析され、結果として生じる信号はQ分の1にダウンサンプリングされ、実数部分が採られる。対応する合成演算は、Q倍にアップサンプリングする工程と、複素変調フィルタ
【0120】
【数5】
によって合成フィルタリングする工程と、R=2Q個のサブバンドにわたって結果を合計する工程であって、r=−Q、−Q+1,…,Q−1である工程と、最後に、結果を2で除算する工程とを有している。
【0121】
プロトタイプ・ウィンドウw(y)が、前述の実数バンクにおいて完全な再構成をもたらすよう企図された場合、複素のケースにおける解析及び合成を組み合わせた演算によって、複素値信号z(n)が完全に再構成される。このことが分かるために、Cが、(3)の実数部分に等しい解析フィルタを有する解析バンクを表し、Sが、−((3)の虚数部分)に等しい解析フィルタを有する解析バンクを表すものとする。その場合、複素解析バンク(3)は、E=C−iSとして記述することが可能である。複素信号をz=ζ+iηとして記述することによって、
【0122】
【数6】
が得られる。
【0123】
ここで、(5)は、正の周波数r=0,…,Q−1及び負の周波数r=−Q,…,−1について求められる。(3)においてrを−1−rに置き換えると解析フィルタの複素共役につながるので、解析(5)によって、正の周波数r=0,…,Q−1の場合、Cζ+Sη及びCζ−Sηへのアクセスがもたらされる。合成の場合、この情報をCζ及びSηに容易に再合成することが可能である。そこから、ζ及びηの完全な再構成が、対応する実数値合成バンクによって可能である。この再構成が、複素解析、実数部分、複素合成、及び2での除算の演算に同等であるという主張を証明する簡単な詳細は割愛する。
【0124】
このフィルタ・バンク構造は、Karp T., Fliege N.J.による「Modified DFT Filter Banks with Perfect Reconstruction, IEEE Transactions on Circuits and Systems-II: Analog and Digital Signal Processing, Vol. 46, No. 11, November 1999」とは同一でないが関連している。主たる差は、本願のフィルタ・バンクが奇数でスタックされていることである。このことは、以下に提案されるハイブリッド構造の場合に効果的である。
【0125】
k=0,1,…,M−1及びr=−Q,−Q+1,…,Q−1それぞれについて、vk,r(n)を、解析フィルタ503による複素QMF解析信号yk(v)を解析し、Q分の1にダウンサンプリングし、実数部分を採ることによって達成される部分サブバンド信号とする。これによって、元のサンプリング・レートのサンプリング・レート1/(QM)における合計2QM個の実数値信号がもたらされる。よって、2倍にオーバサンプリングされた表現が得られる。図8及び図10を参照すれば、パス・バンド信号を
【0126】
【数7】
によって定義することが好都合である。同様に、前述したストップ・バンド信号又は「エイリアス・バンド」信号は、
【0127】
【数8】
によって定義される。
【0128】
前述の信号はともに、クリティカル・サンプリングされている。
【0129】
次の工程は、時間信号が、周波数π/(2M)≦Ω≦π−π/(2M)における純粋な正弦波である場合であり、かつ(1)においてθ=0である場合、
【0130】
【数9】
であることを利用するものである。ここで、Cは複素定数である。その結果、隣接QMFバンドはよって、同じ周波数及び位相を有しているが、異なる振幅を有している(変調線形位相QMFプロトタイプ・フィルタの応答による)複素正弦波を有する。よって、前述の通り、2つの信号成分(1つのQMFサブバンドのパス・バンド内の1つ、及び隣接サブバンドのエイリアス・バンド内の1つ)が生じる。
【0131】
対応する対のサブバンド・サンプルを、重み付けされた和及び差に変換することは、よって、非常にわずかな差につながる。この変換の詳細を概説する前に指摘すべき点は、θ=0であるという前提が充足されない場合、QMFサンプルが好ましくは、
【0132】
【数10】
によって調整前プロセッサ511内で予め乗算すること(調節前処理)によって位相補償すべきであることである。
【0133】
あるいは、調整前プロセッサ内のkπの更なる位相ジャンプをバタフライ構造により、符号反転によって扱うことも可能である。
【0134】
k=0,…,M−2の場合、和信号及び差信号は、
【0135】
【数11】
によって定義される。
【0136】
最初のQMFバンド及び最後のQMFバンドの場合、定義は、
【0137】
【数12】
によって置き換えられる。
【0138】
図11は、対応する変換バタフライ構造を示す。前述のバタフライ構造は、MPEG-1レイヤIII(MP3)に用いられるものと同様である。しかし、重要な差は、mp3のいわゆるアンチエイリアス・バタフライを用いて、実数値フィルタ・バンクのパス・バンド内のエイリアシングを削減することである。実数変調フィルタ・バンクでは、サブバンド内の正の周波数及び負の(複素の)周波数間で区別することが可能でない。合成工程では、サブバンド内の一正弦波はよって一般に、出力内の2つの正弦波につながる。このうちの1つ(すなわち、エイリアスされた正弦波)は、正しい周波数からかなり離れたところにある。実数バンク・アンチエイリアス・バタフライは、第2のハイブリッド・バンク合成を2つの隣接実数QMFバンドに誘導することによって、エイリアスされた正弦波を抑制することを目的としている。本願手法は、複素QMFサブバンドに第2のハイブリッド・バンクからの複素正弦波が供給される点で前述の場合と基本的に異なる。これは、最終出力内の正確に位置特定された1つの正弦波しかもたらさず、MP3のエイリアスの問題は全く生じない。バタフライ構造505は単に、差信号dが割愛された場合に、合成された解析演算及び合成演算の振幅応答を補正することを目的にしている。
【0139】
まず、変換係数がβk、γ=1及びαk,γ=0に設定された場合、信号対(s,d)は単に対(b,a)の複製になる。このことは選択的なやり方で行うことが可能である。(10)及び(11)の構造が、インプレース計算を行うことが可能であるようなものであるからである。このことは、ハイブリッド・フィルタ・バンク構造が、QMFバンドの部分集合にしか呼び出されない場合に重要性を有する。和演算及び差演算は全て、
【0140】
【数13】
である限り反転可能であり、
【0141】
【数14】
の場合、変換は直交である。
【0142】
対応する合成工程は、(10)及び(11)に非常に類似しており、当業者に明らかであろう。このことは、調整前プロセッサ511による調整前処理の反転についてもあてはまる。本願手法は、βk,Q−1−r=βk,rであり、αk,Q−1−r=αk,rである選択の場合に信号dk,r(n)が非常に少なくなり、かつ、
【0143】
【数15】
であり、Kが正規化定数であることを教示している。
【0144】
サブバンドk毎の更なるフィルタ・バンクがクリティカル・サンプリングされ、完全に再構成されるという前提では、エイリアス・バンド部分サブバンド領域信号の近似は事実上、オーバサンプリングされた表現を、元の時間領域サンプルのMDCTに厳密に似た、クリティカル・サンプリングされた表現に変える。これによって、既知の知覚波形符号器と同様なやり方における複素サブバンド領域信号の効率的な符号化が可能になる。ストップ・バンド又はエイリアス・バンドに対応する変換係数を廃棄することの再構成エラーは、通常の変換長Q=16の場合、約34dBである。
【0145】
あるいは、ストップ・バンド又はエイリアス・バンドに対応する係数を、パス・バンドに対応する係数に更に符号化してより好適な再構成を得ることが可能である。これは、Qが非常に小さい(例えば、Q<8)場合に、又はQMFバンクの性能が劣悪である場合に有利であり得る。
【0146】
図5の例では、(10)及び(11)の和・差バタフライ505を施して信号対(s,d)を得る。このうち、この場合、支配的な成分のみが維持される。次の工程では、例えば、スケール係数符号化及び量子化を用いた通常の波形符号化手法を、結果として生じる信号に施す。符号化係数はビット・ストリームに埋め込まれる。
【0147】
復号器は、逆の処理をたどる。まず、係数がビット・ストリームから逆多重化され、復号化される。次いで、符号器の逆バタフライ演算、並びにこれに続く合成フィルタリング及び調整後処理を施して複素サブバンド領域信号を得る。前述の信号は最後に、QMF合成バンクによって時間領域に変換することが可能である。
【0148】
明確にするための上記説明は、種々の機能的装置及びプロセッサを参照して本発明の実施例を説明した。しかし、別々の機能的装置又はプロセッサ間の何れかの適切な機能分散を本発明を損なうことなく用いることができることは明らかであろう。例えば、別個のプロセッサ又はコントローラによって行うものとして示された機能を同じプロセッサ又はコントローラによって行うことができる。よって、特定の機能的装置への参照は、厳密な論理的又は物理的構造若しくは編成を示すのではなく単に、前述の機能を提供する適切な手段への参照としてみなすものとする。
【0149】
本発明は、ハードウェア、ソフトウェア、ファームウェアや、これらの何れかの組み合わせをはじめとする何れかの適切な形態で実施することが可能である。任意的には、本発明は、1つ又は複数のデータ・プロセッサ上及び/若しくはディジタル信号プロセッサ上で実行するコンピュータ・ソフトウェアとして少なくとも部分的に実現することができる。本発明の実施例の構成要素及び構成部分は、何れかの適切な方法で物理的に、機能的に、及び論理的に実現することができる。実際に、機能は、単一の装置において、複数の装置において、又は、他の機能的装置の一部として実施することができる。そういうものとして、本発明は、単一装置において実施することができ、又は、別々の装置及びプロセッサに物理的及び機能的に分散させることができる。
【0150】
本発明は、特定の実施例に関して説明したが、本明細書及び特許請求の範囲に記載の特定の形態に限定することを意図するものでない。むしろ、本発明の範囲は、特許請求の範囲によってのみ限定される。更に、特定の実施例に関して特徴を説明しているようにみえ得るが、前述の実施例の種々の特徴を本発明によって組み合わせることができることを当業者は認識するであろう。特許請求の範囲では、comprisingの語は、他の構成要素や工程が存在することを排除するものでない。
【0151】
更に、個々に列挙されているが、複数の手段、構成要素又は方法工程は、例えば、単一の装置又はプロセッサによって実現することができる。更に、個々の特徴は、別々の請求項に備え得るが、場合によっては、効果的に組み合わせてもよく、別々の請求項に備えていることは、特徴の組み合わせが実現可能でないこと及び/又は効果的でないことを示唆するものでない。更に、一クレーム・カテゴリーに特徴を備えていることは、このカテゴリーに限定することを示唆するものでなく、むしろ、他のクレーム・カテゴリーに特徴が適宜、同様に適用可能であることを示す。更に、クレーム内の構成の順序は、構成を実施しなければならない何れかの特定の順序を示唆するものでなく、特に、方法クレームにおける個々の工程の順序は、この順序で工程を行わなければならないことを示唆するものでない。むしろ、工程は、何れかの適切な順序で行うことができる。更に、単数形の記載は、複数形を排除するものでない。よって、「a」、「an」、「first」、「second」等への参照は、複数形を排除するものでない。単に明瞭化する例として記載した、特許請求の範囲における参照符号は、特許請求の範囲を如何なる方法によって限定されるものとも解されないものとする。
【図面の簡単な説明】
【0151】
【図1】本発明の特定の実施例による、オーディオ信号の通信のための送信システム100を示す図である。
【図2】本発明の特定の実施例による符号器を示す図である。
【図3】本発明の特定の実施例による符号器の特定のエレメントの例を示す図である。
【図4】本発明の特定の実施例による復号器を示す図である。
【図5】本発明の特定の実施例による符号器を示す図である。
【図6】解析及び合成のフィルタ・バンクの例を示す図である。
【図7】QMFフィルタ・バンクのスペクトルの例を示す図である。
【図8】ダウンサンプリングされたQMFサブバンド・フィルタ・スペクトルの例を示す図である。
【図9】QMFサブバンドのスペクトルの例を示す図である。
【図10】サブバンド・フィルタ・バンクのスペクトルの例を示す図である。
【図11】バタフライ変換構造の例を示す図である。
Claims (27)
- 波形復号化によって時間領域オーディオ信号を生成するための復号器であって、
符号化データ・ストリームを受信するための受信器と、
前記符号化データ・ストリームのデータ値を復号化することによって第1のサブバンド信号を生成するための生成器とを備え、前記第1のサブバンド信号は、前記時間領域オーディオ信号のクリティカル・サンプリングされたサブバンド領域信号表現に対応し、前記復号器は、さらに、
サブバンド処理によって第2のサブバンド信号を前記第1のサブバンド信号またはその処理バージョンから生成するための変換器を備え、前記第2のサブバンド信号は、前記時間領域オーディオ信号の非クリティカル・サンプリングされた複素サブバンド領域表現に対応し、前記復号器は、さらに、
パラメトリックデータを前記第2のサブバンド信号を用いてパラメトリック復号化するためのパラメトリック復号器と、
前記時間領域オーディオ信号を前記第2のサブバンド信号から生成するための合成フィルタ・バンクとを備える、復号器。 - 請求項1に記載の復号器であって、前記第1のサブバンド信号の各サブバンドは、複数の部分サブバンドを含み、前記変換器は、前記第2のサブバンド信号のサブバンドを前記第1のサブバンド信号の部分サブバンドから生成するための第2の合成フィルタ・バンクを含む、復号器。
- 請求項2に記載の復号器であって、前記第2のサブバンド信号の各サブバンドは、エイリアス・バンド及び非エイリアス・バンドを含み、前記変換器は、前記第1のサブバンド信号の部分サブバンドを前記第2のサブバンド信号の第1のサブバンドのエイリアス部分サブバンド、及び前記第2のサブバンド信号の第2のサブバンドの非エイリアス・サブバンドに分割するための分離器を含み、前記エイリアス・サブバンド及び前記非エイリアス・サブバンドは、前記合成フィルタ・バンクによって生成される時間領域信号の対応する周波数区間を有する、復号器。
- 分離器がバタフライ構造を有する、請求項3に記載の復号器。
- 時間領域オーディオ信号を符号化する符号器であって、
前記時間領域オーディオ信号を受信するための受信器と、
第1のサブバンド信号を前記時間領域オーディオ信号から生成する第1のフィルタ・バンクとを備え、前記第1のサブバンド信号は、時間領域信号の非クリティカル・サンプリングされた複素サブバンド領域表現に対応し、前記符号器は、さらに、
前記時間領域信号を前記第1のサブバンド信号を用いてパラメトリック符号化するためのパラメトリック符号器と、
第2のサブバンド信号を前記第1のサブバンド信号またはその処理バージョンからサブバンド処理によって生成するための変換器とを備え、前記第2のサブバンド信号は、前記時間領域オーディオ信号のクリティカル・サンプリングされたサブバンド領域表現に対応し、前記符号器は、さらに、
前記第2のサブバンド信号のデータ値を符号化することによって波形符号化データ・ストリームを生成するための生成器を備える、符号器。 - 請求項5に記載の符号器であって、前記変換器は、前記第1のサブバンド信号のサブバンド毎に複数の部分サブバンドを生成するための第2のフィルタ・バンクを含む、符号器。
- 前記第2のフィルタ・バンクは奇数でスタックされる、請求項6に記載の符号器。
- 請求項6に記載の符号器であって、前記第1のサブバンド信号の各サブバンドは、前記サブバンドのエイリアス・バンドに対応する特定のエイリアス部分サブバンドと、前記サブバンドの非エイリアス・バンドに対応する特定の非エイリアス部分サブバンドとを含み、前記変換器は、第1のサブバンドのエイリアス部分サブバンドを第2のサブバンドの非エイリアス部分サブバンドと合成するための合成器を含み、前記エイリアス部分サブバンド及び前記非エイリアス部分サブバンドは、前記符号器によって生成される前記時間領域信号の対応する周波数区間を有する、符号器。
- 請求項8に記載の符号器であって、前記合成器は、前記エイリアス・バンド内のエネルギを削減するよう構成される、符号器。
- 請求項8に記載の符号器であって、前記合成器は、前記第1のサブバンド内の第1のエイリアス部分サブバンド及び前記第2のサブバンド内の第1の非エイリアス部分サブバンドの非エイリアス和信号を生成するための信号生成器を備える、符号器。
- 請求項10に記載の符号器であって、前記信号合成器は、前記非エイリアス和信号を生成するためのバタフライ構造を備える、符号器。
- 請求項11に記載の符号器であって、前記バタフライ構造の少なくとも1つの係数は、前記第1のフィルタ・バンクのフィルタの周波数応答によって変わってくる、符号器。
- 請求項8に記載の符号器であって、前記変換器は、前記符号化データ・ストリーム内の前記エイリアス・バンドのデータ値を含まないよう構成される、符号器。
- 請求項5に記載の符号器であって、前記第2のサブバンド信号への変換に先行して前記第1のサブバンド信号に対して非エイリアス信号処理を行うための非エイリアス信号生成器を更に備える、符号器。
- 請求項5に記載の符号器であって、前記第2のサブバンド信号への変換に先行して前記第1のサブバンド信号を位相補償するための位相補償器を更に備える、符号器。
- 請求項5に記載の符号器であって、前記第1のフィルタ・バンクは、QMFフィルタ・バンクである、符号器。
- 波形復号化によって時間領域オーディオ信号を生成する方法であって、
符号化データ・ストリームを受信する工程と、
前記符号化データ・ストリームのデータ値を復号化することによって第1のサブバンド信号を生成する工程とを含み、前記第1のサブバンド信号は、前記時間領域オーディオ信号のクリティカル・サンプリングされたサブバンド領域信号表現に対応し、前記方法は、さらに、
サブバンド処理によって第2のサブバンド信号を前記第1のサブバンド信号またはその処理バージョンから生成する工程を含み、前記第2のサブバンド信号は、前記時間領域オーディオ信号の非クリティカル・サンプリングされた複素サブバンド領域表現に対応し、前記方法は、さらに、
パラメトリックデータを前記第2のサブバンド信号を用いてパラメトリック復号化する工程と、
合成フィルタ・バンクが前記時間領域オーディオ信号を前記第2のサブバンド信号から生成する工程とを含む、方法。 - 時間領域オーディオ信号を符号化する方法であって、
前記時間領域オーディオ信号を受信する工程と、
第1のフィルタ・バンクが第1のサブバンド信号を前記時間領域オーディオ信号から生成する工程とを含み、前記第1のサブバンド信号は、時間領域信号の非クリティカル・サンプリングされた複素サブバンド領域表現に対応し、前記方法は、さらに、
前記時間領域信号を前記第1のサブバンド信号を用いてパラメトリック符号化する工程と、
第2のサブバンド信号を前記第1のサブバンド信号またはその処理バージョンからサブバンド処理によって生成する工程とを含み、前記第2のサブバンド信号は、前記時間領域オーディオ信号のクリティカル・サンプリングされたサブバンド領域表現に対応し、前記方法は、さらに、
前記第2のサブバンド信号のデータ値を符号化することによって波形符号化データ・ストリームを生成する工程を含む、方法。 - オーディオ信号を受信するための受信器であって、
符号化データ・ストリームを受信するためのストリーム受信器と、
前記符号化データ・ストリームのデータ値を復号化することによって第1のサブバンド信号を生成するための生成器とを備え、前記第1のサブバンド信号は、時間領域オーディオ信号のクリティカル・サンプリングされたサブバンド領域信号表現に対応し、前記受信器は、さらに、
サブバンド処理によって第2のサブバンド信号を前記第1のサブバンド信号またはその処理バージョンから生成するための変換器を備え、前記第2のサブバンド信号は、前記時間領域オーディオ信号の非クリティカル・サンプリングされた複素サブバンド領域表現に対応し、前記受信器は、さらに、
パラメトリックデータを前記第2のサブバンド信号を用いてパラメトリック復号化するためのパラメトリック復号器と、
時間領域オーディオ信号を前記第2のサブバンド信号から生成するための合成フィルタ・バンクとを備える、受信器。 - 符号化オーディオ信号を送信するための送信器であって、
時間領域オーディオ信号を受信するための受信器と、
第1のサブバンド信号を前記時間領域オーディオ信号から生成するための第1のフィルタ・バンクとを備え、前記第1のサブバンド信号は、時間領域信号の非クリティカル・サンプリングされた複素サブバンド領域表現に対応し、前記送信器は、さらに、
前記時間領域信号を前記第1のサブバンド信号を用いてパラメトリック符号化するためのパラメトリック符号器と、
第2のサブバンド信号を前記第1のサブバンド信号またはその処理バージョンからサブバンド処理によって生成するための変換器とを備え、前記第2のサブバンド信号は、前記時間領域オーディオ信号のクリティカル・サンプリングされたサブバンド領域表現に対応し、前記送信器は、さらに、
前記第2のサブバンド信号のデータ値を符号化することによって波形符号化データ・ストリームを生成するための生成器と、
前記波形符号化データ・ストリームを送信するためのストリーム送信器とを備える、送信器。 - 時間領域オーディオ信号を送信するための送信システムであって、
送信器を備え、前記送信器は、
前記時間領域オーディオ信号を受信するための信号受信器と、
第1のサブバンド信号を前記時間領域オーディオ信号から生成するための第1のフィルタ・バンクとを含み、前記第1のサブバンド信号は、時間領域信号の非クリティカル・サンプリングされた複素サブバンド領域表現に対応し、前記送信器は、さらに、
前記時間領域信号を前記第1のサブバンド信号を用いてパラメトリック符号化するためのパラメトリック符号器と、
第2のサブバンド信号を前記第1のサブバンド信号またはその処理バージョンからサブバンド処理によって生成するための変換器とを含み、前記第2のサブバンド信号は、前記時間領域オーディオ信号のクリティカル・サンプリングされたサブバンド領域表現に対応し、前記送信器は、さらに、
前記第2のサブバンド信号のデータ値を符号化することによって波形符号化データ・ストリームを生成するための生成器と、
前記波形符号化データ・ストリームを送信するためのストリーム送信器とを含み、
前記送信システムは、さらに、受信器を備え、前記受信器は、
前記波形符号化データ・ストリームを受信するためのストリーム受信器と、
前記符号化データ・ストリームのデータ値を復号化することによって第3のサブバンド信号を生成するための生成器とを含み、前記第3のサブバンド信号は、前記時間領域オーディオ信号のクリティカル・サンプリングされたサブバンド領域信号に対応し、前記受信器は、さらに、
第4のサブバンド信号を前記第3のサブバンド信号またはその処理バージョンからサブバンド処理によって生成するための変換器を含み、前記第4のサブバンド信号は、前記時間領域オーディオ信号の非クリティカル・サンプリングされた複素サブバンド領域表現に対応し、前記受信器は、さらに、
パラメトリックデータを前記第4のサブバンド信号を用いてパラメトリック復号化するためのパラメトリック復号器と、
時間領域オーディオ信号を前記第4のサブバンド信号から生成するための合成フィルタ・バンクとを含む、送信システム。 - オーディオ信号を受信する方法であって、
符号化データ・ストリームを受信する工程と、
前記符号化データ・ストリームのデータ値を復号化することによって第1のサブバンド信号を生成する工程とを含み、前記第1のサブバンド信号は、時間領域オーディオ信号のクリティカル・サンプリングされたサブバンド領域信号表現に対応し、前記方法は、さらに、
第2のサブバンド信号を前記第1のサブバンド信号またはその処理バージョンからサブバンド信号によって生成する工程を含み、前記第2のサブバンド信号は、前記時間領域オーディオ信号の非クリティカル・サンプリングされた複素サブバンド領域表現に対応し、前記方法は、さらに、
パラメトリックデータを前記第2のサブバンド信号を用いてパラメトリック復号化する工程と、
合成フィルタ・バンクを用いて時間領域オーディオ信号を前記第2のサブバンド信号から生成する工程とを備える、方法。 - 符号化オーディオ信号を送信する方法であって、
時間領域オーディオ信号を受信する工程と、
第1のフィルタ・バンクが、第1のサブバンド信号を前記時間領域オーディオ信号から生成する工程とを含み、前記第1のサブバンド信号は、前記時間領域信号の非クリティカル・サンプリングされた複素サブバンド領域表現に対応し、前記方法は、さらに、
前記時間領域信号を前記第1のサブバンド信号を用いてパラメトリック符号化する工程と、
第2のサブバンド信号を前記第1のサブバンド信号またはその処理バージョンからサブバンド処理によって生成する工程とを含み、前記第2のサブバンド信号は、前記時間領域オーディオ信号のクリティカル・サンプリングされたサブバンド領域表現に対応し、前記方法は、さらに、
前記第2のサブバンド信号のデータ値を符号化することによって波形符号化データ・ストリームを生成する工程と、
前記波形符号化データ・ストリームを送信する工程とを含む、方法。 - 時間領域オーディオ信号を送信し、受信する方法であって、
送信器が、
前記時間領域オーディオ信号を受信する工程と、
第1のフィルタ・バンクが第1のサブバンド信号を前記時間領域オーディオ信号から生成する工程とを含み、前記第1のサブバンド信号は、時間領域信号の非クリティカル・サンプリングされた複素サブバンド領域表現に対応し、前記方法は、さらに、
前記時間領域信号を前記第1のサブバンド信号を用いてパラメトリック符号化する工程と、
第2のサブバンド信号を前記第1のサブバンド信号またはその処理バージョンからサブバンド処理によって生成する工程とを含み、前記第2のサブバンド信号は、前記時間領域オーディオ信号のクリティカル・サンプリングされたサブバンド領域表現に対応し、前記方法は、さらに、
前記第2のサブバンド信号のデータ値を符号化することによって波形符号化データ・ストリームを生成する工程と、
前記波形符号化データ・ストリームを送信する工程と、
受信器が、
前記波形符号化データ・ストリームを受信する工程と、
前記符号化データ・ストリームのデータ値を復号化することによって第3のサブバンド信号を生成する工程とを含み、前記第3のサブバンド信号は、前記時間領域オーディオ信号のクリティカル・サンプリングされたサブバンド領域信号表現に対応し、前記方法は、さらに、
第4のサブバンド信号を前記第3のサブバンド信号またはその処理バージョンからサブバンド処理によって生成する工程を含み、前記第4のサブバンド信号は、前記時間領域オーディオ信号の非クリティカル・サンプリングされた複素サブバンド領域表現に対応し、前記方法は、さらに、
パラメトリックデータを前記第4のサブバンド信号を用いてパラメトリック復号化する工程と、
合成フィルタ・バンクを用いて時間領域オーディオ信号を前記第4のサブバンド信号から生成する工程とを含む、方法。 - 請求項17、18、22、23又は24の何れかに記載の方法を実行するコンピュータ・プログラム。
- 請求項1に記載の復号器を備えたオーディオ再生装置。
- 請求項5に記載の符号器を備えたオーディオ記録装置。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP04105457 | 2004-11-02 | ||
EP04105457.8 | 2004-11-02 | ||
EP05108293.1 | 2005-09-09 | ||
EP05108293 | 2005-09-09 | ||
PCT/IB2005/053545 WO2006048814A1 (en) | 2004-11-02 | 2005-10-31 | Encoding and decoding of audio signals using complex-valued filter banks |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2008519290A JP2008519290A (ja) | 2008-06-05 |
JP2008519290A5 JP2008519290A5 (ja) | 2008-07-17 |
JP4939424B2 true JP4939424B2 (ja) | 2012-05-23 |
Family
ID=35530766
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007538599A Active JP4939424B2 (ja) | 2004-11-02 | 2005-10-31 | 複素値のフィルタ・バンクを用いたオーディオ信号の符号化及び復号化 |
Country Status (11)
Country | Link |
---|---|
US (1) | US8255231B2 (ja) |
EP (1) | EP1810281B1 (ja) |
JP (1) | JP4939424B2 (ja) |
KR (1) | KR101187597B1 (ja) |
CN (2) | CN101053019B (ja) |
BR (1) | BRPI0517234B1 (ja) |
ES (1) | ES2791001T3 (ja) |
MX (1) | MX2007005103A (ja) |
PL (1) | PL1810281T3 (ja) |
RU (1) | RU2407069C2 (ja) |
WO (1) | WO2006048814A1 (ja) |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2099027A1 (en) * | 2008-03-05 | 2009-09-09 | Deutsche Thomson OHG | Method and apparatus for transforming between different filter bank domains |
BR122019023709B1 (pt) | 2009-01-28 | 2020-10-27 | Dolby International Ab | sistema para gerar um sinal de áudio de saída a partir de um sinal de áudio de entrada usando um fator de transposição t, método para transpor um sinal de áudio de entrada por um fator de transposição t e meio de armazenamento |
CA3076203C (en) | 2009-01-28 | 2021-03-16 | Dolby International Ab | Improved harmonic transposition |
US8392200B2 (en) * | 2009-04-14 | 2013-03-05 | Qualcomm Incorporated | Low complexity spectral band replication (SBR) filterbanks |
TWI484481B (zh) * | 2009-05-27 | 2015-05-11 | 杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
US11657788B2 (en) * | 2009-05-27 | 2023-05-23 | Dolby International Ab | Efficient combined harmonic transposition |
KR101599884B1 (ko) * | 2009-08-18 | 2016-03-04 | 삼성전자주식회사 | 멀티 채널 오디오 디코딩 방법 및 장치 |
KR101697497B1 (ko) * | 2009-09-18 | 2017-01-18 | 돌비 인터네셔널 에이비 | 입력 신호를 전위시키기 위한 시스템 및 방법, 및 상기 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터 판독가능 저장 매체 |
RU2596033C2 (ru) | 2010-03-09 | 2016-08-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство и способ получения улучшенной частотной характеристики и временного фазирования способом расширения полосы аудио сигналов в фазовом вокодере |
WO2011110496A1 (en) | 2010-03-09 | 2011-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for handling transient sound events in audio signals when changing the replay speed or pitch |
AU2011226212B2 (en) * | 2010-03-09 | 2014-03-27 | Dolby International Ab | Apparatus and method for processing an input audio signal using cascaded filterbanks |
AU2011237882B2 (en) | 2010-04-09 | 2014-07-24 | Dolby International Ab | MDCT-based complex prediction stereo coding |
JP5850216B2 (ja) * | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
MY176904A (en) | 2010-06-09 | 2020-08-26 | Panasonic Ip Corp America | Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit, and audio decoding apparatus |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
MY156027A (en) * | 2010-08-12 | 2015-12-31 | Fraunhofer Ges Forschung | Resampling output signals of qmf based audio codecs |
KR101826331B1 (ko) * | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
JP5552988B2 (ja) * | 2010-09-27 | 2014-07-16 | 富士通株式会社 | 音声帯域拡張装置および音声帯域拡張方法 |
CA2929800C (en) | 2010-12-29 | 2017-12-19 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding/decoding for high-frequency bandwidth extension |
CN107786484B (zh) * | 2011-06-10 | 2021-02-09 | 技术研究及发展基金公司 | 接收机、发射机以及用于数字多子频带处理的方法 |
JP6155274B2 (ja) | 2011-11-11 | 2017-06-28 | ドルビー・インターナショナル・アーベー | 過剰サンプリングされたsbrを使ったアップサンプリング |
CN103366750B (zh) * | 2012-03-28 | 2015-10-21 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
CN103366749B (zh) * | 2012-03-28 | 2016-01-27 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
EP2682941A1 (de) * | 2012-07-02 | 2014-01-08 | Technische Universität Ilmenau | Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne |
EP2709106A1 (en) | 2012-09-17 | 2014-03-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal |
HUE032831T2 (en) | 2013-01-08 | 2017-11-28 | Dolby Int Ab | Model-based prediction in a critically sampled filter block |
CN104078048B (zh) * | 2013-03-29 | 2017-05-03 | 北京天籁传音数字技术有限公司 | 一种声音解码装置及其方法 |
KR20190134821A (ko) | 2013-04-05 | 2019-12-04 | 돌비 인터네셔널 에이비 | 스테레오 오디오 인코더 및 디코더 |
US9514761B2 (en) | 2013-04-05 | 2016-12-06 | Dolby International Ab | Audio encoder and decoder for interleaved waveform coding |
US9379830B2 (en) * | 2013-08-16 | 2016-06-28 | Arris Enterprises, Inc. | Digitized broadcast signals |
CN105849801B (zh) | 2013-12-27 | 2020-02-14 | 索尼公司 | 解码设备和方法以及程序 |
US9609451B2 (en) | 2015-02-12 | 2017-03-28 | Dts, Inc. | Multi-rate system for audio processing |
CN108140396B (zh) * | 2015-09-22 | 2022-11-25 | 皇家飞利浦有限公司 | 音频信号处理 |
EP3276620A1 (en) * | 2016-07-29 | 2018-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis |
EP3301673A1 (en) * | 2016-09-30 | 2018-04-04 | Nxp B.V. | Audio communication method and apparatus |
US10109959B1 (en) * | 2017-05-25 | 2018-10-23 | Juniper Networks, Inc. | Electrical connector with embedded processor |
JP7072041B2 (ja) * | 2020-12-11 | 2022-05-19 | 株式会社東芝 | 計算装置 |
JP7254993B2 (ja) * | 2020-12-11 | 2023-04-10 | 株式会社東芝 | 計算装置 |
TW202334938A (zh) * | 2021-12-20 | 2023-09-01 | 瑞典商都比國際公司 | 正交鏡像濾波器域中之沉浸式音訊及視訊服務空間重建濾波器庫 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1062963C (zh) * | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
JPH05235701A (ja) * | 1992-02-25 | 1993-09-10 | Nippon Steel Corp | 環状畳み込みによるディジタルフィルタバンク処理方法及び装置 |
DE19647399C1 (de) | 1996-11-15 | 1998-07-02 | Fraunhofer Ges Forschung | Gehörangepaßte Qualitätsbeurteilung von Audiotestsignalen |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
KR100335609B1 (ko) | 1997-11-20 | 2002-10-04 | 삼성전자 주식회사 | 비트율조절이가능한오디오부호화/복호화방법및장치 |
US6996198B2 (en) * | 2000-10-27 | 2006-02-07 | At&T Corp. | Nonuniform oversampled filter banks for audio signal processing |
CN1318904A (zh) * | 2001-03-13 | 2001-10-24 | 北京阜国数字技术有限公司 | 一种实用的基于小波变换的声音编解码器 |
JP3870193B2 (ja) * | 2001-11-29 | 2007-01-17 | コーディング テクノロジーズ アクチボラゲット | 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム |
JP3579047B2 (ja) * | 2002-07-19 | 2004-10-20 | 日本電気株式会社 | オーディオ復号装置と復号方法およびプログラム |
CA2399159A1 (en) * | 2002-08-16 | 2004-02-16 | Dspfactory Ltd. | Convergence improvement for oversampled subband adaptive filters |
KR100728428B1 (ko) * | 2002-09-19 | 2007-06-13 | 마츠시타 덴끼 산교 가부시키가이샤 | 오디오 디코딩 장치 및 오디오 디코딩 방법 |
WO2004105253A1 (ja) * | 2003-05-21 | 2004-12-02 | Sony Corporation | データ処理装置、符号化装置および符号化方法、復号装置および復号方法、並びにプログラム |
CN1875402B (zh) * | 2003-10-30 | 2012-03-21 | 皇家飞利浦电子股份有限公司 | 音频信号编码或解码 |
-
2005
- 2005-10-31 EP EP05797747.2A patent/EP1810281B1/en active Active
- 2005-10-31 KR KR1020077012506A patent/KR101187597B1/ko active IP Right Grant
- 2005-10-31 WO PCT/IB2005/053545 patent/WO2006048814A1/en active Application Filing
- 2005-10-31 BR BRPI0517234-9A patent/BRPI0517234B1/pt active IP Right Grant
- 2005-10-31 JP JP2007538599A patent/JP4939424B2/ja active Active
- 2005-10-31 US US11/718,238 patent/US8255231B2/en active Active
- 2005-10-31 MX MX2007005103A patent/MX2007005103A/es active IP Right Grant
- 2005-10-31 PL PL05797747T patent/PL1810281T3/pl unknown
- 2005-10-31 ES ES05797747T patent/ES2791001T3/es active Active
- 2005-10-31 CN CN2005800377577A patent/CN101053019B/zh active Active
- 2005-10-31 CN CN201110040478.3A patent/CN102148035B/zh active Active
- 2005-10-31 RU RU2007120591/09A patent/RU2407069C2/ru active
Also Published As
Publication number | Publication date |
---|---|
PL1810281T3 (pl) | 2020-07-27 |
CN101053019A (zh) | 2007-10-10 |
BRPI0517234B1 (pt) | 2019-07-02 |
BRPI0517234A (pt) | 2008-10-07 |
EP1810281B1 (en) | 2020-02-26 |
CN102148035B (zh) | 2014-06-18 |
RU2407069C2 (ru) | 2010-12-20 |
CN102148035A (zh) | 2011-08-10 |
US8255231B2 (en) | 2012-08-28 |
JP2008519290A (ja) | 2008-06-05 |
KR20070085681A (ko) | 2007-08-27 |
ES2791001T3 (es) | 2020-10-30 |
MX2007005103A (es) | 2007-07-04 |
EP1810281A1 (en) | 2007-07-25 |
US20090063140A1 (en) | 2009-03-05 |
KR101187597B1 (ko) | 2012-10-12 |
WO2006048814A1 (en) | 2006-05-11 |
CN101053019B (zh) | 2012-01-25 |
RU2007120591A (ru) | 2008-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4939424B2 (ja) | 複素値のフィルタ・バンクを用いたオーディオ信号の符号化及び復号化 | |
AU2010209673B2 (en) | Improved harmonic transposition | |
US11837246B2 (en) | Harmonic transposition in an audio coding method and system | |
AU2006336954B2 (en) | Efficient filtering with a complex modulated filterbank | |
US6963842B2 (en) | Efficient system and method for converting between different transform-domain signal representations | |
JP2022174061A (ja) | 符号化されたオーディオ信号を復号するためのデコーダおよびオーディオ信号を符号化するためのエンコーダ | |
CN102473417B (zh) | 频带扩展方法、频带扩展装置、集成电路及音频解码装置 | |
JP2004531151A (ja) | 時間離散オーディオサンプル値を処理する方法と装置 | |
KR101418227B1 (ko) | 스피치 시그널 부호화 방법 및 복호화 방법 | |
JP2013502607A (ja) | マルチチャネルオーディオデコーディング方法及び装置 | |
CA3162808C (en) | Improved harmonic transposition | |
AU2017258839B2 (en) | Improved Harmonic Transposition | |
AU2022291476B2 (en) | Improved Harmonic Transposition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080502 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081030 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20091203 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20091208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20091203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110607 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110902 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110913 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120214 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120224 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150302 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4939424 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |