JP5665987B2 - Qmfベースのオーディオコーデックの出力信号のリサンプリング - Google Patents

Qmfベースのオーディオコーデックの出力信号のリサンプリング Download PDF

Info

Publication number
JP5665987B2
JP5665987B2 JP2013523621A JP2013523621A JP5665987B2 JP 5665987 B2 JP5665987 B2 JP 5665987B2 JP 2013523621 A JP2013523621 A JP 2013523621A JP 2013523621 A JP2013523621 A JP 2013523621A JP 5665987 B2 JP5665987 B2 JP 5665987B2
Authority
JP
Japan
Prior art keywords
filter bank
signal
audio signal
sampling rate
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013523621A
Other languages
English (en)
Other versions
JP2013538367A (ja
Inventor
マルクス ローヴァッサー
マルクス ローヴァッサー
マーヌエル ヤンデア
マーヌエル ヤンデア
マクス ノイエンドルフ
マクス ノイエンドルフ
ラルフ ガイガー
ラルフ ガイガー
マルクス シェネル
マルクス シェネル
マティアス ヒルデンブラント
マティアス ヒルデンブラント
トビアス カルプカ
トビアス カルプカ
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=44630032&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP5665987(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ, フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2013538367A publication Critical patent/JP2013538367A/ja
Application granted granted Critical
Publication of JP5665987B2 publication Critical patent/JP5665987B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0211Frequency selective networks using specific transformation algorithms, e.g. WALSH functions, Fermat transforms, Mersenne transforms, polynomial transforms, Hilbert transforms
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0248Filters characterised by a particular frequency response or filtering method
    • H03H17/0264Filter sets with mutual related characteristics
    • H03H17/0272Quadrature mirror filters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/06Non-recursive filters
    • H03H17/0621Non-recursive filters with input-sampling frequency and output-delivery frequency which differ, e.g. extrapolation; Anti-aliasing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0294Variable filters; Programmable filters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Algebra (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Description

本発明は、オーディオ処理に関し、特に、QMFベースのオーディオコーデックの出力信号をリサンプリングするための装置および方法に関する。
ほとんどの低価格帯のオーディオ家電製品は、コストが理由で、固定のサンプリングレートを用いたデジタル−アナログ変換器を使用する。しかし、マルチメディア対応デバイスが様々な種類の音響源をサポートすることを必要とするとき、リサンプリングの処理は避けることができない。というのも、メディアファイルは、異なるサンプリングレートを使用して符号化されることがあり、更に、通信コーデックは、異なるサンプリングレートを使用するからである。異なるサンプルレートを選択することは、異なるオーディオコーデックおよび処理方法の動作基点に関する重大な事項である。サポートされる必要があるサンプルレートが異なっているほど、サンプルレート適合およびリサンプリングのタスクは、より複雑になる。
例えば現行のMPEG―D USAC(USAC=Unified Speech and Audio Coding(音声音響統合符号化))参照モデルにおいては、いくつかのまれな(16000Hzまたは22050Hzの整数倍でない)サンプリングレートが使用される。これらのレートは、2つの見解の間の妥協の結果である。1つ目は、特別に設計され、ある程度、全システムのサンプリングレートを表す統合されたACELP符号化ツールの名目上のサンプリングレート、2つ目が、より大きなオーディオ帯域幅を符号化すること、および/または、拡張性を実現することを可能にするように、ビットレートとともに、サンプリングレートを増加させる要望である。
部分的には、まれなサンプリングレートは、参照モデルの部分が導き出されたAMR―WB+システムから受け継いだものでもある。また、低ビットレートオーディオ符号化においては実際上、通常であるように、サンプリングレートは、したがってオーディオ帯域幅は、低ビットレートUSAC動作基点で、大幅に減少させられている。
特に、低USACビットレートでは、現在使用されるサンプリングレートは、上述の問題の両方を示す。それらは、低コストのハードウェアDAコンバータとは互換性がなく、追加的なポスト・リサンプリングステップを必要とする。オーディオ帯域幅は、人間の可聴範囲の上限を十分に下回るナイキスト周波数に制限される。
オーディオ処理ユニットの出力サンプリングレートを適合させるために、追加のリサンプリング機能モジュールは、この目的のために使用されており、かなりの量の追加のコンピュータ・リソースを必要とする。基本的には、補間器と任意のアップ・サンプラ(up sampler)およびダウン・サンプラ・モジュール(down sampler module)からなる、この目的のために使用される技術は、長い間変化がなかった。
本発明の目的は、オーディオ信号をリサンプリングするための改善された構想を提供することにある。本発明の目的は、請求項1に記載の装置、請求項13に記載の方法、および請求項14に記載のコンピュータ・プログラムによって解決される。
本発明によれば、オーディオ信号を処理するための装置が提供される。本装置は、処理されたオーディオ信号を得るために、異なる構成設定によってオーディオ信号を処理するための構成可能な第1のオーディオ信号処理装置を含む。ここで、本装置は、異なる構成設定が、結果として処理されたオーディオ信号の異なるサンプリングレートをもたらすように構成される。さらに、本装置は、第1の数の分析フィルタバンクチャネルを有する分析フィルタバンク、第2の数の合成フィルタバンクチャネルを有する合成フィルタバンク、および、所定のサンプリングレートを有するオーディオ信号を受信し、かつ、処理するように構成されている第2のオーディオ処理装置を含む。
さらに、本装置は、合成フィルタバンクのオーディオ信号出力が、所定のサンプリングレート、または、所定のサンプリングレートとは異なっており、かつ、分析フィルタバンク入力信号のサンプリングレートより所定のサンプリングレートに近いサンプリングレートを有するように、構成可能な第1のオーディオ信号処理装置に供給された構成設定によって、分析フィルタバンクチャネルの第1の数、または、合成フィルタバンクチャネルの第2の数を制御するための制御装置を含む。
本発明は、周波数領域表現信号帯域幅を変化させることによって、帯域幅変化が周波数領域においてなされなかった場合のように、結果として生じる相当する時間領域信号が、異なるサンプリングレートを有するという発見に基づく。帯域幅変化の操作は安価である。というのも、それは、周波数領域データを削除または付加することによって達成されることができるからである。
周波数領域から時間領域への変換ステップは、異なる周波数領域帯域幅(変換長)を処理することができるようにするために修正される必要がある。
修正された帯域幅周波数領域信号表現は、フィルタバンクに限定される代わりに、全体の信号処理方法に拡張されることもでき、したがって、全部の処理が、実際のターゲット出力信号特性を利用することを可能にする。
すべてのオーディオ信号源が、1つの信号出力サンプルレートにもたらされることができるというわけではない場合であっても、異なる出力サンプルレートの合計を減少させることは、すでに一定のデバイス上の多くのコンピュータのリソースを節約する。
フィルタバンクの煩雑さは、その長さに直接関連がある。フィルタバンク時間領域信号合成変換が、その変換長を減少させることによって、ダウンサンプリングするために修正される場合、その煩雑さは減少する。それが、その変換長を拡大することによってアップサンプリングするために使用される場合、その煩雑さは、増加するが、それでもなお、相当する信号ひずみ特性を有する追加のリサンプラのために必要な煩雑さのはるかに下回る。また、全体としての信号ひずみは、より少なくなる。というのも、追加のリサンプラによって生じたいかなる付加的な信号ひずみも除去されるからである。
実施形態によれば、分析フィルタバンクは、時間領域において示されている分析フィルタバンク入力信号を、複数の第1のサブバンド信号を有する第1の時間−周波数領域オーディオ信号に、変換させるように構成される。ここで、第1のサブバンド信号の数は、分析フィルタバンクチャネルの第1の数に等しい。この実施形態によれば、本装置は、第2の時間−周波数領域オーディオ信号の第2のサブバンド信号の数が、合成フィルタバンクチャネルの数と等しいように、構成設定(conf)に基づいて、第1の時間−周波数領域オーディオ信号から、複数の第2のサブバンド信号を有する第2の時間−周波数領域オーディオ信号を生成するように構成されている信号調節装置を更に含む。第2の時間−周波数領域オーディオ信号の第2のサブバンド信号の数は、第1の時間−周波数領域オーディオ信号のサブバンド信号の数とは異なる。さらにまた、合成フィルタバンクは、合成フィルタバンクのオーディオ信号出力として、時間領域オーディオ信号に第2の時間−周波数領域オーディオ信号を変換されるように構成される。
他の実施形態において、信号調節装置は、少なくとも一つの追加のサブバンド信号を生成することによって、第2の時間−周波数領域オーディオ信号を生成するように構成されうる。更なる実施形態において、信号調節装置は、少なくとも一つの追加のサブバンド信号を生成するために、スペクトル帯域複製を行うことによって、少なくとも一つの追加のサブバンド信号を生成するように構成される。他の実施形態において、信号調節装置は、追加のサブバンド信号としてゼロ信号を生成するように構成される。
実施形態によれば、分析フィルタバンクは、QMF(Quadrature Mirror Filter(直交ミラーフィルタ))分析フィルタバンクであり、合成フィルタバンクは、QMF合成フィルタバンクである。別の実施形態において、分析フィルタバンクは、MDCT(修正された離散コサイン変換)分析フィルタバンクであり、合成フィルタバンクは、MDCT合成フィルタバンクである。
実施形態において、本装置は、第1の合成サンプリングレートを有する合成フィルタバンク出力信号を受信するように構成されている、追加のリサンプラを含むことができる。追加のリサンプラは、第2の合成サンプリングレートを有するリサンプリングされた出力信号を受信するために、合成フィルタバンク出力信号をリサンプリングすることができる。実施形態による本装置と追加のリサンプラを組み合わせることによって、使用されたリサンプラの煩雑さを減少させることが可能である。高煩雑性リサンプラを使用する代わりに、2つの低煩雑性リサンプラが使用されうる。
別の実施形態において、本装置は、分析フィルタバンク入力信号として、第1の合成サンプリングレートを有する合成フィルタバンク出力信号を分析フィルタバンクに送るように構成されうる。このことによって、さらに、実施形態による装置の煩雑さは、低減されうる。膨大な数の分析及び合成フィルタバンクチャネルを有する分析フィルタバンクと合成フィルタバンクを使用する代わりに、フィルタバンクチャネルの数は、著しく減少させられるだろう。これは、1回又は複数回、分析及び合成変換を繰り返すことによって、達成する。実施形態によれば、分析及び合成フィルタバンクは、分析及び合成フィルタバンクチャネルの数が、変換サイクル(1つの変換サイクルは、分析ステップ及び合成ステップを含む)ごとに変更可能でありうるように、構成されうる。
制御装置は、インデックス番号を含む構成設定を受信するように構成されうる。さらにまた、制御装置は、それから、インデックス番号およびルックアップテーブルに基づいて、処理されたオーディオ信号のサンプリングレートまたは所定のサンプリングレートを決定するように構成されうる。これらの実施形態によれば、各構成設定において、明示した数の分析及び合成フィルタバンクチャネルを送信することは必要ではなく、その代わりに、特定の構成を識別している1つのインデックス番号が送信される。これは、構成設定を送信するために必要とされるビットレートを低減させる。
一実施形態によれば、制御装置は、許容可能な誤差に基づいて、第1の数の分析フィルタバンクチャネルまたは第2の数の合成フィルタバンクチャネルを決定するように構成される。実施形態において、制御装置は、実際の誤差を、許容可能な誤差と比較するための誤差比較器を含みうる。さらにまた、本装置は、構成設定から許容可能な誤差を得るように構成されうる。これらの実施形態によれば、リサンプリングの正確度を特定することが可能でありえる。特定の状況において、一方では、分析および合成フィルタバンクの煩雑さを低減させるために、従って計算の煩雑さを低減させるためにも、リサンプリングの精度が低減させられうることが理解されうる。
他の実施形態によれば、サラウンド信号をアップミックスするための装置が提供される。本装置は、複数のダウンミックスサブバンド信号を生成するために、ダウンミックス時間領域信号を時間−周波数領域に変換するための分析フィルタバンクを含む。さらに、本装置は、複数のサラウンドサブバンド信号を得るために、複数のサブバンド信号をアップミックスするための少なくとも2つのアップミックス装置を含む。さらにまた、本装置は、サラウンドサブバンド信号の数を調節するための少なくとも2つの信号調節装置を含む。少なくとも2つの信号調節装置は、第1の複数の入力サラウンドサブバンド信号を受信するように構成される。少なくとも2つの信号調節装置は、第2の複数の出力サラウンドサブバンド信号を出力するように構成される。ここで、第1の複数の入力サラウンドサブバンド信号の数および第2の複数の出力サラウンドサブバンド信号の数は異なる。さらに、本装置は、時間領域サラウンド出力信号を得るために、時間−周波数領域から時間領域に複数の出力サラウンドサブバンド信号を変換するための複数の合成フィルタバンクユニットを含む。さらにまた、本装置は、構成設定を受信するように構成される制御装置を含む。制御装置は、さらに、受信された構成設定に基づいて、分析フィルタバンクのチャネル数を制御し、合成フィルタバンクユニットのチャネル数を制御し、信号調節装置ユニットの第1の複数の入力サラウンドサブバンド信号の数を制御し、信号調節装置ユニットの第2の複数の出力サラウンドサブバンド信号の数を制御するように構成される。
本発明の好ましい実施態様は、添付した図を参照して後述される。
図1は、一実施形態によるオーディオ信号を処理するための装置を示す。 図2a〜図2cは、時間−周波数領域サンプルへの時間領域サンプルの変換を示す。 図3a〜図3cは、時間領域サンプルへの時間−周波数領域サンプルの変換を示す。 図4は、時間領域サンプルへの時間−周波数領域サンプルの変換を更なる図において示す。 図5は、一実施形態の基本的概念を示している2つのダイアグラムを示す。 図6は、更なる実施形態による装置を示す。 図7a及び7bは、実施形態によるルックアップテーブルを示す。 図8は、SBR処理を使用している実施形態による装置を示す。 図9は、一実施形態によるリサンプリングされたサンプリングレートでMPEGサラウンド信号をアップミックスするためのQMF分析および合成フィルタバンクを使用している別の実施形態による装置を示す。 図10は、SBR処理を使用している別の実施形態による装置を示す。 図11は、追加のリサンプラを含む別の実施形態による装置を示す。 図12は、一実施形態によるリサンプラとしてQMFを使用している装置を示す。 図13は、一実施形態による追加のリサンプラを使用している装置を示す。 図14は、別の実施形態によるリサンプラとしてQMFを使用している装置を示す。 図15は、本装置が他の変換サイクルを行うために分析フィルタバンクに合成フィルタバンク出力を送るように構成される、更なる実施形態による装置を示す。 図16は、誤差比較器を含む他の実施形態による制御装置を示す。 図17は、分析及び合成フィルタバンクチャネルの数をそれぞれ決定するための方法を示しているフローチャートを示す。 図18は、誤差比較器を含む更なる実施形態による制御装置を示す。
図1は、一実施形態によるオーディオ信号を処理するための装置を示す。オーディオ信号s0が、本装置に送られる。別の実施形態では、s0は、ビットストリーム、特にオーディオデータ・ビットストリームでありえる。さらに、本装置は、構成設定confを受信する。本装置は、処理されたオーディオ信号s1を得るために、構成設定confに従って、オーディオ信号s0を処理するための構成可能な第1のオーディオ信号処理装置110を含む。さらにまた、オーディオ信号を処理するための装置は、異なる構成設定confが、結果として処理されたオーディオ信号の異なるサンプリングレートをもたらすように、構成される。さらに、本装置は、第1の数の分析フィルタバンクチャネルc1を有する分析フィルタバンク120と、第2の数の合成フィルタバンクチャネルc2を有する合成フィルタバンク130とを含む。さらに、本装置は、所定のサンプリングレートを有するオーディオ信号s2を受信し、処理するように構成されている第2のオーディオ処理装置140を含む。さらにまた、本装置は、合成フィルタバンク130によるオーディオ信号出力s2が、所定のサンプリングレート、または、所定のサンプリングレートとは異なっているが、分析フィルタバンク120への入力信号s1のサンプリングレートより所定のサンプリングレートに近いサンプリングレートを有するように、構成可能な第1のオーディオ信号処理装置110に供給された構成設定confによって、分析フィルタバンクチャネルc1の第1の数または合成フィルタバンクチャネルc2の第2の数を制御するための制御装置150を含む。
分析フィルタバンクおよび合成フィルタバンクは、分析チャネルの数及び合成チャネルの数が構成可能であり、それらの数が構成可能なパラメータによって決定されうるように、構成されうる。
図2a〜図2cにおいて、時間−周波数領域サンプルへの時間領域サンプルの変換が示される。図2aの左側は、時間領域の(処理された)オーディオ信号の複数のサンプルを示す。図2aの左側に、640の時間サンプルが示される。最新の64の時間サンプルを「新しい時間サンプル(new time samples)」と呼び、一方、残りの576の時間サンプルを古い時間サンプル(old time sample)と呼ぶ。図2aによって示された実施形態において、短時間フーリエ変換(Short Time Fourier Transform(STFT))の第1のステップが行われる。576の古いサンプルおよび64の新しい時間サンプルは、64の周波数値に変換される、すなわち、64のサブバンドサンプル値が生成される。
図2bに示されたその後のステップにおいて、考慮された640の時間サンプルのうちの最も古い64の時間サンプルが除かれる。代わりに、64の新しい時間サンプルは、図2aによって示された処理ステップにおいて利用可能な残りのすでに考慮された576の時間サンプルと共に考慮される。これは、各処理ステップにおいて、64の時間サンプルだけ、640の時間サンプルの長さを有するスライディング・ウィンドウ(sliding window)をシフトすることとしてみなすことができる。さらに、図2bに示された処理ステップにおいても、更なる64のサブバンドサンプルは、考慮された640の時間サンプル(576の古いサンプルおよび初めて考慮される64の新しい時間サンプル)から生成される。これにより、64のサブバンド値の第2の組が生成される。64の新しいサブバンドサンプルが、64の新しい時間サンプルを考慮に入れることによって生成されると言えるだろう。
図2cに示されたその後のステップにおいて、さらに、スライディング・ウィンドウは、64の時間サンプルだけシフトされる、すなわち、最も古い64の時間サンプルが除かれ、64の新しい時間サンプルが考慮に入れられる。64の新しいサブバンドサンプルは、576の古い時間サンプルおよび64の新しい時間サンプルに基づいて生成される。図2cの右側から分かるように、64の新しいサブバンド値の新しい組が、STFTを行うことによって生成されている。
図2a〜図2cに示された処理は、追加の時間サンプルから追加のサブバンドサンプルを生成するために、繰り返し行われる。
大まかに説明すれば、64の新しい時間サンプルは、64の新しいサブバンドサンプルを生成するために必要である。
図2a〜図2cによって示された実施形態において、生成されたサブバンドサンプルの各組は、時間−周波数領域において、特定の時間インデックスで、サブバンドサンプルを示す。すなわち、時間インデックスjの第32のサブバンドサンプルは、時間−周波数領域の信号サンプルS[32,j]を示す。時間−周波数領域の特定の時間インデックスに関して、64のサブバンド値がその時間インデックスのために存在し、一方、時間領域における時点ごとに、多くて1つの信号値が存在する。他方、64の周波数バンドの各々のサンプリングレートは、時間領域の信号のわずか1/64である。
分析フィルタバンクによって生成されるサブバンド信号の数が、分析フィルタバンクのチャネルの数に依存することは、当業者によって理解される。例えば、分析フィルタバンクは、時間周波数領域における16、32、96、または128のサブバンド信号が、例えば16、32、96または128の時間サンプルから生成されうるように、それぞれ、16、32、96または128のチャネルを含みうる。
図3a〜図3bは、時間領域サンプルに時間−周波数領域サンプルの変換を示す。
図3aの左側は、時間−周波数領域のサブバンドサンプルの複数の組を示す。より詳細には、図3aの各縦方向のボックスは、時間−周波数領域の複数の64のサブバンドサンプルを示す。時間−周波数領域のスライディング・ウィンドウは、各々時間−周波数領域の64のサブバンドサンプルを含む10の時間インデックスをカバーする。逆短時間フーリエ変換(Inverse Short Time Fourier Transform(ISTFT))を行うことによって、図3aの右側に示されるように、64の時間サンプルは、考慮された(10×64の)サブバンドサンプルから生成される。
図3bに示されるその後の処理ステップにおいて、64のサブバンド値の最も古い組は、除かれる。その代わりに、スライディング・ウィンドウは、ここで、時間−周波数領域において異なる時間インデックスを有する64のサブバンド値の新しい組をカバーする。64の新しい時間サンプルは、考慮された640のサブバンドサンプル(576の古いサブバンドサンプルおよび初めて考慮される64の新しいサブバンドサンプル)から、時間領域において生成される。図3bの右側は、時間領域における状況を示す。図3bは、図3bの処理ステップにおいて生成された新しい64時間サンプルとともに、図3aに示したようなISTFTを行うことによって生成された64の古い時間サンプルを示す。
図3a,図3bに示された処理は、追加のサブバンドサンプルから追加の時間サンプルを生成するために、繰り返し行われる。
一般に合成フィルタバンク130の構想を説明するために、時間−周波数領域の64の新しいサブバンドサンプルは、時間領域の64の新しい時間サンプルを生成するために必要である。
合成フィルタバンクによって生成される時間サンプルの数が合成フィルタバンクのチャネルの数に依存することは、当業者に理解される。例えば、合成フィルタバンクは、時間領域の16、32、96、または128の時間サンプルが、例えば時間−周波数領域の16、32、96または128のサブバンドサンプルから生成されうるように、それぞれ、16、32、96または128チャネルを含みうる。
図4は、時間領域サンプルへの時間−周波数領域サンプルの変換を示している別の図を示す。各処理ステップにおいて、追加の64のサブバンドサンプル(すなわち、時間−周波数領域の次の時間インデックスの64のサブバンドサンプル)が、考慮される。最新の64のサブバンドサンプルについて考慮すると、64の新しい時間サンプルが生成されることができる。時間領域の信号のサンプリングレートは、64のサブバンド信号のそれぞれのサンプリングレートの64倍である。
図5は、実施形態の基本的概念を表している2つのダイアグラムを示す。図5の上部は、時間−周波数領域の信号の複数のサブバンドサンプルを表す。横座標は、時間を示す。縦座標は、周波数を示す。図5は、時間インデックスごとに、時間−周波数領域の信号が(「x」で印を付した)3つの追加のサブバンドサンプルを含むという点において、図4と異なる。すなわち、3つの追加のサブバンドは、時間−周波数領域の信号が、64のサブバンド信号を有するだけでなく、ここで67のサブバンド信号も有するように、追加された。図5の下部で示されたダイアグラムは、逆短時間フーリエ変換(Inverse Short Time Fourier Transform(ISTFT))を行った後に、時間領域の同じ信号の時間サンプルを示す。3つのサブバンドが、時間−周波数領域において追加されたので、時間−周波数領域の特定の時間インデックスの67の追加のサブバンドサンプルは、時間領域のオーディオ信号の67の新しい時間サンプルを生成するために使用されることができる。新しい67の時間サンプルが、時間−周波数領域の1つの時間インデックスの67の追加のサブバンドサンプルを使用して、時間領域において生成されたので、合成フィルタバンク130によって出力されたような時間領域におけるオーディオ信号s2のサンプリングレートは、サブバンド信号のそれぞれのサンプリングレートの67倍である。上記より分かるように、分析フィルタバンク120において64のチャネルを使用することは、分析フィルタバンク120に送られるとき、結果として処理されたオーディオ信号s1のサンプリングレートの1/64の各サブバンド信号のサンプリングレートをもたらす。分析フィルタバンク120および合成フィルタバンク130両方に関して、64のチャネルを有する分析フィルタバンク120および67のチャネルを有する合成フィルタバンク130は、結果として分析フィルタバンク120に入力されているオーディオ信号s1のサンプリングレートの67/64倍の合成フィルタバンクによって出力される信号s2のサンプリングレートをもたらす。
以下の構想を導き出すことができる。分析フィルタバンク120に送られる(処理された)オーディオ信号s1を考慮する。フィルタバンクがc1チャネルを有すると仮定し、更に、処理されたオーディオ信号のサンプリングレートがsr1であると仮定すると、各サブバンド信号のサンプリングレートは、sr1/c1である。合成フィルタバンクがc2チャネルを有すると更に仮定し、各サブバンド信号のサンプリングレートがsrsubbandであると仮定すると、合成フィルタバンク130によって出力されているオーディオ信号s2のサンプリングレートは、c2・srsubbandである。そのことは、合成フィルタバンク130によって出力されているオーディオ信号のサンプリングレートが、c2/c1・sr1であることを意味する。c1とは異なるc2を選択することは、合成フィルタバンク130によって出力されているオーディオ信号s2のサンプリングレートが、分析フィルタバンク120に入力されているオーディオ信号のサンプリングレートとは異なって設定することができることを意味する。
1とは異なるc2を選択することは、分析フィルタバンクチャネルの数が合成フィルタバンクチャネルの数と異なることを意味するだけではない。さらに、STFTによる分析フィルタバンク120によって生成されているサブバンド信号の数は、合成フィルタバンク130によってISTFTを行うときに必要であるサブバンド信号の数と異なる。
3つの異なる状況が、区別されることができる。
1がc2に等しい場合、分析フィルタバンク120によって生成されるサブバンド信号の数は、ISTFTのための合成フィルタバンク130によって必要なサブバンド信号の数に等しい。サブバンド調節は必要でない。
2がc1より小さい場合、分析フィルタバンク120によって生成されるサブバンド信号の数は、合成のための合成フィルタバンク130によって必要なサブバンド信号の数より大きい。実施形態によれば、最も高い周波数サブバンド信号は、削除されうる。例えば、分析フィルタバンク120が64のサブバンド信号を生成する場合であって、合成フィルタバンク130が61のサブバンド信号を必要とするだけである場合、最も高い周波数を有する3つのサブバンド信号は除かれうる。
2がc1より大きい場合、分析フィルタバンク120によって生成されるサブバンド信号の数は合成のための合成フィルタバンク130によって必要なサブバンド信号の数より小さい。
実施形態によれば、追加のサブバンド信号は、追加のサブバンド信号としてゼロ信号を追加することによって生成されうる。ゼロ信号は、各サブバンドサンプルの振幅値がゼロに等しい信号である。
別の実施形態によれば、追加のサブバンド信号は、追加のサブバンド信号として擬似ランダムサブバンド信号を追加することによって生成されうる。疑似ランダムサブバンド信号は、各サブバンドサンプルの値が擬似ランダムデータを含む信号である。ここで、擬似ランダムデータは、許容値範囲から疑似ランダム的に決定される必要がある。例えば、サンプルの擬似ランダム的に選択された振幅値は、最大振幅値より小さくなければならず、サンプルの位相値は、0と2π(含む)との間の範囲になければならない。
別の実施形態では、追加のサブバンド信号は、最も高いサブバンド信号のサンプル値を複製することによって生成され、追加のサブバンド信号のサンプル値としてそれらを使用する。別の実施形態では、最も高いサブバンドの位相値は、複製されて、追加のサブバンドのためのサンプル値として使用され、その一方で、最も高いサブバンドの振幅値は、例えば、それらの重みを減少させるために、重み係数で乗算され、それから追加のサブバンド信号のサブバンドサンプルの振幅値として使用される。例えば、追加のサブバンド信号のすべての振幅値は、重み係数0.9で乗算されうる。2つの追加のサブバンド信号が必要である場合、最も高いサブバンド信号の振幅値は、第1の追加のサブバンド信号を生成するために、重み係数0.9で乗算されうる。その一方で、すべての振幅値は、第2の追加のサブバンド信号を生成するために、重み係数0.8で乗算されうる。
Figure 0005665987
追加のサンプリングレート変換器を追加する代わりに、この機能は、すでに現存のQMF合成フィルタに組み込まれることができる。
作業負荷の増加は、同等の正確さを有するサンプリングレート変換器のそれを下回るが、サンプリングレート比は、任意とはなりえない。基本的に、QMF分析およびQMF合成フィルタバンクにおいて使用されるバンドの数の比率で決定される。通常、合成QMFの速い計算を可能にする出力バンドの数(例えば60、72、80、48、…)を使用することが好ましい。
QMFを使用するときに出力サンプルレートが変更されるのと同様に、オーディオ信号コーデックのサンプルレートも同様に調節され、それは、別の種類のフィルタバンク、例えばMDCT(修正離散コサイン変換)を使用する。
図6は、一実施形態による装置を示す。本装置は、信号調節装置125を含む。分析フィルタバンク120は、時間領域において示されている分析フィルタバンク入力信号s1を、複数の、例えば3つの第1のサブバンド信号s11、s12、s13を有する第1の時間−周波数領域オーディオ信号に変換させるように構成される。第1のサブバンド信号の数は、分析フィルタバンクチャネルの第1の数c1に等しい。
信号調節装置125は、構成設定confに基づいて、第1の時間−周波数領域オーディオ信号から、第2の時間−周波数領域オーディオ信号を生成するように構成される。第2の時間−周波数領域オーディオ信号は、複数の、例えば4つの第2のサブバンド信号s21、s22、s23、s24を有する。第2のサブバンド信号の数が合成フィルタバンクチャネルの数c2に等しいように、第2の時間−周波数領域オーディオ信号は生成される。第2の時間−周波数領域オーディオ信号の第2のサブバンド信号の数は、第1の時間−周波数領域オーディオ信号のサブバンド信号の数とは異なりうる。従って、サブバンド信号の数は、例えば、上記の構想のうちの1つによって、調節される必要がありうる。
合成フィルタバンク130は、合成フィルタバンク130のオーディオ信号出力s2として、時間領域オーディオ信号に、第2の時間−周波数領域オーディオ信号を変換させるように構成される。
しかし、他の実施形態において、信号調節装置125が含まれないこともある。分析フィルタバンク120が、合成フィルタバンク130によって必要とされるよりも多くのチャネルを供給する場合、合成フィルタバンクそれ自体が、必要ではないチャネルを除く。さらに、合成フィルタバンク130は、分析フィルタバンク120によって供給されたサブバンド信号の数が、合成フィルタバンクチャネルの数より小さい場合、ゼロ・サブバンド信号または擬似ランダムデータを含む信号をそれ自体が使用するように構成されうる。
その実施形態による装置は、異なる状況に適合することに特に適している。例えば、第1のオーディオ信号処理装置110は、処理されたオーディオ信号s1が、1つの状況において、第1のサンプリングレートsr1を有するように、そして、処理されたオーディオ信号s1が、第2の状況において、第1のサンプリングレートとは異なる第2のサンプリングレートsr1’を有するように、オーディオ信号s0を処理することを必要としうる。例えば、第1のオーディオ信号処理装置110は、例えば16000Hzの第1のサンプリングレートで動作しているACELP(代数符号励振線形予測(Algebraic Code Excited Linear Prediction))復号ツールを使用しうるが、一方、異なる第2の状況において、第1のオーディオ信号処理装置は、例えば48000Hzのサンプリングレートを例えば有するAAC(先進的音響符号化(Advanced Audio Coding))を使用しうる。さらに、第1のオーディオ信号処理装置が、異なるサンプリングレート間で切り替えるAACデコーダを使用するという状況が生じうる。または、第1の信号処理装置110は、第1のサンプリングレートsr1を有する第1のステレオオーディオ信号s1と、第2のサンプリングレートsr1’を有するMPEGサラウンド信号である第2のオーディオs1’信号との間で切り替えるように構成されうる。
さらに、特定の所定のサンプリングレートsr2を有する第2のオーディオ信号処理装置140にオーディオ信号を供給することは必要でありえる。例えば、使用されたデジタルアナログ変換器は、特定のサンプリングレートを必要しうる。この場合、第2信号処理装置140は、常に、固定の第2のサンプリングレートsr2で作動しうる。しかし、他の場合では、第2のオーディオ処理装置140のオーディオ信号s2のサンプリングレートは、実行時に変更しうる。例えば、第1のケースでは、第2のオーディオ信号処理装置140は、例えば24000Hzの比較的低いサンプリングレートをサポートしている第1の低いオーディオ品質のD/A(デジタル−アナログ)変換器間で切り替わりうるが、一方で、他の状況では、第2のオーディオ信号処理装置140は、例えば96000Hzのサンプリングレートを有する第2のDA変換器を使用しうる。例えば、第1のオーディオ信号処理装置110によって処理された、処理されたオーディオ信号sr2の最初のサンプリングレートが例えば4000Hzの比較的低いサンプリングレートを有する状況において、96000Hzのサンプリングレートを有する高品質の第2のDA変換器を使用することは必要でないかもしれないが、その代わりに、コンピュータのリソースをほとんど必要としない第1のDA変換器を使用することは十分である。従って、調節可能なサンプリングレートを有する装置を提供することが理解されうる。
一実施形態によれば、合成フィルタバンク130によるオーディオ信号出力が、所定のサンプリングレートsr2、または、所定のサンプリングレートsr2とは異なるが、分析フィルタバンク120への処理された入力信号s1のサンプリングレートsr1よりは所定のサンプリングレートsr2に近いサンプリングレートsr2を有するように、構成可能な第1のオーディオ信号処理装置110に供給された構成設定confによって分析フィルタバンクチャネルの第1の数c1および/または分析フィルタバンクチャネルの第2の数c2を制御する制御装置150を含む装置が提供される。
一実施形態において、構成設定は、第1のサンプリングレートsr1および/または第2のサンプリングレートsr2に関する明示的な情報を含みうる。例えば、構成設定は、第1のサンプリングレートsr1が9000Hzに設定され、第2のサンプリングレートsr2が24000Hzに設定されることを明示的に定めうる。
しかし、別の実施形態では、構成設定confは、サンプリングレートを明示的に特定することができない。代わりに、制御装置が第1のsr1および/または第2のサンプリングレートsr2を決定するために使用しうるインデックス番号が特定されうる。
一実施形態において、構成設定confは、実行時に制御装置に追加の装置(図示せず)によって供給されることができる。例えば、その追加の装置は、構成設定confにおいて、ACELPデコーダが使用されるか、AACデコーダが使用されるかを特定しうる。
代わりの実施形態において、構成設定confは追加の装置によって実行時に供給されないが、構成設定confは、それが制御装置150に永久に利用できるように、一回格納される。構成設定confは、それから長い期間、変更されないままである。
この決定に応じて、追加の装置は、明示的なサンプリングレートを、構成設定confに含められている制御装置に送ることができる。
代わりの実施形態において、追加の装置は、(「使用されたACELPデコーダ」を示しているインデックス値「0」を送信することによって、または、「使用されたAACデコーダ」を示しているインデックス値「1」を送信することによって)第1の状況が存在するかどうかを示す構成設定confを送る。これは、図7aおよび図7bを参照して説明される。
図7aおよび図7bは、制御装置が利用できる実施形態によるルックアップテーブルを示す。例えば、ルックアップテーブルは、制御装置の固定テーブルとして格納されている所定のルックアップテーブルでありえる。別の実施形態において、ルックアップテーブルは、追加の装置からのメタ情報として供給されうる。例えば、ルックアップテーブル情報が、長い期間ために1回送られるだけであるが、現在のサンプリングレート構成を特定しているインデックス値は、より頻繁に更新される。
図7aは、単一のサンプリングレートの解像度を可能にしているシンプルなルックアップテーブルを示し、図7aの実施形態において、第1のオーディオ信号処理装置110のサンプリングレートが特定される。第1の構成設定confに含まれているインデックス値を受信することによって、制御装置150は、第1のオーディオ信号処理装置110によって処理されている処理されたオーディオ信号s1のサンプリングレートを決定することが可能である。図7aのルックアップテーブルにおいて、第2のサンプリングレートsr2についての情報は利用できない。一実施形態において、第2のサンプリングレートは、固定のサンプリングレートであって、制御装置150に認識されたものである。別の実施形態では、第2のサンプリングレートは、図7aに示されたルックアップテーブルと類似している別のルックアップテーブルを使用することによって決定される。
図7bは、処理されたオーディオ信号s1の第1のサンプリングレートsr1と同様に合成フィルタバンクによって出力されているオーディオ信号s2の第2のサンプリングレートsr2に関する情報を含む他のルックアップテーブルを示す。追加の装置が、制御装置150にインデックス値を含む構成設定confを送信する。制御装置150は、インデックス値を図7bのルックアップテーブルで探して、したがって処理されたオーディオ信号s1の第1の所望のサンプリングレート、および、合成フィルタバンク140によって生成されているオーディオ信号s2の第2の所望のサンプリングレートsr2を決定する。
図8は、SBR処理と上記構想の組み合わせを示す。QMF合成バンドがSBRモジュールの一部である場合、リサンプリング機能は、システムに組み込まれることができる。特に、適当なMおよびNのQMFフィルタバンクを適切に選択することによって、ほぼ任意のリサンプリング比を実現することが可能であるという追加の利点によって、通常の2:1または4:1のリサンプリング比を超えて、動的なSBRレンジを拡大するために、SBRパラメータを送信することは可能である。このように、全体のリサンプリング特性のための自由度を増加させる(図8参照)。
例えば、合成バンドの数が64より多い場合、それらが必ずしもゼロで満たされている必要があるというわけではない。代わりに、SBRパッチングのための範囲は、この高周波数範囲を使用するために拡大されることもできる。
Figure 0005665987
Figure 0005665987
こうすることによって、SBRによってカバーされることができる潜在的オーディオ帯域幅は、12kHzに増加させることができる。同時に、残りのリサンプリング比が単純な1:2の関係であるので、都合のよい48kHzへの潜在的なポスト・リサンプリングステップが、かなり安価に実行されることができる。
コアコーダがいくらか変わった又はまれなサンプリング周波数で動作することができる可能性を維持すると共に、より広いSBR範囲を可能にすることができるより多くの組み合わせが考えられる。
図9は、実施形態によるリサンプリングされたサンプリングレートでMPEGサラウンド信号をアップミックスするためのQMF分析および合成フィルタバンクを利用している別の実施形態による装置を示す。説明の便宜上、分析フィルタバンクは、入力された信号からの3つのサブバンド信号だけを生成するように表されており、QMF合成フィルタバンクの各々は、4つのサブバンド信号だけを含んでいる時間−周波数領域信号を時間領域に変換させるように表される。しかしながら、他の実施形態では、それぞれ、分析フィルタバンクが、例えば、45チャネルを含むこともあり、合成フィルタバンクは、例えば、60チャネルを含むこともあると理解される。
図9において、ダウンミックスオーディオ信号s1は、QMF分析フィルタバンク910に送られる。QMF分析フィルタバンク910は、3つの(ダウンミックスされた)サブバンド信号s11、s12、s13を得るために、ダウンミックス時間領域オーディオ信号を時間−周波数領域に変換する。3つのダウンミックスサブバンド信号s11、s12、s13は、それぞれ、それから3つのアップミックス装置921、922、923に送られる。アップミックス装置921、922、923の各々は、5つのサラウンドサブバンド信号を、それぞれ、左、右、中心、左サラウンドおよび右サラウンドのサブバンド信号として生成する。3つの生成された左サブバンド信号は、次に左サブバンド信号のための左信号調節装置931に送られる。左信号調節装置931は、3つの左サラウンドサブバンド信号から4つの左サブバンド信号を生成して、それらを時間領域のサラウンド信号の左チャネルs21を生成するために、時間−周波数領域から時間領域にサブバンド信号を変換する左合成フィルタバンク941に送る。同様にして、右信号調節装置932および右合成フィルタバンク942は、右チャネルs22を生成するために使用され、中心信号調節装置933および中心合成フィルタバンク943は、中心チャネルs23を生成するために使用され、左サラウンド信号調節装置934および左サラウンド合成フィルタバンク944は、左サラウンドチャネルs24を生成するために使用され、そして、右サラウンド信号調節装置935および右サラウンド合成フィルタバンク945は、時間領域のサラウンド信号の右サラウンドチャネルs25を生成するために使用される。
制御装置(950)は、構成設定confを受信して、受信した構成設定confに基づいて、分析フィルタバンク910のチャネル数を制御するように構成されている。制御装置は、更に、受信した構成設定confに基づいて、合成フィルタバンクユニット941、942、943、944、945のチャネル数、信号調節装置931、932、933、934、935の第1の複数の入力サラウンドサブバンド信号の数、および信号調節装置931、932、933、934、935の第2の複数の出力サラウンドサブバンド信号の数を制御するように構成されている。
図10は、別の実施形態による装置を示す。図10の実施形態は、信号調節装置125が、追加のサブバンド信号を得るために分析フィルタバンク120から得られたサブバンド信号のスペクトル帯域複製(SBR)を行うためのスペクトルバンド・レプリケータ(spectral band replicator)128を更に含むという点で、図8の実施形態と異なる。
従来は、スペクトル帯域複製を行なうことによって、スペクトル帯域複製から得られたサブバンド信号の数が、スペクトル複製されるのに利用できるサブバンド信号の数の2倍又は4倍であるように、複数のサブバンド信号が「複製される」。従来のスペクトル帯域複製(SBR)において、利用可能なサブバンド信号の数は、例えば(分析フィルタバンク変換から生じている)32のサブバンド信号が複製され、かつ、64のサブバンド信号が合成ステップに利用できるように、複製される。利用可能なサブバンド信号が、より低いサブバンド信号を形成し、その一方で、スペクトル複製されたサブバンドは、すでに利用可能なサブバンド信号より高い周波数範囲に位置しているより高いサブバンド信号を形成するように、サブバンド信号は複製される。
図10に示された実施形態によれば、SBRから生じているサブバンド信号の数が、複製されたサブバンド信号の整数倍(または同数)である必要がないように、利用できるサブバンド信号は複製される。例えば、32のサブバンド信号が複製されるかもしれない、さらに32のサブバンド信号が引き出されるのではなく、例えば、さらに36のサブバンド信号が引き出されて、全体で、例えば、64の代わりに68のサブバンド信号が合成から利用可能である。図10の実施形態の合成フィルタバンク130は、64の代わりに68のチャネルを処理するように調節される。
図10に示された実施形態によれば、スペクトル帯域複製によって複製されたチャネル数および複製されることができるチャネル数は、複製されたチャネルの数が、スペクトル帯域複製において使用されたチャネルの整数倍(または同数)である必要がないように、調節可能である。図10の実施形態において、制御装置は、合成フィルタバンク140のチャネル数を制御するだけでなく、チャネル数をスペクトル帯域複製によって複製されるためにも制御する。例えば、制御装置が、分析フィルタバンク120がc1チャネルを有しており、合成フィルタバンクがc2チャネル(c2>c1)を有することを決定した場合、スペクトル帯域複製によって得られる必要がある追加チャネルの数は、c2−c1である。
2>2・c1である場合、スペクトル帯域複製に関連して追加のサブバンド信号をどのように生成するかという問題が生じる。一実施形態によれば、ゼロ・サブバンド信号(すべてのサブバンドサンプルの振幅値がゼロ)は、さらに必要なサブバンド信号ごとに追加されうる。別の実施形態において、擬似ランダムデータは、生成される追加のサブバンド信号のサンプル値として使用される。更なる実施形態において、スペクトル帯域複製から生じている最も高いサブバンド信号は、それ自体複製される。例えば、最も高いサブバンド信号の振幅値は、追加の1つ又は複数のサブバンド信号の振幅値を形成するために複製される。振幅値は、重み係数を乗算されうる。例えば、第1の追加のサブバンド信号の振幅値の各々は、0.95で乗算されうる。第2の追加のサブバンド信号の振幅値の各々は、0.90などによって乗算されうる。
なお更なる実施形態において、スペクトル帯域複製は、追加のサブバンド信号を生成するために拡張される。スペクトル包絡情報は、利用できる低いサブバンド信号から追加のサブバンド信号を生成するために使用されうる。スペクトル包絡情報は、追加のサブバンド信号を生成するために、スペクトル帯域複製において考慮されたその低いサブバンド信号の振幅値で乗算されるために使用される重み係数を得るために使用されうる。
図11は、別の実施形態による装置を示す。本装置は、図11の装置が追加のリサンプラ170を更に含むという点で、図1に示された装置と異なる。追加のリサンプラ170は、追加的なリサンプリング処理を行うために使用される。リサンプラは、従来のリサンプラでもよく、あるいは、代わりに、本発明のリサンプリングを行うオーディオ信号を処理する装置でもよい。例えば、本発明による装置は、追加のリサンプラとして使用される場合、本発明による第1の装置は、第1のサンプリングレートsr1から、サンプリングレートsr2=c2/c1・sr1を有するオーディオ信号にリサンプリングする。それから、追加のリサンプラは、サンプリングレートsr2からサンプリングレートsr2’=c4/c3・sr2=c4/c3・c2/c1・sr1に、オーディオ信号をリサンプリングする。2つのリサンプラを使用することによって、上記実施形態のうちの1つによるリサンプラが、c1・c3分析チャネルおよびc4・c2合成チャネルを有しなければならないことが回避される。例えば、998000/996003のリサンプリング係数が望まれる(リサンプリング係数とは、分析前のオーディオ信号のサンプリングレートに対する合成後のオーディオ信号のサンプリングレートの比率である)場合、それから、2つのリサンプラを含む装置は、996003の分析フィルタバンクチャネル、および、998000の合成フィルタバンクチャネルが必要となることを回避する。代わりに、第1のリサンプリングは、999のフィルタバンクチャネルを有する分析フィルタバンク、および、1000のチャネルを有する合成フィルタバンクによって行われることができ、第2のリサンプリングは、997のチャネルを有する分析フィルタバンクおよび998のチャネルを有する合成フィルタバンクによって行われることができる。
本実施形態において、制御装置150は、リサンプリング係数を適切な分析および合成フィルタバンクチャネル値に分割する方法をとるように構成されうる。
図12は、実施形態によるリサンプラとして、QMFを示す。QMF出力サンプリングレートを調節するために取付けられたポスト・リサンプラを有するQMF合成ステージの例が示される。
QMF合成後の出力サンプリングレートが「標準」サンプリングレートに従わない場合、QMFベースのリサンプリングおよび追加のリサンプラの組み合わせは、これが必要である場合(例えば良好な小さい整数リサンプリング比率(または(例えばラグランジュ補間回路を使用する)近いサンプリングレート間の補間)に、リサンプラのためのより良い動作条件を得るために、なお使用されることができる。
図13に、分析装置および合成装置を含むリサンプラが示される。しかし、このような構成要素が、ほとんどの現在のオーディオコーデックにすでに存在しているので、これらのすでに存在している構成要素は、デコーダシステムに付加された追加の分析/合成ステージを必要とすることなしで、リサンプリングタスクを達成するために、制御物によって、わずかに変更されうる。このアプローチは、図14に示される。いくつかのシステムにおいて、より都合のよい動作基点を達成して、全体のデシメーションおよびアップサンプリング係数に関して、実施の制約を克服するためにfsをわずかに変えることが可能でありえる。
図13に示される「フィルタバンク制御」ブロックは、所望の出力サンプリング周波数fs,finalを得るために、デコーダの係数MおよびNを操作する。それは、所望の出力サンプリング周波数fs,final、コアデコーダ出力サンプリング周波数、およびデコーダについての他の情報を入力としてとる。サンプリング周波数fs,finalは、一定であって、出力装置ハードウェアを整合することが望まれうるが、一方、コーデックの観点からは、符号化効率の態様のため、変化することが望まれることもある。リサンプラをデコーダに組み合わせることによって、両方の要求、すなわち、出力での固定の出力サンプリングレートとオーディオコーデックの最も良く動作するサンプリングレートは、追加のリサンプラ処理のため、ほとんど追加の煩雑さや信号劣化がない状態で、満たされることができる。
異なる長さについてのQMFプロトタイプは、補間によって64のバンドQMFについてのものから作り出すことができる。
フィルタバンクの煩雑さは、その長さに直接関連がある。フィルタバンク時間領域信号合成変換が、変換長を減少させることによってダウンサンプリングのために修正される場合、その煩雑さは減少する。それがその変換長を増大させることによってアップサンプリングするために使用される場合、その煩雑さは増加するが、それでもなお、等価信号歪み特性を有する追加のリサンプラのために必要な煩雑さをはるかに下回る。
図15は、更なる実施形態による装置を示す。ここで、本装置は、別の変換サイクルを行うために、合成フィルタバンク出力を分析フィルタバンクに送るように構成されている。図1の実施形態のように、処理されたオーディオ信号s1は、オーディオ信号が時間領域から時間−周波数領域に変換される分析フィルタバンク120に送られる。合成フィルタバンクは、次に時間−周波数領域信号を時間領域に戻す変換をする。ここで、合成フィルタバンクチャネルc2の数は、入力された信号とは異なるサンプリングレートを有する出力信号s2を生成するために、分析フィルタバンクチャネルc1の数とは異なる。しかし、図1の実施形態とは異なり、出力信号は、第2のオーディオ信号処理装置140に送られずに、代わりに、分析フィルタバンクおよび合成フィルタバンクによってオーディオ信号の追加のリサンプリングを行うために、さらに分析フィルタバンクに送られることができる。異なる分析フィルタバンクおよび合成フィルタバンク(例えば分析フィルタバンク・インスタンスおよび合成フィルタバンク・インスタンス)は、その後の分析/合成ステップにおいて使用されることができる。制御装置150は、分析および合成フィルタバンクチャネルc1,c2の数を、その数が第1の分析/合成ステップにおけるものと、第2の分析/合成ステップにおけるものと異なるように、制御することができる。これによって、全体のリサンプリング比率は、任意で選択されることができ、その結果、それが(c2・c4・c6・c8・…)/(c1・c3・c5・c7・…)という結果を生じる。ここで、c1、c2、c3、…は、整数値である。
リサンプリングの後に第2のサンプリングレートsr2を有するように、第1のサンプリングレートsr1を有するオーディオ信号のリサンプリングは、実現することは容易でないかもしれない。例えば、22050Hzのサンプリング周波数が23983Hzのサンプリング周波数にリサンプリングされるケースでは、22050のチャネルを有する分析フィルタバンクおよび23983のチャネルを有する合成フィルタバンクを実現することは、計算機的に高価である。しかし、23983Hzの出力サンプリング周波数を正確に実現することが望ましいかもしれないが、ユーザ(または他のアプリケーション)は、誤差が許容可能な範囲内にある限り、誤差を許容するかもしれない。
図16は、他の実施形態による制御装置を示す。第1のサンプリングレートsr1および第2の所望のサンプリングレートsr2は、制御装置に送られる。第1のサンプリングレートは、分析フィルタバンクに入れられる(処理された)オーディオ信号s1のサンプリングレートを特定する。第2の所望のサンプリングレートsr2は、合成フィルタバンクから出力されるときに、オーディオ信号s2が示す所望のサンプリングレートを特定する。さらにまた、許容可能な誤差eも、制御装置に与えられる。許容可能な誤差eは、合成フィルタバンクから出力された信号の実際のサンプリングレートsr2’が、どの程度所望のサンプリングレートsr2から逸脱するかについて特定する。
第1のサンプリングレートsr1および第2の所望のサンプリングレートsr2は、合成チャネル数選択器1010に与えられる。合成チャネル数選択器1010は、合成フィルタバンクの適切なチャネル数c2を選択する。ある数の合成フィルタバンクチャネルc2、例えば60、72、80または48チャネルは、時間−周波数領域から時間領域への信号変換について、速い計算を可能にするために特に適する。合成チャネル数選択器1010は、第1および第2のサンプリングレートsr1,sr2に依存する合成チャネル数c2を選択する。例えば、リサンプリング比率が整数、例えば3である(例えばサンプリングレートsr1=16000Hzおよびsr2=48000Hzから生じる)場合、合成チャネル数は、小さい数、例えば30であることは十分でありえる。他の状況において、例えば、サンプリングレートが高い場合やサンプリングレート比が整数でない(例えば、sr1=である場合、22050Hzおよびsr2は24000Hzである)場合には、より大きい合成チャネル数を選択することがより有効でありえる。この場合、合成チャネル数は、例えば、c2=2000として選択されうる。
別の実施形態において、第1のsr1のみ、または、第2のsr2サンプリングレートのみが、合成チャネル数選択器1010に送られる。なお更なる実施形態において、第1のsr1サンプリングレートも第2のsr2サンプリングレートも、合成チャネル数選択器1010に送られず、合成チャネル数選択器1010は、それからサンプリングレートsr1,sr2から独立して合成チャネル数c2を選択する。
合成チャネル数選択器1010は、選択された合成チャネル数c2を分析チャネル数計算器1020に送られる。さらにまた、第1および第2のサンプリングレートsr1およびsr2も、分析チャネル数計算器1020に送られる。分析チャネル数計算器は、式
1=c2・sr1/sr2
に従って、第1および第2のサンプリングレートsr1およびsr2並びに合成チャネル数c2に応じて、分析フィルタバンクチャネルc1の数を算出する。
しばしば、計算された数c1が、整数でなく、整数とは異なる値である状況が起こることがある。しかし、分析フィルタバンクチャネルの数(並びに合成フィルタバンクチャネルの数)は、整数である必要がある。例えば、第1のサンプリングレートsr1がsr1=22050Hzである場合、第2の所望のサンプリングレートsr2はsr2=24000Hzであり、合成フィルタバンクチャネルc2の数は、c2=2000であり、分析チャネルの計算された数c1が、c1=c2・sr1/sr2=2000・22050/24000=1837.5の分析チャネルであるように、選択されている。従って、分析フィルタバンクが1837のチャネルを含むべきか、1838のチャネルを含むべきかの決定がなされる必要がある。
異なる丸め方法が適用されうる。
一実施形態によれば、計算値が整数でない場合に、隣の低い整数値が分析チャネル数に選択されるという第1の丸め方法が適用される。例えば、1837.4または1837.6の計算値は、1837に丸められる。
別の実施形態によれば、計算値が整数でない場合、隣の高い整数値が分析チャネル数に選択されるという第2の丸め方法が適用される。例えば、1837.4または1837.6の計算値は、1838に丸められる。
なお更なる実施形態によれば、算術的な丸めが適用される。例えば、1837.5の計算値は、1838に丸められて、1837.4の計算値は、1837に丸められる。
しかし、「1837.5」の例において、分析フィルタバンクチャネルの数として計算の正確な値を適用することは可能でないので、所望の第2のサンプリングレートsr2でなく、ずれている実際の第2のサンプリングレートsr2’が得られる。
図16の実施形態の制御装置は、式
sr2’=c2/c1・sr1
によって、第1のサンプリングレートsr1と、合成フィルタバンクチャネルの選択された数c2と、分析フィルタバンクチャネルの計算された数c1とに基づいて、実際の第2のサンプリングレートsr2’を計算する、サンプリングレート2計算器1030を含む。
例えば、上記例において、第1のサンプリングレートsr1がsr1=22050Hzであり、合成フィルタバンクチャネルの数がc2=2000であり、分析フィルタバンクの数c1を1838であるように選択することを仮定すると、これは、所望の24000Hzの代わりに、
sr2’=c2/c1・sr1=2000/1838・22050Hz=23993.47Hz
という実際の第2のサンプリングレートを生じさせる。
1837チャネルを有する分析フィルタバンクを適用することは、所望の24000Hzの代わりに、
sr2’=c2/c1・sr1=2000/1837・22050Hz=24006.53Hz
という実際の第2にサンプリングレートを生じさせる。
合成フィルタバンクから出力されているオーディオ信号の実際の第2のサンプリングレートsr2’と所望のサンプリングレートsr2は、誤差計算器1040に送られる。誤差計算器は、選択された分析および合成フィルタバンクチャネル設定に従って、所望のサンプリングレートsr2と実際のサンプリングレートsr2’との差を示している実際の誤差e’を計算する。
一実施形態において、実際の誤差e’は、
e’=|sr2−sr2
によって、所望のサンプリングレートsr2と実際のサンプリングレートとの間の差の絶対値でありえる。
別の実施形態において、実際の誤差e’は、例えば、式
e’=|(sr2−sr2’)/sr2
に従って計算された相対値でありえる。
Figure 0005665987
しかし、実際の誤差e’が許容可能な誤差によって定められた範囲内にある場合、例えば|e’|>|e|である場合、誤差比較器1060は、始めから決定処理を開始し、合成チャネル数選択器1010に、異なる合成チャネル数を合成フィルタバンクチャネルの数として選択するように命令する。
異なる実施形態は、新しい合成チャネル数を選択するために、異なる方法を実現することができる。例えば、一実施形態において、合成チャネル数は、ランダムに選択されうる。別の実施形態において、より高いチャネル数が選択される。例えば、チャネル数が合成チャネル数選択器1010によって前に選択された合成チャネル数のサイズの2倍である。例えばsr2:=2・sr2である。例えば、上述の例において、チャネル数sr2=2000は、sr2:=2・sr2=2・2000=4000によって置き換えられる。
そのプロセスは、許容できる実際の誤差e’を有する合成チャネル数が発見されるまで続く。
図17は、対応する方法を表しているフローチャートを示す。ステップ1110において、合成チャネル数c2は、選択される。ステップ1120において、分析チャネル数c1は、選択された合成チャネル数c2、第1のサンプリングレートsr1および所望のサンプリングレートsr2に基づいて算出される。必要に応じて、丸めは、分析チャネル数c1を決定するために実行される。ステップ1130において、実際の第2のサンプリングレートは、第1のサンプリングレートsr1、選択された数の合成フィルタバンクチャネルc2および分析フィルタバンクチャネルc1の算出された数に基づいて算出される。さらに、ステップ1140において、実際の第2のサンプリングレートsr2’と所望の第2のサンプリングレートsr2との間の差を示している実際の誤差e’が算出される。ステップ1150において、実際の誤差e’は、定められた許容可能な誤差eと比較される。誤差が許容できる場合には、そのプロセスは、ステップ1160に進む。それぞれ、選択された合成チャネル数は、合成フィルタバンクにパスされて、算出された分析チャネル数は、分析フィルタバンクにパスされる。誤差が許容できない場合、そのプロセスはステップ1110に進む、すなわち、新たな合成チャネル数が選択され、処理は適切な分析および合成フィルタバンクチャネル数が決定されるまで繰り返される。
図18は、更なる実施形態による制御装置を示す。図18の実施形態は、合成チャネル数選択器1010が分析チャネル数選択器1210と置き換えられること、および、分析チャネル数計算器1020が合成チャネル数計算器1220と置き換えられることの点で、図16の実施形態と異なる。合成チャネル数c2を選択する代わりに、分析チャネル数選択器1210は、分析チャネル数c1を選択する。それから、合成チャネル数計算器1220は、式c2=c1・sr2/sr1によって、合成チャネル数c2を算出する。算出された合成チャネル数c2は、次に、選択された分析チャネル数c1、第1のサンプリングレートsr1、および所望の第2のサンプリングレートsr2を受ける、サンプリングレート2計算器1230にパスされる。それは別にして、サンプリングレート2計算器1230、誤差計算器1240、誤差比較器1250、およびチャネル数パサー1260は、それぞれ、図16の実施形態のサンプリングレート2計算器1030、誤差計算器1040、誤差比較器1050、およびチャネル数パサー1060に対応する。
いくつかの態様が装置に関連して説明されたにもかかわらず、これらの態様は、対応する方法の記載も示すことは明らかである。ここで、ブロックまたはデバイスは、方法ステップまたは方法ステップの機能に対応する。類似して、方法ステップに関連して説明された態様は、対応するブロックまたは項目の記載または対応する装置の機能を示す。
発明の分析された信号は、デジタル記憶媒体に格納されることができる、または、例えば無線伝送媒体またはインターネットなどの有線伝送媒体などの伝送媒体で送信できる。
特定の実現要求に応じて、本発明の実施形態は、ハードウェアにおいて、または、ソフトウェアにおいて、実行されることができる。その実施態様は、各方法が実行されるように、プログラミング可能な計算機システムと協動する(または協動することができる)、そこに格納された電子的に読み込み可能な制御信号を有するデジタル記憶媒体、例えばフロッピー(登録商標)ディスク、DVD、CD、ROM、PROM、EPROM、EEPROMまたはFLASHメモリを使用して実行されることができる。
本発明によるいくつかの実施形態は、本願明細書に記載された方法のうちの1つが実行されるように、プログラミング可能な計算機システムと協動することができる電子的に読み込み可能な制御信号を有する非一時的データキャリアを含む。
通常、本発明の実施形態は、プログラムコードを有するコンピュータ・プログラム製品として実行されることができ、そのコンピュータ・プログラム製品が、コンピュータ上で動作するときに、プログラムコードが前記方法のうちの1つを実行するように実施される。プログラムコードは、例えば、機械読み取り可読キャリアに格納されることができる。
他の実施形態は、機械読み取り可読キャリアに格納され、本願明細書に記載された方法のうちの1つを実行するためのコンピュータ・プログラムを含む。
従って、換言すれば、本発明の方法の一実施形態は、コンピュータ・プログラムがコンピュータ上で動作するとき、本願明細書において記載された方法のうちの1つを実行するためのプログラムコードを有するコンピュータ・プログラムである。
従って、本発明の方法の更なる実施形態は、その上に記録され、本願明細書に記載された方法のうちの1つを実行するためのコンピュータ・プログラムを含んでいるデータキャリア(またはデジタル記憶媒体またはコンピュータ可読媒体)である。
従って、本発明の方法の更なる実施形態は、本願明細書に記載された方法のうちの1つを実行するためのコンピュータ・プログラムを示しているデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは、例えば、データ通信接続を介して、例えばインターネットを介して転送されるように構成されることができる。
更なる実施形態は、本願明細書に記載された方法のうちの1つを実行するために構成されるまたは適合された、処理手段、例えばコンピュータまたはプログラム可能な論理回路を含む。
更なる実施形態は、その上に、本願明細書に記載された方法のうちの1つを実行するためのコンピュータ・プログラムをインストールしていたコンピュータを含む。
いくつかの実施形態において、プログラム可能な論理回路(例えば論理プログラミング可能なデバイス)は、本願明細書に記載された方法の機能の一部または全てを実行するために使用されることができる。いくつかの実施形態において、論理プログラミング可能デバイスは、本願明細書に記載された方法のうちの1つを実行するために、マイクロプロセッサと協動することができる。通常、前記方法は、好ましくはいかなるハードウェア装置によっても実行される。
上記実施形態は、本発明の原理のために、単に示しているにすぎない。本装置の修正変更および本願明細書に記載された詳細が、他の当業者にとって明らかであるものと理解される。従って、間近に迫った特許請求の範囲のみによって制限され、本願明細書の実施形態の記載および説明よって示された具体的な詳細によっては制限されないという意図である。

Claims (14)

  1. オーディオ信号を処理するための装置であって、
    処理されたオーディオ信号(s1)を得るために、異なる構成設定(conf)によって前記オーディオ信号(s0)を処理するための構成可能な第1のオーディオ信号処理装置(110)であって、前記装置は、異なる構成設定(conf)が結果として前記処理されたオーディオ信号(s1)の異なるサンプリングレート(sr1)をもたらすように構成される、前記構成可能な第1のオーディオ信号処理装置(110)と、
    第1の数(c1)の分析フィルタバンクチャネルを有する分析フィルタバンク(120)と、
    第2の数(c2)の合成フィルタバンクチャネルを有する合成フィルタバンク(130)と、
    所定のサンプリングレート(sr2)を有するオーディオ信号(s2)を受信して、処理するように構成されている第2のオーディオ処理装置(140)と、
    前記合成フィルタバンク(140)のオーディオ信号出力(s2)が、前記所定のサンプリングレート(sr2)、または、前記所定のサンプリングレート(sr2)とは異なっており、かつ、分析フィルタバンク入力信号(s1)のサンプリングレート(sr1)より前記所定のサンプリングレート(sr2)に近いサンプリングレート(sr2’)を有するように、前記構成可能な第1のフィルタバンク(140)に供給された構成設定(conf)によって、前記第1の数(c1)の分析フィルタバンクチャネルおよび前記第2の数(c 2 )の合成フィルタバンクチャネルを制御するための制御装置(150)と
    を含むことを特徴とする、オーディオ信号を処理するための前記装置。
  2. 前記分析フィルタバンク(120)は、時間領域において示されている前記分析フィルタバンク入力信号(s1)を、複数の第1のサブバンド信号を有する第1の時間−周波数領域オーディオ信号に変換させるように構成されており、第1のサブバンド信号の数が、分析フィルタバンクチャネルの前記第1の数(c1)に等しいこと、
    前記装置は、第2の時間−周波数領域オーディオ信号の第2のサブバンド信号の前記数が、合成フィルタバンクチャネルの前記数(c2)に等しいように、前記構成設定(conf)に基づいて前記第1の時間−周波数領域オーディオ信号から、複数の第2のサブバンド信号を有する前記第2の時間−周波数領域オーディオ信号を生成するように構成されている信号調節装置(125)を含み、前記第2の時間−周波数領域オーディオ信号の第2のサブバンド信号の数は、前記第1の時間−周波数領域オーディオ信号のサブバンド信号の数とは異なること、および、
    前記合成フィルタバンク(130)は、前記合成フィルタバンク(130)の前記オーディオ信号出力(s2)として、時間領域オーディオ信号に、前記第2の時間−周波数領域オーディオ信号を変換するように構成されること
    を特徴とする、請求項1に記載の装置。
  3. 前記信号調節装置(125)は、少なくとも一つの追加のサブバンド信号を生成することによって、前記第2の時間−周波数領域オーディオ信号を生成するように構成されることを特徴とする、請求項2に記載の装置。
  4. 前記信号調節装置(125)は、少なくとも一つの追加のサブバンド信号を生成するために、スペクトル帯域複製を行うことによって、少なくとも一つの追加のサブバンド信号を生成するように構成されることを特徴とする、請求項3に記載の装置。
  5. 前記信号調節装置(125)は、追加のサブバンド信号として、ゼロ信号を生成するように構成されることを特徴とする、請求項3又は請求項4に記載の装置。
  6. 前記分析フィルタバンクは、QMF分析フィルタバンクであり、前記合成フィルタバンクは、QMF合成フィルタバンクであることを特徴とする、請求項1又は請求項2に記載の装置。
  7. 前記分析フィルタバンクは、MDCT分析フィルタバンクであり、前記合成フィルタバンクは、MDCT合成フィルタバンクであることを特徴とする、請求項1又は請求項2に記載の装置。
  8. 前記装置は、第1の合成サンプリングレートを有する合成フィルタバンク出力信号(s2)を受信するように構成されている追加のリサンプラ(170)を更に含み、前記追加のリサンプラは、第2の合成サンプリングレートを有するリサンプリングされた出力信号を受信するために、前記合成フィルタバンク出力信号をリサンプリングすることを特徴とする、請求項1〜請求項7のいずれかに記載の装置。
  9. 前記装置は、分析フィルタバンク入力信号として、第1の合成サンプリングレートを有する合成フィルタバンク出力信号を、分析フィルタバンクに送るように構成されることを特徴とする、請求項1〜請求項7のいずれかに記載の装置。
  10. 前記制御装置は、許容可能な誤差(e)に基づいて、前記第1の数(c 1 )の分析フィルタバンクチャネルまたは前記第2の数(c 2 )の合成フィルタバンクチャネルを決定するように構成されることを特徴とする、請求項1〜請求項9のいずれかに記載の装置。
  11. 前記制御装置は、実際の誤差(e’)を許容可能な誤差(e)と比較するための誤差比較器(1050)を含むことを特徴とする、請求項10に記載の装置。
  12. サラウンド信号をアップミックスするための装置であって、
    複数のダウンミックスされたサブバンド信号(s 11 、s 12 、s 13 )を生成するために、ダウンミックスされた時間領域信号(s 1 )を、時間−周波数領域に変換するための分析フィルタバンク(910)と、
    複数のサラウンドサブバンド信号を得るために、前記複数のサブバンド信号をアップミックスするための少なくとも2つのアップミックス装置(921、922、923)と、
    サラウンドサブバンド信号の前記数を調節するための少なくとも2つの信号調節装置ユニット(931、932、933、934、935)であって、前記少なくとも2つの信号調節装置ユニット(931、932、933、934、935)は、第1の複数の入力サラウンドサブバンド信号を受信するように構成され、前記少なくとも2つの信号調節装置ユニット(931、932、933、934、935)は、第2の複数の出力サラウンドサブバンド信号を出力するように構成され、前記第1の複数の入力サラウンドサブバンド信号の数と前記第2の複数の出力サラウンドサブバンド信号の数とは異なる、前記少なくとも2つの信号調節装置ユニットと、
    時間領域サラウンド出力信号(s 21 、s 22 、s 23 、s 24 、s 25 )を得るために、時間−周波数領域から時間領域に、複数の出力サラウンドサブバンド信号を変換するための複数の合成フィルタバンクユニット(941、942、943、944、945)と、
    構成設定(conf)を受信するように構成され、かつ、前記受信された構成設定(conf)に基づいて、前記分析フィルタバンク(910)のチャネルの数を制御し、前記合成フィルタバンクユニット(941、942、943、944、945)のチャネルの数を制御し、前記信号調節装置ユニット(931、932、933、934、935)の前記第1の複数の入力サラウンドサブバンド信号の数を制御し、前記信号調節装置ユニット(931、932、933、934、935)の前記第2の複数の出力サラウンドサブバンド信号の数を制御するように構成される、制御装置(950)と
    を含むことを特徴とする、前記装置。
  13. オーディオ信号を処理するための方法であって、
    異なる構成設定が、第1の処理されたオーディオ信号の異なるサンプリングレートをもたらすように、前記第1の処理されたオーディオ信号を得るために、異なる構成設定によってオーディオ信号を処理するステップと、
    合成フィルタバンクによって出力されたオーディオ信号が、前記所定のサンプリングレート、または、前記所定のサンプリングレートとは異なり、かつ、分析フィルタバンクへの入力信号の前記サンプリングレートより前記所定のサンプリングレートに近いサンプリングレートを有するように、構成設定によって、分析フィルタバンクの分析フィルタバンクチャネルの第1の数および合成フィルタバンクの合成フィルタバンクチャネルの第2の数を制御するステップと、
    前記所定のサンプリングレートを有する前記オーディオ信号出力を処理するステップと
    を含むことを特徴とする、前記方法。
  14. コンピュータ・プログラムが、コンピュータまたは処理装置によって実行されるときに、請求項13の方法を実行するための前記コンピュータ・プログラム。
JP2013523621A 2010-08-12 2011-08-11 Qmfベースのオーディオコーデックの出力信号のリサンプリング Active JP5665987B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US37312610P 2010-08-12 2010-08-12
US61/373,126 2010-08-12
PCT/EP2011/063848 WO2012020090A1 (en) 2010-08-12 2011-08-11 Resampling output signals of qmf based audio codecs

Publications (2)

Publication Number Publication Date
JP2013538367A JP2013538367A (ja) 2013-10-10
JP5665987B2 true JP5665987B2 (ja) 2015-02-04

Family

ID=44630032

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013523621A Active JP5665987B2 (ja) 2010-08-12 2011-08-11 Qmfベースのオーディオコーデックの出力信号のリサンプリング

Country Status (18)

Country Link
US (11) US9595265B2 (ja)
EP (1) EP2603913B1 (ja)
JP (1) JP5665987B2 (ja)
KR (1) KR101517446B1 (ja)
CN (1) CN103270553B (ja)
AR (1) AR082671A1 (ja)
AU (1) AU2011288406B2 (ja)
BR (5) BR122021003688B1 (ja)
CA (1) CA2807889C (ja)
ES (1) ES2501493T3 (ja)
HK (1) HK1186832A1 (ja)
MX (1) MX2013001650A (ja)
MY (1) MY156027A (ja)
PL (1) PL2603913T3 (ja)
RU (1) RU2562434C2 (ja)
SG (1) SG187743A1 (ja)
TW (1) TWI460719B (ja)
WO (1) WO2012020090A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9905236B2 (en) 2012-03-23 2018-02-27 Dolby Laboratories Licensing Corporation Enabling sampling rate diversity in a voice communication system
US9601122B2 (en) 2012-06-14 2017-03-21 Dolby International Ab Smooth configuration switching for multichannel audio
ES2749089T3 (es) * 2013-01-21 2020-03-19 Dolby Laboratories Licensing Corp Codificador y descodificador de audio con metadatos de límite y sonoridad de programa
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
WO2015157843A1 (en) 2014-04-17 2015-10-22 Voiceage Corporation Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
FR3023646A1 (fr) * 2014-07-11 2016-01-15 Orange Mise a jour des etats d'un post-traitement a une frequence d'echantillonnage variable selon la trame
EP3107096A1 (en) 2015-06-16 2016-12-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downscaled decoding
EP3284087B1 (en) * 2016-01-22 2019-03-06 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatuses and methods for encoding or decoding an audio multi-channel signal using spectral-domain resampling
US10770082B2 (en) 2016-06-22 2020-09-08 Dolby International Ab Audio decoder and method for transforming a digital audio signal from a first to a second frequency domain
EP3276620A1 (en) * 2016-07-29 2018-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis
CN116778950B (zh) * 2023-08-18 2023-11-17 玖益(深圳)医疗科技有限公司 用于音频数据传输的采样率匹配方法、系统及存储介质

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6252909B1 (en) * 1992-09-21 2001-06-26 Aware, Inc. Multi-carrier transmission system utilizing channels of different bandwidth
DE19706516C1 (de) * 1997-02-19 1998-01-15 Fraunhofer Ges Forschung Verfahren und Vorricntungen zum Codieren von diskreten Signalen bzw. zum Decodieren von codierten diskreten Signalen
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6940973B1 (en) * 1999-06-07 2005-09-06 Bell Canada Method and apparatus for cancelling common mode noise occurring in communications channels
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
AU2001262748A1 (en) * 2000-06-14 2001-12-24 Kabushiki Kaisha Kenwood Frequency interpolating device and frequency interpolating method
CA2354808A1 (en) * 2001-08-07 2003-02-07 King Tam Sub-band adaptive signal processing in an oversampled filterbank
CN100395817C (zh) 2001-11-14 2008-06-18 松下电器产业株式会社 编码设备、解码设备和解码方法
JP3646939B1 (ja) * 2002-09-19 2005-05-11 松下電器産業株式会社 オーディオ復号装置およびオーディオ復号方法
US8311809B2 (en) 2003-04-17 2012-11-13 Koninklijke Philips Electronics N.V. Converting decoded sub-band signal into a stereo signal
SE0301273D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
JP2007503026A (ja) * 2003-05-28 2007-02-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ サブバンドフィルタ処理を用いた透かし埋め込みの装置と方法
US20050018796A1 (en) * 2003-07-07 2005-01-27 Sande Ravindra Kumar Method of combining an analysis filter bank following a synthesis filter bank and structure therefor
JP4679049B2 (ja) * 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
JP4767687B2 (ja) * 2003-10-07 2011-09-07 パナソニック株式会社 スペクトル包絡線符号化のための時間境界及び周波数分解能の決定方法
RU2374703C2 (ru) * 2003-10-30 2009-11-27 Конинклейке Филипс Электроникс Н.В. Кодирование или декодирование аудиосигнала
JP4396233B2 (ja) * 2003-11-13 2010-01-13 パナソニック株式会社 複素指数変調フィルタバンクの信号分析方法、信号合成方法、そのプログラム及びその記録媒体
KR20070001115A (ko) * 2004-01-28 2007-01-03 코닌클리케 필립스 일렉트로닉스 엔.브이. 복소수 값 데이터를 이용하는 오디오 신호 디코딩
US7272567B2 (en) * 2004-03-25 2007-09-18 Zoran Fejzo Scalable lossless audio codec and authoring tool
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
FR2875351A1 (fr) * 2004-09-16 2006-03-17 France Telecom Procede de traitement de donnees par passage entre domaines differents de sous-bandes
CN101053019B (zh) 2004-11-02 2012-01-25 皇家飞利浦电子股份有限公司 使用复值滤波器组的音频信号的编码和解码的装置和方法
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US8121836B2 (en) * 2005-07-11 2012-02-21 Lg Electronics Inc. Apparatus and method of processing an audio signal
US8295362B2 (en) 2006-01-05 2012-10-23 Broadcom Corporation Method and system for redundancy-based decoding of video content
US7917561B2 (en) 2005-09-16 2011-03-29 Coding Technologies Ab Partially complex modulated filter bank
DE102006047197B3 (de) * 2006-07-31 2008-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines reellen Subband-Signals zur Reduktion von Aliasing-Effekten
US8700387B2 (en) * 2006-09-14 2014-04-15 Nvidia Corporation Method and system for efficient transcoding of audio data
US8036903B2 (en) * 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
US8280731B2 (en) 2007-03-19 2012-10-02 Dolby Laboratories Licensing Corporation Noise variance estimator for speech enhancement
CN100522920C (zh) 2007-05-11 2009-08-05 上海康鹏化学有限公司 4-溴-2,6-二氟苯甲酸的制备方法
US7536249B2 (en) 2007-07-12 2009-05-19 Delphi Technologies, Inc. System and method for a pumping torque estimation model for all air induction configurations
US8548815B2 (en) * 2007-09-19 2013-10-01 Qualcomm Incorporated Efficient design of MDCT / IMDCT filterbanks for speech and audio coding applications
DE602007008429D1 (de) * 2007-10-01 2010-09-23 Harman Becker Automotive Sys Effiziente Audiosignalverarbeitung im Subbandbereich, Verfahren, Vorrichtung und dazugehöriges Computerprogramm
KR101373004B1 (ko) * 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
DE102008024490B4 (de) 2008-05-21 2011-09-22 Siemens Medical Instruments Pte. Ltd. Filterbanksystem für Hörgeräte
CN102089814B (zh) * 2008-07-11 2012-11-21 弗劳恩霍夫应用研究促进协会 对编码的音频信号进行解码的设备和方法
CA3107567C (en) 2009-01-28 2022-08-02 Dolby International Ab Improved harmonic transposition
TWI621332B (zh) * 2009-02-18 2018-04-11 杜比國際公司 用於高頻重建或參數立體聲之複指數調變濾波器組
US8392200B2 (en) * 2009-04-14 2013-03-05 Qualcomm Incorporated Low complexity spectral band replication (SBR) filterbanks
TWI643187B (zh) * 2009-05-27 2018-12-01 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
DE102009036610B4 (de) * 2009-07-09 2017-11-16 Sivantos Pte. Ltd. Filterbankanordnung für eine Hörvorrichtung
CN105017600A (zh) 2014-12-10 2015-11-04 淄博龙沙高分子材料科技有限公司 增粘母料生产工艺

Also Published As

Publication number Publication date
US20220262381A1 (en) 2022-08-18
HK1186832A1 (en) 2014-07-11
US20170148462A1 (en) 2017-05-25
MY156027A (en) 2015-12-31
CN103270553B (zh) 2015-08-12
US11790928B2 (en) 2023-10-17
US11676615B2 (en) 2023-06-13
US11810584B2 (en) 2023-11-07
TWI460719B (zh) 2014-11-11
US20190259405A1 (en) 2019-08-22
KR101517446B1 (ko) 2015-05-04
US20220262383A1 (en) 2022-08-18
US11475905B2 (en) 2022-10-18
CA2807889C (en) 2016-07-19
US10311886B2 (en) 2019-06-04
CN103270553A (zh) 2013-08-28
BR122021003884B1 (pt) 2021-11-30
US20220262380A1 (en) 2022-08-18
US20210174816A1 (en) 2021-06-10
TW201230010A (en) 2012-07-16
EP2603913B1 (en) 2014-06-11
US20130151262A1 (en) 2013-06-13
MX2013001650A (es) 2013-03-20
US11804232B2 (en) 2023-10-31
AR082671A1 (es) 2012-12-26
BR122021003886B1 (pt) 2021-08-17
CA2807889A1 (en) 2012-02-16
KR20130055657A (ko) 2013-05-28
BR112013003303A2 (pt) 2020-11-17
SG187743A1 (en) 2013-03-28
US11961531B2 (en) 2024-04-16
US11361779B2 (en) 2022-06-14
AU2011288406B2 (en) 2014-07-31
US20210166709A1 (en) 2021-06-03
JP2013538367A (ja) 2013-10-10
AU2011288406A1 (en) 2013-03-28
US20240046942A1 (en) 2024-02-08
US11475906B2 (en) 2022-10-18
WO2012020090A1 (en) 2012-02-16
EP2603913A1 (en) 2013-06-19
US20210166710A1 (en) 2021-06-03
BR122021003887B1 (pt) 2021-08-24
RU2013110507A (ru) 2014-09-20
US20220262382A1 (en) 2022-08-18
US9595265B2 (en) 2017-03-14
ES2501493T3 (es) 2014-10-02
BR112013003303B1 (pt) 2021-09-28
RU2562434C2 (ru) 2015-09-10
PL2603913T3 (pl) 2014-11-28
BR122021003688B1 (pt) 2021-08-24

Similar Documents

Publication Publication Date Title
JP5665987B2 (ja) Qmfベースのオーディオコーデックの出力信号のリサンプリング
JP5350393B2 (ja) オーディオコーディングシステム、オーディオデコーダ、オーディオエンコーディング方法及びオーディオデコーディング方法
JP6789915B2 (ja) スペクトルパターンを利用することによってシヌソイドおよびスイープを効率的に合成するための装置および方法
JP6100164B2 (ja) オーディオ信号を処理し、音声音響統合符号化方式(usac)のためにより高い時間粒度を供給するための装置および方法
WO2011118977A2 (ko) 오디오 신호 처리 방법 및 장치
JP6663996B2 (ja) 符号化されたオーディオ信号を処理するための装置および方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140128

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140417

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140424

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140728

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141111

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141209

R150 Certificate of patent or registration of utility model

Ref document number: 5665987

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R157 Certificate of patent or utility model (correction)

Free format text: JAPANESE INTERMEDIATE CODE: R157

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250