JP5597738B2 - クロス生成物により向上された高調波転換 - Google Patents

クロス生成物により向上された高調波転換 Download PDF

Info

Publication number
JP5597738B2
JP5597738B2 JP2013068151A JP2013068151A JP5597738B2 JP 5597738 B2 JP5597738 B2 JP 5597738B2 JP 2013068151 A JP2013068151 A JP 2013068151A JP 2013068151 A JP2013068151 A JP 2013068151A JP 5597738 B2 JP5597738 B2 JP 5597738B2
Authority
JP
Japan
Prior art keywords
subband
signal
frequency
index
decomposition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013068151A
Other languages
English (en)
Other versions
JP2013148920A (ja
Inventor
ヴィレモーズ,ラルス
ヘデリン,ペール
Original Assignee
ドルビー インターナショナル アーベー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー インターナショナル アーベー filed Critical ドルビー インターナショナル アーベー
Publication of JP2013148920A publication Critical patent/JP2013148920A/ja
Application granted granted Critical
Publication of JP5597738B2 publication Critical patent/JP5597738B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Auxiliary Devices For Music (AREA)
  • Carbon And Carbon Compounds (AREA)
  • Fats And Perfumes (AREA)
  • Superconductors And Manufacturing Methods Therefor (AREA)

Description

本発明は、高周波数再構成(HFR: high frequency reconstruction)のために高調波転換(harmonic transposition)法を使うオーディオ符号化システムに関する。
スペクトル帯域複製(SBR: Spectral Band Replication)技術のようなHFR技術は、伝統的な知覚的なオーディオ・コーデックの符号化効率を著しく改善できる。MPEG-4先進オーディオ符号化(AAC: Advanced Audio Coding)と組み合わせて、HFR技術は非常に効率的なオーディオ・コーデックをなす。それはすでにXM衛星ラジオ(XM Satellite Radio)システムおよびデジタル・ラジオ・モンディアル(Digital Radio Mondiale)内ですでに使用されている。AACとSBRの組み合わせはaacPlusと呼ばれ、MPEG-4規格の一部であり、該規格では高効率AACプロファイル(High Efficiency AAC Profile)と称されている。一般に、HFR技術はいかなる知覚的オーディオ・コーデックとも、上位互換かつ下位互換な仕方で組み合わされることができ、よってユーレカ(Eureka)DABシステムにおいて使われているMPEG-2レイヤー2のようなすでに確立されている放送システムをアップグレードする可能性をもたらす。HFR転換法も、音声コーデックと組み合わされて、超低ビットレートで広い帯域幅の音声を可能にできる。
HRFの背後にある基本的な発想は、信号の高周波数範囲の特性と、同じ信号の低周波数範囲の特性との間には通例強い相関があるという観察である。よって、信号のもとの入力高周波数範囲の表現のためのよい近似が、低周波数範囲から高周波数範囲への信号転換によって達成できる。
転換の概念はWO98/57436において、高周波数帯域を、オーディオ信号のより低い周波数帯域から再生成する方法として確立された。この概念を音響符号化および/または音声符号化において使うことによってビットレートの実質的な節約が得られる。以下では、音響符号化〔オーディオ符号化〕に言及するが、記載される方法およびシステムは音声符号化にも、統合音声音響符号化(unified speech and audio coding)においても等しく適用可能であることを注意しておくべきである。
HFRベースのオーディオ符号化システムでは、低帯域幅信号がコア波形符号化器に呈示され、より高い周波数は前記低帯域幅信号の転換および追加的な副情報を使ってデコーダ側で再生成される。副情報は典型的には非常に低ビットレートでエンコードされ、目標スペクトル形を記述する。コア符号化信号の帯域幅が狭い低ビットレートのためには、ハイバンド、すなわちオーディオ信号の高周波数範囲を知覚的に快適な特性をもって再生成することがますます重要になる。高調波周波数再構成方法の二つの変形が下記において言及される。一方は高調波転換(harmonic transposition)と称され、他方は単一側波帯変調(single sideband modulation)と称される。
WO98/57436において定義される高調波転換の原理は、周波数ωをもつ正弦波は周波数Tωをもつ正弦波にマッピングされるというものである。ここで、T>1は転換の次数を定義する整数である。高調波転換の魅力的な特徴は、ソース周波数範囲を転換次数に等しい因子によって、すなわちTに等しい因子によって目標周波数範囲に引き伸ばすということである。高調波転換は、複雑な音楽素材については性能がいい。さらに、高調波転換は、低いクロスオーバー周波数を示す。すなわち、クロスオーバー周波数より上の大きな高周波数範囲は、クロスオーバー周波数より下の比較的小さな低周波数範囲から生成できる。
高調波転換とは対照的に、単一側波帯変調(SSB)ベースのHFRは周波数ωの正弦波を周波数ω+Δωの正弦波にマッピングする。ここで、Δωは固定した周波数シフトである。低帯域幅のコア信号を与えられたとき、SSB転換からは不協和のリンギング・アーチファクト(ringing artifact)が生じることがある。また、低いクロスオーバー周波数、すなわち小さなソース周波数範囲について、高調波転換は、SSBベースの転移よりも、所望される目標周波数範囲を埋めるためにより少数のパッチを必要とする。例として、高周波数範囲(ω,4ω]を埋める必要がある場合、高調波転換なら転換次数T=4を使ってこの周波数範囲を低周波数範囲((1/4)ω,ω]から埋めることができる。他方、同じ低周波数範囲を使うSSBベースの転換は周波数偏移Δω=(3/4)ωを使わなければならず、高周波数範囲(ω,4ω]を埋めるためにはこのプロセスを4回繰り返すことが必要になる。
他方、WO02/052545A1においてすでに指摘されているように、高調波転換は顕著な周期構造をもつ信号については欠点をもつ。そのような信号は、Ωを基本周波数として、周波数Ω,2Ω,3Ω……をもつ高調波関係にある正弦波の重ね合わせである。
次数Tの高調波転換のもとでは、出力正弦波は周波数TΩ,2TΩ,3TΩ……をもつ。これは、T>1の場合、所望される完全な高調波系列の、全体を含まない部分集合でしかない。結果として得られるオーディオ品質の面では、転換された基本周波数TΩに対応する「ゴースト」ピッチが典型的には知覚される。しばしば、高調波転換は、エンコードされデコードされたオーディオ信号の「金属的な」音の性質につながる。この状況は、HFRにいくつかの転換次数T=2,3,……,Tmaxを加えることによってある程度は軽減されうるが、この方法は、大半のスペクトル・ギャップが避けられるべきであるならば、計算が複雑である。
高調波転換を使うときに「ゴースト」ピッチが出現するのを避けるための代替的な解決策がWO02/052545A1において提起されている。この解決策は、二つの型の転換、すなわち典型的な高調波転換および特別な「パルス転換(pulse transposition)」を使うことにある。記載される方法は、パルス列のような性質をもって周期的であると検出されるオーディオ信号の部分については、専用の「パルス転換」に切り換えることを教示している。このアプローチの問題は、複雑な音楽素材に対する「パルス転換」の適用はしばしば、高分解能フィルタバンクに基づく高調波転換に比べて音質を劣化させるということである。よって、複雑な素材についてはパルス転換が使われないよう、検出機構はやや保守的に調整される必要がある。必然的に、単一ピッチの楽器や声が時に複雑な信号と分類され、それにより高調波転換を呼び出し、よって高調波を欠いてしまう。さらに、単一ピッチの信号や弱い複雑な背景においてあるピッチが支配的な信号の途中で切り換えが起こると、非常に異なるスペクトル充填属性をもつ二つの転換方法の間の切り換え自身が、聞き取れるアーチファクトを生じてしまう。
本発明は、周期的な信号の高調波転換から帰結する高調波系列を完成させる方法およびシステムを提供する。周波数領域転換は、分解フィルタバンク(analysis filter bank)からの非線形修正されたサブバンド信号を、合成フィルタバンク(synthesis filter bank)の選択されたサブバンドにマッピングする段階を含む。非線形修正は、位相修正または位相回転を含み、これは複素フィルタバンク領域において、冪乗則およびそれに続く大きさ調整によって得ることができる。従来技術の転換は一時には一つの分解サブバンドを別個に修正するが、本発明は、各合成サブバンドについて、少なくとも二つの分解サブバンドの非線形な組み合わせを加えることを教示する。組み合わされるべき分解サブバンドどうしの間の間隔は、転換されるべき信号の優勢な成分の基本周波数に関係していてもよい。
最も一般的な形では、本発明の数学的記述は、一組の周波数成分ω12,……,ωKが新しい周波数成分
ω=T1ω1+T2ω2+……+TKωK
を生成するために使われるというものである。ここで、係数T1,T2,……,TKは整数の転換次数であり、その和が合計転換次数T=T1+T2+……+TKである。この効果は、K個の好適に選ばれたサブバンド信号の位相を因子T1,T2,……,TKによって修正し、結果を、修正された位相の和に等しい位相をもつ信号に再び組み合わせることによって得られる。個々の転換次数は整数なのでこれらの位相演算のすべてがよく定義されており、曖昧さがないこと、合計転換次数がT≧1を満たす限りこれらの整数のうちの一部は負でもよいことを注意しておくことが重要である。
従来技術の方法はK=1の場合に対応し、本発明はK≧2を使うことを教示する。説明文は主としてK=2、T≧2の場合を主として扱う。当面のたいていの個別的問題を解決するにはこれで十分だからである。ただし、K>2の場合も本稿によって等しく開示され、カバーされていると考えられることを注意しておくべきである。
本発明は、より多数の低周波数帯域分解チャネル、すなわち、より多数の分解サブバンド信号からの情報を、分解フィルタバンクからの非線形修正された諸サブバンド信号を合成フィルタバンクのある選択されたサブバンド信号にマッピングするために使う。転換は、単に一時に一つのサブバンドを別個に修正するのではなく、各合成サブバンドについて少なくとも二つの異なる分解サブバンドの非線形結合を加える。前述したように、次数Tの高調波転換は、T>1として、周波数ωの正弦波を周波数Tωの正弦波にマッピングするよう設計される。本発明によれば、ピッチ・パラメータΩおよびインデックス0<r<Tをもつ、いうところのクロス生成物による向上(cross product enhancement)が、周波数(ω,ω+Ω)をもつ一対の正弦波を周波数(T−r)ω+r(ω+Ω)=Tω+rΩをもつ正弦波にマッピングするよう設計される。そのようなクロス生成物転換のためには、周期Ωをもつ周期信号のすべての部分周波数が、1からT−1までの範囲のインデックスrをもつピッチ・パラメータΩのすべてのクロス生成物を、次数Tの高調波転換に追加することによって生成されることを理解しておくべきである。
本発明のある側面によれば、信号の低周波数成分から信号の高周波数成分を生成するシステムおよび方法が記述される。以下でシステムのコンテキストにおいて記述される特徴が本発明の方法にも等しく適用可能であることを注意しておくべきである。信号は、たとえば、音響および/または音声信号であってもよい。本システムおよび方法は、統合音声音響信号符号化のために使われてもよい。信号は低周波数成分および高周波数成分を含み、低周波数成分はあるクロスオーバー周波数より下の周波数を含み、高周波数成分は前記クロスオーバー周波数より上の周波数を含む。ある種の状況では、前記信号の高周波数成分をその低周波数成分から推定することが必要とされることがありうる。例として、ある種のオーディオ・エンコード方式はオーディオ信号の低周波数成分のみをエンコードして、その信号の高周波数成分はデコードされた低周波数成分だけから、可能性としてはもとの高周波数成分の包絡線についてのある種の情報を使って、再構成しようとする。ここに記載されるシステムおよび方法は、そのようなエンコードおよびデコード・システムのコンテキストにおいて使われてもよい。
高周波数成分を生成するシステムは、前記信号の前記低周波数成分の複数の分解サブバンド信号を提供する分解フィルタバンクを有する。そのような分解フィルタバンクは一定の帯域幅をもつ一組の帯域通過フィルタを有していてもよい。音声信号のコンテキストでは特に、対数帯域幅分布をもつ帯域通過フィルタの組を使うことが有益であることもありうる。前記信号の前記低周波数成分をその周波数構成要素に分割することが前記分解フィルタバンクのねらいである。これらの周波数構成要素は、分解フィルタバンクによって生成される前記複数の分解サブバンド信号において反映される。例として、楽器によって奏でられる音符を含む信号が分解サブバンド信号に分割され、そのうち、奏でられた音符の高調波周波数に対応するサブバンドについて著しい大きさを有する一方、他のサブバンドは小さな大きさの分解サブバンド信号を示す。
システムはさらに、前記複数の分解サブバンド信号のうち第一および第二のものの位相を修正または回転させ、位相修正された分解サブバンド信号を組み合わせることによって、特定の合成周波数をもつ合成サブバンド信号を生成する非線形処理ユニットを含む。第一および第二の分解サブバンド信号は一般には異なる。換言すれば、両者は異なるサブバンドに対応する。非線形処理ユニットは、合成サブバンド信号が生成されるいわばクロス項処理ユニットを有していてもよい。合成サブバンド信号は合成周波数を有する。一般に、合成サブバンド信号は、ある合成周波数範囲からの諸周波数を含む。合成周波数は、この周波数範囲内のある周波数、たとえばこの周波数範囲の中心周波数である。合成周波数は、そして合成周波数範囲も、典型的には、クロスオーバー周波数より上である。同様にして、分解サブバンド信号はある分解周波数範囲からの諸周波数を含む。これらの分解周波数範囲は典型的にはクロスオーバー周波数より下である。
位相修正の動作は、分解サブバンド信号の周波数を転換することを含んでいてもよい。典型的には、分解フィルタバンクは、大きさおよび位相を含む複素指数関数として表現されうる複素分解サブバンド信号を与える。複素サブバンド信号の位相は、サブバンド信号の周波数に対応する。そのようなサブバンド信号のある転換次数T'による転換は、サブバンド信号を転換次数T'の冪乗にすることによって実行されてもよい。これは、複素サブバンド信号の位相が転換次数T'を乗算される結果となる。その結果、転換された分解サブバンド信号は、初期位相または周波数よりT'倍の大きさの位相または周波数を示す。そのような位相修正動作は、位相回転または位相乗算とも称されることがある。
システムは、さらに、合成サブバンド信号から前記信号の高周波数成分を生成するための合成フィルタバンクを有する。換言すれば、合成フィルタバンクのねらいは、可能性としては複数の合成周波数範囲からの可能性としては複数の合成サブバンド信号をマージし、時間領域において前記信号の高周波数成分を生成することである。ある基本周波数、たとえば基本周波数Ωをもつ信号について、合成フィルタバンクおよび/または分解フィルタバンクは前記信号の前記基本周波数に関連する周波数間隔を示す。特に、基本周波数Ωを解像するために十分小さな周波数間隔または十分高い分解能をもつフィルタバンクを選ぶことが有益でありうる。
本発明のもう一つの側面によれば、非線形処理ユニットまたは該非線形処理ユニット内のクロス項処理ユニットは第一および第二の転換次数の複数入力単一出力ユニットを有し、該複数入力単一出力ユニットは、それぞれ第一および第二の分解周波数を示す前記第一および第二の分解サブバンド信号から前記合成サブバンド信号を生成する。換言すれば、前記複数入力単一出力ユニットは前記第一および第二の分解サブバンド信号の転換を実行し、それら二つの転換された分解サブバンド信号を合成サブバンド信号にマージする。第一の分解サブバンド信号は位相修正される、あるいはその位相が前記第一の転換次数を乗算され、第二の分解サブバンド信号は位相修正される、あるいはその位相が前記第二の転換次数を乗算される。複素分解サブバンド信号の場合、そのような位相修正動作は、それぞれの分解サブバンド信号の位相に、それぞれの転換次数を乗算することにある。それら二つの転換された分解サブバンド信号は、前記第一の分解周波数に前記第一の転換次数を乗算したもの、足す、前記第二の分解周波数に前記第二の転換次数を乗算したものに対応する合成周波数をもつ組み合わされた合成サブバンド信号を与えるために、組み合わされる。この組み合わせ段階は、前記二つの転換された複素合成サブバンド信号の乗算からなっていてもよい。二つの信号の間のそのような乗算はそれらの標本値の乗算からなっていてもよい。
上述した特徴は、公式で表してもよい。前記第一の分解周波数をω、前記第二の分解周波数を(ω+Ω)とする。これらの変数は前記二つの分解サブバンド信号のそれぞれの分解周波数範囲を表すこともあることを注意しておくべきである。換言すれば、周波数は、ある特定の周波数範囲または周波数サブバンド内に含まれるすべての周波数を代表していると理解されるべきである。すなわち、前記第一および第二の分解周波数は、第一および第二の分解サブバンドの第一および第二の分解周波数帯域としても理解すべきである。さらに、前記第一の転換次数は(T−r)であってもよく、前記第二の転換次数はrであってもよい。転換次数を、T>1かつ1≦r<Tとなるよう制約することが有益であることがある。そのような場合、前記複数入力単一出力ユニットは、合成周波数(T−r)ω+r(ω+Ω)をもつ合成サブバンド信号を与えてもよい。
本発明のさらなる側面によれば、システムは複数の複数入力単一出力ユニットおよび/または複数の非線形処理ユニットを有し、これらは前記合成周波数をもつ複数の部分合成サブバンド信号を生成する。換言すれば、同じ合成周波数範囲をカバーする複数の部分合成サブバンド信号が生成されてもよい。そのような場合、前記複数の部分合成サブバンド信号を組み合わせるために、サブバンド合計ユニットが設けられる。すると、組み合わされた部分合成サブバンド信号が前記合成サブバンド信号を表す。組み合わせる動作は、前記複数の部分合成サブバンド信号を足し合わせることを含んでいてもよい。また、前記複数の部分合成サブバンド信号から平均合成サブバンド信号を決定することを含んでいてもよい。その際、前記合成サブバンド信号は、該合成サブバンド信号の関連性(relevance)に従って重み付けされてもよい。組み合わせる動作は、たとえば所定の閾値を超える大きさをもつ、前記複数のサブバンド信号のうちの一つまたは複数を選択することをも含んでいてもよい。前記合成サブバンド信号が利得パラメータを乗算されることが有益であることがあることを注意しておくべきである。特に、複数の部分合成サブバンド信号がある場合、そのような利得パラメータは、前記合成サブバンド信号の規格化に寄与しうる。
本発明のあるさらなる側面によれば、前記非線形処理ユニットはさらに、前記複数の分解サブバンド信号のうちの第三のものからさらなる合成サブバンド信号を生成する直接処理ユニットを有する。そのような直接処理ユニットは、たとえばWO98/57436において記述されている直接転換法を実行しうる。システムが追加的な直接処理ユニットを有する場合、対応する合成サブバンド信号を組み合わせるためのサブバンド合計ユニットを設ける必要があることがある。そのような対応する合成サブバンド信号は典型的には、同じ合成周波数範囲をカバーするおよび/または同じ合成周波数を示すサブバンド信号である。サブバンド合成ユニットは、上に概説した側面に従って組み合わせを実行してもよい。ある種の合成サブバンド信号、特に前記複数入力単一出力ユニットにおいて生成されたものを、たとえば前記合成サブバンド信号に寄与する前記クロス項からの前記一つまたは複数の分解サブバンド信号の大きさの最小値が前記信号の大きさの所定の割合より小さい場合には、無視してもよい。前記信号は前記信号の前記低周波数成分または特定の分解サブバンド信号であってもよい。この信号は、特定の合成サブバンド信号であってもよい。換言すれば、前記合成サブバンド信号を生成するために使われる前記分解サブバンド信号のエネルギーまたは大きさが小さすぎる場合、この合成サブバンド信号は前記信号の高周波数成分を生成するために使用されないことがありうる。前記エネルギーまたは大きさは、各標本値について決定されてもよいし、あるいは、たとえば前記分解サブバンド信号の複数の隣接する標本値にまたがる時間平均またはスライディング窓平均を決定することによって、標本値の集合について決定されてもよい。
前記直接処理ユニットは、第三の分解周波数を示す前記第三の分解サブバンド信号から前記合成サブバンド信号を生成する、第三の転換次数T'の単一入力単一出力ユニットを有していてもよい。ここで、前記第三の分解サブバンド信号は位相修正されるまたはその位相は前記第三の転換次数T'によって乗算される。ここで、T'は1より大きい。すると、前記合成周波数は前記分解周波数に前記第三の転換次数を乗算したものに対応する。この第三の転換次数T'は好ましくは下記で導入されるシステム転換次数Tに等しいことを注意しておくべきである。
本発明のもう一つの側面によれば、前記分解フィルタバンクは、本質的に一定のサブバンド間隔Δωで、N個の分解サブバンドを有する。上述したように、このサブバンド間隔Δωは、前記信号の基本周波数に関連付けられていてもよい。分解サブバンドは、分解サブバンド・インデックスnに関連付けられており、ここでn∈{1,……,N}である。換言すれば、前記分解フィルタバンクの前記分解サブバンドは、サブバンド・インデックスnによって同定されうる。同様にして、前記対応する分解サブバンドの周波数範囲からの周波数を含む前記分解サブバンド信号は、サブバンド・インデックスnを用いて同定されうる。
合成側では、合成フィルタバンクは、やはり合成サブバンド・インデックスnに関連付けられている合成サブバンドを有する。この合成サブバンド・インデックスnは、サブバンド・インデックスnをもつ合成サブバンドの合成周波数範囲からの周波数を含む合成サブバンド信号をも同定する。システムが、合計転換次数とも称されるシステム転換次数Tをもつ場合、合成サブバンドは本質的にはサブバンド間隔Δω・Tをもつ。すなわち、合成サブバンドのサブバウンド間隔は分解サブバンドのサブバンド間隔のT倍の大きさである。そのような場合、インデックスnをもつ合成サブバンドおよび分解サブバンドはそれぞれ、因子あるいはシステム転換次数Tを通じて互いに関係する周波数範囲を含む。例として、インデックスnをもつ分解サブバンドの周波数範囲が[(n−1)ω,nω]である場合、インデックスnをもつ合成サブバンドの周波数範囲は[T(n−1)ω,Tnω]である。
合成サブバンド信号がインデックスnをもつ合成サブバンドと関連付けられていることが与えられれば、本発明のもう一つの側面は、インデックスnをもつこの合成サブバンド信号が、第一および第二の分解サブバンド信号から複数入力単一出力ユニットにおいて生成されるということである。第一の分解サブバンド信号はインデックスn−p1をもつ分解サブバンドに関連付けられており、第二の分解サブバンド信号はインデックスn+p2をもつ分解サブバンドに関連付けられている。
以下では、一対のインデックス・シフト(p1,p2)を選択するいくつかの方法を概説する。これは、いうところのインデックス選択ユニットによって実行されうる。典型的には、最適なインデックス・シフトの対は、所定の合成周波数をもつ合成サブバンド信号を生成するために選択される。第一の方法では、インデックス・シフトp1およびp2は、インデックス記憶ユニットに記憶されている限られた対(p1,p2)のリストから選択される。インデックス・シフト対のこの限られたリストから、前記第一の分解サブバンド信号の大きさおよび前記第二の分解サブバンド信号の大きさを含む集合の最小値が最大にされるよう、対(p1,p2)が選択される。換言すれば、インデックス・シフトp1およびp2の可能な各対について、対応する分解サブバンド信号の大きさが決定できる。複素解析サブバンド信号の場合、大きさ(magnitude)は絶対値(absolute value)に対応する。大きさは、各標本値について決定されてもよいし、あるいは、たとえば前記分解サブバンド信号の複数の隣接する標本値にまたがる時間平均またはスライディング窓平均を決定することによって、標本値の集合について決定されてもよい。これは前記第一および第二の分解サブバンド信号についてそれぞれ第一および第二の大きさを与える。前記第一および第二の大きさのうちの最小のものが考慮され、この最小の大きさの値が最高になるインデックス・シフト対(p1,p2)が選択される。
もう一つの方法では、インデックス・シフトp1およびp2は、公式p1=r・lおよびp2=(T−r)・lを通じて決定される限られた対(p1,p2)のリストから選択される。これらの公式においてlは正の整数であり、たとえば1から10の値を取る。この方法は、第一の分解サブバンド(n−p1)を転換するために使われる第一の転換次数が(T−r)であり、第二の分解サブバンド(n+p2)を転換するために使われる第二の転換次数がrである状況において特に有用である。システム転換次数Tが固定されているとすると、パラメータlおよびrは、前記第一の分解サブバンド信号の大きさおよび前記第二の分解サブバンド信号の大きさを含む集合の最小値が最大にされるよう、選択される。換言すれば、パラメータlおよびrは、上で概説したようなmax-min最適化アプローチによって選択されてもよい。
あるさらなる方法では、前記第一および第二の分解サブバンド信号の選択は、根底にある信号の特性に基づいていてもよい。特に、信号が基本周波数Ωを含む場合、すなわち信号がパルス列のような性質をもって周期的である場合、そのような信号特性を考慮してインデックス・シフトp1およびp2を選択することが有益であることがある。基本周波数Ωは、前記信号の前記低周波数成分から決定されてもよいし、あるいは前記低周波数成分および前記高周波数成分両方を含むもとの信号から決定されてもよい。第一の場合では、基本周波数Ωは高周波数再構成を使う信号デコーダにおいて決定できる。一方、第二の場合には、基本周波数は典型的には信号エンコーダにおいて決定され、次いで対応する信号デコーダに信号伝達される。サブバンド間隔Δωをもつ分解フィルタバンクが使用され、第一の分解サブバンド(n−p1)を転換するために使われる第一の転換次数が(T−r)であり、第二の分解サブバンド(n+p2)を転換するために使われる第二の転換次数がrである場合、それらの和p1+p2が割合Ω/Δωを近似し、それらの分率p1/p2がr/(T−r)を近似するよう選択されてもよい。ある具体的な場合において、p1およびp2は分率p1/p2がr/(T−r)に等しくなるよう選択される。
本発明のもう一つの側面によれば、信号の高周波数成分を生成するシステムは、所定の時間インスタンスkのまわりの前記低周波数成分の所定の時間区間を単離する分解窓をも有する。システムはまた、所定の時間インスタンスkのまわりの前記高周波数成分の所定の時間区間を単離する合成窓をも有する。そのような窓は、時間的に変化しつつある周波数構成要素をもつ信号にとって特に有用である。それらの窓は、信号の瞬間的な周波数組成を分析することを許容する。前記フィルタバンクと組み合わせて、そのような時間依存の周波数分解のための典型例は、短時間フーリエ変換(STFT: Short Time Fourier Transform)である。しばしば分解窓は合成窓の時間拡大バージョンであることを注意しておくべきである。システム転換次数Tをもつシステムについては、時間領域における分解窓は、時間領域における合成窓の拡大因子Tによる時間拡大バージョンであってもよい。
本発明のあるさらなる側面によれば、信号をデコードするシステムが記述される。本システムは、信号の低周波数成分のエンコードされたバージョンを受け、上記のシステムに基づく、前記信号の前記低周波数成分から前記信号の前記高周波成分を生成する転換ユニットを有する。典型的には、そのようなデコード・システムはさらに、前記信号の前記低周波数成分をデコードするためのコア・デコーダを有する。前記デコード・システムはさらに、前記低周波数成分のアップサンプリングを実行してアップサンプリングされた低周波数成分を与えるアップサンプラーを有していてもよい。これは、前記低周波成分はもとの信号に比べて縮小した周波数範囲しかカバーしないという事実を利用して、エンコーダにおいて前記集合の前記低周波数成分がダウンサンプリングされている場合に必要とされることがある。さらに、デコード・システムは、前記低周波数成分を含むエンコードされた信号を受け取るための入力ユニットと、前記低周波数成分および生成された高周波数成分を含むデコードされた信号を提供するための出力ユニットとを有していてもよい。
デコード・システムはさらに、前記高周波数成分を整形するための包絡線調整器を有していてもよい。信号の高周波数は信号の前記低周波数範囲から、本稿に記載される高周波数再構成システムおよび方法を使って再生成されうるものの、もとの信号から、その高周波数成分のスペクトル包絡線に関する情報を抽出することが有益であることがありうる。この包絡線情報は次いで、もとの信号の高周波数成分のスペクトル包絡線をよく近似する高周波数成分を生成するために、デコーダに与えられてもよい。この動作は、典型的には、デコード・システムにおける包絡線調整器において実行される。前記信号の前記高周波数成分の包絡線に関係した情報を受け取るために、デコード・システムは包絡線データ受領ユニットを有していてもよい。再生成された高周波成分およびデコードされ、可能性としてはアップサンプリングされた低周波数成分は、次いで、成分合計ユニットにおいて加算され、デコードされた信号を決定してもよい。
上で概説したように、高周波数成分を生成するシステムは、特定の合成サブバンド信号を生成するために転換され組み合わされるべき分解サブバンド信号に関する情報を使ってもよい。この目的のため、デコード・システムはさらに、合成サブバンド信号を生成するもとになる第一および第二の分解サブバンド信号の選択を許容する情報を受け取るサブバンド選択データ受領ユニットを有していてもよい。この情報は、エンコードされた信号のある種の特性に関係していてもよい。たとえば、この情報は、信号の基本周波数Ωに関連付けられていてもよい。この情報はまた、選択されるべき分解サブバンドに直接関係していてもよい。例として、この情報は、第一および第二の分解サブバンド信号の可能な対のリストまたは可能なインデックス・シフトの対(p1,p2)のリストを含んでいてもよい。
本発明のもう一つの側面によれば、エンコードされた信号が記述される。このエンコードされた信号は、デコードされた信号の低周波数成分に関係した情報を含む。ここで、前記低周波数成分は複数の分解サブバンド信号を含む。さらに、エンコードされた信号は、前記複数の分解サブバンド信号のうちのどの二つが、選択された二つの分解サブバンド信号を転換することによってデコードされた信号の高周波数成分を生成するために選択されるべきかに関係した情報を含む。換言すれば、エンコードされた信号は、信号の前記低周波数成分の、可能性としてはエンコードされたバージョンを含む。さらに、前記信号の基本周波数Ωまたは可能なインデックス・シフト対(p1,p2)のリストといった、デコーダが本稿において概説されるクロス生成物による向上がなされた高調波転換法に基づいて前記信号の前記高周波数成分を再生成できるようにする情報を提供する。
本発明のあるさらなる側面によれば、信号をエンコードするシステムが記述される。このエンコード・システムは、前記信号を低周波数成分および高周波数成分に分割する分割ユニットと、前記低周波数成分をエンコードするコア・エンコーダとを有する。本システムはまた、前記信号の基本周波数Ωを判別する周波数判別ユニットと、前記基本周波数Ωのエンコードのためのパラメータ・エンコーダとをも有する。ここで、基本周波数Ωは、前記信号の前記高周波数成分を再生成するためにデコーダにおいて使用される。本システムは、前記高周波数成分のスペクトル包絡線を決定するための包絡線決定ユニットと、該スペクトル包絡線をエンコードする包絡線エンコーダとをも有していてもよい。換言すれば、本エンコード・システムは、もとの信号の高周波数成分を除去し、コア・エンコーダ、たとえばAACまたはドルビーDエンコーダによって低周波数成分をエンコードする。さらに、本エンコード・システムは、もとの信号の高周波数成分を分析し、デコードされた信号の高周波数成分を再生成するためにデコーダにおいて使用される一組の情報を決定する。該一組の情報は、前記信号の基本周波数Ωおよび/または前記高周波数成分のスペクトル包絡線を含んでいてもよい。
本エンコード・システムは、前記信号の前記低周波数成分の複数の分解サブバンド信号を与える分解フィルタバンクをも有していてもよい。さらに、本システムは、前記信号の高周波数成分を生成するための第一および第二のサブバンド信号を決定するためのサブバンド対決定ユニットと、決定された第一および第二のサブバンド信号を表すインデックス番号をエンコードするインデックス・エンコーダとを有していてもよい。換言すれば、本エンコード・システムは、前記信号の高周波数サブバンドおよび最終的には前記高周波数成分が生成されうるもとになる分解サブバンドを決定するために、本稿において記載される高周波数再構成方法および/またはシステムを使ってもよい。次いで、これらのサブバンドに関する情報、たとえばインデックス・シフト対(p1,p2)の限られたリストがエンコードされ、デコーダに与えられてもよい。
上でハイライトしたように、本発明は、信号の高周波数成分を生成する方法ならびに信号をデコードおよびエンコードする方法を包含する。システムのコンテキストにおいて上で概説した特徴は、対応する方法にも等しく適用可能である。以下では、本発明に基づく方法の以下の選択された側面が概説される。同様にして、これらの側面は、本稿において概説されるシステムにも適用可能である。
本発明のもう一つの側面によれば、信号の低周波数成分からの高周波数成分の高周波数再構成を実行する方法が記述される。この方法は、第一の周波数帯域から前記低周波成分の第一のサブバンド信号を、第二の周波数帯域から前記低周波成分の第二のサブバンド信号を提供する段階を含む。換言すれば、前記信号の前記低周波数成分から二つのサブバンド信号が単離される。前記第一のサブバンド信号は第一の周波数帯域を含み、前記第二のサブバンド信号は第二の周波数帯域を含む。これら二つの周波数サブバンドは好ましくは異なっている。あるさらなる段階において、前記第一および第二のサブバンド信号はそれぞれ第一および第二の転換因子によって転換される。各サブバンド信号の転換は、信号を転換するための既知の方法に従って実行されてもよい。複素サブバンド信号の場合、転換は、位相を修正することによって、あるいは位相にそれぞれの転換因子または転換次数を乗算することによって実行されてもよい。あるさらなる段階では、転換された第一および第二のサブバンド信号が組み合わされて、高周波数帯域からの周波数を含む高周波数成分を与える。
前記転換は、前記高周波数帯域が第一の周波数帯域に第一の転換因子を乗算したものと第二の周波数帯域に第二の転換因子を乗算したものとの和に対応するよう、実行される。さらに、転換する段階は、前記第一のサブバンド信号の前記第一の周波数帯域に前記第一の転換因子を乗算し、前記第二のサブバンド信号の前記第二の周波数帯域に前記第二の転換因子を乗算する段階を含む。説明を簡単にするため、範囲を限定することなく、本発明は、個々の周波数の転換について例解される。しかしながら、転換は、個々の周波数についてのみならず、周波数帯域全体についても、すなわちある周波数帯域内に含まれる複数の周波数についても実行されることを注意しておくべきである。実のところ、周波数の転換と周波数帯域の転換は、本稿においては交換可能なものとして理解されるべきである。しかしながら、分解フィルタバンクと合成フィルタバンクの異なる周波数分解能を認識しておく必要がある。
上述した方法において、提供する段階は、分解フィルタバンクによって前記低周波数成分をフィルタリングして、第一および第二のサブバンド信号を生成することを含んでいてもよい。他方、組み合わせる段階は、前記第一および第二の転換されたサブバンド信号を乗算して高サブバンド信号を与え、前記高サブバンド信号を合成フィルタバンクに入力して前記高周波数成分を生成することを含んでいてもよい。周波数表現へのおよび周波数表現からの他の信号変換も可能であり、本発明の範囲内である。そのような信号変換はフーリエ変換(FFT、DCT)、ウェーブレット変換、直交ミラー・フィルタ(QMF: quadrature mirror filters)などを含む。さらに、これらの変換は、「変換されるべき」信号の短縮された時間区間を孤立させる目的のための窓関数をも含む。可能な窓関数は、ガウス窓、コサイン窓、ハミング(Hamming)窓、ハン(Hann)窓、長方形窓、バーレット(Barlett)窓、ブラックマン(Blackman)窓などを含む。本稿では、「フィルタバンク」の用語は、そのような任意の変換を、可能性としては任意のそのような窓関数と組み合わせたものを含みうる。
本発明のもう一つの側面によれば、エンコードされた信号をデコードする方法が記述される。エンコードされた信号はもとの信号から導出されたもので、該もとの信号の、クロスオーバー周波数より下の周波数サブバンドの部分のみを表す。本方法は、エンコードされた信号の第一および第二の周波数サブバンドを提供する段階を含む。これは分解フィルタバンクを使うことによってなされてもよい。これらの周波数サブバンドは、第一の転換因子および第二の転換因子によってそれぞれ転換される。これは、前記第一の周波数サブバンド内の信号の第一の転換因子による位相修正または位相乗算を実行し、前記第二の周波数サブバンド内の信号の第二の転換因子による位相修正または位相乗算を実行することによってなされてもよい。最後に、高周波数サブバンドが前記第一および第二の転換された周波数サブバンドから生成される。ここで、前記高周波数サブバンドは前記クロスオーバー周波数より上である。この高周波数サブバンドは、前記第一の周波数サブバンドに前記第一の転換因子を乗算したものと前記第二の周波数サブバンドに前記第二の転換因子を乗算したものとの和に対応しうる。
本発明のもう一つの側面によれば、信号をエンコードする方法が記述される。この方法は、前記信号をフィルタ処理して前記信号の低周波数を単離し、前記信号の前記低周波数成分をエンコードする段階を含む。さらに、前記信号の前記低周波数成分の複数の分解サブバンド信号が提供される。これは、本稿において記載されるような分解フィルタバンクを使ってなされてもよい。次いで、前記信号の高周波数成分を生成するための第一および第二のサブバンド信号が決定される。これは、本稿において概説される高周波数再構成方法およびシステムを使ってなされてもよい。最後に、決定された第一および第二のサブバンド信号を表す情報がエンコードされる。そのような情報はもとの信号の特性、たとえば該信号の基本周波数Ω、あるいは選択された分解サブバンドに関係する情報、たとえばインデックス・シフト対(p1,p2)であってもよい。
本発明の上述した諸実施形態および諸側面が任意に組み合わされてもよいことは注意しておくべきである。特に、システムについて概説された諸側面は、本発明によって包含される対応する方法にも適用可能であることを注意しておくべきである。さらに、本発明の開示は、従属請求項における引用によって明示的に与えられる請求項の組み合わせ以外の請求項の組み合わせをもカバーすることを注意しておくべきである。すなわち、請求項およびその技術的特徴は、任意の順序および任意の形において組み合わされることができる。
本発明についてこれから、本発明の範囲を限定するものではない、例解するための例によって、付属の図面を参照しつつ述べていく。
HFR向上されたオーディオ・デコーダの動作を示す図である。 いくつかの次数を使う高調波転換器の動作を示す図である。 周波数領域(FD: frequency domain)高調波転換器の動作を示す図である。 クロス項処理の本発明の使用の動作を示す図である。 従来技術の直接処理を示す図である。 従来技術の単一サブバンドの直接非線形処理を示す図である。 本発明のクロス項処理の構成要素を示す図である。 クロス項処理ブロックの動作を示す図である。 図8のMISOシステムのそれぞれに含まれる本発明の非線形処理を示す図である。 例示的な周期信号の高調波転換のための本発明の効果を示す図である。 例示的な周期信号の高調波転換のための本発明の効果を示す図である。 例示的な周期信号の高調波転換のための本発明の効果を示す図である。 例示的な周期信号の高調波転換のための本発明の効果を示す図である。 例示的な周期信号の高調波転換のための本発明の効果を示す図である。 例示的な周期信号の高調波転換のための本発明の効果を示す図である。 例示的な周期信号の高調波転換のための本発明の効果を示す図である。 例示的な周期信号の高調波転換のための本発明の効果を示す図である。 例示的な周期信号の高調波転換のための本発明の効果を示す図である。 短時間フーリエ変換(STFT)の時間‐周波数分解を示す図である。 合成側で使われる、窓関数の例示的な時間進行およびそのフーリエ変換を示す図である。 正弦波入力信号のSTFTを示す図である。 合成側で使用される、図20に基づく窓関数およびそのフーリエ変換を示す図である。 合成フィルタバンク・サブバンドのクロス項向上のための適切な分解フィルタバンク・サブバンドの決定を示す図である。 合成フィルタバンク・サブバンドのクロス項向上のための適切な分解フィルタバンク・サブバンドの決定を示す図である。 記載される直接項およびクロス項の高調波転換法の実験結果を示す図である。 記載される直接項およびクロス項の高調波転換法の実験結果を示す図である。 記載される直接項およびクロス項の高調波転換法の実験結果を示す図である。 本稿において概説される向上された高調波転換方式を使うエンコーダの実施形態を示す図である。 本稿において概説される向上された高調波転換方式を使うデコーダの実施形態を示す図である。 図28および図29に示される転換ユニットの実施形態を示す図である。
以下に記載される実施形態は単に、いうところのクロス生成物による向上がなされた高調波転換のための本発明の原理を例解するものである。本稿に記載される構成および詳細に対する修正および変形が他の当業者には明白となるであろうことは理解される。したがって、本発明は、ここに記載される実施形態の記述および説明によって呈示される個別的な詳細によってではなく、特許請求の範囲によってのみ限定されることが意図されている。
図1は、HFR向上されたオーディオ・デコーダの動作を示している。コア・オーディオ・デコーダ101は低帯域幅オーディオ信号を出力し、それがアップサンプラー104に入力される。アップサンプラー104は、所望されるフル・サンプリング・レートで最終的なオーディオ出力寄与を生成するために必要とされることがある。そのようなアップサンプリングは、帯域幅制限されたコア・オーディオ・コーデックが外部オーディオ・サンプリング・レートの半分で動作する一方HFR部分はフル・サンプリング周波数で処理されるデュアル・レート・システムについては必要とされる。結果として、単一レート・システムについては、このアップサンプラー104は省略される。101の低帯域幅出力は、転換された信号、すなわち所望される高周波数範囲を含む信号を出力する転換器または転換ユニット102にも送られる。この転換された信号は、包絡線調整器103によって時間および周波数において整形されてもよい。最終的なオーディオ出力は、低帯域幅コア信号と包絡線調整された転換された信号との和である。
図2は、異なる転換次数Tのいくつかの転換器を有する、図1の転換器102に対応する高調波転換器201の動作を示している。転換されるべき信号が、それぞれ転換次数T=2,3,……,Tmaxをもつ個々の転換器201−2、201−3、……、201−Tmaxのバンクに渡される。典型的には、転換次数Tmax=3がたいていのオーディオ符号化用途にとって十分である。異なる転換器201−2、201−3、……、201−Tmaxの寄与は202において合計され、組み合わされた転換器出力を与える。第一の実施形態では、この合計動作は個々の寄与を足し合わせることを含んでいてもよい。もう一つの実施形態では、ある種の周波数への複数の寄与を加えることの効果が緩和されるよう、寄与は異なる重みを用いて重み付けされる。たとえば、三次の寄与は、二次の寄与よりも低い利得をもって加えられてもよい。最後に、合計ユニット202が、出力周波数に依存して選択的にこれらの寄与を加えてもよい。たとえば、二次の転換は第一のより低い目標周波数単位について使用されてもよく、三次の転換は第二のより高い目標周波数単位について使用されてもよい。
図3は、201の個々のブロックの一つ、すなわち転換次数Tの転換器201−Tの一つのような周波数領域(FD)高調波転換器の動作を示している。分解フィルタバンク301は非線形処理302に提出される複素サブバンドを出力する。非線形処理302は選ばれた転換次数Tに従ってサブバンド信号の位相および/または振幅を修正する。修正されたサブバンドは合成フィルタバンク303に入力される。合成フィルタバンク303は転換された時間領域信号を出力する。図2に示されるような異なる転換次数の複数の並列転換器の場合、いくつかのフィルタバンク動作は異なる転換器201−2、201−3、……、201−Tmaxの間で共有されてもよい。フィルタバンク動作の共有は、分解または合成についてなされてもよい。共有される合成303の場合、合計202はサブバンド領域において、すなわち合成303前に実行されることができる。
図4は、直接処理401に加えてクロス項処理402の動作を示している。クロス項処理402および直接処理401は、図3の周波数領域高調波転換器の非線形処理ブロック302内で並列に実行される。転換された出力信号は、統合転換信号を与えるために組み合わされる、たとえば加算される。転換された出力信号の組み合わせは、転換された出力信号の重ね合わせであってもよい。任意的に、クロス項の選択的な加算は利得計算において実装されてもよい。
図5は、図3の周波数領域高調波転換器内の図4の直接処理ブロック401の動作をより詳細に示している。単一入力単一出力(SISO: single-input-single-output)ユニット401−1、……、401−n、……、401−Nは、ソース範囲からの各分解サブバンドを、目標範囲内の一つの合成サブバンドにマッピングする。図5によれば、インデックスnの分解サブバンドは、SISOユニット401−nによって同じインデックスnの合成サブバンドにマッピングされる。合成フィルタバンクにおけるインデックスnをもつサブバンドの周波数範囲が、高調波転換の厳密なバージョンまたは型に依存して変わりうることを注意しておくべきである。図5に示されるバージョンまたは型において、分解バンク301の周波数間隔は、合成バンク303の周波数間隔よりもT倍小さい。よって、合成バンク303内のインデックスnは、分解バンク301内の同じインデックスnをもつサブバンドの周波数よりもT倍高い。例として、分解サブバンド[(n−1)ω,nω]は合成サブバンド[(n−1)Tω,nTω]に転換される。
図6は、401−nのSISOユニットのそれぞれに含まれる、単一サブバンドの直接非線形処理を示している。ブロック601の非線形性は、複素サブバンド信号の位相に対して、転換次数Tに等しい因子の乗算を実行する。任意的な利得ユニット602は、位相修正されたサブバンド信号の大きさを修正する。数学的には、SISOユニット401−nの出力yは、SISOシステム401−nへの入力xおよび利得パラメータgの関数として次のように書ける。
y=g・vT (1)
ここで、v=x/|x|1-1/T
これは次のように書き直すことができる。
y=g・|x|・(x/|x|)T
ことばで言うと、複素サブバンド信号xの位相は転換次数Tを乗算され、複素サブバンド信号xの振幅は利得パラメータgによって修正される。
図7は、次数Tの高調波転換のためのクロス項処理402の構成要素を示している。T−1個のクロス項処理ブロック701−1、……、701−r、……、701−(T−1)が並列にある。これらの出力は合計ユニット702において合計されて、組み合わされた出力を生成する。導入部ですでに指摘したように、周波数(ω,ω+Ω)をもつ一対の正弦波を周波数(T−r)ω+r(ω+Ω)=Tω+rΩをもつ正弦波にマッピングすることが目標である。ここで、変数rは1からT−1まで変わる。換言すれば、分解フィルタバンク301からの二つのサブバンドは高周波数範囲の一つのサブバンドにマッピングされることになる。rの特定の値および所与の転換次数Tについて、このマッピング段階はクロス項処理ブロック701−rにおいて実行される。
図8は、固定された値r=1,2,……,T−1についてのクロス項処理ブロック701−rの動作を示している。各出力サブバンド803は、二つの入力サブバンド801および802から複数入力単一出力(MISO: multiple-input-single-output)ユニット800−nにおいて得られる。インデックスnの出力サブバンド803について、MISOユニット800−nの二つの入力はサブバンドn−p1、801、およびn+p2、802である。ここで、p1およびp2は正整数のインデックス・シフトであり、転換次数T、変数rおよびクロス生成物向上ピッチ・パラメータΩに依存する。分解および合成サブバンドの番号付け規約は図5と揃えてある。すなわち、分解バンク301の周波数における間隔は合成バンク303よりもT倍小さく、よって因子Tの変動に関して与えられた上記のコメントはここでも成り立つ。
クロス項処理の使用に関係して、次のことが考慮されるべきである。ピッチ・パラメータΩは高精度で知られている必要はなく、分解フィルタバンク301によって得られる周波数分解能よりよい周波数分解能を使う必要は全くない。実際、本発明のいくつかの実施形態では、根底にあるクロス生成物向上ピッチ・パラメータΩはデコーダに全く入力されない。その代わり、整数インデックス・シフトの選ばれた対(p1,p2)が、可能な候補のリストから、クロス生成物出力大きさの最大化、すなわちクロス生成物出力のエネルギーの最大化などの最適化基準に従うことによって、選択される。例として、Tおよびrの所与の値について、Lを正整数のリストとして、公式(p1,p2)=(rl,(T−r)l)、l∈Lによって与えられる候補のリストを使うことができる。これは、公式(11)のコンテキストにおいて以下でさらに詳細に示される。原則としてすべての正整数が候補としてOKである。場合によっては、ピッチ情報は、適切なインデックス・シフトとしてどのlを選ぶかを特定する助けとなることがある。
さらに、図8に示される例示的なクロス生成物処理は適用されるインデックス・シフト(p1,p2)がある範囲の出力サブバンドについて同じである、たとえば合成サブバンド(n−1)、nおよび(n+1)が固定された距離p1+p2をもつ分解サブバンドから構成されることを示唆しているものの、そうである必要はない。実際のところ、インデックス・シフト(p1,p2)は一つ一つすべての出力サブバンドについて異なっていてもよい。これは、各サブバンドnいついて、クロス生成物向上ピッチ・パラメータの異なる値Ωが選択されてもよいことを意味している。
図9は、MISOユニット800−nのそれぞれに含まれる非線形処理を示している。積演算901は、二つの複素入力サブバンド信号の位相の重み付けされた和に等しい位相と、二つの入力サブバンド標本値の大きさの一般化された平均値に等しい大きさをもつサブバンド信号を生成する。任意的な利得ユニット902は、位相修正されたサブバンド標本値の大きさを修正する。数学的には、出力yは、MISOユニット800−nへの入力u1 801およびu2 802ならびに利得パラメータgの関数として次のように書ける。
y=g・v1 T-rv2 r (2)
ここで、m=1,2についてvm=um/|um|1-1/T
これは次のように書き直すことができる。
y=μ(|u1|,|u2|)・(u1/|u1|)T-r(u2/|u2|)T
ここで、μ(|u1|,|u2|)は大きさ生成関数である。ことばで言うと、複素サブバンド信号u1の位相は転換次数T−rを乗算され、複素サブバンド信号u2の位相は転換次数rを乗算される。これら二つの位相の和は出力yの位相として使われる。出力yの大きさは大きさ生成関数によって得られる。公式(2)と比較すると、大きさ生成関数は、利得パラメータgによって修正された大きさの幾何平均として表される。すなわち、μ(|u1|,|u2|)=g・|u1|1-r/T|u2|r/Tとなる。利得パラメータが入力に依存することを許容することによって、これはもちろんすべての可能性をカバーする。
公式(2)は、周波数(ω,ω+Ω)をもつ一対の正弦波が、(T−r)ω+r(ω+Ω)とも書ける周波数Tω+rΩをもつ正弦波にマッピングされるべきであるという根底にある目標から帰結することを注意しておくべきである。
以下のテキストでは、本発明の数学的記述が概説される。簡単のため、連続的な時間信号を考える。合成フィルタバンク303は、実数値の対称窓関数またはプロトタイプ・フィルタw(t)を用いて、対応する複素変調された分解フィルタバンク301から完璧な再構成を達成すると想定される。合成フィルタバンクは、いつもではないがしばしば、合成プロセスにおいて同じ窓を使う。変調は、均等に積み重ねられた型であると想定され、ストライド(stride)は1に規格化され、合成サブバンドの角周波数間隔はπに規格化される。よって、合成フィルタバンクへの入力サブバンド信号が下記の合成サブバンド信号yn(k)によって与えられるならば、目標信号s(t)は合成フィルタバンクの出力において達成される。
Figure 0005597738
公式(3)が、短時間フーリエ変換(STFT)とも記される窓掛けされた離散フーリエ変換(DFT: Discrete Fourier Transform)のような複素変調されたサブバンド分解フィルタバンクにおける通常の動作の規格化された連続時間数学モデルであることを注意しておく。公式(3)の複素指数関数の引数におけるわずかな修正により、複素変調された(擬似)直交ミラー・フィルタバンク(QMF: Quadrature Mirror Filterbank)および窓掛けされた奇積層の(oddly stacked)窓掛けされたDFTとも記される複素化修正離散コサイン変換(CMDCT: complexified Modified Discrete Cosine Transform)についての連続時間モデルを得ることになる。サブバンド・インデックスnは連続時間の場合についてすべての非負の整数を走る。離散時間の対応物については、時間変数tは1/Nきざみでサンプリングされ、サブバンド・インデックスnはNによって制限される。ここで、Nはフィルタバンク中のサブバンドの数であり、これはフィルタバンクの離散的な時間ストライドに等しい。離散時間の場合には、Nに関係した規格化因子も、もし窓のスケーリングに組み込まれていなければ、変換動作において必要とされる。
実数値の信号については、選ばれたフィルタバンク・モデルについて中に実数値の標本値があるのと同数の複素サブバンド標本値が外にある。したがって、2倍の総合的なオーバーサンプリング(あるいは冗長性)がある。より高い度合いのオーバーサンプリングのあるフィルタバンクが用いられることもできるが、呈示の明確のため、実施形態の本記述ではオーバーサンプリングは少なめにしている。
公式(3)に対応する変調されたフィルタバンク分析に関わる主要な段階は、信号が時刻t=kを中心とする窓を乗算され、結果として得られる窓掛けされた信号が複素正弦波exp[−inπ(t−k)]のそれぞれと相関を取られる。離散時間実装では、この相関は高速フーリエ変換により効率的に実装される。合成フィルタバンクについての対応するアルゴリズム・ステップは当業者にはよく知られており、合成変調、合成窓掛けおよび重畳加算(overlap add)動作からなる。
図19は、時間インデックスkおよびサブバンド・インデックスnのいくつかの値のセレクションについてサブバンド標本値yn(k)によって担持される情報に対応する時間および周波数における位置を示している。一例として、サブバンド標本値y5(4)が黒い長方形1901によって表されている。
正弦波s(t)=Acos(ωt+θ)=Re{Cexp(iωt)}について、(3)のサブバンド信号は十分大きなnについてはよい近似で次式によって与えられる。
Figure 0005597738
ここで、ハット^はフーリエ変換を表す。すなわち、^付きのwは窓関数wのフーリエ変換である。
厳密には、公式(4)はωの代わりに−ωを加える場合にのみ成り立つ。この項は、窓の周波数応答は十分高速に減衰し、ωとnの和は0に近くないという想定に基づいて無視されている。
図20は、窓w 2001およびそのフーリエ変換^w 2002の典型的な様相を描いている。
図21は、公式(4)に対応する単一正弦波の分解を示している。主として周波数Ωにおける正弦波によって影響されるサブバンドは、nπ−ωが小さいようなインデックスnをもつものである。図21の例については、水平な破線2101によって示されるように、周波数ω=6.25πである。その場合、それぞれ参照符号2102、2103、2104によって表されるn=5,6,7についての三つのサブバンドが有意な0でないサブバンド信号を含む。これら三つのサブバンドの陰影は、公式(4)から得られる、各サブバンド内部の複素正弦波の相対振幅を反映している。陰影が黒いほど振幅が高いことを意味する。具体例では、これは、サブバンド5、すなわち2102の振幅はサブバンド7,すなわち2104の振幅に比べて低く、サブバンド7の振幅はサブバンド6、すなわち2103の振幅より低いことを意味する。合成フィルタバンクの出力において高品質の正弦波を合成するためには、特に窓が図20の窓2001のような様相をもち、比較的短い継続時間および周波数における有意なサイドローブをもつ場合、いくつかの0でないサブバンドが一般には必要となることがあることを注意しておくことが重要である。
合成サブバンド信号yn(k)は分解フィルタバンク301および非線形処理、すなわち図3に示される高調波転換器302の結果として決定されることもできる。分解フィルタバンク側では、分解サブバンド信号xn(k)はソース信号z(t)の関数として表現されてもよい。次数Tの転換のためには、窓wT(t)=w(t/T)/T、ストライド1および合成バンクの周波数きざみよりT倍細かい変調周波数きざみをもつ複素変調された分解フィルタバンクがソース信号z(t)に適用される。図22は、スケーリングされた窓wT 2201およびそのフーリエ変換^wT 2202の様相を示している。図20に比べ、時間窓2201は引き延ばされており、周波数窓2202は圧縮されている。
修正されたフィルタバンクによる分解は、下記の分解サブバンド信号xn(k)を生じさせる:
Figure 0005597738
正弦波z(t)=Bcos(ξt+φ)=Re{Dexp(iξt)}について、(5)のサブバンド信号は十分大きなnについてはよい近似で次式によって与えられることがわかる。
Figure 0005597738
よって、これらのサブバンド信号を高調波転換器302に提出し、直接転換規則(1)ないし(6)を適用することによって、次が得られる。
Figure 0005597738
公式(4)および式(7)によって与えられる高調波転換であるチルダ付きのyn(k)を通じて得られる非線形サブバンド信号は、理想的には一致すべきである。
奇数の転換次数Tについては、(7)において窓の影響を含む因子は1に等しい。窓のフーリエ変換は想定により実数値であり、T−1は偶数だからである。したがって、公式(7)は、すべてのサブバンドについて、ω=Tξとして公式(4)と厳密に一致させられることができる。それにより、公式(7)に従う入力サブバンド信号をもつ合成フィルタバンクの出力は周波数ω=Tξ、振幅A=gB、位相θ=Tφをもつ正弦波である。ここで、Bおよびφは公式D=Bexp(iφ)から決定される。この公式を代入すると、
Figure 0005597738
を与える。よって、正弦波ソース信号z(t)の次数Tの高調波転換が得られる。
偶数のTについては、一致はより近似的であるが、それでも、対称的な実数値の窓については最も重要な主ローブを含む窓周波数応答^wの正の値の部分では、成り立つ。これは、Tの偶数の値についても、正弦波ソース信号z(t)の高調波転換が得られることを意味している。ガウス窓の特定の場合では、^wは常に正であり、結果として、転換の偶数次と奇数次についてパフォーマンスに差はない。
公式(6)と同様に、周波数ξ+Ωをもつ正弦波、すなわち正弦波ソース信号z(t)=B′cos((ζ+Ω)t+φ′)=Re{Eexp(i(ζ+Ω)t)}の分析は、
Figure 0005597738
となる。したがって、二つのサブバンド信号、すなわち図8における信号801に対応するu1=xn-p1(k)および図8における信号802に対応するu2=x′n+p2(k)を図8に示されるクロス生成物処理800−nに入力し、クロス生成物公式(2)を適用すると、次の出力サブバンド信号803が与えられる。
Figure 0005597738
公式(9)から、MISOシステム800−nの出力サブバンド信号803の位相発展が周波数Tξ+rΩの正弦波の分析の位相発展に追随することが見て取れる。これは、インデックス・シフトp1およびp2の選択とは独立して成り立つ。実際、サブバンド信号(9)が周波数Tξ+rΩに対応するサブバンド・チャネルnに入力される場合、すなわち、
Figure 0005597738
である場合、出力は周波数Tξ+rΩでの正弦波の生成への寄与である。しかしながら、各寄与が有意であり、それらの寄与が有益な仕方で足し合わされることを確認することが有利である。これらの側面について以下で論じる。
クロス生成物向上ピッチ・パラメータΩが与えられたとき、(10)の複素大きさM(n,ξ)がある範囲の諸サブバンドnについて^w(nπ−(Tξ+rΩ))を近似する(その場合、最終的な出力が周波数Tξ+rΩにおける正弦波を近似することになる)ために、インデックス・シフトp1およびp2についての好適な選択が導出されることができる。主ローブに対する最初の考察は、(n−p1)π−Tξ、(n+p2)π−T(ξ+Ω)、nπ−(Tξ+rΩ)の三つすべての値が同時に小さくなることを課す。これは、次の近似等式を導く。
Figure 0005597738
これは、クロス生成物向上ピッチ・パラメータΩを知っているとき、インデックス・シフトが公式(11)によって近似されてもよいということを意味する。これにより、分解サブバンドの簡単な選択が許容される。公式(11)に基づくインデックス・シフトp1およびp2の選択の、式(10)に従うパラメータM(n,ζ)の大きさに対する効果のより十全な解析は、ガウス窓および正弦窓のような窓関数w(t)の重要な特別な場合について実行されることができる。^w(nπ−(Tξ+rΩ))への所望される近似は、
Figure 0005597738
のいくつかのサブバンドについて非常に良好であることがわかる。
関係式(11)は、分解フィルタバンク301が角周波数サブバンド間隔π/Tをもつ例示的な状況に合わせて較正されていることを注意しておくべきである。一般的な場合には、(11)の結果として得られる解釈は、クロス項ソース・スパンp1+p2が、根底にある基本周波数Ωを近似する、分解フィルタバンクのサブバンド間隔を単位として測った、整数であり、対(p1,p2)が(r,T−r)の倍数として選ばれるというものである。
デコーダにおけるインデックス・シフト対(p1,p2)の決定のために、次のモードを使ってもよい:
1.Ωの値はエンコード・プロセスにおいて導出され、好適な丸め手順によってp1およびp2の整数値を導出するために十分な精度でデコーダに明示的に伝送されてもよい。それは、次の原理に従ってでもよい。
・p1+p2がΩ/Δωを近似する。ここで、Δωは分解フィルタバンクの角周波数間隔である;および
・p1/p2がr/(T−r)を近似するよう選ばれる。
2.各目標サブバンド標本値について、インデックス・シフト対(p1,p2)が、(p1,p2)=(rl,(T−r)l)、l∈L、r∈{1,2,…,T−1}のような候補となる値のあらかじめ決定されたリストからデコーダにおいて導出されてもよい。ここで、Lは正の整数のリストである。選択は、クロス項出力大きさの最適化、たとえばクロス項出力のエネルギーの最大化に基づいていてもよい。
3.各目標サブバンド標本値について、インデックス・シフト対(p1,p2)が、候補となる値の短縮されたリストから、クロス項出力大きさの最適化によって導出されてもよい。ここで、候補となる値の短縮されたリストは、エンコード・プロセスにおいて導出され、デコーダに伝送される。
サブバンド信号u1およびu2の位相修正がそれぞれ重み付け(T−r)およびrを用いて実行されるが、サブバンド・インデックス距離p1およびp2はそれぞれrおよび(T−r)に比例して選ばれることを注意しておくべきである。よって、合成サブバンドnに最も近いサブバンドが最も強い位相修正を受ける。
上で概説したモード2および3についての最適化手順のための有利な方法は、Max-Min最適化:
Figure 0005597738
を考え、勝ち残った対をrのその対応する値とともに使って、所与の目標サブバンド・インデックスnについてのクロス生成物寄与を構築することであってもよい。デコーダ探索指向のモード2では、また部分的にはモード3でも、異なる値rについてのクロス項の追加は好ましくは独立してなされる。同じサブバンドに中身を何回か加えるリスクがあるかもしれないからである。他方、モード1のようにしてサブバンドを選択するために基本周波数Ωが使われる場合、あるいはモード2においてありうるように狭い範囲のサブバンド・インデックス距離しか許されない場合には、同じサブバンドに何回か中身を加えてしまうというこの特定の問題は回避されうる。
さらに、上で概説したクロス項処理方式の実施形態のためには、クロス生成物利得gの追加的なデコーダ修正が有益であることがあることも注意しておくべきである。たとえば、公式(2)によって与えられるクロス生成物MISOユニットへの入力サブバンド信号u1、u2や、公式(1)によって与えられる転換SISOユニットへの入力サブバンド信号xに適用される。直接処理401およびクロス生成物処理402が同じ出力合成サブバンドのための構成要素を提供する図4に示されるように、三つの信号すべてが同じ出力合成サブバンドに入力されるならば、所定の閾値q>1について
min(|u1|,|u2|)<q|x| (13)
であれば、クロス生成物利得g、すなわち図9の利得ユニット902を0に設定することが望ましいことがありうる。換言すれば、クロス生成物を追加するのは、直接項入力サブバンド大きさ|x|が両方のクロス生成物入力項に比べて小さい場合にのみ実行される。このコンテキストにおいて、xは、考えているクロス生成物と同じ合成サブバンドにおける出力につながる直接項処理のための分解サブバンド標本値である。これは、直接転換によってすでに対策されている高調波成分をさらに向上させないようにするための用心といえる。
以下では、本稿で概説される高調波転換法が、従来技術に対する向上を例解するために例示的なスペクトル構成について記述される。図10は、次数T=2の直接高調波転換の効果を示している。上の図1001は、基本周波数Ωの倍数に位置する縦の矢印によって、もとの信号の部分周波数成分を描いている。これは、たとえばエンコーダ側におけるソース信号を示す。図式1001は、部分周波数Ω、2Ω、3Ω、4Ω、5Ωをもつ左側のソース周波数範囲および部分周波数6Ω、7Ω、8Ωをもつ右側の目標周波数範囲に区分されている。ソース周波数範囲は典型的にはエンコードされ、デコーダに伝送される。他方、HFR法のクロスオーバー周波数1005より上の部分成分6Ω、7Ω、8Ωを含む右側の目標周波数範囲は典型的にはデコーダに伝送されない。ソース信号のクロスオーバー周波数1005より上の目標周波数範囲を、ソース周波数範囲から再構成することが高調波転換法の目的である。したがって、目標周波数範囲、特に図式1001における部分成分6Ω、7Ω、8Ωは、転換器への入力として利用可能ではない。
上で概説したように、ソース周波数範囲において利用可能な周波数成分から、ソース信号の信号成分6Ω、7Ω、8Ωをを再生成することが高調波転換法のねらいである。下の図式1002は右側の目標周波数範囲における転換器の出力を示している。そのような転換器はたとえばデコーダ側に置かれていてもよい。周波数6Ωおよび8Ωにおける部分成分は周波数3Ωおよび4Ωにおける部分成分から、転換次数T=2を使う高調波転換によって再生成される。ここで点線の矢印1003および1004によって描かれている高調波転換のスペクトル引き伸ばし効果の結果として、7Ωにおける目標部分成分は欠けている。この7Ωにおける目標部分成分は、基本になる従来技術の高調波転換法を使っては生成できない。
図11は、二次高調波転換器が単一のクロス項によって向上されている、すなわちT=2かつr=1の場合における、周期信号の高調波転換のための本発明の効果を示している。図10のコンテキストにおいて概説されたように、転換器は、下の図式1102におけるクロスオーバー周波数1105より上の目標周波数範囲における部分成分6Ω、7Ω、8Ωを、図式1101のクロスオーバー周波数1105より下のソース周波数範囲における部分成分Ω、2Ω、3Ω、4Ω、5Ωから生成するために使われる。図10の従来技術の転換器出力に加えて、7Ωにおける部分周波数成分が3Ωおよび4Ωにおけるソース部分成分の組み合わせから再生成されている。クロス生成物を追加することの効果は、破線矢印1103および1104によって描かれている。公式では、ω=3Ωなので、(T−r)ω+r(ω+Ω)=Tω+rΩ=6Ω+Ω=7Ωである。この例から見て取れるように、本稿に概説される本発明のHFR法を使うことで、すべての目標部分成分が再生成されうる。
図12は、図10のスペクトル構成について変調されたフィルタバンクにおける従来技術の二次高調波転換器の可能な実装を示している。分解フィルタバンク・サブバンドの様式化された周波数応答が、上の図式1201における参照符号1206などの点線で示されている。サブバンドはサブバンド・インデックスによって数えられる。そのうち、インデックス5、10および15が図12に示されている。与えられている例については、基本周波数Ωは分解サブバンド周波数間隔の3.5倍に等しい。これは、図式1201における部分成分Ωがサブバンド・インデックス3および4をもつ二つのサブバンドの間に位置されているという事実によって示される。部分成分2Ωはサブバンド・インデックス7をもつサブバンドの中心に位置される、などとなっている。
下の図式1202は、再生成された部分成分6Ωおよび8Ωに、選択された合成フィルタバンク・サブバンドの参照符号1207などの様式化された周波数応答を重畳したものを示している。先述したように、これらのサブバンドは、T=2倍粗い周波数間隔をもつ。対応して、周波数応答も因子T=2によってスケーリングされる。上で概説したように、従来技術の直接項処理方法は各分解サブバンドの、すなわち図式1201におけるクロスオーバー周波数1205より下の各サブバンドの位相を、因子T=2によって修正し、その結果を同じインデックスをもつ合成サブバンド、すなわち図式1202においてクロスオーバー周波数1205より上のサブバンドにマッピングする。これは、図12において、斜めの点線の矢印、たとえば分解サブバンド1206および合成サブバンド1207についての矢印1208によって象徴されている。分解サブバンド1201からのサブバンド・インデックス9ないし16をもつサブバンドについてのこの直接項処理の結果は、周波数3Ωおよび4Ωにおけるソース部分成分からの合成サブバンド1202における周波数6Ωおよび8Ωにおける二つの目標部分成分の再生成である。図12から見て取れるように、目標部分成分6Ωへの主たる寄与はサブバンド・インデックス10および11をもつサブバンド、すなわち参照符号1209および1210からきており、目標部分成分8Ωへの主たる寄与はサブバンド・インデックス14をもつサブバンド、すなわち参照符号1211からきている。
図13は、図12の変調されたフィルタバンクの追加的なクロス項処理ステップの可能な実装を示している。クロス項処理ステップは、図11に関して基本周波数Ωをもつ周期信号について記述したものに対応する。上の図式1301は分解サブバンドを示しており、そのうちのソース周波数範囲が、下の図式1302における合成サブバンドの目標周波数範囲に転換される。これらの分解サブバンドからの部分成分7Ωを取り囲む合成サブバンド1315および1316の生成という個別的な場合を考える。転換次数T=2について、可能な値r=1が選択されてもよい。候補値(p1,p2)を(r,T−r)=(1,1)の倍数として選び、p1+p2がΩ/Δω=Ω/(Ω/3.5)=3.5、つまり分解サブバンド周波数間隔の単位で表した基本周波数Ωを近似するようにすることは、p1=p2=2という選択につながる。図8のコンテキストで概説したように、サブバンド・インデックスnをもつ合成サブバンドは、サブバンド・インデックス(n−p1)および(n+p2)をもつ分解サブバンドのクロス項生成物から生成されうる。結果として、サブバンド・インデックス12をもつ合成サブバンド、すなわち参照符号1315については、クロス生成物は、サブバンド・インデックス(n−p1)=12−2=10、すなわち参照符号1311およびサブバンド・インデックス(n+p2)=12+2=14、すなわち参照符号1313をもつ分解サブバンドから形成される。サブバンド・インデックス13をもつ合成サブバンドについては、クロス生成物は、インデックス(n−p1)=13−2=11、すなわち参照符号1312および(n+p2)=13+2=15、すなわち参照符号1314をもつ分解サブバンドから形成される。クロス生成物生成のこのプロセスは、斜めの破線/点線矢印の対、すなわちそれぞれ参照符号の対1308と1309および1306と1307によって象徴される。
図13から見て取れるように、部分成分7Ωはインデックス12をもつサブバンド1315内に主として置かれており、インデックス13をもつサブバンド1316には二次的に置かれているのみである。したがって、よりリアルなフィルタ応答のために、インデックス13をもつ合成サブバンド1316のまわりの項よりも、インデックス12をもつ合成サブバンドのまわりの、周波数(T−r)ω+r(ω+Ω)=Tω+rΩ=6Ω+Ω=7Ωにおける高品質の正弦波の合成に有益に加わるより多くの直接および/またはクロス項がある。さらに、公式(13)のコンテキストにおいてハイライトされたように、p1=p2=2をもつクロス項すべての盲目的な追加は、より周期的でないアカデミックな入力信号について望まれない信号成分につながることがある。
図14は、次数T=3の従来技術の高調波転換の効果を示している。上の図1401は、基本周波数Ωの倍数に位置する縦の矢印によって、もとの信号の部分周波数成分を描いている。部分成分6Ω、7Ω、8Ω、9ΩはHFR法のクロスオーバー周波数1405より上の目標範囲にあり、よって転換器への入力として利用可能ではない。ソース範囲における信号からそれらの信号成分を再生成することが高調波転換のねらいである。下の図式1402は目標周波数範囲における転換器の出力を示している。周波数6Ω、すなわち参照符号1407および9Ω、すなわち参照符号1410における部分成分は周波数2Ω、すなわち参照符号1406および3Ω、すなわち参照符号1409における部分成分から再生成される。ここで点線の矢印1408および1411によってそれぞれ描かれている高調波転換のスペクトル引き伸ばし効果の結果として、7Ωおよび8Ωにおける目標部分成分は欠けている。
図15は、三次高調波転換器が二つの異なるクロス項の追加によって向上されている、すなわちT=3かつr=1,2の場合における、周期信号の高調波転換のための本発明の効果を示している。図14の従来技術の転換器出力に加えて、7Ωにおける部分周波数成分1508が2Ωにおけるソース部分成分1506および3Ωにおけるソース部分成分1507の組み合わせからのr=1についてのクロス項によって再生成されている。クロス生成物を追加することの効果は、破線矢印1510および1511によって描かれている。公式では、ω=2Ωにより、(T−r)ω+r(ω+Ω)=Tω+rΩ=6Ω+Ω=7Ωである。同様に、8Ωにおける部分周波数成分1509がr=2についてのクロス項によって再生成されている。下の図式1502の目標範囲におけるこの部分周波数成分1509は、上の図式1501のソース周波数範囲における2Ωにおける部分周波数成分1506および3Ωにおける部分周波数成分1507から生成される。クロス項生成物の生成は、矢印1512および1513によって描かれている。公式では、(T−r)ω+r(ω+Ω)=Tω+rΩ=6Ω+2Ω=8Ωである。見て取れるように、本稿に概説される本発明のHFR法を使うことで、すべての目標部分成分が再生成されうる。
図16は、図14のスペクトル状況について変調されたフィルタバンクにおける従来技術の三次高調波転換器の可能な実装を示している。分解フィルタバンク・サブバンドの様式化された周波数応答が、上の図式1601における点線で示されている。サブバンドはサブバンド・インデックス1ないし17によって数えられる。そのうち、インデックス7をもつサブバンド1606、インデックス10をもつサブバンド1607およびインデックス11をもつサブバンド1608が例示的な仕方で参照されている。与えられている例については、基本周波数Ωは分解サブバンド周波数間隔Δωの3.5倍に等しい。下の図式1602は、再生成された部分周波数に、選択された合成フィルタバンク・サブバンドの様式化された周波数応答を重畳したものを示している。例として、サブバンド・インデックス7をもつサブバンド1609、サブバンド・インデックス10をもつサブバンド1610およびサブバンド・インデックス11をもつサブバンド1611が参照されている。先述したように、これらのサブバンドは、T=3倍粗い周波数間隔Δωをもつ。対応して、周波数応答もそれに応じてスケーリングされている。
従来技術の直接項処理は各分解サブバンドについて、サブバンド信号の位相を、因子T=3によって修正し、その結果を同じインデックスをもつ合成サブバンドにマッピングする。これは、斜めの点線の矢印によって象徴されている。サブバンド6ないし11についてのこの直接項処理の結果は、周波数2Ωおよび3Ωにおけるソース部分成分からの、周波数6Ωおよび9Ωにおける二つの目標部分周波数の再生成である。図16から見て取れるように、目標部分成分6Ωへの主たる寄与はインデックス7をもつサブバンド、すなわち参照符号1606からきており、目標部分成分9Ωへの主たる寄与はインデックス10および11をもつサブバンド、すなわち参照符号1607および1608からきている。
図17は、図16の変調されたフィルタバンクにおける、7Ωにおける部分成分の再生成につながる、r=1についての追加的なクロス項処理ステップの可能な実装を示している。図8のコンテキストにおいて概説したように、インデックス・シフト(p1,p2)は(r,T−r)=(1,2)の倍数として選択され、p1+p2が3.5、つまり分解サブバンド周波数間隔Δωを単位として表した基本周波数Ωを近似するようにしてもよい。換言すれば、生成されるべき合成サブバンドに寄与する二つの分解サブバンドの間の相対距離、すなわち周波数軸上での距離を分解サブバンド周波数間隔Δωで割ったものは、相対基本周波数、すなわち基本周波数Ωを分解サブバンド周波数間隔Δωで割ったものを最もよく近似するべきである。このことは公式(11)によっても表されており、p1=1、p2=2という選択につながる。
図17に示されるように、インデックス8をもつ合成サブバンド、すなわち参照符号1710は、インデックス(n−p1)=8−1=7、すなわち参照符号1706および(n+p2)=8+2=10、すなわち参照符号1708をもつ分解サブバンドから形成されるクロス生成物から得られる。インデックス9をもつ合成サブバンドについては、クロス生成物は、インデックス(n−p1)=9−1=8、すなわち参照符号1707および(n+p2)=9+2=11、すなわち参照符号1709をもつ分解サブバンドから形成される。クロス生成物を形成するこのプロセスは、斜めの破線/点線矢印の対、すなわちそれぞれ参照符号の対1712と1713および1714と1715によって象徴される。図17からは、部分周波数7Ωはサブバンド1711よりもサブバンド1710により顕著に位置されていることが見て取れる。したがって、リアルなフィルタ応答のためには、インデックス8をもつ合成サブバンド、すなわちサブバンド1710のまわりの、周波数(T−r)ω+r(ω+Ω)=Tω+rΩ=6Ω+Ω=7Ωにおける高品質の正弦波の合成に有益に加わるより多くのクロス項があることが期待される。
図18は、図16の変調されたフィルタバンクにおける、r=2についての、8Ωにおける部分周波数の再生成につながる、追加的なクロス項処理ステップの可能な実装を示している。インデックス・シフト(p1,p2)は(r,T−r)=(2,2)の倍数として選択され、p1+p2が3.5、つまり分解サブバンド周波数間隔Δωを単位として表した基本周波数Ωを近似するようにしてもよい。これは、p1=2、p2=1という選択につながる。図18に示されるように、インデックス9をもつ合成サブバンド、すなわち参照符号1810は、インデックス(n−p1)=9−2=7、すなわち参照符号1806および(n+p2)=9+1=10、すなわち参照符号1808をもつ分解サブバンドから形成されるクロス生成物から得られる。インデックス10をもつ合成サブバンドについては、クロス生成物は、インデックス(n−p1)=10−2=8、すなわち参照符号1807および(n+p2)=10+1=11、すなわち参照符号1809をもつ分解サブバンドから形成される。クロス生成物を形成するこのプロセスは、斜めの破線/点線矢印の対、すなわちそれぞれ矢印対1812と1813および1814と1815によって象徴される。図18からは、部分周波数8Ωはサブバンド1811よりもサブバンド1810において、わずかだがより顕著に位置されていることが見て取れる。したがって、リアルなフィルタ応答のためには、インデックス9をもつ合成サブバンド、すなわちサブバンド1810のまわりの周波数(T−r)ω+r(ω+Ω)=Tω+rΩ=2Ω+6Ω=8Ωにおける高品質の正弦波の合成に有益に加わるより多くの直接および/またはクロス項があることが期待される。
以下では、T=3についてこの規則に従ってインデックス・シフト対(p1,p2)およびrについて、Max-Min最適化ベースの選択手順(12)を例解する図23および図24が参照される。選ばれた目標サブバンド・インデックスはn=18であり、上の図は、与えられた時間インデックスについてのサブバンド信号の大きさの例を与える。ここで正整数のリストが7つの値L={2,3,…,8}によって与えられる。
図23は、r=1での候補の探索を示している。目標サブバンドまたは合成サブバンドは、インデックスn=18をもって示されている。点線2301は上の分解サブバンド範囲および下の合成サブバンド範囲におけるインデックスn=18をもつサブバンドをハイライトしている。可能なインデックス・シフト対はl=2,3,…,8について(p1,p2)={(2,4),(3,6),…,(8,16)}であり、対応する分解サブバンド大きさ標本値インデックス対、すなわち最適なクロス項を決定するために考慮されるサブバンド・インデックス対のリストは{(16,22),(15,24),…,(10,34)}である。一組の矢印が考慮対象の対を示す。一例として、参照符号2302および2303によって表される対(15,24)が示されている。これらの大きさの対の最小値を評価すると、クロス項の前記可能なリストについてのそれぞれの最小の大きさのリスト(0,4,1,0,0,0,0)が与えられる。l=3についての第二のエントリーが最大なので、対(15,24)がr=1での候補の間で勝ち残り、この選択が太い矢印によって描かれている。
図24は同様に、r=2での候補の探索を示している。目標サブバンドまたは合成サブバンドは、インデックスn=18をもって示されている。点線2401は上の分解サブバンド範囲および下の合成サブバンド範囲におけるインデックスn=18をもつサブバンドをハイライトしている。この場合、可能なインデックス・シフト対は(p1,p2)={(4,2),(6,3),…,(16,8)}であり、対応する分解サブバンド大きさ標本値インデックス対は{(14,20),(12,21),…,(2,26)}であり、このうち対(6,24)が参照符号2402および2403によって表されている。これらの大きさの対の最小値を評価すると、リスト(0,0,0,0,3,1,0)が与えられる。第五のエントリーが最大、つまりl=6なので、対(6,24)がr=2での候補の間で勝ち残り、太い矢印によって描かれている。全体として、対応する大きさ対の最小値は、r=1についての選択されたサブバンド対のものよりも小さいので、目標サブバンド・インデックスn=18についての最終的な選択は対(15,24)かつr=1に落ち着く。
入力信号z(t)が基本周波数Ωをもつ、すなわちクロス生成物向上ピッチ・パラメータに対応する基本周波数をもつ高調波系列であり、Ωが分解フィルタバンクの周波数分解能に比べて十分大きいとき、公式(6)によって与えられる分解サブバンド信号xn(k)および公式(8)によって与えられるx′n(k)は、入力信号z(t)の分解の良好な近似であり、近似は種々のサブバンド領域において有効であることをさらに注意しておくべきである。公式(6)と(8)〜(10)の比較から、入力信号z(t)の周波数軸に沿った高調波位相発展が、本発明によって正しく外挿されることがわかる。これは特に、純粋なパルス列について成り立つ。出力オーディオ品質のために、これは、人間の声や一部の楽器によって生成されるようなパルス列のような性質の信号について魅力的な特徴である。
図25、図26および図27は、T=3の場合における高調波信号についての本発明の転換の例示的な実装のパフォーマンスを示している。信号は基本周波数282.35Hzをもち、考慮される目標範囲10ないし15kHzにおけるその大きさスペクトルが図25に描かれている。N=512個のサブバンドのフィルタバンクが、転換を実装するために48kHzのサンプリング周波数において使用される。三次の直接転換器(T=3)の出力の大きさスペクトルが図26に描かれている。見て取れるように、三つ目ごとの高調波が上で概説した理論によって予言されるように高忠実度で再現されており、知覚されるピッチは847Hz、つまりもとのピッチの三倍である。図27は、クロス項生成物を適用する転換器の出力を示している。すべての高調波が、理論の近似的な側面に起因する不完全性の制限内で再生成されている。この場合については、サイドローブは信号レベルより約40dB下であり、これはもとの高調波信号から知覚的に区別できない高周波数成分の再生成のためには十分以上である。
以下では、統合音声音響符号化(USAC)のための例示的なエンコーダ2800および例示的なデコーダ2900をそれぞれ示す図28および図29が参照される。USACエンコーダ2800およびデコーダ2900の一般的な構造は次のように述べられる:まず、ステレオまたは多チャネル処理を扱うためのMPEGサラウンド(MPEGS: MPEG Surround)機能ユニットおよび入力信号におけるより高いオーディオ周波数のパラメトリック表現を扱う向上SBR(eSBR: enhanced SBR)ユニット2801および2901からなる共通の前処理/後処理があってもよい。eSBRは本稿で概説される高調波転換法を利用してもよい。二つの分枝があり、一方は修正された先進オーディオ符号化(AAC)ツール経路からなり、他方は線形予測符号化(LPまたはLPC領域)ベースの経路からなる。この後者は、LPC残差の周波数領域表現または時間領域表現をフィーチャーする。AACおよびLPC両方についてのすべての伝送されるスペクトルは、量子化および算術符号化に続いて、MDCT領域で表されてもよい。時間領域表現はACELP励振符号化方式を使う。
エンコーダ2800の向上スペクトルバンド複製(eSBR: enhanced Spectral Band Replication)ユニット2801は本稿で概説した高周波数再構成システムを有していてもよい。特に、eSBRユニット2801は、複数の分解サブバンド信号を生成するために分解フィルタバンク301を有していてもよい。分解サブバンド信号は次いで、複数の合成サブバンド信号を生成するよう非線形処理ユニット302において転換されてもよい。生成された合成サブバンド信号は次いで、高周波数成分を生成するために合成フィルタバンク303に入力されてもよい。eSBRユニット2801では、エンコード側では、低周波数成分から、もとの信号の高周波数成分に最もよく一致する高周波数成分をどのようにして生成するかについての一組の情報が決定されてもよい。この一組の情報は、優勢な基本周波数Ωのような信号特性について、高周波数成分のスペクトル包絡についての情報を含んでいてもよく、分解サブバンド信号をどのように組み合わせるのが最もよいかについての情報、すなわちインデックス・シフト対(p1,p2)の限られた集合のような情報を含んでいてもよい。この一組の情報に関係するエンコードされたデータは、ビットストリーム・マルチプレクサにおいて他のエンコードされた情報とマージされ、エンコードされたオーディオ・ストリームとして対応するデコーダ2900に転送される。
図29に示されるデコーダ2900も向上されたスペクトル帯域幅複製(eSBR)ユニット2901を有している。eSBRユニット2901はエンコードされたオーディオ・ビットストリームまたはエンコードされた信号をエンコーダ2800から受け取り、本稿で概説された方法を使って信号の高周波数成分を生成し、その高周波成分がデコードされた低周波数成分とマージされてデコード信号を生じる。eSBRユニット2901は本稿で概説された種々のコンポーネントを有していてもよい。特に、分解フィルタバンク301、非線形処理ユニット302および合成フィルタバンク303を有していてもよい。eSBRユニット2901は、高周波数再構成を実行するために、エンコーダ2800によって与えられた高周波数成分についての情報を使ってもよい。そのような情報は、信号の基本周波数Ω、もとの高周波数成分のスペクトル包絡および/または合成サブバンド信号、ひいてはデコード信号の高周波数成分を生成するために使われるべき分解サブバンドについての情報であってもよい。
さらに、図28および図29は、USACエンコーダ/デコーダの、以下のような可能な追加的コンポーネントを示している。
・ビットストリーム・ペイロード・デマルチプレクサ・ツール。これは、ビットストリーム・ペイロードを各ツールのための部分に分離し、各ツールに、そのツールに関係するビットストリーム・ペイロード情報を与える。
・スケール因子ノイズレス・デコード・ツール。これは、ビットストリーム・ペイロード・デマルチプレクサから情報を受け、その情報をパースし、ハフマンおよびDPCM符号化されたスケール因子をデコードする。
・スペクトル・ノイズレス・デコード・ツール。これは、ビットストリーム・ペイロード・デマルチプレクサから情報を受け、その情報をパースし、算術符号化されたデータをデコードし、量子化されたスペクトルを再構成する。
・逆量子化ツール。これはスペクトルについての量子化された値を受け、整数値を、スケーリングされていない再構成されたスペクトルに変換する。この量子化器は好ましくは圧縮伸張量子化器であり、その圧縮伸張因子は選ばれたコア符号化モードに依存する。
・ノイズ充填ツール。これはデコードされたスペクトルにおけるスペクトル・ギャップを充填するために使われる。該スペクトル・ギャップは、たとえばエンコーダにおけるビット需要に対する強い制約に起因してスペクトル値が0に量子化されるときに現れる。
・再スケーリング・ツール。これは、スケール因子の整数表現を実際の値に変換し、スケーリングされていない逆量子化されたスペクトルに関連するスケール因子を乗算する。
・ISO/IEC14496-3に記載されているようなM/Sツール。
・ISO/IEC14496-3に記載されているような時間的ノイズ整形(TNS: temporal noise shaping)ツール。
・フィルタバンク/ブロック切り換えツール。これは、エンコーダにおいて実行された周波数マッピングの逆を適用する。フィルタバンク・ツールのためには好ましくは逆修正離散コサイン変換(IMDCT)が使われる。
・時間歪みフィルタバンク/ブロック切り換えツール。これは、時間歪みモードが有効にされているときに通常のフィルタバンク/ブロック切り換えツールを置換する。フィルタバンクは好ましくは通常のフィルタバンクについてと同じもの(IMDCT)であり、さらに、窓掛けされた時間領域標本値が、歪められた時間領域から線形の時間領域に、時間変動する再サンプリングによってマッピングされる。
・MPEGサラウンド(MPEGS)ツール。これは、一つまたは複数の入力信号から、適切な空間的パラメータによって制御される該入力信号に洗練された上方混合(upmix)手順を適用することによって、複数の信号を生成する。USACのコンテキストでは、MPEGSは好ましくは、伝送される下方混合(downmix)された信号とともにパラメトリック副情報を伝送することによって、多チャネル信号を符号化するために使われる。
・信号分類器ツール。これは、もとの入力信号を分析して、それから、種々の符号化モードの選択をトリガーする制御情報を生成する。入力信号の分析は典型的には実装依存であり、所与の入力信号フレームについて最適なコア符号化モードを選ぼうとする。信号分類器の出力は任意的に、他のツール、たとえばMPEGサラウンド、向上SBR、時間歪みフィルタバンクなど、の振る舞いに影響するためにも使われてもよい。
・LPCフィルタ・ツール。これは、線形予測合成フィルタを通じて再構成された励振信号をフィルタ処理することによって、励振領域信号から時間領域信号を生成する。
・ACELPツール。これは、長期予測器(適応符号語)をパルス様シーケンス(イノベーション符号語)と組み合わせることによって時間領域励振信号を効率的に表現する方法を提供する。
図30は、図28および図29に示されるeSBRユニットのある実施形態を示している。eSBRユニット3000は以下ではデコーダのコンテキストで記述され、eSBRユニット3000への入力は信号の、ローバンドとしても知られる低周波数成分と、基本周波数Ωのような特定の信号特性および/または可能なインデックス・シフト値(p1,p2)に関する可能な追加的情報である。エンコーダ側では、eSBRへの入力は典型的には完全な信号であるのに対し、出力は信号特性および/またはインデックス・シフト値に関する追加的情報である。
図30では、低周波数成分3013は、QMF周波数帯域を生成するためにQMFフィルタバンクに入力される。これらのQMF周波数帯域は、本稿で概説される分解サブバンドと混同すべきではない。QMF周波数帯域は、時間領域ではなく、周波数領域において、信号の低周波数成分と高周波数成分を操作およびマージする目的のために使われる。低周波数成分3014は本稿で概説された高周波数再構成のためのシステムに対応する転換ユニット3004に入力される。転換ユニット3004は、エンコードされた信号の基本周波数Ωおよび/またはサブバンド選択のための可能なインデックス・シフト対(p1,p2)といった追加的情報3011をも受け取ってもよい。転換ユニット3004は、信号のハイバンドとしても知られる高周波数成分3012を生成し、それがQMFフィルタバンク3003によって周波数領域に変換される。QMF変換された低周波数成分およびQMF変換された高周波数成分の両方は操作およびマージユニット3005に入力される。このユニット3005は高周波数成分の包絡線調整を実行してもよく、調整された高周波数成分および低周波数成分を組み合わせる。組み合わされた出力信号は、逆QMFフィルタバンク3001によって時間領域に再変換される。
典型的には、QMFフィルタバンクは64個のQMF周波数帯域を有する。しかしながら、低周波数成分3013をダウンサンプリングして、QMFフィルタバンク3002が32個のQMF周波数帯域しか必要としないようにすることが有益であることがある。そのような場合、低周波数成分3013は帯域幅fs/4をもつ。ここで、fsは信号のサンプリング周波数である。他方、高周波数成分3012は帯域幅fs/2をもつ。
本稿で記載された方法およびシステムは、ソフトウェア、ファームウェアおよび/またはハードウェアとして実装されてもよい。ある種のコンポーネントは、たとえば、デジタル信号プロセッサまたはマイクロプロセッサ上で走るソフトウェアとして実装されてもよい。他のコンポーネントはたとえば、ハードウェアおよび/または特定用途向け集積回路(application specific integrated circuit)として実装されてもよい。記載される方法およびシステムにおいて遭遇される信号は、ランダム・アクセス・メモリまたは光記憶媒体といったメディア上に記憶されてもよい。それらの信号は、電波ネットワーク、衛星ネットワーク、無線ネットワークまたは有線ネットワーク、たとえばインターネットといったネットワークを介して転送されてもよい。本稿で記載された方法およびシステムを使用する典型的な装置はセットトップボックスまたはオーディオ信号をデコードする他の顧客構内設備である。エンコード側では、本方法およびシステムは放送ステーションにおいて、たとえばビデオ・ヘッドエンド・システムにおいて使用されてもよい。
本稿は信号の高周波数再構成を、該信号の低周波数成分に基づいて実行する方法およびシステムを概説した。低周波数成分からのサブバンドの組み合わせを使うことによって、本方法およびシステムは、当技術分野で知られている転換方法によっては生成され得ない周波数および周波数帯域の再構成を許容する。さらに、記載されるHTR方法およびシステムは、低いクロスオーバー周波数の使用および/または狭い低周波数帯域からの大きな高周波数帯域の生成を許容する。
いくつかの付番実施例を記載しておく。
〔付番実施例1〕
オーディオ信号の高周波数成分を前記オーディオ信号の低周波数成分から生成するシステムであって:
・前記オーディオ信号の前記低周波数成分の複数の分解サブバンド信号を提供する分解フィルタバンクと;
・前記複数の分解サブバンド信号のうち第一および第二のものの位相に乗算を行い、位相乗算された分解サブバンド信号を組み合わせることによって、ある合成周波数をもつ合成サブバンド信号を生成する非線形処理ユニットと;
・前記合成サブバンド信号から前記オーディオ信号の前記高周波数成分を生成するための合成フィルタバンクとを有しており、
前記非線形処理ユニットが、それぞれ第一の分解周波数ωおよび第二の分解周波数(ω+Ω)をもつ前記第一および第二の分解サブバンド信号から前記合成サブバンド信号を生成する、第一および第二の転換次数の複数入力単一出力ユニットを有し;
前記第一の分解サブバンド信号は前記第一の転換次数(T−r)によって位相乗算され;
前記第二の分解サブバンド信号は前記第二の転換次数rによって位相乗算され;
T>1であり、1≦r<Tであり;
前記合成周波数は(T−r)ω+r(ω+Ω)である、
システム。
〔付番実施例2〕
付番実施例1記載のシステムであって、さらに:
・前記合成サブバンド信号に利得パラメータを乗算する利得ユニットを有する、
システム。
〔付番実施例3〕
付番実施例1または2記載のシステムであって、さらに:
・前記合成周波数をもつ複数の部分合成サブバンド信号を生成する複数の複数入力単一出力ユニットおよび/または複数の非線形処理ユニットと;
・前記複数の部分合成サブバンド信号を組み合わせるサブバンド合計ユニットとを有する、
システム。
〔付番実施例4〕
付番実施例1または2記載のシステムであって、前記非線形処理ユニットがさらに:
・前記複数の分解サブバンド信号のうちの第三のものからさらなる合成サブバンド信号を生成する直接処理ユニットと;
・前記合成周波数をもつ合成サブバンド信号を組み合わせるサブバンド合計ユニットとを有する、
システム。
〔付番実施例5〕
付番実施例1ないし4のうちいずれか一項記載のシステムであって、
前記サブバンド合成ユニットは、前記複数入力単一出力ユニットにおいて生成された合成サブバンド信号を、前記第一および第二の分解サブバンド信号の大きさのうちの最小値が、前記信号の大きさの所定の割合より小さい場合には、無視する、
システム。
〔付番実施例6〕
付番実施例4記載のシステムであって、前記直接処理ユニットが:
・第三の分解周波数を示す前記第三の分解サブバンド信号から前記合成サブバンド信号を生成する、第三の転換次数T'の単一入力単一出力ユニットを有しており、
前記第三の分解サブバンド信号は前記第三の転換次数T'によって位相修正され;
T'は1より大きく;
前記合成周波数は前記分解周波数に前記第三の転換次数を乗算したものに対応する、
システム。
〔付番実施例7〕
付番実施例1ないし6のうちいずれか一項記載のシステムであって、
前記信号が基本周波数を含み;
前記分解フィルタバンクが前記信号の前記基本周波数に関連する周波数間隔を示す、
システム。
〔付番実施例8〕
付番実施例1ないし6のうちいずれか一項記載のシステムであって、
前記分解フィルタバンクは、本質的に一定のサブバンド間隔Δωで、N個の分解サブバンドを有し;
分解サブバンドは、分解サブバンド・インデックスnに関連付けられており、ここでn∈{1,……,N}であり;
前記合成フィルタバンクは合成サブバンドを有し;
前記合成サブバンドは合成サブバンド・インデックスnに関連付けられており:
インデックスnをもつ前記合成サブバンドおよび前記分解サブバンドはそれぞれ、前記因子Tを通じて互いに関係する周波数範囲を有する、
システム。
〔付番実施例9〕
付番実施例8記載のシステムであって、
前記合成サブバンド信号がインデックスnをもつ合成サブバンドと関連付けられており;
前記第一の分解サブバンド信号はインデックスn−p1をもつ分解サブバンドに関連付けられており;
前記第二の分解サブバンド信号はインデックスn+p2をもつ分解サブバンドに関連付けられており;
当該システムがさらに、p1およびp2を選択するインデックス選択ユニットを有する、
システム。
〔付番実施例10〕
付番実施例9記載のシステムであって、
前記インデックス選択ユニットが、インデックス記憶ユニットに記憶されている対(p1,p2)の限られたリストからインデックス・シフトp1およびp2を選択するよう動作可能である、
システム。
〔付番実施例11〕
付番実施例10記載のシステムであって、
前記インデックス選択ユニットは、前記第一の分解サブバンド信号の大きさおよび前記第二の分解サブバンド信号の大きさを含む集合の最小値が最大にされるよう、対(p1,p2)を選択するよう動作可能である、
システム。
〔付番実施例12〕
付番実施例10記載のシステムであって、前記インデックス選択ユニットは、対(p1,p2)の限られたリストを、
インデックス・シフトp1=r・lであり;
インデックス・シフトp2=(T−r)・lであり;
lは正の整数である、
ように決定するよう動作可能である、システム。
〔付番実施例13〕
付番実施例12記載のシステムであって、
前記インデックス選択ユニットは、前記第一の分解サブバンド信号の大きさおよび前記第二の分解サブバンド信号の大きさを含む集合の最小値が最大にされるよう、パラメータlおよびrを選択するよう動作可能である、
システム。
〔付番実施例14〕
付番実施例9記載のシステムであって、前記インデックス選択ユニットが、前記信号の特性に基づいてインデックス・シフトp1およびp2を選択するよう動作可能である、システム。
〔付番実施例15〕
付番実施例14記載のシステムであって、
前記信号が基本周波数Ωを含み;
前記インデックス選択ユニットは、インデックス・シフトp1およびp2を、
インデックス・シフトの和p1+p2が割合Ω/Δωを近似し、
それらの比率p1/p2がr/(T−r)の倍数となる、
よう選択するよう動作可能である、システム。
〔付番実施例16〕
付番実施例14記載のシステムであって、
前記信号が基本周波数Ωを含み;
前記インデックス選択ユニットは、インデックス・シフトp1およびp2を、
インデックス・シフトの和p1+p2が割合Ω/Δωを近似し、
比率p1/p2がr/(T−r)に等しくなる、
よう選択するよう動作可能である、システム。
〔付番実施例17〕
付番実施例1ないし16のうちいずれか一項記載のシステムであって、さらに:
・所定の時間インスタンスkのまわりの前記低周波数成分の所定の時間区間を単離する分解窓と;
・所定の時間インスタンスkのまわりの前記高周波数成分の所定の時間区間を単離する合成窓とを有する、
システム。
〔付番実施例18〕
付番実施例17記載のシステムであって、
前記合成窓が前記分解窓の時間スケーリングされたバージョンである、
システム。
〔付番実施例19〕
信号をデコードするシステムであって:
前記信号の前記高周波数成分を前記信号の前記低周波数成分から生成する付番実施例1記載の転換ユニットを有する、
システム。
〔付番実施例20〕
付番実施例19記載のシステムであって、前記信号が音声信号および/または音響信号である、システム。
〔付番実施例21〕
付番実施例19ないし20のうちいずれか一項記載のシステムであって、さらに:
前記信号の前記低周波数成分をデコードするコア・デコーダを有する、
システム。
〔付番実施例22〕
付番実施例19ないし21のうちいずれか一項記載のシステムであって、さらに:
・前記低周波数成分のアップサンプリングを実行してアップサンプリングされた低周波数成分を与えるアップサンプラーと;
・前記高周波数成分を整形するための包絡線調整器と;
・前記アップサンプリングされた低周波数成分および前記調整された高周波数成分の和として、デコードされた信号を決定する成分合計ユニットとを有する、
システム。
〔付番実施例23〕
付番実施例19ないし22のうちいずれか一項記載のシステムであって、さらに:
・前記合成サブバンド信号が生成されるもとになる前記第一および第二の分解サブバンド信号の選択を許容する情報を受け取るサブバンド選択受領ユニットを有する、
システム。
〔付番実施例24〕
付番実施例23記載のシステムであって、
前記情報は、前記信号の基本周波数Ωに関連する、
システム。
〔付番実施例25〕
付番実施例23記載のシステムであって、
前記情報は、第一および第二の分解サブバンド信号の対のリストを含む、
システム。
〔付番実施例26〕
付番実施例22記載のシステムであって、さらに:
・前記信号の前記高周波成分の包絡線に関係した情報を受け取る包絡線受領ユニットを有する、
システム。
〔付番実施例27〕
付番実施例21記載のシステムであって、さらに:
・前記低周波数成分を含む前記信号を受領する入力ユニットと;
・前記低周波数成分および生成された高周波数成分を含むデコードされた信号を提供する出力ユニットとを有する、
システム。
〔付番実施例28〕
オーディオ信号の低周波数成分からの高周波数成分の高周波数再構成を実行する方法であって:
・第一の周波数ωをもつ前記低周波成分の第一のサブバンド信号および第二の周波数(ω+Ω)をもつ前記低周波成分の第二のサブバンド信号を提供する段階と;
・前記第一のサブバンド信号の位相を第一の転換因子(T−r)倍して第一の転換されたサブバンド信号を与える段階と;
・前記第二のサブバンド信号の位相を第二の転換因子r倍して第二の転換されたサブバンド信号を与える段階であって、ここで、T>1であり1≦r<Tである、段階と;
・第一および第二の転換されたサブバンド信号を組み合わせて、高周波数(T−r)ω+r(ω+Ω)をもつ高周波数成分を与える段階とを含む、
方法。
〔付番実施例29〕
付番実施例28記載の方法であって、前記提供する段階は:
・分解フィルタバンクによって前記低周波数成分をフィルタリングして、第一および第二のサブバンド信号を生成することを含む、
方法。
〔付番実施例30〕
付番実施例28または29記載の方法であって、前記組み合わせる段階は:
・前記第一および第二の転換されたサブバンド信号を乗算して前記高サブバンド信号を与える段階と;
・前記高サブバンド信号を合成フィルタバンクに入力して前記高周波数成分を生成する段階とを含む、
方法。
〔付番実施例31〕
付番実施例28ないし30のうちいずれか一項記載の方法であって、さらに:
・エンコードされたオーディオ信号をデコードして前記オーディオ信号の前記低周波数成分を与える段階を含み、前記エンコードされた信号は、あるもとの信号から導出されたものであり、該もとの信号の、クロスオーバー周波数より下の周波数サブバンドの一部のみを表している、
方法。
〔付番実施例32〕
オーディオ信号を含む受領されたマルチメディア信号をデコードするセットトップボックスであって:
・前記オーディオ信号の前記低周波数成分から前記信号の前記高周波数成分を生成するための、付番実施例1ないし27のうちいずれか一項記載の転換ユニットを有する、
セットトップボックス。
〔付番実施例33〕
コンピューティング・デバイスで実行されたときに該コンピューティング・デバイスに付番実施例28ないし31のうちいずれか一項記載の方法段階を実行させるための、ソフトウェア・プログラム。
〔付番実施例34〕
コンピューティング・デバイスで実行されたときに該コンピューティング・デバイスに付番実施例28ないし31のうちいずれか一項記載の方法段階を実行させるためのソフトウェア・プログラムが格納された記憶媒体。

Claims (21)

  1. オーディオ信号をデコードするシステムであって:
    ・前記オーディオ信号の低周波数成分をデコードするコア・デコーダと;
    ・前記オーディオ信号の前記低周波数成分の複数の分解サブバンド信号を提供する分解フィルタバンク(301)と;
    ・前記複数の分解サブバンド信号からの、合成サブバンド信号(803)が生成されるもとになる第一(801)および第二(802)の分解サブバンド信号の選択を許容する情報であって、前記オーディオ信号の基本周波数Ωに関連する情報を受け取るサブバンド選択受領ユニットと;
    ・それぞれ第一および第二の分解周波数をもつ前記第一(801)および第二(802)の分解サブバンド信号から合成周波数をもつ前記合成サブバンド信号(803)を生成する、第一および第二の転換次数の複数入力単一出力ユニット(800−n)と;
    ・前記合成サブバンド信号から前記オーディオ信号の高周波数成分を生成するための合成フィルタバンク(303)とを有する、
    システム。
  2. 請求項1記載のシステムであって、
    前記分解フィルタバンクは、本質的に一定のサブバンド間隔Δωで、N個の分解サブバンドを有し;
    分解サブバンドは、分解サブバンド・インデックスnに関連付けられており、ここでn∈{1,……,N}であり;
    前記合成フィルタバンクは合成サブバンドを有し;
    前記合成サブバンドは合成サブバンド・インデックスnに関連付けられており:
    インデックスnをもつ前記合成サブバンドの周波数範囲は同じインデックスnをもつ分解サブバンドの周波数範囲の因子T倍である
    システム。
  3. 請求項2記載のシステムであって、
    前記合成サブバンド信号がインデックスnをもつ合成サブバンドと関連付けられており;
    前記第一の分解サブバンド信号はインデックスn−p1をもつ分解サブバンドに関連付けられており;
    前記第二の分解サブバンド信号はインデックスn+p2をもつ分解サブバンドに関連付けられており、p 1 およびp 2 は正の整数であり
    当該システムがさらに、p1およびp2を選択するインデックス選択ユニットを有する、
    システム。
  4. 請求項3記載のシステムであって、前記インデックス選択ユニットが、前記オーディオ信号の基本周波数Ωに基づいてインデックス・シフトp1およびp2を選択するよう動作可能である、システム。
  5. 請求項4記載のシステムであって、
    前記インデックス選択ユニットは、インデックス・シフトp1およびp2を、
    インデックス・シフトの和p1+p2が割合Ω/Δωを近似し、
    その比率p1/p2が、1≦r<Tとして、r/(T−r)を近似する、
    よう選択するよう動作可能である、システム。
  6. 請求項4記載のシステムであって、
    前記インデックス選択ユニットは、インデックス・シフトp1およびp2を、
    インデックス・シフトの和p1+p2が割合Ω/Δωを近似し、
    比率p1/p2が、1≦r<Tとして、r/(T−r)に等しくなる、
    よう選択するよう動作可能である、システム。
  7. T=2かつr=1である、請求項5または6記載のシステム。
  8. 請求項1記載のシステムであって、さらに:
    ・所定の時間インスタンスkのまわりの前記低周波数成分の所定の時間区間を単離する分解窓と;
    ・前記所定の時間インスタンスkのまわりの前記高周波数成分の所定の時間区間を単離する合成窓とを有する、
    システム。
  9. 請求項8記載のシステムであって、
    前記合成窓が前記分解窓の時間スケーリングされたバージョンである、
    システム。
  10. 請求項1記載のシステムであって、さらに:
    ・前記低周波数成分のアップサンプリングを実行してアップサンプリングされた低周波数成分を与えるアップサンプラー(104)と;
    ・前記高周波数成分を調整するための包絡線調整器(103)と;
    ・前記アップサンプリングされた低周波数成分および前記調整された高周波数成分の和として、デコードされたオーディオ信号を決定する成分合計ユニットとを有する、
    システム。
  11. 請求項10記載のシステムであって、さらに:
    ・前記オーディオ信号の前記高周波成分の包絡線に関係した情報を受け取る包絡線受領ユニットを有する、
    システム。
  12. 請求項10記載のシステムであって、さらに:
    ・前記低周波数成分を含む前記オーディオ信号を受領する入力ユニットと;
    ・前記低周波数成分および生成された高周波数成分を含むデコードされたオーディオ信号を提供する出力ユニットとを有する、
    システム。
  13. 請求項1記載のシステムであって
    前記合成周波数は、前記第一の分解周波数に前記第一の転換次数を乗算したもの、足す、前記第二の分解周波数に前記第二の転換次数を乗算したものに対応する、
    システム。
  14. 請求項13記載のシステムであって、
    前記第一の分解周波数がωであり;
    前記第二の分解周波数が(ω+Ω)であり;
    前記第一の転換次数が(T−r)であり;
    前記第二の転換次数がrであり;
    T>1であり;
    1≦r<Tであり、
    前記合成周波数が(T−r)ω+r(ω+Ω)となる、
    システム。
  15. 請求項1記載のシステムであって、さらに:
    ・前記合成サブバンド信号に利得パラメータを乗算する利得ユニット(902)を有する、
    システム。
  16. 請求項1記載のシステムであって、
    前記分解フィルタバンクが前記オーディオ信号の前記基本周波数に関連する周波数間隔を示す、
    システム。
  17. オーディオ信号をエンコードするシステムであって:
    ・前記オーディオ信号を低周波数成分および高周波数成分に分割する分割ユニットと;
    ・前記低周波数成分をエンコードするコア・エンコーダと;
    ・前記オーディオ信号の基本周波数Ωを判別する周波数判別ユニットと;
    ・前記基本周波数Ωの値をエンコードするためのパラメータ・エンコーダとを有しており、前記基本周波数Ωの値は、前記オーディオ信号の前記高周波数成分を再生成するために使われる、
    システム。
  18. 請求項17記載のシステムであって、さらに:
    ・前記高周波数成分のスペクトル包絡線を決定する包絡線決定ユニットと;
    ・該スペクトル包絡線をエンコードする包絡線エンコーダとを有する、
    システム。
  19. エンコードされたオーディオ信号をデコードする方法であって、前記エンコードされたオーディオ信号は、
    あるもとのオーディオ信号から導出されたものであり;
    該もとのオーディオ信号の、クロスオーバー周波数より下の周波数サブバンドの一部のみを表しており、当該方法は:
    ・前記エンコードされたオーディオ信号からの低周波数成分をデコードする段階と;
    ・前記低周波数成分の複数の分解サブバンド信号を提供する段階と;
    ・前記複数の分解サブバンド信号からの、合成サブバンド信号(803)が生成されるもとになる第一(801)および第二(802)の分解サブバンド信号の選択を許容する情報であって、前記オーディオ信号の基本周波数Ωに関連する情報を受け取る段階と;
    ・第一および第二の転換次数を使って、それぞれ第一および第二の分解周波数をもつ前記第一(801)および第二(802)の分解サブバンド信号から合成周波数をもつ前記合成サブバンド信号(803)を生成する段階と;
    ・前記合成サブバンド信号から、前記クロスオーバー周波数より上の合成周波数を含む高周波数成分を生成する段階とを含む、
    方法。
  20. オーディオ信号をエンコードする方法であって:
    ・前記オーディオ信号をフィルタ処理して前記オーディオ信号の低周波数成分を単離する段階と;
    ・前記オーディオ信号の前記低周波数成分をエンコードする段階と;
    ・前記オーディオ信号の前記低周波数成分の複数の分解サブバンド信号を提供する段階と;
    ・前記オーディオ信号の高周波数成分を生成するための第一および第二の分解サブバンド信号を決定する段階と;
    基本周波数Ωの値をエンコードする段階とを含み、前記基本周波数Ωの値は、前記オーディオ信号の高周波数成分を再生成するために使用される
    方法。
  21. プロセッサ上での実行用に適応されたソフトウェア・プログラムであって、コンピューティング・デバイスで実行されたときに請求項19または20記載の方法段階を実行するための、ソフトウェア・プログラムを格納する記憶媒体。
JP2013068151A 2009-01-16 2013-03-28 クロス生成物により向上された高調波転換 Active JP5597738B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14522309P 2009-01-16 2009-01-16
US61/145,223 2009-01-16

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2011545750A Division JP5237465B2 (ja) 2009-01-16 2010-01-15 クロス生成物により向上された高調波転換

Publications (2)

Publication Number Publication Date
JP2013148920A JP2013148920A (ja) 2013-08-01
JP5597738B2 true JP5597738B2 (ja) 2014-10-01

Family

ID=42077387

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2011545750A Active JP5237465B2 (ja) 2009-01-16 2010-01-15 クロス生成物により向上された高調波転換
JP2013068151A Active JP5597738B2 (ja) 2009-01-16 2013-03-28 クロス生成物により向上された高調波転換

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2011545750A Active JP5237465B2 (ja) 2009-01-16 2010-01-15 クロス生成物により向上された高調波転換

Country Status (21)

Country Link
US (9) US8818541B2 (ja)
EP (8) EP3598445B1 (ja)
JP (2) JP5237465B2 (ja)
KR (2) KR101589942B1 (ja)
CN (2) CN102282612B (ja)
AU (1) AU2010205583B2 (ja)
BR (3) BRPI1007050B1 (ja)
CA (7) CA3084938C (ja)
CL (1) CL2011001717A1 (ja)
ES (7) ES2885804T3 (ja)
HK (1) HK1162735A1 (ja)
MX (1) MX2011007563A (ja)
MY (1) MY180550A (ja)
PL (6) PL3992966T3 (ja)
RU (5) RU2495505C2 (ja)
SG (1) SG172976A1 (ja)
TR (1) TR201910073T4 (ja)
TW (2) TWI523005B (ja)
UA (1) UA99878C2 (ja)
WO (1) WO2010081892A2 (ja)
ZA (1) ZA201105923B (ja)

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
UA99878C2 (ru) 2009-01-16 2012-10-10 Долби Интернешнл Аб Гармоническое преобразование, усовершенствованное перекрестным произведением
RU2493618C2 (ru) * 2009-01-28 2013-09-20 Долби Интернешнл Аб Усовершенствованное гармоническое преобразование
BRPI1007528B1 (pt) 2009-01-28 2020-10-13 Dolby International Ab Sistema para gerar um sinal de áudio de saída a partir de um sinal de áudio de entrada usando um fator de transposição t, método para transpor um sinal de áudio de entrada por um fator de transposição t e meio de armazenamento
EP2239732A1 (en) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
TWI556227B (zh) 2009-05-27 2016-11-01 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US8971551B2 (en) 2009-09-18 2015-03-03 Dolby International Ab Virtual bass synthesis using harmonic transposition
TWI404050B (zh) * 2009-06-08 2013-08-01 Mstar Semiconductor Inc 多聲道音頻信號解碼方法與裝置
EP2306456A1 (en) * 2009-09-04 2011-04-06 Thomson Licensing Method for decoding an audio signal that has a base layer and an enhancement layer
JP5433022B2 (ja) 2009-09-18 2014-03-05 ドルビー インターナショナル アーベー 高調波転換
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
ES2805349T3 (es) * 2009-10-21 2021-02-11 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
KR102020334B1 (ko) 2010-01-19 2019-09-10 돌비 인터네셔널 에이비 고조파 전위에 기초하여 개선된 서브밴드 블록
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CN103155033B (zh) * 2010-07-19 2014-10-22 杜比国际公司 高频重建期间的音频信号处理
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
US9236063B2 (en) 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
AU2015202647B2 (en) * 2010-09-16 2017-05-11 Dolby International Ab Cross product enhanced subband block based harmonic transposition
CA3191597C (en) * 2010-09-16 2024-01-02 Dolby International Ab Cross product enhanced subband block based harmonic transposition
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US8675881B2 (en) * 2010-10-21 2014-03-18 Bose Corporation Estimation of synthetic audio prototypes
US9078077B2 (en) 2010-10-21 2015-07-07 Bose Corporation Estimation of synthetic audio prototypes with frequency-based input signal decomposition
CN103477387B (zh) 2011-02-14 2015-11-25 弗兰霍菲尔运输应用研究公司 使用频谱域噪声整形的基于线性预测的编码方案
BR112013020482B1 (pt) 2011-02-14 2021-02-23 Fraunhofer Ges Forschung aparelho e método para processar um sinal de áudio decodificado em um domínio espectral
KR101551046B1 (ko) 2011-02-14 2015-09-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 저-지연 통합 스피치 및 오디오 코딩에서 에러 은닉을 위한 장치 및 방법
MY166394A (en) 2011-02-14 2018-06-25 Fraunhofer Ges Forschung Information signal representation using lapped transform
KR101525185B1 (ko) 2011-02-14 2015-06-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
ES2639646T3 (es) 2011-02-14 2017-10-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificación y decodificación de posiciones de impulso de pistas de una señal de audio
AU2012218409B2 (en) * 2011-02-18 2016-09-15 Ntt Docomo, Inc. Speech decoder, speech encoder, speech decoding method, speech encoding method, speech decoding program, and speech encoding program
EP3279895B1 (en) * 2011-11-02 2019-07-10 Telefonaktiebolaget LM Ericsson (publ) Audio encoding based on an efficient representation of auto-regressive coefficients
EP3544006A1 (en) 2011-11-11 2019-09-25 Dolby International AB Upsampling using oversampled sbr
US20130162901A1 (en) * 2011-12-22 2013-06-27 Silicon Image, Inc. Ringing suppression in video scalers
US8917197B2 (en) * 2012-01-03 2014-12-23 Nucript LLC System and method for improving performance of photonic samplers
BR122021018240B1 (pt) * 2012-02-23 2022-08-30 Dolby International Ab Método para codificar um sinal de áudio multicanal, método para decodificar um fluxo de bits de áudio codificado, sistema configurado para codificar um sinal de áudio, e sistema para decodificar um fluxo de bits de áudio codificado
CN102584191B (zh) * 2012-03-22 2014-05-14 上海大学 用蛇纹石尾矿制备堇青石陶瓷的方法
CN110706715B (zh) * 2012-03-29 2022-05-24 华为技术有限公司 信号编码和解码的方法和设备
JP5894347B2 (ja) * 2012-10-15 2016-03-30 ドルビー・インターナショナル・アーベー 転移器に基づく仮想ベース・システムにおけるレイテンシーを低減するシステムおよび方法
CN103928031B (zh) * 2013-01-15 2016-03-30 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
KR101775084B1 (ko) * 2013-01-29 2017-09-05 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 주파수 향상 오디오 신호를 생성하는 디코더, 디코딩 방법, 인코딩된 신호를 생성하는 인코더, 및 컴팩트 선택 사이드 정보를 이용한 인코딩 방법
US9881624B2 (en) 2013-05-15 2018-01-30 Samsung Electronics Co., Ltd. Method and device for encoding and decoding audio signal
MX353240B (es) * 2013-06-11 2018-01-05 Fraunhofer Ges Forschung Dispositivo y método para extensión de ancho de banda para señales acústicas.
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
JP6531649B2 (ja) 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
FR3015754A1 (fr) * 2013-12-20 2015-06-26 Orange Re-echantillonnage d'un signal audio cadence a une frequence d'echantillonnage variable selon la trame
JP6593173B2 (ja) 2013-12-27 2019-10-23 ソニー株式会社 復号化装置および方法、並びにプログラム
DE102014003057B4 (de) * 2014-03-10 2018-06-14 Ask Industries Gmbh Verfahren zur Rekonstruierung hoher Frequenzen bei verlustbehafteter Audiokomprimierung
US9306606B2 (en) * 2014-06-10 2016-04-05 The Boeing Company Nonlinear filtering using polyphase filter banks
EP2963646A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980798A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
TWI693594B (zh) 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
WO2016180704A1 (en) 2015-05-08 2016-11-17 Dolby International Ab Dialog enhancement complemented with frequency transposition
US9837089B2 (en) 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US10847170B2 (en) * 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9454343B1 (en) 2015-07-20 2016-09-27 Tls Corp. Creating spectral wells for inserting watermarks in audio signals
US9311924B1 (en) 2015-07-20 2016-04-12 Tls Corp. Spectral wells for inserting watermarks in audio signals
US9626977B2 (en) 2015-07-24 2017-04-18 Tls Corp. Inserting watermarks into audio signals that have speech-like properties
US10115404B2 (en) 2015-07-24 2018-10-30 Tls Corp. Redundancy in watermarking audio signals that have speech-like properties
TWI807562B (zh) 2017-03-23 2023-07-01 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
US10573326B2 (en) * 2017-04-05 2020-02-25 Qualcomm Incorporated Inter-channel bandwidth extension
CN108108333B (zh) * 2017-05-02 2021-10-19 大连民族大学 一种伪双谱分离具有相同谐波频率成分信号的方法
IL278223B2 (en) * 2018-04-25 2023-12-01 Dolby Int Ab Combining high-frequency audio reconstruction techniques
CN109003621B (zh) * 2018-09-06 2021-06-04 广州酷狗计算机科技有限公司 一种音频处理方法、装置及存储介质
CN109036457B (zh) * 2018-09-10 2021-10-08 广州酷狗计算机科技有限公司 恢复音频信号的方法和装置
CN110244290A (zh) * 2019-06-17 2019-09-17 电子科技大学 一种距离扩展目标的检测方法

Family Cites Families (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4048443A (en) 1975-12-12 1977-09-13 Bell Telephone Laboratories, Incorporated Digital speech communication system for minimizing quantizing noise
US4998072A (en) * 1990-02-20 1991-03-05 John Fluke Mfg. Co., Inc. High resolution direct digital synthesizer
SE501305C2 (sv) 1993-05-26 1995-01-09 Ericsson Telefon Ab L M Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler
KR100289733B1 (ko) 1994-06-30 2001-05-15 윤종용 디지탈 오디오 부호화 방법 및 장치
JP3606388B2 (ja) 1994-10-31 2005-01-05 ソニー株式会社 オーデイオデータ再生方法及びオーデイオデータ再生装置
US5781880A (en) * 1994-11-21 1998-07-14 Rockwell International Corporation Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual
TW303410B (en) 1996-04-19 1997-04-21 Kok Hua Liow Improved construction products and methods
US6252965B1 (en) 1996-09-19 2001-06-26 Terry D. Beard Multichannel spectral mapping audio apparatus and method
RU2256293C2 (ru) * 1997-06-10 2005-07-10 Коудинг Технолоджиз Аб Усовершенствование исходного кодирования с использованием дублирования спектральной полосы
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US5856674A (en) 1997-09-16 1999-01-05 Eaton Corporation Filament for ion implanter plasma shower
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
DE60019268T2 (de) 1999-11-16 2006-02-02 Koninklijke Philips Electronics N.V. Breitbandiges audio-übertragungssystem
GB0003954D0 (en) 2000-02-18 2000-04-12 Radioscape Ltd Method of and apparatus for converting a signal between data compression formats
US7742927B2 (en) 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
EP1158494B1 (en) 2000-05-26 2002-05-29 Lucent Technologies Inc. Method and apparatus for performing audio coding and decoding by interleaving smoothed critical band evelopes at higher frequencies
US7003467B1 (en) 2000-10-06 2006-02-21 Digital Theater Systems, Inc. Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio
EP1199711A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Encoding of audio signal using bandwidth expansion
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
SE0004818D0 (sv) * 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
US6889182B2 (en) * 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
US7013269B1 (en) * 2001-02-13 2006-03-14 Hughes Electronics Corporation Voicing measure for a speech CODEC system
FR2821501B1 (fr) 2001-02-23 2004-07-16 France Telecom Procede et dispositif de reconstruction spectrale d'un signal a spectre incomplet et systeme de codage/decodage associe
FR2821475B1 (fr) 2001-02-23 2003-05-09 France Telecom Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies, notamment de signaux stereophoniques
SE0101175D0 (sv) 2001-04-02 2001-04-02 Coding Technologies Sweden Ab Aliasing reduction using complex-exponential-modulated filterbanks
US7400651B2 (en) 2001-06-29 2008-07-15 Kabushiki Kaisha Kenwood Device and method for interpolating frequency components of signal
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
EP1351401B1 (en) * 2001-07-13 2009-01-14 Panasonic Corporation Audio signal decoding device and audio signal encoding device
US7333929B1 (en) 2001-09-13 2008-02-19 Chmounk Dmitri V Modular scalable compressed audio data stream
JP3926726B2 (ja) * 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
EP1423847B1 (en) 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
US7065491B2 (en) 2002-02-15 2006-06-20 National Central University Inverse-modified discrete cosine transform and overlap-add method and hardware structure for MPEG layer3 audio signal decoding
CA2464408C (en) * 2002-08-01 2012-02-21 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method for band expansion with aliasing suppression
JP3879922B2 (ja) 2002-09-12 2007-02-14 ソニー株式会社 信号処理システム、信号処理装置および方法、記録媒体、並びにプログラム
US20040083094A1 (en) 2002-10-29 2004-04-29 Texas Instruments Incorporated Wavelet-based compression and decompression of audio sample sets
KR100501930B1 (ko) 2002-11-29 2005-07-18 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
RU2244386C2 (ru) 2003-03-28 2005-01-10 Корпорация "Самсунг Электроникс" Способ восстановления высокочастотной составляющей аудиосигнала и устройство для его реализации
SE0301272D0 (sv) 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Adaptive voice enhancement for low bit rate audio coding
CN101800049B (zh) * 2003-09-16 2012-05-23 松下电器产业株式会社 编码装置和译码装置
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
EP1672618B1 (en) * 2003-10-07 2010-12-15 Panasonic Corporation Method for deciding time boundary for encoding spectrum envelope and frequency resolution
CN100507485C (zh) 2003-10-23 2009-07-01 松下电器产业株式会社 频谱编码装置和频谱解码装置
US7668711B2 (en) * 2004-04-23 2010-02-23 Panasonic Corporation Coding equipment
JP4977471B2 (ja) * 2004-11-05 2012-07-18 パナソニック株式会社 符号化装置及び符号化方法
JP5129117B2 (ja) * 2005-04-01 2013-01-23 クゥアルコム・インコーポレイテッド 音声信号の高帯域部分を符号化及び復号する方法及び装置
WO2006126844A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
US8311840B2 (en) * 2005-06-28 2012-11-13 Qnx Software Systems Limited Frequency extension of harmonic signals
KR101171098B1 (ko) 2005-07-22 2012-08-20 삼성전자주식회사 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
KR100717058B1 (ko) 2005-11-28 2007-05-14 삼성전자주식회사 고주파 성분 복원 방법 및 그 장치
US20070121953A1 (en) 2005-11-28 2007-05-31 Mediatek Inc. Audio decoding system and method
JP2007171339A (ja) * 2005-12-20 2007-07-05 Kenwood Corp オーディオ信号処理装置
JP4548348B2 (ja) 2006-01-18 2010-09-22 カシオ計算機株式会社 音声符号化装置及び音声符号化方法
CN101089951B (zh) * 2006-06-16 2011-08-31 北京天籁传音数字技术有限公司 频带扩展编码方法及装置和解码方法及装置
US20070299655A1 (en) 2006-06-22 2007-12-27 Nokia Corporation Method, Apparatus and Computer Program Product for Providing Low Frequency Expansion of Speech
JP2008033269A (ja) 2006-06-26 2008-02-14 Sony Corp デジタル信号処理装置、デジタル信号処理方法およびデジタル信号の再生装置
US20080109215A1 (en) 2006-06-26 2008-05-08 Chi-Min Liu High frequency reconstruction by linear extrapolation
EP2048658B1 (en) 2006-08-04 2013-10-09 Panasonic Corporation Stereo audio encoding device, stereo audio decoding device, and method thereof
KR101435893B1 (ko) * 2006-09-22 2014-09-02 삼성전자주식회사 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
US20080243518A1 (en) 2006-11-16 2008-10-02 Alexey Oraevsky System And Method For Compressing And Reconstructing Audio Files
US8363842B2 (en) 2006-11-30 2013-01-29 Sony Corporation Playback method and apparatus, program, and recording medium
TWI308740B (en) 2007-01-23 2009-04-11 Ind Tech Res Inst Method of a voice signal processing
US20080208575A1 (en) 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
JP4905241B2 (ja) * 2007-04-27 2012-03-28 ヤマハ株式会社 高調波生成装置、低音増強装置、およびコンピュータプログラム
US7886303B2 (en) 2007-05-18 2011-02-08 Mediatek Inc. Method for dynamically adjusting audio decoding process
CN101105940A (zh) 2007-06-27 2008-01-16 北京中星微电子有限公司 音频编解码的量化方法、反变换方法及音频编解码装置
UA99878C2 (ru) * 2009-01-16 2012-10-10 Долби Интернешнл Аб Гармоническое преобразование, усовершенствованное перекрестным произведением

Also Published As

Publication number Publication date
JP5237465B2 (ja) 2013-07-17
EP4145446B1 (en) 2023-11-22
CA2748003A1 (en) 2010-07-22
RU2495505C2 (ru) 2013-10-10
US20210366500A1 (en) 2021-11-25
EP3598445A1 (en) 2020-01-22
EP3598447B1 (en) 2021-12-01
KR101256808B1 (ko) 2013-04-22
EP3598446A1 (en) 2020-01-22
EP3598446B1 (en) 2021-12-22
PL4145446T3 (pl) 2024-04-08
US10192565B2 (en) 2019-01-29
RU2638748C2 (ru) 2017-12-15
US9799346B2 (en) 2017-10-24
US11935551B2 (en) 2024-03-19
ES2966639T3 (es) 2024-04-23
EP3992966B1 (en) 2022-11-23
KR20110128275A (ko) 2011-11-29
CA3162807C (en) 2024-04-23
RU2667629C1 (ru) 2018-09-21
US10586550B2 (en) 2020-03-10
US20140297295A1 (en) 2014-10-02
ES2734361T3 (es) 2019-12-05
EP2620941A1 (en) 2013-07-31
MY180550A (en) 2020-12-02
JP2013148920A (ja) 2013-08-01
MX2011007563A (es) 2011-09-06
RU2018130424A3 (ja) 2021-11-15
US20230298606A1 (en) 2023-09-21
SG172976A1 (en) 2011-08-29
US20180033446A1 (en) 2018-02-01
TWI523005B (zh) 2016-02-21
BR122019023684B1 (pt) 2020-05-05
ES2904373T3 (es) 2022-04-04
KR20130006723A (ko) 2013-01-17
CA3084938A1 (en) 2010-07-22
CN103632678B (zh) 2017-06-06
EP3598445B1 (en) 2021-07-07
RU2765618C2 (ru) 2022-02-01
CL2011001717A1 (es) 2012-07-20
CA2926491A1 (en) 2010-07-22
CA3124108C (en) 2022-08-02
EP3598447A1 (en) 2020-01-22
CA3009237C (en) 2020-08-25
US20240249739A1 (en) 2024-07-25
CA3084938C (en) 2021-08-24
EP2620941B1 (en) 2019-05-01
RU2013119725A (ru) 2014-11-10
RU2011133894A (ru) 2013-03-10
US11682410B2 (en) 2023-06-20
US12119011B2 (en) 2024-10-15
AU2010205583B2 (en) 2013-02-07
CA2748003C (en) 2016-05-24
PL2620941T3 (pl) 2019-11-29
US20190115038A1 (en) 2019-04-18
RU2646314C1 (ru) 2018-03-02
CA3124108A1 (en) 2010-07-22
ES2885804T3 (es) 2021-12-15
CA3009237A1 (en) 2010-07-22
EP4300495A2 (en) 2024-01-03
US20110305352A1 (en) 2011-12-15
ES2427278T3 (es) 2013-10-29
BRPI1007050B1 (pt) 2020-04-22
EP4300495A3 (en) 2024-02-21
BRPI1007050A2 (pt) 2019-03-26
JP2012515362A (ja) 2012-07-05
EP4145446A1 (en) 2023-03-08
TWI430264B (zh) 2014-03-11
WO2010081892A3 (en) 2010-11-18
PL3598446T3 (pl) 2022-03-28
CN102282612A (zh) 2011-12-14
ES2938858T3 (es) 2023-04-17
ZA201105923B (en) 2012-11-28
PL3992966T3 (pl) 2023-03-20
KR101589942B1 (ko) 2016-01-29
CA2926491C (en) 2018-08-07
UA99878C2 (ru) 2012-10-10
US20240194211A1 (en) 2024-06-13
CA3162807A1 (en) 2010-07-22
CN103632678A (zh) 2014-03-12
BR122019023704B1 (pt) 2020-05-05
US8818541B2 (en) 2014-08-26
HK1162735A1 (en) 2012-08-31
PL3598445T3 (pl) 2021-12-27
EP3992966A1 (en) 2022-05-04
US11031025B2 (en) 2021-06-08
EP2380172B1 (en) 2013-07-24
PL3598447T3 (pl) 2022-02-14
AU2010205583A1 (en) 2011-07-07
TW201128634A (en) 2011-08-16
US20200273476A1 (en) 2020-08-27
RU2018130424A (ru) 2020-02-25
CN102282612B (zh) 2013-07-24
CA3231911A1 (en) 2010-07-22
WO2010081892A2 (en) 2010-07-22
TR201910073T4 (tr) 2019-07-22
ES2901735T3 (es) 2022-03-23
TW201413709A (zh) 2014-04-01
EP2380172A2 (en) 2011-10-26

Similar Documents

Publication Publication Date Title
US11935551B2 (en) Cross product enhanced harmonic transposition

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140401

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140627

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140715

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140811

R150 Certificate of patent or registration of utility model

Ref document number: 5597738

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250