JP5844266B2 - 適応オーバーサンプリングを用いる高周波数オーディオ信号を発生させるための装置および方法 - Google Patents

適応オーバーサンプリングを用いる高周波数オーディオ信号を発生させるための装置および方法 Download PDF

Info

Publication number
JP5844266B2
JP5844266B2 JP2012534591A JP2012534591A JP5844266B2 JP 5844266 B2 JP5844266 B2 JP 5844266B2 JP 2012534591 A JP2012534591 A JP 2012534591A JP 2012534591 A JP2012534591 A JP 2012534591A JP 5844266 B2 JP5844266 B2 JP 5844266B2
Authority
JP
Japan
Prior art keywords
frequency
input
spectral
time
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012534591A
Other languages
English (en)
Other versions
JP2013508758A (ja
Inventor
ラルス ヴィレメース
ラルス ヴィレメース
ペール エクストランド
ペール エクストランド
ザシャ ディッシュ
ザシャ ディッシュ
フレデリク ナーゲル
フレデリク ナーゲル
シュテファン ヴィルデ
シュテファン ヴィルデ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Publication of JP2013508758A publication Critical patent/JP2013508758A/ja
Application granted granted Critical
Publication of JP5844266B2 publication Critical patent/JP5844266B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

本発明は、オーディオ信号の符号化に関連しかつ特に高調波トランスポーザ等の周波数領域トランスポーザを含む高周波数再構築方法に関連する。
先行技術において、高調波トランスポジションまたはタイムストレッチ等を使用する高周波数再構築のための方法がいくつか存在する。ある方法は、位相ヴォコーダによるものである。これらは、十分な高周波数分解能で周波数解析を行いかつ信号を合成する前の周波数領域で信号変調を行うことを原則とする。タイムストレッチまたはトランスポジションは、解析ウィンドウ、解析ウィンドウストライド、合成ウィンドウ、合成ウィンドウストライドの組み合わせおよび解析された信号の位相調整に依存する。
これらの方法について避けられない問題の1つは、定常音声のための高品質トランスポジションを得るために必要な周波数分解能と、過渡音声のためのシステムの過渡応答との矛盾である。
たとえば、M・パケットによる「フェーズロックドヴォコーダ」,オーディオおよび音響に対する信号処理の応用に関するIEEE ASSP会議,モホンク,1995年(M. Puckette. Phase-locked Vocoder. IEEE ASSP Conference on Applications of Signal Processing to Audio and Acoustics, Mohonk 1995)、ロベル・Aによる「位相ヴォコーダにおける過渡検出および保存」(Robel, A.: Transient detection and preservation in the phase vocoder; citeseer.ist.psu.edu/679246.html)、ラロッシュ・L,M・ドルソンによる「オーディオの改善された位相ヴォコーダ時間スケール修正」,IEEE Trans.スピーチおよびオーディオ処理,vol.7,no.3,323頁〜332頁(Laroche L., Dolson M.: “Improved phase vocoder timescale modification of audio", IEEE Trans. Speech and Audio Processing, vol. 7, no. 3, pp. 323-332)、およびラロッシュ・Jおよびドルソン・Mの「パッチ発生のための位相ヴォコーダピッチシフティング」と題する米国特許第6549884号(United States Patent 6549884 Laroche, J. & Dolson, M.: Phase-vocoder pitch-shifting for the patch generation)に記載の位相ヴォコーダを採用するアルゴリズムが、フレデリック・ナゲル,サーシャ・デイッシュによる「オーディオコーディックのための高調波帯域幅拡張法」,音響、音声および信号処理に関するICASSP国際会議,IEEE CNF,台北,台湾,2009年4月(Frederik Nagel, Sascha Disch, “A harmonic bandwidth extension method for audio codecs,” ICASSP International Conference on Acoustics, Speech and Signal Processing, IEEE CNF, Taipei, Taiwan, April 2009)において提示されている。しかしながら、「高調波帯域拡張」(HBE)と呼ばれるこの方法は、フレデリック・ナゲル,サーシャ・デイッシュ,ニコラス・レトルバックによる「オーディオコーディックのための新規な過渡取り扱いを伴う位相ヴォコーダ駆動帯域幅拡張法」,第126回AES会議,ミュンヘン,ドイツ,2009年5月(Frederik Nagel, Sascha Disch, Nikolaus Rettelbach, “A phase vocoder driven bandwidth extension method with novel transient handling for audio codecs,” 126th AES Convention, Munich, Germany, May 2009)に記載されるとおりオーディオ信号に含まれる過渡の品質劣化を招きやすい。これは、サブバンドに対する垂直コヒーレンスの保存が標準的な位相ヴォコーダアルゴリズムにおいては保証されていないばかりか、暗示的に円形周期性を呈する変換の分離された時間ブロックに対して、離散フーリエ変換(DFT、Discrete Fourier Transform)位相の再計算を行わなければないためである。
ブロックごとの位相ヴォコーダ処理によって特に2種類のアーティファクトが観察できることがわかっている。特定的には、新たに計算された位相を適用することによる信号の時間的巡回畳込効果によって生じる波形の分散および時間的エイリアシングである。
言い換えれば、BWEアルゴリズムにおけるオーディオ信号のスペクトル値に位相変調を適用することにより、オーディオ信号のブロックに含まれる過渡がブロックに循環され得る、すなわち巡回的に畳み込まれてブロックに戻り得る。これにより、時間的エイリアシングが生じ、かつ結果的にオーディオ信号の劣化が生じる。
したがって、過渡を含む信号部分については特別な処理の方法を採用する必要がある。しかしながら、BWEアルゴリズムをコーディックチェインのデコーダ側に対して行うので、計算の複雑性が深刻な問題となる。したがって、上記のオーディオ信号の劣化対策によって計算の複雑性が大きく増大するという犠牲を払うことは好ましくない。
したがって、本発明の目的は、高周波数オーディオ信号を発生するための効率的かつ質の高いコンセプトを提供することである。
この目的は、請求項1に記載の高周波数オーディオ信号を発生するための装置、請求項14に記載の高周波数オーディオ信号を発生するための方法または請求項15に記載のコンピュータプログラムにより達成される。
本発明は、過渡を別々に、すなわちオーディオ信号の非過渡部分とは別に扱うという特徴を利用する。このため、高周波数オーディオ信号を発生させるための装置は、過渡情報を判別するため入力信号を解析するための解析器を含み、入力信号の第1の部分について、過渡情報が関連付けられかつ入力信号の第2の時間的に後の部分は過渡情報を有していない。解析器は、オーディオ信号自体を実際に、すなわちエネルギー分布またはエネルギーにおける変化を解析することにより解析し、過渡部分を判別できる。これには、解析の結果をコアコーダ出力信号に基づき高周波数オーディオ信号を発生させるために使用できるように、コアコーダ出力信号をある時点で予め解析するよう、ある種の先取りが必要となる。別の例では、符号器側の過渡検出を行い、ビットストリームにおけるあるビット等のあるサイド情報を過渡特性を有する信号の時間部分へ関連付ける。そして、解析器は、この入力オーディオ信号のある部分が過渡かそうでないかを判別するためにビットストリームからこの過渡情報ビットを抽出するよう構成される。また、高周波数オーディオ信号を発生させるための装置は、入力信号を入力スペクトル表現へ変換するためのスペクトル変換器を含む。高周波数再構築を、フィルタバンク領域内で、すなわちスペクトル変換器を利用するスペクトル変換に続いて実行する。このため、スペクトルプロセッサは、入力スペクトル表現を処理して、入力スペクトル表現より高い周波数の値を含む処理されたスペクトル表現を発生させる。時間領域へ戻す変換は、次に接続された、処理されたスペクトル表現を時間表現に変換するための時間変換器により行われる。本発明によれば、スペクトル変換器および/または時間変換器は、過渡情報が関連付けられた入力信号の第1の部分について周波数領域オーバーサンプリングを行いかつ関連の過渡情報を有しない入力信号の第2の部分についての周波数領域オーバーサンプリングは行わないよう制御可能である。
本発明は、組み合わせたフィルタバンクにおける高調波トランスポジション等のトランスポジションについて良好な過渡性能を維持しながらも、結果として複雑性を低減するという点で有利である。したがって、本発明は、フィルタバンクにおける組み合わされたトランスポーザの周波数において適応オーバーサンプリングを有する装置および方法を含み、このオーバーサンプリングは、好ましい実施例では過渡検出器により制御される。
好ましい実施例では、スペクトルプロセッサが、ベースバンドから第1の高帯域部分、好ましくは3または4の高帯域部分等の追加の高帯域部分への高調波トランスポジションを行うことが好ましい。実施例において、各高帯域部分は、逆FFT等の単独の合成フィルタバンクを有する。他の実施例では、これは、計算上より効率的で、単一の1024逆FFT等の単一合成フィルタバンクを使用する。両方の場合とも、周波数領域オーバーサンプリングは、係数1.5等のオーバーサンプリング係数により変換サイズを大きくすることにより得られる。付加的なFFT入力は、好ましくはゼロパディングを行うこと、すなわちウィンドウ化されたフレームの第1の値の前にいくつかのゼロを加え、かつウィンドウ化されたフレームの終わりにいくつかのゼロを加えることにより得られる。FFT制御信号に応答して、FFTのサイズはオーバーサンプリングにより拡大しかつ好ましくはゼロパディングが行われる。ただし、ゼロとは異なるいくつかの雑音値等の他の値をウィンドウ化されたフレームにパディングすることもできる。
スペクトルプロセッサは、付加的に解析器出力信号によっても制御できる。すなわちFFTが非過渡または非パディングの場合に比べて長い過渡部の場合について、フィルタバンク内のラインのマッピングのための、すなわち異なるトランスポジションの「ラウンド」またはトランスポジション繰り返しのための開始インデックス値を、オーバーサンプリング係数に応じて変更する。この変更は、好ましくは、オーバーサンプリング係数を、使用された変換領域インデックスに乗じて、周波数領域のオーバサンプルの場合についてパッチ動作をするための新たな開始インデックスを得ることを含む。
次に、好ましい実施例について、添付の図面を参照して、説明する。
高周波数オーディオ信号を発生するための装置のブロック図である。 aは、高周波数オーディ信号を発生するための装置の実施例を示す図であり、かつbは、図1または図2aの高周波数オーディオ信号を発生するための装置を含むスペクトル帯域複製プロセッサを帯域幅拡張した信号を最終的に得るSBR処理全体のブロックとして示す図である。 スペクトルプロセッサ内で行われる処理アクション/ステップの実施例を示す図である。 いくつかの合成フィルタバンクのフレームワークにおける本発明の実施例の図である。 単一の合成フィルタバンクが使用される他の実施例の図である。 図5の実施例のためのフィルタバンクにおけるスペクトルのトランスポジションおよびラインの対応のマッピングを示す図である。 aは、ウィンドウの中心に近い過渡事象の過渡ストレッチを示す図であり、bは、ウィンドウのエッジに近い過渡ストレッチを示す図であり、かつcは、関連の過渡情報を有する入力信号の第1の部分に発生するオーバーサンプリングを伴う過渡ストレッチを示す図である。
図1は、実施例による高周波数オーディオ信号を発生させるための装置を示す図である。入力信号は、入力信号ライン10を介して、解析器12およびスペクトル変換器14へ与えられる。解析器は、入力信号を解析して、過渡情報ライン16へ出力されるべき過渡情報を決定するよう構成される。また、解析器は、入力信号のうち過渡情報を有していない第2の後ろの部分が存在するかどうかも見つけ出す。常に過渡的な信号というのは存在しない。複雑であるため、入力信号の過渡部分、すなわち「第1の部分」がめったに発生しないように過渡検出を行うことが好ましいが、これは、発明の周波数領域オーバーサンプリングが、効率を低減するものの、良質のオーディオ処理には必要だからである。本発明によれば、周波数領域のオーバーサンプリングは、実際に必要な時にオンになり、必要でない時、すなわち信号が非過渡的信号である場合にはオフに切り替わる。ただし、周波数領域オーバーサンプリングは、図7aに関連して説明するとおり、ウィンドウの中心付近に過渡事象を有する過渡信号についてはオフに切り替えることもできる。しかしながら、効率と複雑性の理由で、ある部分が、この過渡事象がウィンドウの中心に近いか否かに関係なく、過渡を含んでいる場合には、過渡部分としてマークすることが好ましい。図4および図5に関連して説明するとおり多重オーバーラッピング処理により、各過渡は、いくつかのウィンドウについては、中心に近くなり、すなわち「良い」過渡であるが、他のいくつかのウィンドウについては、ウィンドウのエッジに近くなり、したがって、これらのウィンドウについては、「悪い」過渡ということにもなる。
スペクトル変換器14は、入力信号をライン11上に出力される入力スペクトル表現に変換するよう構成される。スペクトルプロセッサ13は、ライン11を介してスペクトル変換器に接続される。
スペクトルプロセッサ13は、入力スペクトル表現に対して処理を行って、入力されたスペクトル表現よりも高い周波数の値を含む処理されたスペクトル表現を発生するよう構成される。言い換えれば、スペクトルプロセッサ13は、トランスポジションを行いかつ好ましくは高調波トランスポジションを行う。ただし、スペクトルプロセッサ13においては他のトランスポジションを行うこともできる。処理されたスペクトル表現は、スペクトルプロセッサ13からライン15を介して時間変換器17へ出力されるが、時間変換器17は、処理されたスペクトル表現を時間表現に変換するよう構成される。好ましくは、スペクトル表現は、周波数領域またはフィルタバンク領域表現であって、時間表現は、直線的なフル帯域幅時間領域表現である。ただし、時間変換器は、処理されたスペクトル表現15を各々FFTフィルタバンクよりも高いある帯域幅を有する個別のサブ帯域信号を有するフィルタバンク領域に直接変換するよう構成することもできる。したがって、出力ライン18上の出力時間表現も、1またはいくつかのサブ帯域信号を含むことも可能で、各サブ帯域信号が処理されたスペクトル表現における周波数ラインまたは値よりも高い帯域幅を有する。
スペクトル変換器14もしくは時間変換器17またはその両方の素子は、オーディオ品質の損失を伴わずに、高い効率と低減された複雑性を実現するため、関連の過渡情報を有するオーディオ信号の第1の部分について周波数領域オーバーサンプリングを行い、過渡情報を有していない入力信号の第2の部分については周波数領域オーバーサンプリングを行わないよう、スペクトル変換アルゴリズムの大きさに関して、制御可能である。
好ましくは、スペクトル変換器は、第2の部分に適用される変換の長さに比べて関連する過渡情報を有する第1の部分の変換長さを長くすることにより、周波数領域オーバーサンプリングを実行するよう構成され、より長い変換長は、パディングされたデータを含む。2つの変換長の長さの差は、1.3から3の範囲が可能な周波数領域オーバーサンプリング係数により表され、できるだけ低く、かつ図7に示す「悪い過渡」がプリエコーを導入しないよう、または導入するのは許容可能な小さなプリエコーだけにすることを確実にするのに十分な大きさであることが好ましい。オーバーサンプリング係数の好ましい値は、1.4〜1.9の範囲である。
次に、図2aを参照して、好ましい実施例による図1のスペクトル変換器14、スペクトルプロセッサ13または時間変換器17について詳細に説明する。
スペクトル変換器14は、解析ウィンドワ14aおよびFFTプロセッサ14bを含む。また、時間変換器は、逆FFTモジュール17a、合成ウィンドワ17bおよびオーバーラップ付加プロセッサ17cを含む。発明の装置は、たとえば、図5および図6に関連して説明する単一の時間変換器17を含んでもよいし、または図4に示すような単一のスペクトル変換器14およびいくつかの時間変換器を含むこともできる。スペクトル変換器13はたとえば位相処理/トランスポジションモジュール13aを含むのが好ましく、これについては以下に詳説する。しかしながら、位相処理/トランスポジションモジュールは、たとえばM・ディーツ,S・リリヤード,K・キョルリンクおよびO・クンツによる「スペクトル帯域複製、オーディオコーディングにおける新しいアプローチ」,第112回AES会議,ミュンヘン,2002年5月(M. Dietz, S. Liljeryd, K. Kjoerling and O. Kunz “Spectral Band Replication, a Novel Approach in Audio Coding”, in 112th AES convention, Munich, May 2002)から知られるフィルタバンク内に低周波数ラインから高周波数ラインを発生させるための既知のパッチアルゴリズムのいずれかにより実現できる。パッチアルゴリズムについては、さらにISO/IEC14496−3:2001(MPEG−4標準)に記載される。しかしながら、図5の単一の合成フィルタバンクの実施例および図6に関連して詳説するとおり、MPEG−4標準のパッチアルゴリズムとは対照的に、スペクトルプロセッサ13が、数回の「ラウンド」または繰り返しで高調波トランスポジションを実行する。
図2bは、高周波数再構築プロセッサのためのSBR(スペクトル帯域複製)を示す。入力ライン10上の、たとえば時間領域出力信号であると考えられるコアデコーダ出力信号が、ブロック20へ付与され、これが図1または図2aの処理を表す。この実施例では、時間変換器18は最終的に真の時間領域信号を出力する。この真の時間領域信号が、次に、好ましくはQMF(直交ミラーフィルター)解析ステージ21に入力され、これにより複数のサブバンド信号がライン22上に付与される。これらの個別のサブバンド信号は、SBRプロセッサ23に入力され、プロセッサは付加的にSBRパラメータ24を受けるが、こられのパラメータは典型的には、入力ビットストリーム由来のものであり、コアデコーダ(図2bでは不図示)に入力される符号化された低帯域信号がこれに属する。SBRプロセッサ23は、調整された包絡線を出力し、かつそれ以外では、操作された高周波数オーディオ信号をQMF合成ステージ25へ出力し、同ステージは最終的にライン26上に時間領域高帯域オーディオ信号を出力する。ライン26上の信号は、コンバイナ27に転送され、コンバイナは、付加的に低帯域信号をバイパスライン28を介して受ける。バイパスライン28またはコンバイナが低帯域信号に十分な遅延を導入して、正確な高帯域信号26が正確な低いバンド信号28と組み合わされることが好ましい。代替的には、QMF合成ステージ25は、低帯域信号もQMF表現で得られかつその低帯域のQMF表現が、ライン29で示すQMF合成ステージ25のより低いチャネルに付与される場合、合成ステージおよびコンバイナの機能を提供することができる。この場合、コンバイナ27は不要である。QMF合成ステージ25の出力またはコンバイナ27の出力に、帯域幅拡張したオーディオ信号が出力される。この信号は、その後、ストア、伝送または増幅器およびラウドスピーカーで再生することができる。
図4は、複数の異なる時間変換器170a,170bおよび170cに依存する本発明の実施例を示す。また、図4は、この実施例における128サンプルの解析ストライドaを有する図2aの解析ウィンドワ14aの処理を示す。解析ウィンドウについて1024サンプルの長さを考える場合、これは解析ウィンドウ14aの8倍のオーバーラップ処理を意味する。
ブロック14の出力に、入力スペクトル表現が存在し、これが、並列に配列された位相プロセッサ41,42および43を介して処理される。位相プロセッサ41は、図1のスペクトルプロセッサ13の一部であり、好ましくは、スペクトル変換器14からの複素数のスペクトル値を入力として受けかつ各値の各位相に2が乗算されるように各値を処理する。位相プロセッサ14の出力に、前のブロック41と同じ振幅を有するが、各位相に2が乗算された処理されたスペクトル表現が存在する。同様に、位相プロセッサ42は、各入力スペクトルラインの位相を決定し、この位相に係数3を乗算する。同様に、位相プロセッサ43は、このスペクトルコンバータにより出力される各複素数のスペクトルラインの位相を再び回収し、各スペクトルラインの位相に4を乗じる。その後、これら位相プロセッサの出力は、対応する時間変換器170a,170bおよび170cへ転送される。また、ダウンサンプラ44および45が設けられ、ダウンサンプラ44が、3/2のダウンサンプリング係数を有し、かつダウンサンプラ45が、2のダウンサンプリング係数を有する。ダウンサンプラ44および45の出力ならびに時間変換器170aの出力では、すべての信号が、2fsに等しい同じサンプリングレートであり、かつしたがって加算器46を介するサンプル態様で1つのサンプル内にともに加算され得る。したがって、加算器46の出力信号は、図4の左側においては、入力信号fsのサンプリング周波数の2倍の周波数を有する。スペクトル時間変換器170aの出力信号が、入力サンプリングレートの大きさの倍なので、この例では、256という異なるストライドのオーバーラップ加算処理をブロック170aにおいて行う。結果として、「3」で示す他のオーバーラップ加算処理は、時間変換器bにおいて構成され、かつより大きな512のストライドが時間変換器170cにより適用される。アイテム44および45が3/2および4/2のダウンサンプリングを行うが、このダウンサンプリングは、ある意味で、位相ヴォコーダ理論により知られる3×ダウンサンプリングおよび4×ダウンサンプリングに相当する。係数1/2は、素子170aの出力がいずれにしても入力に比べて2倍のサンプリング周波数にあるという事実から来ており、たとえばコンバイナ46による第1の処理は、2倍のサンプリングレートで行われる。これに関しては、サンプリングレートを2倍に増やすかまたは他のより高いサンプリングレートが必要であり、これは、高周波数オーディオ信号のスペクトル成分がより高くかつエイリアシングのない信号を生成するためには、サンプリングレートもサンプリング定理により上げる必要があるからである。
より高い周波数は、異なる時間変換器170a,170bおよび170cに給電して、スペクトルプロセッサ41、42および43が出力する信号が対応の周波数チャネルに入力されるようにすることで発生される。また、時間変換器170a,170bおよび170cは、入力フィルタバンク14と比較して周波数間隔が大きく、そのためこれらのプロセッサの同じ大きさすなわち同じFFTサイズの代わりに、このプロセッサにより発生させられる信号がより高いスペクトル成分または言い換えれば、より高い最大周波数を表す。
解析器12は、入力信号からの過渡情報を回収し、プロセッサ14,170a,170bおよび170cを制御して、より大きな変換サイズを使用しかつウィンドウ化されたフレームの開始前およびウィンドウ化されたフレームの終了後にパッディングされた値を使用するよう構成され、それにより周波数領域オーバーサンプリングが適応的に行われる。図5に示す代替的実施例では、単一の合成フィルタバンク17が、3つの合成フィルタバンク170a,170bおよび170cの代わりに使用される。この点では、図4に示すブロック41から43に示すように位相プロセッサ13は、2,3および4の乗算に対応する位相処理を一括して行う。また、スペクトル変換器14は、解析ストライド128でウィンドウ化動作を行い、かつ時間変換器17は、合成ストライド256でオーバーラップ加算処理を行う。時間変換器17は、周波数時間変換を行う一方、個々の周波数ラインの間に二重の間隔を付与する。ブロック17の出力は、ウィンドウごとに、1024値でありかつサンプリングレートが倍であるので、ウィンドウ化されたフレームの時間長は、入力フレームの時間長の量の半分である。長さにおけるこの減分は、256の合成ストライド、一般に、解析ストライドの2倍の合成ストライドを付与することにより均衡される。一般に、合成ストライドは、係数により解析ストライドより大きくする必要があるが、この係数は、サンプリング周波数増加の係数と等しくなり得る。
図5は、図4の2つのより低いブランチを省く、トランスポーザのための効率的な組み合わせフィルタバンク構造を示す。3次および4次の高調波が、図5に示すように2次バンクにおいて生成される。フィルタバンクパラメータT=3,4における変化により、図6に関連して説明するように、図3のサブバンドの単純な1対1のマッピングを補間ルールに一般化する必要がある。原則的には、合成フィルタバンクサブバンドの物理的間隔が、解析フィルタバンクのものの2倍になるなら、インデックスnを有する合成帯域への入力は、インデックスkおよびk+1を有する解析帯域から入手される。さらに、定義のため、k+rが整数およびnQ/Tの分数表現を表すと仮定する。大きさについての幾何学的補間を累乗(1−r)およびrで適用し、位相は、重みT(1−r)およびTrで線形に結合される。たとえば、Q=2の場合、各トランスポジション係数の位相マッピングは、図6に示すとおりである。詳細には、図6の左側は、スペクトルのトランスポジションのグラフであり、右側は、フィルタバンク領域のラインのマッピング、すなわち標的ラインへ向かうソースラインの給電を示し、ソースラインは、解析フィルタバンク、すなわちスペクトル変換器の出力であり、かつ標的ラインまたは標的ビンとは、合成または時間変換器への入力である。標的ビンへのこの「再接続」または給電ソースビンは、実際にはより高い周波数を発生する。というのも、最終的に、たとえば、図6のfsで示す部分におけるkに対応する物理的周波数の、標的周波数k,3/2kまたは2kへのトランスポジションが、それぞれ2,3または4による物理周波数のトランスポジションに相当するようなサンプリングレートが2倍のシステムでは、たとえば、左側の真ん中および下部に見られるように、周波数インデックスkは、3/2kまたは2kの周波数へトランスポーズされるからである。
また、インデックスkを有する周波数ラインが、同じインデックスkを有する周波数ラインにマッピングされるが、図6の左側の第1の部分は、係数2によるトランスポジションを示す。しかしながら、このトランスポジションは、同じFFTカーネルサイズを用いて、異なる周波数間隔、すなわち倍にされた周波数間隔で暗示的に行う係数2のサンプリングレート変換により生じる。この点で、解析フィルタバンク出力(ソースビン)から合成フィルタバンク入力(標的ビン)へのフィルタバンクにおけるラインのマッピングは、同じインデックスkを同じインデックスkにマッピングするため、第1の場合には直線的で、しかしながら各ソースビンスペクトルラインの位相は、2本の矢印62による乗算によって示されるように2を乗じられる。これによりトランスポジション係数2で2次トランスポジションが生じる。
実際に3次トランスポジションを実現または近似化するために、標的ビンは、周波数に関して3/2kから上向きに延びる。標的ビン3/2kおよび3/2(k+2)についての結果も直線的なものであり、これは、ソースビンk,k+2における対応のスペクトルラインは、そのまま取ることができ、かつそれらの位相はそれぞれ位相乗算矢印63で示されるとおり3を乗じられる。しかしながら、標的ビン3/2(k+1)は、ソースビンにおいて直接の対応部分を有していない。たとえば、k=4でかつk+1=5である小さい例を考えると、3/2kは6に相当し、これを1.5で除算すれば、結果は、k=4である。しかしながら、次の標的ビン=7であり、かつ7を1.5で除算すると4.66になる。しかしながら、インデックス4.66を有するソースビンは存在しない。というのも整数のソースビンしか存在しないからである。したがって、隣接または近接するソースビンkおよびk+1の間の補間が行われる。しかしながら、4.66は、4(k)よりも5(k+1)に近いので、ソースビンk+1の位相情報は、矢印62により示す2を乗算されかつソースビンkからの位相情報(4に等しい例では)は、1による位相乗算を表す位相矢印61が示す1を乗算される。これはもちろん位相を単にそのまま取るということに相当する。矢印61および62が表す動作を行って得られるこれらのフェーズを、合算するなど組み合わせることが好ましく、両方の矢印による位相の乗算を行い乗算値3を得ることがさらに好ましいが、これは、3次トランスポジションに必要なものである。同様に、3/2k+2および3/2(k+2)+1の位相値を計算する。
4次トランポジションについても同様の計算を行い、補間した値が矢印62で示すとおり、2つの隣接するソースビンにより計算され、各ソースビンの位相に2が乗算される。一方、整数倍の直接的に対応する標的ビンの位相は、補間する必要はなく、4を乗算したソースビンの位相を用いて計算される。
なお、標的ビンをソースビンから直接的に計算する好ましい実施例においては、位相は、ソースビンについてのみ修正され、かつソースビンの振幅は、そのまま維持される。補間された値については、2つの隣接するソースビンの振幅間で補間を行うことが好ましいが、2つ隣接するソースビンのうち常に高い方の振幅もしくは低い方の振幅を取るか、または幾何学的平均値、算術平均値もしくは隣接するソースビン振幅のなんらかの他の組み合わせを取るなどして、これら2つのソースビンを組み合わせる他の方法を実行することもできる。
図3は、好ましい実施例を図6の手順についてのフローチャートで示す図である。ステップ30において、標的ビンを選択する。その後、ステップ31において、可能な場合、トランスポジション係数を用いて単一位相を乗算することにより位相を計算する。したがって、ステップ31は、3倍の位相乗算を、3次トランスポジションにおいて行うことができるかまたは4次トランスポジションにおいて4を乗算(矢印64)する出来事について適用する。補間された標的ビンの計算については、これらの値を単一のソースビンから直接計算することは不可能である。その代り、補間するために使用する隣接するソースビンをステップ32に示すとおり選択する。実施例では、隣接するソースビンは、図5に示す組み合わされたアップサンプリングの場合には、整数トランスポジション係数または分数トランスポジション係数で、計算する標的ビンを除算して得られる非整数の数を囲む2つの整数である。次に、ステップ33において、対応の位相係数を隣接するソースビン位相に適用して、標的ビン位相を計算する。隣接するソースビンに適用された位相係数の和は、たとえば矢印61による1倍の位相「乗算」と矢印62による2倍の位相乗算を行うことによって、中央部に示されたようなトランスポジション係数に等しくなり、3次のトランスポジション係数T=3に対応する(1+2)位相乗算が得られる。
次に、ステップ34で、標的ビン振幅を、ソースビン振幅を補間することにより決定することが好ましい。代替の実施例では、標的ビン振幅は、ソースビン振幅または直接計算した標的ビンの平均標的ビン振幅に基づきランダムに選択することができる。ランダムな選択を適用する場合、2つのソースビン振幅値の平均または一方をランダム処理の中央値として決めることができる。
周波数領域オーバーサンプリングにより、トランスポーザの改善された過渡応答が得られるが、これは、長さ1024FのDFTカーネルを使用しかつその長さに対称な解析および合成ウィンドウをゼロパディングすることにより実現される。ここで、Fは、周波数領域オーバーサンプリング係数である。
複雑さのため、オーバーサンプリングの量は最小に保つことが重要で、ここで、一連の図面により、以下にその基本的理論を説明する。
プロトタイプの過渡信号が時間t=tにおけるディラックパルスであるとする。ここで、位相にTを乗じることは、t=Tt0-でパルスの変換を行うために正しいことのように思われる。実際、無限持続時間のウィンドウを有する理論上のトランスポーザでは、パルスの正しいストレッチが得られると考えられる。有限持続時間のウィンドウ化解析については、各解析ブロックがDFTの大きさに等しい周期の周期的信号の1周期間隔と解釈されるという事実によりこの状況には混乱が生じる。
図7aにおいて、様式化された解析および合成ウィンドウがそれぞれ上部と下部に図示される。t=t0-における入力パルスは、垂直矢印で上のグラフに描かれる。DFT変換ブロックのサイズがLであると仮定すると、Tによる位相乗算の効果によって、t=Tt0-(実線)のパルスのDFT解析が得られかつ他の寄与部分(点線)は相殺される。次のウィンドウでは、パルスは中心に対して他の位置を有しかつ所望の挙動は、パルスをウィンドウの中心に対してその位置のT倍移動させることになる。この挙動によって、すべての寄与分が単一のタイムストレッチされた合成パルスに合算されることが保証される。
パルスがDFTブロックのエッジのより外側に向かって移動する図7bの状況には問題が発生する。合成ウィンドウがピックアップする成分は、t=Tt0-−Lにおけるパルスである。オーディオに対する最終的な影響は、(かなり長い)トランスポーザウィンドウのスケールに匹敵する時間距離の反響(re‐echo)の発生である。
周波数領域オーバーサンプリングの有益な効果を図7cに示す。DFT変換の大きさは、FLに拡大するが、Lは、ウィンドウの持続時間であり、F≧1である。
ここで、パルス列の周期がFLでありかつパルスストレッチに対する望ましくない寄与分については、十分に大きい値のFを選択することにより相殺される。t=t0<L/2におけるいずれのパルスについても、t=Tt0−FLの望ましくない画像は、t=−L/2で合成ウィンドウの左側エッジの左に位置しているはずである。すなわち、TL/2−FL≦L/2であり、以下の法則が導かれる。


Figure 0005844266
より定量的解析によって、この不等式が課す値よりやや劣る周波数領域オーバーサンプリングを用いても、プリエコーが低減されることがわかる。これは、単に、ウィンドウがエッジ近くの小さな値から構成されるためである。
図2のトランスポーズの場合、上記の導出は、オーバーサンプリング係数F=2.5を使用して、T=2,3,4すべてのケースをカバーすることを示唆する。前の寄与分においては、F=2の使用ですでに有意な品質の向上につながることがわかった。図3の組み合わされたフィルタバンク実現例では、より小さい値であるF=1.5を使用することで十分であった。
オーバーサンプリングは、信号の過渡部においてのみ必要であるので、エンコーダにおいて過渡の検出が行われ、過渡フラグが各コアコーダフレームについてデコーダへ送られ、デコーダにおけるオーバーサンプリングの量が制御される。オーバーサンプリングが活性の場合、係数F=1.5を、その解析ウィンドウが現在のコアコーダフレームから出発する、少なくともすべてのトランスポーザグラニュールについて使用する。
図7cにおいて、「ゼロパディング」を、ウィンドウの第1のノンゼロ値前では部分70としてかつウィンドウの最後のノンゼロ値後では部分71として示す。こうして、図7cにおけるウィンドウを、その開始と終了にゼロを重みづけ係数を有する新たなより大きいウィンドウとして解釈することができる。このことは、より大きな長さを有するこのウィンドウが解析ウィンドウ14aまたは合成ウィンドウ17bにより適用される場合、「ゼロパディング」の単独のステップは不要であることを意味する。これは、開始と終了にゼロ部分を有するウィンドウを適用することにより、ゼロパディングが自動的に行われるからである。しかし、好ましい他の例では、ウィンドウは変更されず、常に同じ形状で使用されるが、過渡検出に成功するとすぐにウィンドウ化フレームの開始前もしくはウィンドウフレームの終了後または開始前および終了後にゼロがパディングされ、これはウィンドウ化とは別でかつ変換の計算とも別の単独のステップとして考慮することができる。したがって、過渡事象の場合、値パダーが起動されてゼロをパディングすることが好ましく、その結果、すなわちウィンドウ化されたフレームおよびパディングされたゼロは、図7cに示すゼロ部分70および71を有するウィンドウが適用された場合に得られたであろう結果と全く同じである。
同様に、合成の場合でも、過渡事象の場合には、特定のより長い合成ウィンドウを適用することができ、これは、逆FFTプロセッサ17aにより発生するフレームの先頭の値および最後の値をゼロにすることになる。しかしながら、FFT-1出力の開始からの値を単純に削除、すなわち相殺するよりも、同じ合成ウィンドウを常に適用することが好ましい。後者の場合、プロセッサ17aが出力したブロックの開始と終了で削除されるゼロ値(パディングされた値)の数がゼロパディングの値の数に相当する。
また、過渡事象の検出は、図2aにおいて開始インデックス制御ライン29を介する開始インデックス制御を行う。このため、開始インデックスkおよび結果的にはインデックス3/2kおよび2kに、周波数領域オーバーサンプリング係数を乗じる。この係数がたとえば2の場合、図6の左側の各kは、2kにより置換される。しかしながら、他の手順は、図示のとおり同じ態様で行われる。
高周波数強化信号すなわちいわゆるSBRフレームを発生するために使用されるフレームに過渡の信号が送られることが好ましい。入力信号の第1の部分が過渡事象を含むSBRフレームであると考えられ、かつ第2の部分が過渡を含まない時間的に後ろのSBRフレームであると考えられる。したがって、この過渡フレームの少なくとも単一のサンプル値を有する各ウィンドウは、フレームが1ウィンドウの長さを有しかつ過渡事象が単一のサンプルの場合に、パディング値を有するより長い変換を用いて変換される8つの窓が得られるように、ゼロパディングされる。
本発明は、周波数領域トランスポジションのための装置として考えられ、組み合わせたトランスポーザのフィルタバンクにおいて適応周波数領域オーバーサンプリングが行われ、これは過渡検出器により制御される。
装置に関連して、いくつかの局面について説明したが、これらの局面は対応する方法の説明も示しており、ブロックまたは装置が方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップに関連して記載された局面も対応のブロックもしくはアイテムまたは対応の装置の特徴を表す。
いくつかの実施要件によっては、発明の実施例はハードウェアでもソフトウェアでも実現可能である。この場合、電気的に可読な制御信号を記憶したフロッピーディスク、DVD、CD、ROM、PROM、EPROM、EEPROMまたはフラッシュメモリ等のデジタル記憶媒体を使用して実現可能であり、これらの媒体は、それぞれの方法が実行されるようにプログラマブルコンピュータシステムと協働する(または協働する能力がある)。
本発明によるいくつかの実施例は、ここに記載の方法のうち1つが実行されるように、プログラマブルコンピュータシステムと協働可能な電気的に可読な制御信号を有するデータキャリアを含む。
一般に、本発明の実施例は、プログラムコードを有するコンピュータプログラム製品として実現でき、プログラムコードは、コンピュータプログラム製品がコンピュータで実行されると、方法の1つを実行するよう動作する。プログラムコードはたとえば機械可読キャリアに記憶され得る。
他の実施例は、機械可読キャリアに記憶された、ここに記載の方法の1つを実行するためのコンピュータプログラムを含む。
したがって、言い換えれば、本発明の方法の実施例は、コンピュータプログラムがコンピュータで実行されると、ここに記載の方法の1つを実行するためのプログラムコードを有するコンピュータプログラムである。
したがって、本発明の方法のさらに他の実施例は、ここに記載の方法の1つを実行するためのコンピュータプログラムを記憶して含む、データキャリア(またはデジタル記憶媒体もしくはコンピュータ可読媒体)である。
したがって、本発明の方法のさらに他の実施例はここに記載の方法の1つを実行するためのコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは、たとえばインターネットを介するデータ通信接続により転送されるように構成されてもよい。
さらに他の実施例は、ここに記載の方法の1つを実行するよう構成または適合される処理手段、たとえばコンピュータまたはプログラマブルロジック装置を含む。
さらに他の実施例は、ここに記載の方法の1つを実行するためのコンピュータプログラムをインストールするコンピュータを含む。
いくつかの実施例においては、プログラマブル論理装置(フィールドプログラマブルゲートアレイ等)を使用して、ここに記載の方法の機能性のいくつかまたはすべてを実行してもよい。いくつかの実施例においては、フィールドプログラマブルゲートアレイは、ここに記載の方法の1つを実行するために、マイクロプロセッサと協働してもよい。一般に、方法は何らかのハードウェア装置で実行されることが好ましい。
上記の実施例は、本発明の原則について説明したにすぎない。当業者には、ここに記載の構成および詳細について修正および変形が明らかになることは当然である。したがって、発明は特許請求の範囲によってのみ限定され、明細書中の記載および実施例の説明により提示される特定の詳細により限定されないことを意図する。

Claims (14)

  1. 高周波数オーディオ信号(18)を発生するための装置であって、
    過渡情報を判別するため入力信号を解析するための解析器(12)を含み、入力信号の第1の時間部分は、関連の過渡情報を有し、入力信号の第2の時間部分は過渡情報を有しておらず、第2の時間部分は、第1の時間部分よりも時間において後であり、さらに
    入力信号を入力スペクトル表現(11)に変換するためのスペクトル変換器(14)と、
    入力スペクトル表現を処理して、入力スペクトル表現の周波数より高い周波数の値を含む処理されたスペクトル表現(15)を発生するためのスペクトルプロセッサ(13)と、
    処理されたスペクトル表現を時間表現に変換するための時間変換器(17)とを含み、
    スペクトル変換器(14)または時間変換器(17)が、関連の過渡情報を有する入力信号の第1の時間部分について周波数領域オーバーサンプリングを行いかつ入力信号の第2の時間部分についての周波数領域オーバーサンプリングは行わないかまたは入力信号の第1の時間部分に比べてより小さいオーバーサンプリング係数で周波数領域オーバーサンプリングを行うよう制御可能であり、
    スペクトルプロセッサ(13)が、入力スペクトル表現の2つの値を組み合わせることにより、より高い周波数の値を計算するように構成され、入力スペクトル表現の2つの値は、周波数に関して隣接している、装置。
  2. スペクトル変換器(14)が、第2の時間部分についてスペクトル変換器(14)が適用する変換に比べて関連の過渡情報を有する第1の時間部分についてより長い変換長を適用することによって周波数領域オーバーサンプリングを行うよう構成され、
    より長い変換長への入力がパディングされたデータを含む、請求項1に記載の装置。
  3. スペクトル変換器(14)が、
    入力オーディ信号のオーバーラップフレームをウィンドウ化するためのウィンドワ(14a)を含み、フレームはいくつかのウィンドウサンプルを有し、さらに
    フレームを周波数領域へ変換するための時間周波数プロセッサ(14b)を含み、
    時間周波数プロセッサ(14b)が、入力信号の第1の時間部分について、第1のウィンドウ化されたサンプルの前またはいくつかの入力サンプルのうちの最後のウィンドウ化されたサンプルに続いて追加の値をパディングし、かつ入力信号の第2の時間部分について、追加の値をパディングしないかまたはより少ない数の追加の値をパディングすることによりウィンドウ化されたサンプルの数を増加させるよう構成される、請求項1に記載の装置。
  4. パディングされたデータが、ゼロパディングデータである、請求項2または請求項3に記載の装置。
  5. スペクトル変換器(14)が、制御可能な変換長を有する変換カーネルを含み、第2の時間部分の変換長に対して第1の時間部分の変換長が増大する、請求項1から請求項4のいずれかに記載の装置。
  6. スペクトル変換器がいくつかの連続する周波数ラインを設けるよう構成され、
    プロセッサが、そのいくつかの連続する周波数ラインの位相または振幅を修正することにより周波数のより高い周波数ラインのための位相を計算して、処理されたスペクトルを得るよう構成され、
    時間変換器は、時間変換器出力のサンプリングレートが入力オーディオ信号のサンプリングレートより高くなるように変換を実行するよう構成される、請求項1から請求項5のいずれかに記載の装置。
  7. スペクトルプロセッサ(13)が、ある周波数インデックスで始まる入力スペクトル表現のスペクトル部分を処理することによって、トランスポジション係数を使用してトランスポジションを実行するよう構成され、かつ
    ある周波数インデックスが、入力信号の第1の時間部分についてはより高くかつ入力信号の第2の時間部分についてはより低い、請求項1から請求項6のいずれかに記載の装置。
  8. スペクトル変換器(14)または時間変換器(17)は、オーバーサンプリング係数を用いて第1の入力部分について周波数領域オーバーサンプリングを実行するよう構成され、かつ
    スペクトルプロセッサ(13)は、入力信号の第1の時間部分についてある周波数インデックスにオーバーサンプリング係数を乗算するよう構成される、請求項7に記載の装置。
  9. スペクトルプロセッサが、周波数に関して隣接している2つの値の位相(33)を補間することにより位相を計算するか、または
    周波数に関して隣接している2つの値の振幅を補間することにより振幅(34)を計算するよう構成される、請求項1に記載の装置。
  10. スペクトルプロセッサが、トランスポジション係数を使用してトランスポジションを実行するよう構成され、トランスポジション係数の整数倍でないかまたはトランスポジション係数の整数倍を時間変換器(17)が付与するアップサンプリング係数で除算したものである標的周波数(32)について、スペクトルプロセッサ(13)が、各々個別の位相係数で乗算された2以上の隣接するスペクトル値からの位相を使用して標的周波数の位相を計算するよう構成され、位相係数の合計がトランスポジション係数に等しくなるよう位相係数が決定される、請求項1から請求項9のいずれかに記載の装置。
  11. スペクトルプロセッサが、トランスポジション係数を使用してトランスポジションを実行するよう構成され、トランスポジション係数の整数倍でなく、またはトランスポジション係数の整数倍を時間変換器(17)が付与するアップサンプリング係数で除算したものである標的周波数について、スペクトルプロセッサが、各々個別の位相係数を乗算した2以上の隣接スペクトル値からの位相を使用して、標的周波数について位相を計算するよう構成され、
    トランスポジション係数で除算またはトランスポジション係数の分数およびアップサンプリング係数で除算した標的周波数のインデックスが、入力スペクトル表現の第2の値により近い場合に、入力スペクトル値の第1の値についての位相係数が、入力スペクトル表現の第2の値についての位相係数より低くなるように位相係数が決定される、請求項1から請求項10のいずれかに記載の装置。
  12. 入力信号が過渡情報を含む関連のサイド情報を有し、かつ
    解析器は入力信号を解析して、サイド情報から過渡情報を抽出するよう構成され、
    解析器(12)は、入力信号におけるオーディオエネルギー分布またはオーディオエネルギーの変化に基づき入力信号における過渡を解析しかつ検出するための過渡検出器を含む、請求項1から請求項11のいずれかに記載の装置。
  13. 高周波数オーディオ信号(18)を発生させる方法であって、
    過渡情報を判別するために入力信号を解析するステップ(12)を含み、入力信号の第1の時間部分は関連する過渡情報を有しかつ入力信号の第2の時間部分は過渡情報を有しておらず、第2の時間部分は、第1の時間部分よりも時間において後であり、さらに
    入力信号を入力スペクトル表現(11)に変換するステップ(14)と、
    入力スペクトル表現の周波数より高い周波数の値を含む処理されたスペクトル表現(15)を発生するよう入力スペクトル表現を処理するステップ(13)と、
    処理されたスペクトル表現を時間表現に変換するステップ(17)とを含み、
    入力スペクトル表現への変換ステップ(14)または時間表現への変換ステップ(17)において、制御可能な周波数領域オーバーサンプリングが、過渡情報を有する入力信号の第1の時間部分について行われ、
    入力信号の第2の時間部分について、周波数領域オーバーサンプリングが行われないかまたは周波数領域オーバーサンプリングが入力信号の第1の時間部分に比較してより小さいオーバーサンプリング係数で行われ、
    入力スペクトル表現を処理するステップ(13)は、入力スペクトル表現の2つの値を組み合わせることにより、より高い周波数の値を計算することを含
    入力スペクトル表現の2つの値は、周波数に関して隣接している、方法。
  14. コンピュータで実行されると、請求項13に記載の高周波数オーディオ信号を発生するための方法を実行するためのコンピュータプログラム。
JP2012534591A 2009-10-21 2010-05-25 適応オーバーサンプリングを用いる高周波数オーディオ信号を発生させるための装置および方法 Active JP5844266B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US25377609P 2009-10-21 2009-10-21
US61/253,776 2009-10-21
PCT/EP2010/057130 WO2011047886A1 (en) 2009-10-21 2010-05-25 Apparatus and method for generating a high frequency audio signal using adaptive oversampling

Publications (2)

Publication Number Publication Date
JP2013508758A JP2013508758A (ja) 2013-03-07
JP5844266B2 true JP5844266B2 (ja) 2016-01-13

Family

ID=42470889

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012534591A Active JP5844266B2 (ja) 2009-10-21 2010-05-25 適応オーバーサンプリングを用いる高周波数オーディオ信号を発生させるための装置および方法

Country Status (16)

Country Link
US (1) US9159337B2 (ja)
EP (1) EP2486564B1 (ja)
JP (1) JP5844266B2 (ja)
KR (1) KR101341115B1 (ja)
CN (1) CN102648495B (ja)
AR (1) AR078717A1 (ja)
AU (1) AU2010310041B2 (ja)
BR (1) BR112012009249B1 (ja)
CA (1) CA2778205C (ja)
ES (1) ES2461172T3 (ja)
HK (1) HK1174733A1 (ja)
MX (1) MX2012004623A (ja)
PL (1) PL2486564T3 (ja)
RU (1) RU2547220C2 (ja)
TW (1) TWI431614B (ja)
WO (1) WO2011047886A1 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL3998606T3 (pl) 2009-10-21 2023-03-06 Dolby International Ab Nadrpóbkowanie w połączonym banku filtrów modułu transpozycji
US9312969B2 (en) * 2010-04-15 2016-04-12 North Eleven Limited Remote server system for combining audio files and for managing combined audio files for downloading by local systems
MX2012001696A (es) * 2010-06-09 2012-02-22 Panasonic Corp Metodo de extension de ancho de banda, aparato de extension de ancho de banda, programa, circuito integrado, y aparato de descodificacion de audio.
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
CA3209829C (en) 2010-07-19 2024-05-21 Dolby International Ab Processing of audio signals during high frequency reconstruction
JP6155274B2 (ja) 2011-11-11 2017-06-28 ドルビー・インターナショナル・アーベー 過剰サンプリングされたsbrを使ったアップサンプリング
CN104221082B (zh) * 2012-03-29 2017-03-08 瑞典爱立信有限公司 谐波音频信号的带宽扩展
US9313765B2 (en) * 2012-05-14 2016-04-12 Lg Electronics Inc. Method for measuring position in wireless communication system
EP2709106A1 (en) 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
US9704486B2 (en) 2012-12-11 2017-07-11 Amazon Technologies, Inc. Speech recognition power management
WO2014118179A1 (en) * 2013-01-29 2014-08-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, systems, methods and computer programs using an increased temporal resolution in temporal proximity of onsets or offsets of fricatives or affricates
ES2725358T3 (es) * 2013-01-29 2019-09-23 Fraunhofer Ges Forschung Decodificador para generar una señal de audio mejorada en frecuencia, procedimiento de decodificación, codificador para generar una señal codificada y procedimiento de codificación que utiliza información lateral de selección compacta
KR102088153B1 (ko) * 2013-04-05 2020-03-12 돌비 레버러토리즈 라이쎈싱 코오포레이션 향상된 스펙트럼 확장을 사용하여 양자화 잡음을 감소시키기 위한 압신 장치 및 방법
TWI557727B (zh) 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
CN117238300A (zh) * 2016-01-22 2023-12-15 弗劳恩霍夫应用研究促进协会 使用帧控制同步来编码或解码多声道音频信号的装置和方法
US9947323B2 (en) * 2016-04-01 2018-04-17 Intel Corporation Synthetic oversampling to enhance speaker identification or verification
TWI834582B (zh) 2018-01-26 2024-03-01 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體
CN111835600B (zh) * 2019-04-16 2022-09-06 达发科技(苏州)有限公司 多模式超高速数字用户线路收发器设备及其执行方法
CN114582814A (zh) * 2020-11-30 2022-06-03 泽鸿(广州)电子科技有限公司 支撑结构

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SU980133A1 (ru) * 1981-02-06 1982-12-07 Московский Ордена Трудового Красного Знамени Электротехнический Институт Связи Устройство анализа и синтеза речевого сигнала
SU1316030A1 (ru) * 1986-01-06 1987-06-07 Акустический институт им.акад.Н.Н.Андреева Способ анализа и синтеза речи и устройство дл его осуществлени
US5029509A (en) 1989-05-10 1991-07-09 Board Of Trustees Of The Leland Stanford Junior University Musical synthesizer combining deterministic and stochastic waveforms
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
KR100528325B1 (ko) 2002-12-18 2005-11-15 삼성전자주식회사 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치
US8843378B2 (en) 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
US8374365B2 (en) * 2006-05-17 2013-02-12 Creative Technology Ltd Spatial audio analysis and synthesis for binaural reproduction and format conversion
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
EP3296992B1 (en) 2008-03-20 2021-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for modifying a parameterized representation
US8423852B2 (en) 2008-04-15 2013-04-16 Qualcomm Incorporated Channel decoding-based error detection
WO2010025206A2 (en) 2008-08-28 2010-03-04 Trw Automotive U.S. Llc Method and apparatus for controlling an actuatable safety device
PL2234103T3 (pl) * 2009-03-26 2012-02-29 Fraunhofer Ges Forschung Urządzenie i sposób manipulacji sygnałem audio

Also Published As

Publication number Publication date
CA2778205A1 (en) 2011-04-28
JP2013508758A (ja) 2013-03-07
TW201133471A (en) 2011-10-01
MX2012004623A (es) 2012-05-08
HK1174733A1 (en) 2013-06-14
EP2486564A1 (en) 2012-08-15
AR078717A1 (es) 2011-11-30
TWI431614B (zh) 2014-03-21
WO2011047886A1 (en) 2011-04-28
EP2486564B1 (en) 2014-04-09
KR101341115B1 (ko) 2013-12-13
CN102648495A (zh) 2012-08-22
AU2010310041A1 (en) 2012-06-14
BR112012009249A2 (pt) 2020-12-22
PL2486564T3 (pl) 2014-09-30
AU2010310041B2 (en) 2013-08-15
BR112012009249B1 (pt) 2021-11-09
CN102648495B (zh) 2014-05-28
RU2012119259A (ru) 2013-11-27
ES2461172T3 (es) 2014-05-19
RU2547220C2 (ru) 2015-04-10
US9159337B2 (en) 2015-10-13
KR20120094916A (ko) 2012-08-27
US20120281859A1 (en) 2012-11-08
CA2778205C (en) 2015-11-24

Similar Documents

Publication Publication Date Title
JP5844266B2 (ja) 適応オーバーサンプリングを用いる高周波数オーディオ信号を発生させるための装置および方法
US9858945B2 (en) Subband block based harmonic transposition
JP6573703B2 (ja) 高調波転換
RU2800676C1 (ru) Усовершенствованное гармоническое преобразование на основе блока поддиапазонов
AU2023202547B2 (en) Improved Subband Block Based Harmonic Transposition
RU2789688C1 (ru) Усовершенствованное гармоническое преобразование на основе блока поддиапазонов
RU2772356C2 (ru) Усовершенствованное гармоническое преобразование на основе блока поддиапазонов
AU2015203065A1 (en) Improved subband block based harmonic transposition

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130530

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130625

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130919

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130927

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131212

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140513

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20140911

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150917

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151118

R150 Certificate of patent or registration of utility model

Ref document number: 5844266

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250