JP5329714B2 - 帯域拡張符号化装置、帯域拡張復号化装置及び位相ボコーダ - Google Patents

帯域拡張符号化装置、帯域拡張復号化装置及び位相ボコーダ Download PDF

Info

Publication number
JP5329714B2
JP5329714B2 JP2012518070A JP2012518070A JP5329714B2 JP 5329714 B2 JP5329714 B2 JP 5329714B2 JP 2012518070 A JP2012518070 A JP 2012518070A JP 2012518070 A JP2012518070 A JP 2012518070A JP 5329714 B2 JP5329714 B2 JP 5329714B2
Authority
JP
Japan
Prior art keywords
signal
window function
band
frequency signal
low frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012518070A
Other languages
English (en)
Other versions
JP2012531632A (ja
Inventor
フレデリック ナーゲル
マルクス ムルトラス
サーシャ デッシュ
ジェレミ− ルコンテ
クリスチャン エルテル
パトリック ヴァルムボルド
Original Assignee
フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン filed Critical フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Publication of JP2012531632A publication Critical patent/JP2012531632A/ja
Application granted granted Critical
Publication of JP5329714B2 publication Critical patent/JP5329714B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

本発明はオーディオ信号処理に関し、特に、帯域拡張符号化装置、オーディオ信号の符号化方法、帯域拡張復号化装置、符号化されたオーディオ信号の復号化方法、位相ボコーダ及びオーディオ信号に関する。
さらに、本発明の実施例は、帯域拡張から独立した純粋な時間伸長のための位相ボコーダの適用に関する。
オーディオ信号の記憶や伝送が厳しいビットレートの制限を受けることは、良くあることである。そのような制限は通常、当該オーディオ信号を記憶又は伝送するために必要な情報レートを効率良く圧縮できる符号器/復号器(「コーデック」)を用いることで対処されている。過去においては、非常に低いビットレートしか使用できない場合、符号器はオーディオ帯域を思い切って減少させることを余儀なくされた。現代のオーディオコーデックにおいては、特許文献1〜3及び非特許文献1〜12に示されるように、帯域拡張方法(BWE)を使用して広帯域信号を符号化することができる。
上述の文献におけるアルゴリズムは高周波コンテンツ(HF)のパラメトリック表示に依存している。この表示は、復号化された信号の低周波部分(LF)から、HFスペクトル領域への転位(「パッチング」)とパラメータ作動型の後処理の適用とによって生成される。
このような技術分野においては、スペクトル帯域複製(SBR)やハーモニック帯域拡張(HBE)などの帯域拡張(BWE)方法が知られている。以下に、これら2つの帯域拡張方法について簡単に説明する。
1つ目の方法である、非特許文献1に開示されたスペクトル帯域複製(SBR)は、HF情報を生成するために直ミラーフィルタバンク(QMF)を使用するものである。所謂「パッチング」アルゴリズムを使用して低いQMF帯域信号が高いQMF帯域へとコピーされ、その結果、LF部分の情報がHF部分において複製される。次に、その生成されたHF部分は、スペクトル包絡及び調性(tonality)を調整するパラメータを使用して、オリジナルのHF部分に密接に合致するよう適合させられる。
他方、ハーモニック帯域拡張(HBE)は、位相ボコーダに基づく代替的な帯域拡張スキームである。非ハーモニックなスペクトルシフトに依存するスペクトル帯域複製とは対照的に、ハーモニック帯域拡張はスペクトルのハーモニックな継続を可能にする。SBRパッチングアルゴリズムと置き換えるか又はSBRパッチングアルゴリズムを修正するために、ハーモニック帯域拡張を利用しても良い。
特許文献4は、周波数ドメイン又は時間ドメインのいずれかにおいて作動する、二者択一のパッチングアルゴリズムの間で選択できる、ある帯域拡張方法を開示している。フィルタバンクによる時間−周波数変換においては、予め決められたある分析窓関数が適用される。さらに、現状の技術(state-of-the-art)に従う典型的な位相ボコーダの構成は、2乗余弦窓(raised-cosine window)やバートレット窓(Bartlett window)のような1つの所定のウィンドウ形状を使用する。
しかしながら、ボコーダのアプリケーションのために予め決められた1つの分析窓関数を選択するということは、様々な階級のオーディオ信号にとって全体的な知覚的オーディオ品質を達成するという点において、アプリケーションデザイナーに対して常にトレードオフを強いるものである。つまり、最初にある窓関数を選択することで平均的なオーディオ品質は最適化できても、各階級の信号におけるオーディオ品質は準最適に留まることになる。
さらに、ある信号に対しては、位相ボコーダに特殊な分析窓関数を使用することが有益となることも発見されている。この位相ボコーダは、オーディオ信号をそのピッチは変更せずに時間的に伸長させるために、特別に使用されても良い。
従って、最適な分析窓関数を帯域拡張スキームの範囲内などから選択するための概念が必要とされる。しかしながら、上述したような知覚的なオーディオ品質の低下に対する対策が、使用されるコーデックの演算の複雑性を有意に増大させるような結果をもたらすことは、好ましくない。
米国特許第5,455,888号公報“Speech bandwidth extension method and apparatus”, Vasu Iyengar et al. 米国特許出願第08/951,029号“Audio band width extending system and method” Ohmori, et al. 米国特許第6,895,375号公報“System for bandwidth extension of Narrow-band speech” Malah, D & Cox, R. V. 米国仮特許出願第61/079,841号
M Dietz, L. Liljeryd, K. Kjorling and O. Kunz, "Spectral Band Replication, a novel approach in audio coding" in 112th AES Convention, Munich, May 2002 S. Meltzer, R. Bohm and F. Henn, "SBR enhanced audio codecs for digital broadcasting such as "Digital Radio Mondiale" (DRM)," in 112th AES Convention, Munich, May 2002 T. Ziegler, A. Ehret, P. Ekstrand and M. Lutzky, "Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm," in 112th AES Convention, Munich, May 2002 International Standard ISO/IEC 14496-3:2001 FPDAM 1, "Bandwidth Extension," ISO/IEC, 2002 E. Larsen, R. M. Aarts, and M. Danessis. "Efficient high-frequency bandwidth extension of music and speech" in AES 112th Convention, Munich, Germany, May 2002 R.M. Aarts, E. Larsen, and O. Ouweltjes. "A unified approach to low-and high frequency bandwidth extension" in AES 115th Convention, New York, USA, October 2003 K. Kayhko. "A Robust Wideband Enhancement for Narrowband Speech Signal" Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio Signal Processing, 2001 E. Larsen and R.M. Aarts. "Audio Bandwidth Extension Application to psychoacoustics, Signal Processing and Loudspeaker Design. John Wiley & Sons, Ltd, 2004 E. Larsen, R.M. Aarts, and M. Danessis. "Efficient high-frequency bandwidth extension of music and speech" in AES 112th Convention, Munich, Germany, May 2002 J. Makhoul. "Spectral Analysis of Speech by Linear Prediction". IEEE Transactions of Audio and Electroacoustics, AU-21(3), June 1973 Frederik Nagel, Sascha Disch, "A harmonic bandwidth extension method for audio codecs," ICASSP International Conference on Acoustics, Speech and Signal Processing, IEEE CNF, Taipei, Taiwan, April 2009
本発明の目的は、改善されたオーディオ品質を提供する符号化及び/又は復号化の概念、又は位相ボコーダの概念を提供することである。
前記目的は、請求項1に係る帯域拡張符号化装置、請求項2に係る帯域拡張復号化装置、請求項に係る符号化方法、請求項に係る復号化方法、請求項に係る符号化済みオーディオ信号を記録した記憶媒体又は請求項に係るコンピュータプログラムによって達成できる。
本発明は次のような知見を基礎とする。即ち、複数の分析窓関数の中から帯域拡張復号化装置において帯域拡張を実行するために使用されるべき1つの分析窓関数を決定するために、特定の時間長を持つオーディオサンプルのブロックを有するオーディオ信号を分析することによって、改善された知覚的品質を達成できるという知見である。このような手法により、予め決められた分析窓関数の適用に起因するオーディオ品質の低下を防止することができ、その結果として、先行技術のBWE法に比べて比較的低い労力で知覚的オーディオ品質を改善できるようになる。
本発明の一実施形態に従えば、オーディオ信号を符号化する帯域拡張符号化装置は、信号分析器とコア符号器とパラメータ計算器とを備える。オーディオ信号は、コア周波数帯域を含む低周波信号と、高域側帯域(upper frequency band)を含む高周波信号とを有する。信号分析器はオーディオ信号を分析し、当該オーディオ信号は複数のオーディオサンプルからなる1つのブロックを有し、当該ブロックはある特定の時間長を有している。信号分析器はさらに、複数の窓関数の中から、帯域拡張復号化装置における帯域拡張を実行するために使用されるべき1つの分析窓関数を決定する。コア符号器は低周波信号を符号化して符号化済み低周波信号を取得する。パラメータ計算器は高周波信号から帯域拡張パラメータを計算する。
本発明の他の実施形態に従えば、符号化済みオーディオ信号を復号化する帯域拡張復号化装置は、コア復号器とパッチモジュールと結合器とを備える。符号化済みオーディオ信号は符号化された低周波信号と高帯域パラメータ(upper band parameters)とを含む。コア復号器は符号化された低周波信号を復号化し、復号化済み低周波信号はコア周波数帯域を含む。パッチモジュールは復号化済み低周波信号と高帯域パラメータとに基づいてパッチ済み信号を生成するが、そのパッチ済み信号は、コア周波数帯域から生成された高周波数帯域を含む。結合器はパッチ済み信号と復号化済み低周波信号とを結合し、結合された出力信号を取得する。
本発明の他の実施形態に従えば、オーディオ信号を処理する位相ボコーダ処理装置は、分析窓掛け器(analysis windower)と、時間/スペクトル変換器と、周波数ドメイン処理器と、周波数/時間変換器と、合成窓掛け器(synthesis windower)と、比較器と、オーバーラップ加算器(overlap adder)とを備える。分析窓掛け器は、オーディオ信号又はオーディオ信号から導出された信号に対し、複数の分析窓関数を適用して複数の窓掛けされたオーディオ信号を取得するものであり、ここでオーディオ信号は複数のオーディオサンプルからなる1つのブロックを有し、当該ブロックは特定の時間長を有している。時間/スペクトル変換器は、窓掛けされたオーディオ信号を複数のスペクトルへと変換する。周波数ドメイン処理器は、複数のスペクトルを周波数ドメインで処理し、複数の修正済みスペクトルを取得する。周波数/時間変換器は、複数の修正済みスペクトルを修正済み時間ドメイン信号へと変換する。合成窓掛け器は、修正済み時間ドメイン信号に対して、前記複数の分析窓関数と合致(match)している複数の合成窓関数を適用し、複数の窓掛けされた修正済み時間ドメイン信号を取得する。比較器は、複数の窓掛けされた修正済み時間ドメイン信号と前記オーディオ信号又はオーディオ信号から導出された信号との比較に基づいて、前記複数の分析窓関数に対応する複数の比較パラメータを決定する。比較器はさらに、所定の条件を満たすような1つの比較パラメータに対応する1つの分析窓関数と1つの合成窓関数とを選択する。オーバーラップ加算器は、窓掛けされた修正済み時間ドメイン信号のオーバーラップしているブロックを加算して、時間的に伸長された信号を取得する。ここで、前記窓掛けされた修正済み時間ドメイン信号とは、前記比較器によって選択された分析窓関数と合成窓関数とを用いて、前記前記分析窓掛け器と前記合成窓掛け器とによる修正が加えられた信号である。
本発明の実施形態は次の概念を基礎とする。即ち、コア周波数帯域を含むオーディオ信号へと適用された複数の分析窓関数から複数のパッチ済み信号を生成しても良いという概念である。当該複数のパッチ済み信号は、オリジナルのオーディオ信号又はそのオーディオ信号から導出された信号である参照信号と比較されても良く、その結果、複数の比較パラメータが生成され、それらはオーディオ品質の値に関連付けられても良い。さらに、複数の分析窓関数の中から、所定の条件を満たすような1つの比較パラメータに対応した1つの分析窓関数が選択されても良い。この選択された分析窓関数を使用することで、オーディオ品質の低下を最小限に抑えることができ、その結果として、BWEシナリオの中で最適な知覚的オーディオ品質を達成できるようになる。
本発明の他の実施形態は、信号分類器を含む信号分析器に関するものであり、ここで信号分類器はオーディオ信号又はそのオーディオ信号から導出された信号を分析/分類するものである。この場合、帯域拡張復号化装置において帯域拡張を実行するために使用されるべき分析窓関数は、分析/分類された信号の信号特性に基づいて選択される。
そのため、本発明の実施例は復号化装置における帯域拡張のための最適な分析窓関数を選択する方法を提供する。制御パラメータはどの分析窓関数が最適であるかを決定する目的で評価されても良い。この目的を達成するため、合成による分析(analysis-by-synthesis)のスキームを使用しても良い。即ち、1組の窓関数を適用し、その中からある目的に従って最適な窓関数を選択しても良い。本発明の好適なモードにおいては、その目的とは、復元における最良の知覚的オーディオ品質を確保することである。他のモードでは、ある目的機能が最適化される。例えば、その目的は、オリジナルHF(高周波帯域)のスペクトル平坦度をできるだけ保持することでも良い。
一つの方法では、窓関数の選択は、オリジナル信号、合成された信号又はそれらの両方を考慮することにより、符号化装置だけで実行されても良い。決定された窓関数(ウィンドウ指示)はその後に復号化装置へと伝送される。他の方法では、窓関数の選択は、復号化された信号のコア帯域だけを考慮しながら符号化装置と復号化装置との両側で同期的に実行されても良い。後者の方法では、追加的なサイド情報を生成する必要がなく、その点はコーデックのビットレート効率の観点から見て望ましい。
本発明は、ボコーダの出力信号の知覚的品質を最適化できるという利点がある。本発明の実施形態は、ボコーディング処理にとって適切な分析及び合成窓関数の信号適応型の選択を提供し、それによって分析及び/又は合成窓関数の様々な時間応答又は周波数応答を達成できる。
本発明の他の利点として、BWEスキームにおけるような上述した品質低下の抑制と演算上の複雑さとの間のより良好な妥協点を得ることができるという点が挙げられる。
以下に、添付の図面を参照しながら本発明の実施例を説明する。
帯域拡張符号化装置の一実施例を示すブロック図である。 帯域拡張復号化装置の一実施例を示すブロック図である。 帯域拡張符号化装置の他の実施例を示すブロック図である。 帯域拡張復号化装置の他の実施例を示すブロック図である。 帯域拡張符号化装置のさらに他の実施例を示すブロック図である。 帯域拡張復号化装置のさらに他の実施例を示すブロック図である。 比較器のある構成を示すブロック図である。 帯域拡張符号化装置の別の実施例を示すブロック図である。 信号分類器のある構成を示すブロック図である。 帯域拡張符号化装置のさらに別の実施例を示すブロック図である。 帯域拡張復号化装置の別の実施例を示すブロック図である。 位相ボコーダ処理装置のある実施例を示すブロック図である。 異なる分析及び合成窓関数の間で制御情報により切替を実行する装置のある実施例を示すブロック図である。 位相ボコーダ作動型の帯域拡張復号化装置のある実施例の前半の構成図である。 位相ボコーダ作動型の帯域拡張復号化装置のある実施例の後半の構成図である。 図14Aのブロック(1)〜(6)の説明図である。
図1は、オーディオ信号101−1を符号化する、本発明の一実施例に従う帯域拡張符号化装置100のブロック図である。オーディオ信号101−1は、コア周波数帯域101−3を含む低周波信号101−2と、高域側帯域101−5を含む高周波信号101−4とを有する。帯域拡張符号化装置100は、信号分析器110とコア符号器120とパラメータ計算器130とを備える。信号分析器110はオーディオ信号101−1を分析するものであり、このオーディオ信号101−1は複数のオーディオサンプルからなる1つのブロック101−6を有し、そのブロック101−6はある特定の時間長を持っている。信号分析器110はさらに、複数の分析窓関数111−1の中から、帯域拡張復号化装置200などにおいて帯域拡張を実行するために使用されるべき1つの分析窓関数111−2を決定する。コア符号器120は低周波信号101−2を符号化して符号化済み低周波信号121を取得する。最後に、パラメータ計算器130は高周波信号101−4から帯域拡張パラメータ131を計算する。帯域拡張パラメータ131と、帯域拡張復号化装置200において使用されるべき分析窓関数111−2と、符号化済み低周波信号121とは、帯域拡張符号化装置100により出力される符号化済みオーディオ信号103−1を構成する。
図2は、符号化済みオーディオ信号201−1を復号化する、本発明の他の実施例に従う帯域拡張復号化装置200のブロック図である。符号化済みオーディオ信号201−1は、符号化済み低周波信号201−2と高帯域パラメータ201−3とを含む。ここで、符号化済みオーディオ信号201−1は、図1の帯域拡張符号化装置100により出力された符号化済みオーディオ信号103−1と対応していても良い。帯域拡張復号化装置200は、コア復号器210とパッチモジュール220と結合器230とを備える。コア復号器210は、符号化済み低周波信号201−2を復号化して復号化済み低周波信号211−1を取得するものであり、復号化済み低周波信号211−1はコア周波数帯域211−2を含む。パッチモジュール220は、復号化済み低周波信号211−1と高帯域パラメータ201−3とに基づいてパッチ済み信号221−1を生成するものであり、そのパッチ済み信号221−1はコア周波数帯域211−2から生成された高域側帯域221−2を含む。最後に、結合器230は、パッチ済み信号221−1と復号化済み低周波信号211−1とを結合し、結合された出力信号231−1を取得する。特に、パッチ済み信号221−1は、帯域拡張アルゴリズムの目標周波数範囲内の信号であっても良く、他方、帯域拡張復号化装置200により出力される結合された出力信号231−1は、拡張された帯域幅231−2を持つ操作済信号であっても良い。
図3は、本発明の他の実施例である帯域拡張符号化装置300を示すブロック図である。帯域拡張符号化装置300は、低域通過(LP)フィルタと高域通過(HP)フィルタとを備えていても良い。それら各フィルタは、オーディオ信号101−1の低域通過フィルタ処理済バージョンである低周波信号101−2と、オーディオ信号101−1の高域通過フィルタ処理済バージョンである高周波信号101−4とを生成しても良い。図3に示すように、帯域拡張符号化装置300は、パラメータ計算器320及びパッチモジュール330で使用されるべき窓関数制御情報311を提供する窓関数制御器310をさらに備えても良い。窓関数制御器310により提供される窓関数制御情報311は、オーディオ信号101−1から導出されたオーディオサンプルのブロック101−6に対して適用されるべき複数の分析窓関数111−1を指示しても良い。特に、パラメータ計算器320は窓関数制御器310により制御される窓掛け部(windower)を備えても良く、この窓掛け部は、複数の分析窓関数111−1と比較器340により選択されるべき1つの分析窓関数111−2とを高周波信号101−4に対して適用するものである。パラメータ計算器320において、窓関数制御情報311により指示された複数の分析窓関数111−1に対応する複数の帯域拡張パラメータ321−1と、比較器340の出力において窓関数指示(window indication)341−1が提供する選択された分析窓関数111−2に対応する帯域拡張パラメータ321−2とが、それぞれ取得される。
図3に示す実施例では、信号分析器110はパッチモジュール330を含み、このモジュール330は、低周波信号101−2と窓関数制御情報311と帯域拡張パラメータ321−1とに基づいて複数のパッチ済み信号331−1を生成する。ここで、パッチ済み信号331−1はコア周波数帯域101−3から生成された高域側帯域331−2を含む。特に、パッチモジュール330は、窓関数制御器310により制御される窓掛け部(windower)を含み、このパッチモジュール330の窓掛け部は、複数の分析窓関数111−1を低周波信号101−2へと適用するものである。
さらに、帯域拡張符号化装置300の信号分析器110は比較器340を備えており、この比較器340は、複数のパッチ済み信号331−1と、オーディオ信号101−1又は破線で示す高周波信号101−4のようなオーディオ信号から導出された信号である参照信号との比較に基づいて、複数の比較パラメータ341−2を決定する。ここで、複数の比較パラメータ341−2は複数の分析窓関数111−1に対応している。比較器340は、ある比較パラメータがある所定の条件を満たすような、1つの分析窓関数111−2に対応する1つの窓関数指示341−1をさらに提供する。最後に、帯域拡張符号化装置300は前記窓関数指示341−1を含む符号化済みオーディオ信号351を提供する出力インターフェース350を備えている。
上述した比較の実施に関して、図7は比較器700の実施例のブロック図を示す。比較器700は、スペクトル平坦度(spectral flatness measure: 以下ではSFMと呼ぶ)パラメータ計算器710と、SFMパラメータ比較器720と、窓関数指示抽出器730とを備える。SFMパラメータ計算器710は、複数の入力信号701−1から複数のSFMパラメータ703−1と、参照入力信号701−2から参照SFMパラメータ703−2とを計算しても良い。特に、各SFMパラメータは、パワースペクトルの幾何学的平均を、対応する入力信号から導出されたパワースペクトルの算術的平均により割り算することで計算しても良い。ここで、比較的高いSFMパラメータの場合には、全スペクトル帯域においてスペクトルが同様のパワー量を持つことを意味し、比較的低いSFMパラメータの場合には、スペクトルパワーが比較的少数の帯域に集中していることを意味する。加えて、SFMパラメータは、入力信号の全帯域に亘って測定するのではなく、所定の部分帯域(サブ帯域)内だけで測定することもできる。SFMパラメータ比較器720は、SFMパラメータ703−1と参照SFMパラメータ703−2とを比較して複数の比較パラメータ705を取得しても良く、これら比較パラメータ705は、例えば比較されたSFMパラメータ間の偏差に基づいていても良い。窓関数指示抽出器730は、複数の比較パラメータ705の中から、所定の条件が満たされるような1つの比較パラメータを選択しても良い。その所定の条件とは、例えば選択された比較パラメータが複数の比較パラメータのうちの最小値となるように選択されても良い。その場合、選択された比較パラメータは複数の入力信号701−1のうちの1つの入力信号に対応することになり、スペクトル平坦度において参照入力信号701−2との偏差が最小となる特徴を持つ。
具体的には、入力信号701−1はパッチ済み信号331−1に対応していても良く、そのパッチ済み信号331−1は、複数の分析窓関数111−1を、オーディオ信号101−1又は低周波信号101−2などのようなオーディオ信号101−1から導出された信号へと適用した後に取得されたものである。他方、参照入力信号701−2は、オリジナルオーディオ信号101−1に対応していても良い。さらに、比較器700の複数の比較パラメータ705は、帯域拡張符号化装置300の複数の比較パラメータ341−2に対応していても良い。分析窓関数111−2は、選択された比較パラメータに対応し、パッチ済み信号331−1とオリジナルオーディオ信号101−1とのSFMパラメータにおける偏差が例えば最小となるように選択されても良い。また、選択された分析窓関数111−2は窓関数指示341−1に対応する窓関数指示707により示されても良く、その指示は比較器700の出力又は比較器340の出力においてそれぞれ提供されるものである。その結果、選択された分析窓関数111−2が帯域拡張復号化装置内などで帯域拡張を実行するために使用された場合、例えばスペクトル平坦度により測定される知覚的オーディオ品質は、最小限の変更又は低下に留めることができる。
さらに、窓関数制御器310の出力において窓関数制御情報311により指示された複数の分析窓関数111−1は、異なる窓関数特性を持ちかつブロック101−6と時間的に同じウィンドウ長を持つ異なる分析窓関数を含んでも良い。特に、これらの異なる分析窓関数は、スペクトル分析から得られる異なる周波数応答関数(「伝達関数」)により特徴付けられても良い。さらにそれら伝達関数は、メインローブ幅、サイドローブレベル又はサイドローブ・フォールオフなどの特徴により区別することができる。また、これらの異なる分析窓関数は、スペクトル分解能又はダイナミック・レンジのような性能特性の観点から複数のグループへと分けられても良い。例えば、高度及び中程度の分解能を持つ窓関数は、矩形窓、三角窓、余弦窓、2乗余弦窓、ハミング(Humming)窓、ハン(Hann)窓、バートレット(Bartlett)窓、ブラックマン(Blackman)窓、ガウス(Gaussian)窓、カイザー(Kaiser)窓又はバートレット・ハン(Bartlett-Hann)窓などに代表される窓関数である。他方、低い分解能又は高いダイナミック・レンジを持つ窓関数は、フラット・トップ(flat-top)窓、ブラックマン・ハリス(Blackman-Harris)窓又はチューキー(Tukey)窓に代表される窓関数である。代替的な実施例では、異なる個数のサンプルを持つ窓関数(即ち異なるウィンドウ長を持つ窓)を使用することもできる。
具体的には、分析窓関数の異なるグループに属しても良い異なる分析窓関数111−1を、パッチモジュール330を使用してオーディオサンプルのブロック101−6に適用することは、例えば異なるSFMパラメータのような異なる特性を持つ複数のパッチ済み信号331−1をもたらす結果となるであろう。
図4は、本発明の他の実施例である帯域拡張復号化装置400を示すブロック図である。この復号化装置400は例えば図3の帯域拡張符号化装置300により提供された窓関数指示341−1を明示的に利用できる。具体的には、帯域拡張復号化装置400は、符号化済み低周波信号401−2と高帯域パラメータ401−3と窓関数指示401−4とを含む符号化済みオーディオ信号401−1に作用するよう構成されている。ここで、符号化済み低周波信号401−2と高帯域パラメータ401−3と窓関数指示401−4とは、帯域拡張符号化装置300の出力インターフェース350から出力された符号化済み低周波信号121と帯域拡張パラメータ321−2と窓関数指示341−1とにそれぞれ対応していても良い。図4に示す実施例の帯域拡張復号化装置400は、図2の帯域拡張復号化装置200のコア復号器210に対応するコア復号器410を備え、コア復号器410は符号化済み低周波信号401−2を復号化し、その復号化済み低周波信号411−1はコア周波数帯域411−2を含む。さらに、帯域拡張復号化装置400は、帯域拡張復号化装置200のパッチモジュール220に対応するパッチモジュール420を備え、当該パッチモジュール420は、窓関数指示401−4に基づいて複数の分析窓関数から1つの分析窓関数を選択し、かつその選択された分析窓関数を復号化済み低周波信号411−1へと適用するための制御可能な窓掛け部を含む。このようにして、パッチモジュール420の出力側ではパッチ済み信号421が取得される。パッチ済み信号421は、次に結合器430により低周波信号411−1と結合され、その結果、帯域拡張復号化装置400の出力側において結合された出力信号431が出力される。ここで、パッチ済み信号421と復号化済み低周波信号411−1と結合器430と結合された出力信号431とは、パッチ済み信号221−1と復号化済み低周波信号211−1と結合器230と結合された出力信号231−1とにそれぞれ対応しても良い。前述したように、結合された出力信号431は拡張された帯域幅を持つ操作済信号であっても良い。
図3と図4の実施例に関して言えば、符号化装置側(図3)で信号分析を用いて取得された最適な分析窓関数に対応している窓関数指示341−1,401−4は、符号化済みオーディオ信号351,401−1の中で伝送でき、次にパッチモジュール420により使用可能であり、その結果、復号化装置側(図4)においてさらなる信号分析を必要とせずに帯域拡張を実行できるという利点がある。
図5は、本発明の他の実施例である帯域拡張符号化装置500を示すブロック図である。この帯域拡張符号化装置500は、図3の帯域拡張符号化装置300と実質的に同じブロックを備えている。そのため、同様の構成及び/又は機能を有するブロックには同一の参照番号を付している。しかし、図3の実施例とは対照的に、帯域拡張符号化装置500は、複数のパッチ済み信号333−1とオーディオ信号101−1から導出された1つの参照低周波信号とを比較する、比較器510を備える。帯域拡張符号化装置500は任意ではあるがコア復号器520をさらに備えても良く、そのコア復号器520は、コア符号器120の出力からの符号化済み低周波信号121を復号化することで復号化済み低周波信号521を出力する。前記参照低周波信号としては、例えばオーディオ信号101−1の低域通過フィルタ処理済バージョンである低周波信号101−2か、又はコア復号器520から出力された復号化済み低周波信号521が使用されても良い。さらに、比較器510は、前記パッチ済み信号331−1と前記参照低周波信号101−2又は521との比較に基づいて(最適な)分析窓関数を選択し、選択された分析窓関数に対応する窓関数指示511を提供する。図3の実施例における窓関数指示341−1と同様に、窓関数指示511をパラメータ計算器320へと供給することができ、その結果、この窓関数指示511に対応するBWEパラメータ321−2だけが取得される。BWEパラメータ321−2と符号化済み低周波信号121とは、出力インターフェース530へと入力されても良い。しかし、窓関数指示511は出力インターフェース530へと入力されなくても良い。最後に、出力インターフェース530は、窓関数指示511を含まない符号化済みオーディオ信号531を出力する。
図6は、本発明のさらに他の実施例である帯域拡張復号化装置600を示すブロック図である。具体的には、帯域拡張復号化装置600は、符号化済み低周波信号601−2と高帯域パラメータ601−3とを含む符号化済みオーディオ信号601−1に作用する。ここで、符号化済みオーディオ信号601−1と符号化済み低周波信号601−2と高帯域パラメータ601−3とは、図2の符号化済みオーディオ信号201−1と符号化済み低周波信号201−2と高帯域パラメータ201−3とにそれぞれ対応しても良い。特に、図6に示す実施例では、帯域拡張復号化装置600に入力される符号化済みオーディオ信号601−1は、窓関数指示を含んでいない。そのため、この場合(図6)においては、帯域拡張スキーム内などで適用されるべき適切な窓関数を選択するという目的を持つ信号分析が、復号化装置側において必要とされる。
図6に示すように、帯域拡張復号化装置600のパッチモジュール220は、分析窓掛け器610と時間/スペクトル変換器620と周波数ドメイン処理器630と周波数/時間変換器640と合成窓掛け器650と比較器660と帯域拡張モジュール670とを備える。加えて、帯域拡張復号化装置600は、符号化済み低周波信号601−2を復号するためのコア復号器680を備えており、そこで復号化された低周波信号681−1はコア周波数帯域681−2を含む。ここで、コア復号器680及び復号化済み低周波信号681−1は、それぞれ図2のコア復号器210及び復号化済み低周波信号211−1に対応しても良い。
分析窓掛け器610は、帯域拡張符号化装置300,500の実施例における分析窓関数111−1のような複数の分析窓関数を、復号化済み低周波信号681−1に適用して複数の窓掛けされた低周波信号611を取得する。時間/スペクトル変換器620は、窓掛けされた低周波信号611を複数のスペクトル621へと変換する。周波数ドメイン処理器630は複数のスペクトル621を周波数ドメインで処理し、複数の修正済みスペクトル631を取得する。周波数/時間変換器640はその複数の修正済みスペクトル631を修正済み時間ドメイン信号641へと変換する。合成窓掛け器650は、分析窓関数に合致している複数の合成窓関数を修正済み時間ドメイン信号641へと適用し、窓掛けされた修正済み時間ドメイン信号651を取得する。特に、合成窓関数は、当該合成窓関数を適用することで対応する分析窓関数の影響が補償されるように、分析窓関数と合致させることができる。比較器660は、複数の窓掛けされた修正済み時間ドメイン信号651と復号化済み低周波信号681−1との比較に基づいて、複数の比較パラメータを決定する。ここで、当該複数の比較パラメータは、分析窓掛け器610により復号化済み低周波信号681−1に対して適用された複数の分析窓関数111−1に対応している。さらに比較器660は、所定の条件を満たす1つの比較パラメータに対応した1つの分析窓関数と1つの合成窓関数とを選択する。ここで、比較器660は特に図7に関して上段で説明したように構成されても良い。選択された分析窓関数及び合成窓関数は、比較器660の出力において提供される窓関数指示661を構成しても良い。しかし、復号化装置側における帯域拡張を実行するために使用された窓関数指示401−4が符号化済みオーディオ信号401−1内に含まれていた図4の帯域拡張復号化装置400とは対照的に、図6の帯域拡張復号化装置600における窓関数指示661は符号化済みオーディオ信号601−1内に使用可能な状態で存在せず、その結果、窓関数指示661は、まず符号化済みオーディオ信号601−1から導出された復号化済み低周波信号681−1を分析することにより決定されなければならない。さらに、帯域拡張復号化装置600のパッチモジュール220は帯域拡張モジュール670を備えており、このモジュール670が帯域拡張アルゴリズムを実行することで、復号化済み低周波信号681−1と比較器660により選択された分析窓関数及び合成窓関数と高帯域パラメータ601−3とに基づいて、パッチ済み信号671を生成する。最後に、パッチ済み信号671と復号化済み低周波信号681−1とを結合器690により結合し、拡張された帯域を有する結合された出力信号691を取得する。ここで、パッチ済み信号671と復号化済み低周波信号681−1と結合器690と結合された出力信号691とは、それぞれ、図2の帯域拡張復号化装置200におけるパッチ済み信号221−1と復号化済み低周波信号211−1と結合器230と結合された出力信号231−1とに対応しても良い。
これまで説明した帯域拡張符号化装置/復号化装置の実施例において、使用される比較器はいずれも図7において説明した比較器700に対応していても良い。具体的には、比較器700は、複数の入力信号701−1として、図3及び図5における帯域拡張符号化装置300及び500の複数のパッチ済み信号331−1、又は図6の帯域拡張復号化装置600における複数の窓掛けされた修正済時間ドメイン信号651を受け取り、参照入力信号701−2として、図3において「参照信号」と記載されたオーディオ信号101−1若しくは図3に破線で示された高周波信号101−4、図5において「参照低周波信号」と記載された低周波信号101−2若しくは図5に破線で示された復号化済み低周波信号521、又は図6の帯域拡張復号化装置600における復号化済み低周波信号681−1を受け取る。さらに比較器700は窓関数指示707を出力し、この窓関数指示707は、図3における帯域拡張符号化装置300の窓関数指示341−1、図5における帯域拡張符号化装置500の窓関数指示511、又は図6における帯域拡張復号化装置600の窓関数指示661に対応していても良い。上述したように、この比較は例えば入力信号のSFMパラメータの計算に基づいても良い。代替的に、入力信号701−1と参照入力信号701−2との間のサンプル毎に計算された差分に基づいて、入力信号701−1を参照入力信号701−2と比較しても良い。
これまでの実施例では、窓関数の選択は信号分析により実行されている。即ち、複数の異なる分析窓関数がオーディオ信号又はオーディオ信号から導出された信号に対して適用され、複数の異なるパッチ済み(合成された)信号が生成される。その複数の合成された信号から、当該合成された信号とオリジナルオーディオ信号又はそのオーディオ信号から導出された信号との比較に基づくある所定の基準に従って、ある最適な窓関数が選択される。当該選択された窓関数は、次にオーディオ信号又はそのオーディオ信号から導出された信号に対して帯域拡張スキームなどの中で適用され、その結果、特定のパッチ済み(合成された)信号が生成される。このような手順は特に閉ループに対応しており、「合成による分析」と呼ぶことができる。代替的に、窓関数の選択は、オーディオ信号又はそのオーディオ信号から導出された信号である入力信号を直接的に分析することでも実行でき、この場合、当該オリジナルオーディオ入力信号は、調性度(measure of the tonality)のようなある所定の信号特性に関して分析/分類されている。この代替的な分析スキームは開ループに対応しており、以下の実施例で説明する。
図8は、本発明のさらに他の実施例である帯域拡張符号化装置800を示すブロック図である。ここで、帯域拡張符号化装置800の基本的な構成は図3の帯域拡張符号化装置300の構成と対応する。よって、図3と図8において同じブロックは同じ参照番号で示す。
帯域拡張符号化装置800の信号分析器110は信号分類器810を備えている。その信号分類器810は、オーディオ信号101−1又は高周波信号101−4(破線)のようなそのオーディオ信号から導出された信号を分類し、その分類された信号の信号特性に基づいて1つの分析窓関数に対応する窓関数指示811を決定する。例えば信号分類器810は、オーディオ信号101−1又は高周波信号101−4から調性度を計算することで、窓関数指示811を決定しても良い。ここで、調性度はスペクトルエネルギーが各帯域においてどのように分配されているかを示したものでも良い。スペクトルエネルギーがある帯域において比較的均一に分配されている場合には、その帯域にかなり調性の低い信号又は非調性信号(non-tonal signal)(「雑音性信号」)が存在し、窓関数指示811は、その調性の低い信号に適用されるべき第1の特性を有する第1の窓関数に関連付けられても良い。他方、その帯域内のある位置にスペクトルエネルギーが比較的集中している場合には、その帯域にかなり調性の高い信号又は調性信号(tonal signal)が存在し、窓関数指示811は、その調性の高い信号に適用されるべき第2の特性を有する第2の窓関数に関連付けられても良い。符号化装置800は、信号分類器810により決定された窓関数指示811に基づいて窓関数制御情報821を提供する、窓関数制御器820をさらに備えている。符号化装置800のパラメータ計算器830は、窓関数制御器820により制御される窓掛け部を備え、パラメータ計算器830の当該窓掛け部は、窓関数制御情報821に基づいたある分析窓関数を高周波信号101−4に対して適用し、BWEパラメータ831を取得する。窓関数制御器820は、例えば窓関数制御情報821をパラメータ計算器830へと提供することができ、その結果、パラメータ計算器830の窓掛け部は、決定された調性度が所定のしきい値未満である場合には、第1のメインローブ幅を持つある伝達関数により特徴付けられた第1の窓関数を適用し、決定された調性度が所定のしきい値以上である場合には、第2のメインローブ幅を持つある伝達関数により特徴付けられた第2の窓関数を適用する。ここで、前記伝達関数の第1のメインローブ幅は前記伝達関数の第2のメインローブ幅よりも大きい。特に、帯域拡張スキームにおいては、調性の低い信号の場合には伝達関数のメインローブが比較的大きい窓関数を使用し、調性の高い信号の場合には伝達関数のメインローブが比較的小さな窓関数を使用することが有利であろう。
帯域拡張符号化装置800のコア符号器120は、低周波信号101−2を符号化して符号化済み低周波信号121を取得する。図3の実施例と同様に、符号化済み低周波信号121と窓関数指示811とBWEパラメータ831とが出力インターフェース840へと入力され、窓関数指示811を含む符号化済みオーディオ信号841を出力しても良い。
図9は信号分類器900の構成を示すブロック図であり、この信号分類器900は図8,図10,図11の実施例においてオーディオ信号101−1を直接的に分析するために使用されても良い。信号分類器900は、調性測定器910と信号特性評価器(signal characterizer)920と窓関数選択器930とを備えても良い。調性測定器910はオーディオ信号101−1を分析し、当該オーディオ信号101−1の調性度911を決定することができる。信号特性評価器920は、調性測定器910により提供された調性度911に基づいてオーディオ信号101−1の信号特性921を決定することができる。特に信号特性評価器920は、オーディオ信号101−1が雑音性信号に該当するか、又はむしろ調性信号に該当するかを決定しても良い。最後に、窓関数選択器930は、信号特性921に基づいて窓関数指示811を提供するよう構成されている。
図10は、本発明のさらに他の実施例である帯域拡張符号化装置1000を示すブロック図であり、この帯域拡張符号化装置1000は、図5の帯域拡張符号化装置500に対応していても良い。図5に示す実施例と同じブロックは、図10においても同じ参照番号で示す。帯域拡張符号化装置1000の信号分析器110は、オーディオ信号101−1から導出された低周波信号101−2を分類して窓関数指示1011を決定する信号分類器1010を備えており、窓関数指示1011は信号分類器1010により提供される分類済信号のある信号特性に基づいた1つの分析窓関数に対応している。さらに、符号化装置1000は、信号分類器1010により決定された窓関数指示1011に基づいて窓関数制御情報1021を提供する窓関数制御器1020を備えている。帯域拡張符号化装置1000のパラメータ計算器1030は、窓関数制御器1020により制御される窓掛け部を備えており、このパラメータ計算器1030の窓掛け部は窓関数制御情報1021に基づいてある分析窓関数を高周波信号101−4に対して適用し、BWEパラメータ1031を得るものである。帯域拡張符号化装置1000は、低周波信号101−2を符号化して符号化済み低周波信号121を得るコア符号器120を備えても良い。さらに、帯域拡張符号化装置1000は、任意ではあるが破線ブロックで示されたコア復号器1050も備えても良く、そのコア復号器1050は、符号化済み低周波信号121を復号化して復号化済み低周波信号1051(破線矢印)を得るものである。同様に、信号分類器1010は、任意ではあるが窓関数指示1011を決定するために復号化済み低周波信号1051を分析/分類しても良い。符号化済み低周波信号121及びBWEパラメータ1031は、さらに出力インターフェース1040に入力されても良く、このインターフェースは窓関数指示1011を含まない符号化済みオーディオ信号1041を出力する。この符号化済みオーディオ信号1041は図5に示す符号化済みオーディオ信号531に対応していても良い。
この場合、窓関数指示は符号化装置側(図10)の符号化済みオーディオ信号の中に含まれていないので、その窓関数指示を復号化装置側(図11)でも決定する必要がある。この点に関しては以下に説明する。
図11は、本発明のさらに他の実施例である帯域拡張復号化装置1100を示すブロック図であり、この帯域拡張復号化装置1100は図6に示す帯域拡張復号化装置600と対応しても良い。図6に示す実施例と同じブロックは、図11においても同じ参照番号で示す。具体的には、帯域拡張復号化装置1100は、符号化済み低周波信号601−2を復号化して復号化済み低周波信号681−1を得るコア復号器680を備えている。帯域拡張復号化装置1100のパッチモジュール220は信号分類器1110を備えており、この信号分類器1110は復号化済み低周波信号681−1を分析/分類し、分析された信号の信号特性に基づいてある1つの分析窓関数に対応した窓関数指示1111を決定する。さらに復号化装置1100は、信号分類器1110により決定された窓関数指示1111に基づいて窓関数制御情報1121を提供する窓関数制御器1120を備えている。加えて、復号化装置1100はBWEモジュール1130を備えており、そのモジュール1130は、復号化済み低周波信号681−1と窓関数制御情報1121に依存した分析窓関数と高帯域パラメータ601−3とに基づいて、パッチ済み信号671を生成するような構成であっても良い。パッチ済み信号671及び復号化済み低周波信号681−1は、次に結合器690により結合され、結合された出力信号691を得る。
上述した実施例の「合成による分析」のスキームは、位相ボコーダの構成において使用されても良い。図12は位相ボコーダ処理装置1200のある実施例を示すブロック図である。オーディオ信号1201を処理する位相ボコーダ処理装置1200は、分析窓掛け器1210と、時間/スペクトル変換器1220と、周波数ドメイン処理器1230と、周波数/時間変換器1240と、合成窓掛け器1250と、比較器1260と、オーバーラップ加算器1270とを備えても良い。詳細には、分析窓掛け器1210は、オーディオ信号1201又は破線矢印で示す復号化済み低周波信号1202のようなオーディオ信号から導出された信号に対して複数の分析窓関数111−1を適用し、その結果、複数の窓掛けされたオーディオ信号1211を取得しても良い。ここで、オーディオ信号1201は複数のオーディオサンプルからなる1つのブロックを有し、そのブロックはある特定の時間長を持つものである。時間/スペクトル変換器1220は、窓掛けされたオーディオ信号1211を複数のスペクトル1221へと変換しても良い。周波数ドメイン処理器1230は、その複数のスペクトル1221を周波数ドメインで処理し、複数の修正済みスペクトル1231を取得しても良い。周波数/時間変換器1240は、複数の修正済みスペクトル1231を修正済み時間ドメイン信号1241へと変換しても良い。合成窓掛け器1250は、修正済み時間ドメイン信号1241に対して複数の合成窓関数を適用し、複数の窓掛けされた修正済み時間ドメイン信号1251を得てもよい。ここで、複数の合成窓関数は前述の分析窓関数に合致(match)するものである。さらに比較器1260は、複数の窓掛けされた修正済み時間ドメイン信号1251と、オーディオ信号1201又は復号化済み低周波信号1202(破線)のようなそのオーディオ信号から導出された信号との比較に基づいて、複数の比較パラメータを決定しても良く、ここで、これら複数の比較パラメータは前記複数の分析窓関数に対応している。さらに比較器1260は、ある比較パラメータがある所定の条件を満たすような1つの分析窓関数及び合成窓関数を選択しても良い。ここで、比較器1260により選択された分析窓関数及び合成窓関数は、上述した実施例の中で説明した方法と同様の方法で決定されても良いことに留意すべきである。特に、比較器1260は、図7の実施例と同様に構成されても良い。次に、選択された分析窓関数及び合成窓関数は、図12に示す処理連鎖の中で、分析窓掛け器1210から始まり比較器1260の前の合成窓掛け器1250で終わる信号経路のために使用されても良く、その結果、ある特定の(最適な)窓掛けされた修正済時間ドメイン信号1255が合成窓掛け器1250の出力において得られる。最後に、オーバーラップ加算器1270は、比較器1260により選択された分析窓関数及び合成窓関数により修正された、前記窓掛けされた修正済時間ドメイン信号1255のオーバーラップしている連続的なブロックを加算して、時間的に伸長された信号1271を取得するよう構成されても良い。
具体的には、時間的に伸長された信号1271は、窓掛けされた修正済時間ドメイン信号1255のオーバーラップしている連続的なブロック同士の間隔を、オリジナルオーディオ信号1201の対応するブロック、又は復号化済み低周波信号1202のブロックの間隔よりも広げることで得ることができる。加えて、ここで信号伸長器として作動しているオーバーラップ加算器1270は、オーディオ信号1201又は復号化済み低周波信号1202を、そのピッチを変更せずに時間的に伸長させても良く、この場合は「純粋な時間的伸長(pure time stretching)」がもたらされる。
代替的に、比較器1260は処理系列の中でオーバーラップ加算器1270の後に配置されても良く、その場合、オーバーラップ加算器1270は「合成による分析」のスキームの中に含まれても良い。この場合、オーバーラップ加算器1270による処理を施された様々に窓掛けされた修正済み時間ドメイン信号1251の影響も、また後続の比較/窓関数選択によって補償され得るという点で有利と言える。
さらなる代替的実施例においては、位相ボコーダ処理器1200は、例えば単純なサンプルレート変換器の形式を持つデシメータ(decimator)をさらに備えても良く、このデシメータは、ある帯域拡張アルゴリズムの1つの目標周波数領域内にデシメートされた信号が得られるように、伸長された信号をデシメート(圧縮)しても良い。
さらに他の実施例においては、位相ボコーダは、分析されたオーディオ信号の信号特性に適合した最適な分析窓関数を選択するという目的のために、入力オーディオ信号の直接分析を実行しても良い。特に、位相ボコーダのために特別な分析窓関数を使用することで恩恵を受ける信号もあることが発見されている。一例として、雑音性信号は例えばチューキー窓を適用することでより良好に分析され、他方、優位に調性の高い信号は例えばバートレット窓が提供する伝達関数の小さなメインローブによって恩恵を受けることが挙げられる。
要約すれば、最適な窓関数を選択する方法は、次の2つの方法のうちのいずれかで実行できることが分かる。即ち、図3及び図8の帯域拡張符号化装置300及び800内のように符号化装置側だけで窓関数選択が実行され、その後、提供された窓関数指示が図4の帯域拡張復号化装置400のような復号化装置側に伝送される方法と、図5及び図6の帯域拡張符号化装置/復号化装置500及び600、又は図10及び図11の帯域拡張符号化装置/復号化装置1000及び1100のように、符号化装置側及び復号化装置側の両側において窓関数選択が実行される方法である。
この文脈において、後者の方法では窓関数指示が符号化済みオーディオ信号の中に追加的なサイド情報として記憶されることがなく、その結果、符号化済みオーディオ信号の記憶又は伝送のためのビットレートを低減できる点で有利とも言える。
図13は本発明の一実施例である装置1300を示し、この装置は、位相ボコーダのアプリケーションに適用可能な時間−周波数変換の処理過程において、制御情報に基づいて異なる分析及び合成の窓関数の間で切り替えを行うために使用することができる。入力ビットストリーム1301−1は、オーディオデータ1301−3から制御情報1301−2を分離するデータストリーム解釈器(datastream interpreter)により解釈されても良い。さらに、制御情報1301−2に従い、複数の分析窓関数1311−2の中から1つの分析窓関数1311−1をオーディオデータ1301−3に対して適用しても良い。ここでは、例示的に前記複数の分析窓関数1311−2はブロック「分析窓関数1」から「分析窓関数4」と名付けた4つの異なる分析窓関数を含み、そのブロック「分析窓関数1」は適用された分析窓関数1311−1を意味している。特に、制御信号1301−2は、信号特性の直接的な計算により得られたものか、又は上述したような「合成による分析」のスキームにより得られたものでも良い。雑音性信号の場合には、例えばチューキー窓が選択されても良く、調性信号の場合には、例えばバートレット窓が選択されても良い。コサイン・テーパー窓とも呼ばれるチューキー窓は、幅(1.0−α・2)Nの矩形窓と組み合わせられた幅(α・2)Nのコサインローブとしてイメージされても良い。チューキー窓は次式(1)により定義されても良い。
Figure 0005329714
ここで、パラメータαが0から1へと変化するにつれて窓関数は矩形窓からハン窓へと展開する。三角窓を代表するバートレット窓は、次式(2)により定義されても良い。
Figure 0005329714
式(1)及び(2)において、nは整数値であり、Nは時間離散窓関数w(n)の(サンプル毎の)幅である。
分析窓関数1311−1を適用した後に得られる窓掛けされたオーディオ信号は、「時間−周波数変換」と記載されたブロック1320において、時間ドメインから周波数ドメインへとさらに変換されても良い。その変換で得られたスペクトルは、次に「周波数ドメイン処理」と記載されたブロック1330において処理されても良い。特に、ブロック1330は、当該スペクトルのスペクトル値の位相を修正する位相修正器を備えても良い。次に、処理されたスペクトルは、「周波数−時間変換」と記載されたブロック1340において時間ドメインへと逆変換されても良く、その結果、修正済み時間ドメイン信号が得られる。最後に、制御情報1301−2に基づいて、「合成窓関数1」〜「合成窓関数4」と記載された複数の合成窓関数1351−2から選ばれた1つの合成窓関数1351−1が、前記修正済み時間ドメイン信号へと適用されても良い。ここで、合成窓関数1351−1は分析窓関数1311−1の影響を補償するものである。その結果、発生可能な全ての信号経路からの寄与を+の印を記載したブロック1360において加算した後に、窓掛けされた修正済み時間ドメイン信号1361が装置1300の出力において得られる。
図14は、本発明の実施例である位相ボコーダ作動型の帯域拡張復号化装置1400を示す。具体的には、オーディオデータストリーム1411−1は符号化済み低周波信号1411−2とHBE/SBRデータ1411−3とに分離されても良い。符号化済み低周波信号1411−2はコア復号器1420により復号化され、コア周波数帯域1425を含む復号化済み低周波信号1421が得られても良い。復号化済み低周波信号1421は、例えば1024のフレームサイズを有するPCM(パルス符号変調)データを表しても良い。復号化済み低周波信号1421は、次に遅延ステージ1430へと送られ、遅延された信号1431が得られる。次に、この遅延された信号1431は、32帯域のQMF(直交ミラーフィルタ)分析バンク1440へと入力され、例えば遅延された信号1431の32個の周波数サブバンド1441が生成される。HBE/SBRデータ1411−3はパッチ切替器1450を制御する制御情報を含んでも良く、そのパッチ切替器1450はSBRパッチング・アルゴリズムとHBEパッチング・アルゴリズムとの間における切替を実行する。SBRパッチング・アルゴリズムの場合には、周波数サブバンド1441はSBRパッチング装置1460−1へと供給され、パッチ済みQMFデータ1461が得られる。SBRパッチング装置1460−1の出力側にあるパッチ済みQMFデータ1461はHBE/SBRツール1470−1へと供給され、そのツール1470−1は、例えばノイズ充填ユニット1470−2、欠損ハーモニック再構築ユニット1470−3、又は逆フィルタ処理ユニット1470−4を含む。特に、HBE/SBRツール1470−1は、パッチ済みQMFデータ1461に使用されるべき公知のスペクトル帯域複製技術を備えていても良い。SBRパッチング装置1460−1により使用されるパッチングアルゴリズムは、例えば周波数ドメイン内のスペクトルデータのミラーリング又はコピー操作を使用しても良い。さらに、HBE/SBRツール1470−1は、HBE/SBRデータ1411−3により制御される。パッチ済みQMFデータ1461及びHBE/SBRツール1470−1の出力1471は、包絡フォーマッタ1470へと入力される。この包絡フォーマッタ1470はパッチ済みQMFデータ1461の包絡を調整し、その結果、高域側帯域を含む包絡調整されたパッチ済み信号1472が生成される。包絡調整されたパッチ済み信号1472はQMF合成バンク1480に入力され、このバンク1480は周波数ドメインで前記高域側帯域の成分と前記オーディオ信号1441とを結合する。最後に、「波形」と記載された合成オーディオ信号1481が得られる。
HBEパッチング・アルゴリズム(ブロック1460−2)の場合には、復号化済み低周波信号1421はダウンサンプラー1490により例えば因子2でダウンサンプリングされても良く、その結果、当該復号化済み低周波信号のダウンサンプリング済みバージョンである信号1491を得る。このダウンサンプリング済み信号1491は、さらに位相ボコーダを用いたハーモニック帯域拡張アルゴリズムの先進処理スキームで処理されても良い。
一方では、次の2者択一の切替を使用した信号依存処理スキームを用いても良い。即ち、過渡検出器1485が復号化済み低周波信号1421のブロックの中に過渡イベントを検出しない場合には、“no”と記載された信号経路1500で示す標準アルゴリズムを選択し、前記ブロックで過渡イベントを検出した場合には、“yes”と記載されゼロ・パディング操作(ブロック1515)から始まる信号経路1510で示す先進アルゴリズムを選択する切替を使用してもよい。
他方では、前段において詳細に説明したように、時間−周波数変換の構成において位相ボコーダ内で分析窓関数特性を信号に基づいて切り替えても良い。特に、図14の中に点線で境界を描いた参照番号1520及び1530のボックスは、信号操作により切替可能な窓関数を示している。基本的に、図14は位相ボコーダ作動型の帯域拡張に図13の実施例を適用した例を示している。
ここで、「FFT」(高速フーリエ変換)、「位相適合」及び「iFFT」(逆高速フーリエ変換)と記載した各ブロックは、図13におけるブロック1320、1330及び1340にそれぞれ対応していても良い。具体的には、FFTとiFFTとの処理ブロックは、短時間フーリエ変換(STFT)又は離散フーリエ変換(DFT)と、逆短時間フーリエ変換(iSTFT)又は逆離散フーリエ変換 (iDFT)との処理を、復号化済み低周波信号1421のブロックに対してそれぞれ適用しても良い。加えて、図14に示す帯域拡張復号化装置1400は、アップサンプリングステージ1540とオーバーラップ加算(OLA)ステージ1550とデシメートステージ1560とをさらに備えていても良い。
上述した概念を使用すれば、オーディオ信号内の任意の位置で、異なる窓関数の間で切替を実行することができる点に注意すべきである。
これまで各ブロックが現実的又は論理的なハードウエア構成要素を表すブロック図を用いて本発明を説明してきたが、本発明はコンピュータ実装型の方法で実現されても良い。後者の場合には、各ブロックは対応する方法ステップを表し、これらステップは対応する論理的又は物理的ハードウエアブロックにより実行される機能を表している。
上述した実施の形態は、本発明の原理を単に例示的に示したにすぎない。本明細書に記載した構成及び詳細について修正及び変更が可能であることは、当業者にとって明らかである。従って、本発明は、本明細書に実施形態の説明及び解説の目的で提示した具体的詳細によって限定されるものではなく、添付した特許請求の範囲によってのみ限定されるべきである。
本発明の方法の所定の実施条件に依るが、本発明の方法は、ハードウエア又はソフトウエアにおいて構成可能である。この構成は、その中に格納される電子的に読出し可能な制御信号を有し、本発明の方法が実行されるようにプログラム可能なコンピュータシステムと協働する、デジタル記憶媒体、特にディスク,DVD,CDなどを使用して実行することができる。一般的に、本発明の実施例は、機械読出し可能なキャリアに記憶されたプログラムコードを有するコンピュータプログラム製品として構成することができ、このプログラムコードは当該コンピュータプログラム製品がコンピュータ上で作動されるときに本発明の方法を実行するよう作動する。換言すれば、本発明の方法は、当該コンピュータプログラムがコンピュータ上で作動されるときに、本発明の方法の少なくとも1つを実行するためのプログラムコードを有する、コンピュータプログラムである。本発明の符号化済みオーディオ信号は、デジタル記憶媒体のような任意の機械読出し可能な記憶媒体に記憶することができる。
本発明の新規な処理の利点として、本願明細書に説明した上述の実施例、即ち装置、方法又はコンピュータプログラムにより、帯域拡張のアプリケーションの知覚的オーディオ品質を改善できることが挙げられる。特に、位相ボコーダ作動型の帯域拡張内などにおいて、分析窓関数特性の信号依存型の切替を利用する。
本発明の新規な処理はまた、純粋な時間伸長のような他の位相ボコーダのアプリケーションについても、最適な分析又は合成窓関数の選択において信号特性を考慮することが有益となる場合であれば常に使用することができる。
本発明の概念に従えば、帯域拡張においてパッチング処理のために信号特性が考慮可能となる。最適な分析窓関数の決定は、開ループ内でも閉ループ内でも実行できる。そのため、復元品質は最適化され、従って、一段と強化される。
最も顕著なアプリケーションは、帯域拡張原理に基づくオーディオ復号器である。しかし、本発明の処理により、音楽再生やオーディオ後処理のための位相ボコーダアプリケーションもまた強化することができる。
−備考−
[請求項4]
請求項2に記載の帯域拡張復号化装置(400)において、
前記符号化済みオーディオ信号(401−1)は窓関数指示(401−4)を含み、
前記パッチモジュール(420)は、前記窓関数指示(401−4)に基づいて複数の分析窓関数から1つの分析窓関数を選択し、かつ当該選択された分析窓関数を前記復号化済み低周波信号(411−1)へと適用する制御可能な窓掛け部を含む、
ことを特徴とする帯域拡張復号化装置。
[請求項5]
請求項1に記載の帯域拡張符号化装置(500)において、
複数の分析窓関数(111−1)を指示する窓関数制御情報(311)を提供する窓関数制御手段(310)を備え、
前記パラメータ計算手段(320)は前記窓関数制御手段(310)により制御される窓掛け部を含み、当該窓掛け部は前記複数の分析窓関数(111−1)と比較手段(510)により選択されるべき1つの分析窓関数(111−2)とを前記高周波信号(101−4)へと適用するものであり、
前記信号分析手段(110)は前記低周波信号(101−2)と前記窓関数制御情報(311)と帯域拡張パラメータ(321−1)とに基づいて複数のパッチ済み信号(331−1)を生成するパッチモジュール(330)を含み、前記複数のパッチ済み信号(331−1)は前記コア周波数帯域(101−3)から生成された高域側帯域(331−2)を含むものであり、
前記パッチモジュール(330)は前記窓関数制御手段(310)により制御される窓掛け部を含み、当該窓掛け部は前記複数の分析窓関数(111−1)を前記低周波信号(101−2)へと適用するものであり、
前記複数のパッチ済み信号(333−1)と前記オーディオ信号から導出された参照低周波信号(101−2)との比較に基づいて、前記複数の分析窓関数(111−1)に対応する複数の比較パラメータを決定し、さらに所定の条件を満たす1つの比較パラメータと対応する1つの分析窓関数を指示する窓関数指示(511)を提供する比較手段(510)を備え、
前記帯域拡張パラメータ(321−2)と前記符号化済み低周波信号(121)とを結合して、前記窓関数指示(511)を含まない符号化済みオーディオ信号(531)を提供する出力インターフェース(530)を備えることを特徴とする、帯域拡張符号化装置。
[請求項6]
請求項2に記載の帯域拡張復号化装置(600)において、
前記パッチモジュール(220)は、
複数の分析窓関数(111−1)を前記復号化済み低周波信号(681−1)へと適用して複数の窓掛けされた低周波信号(611)を得る分析窓掛け手段(610)と、
前記窓掛けされた低周波信号(611)を複数のスペクトル(621)へと変換する時間/スペクトル変換手段(620)と、
前記複数のスペクトル(621)を周波数ドメインで処理して複数の修正済みスペクトル(631)を取得する周波数ドメイン処理手段(630)と、
前記複数の修正済みスペクトル(631)を修正済み時間ドメイン信号(641)へと変換する周波数/時間変換手段(640)と、
前記複数の分析窓関数(111−1)に合致している複数の合成窓関数を前記修正済み時間ドメイン信号(641)へと適用し、複数の窓掛けされた修正済み時間ドメイン信号(651)を取得する合成窓掛け手段(650)と、
前記複数の窓掛けされた修正済み時間ドメイン信号(651)と前記復号化済み低周波信号(681−1)との比較に基づいて、前記複数の分析窓関数(111−1)に対応する複数の比較パラメータを決定し、さらに所定の条件を満たす1つの比較パラメータと対応する1つの分析窓関数及び合成窓関数を選択する比較手段(660)とを備え、
前記パッチモジュール(220)は、前記復号化済み低周波信号(681−1)と前記比較手段(660)により選択された前記分析窓関数及び合成窓関数と前記高帯域パラメータ(601−3)とに基づいて前記パッチ済み信号(671)を生成することを特徴とする、帯域拡張復号化装置。
[請求項8]
請求項6に記載の帯域拡張復号化装置(600)において、
前記比較手段(660;700)は、前記窓掛けされた修正済み時間ドメイン信号(651)から導出された複数のSFMパラメータ(703−1)と、前記復号化済み低周波信号(681−1)から導出された1つの参照SFMパラメータ(703−2)とを計算し、さらに前記複数のSFMパラメータ(703−1)と前記参照SFMパラメータ(703−2)との比較に基づいて複数の比較パラメータ(705)を決定することを特徴とする、帯域拡張復号化装置。
[請求項10]
請求項1に記載の帯域拡張符号化装置(1000)において、
前記信号分析手段(110)は、前記オーディオ信号(101−1)から導出された低周波信号(101−2)を分類し、当該分類された信号の信号特性に基づいて1つの分析窓関数に対応する窓関数指示(1011)を決定する信号分類手段(900;1010)を備え、
前記帯域拡張符号化装置(1000)は、前記信号分類手段(900;1010)により決定された前記窓関数指示(1011)に基づいて窓関数制御情報(1021)を出力する窓関数制御手段(1020)を備え、
前記パラメータ計算手段(1030)は、前記窓関数制御手段(1020)により制御される窓掛け部を含み、当該窓掛け部は前記窓関数制御情報(1021)に基づく分析窓関数を前記高周波信号(101−4)に対して適用するよう構成されており、
前記帯域拡張符号化装置(1000)は、前記帯域拡張パラメータ(1031)と前記符号化済み低周波信号(121)とを結合して、前記窓関数指示(1011)を含まない符号化済みオーディオ信号(1041)を出力する出力インターフェース(1040)をさらに備えることを特徴とする、帯域拡張符号化装置。
[請求項11]
請求項5又は10に記載の帯域拡張符号化装置(500;1000)において、
前記符号化済み低周波信号(121)を復号化して復号化済み低周波信号(521;1051)を得るコア復号化手段(520;1050)をさらに備えることを特徴とする、帯域拡張符号化装置。
[請求項12]
請求項2に記載の帯域拡張復号化装置(1100)において、
前記パッチモジュール(220)は、前記復号化済み低周波信号(681−1)を分類し、当該分類された信号の信号特性に基づいて1つの分析窓関数に対応する窓関数指示(1111)を決定する信号分類手段(900;1110)を備え、
前記帯域拡張復号化装置(1100)は、前記信号分類手段(900;1110)により決定された前記窓関数指示(1111)に基づいて窓関数制御情報(1121)を出力する窓関数制御手段(1120)を備え、
前記パッチモジュール(220)は、前記復号化済み低周波信号(681−1)と前記窓関数制御情報(1121)に基づく分析窓関数と前記高帯域パラメータ(601−3)とによって前記パッチ済み信号(671)を生成することを特徴とする、帯域拡張復号化装置。
[請求項13]
オーディオ信号(1201)を処理する位相ボコーダ(1200)であって、
前記オーディオ信号(1201)又は前記オーディオ信号から導出された信号(1202)に対して複数の分析窓関数(111−1)を適用して複数の窓掛けされたオーディオ信号(1211)を取得する分析窓掛け手段(1210)であって、前記オーディオ信号(1201)は複数のオーディオサンプルからなる1つのブロック(101−6)を有し、そのブロック(101−6)は特定の時間長を持つものである、分析窓掛け手段(1210)と、
前記複数の窓掛けされたオーディオ信号(1211)を複数のスペクトル(1221)へと変換する時間/スペクトル変換手段(1220)と、
前記複数のスペクトル(1221)を周波数ドメインで処理して複数の修正済みスペクトル(1231)を得る周波数ドメイン処理手段(1230)と、
前記複数の修正済みスペクトル(1231)を修正済み時間ドメイン信号(1241)へと変換する周波数/時間変換手段(1240)と、
前記修正済み時間ドメイン信号(1241)に対して前記複数の分析窓関数に合致する複数の合成窓関数を適用し、複数の窓掛けされた修正済み時間ドメイン信号(1251)を得る合成窓掛け手段(1250)と、
前記複数の窓掛けされた修正済み時間ドメイン信号(1251)と前記オーディオ信号(1201)又は前記オーディオ信号から導出された信号(1202)との比較に基づいて、前記複数の分析窓関数に対応する複数の比較パラメータを決定し、さらに所定の条件を満たす1つの比較パラメータと対応する1つの分析窓関数及び合成窓関数を選択する比較手段(1260)と、
窓掛けされた修正済時間ドメイン信号(1255)のオーバーラップしているブロックを加算して時間的に伸長された信号(1271)を得るオーバーラップ加算手段(1270)であって、前記窓掛けされた修正済時間ドメイン信号(1255)は、前記比較手段(1260)により選択された分析窓関数及び合成窓関数を用いて前記分析窓掛け手段(1210)及び合成窓掛け手段(1250)により修正された信号である、オーバーラップ加算手段(1270)と、
を備えることを特徴とする位相ボコーダ。

Claims (16)

  1. コア周波数帯域(101−3)を含む低周波信号(101−2)と高域側帯域(101−5)を含む高周波信号(101−4)とを有するオーディオ信号(101−1)を符号化する帯域拡張符号化装置(300;800)であって、
    前記オーディオ信号(101−1)を分析し、前記オーディオ信号の信号特性に基づいて複数の分析窓関数(111−1)の中から帯域拡張復号化装置(400;1400)において帯域拡張を行うために使用されるべき1つの分析窓関数(111−2)を決定する信号分析手段(110)であって、前記オーディオ信号(101−1)は複数のオーディオサンプルからなる1つのブロック(101−6)を有し、そのブロックは特定の時間長を持つものであり、前記複数の分析窓関数(111−1)は異なる窓関数特性を有する異なる分析窓関数を含む、信号分析手段(110)と、
    前記低周波信号(101−2)を符号化して符号化済み低周波信号(121)を得るコア符号化手段(120)と、
    前記1つの分析窓関数(111−2)を前記高周波信号(101−4)に適用して、前記高周波信号(101−4)から帯域拡張パラメータ(321−2;831)を計算するパラメータ計算手段(320;830)と、
    前記1つの分析窓関数(111−2)を指示する窓関数指示(341−1)と前記符号化済み低周波信号(121)と前記帯域拡張パラメータ(321−2;831)とを結合して、前記窓関数指示(341−1)を含む符号化済みオーディオ信号(351;841)を得る出力インターフェース(350;840)と、
    を備えることを特徴とする帯域拡張符号化装置。
  2. 符号化済み低周波信号(401−2)と高帯域パラメータ(401−3)と窓関数指示(401−4)とを有する符号化済みオーディオ信号(401−1)を復号化する帯域拡張復号化装置(400)であって、
    前記符号化済み低周波信号(401−2)を復号化して復号化済み低周波信号(411−1)を得るコア復号化手段(410)であって、前記復号化済み低周波信号(411−1)はコア周波数帯域(411−2)を含む、コア復号化手段と、
    前記復号化済み低周波信号(411−1)と前記高帯域パラメータ(401−3)とに基づいてパッチ済み信号(421)を生成するパッチモジュール(420)であって、前記パッチ済み信号(421)は前記コア周波数帯域(411−2)から生成された高域側帯域(221−2)を含み、前記窓関数指示(401−4)に基づいて複数の分析窓関数の中から1つの分析窓関数を選択し、かつ選択された分析窓関数を前記復号化済み低周波信号(411−1)に適用して前記パッチ済み信号(421)を得る制御可能な窓掛け部を含み、前記複数の分析窓関数は異なる窓関数特性を有する異なる分析窓関数を含む、パッチモジュール(420)と、
    前記パッチ済み信号(421)と前記復号化済み低周波信号(411−1)とを結合して結合された出力信号(431)を得る結合手段(430)と、
    を備えることを特徴とする帯域拡張復号化装置。
  3. 請求項1に記載の帯域拡張符号化装置(300)において、
    複数の分析窓関数(111−1)を指示する窓関数制御情報(311)を提供する窓関数制御手段(310)を備え、
    前記パラメータ計算手段(320)は前記窓関数制御手段(310)により制御される窓掛け部を含み、当該窓掛け部は前記複数の分析窓関数(111−1)を前記高周波信号(101−4)に適用して複数の帯域拡張パラメータ(321−1)を計算し、
    前記信号分析手段(110)は、前記低周波信号(101−2)と前記窓関数制御情報(311)と前記複数の帯域拡張パラメータ(321−1)とに基づいて複数のパッチ済み信号(331−1)を生成するパッチモジュール(330)を含み、前記複数のパッチ済み信号(331−1)は前記コア周波数帯域(101−3)から生成された高域側帯域(331−2)を含むものであり、
    前記信号分析手段(110)は、前記複数のパッチ済み信号(331−1)と前記オーディオ信号(101−1)又は前記オーディオ信号から導出された信号(101−4)である参照信号との比較に基づいて、前記複数の分析窓関数(111−1)に対応する複数の比較パラメータ(341−2)を決定し、さらに所定の条件を満たす1つの比較パラメータと対応する1つの分析窓関数を指示する窓関数指示(341−1)を提供する比較手段(340)を備え、
    前記パラメータ計算手段(320)は、前記窓関数指示(341−1)により指示された1つの分析窓関数(111−2)を前記高周波信号(101−4)へと適用して、帯域拡張パラメータ(321−2)を計算し、
    前記出力インターフェース(350)は、前記帯域拡張パラメータ(321−2)と前記窓関数指示(341−1)と前記符号化済み低周波信号(121)とを結合して、前記窓関数指示(341−1)を含む符号化済みオーディオ信号(351)を提供することを特徴とする、帯域拡張符号化装置。
  4. 請求項3に記載の帯域拡張符号化装置(300;500)において、
    前記比較手段(340;510;700)は、前記パッチ済み信号(331−1)から導出された複数のSFMパラメータ(703−1)と、前記オーディオ信号(101−1)から導出された1つの参照SFMパラメータ(703−2)とを計算し、さらに前記複数のSFMパラメータ(703−1)と前記参照SFMパラメータ(703−2)との比較に基づいて複数の比較パラメータ(705)を決定することを特徴とする、帯域拡張符号化装置。
  5. 請求項1に記載の帯域拡張符号化装置(800)において、
    前記信号分析手段(110)は、前記オーディオ信号(101−1)又はこのオーディオ信号から導出された信号(101−4)を分類し、当該分類された信号の信号特性に基づいて1つの分析窓関数に対応する窓関数指示(811)を決定する信号分類手段(810;900)を備え、
    前記帯域拡張符号化装置(800)は、前記信号分類手段(810)により決定された前記窓関数指示(811)に基づいて窓関数制御情報(821)を出力する窓関数制御手段(820)を備え、
    前記パラメータ計算手段(830)は、前記窓関数制御手段(820)により制御される窓掛け部を含み、当該窓掛け部は前記窓関数制御情報(821)に基づく分析窓関数を前記高周波信号(101−4)に対して適用するよう構成されており、
    前記出力インターフェース(840)は、前記帯域拡張パラメータ(831)と前記窓関数指示(811)と前記符号化済み低周波信号(121)とを結合して、前記窓関数指示(811)を含む符号化済みオーディオ信号(841)を出力することを特徴とする、帯域拡張符号化装置。
  6. コア周波数帯域(101−3)を含む低周波信号(101−2)と高域側帯域(101−5)を含む高周波信号(101−4)とを有するオーディオ信号(101−1)を符号化する帯域拡張符号化方法(100;300;500;800;1000)であって、
    前記オーディオ信号(101−1)を分析し、前記オーディオ信号の信号特性に基づいて複数の分析窓関数(111−1)から帯域拡張復号化装置(200;400;1400)において帯域拡張を実行するために使用されるべき1つの分析窓関数(111−2)を決定するステップ(110)であって、前記オーディオ信号(101−1)は複数のオーディオサンプルからなる1つのブロック(101−6)を有し、そのブロックは特定の時間長を持つものであり、前記複数の分析窓関数(111−1)は異なる窓関数特性を有する異なる分析窓関数を含む、ステップ(110)と、
    前記低周波信号(101−2)を符号化して符号化済み低周波信号(121)を得るステップ(120)と、
    前記1つの分析窓関数(111−2)を前記高周波信号(101−4)に適用して、前記高周波信号(101−4)から帯域拡張パラメータ(321−2;831)を計算するステップ(320;830)と、
    前記1つの分析窓関数(111−2)を指示する窓関数指示(341−1)と前記符号化済み低周波信号(121)と前記帯域拡張パラメータ(321−2;831)とを結合して、前記窓関数指示(341−1)を含む符号化済みオーディオ信号(351;841)を得るステップ(350;840)と、
    を備えることを特徴とする方法。
  7. 符号化済み低周波信号(401−2)と高帯域パラメータ(401−3)と窓関数指示(401−4)とを有する符号化済みオーディオ信号(401−1)を復号化する帯域拡張復号化方法(400)であって、
    前記符号化済み低周波信号(401−2)を復号化して復号化済み低周波信号(411−1)を得るステップ(410)であって、前記復号化済み低周波信号(411−1)はコア周波数帯域(411−2)を含む、ステップ(410)と、
    前記復号化済み低周波信号(411−1)と前記高帯域パラメータ(401−3)とに基づいてパッチ済み信号(421)を生成するステップ(420)であって、前記パッチ済み信号(421)は前記コア周波数帯域(411−2)から生成された高域側帯域(221−2)を含み、前記窓関数指示(401−4)に基づいて複数の分析窓関数の中から1つの分析窓関数を選択し、かつ選択された分析窓関数を前記復号化済み低周波信号(411−1)に適用して前記パッチ済み信号(421)を取得し、前記複数の分析窓関数は異なる窓関数特性を有する異なる分析窓関数を含む、ステップ(420)と、
    前記パッチ済み信号(421)と前記復号化済み低周波信号(411−1)とを結合して結合された出力信号(431)を得るステップ(430)と、
    を備えることを特徴とする方法。
  8. コア周波数帯域(101−3)を含む低周波信号(101−2)と高域側帯域(101−5)を含む高周波信号(101−4)とを有するオーディオ信号(101−1)から生成された、符号化済みオーディオ信号(103−1;351;841)を記録したコンピュータ読み取り可能な記憶媒体であって、前記符号化済みオーディオ信号は、
    符号化済み低周波信号(121)と、
    帯域拡張パラメータ(131;321−2;831)と、
    帯域拡張復号化装置(200;400;1400)において帯域拡張を実行するために使用されるべき1つの分析窓関数(111−2)を指示する窓関数指示(341−1)であって、前記1つの分析窓関数(111−2)は、前記オーディオ信号(101−1)の信号特性に基づいて、異なる窓関数特性を有する複数の分析窓関数の中から決定されたものである、窓関数指示(341−1)と、
    を有することを特徴とする、記憶媒体
  9. 請求項6又は7に記載の方法をコンピュータに実行させるためのプログラムコードを備えたコンピュータプログラム。
  10. 符号化済みオーディオ信号(103−1)を得るために、コア周波数帯域(101−3)を含む低周波信号(101−2)と高域側帯域(101−5)を含む高周波信号(101−4)とを有するオーディオ信号(101−1)を符号化する帯域拡張符号化装置(800)において、
    前記オーディオ信号(101−1)を分析して、複数の分析窓関数(111−1)の中から帯域拡張復号化装置(400)において帯域拡張を行うために使用されるべき1つの分析窓関数(111−2)を決定する信号分析手段(110)であって、前記オーディオ信号(101−1)は複数のオーディオサンプルからなる1つのブロック(101−6)を有し、そのブロックは特定の時間長を持つものであり、前記オーディオ信号の信号特性に基づいて、前記分析窓関数に対応する1つの窓関数指示(811)を決定するために、前記オーディオ信号(101−1)又はこのオーディオ信号から導出された信号(101−4)を分類する信号分類手段(810)を備える信号分析手段(110)と、
    前記信号分類手段(810)により決定された前記窓関数指示(811)に基づいて窓関数制御情報(821)を出力する窓関数制御手段(820)であって、この窓関数制御手段の出力において前記窓関数制御情報により指示された前記複数の分析窓関数(111−1)は異なる窓関数特性を有する異なる分析窓関数を含み、それら分析窓関数はメインローブ幅、サイドローブレベル又はサイドローブ・フォールオフにより区別される異なる伝達関数を持つ、窓関数制御手段(820)と、
    前記低周波信号(101−2)を符号化して符号化済み低周波信号(121)を得るコア符号化手段(120)と、
    前記高周波信号(101−4)から帯域拡張パラメータ(831)を計算するパラメータ計算手段(830)であって、前記窓関数制御手段(820)によって制御される窓掛け部を含み、当該窓掛け部は前記窓関数制御情報(821)に基づいて分析窓関数を前記高周波信号(101−4)へと適用するものである、パラメータ計算手段(830)と、
    前記符号化済み低周波信号(121)と前記帯域拡張パラメータ(831)と前記窓関数指示(811)とを含む符号化済みオーディオ信号(841)を提供する出力インターフェース(840)と、
    を備えることを特徴とする帯域拡張符号化装置。
  11. 請求項10に記載の帯域拡張符号化装置(800)において、
    前記信号分類手段(810)は、
    前記オーディオ信号を分析し、当該オーディオ信号の調性度を決定する調性測定器(910)と、
    前記調性度に基づいて前記オーディオ信号の信号特性を決定する信号特性評価器(920)と、
    前記信号特性に基づいて窓関数指示(811)を提供する窓関数選択器(930)と、
    を備えることを特徴とする帯域拡張符号化装置。
  12. 請求項10に記載の帯域拡張符号化装置(800)において、
    前記オーディオ信号の決定された調性度が所定のしきい値未満である場合に、第1のメインローブ幅を持つ伝達関数によって特徴付けられた第1の窓関数が前記パラメータ計算手段(830)の窓掛け部によって適用されるように、かつ前記オーディオ信号の決定された調性度が所定のしきい値以上である場合に、第2のメインローブ幅を持つ伝達関数によって特徴付けられた第2の窓関数が前記パラメータ計算手段(830)の窓掛け部によって適用されるように、前記パラメータ計算手段(830)のための前記窓関数制御情報(821)が供給され、ここで前記第1のメインローブ幅は前記第2のメインローブ幅より大きいことを特徴とする帯域拡張符号化装置。
  13. 符号化済み低周波信号(401−2)と高帯域パラメータ(401−3)と窓関数指示(401−4)とを有する符号化済みオーディオ信号(401−1)を復号化する帯域拡張復号化装置(400)であって、
    前記符号化済み低周波信号(401−2)を復号化して復号化済み低周波信号(411−1)を得るコア復号化手段(410)であって、前記復号化済み低周波信号(411−1)はコア周波数帯域(411−2)を含む、コア復号化手段(410)と、
    前記復号化済み低周波信号(411−1)と前記高帯域パラメータ(401−3)とに基づいてパッチ済み信号(421)を生成するパッチモジュール(420)であって、前記パッチ済み信号(421)は前記コア周波数帯域(211−2;411−2)から生成された高域側帯域(221−2)を含み、前記パッチモジュール(420)は、前記窓関数指示(401−4)に基づいて複数の分析窓関数から1つの分析窓関数を選択し、かつ選択された分析窓関数を前記復号化済み低周波信号(411−1)に適用して前記パッチ済み信号(421)を得る制御可能な窓掛け部を含み、前記窓関数指示により指示された前記複数の分析窓関数(111−1)は異なる窓関数特性を有する異なる分析窓関数を含み、これら分析窓関数はメインローブ幅、サイドローブレベル又はサイドローブ・フォールオフにより区別される異なる伝達関数を持つ、パッチモジュール(420)と、
    前記パッチ済み信号(421)と前記復号化済み低周波信号(411−1)とを結合して結合された出力信号(431)を得る結合手段(430)と、
    を備えることを特徴とする帯域拡張復号化装置。
  14. コア周波数帯域(101−3)を含む低周波信号(101−2)と高域側帯域(101−5)を含む高周波信号(101−4)とを有するオーディオ信号(101−1)を符号化する帯域拡張符号化方法(100;300;500;1000)であって、
    前記オーディオ信号(101−1)を分析するステップ(110)であって、前記オーディオ信号(101−1)は複数のオーディオサンプルからなる1つのブロック(101−6)を有し、そのブロックは特定の時間長を持つものであり、複数の分析窓関数(111−1)から帯域拡張復号化装置(400)において帯域拡張を実行するために使用されるべき1つの分析窓関数(111−2)を決定するステップ(110)であって、前記オーディオ信号の信号特性に基づいて、前記分析窓関数に対応するある窓関数指示(811)を決定するために、信号分類手段(810)を使用して前記オーディオ信号(101−1)又はこのオーディオ信号から導出された信号(101−4)を分類するサブステップを含む、ステップ(110)と、
    前記信号分類手段(810)により決定された前記窓関数指示(811)に基づいて、窓関数制御手段(820)を使用して窓関数制御情報(821)を出力するステップであって、前記窓関数制御手段の出力において前記窓関数制御情報により指示された前記複数の分析窓関数(111−1)は、異なる窓関数特性を有する異なる分析窓関数を含み、それら分析窓関数はメインローブ幅、サイドローブレベル又はサイドローブ・フォールオフにより区別される異なる伝達関数を持つ、ステップと、
    前記低周波信号(101−2)を符号化して符号化済み低周波信号(121)を得るステップ(120)と、
    前記高周波信号(101−4)から帯域拡張パラメータを計算するステップ(130)であって、前記窓関数制御手段(820)によって制御される窓掛け部によって、前記窓関数制御情報(821)に基づく分析窓関数を前記高周波信号(101−4)へと適用するサブステップを含む、ステップ(130)と、
    出力インターフェース(840)によって、前記符号化済み低周波信号(121)と前記帯域拡張パラメータと前記窓関数指示(811)とを含む符号化済みオーディオ信号(841)を提供するステップと、
    を備えることを特徴とする方法。
  15. 符号化済み低周波信号(401−2)と高帯域パラメータ(401−3)と窓関数指示(401−4)とを有する符号化済みオーディオ信号(401−1)を復号化する帯域拡張復号化方法であって、
    前記符号化済み低周波信号(401−2)を復号化するステップ(410)であり、復号化済み低周波信号(411−1)はコア周波数帯域(411−2)を含む、ステップ(410)と、
    前記復号化済み低周波信号(411−1)と前記高帯域パラメータ(401−3)とに基づいてパッチ済み信号(421)を生成するステップ(420)であって、当該パッチ済み信号(421)は前記コア周波数帯域(411−2)から生成された高域側帯域(221−2)を含み、制御可能な窓掛け部によって、前記窓関数指示(401−4)に基づいて複数の分析窓関数から1つの分析窓関数を選択し、かつ選択された分析窓関数を前記復号化済み低周波信号(411−1)に適用して前記パッチ済み信号(421)を得るサブステップを含み、前記窓関数指示により指示された前記複数の分析窓関数(111−1)は異なる窓関数特性を有する異なる分析窓関数を含み、これら分析窓関数はメインローブ幅、サイドローブレベル又はサイドローブ・フォールオフにより区別される異なる伝達関数を持つ、ステップ(420)と、
    前記パッチ済み信号(421)と前記復号化済み低周波信号(411−1)とを結合して結合された出力信号(431)を得るステップ(430)と、
    を備えることを特徴とする方法。
  16. 請求項14又は15に記載の方法をコンピュータに実行させるためのプログラムコードを備えたコンピュータプログラム。
JP2012518070A 2009-06-29 2010-06-24 帯域拡張符号化装置、帯域拡張復号化装置及び位相ボコーダ Active JP5329714B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US22144209P 2009-06-29 2009-06-29
US61/221,442 2009-06-29
EP10153530.0 2010-02-12
EP10153530A EP2273493B1 (en) 2009-06-29 2010-02-12 Bandwidth extension encoding and decoding
PCT/EP2010/059025 WO2011000780A1 (en) 2009-06-29 2010-06-24 Bandwidth extension encoder, bandwidth extension decoder and phase vocoder

Publications (2)

Publication Number Publication Date
JP2012531632A JP2012531632A (ja) 2012-12-10
JP5329714B2 true JP5329714B2 (ja) 2013-10-30

Family

ID=42537947

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012518070A Active JP5329714B2 (ja) 2009-06-29 2010-06-24 帯域拡張符号化装置、帯域拡張復号化装置及び位相ボコーダ

Country Status (14)

Country Link
US (1) US8606586B2 (ja)
EP (2) EP2273493B1 (ja)
JP (1) JP5329714B2 (ja)
KR (1) KR101425157B1 (ja)
CN (1) CN102473414B (ja)
AU (1) AU2010268160B2 (ja)
BR (1) BRPI1010165B1 (ja)
CA (2) CA2766573C (ja)
ES (2) ES2400661T3 (ja)
HK (2) HK1153035A1 (ja)
MX (1) MX2011013610A (ja)
PL (2) PL2273493T3 (ja)
RU (1) RU2563164C2 (ja)
WO (1) WO2011000780A1 (ja)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102473417B (zh) 2010-06-09 2015-04-08 松下电器(美国)知识产权公司 频带扩展方法、频带扩展装置、集成电路及音频解码装置
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
JP5704397B2 (ja) * 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
US9177570B2 (en) * 2011-04-15 2015-11-03 St-Ericsson Sa Time scaling of audio frames to adapt audio processing to communications network timing
US9697840B2 (en) * 2011-11-30 2017-07-04 Dolby International Ab Enhanced chroma extraction from an audio codec
CN108831501B (zh) 2012-03-21 2023-01-10 三星电子株式会社 用于带宽扩展的高频编码/高频解码方法和设备
RU2725416C1 (ru) 2012-03-29 2020-07-02 Телефонактиеболагет Лм Эрикссон (Пабл) Расширение полосы частот гармонического аудиосигнала
CN106409299B (zh) * 2012-03-29 2019-11-05 华为技术有限公司 信号编码和解码的方法和设备
EP2709106A1 (en) 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
EP2720222A1 (en) * 2012-10-10 2014-04-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns
ES2768179T3 (es) * 2013-01-29 2020-06-22 Fraunhofer Ges Forschung Codificador de audio, decodificador de audio, método para proporcionar una información de audio codificada, método para proporcionar una información de audio decodificada, programa informático y representación codificada utilizando una ampliación de ancho de banda adaptada a la señal
RU2676242C1 (ru) * 2013-01-29 2018-12-26 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Декодер для формирования аудиосигнала с улучшенной частотной характеристикой, способ декодирования, кодер для формирования кодированного сигнала и способ кодирования с использованием компактной дополнительной информации для выбора
RU2625945C2 (ru) 2013-01-29 2017-07-19 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для генерирования сигнала с улучшенным спектром, используя операцию ограничения энергии
US9319510B2 (en) * 2013-02-15 2016-04-19 Qualcomm Incorporated Personalized bandwidth extension
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
CA2927990C (en) 2013-10-31 2018-08-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain
EP2881943A1 (en) 2013-12-09 2015-06-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal with low computational resources
CN103714822B (zh) * 2013-12-27 2017-01-11 广州华多网络科技有限公司 基于silk编解码器的子带编解码方法及装置
WO2015133795A1 (ko) * 2014-03-03 2015-09-11 삼성전자 주식회사 대역폭 확장을 위한 고주파 복호화 방법 및 장치
CN106463143B (zh) 2014-03-03 2020-03-13 三星电子株式会社 用于带宽扩展的高频解码的方法及设备
SG11201609834TA (en) 2014-03-24 2016-12-29 Samsung Electronics Co Ltd High-band encoding method and device, and high-band decoding method and device
CN111710342B (zh) * 2014-03-31 2024-04-16 弗朗霍弗应用研究促进协会 编码装置、解码装置、编码方法、解码方法及程序
KR102191506B1 (ko) * 2014-05-14 2020-12-16 삼성전자주식회사 통신 시스템에서 송신 신호 처리 장치 및 방법
CN104007977A (zh) * 2014-06-09 2014-08-27 威盛电子股份有限公司 电子装置及音频播放方法
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CN104269173B (zh) * 2014-09-30 2018-03-13 武汉大学深圳研究院 切换模式的音频带宽扩展装置与方法
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
US10117247B2 (en) * 2015-03-13 2018-10-30 Futurewei Technologies, Inc. Windowing methods for efficient channel aggregation and deaggregation
KR101642112B1 (ko) 2015-10-29 2016-07-22 주식회사 님버스 이동통신망에서 실시간 멀티미디어를 송수신하기 위한 모뎀 본딩 시스템 및 방법
US10504530B2 (en) 2015-11-03 2019-12-10 Dolby Laboratories Licensing Corporation Switching between transforms
KR101688647B1 (ko) 2016-04-04 2016-12-22 주식회사 님버스 이동통신망에서 실시간 저지연 전송을 위한 모뎀 본딩 시스템 및 방법
RU169931U1 (ru) * 2016-11-02 2017-04-06 Акционерное Общество "Объединенные Цифровые Сети" Устройство сжатия аудиосигнала для передачи по каналам распространения данных
CN110062945B (zh) * 2016-12-02 2023-05-23 迪拉克研究公司 音频输入信号的处理
US11527256B2 (en) * 2018-04-25 2022-12-13 Dolby International Ab Integration of high frequency audio reconstruction techniques
CA3152262A1 (en) * 2018-04-25 2019-10-31 Dolby International Ab Integration of high frequency reconstruction techniques with reduced post-processing delay
WO2020094263A1 (en) 2018-11-05 2020-05-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs
CN113593586A (zh) * 2020-04-15 2021-11-02 华为技术有限公司 音频信号编码方法、解码方法、编码设备以及解码设备

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
US5848391A (en) * 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6921740B1 (en) * 1999-08-31 2005-07-26 Mitsubishi Paper Miils Ltd. Electron-receiving compound and thermal recording material
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US6636830B1 (en) * 2000-11-22 2003-10-21 Vialta Inc. System and method for noise reduction using bi-orthogonal modified discrete cosine transform
US20020128839A1 (en) * 2001-01-12 2002-09-12 Ulf Lindgren Speech bandwidth extension
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US7389226B2 (en) * 2002-10-29 2008-06-17 Ntt Docomo, Inc. Optimized windows and methods therefore for gradient-descent based window optimization for linear prediction analysis in the ITU-T G.723.1 speech coding standard
EP1595247B1 (en) * 2003-02-11 2006-09-13 Koninklijke Philips Electronics N.V. Audio coding
DE602004030594D1 (de) * 2003-10-07 2011-01-27 Panasonic Corp Verfahren zur entscheidung der zeitgrenze zur codierung der spektro-hülle und frequenzauflösung
JP2007508623A (ja) 2003-10-08 2007-04-05 ユニシス コーポレーション 複数のノードにわたってシステムリソースを割り当てて管理する仮想データセンタ
DE102004009954B4 (de) * 2004-03-01 2005-12-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
JP2007304258A (ja) * 2006-05-10 2007-11-22 Matsushita Electric Ind Co Ltd オーディオ信号符号化およびその復号化装置、方法ならびにプログラム
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies

Also Published As

Publication number Publication date
EP2273493B1 (en) 2012-12-19
KR101425157B1 (ko) 2014-08-01
RU2012102411A (ru) 2013-08-20
CA2856587C (en) 2016-09-13
CA2766573C (en) 2015-06-23
CN102473414B (zh) 2013-11-06
US20120158409A1 (en) 2012-06-21
KR20120031957A (ko) 2012-04-04
MX2011013610A (es) 2012-03-26
WO2011000780A1 (en) 2011-01-06
US8606586B2 (en) 2013-12-10
CA2766573A1 (en) 2011-01-06
EP2449554B1 (en) 2015-03-25
BRPI1010165B1 (pt) 2021-01-05
CN102473414A (zh) 2012-05-23
JP2012531632A (ja) 2012-12-10
PL2273493T3 (pl) 2013-07-31
HK1153035A1 (en) 2012-03-16
ES2534944T3 (es) 2015-04-30
AU2010268160A1 (en) 2012-02-02
BRPI1010165A2 (pt) 2016-03-29
ES2400661T3 (es) 2013-04-11
PL2449554T3 (pl) 2015-08-31
AU2010268160B2 (en) 2014-03-06
HK1170331A1 (en) 2013-02-22
RU2563164C2 (ru) 2015-09-20
CA2856587A1 (en) 2011-01-06
EP2449554A1 (en) 2012-05-09
EP2273493A1 (en) 2011-01-12

Similar Documents

Publication Publication Date Title
JP5329714B2 (ja) 帯域拡張符号化装置、帯域拡張復号化装置及び位相ボコーダ
US10522168B2 (en) Audio signal synthesizer and audio signal encoder
JP5227459B2 (ja) 合成オーディオ信号を生成する装置及び方法並びにオーディオ信号を符号化する装置及び方法
JP6229957B2 (ja) 音声信号を再生するための装置および方法、符号化音声信号を生成するための装置および方法、コンピュータプログラム、および符号化音声信号
US9997162B2 (en) Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
AU2014201331B2 (en) Bandwidth extension encoder, bandwidth extension decoder and phase vocoder

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130219

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130516

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130523

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130528

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130702

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130724

R150 Certificate of patent or registration of utility model

Ref document number: 5329714

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250