JP2011527447A - オーディオ信号合成器及びオーディオ信号符号器 - Google Patents

オーディオ信号合成器及びオーディオ信号符号器 Download PDF

Info

Publication number
JP2011527447A
JP2011527447A JP2011516984A JP2011516984A JP2011527447A JP 2011527447 A JP2011527447 A JP 2011527447A JP 2011516984 A JP2011516984 A JP 2011516984A JP 2011516984 A JP2011516984 A JP 2011516984A JP 2011527447 A JP2011527447 A JP 2011527447A
Authority
JP
Japan
Prior art keywords
signal
audio signal
frequency band
raw
spectral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011516984A
Other languages
English (en)
Other versions
JP5244971B2 (ja
Inventor
フレデリック ナーゲル
サーシャ デッシュ
ニコラス レッテルバッハ
マックス ノイエンドルフ
ベルンハルト グリル
ウルリッヒ クレーマー
ステファン ヴァプニック
Original Assignee
フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=41120013&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2011527447(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン filed Critical フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Publication of JP2011527447A publication Critical patent/JP2011527447A/ja
Application granted granted Critical
Publication of JP5244971B2 publication Critical patent/JP5244971B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

第1の周波数帯域とこの第1の周波数帯域から複製された第2の周波数帯域とを有する合成オーディオ信号を生成するオーディオ信号合成器は、パッチ生成器とスペクトル変換器と生信号処理器と結合器とを備える。パッチ生成器は少なくとも2つの異なるパッチングアルゴリズムを実行し、第1の周波数帯域の信号成分を有するオーディオ信号を使用して第2の周波数帯域の信号成分を有する生信号を生成する。パッチ生成器は第1の時間部分のための制御情報に応じて1つのパッチングアルゴリズムを選択し、第2の時間部分のための制御情報に応じて他の1つのパッチングアルゴリズムを選択し、第1及び第2の時間部分のための生信号を取得する。スペクトル変換器は生信号を生信号スペクトル表示へと変換し、生信号処理器はスペクトル帯域複製パラメータに応じて生信号スペクトル表示を処理して調整済の生信号スペクトル表示を取得する。結合器は第1の帯域の信号成分を有するオーディオ信号又はこのオーディオ信号から導出された信号と、調整済の生信号スペクトル表示又はこの調整済の生信号スペクトル表示から導出されたさらなる信号とを結合して合成オーディオ信号を取得する。
【選択図】図1

Description

本発明は、合成オーディオ信号を生成するためのオーディオ信号合成器と、オーディオ信号符号器と、符号化されたオーディオ信号を含むデータストリームとに関する。
自然オーディオ符号化とスピーチ符号化とは、オーディオ信号の符号化における2つの大きな分類である。自然オーディオ符号器は音楽や中程度ビットレートを用いる任意の信号のために一般的に使用され、通常は幅広いオーディオ帯域を提供する。スピーチ符号器は、基本的にスピーチの再生に限定されており、非常に低いビットレートで使用することができる。幅広い帯域のスピーチは、幅狭な帯域のスピーチと比較して、大きな主観的品質向上をもたらす。帯域を増大させることで、スピーチの自然さを向上させるだけでなく、発話者の認識や了解度をも向上させる。従って、幅広い帯域のスピーチ符号化は、次世代電話システムにおける重要な課題である。さらに、マルチメディア分野の急速な進歩によって、音楽や他の非スピーチ信号を、電話システムを介して高品質で伝送することや、ラジオ/テレビ又は他の放送システムのために記憶したり伝送することは望ましい特徴である。
ビットレートを劇的に削減するために、分離帯域(split-band)知覚的オーディオ符号化を使用するソース符号化を実行することも可能である。このような自然オーディオ符号化は、信号内にある知覚的に無意味な部分や統計的な冗長性を利用するものである。もし、このような不要物の利用だけでは所定のビットレート制限に対処できない場合には、サンプリングレートが削減される。さらに、構成レベルの数を減少させることも一般的であるが、これは時には可聴量子化歪を引き起こす可能性がある。また、ジョイントステレオ符号化又は2つ以上のチャネルのパラメトリック符号化を通じてステレオフィールドを低下させることも一般的な手法である。しかし、このような手法を過剰に使用すると、煩わしい知覚的品質低下をもたらしてしまう。符号化性能を向上させるために、スペクトル帯域複製(SBR)のような帯域拡張方法が、HFR(高周波再構築)ベースの符号化において高周波信号を生成するための効率の良い方法として使用されている。
高周波信号を複製する過程において、例えば所定の変換が低周波信号に対して適用され、変換された信号が高周波信号として挿入されても良い。このような過程はパッチングとして知られ、様々な変換が使用されても良い。MPEG4オーディオ標準は、ただ1つのパッチングアルゴリズムを全てのオーディオ信号のために使用する。そのため、様々な信号に対するパッチングや符号化スキームを適用する上で柔軟性の欠如をもたらしている。
一方で、MPEG4標準は、再構築される高周波信号に対し多数の重要なSBRパラメータを適用するという精巧な処理も提供している。これらの重要なSBRパラメータとは、スペクトル包絡のデータ、再構築されたスペクトル部分に追加されるべきノイズフロアのデータ、再構築された高周波部分の調性をオリジナル高周波部分の調性へと適応させるための逆フィルタリングツールに関する情報、消失したハーモニクスのデータのような追加的なスペクトル帯域複製処理データなどである。フィルタバンクドメイン内における連続的な帯域通過信号のパッチングにより提供された複製スペクトルに対し、このように精巧に作成された処理を施すことで、高品質を提供できることが証明されており、さらに、処理能力や記憶能力や電力条件に関し、合理的な資源で構成できることが証明されている。
しかし他方、パッチングが実行されるフィルタバンクと、パッチング済の信号に上述の処理が施されるフィルタバンクとが同じであるため、パッチング操作と、そのパッチング操作の結果に対する上述の処理との間に強い関連性が生じてしまう。そのため、このような組み合わせを持つ手法においては、異なるパッチングアルゴリズムを適用することが問題となる。
特許文献1は、スペクトル包絡調整と組み合わせた、スペクトル帯域複製で使用される転移方法を開示している。
特許文献2は、信号はパルストレイン状か又は非パルストレイン状かのいずれかに分類することができる点を教示し、この分類に基づく適応型で切り替えられる転移手段を提案している。この切替型転移手段は、2つのパッチングアルゴリズムを並行して実行し、混合ユニットが両方のパッチされた信号を(パルストレインか非パルストレインかの)分類に依存して結合する。転移手段間の実際の切替又は混合は、包絡調整フィルタバンクの中で、包絡と制御データに応じて実行される。パルストレイン状の信号に対しては、基本帯域信号がフィルタバンクドメインへと変換され、周波数換算操作が実行され、その周波数換算操作の結果に対し、包絡調整が実行される。この手法は、パッチング処理とさらなる処理との結合である。非パルストレイン状の信号に対しては、周波数ドメインの転移手段(FD転移器)が設けられ、この周波数ドメインの転移手段の結果は、フィルタバンクドメインへと変換され、ここで包絡調整が実行される。このような構成及びその柔軟性を考慮するとき、一方ではパッチン処理とさらなる処理との結合を持ち、他方では、包絡調整が施されるフィルタバンクとは別に設けられた周波数ドメイン転移手段を持つ手法であるため、柔軟性や構成の実現性の点で問題がある。
WO98/57436号公報 WO02/052545号公報
本発明の目的は、改良されたオーディオ品質を提供し、かつ効率的な構成を可能にするオーディオ信号合成器を提供することである。
前記目的は、請求項1に係るオーディオ信号合成器、請求項9に係るオーディオ信号符号器、請求項13に係る合成オーディオ信号の生成方法又は請求項14に係るデータストリームの生成方法によって達成できる。
本発明は、パッチング操作を一方とし、そのパッチング操作の出力を処理する操作を他方とする場合に、2つの操作が独立したドメインで完全に実行されるべきであるという知見に基づいている。この独立したドメインでの操作により、基礎となるパッチングアルゴリズムとは無関係に、一方ではパッチ生成器内において異なるパッチングアルゴリズムを最適化し、他方では同一の包絡調整を常に使用するという柔軟性をもたらす。つまり、包絡調整が行なわれるスペクトルドメイン以外でいずれかのパッチング済信号を生成することで、後続のSBRのさらなる処理からは完全に独立して、異なる信号部分に対して異なるパッチングアルゴリズムを柔軟に適用できるようになる。また、設計者は、包絡調整に起因するパッチングアルゴリズムの特性を考慮する必要がなく、或いは、所定の包絡調整のためのパッチングアルゴリズムの特性を考慮する必要がない。代わりに、スペクトル帯域複製の異なる要素、即ち、パッチング操作を一方とし、そのパッチング操作の結果のさらなる処理を他方とする操作は、互いに独立して実行することができる。スペクトル帯域複製の全般において、パッチングアルゴリズムが個別に実行され、その結果、パッチング操作とその後のSBR操作とを互いに独立して最適化することができる。つまり、いかなるパッチングも実行されないスペクトルドメインにおいて、パッチング結果のさらなる処理を実行するパラメータを全く変更する必要なく、次のパッチングアルゴリズムを単純に選択できるという柔軟性を持つ。
本発明は品質の向上を提供する。なぜなら、本発明によれば、基本帯域信号の各信号部分は、各信号部分毎にそれぞれ最適なパッチングアルゴリズムを用いてパッチングされるように、信号の各部分に対して異なるパッチングアルゴリズムを容易に適用できるからである。さらに、フィルタバンクで作動し、既存のMPEG−4HE−AACなど多くのアプリケーションで既に存在する簡素で効率的且つ高品質な包絡調整ツールも、本発明で活用することができる。パッチ結果のさらなる処理を実行するフィルタバンクドメインでは、パッチングアルゴリズムが全く使用されないようにすることで、さらなる処理からパッチングアルゴリズムを分離することができる。よって、使用可能なあらゆるパッチングアルゴリズムに対して、パッチ結果の既存のさらなる処理方法を適用できる。任意ではあるが、パッチングは他のドメインと同様にフィルタバンクドメインでも実行されても良い。
さらに、上述の特徴はスケーラビィティを提供する。なぜなら、低レベルのアプリケーションに対しては、少ない資源しか必要としないパッチングアルゴリズムを使用することができ、他方、高レベルのアプリケーションに対しては、より多くの資源を必要とするパッチングアルゴリズムを使用してより良好なオーディオ品質をもたらすことができるからである。代替的に、パッチングアルゴリズムを同一に維持することも可能であり、他方、パッチング結果の処理の複雑さは必要性に応じて適応させることができる。例えば、低レベルのアプリケーションに対しては、スペクトル包絡調整のための低減された周波数分解能を適用する一方で、高レベルのアプリケーションに対しては、より高い品質を提供できる細かい周波数分解能を適用できる。しかし、細かい分解能は、メモリ、処理手段、電力消費の点でより大きな資源を必要とする点も、特にモバイル機器において考慮すべきである。パッチングツールはスペクトル包絡調整ツールに依存しておらず、逆に、スペクトル包絡調整ツールもパッチングツール依存にしていないため、このことは対応する他のツールを巻き込むことなく実行できる。なぜなら、パッチの生成とパッチされた生データを例えばフィルタバンクによってスペクトル表示へ変換する処理とを分離することは、最も好ましい特徴だからである。
本発明の第1の実施形態によれば、オーディオ信号合成器は、第1の周波数帯域とこの第1の周波数帯域から導出された第2の合成周波数帯域とを有する合成オーディオ信号を生成し、このオーディオ信号合成器は、パッチ生成器とスペクトル変換器と生信号処理器と結合器とを備える。パッチ生成器は少なくとも2つの異なるパッチングアルゴリズムを実行し、各パッチングアルゴリズムは、第1の周波数帯域の信号成分を有するオーディオ信号を使用して、第2の合成周波数帯域の信号成分を有する生信号を生成する。パッチ生成器は、第1の時間部分のための制御情報に応じて少なくとも2つの異なるパッチングアルゴリズムのうちの1つを選択し、第1の時間部分とは異なる第2の時間部分のための制御情報に応じて少なくとも2つの異なるパッチングアルゴリズムのうちの他の1つを選択し、第1と第2の時間部分のための生信号を取得する。前記スペクトル変換器は生信号を生信号スペクトル表示へと変換する。生信号処理器はスペクトルドメインのスペクトル帯域複製パラメータに応じて生信号スペクトル表示を処理して調整済の生信号スペクトル表示を取得する。結合器は、第1の帯域の信号成分を有するオーディオ信号又はこのオーディオ信号から導出された信号と、調整済の生信号スペクトル表示又はこの調整済の生信号スペクトル表示から導出されたさらなる信号とを結合して、合成オーディオ信号を取得する。
他の実施形態においては、オーディオ信号合成器は、少なくとも2つパッチングアルゴリズムが互いに異なるように、詳しくは、第1の周波数帯域の周波数におけるオーディオ信号の信号成分が第2の周波数帯域の目標周波数へとパッチングされ、その目標周波数が両方のパッチングアルゴリズムに関して異なるように構成される。パッチ生成器はさらに、両方のパッチングアルゴリズムについて時間ドメインで作動するように構成される。
本発明の他の実施形態によれば、オーディオ信号符号器は、オーディオ信号からこのオーディオ信号の第1の周波数帯域の成分と制御情報とスペクトル帯域複製パラメータとを含むデータストリームを生成する。オーディオ信号符号器は、周波数選択的フィルタと生成器と制御情報生成器とを備える。周波数選択的フィルタはオーディオ信号の第1の周波数帯域の成分を生成する。生成器は、オーディオ信号の第2の周波数帯域の成分からスペクトル帯域複製パラメータを生成する。制御情報生成器は制御情報を生成し、この制御情報は第1又は第2の異なるパッチングアルゴリズムから好適なパッチングアルゴリズムを識別する。各パッチングアルゴリズムは、オーディオ信号の第1の周波数帯域の成分を使用して、第2の複製された周波数帯域の信号成分を有する生信号を生成する。
本発明のさらに他の実施形態によれば、コンピュータに接続された伝送ラインを介して伝送されるオーディオ信号ビットストリームは、第1の周波数帯域の符号化されたオーディオ信号と制御信号とスペクトル帯域複製パラメータとを有する。
従って、本発明は、スペクトル帯域複製において異なるパッチングアルゴリズムの間を切り替える方法に関し、使用されるパッチングアルゴリズムは、符号器側においては符号器内で行われる決定に依存し、復号器側においては、ビットストリーム内で伝送された情報に依存する。スペクトル帯域複製(SBR)を使用することにより、高周波数成分は、例えばQMF−フィルタバンク(QMF=直交ミラーフィルタ)における低周波数信号成分を高周波数帯域へとコピーする方法などで生成されても良い。このコピー操作はパッチングとしても知られ、本発明の実施例によれば、このパッチングは時間ドメインでも実行可能な方法で代替されるか又は補足されても良い。代替的な方法の例には以下のようなものがある。
(1)(例えばスペクトルのミラーリングによる)アップサンプリング
(2)位相ボコーダ
(3)非線形の歪み付与
(4)QMF帯域の順序の交替によるQMFドメインのスペクトルのミラーリング
(5)(特にスピーチのために駆動される)モデル
(6)変調
上述の代替的なパッチングアルゴリズムもまた、スペクトル帯域複製パラメータを取得するために、符号器内において実行されても良い。これらのパラメータは、ノイズ充填、逆フィルタリング、消失ハーモニクスのような例えばSBRツールによって使用される。本発明の実施例によれば、パッチ生成器内のパッチングアルゴリズムは、スペクトル帯域複製ツールを使用している間でも、切り替えることができる。
パッチングアルゴリズムの具体的な選択は、適用されたオーディオ信号に依存する。例えば、位相ボコーダはスピーチ信号の特性を強制的に変化させる。よって、位相ボコーダは、例えばスピーチ又はスピーチのような信号に対しては適切なパッチングアルゴリズムを提供できない。このように、パッチ生成器は、オーディオ信号のタイプに依存して、高周波帯域のためのパッチを生成する様々な可能性の中から1つのパッチングアルゴリズムを選択する。例えば、パッチ生成器は、従来のSBRツール(QMF帯域のコピー)と位相ボコーダ又は他のパッチングアルゴリズムの間で切替を実行しても良い。
(例えばMPEG−4構成のような)従来のSBR構成とは対照的に、本発明の実施例では、高周波信号を生成するためのパッチ生成器を使用する。パッチ生成器は周波数ドメインだけに限らず、時間ドメインで作動しても良く、例えばミラーリング、アップサンプリング、位相ボコーダ及び/又は非線形歪付与を実行しても良い。スペクトル帯域複製が周波数ドメイン又は時間ドメインのどちらで行われるかは、後段で説明するように具体的な信号に依存している(即ち信号適応型である)。
スペクトル帯域複製では、多くの場合、オーディオ信号のコア周波数帯域だけを伝送すれば十分であり、高周波帯域の信号成分は復号器において生成すれば十分である、という事実に基づいている。その結果として得られるオーディオ信号は、高い知覚的品質を維持できるであろう。なぜなら、例えばスピーチ信号でも音楽信号でも、高周波成分はコア周波数帯域の低周波成分に対し、大抵は相関関係を持っているからである。このように、消失した高周波成分を生成する適応型のパッチングアルゴリズムを使用することで、高い知覚的品質のオーディオ信号を取得することができる。同時に、高周波帯域をパラメータ主導で生成することは、オーディオ信号の符号化において重要なビットレート削減をもたらす。なぜなら、コア周波帯域のオーディオ信号だけを圧縮符号化して復号器へと伝送するだけで良いからである。残りの周波数成分については、制御情報とスペクトル帯域複製パラメータだけを伝送すれば良い。これらの情報は、復号器におけるオリジナル高周波帯域信号の推定を実行する処理を制御する。厳密に言えば、この処理は次の3つの構成要素を含む。(i)パラメトリックな高周波(HF)帯域推定(SBRパラメータの計算)、(ii)生パッチ生成(実際のパッチング)、(iii)さらなる処理への準備(例えばノイズフロア調整など)。
コア周波数帯域は所謂クロスオーバー周波数により定義されても良い。このクロスオーバー周波数とは、周波数帯域内においてオーディオ信号の符号化が実行される上限までの範囲の閾値を定義するものである。コア符号器はクロスオーバー周波数により制限されるコア周波数帯域のオーディオ信号を符号化する。クロスオーバー周波数を始点として、信号成分はスペクトル帯域複製により生成される。スペクトル帯域複製の従来の方法を使用する際に、コア符号器のクロスオーバー周波数において、いくつかの信号が不要なアーチファクトを含むことがしばしば起こる。
本発明の実施例を使用することで、これらのアーチファクトを防止するか、少なくともこれらのアーチファクトが知覚的な影響を及ぼさないような方法で修正する、パッチングアルゴリズムを決定することができる。例えば、パッチングアルゴリズムとして時間ドメインのミラーリングを使用することで、AMR−WB+(拡張適応型マルチレート・広帯域)における帯域拡張(BWE)と同様にスペクトル帯域複製を実行できる。加えて、信号に依存してパッチングアルゴリズムを変化させることは、スピーチ及び音楽に対し、例えば異なる帯域拡張方法を使用できるという可能性をもたらす。また、音楽かスピーチか判別できない信号(即ち混合信号)に対しては、パッチングアルゴリズムを短時間の期間単位で変化させることができる。例えば、与えられたいかなる時間的期間に対しても、このパッチングのために好適なパッチングアルゴリズムを使用することができる。このような好適なパッチングアルゴリズムは、例えば入力データの各処理済ブロックについて、パッチングの結果とオリジナルオーディオ信号とを比較するような、符号器によって決定されても良い。これにより、オーディオ信号合成器によって生成されるオーディオ信号の知覚的品質を有意に向上させることができる。
本発明のさらなる長所は、パッチ生成器と標準的なSBRツールを含んでも良い生信号処理器とを分離することから生まれる。この2つを分離することで、逆フィルタリング、ノイズフロアや消失ハーモニクスの追加、又は他の機能を持っても良い標準的なSBRツールを使用することができる。このようにパッチングを柔軟に調整できる一方で、標準的なSBRツールも使用可能となる。加えて、標準的なSBRツールは周波数ドメインで使用されることから、パッチ生成器と標準的なSBRツールとの分離は、周波数ドメイン又は時間ドメインのいずれにおいてもパッチング処理を可能にする。
以下に、実施例に基づいて本発明を説明する。本発明の特徴がより理解しやすくなるように、添付の図面を参照しながら以下に詳細に説明する。
本発明の実施例に従うオーディオ信号処理のブロック図である。 本発明の実施例に従うパッチ生成器のブロック図である。 時間ドメインで作動する結合器のブロック図である。 パッチングアルゴリズムの様々な例の概略図である。 位相ボコーダによるパッチングの概略図である。 コピーによるパッチングの概略図である。 符号化されたオーディオストリームを処理してPCMサンプルを出力する実施例を示すブロック図である。 符号化されたオーディオストリームを処理してPCMサンプルを出力する他の実施例を示すブロック図である。 符号化されたオーディオストリームを処理してPCMサンプルを出力するさらに他の実施例を示すブロック図である。 符号化されたオーディオストリームを処理してPCMサンプルを出力するさらに別の実施例を示すブロック図である。 本発明の他の実施例に係るオーディオ符号器を示すブロック図である。 本発明のさらに他の実施例に係るオーディオ符号器を示すブロック図である。 本発明のさらに別の実施例に係るオーディオ符号器を示すブロック図である。
以下に説明する実施の形態は、例えばオーディオ復号器と一緒に使用される、スペクトル帯域複製のための本発明の原理を単に例示的に示したにすぎない。本明細書に記載した構成及び詳細について、修正及び変更が可能であることは、当業者にとって明らかである。従って、本発明は、本明細書に実施形態の説明及び解説の目的で提示した具体的詳細によって限定されるものではない。
図1は、第1の周波数帯域とこの第1の周波数帯域から複製された第2の周波数帯域とを備えた合成オーディオ信号145を生成するためのオーディオ信号合成器を示す。このオーディオ信号合成器は、少なくとも2つの異なるパッチングアルゴリズムを実行するパッチ生成器110を備え、各パッチングアルゴリズムは、第1の周波数帯域内の信号成分を有するオーディオ信号105を使用して、第2の複製された周波数帯域内の信号成分を有する生信号115を生成する。パッチ生成器110は、第1の時間部分のための制御情報112に応じて前記少なくとも2つの異なるパッチングアルゴリズムのうちの1つを選択し、且つ、第1の時間部分とは異なる第2の時間部分のための制御情報112に応じて前記少なくとも2つの異なるパッチングアルゴリズムのうちの他の1つ選択し、第1及び第2の時間部分のための生信号115を取得する。このオーディオ信号合成器は、生信号115を第1サブバンドや第2サブバンド等の成分を有する生スペクトル表示125へと変換するスペクトル変換器120をさらに備える。オーディオ信号合成器は、生信号処理器130をさらに備え、スペクトルドメインのスペクトル帯域複製パラメータ132に応じて生スペクトル表示125を処理し、調整済の生信号スペクトル表示135を取得する。オーディオ信号合成器は結合器140をさらに備え、第1の周波数帯域の信号成分を有するオーディオ信号105又はこのオーディオ信号105から導出された信号と、調整済の生信号スペクトル表示135又はこの調整済の生信号スペクトル表示135から導出されたさらなる信号とを結合し、合成オーディオ信号145を取得する。
他の実施例においては、結合器140は、オーディオ信号105から導出された信号として、生信号スペクトル表示125を使用する。また、結合器140が使用するオーディオ信号から導出された信号は、分析フィルタバンクのような時間/スペクトル変換器によって処理されたオーディオ信号、時間ドメイン或いはスペクトルドメインで作動するパッチ生成器により生成された低周波帯域信号、遅延されたオーディオ信号、又は結合されるべき信号が同じ基底サンプリングレートを持つようにアップサンプリング操作により処理されたオーディオ信号であっても良い。
さらに他の実施例においては、オーディオ信号合成器は、第1の周波数帯域201内の信号成分を有するオーディオ信号105の特性を分析して第1パッチングアルゴリズムか第2パッチングアルゴリズムかを識別するための制御情報112を提供する、分析器をさらに備えていても良い。
さらに他の実施例においては、前記分析器は、オーディオ信号105の中のある程度の声音を有する時間部分に対しては非ハーモニックなパッチングアルゴリズムを識別し、ある特定の時間部分に対してはハーモニックなパッチングアルゴリズムを識別しても良い。
さらに他の実施例においては、オーディオ信号105はメタデータと一緒にデータストリームの中へと符号化され、パッチ生成器110はこのデータストリームの中のメタデータから制御情報112を得ても良い。
さらに他の実施例においては、スペクトル変換器120が分析フィルタバンクを含み、又は少なくとも2つの異なるパッチングアルゴリズムが、位相ボコーダアルゴリズム、アップサンプリングパッチングアルゴリズム、非線形歪付与パッチングアルゴリズム又はコピーアルゴリズムを含んでも良い。
さらに他の実施例においては、生信号処理器130は、スペクトル帯域のエネルギー調整、スペクトル帯域における逆フィルタリング、スペクトル帯域へのノイズフロアの追加又はスペクトル帯域への消失ハーモニクスの追加を実行する。
図2はパッチ生成器110をより詳細に説明するためのブロック図である。パッチ生成器110は、制御情報112及びオーディオ信号105を受け取る制御器111と、パッチング手段113とを含む。制御器111は制御情報112に基づいてパッチングアルゴリズムを選択する。パッチ生成器110は、第1のアルゴリズム1を実行する第1パッチング手段113a、第2のアルゴリズム2を実行する第2パッチング手段113bなどを含む。一般的に、パッチ生成器110は、使用可能なパッチングアルゴリズムの数と同数のパッチング手段113を含む。例えば、パッチ生成器110は、2,3,4又はそれ以上の個数のパッチング手段113を含む。制御情報112に基づいて、制御器111がパッチング手段113の中の1つを選択した後で、制御器111はそのパッチング手段113の中の1つへとオーディオ信号105を出力し、この1つのパッチング手段113はパッチングアルゴリズムを実行して生信号115を出力する。生信号115は、複製された周波数帯域202,203内の信号成分を含む。
図3は結合器140をより詳細に説明するためのブロック図である。結合器140は、合成フィルタバンク141と遅延器143と加算器147とを備える。調整済の生信号135は合成フィルタバンク141へと入力され、ここでは、(例えばスペクトル表示の)調整済生信号135から時間ドメインの調整済生信号135t(時間ドメイン生信号)を生成する。基本帯域オーディオ信号105は遅延器143へと入力され、この遅延器は、基本帯域信号105を所定時間分だけ遅延させ、遅延された基本帯域信号105dを出力する。遅延された基本帯域信号105dと時間ドメインの調整済生信号135tとは加算器147により加算され、合成オーディオ信号145が結合器140の出力として出力される。遅延器143の遅延は、時間ドメインの調整済生信号135tが遅延された基本帯域信号105dの同一の時間に対応(同期)するように、オーディオ信号合成器の処理アルゴリズムに依存している。
図4の(A)〜(D)はパッチ生成器110でパッチング手段113により使用される様々なパッチングアルゴリズムを示す。上述したように、パッチングアルゴリズムは、複製された周波数帯域の中にパッチされた信号を生成する。図4に示す実施例においては、第1の周波数帯域201はクロスオーバー周波数fmaxまで延び、このfmaxから第2の周波数帯域202(又は第2の複製された周波数帯域)が始まり、クロスオーバー周波数の2倍の周波数2*maxまで延びる。この周波数2*maxから、第3の周波数帯域203(又は第3の複製された周波数帯域)が開始する。第1の周波数帯域201は上述のコア周波数帯域を含んでいても良い。
図4は、4つのパッチングアルゴリズムを例として示す。図4の(A)の第1パッチングアルゴリズムはミラーリング又はアップサンプリングを含み、図4の(B)の第2パッチングアルゴリズムはコピー及び変調の操作を含み、図4の(C)の第3パッチングアルゴリズムは位相ボコーダを含み、図4の(D)の第4パッチングアルゴリズムは歪付与を含む。
図4の(A)に示すミラーリングは、第1の周波数帯域201をクロスオーバー周波数fmaxでミラーリングすることで、第2の周波数帯域202のパッチされた信号を得る。第3の周波数帯域203のパッチされた信号は、第2の周波数帯域202の信号をミラーリングすることで得られる。第2の周波数帯域202の信号は既にミラーリングされた信号であるから、第3の周波数帯域203の信号は、第1の周波数帯域201のオーディオ信号105を第3の周波数帯域203へと単純にシフトすることでも得られる。
図4の(B)に示す第2パッチングアルゴリズムは、コピー(又は変調)の操作を実行する。この実施例では、第2の周波数帯域202の信号は第1の周波数帯域201の信号を第2の周波数帯域202へとシフト(コピー)することで得られる。同様に、第3の周波数帯域203の信号は第1の周波数帯域201の信号を第3の周波数帯域203へとシフトすることで得られる。
図4の(C)は位相ボコーダをパッチングアルゴリズムとして使用する実施例を示す。パッチされた信号は以下のようなステップ、即ち、第1ステップでは最大周波数の2倍(2*max)までの信号成分を生成し、第2ステップでは最大周波数の3倍(3*max)までの信号成分を生成することなどにより生成される。位相ボコーダはサンプルの周波数に係数n(n=2,3,4,・・・)を乗算し、コア周波数帯域(第1の周波数帯域201)のn倍の周波数領域に渡るサンプル値の拡張をもたらす。
図4の(D)は、(例えば信号を二乗するなどによる)歪付与を用いたパッチングアルゴリズムを示す。歪付与は色々な方法で得られる。1つの単純な方法は、信号レベルの二乗により高周波成分を生成する方法である。他の歪付与方法は、(例えば所定の閾値を超える信号の切落しによる)クリッピングによるものである。いずれの方法でも、高周波成分を生成できる。基本的に、従来より知られたいかなる歪付与方法でも使用することができる。
図5aは、位相ボコーダのパッチングアルゴリズムをより詳細に示す。ここでも、第1の周波数帯域201は最大周波数(クロスオーバー周波数)fmaxまで延び、このfmaxから第2の周波数帯域202が始まり、例えば最大周波数の2倍の周波数2*maxまで延びる。この第2の周波数帯域202の後には、第3の周波数帯域203が開始し、例えば最大周波数の3倍の周波数3*maxまで延びる。
簡単のため、図5aはスペクトル(周波数fの関数としてのレベルP)をオーディオ信号105のための8本の周波数ライン105a,105b,・・・,105hを用いて示す。位相ボコーダはこれら8本の周波数ライン105a,・・・,105hを矢印で示すようにシフトすることで、新たな信号を生成する。このシフト操作は、上述した乗算に対応する。詳細には、1番目のライン105aは2番目のライン105bへとシフトされ、2番目のラインは4番目のラインへとシフトされ、最後は8番目のライン105hが16番目のライン(第2周波数ドメイン202の最終ライン)へとシフトされる。この方法は2を用いた乗算に対応する。最大周波数の3倍の周波数3*maxまでラインを生成するために、ラインの全ての周波数が3で乗算されても良い。即ち、1番目のライン105aは3番目のライン105cへとシフトされ、2番目のライン105bは6番目のラインへとシフトされ、最後は8番目のライン105hが24番目のライン(第3周波数ドメイン203の最終ライン)へとシフトされる。この位相ボコーダによって、ラインはもはや等間隔ではなくなり、高周波数においては拡張していることが明らかである。
図5bはコピーによるパッチングアルゴリズムを詳細に示す。周波数fの関数としてのレベルPを再び使用して示す。ここでは、第1の周波数帯域201の中に8本のラインが有り、これらが第2の周波数帯域202へとコピーされ、さらに第3の周波数帯域203へとコピーされる。このコピー操作によると、第1の周波数帯域201の中の1番目のライン105aは、第2の周波数帯域202の中でも第3の周波数帯域203の中でも1番目のラインとなる。つまり、各複製された周波数帯域202,203の1番目のラインは、第1の周波数帯域201の中の1番目のラインからコピーされる。他のラインにも同様の方法が適用され、結果的に、帯域全体がコピーされる。
図4や図5に示すような様々なパッチングアルゴリズムが、時間ドメイン又は周波数ドメインで、様々な方法で適用されても良い。それぞれが異なる長所と短所を含むが、それら長所と短所は様々なアプリケーションについて活用することができる。
例えば、周波数ドメインでのミラーリングが図4の(A)に示されるが、時間ドメインでは、このミラーリングは整数の係数によってサンプリングレートを増大させることで実行できる。つまり、存在しているサンプルの各ペアの間に追加的なサンプルを挿入することで実行できる。これらの追加的なサンプルはオーディオ信号から得られるものではなく、システムから導入され、例えばゼロに近いか等しい値を含む。最も簡素な場合として、もし存在する2つのサンプルの間にただ1つの追加的なサンプルが導入される場合には、サンプルの個数が2倍になり、よってサンプリングレートも2倍になることを意味する。もし、2つ以上の追加的なサンプルが(例えば等間隔に)導入される場合には、その数に従ってサンプリングレートも増大し、よって周波数スペクトルもまた増大する。一般的に、存在する各2つのサンプルの間の追加的なサンプルの個数はいずれの数n(n=2,3,4,・・・)でも良く、サンプリングレートはn+1を係数として増大する。追加的なサンプルの挿入により、与えられたサンプリングレートにおける最高の表示可能な周波数を特定する、ナイキスト周波数における周波数スペクトルのミラーリングがもたらされる。周波数ドメインの基本帯域スペクトルの(第1の周波数帯域のスペクトル)は、このような方法で次の周波数帯域へとミラーリングされる。任意ではあるが、このミラーリングは、使用可能な低域通過フィルタリング及び/又はスペクトル成形と組み合わされても良い。
上述のミラーリングのパッチングアルゴリズムの長所は、以下のようにまとめることができる。即ち、この方法を使用することで、周波数ドメインの同様の方法を使用する場合よりも、信号の時間構造が良好に保存される。さらに、スペクトルミラーリングによって、ナイキスト周波数に近い周波数ラインがラインへとマッピングされ、このラインはまたナイキスト周波数に近くなる。この点は有利である。なぜなら、ミラーリングの後では、ミラーリング周波数(即ちオリジナルオーディオ信号105のナイキスト周波数)の周辺のスペクトル領域が、多くの点、例えばスペクトル平面度、調性特性、周波数ポイントの累積又は明瞭性などの特性において類似しているからである。この方法によって、スペクトルは次の周波数帯域へと、より滑らかな方法、例えばコピー操作を用いた場合よりも滑らかな方法で継続される。コピー操作では、オリジナルスペクトルにおいては全く異なる領域から生まれた周波数領域が互いに隣接する結果となり、境界部において非常に異なる特性を表すことになる。コピー操作では、1番目のサンプルは複製された帯域でも1番目のサンプルとなるが、ミラーリングでは、最後のサンプルが複製された帯域の1番目のサンプルとなる。このミラーリングによる滑らかなスペクトルの継続により、他のパッチングアルゴリズムによって生成される再現スペクトルの非連続的な特性に起因するような知覚的アーチファクトを減少させることができる。
最後に、例えば低周波数領域(第1の周波数帯域201)において多数のハーモニクスを持つ信号がある。これらのハーモニクスはスペクトルの局部的なピークとして現れる。しかし、スペクトルの高域部分においてはハーモニクスの数は非常に少ないことがある。換言すれば、スペクトルの高域部分におけるハーモニクスの数が低域部分よりも少ないことがある。この場合、もしスペクトルのコピーを単純に使用すれば、複製された信号の中で、多数のハーモニクスを持つスペクトルの低域部分が、オリジナル信号においてはハーモニックの数が非常に少なかった高域の周波数領域の中へとそのままコピーされることになってしまう。その結果、オリジナル信号の高周波帯域と複製された信号の高周波帯域とは、ハーモニクスの数に関して非常に異なってしまい、このような操作は好ましいとは言えず、回避すべきである。
ミラーリングのパッチングアルゴリズムは周波数ドメイン(例えばQMF領域)でも使用できる。その場合、周波数帯域の前後が逆転し、後ろから前へという逆の順序になる。加えて、サブバンドサンプルについて、各サンプルの虚数部分がその正負符号を変えるように複素共役値を形成させる必要がある。その結果、サブバンド内におけるスペクトルの逆転が発生する。
このパッチングアルゴリズムはパッチの境界に関して高い柔軟性を備える。なぜなら、スペクトルのミラーリングは必ずしもナイキスト周波数において実行されるわけではなく、いかなるサブバンドの境界においても実行されうるからである。
しかし、隣接するQMF帯域の間のパッチの端部におけるエイリアシングは消去されない可能性があり、この点は許容されることも許容されないこともあり得る。
拡張させること、つまり位相ボコーダを使用(図4の(C)又は図5aを参照)することで、周波数構造はハーモニックの点で正確に高周波数領域へと拡張される。なぜなら、1つ又は複数の位相ボコーダが実行する規則正しい乗算によって、基本帯域201がスペクトル的に拡張されるからであり、また、基本帯域201のスペクトル成分が追加的に生成されたスペクトル成分と結合されるからである。
このような位相ボコーダを用いたパッチングアルゴリズムは、基本帯域201が帯域において厳しく制限されている場合、例えば、非常に低いビットレートを使用するよう制限されているような場合に好都合である。つまり、高周波数成分の再構築が比較的低い周波数から始まり、この場合の典型的なクロスオーバー周波数は約5kHzよりも低い(又は4kHzよりも低いこともある)。このような領域では、人間の耳は、不正確に配置されたハーモニクスによる不協和音に対して非常に敏感であり、「不自然」な音という印象を与える可能性もある。さらに、スペクトル的に近い間隔にある音同士(約30Hzから300Hzまでのスペクトル距離を持つ音)は粗い音として知覚される。基本帯域201の周波数構造のハーモニックな継続は、これらの不正確で不快な聴覚的印象を回避する。
コピー操作の第3パッチングアルゴリズム(図4c又は図5bを参照)において、スペクトル領域は、高周波数領域又は複製されるべき領域へとサブバンド単位でコピーされる。全てのパッチング方法にとって言えることであるが、コピー操作も、高周波数信号のスペクトル特性が多くの点で基本帯域信号の特性に類似するという観測の上に成り立っている。互いの偏差は非常に少ないとされる。加えて、人間の耳は典型的には高周波数(典型的には5kHz以上の周波数)においてはあまり敏感ではなく、特に精密でないスペクトルマッピングに関して敏感ではない。実際、この点がスペクトル帯域複製全般において鍵となる考え方である。コピー操作は特に、容易且つ高速で実行できるという長所を持つ。
コピー操作のパッチングアルゴリズムは、またパッチの境界部分について高い柔軟性を持つ。なぜなら、スペクトルのコピーはいかなるサブバンド境界でも実行できる可能性があるからである。
最後に、歪付与を用いたパッチングアルゴリズム(図4dを参照)は、クリッピング、制限法(limiting)、二乗法(squaring)などを用いたハーモニクスの生成を含む。例えば、(上述の位相ボコーダパッチングアルゴリズムを適用した後などのように)もし拡張された信号のスペクトル的な占有率が非常に薄い場合には、その拡張されたスペクトルは、望ましくない周波数の穴を回避するために、歪付与された信号による任意の追加的補足を受けることもできる。
図6a〜図6dは、オーディオ復号器の中に構成されたオーディオ信号合成器の様々な実施例を示す。
図6aの実施例では、符号化されたオーディオストリーム345がビットストリーム・ペイロード・デフォーマッタ350へと入力され、このデフォーマッタは一方では符号化済オーディオ信号355を、他方では追加的情報375を、分離して出力する。符号化済オーディオ信号355は、例えばAACコア復号器360へと入力され、この復号器は復号化されたオーディオ信号105を第1の周波数帯域201で生成する。オーディオ信号105は32帯域分析QMFバンク370へと入力され、このバンクは、例えば32個の周波数帯域を持ち、周波数ドメインのオーディオ信号10532を生成する。パッチ生成器110は高帯域信号だけを生信号として出力し、低帯域信号は出力しないことが望ましい。代替的に、もしブロック110内のパッチングアルゴリズムが低帯域をも生成する場合には、ブロック130aへの入力信号を高域通過フィルタリングすることが望ましい。
周波数ドメインのオーディオ信号10532はパッチ生成器110へと入力され、生成器110はこの実施例においてはパッチを周波数ドメイン(QMFドメイン)で生成する。結果として得られた生信号スペクトル表示125はSBRツール130aへと入力され、このツール130aは、例えばノイズフロアの生成、消失したハーモニクスの再構築、又は逆フィルタリングを実行する。
他方、追加的な情報375はビットストリーム・パーサ380へと入力され、このパーサは追加的な情報を分析して様々な情報385を取得し、それらの情報を例えばハフマン復号化及び逆量子化ユニット390へと入力し、ユニット390は、例えば制御情報112とスペクトル帯域複製パラメータ132とを抽出する。制御情報112はパッチ生成器へと入力され、スペクトル帯域複製パラメータ132はSBRツール130a及び包絡調整器130bへと入力される。包絡調整器130bは生成されたパッチの包絡を調整する。その結果、包絡調整器130bは調整済の生信号135を生成して合成QMFバンク140へと入力し、バンク140は調整済の生信号135と周波数ドメインのオーディオ信号10532とを結合する。合成QMFバンク140は例えば64の周波数帯域を含んでも良く、(調整済の生信号135と周波数ドメインのオーディオ信号10532とを結合することで)合成オーディオ信号145(例えばPCMサンプルの出力:PCM=パルスコード変調)を生成する。
さらに、図6aはSBRツール130aを示し、このツールは、パッチ生成器110から出力されたQMFスペクトルデータに使用されるべき公知のスペクトル帯域複製方法を実行しても良い。図6aで示すような周波数ドメインで使用されるパッチングアルゴリズムは、例えば周波数ドメイン内でのスペクトルデータの単純なミラーリング又はコピー操作を用いることもできる(図4の(A)と(B)を参照)。
本発明の実施例の全般的な構成は先行技術に開示された従来の復号器と類似してはいるが、しかし、本発明の実施例におけるパッチ生成器110は、従来のパッチ生成器とは異なり、オーディオ信号の知覚的な品質を向上させる上で適合した、異なるパッチングアルゴリズムを実行するよう構成されている。加えて、本発明の実施例では、図6aで示すような周波数ドメインのパッチングに限らず、時間ドメインのパッチングアルゴリズムも使用しても良い。
図6bは、パッチ生成器110が周波数ドメイン内でも時間ドメイン内でもパッチングアルゴリズムを使用できる、本発明の実施例を示す。図6bの復号器は、ビットストリーム・ペイロード・デフォーマッタ350とAAC復号器360とビットストリーム・パーサ380とハフマン復号化及び逆量子化ユニット390とを備える。この図6bの実施例でも、符号化されたオーディオストリーム345がビットストリーム・ペイロード・デフォーマッタ350へと入力され、このデフォーマッタは一方では符号化済オーディオ信号355を生成し、他方ではこのオーディオ信号から分離した追加的な情報375を出力する。この追加的情報は、その後ビットストリーム・パーサ380によって分析されて別の情報385が分離され、この情報385はハフマン復号化及び逆量子化ユニット390へと入力される。他方、符号化済オーディオ信号355はAACコア復号器360へと入力される。
ここで、この実施例では2つの場合に分けられる。即ち、パッチ生成器110が周波数ドメインで作動する場合(点線で示す信号ライン)と、時間ドメイン内で作動する場合(破線で示す信号ライン)とのいずれかである。
もしパッチ生成器110が時間ドメインで作動する場合には、AACコア復号器360の出力はパッチ生成器110へと入力され(オーディオ信号105の破線で示すライン)、この生成器の出力は分析フィルタバンク370へと送られる。分析フィルタバンク370の出力は生信号スペクトル表示125であり、この表示125は(生信号調整器130の一部である)SBRツール130aへと入力され、また合成QMFバンク140へも入力される。
他方、もしパッチングアルゴリズムが(図6aで示すように)周波数ドメインを使用する場合には、AACコア復号器360の出力は、オーディオ信号105の点線で示すラインを介して分析QMFバンク370へと入力され、このバンク370は次に周波数ドメインオーディオ信号10532を生成し、(点線のように)このオーディオ信号10532をパッチ生成器110と合成QMFバンク140とに送る。パッチ生成器110は、生信号表示125を生成し、この生信号表示をSBRツール130aへと伝送する。
このように、この実施例は、点線で示す第1の処理モード(周波数ドメインパッチング)又は破線で示す第2の処理モード(時間ドメインパッチング)のいずれかを実行するが、他の機能的構成要素の間の全ての実線部分は両方の処理モードにおいて使用される。
(破線で示す)時間ドメイン処理モードでは、パッチ生成器110からブロック370への出力が低周波帯域信号及び高周波周波帯域信号を備えるのが望ましい。この場合、パッチ生成器の出力信号は低周波帯域信号及び高周波帯域信号から成る広周波帯域の信号である。ブロック370が出力する低周波帯域信号はブロック140へと入力され、高周波帯域信号はブロック130aへと入力される。帯域分割は分析フィルタバンク370の中で実行されても良いが、別の構成要素により実行されても良い。さらに、結合器140の中で、パッチ生成器110の出力信号の低帯域部分が全く使用されずにオリジナルの低帯域部分が使用されるように、AAC復号器360の出力信号がブロック370へと直接的に入力されても良い。
(点線で示す)周波数ドメイン処理モードでは、パッチ生成器110は高帯域信号だけを出力し、オリジナルの低帯域信号がAACコア復号器からブロック370へと直接的に入力され、合成バンク140へと送られることが望ましい。代替的に、パッチ生成110は、全帯域の出力信号を生成し、且つ低帯域信号をブロック140へと送っても良い。
ハフマン復号化及び逆量子化ユニット390はスペクトル帯域複製パラメータ132と制御情報112とを生成し、制御情報112はパッチ生成器110へと入力される。さらに、スペクトル帯域複製パラメータ132は包絡調整器130bとSBRツール130aとに入力される。包絡調整器130bの出力は調整された生信号135であり、結合器140(合成QMFバンク)の中で、(周波数ドメインパッチングのために)スペクトル帯域のオーディオ信号10532と結合されるか、又は(時間ドメインパッチングのために)生信号スペクトル表示125と結合されて合成オーディオ信号145が生成される。この信号145は出力としてPCMサンプルを含んでも良い。
この実施例においても、パッチ生成器110は(例えば図4の(A)〜図4の(D)に示した)パッチングアルゴリズムのうちの1つを使用して、第1の周波数帯域201の基本帯域信号から、第2の周波数帯域202のオーディオ信号又は第3の周波数帯域203のオーディオ信号を生成する。第1の周波数帯域201内のオーディオ信号サンプルだけが符号化された出力ストリーム345の中に含まれ、消失したサンプルはスペクトル帯域複製方法を用いて生成される。
図6cは時間ドメインのパッチングアルゴリズムのための実施例を示す。図6aとの比較において、図6cの実施例ではパッチ生成器110と分析QMFバンク120との配置が異なる。復号化のシステムにおける他の構成要素は図6aで示したものと同様であるため、これらの説明は省略する。
パッチ生成器110はAACコア復号器360からオーディオ信号105を受け取り、時間ドメインでパッチングを実行して生信号115を生成する。この生信号115は(例えば64帯域を有する分析QMFバンクなどの)スペクトル変換器120へと入力される。多くの可能性の中の1つであるが、パッチ生成器110が時間ドメインで実行するあるパッチングアルゴリズムは、2倍のサンプリングレートを含む生信号115をもたらす。この場合、パッチ生成器110は存在しているサンプルの間に(例えばゼロに近い値の)追加的なサンプルを導入するようなパッチングを実行する。スペクトル変換器120の出力は生信号スペクトル表示125であり、SBRツール130aと包絡調整器130bとを備えた生信号調整器130へと入力される。前述の実施例と同様に、包絡調整器130bの出力は調整済の生信号135を含み、この生信号135は結合器140でオーディオ信号105fと周波数ドメインにおいて結合される。この結合器140は例えば64の周波数帯域を有する合成QMFバンクを含む。
このように、図6(A)との主な相違点は、時間ドメインで例えばミラーリングが実行され、信号115が64帯域の分析フィルタバンク120へと入力される前に高周波データが既に再構築されているという点であり、つまり、この信号115が既に(二重レートのSBRで)2倍化されたサンプリングレートを含んでいるという点である。このパッチング操作の後で、標準的なSBRツール、即ち、逆フィルタリング,ノイズフロアの追加,又は消失ハーモニクスの追加などを含むSBRツールが使用されても良い。高周波領域の再構築は時間ドメインで行われるが、その後のSBRの手段も有効に活用することができるように、分析/合成はQMFドメインで実行される。
図6cの実施例では、パッチ生成器110は、低帯域信号と高帯域信号とを備えた全帯域信号(生信号)を出力することが好ましい。代替的に、パッチ生成器は、例えば高域通過フィルタリングによって得られた高帯域部分だけを出力し、QMFバンク120にはAACコア復号器からの出力105が直接的に送られても良い。
さらなる実施例では、パッチ生成器110は、時間ドメインの入力インターフェイス及び/又は時間ドメインの出力インターフェイス(時間ドメイン・インターフェイス)を備えても良いし、このブロック内の処理は、QMFドメインなどのいかなるドメインで実行されても良く、さらには、DFT,FFT,DCT,DST或いは他のいかなる周波数ドメインで実行されても良い。その場合、時間ドメインの入力インターフェイスは、時間/周波数変換器、又は一般的には時間ドメインからスペクトル表示へと変換する変換器に接続されている。スペクトル表示は、次に、周波数ドメインデータに対して作動する少なくとも2つの異なるパッチングアルゴリズムを使用して処理される。代替的に、第1パッチングアルゴリズムが周波数ドメインで作動され、第2パッチングアルゴリズムが時間ドメインで作動されても良い。パッチされた周波数ドメインのデータは時間ドメイン表示へと逆変換され、次に、時間ドメイン出力インターフェイスを介してブロック120へと出力される。ライン115の信号が、全帯域を持たずに低帯域だけを持つような実施例においては、スペクトル信号を時間ドメインへと逆変換する前に、スペクトルドメインにおいてフィルタリングが実行されことが望ましい。
好適には、ブロック110におけるスペクトル分解能はブロック120によって得られる分解能よりも高い。ある実施例では、ブロック110におけるスペクトル分解能はブロック120における分解能の少なくとも2倍の高さを持つ。
この実施例のように、パッチングアルゴリズムを別の機能ブロックに隔離することで、SBRツールの使用から完全に独立した状態で、任意のスペクトル複製方法を適用することが可能になる。代替的な実施例においては、時間ドメインでのパッチングにより高周波要素を生成し、かつこれと並行して、AAC復号器360の信号を32帯域の分析フィルタバンクへと入力することも可能である。この場合、基本帯域とパッチされた信号とはQMF分析の後でのみ結合される。
図6dはパッチングが時間ドメインで実行される実施例を示す。この実施例を図6aの実施例と比較すれば、図6cで示す実施例と同様に、パッチ生成器110の配置と分析フィルタバンク370の配置が異なっている。AACコア復号器360,ビットストリーム・ペイロード・デフォーマッタ350,ビットストリーム・パーサ380,ハフマン復号化及び逆量子化ユニット390は、図6aの実施例と同じであるので、説明の繰り返しは省略する。
図6dの実施例においては、復号器360から出力されるオーディオ信号105を分岐させて、このオーディオ信号105をパッチ生成器110と32帯域分析QMFバンク370とに入力する。32帯域分析QMFバンク370(更なる変換器370)は、さらなる生信号スペクトル表示123を生成する。パッチ生成器110は時間ドメインでパッチングを実行して生信号115を生成し、この生信号115は、64帯域の分析QMFフィルタバンクを含んでいても良いスペクトル変換器120へと入力される。スペクトル変換器120は生信号スペクトル表示125を生成し、この表示125は、本実施例においては、第1の周波数帯域201と複製された第2又は第3の周波数帯域202,203との周波数成分を持つ。この実施例は、32帯域の分析フィルタバンク370の出力123と生信号スペクトル表示125とを加算して、結合された生信号スペクトル表示126を得る加算器124をさらに備える。この加算器124は、一般的には、生信号スペクトル表示125から基本帯域成分(第1の周波数帯域201の成分)を減算する結合器124である。よって、加算器124は、正負逆転された信号を加算するか、又は代替的には、分析32帯域フィルタバンク370からの出力信号を逆転させるための任意のインバータを備えていても良い。
例えば、基本周波数帯域201内の周波数成分を減算した後で、その出力はスペクトル帯域複製ツール130aへと入力され、このツール130aは、結果として得られた信号を包絡調整器130bへと送り出す。包絡調整器130bは、調整された生信号135を生成し、この生信号は結合器140の中で32帯域分析フィルタバンク370の出力123と結合される。その結果、結合器140は、(例えば第2及び第3の周波数帯域202,203内の)パッチされた周波数成分と、32帯域分析フィルタバンク370により出力された基本帯域成分とを結合する。この実施例でも、結合器140は64帯域の合成QMFフィルタバンクを備え、例えばPCMサンプルを有する合成オーディオ信号を出力しても良い。
図6dの実施例では、パッチ生成器110は、低帯域信号と高帯域信号とを備えた全帯域信号(生信号)を出力することが好ましい。代替的に、パッチ生成器110は、例えば高域通過フィルタリングによって得られた高周波帯域部分だけを出力してブロック120へと出力し、図6dに示すように、QMFバンク370にはAACコア復号器360からの出力が直接的に入力されても良い。この場合は、減算器124は必要ではなく、ブロック120の出力はブロック130aへと直接的に送られる。なぜなら、この信号は高帯域だけを含んでいるからである。さらに、ブロック370は減算器124への出力を必要としない。
他の実施例においては、パッチ生成器110は、時間ドメインの入力インターフェイス及び/又は時間ドメインの出力インターフェイス(時間ドメイン・インターフェイス)を備えても良いし、このブロック内の処理は、QMFドメインなどのいかなるドメインで実行されても良く、さらには、DFT,FFT,DCT,MDCT,DST或いは他のいかなる周波数ドメインで実行されても良い。その場合、時間ドメインの入力インターフェイスは、時間/周波数変換器、又は一般的には時間ドメインからスペクトル表示へと変換する変換器に接続されている。スペクトル表示は、次に、周波数ドメインデータに対して作動する少なくとも2つの異なるパッチングアルゴリズムを使用して処理される。代替的に、第1パッチングアルゴリズムが周波数ドメインで作動され、第2パッチングアルゴリズムが時間ドメインで作動されても良い。パッチされた周波数ドメインのデータは時間ドメイン表示へと逆変換され、次に、時間ドメイン出力インターフェイスを介してブロック120へと出力される。
好適には、ブロック110におけるスペクトル分解能はブロック120によって得られる分解能よりも高い。ある実施例では、ブロック110におけるスペクトル分解能はブロック120における分解能の少なくとも2倍の高さを持つ。
図6a〜図6dは復号器の構成に関するものであり、特に、復号器構成の中にパッチ生成器110を組み込んだ構成に関するものである。復号器、特にパッチ生成器110が高周波成分を生成又は複製できるように、符号器は追加的な情報を復号器へと伝送しても良く、この場合、その追加的な情報は、一方では例えばパッチングアルゴリズムを決定するために使用できる制御情報112をもたらし、他方ではスペクトル帯域複製ツール130aによって使用されるスペクトル帯域複製パラメータ132をもたらす。
さらに他の実施例は、第1の周波数帯域201とこの第1の周波数帯域から導出される第2の複製された周波数帯域202とを備えた合成オーディオ信号145を生成するための方法である。この方法は、少なくとも2つの異なるパッチングアルゴリズムを実行し、生信号115を生信号スペクトル表示125へと変換し、その生信号スペクトル表示125を処理する。各パッチングアルゴリズムは、第1の周波数帯域201の信号成分を有するオーディオ信号105を使用して、第2の複製された周波数帯域の信号成分を有する生信号115を生成する。パッチングは、第1の時間部分のための制御情報112に応じて前記少なくとも2つの異なるパッチングアルゴリズムのうちの1つを選択し、且つ、第1の時間部分とは異なる第2の時間部分のための制御情報112に応じて前記少なくとも2つの異なるパッチングアルゴリズムのうちの他の1つ選択し、第1及び第2の時間部分のための生信号115を取得する。生信号スペクトル表示125の処理は、スペクトルドメインのスペクトル帯域複製パラメータ132に応じて実行され、調整済の生信号スペクトル表示135を取得する。最後に、この方法は、第1の周波数帯域201の信号成分を有するオーディオ信号105又はこのオーディオ信号105から導出された信号と、調整済の生信号スペクトル表示135又はこの調整済の生信号スペクトル表示135から導出された別の信号とを結合し、合成オーディオ信号145を取得する、結合ステップを備える。
図7a,図7b及び図7cは符号器の実施例を示す。
図7aはオーディオ信号305を符号化して符号化されたオーディオビットストリーム345を生成する符号器を示す。符号化されたオーディオビットストリーム345は、その後、図6a〜図6dに示す復号器へと入力される。図7aに示す符号器は、低域通過フィルタ310(又は一般的な周波数選択的フィルタ)と高域通過フィルタ320とを備え、これらのフィルタに対してオーディオ信号305が入力される。低域通過フィルタ310は第1の周波数帯域201内のオーディオ信号成分を分離し、他方、高域通過フィルタ320は残りの周波数成分、例えば第2の周波数帯域202内及びさらなる周波数帯域内の周波数成分を分離する。その結果、低域通過フィルタ310は低域通過フィルタリングされた信号315を生成し、高域通過フィルタ320は高域通過フィルタリングされたオーディオ信号325を生成する。低域通過フィルタリングされたオーディオ信号315は、例えばAAC符号器を含んでも良いオーディオ符号器330へと入力される。
さらに、低域通過フィルタリングされたオーディオ信号315は制御情報生成器340へも入力され、この生成器340は好適なパッチングアルゴリズムが識別されるように制御情報112を生成し、その結果、パッチ生成器110がアルゴリズムを選択できるようにする。高域通過フィルタリングされたオーディオ信号325はスペクトル帯域複製データ生成器328へと入力され、このデータ生成器328はスペクトル帯域複製パラメータ132を生成し、このパラメータは一方では制御情報生成器へと入力される。図7aの符号器はフォーマッタ343をさらに備え、オーディオ符号器330からの符号化済信号と、スペクトル帯域複製データ生成器328からのスペクトル帯域複製パラメータ132と、制御情報生成器340からの制御情報112とを受信する。
スペクトル帯域複製パラメータ132はパッチング方法に依存しても良い。一方、異なるパッチングアルゴリズムに対してスペクトル帯域複製パラメータが必ずしも異なる必要はなく、また、SBRパラメータ132を全てのパッチングアルゴリズムに対して決定することも必ずしも必要ではない。(図7cはSBRパラメータ132の1セットだけを計算する必要がある実施例を示す。)SBRデータ生成器328は異なるパッチングアルゴリズムに対して異なるSBRパラメータ132を生成しても良く、従ってSBRパラメータ132は、第1パッチングアルゴリズムに適合する1番目のSBRパラメータ132aと、第2パッチングアルゴリズムに適合する2番目SBRパラメータ132bと、第3パッチングアルゴリズムに適合する3番目のSBRパラメータ132cなどを含んでいても良い。
図7bは制御情報生成器340の実施例をより詳細に示す。制御情報生成器340は低域通過フィルタリングされた信号315とSBRパラメータ132とを受信する。低域通過フィルタリングされた信号315は、第1パッチングユニット342aと第2パッチングユニット342bとその他のパッチングユニット(図示せず)へと入力されても良い。パッチングユニット342の個数は、例えば復号器内のパッチ生成器110によって実行され得るパッチングアルゴリズムの個数と同じでも良い。パッチングユニット342の出力は、第1パッチングユニット342aによる第1パッチング済オーディオ信号344aと、第2パッチングユニット342bによる第2パッチング済オーディオ信号344bなどを含む。第2の周波数帯域202内の生成分を含むパッチング済オーディオ信号344は、スペクトル帯域複製ツールブロック346へと入力される。ここでも、スペクトル帯域複製ツールブロック346の個数は、例えばパッチングアルゴリズムの個数と同じでも良く、又はパッチングユニット342の個数と同じでも良い。SBRパラメータ132もまたスペクトル帯域複製ツールブロック(SBRツールブロック)346へと入力され、このとき、1番目のSBRツールブロック346aが1番目のSBRパラメータ132aと1番目のパッチング済信号344aとを受け取るようにする。同様に、2番目のSBRツールブロック346bは2番目のSBRパラメータ132bと2番目のパッチング済信号344bとを受け取る。SBRツールブロック346は、複製パラメータ132に基づいて、第2及び/又は第3の周波数帯域202,203内の高周波数成分を含む複製オーディオ信号347を生成する。
最後に、制御情報生成器340は、オリジナルオーディオ信号305特にオーディオ信号305の高周波成分と、複製オーディオ信号347とを比較する、比較ユニット348を含む。この比較も各パッチングアルゴリズム毎に実行されても良く、1番目の比較ユニット348aは、オーディオ信号305と1番目のSBRツールブロック346aが出力した1番目の複製オーディオ信号347aとを比較する。
同様に、2番目の比較ユニット348bは、オーディオ信号305と2番目のSBRツールブロック346bからの2番目の複製オーディオ信号347bとを比較する。比較ユニット348は高周波帯域の複製オーディオ信号347とオリジナルオーディオ信号305との偏差を決定し、最終的には、評価ユニット349が、オリジナルオーディオ信号305と様々なパッチングアルゴリズムを使用した複製オーディオ信号347との間の偏差を比較し、その結果から、1つの好適なパッチングアルゴリズム又はいくつかの適切もしくは不適切なパッチングアルゴリズムを決定できるようにする。制御情報112は、好適なパッチングアルゴリズムの1つを識別可能とする情報を含む。制御情報112は、例えばオリジナルオーディオ信号305と複製オーディオ信号347との最小偏差に基づいて決定された、好適なパッチングアルゴリズムの識別番号を含んでも良い。代わりに、制御信号112は、オリジナルオーディオ信号305と複製オーディオ信号347との間に十分な整合性をもたらすいくつかのパッチングアルゴリズム又はパッチングアルゴリズムの順位を提供しても良い。この評価は、例えば知覚的品質に関し、複製オーディオ信号347が、人間にとってオリジナルオーディオ信号305から区別できないか又は殆ど区別できないような理想的な状態になるように実行されても良い。
図7cは、オーディオ信号305が入力され、さらに任意的にメタデータ306も入力される、符号器のさらなる実施例を示す。オリジナルオーディオ信号305は、低域通過フィルタ310と高域通過フィルタ320とに入力される。低域通過フィルタ310の出力はオーディオ符号器330へと入力され、高域通過フィルタ320の出力はSBRデータ生成器350へと入力される。この符号器はメタデータ処理ユニット309及び/又は分析ユニット(又は分析手段)307をさらに備え、これらの出力は制御情報生成器340へと送られる。メタデータ処理ユニット309はメタデータ306を適切なパッチングアルゴリズムについて分析する。分析ユニット307は、例えば、オーディオ信号305内の過渡又はパルストレインもしくは非パルストレイン分節の、個数と強度を決定することができる。メタデータ処理ユニット309の出力及び/又は分析ユニット307の出力に基づいて、制御情報生成器340は、好適なパッチングアルゴリズムを決定するか、又はパッチングアルゴリズムの順位を生成し、この情報を制御情報112の中に符号化する。フォーマッタ343は、制御情報112とスペクトル帯域複製パラメータ132と符号化済オーディオ信号355とを結合して符号化されたオーディオストリーム345を生成する。
分析手段307は、例えばオーディオ信号の特性を分析し、ある程度の声音を有する時間部分については非ハーモニック信号成分を識別し、ある特定の時間部分についてはハーモニック信号成分を識別するよう構成されても良い。もしオーディオ信号305が純粋にスピーチ又は声音である場合には、声音の程度が高くなり、他方、声音と例えば楽音との混合である場合には、声音の程度が低くなる。SBRパラメータ132の計算は、この特徴と好適なパッチングアルゴリズムとに基づいて実行されても良い。
本発明のさらに他の実施例は、オーディオ信号305の第1の周波数帯域201の成分と、制御信号112と、スペクトル帯域複製パラメータ132とを含むデータストリームを生成する方法を提案する。この方法は、まずオーディオ信号305を周波数選択的にフィルタリングしてオーディオ信号305の第1の周波数帯域201の成分を生成するステップを含む。またこの方法は、オーディオ信号305の第2の周波数帯域202の成分からスペクトル帯域複製パラメータ132を生成するステップを含む。最後にこの方法は、第1又は第2の異なるパッチングアルゴリズムから好適なパッチングアルゴリズムを識別する制御情報112を生成するステップを含み、このとき各パッチングアルゴリズムは、オーディオ信号305の第1の周波数帯域201の成分を使用して複製された第2の周波数帯域202の信号成分を有する生信号115を生成する。
本発明のいくつかの実施例、特に図6a〜図6dに示す実施例においては、低帯域と調整済の高帯域との間の結合が周波数ドメインで実行されたが、この結合は時間ドメインで実行されても良いことに注意すべきである。この場合、コア復号器の出力信号は(パッチング及び調整によって発生した処理遅延を補償するために潜在的に必要となる遅延ステージの出力において)時間ドメインで使用することができ、フィルタバンクドメインで調整された高帯域は、低帯域部分は持たずに高帯域部分を持つ信号として時間ドメインへと変換することができる。図6の実施例においては、この信号は高域の32個のサブバンドだけを含み、この信号を時間ドメインへと変換した結果は時間ドメインの高帯域信号となる。次に、両方の信号はサンプル毎の加算などによって時間ドメインで結合され、デジタル/アナログ変換されてスピーカへと伝送されるべき出力信号として、例えばPCMサンプルを得ることができる。
これまで本発明のいくつかの態様を装置として説明してきたが、これらの態様は対応する方法の説明でもあることは明らかであり、その場合、ブロック又は装置は、方法ステップ又は方法ステップの特徴に対応する。同様に、方法ステップの文脈における説明は、対応するブロック、項目又は対応する装置の説明にもあてはまる。
本発明の符号化されたオーディオ信号又はビットストリームは、デジタル記憶媒体に記憶されることが可能であり、又は、インターネットのような無線伝送媒体或いは有線伝送媒体等、伝送媒体を介して伝送されることも可能である。
本発明の方法の所定の実施条件に依るが、本発明の方法は、ハードウエア又はソフトウエアにおいて構成可能である。この構成は、その中に格納される電子的に読出し可能な制御信号を有し、本発明の方法が実行されるようにプログラム可能なコンピュータシステムと協働する(又は協働可能な)、デジタル記憶媒体、例えば、フレキシブルディスク,DVD,CD,ROM,PROM,EPROM,EEPROM又はフラッシュメモリなどを使用して実行することができる。
本発明の実施例は、機械読出し可能な制御信号を持つデータキャリアを含み、この制御信号はプログラム可能なコンピュータシステムと協働して本明細書に記載の方法のうちの1つを実行するよう作動することができる。一般的に、本発明の実施例は、当該コンピュータプログラム製品がコンピュータ上で作動するときに、本発明の方法の1つを実行するよう作動するプログラムコードを有するコンピュータプログラム製品として構成される。このプログラムコードは例えば機械読出し可能なキャリアに記憶されても良い。本発明の他の実施例は、機械読出し可能なキャリアに記憶され、本発明の方法の1つを実行するコンピュータプログラムを含む。換言すれば、本発明の1つの実施例は、当該コンピュータプログラムがコンピュータ上で作動するときに、本発明の方法の1つを実行するためのプログラムコードを有する、コンピュータプログラムである。本発明の他の実施例は、本発明の方法の1つを実行するためのコンピュータプログラムが記憶された、データキャリア(又はデジタル記憶媒体又はコンピュータ読出し可能な媒体)である。本発明のさらに他の実施例は、本発明の方法の1つを実行するためのコンピュータプログラムを表現するデータストリーム又は信号列である。このデータストリーム又は信号列は、例えばインターネットのようなデータ通信網を介して伝送可能である。本発明のさらに他の実施例は、本発明の方法の1つを実行するよう構成又は適用された、例えばコンピュータ又はプログラム可能な論理回路のような処理手段を含む。本発明のさらに他の実施例は、本発明の方法の少なくとも1つを実行するためのコンピュータプログラムを内蔵したコンピュータを含む。本発明のいくつかの実施例は、本発明の方法のいくつか又は全ての機能を実行するために、(例えば書換え可能ゲートアレイ等の)プログラム可能な論理回路を使用しても良い。本発明のいくつかの実施例では、本発明のある方法を実行するために、書換え可能ゲートアレイはマイクロプロセッサと協働しても良い。一般的に、本発明の方法は、いかなるハードウエア装置によっても実行できることが好ましい。
上述した実施の形態は、本発明の原理を単に例示的に示したにすぎない。本明細書に記載した構成及び詳細について、修正及び変更が可能であることは、当業者にとって明らかである。従って、本発明は、以下に添付する特許請求の範囲の技術的範囲によってのみ限定されるものであり、本明細書に実施形態の説明及び解説の目的で提示した具体的詳細によって限定されるものではない。

Claims (15)

  1. 合成オーディオ信号(145)を生成するオーディオ信号合成器であって、前記合成オーディオ信号(145)は第1の周波数帯域(201)とこの第1の周波数帯域から導出された第2の合成周波数帯域(202)とを有するオーディオ信号合成器において、
    少なくとも2つの異なるパッチングアルゴリズムを実行して、前記第1の周波数帯域(201)の信号成分を有するオーディオ信号(105)から前記第2の合成周波数帯域(202)の信号成分を有する生信号(115)を生成するパッチ生成器(110)であって、第1の時間部分のための制御情報(112)に応じて前記少なくとも2つの異なるパッチングアルゴリズムのうちの1つを選択し、且つ、前記第1の時間部分とは異なる第2の時間部分のための前記制御情報(112)に応じて前記少なくとも2つの異なるパッチングアルゴリズムのうちの他の1つ選択し、前記第1及び第2の時間部分のための生信号(115)を取得するパッチ生成器(110)と、
    前記生信号(115)を生信号スペクトル表示(125)へと変換するスペクトル変換器(120)と、
    スペクトルドメインのスペクトル帯域複製パラメータ(132)に応じて前記生信号スペクトル表示(125)を処理し、調整済の生信号スペクトル表示(135)を取得する生信号処理器(130)と、
    前記第1の周波数帯域(201)の信号成分を有するオーディオ信号(105)又はこのオーディオ信号(105)から導出された信号と、前記調整済の生信号スペクトル表示(135)又はこの調整済の生信号スペクトル表示(135)から導出されたさらなる信号とを結合して前記合成オーディオ信号(145)を取得する結合器(140)と、
    を備えたことを特徴とするオーディオ信号合成器。
  2. 前記少なくとも2つのパッチングアルゴリズムは、前記オーディオ信号(105)の第1の周波数帯域(201)のある周波数における信号成分が第2の周波数帯域(202)の目標周波数へとパッチングされ、その目標周波数が両方のパッチングアルゴリズムに関して異なる、という意味で互いに異なることを特徴とする、請求項1に記載のオーディオ信号合成器。
  3. 前記パッチ生成器(110)は前記両方のパッチングアルゴリズムについて時間ドメインで作動し、又は、前記パッチ生成器は時間ドメイン信号をスペクトル表示に変換する変換器,スペクトル表示の信号を時間ドメインに変換する変換器,及び時間ドメイン出力インターフェイスを備え、このパッチ生成器(110)は少なくとも1つのパッチングアルゴリズムについてスペクトルドメインで作動することを特徴とする、請求項1又は2に記載のオーディオ信号合成器。
  4. 前記パッチ生成器(110)は、前記生信号(115)が前記パッチ生成器(110)に入力されたオーディオ信号(105)のサンプリングレートよりも大きなサンプリングレートを有するさらなる信号成分を前記第1の周波数帯域(201)に持つように、前記生信号(115)を生成し、

    前記スペクトル変換器は、前記第2の周波数帯域(202)の信号成分と前記第1の周波数帯域(201)のさらなる信号成分とを前記生信号スペクトル表示(125)へと変換することを特徴とする、請求項1乃至3のいずれか1項に記載のオーディオ信号合成器。
  5. 更なるスペクトル変換器(370)と更なる結合器(124)とをさらに備え、
    前記更なるスペクトル変換器(370)は、前記第1の周波数帯域(201)の信号成分を持つ前記オーディオ信号(105)を更なる生信号スペクトル表示(123)へと変換し、
    前記更なる結合器(124)は、前記生信号スペクトル表示(125)と前記更なる生信号スペクトル表示(123)とを結合して結合された生信号スペクトル表示(126)を取得し、
    前記生信号処理器(130)は前記結合された生信号スペクトル表示(126)を処理することを特徴とする、請求項4に記載のオーディオ信号合成器。
  6. 前記結合器(140)は、前記オーディオ信号(105)から導出された信号として、前記更なる生信号スペクトル表示(123)を使用することを特徴とする、請求項1乃至5のいずれか1項に記載のオーディオ信号合成器。
  7. 前記オーディオ信号(105)と前記制御情報(112)とはデータストリームの中に符号化され、
    このデータストリームから前記制御情報(112)を取得するデフォーマッタをさらに備えることを特徴とする、請求項1乃至6のいずれか1項に記載のオーディオ信号合成器。
  8. 前記オーディオ信号と前記スペクトル帯域複製パラメータ(132)とはデータストリームの中に符号化され、
    前記生信号処理器(130)はこのデータストリームから前記スペクトル帯域複製パラメータ(132)を取得することを特徴とする、請求項1乃至7のいずれか1項に記載のオーディオ信号合成器。
  9. オーディオ信号(305)からデータストリーム(345)を生成するオーディオ信号符号器であって、前記データストリームはオーディオ信号(305)の第1の周波数帯域(201)の成分と制御情報(112)とスペクトル帯域複製パラメータ(132)とを有する、オーディオ信号符号器において、
    前記オーディオ信号(305)の前記第1の周波数帯域(201)の成分を生成する周波数選択的フィルタ(310)と、
    前記オーディオ信号(305)の第2の周波数帯域(202)の成分から前記スペクトル帯域複製パラメータ(132)を生成する生成器と、
    前記制御情報(112)を生成する制御情報生成器(340)であって、前記制御情報(112)は第1又は第2の異なるパッチングアルゴリズムから好適なパッチングアルゴリズムを識別するものであり、各パッチングアルゴリズムは、前記オーディオ信号(305)の前記第1の周波数帯域(201)の成分を使用して前記第2の複製された周波数帯域(202)の信号成分を有する生信号(115)を生成する、制御情報生成器と、
    を備えることを特徴とするオーディオ信号符号器。
  10. 前記オーディオ信号(305)を分析(307)して前記オーディオ信号の特徴を提供する手段をさらに備え、
    前記分析手段(370)は、ある程度の声音を有する時間部分については非ハーモニック信号成分を識別し、又はある特定の時間部分についてはハーモニック信号成分を識別することを特徴とする、請求項9に記載のオーディオ信号符号器。
  11. 前記制御情報生成器(340)は、前記オーディオ信号(305)と前記第1及び第2のパッチングアルゴリズムのためのパッチされたオーディオ信号(347)とを比較することにより前記好適なパッチングアルゴリズムを識別し、
    異なるようにパッチされたオーディオ信号(347)は、スペクトル帯域複製ツール(346)を使用してスペクトル帯域複製パラメータ(132)に応じて生信号調整を適用することで、前記第1及び第2のパッチングアルゴリズムに関連した異なる生信号(344)から導出されることを特徴とする、請求項9又は10に記載のオーディオ信号符号器。
  12. 伝送ラインを介して伝送するため或いは記憶するためのデータストリームであって、
    第1の周波数帯域(201)の符号化されたオーディオ信号(105)と、
    制御情報(112)とを備え、
    前記制御情報(112)は異なる第1又は第2のパッチングアルゴリズムから1つのパッチングアルゴリズムを識別し、各パッチングアルゴリズムは前記オーディオ信号(305)の前記第1の周波数帯域(201)の成分を使用して第2の複製された周波数帯域(202)の信号成分を有する生信号(115)を生成する、データストリーム。
  13. 合成オーディオ信号(145)を生成する方法であって、前記合成オーディオ信号(145)は第1の周波数帯域とこの第1の周波数帯域から複製された第2の周波数帯域(202)とを有する方法において、
    少なくとも2つの異なるパッチングアルゴリズムを実行するステップであって、各パッチングアルゴリズムは前記第1の周波数帯域(201)の信号成分を有するオーディオ信号(105)を使用して前記第2の複製された周波数帯域(202)の信号成分を有する生信号(115)を生成し、第1の時間部分のための制御情報(112)に応じて前記少なくとも2つの異なるパッチングアルゴリズムのうちの1つを選択し、且つ、前記第1の時間部分とは異なる第2の時間部分のための前記制御情報(112)に応じて前記少なくとも2つの異なるパッチングアルゴリズムのうちの他の1つ選択し、前記第1及び第2の時間部分のための生信号(115)を取得するステップと、
    前記生信号(115)を生信号スペクトル表示(125)へと変換するステップと、
    スペクトルドメインのスペクトル帯域複製パラメータ(132)に応じて前記生信号スペクトル表示(125)を処理し、調整済の生信号スペクトル表示(135)を取得するステップと、
    前記第1の周波数帯域(201)の信号成分を有するオーディオ信号(105)又はこのオーディオ信号(105)から導出された信号と、前記調整済の生信号スペクトル表示(135)又はこの調整済の生信号スペクトル表示(135)から導出されたさらなる信号とを結合して前記合成オーディオ信号(145)を取得するステップと、
    を備えたことを特徴とする、合成オーディオ信号の生成方法。
  14. データストリーム(345)を生成する方法であって、前記データストリームはオーディオ信号(305)の第1の周波数帯域(201)の成分と制御情報(112)とスペクトル帯域複製パラメータ(132)とを備える方法において、
    前記オーディオ信号(305)の前記第1の周波数帯域(201)の成分を生成するために前記オーディオ信号(305)を周波数選択的にフィルタリングするステップと、
    前記オーディオ信号(305)の第2の周波数帯域(202)の成分から前記スペクトル帯域複製パラメータ(132)を生成するステップと、
    前記制御情報(112)を生成するステップであって、前記制御情報(112)は第1又は第2の異なるパッチングアルゴリズムから好適なパッチングアルゴリズムを識別するものであり、各パッチングアルゴリズムは、前記オーディオ信号(305)の前記第1の周波数帯域(201)の成分を使用して前記第2の複製された周波数帯域(202)の信号成分を有する生信号(115)を生成するステップと、
    を備えることを特徴とする方法。
  15. プロセッサ上で作動されたときに請求項13又は14に記載の方法を実行する、コンピュータプログラム。
JP2011516984A 2008-07-11 2009-06-19 オーディオ信号合成器及びオーディオ信号符号器 Active JP5244971B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US7983908P 2008-07-11 2008-07-11
US61/079,839 2008-07-11
US10382008P 2008-10-08 2008-10-08
US61/103,820 2008-10-08
PCT/EP2009/004451 WO2010003539A1 (en) 2008-07-11 2009-06-19 Audio signal synthesizer and audio signal encoder

Publications (2)

Publication Number Publication Date
JP2011527447A true JP2011527447A (ja) 2011-10-27
JP5244971B2 JP5244971B2 (ja) 2013-07-24

Family

ID=41120013

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011516984A Active JP5244971B2 (ja) 2008-07-11 2009-06-19 オーディオ信号合成器及びオーディオ信号符号器

Country Status (16)

Country Link
US (3) US8731948B2 (ja)
EP (1) EP2301026B1 (ja)
JP (1) JP5244971B2 (ja)
KR (1) KR101223835B1 (ja)
CN (1) CN102089816B (ja)
AR (1) AR072864A1 (ja)
AU (1) AU2009267525B2 (ja)
BR (1) BRPI0910792B1 (ja)
CA (1) CA2730198C (ja)
CO (1) CO6341675A2 (ja)
ES (1) ES2796552T3 (ja)
MX (1) MX2011000372A (ja)
RU (1) RU2491658C2 (ja)
TW (1) TWI441162B (ja)
WO (1) WO2010003539A1 (ja)
ZA (1) ZA201009208B (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011197598A (ja) * 2010-03-24 2011-10-06 J&K Car Electronics Corp 高調波生成方法、高調波生成装置、及び、プログラム
JP2014532904A (ja) * 2011-11-11 2014-12-08 ドルビー インターナショナル アーベー 過剰サンプリングされたsbrを使ったアップサンプリング
JP2018041100A (ja) * 2013-07-22 2018-03-15 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 符号化オーディオ信号の復号装置、方法およびコンピュータプログラム
JP2020079963A (ja) * 2015-03-13 2020-05-28 ドルビー・インターナショナル・アーベー オーディオ処理ユニットおよびエンコードされたオーディオ・ビットストリームをデコードする方法
JP2021515276A (ja) * 2018-04-25 2021-06-17 ドルビー・インターナショナル・アーベー 後処理遅延低減との高周波再構成技術の統合
US11367455B2 (en) 2015-03-13 2022-06-21 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element
US11527256B2 (en) 2018-04-25 2022-12-13 Dolby International Ab Integration of high frequency audio reconstruction techniques
US11996106B2 (en) 2013-07-22 2024-05-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101223835B1 (ko) 2008-07-11 2013-01-17 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 신호 합성기 및 오디오 신호 인코더
PL2346030T3 (pl) * 2008-07-11 2015-03-31 Fraunhofer Ges Forschung Koder audio, sposób kodowania sygnału audio oraz program komputerowy
PT2945159T (pt) * 2008-12-15 2018-06-26 Fraunhofer Ges Forschung Codificador de áudio e descodificador de extensão de largura de banda
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
CO6440537A2 (es) * 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
CN101566940B (zh) * 2009-05-25 2012-02-29 中兴通讯股份有限公司 实现无线数据终端通用串行总线音频传输的方法及装置
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
EP2362375A1 (en) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using harmonic locking
JP5719922B2 (ja) * 2010-04-13 2015-05-20 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン サンプルごとに正確なオーディオ信号表現のための方法、エンコーダ及びデコーダ
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
BR112013008463B8 (pt) 2010-10-06 2022-04-05 Fraunhofer Ges Zur Foerderung Der Angewandten Forschubg E V Aparelho e método para processar um sinal de áudio e para prover uma granularidade temporal maior para um codec de fala e áudio unificado combinado (usac)
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
EP2710588B1 (en) 2011-05-19 2015-09-09 Dolby Laboratories Licensing Corporation Forensic detection of parametric audio coding schemes
CN107103907B (zh) * 2011-08-17 2021-01-26 瑞典爱立信有限公司 编码器能力的动态发信号通知的机制
US9380320B2 (en) * 2012-02-10 2016-06-28 Broadcom Corporation Frequency domain sample adaptive offset (SAO)
US9212946B2 (en) * 2012-06-08 2015-12-15 General Electric Company Campbell diagram displays and methods and systems for implementing same
KR101920029B1 (ko) * 2012-08-03 2018-11-19 삼성전자주식회사 모바일 장치 및 제어방법
ES2549953T3 (es) * 2012-08-27 2015-11-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada, programa de ordenador y señal de audio codificada
RU2627102C2 (ru) * 2013-01-29 2017-08-03 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Декодер для формирования аудиосигнала с улучшенной частотной характеристикой, способ декодирования, кодер для формирования кодированного сигнала и способ кодирования с использованием компактной дополнительной информации для выбора
US9060223B2 (en) * 2013-03-07 2015-06-16 Aphex, Llc Method and circuitry for processing audio signals
DK2981958T3 (en) * 2013-04-05 2018-05-28 Dolby Int Ab AUDIO CODES AND DECODS
BR122021009022B1 (pt) * 2013-04-05 2022-08-16 Dolby International Ab Método de decodificação para decodificar dois sinais de áudio, mídia legível por computador, e decodificador para decodificar dois sinais de áudio
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP2830049A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient object metadata coding
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
KR20230042410A (ko) 2013-12-27 2023-03-28 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
US20150350784A1 (en) * 2014-04-03 2015-12-03 Uma Satish Doshi Music adaptive speaker system and method
EP2963648A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using vertical phase correction
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
CN104143335B (zh) 2014-07-28 2017-02-01 华为技术有限公司 音频编码方法及相关装置
WO2016040885A1 (en) 2014-09-12 2016-03-17 Audience, Inc. Systems and methods for restoration of speech components
DE112016000545B4 (de) 2015-01-30 2019-08-22 Knowles Electronics, Llc Kontextabhängiges schalten von mikrofonen
CN112002337A (zh) * 2015-03-03 2020-11-27 杜比实验室特许公司 用于对音频信号进行处理的方法、装置和设备
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
GB202203733D0 (en) * 2022-03-17 2022-05-04 Samsung Electronics Co Ltd Patched multi-condition training for robust speech recognition

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007532963A (ja) * 2004-04-15 2007-11-15 ノキア コーポレイション 音声信号の符号化

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US5898605A (en) * 1997-07-17 1999-04-27 Smarandoiu; George Apparatus and method for simplified analog signal record and playback
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004818D0 (sv) 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
JP3870193B2 (ja) * 2001-11-29 2007-01-17 コーディング テクノロジーズ アクチボラゲット 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム
JP3864098B2 (ja) 2002-02-08 2006-12-27 日本電信電話株式会社 動画像符号化方法、動画像復号方法、及びこれらの方法の実行プログラムとこれらの実行プログラムを記録した記録媒体
AU2003281128A1 (en) 2002-07-16 2004-02-02 Koninklijke Philips Electronics N.V. Audio coding
ES2297083T3 (es) 2002-09-04 2008-05-01 Microsoft Corporation Codificacion entropica por adaptacion de la codificacion entre modos por longitud de ejecucion y por nivel.
DE10252327A1 (de) * 2002-11-11 2004-05-27 Siemens Ag Verfahren zur Erweiterung der Bandbreite eines schmalbandig gefilterten Sprachsignals, insbesondere eines von einem Telekommunikationsgerät gesendeten Sprachsignals
US20040138876A1 (en) * 2003-01-10 2004-07-15 Nokia Corporation Method and apparatus for artificial bandwidth expansion in speech processing
KR100917464B1 (ko) * 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP4241417B2 (ja) 2004-02-04 2009-03-18 日本ビクター株式会社 算術復号化装置、および算術復号化プログラム
CN1926610B (zh) 2004-03-12 2010-10-06 诺基亚公司 合成单声道音频信号的方法、音频解码器和编码系统
ATE429011T1 (de) * 2005-01-31 2009-05-15 Harman Becker Automotive Sys Bandbreitenerweiterung eines schmalbandigen akustischen signals
JP4438663B2 (ja) 2005-03-28 2010-03-24 日本ビクター株式会社 算術符号化装置及び算術符号化方法
KR100713366B1 (ko) 2005-07-11 2007-05-04 삼성전자주식회사 모폴로지를 이용한 오디오 신호의 피치 정보 추출 방법 및그 장치
US7539612B2 (en) 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
JP4211780B2 (ja) 2005-12-27 2009-01-21 三菱電機株式会社 デジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
JP2007300455A (ja) 2006-05-01 2007-11-15 Victor Co Of Japan Ltd 算術符号化装置、および算術符号化装置におけるコンテキストテーブル初期化方法
US8010352B2 (en) * 2006-06-21 2011-08-30 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
JP2008098751A (ja) 2006-10-06 2008-04-24 Matsushita Electric Ind Co Ltd 算術符号化装置及び算術復号化装置
US7912729B2 (en) * 2007-02-23 2011-03-22 Qnx Software Systems Co. High-frequency bandwidth extension in the time domain
US8015368B2 (en) * 2007-04-20 2011-09-06 Siport, Inc. Processor extensions for accelerating spectral band replication
EP4376307A2 (en) 2008-07-11 2024-05-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and audio decoder
KR101223835B1 (ko) 2008-07-11 2013-01-17 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 신호 합성기 및 오디오 신호 인코더

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007532963A (ja) * 2004-04-15 2007-11-15 ノキア コーポレイション 音声信号の符号化

Cited By (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011197598A (ja) * 2010-03-24 2011-10-06 J&K Car Electronics Corp 高調波生成方法、高調波生成装置、及び、プログラム
JP2014532904A (ja) * 2011-11-11 2014-12-08 ドルビー インターナショナル アーベー 過剰サンプリングされたsbrを使ったアップサンプリング
US9530424B2 (en) 2011-11-11 2016-12-27 Dolby International Ab Upsampling using oversampled SBR
USRE48258E1 (en) 2011-11-11 2020-10-13 Dolby International Ab Upsampling using oversampled SBR
US10573334B2 (en) 2013-07-22 2020-02-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
US10984805B2 (en) 2013-07-22 2021-04-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
US10276183B2 (en) 2013-07-22 2019-04-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
US10311892B2 (en) 2013-07-22 2019-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding audio signal with intelligent gap filling in the spectral domain
US10332539B2 (en) 2013-07-22 2019-06-25 Fraunhofer-Gesellscheaft zur Foerderung der angewanften Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US10332531B2 (en) 2013-07-22 2019-06-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
US10347274B2 (en) 2013-07-22 2019-07-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US10515652B2 (en) 2013-07-22 2019-12-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
US11735192B2 (en) 2013-07-22 2023-08-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US10593345B2 (en) 2013-07-22 2020-03-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for decoding an encoded audio signal with frequency tile adaption
US10847167B2 (en) 2013-07-22 2020-11-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US10147430B2 (en) 2013-07-22 2018-12-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
US11049506B2 (en) 2013-07-22 2021-06-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US11222643B2 (en) 2013-07-22 2022-01-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for decoding an encoded audio signal with frequency tile adaption
US11250862B2 (en) 2013-07-22 2022-02-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
US11996106B2 (en) 2013-07-22 2024-05-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US11257505B2 (en) 2013-07-22 2022-02-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US11289104B2 (en) 2013-07-22 2022-03-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
US11922956B2 (en) 2013-07-22 2024-03-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
US11769513B2 (en) 2013-07-22 2023-09-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
JP2018041100A (ja) * 2013-07-22 2018-03-15 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 符号化オーディオ信号の復号装置、方法およびコンピュータプログラム
US11769512B2 (en) 2013-07-22 2023-09-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
US11417350B2 (en) 2015-03-13 2022-08-16 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element
US11367455B2 (en) 2015-03-13 2022-06-21 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element
JP7210658B2 (ja) 2015-03-13 2023-01-23 ドルビー・インターナショナル・アーベー オーディオ処理ユニットおよびエンコードされたオーディオ・ビットストリームをデコードする方法
JP2020079963A (ja) * 2015-03-13 2020-05-28 ドルビー・インターナショナル・アーベー オーディオ処理ユニットおよびエンコードされたオーディオ・ビットストリームをデコードする方法
JP2021167981A (ja) * 2015-03-13 2021-10-21 ドルビー・インターナショナル・アーベー オーディオ処理ユニットおよびエンコードされたオーディオ・ビットストリームをデコードする方法
US11664038B2 (en) 2015-03-13 2023-05-30 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element
US11842743B2 (en) 2015-03-13 2023-12-12 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element
US11810592B2 (en) 2018-04-25 2023-11-07 Dolby International Ab Integration of high frequency audio reconstruction techniques
US11830509B2 (en) 2018-04-25 2023-11-28 Dolby International Ab Integration of high frequency reconstruction techniques with reduced post-processing delay
US11810589B2 (en) 2018-04-25 2023-11-07 Dolby International Ab Integration of high frequency audio reconstruction techniques
US11810590B2 (en) 2018-04-25 2023-11-07 Dolby International Ab Integration of high frequency audio reconstruction techniques
US11527256B2 (en) 2018-04-25 2022-12-13 Dolby International Ab Integration of high frequency audio reconstruction techniques
US11810591B2 (en) 2018-04-25 2023-11-07 Dolby International Ab Integration of high frequency audio reconstruction techniques
US11823694B2 (en) 2018-04-25 2023-11-21 Dolby International Ab Integration of high frequency reconstruction techniques with reduced post-processing delay
US11823696B2 (en) 2018-04-25 2023-11-21 Dolby International Ab Integration of high frequency reconstruction techniques with reduced post-processing delay
US11823695B2 (en) 2018-04-25 2023-11-21 Dolby International Ab Integration of high frequency reconstruction techniques with reduced post-processing delay
JP2021515276A (ja) * 2018-04-25 2021-06-17 ドルビー・インターナショナル・アーベー 後処理遅延低減との高周波再構成技術の統合
JP2021157202A (ja) * 2018-04-25 2021-10-07 ドルビー・インターナショナル・アーベー 後処理遅延低減との高周波再構成技術の統合
US11862185B2 (en) 2018-04-25 2024-01-02 Dolby International Ab Integration of high frequency audio reconstruction techniques
US11908486B2 (en) 2018-04-25 2024-02-20 Dolby International Ab Integration of high frequency reconstruction techniques with reduced post-processing delay
JP7242767B2 (ja) 2018-04-25 2023-03-20 ドルビー・インターナショナル・アーベー 後処理遅延低減との高周波再構成技術の統合
US11562759B2 (en) 2018-04-25 2023-01-24 Dolby International Ab Integration of high frequency reconstruction techniques with reduced post-processing delay
JP7493076B2 (ja) 2018-04-25 2024-05-30 ドルビー・インターナショナル・アーベー 後処理遅延低減との高周波再構成技術の統合
JP7493073B2 (ja) 2018-04-25 2024-05-30 ドルビー・インターナショナル・アーベー 後処理遅延低減との高周波再構成技術の統合

Also Published As

Publication number Publication date
CA2730198A1 (en) 2010-01-14
US8731948B2 (en) 2014-05-20
EP2301026A1 (en) 2011-03-30
WO2010003539A1 (en) 2010-01-14
TWI441162B (zh) 2014-06-11
US20180350387A1 (en) 2018-12-06
CN102089816B (zh) 2013-01-30
AU2009267525B2 (en) 2012-12-20
RU2491658C2 (ru) 2013-08-27
KR101223835B1 (ko) 2013-01-17
RU2011101616A (ru) 2012-07-27
ZA201009208B (en) 2011-10-26
EP2301026B1 (en) 2020-03-04
KR20110040817A (ko) 2011-04-20
AR072864A1 (es) 2010-09-29
BRPI0910792A2 (pt) 2015-10-06
US10014000B2 (en) 2018-07-03
US20140222434A1 (en) 2014-08-07
US10522168B2 (en) 2019-12-31
CA2730198C (en) 2014-09-16
MX2011000372A (es) 2011-05-19
CN102089816A (zh) 2011-06-08
CO6341675A2 (es) 2011-11-21
BRPI0910792B1 (pt) 2020-03-24
AU2009267525A1 (en) 2010-01-14
ES2796552T3 (es) 2020-11-27
TW201009807A (en) 2010-03-01
US20110173006A1 (en) 2011-07-14
JP5244971B2 (ja) 2013-07-24

Similar Documents

Publication Publication Date Title
JP5244971B2 (ja) オーディオ信号合成器及びオーディオ信号符号器
TWI492222B (zh) 用以產生合成音訊信號及將音訊信號編碼之裝置與方法
JP5329714B2 (ja) 帯域拡張符号化装置、帯域拡張復号化装置及び位相ボコーダ
JP5970014B2 (ja) オーディオエンコーダおよび帯域幅拡張デコーダ
JP6229957B2 (ja) 音声信号を再生するための装置および方法、符号化音声信号を生成するための装置および方法、コンピュータプログラム、および符号化音声信号
JP3871347B2 (ja) スペクトル帯域複製を用いた原始コーディングの強化
KR101373004B1 (ko) 고주파수 신호 부호화 및 복호화 장치 및 방법
CN106796800B (zh) 音频编码器、音频解码器、音频编码方法和音频解码方法
AU2013207549B2 (en) Apparatus and method for generating a synthesis audio signal and for encoding an audio signal

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121211

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130312

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130408

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160412

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5244971

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250