JP2016539377A - 低演算資源を用いて符号化済みオーディオ信号を復号化する装置及び方法 - Google Patents

低演算資源を用いて符号化済みオーディオ信号を復号化する装置及び方法 Download PDF

Info

Publication number
JP2016539377A
JP2016539377A JP2016536886A JP2016536886A JP2016539377A JP 2016539377 A JP2016539377 A JP 2016539377A JP 2016536886 A JP2016536886 A JP 2016536886A JP 2016536886 A JP2016536886 A JP 2016536886A JP 2016539377 A JP2016539377 A JP 2016539377A
Authority
JP
Japan
Prior art keywords
bandwidth extension
harmonic
audio signal
extension mode
encoded audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016536886A
Other languages
English (en)
Other versions
JP6286554B2 (ja
Inventor
ニーデルマイエル,アンドレアス
ヴィルデ,ステファン
フィッシャー,ダニエル
ヒルデンブラント,マティアス
ガイエル,マルク
ノイエンドルフ,マックス
Original Assignee
フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン filed Critical フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Publication of JP2016539377A publication Critical patent/JP2016539377A/ja
Application granted granted Critical
Publication of JP6286554B2 publication Critical patent/JP6286554B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

第1のハーモニック帯域幅拡張モード又は第2の非ハーモニック帯域幅拡張モードのいずれかを示す帯域幅拡張制御データを含む符号化済みオーディオ信号(101)を復号化する装置は、第1のハーモニック帯域幅拡張モード又は第2の非ハーモニック帯域幅拡張モードのいずれかを示す帯域幅拡張制御データを含む符号化済みオーディオ信号を受信するための入力インターフェイス(100)と、第2の非ハーモニック帯域幅拡張モードを使用してオーディオ信号(101)を復号化するためのプロセッサ(102)と、符号化済み信号に対して帯域幅拡張制御データが第1のハーモニック帯域幅拡張モードを示している場合でも、第2の非ハーモニック帯域幅拡張モードを使用してオーディオ信号を復号化するようプロセッサ(102)を制御するためのコントローラ(104)と、を備える。【選択図】図1a

Description

本発明はオーディオ処理に関し、特に低減された演算資源を用いて符号化済みオーディオ信号を復号化する概念に関するものである。
「スピーチ及びオーディオ統合符号化」(USAC)標準(非特許文献1)は、ハーモニック転換器を用いたハーモニック帯域幅拡張ツールHBEを標準化しており、このツールはスペクトル帯域複製(SBR)システムの拡張であり、非特許文献1及び2においてそれぞれ標準化されている。
SBRは、所与の低周波数部分を所与のサイド情報と一緒に使用することによって、帯域幅制限されたオーディオ信号の高周波コンテンツを合成する。SBRツールは非特許文献2に記載されており、強化されたSBR、つまりeSBRは非特許文献1に記載されている。位相ボコーダを用いるハーモニック帯域幅拡張HBEはeSBRの一部であり、標準的なSBR処理において実行されるコピーパッチング(copy-up patching)された信号の中で度々観測される聴覚的粗さを避けるために発展してきた。HBEの主たる目的は、eSBRを適用しながら、所与のオーディオ信号の合成された高周波領域におけるハーモニックな構造を保存することである。
符号器がHBEツールの使用を選択できる一方で、非特許文献1に適合する復号器は、HBE関連データの復号化及び適用を提供しなければならない。
リスニング試験(非特許文献3)は、HBEを使用することで、非特許文献1に従って復号化されたビットストリームの知覚的オーディオ品質を改善するであろうことを示している。
HBEツールは、従来のSBRシステムの単純なコピーパッチングを、先進的な信号処理手順によって置き換えるものである。これら手順は、フィルタ状態及び遅延ラインのために、かなりの量の処理パワーとメモリとを必要とする。これとは対照的に、コピーパッチングの演算複雑性は無視できる。
HBEについて観測された複雑性の増大は、パーソナルコンピュータ装置については問題にならない。しかしながら、復号器チップを設計するチップ製作者は、演算上の作業量とメモリ消費に関して、確実で複雑性の低い制約を求めている。その一方で、聴覚的粗さを避ける目的で、HBE処理が望まれている。
USAC−ビットストリームは、非特許文献1に記載のように復号化される。このことは、非特許文献1の7.5.3に記載のように、HBE復号器ツールの実装を必然的に暗示している。このツールは、eSBR処理を含む全てのコーデック作動ポイントにおいて信号伝達され得る。非特許文献1のプロファイルと適合基準を満足する復号器装置にとって、このことは、演算上の作業量とメモリ消費の全体が、最悪の場合には有意に増大することを意味している。
演算複雑性における実際の増大は、実装とプラットフォームに依存する。オーディオチャネル毎のメモリ消費の増大は、メモリが最適化された現在の実装においては、実際のHBE処理について少なくとも15kワードである。
[1]ISO/IEC 23003-3:2012: "Unified speech and audio coding" [2]ISO/IEC 14496-3:2009: "Audio" [3]ISO/IEC JTCI/SC29/WG11 MPEG2011/N12232: "USAC Verification Test Report"
本発明の目的は、現存の符号化済みオーディオ信号を処理するために、低い演算量でかつそれにも拘わらず適切な、符号化済みオーディオ信号を復号化する改良された概念を提供することである。
この目的は、請求項1に従う符号化済みオーディオ信号を復号化する装置、請求項13に従う符号化済みオーディオ信号を復号化する方法、又は請求項14に従うコンピュータプログラムによって達成される。
本発明は、次のような知見に基づいている。すなわち、ハーモニック帯域幅拡張モードを使用して復号化されるべき部分を含み、非ハーモニック帯域幅拡張モードを使用して復号化されるべき部分をさらに含むオーディオ信号が、全体信号に亘って非ハーモニック帯域幅拡張モードだけを使用して復号化される場合、低減されたメモリ資源を必要とするオーディオ復号化概念が達成されるという知見である。換言すれば、ある信号がハーモニック帯域幅拡張モードを使用して復号化されるべく信号伝達されている部分又はフレームを含む場合であっても、これら部分又はフレームが非ハーモニック帯域幅拡張モードを使用して復号化されるということである。この目的で、非ハーモニック帯域幅拡張モードを使用してオーディオ信号を復号化するためのプロセッサが提供され、加えて、符号化済みオーディオ信号内に含まれた帯域幅拡張制御データがそのオーディオ信号について第1の−つまりハーモニックな−帯域幅拡張モードを示す場合であっても、第2の非ハーモニック帯域幅拡張モードを使用してオーディオ信号を復号化するようにプロセッサを制御するために、その装置内にコントローラが実装されるか、又は復号化の方法の中で制御ステップが実行される。それ故、プロセッサは、演算的に非常に効率的な非ハーモニック帯域幅拡張モードにだけ対応するための、メモリ及び処理パワーのような対応するハードウエア資源だけを持って実装されればよい。他方で、オーディオ復号器は、許容可能な品質を持つ復号化済み信号を得るために、符号化済みオーディオ信号を受け入れかつハーモニック帯域幅拡張モードを用いて復号化することもできる。換言すれば、低い演算資源要求アプリケーションに対しては、たとえ符号化済みオーディオ信号それ自体が、内部に含まれた帯域幅拡張制御データによって、この信号の少なくとも複数の部分がハーモニック帯域幅拡張モードを使用して復号化されることを必要としたとしても、コントローラは、全体のオーディオ信号を、非ハーモニック帯域幅拡張モードを使用して復号化するように、プロセッサを制御するよう構成されている。このように、両方の帯域幅拡張モードを必要とする符号化済みオーディオ信号に対し、完全な後方互換性を維持しながら、演算資源を一方としオーディオ品質を他方とする二者間の良好な妥協が取得される。本発明は、特にUSAC復号器の演算量とメモリ要求を低減するという事実により有利である。さらに、好適な実施形態において、所定の又は標準化された非ハーモニック帯域幅拡張モードは、基本的に非ハーモニック帯域幅拡張モードのためには必要でない帯域幅拡張モードデータをできるだけ再利用するためにビットストリーム内で伝送されたハーモニック帯域幅拡張モードデータを使用して修正され、その非ハーモニック帯域幅拡張モードのオーディオ品質が改善される。このように、USAC標準(非特許文献1)において開示された位相ボコーダ処理に典型的に基づいているハーモニック帯域幅拡張モードを省略することに起因する知覚的品質の障害を緩和するために、この好適な実施形態において、代替的復号化スキームが提案される。
一実施形態では、符号化済みオーディオ信号が符号化済みステレオ又は多チャネルオーディオ信号である場合、プロセッサは第2の非ハーモニック帯域幅拡張モードを使用して符号化済みオーディオ信号を復号化するのに十分なメモリ資源と処理資源とを有する一方で、そのメモリ資源又は処理資源は第1のハーモニック帯域幅拡張モードを使用して符号化済みオーディオ信号を復号化するのには十分でない。これと対照的に、符号化済みオーディオ信号が符号化済みモノラル信号である場合、プロセッサは第2の非ハーモニック帯域幅拡張モードを使用し、かつ第1のハーモニック帯域幅拡張モードを使用して、符号化済みオーディオ信号を復号化するのに十分なメモリ資源と処理資源とを有する。なぜなら、モノラル復号化のための資源は、ステレオ又は多チャネル復号化のための資源に比べて低減されるからである。よって、利用可能な資源はビットストリーム構成、すなわちツールとサンプリングレート等との組合せに依存する。例えば、資源はハーモニックBWEを使用してモノラルビットストリームを復号化するのには十分であるが、プロセッサはハーモニックBWEを使用してステレオビットストリームを復号化するためには資源不足となる可能性がある。
以下に、好適な実施形態について添付の図面を参照しながら以下に説明する。
限られた資源のプロセッサを使用して符号化済みオーディオ信号を復号化するための装置の一実施形態を示す。 両方の帯域幅拡張モードについての符号化済みオーディオ信号データの一例を示す。 USAC標準復号器と新規な復号器とを示す表である。 図1aのコントローラを構成するための実施形態のフローチャートを示す。 共通の帯域幅拡張ペイロードデータと追加のハーモニック帯域幅拡張データとを有する、符号化済みオーディオ信号の他の構造を示す。 標準の非ハーモニック帯域幅拡張モードを修正するためのコントローラの構成を示す。 コントローラの他の構成を示す。 改良された非ハーモニック帯域幅拡張モードの一構成を示す。 プロセッサの好適な構成を示す。 単一チャネル要素のための復号化手順のシンタックスを示す。 チャネルペア要素のための復号化手順のシンタックスの前半を示す。 チャネルペア要素のための復号化手順のシンタックスの後半を示す。 改良された非ハーモニック帯域幅拡張モードの他の構成を示す。 図8aに示されたデータの概要を示す。 コントローラによって実行された非ハーモニック帯域幅拡張モードの改良の他の構成を示す。 パッチングバッファとそのパッチングバッファのコンテンツのシフトとを示す。 非ハーモニック帯域幅拡張モードの好ましい修正の説明を示す。
図1aは、符号化済みオーディオ信号を復号化する装置の一実施形態を示す。符号化済みオーディオ信号は、第1のハーモニック帯域幅拡張モード又は第2の非ハーモニック帯域幅拡張モードのいずれかを示す、帯域幅拡張制御データを含む。符号化済みオーディオ信号はライン101によって入力インターフェイス100に入力される。入力インターフェイスはライン108を介して限られた資源のプロセッサ102に接続されている。さらに、少なくとも任意にライン106を介して入力インターフェイス100に接続され、さらにライン110を介してプロセッサ102に接続されている、コントローラ104が設けられている。プロセッサ102の出力は、符号112で示すような復号化済みオーディオ信号である。入力インターフェイス100は、符号化済みオーディオ信号の1フレームのような符号化済み部分について、第1のハーモニック帯域幅拡張モード又は第2の非ハーモニック帯域幅拡張モードのいずれかを示す、帯域幅拡張制御データを含む符号化済みオーディオ信号を受信するよう構成されている。プロセッサ102は、図1aのライン110の近傍に示すように、第2の非ハーモニック帯域幅拡張モードのみを使用してオーディオ信号を復号化するよう構成されている。このことは、コントローラ104によって確実になる。コントローラ104は、たとえ帯域幅拡張制御データが符号化済みオーディオ信号について第1のハーモニック帯域幅拡張モードを示していても、第2の非ハーモニック帯域幅拡張モードを使用してそのオーディオ信号を復号化するよう、プロセッサ102を制御するよう構成されている。
図1bは、データストリーム又はビットストリーム内の符号化済みオーディオ信号の好ましい構成を示している。符号化済みオーディオ信号は、全体のオーディオ項目についてのヘッダ114を含み、かつ全体のオーディオ項目はフレーム1(116)、フレーム2(118)及びフレーム3(120)のような一連のフレームの中に組織化されている。各フレームはさらに、フレーム1についてのヘッダ116aのような関連ヘッダとフレーム1についてのペイロードデータ116bとを有している。さらに、第2フレーム118も、ヘッダデータ118aとペイロードデータ118bとを有する。同様に、第3フレーム120も、ヘッダ120aとペイロードデータブロック120bとを有する。USAC標準においては、ヘッダ114はフラグ「harmonicSBR」を有する。もしこのフラグ「harmonicSBR」が0であれば、USAC標準に定義されているように、全体のオーディオ項目は非ハーモニック帯域幅拡張モードを使用して復号化される。この文脈においてUSAC標準については、ISO/IEC 1449-3:2009,オーディオ部門である高効率AAC標準(HE−AAC)を参照されたい。しかしながら、harmonicSBRフラグが1の値を有する場合には、ハーモニック帯域幅拡張モードが有効化され、各フレームについて0又は1であり得る個別フラグsbrPatchingModeによって信号伝達され得る。この文脈の中で、2つのフラグの異なる値を示す図1cを参照されたい。このように、フラグharmonicSBRが1で、フラグsbrPatchingModeが0である場合には、USAC標準復号器はハーモニック帯域幅拡張モードを実行する。しかしながら、図1cの130で示される場合、図1aのコントローラ104は、プロセッサ102に非ハーモニック帯域幅拡張モードを実行させるよう制御する。
図2は、本発明の手順の好ましい構成を示す。ステップ200では、入力インターフェイス100又は復号化装置の中の他のエンティティが符号化済みオーディオから帯域幅拡張制御データを読み出し、この帯域幅拡張制御データが1フレーム当り1つの指示となり得るか、又は、もし可能なら、USAC標準に関して図1bの文脈において説明したように、1項目当り1つの追加指示となり得る。ステップ202では、プロセッサ102は帯域幅拡張制御データを受け取り、その帯域幅拡張制御データを図1aのプロセッサ102内に実装されている特異な制御レジスタに格納する。次に、ステップ204では、コントローラ104がこのプロセッサ制御レジスタにアクセスし、そして206に示すように、この制御レジスタを非ハーモニック帯域幅拡張を示す値で上書きする。この点は、USACシンタックス内で、単一チャネル要素については図6の符号600で、又はsbr_channel_pair_elementについては図7aのステップ700及び図7bのステップ702、704でそれぞれ示されるように、例示的に示されている。特に、図2のブロック206において示された「上書き」は、USACシンタックス内に行600、700、702、704を挿入することによって実行され得る。特に、図6の残りの部分はISO/IEC DIS 23003-3の表41に対応しており、図7a,7bはISO/IEC DIS 23003-3の表42に対応している。この国際標準は、参照によってその全体が本願に組み込まれる。この標準の中で、図6及び図7a,7bにおける全てのパラメータ/値の詳細な定義が付与されている。
特に、600、700、702、704で示されたハイレベルシンタックス内の追加行は次のことを示している。すなわち、602においてビットストリームから読み出された値sbrPatchingModeとは関係なく、sbrPatchingModeフラグは1に設定される。即ち、復号器におけるさらなる処理に対し、非ハーモニック帯域幅拡張モードが実行されるべきことを信号伝達している。重要な点は、シンタックス行600が、604で示されるsbrOversampllingFlag, sbrPitchInBinsFlag及びsbrPitchInBinsからなる特異なハーモニック帯域幅拡張データの復号器側の読み出しの後に配置されていることである。それ故、図6に示され、同様に図7aにも示されるように、符号化済みオーディオ信号は、両方の帯域幅拡張モード、すなわち非ハーモニック帯域幅拡張モードとハーモニック帯域幅拡張モードとについて共通の帯域幅拡張ペイロードデータ606を含んでおり、かつ604で示すようにハーモニック帯域幅拡張モードについて特異な追加のデータを含んでいる。この点は図3aの文脈の中でも後述されるであろう。変数「lpHBE」は本発明の手順、すなわち「低いパワーのハーモニック帯域幅拡張」モードを示しており、このモードは非ハーモニック帯域幅拡張モードであるが、「ハーモニック帯域幅拡張」に関して後述するような追加の修正が加えられたモードである。
好適には、図1aに示すように、プロセッサ102は限られた資源のプロセッサである。特に、限られた資源の資源プロセッサ102は、第2の非ハーモニック帯域幅拡張モードを用いてオーディオ信号を復号化するのに十分な処理資源とメモリ資源とを有する。しかしながら、特にそのメモリ又は処理資源は第1のハーモニック帯域幅拡張モードを用いてオーディオ信号を復号化するのには十分でない。図3aで示すように、1フレームは、ヘッダ300と、共通の帯域幅拡張ペイロードデータ302と、ピッチ、ハーモニックグリッドなどに関するデータのような追加のハーモニック帯域幅拡張データ304と、さらに追加的に符号化済みコアデータ306とを含む。しかしながら、これらデータ項目の順序は、図3aと相違していてもよい。異なる好適な実施形態においては、符号化済みコアデータが最初である。次に、sbrPatchingModeフラグ/ビットを有するヘッダ300が続き、追加のHBEデータ304が後続し、最後に共通の帯域幅拡張ペイロードデータ302が続く。
追加のハーモニック帯域幅拡張データは、USACの例において、図6の文脈の中で項目604として説明したように、7ビットからなるsbrPitchInBins情報である。特に、USAC標準で示したように、データsbrPitchInBinsはSBRハーモニック転換器において、外積項目(cross-product terms)の加算を制御している。sbrPitchInBinsは0〜127の間の範囲における整数値であり、コアコーダのサンプリング周波数に対して作動している1536−DFTについて、周波数binで測定された距離を表している。特に、sbrPitchInBins情報を使用して、ピッチ又はハーモニックグリッドが決定され得ることが発見された。この点は、図8bの式(1)の中で示されている。このハーモニックグリッドを計算するために、sbrPitchInBins及びsbrRatioの値が計算され、ここでSBR比は上述の図8bにおいて示される通りであり得る。
当然ながら、ハーモニックグリッド、ピッチ、又はハーモニックグリッドを定義している基本トーンの他の指示がビットストリーム内に含まれ得る。このデータは第1のハーモニック帯域幅拡張モードを制御するために使用され、本発明の一実施形態では、いかなる修正もない非ハーモニック帯域幅拡張モードが実行されるように、廃棄され得る。しかしながら、他の実施形態では、図3b及び他の図に示すように、単純な非ハーモニック帯域幅拡張モードはハーモニック帯域幅拡張モードについての制御データを使用して修正される。換言すれば、符号化済みオーディオ信号は、第1のハーモニック帯域幅拡張モードと第2の非ハーモニック帯域幅拡張モードとについての共通の帯域幅拡張ペイロードデータ302を含み、かつ第1のハーモニック帯域幅拡張モードについての追加的ペイロードデータ304を含む。この文脈で、図1に示されたコントローラ104は、プロセッサ102を制御するために追加的ペイロードデータを使用するよう構成され、それは、如何なる修正もなしに第2の非ハーモニック帯域幅拡張モードでパッチング操作を行う場合に比べて、プロセッサによって実行されるパッチング操作を修正するためである。この目的で、プロセッサ102は図3bに示されるようなパッチングバッファを有することが望ましく、そのバッファの具体的な構成は図8dに関して例示的に説明される。
さらなる実施形態において、第1のハーモニック帯域幅拡張モードについての追加的ペイロードデータ304は、符号化済みオーディオ信号のハーモニック特性に関する情報を含み、このハーモニック特性は、sbrPitchInBinsデータ、他のハーモニックグリッドデータ、基本トーンデータ、又は如何なる他のデータであってもよく、他のデータとは、符号化済みオーディオ信号の対応する部分のハーモニックグリッド、基本トーン、又はピッチがそのデータから導出され得るデータのことである。コントローラ104は、符号化済みオーディオ信号を復号化する際にパッチング操作を実行するために、プロセッサ102によって使用されるパッチングバッファのパッチングバッファコンテンツを修正するよう構成されており、それにより、パッチ信号のハーモニック特性がパッチングバッファを修正しないパッチ済み信号に比べて前記ハーモニック特性により近くなる。
この目的で、図9を参照されたい。ここでは、符号900において、ハーモニックグリッドk・f0におけるスペクトルラインを有するオリジナルスペクトルを示し、ハーモニックラインは1からNまで延びている。さらに、基本トーンf0は、この実例では3に等しく、その結果、ハーモニックグリッドは3の全ての倍数を含む。さらに、項目902はパッチング前の復号化済みコアスペクトルを示している。特に、クロスオーバー周波数x0は16の位置で示され、パッチソースは周波数ライン4から周波数ライン10まで延びるように示されている。パッチソースの開始及び/又は終了周波数は、好ましくは符号化済みオーディオ信号の中で信号伝達され、典型的には図3aの共通の帯域幅拡張ペイロードデータ302の中のデータとして信号伝達される。項目904は項目902と同じ状況を示しているが、906に追加的に計算されたハーモニックグリッドk・f0を有している。さらに、パッチ目標(patch destination)908が示されている。このパッチ目標は、図3aの共通の帯域幅拡張ペイロードデータ302の中に好ましくは追加的に含まれる。よって、パッチソースは903で示すようにソース範囲の低域周波数を示しており、パッチ目標はパッチ目標の低域側境界を示している。もし、910で示すように典型的な非ハーモニックなパッチングが適用された場合には、パッチ済みデータの調性ライン又はハーモニックラインと計算されたハーモニックグリッド906との間に不一致が存在することが見て取れるであろう。それ故、従来のSBRパッチング、単純なUSAC又は高効率AACの非ハーモニックパッチングモードでは、誤ったハーモニックグリッドを持つパッチを導入することになる。この問題を解決するため、プロセッサによってこの単純な非ハーモニックパッチの修正が実行される。修正の一つの方法は、パッチングバッファのコンテンツを回転させること、別の言い方をすれば、ハーモニックラインの周波数における距離を変化させずに、ハーモニックラインをパッチング帯域内で移動させることである。パッチのハーモニックグリッドをパッチング前の復号化済みスペクトルの計算されたハーモニックグリッドに一致させる他の方法は、当業者にとって自明のことである。本発明のこの好ましい実施形態では、符号化済みオーディオ信号内に共通の帯域幅拡張ペイロードデータと共に含まれている追加のハーモニック帯域幅拡張データは、単純に廃棄されるのではなく、典型的にはビットストリーム内で信号伝達されている非ハーモニック帯域幅拡張モードを修正することによって、オーディオ品質を改善するために再利用される。しかしながら、修正された非ハーモニック帯域幅拡張モードが依然として隣接する周波数binのセットの隣接する周波数binのセットへのコピー操作に依存する非ハーモニック帯域幅拡張モードであるという事実により、この手順は、単純な非ハーモニック帯域幅拡張モードを実行する場合に比べてメモリ資源の増量という結果を招くことがない一方で、図9の912で示すようにハーモニックグリッドの一致により、再生された信号のオーディオ品質を有意に強化する。
図3cは、図3bのコントローラ104によって実行される好ましい構成を示す。ステップ310では、コントローラ104は追加のハーモニック帯域幅拡張データからハーモニックグリッドを計算し、この目的で如何なる計算が実行されてもよいが、USACの文脈においては、図8bの式(1)が実行される。さらに、ステップ312ではパッチングソース帯域及びパッチング目標帯域が決定され、すなわち、この決定は基本的に、共通の帯域幅拡張データからパッチソースデータ903とパッチ目標データ908とを読み出すことを含んでも良い。しかしながら、他の実施形態においては、このデータは予め定義されており、従って既に復号器側に知られており、必ずしも伝送される必要はない。
ステップ314では、パッチングソース帯域が周波数境界内で修正される。つまりパッチソースのパッチ境界は、伝送されたデータに比べて変更されない。この修正は、パッチングの前、つまりパッチデータが902で示されたパッチングの前のコア又は復号化済みスペクトルに関連しているとき、又はパッチコンテンツが高周波数領域に既に転換された後、のいずれでも実行可能であり、すなわち図9の中でパッチングが矢印914で示され、符号910と、回転がパッチングの後で実行された符号912とによって示されている。
このパッチング914又は「コピー」は、非ハーモニックパッチングであり、図9においては、周波数刻み6個分を持つパッチソースの広がりと、目標領域内の同じ周波数刻み6個分を持つ広がり、即ち、910又は912の広がりとを比べることによって、確認され得る。
この修正は、ハーニックグリッドと合致するパッチングソース帯域における周波数部分が、パッチングの後で、ハーニックグリッドと合致する目標周波数部分内に配置されるように、実行される。
好適には、図8dに示されるように、3つの異なる状態828、830、832で示されたパッチングバッファがプロセッサ102内に設けられている。プロセッサは図4内の400で示されるように、パッチングバッファをロードするよう構成されている。次に、コントローラは、追加の帯域幅拡張データと共通の帯域幅拡張データとを使用して、バッファシフト値を計算402するよう構成されている。次に、ステップ404では、計算されたバッファシフト値によってバッファコンテンツがシフトされる。項目830は、シフト値が「−2」であると計算された場合を示し、項目832は、2のシフト値がステップ402で計算され、+2によるシフトがステップ404で実行された場合のバッファ状態を示している。次に、図4の406で示されるように、パッチングバッファコンテンツを使用してパッチングが実行されるが、そのパッチは非ハーモニック方式で実行される。次に、ステップ408では、パッチ結果が共通の帯域幅拡張データを使用して修正される。そのような追加的に使用される共通の帯域幅拡張データは、高効率AAC又はUSACから知られているように、スペクトル包絡データ、ノイズデータ、特異なハーモニックライン上のデータ、逆フィルタリングデータ等であってもよい。
この目的で、図1aのプロセッサ102のさらなる詳細構成を示す図5を参照されたい。このプロセッサは、典型的には、コア復号器500と、パッチングバッファを有するパッチャ502と、パッチ修正器504と、結合器506とを含む。コア復号器は、符号化済みオーディオ信号を復号化して、図9の902に示されるように、パッチング前の復号化済みスペクトルを得るよう構成されている。次に、パッチングバッファを有するパッチャ502は、図9における操作914を実行する。パッチャ502は、図9の文脈の中で説明したように、パッチングの前又は後に、パッチングバッファの修正を実行する。パッチ修正器504は最後に、図4の408で示されたように、追加の帯域幅拡張データを使用してパッチ結果を修正する。次に、例えば合成フィルタバンク形式の周波数ドメイン結合器であり得る結合器506は、パッチ修正器504の出力とコア復号器500の出力、つまり低帯域信号とを結合して、図1aのライン112での出力として最終的に帯域幅拡張オーディオ信号を取得する。
図1bの文脈の中で既に説明した通り、帯域幅拡張制御データは、オーディオ項目について、図1bにおいて説明されたharmonicSBRのような第1の制御データエンティティを含んでも良く、このオーディオ項目は複数のオーディオフレーム116、118、120を含む。第1の制御データエンティティは、第1のハーモニック帯域幅拡張モードが前記複数のフレームについて活性か又は不活性かを示している。さらに、例示的にはUSAC標準におけるSBRパッチングモードに対応する第2の制御データエンティティが準備され、個別のフレームについて各ヘッダ116a,118a,120aの中に提供される。
図1aの入力インターフェイス100は、オーディオ項目についての第1の制御データエンティティと、複数のフレームの各フレームについての第2の制御データエンティティとを読み出すよう構成され、図1aのコントローラ104は、第1の制御データエンティティの値及び第2の制御データエンティティの値とは関係なく、第2の非ハーモニック帯域幅拡張モードを使用してオーディオ信号を復号化するように、プロセッサ102を制御するよう構成されている。
本発明の一実施形態では、図6及び図7a、7bにおいてシンタックス変更によって示されたように、USAC復号器は比較的高い複雑性を持つハーモニック帯域幅拡張計算をスキップするよう強制される。よって、もし600、700、702、704で示されるフラグlpHBEが非ゼロ値に設定されたとき、帯域幅拡張又は「低パワーHBE」が動作する。lpHBEフラグは、利用可能なハードウエア資源に依存して、復号器によって個別に設定されてもよい。ゼロ値は、復号器が完全な標準準拠、つまり図1bの第1と第2の制御データエンティティによって指示されるように動作するであろうことを意味している。しかしながら、もしこの値が1であれば、ハーモニック帯域幅拡張モードが信号伝達された場合でも、非ハーモニック帯域幅拡張モードがプロセッサによって実行されるであろう。
よって、本発明は、低い演算複雑性と低いメモリ消費とを必要とするプロセッサを、新たな復号化手順と共に提供している。非特許文献1に定義されたeSBRのビットストリームシンタックスは、HBE(非特許文献1)及び従来のSBR復号化(非特許文献2)の双方にとって共通のベースを共有している。しかしながら、HBEの場合には、追加情報がビットストリームの中に符号化される。本発明の好適な実施形態における「低複雑性HBE」復号器は、非特許文献1に従ってUSAC符号化済みデータを復号化し、全てのHBE特異情報を廃棄する。残りのeSBRデータは、次に従来のSBR(非特許文献2)アルゴリズムへと供給されかつそれによって解釈される。つまり、そのデータはハーモニック転換(harmonic transposition)に代えてコピーパッチング(非特許文献2)を適用するよう使用される。eSBR復号化メカニズムの修正は、シンタックス変更に関して、図6及び図7a,7bで示されている。さらに、好適な一実施形態においては、ビットストリームによって運ばれるsbrPitchInBins情報のような特異なHBE情報が再利用される。
従来のUSAC符号化済みビットストリームデータを用いて、sbrPitchInBins値がUSACフレームの中で伝送されてもよい。この値は、現在のUSACフレームのハーモニック構造を記述している情報を伝送するために、符号器によって決定されていた周波数値を反映している。標準HBE機能を使用せずにこの値を活用するために、以下の本発明方法がステップ毎に適用されるべきである。
1.ビットストリームからsbrPitchInBinsを抽出する。
USACビットストリームからビットストリーム要素sbrPitchInBinsを如何にして抽出するかの情報について、それぞれ表44及び表45を参照(非特許文献1)。
2.式(1)に従ってハーモニックグリッドを計算する。
Figure 2016539377
3.ソースパッチ開始サブバンドと目標パッチ開始サブバンドとの双方のハーモニックグリッドに対する距離を計算する。
図8aにおけるフローチャートは、開始及び終了パッチのハーモニックグリッドに対する距離をどのように計算するかについて、本発明アルゴリズムの詳細な説明を与えている。
harmonicGrid (hg) 式(1)に従うハーモニックグリッド
source_band 図9のQMFパッチソース帯域903
dest_band 図9のQMFパッチ目標帯域908
p_mod_x ソース帯域mod hg
k_mod_x 目標帯域 mod hg
mod モジュロ演算
NINT 直近の整数への丸め操作
sbrRatio SBR比、即ち1/2,3/8又は1/4
pitchInBins ビットストリーム内で伝送されたピッチ情報
以下に、図8aについてさらに詳細に説明する。好適には、この制御すなわち全体の計算は図1aのコントローラ104内で実行される。ステップ800では、ハーモニックグリッドが図8bに示すように式(1)に従って計算される。次に、ハーモニックグリッドhgが2より小さいかどうかが判定される。もしそうでない場合には、次に制御はステップ810へ移行する。しかしながら、ハーモニックグリッドが2より小さいと判定された場合には、次にステップ804でソース帯域値が偶数かどうかを判定する。もしそうであれば、ハーモニックグリッドは2であると判定され、もしそうでないときには、ハーモニックグリッドは3に等しいと判定される。次に、ステップ810において、モジュロ計算が実行される。ステップ812では、両方のモジュロ計算が異なるかどうかが判定される。もしその結果が同じである場合には、手順は終了し、もし結果が異なる場合には、ブロック814内で示されるように、シフト値が両方のモジュロ計算結果の間の差分として計算される。次に、ステップ814でも示されるように、循環方式のバッファシフトが実行される。シフトを適用する場合に、好ましくは位相関係が考慮されるべきであることを注意する必要がある。この制御はブロック816で終了する。
要約すると、図8cに示されるように、全体の手順は、820で示されるようにビットストリームからsbrPitchInBins情報を抽出するステップを含む。次に、コントローラは、822で示されるようにハーモニックグリッドを計算する。次に、ステップ824において、ソース開始サブバンドと目標開始サブバンドとのハーモニックグリッドに対する両方の距離が計算され、その計算は、好適な実施形態では、ステップ810に対応する。最後に、ブロック826で示すように、QMFバッファシフト、すなわち高効率AAC非ハーモニック帯域幅拡張のQMFドメイン内での循環シフトが実行される。
QMFバッファシフトでは、たとえ非ハーモニック帯域幅拡張手順が実行されていても、伝送されたsbrPitchInBins情報に従って信号のハーモニック構造が再構成される。
これまで幾つかの特徴を符号化又は復号化装置の文脈で説明してきたが、これら特徴はまた対応する方法の記述を表現していることは明白であり、そこではブロック又は装置は方法ステップ又は方法ステップの特徴に対応している。同様に、方法ステップの文脈で説明された特徴はまた、対応するブロック又は項目の説明、又は対応する装置の特徴を表現している。方法ステップの幾つか又は全部は、例えばマイクロプロセッサ、プログラム可能なコンピュータ、又は電子回路などのハードウエア装置によって(を用いて)実行されてもよい。幾つかの実施形態では、最も重要な方法ステップの幾つか又はそれ以上がそのような装置によって実行されてもよい。
ある実装要件にもよるが、本発明の実施形態は、ハードウエア又はソフトウエアにおいて構成可能である。この構成は、非一時的記憶媒体、すなわちその中に格納された電子的に読み取り可能な制御信号を有し、本発明の各方法が実行されるようにプログラム可能なコンピュータシステムと協働する(又は協働可能な)、例えばフレキシブルディスク,ハードディスクトライブ(HDD),DVD,ブルーレイ,CD,ROM,PROM,EPROM,EEPROM又はフラッシュメモリなどのデジタル記憶媒体を使用して実行され得る。従って、そのデジタル記憶媒体はコンピュータ読み取り可能であり得る。
本発明に従う幾つかの実施形態は、上述した方法の1つを実行するようプログラム可能なコンピュータシステムと協働可能で、電子的に読み取り可能な制御信号を有するデータキャリアを含む。
一般的に、本発明の実施例は、プログラムコードを有するコンピュータプログラム製品として構成することができ、そのプログラムコードは当該コンピュータプログラム製品がコンピュータ上で作動するときに、本発明の方法の一つを実行するよう作動可能である。そのプログラムコードは、例えば機械読み取り可能なキャリアに格納されていても良い。
本発明の他の実施形態は、上述した方法の1つを実行するための、機械読み取り可能なキャリアに格納されたコンピュータプログラムを含む。
換言すれば、本発明方法の一実施形態は、そのコンピュータプログラムがコンピュータ上で作動するときに、上述した方法の1つを実行するためのプログラムコードを有するコンピュータプログラムである。
本発明の他の実施形態は、上述した方法の1つを実行するために記録されたコンピュータプログラムを含む、データキャリア(又はデジタル記憶媒体、又はコンピュータ読み取り可能な媒体)である。データキャリア、デジタル記憶媒体、又は記録された媒体は、典型的には有形であり、及び/又は非一時的である。
本発明の他の実施形態は、上述した方法の1つを実行するためのコンピュータプログラムを表現するデータストリーム又は信号列である。そのデータストリーム又は信号列は、例えばインターネットのようなデータ通信接続を介して伝送されるよう構成されても良い。
他の実施形態は、上述した方法の1つを実行するように構成又は適応された、例えばコンピュータ又はプログラム可能な論理デバイスのような処理手段を含む。
他の実施形態は、上述した方法の1つを実行するためのコンピュータプログラムがインストールされたコンピュータを含む。
本発明に従う他の実施形態は、ここで説明した方法の1つを実行するためのコンピュータプログラムを受信機へ(例えば電子的に又は光学的に)伝送するよう構成された、装置又はシステムを含む。受信機は、例えばコンピュータ、携帯機器、メモリーデバイス又はそれらの類似物であってもよい。装置又はシステムは、例えばコンピュータプログラムを受信機へと転送するファイルサーバを含んでもよい。
幾つかの実施形態においては、(例えば書換え可能ゲートアレイのような)プログラム可能な論理デバイスが、上述した方法の幾つか又は全ての機能を実行するために使用されても良い。幾つかの実施形態では、書換え可能ゲートアレイが、上述した方法の1つを実行するためにマイクロプロセッサと協働しても良い。一般的に、そのような方法は、好適には任意のハードウエア装置によって実行される。
上述した実施形態は、本発明の原理を単に例示的に示したに過ぎない。本明細書に記載した構成及び詳細について修正及び変更が可能であることは、当業者にとって明らかである。従って、本発明は、添付した特許請求の範囲によってのみ限定されるべきであり、本明細書に実施形態の説明及び解説の目的で提示した具体的詳細によって限定されるものではない。
本発明の一実施形態では、図6及び図7a、7bにおいてシンタックス変更によって示されたように、USAC復号器は比較的高い複雑性を持つハーモニック帯域幅拡張計算をスキップするよう強制される。よって、もし600、700、702、704で示されるフラグlpHBEが非ゼロ値に設定されたとき、非ハーモニック帯域幅拡張又は「低パワーHBE」が動作する。lpHBEフラグは、利用可能なハードウエア資源に依存して、復号器によって個別に設定されてもよい。ゼロ値は、復号器が完全な標準準拠、つまり図1bの第1と第2の制御データエンティティによって指示されるように動作するであろうことを意味している。しかしながら、もしこの値が1であれば、ハーモニック帯域幅拡張モードが信号伝達された場合でも、非ハーモニック帯域幅拡張モードがプロセッサによって実行されるであろう。

Claims (14)

  1. 第1のハーモニック帯域幅拡張モード又は第2の非ハーモニック帯域幅拡張モードのいずれかを示す帯域幅拡張制御データを含む符号化済みオーディオ信号(101)を復号化する装置であって、
    前記第1のハーモニック帯域幅拡張モード又は前記第2の非ハーモニック帯域幅拡張モードのいずれかを示す前記帯域幅拡張制御データを含む前記符号化済みオーディオ信号を受信するための入力インターフェイス(100)と、
    前記第2の非ハーモニック帯域幅拡張モードを使用して、前記オーディオ信号(101)を復号化するためのプロセッサ(102)と、
    前記帯域幅拡張制御データが前記符号化済み信号について前記第1のハーモニック帯域幅拡張モードを示している場合でも、前記第2の非ハーモニック帯域幅拡張モードを使用して前記オーディオ信号を復号化するよう、前記プロセッサ(102)を制御するためのコントローラ(104)と、
    を備える装置。
  2. 請求項1に記載の装置において、前記プロセッサ(102)は、前記第2の非ハーモニック帯域幅拡張モードを使用して前記符号化済みオーディオ信号を復号化するのに十分なメモリ資源及び処理資源を有し、前記メモリ又は処理資源は前記第1のハーモニック帯域幅拡張モードを使用して前記符号化済みオーディオ信号を復号化するのには十分でない、装置。
  3. 請求項1又は2に記載の装置において、
    前記入力インターフェイス(100)は前記帯域幅拡張制御データを読み出し、前記符号化済みオーディオ信号が前記第1のハーモニック帯域幅拡張モード又は前記第2の非ハーモニック帯域幅拡張モードのいずれを使用して復号化されるべきかを決定し、かつ前記帯域幅拡張制御データをプロセッサ制御レジスタ内に格納するよう構成され、
    前記コントローラ(104)は前記プロセッサ制御レジスタにアクセスし、前記入力インターフェイス(100)が前記第1のハーモニック帯域幅拡張モードを示す値を格納していた場合に、前記第2の非ハーモニック帯域幅拡張モードを示す値によって前記プロセッサ制御レジスタ内の値を上書きするよう構成されている、装置。
  4. 請求項1乃至3のいずれか1項に記載の装置において、前記符号化済みオーディオ信号は前記第1のハーモニック帯域幅拡張モードと前記第2の非ハーモニック帯域幅拡張モードとについて共通の帯域幅拡張ペイロードデータ(302)を含み、かつ前記第1のハーモニック帯域幅拡張モードのみについての追加的ペイロードデータ(304)を含み、
    前記コントローラ(104)は、前記追加的ペイロードデータ(304)を使用して、前記第2の非ハーモニック帯域幅拡張モードにおけるパッチング操作に比べて、前記プロセッサによって実行されるパッチング操作を修正するように前記プロセッサ(102)を制御するよう構成され、前記修正されたパッチング操作は非ハーモニックパッチング操作である、装置。
  5. 請求項4に記載の装置において、
    前記追加的ペイロードデータ(304)は、前記符号化済みオーディオ信号のハーモニック特性に関する情報を含み、
    前記コントローラ(104)は、前記符号化済みオーディオ信号を復号化する際にパッチング操作を実行するため、前記プロセッサ(102)によって使用されるパッチングバッファのパッチングバッファコンテンツ(828、830、832)を、パッチ済み信号のハーモニック特性が前記パッチングバッファコンテンツを修正しないパッチ済み信号のハーモニック特性に比べて前記ハーモニック特性により近くなるように、修正するよう構成されている、装置。
  6. 請求項4又は5に記載の装置において、
    前記コントローラ(104)は、
    前記追加的ペイロードデータからピッチ周波数を示すハーモニックグリッドを計算(310)し、
    周波数境界を持つパッチングソース帯域と周波数境界を持つパッチング目標帯域とについて、パッチングソース情報とパッチング目標情報とを決定(312)し、
    前記ハーモニックグリッドに合致しているパッチングソース帯域内の周波数部分が、パッチング(914)の後に、前記ハーモニックグリッドに合致している目標周波数部分(912)内に配置されるように、パッチング(914)操作の前又は後に、前記パッチングソース帯域内の前記データを前記周波数境界内で修正(314)する、
    よう構成されている装置。
  7. 請求項4乃至6のいずれか1項に記載の装置において、
    前記プロセッサ(102)はパッチングバッファを備え、
    前記プロセッサは前記共通の帯域幅拡張ペイロードデータを使用して前記パッチングバッファをロード(400)するよう構成され、
    前記コントローラは、前記符号化済みオーディオ信号のハーモニックグリッドを示す追加の帯域幅拡張データを使用し、パッチソース帯域情報(903)及びパッチ目標帯域情報(908)を使用して、バッファシフト値を計算(402)するよう構成され、
    前記コントローラは、バッファコンテンツに対してバッファシフト操作を生じさせる(404)よう構成され、
    前記プロセッサ(102)は前記バッファシフト値によってシフトされた前記バッファコンテンツを使用してパッチ済みデータを生成(406、408)するよう構成されている、装置。
  8. 請求項7に記載の装置において、前記コントローラは循環方式の前記バッファシフト操作を生じさせる(404)よう構成されている、装置。
  9. 請求項1乃至8のいずれか1項に記載の装置において、
    前記プロセッサは、
    コア符号化済みオーディオ信号(902)を復号化するコア復号器(500)と、
    前記符号化済みオーディオ信号からの帯域幅拡張データを使用して、前記コア符号化済みオーディオ信号のソース周波数領域を、前記非ハーモニック帯域幅拡張モードに従って目標周波数領域へパッチングするパッチャ(502)と、
    前記符号化済みオーディオ信号からの帯域幅拡張データを使用して、前記目標周波数領域におけるパッチ済み信号を修正するパッチ修正器(504)と、を備える装置。
  10. 請求項1乃至9のいずれか1項に記載の装置において、
    前記帯域幅拡張制御データは、複数のオーディオのフレームを含む1つのオーディオ項目についての第1の制御データエンティティ(114)と、前記符号化済みオーディオ信号の各フレームについての第2の制御データエンティティ(116a,118a,120a)とを含み、前記第1の制御データエンティティは前記第1のハーモニック帯域幅拡張モードが前記複数のフレームについて活性か又は不活性かを示し、前記第2の制御データエンティティは前記第1のハーモニック帯域幅拡張モードが前記符号化済みオーディオ信号の各個別のフレームについて活性か又は不活性かを示しており、
    前記入力インターフェイス(100)は、前記オーディオ項目についての前記第1の制御データエンティティと前記複数のフレームの各フレームについての前記第2の制御データエンティティとを読み出すよう構成され、
    前記コントローラ(104)は、第1の制御データエンティティの値及び第2の制御データエンティティの値とは関係なく、前記第2の非ハーモニック帯域幅拡張モードを使用して前記オーディオ信号を復号化するように、前記プロセッサ(102)を制御するよう構成されている、装置。
  11. 請求項1乃至10のいずれか1項に記載の装置において、
    前記符号化済みオーディオ信号はUSAC標準によって定義されたビットストリームであり、
    前記プロセッサ(102)は前記USAC標準によって定義された前記第2の非ハーモニック帯域幅拡張モードを実行するよう構成され、
    前記入力インターフェイスは前記USAC標準に従って前記符号化済みオーディオ信号を含む前記ビットストリームを解析するよう構成されている、装置。
  12. 請求項1乃至11のいずれか1項に記載の装置において、
    前記符号化済みオーディオ信号が符号化済みステレオ又は多チャネルオーディオ信号である場合に、前記プロセッサ(102)は、前記第2の非ハーモニック帯域幅拡張モードを使用して前記符号化済みオーディオ信号を復号化するのに十分なメモリ資源及び処理資源を有し、前記メモリ又は処理資源は前記第1のハーモニック帯域幅拡張モードを使用して前記符号化済みオーディオ信号を復号化するのには十分でなく、
    前記符号化済みオーディオ信号が符号化済みモノラル信号である場合に、前記プロセッサ(102)は、前記第2の非ハーモニック帯域幅拡張モード及び前記第1のハーモニック帯域幅拡張モードを使用して、前記符号化済みオーディオ信号を復号化するのに十分なメモリ資源及び処理資源を有する、装置。
  13. 第1のハーモニック帯域幅拡張モード又は第2の非ハーモニック帯域幅拡張モードのいずれかを示す帯域幅拡張制御データを含む符号化済みオーディオ信号(101)を復号化する方法であって、
    前記第1のハーモニック帯域幅拡張モード又は前記第2の非ハーモニック帯域幅拡張モードのいずれかを示す前記帯域幅拡張制御データを含む前記符号化済みオーディオ信号を受信するステップ(100)と、
    前記第2の非ハーモニック帯域幅拡張モードを使用して、前記オーディオ信号(101)を復号化するステップ(102)と、
    前記帯域幅拡張制御データが前記符号化済み信号について前記第1のハーモニック帯域幅拡張モードを示している場合でも、前記第2の非ハーモニック帯域幅拡張モードを使用して前記オーディオ信号を復号化するよう、前記プロセッサ(102)を制御するステップ(104)と、
    を含む方法。
  14. コンピュータ上で作動するとき、請求項13に従って符号化済みオーディオ信号を復号化する方法を実行するためのコンピュータプログラム。
JP2016536886A 2013-12-09 2014-11-28 低演算資源を用いて符号化済みオーディオ信号を復号化する装置及び方法 Active JP6286554B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP13196305.0 2013-12-09
EP13196305.0A EP2881943A1 (en) 2013-12-09 2013-12-09 Apparatus and method for decoding an encoded audio signal with low computational resources
PCT/EP2014/076000 WO2015086351A1 (en) 2013-12-09 2014-11-28 Apparatus and method for decoding an encoded audio signal with low computational resources

Publications (2)

Publication Number Publication Date
JP2016539377A true JP2016539377A (ja) 2016-12-15
JP6286554B2 JP6286554B2 (ja) 2018-02-28

Family

ID=49725065

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016536886A Active JP6286554B2 (ja) 2013-12-09 2014-11-28 低演算資源を用いて符号化済みオーディオ信号を復号化する装置及び方法

Country Status (11)

Country Link
US (2) US9799345B2 (ja)
EP (2) EP2881943A1 (ja)
JP (1) JP6286554B2 (ja)
KR (1) KR101854298B1 (ja)
CN (1) CN105981101B (ja)
BR (1) BR112016012689B1 (ja)
CA (1) CA2931958C (ja)
ES (1) ES2650941T3 (ja)
MX (1) MX353703B (ja)
RU (1) RU2644135C2 (ja)
WO (1) WO2015086351A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018508831A (ja) * 2015-03-13 2018-03-29 ドルビー・インターナショナル・アーベー 少なくとも一つの充填要素内の向上スペクトル帯域複製メタデータを用いたオーディオ・ビットストリームのデコード

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW202341126A (zh) * 2017-03-23 2023-10-16 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
TWI809289B (zh) * 2018-01-26 2023-07-21 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體
CN114242088A (zh) * 2018-04-25 2022-03-25 杜比国际公司 具有减少后处理延迟的高频重建技术的集成
MX2020011206A (es) * 2018-04-25 2020-11-13 Dolby Int Ab Integracion de tecnicas de reconstruccion de alta frecuencia con retraso post-procesamiento reducido.

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011520146A (ja) * 2009-04-02 2011-07-14 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ハーモニックな帯域拡張と非ハーモニックな帯域拡張との組合せを使用して、入力信号表示に基づいて帯域拡張信号の表示を生成するための装置と方法及びコンピュータプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE9700772D0 (sv) * 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
US6850884B2 (en) * 2000-09-15 2005-02-01 Mindspeed Technologies, Inc. Selection of coding parameters based on spectral content of a speech signal
ES2291877T3 (es) * 2004-05-17 2008-03-01 Nokia Corporation Codificacion de audio con diferentes modelos de codificacion.
US8880410B2 (en) * 2008-07-11 2014-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
WO2010036061A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
ES2400661T3 (es) 2009-06-29 2013-04-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificación y decodificación de extensión de ancho de banda
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
CN102208188B (zh) * 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011520146A (ja) * 2009-04-02 2011-07-14 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ハーモニックな帯域拡張と非ハーモニックな帯域拡張との組合せを使用して、入力信号表示に基づいて帯域拡張信号の表示を生成するための装置と方法及びコンピュータプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
NAGEL, FREDRIK ET AL.: "A Continuous Modulated Single Sideband Bandwidth Extension", PROC. OF IEEE ICASSP2010, JPN6017024507, 14 March 2010 (2010-03-14), pages 357 - 360, XP031697766 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018508831A (ja) * 2015-03-13 2018-03-29 ドルビー・インターナショナル・アーベー 少なくとも一つの充填要素内の向上スペクトル帯域複製メタデータを用いたオーディオ・ビットストリームのデコード
JP2018508830A (ja) * 2015-03-13 2018-03-29 ドルビー・インターナショナル・アーベー 少なくとも一つの充填要素内の向上スペクトル帯域複製メタデータを用いたオーディオ・ビットストリームのデコード
US10134413B2 (en) 2015-03-13 2018-11-20 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element
US10262669B1 (en) 2015-03-13 2019-04-16 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element
US10262668B2 (en) 2015-03-13 2019-04-16 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element
US10453468B2 (en) 2015-03-13 2019-10-22 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element
US10553232B2 (en) 2015-03-13 2020-02-04 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element
US10734010B2 (en) 2015-03-13 2020-08-04 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element
US10943595B2 (en) 2015-03-13 2021-03-09 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element
US11367455B2 (en) 2015-03-13 2022-06-21 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element
US11417350B2 (en) 2015-03-13 2022-08-16 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element
US11664038B2 (en) 2015-03-13 2023-05-30 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element
US11842743B2 (en) 2015-03-13 2023-12-12 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element

Also Published As

Publication number Publication date
MX2016007430A (es) 2016-08-19
EP3080803B1 (en) 2017-10-04
US20170278522A1 (en) 2017-09-28
MX353703B (es) 2018-01-24
US10332536B2 (en) 2019-06-25
ES2650941T3 (es) 2018-01-23
CN105981101B (zh) 2020-04-10
CA2931958A1 (en) 2015-06-18
RU2644135C2 (ru) 2018-02-07
CA2931958C (en) 2018-10-02
CN105981101A (zh) 2016-09-28
US9799345B2 (en) 2017-10-24
US20160284359A1 (en) 2016-09-29
EP2881943A1 (en) 2015-06-10
EP3080803A1 (en) 2016-10-19
JP6286554B2 (ja) 2018-02-28
WO2015086351A1 (en) 2015-06-18
KR20160079878A (ko) 2016-07-06
KR101854298B1 (ko) 2018-05-03
BR112016012689B1 (pt) 2021-02-09

Similar Documents

Publication Publication Date Title
JP6407928B2 (ja) オーディオ処理システム
JP6155274B2 (ja) 過剰サンプリングされたsbrを使ったアップサンプリング
JP2020074013A (ja) マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ
ES2758799T3 (es) Método y aparato para codificar y decodificar una señal de audio y programas informáticos
JP5805796B2 (ja) 柔軟なコンフィギュレーション機能性を有するオーディオエンコーダおよびデコーダ
ES2535609T3 (es) Codificador de audio con estimación de ruido de fondo durante fases activas
JP5298245B2 (ja) Sbrビットストリームパラメータダウンミックス
TWI758146B (zh) 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
JP6286554B2 (ja) 低演算資源を用いて符号化済みオーディオ信号を復号化する装置及び方法
JP2008107415A (ja) 符号化装置
KR20170087529A (ko) 오디오 인코더 및 디코더
CN113936674A (zh) 用于音频信号的高频重建技术的回溯兼容集成
TW202006706A (zh) 具有減少後處理延遲之高頻重建技術之整合
KR20200012861A (ko) 디지털 오디오 신호에서의 차분 데이터
JP2004184975A (ja) 少ない計算量で高周波数成分を復元するオーディオデコーディング方法及び装置
ES2898281T3 (es) Control de ancho de banda en codificadores y/o decodificadores
RU2575390C2 (ru) Кодер аудио и декодер, имеющий гибкие функциональные возможности конфигурации
JP2005351977A (ja) オーディオ信号符号化装置及びオーディオ信号符号化方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160620

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160620

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170621

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170704

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170720

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180205

R150 Certificate of patent or registration of utility model

Ref document number: 6286554

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250