JP2014532904A - 過剰サンプリングされたsbrを使ったアップサンプリング - Google Patents

過剰サンプリングされたsbrを使ったアップサンプリング Download PDF

Info

Publication number
JP2014532904A
JP2014532904A JP2014540505A JP2014540505A JP2014532904A JP 2014532904 A JP2014532904 A JP 2014532904A JP 2014540505 A JP2014540505 A JP 2014540505A JP 2014540505 A JP2014540505 A JP 2014540505A JP 2014532904 A JP2014532904 A JP 2014532904A
Authority
JP
Japan
Prior art keywords
sbr
encoder
frequency component
sampling rate
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014540505A
Other languages
English (en)
Other versions
JP6155274B2 (ja
Inventor
ホーリッヒ,ホルガー
フリードリッヒ,トビアス
Original Assignee
ドルビー インターナショナル アーベー
ドルビー インターナショナル アーベー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー インターナショナル アーベー, ドルビー インターナショナル アーベー filed Critical ドルビー インターナショナル アーベー
Publication of JP2014532904A publication Critical patent/JP2014532904A/ja
Application granted granted Critical
Publication of JP6155274B2 publication Critical patent/JP6155274B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

エンコーダは、信号サンプリング・レート(fs_in)のオーディオ信号の低周波成分をエンコードするコア・エンコーダと、複数のSBRパラメータを決定するスペクトル帯域複製(SBR)エンコード・ユニット(153、254)とを有する。複数のSBRパラメータは、前記オーディオ信号の高周波成分が前記オーディオ信号の前記低周波成分および前記複数のSBRパラメータに基づいて近似されることができるよう、決定される。マルチプレクサが、前記コア・エンコードされたビットストリーム、前記複数のSBRパラメータおよび前記SBRエンコーダ(153、254)によって適用される一つまたは複数のSBRエンコーダ設定の指標を含む全体的なビットストリームを生成するよう適応される。生成された全体的なビットストリームは、前記コア・エンコードされたビットストリームが前記信号サンプリング・レート(fs_in)の前記低周波成分をエンコードすることによって決定されたことを示さない。

Description

関連出願への相互参照
本願は2011年11月11日に出願された米国仮出願第61/558,519号の優先権を主張するものである。同出願の内容はここに参照によってその全体において組み込まれる。
技術分野
本稿はオーディオ・エンコードおよびデコードに関する。詳細には、本稿はスペクトル帯域複製(SBR: spectral band replication)技法に関わるオーディオ・エンコード/デコードに関する。
スペクトル帯域複製(SBR)のようなHFR(High Frequency Reconstruction[高周波再構成])技法は、伝統的な知覚的オーディオ・コーデックの符号化効率を著しく改善することを許容する。MPEG-4先進オーディオ符号化(AAC: Advanced Audio Coding)と組み合わせて、HFRは非常に効率的なオーディオ・コーデックをなし、そうしたコーデックはすでにXM衛星ラジオ(XM Satellite Radio)・システムおよびデジタル・ラジオ・モンディアル(Digital Radio Mondiale)内で使われており、3GPP、DVDフォーラムその他で標準化されてもいる。それはMPEG-4標準の一部であり、該標準では高効率AACプロファイル(HE-AAC)と称される。一般に、HFR技術は、後方互換および前方互換な仕方で任意の知覚的オーディオ・コーデックと組み合わされることができ、それによりユーレカDABシステムで使われるMPEGレイヤー2のようなすでに確立された放送システムをアップグレードする可能性をもたらす。HFR転移方法は発話コーデックと組み合わせて、超低ビットレートでの広帯域発話を許容することもできる。
HFR(または特にSBR)の背後にある基本的発想は、信号の高周波数範囲(高周波成分と称される)の特性と、同じ信号の低周波範囲(低周波成分と称される)の特性との間には、通例、強い相関が存在するという観察である。よって、信号のもとの入力高周波範囲の表現についてのよい近似が、低周波範囲から高周波範囲の信号転移によって達成できる。
オーディオ信号は種々のサンプリング・レートで与えられることがある。オーディオ・コーデックのユーザーは典型的にはさまざまな入力サンプリング・レートでのオーディオ信号をエンコードできることを望む。同様に、オーディオ・コーデックのユーザーは、オーディオ・デコーダの出力においてさまざまなサンプリング・レートを選択できることを望む。たとえば、ユーザーは(たとえばコンパクト・ディスクからの、wavファイルからのまたはメディア・ライブラリからの)圧縮されていないオーディオ信号をエンコードするためにオーディオ・コーデックを使用する。これら圧縮されていないオーディオ信号は、さまざまなレンダリング装置(TV、mp3プレーヤー、スマートフォンなど)によってサポートされる24、32、44.1または48kHzのようなさまざまな入力サンプリング・レートであってもよい。
よって、オーディオ・コーデックは、エンコーダへの入力においてさまざまなサンプリング・レートを扱うことができるべきであり、デコーダの出力においてさまざまなサンプリング・レートを提供することができるべきである。特に、オーディオ・コーデックは、該オーディオ・コーデックの入力におけるおよび出力におけるオーディオ信号のサンプリング・レートを柔軟かつプロセッサ効率のよい仕方で変換できるべきである。たとえば、ユーザーは48kHzの出力サンプリング・レートおよび24kHzの入力サンプリング・レートを選択してもよい。この場合、オーディオ・コーデックは、所要計算量が低いサンプリング・レート変換(2倍のアップサンプリング)を提供できるべきである。特に、アップサンプリングに関係した計算上の複雑さは軽減される(あるいは可能であれば、通常の再サンプリング器を使う明示的なアップサンプリングの必要性が完全になくされるべきである)べきである。
本稿は、高周波再構成を利用するオーディオ・コーデック、特にSBRを使うオーディオ・コーデックであって、低下した計算量でのオーディオ信号のサンプリング・レート変換を実行するよう構成されているものを記述する。
ある側面によれば、ある信号サンプリング・レートのオーディオ信号のためのエンコーダが記述される。本エンコーダはSBRベースのエンコーダである。よって、本エンコーダは、前記信号サンプリング・レートの前記オーディオ信号の低周波成分をエンコードし、それによりコア・エンコードされたビットストリームを生成するよう適応されたコア・エンコーダを有する。換言すれば、コア・エンコーダは、より低いサンプリング・レートに事前にダウンサンプリングすることなく、前記信号サンプリング・レートの前記オーディオ信号に対して直接作用する。コア・エンコーダは、前記オーディオ信号の低周波成分をエンコードし、ここで、前記低周波成分は典型的にはSBR開始周波数より下の前記オーディオ信号の周波数を含む。コア・エンコーダは、たとえば先進オーディオ・エンコード(AAC)またはMPEG-1またはMPEG-2オーディオ・レイヤーIII(すなわちmp3)エンコードを実行するよう適応されていてもよい。
さらに、エンコーダは、一つまたは複数のSBRエンコーダ設定のもとで複数のSBRパラメータを決定するよう適応されているスペクトル帯域複製(SBR)エンコード・ユニットを有する。典型的には、前記複数のSBRパラメータは、前記信号サンプリング・レートの前記オーディオ信号の高周波成分が前記オーディオ信号の低周波成分および前記複数のSBRパラメータに基づいて近似される(または再構成される)ことができるよう、決定される。換言すれば、前記複数のSBRパラメータは、対応するSBRデコーダが、前記(再構成された)低周波成分および前記複数のSBRパラメータから再構成された高周波成分を決定できるようにされるよう、決定される。典型的には、前記高周波成分は、前記SBR開始周波数より上の前記オーディオ信号の周波数を含む。
前記複数のSBRパラメータは典型的には、前記低周波成分との関連で前記高周波成分のスペクトル包絡線を記述するパラメトリック・データを含む。よって、前記複数のSBRパラメータは、前記低周波成分内に含まれるスペクトル・データから前記高周波成分のスペクトル包絡線を近似することを許容してもよい。前記一つまたは複数のSBRエンコーダ設定は典型的には、いわゆるSBRヘッダにおいて、対応するデコーダに提供される。
さらに、前記エンコーダは、コア・エンコードされたビットストリーム、前記複数のSBRパラメータおよび前記SBRエンコーダによって適用される前記一つまたは複数のSBRエンコーダ設定の指標を含む全体的なビットストリームを生成するよう適応されたマルチプレクサを有する。全体的なビットストリームは対応するデコーダに(たとえば無線または有線のネットワークを介して)伝送されてもよく、あるいは全体的なビットストリームはデータ・ファイルに記憶されていてもよい。典型的には、全体的なビットストリームは、適切なデータ・フォーマットで与えられる。たとえば、全体的なビットストリームはMP4フォーマット、3GPフォーマット、3G2フォーマットまたは低オーバーヘッドMPEG-4オーディオ・トランスポート多重(LATM: Low-overhead MPEG-4 Audio Transport Multiplex)フォーマットでエンコードされてもよい。より一般的な表現では、全体的なビットストリームは、明示的なSBR信号伝達を使うフォーマットにおいて、(前記エンコーダによって、たとえば前記マルチプレクサによって)エンコードされてもよい。二つの明示的な型のSBR信号伝達がありうる。後方互換なものと後方互換でない明示的SBR信号伝達である(ISO/IEC14496-3、セクション1.6.5.2 SBRの暗黙的および明示的信号伝達に記載されるように)。ISO/IEC14496-3、セクション1.6.5.2 SBRの暗黙的および明示的信号伝達は、どのようにSBRが信号伝達されうるかを記述している。この仕様(特に、引用されているセクション)は参照によって組み込まれる。過剰サンプリングされたSBRが使用されるか否かを示す関連情報は、全体的なビットストリームのデータ・エンティティ、たとえばAudioSpecificConfig()内に記憶されてもよい。AudioSpecificConfig()内では、二つの異なるサンプリング・レート値が伝達されうる。samplingFrequency〔サンプリング周波数〕およびextensionSamplingFrequency〔拡張サンプリング周波数〕である。これら二つの異なるサンプリング・レートの間の比は過剰サンプリングされたSBR(Oversampled SBR)の使用を指示しうる。過剰サンプリングされたSBRについては、extensionSamplingFrequencyは典型的にはsamplingFrequencyの二倍である(ここで、samplingFrequencyは典型的にはコア・エンコーダのサンプリング・レートに対応する)。
前記マルチプレクサ(またはより一般には前記エンコーダ)は、標準準拠ビットストリーム(たとえば、参照によって組み込まれるISO/IEC14496-12におけるMP4FF)を生成するよう適応されていてもよい。
前記エンコーダは、生成される全体的なビットストリームが、コア・エンコードされたビットストリームが前記信号サンプリング・レートの前記低周波成分をエンコードすることによって決定されたことを示さないことを保証するよう適応されてもよい。換言すれば、全体的なビットストリームは、コア・エンコーダがオーディオ信号をエンコードするのに先立ってダウンサンプリングを適用しておらず、前記信号サンプリング・レートで前記オーディオ信号を直接コア・エンコードしたという事実に関して、何も伝えなくてもよい。代替的または追加的に、前記エンコーダは、生成された全体的なビットストリームが、コア・エンコードされたビットストリームが前記信号サンプリング・レートより低いサンプリング・レートで、たとえば前記信号サンプリング・レートの半分で、前記低周波成分をエンコードすることによって決定されたことを示すことを保証するよう適応されていてもよい。明示的なSBR信号伝達のコンテキストにおいて、これは(たとえば参照によって組み込まれるISO/IEC14496-3、表1.1.3 AudioSpecificConfig()のシンタックス において規定されるように)AudioSpecificConfig()内の適切な情報を提供することによって達成されてもよい。具体的には、前記エンコーダ(たとえば、併せて高効率(HE: high efficiency)エンコーダと称されうるSBRエンコーダと連携したコア・エンコーダ)は、samplingFrequencyの値に対する値extensionSamplingFrequencyの比が2と異なる、たとえば2より小さい、たとえば1に等しいことを保証するよう適応されていてもよい。よって、前記エンコーダは、該エンコーダがデュアル・レート・モードで動作することを示す全体的なビットストリームを生成するよう適応されていてもよい。extensionSamplingFrequencyの修正はSBRエンコーダとの関連でコア・エンコーダによって実行されてもよい。よって、ある実施形態では、HEエンコーダはextensionSamplingFrequencyについての特定の値(たとえばsamplingFrequencyに等しいextensionSamplingFrequency)を前記マルチプレクサに与え、前記マルチプレクサはこの値を全体的なビットストリームのAudioSpecificConfig()中に含める。
高効率先進オーディオ符号化(HE-AAC)エンコーダの場合、エンコーダは、過剰サンプリングされたSBRモードで動作するHE-AACエンコーダとして指定されてもよい。より一般的な表現では、過剰サンプリングされたSBRモードで動作するSBRベースのエンコーダと言ってもよい。このエンコーダは、前記コア・エンコードされたビットストリーム、前記複数のSBRパラメータおよび前記SBRパラメータを決定するために使われた前記一つまたは複数のSBRエンコーダ設定の指標を含む全体的なビットストリームを生成するよう適応される。さらに、本エンコーダは、生成される全体的なビットストリームが本エンコーダが過剰サンプリングされたSBRモードで動作していることを示さない(またはかかる事実についてサイレントである)ことを保証するよう適応されていてもよい。代替的または追加的に、本エンコーダは、生成される全体的なビットストリームが本エンコーダがデュアル・レートSBRモードで動作することを示すことを保証するよう適応されてもよい。上記のように、これは、AudioSpecificConfig()内に適切なデータを与えることによって達成されてもよい。
本エンコーダは、一つまたは複数のエンコーダ制約条件または条件(基準または入力パラメータとも称される)に依存して前記一つまたは複数のSBRエンコーダ設定を定義するための複数のパラメータ調整(tuning)テーブルを利用してもよい。典型的には、前記複数のパラメータ調整テーブルは、対応するエンコーダ条件のもとで本エンコーダの知覚的に最適化されたパフォーマンスを可能にするために、知覚的測定に基づいて決定される。
よって、SBRエンコード・ユニットは、複数のパラメータ調整テーブルの一つから前記一つまたは複数のSBRエンコーダ設定を決定するよう適応されていてもよい。上記のように、前記複数のパラメータ調整テーブルのそれぞれは、一つまたは複数のエンコーダ条件に依存して前記一つまたは複数のSBRエンコーダ設定を定義してもよい。換言すれば、(前記一つまたは複数のSBRエンコーダ設定を含む)パラメータ調整テーブルは、前記一つまたは複数のエンコーダ条件の特定の組み合わせについて定義されてもよい。前記一つまたは複数のエンコーダ条件は:低いほうの目標ビットレート(lower target bit rate)、高いほうの目標ビットレート(higher target bit rate)、前記コア・エンコーダによって使用されるサンプリング・レート、前記オーディオ信号内に含まれるチャネル数、デュアル・レート・モードの代わりに過剰サンプリングされたエンコード・モードを使うことの指標、のうちの任意の一つまたは複数を含んでいてもよい。
上記で概説したように、過剰サンプリングされたエンコード・モード(oversampled encoding mode)では、コア・エンコーダは前記信号サンプリング・レートで前記オーディオ信号の低周波成分をエンコードする。他方、デュアル・レート・エンコード・モード(dual rate encoding mode)では、コア・エンコーダは、低下したサンプリング・レートで、たとえば前記信号サンプリング・レートの半分で、前記オーディオ信号の低周波成分をエンコードする。エンコーダは、全体的なビットストリームが、エンコーダが該全体的なビットストリームを生成するために過剰サンプリングされたエンコード・モードを使ったことを示さないことを保証するよう適応されてもよい。
さらに、エンコーダは、前記複数のパラメータ調整テーブルから適切なパラメータ調整テーブルを選択し、前記適切なパラメータ調整テーブルにおいて定義されている前記一つまたは複数のSBRエンコーダ設定を使って前記複数のSBRパラメータを決定するよう適応されていてもよい。典型的には、過剰サンプリングされたエンコード・モードで動作するエンコーダは、過剰サンプリングされたエンコード・モードの使用を示すエンコーダ条件のために定義されているパラメータ調整テーブルを使う。本稿において記述されるアップサンプリング・シナリオにおける適切な複数のSBRパラメータの決定を保証するため、エンコーダ(特にSBRエンコード・ユニット)は、前記複数のパラメータ調整テーブルのうちからのデュアル・レート・パラメータ調整テーブルを使用するよう適応されてもよい。デュアル・レート・パラメータ調整テーブルは、デュアル・レート・エンコード・モードの使用を示すエンコーダ条件について定義される。
エンコーダの複雑さを低減するため、エンコーダは、デュアル・レート・パラメータ調整テーブルによって定義されている前記一つまたは複数のSBRエンコーダ設定の少なくとも一つを修正するよう適応されていてもよい。特に、デュアル・レート・パラメータ調整テーブルは、コア・エンコーダによって使用されるサンプリング・レートが前記信号サンプリング・レートに対応するという(さらなる)エンコーダ条件のために定義されてもよい。さらに、デュアル・レート・パラメータ調整テーブルは、デュアル・レートSBR停止周波数を、前記一つまたは複数のSBRパラメータ設定の一つとして定義してもよい。エンコーダ(特に、SBRエンコード・ユニット)は、前記複数のSBRパラメータを決定するためにSBR停止周波数を使うよう適応されていてもよい。ここで、SBR停止周波数はデュアル・レートSBR停止周波数より小さい。よって、エンコーダは、SBRエンコードを、信号エネルギーを有する前記オーディオ信号の周波数帯域に絞るよう適応される。
さらに、デュアル・レート・パラメータ調整テーブルは、デュアル・レートSBR開始周波数を、前記一つまたは複数のSBRエンコーダ設定の一つとして定義してもよい。エンコーダ(特に、SBRエンコード・ユニット)は、前記複数のSBRエンコーダ設定を決定するためにSBR開始周波数を使うよう適応されていてもよい。ここで、SBR開始周波数はデュアル・レートSBR開始周波数に対応する。
エンコーダはさらに、第一のサンプリング・レートにある前記オーディオ信号をアップサンプリングして前記信号サンプリング・レートの前記オーディオ信号を与えるよう適応されたアップサンプリング・ユニットを有していてもよい。ここで、前記第一のサンプリング・レートは前記信号サンプリング・レートより小さい。換言すれば、前記オーディオ信号を第一のサンプリング・レートから前記信号サンプリング・レートにアップサンプリングするためにアップサンプリング・ユニットが使われてもよい。その際、エンコーダは、前記第一のサンプリング・レートに基づいて前記オーディオ信号をSBRエンコードするために使用される前記SBR停止周波数を決定するよう適応されていてもよい。特に、エンコーダは、前記SBR停止周波数を、前記第一のサンプリング・レートの半分に近くなるよう選択してもよい。
SBR停止周波数は典型的には所定の周波数格子(たとえば、直交ミラー・フィルタバンクによって与えられるグリッド)上で選択されることを注意しておくべきである。さらに、SBR開始周波数の値に関してSBR停止周波数の選択に対する制約があってもよい。たとえば、SBR停止周波数がSBR開始周波数より、少なくとも所定数の周波数帯(たとえば3個のQMF帯域)だけ上であることがSBRエンコーダによって課されてもよい。そのような場合、エンコーダは、(SBR開始周波数への最小の必要とされる距離を考慮に入れつつおよび/または前記所定の周波数格子を考慮に入れつつ)SBR停止周波数を、前記第一のサンプリング・レートの半分または前記信号サンプリング・レートの半分にできるだけ近くなるよう選択してもよい。
SBRエンコード・ユニットは典型的には、前記オーディオ信号から複数のサブバンド信号を提供するよう適応された分解フィルタバンク(たとえば、直交ミラー・フィルタバンク(QMF: quadrature mirror filter bank))を有する。さらに、SBRエンコード・ユニットは、前記複数のサブバンド信号の第一の部分集合を低周波成分に割り当て;前記複数のサブバンド信号の第二の部分集合を高周波成分に割り当て;前記第一および第二の部分集合から前記複数のSBRパラメータを決定するよう適応されたSBRエンコーダを有していてもよい。
上記のように、前記一つまたは複数のSBRエンコーダ設定は典型的にはSBR開始周波数を含む。ここで、SBRエンコード・ユニットは、前記SBR開始周波数以上の前記高周波成分の周波数について前記複数のSBRパラメータを決定するよう制約される。さらに、前記一つまたは複数のSBRエンコーダ設定は典型的にはSBR停止周波数を含む。ここで、SBRエンコード・ユニットは、SBR停止周波数以下の前記高周波成分の周波数について前記複数のSBRパラメータを決定するよう制約される。
さらなる側面によれば、ある信号サンプリング・レートのオーディオ信号をより高いサンプリング・レートに(たとえば前記信号サンプリング・レートの二倍以上に)アップサンプリングするよう適応されたオーディオ・コーデックが記述される。本オーディオ・コーデックはSBRオーディオ・コーデックであり、前記信号サンプリング・レートの前記オーディオ信号のためのエンコーダと、対応するデコーダとを有する。本エンコーダは、前記信号サンプリング・レートの前記オーディオ信号の低周波成分をエンコードし、それによりコア・エンコードされたビットストリームを生成するよう適応されたコア・エンコーダを有する。さらに、本エンコーダは、一つまたは複数のSBRエンコーダ設定のもとで複数のSBRパラメータを決定するよう適応されているSBRエンコード・ユニットを有する。前記複数のSBRパラメータは、前記信号サンプリング・レートの前記オーディオ信号の高周波成分が前記オーディオ信号の低周波成分および前記複数のSBRパラメータに基づいて近似されることができるよう、決定される。さらに、前記エンコーダは、コア・エンコードされたビットストリーム、前記複数のSBRパラメータおよび前記一つまたは複数のSBRエンコーダ設定の指標を含む全体的なビットストリームを生成するよう適応されたマルチプレクサを有する。
対応するデコーダは、前記生成された全体的なビットストリームを受領するよう適応されている。本デコーダは、前記コア・エンコードされたビットストリームから前記信号サンプリング・レートの再構成された低周波成分を生成するよう適応されたコア・デコーダを有する。コア・デコーダは、前記コア・エンコーダ(たとえばAACまたはmp)に対する対応するデコーダであってもよい。さらに、本デコーダは、前記再構成された低周波成分のN(たとえばN=32)個のサブバンド信号を生成するよう適応された分解フィルタバンク(たとえばQMFフィルタバンク)を有する。さらに、本デコーダは、前記再構成された低周波成分のN個のサブバンド信号に基づいて、前記複数のSBRパラメータに基づいて、かつ前記一つまたは複数のSBRエンコーダ設定に基づいて、再構成された高周波成分のN個のサブバンド信号を生成するよう適応されたSBRデコーダを有する。本デコーダは、2N個の周波数帯を含む合成フィルタバンク(たとえばQMFフィルタバンク)を利用して、前記再構成された低周波成分のN個のサブバンド信号からおよび前記再構成された高周波成分のN個のサブバンド信号から、前記信号サンプリング・レートの二倍の再構成されたオーディオ信号を生成する。
換言すれば、SBRベースのコーデック(たとえばHE-AACコーデック)はある信号サンプリング・レートのオーディオ信号をアップサンプリングするよう適応されていてもよい。SBRベースのコーデックは、過剰サンプリングされたSBRモードで動作するSBRベースのエンコーダ(たとえばHE-AACエンコーダ)を有する。SBRベースのエンコーダ(たとえばHE-AACエンコーダ)は、コア・エンコードされたビットストリーム、複数のSBRパラメータおよび前記SBRパラメータを決定するために使われた前記一つまたは複数のSBRエンコーダ設定の指標を含む全体的なビットストリームを生成するよう適応されている。さらに、本コーデックは、デュアル・レート・モードで動作するSBRベースのデコーダ(たとえばHE-ACCデコーダ)を有する。SBRベースのデコーダ(たとえばHE-ACCデコーダ)は、全体的なビットストリームから前記信号サンプリング・レートの二倍の再構成されたオーディオ信号を生成するよう適応されている。
もう一つの側面によれば、ある信号サンプリング・レートのオーディオ信号をエンコードする方法が記述される。本方法は、前記信号サンプリング・レートの前記オーディオ信号の低周波成分をエンコードし、それによりコア・エンコードされたビットストリームを生成することを含む。さらに、本方法は、一つまたは複数のSBRエンコーダ設定のもとで複数のSBRパラメータを決定することを含む。前記複数のSBRパラメータは、前記信号サンプリング・レートの前記オーディオ信号の高周波成分が前記オーディオ信号の低周波成分および前記複数のSBRパラメータに基づいて近似されることができるよう、決定される。さらに、本方法は、前記コア・エンコードされたビットストリーム、前記複数のSBRパラメータおよび前記一つまたは複数のSBRエンコーダ設定の指標を含む全体的なビットストリームを生成することを含む。本方法は、生成される全体的なビットストリームが、コア・エンコードされたビットストリームが前記信号サンプリング・レートにある前記低周波成分をエンコードすることによって決定されたことを示さないことを保証する。
もう一つの側面によれば、ある信号サンプリング・レートのオーディオ信号をアップサンプリングする方法が記述される。本方法は、前記信号サンプリング・レートの前記オーディオ信号の低周波成分をエンコードし、それによりコア・エンコードされたビットストリームを生成することを含む。本方法は、一つまたは複数のSBRエンコーダ設定のもとで複数のSBRパラメータを決定することにおいて進んでもよい。前記複数のSBRパラメータは、前記信号サンプリング・レートの前記オーディオ信号の高周波成分が前記オーディオ信号の低周波成分および前記複数のSBRパラメータに基づいて近似されることができるよう、決定される。本方法は、コア・エンコードされたビットストリームから前記信号サンプリング・レートの再構成された低周波成分を生成することを含んでいてもよい。さらに、本方法は、前記再構成された低周波成分のN個のサブバンド信号を生成し、前記再構成された低周波成分のN個のサブバンド信号に基づいて、前記複数のSBRパラメータに基づいて、かつ前記一つまたは複数のSBRエンコーダ設定に基づいて、再構成された高周波成分のN個のサブバンド信号を生成することを含んでいてもよい。最終的には、本方法は、前記再構成された低周波成分のN個のサブバンド信号からおよび前記再構成された高周波成分のN個のサブバンド信号から、前記信号サンプリング・レートの二倍の再構成されたオーディオ信号を生成する。
あるさらなる側面によれば、ソフトウェア・プログラムが記述される。本ソフトウェア・プログラムは、プロセッサ上での実行のためおよびコンピューティング装置上で実行されたときに本稿で概説される方法ステップを実行するために適応されていてもよい。
もう一つの側面によれば、記憶媒体が記述される。本記憶媒体は、プロセッサ上での実行のためおよびコンピューティング装置上で実行されたときに本稿で概説される方法ステップを実行するために適応されたソフトウェア・プログラムを有していてもよい。
あるさらなる側面によれば、コンピュータ・プログラム・プロダクトが記述される。コンピュータ・プログラムは、コンピュータ上で実行されたときに本稿で概説される方法ステップを実行するための実行可能命令を含んでいてもよい。
本稿において概説される好ましい実施形態を含む方法およびシステムは、単独で、あるいは本稿において開示される他の方法およびシステムと組み合わせて使用されてもよいことを注意しておくべきである。さらに、本稿で概説される方法およびシステムのすべての側面は、任意に組み合わされてもよい。特に、請求項の特徴は、任意の仕方で互いに組み合わされてもよい。
本発明について、以下で、付属の図面を参照しつつ例示的に説明する。
aはデュアル・レート・モードでのHE-AACコーデックの例示的なブロック図であり、bは過剰サンプリングされたSBRモードでのHE-AACコーデックの例示的なブロック図である。 内在的なアップサンプリングを提供するHE-AACコーデックの例示的なブロック図である。 パラメータ調整テーブルを選択する方法の例示的なフローチャートを示す。 入力サンプリング・レートおよび出力サンプリング・レートの可能な組み合わせの例示的なチャートである。
上記で概説したように、本稿は、SBRのような高周波再構成技法を利用するオーディオ・コーデックに関する。図1のaおよびbは、HE-AACバージョン1およびHE-AACバージョン2(すなわち、ステレオ信号のパラメトリック・ステレオ(PS)エンコード/デコードを含むHE-AAC)において使われる二つの例示的なSBRベースのオーディオ・コーデックを示している。図1のaは、いわゆるデュアル・レート・モードで、すなわちエンコーダ110中のコア・エンコーダ112がSBRエンコーダ114の半分のサンプリング・レートで機能するモードで動作するHE-AACコーデック100のブロック図を示している。エンコーダ110の入力において、入力サンプリング・レートfs=fs_inでのオーディオ信号が与えられる。該オーディオ信号は次いで、オーディオ信号の低周波成分を与えるために、ダウンサンプリング・ユニット111において因子2だけダウンサンプリングされる。典型的には、ダウンサンプリング・ユニット111は、ダウンサンプリングに先立って高周波成分を除去する(それによりエイリアシングを避ける)ために低域通過フィルタを有する。ダウンサンプリング・ユニット111は、低下したサンプリング・レートfs/2=fs_in/2の低周波成分を与える。低周波成分はコア・エンコーダ112(たとえばAACエンコーダ)によってエンコードされて、低周波成分のエンコードされたビットストリームを与える。
本稿および対応する図面では、エンコーダおよび/またはデコーダの入力において受領される信号またはビットストリームのサンプリング・レートに基づく、エンコーダおよび/またはデコーダによって使用される内部サンプリング・レート(fsと表わす)と、オーディオ信号の入力/出力サンプリング・レート(それぞれfs_in/fs_outと表わされる)との間の区別がされていることを注意しておくべきである。特に、内部サンプリング・レートfsは、エンコーダおよび/またはデコーダにおいて受領されるオーディオ信号および/またはビットストリームのサンプリング・レートに等しく設定される。
オーディオ信号の高周波成分はSBRパラメータを使ってエンコードされる。この目的のため、オーディオ信号は分解フィルタバンク113(たとえば、64個などの周波数帯を有する直交ミラー・フィルタバンク(QMF))を使って分解される。結果として、オーディオ信号の複数のサブバンド信号が得られる。ここで、各時点tにおいて(または各サンプルnにおいて)、前記複数のサブバンド信号は、この時点tにおけるオーディオ信号のスペクトルの指標を与える。前記複数のサブバンド信号はSBRエンコーダ114に与えられる。SBRエンコーダ114は、複数のSBRパラメータを決定する。ここで、前記複数のSBRパラメータは、対応するデコーダにおいて(再構成された)低周波成分からオーディオ信号の高周波成分を再構成することを可能にする。SBRエンコーダ114は典型的には、前記複数のSBRパラメータおよび(再構成された)低周波成分に基づいて決定される再構成された高周波成分がもとの高周波成分を近似するよう、前記複数のSBRパラメータを決定する。この目的のために、SBRエンコーダ114は、もとの高周波成分と再構成された高周波成分に基づく誤差最小化基準(たとえば平均二乗誤差基準)を利用してもよい。
前記複数のSBRパラメータおよび前記低周波成分のエンコードされたビットストリームはマルチプレクサ115において結合され、全体的なビットストリーム、たとえばHE-AACビットストリームを与え、これが記憶されたり伝送されたりしてもよい。下記で概説するように、全体的なビットストリームは、前記複数のSBRパラメータを決定するためにSBRエンコーダ114によって使用されたSBRエンコーダ設定に関する情報をも含む。
対応するデコーダ130は、前記全体的なビットストリームから、サンプリング・レートfs_out=fs_inの圧縮されていないオーディオ信号を生成してもよい。コア・デコーダ131はSBRパラメータを、低周波成分のエンコードされたビットストリームから分離する。さらに、コア・デコーダ131(たとえばAACデコーダ)は、低周波成分のエンコードされたビットストリームをデコードして、デコーダ130の内部サンプリング・レートfsでの再構成された低周波成分の時間領域信号を与える。再構成された低周波成分は分解フィルタバンク132を使って分解される。デュアル・レート・モードでは、内部サンプリング・レートfsはデコーダ130においては、入力サンプリング・レートfs_inおよび出力サンプリング・レートfs_outとは異なることを注意しておくべきである。これは、AACデコーダ131はダウンサンプリングされた領域で、すなわち入力サンプリング・レートfs_inの半分であり出力サンプリング・レートfs_outの半分である内部サンプリング・レートで機能するという事実のためである。
分解フィルタバンク132(たとえば32個などの周波数帯域を有する直交ミラー・フィルタバンク)は典型的には、エンコーダ110において使われる分解フィルタバンク113に比べ半分の数の周波数帯しかもたない。これは、オーディオ信号全体ではなく、再構成された低周波成分のみが分解される必要があるという事実のためである。再構成された低周波成分の結果として得られる複数のサブバンド信号は、受領されるSBRパラメータとの関連でSBRデコーダ113において、再構成された高周波成分の複数のサブバンド信号を生成するために使用される。その後、合成フィルタバンク134(たとえば64個などの周波数帯の直交ミラー・フィルタバンク)が、時間領域での再構成されたオーディオ信号を与えるために使われる。典型的には、合成フィルタバンク134は、分解フィルタバンク132の周波数帯の数の二倍の数の周波数帯をもつ。再構成された低周波成分の前記複数のサブバンド信号は、合成フィルタバンク134の下半分の諸周波数帯に入力されてもよく、再構成された高周波成分の前記複数のサブバンド信号は、合成フィルタバンク134の上半分の諸周波数帯に入力されてもよい。合成フィルタバンク134の出力における再構成されたオーディオ信号は、信号サンプリング・レートfs_out=fs_inに対応する内部サンプリング・レート2fsをもつ。
図1のbは、過剰サンプリングされたSBRモードで使われるHE-AACコーデック140のブロック図を示している。過剰サンプリングされたSBRモードでのHE-AACコーデック14は、デュアル・レート・モードでのHE-AACコーデック110とほぼ同じ仕方で動作するが、エンコーダ150はダウンサンプリング・ユニット111を有さないという違いがある。結果として、コア・エンコーダ152は、オーディオ信号の帯域幅全体に対して作用することを可能にされる。それにより、コア・デコーダ152によってエンコードされる低周波成分の帯域幅およびSBRエンコーダ154を使ってエンコードされる高周波成分の帯域幅に関してさらなる柔軟性が提供される。換言すれば、エンコーダ150の出力における全体的なビットストリームの利用可能なビットレートに依存して、コア・デコーダ152は低周波成分の帯域幅を選択しうる。オーディオ信号の残りの帯域幅は高周波成分に帰せられ、SBRエンコーダ154を使ってエンコードされる。低周波成分と高周波成分の間の遷移周波数はクロスオーバー周波数と称されてもよい。ダウンサンプリング・ユニット111がないため、コア・エンコーダ152はより高いサンプリング・レートで、すなわち内部サンプリング・レートfs=fs_inで機能し、より高い時間分解能をもつ入力信号を与えられる。これは、信号ピークまたは過渡信号(たとえば短いアタックにより引き起こされる)をエンコードするために有益である。
他方、エンコーダ150は典型的には、デュアル・レート・モードでのHE-AACコーデックのエンコーダ110よりも、SBRパラメータを決定するための低い周波数分解能を使う。この低下した周波数分解能は、(デュアル・レート・モードでのHE-AACコーデックの場合の高周波成分の帯域幅に比べ)低下した帯域幅をもつ高周波成分を処理するのに十分でありうる。エンコーダ150では、分解フィルタバンク153(たとえば32個などの周波数帯域の直交ミラー・フィルタバンク)が、オーディオ信号の複数のサブバンド信号を与えるために使われる。SBRエンコーダ154は前記複数のサブバンド信号を使って複数のSBRパラメータを生成する。該複数のSBRパラメータは――低周波成分に帰せられる前記複数のサブバンド信号との関連で――高周波成分に帰せられる前記複数のサブバンド信号を近似する。コア・エンコーダ152によって与えられる低周波成分のエンコードされたビットストリームと前記複数のSBRパラメータとを組み合わせて、記憶または伝送されうる全体的なビットストリームを与えるために、マルチプレクサ155が使われる。さらに、全体的なビットストリームは、前記複数のSBRパラメータを生成するためにSBRエンコーダ154によって使用されたSBRエンコーダ設定の指標を有していてもよい。特に、全体的なビットストリームは、過剰サンプリングされたSBRモードでのHE-AACエンコードが使用されたことの指標を含んでいてもよい。
デコーダ170では、全体的なビットストリームは、低周波成分のエンコードされたビットストリームと、前記複数のSBRパラメータとに分割される。低周波成分のエンコードされたビットストリームは、コア・デコーダ171(たとえばAACデコーダ)を使って、時間領域の再構成された低周波成分にデコードされる。再構成された低周波成分は分解フィルタバンク172(たとえば32個などの周波数帯をもつ直交ミラー・フィルタバンク)に渡され、再構成された低周波成分の複数のサブバンド信号を与える。典型的には、分解フィルタバンク172は、エンコーダ150で使われる分解フィルタバンク153と同数の周波数帯をもつ。これは、全体的な信号帯域幅のどの部分が低周波成分に帰せられ、どの部分が高周波成分に帰せられたかをデコーダ170が先験的に知らないという事実による。
前記複数のサブバンド信号はSBRデコーダ173に渡される。ここで、前記複数のSBRパラメータは再構成された高周波成分の複数のサブバンド信号を生成するために使われる。再構成された低周波成分の前記複数のサブバンド信号および再構成された高周波成分の前記複数のサブバンド信号は、合成フィルタバンク174(たとえば32個などの周波数帯をもつ直交ミラー・フィルタバンク)のそれぞれの周波数帯に割り当てられて、信号サンプリング・レートfs_out=fs_inに対応する内部サンプリング・レートfsをもつ時間領域の再構成されたオーディオ信号を与える。合成フィルタバンク174の周波数帯の数は典型的にはエンコーダ150において使用される分解フィルタバンク153の周波数帯の数に対応する。
デュアル・レート・モードでのSBRベースのコーデック100および過剰サンプリングされたSBRモードでのSBRベースのコーデック140は典型的には、入力パラメータ(または基準または条件)の関数としていくつかのSBRエンコーダ設定を定義する複数のパラメータ調整テーブルを利用する。入力パラメータまたは条件は典型的には以下を含む。
・使用されるコア・エンコーダの型(HE-AACコーデックの場合はAACだが、mp3-proを使う場合はmp3がコア・エンコーダとして使用されてもよい)。
・低いほうのビットレート限界(下回るべきでない下限ビットレートを示す)。
・高いほうのビットレート限界(超えるべきでない上限ビットレートを示す)。
・過剰サンプリングされたSBRモードにおけるHE-AACの使用(またはデュアル・レート・モードでのHE-AACの使用)を示す二値フラグ(bUse_downsampledモードについての指標とも称される)。
・コア・エンコーダによって使用されるサンプリング・レート。
・エンコードされるべきオーディオ信号のオーディオ・チャネル数(たとえば、二つのオーディオ・チャネルをもつステレオ信号または5つのオーディオ・チャネルおよび追加的なLFE(Low Frequency Effect[低域効果])チャネルをもつ5.1サラウンド・サウンド・オーディオ信号)。
上述した入力パラメータの一部または全部は、以下のSBRエンコーダ設定の一部または全部を含み定義する、特定のパラメータ調整テーブルを定義する。
・SBR開始周波数(SBR startBandFrequency〔開始帯域周波数〕とも称される)(これは、高周波成分の下の周波数限界または下限周波数帯域を示す)。SBR開始周波数は対応するデコーダに伝送されるSBRヘッダの一部である。詳細については、ISO/IEC14496-3、表4.63―sbr_header()のシンタックス を参照。ここではSBR開始周波数はbs_start_freqと呼ばれている。この文書は参照によって組み込まれる。SBR開始周波数は、オーディオ信号がそこまではコア・エンコーダを使ってエンコードされる上の周波数限界を指定する。SBR開始周波数は(xOverBandとの関連で)、それ以上ではオーディオ信号がSBRエンコードを使ってエンコードされるオーディオ信号の下の周波数限界または下限周波数帯域を定義する。より精密には、xOverBand(上述した規格ではbs_xover_bandと称される)はSBR開始周波数へのオフセットを定義し、それにより実際のSBR範囲を決定する。多くの場合、オフセットは0であり、よってSBR開始周波数は実際にそれ以上ではオーディオ信号がSBRエンコードを使ってエンコードされる下の周波数限界または下限周波数帯域を示す。
・発話構成設定のためのSBR開始周波数(これは発話オーディオ信号のためのSBR開始周波数を示す)。典型的には、エンコードされるオーディオ信号が発話オーディオ信号であることをエンコーダに通知するのは、エンコーダのユーザーである。そうであれば、発話構成設定のためのSBR開始/停止周波数はSBRヘッダ内で選ばれ、伝達される。
・SBR停止周波数(SBR stopBandFrequency〔停止帯域周波数〕とも称される)(これは、SBRエンコードのための上限周波数または上限周波数帯域を示す)。SBR停止周波数はSBRヘッダの一部であり(ISO/IEC14496-3、表4.63―sbr_header()のシンタックス を参照)、bs_stop_freqと称される。SBRパラメータは、SBR開始周波数およびSBR停止周波数によって定義される周波数区間内にある、前記高周波成分の諸周波数帯域についてのみ決定される。SBR停止周波数より上の周波数はSBRエンコードでは考慮されない。
・発話構成設定のためのSBR停止周波数(これは発話オーディオ信号のためのSBR停止周波数を示す)。
・ノイズ帯域の数(SBRヘッダの一部(ISO/IEC14496-3、表4.63―sbr_header()のシンタックス を参照、bs_noise_bandsと称される))、noiseFloorOffset〔ノイズ・フロア・オフセット〕またはnoiseMaxLevel〔ノイズ最大レベル〕のようなさまざまなノイズ関係の設定。これらのノイズ関係の設定は、高周波成分の知覚上の品質を改善するために再構成された高周波成分に加えられるノイズを指定するために使用されてもよい。
・ステレオ・モード(これはたとえば、ステレオ信号のPSエンコードかステレオ・オーディオ信号の左および右信号のエンコードの使用を示す)。より具体的には、「ステレオ・モード」は、SBRのためのステレオ結合が使われるか否かを決定する。
・周波数帯のスケーリング。このパラメータはSBRヘッダの一部であり(ISO/IEC14496-3、表4.63―sbr_header()のシンタックス を参照)、bs_freq_scaleと称される。周波数帯のスケーリングは、SBRについてのオクターブ当たりの帯域の数を示す。これは、SBRエンコーダおよびデコーダにおいて周波数帯テーブルを生成するために必要となることがある。これらの帯域は、スケーリング演算、ノイズ置換、欠けている高調波の挿入、逆フィルタリングなどを適用するために使用されうる(さらなる詳細については、ISO/IEC14496-3、表4.105―bs_freq_scaleを参照。これは参照によって組み込まれる)。SBRヘッダの一部であるxOverBand(ISO/IEC14496-3、表4.63―sbr_header()のシンタックス を参照、bs_xover_bandと呼ばれる)。
典型的には、デュアル・レート・モードでのHE-AACコーデック100(過剰サンプリングされたSBRについてのフラグがセットされていない)についておよび過剰サンプリングされたSBRモードでのHE-AACコーデック140(過剰サンプリングされたSBRについてのフラグがセットされている)について、異なるパラメータ調整テーブルがある。以下の理由により、これはSBR開始周波数およびSBR停止周波数について特に有意である。図1のaおよびbで見て取れるように、デュアル・レート・モードでのHE-AACコーデック100のコア・エンコーダ112は過剰サンプリングされたSBRモードでのHE-AACコーデック140に比べ、(入力における同一のオーディオ信号に対し)半分のサンプリング・レートで機能する。よって、デュアル・レート・モード(すなわち、過剰サンプリングされたSBRについてのフラグがセットされていない)について定義されたパラメータ調整テーブルは、典型的には、過剰サンプリングされたSBRモード(すなわち、過剰サンプリングされたSBRについてのフラグがセットされている)について定義されたパラメータ調整テーブルとは、コア・エンコーダ・サンプリング・レートに対するSBR開始/停止周波数の比が異なる。
上述したSBRエンコーダ設定(またはその指標)の一部または全部はエンコーダ110、150からそれぞれのデコーダ130、170に、たとえば伝送されるビットストリームにおいて、あるいはオーディオ・ファイルにおいて与えられる。特に、エンコーダ110、150はSBR開始周波数、SBR停止周波数、ノイズ帯域の数、noiseFloorOffset〔ノイズ・フロア・オフセット〕、NoiseMaxLevel〔ノイズ最大レベル〕、stereoMode〔ステレオ・モード〕の使用、周波数帯のスケーリング(bs_freq_scale)および/またはxOverBandの指標を対応するデコーダ130、170に与えてもよい。さらに、過剰サンプリングされたSBRモードで動作するエンコーダ150は、デコーダ側において過剰サンプリングされたSBRモードの適切なデコーダ170が選択されるよう、bUse_downsampledモードについての指標、すなわち、エンコーダ150が過剰サンプリングされたSBRモードで機能したという指示をデコーダに与えてもよい。先述したように、これはAudioSpecificConfig()においてextensionSamplingFrequency〔拡張サンプリング周波数〕を介して指示されてもよい。よって、それぞれのデコーダ130、170は、厳密なパラメータ調整テーブルや可能性としてはオーディオ信号をエンコードするためにエンコーダにおいて使用された他のパラメータに関する詳細をすべて知る必要はない。デコーダは、全体的なビットストリーム内で受領される限られた数のSBRエンコーダ設定の指示のみに基づいて受領された全体的なビットストリームをデコードする、一般的な、たとえば標準化されたデコーダであってよい。
上記で示したように、入力におけるオーディオ信号のサンプリング・レートfs_inとコーデック100、140の出力におけるオーディオ信号のサンプリング・レートfs_outとの間の変換を効率的な仕方で提供することが望ましいことがありうる。本稿では、過剰サンプリングされたSBRモードでのHE-AACコーデック140のエンコーダ150をデュアル・レート・モードでのHE-AACコーデック100のデコーダ130と組み合わせることによって、二倍(またはそれ以上)のアップサンプリングを提供することが提案される。過剰サンプリングされたモードでの修正されたエンコーダ250をデュアル・レート・モードでのデコーダと組み合わせるそのような構成200が図2に示されている。図2から見て取れるように、エンコーダ250は低周波成分のダウンサンプリングを実行せず、よって時間領域信号を表わす全体的なビットストリームをサンプリング・レートfs=fs_inで提供する。デコーダ130はこの全体的なビットストリームを受領し、内在的に二倍のアップサンプリングを実行する。具体的には、デコーダ130はサンプリング・レートfs=fs_inでの時間領域信号を表わす全体的なビットストリームを受領し、2fsのサンプリング・レートの時間領域信号を生成する。結果として、再構成されたオーディオ信号がデコーダ130の出力において得られ、該再構成されたオーディオ信号はfs_out=2×fs_inの出力サンプリング・レートをもつ。
換言すれば、過剰サンプリングされたSBRを使ったオーディオ信号のアップサンプリングが提案される。具体的には、オーディオ・エンコーダ(たとえばドルビー・パルス(Dolby Pulse)・エンコーダ)における、従来の再サンプリング器を必要としないHE-AACv1およびHE-AACv2構成設定の二倍のアップサンプリングが提案される。過剰サンプリングされたSBRを使ってオーディオ信号をアップサンプリングするために、「過剰サンプリングされたSBRモード」で走るエンコーダ250(「アップサンプリングされたモード」のエンコーダ250とも称される)が「デュアル・レート(通常)SBRモード」で走るデコーダ130と組み合わされる。
アップサンプリングを要求する通常のオーディオ・コーデックでは、入力オーディオ信号は、SBR処理が行なわれる前にアップサンプリングされ(一般的には、サンプルの数が増やされる)、それにより増大した数のサンプルを含むアップサンプリングされたオーディオ信号を生じる。このように、SBRエンコーダは、多数の追加的な計算を実行する必要があり、それによりオーディオ・エンコーダの計算量が増える。しかしながら、図2に示される提案されるオーディオ・エンコード/デコード方式についてはこれは当てはまらない。SBR処理の前にアップサンプリングは行なわれないからである。これは、少なくとも二つの施策によってエンコーダの複雑さを低下させる:一方では、再サンプリング・ユニットを回避することによって、他方では、SBRエンコードをより低いサンプリング・レートで実行することによってである。
オーディオ・コーデック200は、二倍の(または因子2の)内在的なアップサンプリングを提供する。2より小さいアップサンプリング比が要求される場合には、それは通常の再サンプリング器を使うことによって提供できる。因子2よりも大きい比でサンプリング・レートをアップサンプリングするためには、通常の再サンプリング器は、オーディオ信号を(所望される出力サンプリング・レートの半分である)次の好適なサンプリング・レートにアップサンプリングするために使用されてもよい。その後、オーディオ・コーデック200を使って、残りの二倍のアップサンプリングが提供されてもよい。たとえば、22.05kHzから48kHzへのアップサンプリングは、通常通りに22.05Hzから24kHzへアップサンプリングした後にオーディオ・コーデック200を使って48kHz出力サンプリング・レートをもつオーディオ信号を与えることによってなされてもよい。
HE-AACv1およびv2コーデックは典型的には、選択的に、デュアル・レート・モードでのデコードを実行する(図1のaおよび図2のデコーダ130に示されるように)か過剰サンプリングされたSBRモード、すなわちいわゆる「ダウンサンプリングされたモード」でのデコードを実行する(図1のbに示されるように)よう構成されている標準化されたデコーダを有する。「デュアル・レート・モード」は典型的にはエンコーダおよびデコーダによって使われるデフォルト・モードである。したがって、過剰サンプリングされたSBRモードでコーデック140を使うためには、デコーダに「ダウンサンプリングされたモード」で動作するよう伝えるために、明示的なSBR信号伝達が使用される。よって、マルチプレクサ155の出力における多重化されたビットストリームは、対応するデコーダ170への、「ダウンサンプリングされたモード」が使われるべきであるという指示を提供する。例として、多重化されたビットストリームを含むMP4ファイルは、たとえばAudioSpecificConfig()におけるパラメータ「extensionSamplingFrequency」を介して、「過剰サンプリングされたSBR」の使用の適切な指標を含む。図2のオーディオ・コーデック200を実装するために、エンコーダ250(「アップサンプリングされたモード」で機能する)は、そのような「過剰サンプリングされたSBR」の使用の指標を多重化されたビットストリームに含めないよう適応されてもよい。例として、明示的なSBR信号伝達を使うMP4ファイルについて、「ダウンサンプリングされたSBR」を使うというデコーダへの明示的な命令は含められないまたは除去される。その代わり、エンコーダ250(特に、SBRエンコーダ254と連携するコア・エンコーダ252)は、エンコーダ250によって「デュアル・レート・モード」が使われたという指標を挿入するよう適応されていてもよい。そのような指標は、パラメータ「extensionSamplingFrequency」を適切に修正することによって与えられてもよい。結果として、デコーダは(デフォルトにより)デコーダ130をデュアル・レート・モードで使う。
上記で概説したように、エンコーダ250におけるSBRエンコーダ254の設定はパラメータ調整テーブル内で指定される。典型的には、エンコーダは複数のそのようなパラメータ調整テーブル、たとえばデュアル・レート・モードでのエンコーダ110のための第一の複数のパラメータ調整テーブルと、アップサンプリングされたモードでの(すなわち過剰サンプリングされたSBRモードでのオーディオ・コーデックのための)エンコーダ140のための第二の複数のパラメータ調整テーブルを有している。パラメータ調整テーブルは、前記一つまたは複数の制約条件のもとでオーディオ・コーデックの最適なエンコード結果を達成するために(前記一つまたは複数の基準によって定義される前記一つまたは複数の制約条件のもとで)使用される前記一つまたは複数のSBRエンコーダ設定を指定する。パラメータ調整テーブルはたとえば、一組の聴取者に対する知覚測定を使って決定されてもよい。たとえば、所定のビットレートおよび特定のエンコード・モードの使用という制約条件のもとでのパラメータ調整テーブル。知覚測定は、一群の聴取者にとて最適な結果を達成するSBRエンコーダ設定を決定するために使用されうる。前記制約条件との関連でのこれらのSBRエンコーダ設定がパラメータ調整テーブルをなす。
よって、前記複数のパラメータ調整テーブルのそれぞれは、次の基準(制約条件または入力パラメータとも称される)の一つまたは複数によって特定される:低いほうの目標ビットレート、高いほうの目標ビットレート、コア・デコーダでのサンプリング・レート、過剰サンプリングされたSBRについてのフラグおよびチャネルの数。前記複数のパラメータ調整テーブルのそれぞれは、基準(または制約条件)の対応する組み合わせについて、複数のSBRエンコーダ設定を定義する。過剰サンプリングされたSRBモードでのオーディオ・コーデック140は、典型的には、デュアル・レート・モードでのオーディオ・コーデック100に比べ、相対的に高いビットレートのために使われる。その結果、過剰サンプリングされたSBRモードのために利用可能なパラメータ調整テーブル(すなわち、第二の複数のパラメータ調整テーブル)は、デュアル・レート・モードのために利用可能なパラメータ調整テーブル(すなわち、第一の複数のパラメータ調整テーブル)よりも相対的に高い目標ビットレートについて定義される。
多様なビットレートについて(および特に比較的低いビットレートについて)、(内在的にアップサンプリングを実行する)オーディオ・コーデック200を提供することができるため、また通常のオーディオ・エンコーダとの後方互換性を保証するために、エンコーダ150(アップサンプリングされたモードで機能する)が第二の複数のパラメータ調整テーブル(すなわち、過剰サンプリングされたSBRモードのために利用可能なパラメータ調整テーブル)を使うのみならず、所与の目標ビットレートについて第二の複数のパラメータ調整テーブル内に適切なパラメータ調整テーブルが見つけられない場合には、第一の複数のパラメータ調整テーブル(すなわち、デュアル・レート・モードのために利用可能なパラメータ調整テーブル)をも使うことができるようにすることが提案される。換言すれば、適切な「過剰サンプリングされた」SBRパラメータ調整テーブルが見つけられないときは常に、「デュアル・レート」SBRパラメータ調整テーブルを使うことが提案される。よって、低ビットレート(および低サンプリング・レート)においてであっても知覚的に最適化されたパラメータ調整テーブルからのSBRパラメータ設定がオーディオ・コーデック200において使用されることができることが保証される。換言すれば、ビットレート対サンプリング・レートの追加的な組み合わせについて、適切なSBRパラメータ調整テーブルが提供されることができることが保証される。
理論上は、本稿に記載されるオーディオ・コーデック200について新しいSBRパラメータ調整テーブルが個別的に設計されることができることを注意しておくべきである。しかしながら、新しいSBRパラメータ調整テーブルが設計される場合、エンコーダ150は、通常の過剰サンプリングされたSBRについてその新しいSBRパラメータ調整テーブルを使うことがありうる。過剰サンプリングされたSBRは、提案されるオーディオ・コーデック200が典型的に使われるたぐいのサンプリング・レート/ビットレート組み合わせのために意図されたものではないので、これは望ましくない。
アップサンプリングされたモードにおいて機能するエンコーダ250のコンテキストにおける「デュアル・レート」SBRパラメータ調整テーブルの使用は、典型的には、SBR stopBandFrequency(すなわちSBR停止周波数)がオーディオ・コーデック200の出力信号の帯域幅のあたりにあることを含意する。よって、SBR stopBandFrequencyは、入力信号の帯域幅に調整されるべきである。さもなければ、SBRエンコーダ254は空の信号部分に対して作用することになりうる。すなわち、SBRエンコーダ254は、何ら有意なエネルギーを含まない周波数帯域に対して作用することになりうる。
例として、入力ステレオ・オーディオ信号は第一のサンプリング・レート22050Hzを使ってエンコードされてもよい。それは、出力(または再構成された)オーディオ信号がサンプリング・レート48kHzをもつよう選択される。さらに、エンコードされた信号は、目標ビットレート128kbit/sのHE-AACビットストリームであるべきである。第一段階では、エンコーダは、22050Hzの入力オーディオ信号を24kHzの信号サンプリング・レート(すなわち所望される出力サンプリング・レートの半分)のオーディオ信号に変換する通常の再サンプリング器またはアップサンプリング器を有していてもよい。残りのアップサンプリングは、図2のコーデック200によって内在的に提供される。
コーデック200のエンコーダ250は、アップサンプリングされたモードで動作し、その結果、最初は、以下の基準またはエンコード条件を満たす「過剰サンプリングされた」SBRパラメータ調整テーブルを探す。
・低いほうのビットレート:<128kbit/s
・高いほうのビットレート:>128kbit/s
・過剰サンプリングされたSBRについてのフラグ(yes/no?):yes
・コア・エンコーダのサンプル・レート:24kHz
・チャネル数:2
・特定のコア・エンコーダの使用:たとえばAACまたはmp3。
エンコーダ250は、そのようなパラメータ調整テーブルが存在しないことを判別することがありうる(たとえば、過剰サンプリングされたSBRの典型的な用途について、サンプリング・レートがそのような高いビットレートのためには低すぎる、あるいはその逆)。結果として、エンコーダ250は、上述した基準を満たす「デュアル・レート」SBRパラメータ調整テーブルを探す。すなわち、同じ基準をもつ(ただし過剰サンプリングされたSBRについてのフラグはない)パラメータ調整テーブルについて、
・低いほうのビットレート:<128kbit/s
・高いほうのビットレート:>128kbit/s
・過剰サンプリングされたSBRについてのフラグ(yes/no?):no
・コア・エンコーダのサンプル・レート:24kHz
・チャネル数:2
・特定のコア・エンコーダの使用:たとえばAACまたはmp3。
この「デュアル・レート」SBR調整テーブルは、10125HzのSBR開始周波数および22125HzのSBR停止周波数を提供してもよい。これらは一緒になって、SBRエンコードによってカバーされる周波数区間を定義する。しかしながら、入力オーディオ信号の第一のサンプリング・レート22050Hz(すなわち、アップサンプリング前の入力オーディオ信号のサンプリング・レート)に鑑みて、入力オーディオ信号の帯域幅はたった11025Hz(=22050Hz/2)である。したがって、エンコーダ250の全体的な複雑さを減らすため、入力オーディオ信号の実際の帯域幅に従ってSBR停止周波数を適応させることが有益である。特に、SBR停止周波数は、コア・エンコーダのサンプリング・レートの半分に等しく(すなわち12kHzに)設定されてもよい。エンコーダ250が入力オーディオ信号の第一のサンプリング・レートを知っている場合(すなわち、エンコーダ250が入力オーディオ信号のアップサンプリングのことを知っている場合)、エンコーダ250はSBR停止周波数を、第一のサンプリング・レートの半分に等しく(すなわち22050/2Hzに)設定するよう適応されていてもよい。結果として得られるSBR停止周波数がSBR開始周波数より低い場合には、SBR停止周波数はSBR開始周波数に依存して設定されるべきである(上記で概説したように、SBR停止周波数は、SBR開始周波数より所定数のQMF帯域ぶんだけ高いべきであり、その結果、SBR停止周波数はたとえばSBR開始周波数よりQMF帯域3個ぶん高くなるよう選択されることができる)。典型的には、SBR開始周波数およびSBR停止周波数についての値は、あらかじめ定義された周波数格子上で修正されることができるだけである。よって、SBR停止周波数は、上述した値(すなわち、コア・エンコーダのサンプリング・レートの半分、入力オーディオ信号の第一のサンプリング・レートの半分またはSBR開始周波数)を最もよく近似する(必要ならより高い周波数まで)ために、あらかじめ定義された周波数格子に従って修正される。
図3は、エンコーダ250において適切なパラメータ調整テーブルを選択するための方法300の例示的なフローチャートを示している。ステップ301では、過剰サンプリングされたSBRモードのための前記複数のパラメータ調整テーブルの中で適切なパラメータ調整テーブルが探索される。適切なパラメータ調整テーブルは、そのパラメータ調整テーブルが過剰サンプリングされたSBRモードのために設計されたものであるという基準に加え、所望される基準(たとえば低いほうのビットレート、高いほうのビットレート、コア・エンコーダのサンプリング・レート、チャネル数)の一部または全部を満たすよう決定される。ステップ302では、適切なパラメータ調整テーブルが同定されたかどうかが検証される。そうであれば、このパラメータ調整テーブルがステップ306においてはいってくるオーディオ信号をエンコードするために使われる。そうでなければ、デュアル・レート・モードについての前記複数のパラメータ調整テーブルの中で適切なパラメータ調整テーブルが探索される(ステップ303)。適切なパラメータ調整テーブルは、そのパラメータ調整テーブルが過剰サンプリングされたSBRモードのために設計されたものであるという基準は別として、所望される基準(たとえば低いほうのビットレート、高いほうのビットレート、コア・エンコーダのサンプリング・レート、チャネル数)の一部または全部を満たすよう決定される。図3では、適切なパラメータ調整テーブルが同定されることができると想定されている。そうでない場合には、本方法はエラー手順にはいってもよい(たとえば、SBRエンコーダ設定を求めて明示的にユーザーに促す、あるいはデフォルトのSBRエンコーダ設定を使う)。任意的なステップ304では、適切なパラメータ調整テーブル内のSBR停止周波数がオーディオ信号の入力サンプリング・レートの半分を超えるかどうか(あるいは、第一のサンプリング・レートが既知であれば、オーディオ信号の第一のサンプリング・レートの半分を超えるかどうか)が検証されてもよい。超えていなければ、前記適切なパラメータ調整テーブルのSBRエンコーダ設定がオーディオ信号をエンコードするためにステップ306において使用されてもよい。もし超えていれば(あるいはステップ304が省略される場合にはいずれの場合にも)、ステップ305において、SBR停止周波数は、オーディオ信号の帯域幅に適合させられてもよい。特に、SBR停止周波数は、オーディオ信号の入力サンプリング・レートの半分またはオーディオ信号の第一のサンプリング・レートの半分(オーディオ信号が事前のアップサンプリングにかけられたことが既知である場合)のうちの小さいほうに適合させられてもよい。さらなる制約条件として、修正されたSBR停止周波数はSBR開始周波数より所定数の周波数だけ高いことが保証されてもよい。SBR停止周波数への修正が所定の周波数格子(たとえば、QMF周波数帯によって与えられる格子)に制約されていてもよいことを注意しておく。(上記の修正されたSBR停止周波数を含む)前記適切なパラメータ調整テーブルからのSBRエンコーダ設定は、ステップ306において、オーディオ信号をエンコードするために使われてもよい。
図4は、図1のa、b、図2のオーディオ・コーデック100、140および200によって扱われうる例示的な入力および出力サンプリング・レートを示している。図4のチャートでは、「X」とマークされている入力および出力サンプリング・レートの組み合わせは、サンプリング・レート修正やダウンサンプリングがないことを示す。ダウンサンプリングは、図1のaおよびbのオーディオ・エンコーダ110および150の前のダウンサンプリングによって達成されてもよい。「Y」とマークされている入力および出力サンプリング・レートの組み合わせは、2より小さい比によるアップサンプリングを示す。このアップサンプリングは、図1のaおよびbのオーディオ・エンコーダ110および150の前のアップサンプリング器によって達成されてもよい。「(X)」とマークされている入力および出力サンプリング・レートの組み合わせは、2以上の比によるアップサンプリングを示す。このアップサンプリングは、比2の内在的なアップサンプリングを提供する図2のオーディオ・コーデック200を使って達成されてもよい。追加的なアップサンプリング器が(比2を超える)残りのアップサンプリングを提供してもよい。結果として、総アップサンプリングのためおよびオーディオ符号化/復号のために要求される計算量が軽減できる。
本稿では、オーディオ符号化および/または復号のための方法およびシステムを記載してきた。本方法およびシステムは、低下した計算量でのオーディオ信号の再サンプリングを許容する。特に、アップサンプリングされたモードでのSBRベースのオーディオ・エンコーダに基づく、修正されたSBRベースのオーディオ・エンコーダが記述されている。適切なSBRエンコーダ設定を選択する方式を記載した。修正されたSBRベースのオーディオ・エンコーダは、SBRベースのオーディオ・エンコーダがアップサンプリングされたモードで動作しているという指示を抑制するよう適応される。結果として、対応するSBRベースのオーディオ・デコーダはデュアル・レート・モードで機能し、それにより、SBRベースのオーディオ・エンコーダにおける入力オーディオ信号に対して、復号されたオーディオ信号の二倍の内在的なアップサンプリングを提供する。全体的なオーディオ・コーデック(特にオーディオ・エンコーダ)は、2より大きいアップサンプリング比を提供するためにアップサンプリング器と組み合わされてもよい。全体として、内在的なアップサンプリングの使用は、オーディオ符号化/エンコードに関係してアップサンプリングを提供するために典型的に必要とされる全体的な計算量を低減することを許容する。
本記載および図面は単に提案される方法およびシステムの原理を例解するものであることを注意しておくべきである。よって、当業者は、本稿で明示的に記載されたり示されたりしていなくても、本発明の原理を具現し、その精神および範囲内に含まれるさまざまな構成を考案できるであろうことは理解されるであろう。さらに、本稿に記載したあらゆる例は、主として、読者が提案される方法およびシステムの原理および当該技術の進歩への発明者によって貢献される概念を理解するのを助ける教育目的のために明確に意図されたものであり、そのような特定的に記載された例および条件への限定なしに解釈されるものである。さらに、本発明の原理、側面および実施形態ならびにその具体例を記載する本稿のあらゆる陳述は、その等価物をも包含することが意図されている。
本稿において記述された方法およびシステムは、ソフトウェア、ファームウェアおよび/またはハードウェアによって実装されてもよい。ある種のコンポーネントは、たとえばデジタル信号プロセッサまたはマイクロプロセッサ上で走るソフトウェアとして実装されてもよい。他のコンポーネントはたとえば、ハードウェアおよびまたは特定用途向け集積回路として実装されてもよい。記載される方法およびシステムにおいて遭遇される信号は、ランダム/アクセス/メモリまたは光記憶媒体のような媒体上に記憶されていてもよい。該信号は、電波ネットワーク、衛星ネットワーク、無線ネットワークまたは有線ネットワーク、たとえばインターネットのようなネットワークを介して転送されてもよい。本稿に記載される方法およびシステムを利用する典型的な装置は、ポータブル電子装置またはオーディオ信号を記憶および/または再生するために使われる他の消費者設備である。

Claims (30)

  1. ある信号サンプリング・レートのオーディオ信号のためのエンコーダであって、
    ・前記信号サンプリング・レートの前記オーディオ信号の低周波成分をエンコードし、それによりコア・エンコードされたビットストリームを生成するよう適応されたコア・エンコーダと;
    ・一つまたは複数のSBRエンコーダ設定のもとで複数のSBRパラメータを決定するよう適応されているスペクトル帯域複製(SBR)エンコード・ユニットであって、前記複数のSBRパラメータは、前記信号サンプリング・レートの前記オーディオ信号の高周波成分が前記オーディオ信号の前記低周波成分および前記複数のSBRパラメータに基づいて近似されることができるよう、決定される、SBRエンコード・ユニットと;
    ・前記コア・エンコードされたビットストリーム、前記複数のSBRパラメータおよび前記SBRエンコーダによって適用される前記一つまたは複数のSBRエンコーダ設定の指標を含む全体的なビットストリームを生成するよう適応されたマルチプレクサとを有しており、前記生成された全体的なビットストリームは、前記コア・エンコードされたビットストリームが前記信号サンプリング・レートの前記低周波成分をエンコードすることによって決定されたことを示さない、
    エンコーダ。
  2. 前記生成された全体的なビットストリームが、前記コア・エンコードされたビットストリームが前記信号サンプリング・レートより低いサンプリング・レートで前記低周波成分をエンコードすることによって決定されたことを示す、請求項1記載のエンコーダ。
  3. 当該エンコーダが、前記全体的なビットストリームを、明示的なSBR信号伝達を使うフォーマットにおいてエンコードするよう適応されている、請求項1または2記載のエンコーダ。
  4. 前記明示的なSBR信号伝達がISO/IEC14496-3に従う、請求項3記載のエンコーダ。
  5. 前記全体的なビットストリームにおけるAudioSpecificConfig()が、前記コア・エンコードされたビットストリームが前記信号サンプリング・レートの前記低周波成分をエンコードすることによって決定されたことを示さない、請求項4記載のエンコーダ。
  6. ・前記AudioSpecificConfig()がsamplingFrequencyと称される第一のパラメータおよびextensionSamplingFrequencyと称される第二のパラメータを有しており、
    ・前記第一のパラメータに対する前記第二のパラメータの比が2より小さい、
    請求項5記載のエンコーダ。
  7. 前記第一のパラメータに対する前記第二のパラメータの比が1である、請求項6記載のエンコーダ。
  8. ・前記SBRエンコード・ユニットは、複数のパラメータ調整テーブルの一つから前記一つまたは複数のSBRエンコーダ設定を決定するよう適応されており;
    ・前記複数のパラメータ調整テーブルのそれぞれは、一つまたは複数のエンコーダ条件に依存して前記一つまたは複数のSBRエンコーダ設定を定義し;
    ・前記一つまたは複数の条件は、低いほうの目標ビットレート、高いほうの目標ビットレート、前記コア・エンコーダによって使用されるサンプリング・レート、前記オーディオ信号内に含まれるチャネル数、デュアル・レート・モードの代わりに過剰サンプリングされたエンコード・モードを使うことの指標、のうちの任意の一つまたは複数を含み;
    ・過剰サンプリングされたエンコード・モードでは、前記コア・エンコーダは前記信号サンプリング・レートで前記オーディオ信号の前記低周波成分をエンコードし;
    ・デュアル・レート・エンコード・モードでは、前記コア・エンコーダは、前記信号サンプリング・レートの半分で、前記オーディオ信号の前記低周波成分をエンコードする、
    請求項1ないし7のうちいずれか一項記載のエンコーダ。
  9. 前記全体的なビットストリームが、当該エンコーダが前記全体的なビットストリームを生成するために過剰サンプリングされたエンコード・モードを使ったことを示さない、請求項8記載のエンコーダ。
  10. 前記全体的なビットストリームが、当該エンコーダが前記全体的なビットストリームを生成するためにデュアル・レート・エンコード・モードを使ったと示す、請求項8または9記載のエンコーダ。
  11. ・前記SBRエンコード・ユニットが、前記複数のパラメータ調整テーブルのうちからのデュアル・レート・パラメータ調整テーブルを使用するよう適応されており;
    ・前記デュアル・レート・パラメータ調整テーブルは、デュアル・レート・エンコード・モードの使用を示すエンコーダ条件について定義されている、
    請求項8ないし10のうちいずれか一項記載のエンコーダ。
  12. ・前記デュアル・レート・パラメータ調整テーブルは、前記コア・エンコーダによって使用されるサンプリング・レートが前記信号サンプリング・レートに対応するというエンコーダ条件について定義されており;
    ・前記デュアル・レート・パラメータ調整テーブルは、デュアル・レートSBR停止周波数を定義し;
    ・前記複数のSBRパラメータを決定するために使われる前記一つまたは複数のSBRエンコーダ設定は、前記デュアル・レートSBR停止周波数より小さい値に対応するSBR停止周波数を含む、
    請求項11記載のエンコーダ。
  13. ・前記デュアル・レート・パラメータ調整テーブルは、デュアル・レートSBR開始周波数を定義し;
    ・前記複数のSBRパラメータを決定するために使われる前記一つまたは複数のSBRエンコーダ設定は、前記デュアル・レートSBR開始周波数に対応するSBR開始周波数を含む、
    請求項12記載のエンコーダ。
  14. ・前記低周波成分は、前記オーディオ信号の、前記SBR開始周波数より下の周波数を含み;
    ・前記高周波成分は、前記オーディオ信号の、前記SBR開始周波数より上の周波数を含む、
    請求項13記載のエンコーダ。
  15. 前記コア・エンコーダが、AACと称される先進オーディオ・エンコードまたはmp3エンコードのうちの任意の一つを実行するよう適応されている、請求項1ないし14のうちいずれか一項記載のエンコーダ。
  16. ・第一のサンプリング・レートにある前記オーディオ信号をアップサンプリングして前記信号サンプリング・レートの前記オーディオ信号を与えるよう適応されたアップサンプリング・ユニットをさらに有しており、前記第一のサンプリング・レートは前記信号サンプリング・レートより小さい、請求項1ないし15のうちいずれか一項記載のエンコーダ。
  17. 前記一つまたは複数のSBRエンコーダ設定が、前記第一のサンプリング・レートに基づいて決定されるSBR停止周波数を含む、請求項16記載のエンコーダ。
  18. 前記SBR停止周波数が、
    ・所定の周波数格子上で決定され;
    ・前記周波数格子上のある周波数に等しい、
    請求項17記載のエンコーダ。
  19. 前記全体的なビットストリームが:MP4フォーマット、3GPフォーマット、3G2フォーマット、LATMフォーマットのいずれか一つでエンコードされる、請求項1ないし18のうちいずれか一項記載のエンコーダ。
  20. 前記SBRエンコード・ユニット(153、254)が、
    ・前記オーディオ信号から複数のサブバンド信号を提供するよう適応された分解フィルタバンクと;
    ・SBRエンコーダ(254)とを有しており、前記SBRエンコーダは:
    ・前記複数のサブバンド信号の第一の部分集合を前記低周波成分に割り当て;
    ・前記複数のサブバンド信号の第二の部分集合を前記高周波成分に割り当て;
    ・前記第一および第二の部分集合から前記複数のSBRパラメータを決定するよう適応されている、
    請求項1ないし19のうちいずれか一項記載のエンコーダ。
  21. 前記一つまたは複数のSBRエンコーダ設定が:
    ・SBR開始周波数であって、前記SBRエンコード・ユニットが、前記SBR開始周波数以上の前記高周波成分の周波数について前記複数のSBRパラメータを決定するよう制約される、SBR開始周波数と;
    ・SBR停止周波数であって、前記SBRエンコード・ユニットは、前記SBR停止周波数以下の前記高周波成分の周波数について前記複数のSBRパラメータを決定するよう制約される、SBR停止周波数とのうちの任意の一つまたは複数を含む、
    請求項1ないし20のうちいずれか一項記載のエンコーダ。
  22. 過剰サンプリングされたスペクトル帯域複製(SBR)モードで動作する、HE-AACと称される高効率先進オーディオ符号化のエンコーダであって、
    ・当該エンコーダは、コア・エンコードされたビットストリーム、複数のSBRパラメータおよび前記SBRパラメータを決定するために使われた前記一つまたは複数のSBRエンコーダ設定の指標を含む全体的なビットストリームを生成するよう適応されており、
    ・生成された全体的なビットストリームは、当該エンコーダが過剰サンプリングされたSBRモードで動作することを示さない、
    エンコーダ。
  23. 前記生成された全体的なビットストリームが、当該エンコーダがデュアル・レート・モードで動作すると示す、請求項22記載のエンコーダ。
  24. ある信号サンプリング・レートのオーディオ信号をアップサンプリングするよう適応されたオーディオ・コーデックであって:
    前記信号サンプリング・レートの前記オーディオ信号のためのエンコーダであって、
    ・前記信号サンプリング・レートの前記オーディオ信号の低周波成分をエンコードし、それによりコア・エンコードされたビットストリームを生成するよう適応されたコア・エンコーダと;
    ・一つまたは複数のSBRエンコーダ設定のもとで複数のSBRパラメータを決定するよう適応されているスペクトル帯域複製(SBR)エンコード・ユニットであって、前記複数のSBRパラメータは、前記信号サンプリング・レートの前記オーディオ信号の高周波成分が前記オーディオ信号の低周波成分および前記複数のSBRパラメータに基づいて近似されることができるよう、決定される、SBRエンコード・ユニットと;
    ・前記コア・エンコードされたビットストリーム、前記複数のSBRパラメータおよび前記一つまたは複数のSBRエンコーダ設定の指標を含む全体的なビットストリームを生成するよう適応されたマルチプレクサとを有する、エンコーダ、ならびに、
    前記生成された全体的なビットストリームを受領するデコーダであって、
    ・前記コア・エンコードされたビットストリームから前記信号サンプリング・レートの再構成された低周波成分を生成するよう適応されたコア・デコーダと;
    ・前記再構成された低周波成分のN個のサブバンド信号を生成するよう適応された分解フィルタバンクと;
    ・前記再構成された低周波成分の前記N個のサブバンド信号に基づいて、前記複数のSBRパラメータに基づいて、かつ前記一つまたは複数のSBRエンコーダ設定に基づいて、再構成された高周波成分のN個のサブバンド信号を生成するよう適応されたSBRデコーダと;
    ・前記再構成された低周波成分の前記N個のサブバンド信号からおよび前記再構成された高周波成分の前記N個のサブバンド信号から、前記信号サンプリング・レートの二倍の再構成されたオーディオ信号を生成するよう適応されている、2N個の周波数帯を含む合成フィルタバンクとを有するデコーダを有する、
    コーデック。
  25. ある信号サンプリング・レートのオーディオ信号をアップサンプリングするよう適応された高効率先進オーディオ符号化(HE-AAC)コーデックであって:
    ・過剰サンプリングされたスペクトル帯域複製(SBR)モードで動作するHE-AACエンコーダであって、前記HE-AACエンコーダは、コア・エンコードされたビットストリーム、複数のSBRパラメータおよび前記SBRパラメータを決定するために使われた前記一つまたは複数のSBRエンコーダ設定の指標を含む全体的なビットストリームを生成するよう適応されている、エンコーダと;
    ・デュアル・レート・モードで動作するHE-AACデコーダであって、前記HE-AACデコーダは、前記全体的なビットストリームから前記信号サンプリング・レートの二倍で再構成されたオーディオ信号を生成するよう適応されている、デコーダとを有する、
    コーデック。
  26. ある信号サンプリング・レートのオーディオ信号をエンコードする方法であって、
    ・前記信号サンプリング・レートの前記オーディオ信号の低周波成分をエンコードし、それによりコア・エンコードされたビットストリームを生成する段階と;
    ・一つまたは複数のSBRエンコーダ設定のもとで複数のスペクトル帯域複製(SBR)パラメータを決定する段階であって、前記複数のSBRパラメータは、前記信号サンプリング・レートの前記オーディオ信号の高周波成分が前記オーディオ信号の前記低周波成分および前記複数のSBRパラメータに基づいて近似されることができるよう、決定される、段階と;
    ・前記コア・エンコードされたビットストリーム、前記複数のSBRパラメータおよび前記一つまたは複数のSBRエンコーダ設定の指標を含む全体的なビットストリームを生成する段階であって、前記生成される全体的なビットストリームは、前記コア・エンコードされたビットストリームが前記信号サンプリング・レートにある前記低周波成分をエンコードすることによって決定されたことを示さない、段階とを含む、
    方法。
  27. ある信号サンプリング・レートのオーディオ信号をアップサンプリングする方法であって、
    ・前記信号サンプリング・レートの前記オーディオ信号の低周波成分をエンコードし、それによりコア・エンコードされたビットストリームを生成する段階と;
    ・一つまたは複数のSBRエンコーダ設定のもとで複数のスペクトル帯域複製(SBR)パラメータを決定する段階であって、前記複数のSBRパラメータは、前記信号サンプリング・レートの前記オーディオ信号の高周波成分が前記オーディオ信号の前記低周波成分および前記複数のSBRパラメータに基づいて近似されることができるよう、決定される、段階と;
    ・前記コア・エンコードされたビットストリームから前記信号サンプリング・レートの再構成された低周波成分を生成する段階と;
    ・前記再構成された低周波成分のN個のサブバンド信号を生成する段階と;
    ・前記再構成された低周波成分の前記N個のサブバンド信号に基づいて、前記複数のSBRパラメータに基づいて、かつ前記一つまたは複数のSBRエンコーダ設定に基づいて、再構成された高周波成分のN個のサブバンド信号を生成する段階と;
    ・前記再構成された低周波成分の前記N個のサブバンド信号からおよび前記再構成された高周波成分の前記N個のサブバンド信号から、前記信号サンプリング・レートの二倍の再構成されたオーディオ信号を生成する段階とを含む、
    方法。
  28. プロセッサ上での実行のためおよびコンピューティング装置上で実行されたときに請求項26または27記載の方法段階を実行するために適応されている、ソフトウェア・プログラム。
  29. プロセッサ上での実行のためおよびコンピューティング装置上で実行されたときに請求項26または27記載の方法段階を実行するために適応されたソフトウェア・プログラムを有する、記憶媒体。
  30. 請求項26または27記載の方法段階を実行するための実行可能命令を含む、コンピュータ・プログラム・プロダクト。
JP2014540505A 2011-11-11 2012-11-12 過剰サンプリングされたsbrを使ったアップサンプリング Active JP6155274B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161558519P 2011-11-11 2011-11-11
US61/558,519 2011-11-11
PCT/EP2012/072395 WO2013068587A2 (en) 2011-11-11 2012-11-12 Upsampling using oversampled sbr

Publications (2)

Publication Number Publication Date
JP2014532904A true JP2014532904A (ja) 2014-12-08
JP6155274B2 JP6155274B2 (ja) 2017-06-28

Family

ID=47715963

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014540505A Active JP6155274B2 (ja) 2011-11-11 2012-11-12 過剰サンプリングされたsbrを使ったアップサンプリング

Country Status (5)

Country Link
US (2) US9530424B2 (ja)
EP (2) EP3544006A1 (ja)
JP (1) JP6155274B2 (ja)
CN (1) CN103918029B (ja)
WO (1) WO2013068587A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016514858A (ja) * 2013-04-05 2016-05-23 ドルビー・インターナショナル・アーベー オーディオ処理システム
JP2023509548A (ja) * 2020-01-10 2023-03-08 華為技術有限公司 オーディオ符号化方法およびデバイスならびにオーディオ復号方法およびデバイス

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI557727B (zh) 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
RU2653458C2 (ru) * 2014-01-22 2018-05-08 Сименс Акциенгезелльшафт Цифровой измерительный вход для электрического устройства автоматизации, электрическое устройство автоматизации с цифровым измерительным входом и способ обработки цифровых входных измеренных значений
TWI693594B (zh) 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
EP3318070B1 (en) * 2015-07-02 2024-05-22 Dolby Laboratories Licensing Corporation Determining azimuth and elevation angles from stereo recordings
HK1255002A1 (zh) 2015-07-02 2019-08-02 杜比實驗室特許公司 根據立體聲記錄確定方位角和俯仰角
EP3182411A1 (en) 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
CN106057220B (zh) * 2016-05-19 2020-01-03 Tcl集团股份有限公司 一种音频信号的高频扩展方法和音频播放器
TWI702594B (zh) * 2018-01-26 2020-08-21 瑞典商都比國際公司 用於音訊信號之高頻重建技術之回溯相容整合
IL313348A (en) 2018-04-25 2024-08-01 Dolby Int Ab Combining high-frequency restoration techniques with reduced post-processing delay
IL278223B2 (en) 2018-04-25 2023-12-01 Dolby Int Ab Combining high-frequency audio reconstruction techniques
CN109243485B (zh) * 2018-09-13 2021-08-13 广州酷狗计算机科技有限公司 恢复高频信号的方法和装置
CN111755017B (zh) * 2020-07-06 2021-01-26 全时云商务服务股份有限公司 云会议的音频录制方法、装置、服务器及存储介质
CN111986685B (zh) * 2020-08-31 2024-06-21 北京百瑞互联技术股份有限公司 一种实现高采样率的音频编解码方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008107415A (ja) * 2006-10-23 2008-05-08 Fujitsu Ltd 符号化装置
WO2010120924A1 (en) * 2009-04-14 2010-10-21 Qualcomm Incorporated Low complexity spectral band replication (sbr) filterbanks
JP2011034046A (ja) * 2009-04-03 2011-02-17 Ntt Docomo Inc 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、音声符号化プログラム及び音声復号プログラム
JP2011100159A (ja) * 2003-10-23 2011-05-19 Panasonic Corp スペクトル符号化装置、スペクトル復号化装置、音響信号送信装置、音響信号受信装置、およびこれらの方法
JP2011520146A (ja) * 2009-04-02 2011-07-14 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ハーモニックな帯域拡張と非ハーモニックな帯域拡張との組合せを使用して、入力信号表示に基づいて帯域拡張信号の表示を生成するための装置と方法及びコンピュータプログラム
WO2011110499A1 (en) * 2010-03-09 2011-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an audio signal using patch border alignment
WO2011128342A1 (en) * 2010-04-13 2011-10-20 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Method and encoder and decoder for gap - less playback of an audio signal
JP2011527447A (ja) * 2008-07-11 2011-10-27 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオ信号合成器及びオーディオ信号符号器

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
JP4679049B2 (ja) 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
RU2374703C2 (ru) 2003-10-30 2009-11-27 Конинклейке Филипс Электроникс Н.В. Кодирование или декодирование аудиосигнала
WO2005073959A1 (en) 2004-01-28 2005-08-11 Koninklijke Philips Electronics N.V. Audio signal decoding using complex-valued data
JP4939424B2 (ja) 2004-11-02 2012-05-23 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 複素値のフィルタ・バンクを用いたオーディオ信号の符号化及び復号化
US7917561B2 (en) 2005-09-16 2011-03-29 Coding Technologies Ab Partially complex modulated filter bank
EP3288027B1 (en) 2006-10-25 2021-04-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating complex-valued audio subband values
JP4930320B2 (ja) * 2006-11-30 2012-05-16 ソニー株式会社 再生方法及び装置、プログラム並びに記録媒体
JP2009180972A (ja) * 2008-01-31 2009-08-13 Panasonic Corp オーディオレジューム再生装置及びオーディオレジューム再生方法
AU2009221443B2 (en) * 2008-03-04 2012-01-12 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for mixing a plurality of input data streams
US8532998B2 (en) 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
UA99878C2 (ru) 2009-01-16 2012-10-10 Долби Интернешнл Аб Гармоническое преобразование, усовершенствованное перекрестным произведением
RU2493618C2 (ru) 2009-01-28 2013-09-20 Долби Интернешнл Аб Усовершенствованное гармоническое преобразование
TWI662788B (zh) 2009-02-18 2019-06-11 瑞典商杜比國際公司 用於高頻重建或參數立體聲之複指數調變濾波器組
KR101433701B1 (ko) * 2009-03-17 2014-08-28 돌비 인터네셔널 에이비 적응형으로 선택가능한 좌/우 또는 미드/사이드 스테레오 코딩과 파라메트릭 스테레오 코딩의 조합에 기초한 진보된 스테레오 코딩
US8515768B2 (en) * 2009-08-31 2013-08-20 Apple Inc. Enhanced audio decoder
ES2805349T3 (es) 2009-10-21 2021-02-11 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
AU2010310041B2 (en) 2009-10-21 2013-08-15 Dolby International Ab Apparatus and method for generating a high frequency audio signal using adaptive oversampling
CN102194457B (zh) * 2010-03-02 2013-02-27 中兴通讯股份有限公司 音频编解码方法、系统及噪声水平估计方法
AU2011311659B2 (en) * 2010-10-06 2015-07-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (USAC)
EP3373296A1 (en) * 2011-02-14 2018-09-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise generation in audio codecs
KR101742136B1 (ko) * 2011-03-18 2017-05-31 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011100159A (ja) * 2003-10-23 2011-05-19 Panasonic Corp スペクトル符号化装置、スペクトル復号化装置、音響信号送信装置、音響信号受信装置、およびこれらの方法
JP2008107415A (ja) * 2006-10-23 2008-05-08 Fujitsu Ltd 符号化装置
JP2011527447A (ja) * 2008-07-11 2011-10-27 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオ信号合成器及びオーディオ信号符号器
JP2011520146A (ja) * 2009-04-02 2011-07-14 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ハーモニックな帯域拡張と非ハーモニックな帯域拡張との組合せを使用して、入力信号表示に基づいて帯域拡張信号の表示を生成するための装置と方法及びコンピュータプログラム
JP2011034046A (ja) * 2009-04-03 2011-02-17 Ntt Docomo Inc 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、音声符号化プログラム及び音声復号プログラム
WO2010120924A1 (en) * 2009-04-14 2010-10-21 Qualcomm Incorporated Low complexity spectral band replication (sbr) filterbanks
WO2011110499A1 (en) * 2010-03-09 2011-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an audio signal using patch border alignment
WO2011128342A1 (en) * 2010-04-13 2011-10-20 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Method and encoder and decoder for gap - less playback of an audio signal

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016514858A (ja) * 2013-04-05 2016-05-23 ドルビー・インターナショナル・アーベー オーディオ処理システム
JP2023509548A (ja) * 2020-01-10 2023-03-08 華為技術有限公司 オーディオ符号化方法およびデバイスならびにオーディオ復号方法およびデバイス
JP7481457B2 (ja) 2020-01-10 2024-05-10 華為技術有限公司 オーディオ符号化方法およびデバイスならびにオーディオ復号方法およびデバイス

Also Published As

Publication number Publication date
USRE48258E1 (en) 2020-10-13
EP2777042A2 (en) 2014-09-17
JP6155274B2 (ja) 2017-06-28
EP3544006A1 (en) 2019-09-25
US20140365231A1 (en) 2014-12-11
CN103918029A (zh) 2014-07-09
WO2013068587A3 (en) 2013-09-26
US9530424B2 (en) 2016-12-27
WO2013068587A2 (en) 2013-05-16
EP2777042B1 (en) 2019-08-14
CN103918029B (zh) 2016-01-20

Similar Documents

Publication Publication Date Title
JP6155274B2 (ja) 過剰サンプリングされたsbrを使ったアップサンプリング
JP6407928B2 (ja) オーディオ処理システム
JP5298245B2 (ja) Sbrビットストリームパラメータダウンミックス
WO2007109338A1 (en) Low bit rate audio encoding and decoding
KR101763129B1 (ko) 오디오 인코더 및 디코더
JP2022091968A (ja) オーディオ信号の高周波再構成を行う方法及びオーディオ処理ユニット
JP6286554B2 (ja) 低演算資源を用いて符号化済みオーディオ信号を復号化する装置及び方法
TW202006706A (zh) 具有減少後處理延遲之高頻重建技術之整合
JP6665354B2 (ja) オーディオ信号の高周波再構成のための高調波転換器の後方互換な統合
EP2610867A1 (en) Audio reproducing device and audio reproducing method
JP2016535870A (ja) 高周波再構成アルゴリズムのための周波数帯域テーブル設計
KR20240151254A (ko) 오디오 신호에 대한 고주파 재구성 기술의 하위 호환 통합

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150721

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151016

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160315

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20161206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170227

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20170307

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170516

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170605

R150 Certificate of patent or registration of utility model

Ref document number: 6155274

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250