JP2023143924A - インターリーブされた波形符号化のためのデコード方法、デコーダ、媒体およびエンコード方法 - Google Patents
インターリーブされた波形符号化のためのデコード方法、デコーダ、媒体およびエンコード方法 Download PDFInfo
- Publication number
- JP2023143924A JP2023143924A JP2023117210A JP2023117210A JP2023143924A JP 2023143924 A JP2023143924 A JP 2023143924A JP 2023117210 A JP2023117210 A JP 2023117210A JP 2023117210 A JP2023117210 A JP 2023117210A JP 2023143924 A JP2023143924 A JP 2023143924A
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- signal
- waveform
- stage
- waveform encoded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 230000003595 spectral effect Effects 0.000 claims abstract description 114
- 230000005236 sound signal Effects 0.000 claims abstract description 97
- 238000012545 processing Methods 0.000 claims description 13
- 230000015572 biosynthetic process Effects 0.000 claims description 5
- 238000003786 synthesis reaction Methods 0.000 claims description 5
- 238000001228 spectrum Methods 0.000 claims description 2
- 239000013598 vector Substances 0.000 description 58
- 230000001052 transient effect Effects 0.000 description 24
- 238000001514 detection method Methods 0.000 description 22
- 230000011664 signaling Effects 0.000 description 18
- 239000011159 matrix material Substances 0.000 description 13
- 238000004422 calculation algorithm Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 8
- 238000005070 sampling Methods 0.000 description 8
- 238000000354 decomposition reaction Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000002123 temporal effect Effects 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 5
- 238000012913 prioritisation Methods 0.000 description 5
- 230000010076 replication Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Error Detection And Correction (AREA)
Abstract
【課題】オーディオ信号のデコードおよびエンコードのための方法および装置が提供される。【解決手段】特に、デコード方法は、クロスオーバー周波数より上の周波数範囲のある部分集合に対応するスペクトル内容をもつ波形符号化された信号を受領することを含む。波形符号化された信号は、クロスオーバー周波数より上のオーディオ信号のパラメトリック高周波数再構成とインターリーブされる。このようにして、オーディオ信号の高周波数帯域の改善された再構成が達成される。【選択図】図1
Description
本稿に開示される発明は概括的にはオーディオ・エンコードおよびデコードに関する。詳細には、オーディオ信号の高周波数再構成を実行するよう適応されたオーディオ・エンコーダおよびオーディオ・デコーダに関する。
オーディオ符号化システムはオーディオの符号化のために、純粋な波形符号化、パラメトリック空間的符号化およびスペクトル帯域複製(SBR: Spectral Band Replication)アルゴリズムを含む高周波数再構成アルゴリズムといった種々の方法論を使用する。MPEG-4標準はオーディオ信号の波形符号化およびSBRを組み合わせる。より正確には、エンコーダは、クロスオーバー周波数までのスペクトル帯域についてはオーディオ信号を波形符号化して、クロスオーバー周波数より上のスペクトル帯域はSBRエンコードを使ってエンコードしてもよい。オーディオ信号の波形符号化された部分はその後、SBRエンコードの間に決定されたSBRパラメータと一緒にデコーダに伝送される。すると、オーディオ信号の波形符号化された部分およびSBRパラメータに基づいて、デコーダはクロスオーバー周波数より上のスペクトル帯域におけるオーディオ信号を再構成する。これについてはレビュー論文の非特許文献1で論じられている。
このアプローチの一つの問題は、強いトーン性成分、すなわち強いハーモニック成分またはSBRアルゴリズムによってうまく再構成されない高スペクトル帯域中の何らかの成分が出力において欠けるということである。
この目的に向け、SBRアルゴリズムは欠失ハーモニクス検出手順を実装する。SBR高周波数再構成によって適正に再構成されないトーン性成分がエンコーダ側で識別される。これらの強いトーン性成分の周波数位置の情報がデコーダに伝送され、そこで、欠けているトーン性成分が位置しているスペクトル帯域のスペクトル内容がデコーダで生成された正弦波によって置き換えられる。
Brinker et al., "An overview of the Coding Standard MPEG-4 Audio Amendments 1 and 2: HE-AAC, SSC, and HE-AAC v2", EURASIP Journal on Audio, Speech and Music Processing, Volume 2009, Article ID 468971
SBRアルゴリズムにおいて提供されている欠失ハーモニクス検出の利点は、いくらか簡略化して言うと、トーン性成分の周波数位置およびその振幅レベルだけをデコーダに伝送すればよいので、非常に低ビットレートの解決策であるということである。SBRアルゴリズムの欠失ハーモニクス検出の欠点は、非常に粗いモデルであるということである。もう一つの欠点は、伝送レートが低いとき、すなわち1秒当たりに伝送されうるビット数が少なく、その結果としてスペクトル帯域が広いとき、大きな周波数範囲が正弦波によって置換されてしまうということである。
SBRアルゴリズムのもう一つの欠点は、オーディオ信号において現われる過渡成分をぼかしてしまう傾向があるということである。典型的には、SBR再構成されたオーディオ信号には過渡成分の前エコーおよび後エコーがある。このように、改善の余地がある。
以下では、例示的な実施形態について、付属の図面を参照して、より詳細に記述する。
例示的な実施形態に基づくデコーダの概略図である。
例示的な実施形態に基づくデコーダの概略図である。
例示的な実施形態に基づくデコード方法のフローチャートである。
例示的な実施形態に基づくデコーダの概略図である。
例示的な実施形態に基づくエンコーダの概略図である。
例示的な実施形態に基づくエンコード方法のフローチャートである。
例示的な実施形態に基づく信号伝達方式の概略的な図解である。
a~bは、例示的な実施形態に基づくインターリーブ段の概略的な図解である。 すべての図面は概略的であり、一般に、本発明を明快にするために必要な部分を示すのみである。他の部分は省略されたり、単に示唆されるだけのことがある。特に断わりのない限り、同様の参照符号は異なる図面において同様の部分を指す。
上記に鑑み、高周波数帯域における過渡成分およびトーン性成分の改善された再構成を提供するエンコーダおよびデコーダならびに関連する方法を提供することが目的である。
〈I.概観 ― デコーダ〉
本稿での用法では、オーディオ信号は純粋なオーディオ信号またはオーディオビジュアル信号またはマルチメディア信号のオーディオ部分またはメタデータと組み合わせたこれらの任意のものでありうる。
本稿での用法では、オーディオ信号は純粋なオーディオ信号またはオーディオビジュアル信号またはマルチメディア信号のオーディオ部分またはメタデータと組み合わせたこれらの任意のものでありうる。
第一の側面によれば、例示的実施形態はデコード方法、デコード装置およびデコードのためのコンピュータ・プログラム・プロダクトを提案する。提案される方法、装置およびコンピュータ・プログラム・プロダクトは一般に同じ特徴および利点をもつことがある。
例示的実施形態によれば、オーディオ処理システムにおけるデコード方法であって:第一のクロスオーバー周波数までのスペクトル内容をもつ第一の波形符号化された信号を受領する段階と;前記第一のクロスオーバー周波数より上の周波数範囲の部分集合に対応するスペクトル内容をもつ第二の波形符号化された信号を受領する段階と;高周波数再構成パラメータを受領する段階と;前記第一の波形符号化された信号および前記高周波数再構成パラメータを使って高周波数再構成を実行して、前記第一のクロスオーバー周波数より上のスペクトル内容をもつ周波数拡張された信号を生成する段階と;前記周波数拡張された信号を前記第二の波形符号化された信号とインターリーブする段階とを含む、方法が提供される。
本稿での用法では、波形符号化された信号は、波形の表現の直接的な量子化;最も好ましくは入力波形信号の周波数変換のラインの量子化によって符号化された信号と解釈される。これは、信号が信号属性の一般的モデルの変形によって表現されるパラメトリック符号化に対するものである。
このように、本デコード方法は、第一のクロスオーバー周波数より上の周波数範囲の部分集合における波形符号化されたデータを使い、それを高周波数再構成された信号とインターリーブすることを提案する。このようにして、第一のクロスオーバー周波数より上の周波数帯域における信号の重要な部分、たとえばパラメトリック高周波数再構成アルゴリズムでは典型的にはうまく再構成されないトーン性成分や過渡成分が波形符号化されうる。結果として、第一のクロスオーバー周波数より上の周波数帯域における信号のこれらの重要な部分の再構成が改善される。
例示的な実施形態によれば、第一のクロスオーバー周波数より上の周波数範囲の前記部分集合は疎な部分集合である。たとえば、該部分集合は、複数の孤立した周波数区間からなっていてもよい。これは、前記第二の波形符号化された信号を符号化するためのビット数が少ない点で有利である。それでも、複数の孤立した周波数区間をもつことにより、オーディオ信号のトーン性成分、たとえば単独のハーモニクスが、前記第二の波形符号化された信号によってうまく捕捉されうる。結果として、高周波数帯域についてのトーン性成分の再構成の改善が低ビット・コストで達成される。
例示的な実施形態によれば、前記第二の波形符号化された信号は、再構成されるべきオーディオ信号中の過渡成分を表わしていてもよい。過渡成分(transient)は典型的には短い時間的範囲、たとえば48kHzのサンプリング・レートで約100時間サンプル、たとえば5ないし10ミリ秒のオーダーの時間的範囲に限定されているが、広い周波数範囲をもつことがある。したがって、該過渡成分捕捉するために、第一のクロスオーバー周波数より上の周波数帯域の前記部分集合は、前記第一のクロスオーバー周波数と第二のクロスオーバー周波数との間に延在する周波数区間を含みうる。これは、過渡成分の改善された再構成が達成されうる点で有利である。
例示的実施形態によれば、前記第二のクロスオーバー周波数は時間の関数として変化する。たとえば、前記第二のクロスオーバー周波数は、オーディオ処理システムによって設定された時間フレーム内で変化しうる。このようにして、過渡成分の短い時間的範囲が考慮されうる。
例示的実施形態によれば、高周波数再構成を実行する段階は、スペクトル帯域複製(SBR)を実行することを含む。高周波数再構成は典型的には周波数領域で、たとえば64サブバンドなどの擬似直交ミラー・フィルタ(QMF: Quadrature Mirror Filters)領域で、実行される。
例示的実施形態によれば、周波数拡張された信号を第二の波形符号化された信号とインターリーブする段階は、周波数領域、たとえばQMF領域で実行される。典型的には、実装の簡単および両信号の時間および周波数特性に対するよりよい制御のために、インターリーブは、高周波数再構成と同じ周波数領域で実行される。
例示的実施形態によれば、受領される第一および第二の波形符号化された信号は、同じ修正離散コサイン変換(MDCT)を使って符号化される。
例示的実施形態によれば、デコード方法は、高周波数再構成パラメータに従って、周波数拡張された信号のスペクトル内容を調整し、それにより周波数拡張された信号のスペクトル包絡を調整することを含んでいてもよい。
例示的実施形態によれば、インターリーブは、第二の波形符号化された信号を周波数拡張された信号に加えることを含んでいてもよい。これは、第二の波形符号化された信号がトーン性成分を表わす場合、たとえば第一のクロスオーバー周波数より上の周波数範囲の前記部分集合が複数の孤立した周波数区間を含むときには、好ましいオプションである。第二の波形符号化された信号を周波数拡張された信号に加えることは、SBRから知られているハーモニクスのパラメトリックな加算を模倣し、SBRの上にコピーした信号を、トーン性成分を好適なレベルで混合することによって大きな周波数範囲が単一のトーン性成分によって置換されることを回避するために使うことを許容する。
例示的実施形態によれば、インターリーブは、周波数拡張された信号のスペクトル内容を、第二の波形符号化された信号のスペクトル内容に対応する第一のクロスオーバー周波数より上の周波数範囲の前記部分集合において、第二の波形符号化された信号のスペクトル内容によって置換することを含む。これは、第二の波形符号化された信号が過渡成分を表わすとき、たとえば第一のクロスオーバー周波数より上の周波数範囲の前記部分集合がしたがって前記第一のクロスオーバー周波数とある第二のクロスオーバー周波数との間に延在する周波数区間を含みうるときに、好ましいオプションである。置換は典型的には、第二の波形符号化された信号によってカバーされる時間範囲についてのみ実行される。このようにして、周波数拡張された信号において存在する過渡成分および潜在的な時間ぼけを置換するのに十分でありながら、できるだけ少ない部分が置換されうる。よって、インターリーブは、SBR包絡時間グリッドによって指定される時間セグメントに限定されない。
例示的実施形態によれば、第一および第二の波形符号化された信号は別個の信号であってもよい。つまり、別個に符号化されたものである。あるいはまた、第一の波形符号化された信号および第二の波形符号化された信号は共通の、合同符号化される信号の第一および第二の信号部分をなす。後者の選択肢は、実装の観点から、より魅力的である。
例示的実施形態によれば、デコード方法は、第二の波形符号化された信号が利用可能である一つまたは複数の時間範囲および第一のクロスオーバー周波数より上の一つまたは複数の周波数範囲に関係するデータを含む制御信号を受領することを含んでいてもよく、ここで、周波数拡張された信号を第二の波形符号化された信号とインターリーブする段階は、該制御信号に基づく。これは、インターリーブを制御する効率的な仕方を提供するという点で有利である。
例示的実施形態によれば、制御信号は、周波数拡張された信号とインターリーブするために第二の波形符号化された信号が利用可能である第一のクロスオーバー周波数より上の前記一つまたは複数の周波数範囲を示す第二のベクトルと、周波数拡張された信号とインターリーブするために第二の波形符号化された信号が利用可能である前記一つまたは複数の時間範囲を示す第三のベクトルとのうち少なくとも一方を含む。これは、制御信号を実装する便利な方法である。
例示的実施形態によれば、制御信号は、高周波数再構成パラメータに基づいてパラメトリック再構成されるべき、第一のクロスオーバー周波数より上の一つまたは複数の周波数範囲を示す第一のベクトルを含む。このようにして、ある種の周波数帯域については周波数拡張された信号が第二の波形符号化された信号より優先されてもよい。
例示的実施形態によれば、第一の側面の任意のデコード方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクトも提供される。
例示的実施形態によれば、オーディオ処理システムのためのデコーダであって:第一のクロスオーバー周波数までのスペクトル内容をもつ第一の波形符号化された信号、前記第一のクロスオーバー周波数より上の周波数範囲の部分集合に対応するスペクトル内容をもつ第二の波形符号化された信号および高周波数再構成パラメータを受領するよう構成された受領段と;前記第一の波形符号化された信号および前記高周波数再構成パラメータを前記受領段から受け取り、前記第一の波形符号化された信号および前記高周波数再構成パラメータを使って高周波数再構成を実行して、前記第一のクロスオーバー周波数より上のスペクトル内容をもつ周波数拡張された信号を生成する高周波数再構成段と;前記高周波数再構成段からの前記周波数拡張された信号および前記受領段からの前記第二の波形符号化された信号を受け取って、前記周波数拡張された信号を前記第二の波形符号化された信号とインターリーブするインターリーブ段とを有する、デコーダも提供される。
例示的実施形態によれば、前記デコーダは、本稿に開示されるどのデコード方法を実行するよう構成されていてもよい。
〈II.概観 ― エンコーダ〉
第二の側面によれば、例示的実施形態はエンコード方法、エンコード装置およびエンコードのためのコンピュータ・プログラム・プロダクトを提案する。提案される方法、装置およびコンピュータ・プログラム・プロダクトは一般に同じ特徴および利点をもつことがある。
第二の側面によれば、例示的実施形態はエンコード方法、エンコード装置およびエンコードのためのコンピュータ・プログラム・プロダクトを提案する。提案される方法、装置およびコンピュータ・プログラム・プロダクトは一般に同じ特徴および利点をもつことがある。
上記のデコーダの概観において提示した特徴およびセットアップに関する利点は一般に、エンコーダについての対応する特徴およびセットアップについて有効でありうる。
例示的実施形態によれば、オーディオ処理システムにおけるエンコード方法であって:エンコードされるべきオーディオ信号を受領する段階と;受領されたオーディオ信号に基づいて、第一のクロスオーバー周波数より上の受領されたオーディオ信号の高周波数再構成を可能にする高周波数再構成パラメータを計算する段階と;受領されたオーディオ信号に基づいて、受領されたオーディオ信号のスペクトル内容が波形符号化され、その後デコーダにおいてオーディオ信号の高周波数再構成とインターリーブされるべき、第一のクロスオーバー周波数より上の周波数範囲の部分集合を同定する段階と;第一のクロスオーバー周波数までのスペクトル帯域について受領されたオーディオ信号を波形符号化することによって第一の波形符号化された信号を生成する段階と;第一のクロスオーバー周波数より上の周波数範囲の前記同定された部分集合に対応するスペクトル帯域について受領されたオーディオ信号を波形符号化することによって第二の波形符号化された信号を生成する段階とを含む、方法が提供される。
例示的実施形態によれば、第一のクロスオーバー周波数より上の周波数範囲の前記部分集合は、複数の孤立した周波数区間を含んでいてもよい。
例示的実施形態によれば、第一のクロスオーバー周波数より上の周波数範囲の前記部分集合は、前記第一のクロスオーバー周波数とある第二のクロスオーバー周波数との間に延在する周波数区間を含んでいてもよい。
例示的実施形態によれば、前記第二のクロスオーバー周波数は時間の関数として変化してもよい。
例示的実施形態によれば、高周波数再構成パラメータは、スペクトル帯域複製(SBR)エンコードを使って計算される。
例示的実施形態によれば、エンコード方法はさらに、デコーダにおいて前記受領されたオーディオ信号の高周波数再構成が前記第二の波形符号化された信号と加えられることを補償するよう、高周波数再構成パラメータに含まれるスペクトル包絡レベルを調整することを含んでいてもよい。デコーダにおいて前記第二の波形符号化された信号が高周波数再構成された信号に加えられるので、組み合わされた信号のスペクトル包絡レベルは、前記高周波数再構成された信号のスペクトル包絡レベルとは異なる。デコーダにおける組み合わされた信号が目標のスペクトル包絡を得るよう、スペクトル包絡レベルにおけるこの変化がエンコーダにおいて考慮されうる。エンコーダ側で上記の調整を実行することにより、デコーダ側で必要とされるインテリジェンスが軽減されうる。あるいは別の言い方をすれば、エンコーダからデコーダへの具体的な信号伝達により、どのように状況に対処するかについてのデコーダにおける特定の規則を定義する必要がなくなる。これは、広く展開されている可能性のあるデコーダを更新する必要なしに、エンコーダの将来の最適化による、本システムの将来の最適化を許容する。
例示的実施形態によれば、高周波数再構成パラメータを調整する段階は、第二の波形符号化された信号のエネルギーを測定し;第二の波形符号化された信号の測定されたエネルギーを、第二の波形符号化された信号のスペクトル内容に対応するスペクトル帯域についてのスペクトル包絡レベルから減算することにより、高周波数再構成された信号のスペクトル包絡を制御するために意図されたスペクトル包絡レベルを調整することを含んでいてもよい。
例示的実施形態によれば、第二の側面の任意のエンコード方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクトも提供される。
例示的実施形態によれば、オーディオ処理システムのためのエンコーダであって:エンコードされるべきオーディオ信号を受領するよう構成された受領段と;前記オーディオ信号を前記受領段から受け取り、受領されたオーディオ信号に基づいて、第一のクロスオーバー周波数より上の受領されたオーディオ信号の高周波数再構成を可能にする高周波数再構成パラメータを計算するよう構成された高周波数エンコード段と;受領されたオーディオ信号に基づいて、受領されたオーディオ信号のスペクトル内容が波形符号化され、その後デコーダにおいてオーディオ信号の高周波数再構成とインターリーブされるべき、第一のクロスオーバー周波数より上の周波数範囲の部分集合を同定するよう構成されたインターリーブ符号化検出段と;前記オーディオ信号を前記受領段から受け取り、第一のクロスオーバー周波数までのスペクトル帯域について受領されたオーディオ信号を波形符号化することによって第一の波形符号化された信号を生成し、第一のクロスオーバー周波数より上の周波数範囲の前記同定された前記部分集合を前記インターリーブ符号化検出段から受け取り、周波数範囲の前記受領された同定された部分集合に対応するスペクトル帯域について受領されたオーディオ信号を波形符号化することによって第二の波形符号化された信号を生成するよう構成された波形符号化段とを有する、エンコーダが提供される。
例示的実施形態によれば、エンコーダはさらに、前記高周波数エンコード段からの前記高周波数再構成パラメータおよび前記インターリーブ符号化検出段からの前記第一のクロスオーバー周波数より上の周波数範囲の同定された部分集合を受領し、受領されたデータに基づいて、デコーダにおいて前記受領されたオーディオ信号の高周波数再構成を前記第二の波形符号化された信号とその後インターリーブすることについて補償するよう、高周波数再構成パラメータを調整するよう構成された包絡調整段を有していてもよい。
例示的実施形態によれば、前記デコーダは、本稿に開示されるどのデコード方法を実行するよう構成されていてもよい。
〈III.例示的実施形態 ― デコーダ〉
図1は、デコーダ100の例示的実施形態を示している。デコーダは、受領段110、高周波数再構成段120およびインターリーブ段130を有する。
図1は、デコーダ100の例示的実施形態を示している。デコーダは、受領段110、高周波数再構成段120およびインターリーブ段130を有する。
デコーダ100の動作についてここで、デコーダ200を示す図2の例示的実施形態および図3のフローチャートを参照してより詳細に説明する。デコーダ200の目的は、再構成されるべきオーディオ信号の高周波数帯域に強いトーン性成分がある場合に高周波数についての改善された信号再構成を与えることである。受領段110はステップD02において、第一の波形符号化された信号201を受領する。第一の波形符号化された信号201は第一のクロスオーバー周波数fcまでのスペクトル内容をもつ。すなわち、第一の波形符号化された信号201は、第一のクロスオーバー周波数fcより下の周波数範囲に制限されている低帯域信号である。
受領段110はステップD04において、第二の波形符号化された信号202を受領する。第二の波形符号化された信号202は第一のクロスオーバー周波数fcより上の周波数範囲のある部分集合に対応するスペクトル内容をもつ。図2の図示した例では、第二の波形符号化された信号202は、複数の孤立した周波数区間202aおよび202bに対応するスペクトル内容をもつ。このように、第二の波形符号化された信号202は、複数の帯域制限された信号から構成されていて、各帯域制限された信号が孤立した周波数区間202aおよび202bの一つに対応すると見られてもよい。図2では、二つの周波数区間202aおよび202bのみが示されている。一般には、第二の波形符号化された信号のスペクトル内容は、さまざまな幅の任意の数の周波数区間に対応しうる。
受領段110は、第一および第二の波形符号化された信号201および202を二つの別個の信号として受領してもよい。あるいはまた、第一および第二の波形符号化された信号201および202は、受領段110によって受領される共通の信号の第一および第二の信号部分をなしていてもよい。換言すれば、第一および第二の波形符号化された信号は、たとえば同じMDCT変換を使って合同符号化されていてもよい。
典型的には、受領段110によって受領される第一の波形符号化された信号201および第二の波形符号化された信号202は、MDCT変換のような重複窓掛け変換を使って符号化される。受領段は、第一および第二の波形符号化された信号201および202を時間領域に変換するよう構成されている波形デコード段240を有していてもよい。波形デコード段240は典型的には、第一および第二の波形符号化された信号201および202の逆MDCT変換を実行するよう構成されたMDCTフィルタバンクを有する。
受領段110はさらに、ステップD06において、以下で開示される高周波数再構成段120によって使われる高周波数再構成パラメータを受領する。
受領段110によって受領された第一の波形符号化された信号201および高周波数パラメータは次いで、高周波数再構成段120に入力される。高周波数再構成段120は典型的には、周波数領域、好ましくはQMF領域で動作する。したがって、高周波数再構成段120に入力される前に、第一の波形符号化された信号201は好ましくは周波数領域、好ましくはQMF領域に、QMF分解段250によって変換される。QMF分解段250は典型的には、第一の波形符号化された信号201のQMF変換を実行するよう構成されたQMFフィルタバンクを有する。
第一の波形符号化された信号201および高周波数再構成パラメータに基づいて、高周波数再構成段120は、ステップD08において、第一の波形符号化された信号201を第一のクロスオーバー周波数fcより上の周波数に拡張する。より具体的には、高周波数再構成段120は、第一のクロスオーバー周波数fcより上のスペクトル内容をもつ周波数拡張された信号203を生成する。このように、周波数拡張された信号203は広帯域信号である。
高周波数再構成段120は、高周波数再構成を実行するための任意の既知のアルゴリズムに従って動作しうる。特に、高周波数再構成段120は、非特許文献1のレビュー論文において開示されるSBRを実行するよう構成されていてもよい。よって、高周波数再構成段は、いくつかのステップで周波数拡張された信号203を生成するよう構成されたいくつかのサブ段を有していてもよい。たとえば、高周波数再構成段120は、高周波数生成段221、パラメトリック高周波数成分追加段222および包絡調整段223を有していてもよい。
手短かには、高周波数生成段221は、第一のサブステップD08aにおいて、周波数拡張された信号203を生成するために、第一の波形符号化された信号201をクロスオーバー周波数fcより上の周波数範囲に拡張する。この生成は、第一の波形符号化された信号201のサブバンド部分を選択し、高周波数再構成パラメータによって案内されて特定の規則に従って、第一の波形符号化された信号201の選択されたサブバンド部分を第一のクロスオーバー周波数fcより上の周波数範囲の選択されたサブバンド部分にミラーまたはコピーすることによって実行される。
高周波数再構成パラメータはさらに、周波数拡張された信号203に欠けているハーモニクスを加えるための欠失ハーモニクス・パラメータを含んでいてもよい。上記で論じたように、欠失ハーモニクス(harmonics)は、スペクトルの任意の強いトーン性(tonal)部分と解釈される。たとえば、欠失ハーモニクス・パラメータは、欠けているハーモニクスの周波数および振幅に関係するパラメータを含んでいてもよい。欠失ハーモニクス・パラメータに基づいて、パラメトリック高周波数成分追加段222は、サブステップD08bにおいて、正弦波成分を生成し、該正弦波成分を周波数拡張された信号203に加える。
高周波数再構成パラメータはさらに、周波数拡張された信号203の目標エネルギー・レベルを記述するスペクトル包絡パラメータを含んでいてもよい。スペクトル包絡パラメータに基づいて、包絡調整段223はサブステップD08cにおいて、周波数拡張された信号203のスペクトル内容、すなわち周波数拡張された信号203のスペクトル係数を調整し、それにより周波数拡張された信号203のエネルギー・レベルがスペクトル包絡パラメータによって記述される目標エネルギー・レベルに対応するようにする。
高周波数再構成段120からの周波数拡張された信号203および受領段110からの第二の波形符号化された信号は次いでインターリーブ段130に入力される。インターリーブ段130は典型的には高周波数再構成段120と同じ周波数領域、好ましくはQMF領域で動作する。よって、第二の波形符号化された信号202は典型的には、QMF分解段250を介してインターリーブ段に入力される。さらに第二の波形符号化された信号202は典型的には、高周波数再構成段120が高周波数再構成を実行するのにかかる時間を補償するために、遅延段260によって、遅延させられる。このようにして、第二の波形符号化された信号202および周波数拡張された信号203は、インターリーブ段130が、同じ時間フレームに対応する信号に対して作用するよう、整列される。
インターリーブ段130は、次いでステップD10において、インターリーブされた信号204を生成するために、第二の波形符号化された信号202を周波数拡張された信号203とインターリーブする、すなわち組み合わせる。第二の波形符号化された信号202を周波数拡張された信号203とインターリーブするために種々のアプローチが使用されうる。
ある例示的実施形態によれば、インターリーブ段130は、周波数拡張された信号203および第二の波形符号化された信号202を加算することによって、周波数拡張された信号203を第二の波形符号化された信号202とインターリーブする。第二の波形符号化された信号202のスペクトル内容は、第二の波形符号化された信号202のスペクトル内容に対応する周波数範囲の前記部分集合において、周波数拡張された信号203のスペクトル内容に重なる。周波数拡張された信号203および第二の波形符号化された信号202を加算することにより、インターリーブされた信号204は、重なる周波数については、周波数拡張された信号203のスペクトル内容および第二の波形符号化された信号202の周波数内容を含むことになる。加算の結果として、インターリーブされた信号204のスペクトル包絡レベルは重なる周波数については増大する。好ましくは、下記で開示されるように、加算に起因するスペクトル包絡レベルの増大は、高周波数再構成パラメータに含まれるエネルギー包絡レベルを決定するときにエンコーダ側で考慮される。たとえば、重なる周波数についてのスペクトル包絡レベルは、デコーダ側でのインターリーブに起因するスペクトル包絡レベルの増大に対応する量だけ、エンコーダ側で減少させられてもよい。
あるいはまた、加算に起因するスペクトル包絡レベルの増大は、デコーダ側で考慮されてもよい。たとえば、第二の波形符号化された信号202のエネルギーを測定し、測定されたエネルギーを、スペクトル包絡パラメータによって記述される目標エネルギー・レベルと比較し、インターリーブされた信号204のスペクトル包絡レベルが目標エネルギー・レベルと等しくなるよう周波数拡張された信号203を調整するエネルギー測定段があってもよい。
もう一つの例示的実施形態によれば、インターリーブ段130は、周波数拡張された信号203および第二の波形符号化された信号202が重なる周波数について、周波数拡張された信号203のスペクトル内容を第二の波形符号化された信号202のスペクトル内容で置き換えることによって、周波数拡張された信号203を第二の波形符号化された信号202とインターリーブする。周波数拡張された信号203が第二の波形符号化された信号202によって置換される例示的実施形態では、周波数拡張された信号203および第二の波形符号化された信号202のインターリーブについて補償するためにスペクトル包絡レベルを調整することは必要ない。
高周波数再構成段120は好ましくは、第一の波形符号化された信号201をエンコードするために使われた根底にあるコア・エンコーダのサンプリング・レートに等しいサンプリング・レートをもって動作する。このようにして、第一の波形符号化された信号202を符号化するために使われたのと同じMDCTのような同じ重複窓掛け変換が、第二の波形符号化された信号202を符号化するために使用されうる。
インターリーブ段130はさらに、受領段から、好ましくは波形デコード段240、QMF分解段250および遅延段260を介して第一の波形符号化された信号201を受領し、第一のクロスオーバー周波数の下および上の周波数についてのスペクトル内容をもつ組み合わされた信号205を生成するために、インターリーブされた信号204を第一の波形符号化された信号201と組み合わせるよう構成されていてもよい。
インターリーブ段130からの出力信号、すなわちインターリーブされた信号204または組み合わされた信号205は、その後、QMF合成段270によって時間領域に変換し戻されてもよい。
好ましくは、QMF分解段250およびQMF合成段270は同数のサブバンドを有する。つまり、QMF分解段250に入力される信号のサンプリング・レートはQMF合成段270から出力される信号のサンプリング・レートに等しい。結果として、第一および第二の波形符号化された信号を波形符号化するために使われた(MDCTを使う)波形符号化器は、出力信号と同じサンプリング・レートで動作する。こうして、第一および第二の波形符号化された信号は、同じMDCT変換を使って、効率的にかつ構造的に簡単に符号化されることができる。これは、波形符号化器のサンプリング・レートが典型的には出力信号のサンプリング・レートの半分に制限され、その後の高周波数再構成モジュールが高周波数再構成のほかにアップサンプリングを行なっていた従来技術と好対照である。これは、出力周波数範囲全体をカバーする周波数を波形符号化する能力を制限する。
図4は、デコーダ400の例示的実施形態を示す。デコーダ400は、再構成されるべき入力オーディオ信号中に過渡成分がある場合において高周波数についての改善された信号再構成を与えることが意図されている。図4の例と図2の例の間の主たる相違は、スペクトル内容の形および第二の波形符号化された信号の継続時間である。
図4は、時間フレームの複数のその後の時間部分の間のデコーダ400の動作を示している。ここでは三つのその後の時間部分が示されている。時間フレームはたとえば2048個の時間サンプルに対応してもよい。特に、第一の時間部分の間に、受領段110は、第一のクロスオーバー周波数fc1までのスペクトル内容をもつ第一の波形符号化された信号401aを受領する。第一の時間部分の間は第二の波形符号化された信号は受領されない。
第二の時間部分の間に、受領段110は、第一のクロスオーバー周波数fc1までのスペクトル内容をもつ第一の波形符号化された信号401bおよび第一のクロスオーバー周波数fc1より上の周波数範囲のある部分集合に対応するスペクトル内容をもつ第二の波形符号化された信号402bを受領する。図4の図示した例では、第二の波形符号化された信号402bは、第一のクロスオーバー周波数fc1とある第二のクロスオーバー周波数fc2の間に延在する周波数区間に対応するスペクトル内容をもつ。このように、第二の波形符号化された信号402bは、第一のクロスオーバー周波数fc1と第二のクロスオーバー周波数fc2の間の周波数帯域に制限された、帯域制限された信号である。
第三の時間部分の間に、受領段110は、第一のクロスオーバー周波数fc1までのスペクトル内容をもつ第一の波形符号化された信号401cを受領する。第三の時間部分については、第二の波形符号化された信号は受領されない。
第一および第三の図示した時間部分については、第二の波形符号化された信号はない。これらの時間部分については、デコーダは、従来のSBRデコーダのような高周波数再構成を実行するよう構成された通常のデコーダのように動作する。高周波数再構成段120は、それぞれ第一の波形符号化された信号401aおよび401cに基づいて、周波数拡張された信号403aおよび403cを生成する。しかしながら、第二の波形符号化された信号がないので、インターリーブ段によってインターリーブは実行されない。
第二の図示した時間部分については、第二の波形符号化された信号402bがある。第二の時間部分については、デコーダ400は図2に関して述べたのと同じ仕方で動作する。具体的には、高周波数再構成段120が第一の波形符号化された信号および高周波数再構成パラメータに基づいて高周波数再構成を実行し、周波数拡張された信号403bを生成する。周波数拡張された信号403bはその後、インターリーブ段130に入力され、そこで第二の波形符号化された信号402bとインターリーブされて、インターリーブされた信号404bにされる。図2の例示的実施形態との関連で論じたように、インターリーブは、加算または置換アプローチを使って実行されうる。
上記の例では、第一および第三の時間部分については第二の波形符号化された信号はない。これらの時間部分については、第二のクロスオーバー周波数は第一のクロスオーバー周波数に等しく、インターリーブは実行されない。第二の時間フレームについては、第二のクロスオーバー周波数は第一のクロスオーバー周波数より大きく、インターリーブが実行される。一般に、第二のクロスオーバー周波数は、このように時間の関数として変わりうる。具体的には、第二のクロスオーバー周波数は時間フレーム内で変わることもある。インターリーブは、第二のクロスオーバー周波数が第一のクロスオーバー周波数より大きく、デコーダによって表わされる最大周波数より小さいときに実行される。第二のクロスオーバー周波数が該最大周波数に等しい場合は、純粋な波形符号化に対応し、高周波数再構成は必要とされない。
図2および図4に関して述べた実施形態は組み合わされてもよいことを注意しておく。図7は、周波数領域、好ましくはQMF領域に関して定義された時間周波数マトリクス700を示している。ここで、インターリーブがインターリーブ段130によって実行される。図示した時間周波数マトリクス700は、デコードされるべきオーディオ信号の一つのフレームに対応する。図示したマトリクスは16個の時間スロットおよび第一のクロスオーバー周波数fc1から始まる複数の周波数サブバンドに分割されている。さらに、八番目の時間スロットより下の時間範囲をカバーする第一の時間範囲T1、八番目の時間スロットをカバーする第二の時間範囲T2および八番目の時間スロットより上の時間スロットをカバーする第三の時間範囲T3が示されている。SBRデータの一部として、種々のスペクトル包絡が種々の時間範囲T1ないしT3に関連付けられていてもよい。
今の例では、エンコーダ側で、周波数帯域710および720における二つの強いトーン性成分がオーディオ信号において同定されている。周波数帯域710および720は、SBR包絡帯域と同じ帯域幅であってもよい。すなわち、スペクトル包絡を表わすために使われるのと同じ周波数分解能であってもよい。帯域710および720におけるこれらのトーン性成分は、完全な時間フレームに対応する時間範囲をもつ。すなわち、トーン性成分の時間範囲は時間範囲T1ないしT3を含む。エンコーダ側で、第一の時間範囲T1の間に710および720のトーン性成分を波形符号化することが決定されている。このことは、トーン性成分710aおよび720が第一の時間範囲T1の間は斜線を付されていることによって示されている。さらに、エンコーダ側で、第二および第三の時間範囲T2およびT3の間に第一のトーン性成分710は、図2のパラメトリック高周波数成分段222との関連で説明したように正弦波を含めることによって、デコーダによってパラメトリック再構成されるべきであることが決定されている。このことは、(第二の時間範囲T2)および第三の時間範囲T3の間の第一のトーン性成分710bの直交斜線パターンによって示されている。第二および第三の時間範囲T2およびT3の間、第二のトーン性成分720はまだ波形符号化される。さらに、この実施形態では、第一および第二のトーン性成分は、加算によって高周波数再構成されたオーディオ信号とインターリーブされ、よってエンコーダは、伝送されるスペクトル包絡、SBR包絡をしかるべく調整している。
さらに、エンコーダ側で、過渡成分730がオーディオ信号において識別されている。過渡成分730は、第二の時間範囲T2に対応する継続時間をもち、第一のクロスオーバー周波数fc1と第二のクロスオーバー周波数fc2の間の周波数区間に対応する。エンコーダ側では、過渡成分の位置に対応するオーディオ信号の時間‐周波数部分を波形符号化することが決定されている。この実施形態では、波形符合された過渡成分のインターリーブは置換によって行なわれる。この情報をデコーダに伝達するために、信号伝達方式がセットアップされる。信号伝達方式は、どの時間範囲においておよび/または第一のクロスオーバー周波数fc1より上のどの周波数範囲において第二の波形符号化された信号が利用可能であるかに関係する情報を含む。信号伝達方式は、いかにしてインターリーブが実行されるべきか、すなわち、インターリーブが加算によるか置換によるかに関係する規則に関連付けられていてもよい。信号伝達方式は、下記で説明するように種々の信号を加算または置換することの優先順位を定義する規則に関連付けられていてもよい。
信号伝達方式は、「追加正弦波」とラベル付けされた、各周波数サブバンドについて、正弦波がパラメトリックに加算されるべきか否かを示す、第一のベクトル740を含む。図7では、第二および第三の時間範囲T2およびT3における第一のトーン性成分710bの加算が、第一のベクトル740の対応するサブバンドについての「1」によって示されている。第一のベクトル740を含む信号伝達は、従来技術から知られている。これらは、正弦波が始まることがいつ許されるかについて、従来技術のデコーダにおいて定義されている規則である。規則は、ある特定のサブバンドについて、新しい正弦波が検出される場合、すなわち第一のベクトル740の「追加正弦波」信号伝達があるフレームにおける0から次のフレームにおける1に移行する場合、そのフレームに過渡イベントがあるのでない限り、正弦波がそのフレームの先頭において始まるというものである。過渡イベントがある場合には、正弦波は該過渡成分において始まる。図示した例では、フレーム内に過渡イベント730があり、周波数帯域710についての正弦波によるパラメトリック再構成がなぜ過渡イベント730のあとにやっと開始されるのかを説明する。
信号伝達方式はさらに、「波形符号化」とラベル付けされた第二のベクトル750を含む。第二のベクトル750は、各周波数サブバンドについて、オーディオ信号の高周波数再構成とインターリーブするために波形符号化された信号が利用可能であるかどうかを示す。図7では、第一および第二のトーン性成分710および720についての波形符号化された信号の利用可能性は、第二のベクトル750の対応するサブバンドについての「1」によって示されている。今の例では、第二のベクトル750における波形符号化されたデータの利用可能性の指示は、インターリーブが加算によって実行されることの指示でもある。しかしながら、他の実施形態では、第二のベクトル750における波形符号化されたデータの利用可能性の指示は、インターリーブが置換によって実行されることの指示であってもよい。
信号伝達方式はさらに、「波形符号化」とラベル付けされた第三のベクトル760を含む。第三のベクトル760は、各時間スロットについて、オーディオ信号の高周波数再構成とインターリーブするために波形符号化された信号が利用可能であるかどうかを示す。図7では、過渡成分730についての波形符号化された信号の利用可能性は、第三のベクトル760の対応する時間スロットについての「1」によって示されている。今の例では、第三のベクトル760における波形符号化されたデータの利用可能性の指示は、インターリーブが置換によって実行されることの指示でもある。しかしながら、他の実施形態では、第三のベクトル760における波形符号化されたデータの利用可能性の指示は、インターリーブが加算によって実行されることの指示であってもよい。
第一、第二および第三のベクトル740、750、760をいかにして具現するかについては多くの代替的な選択肢がある。いくつかの実施形態では、ベクトル740、750、760は、その指示を与えるために論理的な0または論理的な1を使う二進ベクトルである。他の実施形態では、ベクトル740、750、760は異なる形を取ってもよい。たとえば、ベクトル中の「0」のような第一の値が、その特定の周波数帯域または時間スロットについて波形符号化されたデータが利用可能でないことを示してもよい。ベクトル中の「1」のような第二の値が、その特定の周波数帯域または時間スロットについてインターリーブが加算によって実行されることを示してもよい。ベクトル中の「2」のような第三の値が、その特定の周波数帯域または時間スロットについてインターリーブが置換によって実行されることを示してもよい。
上記の例示的な信号伝達方式は、衝突の場合に適用されうる優先順位に関連付けられていてもよい。例として、置換による過渡成分のインターリーブを表わす第三のベクトル760は、第一および第二のベクトル740および750より優先してもよい。さらに、第一のベクトル740は第二のベクトル750より優先してもよい。ベクトル740、750、760の間の任意の優先順位が定義されうることが理解される。
図8のaは、図1のインターリーブ段130をより詳細に示している。インターリーブ段130は、信号伝達デコード・コンポーネント1301、決定論理コンポーネント1302およびインターリーブ・コンポーネント1303を有していてもよい。上記で論じたように、インターリーブ段130は、第二の波形符号化される信号802および周波数拡張された信号803を受領する。インターリーブ段130は、制御信号805をも受領してもよい。信号伝達デコード・コンポーネント1301は、制御信号805を、図7に関して記述した信号伝達方式の第一のベクトル740、第二のベクトル750および第三のベクトル760に対応する三つの部分にデコードする。これらは決定論理コンポーネント1302に送られ、該決定論理コンポーネント1302が論理に基づいて、どの時間/周波数タイルについて第二の波形符号化された信号802および周波数拡張された信号803のどちらを使うかを示す、QMFフレームについての時間/周波数マトリクス870を生成する。時間/周波数マトリクス870は、インターリーブ・コンポーネント1303に送られ、第二の波形符号化された信号802を周波数拡張された信号803とインターリーブするときに使われる。
決定論理コンポーネント1302は図8のbにより詳細に示されている。決定論理コンポーネント1302は、時間/周波数マトリクス生成コンポーネント13201および優先度付けコンポーネント13022を有していてもよい。時間/周波数生成コンポーネント13021は、現在のQMFフレームに対応する諸時間/周波数タイルをもつ時間/周波数マトリクス870を生成する。時間/周波数生成コンポーネント13021は、第一のベクトル740、第二のベクトル750および第三のベクトル760からの情報を時間/周波数マトリクスに含める。たとえば、図7に示されるように、ある周波数について第二のベクトル750に「1」(あるいはより一般には0とは異なる任意の数)があれば、前記ある周波数に対応する諸時間/周波数タイルが時間/周波数マトリクス870において「1」(あるいはより一般にはベクトル750において存在する数に)に設定され、それらの時間/周波数タイルについて第二の波形符号化された信号802とのインターリーブが実行されるべきであることを示す。同様に、ある時間スロットについて第三のベクトル760において「1」(あるいはより一般には0とは異なる任意の数)があれば、前記時間スロットに対応する諸時間/周波数タイルが時間/周波数マトリクス870において「1」(あるいはより一般には0とは異なる任意の数に)に設定され、それらの時間/周波数タイルについて第二の波形符号化された信号802とのインターリーブが実行されるべきであることを示す。同様に、ある周波数について第一のベクトル740に「1」があれば、前記ある周波数に対応する諸時間/周波数タイルが時間/周波数マトリクス870において「1」に設定され、出力信号804が、前記ある周波数がたとえば正弦波信号を含めることによりパラメトリックに再構成された周波数拡張された信号803に基づくべきであることを示す。
いくつかの時間/周波数タイルについては、第一のベクトル740、第二のベクトル750および第三のベクトル760からの情報の間に衝突があるであろう。つまり、ベクトル740~760の二つ以上が、時間/周波数マトリクス870の同じ時間/周波数タイルについて「1」のような0とは異なる数を示す。そのような状況では、優先度付けコンポーネント13022は、時間/周波数マトリクス870における衝突を取り除くためにいかにしてそれらのベクトルからの情報に優先度付けするかについて決定をする必要がある。より正確には、優先度付けコンポーネント13022は、出力信号804が周波数拡張された信号803に基づくべきか(つまり第一のベクトル740に優先権を与える)、周波数方向での第二の波形符号化された信号802のインターリーブによるべきか(つまり第二のベクトル750に優先権を与える)あるいは時間方向での第二の波形符号化された信号802のインターリーブによるべきか(つまり第三のベクトル750に優先権を与える)を決定する。
この目的のために、優先度付けコンポーネント13022は、ベクトル740~760の優先順位に関係するあらかじめ定義された規則を有する。優先度付けコンポーネント13022は、いかにしてインターリーブが実行されるべきか、すなわちインターリーブが加算と置換のどちらによって実行されるべきかに関係するあらかじめ定義された規則をも有していてもよい。
好ましくは、これらの規則は次のようなものである。
・時間方向のインターリーブ、すなわち、第三のベクトル760によって定義されるインターリーブが最高の優先度を与えられる。時間方向のインターリーブは好ましくは、第三のベクトル760によって定義される時間/周波数タイルにおける周波数拡張された信号803を置換することによって実行される。第三のベクトル760の時間分解能は、QMFフレームの時間スロットに対応する。QMFフレームが2048個の時間領域サンプルに対応する場合、時間スロットは典型的には128個の時間領域サンプルに対応してもよい。
・周波数のパラメトリック再構成、すなわち、第一のベクトル740によって定義される周波数拡張された信号803を使うことが、二番目に高い優先度を与えられる。第一のベクトル740の周波数分解能は、SBR包絡帯域のようなQMFフレームの周波数分解能である。第一のベクトル740の信号伝達および解釈に関係する従来技術の規則は有効なままである。
・周波数方向のインターリーブ、すなわち第二のベクトル750によって定義されるインターリーブが最低の優先順位を与えられる。周波数領域におけるインターリーブは、第二のベクトル750によって定義される時間/周波数タイルにおいて周波数拡張された信号803を加えることによって実行される。第二のベクトル750の周波数分解能は、SBR包絡帯域のようなQMFフレームの周波数分解能に対応する。
〈III.例示的実施形態 ― エンコーダ〉
図5は、オーディオ処理システムにおいて使うのに好適なエンコーダ500の例示的な実施形態を示している。エンコーダ500は、受領段510、波形エンコード段520、高周波数エンコード段530、インターリーブ符号化検出段540および伝送段550を有する。高周波数エンコード段530は、高周波数再構成パラメータ計算段530aおよび高周波数再構成パラメータ調整段530bを有していてもよい。
図5は、オーディオ処理システムにおいて使うのに好適なエンコーダ500の例示的な実施形態を示している。エンコーダ500は、受領段510、波形エンコード段520、高周波数エンコード段530、インターリーブ符号化検出段540および伝送段550を有する。高周波数エンコード段530は、高周波数再構成パラメータ計算段530aおよび高周波数再構成パラメータ調整段530bを有していてもよい。
エンコーダ500の動作について、図5および図6のフローチャートを参照して以下に述べる。ステップE02では、受領段510はエンコードされるべきオーディオ信号を受領する。
受領されたオーディオ信号は、高周波数エンコード段530に入力される。受領されたオーディオ信号に基づいて、高周波数エンコード段530、特に高周波数再構成パラメータ計算段530aは、E04において、第一のクロスオーバー周波数fcより上の受領されたオーディオ信号の高周波数再構成を可能にする高周波数再構成パラメータを計算する。高周波数再構成パラメータ計算段530aは、SBRエンコードのような、高周波数再構成パラメータを計算するためのいかなる既知の技法を使ってもよい。高周波数エンコード段530は典型的にはQMF領域において動作する。このように、高周波数再構成パラメータを計算する前に、高周波数エンコード段530は受領されたオーディオ信号のQMF分解を実行してもよい。結果として、高周波数再構成パラメータはQMF領域に関して定義される。
計算された高周波数再構成パラメータは、高周波数再構成に関係するいくつかのパラメータを含んでいてもよい。たとえば、高周波数再構成パラメータは、いかにして第一のクロスオーバー周波数fcより下の周波数範囲の選択されたサブバンド部分から第一のクロスオーバー周波数fcより上の周波数範囲のサブバンド部分にオーディオ信号をミラーまたはコピーするかに関係するパラメータを含んでいてもよい。そのようなパラメータは、時に、パッチング構造を記述するパラメータと称される。
高周波数再構成パラメータはさらに、第一のクロスオーバー周波数より上の周波数範囲のサブバンド部分の目標エネルギー・レベルを記述するスペクトル包絡パラメータを含んでいてもよい。
高周波数再構成パラメータはさらに、前記パッチング構造を記述するパラメータを使って第一のクロスオーバー周波数より上の周波数範囲においてオーディオ信号が再構成されたら欠失するであろうハーモニクスまたは強いトーン性成分を示す、欠失ハーモニクス・パラメータを含んでいてもよい。
次いで、インターリーブ符号化検出段540がステップE06において、受領されたオーディオ信号のスペクトル内容が波形符号化されるべき、第一のクロスオーバー周波数fcより上の周波数範囲のある部分集合を同定する。換言すれば、インターリーブ符号化検出段540の役割は、高周波数再構成が望ましい結果を与えない、第一のクロスオーバー周波数より上の周波数を同定することである。
インターリーブ符号化検出段540は、第一のクロスオーバー周波数fcより上の周波数範囲の関連する部分集合を同定するために種々のアプローチを取り得る。たとえば、インターリーブ符号化検出段540は、高周波数再構成によってうまく再構成されない強いトーン性成分を識別してもよい。強いトーン性成分の識別は受領されたオーディオ信号に基づいていてもよく、たとえばオーディオ信号のエネルギーを周波数の関数として決定し、高いエネルギーをもつ周波数を、強いトーン性成分を含むものとして識別することによってもよい。さらに、識別は、受領されたオーディオ信号がデコーダにおいてどのように再構成されるかについての知識に基づいていてもよい。特に、そのような識別は、第一のクロスオーバー周波数より上の周波数帯域についての受領されたオーディオ信号のトーン性指標と受領されたオーディオ信号の再構成のトーン性指標との比であるトーン性クオータに基づいていてもよい。高いトーン性クオータは、該トーン性クオータに対応する周波数についてはオーディオ信号がうまく再構成されないことを示す。
インターリーブ符号化検出段540はまた、高周波数再構成によってうまく再構成されない、受領されたオーディオ信号の過渡成分を検出してもよい。そのような識別は、受領されたオーディオ信号の時間‐周波数分析の結果であってもよい。たとえば、過渡成分が現われる時間‐周波数区間が、受領されたオーディオ信号のスペクトログラムから検出されてもよい。そのような時間‐周波数区間は典型的には、受領されたオーディオ信号の時間フレームより短い時間範囲をもつ。対応する周波数範囲は典型的には、第二のクロスオーバー周波数まで延びる周波数区間に対応する。したがって、第一のクロスオーバー周波数より上の周波数範囲の前記部分集合は、インターリーブ符号化検出段540によって、第一のクロスオーバー周波数から第二のクロスオーバー周波数へ延びる区間として識別されてもよい。
インターリーブ符号化検出段540はさらに、高周波数再構成パラメータ計算段530aから高周波数再構成パラメータを受領してもよい。高周波数再構成パラメータからの欠失ハーモニクス・パラメータに基づいて、インターリーブ符号化検出段540は、欠けているハーモニクスの周波数を識別し、第一のクロスオーバー周波数fcより上の周波数範囲の同定された前記部分集合において、該欠けているハーモニクスの周波数の少なくとも一部を含めるよう決定してもよい。そのようなアプローチは、パラメトリック・モデルの限界内では正しくモデル化できないオーディオ信号中の強いトーン性成分がある場合に有利でありうる。
受領されたオーディオ信号は波形エンコード段520にも入力される。波形エンコード段520は、ステップE08において、受領されたオーディオ信号の波形エンコードを実行する。特に、波形エンコード段520は、第一のクロスオーバー周波数fcまでのスペクトル帯域についてオーディオ信号を波形符号化することによって、第一の波形符号化された信号を生成する。さらに、波形エンコード段520は、インターリーブ符号化検出段540から同定された部分集合を受領する。次いで、波形エンコード段520は、第一のクロスオーバー周波数より上の周波数範囲の同定された部分集合に対応するスペクトル帯域について受領されたオーディオ信号を波形符号化することによって、第二の波形符号化された信号を生成する。よって、第二の波形符号化された信号は、第一のクロスオーバー周波数fcより上の周波数範囲の同定された部分集合に対応するスペクトル内容をもつことになる。
例示的実施形態によれば、波形エンコード段520は、まずすべてのスペクトル帯域について受領されたオーディオ信号を波形符号化し、次いで、第一のクロスオーバー周波数fcより上の周波数の同定された部分集合に対応する周波数について、そのようにして波形符号化された信号のスペクトル内容を除去することによって、第一および第二の波形符号化された信号を生成してもよい。
波形エンコード段はたとえば、MDCTフィルタバンクのような重複窓掛け変換フィルタバンクを使って波形符号化を実行してもよい。そのような重複窓掛け変換フィルタバンクは、ある時間的長さをもつ窓を使い、そのためある時間フレームにおける変換された信号の値が前後の時間フレームの信号の値によって影響される。この事実の効果を軽減するために、ある量の時間的な過剰符号化を実行することが有利であることがある。つまり、波形符号化段520は受領されたオーディオ信号の現在の時間フレームだけでなく、受領されたオーディオ信号の前後の時間フレームも波形符号化する。同様に、高周波数エンコード段530は受領されたオーディオ信号の現在の時間フレームだけでなく、受領されたオーディオ信号の前後の時間フレームもエンコードしてもよい。このようにして、第二の波形符号化された信号と、オーディオ信号の高周波数再構成との間の改善されたクロスフェードがQMF領域において達成できる。さらに、これは、スペクトル包絡データ境界の調整の必要性を減らす。
第一および第二の波形符号化された信号は別個の信号であってもよいことを注意しておく。しかしながら、好ましくは、それらは共通の信号の第一および第二の波形符号化された信号部分をなす。そうであれば、それらは、受領されたオーディオ信号に対する単一の波形エンコード処理を実行する、たとえば受領されたオーディオ信号に対して単一のMDCT変換を適用することによって生成されうる。
高周波数エンコード段530、特に高周波数再構成パラメータ調整段530bは、第一のクロスオーバー周波数fcより上の周波数範囲の同定された部分集合をも受領してもよい。受領したデータに基づいて、高周波数再構成パラメータ調整段530bは、ステップE10において、高周波数再構成パラメータを調整してもよい。特に、高周波数再構成パラメータ調整段530bは、同定された部分集合に含まれるスペクトル帯域に対応する高周波数再構成パラメータを調整してもよい。
たとえば、高周波数再構成パラメータ調整段530bは、第一のクロスオーバー周波数より上の周波数範囲のサブバンド部分の目標エネルギー・レベルを記述するスペクトル包絡パラメータを調整してもよい。これは、デコーダにおいて第二の波形符号化された信号がオーディオ信号の高周波数再構成と加算される場合に特に重要である。その場合、第二の波形符号化された信号のエネルギーが高周波数再構成のエネルギーに加えられるからである。そのような加算を補償するために、高周波数再構成パラメータ調整段530bは、第二の波形符号化された信号の測定されたエネルギーを、第一のクロスオーバー周波数fcより上の周波数範囲の同定された部分集合に対応するスペクトル帯域についての目標エネルギー・レベルから減算することにより、エネルギー包絡パラメータを調整してもよい。このようにして、第二の波形符号化された信号および高周波数再構成がデコーダにおいて加算されるときに、全信号エネルギーが保存される。第二の波形符号化された信号のエネルギーは、たとえば、インターリーブ符号化検出段540によって測定されてもよい。
高周波数再構成パラメータ調整段530bは、欠失ハーモニクス・パラメータをも調整してもよい。より具体的には、欠失ハーモニクス・パラメータによって示される欠けているハーモニクスを含むサブバンドが第一のクロスオーバー周波数fcより上の周波数範囲の同定された部分集合の一部である場合、そのサブバンドは、波形エンコード段520によって波形符号化される。こうして、高周波数再構成パラメータ調整段530bは、そのような欠けているハーモニクスを、欠失ハーモニクス・パラメータから除去してもよい。そのような欠けているハーモニクスはデコーダ側でパラメトリック再構成される必要がないからである。
次いで伝送段550が、波形エンコード段520からの第一および第二の波形符号化された信号および高周波数エンコード段530からの高周波数再構成パラメータを受領する。伝送段550は、受領されたデータを、デコーダへの伝送のためのビットストリームにフォーマットする。
インターリーブ符号化検出段540はさらに、前記ビットストリームに含めるために、伝送段550に情報を信号伝達してもよい。特に、インターリーブ符号化検出段540は、いかにして第二の波形符号化された信号がオーディオ信号の高周波数再構成とインターリーブされるべきか、たとえばインターリーブが信号の加算によって実行されるべきか信号の一方を他方で置換することによって実行されるべきかおよびどの周波数範囲およびどの時間区間について波形符号化された信号がインターリーブされるべきかを信号伝達してもよい。たとえば、信号伝達は、図7を参照して論じた信号伝達方式を使って実行されてもよい。
〈等価物、拡張、代替その他〉
上記の記述を吟味すれば、当業者には本開示のさらなる実施形態が明白になるであろう。本稿および図面は実施形態および例を開示しているが、本開示はこれらの個別的な例に制約されるものではない。付属の請求項によって定義される本開示の範囲から外れることなく数多くの修正および変形をなすことができる。請求項に現われる参照符号があったとしても、その範囲を限定するものと理解されるものではない。
上記の記述を吟味すれば、当業者には本開示のさらなる実施形態が明白になるであろう。本稿および図面は実施形態および例を開示しているが、本開示はこれらの個別的な例に制約されるものではない。付属の請求項によって定義される本開示の範囲から外れることなく数多くの修正および変形をなすことができる。請求項に現われる参照符号があったとしても、その範囲を限定するものと理解されるものではない。
さらに、図面、本開示および付属の請求項の吟味から、本開示を実施する当業者によって、開示される実施形態に対する変形が理解され、実施されることができる。請求項において、「有する/含む」の語は他の要素またはステップを排除するものではなく、単数形の表現は複数を排除するものではない。ある種の施策が互いに異なる従属請求項に記載されているというだけの事実がこれらの施策の組み合わせが有利に使用できないことを示すものではない。
上記で開示されたシステムおよび方法は、ソフトウェア、ファームウェア、ハードウェアまたはそれらの組み合わせとして実装されうる。ハードウェア実装では、上記の記述で言及された機能ユニットの間でのタスクの分割は必ずしも物理的なユニットへの分割に対応しない。むしろ、一つの物理的コンポーネントが複数の機能を有していてもよく、一つのタスクが協働していくつかの物理的コンポーネントによって実行されてもよい。ある種のコンポーネントまたはすべてのコンポーネントは、デジタル信号プロセッサまたはマイクロプロセッサによって実行されるソフトウェアとして実装されてもよく、あるいはハードウェアとしてまたは特定用途向け集積回路として実装されてもよい。そのようなソフトウェアは、コンピュータ記憶媒体(または非一時的な媒体)および通信媒体(または一時的な媒体)を含みうるコンピュータ可読媒体上で頒布されてもよい。当業者にはよく知られているように、コンピュータ記憶媒体という用語は、コンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータのような情報の記憶のための任意の方法または技術において実装される揮発性および不揮発性、リムーバブルおよび非リムーバブル媒体を含む。コンピュータ記憶媒体は、これに限られないが、RAM、ROM、EEPROM、フラッシュメモリまたは他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)または他の光ディスク記憶、磁気カセット、磁気テープ、磁気ディスク記憶または他の磁気記憶デバイスまたは、所望される情報を記憶するために使用されることができ、コンピュータによってアクセスされることができる他の任意の媒体を含む。さらに、通信媒体が典型的にはコンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータを、搬送波または他の転送機構のような変調されたデータ信号において具現し、任意の情報送達媒体を含むことは当業者にはよく知られている。
いくつかの態様を記載しておく。
〔態様1〕
オーディオ処理システムにおけるデコード方法であって:
第一のクロスオーバー周波数までのスペクトル内容をもつ第一の波形符号化された信号を受領する段階と;
前記第一のクロスオーバー周波数より上の周波数範囲のある部分集合に対応するスペクトル内容をもつ第二の波形符号化された信号を受領する段階と;
高周波数再構成パラメータを受領する段階と;
前記第一の波形符号化された信号および前記高周波数再構成パラメータを使って高周波数再構成を実行して、前記第一のクロスオーバー周波数より上のスペクトル内容をもつ周波数拡張された信号を生成する段階と;
前記周波数拡張された信号を前記第二の波形符号化された信号とインターリーブする段階とを含む、
デコード方法。
〔態様2〕
前記第一のクロスオーバー周波数より上の周波数範囲の前記部分集合は複数の孤立した周波数区間を含む、態様1記載のデコード方法。
〔態様3〕
前記第一のクロスオーバー周波数より上の周波数帯域の前記部分集合は、前記第一のクロスオーバー周波数とある第二のクロスオーバー周波数との間に延在する周波数区間を含む、態様1記載のデコード方法。
〔態様4〕
前記第二のクロスオーバー周波数が時間の関数として変化する、態様3記載のデコード方法。
〔態様5〕
前記第二のクロスオーバー周波数が、前記オーディオ処理システムによって設定された時間フレーム内で変化する、態様3または4記載のデコード方法。
〔態様6〕
高周波数再構成を実行する段階は、スペクトル帯域複製(SBR)を実行することを含む、態様1ないし5のうちいずれか一項記載のデコード方法。
〔態様7〕
高周波数再構成を実行する段階は、周波数領域で実行される、態様1ないし6のうちいずれか一項記載のデコード方法。
〔態様8〕
前記周波数拡張された信号を前記第二の波形符号化された信号とインターリーブする段階は、周波数領域で実行される、態様1ないし7のうちいずれか一項記載のデコード方法。
〔態様9〕
前記周波数領域が直交ミラー・フィルタ(QMF)領域である、態様6または7記載のデコード方法。
〔態様10〕
受領される前記第一および第二の波形符号化された信号は、同じMDCT変換を使って符号化されている、態様1ないし9のうちいずれか一項記載のデコード方法。
〔態様11〕
前記高周波数再構成パラメータに従って、前記周波数拡張された信号のスペクトル内容を調整し、それにより前記周波数拡張された信号のスペクトル包絡を調整する段階をさらに含む、態様1ないし10のうちいずれか一項記載のデコード方法。
〔態様12〕
前記インターリーブする段階は、前記第二の波形符号化された信号を前記周波数拡張された信号に加算することを含む、態様1ないし11のうちいずれか一項記載のデコード方法。
〔態様13〕
前記インターリーブする段階は、前記第二の波形符号化された信号のスペクトル内容に対応する前記第一のクロスオーバー周波数より上の周波数範囲の前記部分集合において、前記周波数拡張された信号のスペクトル内容を前記第二の波形符号化された信号のスペクトル内容によって置換することを含む、態様1ないし11のうちいずれか一項記載のデコード方法。
〔態様14〕
前記第一の波形符号化された信号および前記第二の波形符号化された信号が共通の信号の第一および第二の信号部分をなす、態様1ないし13のうちいずれか一項記載のデコード方法。
〔態様15〕
前記第二の波形符号化された信号が利用可能である一つまたは複数の時間範囲および前記第一のクロスオーバー周波数より上の一つまたは複数の周波数範囲に関係するデータを含む制御信号を受領することをさらに含み、前記周波数拡張された信号を前記第二の波形符号化された信号とインターリーブする段階は、該制御信号に基づく、態様1ないし14のうちいずれか一項記載のデコード方法。
〔態様16〕
前記制御信号は、前記周波数拡張された信号とインターリーブするために前記第二の波形符号化された信号が利用可能である前記第一のクロスオーバー周波数より上の前記一つまたは複数の周波数範囲を示す第二のベクトルと、前記周波数拡張された信号とインターリーブするために前記第二の波形符号化された信号が利用可能である前記一つまたは複数の時間範囲を示す第三のベクトルとのうち少なくとも一方を含む、態様15記載のデコード方法。
〔態様17〕
前記制御信号は、前記高周波数再構成パラメータに基づいてパラメトリック再構成されるべき、前記第一のクロスオーバー周波数より上の一つまたは複数の周波数範囲を示す第一のベクトルを含む、態様15または16記載のデコード方法。
〔態様18〕
態様1ないし17のうちいずれか一項記載のデコード方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
〔態様19〕
オーディオ処理システムのためのデコーダであって:
第一のクロスオーバー周波数までのスペクトル内容をもつ第一の波形符号化された信号、前記第一のクロスオーバー周波数より上の周波数範囲のある部分集合に対応するスペクトル内容をもつ第二の波形符号化された信号および高周波数再構成パラメータを受領するよう構成された受領段と;
前記第一の波形符号化された信号および前記高周波数再構成パラメータを前記受領段から受け取り、前記第一の波形符号化された信号および前記高周波数再構成パラメータを使って高周波数再構成を実行して、前記第一のクロスオーバー周波数より上のスペクトル内容をもつ周波数拡張された信号を生成する高周波数再構成段と;
前記高周波数再構成段からの前記周波数拡張された信号および前記受領段からの前記第二の波形符号化された信号を受け取って、前記周波数拡張された信号を前記第二の波形符号化された信号とインターリーブするインターリーブ段とを有する、
デコーダ。
〔態様20〕
オーディオ処理システムにおけるエンコード方法であって:
エンコードされるべきオーディオ信号を受領する段階と;
受領されたオーディオ信号に基づいて、第一のクロスオーバー周波数より上の前記受領されたオーディオ信号の高周波数再構成を可能にする高周波数再構成パラメータを計算する段階と;
前記受領されたオーディオ信号に基づいて、前記受領されたオーディオ信号のスペクトル内容が波形符号化され、その後デコーダにおいて前記オーディオ信号の高周波数再構成とインターリーブされるべき、前記第一のクロスオーバー周波数より上の周波数範囲のある部分集合を同定する段階と;
第一のクロスオーバー周波数までのスペクトル帯域について前記受領されたオーディオ信号を波形符号化することによって第一の波形符号化された信号を生成し、前記第一のクロスオーバー周波数より上の周波数範囲の同定された前記部分集合に対応するスペクトル帯域について前記受領されたオーディオ信号を波形符号化することによって第二の波形符号化された信号を生成する段階とを含む、
エンコード方法。
〔態様21〕
前記第一のクロスオーバー周波数より上の周波数範囲の前記部分集合は、複数の孤立した周波数区間を含む、態様20記載のエンコード方法。
〔態様22〕
前記第一のクロスオーバー周波数より上の周波数範囲の前記部分集合は、前記第一のクロスオーバー周波数とある第二のクロスオーバー周波数との間に延在する周波数区間を含む、態様20または21記載のエンコード方法。
〔態様23〕
前記第二のクロスオーバー周波数が時間の関数として変化する、態様22記載のエンコード方法。
〔態様24〕
前記高周波数再構成パラメータは、スペクトル帯域複製(SBR)エンコードを使って計算される、態様20または21記載のエンコード方法。
〔態様25〕
デコーダにおいて前記受領されたオーディオ信号の高周波数再構成が前記第二の波形符号化された信号に加えられることを補償するよう、前記高周波数再構成パラメータに含まれるスペクトル包絡レベルを調整する段階をさらに含む、態様20ないし24のうちいずれか一項記載のエンコード方法。
〔態様26〕
前記高周波数再構成パラメータを調整する段階は、
前記第二の波形符号化された信号のエネルギーを測定し;
前記第二の波形符号化された信号の測定されたエネルギーを、前記第二の波形符号化された信号のスペクトル内容に対応するスペクトル帯域についてのスペクトル包絡レベルから減算することにより、前記スペクトル包絡レベルを調整することを含む、
態様25記載のエンコード方法。
〔態様27〕
態様20ないし26のうちいずれか一項記載のエンコード方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
〔態様28〕
オーディオ処理システムのためのエンコーダであって:
エンコードされるべきオーディオ信号を受領するよう構成された受領段と;
前記オーディオ信号を前記受領段から受け取り、受領されたオーディオ信号に基づいて、第一のクロスオーバー周波数より上の前記受領されたオーディオ信号の高周波数再構成を可能にする高周波数再構成パラメータを計算するよう構成された高周波数エンコード段と;
前記受領されたオーディオ信号に基づいて、前記受領されたオーディオ信号のスペクトル内容が波形符号化され、その後デコーダにおいて前記オーディオ信号の高周波数再構成とインターリーブされるべきであるような前記第一のクロスオーバー周波数より上の周波数範囲のある部分集合を同定するよう構成されたインターリーブ符号化検出段と;
前記オーディオ信号を前記受領段から受け取り、第一のクロスオーバー周波数までのスペクトル帯域について前記受領されたオーディオ信号を波形符号化することによって第一の波形符号化された信号を生成し、前記第一のクロスオーバー周波数より上の周波数範囲の同定された前記部分集合を前記インターリーブ符号化検出段から受領し、周波数範囲の受領された同定された前記部分集合に対応するスペクトル帯域について前記受領されたオーディオ信号を波形符号化することによって第二の波形符号化された信号を生成するよう構成された波形エンコード段とを有する、
エンコーダ。
〔態様29〕
前記高周波数エンコード段からの前記高周波数再構成パラメータおよび前記インターリーブ符号化検出段からの前記第一のクロスオーバー周波数より上の周波数範囲の同定された前記部分集合を受領し、受領されたデータに基づいて、デコーダにおいて前記受領されたオーディオ信号の高周波数再構成を前記第二の波形符号化された信号とその後インターリーブすることについて補償するよう、前記高周波数再構成パラメータを調整するよう構成された包絡調整段をさらに有する、態様28記載のエンコーダ。
〔態様1〕
オーディオ処理システムにおけるデコード方法であって:
第一のクロスオーバー周波数までのスペクトル内容をもつ第一の波形符号化された信号を受領する段階と;
前記第一のクロスオーバー周波数より上の周波数範囲のある部分集合に対応するスペクトル内容をもつ第二の波形符号化された信号を受領する段階と;
高周波数再構成パラメータを受領する段階と;
前記第一の波形符号化された信号および前記高周波数再構成パラメータを使って高周波数再構成を実行して、前記第一のクロスオーバー周波数より上のスペクトル内容をもつ周波数拡張された信号を生成する段階と;
前記周波数拡張された信号を前記第二の波形符号化された信号とインターリーブする段階とを含む、
デコード方法。
〔態様2〕
前記第一のクロスオーバー周波数より上の周波数範囲の前記部分集合は複数の孤立した周波数区間を含む、態様1記載のデコード方法。
〔態様3〕
前記第一のクロスオーバー周波数より上の周波数帯域の前記部分集合は、前記第一のクロスオーバー周波数とある第二のクロスオーバー周波数との間に延在する周波数区間を含む、態様1記載のデコード方法。
〔態様4〕
前記第二のクロスオーバー周波数が時間の関数として変化する、態様3記載のデコード方法。
〔態様5〕
前記第二のクロスオーバー周波数が、前記オーディオ処理システムによって設定された時間フレーム内で変化する、態様3または4記載のデコード方法。
〔態様6〕
高周波数再構成を実行する段階は、スペクトル帯域複製(SBR)を実行することを含む、態様1ないし5のうちいずれか一項記載のデコード方法。
〔態様7〕
高周波数再構成を実行する段階は、周波数領域で実行される、態様1ないし6のうちいずれか一項記載のデコード方法。
〔態様8〕
前記周波数拡張された信号を前記第二の波形符号化された信号とインターリーブする段階は、周波数領域で実行される、態様1ないし7のうちいずれか一項記載のデコード方法。
〔態様9〕
前記周波数領域が直交ミラー・フィルタ(QMF)領域である、態様6または7記載のデコード方法。
〔態様10〕
受領される前記第一および第二の波形符号化された信号は、同じMDCT変換を使って符号化されている、態様1ないし9のうちいずれか一項記載のデコード方法。
〔態様11〕
前記高周波数再構成パラメータに従って、前記周波数拡張された信号のスペクトル内容を調整し、それにより前記周波数拡張された信号のスペクトル包絡を調整する段階をさらに含む、態様1ないし10のうちいずれか一項記載のデコード方法。
〔態様12〕
前記インターリーブする段階は、前記第二の波形符号化された信号を前記周波数拡張された信号に加算することを含む、態様1ないし11のうちいずれか一項記載のデコード方法。
〔態様13〕
前記インターリーブする段階は、前記第二の波形符号化された信号のスペクトル内容に対応する前記第一のクロスオーバー周波数より上の周波数範囲の前記部分集合において、前記周波数拡張された信号のスペクトル内容を前記第二の波形符号化された信号のスペクトル内容によって置換することを含む、態様1ないし11のうちいずれか一項記載のデコード方法。
〔態様14〕
前記第一の波形符号化された信号および前記第二の波形符号化された信号が共通の信号の第一および第二の信号部分をなす、態様1ないし13のうちいずれか一項記載のデコード方法。
〔態様15〕
前記第二の波形符号化された信号が利用可能である一つまたは複数の時間範囲および前記第一のクロスオーバー周波数より上の一つまたは複数の周波数範囲に関係するデータを含む制御信号を受領することをさらに含み、前記周波数拡張された信号を前記第二の波形符号化された信号とインターリーブする段階は、該制御信号に基づく、態様1ないし14のうちいずれか一項記載のデコード方法。
〔態様16〕
前記制御信号は、前記周波数拡張された信号とインターリーブするために前記第二の波形符号化された信号が利用可能である前記第一のクロスオーバー周波数より上の前記一つまたは複数の周波数範囲を示す第二のベクトルと、前記周波数拡張された信号とインターリーブするために前記第二の波形符号化された信号が利用可能である前記一つまたは複数の時間範囲を示す第三のベクトルとのうち少なくとも一方を含む、態様15記載のデコード方法。
〔態様17〕
前記制御信号は、前記高周波数再構成パラメータに基づいてパラメトリック再構成されるべき、前記第一のクロスオーバー周波数より上の一つまたは複数の周波数範囲を示す第一のベクトルを含む、態様15または16記載のデコード方法。
〔態様18〕
態様1ないし17のうちいずれか一項記載のデコード方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
〔態様19〕
オーディオ処理システムのためのデコーダであって:
第一のクロスオーバー周波数までのスペクトル内容をもつ第一の波形符号化された信号、前記第一のクロスオーバー周波数より上の周波数範囲のある部分集合に対応するスペクトル内容をもつ第二の波形符号化された信号および高周波数再構成パラメータを受領するよう構成された受領段と;
前記第一の波形符号化された信号および前記高周波数再構成パラメータを前記受領段から受け取り、前記第一の波形符号化された信号および前記高周波数再構成パラメータを使って高周波数再構成を実行して、前記第一のクロスオーバー周波数より上のスペクトル内容をもつ周波数拡張された信号を生成する高周波数再構成段と;
前記高周波数再構成段からの前記周波数拡張された信号および前記受領段からの前記第二の波形符号化された信号を受け取って、前記周波数拡張された信号を前記第二の波形符号化された信号とインターリーブするインターリーブ段とを有する、
デコーダ。
〔態様20〕
オーディオ処理システムにおけるエンコード方法であって:
エンコードされるべきオーディオ信号を受領する段階と;
受領されたオーディオ信号に基づいて、第一のクロスオーバー周波数より上の前記受領されたオーディオ信号の高周波数再構成を可能にする高周波数再構成パラメータを計算する段階と;
前記受領されたオーディオ信号に基づいて、前記受領されたオーディオ信号のスペクトル内容が波形符号化され、その後デコーダにおいて前記オーディオ信号の高周波数再構成とインターリーブされるべき、前記第一のクロスオーバー周波数より上の周波数範囲のある部分集合を同定する段階と;
第一のクロスオーバー周波数までのスペクトル帯域について前記受領されたオーディオ信号を波形符号化することによって第一の波形符号化された信号を生成し、前記第一のクロスオーバー周波数より上の周波数範囲の同定された前記部分集合に対応するスペクトル帯域について前記受領されたオーディオ信号を波形符号化することによって第二の波形符号化された信号を生成する段階とを含む、
エンコード方法。
〔態様21〕
前記第一のクロスオーバー周波数より上の周波数範囲の前記部分集合は、複数の孤立した周波数区間を含む、態様20記載のエンコード方法。
〔態様22〕
前記第一のクロスオーバー周波数より上の周波数範囲の前記部分集合は、前記第一のクロスオーバー周波数とある第二のクロスオーバー周波数との間に延在する周波数区間を含む、態様20または21記載のエンコード方法。
〔態様23〕
前記第二のクロスオーバー周波数が時間の関数として変化する、態様22記載のエンコード方法。
〔態様24〕
前記高周波数再構成パラメータは、スペクトル帯域複製(SBR)エンコードを使って計算される、態様20または21記載のエンコード方法。
〔態様25〕
デコーダにおいて前記受領されたオーディオ信号の高周波数再構成が前記第二の波形符号化された信号に加えられることを補償するよう、前記高周波数再構成パラメータに含まれるスペクトル包絡レベルを調整する段階をさらに含む、態様20ないし24のうちいずれか一項記載のエンコード方法。
〔態様26〕
前記高周波数再構成パラメータを調整する段階は、
前記第二の波形符号化された信号のエネルギーを測定し;
前記第二の波形符号化された信号の測定されたエネルギーを、前記第二の波形符号化された信号のスペクトル内容に対応するスペクトル帯域についてのスペクトル包絡レベルから減算することにより、前記スペクトル包絡レベルを調整することを含む、
態様25記載のエンコード方法。
〔態様27〕
態様20ないし26のうちいずれか一項記載のエンコード方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
〔態様28〕
オーディオ処理システムのためのエンコーダであって:
エンコードされるべきオーディオ信号を受領するよう構成された受領段と;
前記オーディオ信号を前記受領段から受け取り、受領されたオーディオ信号に基づいて、第一のクロスオーバー周波数より上の前記受領されたオーディオ信号の高周波数再構成を可能にする高周波数再構成パラメータを計算するよう構成された高周波数エンコード段と;
前記受領されたオーディオ信号に基づいて、前記受領されたオーディオ信号のスペクトル内容が波形符号化され、その後デコーダにおいて前記オーディオ信号の高周波数再構成とインターリーブされるべきであるような前記第一のクロスオーバー周波数より上の周波数範囲のある部分集合を同定するよう構成されたインターリーブ符号化検出段と;
前記オーディオ信号を前記受領段から受け取り、第一のクロスオーバー周波数までのスペクトル帯域について前記受領されたオーディオ信号を波形符号化することによって第一の波形符号化された信号を生成し、前記第一のクロスオーバー周波数より上の周波数範囲の同定された前記部分集合を前記インターリーブ符号化検出段から受領し、周波数範囲の受領された同定された前記部分集合に対応するスペクトル帯域について前記受領されたオーディオ信号を波形符号化することによって第二の波形符号化された信号を生成するよう構成された波形エンコード段とを有する、
エンコーダ。
〔態様29〕
前記高周波数エンコード段からの前記高周波数再構成パラメータおよび前記インターリーブ符号化検出段からの前記第一のクロスオーバー周波数より上の周波数範囲の同定された前記部分集合を受領し、受領されたデータに基づいて、デコーダにおいて前記受領されたオーディオ信号の高周波数再構成を前記第二の波形符号化された信号とその後インターリーブすることについて補償するよう、前記高周波数再構成パラメータを調整するよう構成された包絡調整段をさらに有する、態様28記載のエンコーダ。
Claims (2)
- オーディオ処理システムにおいてオーディオ信号をデコードする方法であって:
前記オーディオ信号の第一の波形符号化された信号を受領する段階であって、前記第一の波形符号化された信号は第一のクロスオーバー周波数までのスペクトル内容をもつ、段階と;
前記オーディオ信号の第二の波形符号化された信号を受領する段階であって、前記第二の波形符号化された信号は前記第一のクロスオーバー周波数より上の周波数範囲のある部分集合に対応するスペクトル内容を含む、段階と;
前記第一の波形符号化された信号の少なくとも一部を使って周波数再構成を実行して、前記第一のクロスオーバー周波数より上のスペクトル内容をもつ周波数拡張された信号を生成する段階と;
前記周波数拡張された信号を前記第二の波形符号化された信号とインターリーブして、インターリーブされた信号を生成する段階と;
QMF合成により前記インターリーブされた信号を周波数領域から時間領域に変換する段階とを含む、
方法。 - オーディオ信号をデコードする装置であって:
前記オーディオ信号の第一の波形符号化された信号であって、前記第一の波形符号化された信号は第一のクロスオーバー周波数までのスペクトル内容をもつ、第一の波形符号化された信号と、前記オーディオ信号の第二の波形符号化された信号であって、前記第二の波形符号化された信号は前記第一のクロスオーバー周波数より上の周波数範囲のある部分集合に対応するスペクトル内容を含む、第二の波形符号化された信号とを受領するように構成された入力インターフェースと;
前記第一の波形符号化された信号を使って周波数再構成を実行して、前記第一のクロスオーバー周波数より上のスペクトル内容をもつ周波数拡張された信号を生成するように構成された周波数再構成器と;
前記周波数再構成器からの前記周波数拡張された信号と、前記入力インターフェースからの前記第二の波形符号化された信号とを受領して、前記周波数拡張された信号を前記第二の波形符号化された信号とインターリーブして、インターリーブされた信号を生成するように構成されたインターリーブ器と;
QMF合成により前記インターリーブされた信号を周波数領域から時間領域に変換する変換器とを有する、
装置。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361808687P | 2013-04-05 | 2013-04-05 | |
US61/808,687 | 2013-04-05 | ||
JP2019108504A JP6859394B2 (ja) | 2013-04-05 | 2019-06-11 | インターリーブされた波形符号化のためのデコード方法、デコーダ、媒体およびエンコード方法 |
JP2021051360A JP7317882B2 (ja) | 2013-04-05 | 2021-03-25 | インターリーブされた波形符号化のためのデコード方法、デコーダ、媒体およびエンコード方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021051360A Division JP7317882B2 (ja) | 2013-04-05 | 2021-03-25 | インターリーブされた波形符号化のためのデコード方法、デコーダ、媒体およびエンコード方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023143924A true JP2023143924A (ja) | 2023-10-06 |
JP7551860B2 JP7551860B2 (ja) | 2024-09-17 |
Family
ID=50442508
Family Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016505844A Active JP6026704B2 (ja) | 2013-04-05 | 2014-04-04 | インターリーブされた波形符号化のためのオーディオ・エンコーダおよびデコーダ |
JP2016200664A Active JP6317797B2 (ja) | 2013-04-05 | 2016-10-12 | インターリーブされた波形符号化のためのオーディオ・エンコーダおよびデコーダ |
JP2018068064A Active JP6541824B2 (ja) | 2013-04-05 | 2018-03-30 | インターリーブされた波形符号化のためのデコード方法、デコーダ、媒体およびエンコード方法 |
JP2019108504A Active JP6859394B2 (ja) | 2013-04-05 | 2019-06-11 | インターリーブされた波形符号化のためのデコード方法、デコーダ、媒体およびエンコード方法 |
JP2021051360A Active JP7317882B2 (ja) | 2013-04-05 | 2021-03-25 | インターリーブされた波形符号化のためのデコード方法、デコーダ、媒体およびエンコード方法 |
JP2023117210A Active JP7551860B2 (ja) | 2013-04-05 | 2023-07-19 | インターリーブされた波形符号化のためのデコード方法、デコーダ、媒体およびエンコード方法 |
Family Applications Before (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016505844A Active JP6026704B2 (ja) | 2013-04-05 | 2014-04-04 | インターリーブされた波形符号化のためのオーディオ・エンコーダおよびデコーダ |
JP2016200664A Active JP6317797B2 (ja) | 2013-04-05 | 2016-10-12 | インターリーブされた波形符号化のためのオーディオ・エンコーダおよびデコーダ |
JP2018068064A Active JP6541824B2 (ja) | 2013-04-05 | 2018-03-30 | インターリーブされた波形符号化のためのデコード方法、デコーダ、媒体およびエンコード方法 |
JP2019108504A Active JP6859394B2 (ja) | 2013-04-05 | 2019-06-11 | インターリーブされた波形符号化のためのデコード方法、デコーダ、媒体およびエンコード方法 |
JP2021051360A Active JP7317882B2 (ja) | 2013-04-05 | 2021-03-25 | インターリーブされた波形符号化のためのデコード方法、デコーダ、媒体およびエンコード方法 |
Country Status (10)
Country | Link |
---|---|
US (5) | US9514761B2 (ja) |
EP (4) | EP3742440B1 (ja) |
JP (6) | JP6026704B2 (ja) |
KR (7) | KR102170665B1 (ja) |
CN (7) | CN117253497A (ja) |
BR (4) | BR122020020705B1 (ja) |
ES (1) | ES2688134T3 (ja) |
HK (1) | HK1217054A1 (ja) |
RU (4) | RU2622872C2 (ja) |
WO (1) | WO2014161995A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3742440B1 (en) * | 2013-04-05 | 2024-07-31 | Dolby International AB | Audio decoder for interleaved waveform coding |
CN105493182B (zh) * | 2013-08-28 | 2020-01-21 | 杜比实验室特许公司 | 混合波形编码和参数编码语音增强 |
RU2665281C2 (ru) * | 2013-09-12 | 2018-08-28 | Долби Интернэшнл Аб | Временное согласование данных обработки на основе квадратурного зеркального фильтра |
EP3288031A1 (en) | 2016-08-23 | 2018-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding an audio signal using a compensation value |
EP3337065B1 (en) * | 2016-12-16 | 2020-11-25 | Nxp B.V. | Audio processing circuit, audio unit and method for audio signal blending |
US20190051286A1 (en) * | 2017-08-14 | 2019-02-14 | Microsoft Technology Licensing, Llc | Normalization of high band signals in network telephony communications |
JP7270836B2 (ja) | 2019-08-08 | 2023-05-10 | ブームクラウド 360 インコーポレイテッド | 音響心理学的周波数範囲拡張のための非線形適応フィルタバンク |
CN113192521B (zh) * | 2020-01-13 | 2024-07-05 | 华为技术有限公司 | 一种音频编解码方法和音频编解码设备 |
CN113808596A (zh) * | 2020-05-30 | 2021-12-17 | 华为技术有限公司 | 一种音频编码方法和音频编码装置 |
JP7253208B2 (ja) | 2021-07-09 | 2023-04-06 | 株式会社ディスコ | ダイヤモンド成膜方法及びダイヤモンド成膜装置 |
Family Cites Families (76)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2598159B2 (ja) * | 1990-08-28 | 1997-04-09 | 三菱電機株式会社 | 音声信号処理装置 |
DE69322805T2 (de) | 1992-04-03 | 1999-08-26 | Yamaha Corp. | Verfahren zur Steuerung von Tonquellenposition |
US5598478A (en) | 1992-12-18 | 1997-01-28 | Victor Company Of Japan, Ltd. | Sound image localization control apparatus |
EP0695109B1 (en) | 1994-02-14 | 2011-07-27 | Sony Corporation | Device for reproducing video signal and audio signal |
JP3849210B2 (ja) * | 1996-09-24 | 2006-11-22 | ヤマハ株式会社 | 音声符号化復号方式 |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6442275B1 (en) * | 1998-09-17 | 2002-08-27 | Lucent Technologies Inc. | Echo canceler including subband echo suppressor |
CA2311817A1 (en) | 1998-09-24 | 2000-03-30 | Fourie, Inc. | Apparatus and method for presenting sound and image |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
EP1158494B1 (en) * | 2000-05-26 | 2002-05-29 | Lucent Technologies Inc. | Method and apparatus for performing audio coding and decoding by interleaving smoothed critical band evelopes at higher frequencies |
SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
EP1423847B1 (en) * | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
CN1177433C (zh) | 2002-04-19 | 2004-11-24 | 华为技术有限公司 | 一种移动网络中广播多播业务源的管理方法 |
KR20050057288A (ko) | 2002-09-09 | 2005-06-16 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 스마트 스피커들 |
US7191136B2 (en) * | 2002-10-01 | 2007-03-13 | Ibiquity Digital Corporation | Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband |
US7318035B2 (en) * | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
DE10338694B4 (de) | 2003-08-22 | 2005-08-25 | Siemens Ag | Wiedergabeeinrichtung, umfassend wenigstens einen Bildschirm zur Darstellung von Informationen |
RU2374703C2 (ru) | 2003-10-30 | 2009-11-27 | Конинклейке Филипс Электроникс Н.В. | Кодирование или декодирование аудиосигнала |
DE102004007200B3 (de) | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
EP1719117A1 (en) | 2004-02-16 | 2006-11-08 | Koninklijke Philips Electronics N.V. | A transcoder and method of transcoding therefore |
KR20070009644A (ko) * | 2004-04-27 | 2007-01-18 | 마츠시타 덴끼 산교 가부시키가이샤 | 스케일러블 부호화 장치, 스케일러블 복호화 장치 및 그방법 |
KR100608062B1 (ko) * | 2004-08-04 | 2006-08-02 | 삼성전자주식회사 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
CA2581810C (en) * | 2004-10-26 | 2013-12-17 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
SE0402652D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
JP4939424B2 (ja) | 2004-11-02 | 2012-05-23 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 複素値のフィルタ・バンクを用いたオーディオ信号の符号化及び復号化 |
DE102005008343A1 (de) | 2005-02-23 | 2006-09-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Liefern von Daten in einem Multi-Renderer-System |
JP5129117B2 (ja) * | 2005-04-01 | 2013-01-23 | クゥアルコム・インコーポレイテッド | 音声信号の高帯域部分を符号化及び復号する方法及び装置 |
US7684981B2 (en) * | 2005-07-15 | 2010-03-23 | Microsoft Corporation | Prediction of spectral coefficients in waveform coding and decoding |
US7693709B2 (en) * | 2005-07-15 | 2010-04-06 | Microsoft Corporation | Reordering coefficients for waveform coding or decoding |
US8199828B2 (en) | 2005-10-13 | 2012-06-12 | Lg Electronics Inc. | Method of processing a signal and apparatus for processing a signal |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
CN101086845B (zh) * | 2006-06-08 | 2011-06-01 | 北京天籁传音数字技术有限公司 | 声音编码装置及方法以及声音解码装置及方法 |
WO2008004812A1 (en) | 2006-07-04 | 2008-01-10 | Electronics And Telecommunications Research Institute | Apparatus and method for restoring multi-channel audio signal using he-aac decoder and mpeg surround decoder |
JP2008096567A (ja) | 2006-10-10 | 2008-04-24 | Matsushita Electric Ind Co Ltd | オーディオ符号化装置およびオーディオ符号化方法ならびにプログラム |
JP4973919B2 (ja) | 2006-10-23 | 2012-07-11 | ソニー株式会社 | 出力制御システムおよび方法、出力制御装置および方法、並びにプログラム |
EP3288027B1 (en) | 2006-10-25 | 2021-04-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating complex-valued audio subband values |
JP5141180B2 (ja) * | 2006-11-09 | 2013-02-13 | ソニー株式会社 | 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体 |
US8363842B2 (en) | 2006-11-30 | 2013-01-29 | Sony Corporation | Playback method and apparatus, program, and recording medium |
JPWO2008084688A1 (ja) * | 2006-12-27 | 2010-04-30 | パナソニック株式会社 | 符号化装置、復号装置及びこれらの方法 |
KR101379263B1 (ko) * | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
JP2008268384A (ja) * | 2007-04-17 | 2008-11-06 | Nec Lcd Technologies Ltd | 液晶表示装置 |
US8015368B2 (en) | 2007-04-20 | 2011-09-06 | Siport, Inc. | Processor extensions for accelerating spectral band replication |
US8630863B2 (en) * | 2007-04-24 | 2014-01-14 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding audio/speech signal |
CN101743586B (zh) * | 2007-06-11 | 2012-10-17 | 弗劳恩霍夫应用研究促进协会 | 音频编码器、编码方法、解码器、解码方法 |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
US8046214B2 (en) * | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
DK2571024T3 (en) | 2007-08-27 | 2015-01-05 | Ericsson Telefon Ab L M | Adaptive transition frequency between the noise filling and bandwidth extension |
JP5008542B2 (ja) * | 2007-12-10 | 2012-08-22 | 花王株式会社 | トナー用結着樹脂の製造方法 |
EP3296992B1 (en) * | 2008-03-20 | 2021-09-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for modifying a parameterized representation |
JP5010743B2 (ja) * | 2008-07-11 | 2012-08-29 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | スペクトル傾斜で制御されたフレーミングを使用して帯域拡張データを計算するための装置及び方法 |
CA2836871C (en) * | 2008-07-11 | 2017-07-18 | Stefan Bayer | Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs |
EP2144171B1 (en) * | 2008-07-11 | 2018-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal |
CN102089814B (zh) * | 2008-07-11 | 2012-11-21 | 弗劳恩霍夫应用研究促进协会 | 对编码的音频信号进行解码的设备和方法 |
EP2301028B1 (en) * | 2008-07-11 | 2012-12-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus and a method for calculating a number of spectral envelopes |
ES2592416T3 (es) * | 2008-07-17 | 2016-11-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Esquema de codificación/decodificación de audio que tiene una derivación conmutable |
JP5215077B2 (ja) | 2008-08-07 | 2013-06-19 | シャープ株式会社 | コンテンツ再生装置、コンテンツ再生方法、プログラムおよび記録媒体 |
US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
US9947340B2 (en) * | 2008-12-10 | 2018-04-17 | Skype | Regeneration of wideband speech |
PL4231290T3 (pl) * | 2008-12-15 | 2024-04-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy |
DK2211339T3 (en) | 2009-01-23 | 2017-08-28 | Oticon As | listening System |
EP2239732A1 (en) * | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
TWI556227B (zh) * | 2009-05-27 | 2016-11-01 | 杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
US8515768B2 (en) * | 2009-08-31 | 2013-08-20 | Apple Inc. | Enhanced audio decoder |
JP5754899B2 (ja) * | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
CN102257567B (zh) | 2009-10-21 | 2014-05-07 | 松下电器产业株式会社 | 音响信号处理装置、音响编码装置及音响解码装置 |
CN102667920B (zh) * | 2009-12-16 | 2014-03-12 | 杜比国际公司 | Sbr比特流参数缩混 |
CN108989721B (zh) | 2010-03-23 | 2021-04-16 | 杜比实验室特许公司 | 用于局域化感知音频的技术 |
US9275650B2 (en) * | 2010-06-14 | 2016-03-01 | Panasonic Corporation | Hybrid audio encoder and hybrid audio decoder which perform coding or decoding while switching between different codecs |
WO2012000882A1 (en) * | 2010-07-02 | 2012-01-05 | Dolby International Ab | Selective bass post filter |
CN103155033B (zh) * | 2010-07-19 | 2014-10-22 | 杜比国际公司 | 高频重建期间的音频信号处理 |
JP5533502B2 (ja) | 2010-09-28 | 2014-06-25 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
US9117440B2 (en) | 2011-05-19 | 2015-08-25 | Dolby International Ab | Method, apparatus, and medium for detecting frequency extension coding in the coding history of an audio signal |
JP5817499B2 (ja) * | 2011-12-15 | 2015-11-18 | 富士通株式会社 | 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム |
BR122021018240B1 (pt) * | 2012-02-23 | 2022-08-30 | Dolby International Ab | Método para codificar um sinal de áudio multicanal, método para decodificar um fluxo de bits de áudio codificado, sistema configurado para codificar um sinal de áudio, e sistema para decodificar um fluxo de bits de áudio codificado |
US9129600B2 (en) * | 2012-09-26 | 2015-09-08 | Google Technology Holdings LLC | Method and apparatus for encoding an audio signal |
EP3742440B1 (en) | 2013-04-05 | 2024-07-31 | Dolby International AB | Audio decoder for interleaved waveform coding |
-
2014
- 2014-04-04 EP EP20179681.0A patent/EP3742440B1/en active Active
- 2014-04-04 CN CN202311191143.0A patent/CN117253497A/zh active Pending
- 2014-04-04 BR BR122020020705-1A patent/BR122020020705B1/pt active IP Right Grant
- 2014-04-04 BR BR122020020698-5A patent/BR122020020698B1/pt active IP Right Grant
- 2014-04-04 KR KR1020207012124A patent/KR102170665B1/ko active IP Right Grant
- 2014-04-04 KR KR1020217011196A patent/KR102450178B1/ko active IP Right Grant
- 2014-04-04 WO PCT/EP2014/056856 patent/WO2014161995A1/en active Application Filing
- 2014-04-04 BR BR122017006820-2A patent/BR122017006820B1/pt active IP Right Grant
- 2014-04-04 KR KR1020207030234A patent/KR102243688B1/ko active IP Right Grant
- 2014-04-04 CN CN201910557658.5A patent/CN110223703B/zh active Active
- 2014-04-04 JP JP2016505844A patent/JP6026704B2/ja active Active
- 2014-04-04 EP EP24191339.1A patent/EP4428860A2/en active Pending
- 2014-04-04 CN CN201910557659.XA patent/CN110136728B/zh active Active
- 2014-04-04 ES ES14715895.0T patent/ES2688134T3/es active Active
- 2014-04-04 KR KR1020227033768A patent/KR102694669B1/ko active IP Right Grant
- 2014-04-04 RU RU2015147173A patent/RU2622872C2/ru active
- 2014-04-04 CN CN201480019104.5A patent/CN105103224B/zh active Active
- 2014-04-04 US US14/781,891 patent/US9514761B2/en active Active
- 2014-04-04 EP EP18167164.5A patent/EP3382699B1/en active Active
- 2014-04-04 RU RU2017118558A patent/RU2665228C1/ru active
- 2014-04-04 KR KR1020157027445A patent/KR101632238B1/ko active IP Right Grant
- 2014-04-04 BR BR112015025022-0A patent/BR112015025022B1/pt active IP Right Grant
- 2014-04-04 KR KR1020247026655A patent/KR20240127481A/ko active Search and Examination
- 2014-04-04 CN CN202311191551.6A patent/CN117253498A/zh active Pending
- 2014-04-04 CN CN202311188836.4A patent/CN117275495A/zh active Pending
- 2014-04-04 CN CN201910557683.3A patent/CN110265047B/zh active Active
- 2014-04-04 KR KR1020167015595A patent/KR102107982B1/ko active Application Filing
- 2014-04-04 EP EP14715895.0A patent/EP2981959B1/en active Active
-
2016
- 2016-04-29 HK HK16104970.8A patent/HK1217054A1/zh unknown
- 2016-09-28 US US15/279,365 patent/US10121479B2/en active Active
- 2016-10-12 JP JP2016200664A patent/JP6317797B2/ja active Active
-
2018
- 2018-03-30 JP JP2018068064A patent/JP6541824B2/ja active Active
- 2018-07-24 RU RU2018127009A patent/RU2694024C1/ru active
- 2018-10-24 US US16/169,964 patent/US11145318B2/en active Active
-
2019
- 2019-06-11 JP JP2019108504A patent/JP6859394B2/ja active Active
- 2019-06-28 RU RU2019120194A patent/RU2713701C1/ru active
-
2021
- 2021-03-25 JP JP2021051360A patent/JP7317882B2/ja active Active
- 2021-10-06 US US17/495,184 patent/US11875805B2/en active Active
-
2023
- 2023-07-19 JP JP2023117210A patent/JP7551860B2/ja active Active
- 2023-12-14 US US18/539,664 patent/US20240194210A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2023143924A (ja) | インターリーブされた波形符号化のためのデコード方法、デコーダ、媒体およびエンコード方法 | |
RU2809586C2 (ru) | Аудиокодер и декодер для кодирования по форме волны с перемежением |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230814 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240806 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240904 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7551860 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |