JP2019522816A - 第一の周波数領域から第二の周波数領域にデジタル・オーディオ信号を変換するためのオーディオ・デコーダおよび方法 - Google Patents

第一の周波数領域から第二の周波数領域にデジタル・オーディオ信号を変換するためのオーディオ・デコーダおよび方法 Download PDF

Info

Publication number
JP2019522816A
JP2019522816A JP2018567177A JP2018567177A JP2019522816A JP 2019522816 A JP2019522816 A JP 2019522816A JP 2018567177 A JP2018567177 A JP 2018567177A JP 2018567177 A JP2018567177 A JP 2018567177A JP 2019522816 A JP2019522816 A JP 2019522816A
Authority
JP
Japan
Prior art keywords
frequency
audio signal
digital audio
frame
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018567177A
Other languages
English (en)
Other versions
JP6976277B2 (ja
JP2019522816A5 (ja
Inventor
エクストランド,ペール
テシング,ロビン
ヴィレモーズ,ラーシュ
Original Assignee
ドルビー・インターナショナル・アーベー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー・インターナショナル・アーベー filed Critical ドルビー・インターナショナル・アーベー
Priority claimed from PCT/EP2017/065011 external-priority patent/WO2017220528A1/en
Publication of JP2019522816A publication Critical patent/JP2019522816A/ja
Publication of JP2019522816A5 publication Critical patent/JP2019522816A5/ja
Application granted granted Critical
Publication of JP6976277B2 publication Critical patent/JP6976277B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に変換するためのオーディオ・デコーダおよびその中における方法が提供される。デジタル・オーディオ信号の各受領されるフレームについて、本方法は、周波数範囲の上限を同定し、該周波数範囲の上限が閾値量より大きく前記デジタル・オーディオ信号の前記フレームのナイキスト周波数を下回っていれば、前記周波数範囲の同定された上限よりも上の前記デジタル・オーディオ信号の前記フレームのスペクトル帯域を除去することによって、前記デジタル・オーディオ信号の前記フレームのナイキスト周波数は、そのもとの値から低下した値に下げられる。その後、前記デジタル・オーディオ信号の前記フレームは第一の周波数領域から第二の周波数領域に、中間的時間領域を介して変換される。

Description

本発明はオーディオ符号化の分野に関する。詳細には、本発明はオーディオ・デコーダにおける第一の周波数領域から第二の周波数領域へのデジタル・オーディオ信号の変換に関する。
オーディオ符号化システムにおいては、異なるエンコードおよびデコード段階のための異なるフィルタバンクの異なる特性を活用することが一般的である。たとえば、修正離散コサイン変換(MDCT)が、エンコーダからデコーダへの伝送に先立ってデジタル・オーディオ信号の波形をエンコードするために使われてもよく、直交ミラーフィルタ(QMF)バンクが、デコーダにおけるデジタル・オーディオ信号の高周波数および空間合成のために使われてもよい。そのような場合、デジタル・オーディオ信号は、第一のフィルタバンクもしくは変換に関連する第一の周波数領域からデコーダにおける第二のフィルタバンクもしくは変換に関連する第二の領域に変換される必要がある。
デジタル・オーディオ信号をある周波数領域から別の周波数領域に変換することに関連して、変換のサイズを減らすためにデジタル・オーディオ信号をサブサンプリングするシステムがある。これは、帯域制限されたデジタル・オーディオ信号については可能であり、計算量を減らす。たとえば、高効率先進オーディオ符号化(HE-AAC: High-Efficiency Advanced Audio Coding)コーデックは、変換が因子2によりサブサンプリングされるデュアル・レート・モードで動作する。計算量を減らすためにデジタル・オーディオ信号のサブサンプリングが使われるもう一つの例が特許文献1で与えられている。
米国特許出願公開第2016035329A1号
これらのシステムでは、変換がサブサンプリングされる因子は一定であり、よってデジタル・オーディオ信号における変動に適応しない。このように、改善のための余地がある。
以下では、付属の図面を参照しつつ例示的実施形態をより詳細に記載する。
実施形態に基づくオーディオ・エンコーダを示す図である。 実施形態に基づく、デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に変換する方法のフローチャートである。 図2の方法の種々の段階の間のデジタル・オーディオ信号のスペクトルを示す図である。 第一および第二のフィルタバンクの窓の間の整列不良を示す図である。 デジタル・オーディオ信号のフレームのシーケンスを示す図である。 デジタル・オーディオ信号のフレームのシーケンスを示す図である。 ある実施形態に基づくタイミングおよびバッファの例を示す図である。
上記に鑑み、デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に効率的かつ適応的に変換する方法およびオーディオ・デコーダを提供することが目的である。
〈I.概観〉
第一の側面によれば、この目的は、デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に変換するためのオーディオ・デコーダにおける方法であって:
第一の周波数領域で表現されているデジタル・オーディオ信号のその後のフレームを受領することであって、前記デジタル・オーディオ信号は、該デジタル・オーディオ信号のもとのサンプリング・レートの半分であるナイキスト周波数をもつ、ことを実行し;
前記デジタル・オーディオ信号の各フレームについて:
前記デジタル・オーディオ信号のスペクトル内容を解析することによって前記デジタル・オーディオ信号の周波数範囲を同定し、
前記周波数範囲が前記ナイキスト周波数よりも、閾値量より多く下であれば、同定された周波数範囲よりも上の前記デジタル・オーディオ信号のスペクトル帯域を除去することによって前記デジタル・オーディオ信号のナイキスト周波数を、そのもとの値から低下した値に下げ、
前記デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に、中間的時間領域を介して変換することであって、前記デジタル・オーディオ信号は前記中間的時間領域では前記もとのサンプリング・レートに比して、ナイキスト周波数の前記もとの値とナイキスト周波数の前記低下した値との間の比によって定義されるサブサンプリング因子だけ低下したサンプリング・レートをもつ、ことを実行し、
ナイキスト周波数の前記低下した値より上で第二の周波数領域における前記デジタル・オーディオ信号にスペクトル帯域を付加して、ナイキスト周波数をそのもとの値に復元することを含む、
方法によって達成される。
この構成では、フレームごとに、ナイキスト周波数が下げられるべきか否かについて判断がされる。各フレームについて、フレームにおけるデジタル・オーディオ信号の周波数範囲に基づいて判断がされる。周波数範囲が、ある閾値量より大きくナイキスト周波数を下回る場合には、すなわちデジタル・オーディオ信号がそのフレームにおいて帯域制限されていることが見出される場合には、ナイキスト周波数を下げる決定がされる。このようにして、本方法は、デジタル・オーディオ信号の各フレームにおける周波数内容に適応しうる。
あるフレームにおいてナイキスト周波数を下げる決定がされたら、そのフレームに関して同定された周波数範囲より上のスペクトル帯域を除去することによって、ナイキスト周波数はそのもとの値から低下した値に下げられる。結果として、第一の周波数領域から第二の周波数領域に中間的時間領域を介してデジタル・オーディオ信号を変換するプロセスにおいて、除去されるスペクトル帯域が省略されるので、計算量が低減される。換言すれば、変換のサイズがサブサンプリング因子だけ低下し、それにより変換がそれほど計算要求的でなくなる。さらに、周波数範囲はフレームからフレームへと変わることがあり、ナイキスト周波数の低下した値は周波数範囲に依存するので、本方法は、異なるフレームにおけるナイキスト周波数の異なる低下した値を許容する。このようにして、本方法はさらに、フレーム間での周波数内容における変動に適応しうる。
周波数領域におけるナイキスト周波数の低減は、時間領域におけるデジタル・オーディオ信号のサブサンプリングに対応する。ナイキスト周波数の低減はこのように、時間領域に変換されたときにデジタル・オーディオ信号がサブサンプリングされるという効果をもつ。具体的には、デジタル・オーディオ信号が時間領域でサブサンプリングされる因子は、ナイキスト周波数のもとの値とナイキスト周波数の低下した値との間の比によって与えられる。第一の周波数領域は一般には、第一の時間‐周波数変換に関連していてもよい。第二の周波数領域は一般に第二の時間‐周波数変換に関連していてもよい。第一の周波数変換は第一のフィルタバンクに関連していてもよく、第二の周波数領域は第二のフィルタバンクに関連していてもよい。
デジタル・オーディオ信号はサンプリング・レートに関連する。ナイキスト周波数は、デジタル・オーディオ信号のサンプリング・レートの半分である。これは、デジタル・バージョンにおいて表現されうる、もとのオーディオ信号の最高周波数である。ナイキスト周波数は、このように、第一の周波数領域におけるデジタル・オーディオ信号の表現についての周波数スケールでの最高周波数である。
デジタル・オーディオ信号は、フレームの形でデコーダにおいて受領されてもよい。デジタル・オーディオ信号のフレームは、デジタル・オーディオ信号のあらかじめ定義された継続時間の時間的部分を表わす。
周波数範囲とは、典型的には、デジタル・オーディオ信号の0でないスペクトル内容をもつ帯域幅または最高周波数を意味する。
スペクトル内容とは、一般に、デジタル・オーディオ信号の周波数領域表現における種々のスペクトル帯域についてのデジタル・オーディオ信号の値もしくは係数を意味する。
スペクトル帯域とは、デジタル・オーディオ信号の周波数領域表現における周波数区間を意味する。
周波数領域表現とは、典型的には、時間‐周波数領域変換またはフィルタバンクの出力をなす係数もしくはサブバンド・サンプルを意味する。変換またはフィルタバンクという用語は本開示では交換可能に使われる。
上記で論じたように、ナイキスト周波数の低下した値は、フレーム間で変わりうる。これは、本方法が、あるフレームから次のフレームに移るときに、ナイキスト周波数のある低下した値からナイキスト周波数の別の低下した値に切り換えうることを意味する。具体的には、現在フレームのナイキスト周波数の低下した値は、現在フレームの周波数範囲との関係での、前のフレームのナイキスト周波数の低下した値に依存して設定されてもよい。たとえば、現在フレームの周波数範囲が前のフレームにおけるナイキスト周波数の低下した値より上か下かに依存して、ナイキスト周波数の低下した値はそれぞれ増大または減少させられてもよい。これは、ナイキスト周波数の低下した値をどのように調整するかについての決定が、逐次的な仕方でなされることを許容する。
例示的実施形態によれば、現在フレームの周波数範囲がある閾値量より大きく前のフレームのナイキスト周波数の低下した値を超える場合には、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より大きくなるよう設定される(すなわち、ナイキスト周波数が増大させられる)。これらの状況においてナイキスト周波数の低下した値を増大させることが好ましいのは、エイリアシングおよび帯域幅打ち切りのようなアーチファクトを防ぐためである。典型的には、閾値量は0に設定され、帯域幅が前のフレームからのナイキスト周波数の低下した値を超えて増大する場合にはナイキスト周波数の低下した値は常に増大させられる。周波数範囲がナイキスト周波数の低下した値を超えるとは、その周波数範囲内の最高周波数がナイキスト周波数の低下した値を超えることを意味する。
現在フレームの周波数範囲の最高周波数が前のフレームのナイキスト周波数の低下した値と同様である場合もありうる。その場合、本方法は、前のフレームからのナイキスト周波数の低下した値を保持することを決めてもよい。ナイキスト周波数の低下した値を調整することによって、アーチファクトが全く(またはほとんど)導入されないおよび/または計算量の点でほとんど得るものがないからである。(実のところ、ナイキスト周波数の別の低下した値への切り換えはこの状況では、最悪の場合には、計算量の増大につながることがある。のちにさらに説明するように、時間領域におけるデジタル・オーディオ信号の再サンプリングが必要となるからである。)より詳細には、現在フレームの周波数範囲の最高周波数が前のフレームのナイキスト周波数の低下した値と、高々ある閾値量しか違わない場合には、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値に等しくなるよう設定される。
現在フレームの周波数範囲が前のフレームのナイキスト周波数の低下した値より(閾値量によって定義されるところにより)著しく低い場合には、計算量の理由により、前のフレームから現在フレームに移るときにナイキスト周波数の低下した値を減少させることが有益でありうる(すなわち、ナイキスト周波数がさらに減少させられる)。具体的には、現在フレームの周波数範囲が前のフレームのナイキスト周波数の低下した値より、ある閾値量より大きく下回る場合には、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より低く設定されてもよい。閾値量はたとえば、前のフレームのナイキスト周波数の低下した値の20%に対応してもよい。
しかしながら、ナイキスト周波数の低下した値がフレーム間であまりに頻繁に変化するのは望ましくないことがありうる。下記のサブサンプリングの個々の実装に依存して、これは、望ましくないほど高い計算量および/または可聴アーチファクトにつながることがある。好ましくは、本方法は、次のフレームの周波数範囲が前のフレームのナイキスト周波数の低下した値を、閾値量より大きく超える場合には、前のフレームから現在フレームにかけてナイキスト周波数の低下した値を常に増大させる。これは、スペクトル内容を制限するなど、可聴アーチファクトを避けるという理由のためである。
しかしながら、前のフレームから現在フレームにかけてナイキスト周波数の低下した値を減少させるときは、あらかじめ定義される数の前のフレームの周波数範囲を考慮に入れてもよい。この目的のために、現在フレームのナイキスト周波数の低下した値はさらに、あらかじめ定義された数の前のフレームの周波数範囲に依存して設定されてもよい。このようにして、ナイキスト周波数の低下した値が一つ一つのフレームにおいて不必要に調整される状況を回避しうる。
たとえば、周波数範囲がいくつかのフレームを通じて本質的に同じままであったという要件があってもよい。こうして、さらに現在フレームとあらかじめ定義された数の前のフレームのそれぞれとの周波数範囲の間の差の絶対値がそれぞれ高々ある閾値量である場合に、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より低く設定されてもよい。
代替的または追加的に、いくつかの前のフレームの周波数範囲が、現在フレームの直前のフレームのナイキスト周波数の低下した値より低いままであったという要件があってもよい。より詳細には、さらにあらかじめ定義された数の前のフレームのそれぞれの周波数範囲が直前のフレームのナイキスト周波数の低下した値をある閾値量より大きく下回る場合に、現在フレームのナイキスト周波数の低下した値は、直前のフレームのナイキスト周波数の低下した値より低く設定されてもよい。
このように、これらの要件は、フレーム間でのナイキスト周波数の低下した値の、よりなめらかな遷移につながりうる。
上記で言及した閾値量は、みな異なっていてもよく、典型的にはデコーダにおいてあらかじめ定義されている。
フレームごとにナイキスト周波数の低下した値を(そしてそれによりサブサンプリング比を)適応させることは、先行する諸フレームからの時間領域サンプルに頼る変換に困難を呈する。第一の周波数領域から中間的時間領域へのまたは中間的時間領域から第二の周波数領域へのデジタル・オーディオ信号の変換が、現在フレームからのデジタル・オーディオ信号の中間的時間領域のサンプルに加えて、前のフレームからのデジタル・オーディオ信号の中間的時間領域のサンプルを要求する場合に特にそうである。
変換サイズの変化は、現在フレームからデコードされる中間的時間領域のサンプルのサンプリング・レートの変化につながる。これらは、システムにいまだ記憶されている、前の諸フレームからの中間的時間領域のサンプルのサンプリング・レートに一致しない。前の諸フレームからの中間的時間領域のサンプルは、さらなる合同処理のために、現在フレームの中間的時間領域のサンプルと組み合わされる必要がある。例示的実施形態によれば、この問題は、前のフレーム(単数または複数)からの時間領域サンプルを再サンプリングすることによって解決される。具体的には、本方法は、ナイキスト周波数の低下した値が現在フレームおよび前のフレームにおいて異なっているかどうかを検査して、現在フレームおよび前のフレームにおけるデジタル・オーディオ信号の中間的時間領域のサンプルが異なるサンプリング・レートをもつかどうかを識別し、もしそうであれば、現在フレームおよび前のフレームにおける中間的時間領域のサンプルが同じサンプリング・レートをもつよう、前のフレームの中間的時間領域のサンプルを再サンプリングすることを含んでいてもよい。
再サンプリングが行なわれるのは、遷移フレーム(単数または複数)においてのみ、すなわちナイキスト周波数の異なる低下した値(すなわち、異なるサブサンプリング比)に関連する隣接フレームについてのみである。ナイキスト周波数の新たな低下した値への切り換えが完了したら、再サンプリングはもはや必要ない。
変換のサブサンプリングされた動作は、システムにおける時間的遅延を導入することがある。より詳細には、(ナイキスト周波数が下げられたときの)サブサンプリングされた動作におけるデコーダの出力信号は、もとのサンプリング・レートで動作するときのデコーダの出力信号に対して遅れることがある。これは望ましくない。というのも、最適には、デコーダの出力信号は、変換がもとのサンプリング・レートまたは低下したサンプリング・レートのどちらで動作するかに関わりなく(すなわち、ナイキスト周波数がそのもとの値をもつか低下した値をもつかに関わりなく)同じであることが望まれるからである。さもなければ可聴アーチファクトがあることがある。時間的遅延は、デジタル・オーディオ信号を第一の周波数領域から中間的時間領域に変換するために使われる第一のフィルタのバンクのフィルタ(本稿では時に窓と称される)と、デジタル・オーディオ信号を中間的時間領域から第二の周波数領域に変換するために使われる第二のフィルタのバンクのフィルタとの時間的な整列不良に起因する。たとえば、偶対称な逆MDCT窓と奇対称なQMF窓の整列不良があるであろう。前のフレームの中間的時間領域のサンプルの再サンプリングは、この時間的遅延を補償することを含んでいてもよい。そのような補償が実行されないと、デコーダのオーディオ出力において可聴アーチファクトがあることがある。
一般に、時間的遅延は、前のフレームの時間領域サンプルを、再サンプリングするときにある遅延値だけ時間的にシフトすることによって補償されうる。前のフレームの中間的時間領域のサンプルの再サンプリングにおいて補償される時間的遅延は値dfract,1によって与えられ、これは
dfract,1=(q1−1)/2
に従って、それぞれ現在フレームおよび前のフレームのサブサンプリング因子の間の比q1に依存する。
前のフレーム(単数または複数)の中間的時間領域のサンプルの再サンプリングは、種々の仕方で実行されうる。高品質の再サンプリングが所望される場合、補間および有限インパルス応答(FIR)フィルタリングおよびそれに続く間引きが使われてもよい。代替は、線形補間または三次スプライン補間のような補間を使って、前のフレームの中間的時間領域のサンプルを再サンプリングすることである。これは、より低品質の結果につながるが、非常に低い計算量である。この文脈での品質とは、変換のサブサンプリングされた動作でのデコーダの出力信号が、もとのサンプリング・レートで変換が動作するときのデコーダの出力信号と同様であることを意味する。
一般に、第一の周波数領域は、第一のあらかじめ決定された長さをもつ合成フィルタの第一のバンクに関連していてもよく、第二の周波数領域は、第二のあらかじめ決定された長さをもつ分解フィルタの第二のバンクに関連していてもよい。第一のフィルタバンクは、第一のフィルタバンクにおけるフィルタの数に等しい第一の変換サイズに関連しており、第一のフィルタバンクにおけるフィルタの数は対応する変換の周波数帯域またはチャネルの数に対応する。同様に、第二のフィルタバンクは、第二のフィルタバンクにおけるフィルタの数に等しい第二の変換サイズに関連しており、第二のフィルタバンクにおけるフィルタの数は対応する変換の周波数帯域またはチャネルの数に対応する。第一のフィルタバンクおよび第二のフィルタバンクは、もとのサンプリング・レートで動作することが意図されている。すなわち、第一および第二のフィルタバンクは、デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に中間的時間領域を介して変換するよう設計される。ここで、中間的時間領域におけるサンプリング・レートはもとのサンプリング・レートである。これらのフィルタの変換サイズおよびあらかじめ決定された長さはこのように、デジタル・オーディオ信号のもとのサンプリング・レート(およびナイキスト周波数のもとの値)に関連している。しかしながら、ナイキスト周波数が下げられるので、サンプリング・レートはサブサンプリング因子だけ下げられる。結果として、低下したサンプリング・レートで動作する変換またはフィルタバンクが必要になる。もとのサンプリング周波数に関連する第一および第二のフィルタバンクが、低下したサンプリング・レートで動作する変換またはフィルタバンクを提供するための出発点として採用されてもよい。
まず始めに、スペクトル帯域の除去によるナイキスト周波数の低下は、第一および第二のフィルタバンクのサイズ、すなわちスペクトル帯域もしくは周波数チャネルの数がサブサンプリング因子により低減されうることを含意する。これが可能なのは、デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に中間的時間領域を介して変換するプロセスにおいて、除去されたスペクトル帯域が省略されうるからである。
さらに、ナイキスト周波数の低下はサンプリング・レートの低下につながるので、第一および第二のフィルタバンクにおけるフィルタの長さが、低下したサンプリング・レートにマッチするよう短縮されてもよい。したがって、デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に中間的時間領域を介して変換する段階は:第一のバンクの合成フィルタの長さをサブサンプリング因子により短縮し、デジタル・オーディオ信号を第一の周波数領域から中間的時間領域に変換するときに短縮された長さの合成フィルタを使うことおよび/または第二のバンクの分解フィルタの長さをサブサンプリング因子により短縮し、デジタル・オーディオ信号を中間的時間領域から第二の周波数領域に変換するときに短縮された長さの分解フィルタを使うことを含んでいてもよい。このようにして、第一および第二のバンクのそれぞれ合成フィルタおよび分解フィルタは、ナイキスト周波数の低下した値に対応する低下したサンプリング・レートに適応されうる。
第一および第二のバンクは変調された(modulated)フィルタバンクであってもよい。その場合、第一のフィルタバンクは、第一のプロトタイプ・フィルタに関連していてもよく、該第一のプロトタイプ・フィルタから第一のバンクの合成フィルタが導出されうる。さらに、第二のフィルタバンクは、第二のプロトタイプ・フィルタに関連していてもよく、該第二のプロトタイプ・フィルタから第二のバンクの分解フィルタが導出されうる。変調されたフィルタバンクの場合、合成フィルタおよび分解フィルタの長さは、まずそれぞれのプロトタイプ・フィルタの長さを短縮し、次いで短縮された長さのプロトタイプ・フィルタから合成および分解フィルタを導出することによって、短縮されうる。
第一および第二のバンクのそれぞれ合成フィルタおよび分解フィルタの長さを短縮する種々の方法がある。たとえば、閉じた形の表式が利用可能であれば、それを使って、短縮された長さをもつフィルタを再計算してもよい。代替的に、あるいは閉じた形の表式が利用可能でない場合には、フィルタはその長さを短縮するためにダウンサンプリングされてもよい。具体的には、第一のバンクの合成フィルタの長さは、ダウンサンプリング因子によってダウンサンプリングすることによって、あるいは第一のバンクの合成フィルタを記述する閉じた形の表式から合成フィルタを再計算することによって短縮されうる。さらに、第二のバンクの分解フィルタの長さは、ダウンサンプリング因子によってダウンサンプリングすることによって、あるいは第二のバンクの分解フィルタを記述する閉じた形の表式から分解フィルタを再計算することによって短縮されうる。
変調されたフィルタバンクの場合、プロトタイプ・フィルタの長さは、ダウンサンプリング因子によってダウンサンプリングすることによって、あるいは閉じた形の表式からの再計算することによって短縮されてもよい。
可聴アーチファクトを避けるために、第一のバンクの合成フィルタおよび/または第二のバンクの分解フィルタのダウンサンプリングは、上記のように、第一のバンクの合成フィルタおよび第二のフィルタバンクの分解フィルタの時間的な整列不良に起因する時間的遅延を補償することを含んでいてもよい。この時間的な整列不良は、補償されるべき、もとのサンプリング格子に対する第一および第二のバンクのサブサンプリングされた格子の間の不一致につながる。一般に、時間的遅延は、ダウンサンプリングするときに適宜合成または分解フィルタ(またはそのプロトタイプ)をある遅延値だけ時間的にシフトさせることによって補償されうる。
フィルタをダウンサンプリングするときに時間的遅延を補償することの代替として、時間的遅延は、デジタル・オーディオ信号を第二の周波数領域に変換した後に補償されてもよい。より詳細には、本方法は、デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に中間的時間領域を介して変換する段階の後に、デジタル・オーディオ信号に位相シフトを適用することを含んでいてもよい。ここで、位相シフトは、第一のバンクの合成フィルタおよび第二のフィルタバンクの分解フィルタの時間的な整列不良に起因する時間的遅延に依存する。この遅延補償は、デコーダのオーディオ出力において、小さいが可聴でない位相誤差を導入する。
第一のバンクの合成フィルタおよび/または第二のバンクの分解フィルタのダウンサンプリングのときまたは第二の周波数領域のデジタル・オーディオ信号に位相シフトを加えるときに補償される時間的遅延は値dfract,2によって与えられ、これは
dfract,2=(q2−1)/2
に従ってサブサンプリング因子に依存する。ここで、q2は(当該フレームの)サブサンプリング因子である。
計算量を節約する理由で、第一のバンクにおける合成フィルタおよび/または第二のバンクにおける分解フィルタは、線形補間または三次スプライン補間を使ってダウンサンプリングされてもよい。
例示的実施形態によれば、第一の周波数領域は修正離散コサイン変換(MDCT)領域であってもよく、第二の周波数領域は直交ミラーフィルタ(QMF)領域であってもよい。
デジタル・オーディオ信号の周波数範囲(あるいはむしろその上限値)、すなわち帯域幅は、典型的には、第一の周波数領域において表現されたデジタル・オーディオ信号のスペクトルにおける0でないスペクトル内容をもつ帯域幅または最高周波数として決定される。しかしながら、例示的実施形態によれば、本方法はさらに、デジタル・オーディオ信号に関係するパラメータを受領することを含んでいてもよく、前記周波数範囲はさらに該パラメータに基づいて同定される。たとえば、パラメータは周波数閾値に関係していてもよく、該周波数閾値より上ではデジタル・オーディオ信号のスペクトル内容は、該周波数閾値より下のスペクトル内容に基づいて再構成される(たとえば、スペクトル帯域複製のような高周波数再構成技法を使って)。その場合、周波数範囲(あるいはむしろ周波数範囲の上限値)は、該周波数閾値に設定されてもよい。
ナイキスト周波数の低下した値は、同定された周波数範囲の最高周波数に等しくなるよう選択されてもよい。そのような実施形態では、デジタル・オーディオ信号のナイキスト周波数をそのもとの値から低下した値に下げる段階は、同定された周波数範囲より上のデジタル・オーディオ信号のすべてのスペクトル帯域を除去することを含む。
しかしながら、効率的な実装のために、サブサンプリング因子の限られた集合のみが(よってナイキスト周波数の低下した値の限られた集合のみが)サポートされてもよい。サブサンプリング因子のこの限られた集合は典型的には、それらのサブサンプリング因子が、効率的に実装されることができる変換サイズ(たとえば2の冪のサイズのFFT)につながるよう設計される。好ましくは、前記集合内のサブサンプリング因子に対応する事前にプログラムされた変換またはフィルタバンクがある。このようにして、ナイキスト周波数のある低下した値から別の低下した値に切り換える際、フィルタをダウンサンプリングするまたは再計算する必要を回避しうる。
詳細には、デジタル・オーディオ信号のナイキスト周波数を下げる段階は、よって:ナイキスト周波数の低下した値を、値のあらかじめ定義された集合から、同定された周波数範囲より上である前記あらかじめ定義された集合内の最低の値として選択し、ナイキスト周波数の選択された低下した値より上のデジタル・オーディオ信号のスペクトル帯域を除去することを含む。
デジタル・オーディオ信号がマルチチャネル信号である、すなわち複数のオーディオ・チャネルを含む場合には、ナイキスト周波数を下げるかどうかおよびどのように下げるかについての決定は、チャネルごとになされる。具体的には、デジタル・オーディオ信号の周波数範囲を同定し、ナイキスト周波数を下げる段階は、各オーディオ・チャネルについて実行され、それにより、同じフレームにおいて異なるオーディオ・チャネルがナイキスト周波数の異なる低下した値をもつことを許容する。
第二の側面によれば、処理機能をもつ装置によって実行されるときに上記の請求項のうちいずれか一項記載の方法を実行するためのコンピュータ・コード命令が記憶されている(非一時的な)コンピュータ可読媒体を有するコンピュータ・プログラム・プロダクトが提供される。
第三の側面によれば、デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に変換するためのオーディオ・デコーダが提供される。当該オーディオ・デコーダは:
第一の周波数領域で表現されているデジタル・オーディオ信号のその後のフレームを受領するよう構成された受領コンポーネントであって、前記デジタル・オーディオ信号は、該デジタル・オーディオ信号のもとのサンプリング・レートの半分であるナイキスト周波数をもつ、受領コンポーネントと;
変換コンポーネントとを有しており、前記変換コンポーネントは、前記デジタル・オーディオ信号の各フレームについて:
前記デジタル・オーディオ信号のスペクトル内容を解析することによって前記デジタル・オーディオ信号の周波数範囲を同定し、
前記周波数範囲が前記ナイキスト周波数よりも、閾値量より多く下であれば、同定された周波数範囲よりも上の前記デジタル・オーディオ信号のスペクトル帯域を除去することによって前記デジタル・オーディオ信号のナイキスト周波数を、そのもとの値から低下した値に下げ、
前記デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に、中間的時間領域を介して変換することであって、前記デジタル・オーディオ信号は前記中間的時間領域では前記もとのサンプリング・レートに比して、ナイキスト周波数の前記もとの値とナイキスト周波数の前記低下した値との間の比によって定義されるサブサンプリング因子だけ低下したサンプリング・レートをもつ、ことを実行し、
ナイキスト周波数の前記低下した値より上で第二の周波数領域における前記デジタル・オーディオ信号にスペクトル帯域を付加して、ナイキスト周波数をそのもとの値に復元するよう構成されている。
第二および第三の側面は一般に第一の側面と同じ特徴および利点をもちうる。
〈II.例示的実施形態〉
図1は、オーディオ・デコーダ100を概略的に示している。オーディオ・デコーダ100は受領コンポーネント110と、第一の変換コンポーネント120と、信号処理コンポーネント130と、第二の変換コンポーネント140とを有する。
使用時には、受領コンポーネントは(エンコードされた)デジタル・オーディオ信号102を受領する。デジタル・オーディオ信号102は時間的に一連のフレームにおいて受領される。受領コンポーネント110において受領されるデジタル・オーディオ信号102は、ここでもとのサンプリング・レートと称されるサンプリング・レートに関連している。もとのサンプリング・レートは、デジタル・オーディオ信号102の相続く時間的サンプルの間の時間的距離の逆数である。
デジタル・オーディオ信号102は種々のオーディオ・チャネルを有していてもよい。本稿に記載される方法は、デジタル・オーディオ信号102のオーディオ・チャネルのそれぞれに対して別個に、あるいは任意の組み合わせにおいて適用されうることは理解されるものとする。たとえば、いくつかのオーディオ・チャネルがパラメトリックに符号化されて、第二の周波数領域で動作するパラメトリック・ツールによって、より高い周波数にスペクトル内容が追加されるのでもよい。そのようなパラメトリック・ツールが使われるときは、第一の周波数領域で表現されているオーディオ・チャネルの帯域幅は典型的にはナイキスト周波数の半分以下に制限され、そのことは変換サイズを二倍以上削減することを許容する。もう一つの例として、低域効果(LFE: low frequency effect)オーディオ・チャネルは定義により数百Hzに帯域制限されており、因子8、あるいはさらには16による一層積極的なサブサンプリングを許容する。このように、異なるオーディオ・チャネルは異なる帯域幅特性を有していてもよい。計算量の最大限の削減を達成するために、オーディオ・チャネルを別個に扱うことによって、異なるオーディオ・チャネルは、異なる因子によるサブサンプリングを受けることができる。
デコーダ100において受領されるデジタル・オーディオ信号102は典型的には時間領域ではなく、周波数領域で表現されている。たとえば、エンコーダからデコーダへの効率的な伝送のため、デジタル・オーディオ信号102はエンコーダにおいて、MDCTまたは当該目的のために好適であると見出される別のフィルタバンクのような分解フィルタのフィルタバンクの適用によって、第一の周波数領域に変換されていることがありうる。こうして、受領時に、デジタル・オーディオ信号102は、第一の周波数領域において、すなわち種々の周波数帯域についてのデジタル・オーディオ信号102のスペクトル内容を記述する周波数領域サンプルの集まりとして表現されている。基本的なデジタル信号処理によれば、第一の周波数領域におけるデジタル・オーディオ信号102の表現の最大周波数は、デジタル・オーディオ信号102のもとのサンプリング・レートの半分であるナイキスト周波数によって与えられる。
次いで、デジタル・オーディオ信号102は、デジタル・オーディオ信号102を第一の周波数領域表現から第二の周波数領域表現に変換するよう構成された第一の変換コンポーネント120に渡される。ある周波数領域から別の周波数領域に変換する理由は、異なる周波数領域表現には異なる利点が伴うことがあるからである。たとえば、第一の周波数領域表現はデジタル・オーディオ信号102の波形をエンコードしてエンコーダからデコーダ100に送るために好ましいことがあり、一方、第二の周波数領域表現は、デコーダ100におけるデジタル・オーディオ信号102の処理および合成のために、たとえばパラメトリック再構成のために好ましいことがありうる。第二の周波数領域はQMF領域であってもよい。
次いで、デジタル・オーディオ信号102は第一の変換コンポーネント120から信号処理コンポーネント130に渡され、そこでデジタル・オーディオ信号102のさまざまな処理が第二の周波数領域において実行される。たとえば、信号処理コンポーネント130は、当技術分野で既知の高周波数再構成を含むパラメトリック再構成を実行してもよい。
信号処理コンポーネント130からの結果として得られる信号は、次いで、第二の変換コンポーネント140によって第二の周波数領域から時間領域に変換される。その後の再生のための出力信号104を生成するためである。
オーディオ・デコーダ100の概括的な構造は従来技術のデコーダのものと同様であるが、オーディオ・デコーダ100は第一の変換コンポーネント120の機能において従来技術のデコーダと異なっている。計算量を減らすために、第一の変換コンポーネント120は、(第一の周波数領域から時間領域への、および時間領域から第二の周波数領域への)変換のサイズが適応的に、すなわちフレームごとに変わることを許容する方法を実装する。これは、各フレームにおけるナイキスト周波数を、フレーム内のデジタル・オーディオ信号102の帯域幅に適応させることによって達成される。これは、帯域幅より上のデジタル・オーディオ信号102の(典型的には空の)スペクトル帯域を省略することによる。時間領域の観点からは、これはデジタル・オーディオ信号102および変換をフレームごとにサブサンプリングすることに対応する。
第一の変換コンポーネント120の動作は、図1および図3ならびに図2のフローチャートを参照して、下記でより詳細に記述される。
図2の段階S02では、変換コンポーネント120は、デコーダ100の受領コンポーネント110から、第一の周波数領域で表現されたデジタル・オーディオ信号102のフレームを受領する。例示的実施形態によれば、第一のデジタル・オーディオ信号102はMDCTスペクトルの形で与えられる。受領コンポーネント110は、デジタル・オーディオ信号102の該フレームを、エンコーダから受領している。
段階S04では、変換コンポーネント120はデジタル・オーディオ信号102の周波数範囲を同定する。周波数範囲は、デジタル・オーディオ信号102のスペクトル内容を解析することによって識別される。これは図3のaにさらに示されている。この図は、第一の周波数領域において表現されたデジタル・オーディオ信号102のフレームを示している。斜線付きのビンは、0でないスペクトル内容をもつスペクトル帯域に対応する。表現されている最高周波数がナイキスト周波数fNであり、これはデジタル・オーディオ信号102のもとのサンプリング・レートfSの半分である。すなわち、fN=fS/2である。変換コンポーネント120は典型的には、周波数範囲を、デジタル・オーディオ信号102の帯域幅Bとして、すなわちスペクトルにおいて0でないスペクトル内容をもつ最高周波数として決定してもよい。しかしながら、周波数範囲が、デジタル・オーディオ信号102に関係する受領されたパラメータにさらに基づいて決定される例示的実施形態がある。たとえば、それらのパラメータは周波数閾値に関係していて、該周波数閾値より上ではデジタル・オーディオ信号のスペクトル内容が該周波数閾値より下のスペクトル内容に基づいて信号処理コンポーネント130によって(たとえばスペクトル帯域複製のような高周波数再構成技法を使って)再構成されるのでもよい。そのような場合、周波数範囲(あるいはむしろ周波数範囲の上限値)は該周波数閾値に設定されてもよい。もう一つの例によれば、パラメータは周波数閾値に関係していて、該周波数閾値より上ではデジタル・オーディオ信号102のあるオーディオ・チャネルのスペクトル内容が信号処理コンポーネント130によって、デジタル・オーディオ信号の別のオーディオ・チャネルからのスペクトル内容に基づいて再構成されるのでもよい。そのような場合、周波数範囲(あるいはむしろ周波数範囲の上限値)は、その周波数閾値に設定されてもよい。
次に、段階S06において、変換コンポーネント120は、周波数範囲があらかじめ定義された量より大きくナイキスト周波数fNを下回るかどうかを検査する。
もしそうでなければ、帯域幅を制限するまたはエイリアシング・アーチファクトを導入することなくデジタル・オーディオ信号102をサブサンプリングすることは可能ではないと見出される。よって、変換コンポーネント120は段階S14において、ナイキスト周波数を下げることなくデジタル・オーディオ信号102を変換することに進む。換言すれば、変換コンポーネント120は従来技術のシステムのように、すなわちもとのサンプリング・レートで動作する。そうするためには、変換コンポーネント120はまず、逆MDCTフィルタバンクのような合成フィルタの第一のバンクを使って、オーディオ信号102を第一の周波数領域表現から中間的時間領域表現に変換してもよい。第一のフィルタバンクは、バンク内のフィルタの数(これは、変換の周波数サブバンドまたはチャネルの数である)に対応する第一の(あらかじめ決定された)変換サイズに関連している。さらに、第一のバンクのフィルタ(時に窓と称される)はあらかじめ決定された長さをもつ。第一のフィルタバンクを使った変換後、デジタル・オーディオ信号102は中間的時間領域で表現されており、そのもとのサンプリング・レートをもつ。
次いで、QMFフィルタバンクのような分解フィルタの第二のバンクを使って、オーディオ信号102を中間的時間領域表現から第二の周波数領域表現に変換する。第二のフィルタバンクは、バンク内のフィルタの数(これは、変換の周波数サブバンドまたはチャネルの数である)に対応する第二の(あらかじめ決定された)変換サイズに関連している。さらに、第二のバンクのフィルタ(時に窓と称される)はあらかじめ決定された長さをもつ。第一および第二のフィルタバンクおよびその中のフィルタは、このように、もとのサンプリング周波数で動作することが意図されている。たとえば、第一のバンクはフィルタ長4096をもつサイズ2048のMDCT変換に対応してもよく、第二のバンクはフィルタ長640をもつサイズ64のQMFバンクに対応してもよい。
好ましくは、第一および第二のフィルタバンクは変調されたフィルタバンクである。変調されたフィルタバンクは、プロトタイプ・フィルタをもち、該プロトタイプ・フィルタからフィルタバンク内のフィルタが導出されうる。
段階S14を完了した後、変換コンポーネント120は段階S02に戻り、そこでデジタル・オーディオ信号のその後のフレームが受領される。
段階S06において上記の代わりに、周波数範囲があらかじめ定義された量だけナイキスト周波数fNより低いことが見出される場合には、変換コンポーネントは段階S08に進む。
段階S08では、変換コンポーネント120は、ナイキスト周波数の低下した値fN,redを設定する。エイリアシングや帯域幅減少を避けるために、ナイキスト周波数の低下した値は、前記周波数範囲における最高周波数以上であるべきである。たとえば、ナイキスト周波数の低下した値は、同定された周波数範囲の最高周波数(これは図3のaの例では帯域幅Bである)に等しいように選択されてもよい。
しかしながら、効率的な実装のために、ナイキスト周波数の低下した値の限定された集合のみがサポートされてもよい。ここで、該限定された集合の低下した値はたとえば、もとのナイキスト周波数をある集合のサブサンプリング因子で割ることで与えられる。たとえば、サブサンプリング因子の集合はサブサンプリング因子1、4/3、2、4、8および16を含んでいてもよい。よって、変換コンポーネント120は、サブサンプリング因子のこの集合のうちから、デジタル・オーディオ信号102の同定された周波数範囲より上であるがまだナイキスト周波数の低下した値を与える最大の可能なサブサンプリング因子を選択してもよい。あるいはまた、変換コンポーネント120は、ナイキスト周波数の低下した値の限定された集合のうち、デジタル・オーディオ信号102の同定された周波数範囲を超える最低の値を選択してもよい。
一般に、変換コンポーネント120は、同定された周波数範囲より上のデジタル・オーディオ信号102のスペクトル帯域を除去することによって、ナイキスト周波数の値をそのもとの値fNから低下した値fN,redに下げてもよい。これは図3のbにおいてさらに示されている。この図では、前記周波数範囲より上のスペクトル帯域が除去されて、スペクトルにおける最高周波数がナイキスト周波数の低下した値fN,redになっている。時間領域の観点からは、これはデジタル・オーディオ信号102をサブサンプリング因子によって、すなわちfN/fN,redによってサブサンプリングすることに対応する。
ナイキスト周波数を低下した値に下げたら、変換は、デジタル・オーディオ信号102を第一の周波数領域(これはたとえばMDCT領域)から第二の周波数領域(これはたとえばQMF領域)に中間的時間領域を介して変換することに進む。これはさらに図3のcにおいて示されている。この図は、第二の(サブサンプリングされた)周波数領域において表現されたデジタル・オーディオ信号102を示している。ナイキスト周波数が下げられているので、変換コンポーネント120は、低下した変換サイズで機能しうる。具体的には、変換サイズは、もとのサンプリング・レートに比べて、サブサンプリング因子だけ低下していてもよい。このようにして、計算量が削減される。こうして、もとのサンプル・レートで動作する第一および第二のフィルタバンクを使う代わりに、段階S14との関連で上記したように、変換コンポーネント120は、低下した変換サイズの第一のフィルタバンクを第一の周波数領域から中間的時間領域への変換のために、低下した変換サイズの第二のフィルタバンクを中間的時間領域から第二の周波数領域への変換のために、使ってもよい。
この目的のために、変換コンポーネント120は、複数の異なるサンプリング・レートで、すなわちサブサンプリング因子の複数の異なる値で動作するよう意図されたフィルタバンクを計算し、記憶していてもよい。これらのフィルタバンクは該異なるサブサンプリング因子が選択されるたびに再利用されうる。このようにして、計算量が削減されうる。好ましくは、変換コンポーネント120は、サブサンプリング因子の限定された集合をサポートするだけであってもよい。このようにして、フィルタ係数または窓を不揮発性メモリに事前に記憶しておくことにより、異なるサイズのフィルタまたは変換窓を計算するための計算努力が最小化されるまたは完全になくされる。
特定のサブサンプリング因子に対応する低下した変換サイズの第一および第二のフィルタバンクを計算するために、変換コンポーネント120は、もとのサンプリング・レートで動作する第一および第二のフィルタバンクを出発点として採用してもよい。
第一に、変換サイズが低減される必要がある。つまり、フルサイズの第一のフィルタバンクにおける合成フィルタの数が前記サブサンプリング因子によって減らされ、フルサイズの第二のフィルタバンクにおける分解フィルタの数が前記サブサンプリング因子によって減らされる。変換サイズ削減は、段階S08においてデジタル・オーディオ信号102から除去されたスペクトル帯域に対応する第一および第二のフィルタバンクからのフィルタを除去することによって達成される。
第二に、第一および第二のバンクにおけるフィルタの長さが、低下したサンプリング・レートに鑑みて調整される必要がある。よって、変換コンポーネント120は、第一のバンクの合成フィルタの長さおよび第二のバンクの分解フィルタの長さを、前記サブサンプリング因子によって短縮してもよい。
これは、種々の仕方でなされうる。第一のバンクの合成フィルタを記述する閉じた形の表式および/または第二のバンクの分解フィルタを記述する閉じた形の表式がある場合には、これらの閉じた形の表式が、短縮された長さのフィルタを計算し直すために使われてもよい。
代替的に、あるいは閉じた形の表式が利用可能でない場合には、フィルタの長さは、サブサンプリング因子によってダウンサンプリングすることによって短縮されてもよい。たとえば、フィルタは、線形補間または三次スプライン補間のような補間を使ってダウンサンプリングされてもよい。
サブサンプリング因子に対応する第一および第二のフィルタバンクの計算は、変調されたフィルタバンクが使われる場合には容易にされる。その場合、それぞれフルサイズの第一および第二のフィルタバンクのプロトタイプ・フィルタが、修正後に、サブサンプリングされた動作のための対応する第一および第二のフィルタバンクを導出するために使われてもよい。この目的のために、変換コンポーネント120はまず、フルサイズの第一のフィルタバンクの合成プロトタイプ・フィルタの長さをサブサンプリング因子により短縮してもよい。これは、上記のようにサブサンプリング因子によってダウンサンプリングすることによりまたは閉じた形の表式から短縮された長さの合成プロトタイプ・フィルタを再計算することによる。次いで、短縮された長さの合成プロトタイプ・フィルタが、サブサンプリング因子に対応する低減された変換サイズの第一のフィルタバンクを導出するために使われてもよい。同じことは、低減された変換サイズの第二のフィルタバンクを導出することとの関連で第二のフィルタバンクの分解プロトタイプ・フィルタにも当てはまる。
どの周波数表現が使われるかに依存して、変換のサブサンプリングされた動作(すなわち、上記のダウンサンプリングされたフィルタのような低減されたサイズの変換の使用)は、時間的遅延を導入しうる。たとえば、第一の周波数領域表現がMDCTであり、第二の周波数領域表現がQMFである場合、偶対称の逆MDCT窓および奇対称のQMF窓の整列不良があることがある。このことは図4にさらに示されている。より具体的には、信号チェーンの他の諸分枝との同期を維持するために、補償されるべきサブサンプリングされた領域におけるサンプルの半端な数の遅延の差がある。その理由は、MDCTのサンプル点は窓の中心に対してシフトされた格子上に位置されており、一方、QMFバンクについてはそうではないことがあるからである。このことは、q2=2の場合について図4に示されている。
図4のaは、もとのサンプリング・レートにおけるMDCT窓に対するサンプル点の位置を示している。図4のbは、QMF窓についての対応する状況を示している。連続的な時間軸上では、これは、MDCT合成およびそれに続くQMF分解のフルバンド適用についての相対的なタイミング・シナリオの例を表わしている。サブサンプリングされた動作は同じ相対的なタイミングに従うことが望ましい。しかしながら、図4のcは、(サブサンプリング因子2によって下げられた)低下したサンプリング・レートでのMDCT窓に対するサンプル点の位置を示している。QMF分解窓の最適な連続時間位置は不変であり、図4のdで破線の窓の形によって描かれている。だが、利用可能なダウンスケーリングされたQMF分解は窓の中心のサンプル点を想定するので、離散的時間分解窓の可能な最良の位置は図4のdの実線の窓形状によって描かれるようになる。これは、低いサンプリング・レートでのサンプルの四分の一の追加的遅延を導入する。一般的な場合には、本稿で時間的遅延と称される結果として生じるタイミング誤差は、もとのサンプリング・レートにおけるdfract,2=(q2−1)/2サンプルとなる。幸い、QMF窓の典型的な様相のため、誤差は、下記のツールのうちの一つまたは組み合わせによっておおむね補償されることができる。
●QMF分解に続く周波数変動位相利得因子。たとえば、QMFサブバンド・サンプルに対して位相シフトがexp(−i*π/La*dfract,2*(k+0.5))として適用されてもよい。ここで、Laは分解QMFバンクの現在のサイズであり、k=0……La−1である。この種の遅延補償は、QMF再構成における小さいが可聴でない位相誤差を導入する。
●時間的遅延を考慮に入れるダウンサンプリングされたQMF分解窓。これは図4のdの破線の窓を使うことに対応する。QMF窓をMDCT窓と同一の時間格子に整列させる素直な方法は、フィルタを非対称にするためのQMFプロトタイプ・フィルタの線形ダウンサンプリングである。これは
g(n)=(u−m)・f(m+1)+(1+m−u)・f(m)、 n=0,……,(N/q2)−1
に従ってなされてもよい。ここで、Nはもとのプロトタイプ・フィルタfの長さであり、q2はサブサンプリング因子であり、u=n・q2+dfract,2は有理数であり、m=└n・q2+dfract,2┘は整数である(└・┘は床演算子、すなわち下に丸められた最大の整数)。補間されたプロトタイプ・フィルタgは今や一般化されたフィルタ次数og=(of/q2)+(1/q2)−1をもつ。ここで、ofはもとのフィルタfのフィルタ次数である。QMF分解/合成チェーンの再構成精度はこの演算によって維持される。ダウンサンプリングの結果は、プロトタイプ・フィルタ次数の(整数値ofから有理数ogへの)変化である。これは、変換コアにおいて反映されなければならないが、変換領域において周波数依存の利得1の位相因子を適用することによって補償されることもできる。
低下したナイキスト周波数(あるいは等価だがサブサンプリング比)のフレームごとの適応は、前の諸フレームからの時間領域サンプルに頼る変換に困難を呈する。これは、それぞれ第一および第二の周波数領域における周波数領域表現として使用されうるMDCT変換およびQMFバンクについていえる。ナイキスト周波数の低減は、現在のフレームからデコードされる中間的時間領域サンプルの異なるサンプリング・レートを与える。これらは、システムにいまだ記憶されている、前の諸フレームからの中間的時間領域のサンプルのサンプリング・レートに一致しない。前の諸フレームからの中間的時間領域のサンプルは、さらなる合同処理のために、現在フレームの中間的時間領域のサンプルと組み合わされる必要がある。
このような場合、変換コンポーネント120は、前のフレーム(単数または複数)からの時間領域サンプルを再サンプリングしてもよい。より詳細には、変換コンポーネント120は、各フレームにおいて使われるナイキスト周波数の、可能性としては低減されている値を追跡記録してもよい。具体的には、変換コンポーネント120は、現在フレームおよび前のフレームのナイキスト周波数の値(当該フレームにおいて低減が行なわれたかどうかに依存してナイキスト周波数の低下した値またはもとの値)が異なるかどうかを検査してもよい。このようにして、変換コンポーネント120は、現在フレームおよび直前のフレームが異なるサンプリング・レートをもつかどうかを識別しうる。変換が複数の前のフレームからの時間領域サンプルを要求する場合には、変換コンポーネント120は、同様に、現在フレームと該複数の前のフレームのいずれかとにおいて、ナイキスト周波数の値が異なるかどうかを検査してもよい。
変換コンポーネント120が現在フレームと直前のフレーム(または複数の前のフレームのいずれか)とがナイキスト周波数の異なる値をもつことを見出す場合、直前のフレーム(または前のフレームのうちナイキスト周波数の異なる値をもつもの)の中間的時間領域のサンプルを再サンプリングすることに進んでもよい。この再サンプリングは、現在フレームおよび前のフレーム(単数または複数)の中間的時間領域のサインプルが同じサンプリング・レートをもつよう実行される。
この再サンプリングは種々の仕方で達成されうる。たとえば、高品質の再サンプリングをもつために、補間およびそれに続く有限インパルス応答(FIR)フィルタによる低域通過フィルタリングならびにそれに続く間引きを使う伝統的な再サンプリングが使われてもよい。これは、再サンプリングが有理数の因子による再サンプリングに関わる限り(システムのサブサンプリング因子が上記で例示したような整数または有理数の限られた集合に制約される場合にはこれは通例成り立つ)、可能である。因子I/Jによるサブサンプリングが要求される場合、変換コンポーネント120はまず因子Jによって補間し、その後、FIRフィルタリングを行ない、次いで因子Iによって間引くことができる。
代替として、その後のフィルタリングのない線形補間または三次スプライン補間が使われてもよい。これは、より低品質の結果を与えることがある(たとえばエイリアシングの問題があることがある)が、非常に低い計算量という利点をもつ。前のフレーム(単数または複数)の中間的時間領域のサンプルに対して現在フレームの中間的時間領域のサンプルの間に導入される相対的な時間的遅延があることがある。これは、第一のフィルタバンクの窓(すなわちフィルタ)と第二のフィルタバンクの窓(すなわちフィルタ)との間の整列不良のためでありうる。第一のフィルタバンクがMDCTフィルタバンクであり、第二のフィルタバンクが奇対称なプロトタイプ・フィルタを使うQMFバンクである場合、前のフレーム(単数または複数)の中間的時間領域のサンプルに対して現在フレームの中間的時間領域のサンプルの間の時間的遅延は、現在フレームと前のフレームとのサブサンプリング因子の間の比q1に関係している。より詳細には、相対的な時間的遅延はdfract,1=(q1−1)/2によって与えられる。より一般には、これは、図4のaおよびbに示されるように第一のフィルタバンクが半サンプル対称性をもち、第二のフィルタバンクが整数サンプル対称性をもつ場合に成り立つ。
前のフレーム(単数または複数)を再サンプリングするときの相対的な時間的遅延を補償することが好ましい。これはたとえば、前のフレームの中間的時間領域サンプルを、時間的遅延に対応する量だけ時間的にシフトさせることによる。
デジタル・オーディオ信号102を第一の周波数領域から第二の周波数領域に変換したら、変換コンポーネント120は段階S12において、当該フレームにおいてナイキスト周波数をその低下した値からもとの値に復元することに進む。これは、ナイキスト周波数の低下した値fN,redより上の第二の周波数領域においてデジタル・オーディオ信号に(空の)スペクトル帯域を付加することによって達成されうる。これは図3のdにさらに示されている。ここでは、第二の周波数領域においてデジタル・オーディオ信号102の周波数表現に空のスペクトル帯域が追加されており、表現される最高周波数は再びナイキスト周波数のもとの値fNによって与えられる。
図2のフローチャートを参照して記述した方法はこのように、異なるフレームがナイキスト周波数の異なる低下した値をもつことを許容し、それによりナイキスト周波数を各フレームのスペクトル内容に適応させる。換言すれば、変換コンポーネント120は、前のフレームから現在フレームに移るときに低下したナイキスト周波数の値を切り換える決定をしてもよい。この決定は、現在フレームのスペクトル内容のみに基づいてなされてもよい。しかしながら、それはナイキスト周波数の低下した値のジャンプ挙動につながることがある。すなわち、値を非常に頻繁に変化させる傾向があることがある。ナイキスト周波数の低下した値における切り換えは、フィルタのダウンサンプリングおよび/または中間的時間領域サンプルの再サンプリングを必要とすることになるので、ナイキスト周波数の低下した値の遷移はもっと疎であることが望ましいことがありうる。
この理由により、変換コンポーネント120は、段階S08において現在フレームのナイキスト周波数の低下した値を設定するとき、現在フレームの周波数範囲との関係で前のフレームのナイキスト周波数の低下した値をも考慮に入れてもよい。これは図5および図6においてさらに示されている。
図5は、七つの連続するフレーム501a、501b、501c、501d、501e、501f、501gを示している。各フレーム501a〜gは周波数範囲502a〜gをもつ(周波数スケールの斜線パターンは0でないスペクトル帯域を示す)。フレーム501aはナイキスト周波数の低下した値503a(fN,redとラベル付けされている)に関連付けられている。変換コンポーネント120が次のフレーム501bを受け取るとき、フレーム501bの周波数範囲502bは、前のフレーム501aのナイキスト周波数の低下した値fN,redと比較される。この場合、周波数範囲502bは、閾値量T1より大きく、前のフレーム501aのナイキスト周波数の低下した値503aを超えている。エイリアシング問題および打ち切られる帯域幅を避けるために、フレーム501bのナイキスト周波数の低下した値503bは、フレーム501aのナイキスト周波数の低下した値503aより大きいように設定される。具体的には、ナイキスト周波数の低下した値503bは、フレーム501bの周波数範囲502bより上の値に設定される。
変換コンポーネント102は、その後のフレーム501cを受け取るとき、フレーム501cの周波数範囲502cを、フレーム501bのナイキスト周波数の低下した値503bと比較する。この例では、周波数範囲502cは、閾値量T2より大きくナイキスト周波数の低下した値503bと異なりはしないことが見出される。したがって、フレーム501bのナイキスト周波数の低下した値503bをフレーム501cでも保持することを決定する。閾値量T2は典型的には閾値量T1より大きい。つまり、変換コンポーネント120は、ナイキスト周波数の低下した値を減少させる(これは計算量を削減するためには有益でありうる)よりも、ナイキスト周波数の低下した値を増加させやすい(エイリアシングおよび打ち切られた帯域幅を避けるため)。
次のフレーム501dを受け取ると、変換コンポーネント102は、周波数範囲502dを、ナイキスト周波数の低下した値503bと比較する。すると、周波数範囲502dが、閾値量T2より大きくナイキスト周波数の低下した値503bを下回ることが見出される。これは、ナイキスト周波数の、より低い低下した値に切り換えることが有益でありうることを意味する。
いくつかの実施形態によれば、よって、変換コンポーネント120は、フレーム501dでは、ナイキスト周波数の、より低い低下した値に切り換える。しかしながら、図示した実施形態では、変換コンポーネント120は、フレーム501dにおけるナイキスト周波数の低下した値を設定するときに、いくつかの前のフレームの周波数範囲をも考慮に入れる。図示した例では、変換コンポーネント120は、ナイキスト周波数の低下した値を設定するときに、三つの前のフレームの周波数範囲を考慮に入れる。一般に、前のフレームの数は、事前に定義されていてもよく、あるいはシステムに入力されてもよいパラメータである。前のフレームの数は典型的には2〜6フレームの範囲内でありうる。換言すれば、変換コンポーネント120は、前のフレーム501c、501b、501aの周波数範囲502c、502b、502aのそれぞれが、閾値量T2より大きくナイキスト周波数の低下した値503bを下回るかどうかを検査する。今の例ではこれは満たされないので、変換コンポーネント120は、フレーム501dにおいても、ナイキスト周波数の低下した値503bを保持することを決定する。
次いで、変換コンポーネント120は、この手順をフレーム501eおよび501fについて繰り返し、フレーム501dについてと同じ結果になり、ナイキスト周波数の低下した値503bがフレーム501eおよび501fにおいても保持される。
しかしながら、フレーム501gを処理するときは、変換コンポーネント102は異なる結論に至る。より詳細には、変換コンポーネント120は、フレーム501gの周波数範囲502gが閾値量T2より大きくナイキスト周波数の低下した値503bを下回ること、さらに三つの前のフレーム501f、501e、501dの周波数範囲502f、502e、502dのそれぞれも閾値量T2より大きくナイキスト周波数の低下した値503bを下回ることを見出す。結果として、変換コンポーネント120は、ナイキスト周波数の、新たな、より低い低下した値503cに切り換えることを決定する。このようにして、ナイキスト周波数の低下した値のあまりに頻繁な切り換えを回避しうる。たとえば、このやり方でなければナイキスト周波数の低下した値はまずフレーム501dにおいて減少させられ、次いで後続のフレーム501eにおいて再び増大させられていたであろう。
図6は、図5の実施形態への代替または追加として使用されうる変形を示している。図6の実施形態は、ナイキスト周波数の、より低い低下した値に切り換えるときに変換コンポーネント120が別の判断基準を使うという点で図5の実施形態と異なっている。よって、図5および図6の実施形態におけるフレーム501a、501b、501cの処理は同じである。しかしながら、フレーム501d、501e、501f、501gについてはそうではない。
フレーム501dを受け取ると、変換コンポーネントは、周波数範囲502dが閾値量T2より大きく前のフレームのナイキスト周波数の低下した値503bを下回ることが見出す。しかしながら、ナイキスト周波数の別の、より低い低下した値に切り換えることを決定する前に、変換コンポーネントはいくつかの前のフレーム(この場合は三つの前のフレーム)の周波数範囲を見る。具体的には、変換コンポーネント120は三つの前のフレームの周波数範囲502c、502b、502aのそれぞれが、閾値量T3(これは典型的にはT2より小さい)より大きく現在フレーム501dの周波数範囲502dと異なっていないかどうかを検査する。図示した例では、これは成り立っておらず、よって変換コンポーネント120は、前のフレーム501cのナイキスト周波数の低下した値503bを保持することを決定する。
変換コンポーネント120はこれらの検査をその後のフレーム501e、501fについても繰り返して同じ結果になる。つまり、ナイキスト周波数の低下した値503bがフレーム501eおよび501fにおいても保持される。しかしながら、フレーム501gを処理するときは、変換コンポーネント102は別の結論に至る。第一に、周波数範囲502gが閾値量T2より大きくナイキスト周波数の低下した値503bを下回ることを見出す。第二に、三つの前のフレーム501f、501e、501dの周波数範囲502f、502e、502dのそれぞれが閾値量T3より大きく現在フレーム501gの周波数範囲502gと異なっていないことを見出す。結果として、変換コンポーネント120は、ナイキスト周波数の、新たな、より低い低下した値503cに切り換える決定をする。
変換コンポーネント120がどのように動作するかの実際的な例をこれから図7との関連で開示する。図7は、サブサンプリング因子1(サブサンプリングなし)から因子4、次いで4/3によるサブサンプリングに切り換えるときのタイミングおよびバッファの図を示している。図の下部にあるバーの高さはサブサンプリングの量を、よってサブサンプリングされたシステムの帯域幅を示す。この例は、もとの帯域幅を復元するために現在のナイキスト周波数より上で追加の(空の)QMF帯域を付加する段階は含んでいないことを注意しておく。窓および時間領域(PCM)バッファのダウンサンプリングは、点線によって表わされる(より小さな「ドットピッチ」がより高い度合いのサブサンプリングを表わす)。これらはみな、同じ絶対的な継続時間を表わしており、サンプル・レート、よって帯域幅のみが異なっている。
フレームn−1およびnにおいては、フルサイズの変換が使われる。IMDCTフレームnからの時間領域出力はPCMラインに供給され、PCMフレームが分解QMFバンク(実線で描かれている)に供給される。この配位では、四つのQMFブロックが処理される(四つの実線の窓h(n))。フル帯域幅QMF出力は図の下部に四つの実線のバーとして示されている。フレームn+1では、信号の帯域幅はずっと低く、よって1/4サイズの変換が、アーチファクトや打ち切られた帯域幅なしにMDCT係数を変換するために十分である。フレームnからの時間領域データをフレームn+1のサブサンプリングされたデータに適応させるために、フレームnの実線のバッファ・ブロックは再サンプリングされる必要がある。よって、QFMの履歴バッファqmfBuffer(N−L個のサンプル)およびIMDCT重複加算バッファmdctBufferが因子4によってダウンサンプリングされる。結果は、破線のブロックに格納され、フレームn+1においてIMDCT重複加算プロセスおよび分解QMF(M/4個のチャネル)によって使用される。再サンプリング後、変換は、該新たなサブサンプリングされたレートで実行されてもよいが、フレームn+4において帯域幅を増す必要が生じる。その時点で、フレームn+3からの時間領域バッファ(右側の破線ブロック)が因子3によりアップサンプリングされる。結果は点線のブロックに格納され、フレームn+4においてIMDCT重複加算プロセスおよび3/4サイズのフィルタバンクを使う分解QMFにおいて使用される。ここでもまた、結果として得られるQMFサンプルは、図の下部に点線のバーとして示されている。
バッファ、すなわち分解QMFバンクの履歴バッファおよび逆MDCTの重複加算バッファの再サンプリングは、連続的なので一つの段階で行なわれることができる。高品質の再サンプリングは、補間およびFIRフィルタリングならびにそれに続く間引きに関わる伝統的な再サンプリングによってできる。代替は、線形補間または高次補間を使うことである。これは再サンプリングの品質は低くなるが、非常に低い計算量をもつ。例として、バッファは線形補間を使って再サンプリングされる。第一に、両バッファは
Figure 2019522816
として連結される。ここで、NはQMFプロトタイプ・フィルタの現在の長さであり、LはQMFチャネルの現在の数であり、frameLengthは現在のフレーム長(およびMDCTサイズ)である。連結されたバッファhはその後、
Figure 2019522816
として補間される。ここで、W=N−L+frameLengthであり、q1は相対的なサブサンプリング因子であり、u=n・q1+dfract,1は有理数であり、m=└n・q1+dfract,1┘は整数である(└・┘は床演算子、すなわち下に丸められた最大の整数)。dfract,1はdfract,1=(q1−1)/2によって与えられる遅延である。この文脈におけるq1は、現在のサブサンプリング量に対するサブサンプリング因子、すなわち現在フレームと前のフレームのサブサンプリング因子の比を意味し、よって1より小さな値をもちうることを注意しておく。補間された値は次いで、
Figure 2019522816
としてそれぞれのバッファにフィードバックされる。
〈等価物、拡張、代替その他〉
上記の記述を吟味したのちには本開示のさらなる実施形態が当業者には明白となるであろう。本記述および図面は実施形態および例を開示しているが、本開示はそうした特定の例に制約されるものではない。数多くの修正および変形が、付属の請求項によってのみ定義される本開示の範囲から外れることなく、なされることができる。請求項に現われる参照符号があったとしても、その範囲を限定するものと理解されるものではない。
さらに、図面、本開示および付属の請求項の吟味から、本開示を実施する際に、当業者によって、開示される実施形態への変形が理解され、実施されることができる。請求項において、単語「有する/含む」は、他の要素やステップを排除するものではなく、単数形の表現は複数を排除するものではない。ある種の施策が互いに異なる従属請求項において記載されているというだけの事実が、それらの施策の組み合わせが有利に使用できないことを示すものではない。
上記で開示されたシステムおよび方法は、ソフトウェア、ファームウェア、ハードウェアまたはそれらの組み合わせとして実装されうる。一般に、本稿で言及される「コンポーネント」は回路として実装されてもよい。ハードウェア実装では、上記の記述で言及された機能ユニットの間でのタスクの分割は必ずしも物理的なユニットへの分割に対応しない。逆に、一つの物理的コンポーネントが複数の機能を有していてもよく、一つのタスクが協働するいくつかの物理的コンポーネントによって実行されてもよい。ある種のコンポーネントまたはすべてのコンポーネントは、デジタル信号プロセッサまたはマイクロプロセッサによって実行されるソフトウェアとして実装されてもよく、あるいはハードウェアとしてまたは特定用途向け集積回路として実装されてもよい。そのようなソフトウェアは、コンピュータ記憶媒体(または非一時的な媒体)および通信媒体(または一時的な媒体)を含みうるコンピュータ可読媒体上で頒布されてもよい。当業者にはよく知られているように、コンピュータ記憶媒体という用語は、コンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータのような情報の記憶のための任意の方法または技術において実装される揮発性および不揮発性、リムーバブルおよび非リムーバブル媒体を含む。コンピュータ記憶媒体は、これに限られないが、RAM、ROM、EEPROM、フラッシュメモリまたは他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)または他の光ディスク記憶、磁気カセット、磁気テープ、磁気ディスク記憶または他の磁気記憶デバイスまたは、所望される情報を記憶するために使用されることができ、コンピュータによってアクセスされることができる他の任意の媒体を含む。さらに、当業者には、通信媒体が典型的には、コンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータを、搬送波または他の転送機構のような変調されたデータ信号において具現し、任意の情報送達媒体を含むことはよく知られている。
本発明のさまざまな側面は、以下の箇条書き実施例(EEE: enumerated example embodiment)から理解されうる。
〔EEE1〕
デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に変換するためのオーディオ・デコーダにおける方法であって:
第一の周波数領域で表現されているデジタル・オーディオ信号のその後のフレームを受領することであって、前記デジタル・オーディオ信号は、該デジタル・オーディオ信号のもとのサンプリング・レートの半分であるナイキスト周波数をもつ、ことを実行し;
前記デジタル・オーディオ信号の各フレームについて:
前記デジタル・オーディオ信号のスペクトル内容を解析することによって前記デジタル・オーディオ信号の周波数範囲を同定する段階と、
前記周波数範囲が閾値量より大きく前記ナイキスト周波数を下回っていれば、同定された周波数範囲よりも上の前記デジタル・オーディオ信号のスペクトル帯域を除去することによって、前記デジタル・オーディオ信号のナイキスト周波数を、そのもとの値から低下した値に下げる段階と、
前記デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に、中間的時間領域を介して変換する段階であって、前記デジタル・オーディオ信号は前記中間的時間領域では前記もとのサンプリング・レートに比して、ナイキスト周波数の前記もとの値とナイキスト周波数の前記低下した値との間の比によって定義されるサブサンプリング因子により低減されたサンプリング・レートをもつ、段階と、
ナイキスト周波数の前記低下した値より上で第二の周波数領域における前記デジタル・オーディオ信号にスペクトル帯域を付加して、ナイキスト周波数をそのもとの値に復元する段階とを実行することを含む、
方法。
〔EEE2〕
現在フレームのナイキスト周波数の前記低下した値は、現在フレームの周波数範囲との関係での、前のフレームのナイキスト周波数の低下した値に依存して設定される、EEE1記載の方法。
〔EEE3〕
現在フレームの周波数範囲がある閾値量より大きく前のフレームのナイキスト周波数の低下した値を超える場合には、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より大きくなるよう設定される、EEE2記載の方法。
〔EEE4〕
現在フレームの周波数範囲の最高周波数が前のフレームのナイキスト周波数の低下した値と、高々ある閾値量しか違わない場合には、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値に等しくなるよう設定される、EEE2または3記載の方法。
〔EEE5〕
現在フレームの周波数範囲が、ある閾値量より大きく前のフレームのナイキスト周波数の低下した値を下回る場合には、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より低く設定される、EEE2ないし4のうちいずれか一項記載の方法。
〔EEE6〕
現在フレームのナイキスト周波数の低下した値はさらに、あらかじめ定義された数の前のフレームの周波数範囲に依存して設定される、EEE2ないし5のうちいずれか一項記載の方法。
〔EEE7〕
さらに現在フレームとあらかじめ定義された数の前のフレームのそれぞれとの周波数範囲の間の差の絶対値がそれぞれ高々ある閾値量である場合に、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より低く設定される、EEE6記載の方法。
〔EEE8〕
さらにあらかじめ定義された数の前のフレームのそれぞれの周波数範囲が前のフレームのナイキスト周波数の低下した値をある閾値量より大きく下回る場合に、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より低く設定される、EEE6記載の方法。
〔EEE9〕
第一の周波数領域から中間的時間領域へのまたは中間的時間領域から第二の周波数領域への前記デジタル・オーディオ信号の変換が、現在フレームからの前記デジタル・オーディオ信号の中間的時間領域のサンプルに加えて、前のフレームからの前記デジタル・オーディオ信号の中間的時間領域のサンプルを必要とし、
ナイキスト周波数の低下した値が現在フレームおよび前のフレームにおいて異なっているかどうかを検査して、現在フレームおよび前のフレームにおける前記デジタル・オーディオ信号の中間的時間領域のサンプルが異なるサンプリング・レートをもつかどうかを識別し、もしそうであれば、
現在フレームおよび前のフレームにおける中間的時間領域のサンプルが同じサンプリング・レートをもつよう、前のフレームの中間的時間領域のサンプルを再サンプリングすることを含む、
EEE1ないし8のうちいずれか一項記載の方法。
〔EEE10〕
前記再サンプリングは、前記デジタル・オーディオ信号を第一の周波数領域から中間的時間領域に変換するために使われるフィルタの第一のバンクのフィルタと、前記デジタル・オーディオ信号を中間的時間領域から第二の周波数領域に変換するために使われるフィルタの第二のバンクのフィルタとの時間的な整列不良に起因する時間的遅延を補償することを含む、EEE9記載の方法。
〔EEE11〕
前記時間的遅延は、dfract,1=(q1−1)/2に従って、それぞれ現在フレームおよび前のフレームのサブサンプリング因子の間の比q1に依存する値dfract,1によって与えられる、EEE10記載の方法。
〔EEE12〕
前のフレームの中間的時間領域のサンプルが、線形補間または三次スプライン補間のような補間を使って再サンプリングされる、EEE9ないし11のうちいずれか一項記載の方法。
〔EEE13〕
前のフレームの中間的時間領域のサンプルが、補間およびFIRフィルタリングおよびそれに続く間引きを使って再サンプリングされる、EEE9ないし11のうちいずれか一項記載の方法。
〔EEE14〕
第一の周波数領域は、第一のあらかじめ決定された長さをもつ合成フィルタの第一のバンクに関連しており、
第二の周波数領域は、第二のあらかじめ決定された長さをもつ分解フィルタの第二のバンクに関連しており、
前記デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に中間的時間領域を介して変換する段階は:
前記第一のバンクの合成フィルタの長さを前記サブサンプリング因子により短縮し、前記デジタル・オーディオ信号を第一の周波数領域から中間的時間領域に変換するときに、短縮された長さの合成フィルタを使い、
前記第二のバンクの分解フィルタの長さを前記サブサンプリング因子により短縮し、前記デジタル・オーディオ信号を中間的時間領域から第二の周波数領域に変換するときに、短縮された長さの分解フィルタを使うことを含む、
EEE1ないし13のうちいずれか一項記載の方法。
〔EEE15〕
前記第一のバンクの合成フィルタの長さは、前記サブサンプリング因子によってダウンサンプリングすることによって、あるいは前記第一のバンクの合成フィルタを記述する閉じた形の表式から合成フィルタを再計算することによって短縮される、EEE14記載の方法。
〔EEE16〕
前記第二のバンクの分解フィルタの長さは、前記サブサンプリング因子によってダウンサンプリングすることによって、あるいは前記第二のバンクの分解フィルタを記述する閉じた形の表式から分解フィルタを再計算することによって短縮される、EEE14または15記載の方法。
〔EEE17〕
前記第一のバンクの合成フィルタおよび/または前記第二のバンクの分解フィルタのダウンサンプリングは、前記第一のバンクの合成フィルタおよび前記第二のフィルタバンクの分解フィルタの時間的な整列不良に起因する時間的遅延を補償することを含む、EEE15または16記載の方法。
〔EEE18〕
前記デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に中間的時間領域を介して変換する段階の後に、前記デジタル・オーディオ信号に位相シフトを適用することをさらに含み、前記位相シフトは、前記第一のバンクの合成フィルタおよび前記第二のフィルタバンクの分解フィルタの時間的な整列不良に起因する時間的遅延に依存する、EEE14ないし16のうちいずれか一項記載の方法。
〔EEE19〕
前記時間的遅延は、dfract,2=(q2−1)/2に従って前記サブサンプリング因子に依存する値dfract,2によって与えられ、q2は前記サブサンプリング因子である、EEE17または18記載の方法。
〔EEE20〕
前記第一のバンクにおける合成フィルタおよび/または前記第二のバンクにおける分解フィルタは、線形補間または三次スプライン補間を使ってダウンサンプリングされる、EEE15ないし19のうちいずれか一項記載の方法。
〔EEE21〕
第一の周波数領域は修正離散コサイン変換(MDCT)領域であり、第二の周波数領域は直交ミラーフィルタ(QMF)領域である、EEE1ないし20のうちいずれか一項記載の方法。
〔EEE22〕
前記デジタル・オーディオ信号に関係するパラメータを受領することをさらに含み、前記周波数範囲はさらに該パラメータに基づいて同定される、EEE1ないし21のうちいずれか一項記載の方法。
〔EEE23〕
前記デジタル・オーディオ信号のナイキスト周波数を下げる段階はさらに:
ナイキスト周波数の低下した値を、値のあらかじめ定義された集合から、同定された周波数範囲より上である前記あらかじめ定義された集合内の最低の値として選択し、
ナイキスト周波数の選択された低下した値より上の前記デジタル・オーディオ信号のスペクトル帯域を除去することを含む、
EEE1ないし22のうちいずれか一項記載の方法。
〔EEE24〕
前記デジタル・オーディオ信号が複数のオーディオ・チャネルをもち、前記デジタル・オーディオ信号の周波数範囲を同定する段階およびナイキスト周波数を下げる段階は、各オーディオ・チャネルについて実行され、それにより、同じフレームにおいて異なるオーディオ・チャネルがナイキスト周波数の異なる低下した値をもつことを許容する、EEE1ないし23のうちいずれか一項記載の方法。
〔EEE25〕
処理機能をもつ装置によって実行されたときにEEE1ないし24のうちいずれか一項記載の方法を実行するためのコンピュータ・コード命令を記憶しているコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
〔EEE26〕
デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に変換するためのオーディオ・デコーダであって:
第一の周波数領域で表現されているデジタル・オーディオ信号のその後のフレームを受領するよう構成された受領コンポーネントであって、前記デジタル・オーディオ信号は、該デジタル・オーディオ信号のもとのサンプリング・レートの半分であるナイキスト周波数をもつ、受領コンポーネントと;
変換コンポーネントとを有しており、前記変換コンポーネントは、前記デジタル・オーディオ信号の各フレームについて:
前記デジタル・オーディオ信号のスペクトル内容を解析することによって前記デジタル・オーディオ信号の周波数範囲を同定する段階と、
前記周波数範囲が閾値量より大きく前記ナイキスト周波数を下回っていれば、同定された周波数範囲よりも上の前記デジタル・オーディオ信号のスペクトル帯域を除去することによって、前記デジタル・オーディオ信号のナイキスト周波数を、そのもとの値から低下した値に下げる段階と、
前記デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に、中間的時間領域を介して変換する段階であって、前記デジタル・オーディオ信号は前記中間的時間領域では前記もとのサンプリング・レートに比して、ナイキスト周波数の前記もとの値とナイキスト周波数の前記低下した値との間の比によって定義されるサブサンプリング因子により低減されたサンプリング・レートをもつ、段階と、
ナイキスト周波数の前記低下した値より上で第二の周波数領域における前記デジタル・オーディオ信号にスペクトル帯域を付加して、ナイキスト周波数をそのもとの値に復元する段階とを実行するよう構成されている、
オーディオ・デコーダ。

Claims (26)

  1. デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に変換するためのオーディオ・デコーダにおける方法であって:
    第一の周波数領域で表現されているデジタル・オーディオ信号のその後のフレームを受領することであって、前記デジタル・オーディオ信号は、該デジタル・オーディオ信号のもとのサンプリング・レートの半分であるナイキスト周波数をもつ、ことを実行し;
    前記デジタル・オーディオ信号の各フレームについて:
    前記デジタル・オーディオ信号の前記フレームのスペクトル内容を解析することによって前記デジタル・オーディオ信号の前記フレームの周波数範囲の上限を同定する段階であって、前記上限は前記フレーム内で0でないスペクトル内容をもつ最高周波数として決定される、段階と、
    前記周波数範囲の上限が閾値量より大きく前記ナイキスト周波数を下回っていれば、前記周波数範囲の同定された上限よりも上の前記デジタル・オーディオ信号の前記フレームのスペクトル帯域を除去することによって、前記デジタル・オーディオ信号の前記フレームのナイキスト周波数を、そのもとの値から低下した値に下げる段階と、
    前記デジタル・オーディオ信号の前記フレームを第一の周波数領域から第二の周波数領域に、中間的時間領域を介して変換する段階であって、前記デジタル・オーディオ信号の前記フレームは前記中間的時間領域では前記もとのサンプリング・レートに比して、ナイキスト周波数の前記もとの値とナイキスト周波数の前記低下した値との間の比によって定義されるサブサンプリング因子により下げられたサンプリング・レートをもつ、段階と、
    ナイキスト周波数の前記低下した値より上で第二の周波数領域における前記デジタル・オーディオ信号の前記フレームにスペクトル帯域を付加して、ナイキスト周波数をそのもとの値に復元する段階とを実行することを含む、
    方法。
  2. 現在フレームのナイキスト周波数の前記低下した値は、現在フレームの周波数範囲の上限との関係での、前のフレームのナイキスト周波数の低下した値に依存して設定される、請求項1記載の方法。
  3. 現在フレームの周波数範囲の上限がある閾値量より大きく前のフレームのナイキスト周波数の低下した値を超える場合には、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より大きくなるよう設定される、請求項2記載の方法。
  4. 現在フレームの周波数範囲の上限が前のフレームのナイキスト周波数の低下した値と、高々ある閾値量しか違わない場合には、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値に等しくなるよう設定される、請求項2または3記載の方法。
  5. 現在フレームの周波数範囲の上限が、ある閾値量より大きく前のフレームのナイキスト周波数の低下した値を下回る場合には、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より低く設定される、請求項2ないし4のうちいずれか一項記載の方法。
  6. 現在フレームのナイキスト周波数の低下した値はさらに、あらかじめ定義された数の前のフレームの周波数範囲の上限に依存して設定される、請求項2ないし5のうちいずれか一項記載の方法。
  7. さらに現在フレームとあらかじめ定義された数の前のフレームのそれぞれとの周波数範囲の上限の間の差の絶対値がそれぞれ高々ある閾値量である場合に、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より低く設定される、請求項6記載の方法。
  8. さらにあらかじめ定義された数の前のフレームのそれぞれの周波数範囲の上限が前のフレームのナイキスト周波数の低下した値をある閾値量より大きく下回る場合に、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より低く設定される、請求項6記載の方法。
  9. 第一の周波数領域から中間的時間領域へのまたは中間的時間領域から第二の周波数領域への前記デジタル・オーディオ信号の現在フレームの変換が、現在フレームからの前記デジタル・オーディオ信号の中間的時間領域のサンプルに加えて、前のフレームからの前記デジタル・オーディオ信号の中間的時間領域のサンプルを要求し、
    ナイキスト周波数の低下した値が現在フレームおよび前のフレームにおいて異なっているかどうかを検査して、現在フレームおよび前のフレームにおける前記デジタル・オーディオ信号の中間的時間領域のサンプルが異なるサンプリング・レートをもつかどうかを識別し、もしそうであれば、
    現在フレームおよび前のフレームにおける中間的時間領域のサンプルが同じサンプリング・レートをもつよう、前のフレームの中間的時間領域のサンプルを再サンプリングすることを含む、
    請求項1ないし8のうちいずれか一項記載の方法。
  10. 前記再サンプリングは、前記デジタル・オーディオ信号を第一の周波数領域から中間的時間領域に変換するために使われるフィルタの第一のバンクのフィルタと、前記デジタル・オーディオ信号を中間的時間領域から第二の周波数領域に変換するために使われるフィルタの第二のバンクのフィルタとの時間的な整列不良に起因する時間的遅延を補償することを含む、請求項9記載の方法。
  11. 前記時間的遅延は、dfract,1=(q1−1)/2に従って、それぞれ現在フレームおよび前のフレームのサブサンプリング因子の間の比q1に依存する値dfract,1によって与えられる、請求項10記載の方法。
  12. 前のフレームの中間的時間領域のサンプルが、線形補間または三次スプライン補間のような補間を使って再サンプリングされる、請求項9ないし11のうちいずれか一項記載の方法。
  13. 前のフレームの中間的時間領域のサンプルが、補間およびFIRフィルタリングおよびそれに続く間引きを使って再サンプリングされる、請求項9ないし11のうちいずれか一項記載の方法。
  14. 第一の周波数領域は、第一のあらかじめ決定された長さをもつ合成フィルタの第一のバンクに関連しており、第二の周波数領域は、第二のあらかじめ決定された長さをもつ分解フィルタの第二のバンクに関連しており、
    前記デジタル・オーディオ信号の前記フレームを第一の周波数領域から第二の周波数領域に中間的時間領域を介して変換する段階は:
    前記第一のバンクの合成フィルタの長さを前記サブサンプリング因子により短縮し、前記デジタル・オーディオ信号の前記フレームを第一の周波数領域から中間的時間領域に変換するときに、短縮された長さの合成フィルタを使い、
    前記第二のバンクの分解フィルタの長さを前記サブサンプリング因子により短縮し、前記デジタル・オーディオ信号を中間的時間領域から第二の周波数領域に変換するときに、短縮された長さの分解フィルタを使うことを含む、
    請求項1ないし13のうちいずれか一項記載の方法。
  15. 前記第一のバンクの合成フィルタの長さは、前記サブサンプリング因子によってダウンサンプリングすることによって、あるいは前記第一のバンクの合成フィルタを記述する閉じた形の表式から合成フィルタを再計算することによって短縮される、請求項14記載の方法。
  16. 前記第二のバンクの分解フィルタの長さは、前記サブサンプリング因子によってダウンサンプリングすることによって、あるいは前記第二のバンクの分解フィルタを記述する閉じた形の表式から分解フィルタを再計算することによって短縮される、請求項14または15記載の方法。
  17. 前記第一のバンクの合成フィルタおよび/または前記第二のバンクの分解フィルタのダウンサンプリングは、前記第一のバンクの合成フィルタおよび前記第二のフィルタバンクの分解フィルタの時間的な整列不良に起因する時間的遅延を補償することを含む、請求項15または16記載の方法。
  18. 前記デジタル・オーディオ信号の前記フレームを第一の周波数領域から第二の周波数領域に中間的時間領域を介して変換する段階の後に、前記デジタル・オーディオ信号の前記フレームに位相シフトを適用することをさらに含み、前記位相シフトは、前記第一のバンクの合成フィルタおよび前記第二のフィルタバンクの分解フィルタの時間的な整列不良に起因する時間的遅延に依存する、請求項14ないし16のうちいずれか一項記載の方法。
  19. 前記時間的遅延は、dfract,2=(q2−1)/2に従って前記サブサンプリング因子に依存する値dfract,2によって与えられ、q2は前記サブサンプリング因子である、請求項17または18記載の方法。
  20. 前記第一のバンクにおける合成フィルタおよび/または前記第二のバンクにおける分解フィルタは、線形補間または三次スプライン補間を使ってダウンサンプリングされる、請求項15ないし19のうちいずれか一項記載の方法。
  21. 第一の周波数領域は修正離散コサイン変換(MDCT)領域であり、第二の周波数領域は直交ミラーフィルタ(QMF)領域である、請求項1ないし20のうちいずれか一項記載の方法。
  22. 前記デジタル・オーディオ信号に関係するパラメータを受領することをさらに含み、前記周波数範囲の上限はさらに該パラメータに基づいて同定される、請求項1ないし21のうちいずれか一項記載の方法。
  23. 前記デジタル・オーディオ信号の前記フレームのナイキスト周波数を下げる段階はさらに:
    ナイキスト周波数の低下した値を、値のあらかじめ定義された集合から、前記周波数範囲の同定された上限より上である前記あらかじめ定義された集合内の最低の値として選択し、
    ナイキスト周波数の選択された低下した値より上の前記デジタル・オーディオ信号の前記フレームのスペクトル帯域を除去することを含む、
    請求項1ないし22のうちいずれか一項記載の方法。
  24. 前記デジタル・オーディオ信号が複数のオーディオ・チャネルをもち、前記デジタル・オーディオ信号の前記フレームの周波数範囲の上限を同定する段階およびナイキスト周波数を下げる段階は、各オーディオ・チャネルについて実行され、それにより、同じフレームにおいて異なるオーディオ・チャネルがナイキスト周波数の異なる低下した値をもつことを許容する、請求項1ないし23のうちいずれか一項記載の方法。
  25. コンピューティング装置もしくはシステムによって実行されたときに該コンピューティング装置もしくはシステムに請求項1ないし13のうちいずれか一項記載の方法を実行させる命令を有するコンピュータ・プログラム・プロダクト。
  26. デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に変換するためのオーディオ・デコーダであって:
    第一の周波数領域で表現されているデジタル・オーディオ信号のその後のフレームを受領するよう構成された受領コンポーネントであって、前記デジタル・オーディオ信号は、該デジタル・オーディオ信号のもとのサンプリング・レートの半分であるナイキスト周波数をもつ、受領コンポーネントと;
    変換コンポーネントとを有しており、前記変換コンポーネントは、前記デジタル・オーディオ信号の各フレームについて:
    前記デジタル・オーディオ信号の前記フレームのスペクトル内容を解析することによって前記デジタル・オーディオ信号の前記フレームの周波数範囲の上限を同定する段階と、
    前記周波数範囲の上限が閾値量より大きく前記ナイキスト周波数を下回っていれば、前記周波数範囲の同定された上限よりも上の前記デジタル・オーディオ信号の前記フレームのスペクトル帯域を除去することによって、前記デジタル・オーディオ信号の前記フレームのナイキスト周波数を、そのもとの値から低下した値に下げる段階と、
    前記デジタル・オーディオ信号の前記フレームを第一の周波数領域から第二の周波数領域に、中間的時間領域を介して変換する段階であって、前記デジタル・オーディオ信号の前記フレームは前記中間的時間領域では前記もとのサンプリング・レートに比して、ナイキスト周波数の前記もとの値とナイキスト周波数の前記低下した値との間の比によって定義されるサブサンプリング因子により低減されたサンプリング・レートをもつ、段階と、
    ナイキスト周波数の前記低下した値より上で第二の周波数領域における前記デジタル・オーディオ信号の前記フレームにスペクトル帯域を付加して、ナイキスト周波数をそのもとの値に復元する段階とを実行するよう構成されている、
    オーディオ・デコーダ。
JP2018567177A 2016-06-22 2017-06-20 第一の周波数領域から第二の周波数領域にデジタル・オーディオ信号を変換するためのオーディオ・デコーダおよび方法 Active JP6976277B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662353241P 2016-06-22 2016-06-22
US62/353,241 2016-06-22
EP16175715.8 2016-06-22
EP16175715 2016-06-22
PCT/EP2017/065011 WO2017220528A1 (en) 2016-06-22 2017-06-20 Audio decoder and method for transforming a digital audio signal from a first to a second frequency domain

Publications (3)

Publication Number Publication Date
JP2019522816A true JP2019522816A (ja) 2019-08-15
JP2019522816A5 JP2019522816A5 (ja) 2020-07-30
JP6976277B2 JP6976277B2 (ja) 2021-12-08

Family

ID=59062033

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018567177A Active JP6976277B2 (ja) 2016-06-22 2017-06-20 第一の周波数領域から第二の周波数領域にデジタル・オーディオ信号を変換するためのオーディオ・デコーダおよび方法

Country Status (3)

Country Link
US (1) US10770082B2 (ja)
EP (1) EP3475944B1 (ja)
JP (1) JP6976277B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113439302A (zh) * 2019-02-21 2021-09-24 瑞典爱立信有限公司 用于频域分组丢失隐藏的方法及相关解码器
US11509548B1 (en) * 2021-07-16 2022-11-22 Google Llc Adaptive exponential moving average filter
CN113488068B (zh) * 2021-07-19 2024-03-08 歌尔科技有限公司 音频异常检测方法、装置及计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010503881A (ja) * 2006-09-13 2010-02-04 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 音声・音響送信器及び受信器のための方法及び装置
JP2013531820A (ja) * 2011-02-14 2013-08-08 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 重複変換を使用した情報信号表記
JP2014013408A (ja) * 2009-05-27 2014-01-23 Dolby International Ab 信号の高周波成分を生成するためのシステム及び方法
JP2016514858A (ja) * 2013-04-05 2016-05-23 ドルビー・インターナショナル・アーベー オーディオ処理システム

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6433835B1 (en) * 1998-04-17 2002-08-13 Encamera Sciences Corporation Expanded information capacity for existing communication transmission systems
AUPR433901A0 (en) * 2001-04-10 2001-05-17 Lake Technology Limited High frequency signal construction method
US6850571B2 (en) * 2001-04-23 2005-02-01 Webtv Networks, Inc. Systems and methods for MPEG subsample decoding
US7519530B2 (en) * 2003-01-09 2009-04-14 Nokia Corporation Audio signal processing
US7412100B2 (en) * 2003-09-04 2008-08-12 Qualcomm Incorporated Apparatus and method for sub-sampling images in a transform domain
US7009533B1 (en) * 2004-02-13 2006-03-07 Samplify Systems Llc Adaptive compression and decompression of bandlimited signals
EP1564650A1 (en) 2004-02-17 2005-08-17 Deutsche Thomson-Brandt Gmbh Method and apparatus for transforming a digital audio signal and for inversely transforming a transformed digital audio signal
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
PL3288027T3 (pl) * 2006-10-25 2021-10-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób do generowania wartości podpasm audio o wartościach zespolonych
WO2010126709A1 (en) * 2009-04-30 2010-11-04 Dolby Laboratories Licensing Corporation Low complexity auditory event boundary detection
JP5769701B2 (ja) 2009-05-05 2015-08-26 テクミラ ファーマシューティカルズ コーポレイションTekmira Pharmaceuticals Corporation 脂質組成物
DE102009026593A1 (de) 2009-05-29 2010-12-02 Robert Bosch Gmbh Verfahren zur mechanischen Synchronisation zweier sich drehender, achsversetzter Stirnzahnräder
BR122021003887B1 (pt) * 2010-08-12 2021-08-24 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Reamostrar sinais de saída de codecs de áudio com base em qmf
US9313497B2 (en) * 2012-01-25 2016-04-12 Intel Corporation Systems, methods, and computer program products for transform coefficient sub-sampling
TWI575962B (zh) 2012-02-24 2017-03-21 杜比國際公司 部份複數處理之重疊濾波器組中的低延遲實數至複數轉換
CA2900437C (en) * 2013-02-20 2020-07-21 Christian Helmrich Apparatus and method for encoding or decoding an audio signal using a transient-location dependent overlap
US9326067B2 (en) * 2013-04-23 2016-04-26 Personics Holdings, Llc Multiplexing audio system and method
EP2830063A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for decoding an encoded audio signal
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980791A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010503881A (ja) * 2006-09-13 2010-02-04 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 音声・音響送信器及び受信器のための方法及び装置
JP2014013408A (ja) * 2009-05-27 2014-01-23 Dolby International Ab 信号の高周波成分を生成するためのシステム及び方法
JP2013531820A (ja) * 2011-02-14 2013-08-08 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 重複変換を使用した情報信号表記
JP2016514858A (ja) * 2013-04-05 2016-05-23 ドルビー・インターナショナル・アーベー オーディオ処理システム

Also Published As

Publication number Publication date
JP6976277B2 (ja) 2021-12-08
EP3475944B1 (en) 2020-07-15
US10770082B2 (en) 2020-09-08
US20190251978A1 (en) 2019-08-15
EP3475944A1 (en) 2019-05-01

Similar Documents

Publication Publication Date Title
AU2010209673B2 (en) Improved harmonic transposition
US8700388B2 (en) Audio transform coding using pitch correction
KR101090541B1 (ko) 스펙트럴 값들을 후처리하는 장치 및 방법, 그리고 오디오 신호를 위한 인코더 및 디코더
JP2021081754A (ja) 信号生成システム及び信号生成方法
TW201503108A (zh) 後設資料驅動動態範圍控制
MX2010010749A (es) Descodificador de señal de audio, proveedor de datos de contorno de distorsion de tiempo, metodo y programa de computadora.
WO2013058626A2 (ko) 지터 버퍼 관리 방법 및 이를 이용하는 지터 버퍼
JP6976277B2 (ja) 第一の周波数領域から第二の周波数領域にデジタル・オーディオ信号を変換するためのオーディオ・デコーダおよび方法
CN109328382B (zh) 用于将数字音频信号从第一频域变换到第二频域的音频解码器及方法
WO1998035449A1 (en) Method and equipment for processing data
AU2021204779B2 (en) Improved Harmonic Transposition
TWI625722B (zh) 處理一編碼音源訊號之裝置及方法
JP6307715B2 (ja) 音声信号処理装置、音声信号処理方法
JP2022505789A (ja) サブバンド併合および時間領域エイリアシング低減を使用した適応的な非均一時間/周波数タイリングによる知覚音声符号化
JP2005057439A (ja) 帯域分割型符号化・復号化方法、及びその方法に用いる復号化装置
KR101805631B1 (ko) 주파수 영역 변환 기법 및 시간 영역 변환 기법을 전환하며 오디오 신호를 부호화하는 장치 및 방법
KR101702565B1 (ko) 주파수 영역 변환 기법 및 시간 영역 변환 기법을 전환하며 오디오 신호를 부호화하는 장치 및 방법
WO2023118138A1 (en) Ivas spar filter bank in qmf domain
AU2013211560B2 (en) Improved harmonic transposition
JPH10228298A (ja) 音声信号符号化方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200616

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200616

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210415

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210427

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210721

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211012

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211109

R150 Certificate of patent or registration of utility model

Ref document number: 6976277

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150