JP2019522816A - 第一の周波数領域から第二の周波数領域にデジタル・オーディオ信号を変換するためのオーディオ・デコーダおよび方法 - Google Patents
第一の周波数領域から第二の周波数領域にデジタル・オーディオ信号を変換するためのオーディオ・デコーダおよび方法 Download PDFInfo
- Publication number
- JP2019522816A JP2019522816A JP2018567177A JP2018567177A JP2019522816A JP 2019522816 A JP2019522816 A JP 2019522816A JP 2018567177 A JP2018567177 A JP 2018567177A JP 2018567177 A JP2018567177 A JP 2018567177A JP 2019522816 A JP2019522816 A JP 2019522816A
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- audio signal
- digital audio
- frame
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
第一の側面によれば、この目的は、デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に変換するためのオーディオ・デコーダにおける方法であって:
第一の周波数領域で表現されているデジタル・オーディオ信号のその後のフレームを受領することであって、前記デジタル・オーディオ信号は、該デジタル・オーディオ信号のもとのサンプリング・レートの半分であるナイキスト周波数をもつ、ことを実行し;
前記デジタル・オーディオ信号の各フレームについて:
前記デジタル・オーディオ信号のスペクトル内容を解析することによって前記デジタル・オーディオ信号の周波数範囲を同定し、
前記周波数範囲が前記ナイキスト周波数よりも、閾値量より多く下であれば、同定された周波数範囲よりも上の前記デジタル・オーディオ信号のスペクトル帯域を除去することによって前記デジタル・オーディオ信号のナイキスト周波数を、そのもとの値から低下した値に下げ、
前記デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に、中間的時間領域を介して変換することであって、前記デジタル・オーディオ信号は前記中間的時間領域では前記もとのサンプリング・レートに比して、ナイキスト周波数の前記もとの値とナイキスト周波数の前記低下した値との間の比によって定義されるサブサンプリング因子だけ低下したサンプリング・レートをもつ、ことを実行し、
ナイキスト周波数の前記低下した値より上で第二の周波数領域における前記デジタル・オーディオ信号にスペクトル帯域を付加して、ナイキスト周波数をそのもとの値に復元することを含む、
方法によって達成される。
dfract,1=(q1−1)/2
に従って、それぞれ現在フレームおよび前のフレームのサブサンプリング因子の間の比q1に依存する。
dfract,2=(q2−1)/2
に従ってサブサンプリング因子に依存する。ここで、q2は(当該フレームの)サブサンプリング因子である。
第一の周波数領域で表現されているデジタル・オーディオ信号のその後のフレームを受領するよう構成された受領コンポーネントであって、前記デジタル・オーディオ信号は、該デジタル・オーディオ信号のもとのサンプリング・レートの半分であるナイキスト周波数をもつ、受領コンポーネントと;
変換コンポーネントとを有しており、前記変換コンポーネントは、前記デジタル・オーディオ信号の各フレームについて:
前記デジタル・オーディオ信号のスペクトル内容を解析することによって前記デジタル・オーディオ信号の周波数範囲を同定し、
前記周波数範囲が前記ナイキスト周波数よりも、閾値量より多く下であれば、同定された周波数範囲よりも上の前記デジタル・オーディオ信号のスペクトル帯域を除去することによって前記デジタル・オーディオ信号のナイキスト周波数を、そのもとの値から低下した値に下げ、
前記デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に、中間的時間領域を介して変換することであって、前記デジタル・オーディオ信号は前記中間的時間領域では前記もとのサンプリング・レートに比して、ナイキスト周波数の前記もとの値とナイキスト周波数の前記低下した値との間の比によって定義されるサブサンプリング因子だけ低下したサンプリング・レートをもつ、ことを実行し、
ナイキスト周波数の前記低下した値より上で第二の周波数領域における前記デジタル・オーディオ信号にスペクトル帯域を付加して、ナイキスト周波数をそのもとの値に復元するよう構成されている。
図1は、オーディオ・デコーダ100を概略的に示している。オーディオ・デコーダ100は受領コンポーネント110と、第一の変換コンポーネント120と、信号処理コンポーネント130と、第二の変換コンポーネント140とを有する。
g(n)=(u−m)・f(m+1)+(1+m−u)・f(m)、 n=0,……,(N/q2)−1
に従ってなされてもよい。ここで、Nはもとのプロトタイプ・フィルタfの長さであり、q2はサブサンプリング因子であり、u=n・q2+dfract,2は有理数であり、m=└n・q2+dfract,2┘は整数である(└・┘は床演算子、すなわち下に丸められた最大の整数)。補間されたプロトタイプ・フィルタgは今や一般化されたフィルタ次数og=(of/q2)+(1/q2)−1をもつ。ここで、ofはもとのフィルタfのフィルタ次数である。QMF分解/合成チェーンの再構成精度はこの演算によって維持される。ダウンサンプリングの結果は、プロトタイプ・フィルタ次数の(整数値ofから有理数ogへの)変化である。これは、変換コアにおいて反映されなければならないが、変換領域において周波数依存の利得1の位相因子を適用することによって補償されることもできる。
上記の記述を吟味したのちには本開示のさらなる実施形態が当業者には明白となるであろう。本記述および図面は実施形態および例を開示しているが、本開示はそうした特定の例に制約されるものではない。数多くの修正および変形が、付属の請求項によってのみ定義される本開示の範囲から外れることなく、なされることができる。請求項に現われる参照符号があったとしても、その範囲を限定するものと理解されるものではない。
デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に変換するためのオーディオ・デコーダにおける方法であって:
第一の周波数領域で表現されているデジタル・オーディオ信号のその後のフレームを受領することであって、前記デジタル・オーディオ信号は、該デジタル・オーディオ信号のもとのサンプリング・レートの半分であるナイキスト周波数をもつ、ことを実行し;
前記デジタル・オーディオ信号の各フレームについて:
前記デジタル・オーディオ信号のスペクトル内容を解析することによって前記デジタル・オーディオ信号の周波数範囲を同定する段階と、
前記周波数範囲が閾値量より大きく前記ナイキスト周波数を下回っていれば、同定された周波数範囲よりも上の前記デジタル・オーディオ信号のスペクトル帯域を除去することによって、前記デジタル・オーディオ信号のナイキスト周波数を、そのもとの値から低下した値に下げる段階と、
前記デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に、中間的時間領域を介して変換する段階であって、前記デジタル・オーディオ信号は前記中間的時間領域では前記もとのサンプリング・レートに比して、ナイキスト周波数の前記もとの値とナイキスト周波数の前記低下した値との間の比によって定義されるサブサンプリング因子により低減されたサンプリング・レートをもつ、段階と、
ナイキスト周波数の前記低下した値より上で第二の周波数領域における前記デジタル・オーディオ信号にスペクトル帯域を付加して、ナイキスト周波数をそのもとの値に復元する段階とを実行することを含む、
方法。
〔EEE2〕
現在フレームのナイキスト周波数の前記低下した値は、現在フレームの周波数範囲との関係での、前のフレームのナイキスト周波数の低下した値に依存して設定される、EEE1記載の方法。
〔EEE3〕
現在フレームの周波数範囲がある閾値量より大きく前のフレームのナイキスト周波数の低下した値を超える場合には、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より大きくなるよう設定される、EEE2記載の方法。
〔EEE4〕
現在フレームの周波数範囲の最高周波数が前のフレームのナイキスト周波数の低下した値と、高々ある閾値量しか違わない場合には、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値に等しくなるよう設定される、EEE2または3記載の方法。
〔EEE5〕
現在フレームの周波数範囲が、ある閾値量より大きく前のフレームのナイキスト周波数の低下した値を下回る場合には、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より低く設定される、EEE2ないし4のうちいずれか一項記載の方法。
〔EEE6〕
現在フレームのナイキスト周波数の低下した値はさらに、あらかじめ定義された数の前のフレームの周波数範囲に依存して設定される、EEE2ないし5のうちいずれか一項記載の方法。
〔EEE7〕
さらに現在フレームとあらかじめ定義された数の前のフレームのそれぞれとの周波数範囲の間の差の絶対値がそれぞれ高々ある閾値量である場合に、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より低く設定される、EEE6記載の方法。
〔EEE8〕
さらにあらかじめ定義された数の前のフレームのそれぞれの周波数範囲が前のフレームのナイキスト周波数の低下した値をある閾値量より大きく下回る場合に、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より低く設定される、EEE6記載の方法。
〔EEE9〕
第一の周波数領域から中間的時間領域へのまたは中間的時間領域から第二の周波数領域への前記デジタル・オーディオ信号の変換が、現在フレームからの前記デジタル・オーディオ信号の中間的時間領域のサンプルに加えて、前のフレームからの前記デジタル・オーディオ信号の中間的時間領域のサンプルを必要とし、
ナイキスト周波数の低下した値が現在フレームおよび前のフレームにおいて異なっているかどうかを検査して、現在フレームおよび前のフレームにおける前記デジタル・オーディオ信号の中間的時間領域のサンプルが異なるサンプリング・レートをもつかどうかを識別し、もしそうであれば、
現在フレームおよび前のフレームにおける中間的時間領域のサンプルが同じサンプリング・レートをもつよう、前のフレームの中間的時間領域のサンプルを再サンプリングすることを含む、
EEE1ないし8のうちいずれか一項記載の方法。
〔EEE10〕
前記再サンプリングは、前記デジタル・オーディオ信号を第一の周波数領域から中間的時間領域に変換するために使われるフィルタの第一のバンクのフィルタと、前記デジタル・オーディオ信号を中間的時間領域から第二の周波数領域に変換するために使われるフィルタの第二のバンクのフィルタとの時間的な整列不良に起因する時間的遅延を補償することを含む、EEE9記載の方法。
〔EEE11〕
前記時間的遅延は、dfract,1=(q1−1)/2に従って、それぞれ現在フレームおよび前のフレームのサブサンプリング因子の間の比q1に依存する値dfract,1によって与えられる、EEE10記載の方法。
〔EEE12〕
前のフレームの中間的時間領域のサンプルが、線形補間または三次スプライン補間のような補間を使って再サンプリングされる、EEE9ないし11のうちいずれか一項記載の方法。
〔EEE13〕
前のフレームの中間的時間領域のサンプルが、補間およびFIRフィルタリングおよびそれに続く間引きを使って再サンプリングされる、EEE9ないし11のうちいずれか一項記載の方法。
〔EEE14〕
第一の周波数領域は、第一のあらかじめ決定された長さをもつ合成フィルタの第一のバンクに関連しており、
第二の周波数領域は、第二のあらかじめ決定された長さをもつ分解フィルタの第二のバンクに関連しており、
前記デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に中間的時間領域を介して変換する段階は:
前記第一のバンクの合成フィルタの長さを前記サブサンプリング因子により短縮し、前記デジタル・オーディオ信号を第一の周波数領域から中間的時間領域に変換するときに、短縮された長さの合成フィルタを使い、
前記第二のバンクの分解フィルタの長さを前記サブサンプリング因子により短縮し、前記デジタル・オーディオ信号を中間的時間領域から第二の周波数領域に変換するときに、短縮された長さの分解フィルタを使うことを含む、
EEE1ないし13のうちいずれか一項記載の方法。
〔EEE15〕
前記第一のバンクの合成フィルタの長さは、前記サブサンプリング因子によってダウンサンプリングすることによって、あるいは前記第一のバンクの合成フィルタを記述する閉じた形の表式から合成フィルタを再計算することによって短縮される、EEE14記載の方法。
〔EEE16〕
前記第二のバンクの分解フィルタの長さは、前記サブサンプリング因子によってダウンサンプリングすることによって、あるいは前記第二のバンクの分解フィルタを記述する閉じた形の表式から分解フィルタを再計算することによって短縮される、EEE14または15記載の方法。
〔EEE17〕
前記第一のバンクの合成フィルタおよび/または前記第二のバンクの分解フィルタのダウンサンプリングは、前記第一のバンクの合成フィルタおよび前記第二のフィルタバンクの分解フィルタの時間的な整列不良に起因する時間的遅延を補償することを含む、EEE15または16記載の方法。
〔EEE18〕
前記デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に中間的時間領域を介して変換する段階の後に、前記デジタル・オーディオ信号に位相シフトを適用することをさらに含み、前記位相シフトは、前記第一のバンクの合成フィルタおよび前記第二のフィルタバンクの分解フィルタの時間的な整列不良に起因する時間的遅延に依存する、EEE14ないし16のうちいずれか一項記載の方法。
〔EEE19〕
前記時間的遅延は、dfract,2=(q2−1)/2に従って前記サブサンプリング因子に依存する値dfract,2によって与えられ、q2は前記サブサンプリング因子である、EEE17または18記載の方法。
〔EEE20〕
前記第一のバンクにおける合成フィルタおよび/または前記第二のバンクにおける分解フィルタは、線形補間または三次スプライン補間を使ってダウンサンプリングされる、EEE15ないし19のうちいずれか一項記載の方法。
〔EEE21〕
第一の周波数領域は修正離散コサイン変換(MDCT)領域であり、第二の周波数領域は直交ミラーフィルタ(QMF)領域である、EEE1ないし20のうちいずれか一項記載の方法。
〔EEE22〕
前記デジタル・オーディオ信号に関係するパラメータを受領することをさらに含み、前記周波数範囲はさらに該パラメータに基づいて同定される、EEE1ないし21のうちいずれか一項記載の方法。
〔EEE23〕
前記デジタル・オーディオ信号のナイキスト周波数を下げる段階はさらに:
ナイキスト周波数の低下した値を、値のあらかじめ定義された集合から、同定された周波数範囲より上である前記あらかじめ定義された集合内の最低の値として選択し、
ナイキスト周波数の選択された低下した値より上の前記デジタル・オーディオ信号のスペクトル帯域を除去することを含む、
EEE1ないし22のうちいずれか一項記載の方法。
〔EEE24〕
前記デジタル・オーディオ信号が複数のオーディオ・チャネルをもち、前記デジタル・オーディオ信号の周波数範囲を同定する段階およびナイキスト周波数を下げる段階は、各オーディオ・チャネルについて実行され、それにより、同じフレームにおいて異なるオーディオ・チャネルがナイキスト周波数の異なる低下した値をもつことを許容する、EEE1ないし23のうちいずれか一項記載の方法。
〔EEE25〕
処理機能をもつ装置によって実行されたときにEEE1ないし24のうちいずれか一項記載の方法を実行するためのコンピュータ・コード命令を記憶しているコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
〔EEE26〕
デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に変換するためのオーディオ・デコーダであって:
第一の周波数領域で表現されているデジタル・オーディオ信号のその後のフレームを受領するよう構成された受領コンポーネントであって、前記デジタル・オーディオ信号は、該デジタル・オーディオ信号のもとのサンプリング・レートの半分であるナイキスト周波数をもつ、受領コンポーネントと;
変換コンポーネントとを有しており、前記変換コンポーネントは、前記デジタル・オーディオ信号の各フレームについて:
前記デジタル・オーディオ信号のスペクトル内容を解析することによって前記デジタル・オーディオ信号の周波数範囲を同定する段階と、
前記周波数範囲が閾値量より大きく前記ナイキスト周波数を下回っていれば、同定された周波数範囲よりも上の前記デジタル・オーディオ信号のスペクトル帯域を除去することによって、前記デジタル・オーディオ信号のナイキスト周波数を、そのもとの値から低下した値に下げる段階と、
前記デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に、中間的時間領域を介して変換する段階であって、前記デジタル・オーディオ信号は前記中間的時間領域では前記もとのサンプリング・レートに比して、ナイキスト周波数の前記もとの値とナイキスト周波数の前記低下した値との間の比によって定義されるサブサンプリング因子により低減されたサンプリング・レートをもつ、段階と、
ナイキスト周波数の前記低下した値より上で第二の周波数領域における前記デジタル・オーディオ信号にスペクトル帯域を付加して、ナイキスト周波数をそのもとの値に復元する段階とを実行するよう構成されている、
オーディオ・デコーダ。
Claims (26)
- デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に変換するためのオーディオ・デコーダにおける方法であって:
第一の周波数領域で表現されているデジタル・オーディオ信号のその後のフレームを受領することであって、前記デジタル・オーディオ信号は、該デジタル・オーディオ信号のもとのサンプリング・レートの半分であるナイキスト周波数をもつ、ことを実行し;
前記デジタル・オーディオ信号の各フレームについて:
前記デジタル・オーディオ信号の前記フレームのスペクトル内容を解析することによって前記デジタル・オーディオ信号の前記フレームの周波数範囲の上限を同定する段階であって、前記上限は前記フレーム内で0でないスペクトル内容をもつ最高周波数として決定される、段階と、
前記周波数範囲の上限が閾値量より大きく前記ナイキスト周波数を下回っていれば、前記周波数範囲の同定された上限よりも上の前記デジタル・オーディオ信号の前記フレームのスペクトル帯域を除去することによって、前記デジタル・オーディオ信号の前記フレームのナイキスト周波数を、そのもとの値から低下した値に下げる段階と、
前記デジタル・オーディオ信号の前記フレームを第一の周波数領域から第二の周波数領域に、中間的時間領域を介して変換する段階であって、前記デジタル・オーディオ信号の前記フレームは前記中間的時間領域では前記もとのサンプリング・レートに比して、ナイキスト周波数の前記もとの値とナイキスト周波数の前記低下した値との間の比によって定義されるサブサンプリング因子により下げられたサンプリング・レートをもつ、段階と、
ナイキスト周波数の前記低下した値より上で第二の周波数領域における前記デジタル・オーディオ信号の前記フレームにスペクトル帯域を付加して、ナイキスト周波数をそのもとの値に復元する段階とを実行することを含む、
方法。 - 現在フレームのナイキスト周波数の前記低下した値は、現在フレームの周波数範囲の上限との関係での、前のフレームのナイキスト周波数の低下した値に依存して設定される、請求項1記載の方法。
- 現在フレームの周波数範囲の上限がある閾値量より大きく前のフレームのナイキスト周波数の低下した値を超える場合には、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より大きくなるよう設定される、請求項2記載の方法。
- 現在フレームの周波数範囲の上限が前のフレームのナイキスト周波数の低下した値と、高々ある閾値量しか違わない場合には、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値に等しくなるよう設定される、請求項2または3記載の方法。
- 現在フレームの周波数範囲の上限が、ある閾値量より大きく前のフレームのナイキスト周波数の低下した値を下回る場合には、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より低く設定される、請求項2ないし4のうちいずれか一項記載の方法。
- 現在フレームのナイキスト周波数の低下した値はさらに、あらかじめ定義された数の前のフレームの周波数範囲の上限に依存して設定される、請求項2ないし5のうちいずれか一項記載の方法。
- さらに現在フレームとあらかじめ定義された数の前のフレームのそれぞれとの周波数範囲の上限の間の差の絶対値がそれぞれ高々ある閾値量である場合に、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より低く設定される、請求項6記載の方法。
- さらにあらかじめ定義された数の前のフレームのそれぞれの周波数範囲の上限が前のフレームのナイキスト周波数の低下した値をある閾値量より大きく下回る場合に、現在フレームのナイキスト周波数の低下した値は、前のフレームのナイキスト周波数の低下した値より低く設定される、請求項6記載の方法。
- 第一の周波数領域から中間的時間領域へのまたは中間的時間領域から第二の周波数領域への前記デジタル・オーディオ信号の現在フレームの変換が、現在フレームからの前記デジタル・オーディオ信号の中間的時間領域のサンプルに加えて、前のフレームからの前記デジタル・オーディオ信号の中間的時間領域のサンプルを要求し、
ナイキスト周波数の低下した値が現在フレームおよび前のフレームにおいて異なっているかどうかを検査して、現在フレームおよび前のフレームにおける前記デジタル・オーディオ信号の中間的時間領域のサンプルが異なるサンプリング・レートをもつかどうかを識別し、もしそうであれば、
現在フレームおよび前のフレームにおける中間的時間領域のサンプルが同じサンプリング・レートをもつよう、前のフレームの中間的時間領域のサンプルを再サンプリングすることを含む、
請求項1ないし8のうちいずれか一項記載の方法。 - 前記再サンプリングは、前記デジタル・オーディオ信号を第一の周波数領域から中間的時間領域に変換するために使われるフィルタの第一のバンクのフィルタと、前記デジタル・オーディオ信号を中間的時間領域から第二の周波数領域に変換するために使われるフィルタの第二のバンクのフィルタとの時間的な整列不良に起因する時間的遅延を補償することを含む、請求項9記載の方法。
- 前記時間的遅延は、dfract,1=(q1−1)/2に従って、それぞれ現在フレームおよび前のフレームのサブサンプリング因子の間の比q1に依存する値dfract,1によって与えられる、請求項10記載の方法。
- 前のフレームの中間的時間領域のサンプルが、線形補間または三次スプライン補間のような補間を使って再サンプリングされる、請求項9ないし11のうちいずれか一項記載の方法。
- 前のフレームの中間的時間領域のサンプルが、補間およびFIRフィルタリングおよびそれに続く間引きを使って再サンプリングされる、請求項9ないし11のうちいずれか一項記載の方法。
- 第一の周波数領域は、第一のあらかじめ決定された長さをもつ合成フィルタの第一のバンクに関連しており、第二の周波数領域は、第二のあらかじめ決定された長さをもつ分解フィルタの第二のバンクに関連しており、
前記デジタル・オーディオ信号の前記フレームを第一の周波数領域から第二の周波数領域に中間的時間領域を介して変換する段階は:
前記第一のバンクの合成フィルタの長さを前記サブサンプリング因子により短縮し、前記デジタル・オーディオ信号の前記フレームを第一の周波数領域から中間的時間領域に変換するときに、短縮された長さの合成フィルタを使い、
前記第二のバンクの分解フィルタの長さを前記サブサンプリング因子により短縮し、前記デジタル・オーディオ信号を中間的時間領域から第二の周波数領域に変換するときに、短縮された長さの分解フィルタを使うことを含む、
請求項1ないし13のうちいずれか一項記載の方法。 - 前記第一のバンクの合成フィルタの長さは、前記サブサンプリング因子によってダウンサンプリングすることによって、あるいは前記第一のバンクの合成フィルタを記述する閉じた形の表式から合成フィルタを再計算することによって短縮される、請求項14記載の方法。
- 前記第二のバンクの分解フィルタの長さは、前記サブサンプリング因子によってダウンサンプリングすることによって、あるいは前記第二のバンクの分解フィルタを記述する閉じた形の表式から分解フィルタを再計算することによって短縮される、請求項14または15記載の方法。
- 前記第一のバンクの合成フィルタおよび/または前記第二のバンクの分解フィルタのダウンサンプリングは、前記第一のバンクの合成フィルタおよび前記第二のフィルタバンクの分解フィルタの時間的な整列不良に起因する時間的遅延を補償することを含む、請求項15または16記載の方法。
- 前記デジタル・オーディオ信号の前記フレームを第一の周波数領域から第二の周波数領域に中間的時間領域を介して変換する段階の後に、前記デジタル・オーディオ信号の前記フレームに位相シフトを適用することをさらに含み、前記位相シフトは、前記第一のバンクの合成フィルタおよび前記第二のフィルタバンクの分解フィルタの時間的な整列不良に起因する時間的遅延に依存する、請求項14ないし16のうちいずれか一項記載の方法。
- 前記時間的遅延は、dfract,2=(q2−1)/2に従って前記サブサンプリング因子に依存する値dfract,2によって与えられ、q2は前記サブサンプリング因子である、請求項17または18記載の方法。
- 前記第一のバンクにおける合成フィルタおよび/または前記第二のバンクにおける分解フィルタは、線形補間または三次スプライン補間を使ってダウンサンプリングされる、請求項15ないし19のうちいずれか一項記載の方法。
- 第一の周波数領域は修正離散コサイン変換(MDCT)領域であり、第二の周波数領域は直交ミラーフィルタ(QMF)領域である、請求項1ないし20のうちいずれか一項記載の方法。
- 前記デジタル・オーディオ信号に関係するパラメータを受領することをさらに含み、前記周波数範囲の上限はさらに該パラメータに基づいて同定される、請求項1ないし21のうちいずれか一項記載の方法。
- 前記デジタル・オーディオ信号の前記フレームのナイキスト周波数を下げる段階はさらに:
ナイキスト周波数の低下した値を、値のあらかじめ定義された集合から、前記周波数範囲の同定された上限より上である前記あらかじめ定義された集合内の最低の値として選択し、
ナイキスト周波数の選択された低下した値より上の前記デジタル・オーディオ信号の前記フレームのスペクトル帯域を除去することを含む、
請求項1ないし22のうちいずれか一項記載の方法。 - 前記デジタル・オーディオ信号が複数のオーディオ・チャネルをもち、前記デジタル・オーディオ信号の前記フレームの周波数範囲の上限を同定する段階およびナイキスト周波数を下げる段階は、各オーディオ・チャネルについて実行され、それにより、同じフレームにおいて異なるオーディオ・チャネルがナイキスト周波数の異なる低下した値をもつことを許容する、請求項1ないし23のうちいずれか一項記載の方法。
- コンピューティング装置もしくはシステムによって実行されたときに該コンピューティング装置もしくはシステムに請求項1ないし13のうちいずれか一項記載の方法を実行させる命令を有するコンピュータ・プログラム・プロダクト。
- デジタル・オーディオ信号を第一の周波数領域から第二の周波数領域に変換するためのオーディオ・デコーダであって:
第一の周波数領域で表現されているデジタル・オーディオ信号のその後のフレームを受領するよう構成された受領コンポーネントであって、前記デジタル・オーディオ信号は、該デジタル・オーディオ信号のもとのサンプリング・レートの半分であるナイキスト周波数をもつ、受領コンポーネントと;
変換コンポーネントとを有しており、前記変換コンポーネントは、前記デジタル・オーディオ信号の各フレームについて:
前記デジタル・オーディオ信号の前記フレームのスペクトル内容を解析することによって前記デジタル・オーディオ信号の前記フレームの周波数範囲の上限を同定する段階と、
前記周波数範囲の上限が閾値量より大きく前記ナイキスト周波数を下回っていれば、前記周波数範囲の同定された上限よりも上の前記デジタル・オーディオ信号の前記フレームのスペクトル帯域を除去することによって、前記デジタル・オーディオ信号の前記フレームのナイキスト周波数を、そのもとの値から低下した値に下げる段階と、
前記デジタル・オーディオ信号の前記フレームを第一の周波数領域から第二の周波数領域に、中間的時間領域を介して変換する段階であって、前記デジタル・オーディオ信号の前記フレームは前記中間的時間領域では前記もとのサンプリング・レートに比して、ナイキスト周波数の前記もとの値とナイキスト周波数の前記低下した値との間の比によって定義されるサブサンプリング因子により低減されたサンプリング・レートをもつ、段階と、
ナイキスト周波数の前記低下した値より上で第二の周波数領域における前記デジタル・オーディオ信号の前記フレームにスペクトル帯域を付加して、ナイキスト周波数をそのもとの値に復元する段階とを実行するよう構成されている、
オーディオ・デコーダ。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662353241P | 2016-06-22 | 2016-06-22 | |
US62/353,241 | 2016-06-22 | ||
EP16175715.8 | 2016-06-22 | ||
EP16175715 | 2016-06-22 | ||
PCT/EP2017/065011 WO2017220528A1 (en) | 2016-06-22 | 2017-06-20 | Audio decoder and method for transforming a digital audio signal from a first to a second frequency domain |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2019522816A true JP2019522816A (ja) | 2019-08-15 |
JP2019522816A5 JP2019522816A5 (ja) | 2020-07-30 |
JP6976277B2 JP6976277B2 (ja) | 2021-12-08 |
Family
ID=59062033
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018567177A Active JP6976277B2 (ja) | 2016-06-22 | 2017-06-20 | 第一の周波数領域から第二の周波数領域にデジタル・オーディオ信号を変換するためのオーディオ・デコーダおよび方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10770082B2 (ja) |
EP (1) | EP3475944B1 (ja) |
JP (1) | JP6976277B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113439302A (zh) * | 2019-02-21 | 2021-09-24 | 瑞典爱立信有限公司 | 用于频域分组丢失隐藏的方法及相关解码器 |
US11509548B1 (en) * | 2021-07-16 | 2022-11-22 | Google Llc | Adaptive exponential moving average filter |
CN113488068B (zh) * | 2021-07-19 | 2024-03-08 | 歌尔科技有限公司 | 音频异常检测方法、装置及计算机可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010503881A (ja) * | 2006-09-13 | 2010-02-04 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 音声・音響送信器及び受信器のための方法及び装置 |
JP2013531820A (ja) * | 2011-02-14 | 2013-08-08 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 重複変換を使用した情報信号表記 |
JP2014013408A (ja) * | 2009-05-27 | 2014-01-23 | Dolby International Ab | 信号の高周波成分を生成するためのシステム及び方法 |
JP2016514858A (ja) * | 2013-04-05 | 2016-05-23 | ドルビー・インターナショナル・アーベー | オーディオ処理システム |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6433835B1 (en) * | 1998-04-17 | 2002-08-13 | Encamera Sciences Corporation | Expanded information capacity for existing communication transmission systems |
AUPR433901A0 (en) * | 2001-04-10 | 2001-05-17 | Lake Technology Limited | High frequency signal construction method |
US6850571B2 (en) * | 2001-04-23 | 2005-02-01 | Webtv Networks, Inc. | Systems and methods for MPEG subsample decoding |
US7519530B2 (en) * | 2003-01-09 | 2009-04-14 | Nokia Corporation | Audio signal processing |
US7412100B2 (en) * | 2003-09-04 | 2008-08-12 | Qualcomm Incorporated | Apparatus and method for sub-sampling images in a transform domain |
US7009533B1 (en) * | 2004-02-13 | 2006-03-07 | Samplify Systems Llc | Adaptive compression and decompression of bandlimited signals |
EP1564650A1 (en) | 2004-02-17 | 2005-08-17 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for transforming a digital audio signal and for inversely transforming a transformed digital audio signal |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
PL3288027T3 (pl) * | 2006-10-25 | 2021-10-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Urządzenie i sposób do generowania wartości podpasm audio o wartościach zespolonych |
WO2010126709A1 (en) * | 2009-04-30 | 2010-11-04 | Dolby Laboratories Licensing Corporation | Low complexity auditory event boundary detection |
JP5769701B2 (ja) | 2009-05-05 | 2015-08-26 | テクミラ ファーマシューティカルズ コーポレイションTekmira Pharmaceuticals Corporation | 脂質組成物 |
DE102009026593A1 (de) | 2009-05-29 | 2010-12-02 | Robert Bosch Gmbh | Verfahren zur mechanischen Synchronisation zweier sich drehender, achsversetzter Stirnzahnräder |
BR122021003887B1 (pt) * | 2010-08-12 | 2021-08-24 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. | Reamostrar sinais de saída de codecs de áudio com base em qmf |
US9313497B2 (en) * | 2012-01-25 | 2016-04-12 | Intel Corporation | Systems, methods, and computer program products for transform coefficient sub-sampling |
TWI575962B (zh) | 2012-02-24 | 2017-03-21 | 杜比國際公司 | 部份複數處理之重疊濾波器組中的低延遲實數至複數轉換 |
CA2900437C (en) * | 2013-02-20 | 2020-07-21 | Christian Helmrich | Apparatus and method for encoding or decoding an audio signal using a transient-location dependent overlap |
US9326067B2 (en) * | 2013-04-23 | 2016-04-26 | Personics Holdings, Llc | Multiplexing audio system and method |
EP2830063A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for decoding an encoded audio signal |
EP2980794A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
EP2980791A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions |
-
2017
- 2017-06-20 US US16/307,624 patent/US10770082B2/en active Active
- 2017-06-20 JP JP2018567177A patent/JP6976277B2/ja active Active
- 2017-06-20 EP EP17730205.6A patent/EP3475944B1/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010503881A (ja) * | 2006-09-13 | 2010-02-04 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 音声・音響送信器及び受信器のための方法及び装置 |
JP2014013408A (ja) * | 2009-05-27 | 2014-01-23 | Dolby International Ab | 信号の高周波成分を生成するためのシステム及び方法 |
JP2013531820A (ja) * | 2011-02-14 | 2013-08-08 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 重複変換を使用した情報信号表記 |
JP2016514858A (ja) * | 2013-04-05 | 2016-05-23 | ドルビー・インターナショナル・アーベー | オーディオ処理システム |
Also Published As
Publication number | Publication date |
---|---|
JP6976277B2 (ja) | 2021-12-08 |
EP3475944B1 (en) | 2020-07-15 |
US10770082B2 (en) | 2020-09-08 |
US20190251978A1 (en) | 2019-08-15 |
EP3475944A1 (en) | 2019-05-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2010209673B2 (en) | Improved harmonic transposition | |
US8700388B2 (en) | Audio transform coding using pitch correction | |
KR101090541B1 (ko) | 스펙트럴 값들을 후처리하는 장치 및 방법, 그리고 오디오 신호를 위한 인코더 및 디코더 | |
JP2021081754A (ja) | 信号生成システム及び信号生成方法 | |
TW201503108A (zh) | 後設資料驅動動態範圍控制 | |
MX2010010749A (es) | Descodificador de señal de audio, proveedor de datos de contorno de distorsion de tiempo, metodo y programa de computadora. | |
WO2013058626A2 (ko) | 지터 버퍼 관리 방법 및 이를 이용하는 지터 버퍼 | |
JP6976277B2 (ja) | 第一の周波数領域から第二の周波数領域にデジタル・オーディオ信号を変換するためのオーディオ・デコーダおよび方法 | |
CN109328382B (zh) | 用于将数字音频信号从第一频域变换到第二频域的音频解码器及方法 | |
WO1998035449A1 (en) | Method and equipment for processing data | |
AU2021204779B2 (en) | Improved Harmonic Transposition | |
TWI625722B (zh) | 處理一編碼音源訊號之裝置及方法 | |
JP6307715B2 (ja) | 音声信号処理装置、音声信号処理方法 | |
JP2022505789A (ja) | サブバンド併合および時間領域エイリアシング低減を使用した適応的な非均一時間/周波数タイリングによる知覚音声符号化 | |
JP2005057439A (ja) | 帯域分割型符号化・復号化方法、及びその方法に用いる復号化装置 | |
KR101805631B1 (ko) | 주파수 영역 변환 기법 및 시간 영역 변환 기법을 전환하며 오디오 신호를 부호화하는 장치 및 방법 | |
KR101702565B1 (ko) | 주파수 영역 변환 기법 및 시간 영역 변환 기법을 전환하며 오디오 신호를 부호화하는 장치 및 방법 | |
WO2023118138A1 (en) | Ivas spar filter bank in qmf domain | |
AU2013211560B2 (en) | Improved harmonic transposition | |
JPH10228298A (ja) | 音声信号符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200616 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200616 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210415 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210427 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210721 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211012 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211109 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6976277 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |