JP5809645B2 - 信号処理器、窓提供部、符号化されたメディア信号、信号を処理するための方法および窓を提供するための方法 - Google Patents

信号処理器、窓提供部、符号化されたメディア信号、信号を処理するための方法および窓を提供するための方法 Download PDF

Info

Publication number
JP5809645B2
JP5809645B2 JP2012556496A JP2012556496A JP5809645B2 JP 5809645 B2 JP5809645 B2 JP 5809645B2 JP 2012556496 A JP2012556496 A JP 2012556496A JP 2012556496 A JP2012556496 A JP 2012556496A JP 5809645 B2 JP5809645 B2 JP 5809645B2
Authority
JP
Japan
Prior art keywords
window
value
signal
function
values
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012556496A
Other languages
English (en)
Other versions
JP2013531264A (ja
Inventor
クリスティアン ヘルムリッヒ
クリスティアン ヘルムリッヒ
ラルフ ガイガー
ラルフ ガイガー
Original Assignee
フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー.
フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー., フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. filed Critical フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー.
Publication of JP2013531264A publication Critical patent/JP2013531264A/ja
Application granted granted Critical
Publication of JP5809645B2 publication Critical patent/JP5809645B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/45Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

本発明による実施形態は、入力信号の処理されたバージョンを当該入力信号に応じて提供するための信号処理器、信号処理窓値を提供するための窓提供部、符号化されたメディア信号、信号を処理するための方法および信号処理窓値を提供するための方法に関する。
本発明による一実施形態は、可変窓関数を使用してオーディオまたはビデオ信号を符号化または復号するための装置に関する。本発明による別の実施形態は、可変窓関数を使用してオーディオまたはビデオ信号を符号化または復号するための方法に関する。
本発明による実施形態は、一般に、オーディオまたはビデオコーディングシステムにおいて使用され得るもののような信号の分析および処理方法に関する。
離散信号の有限インパルス応答(FIR)フィルタリング(特にフィルタバンクの関連における)は、数ある用途の中でも、スペクトルの分析、処理、合成、およびメディアデータの圧縮において広く採用されている。FIRフィルタの時間(または空間)有限性そしてひいては時間または空間における1つのインスタンスにおいて処理することができる信号区間の有限性は、バイアスまたはリークとして知られる現象を引き起こし得ることはよく理解されている。例えば利得変化または量子化を変化させることによってフィルタリングされた区間を修正する際、フィルタリング演算を反転させると、ブロッキングまたはリンギングアーチファクトが生じ得る。これらのアーチファクトの原因は、処理された区間(以下、「セグメント」と称する)の信号波形のエンドポイント間の不連続性およびその微分の不連続性によるものである可能性があることが分かっている。したがって、リークのこのような不要な作用を低減させるためには、セグメントおよびその微分における不連続性を最小限にすることが有用であるかあるいはさらには必要であることが分かっている。これは、フィルタリングの前にそしてフィルタリングされた領域における信号操作の場合には逆フィルタリングの後にも、長さNのセグメントの各サンプルs(n)(n=0,1,...,N−1)に、セグメントのエンドポイントおよびその微分が徐々に減少してゼロになるように、ある重みw(n)を乗じることによって実現することができる。等価な手法が、フィルタバンクの各ベースフィルタに対する重みに適用されている(例えば、参考文献[2]を参照)。重み因子は解析方程式によって示される場合が多いため、因子の集合は、一般に重み関数または窓関数として知られている。
典型的なオーディオおよびビデオコーディングシステムでは、ソース波形が上記のようにセグメント化され、各セグメントをより粗い表現に量子化して、高いデータ圧縮、すなわち、信号の格納または伝送に必要な低いビットレートを実現する。N個未満のサンプルへのエネルギー圧縮によってコーディング利得を実現する(あるいは、換言すると、所与のビットレートについてのコーディングされた信号の知覚品質を高める)ために、量子化の前にセグメントのフィルタバンク変換を行うことが一般的になっている。最近開発されたシステムでは、重複直交時間−周波数変換を、隣接するセグメントを重複させながらもクリティカルなサンプリングを可能とするフィルタバンクである修正離散コサイン変換(MDCT)の形態で使用している。高性能化のために、順方向および逆方向のMDCT演算を各セグメントの加重と組み合わせる。すなわち、センタ側では、順方向MDCTの前に分析窓wa(n)を適用し、受信側では、逆方向MDCTの後に合成窓ws(n)を使用する。あいにく、全ての重み関数がMDCTとの使用に適しているわけではない。所定の(時間/空間不変)窓を想定した場合、アーキテクチャ全体が量子化誤差や伝送誤差を生じることなく完全な入力復元を達成するためには、wa(n)およびws(n)は、以下のように選択しなければならないことが分かっている。
Figure 0005809645
(n)およびw(n)が同一でなければならない場合、すなわち、w(n)=w(n)=w(n)の場合、式(1)は、参考文献[7]で公開された以下の周知の制約条件に変形される。
Figure 0005809645
最良のエネルギー圧縮を実現するためには、n=N/2−1/2について対称であるw(n)、すなわち、
Figure 0005809645
が通常採用される。アドバンスオーディオコーディング(AAC:Advanced Audio Coding)基準(参考文献[8])においては、2つの窓関数が利用可能である。1つは、以下によって得られる正弦窓であり、
Figure 0005809645
もう1つは、フィールダーおよびデビッドソンの特許"Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio"(米国特許第5109417号および5142656号)に記載されるカイザー−ベッセル派生(KBD)窓である。後者の窓は、異なる形態(α=5)においてではあるが、AC−3(ドルビーデジタル)コーディング基準(ATSC, Inc., "Digital Audio Compression Standard)(AC-3,E-AC-3),Revision B" Document A/52B, June 2005)においても利用されている。Vorbis仕様(参考文献[9])は、以下の窓を定義している。
Figure 0005809645
図5は、参考文献[4]による、フーリエ変換によって得られたAAC窓関数およびVorbis窓関数の周波数応答を示す。正弦窓は比較的高い近周波数選択性(狭いメインローブ)および比較的低い阻止帯域除去性(低いサイドローブ減衰性)を有することが理解される。反対に、KBD窓は、高い阻止帯域減衰性および低い近周波数選択性を有する。Vorbis窓は、前者の2つの窓の中間にある。
いくつかの用途では、式(2)を満たす重み関数の通過帯域選択性および阻止帯域除去性に対してより精密な制御を行うことが望ましい場合があることが分かっている。より具体的には、コーディング効率を向上させるためには、窓の特性を入力スペクトルの特性に絶えず適合させるために窓パラメータが必要である場合があることが分かっている。上記の3つの関数全てのうち、KBD関数だけがこのようなパラメータである、異なる選択性/減衰性のトレードオフを実現するために変化させることができるαを与える。しかしながら、この関数には、計算的にコストが高い数学(ベッセル関数、双曲線正弦、平方根、および除算)が組み込まれており、低パワーデバイスまたはリアルタイムシステムにおいて信号セグメントごとに再計算を行うことを場合によって妨げる。SinhaおよびFerreiraの論文"A New Class of Smooth Power Complementary Windows and their Application to Audio Signal Proces-sing"AES 119th Convention, October 2005, paper 6604に提示される、複雑な値の演算、スペクトルの因数分解、およびフーリエ変換を必要とする窓関数のクラスにも同じことが当てはまる。2つの関数(例えば、KBDおよび正弦)間の補間(最も効率的には加重合計による)を用いて周波数応答をいくらか制御することができるものの、この手法によってもたらされる自由度は限定されたもでしかないということも分かっている。
例えば、参考文献[1]、[2]、[3]、[4]、[5]において、異なる評価基準に対して最適化された多数の窓関数が記載されている。おそらく、現在最も一般的に使用されている関数の3つは、フォン・ハン、ハミングおよびブラックマンによって報告されたものである。
以下に、いくつかの代表的な窓関数について説明する。すなわち、以下において上記の窓関数(例えば、ハン、ハミングおよびブラックマン)について再度説明し、その基礎を成す一般設計式を明らかにする。
窓関数の影響力の大きな研究との一貫性および類似性のため、本検討においては、ナットールの方法および表記(例えば、参考文献[4]を参照)を採用する。具体的には、Lは窓実現の持続時間(長さ)、tは加重内の位置(時間)、fは、窓関数のフーリエ変換によって得られる窓のパワー密度スペクトル内の周波数を示すものとする。加えて、全ての窓関数をピーク振幅1に規格化する。ここでは対称の(好ましくは長さが均一の)釣鐘形の窓のみが検討されるので、これは、w(L/2)=1を意味する。最初に検討される重み関数は、ハン(またはハニング)関数として知られている。これは、参考文献[2]において、
Figure 0005809645
として、DSP用途(非負の値t)について規定されている。参考文献[2]に示され、また(11)から明らかであるように、ハン関数は、べき乗正弦関数のクラスの以下の特殊なケースである。
Figure 0005809645
実際には、典型的には、正の整数がaに代入される。なお、(12)は、オフセットとスケーリングされた余弦との和としても記述することができる。
Figure 0005809645
この式により、オフセットおよびスケーリング因子を変化させることによってハン窓の特定のスペクトル最適化(評価および最適化に関する下記の記載を参照)が可能となる。結果として得られるは、完全パラメータ表現が参考文献[4]において以下として示されるハミング関数である。
Figure 0005809645
ナットール(例えば、参考文献[4]を参照)によって指摘されたように、ハン窓およびハミング窓は、(K+1)−項関数のクラスの二項実現であり、この関数を余弦和関数と称する。ナットールの表記を簡略化すると、これらは、DSP用途での使用について、以下のように記述することができる。
Figure 0005809645
これは、参考文献[4]の式11からスカラー1/Lを省略したものに等しい。三項実現もまた一般的である。簡単なケースは、K=2、そして以下の因子
Figure 0005809645
を用いた(15)であり、これは、a=4とした(12)と等価である。ハミングの手法と同様、ブラックマン(例えば、参考文献[1]を参照)は、以下の最適化されたbを導出した。
Figure 0005809645
ナットール(例えば、参考文献[4]を参照)は、より優れた近接場スペクトル応答のためにブラックマンの値をさらに改良した(第1のサイドローブ、評価および最適化に関する下記の記載を参照)。
Figure 0005809645
興味のある読者は、他の最適化された三項および四項余弦和窓について参考文献[4]を参照されたい。
上記考察を鑑みると、必要とされているのは、計算の複雑性が適度でありながらも良好な設計自由度を実現する代替的な窓関数である。
したがって、本発明は、適度な計算複雑性および良好な設計自由度を有するが窓関数を得ることを可能にする信号処理方法の概念を構築することを目的とする。
本発明による一実施形態は、入力信号の処理されたバージョンを当該入力信号に応じて提供するための信号処理器を実現する。信号処理器は、入力信号の処理されたバージョンを得るために、入力信号またはその前処理されたバージョンの一部を、複数の窓値インデックス値についての信号処理窓値によって示される信号処理窓に応じて窓関数処理するように構成された窓関数処理部を備える。信号処理器はまた、複数の窓値インデックス値についての信号処理窓値を、1つ以上の窓形状パラメータに応じて提供するための窓提供部も備える。窓提供部は、窓値インデックス値に対応付けられた複数の引数値について正弦関数を評価して、信号処理窓値を得るように構成されている。窓提供部は、窓値インデックス値に線形依存する線形項と、窓値インデックス値を対応する関数値にマッピングするとともに、窓スロープの中心に対して点対称である1つ以上の整形関数の関数値との加重和を計算して、引数値を得るように構成されている。
本発明のこの実施形態は、線形項と1つ以上の整形関数との加重合計は非常に低い計算労力で実行可能であるため、信号処理窓値を上述のように決定することにより、入力信号の窓関数処理を容易に調整可能に達成することができるという知見に基づいている。それにもかかわらず、1つ以上の整形関数の点対称性と、複数の引数値についての正弦関数の評価とにより、例えば、2つの連続する窓スロープ間の良好なエネルギー保存性といった窓の特に良好な特性がもたらされるということも分かっている。また、信号処理窓値によって定義される窓の特性は、1つ以上の窓形状パラメータに応じて1つ以上の整形関数の加重を修正することによって容易に調整することができ、したがって、比較的小さい計算労力で異なる特性の窓を得ることができる。例えば、本明細書に定義される概念により、1つ以上の整形関数の加重を変化させることにより、いずれも上記良好な特性を有する多数の異なる窓形状を得ることが可能となる。
さらに、上記概念を用いれば、非常に高い粒度で調整が可能な異なる特性を有する窓の計算には、特に複雑な計算は不要であり、単に、加重和を形成して引数値を得て、そして当該引数値を使用して正弦関数を評価するだけでよいという点に留意されたい。
本発明による別の実施形態は、入力信号の処理されたバージョンを当該入力信号に応じて提供するための信号処理器を実現する。信号処理器は、入力信号の処理されたバージョンを得るために、入力信号またはその前処理されたバージョンの一部を、複数の窓値インデックス値についての信号処理窓値によって示される信号処理窓に応じて窓関数処理するように構成された窓関数処理部を備える。信号処理窓値は、窓値インデックス値に対応付けられた複数の引数値についての正弦関数評価の結果値であり、引数値は、窓値インデックス値に線形依存する線形項と、窓値インデックス値を対応する関数値にマッピングするとともに窓スロープの中心に対して点対称である1つ以上の正弦型整形関数の関数値との加重和である。本発明によるこの実施形態は、上述の実施形態と同じ主要な考え方に基づいている。また、正弦型整形関数を使用することにより、特に良好な特性を有する信号処理窓がもたらされることが分かった。
本発明による別の実施形態は、複数の窓値インデックス値についての信号処理窓値を、1つ以上の窓形状パラメータに応じて提供する窓提供部を実現する。窓提供部は、窓値インデックス値に対応付けられた複数の引数値について正弦関数を評価して、信号処理窓値を得るように構成されている。窓提供部は、窓値インデックス値に線形依存する線形項と1つ以上の整形関数の関数値との加重和を計算して、引数値を得るように構成されている。1つ以上の整形関数は、窓値インデックス値を対応する関数値にマッピングし、1つ以上の整形関数は、窓スロープの中心に対して点対称である。
本発明によるこの実施形態は、上記実施形態と同じ考え方に基づいている。
本発明による別の実施形態は、入力信号の処理されたバージョンを当該入力信号に応じて提供するための信号処理器を実現する。信号処理器は、入力信号の処理されたバージョンを得るために、入力信号またはその前処理されたバージョンの一部を、複数の窓値インデックス値についての信号処理窓値によって示される信号処理窓に応じて窓関数処理するように構成された窓関数処理部を備える。信号処理器はまた、複数の窓値インデックス値についての信号処理窓値を、1つ以上の窓形状パラメータに応じて提供する窓提供部も備える。窓提供部は、窓関数値インデックス値を対応する関数値にマッピングする複数の正弦型整形関数の関数値の加重和を計算して、信号処理窓値を得るように構成されている。関数値の加重は、窓形状パラメータによって決定される。本発明によるこの実施形態は、窓形状パラメータと上述の計算規則を用いることにより、計算効率よく、かつ窓特性を自由に調整しながら、多くの用途について十分に良好な特性を有する窓形状を得ることができるという知見に基づいている。
本発明による別の実施形態は、入力信号の処理されたバージョンを当該入力信号に応じて提供するための信号処理器を実現する。信号処理器は、入力信号の処理されたバージョンを得るために、入力信号またはその前処理されたバージョンの一部を、複数の窓値インデックス値についての信号処理窓値によって示される信号処理窓に応じて窓関数処理するように構成された窓関数処理部を備える。信号処理窓値は、窓値インデックス値を対応する関数値にマッピングする複数の正弦型整形関数の関数値の加重合計の結果値である。本発明によるこの実施形態は、上述の実施形態と同じ考え方に基づいている。
本発明による別の実施形態は、符号化されたメディア信号を実現する。符号化されたメディア信号は、メディアコンテンツの符号化された表現と1つ以上の窓形状パラメータとを含む。1つ以上の窓形状パラメータは、メディアコンテンツの符号化された表現の復号において適用される窓の形状を定義する。1つ以上の窓形状パラメータは、窓値インデックス値に線形依存する線形項と、1つ以上の整形関数の関数値との加重和を計算して、複数の引数の正弦関数を評価することによって複数の窓値インデックス値についての信号処理窓値を導出するための引数値を得るための重みを示す。窓形状パラメータを使用することにより、復号器によって効率的に導出が可能な多数の異なるタイプの窓を示すことができるため、この符号化されたメディア信号により、窓関数処理の信号処理のための高い自由度がもたらされる。
次に、本発明による実施形態を添付の図面を参照しながら説明する。
図1aは、本発明の一実施形態による信号処理器のブロック模式図を示す。 図1bは、本発明の別の実施形態による信号処理器のブロック模式図を示す。 図2は、本発明の別の実施形態による信号処理器のブロック模式図を示す。 図3は、本発明の一実施形態による窓提供部のブロック模式図を示す。 図4は、本発明の一実施形態による符号化されたメディア信号の概略表現を示す。 図5は、AAC窓およびVorbis窓の周波数強度応答のグラフ表現をdB縦軸のスケールで示す。 図6は、AACのKBD窓関数および本発明による関数のある1つのインスタンスの振幅のグラフ表現を示す。 図7は、AACのKBD窓と比較した本発明の窓関数の上記インスタンスの周波数強度応答のグラフ表現を線形横軸およびdB縦軸のスケールで示す。 図8は、AACのKBD窓と比較した本発明による窓関数の上記インスタンスの周波数強度応答のグラフ表現を対数横軸およびdB縦軸のスケールで示す。 図9は、AACのKBD窓および三次Sinha-Ferreira窓と比較した本発明による窓関数の別の2つのインスタンスの周波数強度応答のグラフ表現を示す。 図10は、本発明による窓関数および類似の窓関数のための信号適合処理をブロック図で示す。 図11は、式(12)による、いくつかのべき乗正弦関数のスペクトルのグラフ表現を示す。 図12は、式(15)による、最適化された余弦和関数のスペクトルのグラフ表現を示す。 図13は、式(19)による、本提案の最適化された正弦和窓のグラフ表現を示す。 図14は、異なる窓関数の適用後のLf=32および96.5の周波数を有する2つの正弦曲線のDFTスペクトルのグラフ表現を示す。 図15は、2つのPC窓および本提案の窓のスペクトルのグラフ表現を示す。 図16は、窓の概略表現を示す。
1.図1aによる信号処理器
図1は、本発明の第1の実施形態による信号処理器100のブロック模式図を示す。信号処理器100は、入力信号110を受信し、これに基づいて、入力信号の処理されたバージョン112を提供するように構成されている。信号処理器100は、入力信号の処理されたバージョン112(または任意の後処理部130においてさらなる後処理を経た入力信号のバージョン112’)を得るために、入力信号110またはその前処理されたバージョン110’(任意の前処理111によって得ることができる)の一部を、複数の窓値インデックス値nについての信号処理窓値122によって示される信号処理窓に応じて窓関数処理するように構成された窓関数処理部120を備える。
この目的で、窓関数処理部120は、窓提供部130から信号処理窓値w(n)を受信する。窓提供部130もまた典型的には信号処理器100の一部である。窓提供部130は、複数の窓値インデックス値nについての信号処理窓値w(n)を1つ以上の窓形状パラメータ132に応じて提供するように構成されている。窓提供部は、窓値インデックス値nに対応付けられた複数の引数値c´(n)について正弦関数を評価して、信号処理窓値w(n)を得るように構成されている。窓提供部130はまた、例えば、c(n)によって示される窓値インデックス値nに線形依存する線形項と、1つ以上の整形関数の関数値との加重和を計算するようにも構成されている。1つ以上の整形関数は、窓値インデックス値nを対応する関数値にマッピングする。1つ以上の整形関数は、窓スロープの中心に対して点対称である。加重和の計算を実行して、引数値c´(n)を得る。
したがって、窓提供部130は、特に良好な特性を有する窓を示す信号処理窓値w(n)を提供する。信号処理窓値w(n)を得るために窓提供部において正弦関数評価を適用することにより、2つの対応する窓スロープが重複している場合について、良好なエネルギー保存特性を有する窓を得ることが可能となる。さらに、正弦関数評価のために、窓値インデックス値(簡単に「インデックス値」としても示す)の線形関数ではなく、インデックス値に線形依存する線形項と、非線形でありかつ窓スロープの中心に対して点対称である1つ以上の整形関数の関数値との重ね合わせである引数値c´(n)を使用することにより、信号処理窓値w(n)によって示される信号処理窓の形状を調整することができる。
例えば、1つ以上の窓形状パラメータ132に応じて引数値の異なる遷移(インデックス値nの関数としての)が得られるように、引数値c´(n)に対する1つ以上の整形関数の寄与を調整することができる。したがって、信号処理窓値によって示される信号処理窓の特性は、1つ以上の窓形状パラメータ132に応じて特定のニーズに合わせて調整することができる。さらに、窓スロープの中心に対して点対称である1つ以上の整形関数を選択することは、信号処理窓の良好なエネルギー保存特性およびエネルギー圧縮特性を保証するとともに、引数値を計算するための計算労力を削減する機会を提供するのに有用であることが分かっている。
信号処理窓値w(n)の代わりとなり得る信号処理窓値wnew(n)の計算に関する詳細については後述する。
2.図1bによる信号処理器
図1bは、信号処理器100と類似した信号処理器150のブロック模式図を示す。したがって、同一の手段および信号には同一の参照符号を付す。ただし、信号処理器150は、窓提供部130とは異なる窓提供部180を備える。窓提供部180は、1つ以上の形状パラメータck´182を受信し、これに基づいて、例えば、w(t)で示される信号処理窓値w(t)を提供する。ここで、変数tは窓値インデックス値であり、簡単に「インデックス値」としても示される点に留意されたい。
窓提供部180は、複数の窓値インデックス値tについての信号処理窓値w(t)を1つ以上の窓形状パラメータcに応じて提供するように構成されている。窓提供部180は、窓値インデックス値を対応する関数値にマッピングする複数の正弦型整形関数の関数値の加重和を計算して、信号処理窓値w(t)を得るように構成されている。関数値の加重は、窓形状パラメータcによって決定される。
窓提供部180を用いて信号処理窓値を提供することにより、信号処理窓値が多くの場合において十分に良好な特性を有するように、信号処理窓値を提供することができる。また、窓形状パラメータの1つ以上の異なる選択について異なる信号処理窓を得ることができるように、1つ以上の窓形状パラメータcを用いて特定の特性を調整することができる。
正弦型整形関数を使用し、そして、この正弦型重み関数の関数値の加重和を形成することにより、詳しく後述するように、良好な特性を有する窓を得ることができる。
さらに、窓提供部180によって提供される信号処理窓値w(t)の計算に関する詳細については後述されるという点に留意されたい。
3.図2による信号処理器
図2は、本発明の一実施形態による信号処理器200のブロック模式図を示す。信号処理器200は、入力信号210を受信し、これに基づいて、入力信号の処理されたバージョン212を提供するように構成されている。
信号処理器200は、入力信号210またはその前処理されたバージョン210の一部を、当該入力信号の処理されたバージョン212を得るために、複数の窓値インデックス値(簡単に「インデックス値」として示される)についての信号処理窓値によって示される信号処理窓に応じて窓関数処理するように構成された窓関数処理部220を備える。信号処理器200は、任意の前処理211および任意の後処理213を備え得る。
信号処理窓値は、窓値インデックス値に対応付けられた複数の引数値についての正弦関数評価の結果値であり、引数値は、窓値インデックス値に線形依存する線形項と、窓値インデックス値を対応する関数値にマッピングする1つ以上の正弦型整形関数の関数値との加重和である。1つ以上の正弦型整形関数は、窓スロープの中心に対して点対称である。
窓関数処理部220は、結果的に、窓関数処理部120によって実行される窓関数処理と非常に類似した窓関数処理を実行し得る。例えば、窓関数処理部220によって使用される信号処理窓値は、窓関数処理部120によって使用される信号処理窓値と同一であり得る。窓関数処理部220によって使用される信号処理窓値は、例えば、ルックアップテーブルに格納してもよく、あるいは、別の方法で得ることができる。
別の実施形態では、異なる信号処理窓値を使用してもよい。別の実施形態において、信号処理窓値は、窓値インデックス値を対応する関数値にマッピングする複数の正弦型整形関数の関数値の加重合計の結果値である。
結論として、窓関数処理部220は、例えば、信号処理窓値wnew(n)によって示される窓を入力信号210またはその前処理されたバージョン211’に適用するように構成され得る。しかしながら、その代わりに、窓関数処理部220は、信号処理窓値w(t)を入力信号210またはその前処理されたバージョン210’に適用するように構成されてもよい。
窓関数処理部220によって適用される信号処理窓に関するさらなる詳細については後述する。
4.図3による窓提供部
図3は、本発明の一実施形態による窓提供部300のブロック模式図を示す。窓提供部300は、典型的には変数値である1つ以上の窓形状パラメータ310を受信し、これに基づいて、複数の窓値インデックス値についての信号処理窓値w(n)312の集合を提供するように構成されている。窓提供部300は、窓値インデックス値に対応付けられた複数の引数値について正弦関数を評価して、信号処理窓値w(n)を得るように構成されている。窓提供部はまた、例えば、c(n)によって示される場合がある、窓値インデックス値nに線形依存する線形項と、1つ以上の整形関数の関数値との加重和を計算するようにも構成されている。1つ以上の整形関数は、窓値インデックス値nを対応する関数値にマッピングする。1つ以上の整形関数は、窓スロープの中心に対して点対称である。
したがって、窓提供部300は、本質的に、窓提供部130の機能を果たす。ただし、窓提供部300は、窓関数処理部130から独立した構成要素であり得るという点に留意されたい。しかしながら、その代わりに、窓提供部300は、窓提供部180の機能を果たしてもよい。
5.図4による符号化されたメディア信号
以下に、符号化されたメディア信号について説明する。このような符号化されたメディア信号の概略表現が図4に示されている。符号化されたメディア信号400は、メディアコンテンツの符号化された表現と窓形状パラメータとを含む。窓形状パラメータは、例えば、窓提供部130のための1つ以上の窓形状パラメータ132としての機能を果たすかあるいは窓提供部180のための1つ以上の窓形状パラメータ132としての機能を果たすように適合される。したがって、符号化されたメディア信号400における窓形状パラメータは、窓提供部130または窓提供部180を用いて信号処理窓値w(n)またはw(t)を生成するために選択される。また、メディアコンテンツの符号化された表現は、典型的には、窓形状パラメータによって示される窓に応じた窓関数処理を用いて符号化される。
6.窓提供部130によって提供されるかあるいは窓関数処理部220によって使用される窓に関する詳細
6.1 概要および定義
以下に、窓提供部130によって提供される窓に関するいくつかの詳細について説明する。この窓は、窓関数処理部220によっても使用され得る。ここで、窓は、信号処理窓値w(n)によって定義されるという点に留意されたい。信号処理窓値w(n)に、典型的には、入力信号110またはその前処理されたバージョン110’を乗じて、入力信号の窓関数処理されたバージョンまたは入力信号の前処理されたバージョン110’を得る。窓は、典型的には、信号処理窓値w(n)によって示される(ここで、nは信号処理窓値を指定するインデックス値(例えば、時間インデックス値)である)。
加えて、窓は、典型的には、左側窓スロープおよび右側窓スロープを含む点に留意されたい。窓は、更に、中央の信号処理窓値の数が共通の所定の値をとるような一定の(またはほぼ一定の)中央部分を任意に含み得る。しかしながら、窓の左側窓スロープと右側窓スロープとは異なっていてもよいという点に留意されたい。したがって、以下の記述は、単一の窓スロープの、すなわち、小さい窓値(例えば、ゼロ窓値)と大きな窓値(例えば、最大窓値1)との間の移行の形状を実質的に示していることが指摘される。
次に、窓の概略表現を示す図16を参照すると、横軸1610がインデックス値nを示し、縦軸1612がインデックス値nに対応付けられた信号処理窓値w(n)を示す図16のグラフ表現においてこのことがより詳細に説明される。窓1600は左側窓部1620および右側窓部1622を含むことが理解される。左側窓部は、キー要素として、左側窓スロープ1630を含む。左側窓スロープ1630は、例えば、複数の信号処理窓値w(n)によってn=n〜n=nについて定義される。左側窓部1620は、信号処理窓値w(n)が小さい値、例えばw(n)=0をとる左外側部分を任意に更に含み得る。左側窓部はまた、信号処理窓値w(n)が所定の値、例えばw(n)=1をとる中央窓部の一部も任意に含む。窓1600は、右側窓部1622を含み、右側窓部1622は、キー要素として、右側窓スロープ1640を含む。右側窓部は、信号処理窓値が所定の値、例えばw(n)=1をとる中央窓部の一部を任意に含み得る。右側窓部はまた、信号処理窓値w(n)が小さい値、例えばw(n)=0をとる右外側部分も任意に含み得る。
左外側部分、中央窓部および右外側窓部分は任意であると考えるべきであるという点に留意されたい。また、窓1600は、対称であっても非対称であってもよいという点に留意されたい。したがって、左側窓スロープ1630および右側窓スロープ1640は、等しくてもよく、あるいはいくつかの実施形態においては著しく異なっていてもよい。
ここで、以下の記述は、実質的に、左側窓スロープ1630、即ち、小さいまたはゼロの窓値と、大きいまたは最大の窓値との間の移行に関するという点に留意されたい。しかしながら、左外側部分を任意に追加し、中央窓部を任意に追加し、右側窓スロープを追加し、右外側部分を任意に追加することにより、左側窓スロープ1630の知識から窓1600全体を得ることができるという点に留意されたい。また、右側窓スロープ1640は、例えば式(3)といった単純なミラーリング処理を用いて左側窓スロープと同様に得ることができるという点にも留意されたい。
ここで、以下の記述によると、左側窓スロープは、n=0〜n=N/2−1について値w(n)によって示されるべきであるという点にも留意されたい。しかしながら、異なるインデックス値を使用することは当然可能である。
6.2 窓wnew(n)の詳細
本発明による実施形態は、MDCT用途のための自由かつ計算効率のよい窓関数アプリケーションが無いという問題に対し、式(4)の正弦窓関数に対する拡張を宣言することによって対処するものである。
尚、式(4)は、n=N/2−1/2について対称である三角形窓関数の正弦であると考えることができる。式(3)が与えられた場合、これは、以下を意味する。
Figure 0005809645
Figure 0005809645
ここで、c(n)は窓コア関数を示し、窓コア関数は予め定められているため事前に計算が可能である。本提案の拡張は、式(7)のc(n)に、2πの整数倍である角周波数を有する加重正弦曲線を加算することである。
Figure 0005809645
Figure 0005809645
c´(n)における正弦項もまた事前に計算することができる。a因子によって規定されるそれらの加重のみが適合される必要がある。よって、本提案の窓を変換毎に信号に合わせて調整する際、式(9)と、式(8)における加重とをだけ再計算すればよく、これにより、適合の計算的な複雑性がKBD窓およびSinha-Ferreira窓を用いた適合よりも低くなる。
さらに、式(8)および式(9)における正弦項により、本提案の窓関数のクラスの各実現は、そのエンドポイントにおいて完全に減衰してゼロとなり、これにより、サイドローブの少なくとも12dB/オクターブの一様な減衰が窓の周波数応答において保証されることも述べるに値する。このことは、KBD窓およびPrincen and Bradleyの論文“Analysis/Synthesis Filter Bank Design Based on Time Domain Aliasing Cancellation,” IEEE Trans. Acoustics, Speech,and Signal Processing, Oct.1986, pp.1153-1161およびFerreiraの論文“Convolutional Effects in Transform Coding with TDAC: An Optimal Window,” IEEE Trans. Speech and Audio Processing, Mar. 1996, pp. 104-114において公開された窓については当てはまらず、したがって、これらの遠周波数(far-frequency)サイドローブは、12dB/オクターブ未満で減衰する。等しいメインローブ幅の場合、これは、式(8)および式(9)による窓が、遠周波数サイドローブ減衰に関して従来技術の窓よりも優れた性能を有する可能性があることを意味する。
本発明による窓の計算または適合は、以下のステップを含む:
−設計考慮に基づいてc´(n)における正弦項の数および適切な重み因子aを選択するステップ。
−窓長Nを決定または定義し、選択されたaおよび正弦項の数を用いてc´(n)を計算するステップ。
−n=0,1,...,N/2−1について式(9)のwnew(n)を計算し、次いで式(3)を使用して、長さNの窓インスタンスを求めるステップ。
−異なる窓パラメータ表現が前の隣接セグメントについて使用される場合、前の窓インスタンスの右半分を較正するか、現在の窓インスタンスの左半分を較正するか、あるいは前の窓インスタンスの右半分および現在の窓インスタンスの左半分の両方を較正することのいずれかにより、完全反転制約条件を満足させるステップ。
好ましい実施形態において、窓関数は、計算の複雑性に関しては正弦窓およびVorbis窓と同等であるが、少なくともKBD窓およびSinha-Ferreira窓の設計自由度を提供する。
上記に関し、値c´(n)は、窓値インデックス値nに対応付けられた引数値であると考えられるという点に留意されたい。また、関数sin(2π・f・c(n))は、整形関数であると考えられ得るという点にも留意されたい。
また、整形関数として正弦関数を使用する必要はないという点に留意されたい。むしろ、整形関数が窓スロープの中心に対して点対称となるように整形関数を選択すればよい。窓スロープの中心は、例えば、線形項c(n)=0.5の値によって定義される。例えば、正弦関数の代わりに点対称の多項関数を使用してもよく、これにより、場合によっては評価が容易となり得る。また、整形関数は、c(n)=0およびc(n)=1について、即ち、窓スロープの最も左の窓値インデックス値の環境および窓スロープの最も右の窓値インデックス値の環境において、十分にゼロに近い値をとるのが好ましい。換言すれば、整形関数は、最も左の窓値インデックス値(例えば、n=0)および最も右の窓値インデックス値(例えば、n=N/2−1)の環境(または近傍)においてゼロを有するかあるいはほぼゼロの値をとるのがよい。
さらに、式(6)および式(7)は、例えば、窓提供部130の引数値計算によって評価されてもよく、式(9)は窓提供部130の正弦関数評価によって評価されてもよいという点に留意されたい。したがって、n=0〜n=N/2−1について窓提供部130の正弦関数評価によって得られる値wnew(n)は、例えば、左側窓スロープ1630を示し得る。
窓提供部130は、結果として、左側窓スロープに対応付けられた上記信号処理窓値に基づいて、窓1610全体を組み立てるように構成され得る。この目的で、窓提供部は、図16に示すように、左外側部分、中央窓部、右側窓スロープおよび右外側部分を追加してもよい。右側窓スロープは、対称の窓の場合、左側窓スロープをミラーリングすることによって得ることができる。しかし、その代わりに、右側窓スロープは、左側窓スロープとは異なっていてもよく、また、左側窓スロープとは異なる窓形状パラメータについて得られた窓スロープをミラーリングすることによって得ることができる。
また、入力信号の前の部分に対応付けられた右側移行スロープと入力信号の後の部分に対応付けられた左側移行スロープとが、完全反転制約条件が満たされるという点において一致することを信号処理器によって確実にしてもよいという点に留意されたい。この目的で、入力信号の後の部分に対応付けられた左側窓スロープが入力信号の前の部分に対応付けられた右側窓スロープを得るために適用されたものと同じパラメータを使用して得られることを確実にしてもよい。
さらに、式(6)、式(8)および式(9)によって定義されるアルゴリズムは、計算力が限られた装置における窓関数のオンライン計算によく適しているという点に留意されたい。
しかしながら、いくつかの実施形態では、式(6)、式(8)および式(9)によって定義されるような窓を一度評価し、その結果を、後で使用するためにルックアップテーブルに格納してもよい。
6.3.窓の設計についての解説
以下に、特に良好な特性を有する窓を与えるいくつかの条件について述べる。しかしながら、以下に述べる条件に従うことは必須であると考えるべきではないという点に留意されたい。
発明の背景のセクションで述べたように、MDCTを採用する信号コーダは、信号操作が行われていないときに、システム全体を完全に反転可能するために、すなわち、完全な入力復元を実現するために、信号に適用される窓関数に対してある条件を課す必要がある。パワー相補関数としても知られる式(2)に合致する関数は、適切なカテゴリーの代表例である。本発明の窓クラスの全ての実現は、このカテゴリーに属する。しかしながら、全ての採用されたnについて非負のc´(n)を用いた以下の実現が特に良好な通過帯域選択性と阻止帯域除去性とを同時にもたらすことが分かる。
Figure 0005809645
したがって、以下の記述では窓クラスのこの部分集合に注目する。場合によっては、全ての採用されたnについて非負のc´(n)を用いた実現のみが、十分な通過帯域選択性および阻止帯域除去性を同時にもたらす。
一般に、所与の使用例に合わせた窓周波数応答を設計するために式(8)において任意の数の正弦項を使用することができるが、2つの正弦項(f=1、2)により、自由度と、複雑性と、メモリ使用との間の適切なトレードオフがもたらされることが分かった。具体的には、2つの正弦項を使用して、以下のようなパラメータを導出することができる。
−窓インスタンスのメインローブ幅を最小にする、すなわち、近周波数選択性を最大化し、
−ある規格化された周波数を超える窓インスタンスの最大サイドローブレベルを最小化し、
−窓インスタンスのサイドローブ減衰、即ち、遠周波数阻止帯域減衰のレートを最大化し、
−窓インスタンスの既存の基準窓インスタンスに対する最大差を最小化する。
以下に、これらの設計考慮のそれぞれについて具体例を用いて検討する。
6.3.1 最大通過帯域選択性を有する窓
式(2)のパワー相補条件は、特に最初のいくつかのサイドローブの幅およびレベルに関して、達成可能な周波数応答の範囲を限定するものの、最も狭いメインローブにつながる窓関数は、c´(n)における全てのa因子をゼロに設定することによって得ることができる。容易に分かるように、得られる窓は、式(4)のAAC正弦窓に等しい。そのスペクトルを、KBD(α=4)窓およびVorbis窓のスペクトルと共に図5に示す。
しかしながら、要するに、窓形状パラメータaのうち少なくとも1つは非ゼロ値に設定されるのが好ましいという点に留意されたい。それでも、窓提供部113の上述の構造により、単に窓形状パラメータaを設定するだけで、特定の信号を用いることなくAAC正弦窓さえも得るための自由度が実現される。
6.3.2 最小サイドローブ最大値を有する窓
最大サイドローブレベルを最小化する式(9)の構成は、全数探索法または勾配ベースの探索法のいずれかによってaパラメータをまとめて最適化することにより得ることができる。しかしながら、式(2)により、それを上回る値に対してミニマックス最適化が実行される低周波数境界Nω>1.5を定義することが推奨される。Nω=4.5の値により、パラメータa=0.1224およびa=0.00523が得られることが分かった。このように構成された窓関数を図6に示す。同じく図示されるAACのKBD窓関数との類似性は明らかである。対応する窓スペクトルを図7に示す。KBD窓と比較して本発明の窓の最初の2つのサイドローブのレベルが低いこと、およびNω≒5(この周波数を超える本提案の窓の最初の3つのサイドローブは−66.8dBのレベルを有する一方で、KBD窓は−63.0dBの若干高いレベルに達している)を超える最大サイドローブレベルが減少していることは注目に値する。
c´(n)における正弦項の使用により、本発明の窓クラスのいずれの実現も連続的であり、よって、そのエンドポイントにおいて滑らかに減少してゼロとなることが保証される。この利点を図8に示す。過去に導出された窓のサイドローブは、12dB/オクターブのレートで減衰することが理解される。これに対し、KBD窓はより低い減衰レートを示しており、その理由は、KBDの重み関数のエンドポイントにおける若干の不連続性にある。その結果、本提案の窓は、Nω≒250〜Nω≒7ではKBD窓に性能において劣っているにも関わらず、Nω≒250より上ではKBD窓よりも高い除去性を達成している。いくつかの分析または合成用途では、この特徴は利点となり得る。
6.3.3 最大サイドローブ減衰を有する窓
ある場合においては、12dB/オクターブを超えるレートでサイドローブが減衰する窓を利用することが望ましいことがある。本発明により、例えば、24dB/オクターブで減衰する窓を構築することが可能となる。これは、重み関数の連続した一次微分、すなわち、窓インスタンスの端部において消失する微分を要件とすることによって行われる。この問題に対する最も直観的な解決方法は、a=0.1591、a=0の構成である。得られる窓応答を、以下で述べる他の3つの応答とともに図9に示す。
6.3.4 基準窓を近似する窓
本提案の窓クラスの自由度についてのこの論証を完成させるため、2つの既存の窓に非常に類似した2つの窓実現を生成する試みを行う。その多様性のゆえに、KBD(α=4)関数および三次Sinha-Ferreira関数を基準として選択した。c´(n)および式(9)による復元を、最小二乗的に、すなわち、基準と近似との間の平方差を最小化することにより行った(なお、他の方法も考えられる)。図9はその結果を示す。本発明の窓は、従来技術の相当する窓とほぼ同一であり、大きな違いは非常に低いレベルにおいてのみ生じていることが理解される。したがって、複雑な環境またはメモリを最重視すべき環境においては、基準窓は、高レベルの後方互換性、また、該当する場合は、ほぼ完全な復元の可能性を維持しながら、本発明の窓クラスを用いたデバイスで置き換えることができる。
7.信号適合型システムにおける実施例
本提案の窓クラスのさらなる利点は、システムが、2の整数べきによって関係付けられた異なる長さの信号セグメントを処理するときに生じる。例えば、AACでは、この手順(ブロック切り替えとしても知られる)は、フレーム当たり2048(1920)個のサンプルに対して1回または256(240)個のサンプルに対して8回、MDCTを適用することによって実現される。ここで、式(8)における個々の項の部分集合、例えば、n=0,1,...,、N/8−1を、より低い長さの窓のためのコア関数として再使用することができ、正弦項の場合には窓関数自体として使用することができる。低い長さの窓についての設計自由度を下げることが許容される場合は、このことを利用して、コア関数の格納に必要とされるメモリ容量をさらに削減することができる。
8.本発明のさらなる応用
本明細書で報告されるようなパワー相補窓関数は、オーディオまたはビデオコーディング以外のいくつかの応用シナリオに非常に魅力的でありえる。「発明の背景」セクションの第6段落で引用した文献に示されるように、パワー相補窓は、連続ブロック間に重複を有してブロックごとに動作する、瞬間エネルギー保存型クロスフェイドまたは切り替えシステムおよび信号分析・処理デバイスにおいて採用することができる。より一般的には、一次元以上の信号上でフィルタリングタスクを実行するあらゆる装置は、本報告の窓を、以下を含むそのフィルタリングカーネルの構築において使用することができるが、これらに限定されるものではない。
−高域通過(微分)フィルタ、低域通過(積分)フィルタ、および帯域通過フィルタ、
−ダウンサンプリング部(デシメーションフィルタ)およびアップサンプリング部(補間フィルタ)、
−単一または多周波帯用の等化器、圧縮器、伸長器、および制限器、
−ノイズ低減のためのアルゴリズムおよび関連の改良または効果ツール。
本明細書において提案される本発明の窓関数をこのようなシステムにおいて採用し、そのスペクトル特性を、好ましくは、信号セグメント適合的に、アプリケーション要件に合わせて調整することにより、知覚性能の向上の実現が期待される。
9.図10によるメディア信号符号化器およびメディア信号復号器
図10は、メディア信号符号化器およびメディア信号復号器のブロック模式図を示す。メディア信号符号化器1010は、1つ以上のチャネル信号s(n)〜s(n)を受信し、これに基づいて、符号化された表現を提供するように構成されている。入力メディア信号の符号化された表現は、MDCT係数S(k)〜S(k)の形態をとってもよく、あるいは、このようなMDCT係数の符号化された表現であってもよい。信号符号化器1010は、例えば、独立して動作し得るか結合され得る複数の同一の信号経路1012a〜1012mを備える。加えて、信号符号化器1010はまた、符号化パラメータ計算部602も備え、符号化パラメータ計算部602は、例えば、ブロック長、時間領域雑音整形(TNS)パラメータ、サブバンド利得補償パラメータ、設定情報および/または心理音響モデル情報等の符号化パラメータのうち1つ以上を決定する。以下に、経路または枝路1012aについて述べるが、上記の記述は、更なる枝路、例えば、枝路1012mにも適用可能である。
枝路1012aは、それぞれのチャネルの入力信号s(n)および符号化パラメータ決定部602からの情報を受信する窓検出部603を備える。窓検出部603は、例えば、所望の窓の形状を示す窓形状情報603aを提供し得る。
窓形状情報は、例えば、符号化器1010の客観的性能(コーディング利得、周波数選択性またはエネルギー圧縮、データ圧縮、導入されるエイリアシングの量)または主観的性能(誤りのないまたは誤りのある送信および復号後の符号化された出力の知覚品質)が最適化されるかあるいは改良されるように、窓検出部603に対する入力から決定され得る。
枝路1012aはまた、窓同期化部604を含み、窓同期化部604は、任意であると考えられるべきであり、また、本発明の枝路1012aの窓検出部603によって提供される窓形状情報を、異なる枝路の窓検出部によって提供された窓形状情報と組み合わせることができる。したがって、同期化窓形状情報604aが窓同期化部604によって任意に提供され得る。信号経路1012aはまた、窓形状情報603aまたは同期化窓形状情報604aを受信し、これに基づいて、適合化窓形状情報605aを提供するように構成された完全復元実行部605も備える。例えば、完全復元実行部605は、入力信号の前の部分に対応付けられた窓の右側移行スロープ(窓スロープとしても示される)が、入力信号の連続する部分に対応付けられた窓の窓スロープのミラーリングされたバージョンとなることを確実にすることができる。例えば、入力信号の連続する部分に対応付けられた窓の窓スロープが同一の窓形状パラメータで定義されることを確実にすることができる。信号経路1012aはまた、窓関数処理部1014に信号処理窓値w(n)を提供するように構成された窓計算部606も備える。窓関数処理部1014は、入力信号s(n)のサンプルに対応する信号処理窓値w(n)を乗じて、窓関数処理された信号値s´(n)を得るように構成され、窓関数処理された信号値s´(n)は、修正離散コサイン変換部607に入力されて、MDCT係数S(k)が得られる。
ここで、窓計算部606は、窓提供部130または窓提供部180の機能を果たすことができ、したがって、信号処理窓値w(n)は信号処理窓値w(n)または信号処理窓値w(t)と等価であるという点に留意されたい。また、窓関数処理部1014は、窓関数処理部120の機能を果たすことができる。
したがって、符号化器1010は、適合化窓形状パラメータ605aに応じて、入力信号s(n)の窓関数処理のための複数の異なる窓を適用するように構成され、窓計算部606は信号処理窓値を提供する。
符号化器1010は、MDCT変換部607によって提供されたスペクトル値S(k)〜S(k)を効率的に符号化するための更なる符号化ステージを任意に備え得る。
信号復号器1020は、復号されたスペクトル値Q(k)〜Q(k)を受信するように構成されている。復号されたスペクトル値Q(k)〜Q(k)は、スペクトル値S(k)〜S(k)を符号化することにより符号化器1010によって提供され得るビットストリームから抽出され得る。換言すれば、スペクトル係数Q(k)〜Q(k)は、量子化誤差の場合を除いて、スペクトル値S(k)〜S(k)と同一であってもよい。ここで、kは周波数インデックスであり、M≧1はチャネル数を示す(ここで、1チャンネル当たり1つの枝路が設けられている)。
復号器1020はまた、窓長値N〜N(これらは上述のように変数Nの関数をとる)および1つ以上の窓形状パラメータa〜a(例えば、1つの枝路またはチャネル当たり1つ)を受信するようにも構成されている。復号器1020は、スペクトル係数Q(k)〜Q(k)を受信し、これに基づいて、逆変換された信号q(n)〜q(n)を得るように構成された逆修正離散コサイン変換部608を備える。復号器1020はまた、窓選択部609も含み、窓選択部609は、完全復元実行部605と組み合わされて動作して、入力窓形状パラメータa〜aから適合された窓形状パラメータ605aを導出する(ここで、入力窓形状パラメータa〜aは、メディアコンテンツを表すビットストリームから抽出または導出され得る)。例えば、入力窓形状パラメータa〜aおよびスペクトル値Q(k)〜Q(k)は、いずれも、符号化されたメディア信号で表現され得る。
復号器1020は、適合された窓形状パラメータ605a(あるいは、入力窓形状パラメータa〜a)を受信し、これに基づいて、信号処理窓値w(n)〜w(n)を提供する窓計算部606を更に備える。窓計算部606は、窓提供部130または窓提供部180の機能を果たすことができ、適合された窓形状パラメータ605aは、1つ以上の窓形状パラメータ132または1つ以上の窓形状パラメータ182に対応していてもよい。同様に、信号処理窓値w(n)〜w(n)は、信号処理窓値w(n)または信号処理窓値w(t)と等価であってもよい。
したがって、窓計算部606は、適合された窓形状パラメータ605aまたは入力窓形状パラメータa〜aに応じて異なる形状の窓を提供することができる。
復号器1020の窓計算部606によって提供される信号処理窓値w(n)〜w(n)を逆修正離散コサイン変換部608によって提供される逆変換された信号q(n)〜q(n)に例えば乗法演算1024により適用して、値q(n)〜q(n)の窓関数処理されたバージョンq´(n)〜q´(n)を得ることができる。
復号器1020は、逆変換された信号q(n)〜q(n)の連続する窓部分q´(n)〜q´(n)を受信し、当該連続する部分を重複加算して、復元された信号y(n)〜y(n)を得るように構成された重複加算部610を更に備える。重複加算部610は、重複加算部610によって重複された窓関数処理された信号部分q´(n)〜q´(n)が「相補」窓を用いて窓関数処理されるように、窓関数処理部1024と連動させるのが好ましく、したがって、第1の窓の右側窓スロープは、次の窓の左側の窓関数処理されたスロープと重複し、重複する窓スロープは、上述のエネルギー保存特性および/または完全復元特性を含む。
したがって、符号化器1010および復号器1020は、例えば、オーディオ信号、音声信号、ビデオ信号、画像信号等のメディア信号を符号化および復号することができる。
結論として、上記本発明による実施形態は、各種システムおよび信号のアナログまたはデジタル格納または伝送のために、ソフトウェアおよびハードウェアチップの両方ならびにデジタル信号処理器(DSP)において実施可能である。
要約すると、図10は、本提案の窓関数処理技術が信号適合型のAACに似たオーディオコーデックまたは異なるタイプの信号符号化器または信号復号器においてどのように使用されるかを示している。c´(n)を形成するための窓コア関数601は、利用可能なパラメータ設定の定義とともにメモリに格納される。これらのデータは、符号化器と復号器とによって共用される。図10a)において参照符号1010で示す符号化器は、各フレームについてM個の入力チャネルをセグメント化し、M個のセグメントs(n)のそれぞれについて、スペクトル−時間心理音響モデル602からのデータが窓検出部および選択部603において分析されて、適した窓形状、また、該当する場合には、長さおよび数が決定される。周波数選択性(エネルギー圧縮)または低フレーム重複(TNSまたはサブバンド(SB)利得補償を用いたときのエイリアシング低減)といった評価基準に基づいて、適切な窓が選択される。
換言すれば、符号化器1010(または他の信号処理器)は、信号処理器の客観的性能または主観的性能が最適化または改良されるように、窓形状パラメータaのうち1つ以上を信号適合的に決定、変更、または調整するように構成され得る。したがって、1つ以上の窓形状パラメータは、信号処理器(例えば、オーディオ符号化器1010)の客観的(即ち、数値的)または主観的(即ち、知覚的)性能が最適化または改良されるように、入力信号適合的に決定されるるか、変化され得るか、あるいは調整され得る。
同期化部604によるチャネルの窓形状パラメータの任意のマッチングの後、現在のフレームおよび前のフレームの重複する各半分の窓についてパラメータを調整することによって、選択された窓関数を使用して実行される変換の完全復元(PR)がPR実行部605において確実に行われる。修正された窓形状パラメータに基づいて、式(8)および式(9)を用いて、実際の窓係数を計算606し、それぞれのオーディセグメントを乗算して、窓関数処理されたセグメントs´(n)を形成し、窓関数処理されたセグメントs´(n)は、後の量子化、コーディング、および送信のために、MDCT607によって周波数領域に最終的に変換される。図10b)において参照符号1020で示す復号器において、各フレームおよびチャネルについての受信された窓形状パラメータは、復号され、窓選択部609に転送され、窓選択部609は、逆量子化されたスペクトルQ(k)の逆MDCT608の後での使用のために、これらを対応する窓構成にマッピングする。窓シーケンスのPRを実行し、符号化器と同様に窓係数を計算した後、逆MDCTから得られた出力セグメントq(n)は窓関数処理され、重複加算部610によって、個々のチャネル波形y(n)が復元される。
10. 代替的な窓計算
10.1.代替的な窓クラスの窓関数の計算についての概要
以下に、信号処理窓値を提供するために、窓提供部によって(例えば、窓提供部180または窓提供部300または窓計算部606によって)使用可能な窓関数の代替クラスについて説明する。
すなわち、以下に、上記各のいくつかの実質的な変形に基づいた、窓の代替クラスの定義に関する詳細を示す。
上述のセクションのうちの1つにおいて、a=2を用いた式(12)、すなわち、w(t)は、K=1、b=0.5、b=0.5を用いた式(15)と等価であることを指摘した。さらに、K=2を用いたw(t)および(15)と、(16)のbとの等価性が確立された。どのbが、w(t)、w(t)、またはより一般には、奇数aを有するw(t)を与えるのかについての検討を行った。式(12)および式(15)を観察すると、奇数べき乗正弦窓に等価である余弦和窓を構築することは不可能であることが分かった。しかしながら、奇数aのw(t)が必要とされるいくつかの用途においては、ハミング、ブラックマン、およびナットールによって行われたスペクトルリーク最適化を可能とするために、式(15)と類似した式を使用することが望ましい場合がある。
幸い、以下の正弦和関数
Figure 0005809645
により、最適化のための必要な手段が提供されることが分かった。信号処理窓値w(t)は、正弦型整形関数sin((2k+1)π・t/L)の加重和を形成することによって得ることができることが理解される。0〜L/2の値tについて信号窓スロープを得ることができる。
基本周波数の奇数倍である正弦関数が合計されるのが好ましいという点にも留意されたい。例えば、規格化された角周波数は、(2k+1)π/Lとして定義され得る。より高い規格化された周波数は、規格化された基本周波数π/Lの奇数倍であることが理解される。
整形関数は、周波数インデックスk(ゼロ〜最大周波数インデックス値Kのkの場合)の増加とともに正の重みと負の重み(−1)とで交互に重み付けされるという点にも留意されたい。
定数cを適切に選択することにより、2つの特徴を達成することができる。
第1に、(2)の奇数べき乗正弦窓に対応する窓を構築することができる。ここで、3つの最低次の奇数aのw(t)についてのcを規定する。代表的な正弦窓w(t)は、(19)を用いてK=0およびc=1に設定することによって簡単に構築される。w(t)の場合、Kを、K=1に増加させ、そして、以下のようにする。
Figure 0005809645
K=2および以下を用いて、五次のw(t)が最終的に得られる。
Figure 0005809645
第2に、(15)のbと同様に、cは、ブラックマン窓、ハミング窓、およびナットール窓と類似のスペクトル挙動が達成されるように決定することができる。しかし、K=1およびK=2についてのそれぞれのcを導出する前に、窓のスペクトル応答のどの側面を最適化すべきかを正確に評価することが重要である。この目的で、窓のスペクトル性能の客観的測定が必要である。次のセクションでは、いくつかの一般的な測定により、これまでに述べた全ての窓関数の解析を行う。
10.2.評価および最適化
以下に、参考文献[2]に記載される性能指数のうちのいくつかを用いて、この窓クラスの二項または三項変形の性能を評価し、他の窓との比較を行う。この結果に動機付けられ、明確に最適化された実現について説明する。
以下に、窓形状パラメータcの異なる集合について述べる。式(19)による信号処理窓値を組み合わせることにより、異なる特性を有する多種多様な異なる窓を生成することが可能となることが示される。したがって、式(19)による信号処理窓w(t)を提供するように構成された窓提供部は、非常に自由に設定が可能であり、計算の複雑性を非常に低くすることができると要約することができる。なぜなら、整形関数sin((2k+1)π・t/L)は予め計算が可能であると同時に加重合計によって計算の複雑性が比較的小さくなるからである。
時間信号の別の信号による乗算は、これら2つの信号の周波数変換の畳み込みに対応することは十分に確立されている。よって、重み関数を信号に適用することにより、この信号のスペクトルは、加重のスペクトルで畳み込まれる。したがって、窓関数の効果を評価するためには、そのスペクトルを例えばフーリエ変換を用いて調べればよい。
図11および図12は、参考文献[4]と同様に周波数および振幅において規格化された、上記の窓のパワースペクトルの強度を示す。循環するスペクトルゼロ値により、全ての窓が、ゼロ周波数におけるメインローブと、周波数の増加とともに振幅が減衰するサイドローブとを示している。サイドローブの減衰レートは、窓関数の端部およびその微分の端部における不連続性によるものであり、低次の導関数が連続的であればあるほど、より大きいfについて窓が減衰してゼロになるのが早くなる。参考文献[2]および[4]も参照されたい。
図11のべき乗正弦関数w(t)の場合、dB/オクターブ単位での漸近的な減衰は、a(例えば、参考文献[6]を参照)に比例するということができる。すなわち、以下のとおりである。
Figure 0005809645
これは、整数だけでなく、全ての非負の実数aについて成立すると考えられる。図12の最適化された窓の場合、異なるサイドローブ挙動が観察される。メインローブ幅がw(t)=wHann(t)に等しいハミング窓は、重み関数が連続的でないため、わずか−6dB/オクターブで減衰する。同様に、w(t)と同じメインローブ幅を有するブラックマン窓およびナットール窓は、わずか−18dB/オクターブの減衰を示し、その加重の一次導関数は連続的であるが、三次導関数は連続的ではない。しかしながら、これらの窓は、相当するw(t)よりも低い最大サイドローブレベルを示している。このことは、いくつかの用途においてはスペクトルバイアスを顕著に低下させることにつながることがあり、最適化された窓が開発された理由である。
図12の余弦和窓に用いられる最適化手順は(19)の正弦和関数にも適用することができることが分かっているため、(20)を用いた二項窓および(21)を用いた三項窓を最も低い最大サイドローブレベルについて修正することができる(c=1を用いた一項正弦窓はこのように最適化することはできない)。正弦曲線を使用しているがために、(15)のあらゆる実現は、そのエンドポイントにおいてゼロ振幅に近づき、したがって、−12dB/オクターブ(1/f、参考文献[2]を参照)のサイドローブ減衰レートが保証されることが分かっている。導関数が不連続であることが許容される場合、ピークサイドローブ強度(例えば、参考文献[4]を参照)を最小限とするために使用することが可能なcを決定するために更なる自由度が実現される。
二項正弦和窓(K=1)の場合、不連続の一次導関数を許容することにより、c0およびc1の選択における自由度が1度増加する。以下により、
Figure 0005809645
可能な限り低いサイドローブ最大値である−54.3dBが得られることが分かる(第1および第3のサイドローブ)。三項窓(K=2)により、ckの選択においての自由度が2度増加する。以下を用いて、最小ピークサイドローブレベルである−82.8dBに到達させる。
Figure 0005809645
図13は、窓(23)および(24)のパワースペクトルを示す。提案される10個の窓全てについての最大サイドローブレベル、漸近的減衰、メインローブ幅(最初のゼロの位置によって与えられる)、および6dB帯域幅(窓の分解能の尺度、参考文献[2]を参照)を表1に示す。全般的なスペクトル性能に関して、窓(23)が二項ハミング窓と三項ナットール窓とのちょうど中間に位置している様子に注目されたい。さらに、窓(23)は、ブラックマン窓と類似したサイドローブピークを達成しながら、より狭いメインローブを有している。窓(24)は、本検討における全ての窓のうち最も低いサイドローブ最大値を有しているが、w(t)と同様に、最も幅が広いメインローブも示している。
Figure 0005809645
結論として、式(19)に従って信号処理窓値を計算することにより、根本的な計算規則を変更することなく、パラメータcのみを変更することによって、非常に異なる特性の窓を得ることが可能となる。これにより、計算労力および実施のための労力が低減される。また、いくつかの実施形態では、異なるパラメータ集合(20)、(21)、(23)または(24)のうち1つ以上を使用してもよい。実際の実施に応じて、信号処理窓値は、計算され、ルックアップテーブルに格納されてもよく、あるいは、オンラインで計算されてもよい(必要とされる場合)。
10.3.正弦和窓および離散フーリエ変換(DFT)またはMDCT
以下に、離散フーリエ変換において使用された場合の本提案の窓クラスの興味深い特徴について説明する。
注意深い読者は、正弦和のスペクトルと余弦和窓のスペクトルとの間のゼロの位置の違いに気付かれたことであろう。図面から明らかであるように、後者の窓の場合、ほとんどのゼロまたは全てのゼロがLfの整数の倍数において出現する一方で、正弦和窓の場合、ゼロは整数Lfの中間に位置している。以下に、この特徴について、DFTを用いて窓関数処理された高調波信号のスペクトルの分析に関して明らかにする。
先に述べた通り、w(t)によって重み付けされた信号区間s(t)のフーリエ変換(FT)は、s(t)の個々のFTとw(t)との畳み込みと等価である。正弦窓w(t)のFTおよびハン窓w(t)は、それぞれ、以下によって与えられる。
Figure 0005809645
および
Figure 0005809645
(例えば、参考文献[3]を参照)。よって、f=n+0.5、|n|≧1の場合、W(f)=0となり、f=n、|n|≧2の場合、W(f)=0となる(nは整数)。表1のより高次でありかつ最適化された窓のFTは(25)および(26)と異なっているが、分子におけるそれぞれの三角項(正弦和窓の場合はcos( )、余弦和窓の場合はsin( ))は全てに共通である。DFTの関連においては、余弦和窓による最大スペクトルリークは正弦和窓による最小リークに一致し、またその逆も同様であることが示唆される。256点DFTにおいて適用された本提案の二項窓(23)およびナットールの三項窓(18)の一例を図14に示す。
現代のオーディオまたはビデオコーダにおいては、信号波形をセグメントに分割し、各セグメントをより粗い表現に量子化して、高いデータ圧縮、すなわち、信号の格納または伝送に必要とされる低いビットレートが実現される。エネルギー圧縮によってコーディング利得を実現する(あるいは、換言すれば、所与のビットレートについてコーディングされた信号の知覚品質を高める)ために、量子化の前にセグメントのフィルタバンク変換(例えば、MDCT変換607)を行うことが一般的になっている。ごく最近開発されたシステムでは、隣接するセグメントを重複させることを可能にしながらクリティカルなサンプリングを実現するフィルタバンクである、修正離散コサイン変換(MDCT)の形態で時間−周波数変換が適用されている。
より優れた性能を実現するために、順方向および逆方向のMDCT演算(例えば、MDCT変換607および逆MDCT変換608)は、各セグメントの加重を伴う。符号化器側では、MDCTの前に分析窓(例えば、窓w(n))が適用され、復号器側では、逆MDCTの後に合成窓(例えば、合成窓w(n))が適用される。
あいにく、全ての重み関数がMDCTとの使用に適しているわけではない。同一かつ対称の分析窓関数および合成窓関数を以下のように仮定すると、
Figure 0005809645
システム全体が、量子化誤差または伝送誤差を生じることなく完全な入力復元を達成できるのは以下の場合のみである。
Figure 0005809645
ここで、T=L/2である。これは、[7]において報告された、いわゆるプリンセン−ブラッドリー条件すなわちパワー相補(PC)条件である。一般的なPC窓は、MPEG−2/−4AAC基準(例えば、参考文献[6]および[8]を参照)において利用される正弦窓およびKBD窓であり、前者は、以下によって与えられ、
Figure 0005809645
以下のVorbisコーデック仕様の窓である(例えば、参考文献[9]を参照)。
Figure 0005809645
(28)を満たす正弦和窓を生成するために式(19)を使用することができるか否かを検討するため、(27)が与えられた場合に、wsine(t)は三角形関数の正弦であると考えることができる点に着目する。
Figure 0005809645
Figure 0005809645
同様に、wvorbis(t)は、τ(t)を以下のように置き換えた(32)として記述することができる。
Figure 0005809645
(31)および(33)(または31´)のT=L/4の以下の振幅相補性、
Figure 0005809645
は、これらの関数の代替となる関数を、PC特性を犠牲にすることなく、窓関数の周波数応答を最適化するように設計することが可能であることを示している。実際、(27)を支持する場合、以下の式
Figure 0005809645
は、(19)の正弦和関数の修正を使用した、(34)に合致する(31)の拡張であり、交代符号項は省略され、πの奇数倍の代わりに偶数倍が考慮される。本明細書の著者が行った非公式の実験は、一部のtについてτ(t)<0をもたらすdを用いることによってでもPCが得られるが、全てのtについて非負のτ(t)を用いた実現のみが満足な通過帯域選択性および阻止帯域除去性を同時に実現することができることを示している。
さらに、「評価および最適化」のセクションにおいて、(19)のc係数は、得られる窓の最大サイドローブレベルが最小となるように選択された。類似の手順をここでも用いることができる。しかしながら、(28)のPC制約条件により、特に最初の2つまたは3つのサイドローブに関して、スペクトルの設計可能性はさらに制限されている。一般に、サイドローブ最大値を妥当な量だけ最小化することができる上記のより低い周波数境界Lf>1.5(あるいは、代替的に開始サイドローブ)を規定しなければならない。一例を挙げると、Lf=4.5を用いた非公式の全数探索により、以下の二項パラメータ表現が得られる。
Figure 0005809645
この二項パラメータ表現により、Lfを超える最初の3つのサイドローブがいずれも−66.8dBのレベルを有する窓が生成される。高周波数サイドローブは、上述のセクションにおける最適化された窓(23)および(24)のものと全く同様に、当該値から−12dB/オクターブのレートで減衰する。(27)、(32)、(35)および(36)を用いて構築された重み関数の周波数応答を、wsine(t)およびwvorbis(t)の周波数応答と共に図15に示す。明らかに、正弦窓と比較して、本提案の窓においてサイドローブ除去性の実質的な向上が達成されている。制約条件(28)により、この利点は、メインローブの幅が若干広くなり、最初のサイドローブが高くなるという犠牲を伴う。Vorbis窓と比較すると、メインローブ幅および最初の2つのサイドローブの最大値がVorbis窓とほぼ同一であることが分かる。4.5<Lf<11.5の場合、本提案の窓は、サイドローブ減衰の点でwvorbis(t)よりも優れている。Vorbis窓のスペクトルは−18dB/オクターブで減衰し、その強度は、Lfの整数倍(または、ほぼ、整数倍に近い)でゼロになる点にも留意されたい。よって、そのスペクトル挙動は、余弦和窓のスペクトル挙動に類似している。実際、これは、ハン窓のPC等価物であると考えることができる。同様に、本提案のPC窓は、「評価および最適化」のセクションの最適化された正弦和窓に相当するものであると思われる。オーディオコーディングの関連での性能評価を含む、より徹底的な検討は、今後の研究課題とするところである。
11.代替実施例
いくつかの態様を装置との関連で説明したが、これらの態様は対応する方法の記載も示していることは明らかであり、対応する方法においては、ブロックまたはデバイスは、方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップとの関連で説明した態様もまた、対応するブロックもしくは項目または対応する装置の特徴の記載を示すものである。
例えば、マイクロプロセッサ、プログラム可能なコンピュータ、または電子回路といったハードウェア装置によって(またはこれを用いて)、方法ステップの一部または全てを実行してもよい。いくつかの実施形態では、最も重要な方法ステップのうちの1つ以上をこのような装置によって実行してもよい。
符号化されたオーディオもしくはビデオ信号または窓関数のシーケンスであり得る本発明の符号化されたメディア信号は、デジタル記憶媒体に格納されることができ、あるいは、無線伝送媒体またはインターネットのような有線伝送媒体などの伝送媒体で送信することができる。
特定の実施要件によっては、本発明の実施形態は、ハードウェアまたはソフトウェアにおいて実施されることができる。実施は、電子的に読取可能な制御信号を格納したデジタル記憶媒体、例えば、フロッピーディスク、DVD、ブルーレイディスク、CD、ROM、PROM、EPROM、EEPROMまたはフラッシュメモリを用いて実行することができ、これらは、各方法が実行されるようにプログラム可能なコンピュータシステムと協働する(または協働することができる)。したがって、デジタル記憶媒体は、コンピュータ可読であってもよい。
本発明によるいくつかの実施形態は、本明細書に記載される方法のうちの1つが実行されるように、プログラム可能なコンピュータシステムと協働することができる電子的に読取り可能な制御信号を有するデータキャリアを含む。
一般に、本発明の実施形態はプログラムコードを有するコンピュータプログラム製品として実現することができ、コンピュータプログラム製品がコンピュータで実行されたときに、プログラムコードが方法のうちの1つを実行するために動作する。プログラムコードは、例えば、機械可読キャリアに格納され得る。
他の実施形態は、本明細書に記載される、機械可読キャリアに格納された方法のうちの1つを実行するためのコンピュータプログラムを含む。
したがって、換言すれば、本発明の方法の一実施形態は、コンピュータで実行されたときに、本明細書に記載される方法のうちの1つを実行するためのプログラムコードを有するコンピュータプログラムである。
したがって、本発明の方法のさらなる実施形態は、本明細書に記載される方法のうちの1つを実行するためのコンピュータプログラムが記録されたデータキャリア(すなわちデジタル記憶媒体またはコンピュータ可読媒体)である。データキャリア、デジタル記憶媒体、または記録された媒体は、典型的には、有形および/または非過渡的である。
したがって、本発明の方法のさらなる実施形態は、本明細書に記載される方法のうちの1つを実行するためのコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは、例えばインターネットなどのデータ通信接続を介して転送されるように構成することができる。
さらなる実施形態は、本明細書に記載される方法の1つを実行するように構成されるかあるいは適合された、例えばコンピュータまたはプログラム可能論理デバイスといった処理手段を含む。
さらなる実施形態は、本明細書に記載される方法のうちの1つを実行するためのコンピュータプログラムを搭載したコンピュータを含む。
本発明によるさらなる実施形態は、本明細書で説明された方法のうちの1つを実行するためのコンピュータプログラムを受信機に転送する(例えば、電子的または光学的に)ように構成された装置またはシステムを含む。受信機は、例えば、コンピュータ、携帯機器、メモリデバイス等であってもよい。この装置またはシステムは、例えば、コンピュータプログラムを受信機に転送するためのファイルサーバを備えていてもよい。
いくつかの実施形態において、プログラム可能論理デバイス(例えばフィールドプログラマブルゲートアレイ)を用いて、本明細書に記載される方法の機能のいくつかまたは全てを実行してもよい。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本明細書に記載される方法のうちの1つを実行するために、マイクロプロセッサと協働してもよい。通常、上記方法は、好ましくは、いかなるハードウェア装置によっても実行される。
上述の実施形態は、本発明の原理のための単なる例示にすぎない。本明細書に記載される構成および詳細事項の修正および変更は、他の当業者にとって明らかであるものと理解される。したがって、本発明は、添付の特許クレームの範囲のみによって限定されるものであって、本明細書に記載の実施形態の記載および説明によって示される具体的な詳細事項によって限定されるものではない。
12.結論
上記から、式(6)、(8)および(9)を参照して説明した窓関数の計算により、特に良好な特性を有する窓関数が得られると結論付けることができる。
また、式(19)を参照して説明した窓関数の計算により、特に良好な特性を有する窓関数が得られると結論付けることができる。
上記を要約すると、本発明による実施形態は、一般に、オーディオまたはビデオコーディングシステムにおいて使用され得るような信号の分析および処理方法に関する。本発明によるいくつかの実施形態は、ソースの不変フィルタバンク変換または信号適合型可変フィルタバンク変換による信号エネルギー圧縮を必要とする用途に関する。これらは、エネルギー圧縮性能を向上させつつ、変換の完全な反転を可能にするために利用することができる。したがって、本発明による実施形態は、妥当な計算複雑性を有しながらも良好な設計自由度を実現する代替的な窓関数の必要性に対する解決法をなすものである。
添付の請求項または本明細書において定義される、本発明によるいくつかの実施形態は、MDCT用途のための自由かつ計算効率のよい窓関数アプリケーションが無いという問題に対し、式(4)の正弦窓関数に対する拡張を宣言することによって対処するものである。
ただし、本発明による他の実施形態は、より高い自由度を提供するが、MDCT用途における完全復元を提供しない改良された窓関数を生成する。それでも、このような窓関数は多くの用途において有用である。
本発明の理解を容易にするため、添付の図面を参照しながら本発明を例示によって説明したが、これらは本発明の範囲および精神を限定するものではないことも指摘されるべきである。換言すれば、本明細書に記載される実施形態は、フィルタリングアプリケーションにおける、より自由度の高い窓関数処理および/または改良された信号エネルギー圧縮のための本発明の原理のための単なる例示に過ぎない。本明細書に記載される構成および詳細事項の修正および変更は、他の当業者にとって明らかであるものと理解される。したがって、本発明は、添付の特許クレームの範囲のみによって限定されるものであって、本明細書に記載の実施形態の記載および説明によって開示される具体的な詳細事項によって限定されるものではない。
一般的に、時間加重による離散信号の窓関数処理は、バイアス作用を低減させるための処理におけるスペクトル分析に不可欠なツールである。多くの一般的な重み関数(例えば、ハン、ハミング、ブラックマン)は、スケーリングされた余弦の和に基づいている。
本発明による実施形態は、正弦和を用いて構築され、保証された加重連続性によりゼロ位置および少なくとも−12dB/オクターブのサイドローブ減衰に関して修正された(あるいはさらには特有の)スペクトル挙動を示す窓の代替クラスを示す。最小ピークサイドローブレベルを有する二項実現および三項実現のためのパラメータが提供される。本発明によるいくつかの実施形態は、離散フーリエ変換による正弦和窓の使用、および修正離散コサイン変換(MDCT)といった重複変換へのそれらの採用に関する。
換言すれば、本発明による実施形態は、計算が同様に容易であって、リークの低減に関して類似のまたはさらには特有の性能を有する、従来の窓関数(例えば、ハン、ハミングおよびブラックマン)の代替物を提案するものである。
ごく一般的に、本発明による実施形態は、可変窓関数を使用してオーディオまたはビデオ信号を符号化、復号、または処理するための装置、方法またはコンピュータプログラムを実現する。
本発明によるいくつかの実施形態は、オーディオ信号またはビデオ信号についての異なる窓関数のシーケンスを計算するための装置、方法またはコンピュータプログラムを実現する。
本発明によるさらなる実施形態は、符号化されたオーディオまたはビデオコンテンツと、符号化されたオーディオまたはビデオ信号を得るためにオーディオまたはビデオ信号の符号化に使用される変数窓に関連するパラメトリック窓情報とを含む符号化されたオーディオまたはビデオ信号を実現する。
本発明によるさらなる実施形態は、信号適合的な方向において決定される可変窓関数のシーケンスを実現する。
本発明によるさらなる実施形態は、窓(wnew)が以下に基づいて導出される、上記の装置、方法、コンピュータプログラム、符号化された信号および可変窓関数のシーケンスを実現する:
Figure 0005809645
Figure 0005809645
ここで、c(n)は窓コア関数を示し、窓コア関数は予め定められているため事前に計算が可能である。本提案の拡張は、式(7)におけるc(n)に、2πの整数倍である角周波数を有する加重正弦曲線を以下のように加算することである。
Figure 0005809645
Figure 0005809645
さらに結論として、加重正弦の和を用いて生成されるハミング窓、ブラックマン窓および類似窓の数学的に簡素な代替物を提示した。正弦和を用いた手法は、窓関数の保証された連続性といった特有の性質を与えるとともに、例えばオーディオコーディングのためのパワー相補窓の構築においても適用することができる。
参考文献
[1]R.B.Blackman and J.W.Tukey, The Measurement of Power Spectra from the Point of View of Communications Engineering, New York, NY, USA:Dover Publications, 1958.
[2] F.J.Harris, “On the Use of Windows for Harmonic Analysis with the Discrete Fourier Transform, ” Proc.IEEE, vol.66, no.1, pp.51-83, Jan.1978.
[3] N.C.Geckinli and D.Yavuz, “Some Novel Windows and a Concise Tutorial Comparison of Window Families,” IEEE Trans.Acoustics, Speech, and Signal Processing, vol.ASSP-26, no.6, pp.501-507, Dec.1978.
[4] A.H.Nuttall, “Some Windows with Very Good Sidelobe Behavior, ” IEEE Trans.Acoustics, Speech, and Signal Processing, vol.ASSP-29, no.1, pp.84-91, Feb.1981.
[5] S.W.A.Bergen and A.Antoniou, “Design of Ultraspherical Window Functions with Prescribed Spectral Characteristics, ” EURASIP Journal on Applied Signal Processing, vol.2004, no.13, pp.2053-2065, 2004. Available on-line at http://www.hindawi.com/GetArticle.aspx?doi=10.1155/S1110865704403114.
[6] J.O.Smith III, Spectral Audio Signal Processing, Mar.2009 Draft, Center for Computer Research in Music and Acoustics(CCRMA), Stanford University, CA, USA.Available on-line at http://ccrma.stanford.edu/~jos/sasp/(accessed Mar.2010).
[7] J.P.Princen, A.W.Johnson, and A.B.Bradley, “Subband/ Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation, ” Proc.IEEE 1987 ICASSP-12, pp.2161-2164, May 1987.
[8] ISO/IEC 14496-3:2009, “Information technology - Coding of audio-visual objects - Part 3: Audio, ” Geneva, Aug.2009.
[9] Xiph.org Foundation, “Vorbis I specification, ” Feb.2010.Online at http://www.xiph.org/vorbis/doc/Vorbis_I_spec.html.

Claims (34)

  1. 複数の窓値インデックス値(n)についての信号処理窓値(w(n);w(n))を、1つ以上の窓形状パラメータ(310;a)に応じて提供するための窓提供部(300)であって、
    前記窓提供部が、前記窓値インデックス値(n)に対応付けられた複数の引数値について正弦関数を評価して、前記信号処理窓値を得るように構成され、
    前記窓提供部が、前記窓値インデックス値(n)に線形依存する線形項(c(n))と、窓値インデックス値(n)を対応する関数値にマッピングするとともに、窓スロープ(1630)の中心に対して点対称である1つ以上の整形関数の関数値との加重和を計算して、前記引数値を得るように構成されており、
    前記窓提供部(603,604,605,606)は、前記窓提供部が異なる窓形状を有する窓を示す信号処理窓値(n))の複数の異なる集合を前記1つ以上の窓形状パラメータに応じて提供するように構成されるように、前記加重和を前記1つ以上の窓形状パラメータに応じて計算するよう構成されている、窓提供部(300)。
  2. 入力信号の処理されたバージョン(112;s’(n);Q’(n))を該入力信号(110;s(n);q(n))に応じて提供するための信号処理器(100;1010;1020)であって、
    前記入力信号の前記処理されたバージョンを得るために、前記入力信号またはその前処理されたバージョンの一部を、複数の窓値インデックス値(n)についての信号処理窓値(w(n);w(n))によって示される信号処理窓(1600)に応じて窓関数処理するように構成された窓関数処理部(120;1014;1024)と、
    請求項1による窓提供部とを備える信号処理器(100;1010;1020)。
  3. 前記1つ以上の整形関数は、正弦型整形関数である、請求項2に記載の信号処理器。
  4. 前記窓提供部は、
    前記窓値インデックス値nに対応付けられた複数の引数値π/2・c’(n)について正弦関数w(n)=sin(π/2・c’(n))を評価して、前記信号処理窓値w(n)を得るように構成され、
    前記窓提供部は、
    前記窓値インデックス値nに線形依存する線形項c(n)と、窓値インデックス値(n)を対応する関数値にマッピングするとともに、窓スロープ(1630)の中心に対して点対称である1つ以上の整形関数sin(2π・f・c(n))の関数値との下記の式によって表わされる加重和を計算して、前記引数値π/2・c’(n)を得るように構成されている、請求項2または3に記載の信号処理器。
    Figure 0005809645
  5. 前記窓提供部は、c(n)が窓スロープ(1630)について0〜1の値をとるようにc(n)を得るように構成されている、請求項4に記載の信号処理器。
  6. 前記窓提供部は、c(n)を以下の式に従って得るように構成されている、請求項4または5に記載の信号処理器。
    Figure 0005809645
    ここで、nは、窓スロープ(1630)について0〜N/2−1の範囲にある。
  7. 前記窓提供部は、0〜N/2−1であるnについてc’(n)≧0となるようにc’(n)を得るよう構成されている、請求項4から6の一項に記載の信号処理器。
  8. 前記窓提供部は、定常のあるいは定常的に微分可能な整形関数を評価するように構成されている、請求項2から7の一項に記載の信号処理器。
  9. 前記1つ以上の整形関数(sin(2π・f・c(n)))は、前記窓スロープ(1630)の最も左の窓値インデックス値(n=0)から該窓スロープの長さの5パーセント以下の近傍内にゼロ値を含み、前記1つ以上の整形関数(sin(2π・f・c(n)))は、窓スロープの最も右の窓値インデックス値(n=N/2−1)から該窓スロープの長さの5パーセント以下の近傍内にゼロ値を含むか、あるいは
    前記1つ以上の整形関数は、前記窓スロープの最も左の窓値インデックス値(n=0)についての前記整形関数の最大値の5パーセント以下である値を含み、前記1つ以上の整形関数は、前記窓スロープの最も右の窓値インデックス値(n=N/2−1)についての最大値の5パーセント以下である値を含む、請求項2から8の一項に記載の信号処理器。
  10. 前記信号処理器はメディア信号符号化器(1010)であり、
    前記窓関数処理部(1014)は、メディア信号(s(n))またはその前処理されたバージョンの一部を、前記信号処理窓(1600)に応じて窓関数処理して、前記メディア信号の窓関数処理された部分(s’(n))を得るように構成され、
    前記信号処理器(1010)は、前記メディア信号の窓関数処理された部分(s’(n))を周波数領域に変換するように構成されている、請求項2から9の一項に記載の信号処理器。
  11. 前記メディア信号符号化器(1010)は、1つ以上の窓形状パラメータ(a)を前記メディア信号(s(n))の特性に応じて決定するように構成され、
    前記窓提供部(603,604,605,606)は、前記窓提供部が異なる窓形状を有する窓を示す信号処理窓値(n))の複数の異なる集合を前記1つ以上の窓形状パラメータに応じて提供するように構成されるように、前記加重和を前記1つ以上の窓形状パラメータに応じて計算するよう構成されている、請求項10に記載の信号処理器。
  12. 前記メディア信号符号化器(1010)は、前記メディア信号の第1の所与の部分に対応付けられた窓の右側窓スロープ(1640)の1つ以上の窓形状パラメータ(a)、および前記メディア信号の前記第1の所与の部分に続く、前記メディア信号の第2の所与の部分に対応付けられた窓の左側窓スロープ(1630)の1つ以上の窓形状パラメータを適合させるように構成されている、請求項10または11に記載の信号処理器。
  13. 前記信号処理器は、メディア信号復号器(1020)であり,
    前記メディア信号復号器は、前記メディア信号の周波数領域表現(Q(k))を時間領域表現(q(n))に変換するように構成され、
    前記窓関数処理部は、前記メディア信号の前記周波数領域表現を前記メディア信号の前記時間領域表現に変換するための変換部に一体化されるか、あるいは前記窓関数処理部は、前記メディア信号の前記周波数領域表現(q(k))を前記メディア信号の前記時間領域表現(q(n))に変換するための変換部(608)によって提供される時間領域表現(q(n))を窓関数処理するように構成されている、請求項2から9の一項に記載の信号処理器。
  14. 前記信号処理器は、前記1つ以上の窓形状パラメータ(a)を前記符号化されたメディア信号を表すビットストリームから抽出するか、あるいは前記1つ以上の窓形状パラメータを前記符号化されたメディア信号を表すビットストリームの1つ以上のビットストリームパラメータから導出するように構成されている、請求項13に記載の信号処理器。
  15. 前記信号処理器は、前記窓関数処理部によって実行される窓関数処理を用いて、高域通過フィルタ演算、低域通過フィルタ演算、帯域通過フィルタ演算、ダウンサンプリング演算、アップサンプリング演算、圧縮演算、伸長演算、制限演算、ノイズ低減演算、信号強化演算、信号作用演算または等化演算を実行するように構成されている、請求項2から9の一項に記載の信号処理器。
  16. 前記窓提供部(130;603,604,605,606;609,606,606)は、前記整形関数のうち少なくとも1つの事前に計算されたバージョンを前記窓形状パラメータ(a)のうち対応する1つに応じてスケーリングして、前記加重和に対する寄与を求めるように構成されている、請求項2から15の一項に記載の信号処理器。
  17. 前記1つ以上の窓形状パラメータ(a)は、前記加重和に対する前記1つ以上の整形関数の寄与を示す数値である、請求項2から16の一項に記載の信号処理器。
  18. 前記窓提供部は、少なくとも前記線形項と、2つの窓形状パラメータ数値(a)に応じて重み付けされた2つの異なる形状関数との加重和を、前記2つ以上の窓形状パラメータ値に応じて少なくとも4つの異なる窓形状を得ることができるように形成するように構成されている、請求項2から17の一項に記載の信号処理器。
  19. 前記信号処理器は、前記信号処理器の客観的性能または主観的性能が最適化または改良されるように、前記窓形状パラメータ(a)のうち1つ以上を入力信号適合的に決定するか、変化させるか、あるいは調整するように構成されている、請求項2から17の一項に記載の信号処理器。
  20. 入力信号(210)の処理されたバージョン(212)を該入力信号(210)に応じて提供するための信号処理器(200)であって、
    前記入力信号の前記処理されたバージョンを得るために、前記入力信号またはその前処理されたバージョンの一部を、複数の窓値インデックス値(n)についての信号処理窓値(w(n);w(n))によって示される信号処理窓に応じて窓関数処理するように構成された窓関数処理部(220)を備え、
    前記信号処理窓値が、窓値インデックス値(n)に対応付けられた複数の引数値(π/2・c’(n))についての正弦関数評価の結果値であり、
    前記引数値(π/2・c’(n))が、前記窓値インデックス値(n)に線形依存する線形項(c(n))と、窓値インデックス値(n)を対応する関数値にマッピングするとともに、窓スロープ(1630)の中心に対して点対称である1つ以上の正弦型整形関数(sin(2π・f・c(n)))の関数値との加重和であり、
    前記信号処理窓値によって示される前記信号処理窓の特性が1つ以上の窓形状パラメータに応じて調整可能であり、
    前記加重和が、前記1つ以上の窓形状パラメータに依存している、信号処理器(200)。
  21. 前記引数値は、下記の式を用いたπ/2・c’(n)であると定義される、請求項20に記載の信号処理器。
    Figure 0005809645
    ここで、
    c(n)=(n+1/2)・2/N,
    nは、c(n)が窓スロープ(1630)について0〜1の値をとるように選択され、
    fは、1つ以上の整数値をとる。
  22. fは、値1および2をとる、請求項21に記載の信号処理器。
  23. =0.1224(許容誤差+/−1%)かつ
    =0.00523(許容誤差+/−1%)
    である、請求項21または22に記載の信号処理器。
  24. fは、値1のみをとり、
    =0.1591(許容誤差+/−1%)かつ
    =0
    である、請求項21に記載の信号処理器。
  25. 符号化されたメディア信号(400)の処理方法をコンピュータに実行させるためのプログラムであって、
    前記符号化されたメディア信号(400)は、
    メディアコンテンツの符号化された表現(Q(k),Q(k))と、
    1つ以上の窓形状パラメータ(a)または窓形状パラメータを導出することが可能な1つ以上のビットストリームパラメータとを含み、
    前記1つ以上の窓形状パラメータが、前記メディアコンテンツの前記符号化された表現の復号に適用される窓の形状を定義し、
    前記1つ以上の窓形状パラメータが、窓値インデックス値(n)に線形依存する線形項(c(n))と、1つ以上の整形関数の関数値との加重和を計算して、複数の窓値インデックス値(n)についての窓値を導出するための引数値を複数の前記引数値について正弦関数を評価することによって得るための重みを示
    前記処理方法をコンピュータに実行させるためのプログラムは、
    窓提供部が、信号処理窓値を生成するために前記窓形状パラメータを使用するステップと、
    前記メディアコンテンツの符号化された表現(Q (k),Q (k))が、前記窓形状パラメータによって示される窓に応じた窓関数処理を使用して復号されるステップとをコンピュータに実行させる、コンピュータに実行させるためのプログラム。
  26. 複数の窓値インデックス値についての信号処理窓値を、1つ以上の窓形状パラメータに応じて提供するための方法であって、
    前記窓値インデックス値に対応付けられた複数の引数値について正弦関数を評価して、前記信号処理窓値を得るステップと、
    前記窓値インデックス値に線形依存する線形項と、窓値インデックス値を対応する関数値にマッピングするとともに、前記信号処理窓の窓スロープの中心に対して点対称である1つ以上の整形関数の関数値との加重和を計算して、前記引数値を得るステップとを含み、
    異なる窓形状を有する窓を示す信号処理窓値(n))の複数の異なる集合を前記1つ以上の窓形状パラメータに応じて提供するように、前記加重和を前記1つ以上の窓形状パラメータに応じて計算する、方法。
  27. 入力信号の処理されたバージョンを該入力信号に応じて提供するための方法であって、
    前記入力信号の前記処理されたバージョンを得るために、前記入力信号またはその前処理されたバージョンの一部を、複数の窓値インデックス値についての信号処理窓値によって示される信号処理窓に応じて窓関数処理するステップと、
    請求項26によって、複数の窓値インデックス値についての前記信号処理窓値を、1つ以上の窓形状パラメータに応じて提供するステップとを含む方法。
  28. 入力信号の処理されたバージョンを該入力信号に応じて提供するための方法であって、
    前記入力信号の前記処理されたバージョンを得るために、前記入力信号またはその前処理されたバージョンの一部を、複数の窓値インデックス値についての信号処理窓値によって示される信号処理窓に応じて窓関数処理するステップを含み、
    前記信号処理窓値が、窓値インデックス値に対応付けられた複数の引数値についての正弦関数評価の結果値であり、前記引数値が、前記窓値インデックス値に線形依存する線形項と、窓値インデックス値を対応する関数値にマッピングするとともに、前記信号処理窓の窓スロープの中心に対して点対称である1つ以上の正弦型整形関数の関数値との加重和であり、
    前記信号処理窓値によって示される前記信号処理窓の特性が1つ以上の窓形状パラメータに応じて調整可能であり、
    前記加重和が前記1つ以上の窓形状パラメータに依存している、方法。
  29. 複数の窓値インデックス値(n)についての信号処理窓値(w(n);w(n))を、1つ以上の窓形状パラメータ(310;a)に応じて提供するための窓提供部(300)であって、
    前記窓提供部が、前記窓値インデックス値(n)に対応付けられた複数の引数値について正弦関数を評価して、前記信号処理窓値を得るように構成され、
    前記窓提供部が、前記窓値インデックス値(n)に線形依存する線形項(c(n))と、窓値インデックス値(n)を対応する関数値にマッピングするとともに、窓スロープ(1630)の中心に対して点対称である1よりも多い数の整形関数の関数値との加重和を計算して、前記引数値を得るように構成されている、窓提供部(300)。
  30. 入力信号(210)の処理されたバージョン(212)を該入力信号(210)に応じて提供するための信号処理器(200)であって、
    前記入力信号の前記処理されたバージョンを得るために、前記入力信号またはその前処理されたバージョンの一部を、複数の窓値インデックス値(n)についての信号処理窓値(w(n);w(n))によって示される信号処理窓に応じて窓関数処理するように構成された窓関数処理部(220)を備え、
    前記信号処理窓値が、窓値インデックス値(n)に対応付けられた複数の引数値(π/2・c’(n))についての正弦関数評価の結果値であり、
    前記引数値(π/2・c’(n))が、前記窓値インデックス値(n)に線形依存する線形項(c(n))と、窓値インデックス値(n)を対応する関数値にマッピングするとともに、窓スロープ(1630)の中心に対して点対称である1よりも多い数の正弦型整形関数(sin(2π・f・c(n)))の関数値との加重和である、信号処理器(200)。
  31. 複数の窓値インデックス値についての信号処理窓値を、1つ以上の窓形状パラメータに応じて提供するための方法であって、
    前記窓値インデックス値に対応付けられた複数の引数値について正弦関数を評価して、前記信号処理窓値を得るステップと、
    前記窓値インデックス値に線形依存する線形項と、窓値インデックス値を対応する関数値にマッピングするとともに、前記信号処理窓の窓スロープの中心に対して点対称である1よりも多い数の整形関数の関数値との加重和を計算して、前記引数値を得るステップとを含む、方法。
  32. 入力信号の処理されたバージョンを該入力信号に応じて提供するための方法であって、
    前記入力信号の前記処理されたバージョンを得るために、前記入力信号またはその前処理されたバージョンの一部を、複数の窓値インデックス値についての信号処理窓値によって示される信号処理窓に応じて窓関数処理するステップを含み、
    前記信号処理窓値が、窓値インデックス値に対応付けられた複数の引数値についての正弦関数評価の結果値であり、前記引数値が、前記窓値インデックス値に線形依存する線形項と、窓値インデックス値を対応する関数値にマッピングするとともに、前記信号処理窓の窓スロープの中心に対して点対称である1よりも多い数の正弦型整形関数の関数値との加重和である、方法。
  33. コンピュータ上で実行されたときに、請求項26,31の一項に記載の方法を実行するためのコンピュータプログラム。
  34. コンピュータ上で実行されたときに、請求項27,28,32の一項に記載の方法を実行するためのコンピュータプログラム。
JP2012556496A 2010-03-11 2011-03-08 信号処理器、窓提供部、符号化されたメディア信号、信号を処理するための方法および窓を提供するための方法 Active JP5809645B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US31277510P 2010-03-11 2010-03-11
US61/312,775 2010-03-11
EP10175141.0 2010-09-02
EP10175141A EP2372703A1 (en) 2010-03-11 2010-09-02 Signal processor, window provider, encoded media signal, method for processing a signal and method for providing a window
PCT/EP2011/053491 WO2011110572A1 (en) 2010-03-11 2011-03-08 Signal processor, window provider, encoded media signal, method for processing a signal and method for providing a window

Publications (2)

Publication Number Publication Date
JP2013531264A JP2013531264A (ja) 2013-08-01
JP5809645B2 true JP5809645B2 (ja) 2015-11-11

Family

ID=43827399

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2012556496A Active JP5809645B2 (ja) 2010-03-11 2011-03-08 信号処理器、窓提供部、符号化されたメディア信号、信号を処理するための方法および窓を提供するための方法
JP2012556493A Active JP5706917B2 (ja) 2010-03-11 2011-03-08 信号処理器、入力信号の処理されたバージョンを入力信号に応じて提供するための方法及びプログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2012556493A Active JP5706917B2 (ja) 2010-03-11 2011-03-08 信号処理器、入力信号の処理されたバージョンを入力信号に応じて提供するための方法及びプログラム

Country Status (14)

Country Link
US (2) US8907822B2 (ja)
EP (5) EP2372704A1 (ja)
JP (2) JP5809645B2 (ja)
KR (2) KR101445290B1 (ja)
CN (2) CN102893329B (ja)
AU (2) AU2011226118B2 (ja)
BR (2) BR112012022899A2 (ja)
CA (2) CA2792453C (ja)
ES (3) ES2691479T3 (ja)
HK (2) HK1231625A1 (ja)
MX (2) MX2012010440A (ja)
PL (1) PL2545549T3 (ja)
RU (2) RU2616863C2 (ja)
WO (2) WO2011110569A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8538042B2 (en) * 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
US9305031B2 (en) * 2013-04-17 2016-04-05 International Business Machines Corporation Exiting windowing early for stream computing
US8908796B1 (en) * 2013-05-15 2014-12-09 University Of South Florida Orthogonal frequency division multiplexing (OFDM) transmitter and receiver windowing for adjacent channel interference (ACI) suppression and rejection
CN105556601B (zh) * 2013-08-23 2019-10-11 弗劳恩霍夫应用研究促进协会 用于使用交叠范围中的组合来处理音频信号的装置及方法
US9479272B2 (en) 2014-05-14 2016-10-25 Samsung Electronics Co., Ltd Method and apparatus for processing a transmission signal in communication system
EP3209214B1 (en) * 2014-10-20 2019-06-05 Koninklijke Philips N.V. Cardiac reconstruction for photon counting ct for heart and lung images
TWI681384B (zh) * 2018-08-01 2020-01-01 瑞昱半導體股份有限公司 音訊處理方法與音訊等化器
CN110889083B (zh) * 2018-09-10 2020-12-22 湖南银杏可靠性技术研究所有限公司 基于窗谱估计的退化数据一致性检验法
JP7422905B1 (ja) 2022-08-02 2024-01-26 三菱電機株式会社 信号処理装置および信号処理方法

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5109417A (en) 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5142656A (en) 1989-01-27 1992-08-25 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
JP3465941B2 (ja) * 1993-01-07 2003-11-10 三菱電機株式会社 ピッチ抽出装置
US6487574B1 (en) * 1999-02-26 2002-11-26 Microsoft Corp. System and method for producing modulated complex lapped transforms
US6496795B1 (en) * 1999-05-05 2002-12-17 Microsoft Corporation Modulated complex lapped transform for integrated signal enhancement and coding
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
CN1408146A (zh) * 2000-11-03 2003-04-02 皇家菲利浦电子有限公司 音频信号的参数编码
US7313519B2 (en) * 2001-05-10 2007-12-25 Dolby Laboratories Licensing Corporation Transient performance of low bit rate audio coding systems by reducing pre-noise
FR2824978B1 (fr) 2001-05-15 2003-09-19 Wavecom Sa Dispositif et procede de traitement d'un signal audio
US6963842B2 (en) * 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
EP1394772A1 (en) * 2002-08-28 2004-03-03 Deutsche Thomson-Brandt Gmbh Signaling of window switchings in a MPEG layer 3 audio data stream
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
US20040162866A1 (en) * 2003-02-19 2004-08-19 Malvar Henrique S. System and method for producing fast modulated complex lapped transforms
JP2004361731A (ja) 2003-06-05 2004-12-24 Nec Corp オーディオ復号装置及びオーディオ復号方法
JP3849679B2 (ja) * 2003-09-25 2006-11-22 ヤマハ株式会社 雑音除去方法、雑音除去装置およびプログラム
CN100573666C (zh) * 2003-11-26 2009-12-23 联发科技股份有限公司 子带分析/合成滤波方法
US6980933B2 (en) * 2004-01-27 2005-12-27 Dolby Laboratories Licensing Corporation Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients
US7088276B1 (en) * 2004-02-13 2006-08-08 Samplify Systems Llc Enhanced data converters using compression and decompression
US7587313B2 (en) 2004-03-17 2009-09-08 Koninklijke Philips Electronics N.V. Audio coding
WO2005096273A1 (fr) * 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Ameliorations apportees a un procede et un dispositif de codage/decodage audio
WO2005096274A1 (fr) * 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Dispositif et procede de codage/decodage audio ameliores
JP2006243664A (ja) * 2005-03-07 2006-09-14 Nippon Telegr & Teleph Corp <Ntt> 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体
US7720677B2 (en) 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
RU2315424C1 (ru) * 2006-06-06 2008-01-20 Виктор Васильевич Бондаренко Система связи с высокой скоростью передачи информации сверхширокополосными сигналами
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
US8036903B2 (en) * 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
EP1918911A1 (en) * 2006-11-02 2008-05-07 RWTH Aachen University Time scale modification of an audio signal
US7522074B2 (en) * 2007-09-17 2009-04-21 Samplify Systems, Inc. Enhanced control for compression and decompression of sampled signals
WO2009049896A1 (en) * 2007-10-17 2009-04-23 Fraunhofer-Fesellschaft Zur Förderung Der Angewandten Forschung E.V. Audio coding using upmix
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
JP4918074B2 (ja) * 2008-08-18 2012-04-18 日本電信電話株式会社 符号化装置、符号化方法、符号化プログラム、及び記録媒体

Also Published As

Publication number Publication date
MX2012010320A (es) 2012-11-23
KR101445290B1 (ko) 2014-09-29
CA2792453A1 (en) 2011-09-15
CA2792454A1 (en) 2011-09-15
BR112012022899A2 (pt) 2018-06-05
JP5706917B2 (ja) 2015-04-22
WO2011110569A1 (en) 2011-09-15
EP3096317B1 (en) 2018-08-01
RU2611986C2 (ru) 2017-03-01
MX2012010440A (es) 2012-12-05
EP2545550B1 (en) 2016-09-07
EP2545550A1 (en) 2013-01-16
ES2691479T3 (es) 2018-11-27
CN102893329A (zh) 2013-01-23
KR101445292B1 (ko) 2014-09-29
BR112012022898A2 (pt) 2018-09-18
US8907822B2 (en) 2014-12-09
CN102893328A (zh) 2013-01-23
JP2013531264A (ja) 2013-08-01
EP2545549A1 (en) 2013-01-16
CA2792453C (en) 2016-05-31
HK1231625A1 (zh) 2017-12-22
AU2011226118A1 (en) 2012-10-25
WO2011110572A1 (en) 2011-09-15
US20130241750A1 (en) 2013-09-19
EP3096317A1 (en) 2016-11-23
BR112012022898B1 (pt) 2021-02-02
ES2526774T3 (es) 2015-01-15
US9252803B2 (en) 2016-02-02
AU2011226121A1 (en) 2012-10-25
KR20130007601A (ko) 2013-01-18
RU2616863C2 (ru) 2017-04-18
EP2372704A1 (en) 2011-10-05
JP2013522657A (ja) 2013-06-13
EP2545549B1 (en) 2014-10-01
CN102893328B (zh) 2014-12-10
RU2012143351A (ru) 2014-04-20
EP2372703A1 (en) 2011-10-05
CN102893329B (zh) 2015-04-08
PL2545549T3 (pl) 2015-03-31
ES2601847T3 (es) 2017-02-16
KR20130007603A (ko) 2013-01-18
HK1181179A1 (en) 2014-03-07
RU2012143352A (ru) 2014-04-27
US20130246492A1 (en) 2013-09-19
CA2792454C (en) 2018-01-16
AU2011226121B2 (en) 2014-08-28
AU2011226118B2 (en) 2014-08-28

Similar Documents

Publication Publication Date Title
JP5809645B2 (ja) 信号処理器、窓提供部、符号化されたメディア信号、信号を処理するための方法および窓を提供するための方法
JP6175148B2 (ja) マルチオーバーラップ部分を使用して符号化済み信号を生成し又は符号化済みオーディオ信号を復号化するための装置及び方法
TWI581252B (zh) 使用截斷分析或合成窗段重疊部分處理音訊信號的方法及處理器
CN110291583B (zh) 用于音频编解码器中的长期预测的系统和方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140128

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140417

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140424

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150127

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150421

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150721

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150818

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150911

R150 Certificate of patent or registration of utility model

Ref document number: 5809645

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250