JP2022091803A - プロセッサおよびトランケートされた分析または合成窓のオーバーラップ部分を使用したオーディオ信号の処理方法 - Google Patents
プロセッサおよびトランケートされた分析または合成窓のオーバーラップ部分を使用したオーディオ信号の処理方法 Download PDFInfo
- Publication number
- JP2022091803A JP2022091803A JP2022037055A JP2022037055A JP2022091803A JP 2022091803 A JP2022091803 A JP 2022091803A JP 2022037055 A JP2022037055 A JP 2022037055A JP 2022037055 A JP2022037055 A JP 2022037055A JP 2022091803 A JP2022091803 A JP 2022091803A
- Authority
- JP
- Japan
- Prior art keywords
- window
- overlap portion
- overlap
- length
- asymmetric
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 45
- 238000003672 processing method Methods 0.000 title 1
- 238000000034 method Methods 0.000 claims abstract description 42
- 238000012545 processing Methods 0.000 claims abstract description 35
- 230000007704 transition Effects 0.000 claims description 75
- 238000006243 chemical reaction Methods 0.000 claims description 62
- 238000004458 analytical method Methods 0.000 claims description 52
- 230000006870 function Effects 0.000 claims description 28
- 238000004590 computer program Methods 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 8
- 238000005562 fading Methods 0.000 claims description 7
- 230000001174 ascending effect Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 5
- 230000004044 response Effects 0.000 claims 1
- 239000002131 composite material Substances 0.000 description 37
- 230000009466 transformation Effects 0.000 description 16
- 230000001052 transient effect Effects 0.000 description 15
- 230000003595 spectral effect Effects 0.000 description 10
- 230000015572 biosynthetic process Effects 0.000 description 9
- 238000003786 synthesis reaction Methods 0.000 description 9
- OVOUKWFJRHALDD-UHFFFAOYSA-N 2-[2-(2-acetyloxyethoxy)ethoxy]ethyl acetate Chemical compound CC(=O)OCCOCCOCCOC(C)=O OVOUKWFJRHALDD-UHFFFAOYSA-N 0.000 description 6
- 238000013139 quantization Methods 0.000 description 6
- 238000000844 transformation Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 230000002441 reversible effect Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000003467 diminishing effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/028—Voice signal separating using properties of sound source
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M13/00—Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Image Analysis (AREA)
- Complex Calculations (AREA)
Abstract
Description
合成側のためのオーバーラップ窓を用いたオーディオ処理に関する。
オコーダは、現在の信号特性に時間および周波数の分解能を適応させるために、ある種の
変換サイズの切り替えを使用する。利用可能な変換サイズとそれらに対応する窓形状との
間の切り替えを処理するための異なるアプローチが開発されている。いくつかの手法では
、異なる変換長、例えばMPEG―4(HE)AAC[1]を用いて、符号化されたフレ
ーム間に遷移窓を挿入する。遷移窓の欠点は、エンコーダーの先読みを増やす必要がある
ため、低い遅延アプリケーションには適していない。他のものは、遷移窓の必要性を回避
するために、すべての変換サイズに対して固定された低い窓オーバーラップ、例えばCE
LT[2]を採用する。しかしながら、低いオーバーラップは、周波数分離を減少させ、
トーナル信号の符号化効率を低下させる。対称オーバーラップのための異なる変換および
オーバーラップ長を用いる改善されたインスタント切り替え手法が、〔3〕においてされ
る。〔6〕は、低いオーバーラップサイン窓を使用して、異なる変換長間の瞬間的な切り
替えの例を示している。
、しばしば非対称MDCT窓を使用する。エンコーダー側では、先行フレームとの長いオ
ーバーラップが周波数分離を改善するために使用される一方で、先読み遅延を低減するた
めに、後続フレームとの短縮オーバーラップが使用される。デコーダー側では、エンコー
ダー窓の反映されたバージョンが用いられる。非対称分析および合成窓掛けは、図8a~
図8cに示されている。
る。
7に記載のオーディオ信号を処理する方法、または請求項18に記載のコンピュータプロ
グラムによって達成される。
のに有用であるという知見に基づいている。一方、フレキシブルな変換サイズ切り替え戦
略を有するために、1つのブロックサイズから異なるブロックサイズへの遷移のための分
析または合成窓は、非対称窓の切り捨てられたオーバーラップ部分を窓エッジとして使用
することを可能にするか、または完全な再構成特性を乱すことなく窓エッジのための基礎
として使用することを可能にする。
は、遷移窓内で使用することができる。しかし、遷移窓の必要な長さに適合するために、
このオーバーラップ部分または非対称の窓エッジまたはフランクは、遷移窓の制約内で許
容される長さにトランケートされる。これは、しかしながら、完全な復元特性に違反しな
い。それ故、非対称窓の窓オーバーラップ部分のこの切り捨ては、完璧な再構成側からの
ペナルティなしに、短時間かつ即座の切り替え遷移窓を可能にする。
なく、考慮中の非対称な窓オーバーラップ部分を切り捨てることによって生じる不連続を
滑らかにするか、フェードインまたはフェードアウトすることが好ましい。
フェードインまたはフェードアウトの場合でさえも、特定の窓エッジが使用されるため、
メモリーを節約する実施に依存する。これらのメモリー効率のよい実施は、さらに、格納
された昇順窓エッジから降順窓エッジを構成するか、またはその逆を論理演算または算術
演算によって構成し、昇順または降順のいずれかのエッジのみを格納しなければならず、
そして、他のものは自動的にその場で導出することができるようにする。
サは、オーディオ信号の分析処理において、第1の非対称窓から第2の窓への変化を示す
オーディオ信号から窓制御信号を導出する分析器を有する。代替的にまたは追加的に、窓
制御信号は、例えば合成信号処理の場合に、第3の窓から第4の非対称窓への変化を示す
。特に、分析側にとって、第2の窓は第1の窓よりも短いか、合成側では、第3の窓が第
4の窓よりも短い。
第3の窓を構築するための窓コンストラクタをさらに含む。具体的には、窓コンストラク
タは、第1の非対称窓の切り捨てられた第1のオーバーラップ部分を使用して、第2の窓
の第1のオーバーラップ部分を決定するように構成される。代替的に、または追加的に、
窓コンストラクタは、第4の非対称窓の第2のオーバーラップ部分を使用して、第3の窓
の第2のオーバーラップ部分を計算するように構成される。
ーディオ信号部分を得るための合成処理の場合には、特に、分析処理または第3および第
4の窓を適用する。
散的かつ時間的に後続するオーディオ信号サンプルのストリームが窓シーケンスによって
窓掛けされ、例えば、分析器が実際にオーディオ信号の過渡状態を検出するとき、長い窓
から短い窓への切り替えが実行される。次に、窓処理に続いて、時間領域から周波数領域
への変換が実行され、好ましい実施形態では、この変換は、修正離散コサイン変換(MD
CT)を使用して行われる。MDCTは、2N個の時間領域サンプルの集合からN個の周
波数領域サンプルの集合を生成するために、畳み込み演算と次のDCTIV変換を使用し
、これらの周波数領域値がさらに処理される。
ンコーダー側分析器によって決定されたある窓シーケンスを示す符号化オーディオ信号に
サイド情報から窓制御信号を引き出し、デコーダー側プロセッサの実装に送信される。合
成窓処理は、デコーダー側処理の最後、すなわち、一組のN個のスペクトル値の集合から
2N個の時間領域値の集合を生成する周波数-時間変換および非畳み込み演算に続いて実
行され、本発明のトランケートされた窓エッジを使用する合成窓処理に続いて、必要に応
じてオーバーラップ加算が実行される。好ましくは、分析窓の位置決めのために、および
合成窓を用いた合成窓処理の後の実際のオーバーラップ加算のために、50%のオーバー
ラップが適用される。
号化効率を有する非対称変換窓に依存することである。一方、本発明は、柔軟な変換サイ
ズが過渡信号の効率的な符号化のための戦略を切替えることができ、そして、それは、完
全なコーダ遅延を増加させない。したがって、本発明は、短い変換のための非対称窓と、
短い窓の対称的な重複範囲のための柔軟な変換/オーバーラップ長の切り替えコンセプト
との組み合わせに依存する。短い窓は、両側で同じ対称オーバーラップを有する完全に対
称であってもよく、または先行する窓と第1の対称オーバーラップと、後続の窓との第2
の異なる対称オーバーラップを有する非対称であってもよい。
によって、異なるブロックサイズを有する窓からのいかなる遷移も付加的な長い遷移窓の
挿入も必要としないという事実のために、任意のコーダ遅延または必要なコーダ先読みは
増加しないという点で、有利である。
換から、対称的にオーバーラップする窓を有するより短い変換に、即座に切り替えるため
の概念に関する。
が問題となる。
・窓の左のオーバーフラップ部分は、完全またはほぼ完全な再構成が達成されるように、
前の非対称窓の形状に一致する必要がある。
・オーバーラップしている部分の長さは、変換の長さが短いために制限される。
換のサイズの半分以下の短い変換では長すぎる。従って、より短い窓形状を選択する必要
がある。
反映されたバージョンであると仮定する。この場合、窓は、完全な再構成のために、次の
式を満たさなければならない。
ここで、Lは、変換長とnのサンプルインデックスを表す。
れは、最も右の窓サンプルの全てがゼロの値を持つことを意味する。上記の式から、窓サ
ンプルWnがゼロの値を有する場合、対称サンプルW2L-1-nに対して任意の値が選択され
得ることが分かる。窓の右端mのサンプルがゼロである場合、左端mのサンプルは、完全
な再構成を失うことなくゼロで置き換えることができ、すなわち、左のオーバーラップ部
分を右のオーバーラップ部分の長さにトランケートすることができる。
分なオーバーラップ長が残るようにすると、これは第1の短い変換窓の形状の解を与え、
上記の条件の両方を満たす。非対称窓のオーバーラップ部分の左端はトランケートされ、
その後の短い窓に使用される対称オーバーラップと組み合わされる。結果として生じる窓
形状の一例が図10Cに示されている。
のための完全に新規な窓形状を設計する必要を回避する。また、遷移に追加の窓テーブル
が必要ないため、アルゴリズムが実施されているハードウエアのROM/RAMの需要/
要求が減少する。
、右側に長いオーバーラップを有する。したがって、右側のオーバーラップ部分のトラン
ケートされたバージョンは、図13Dにて図示するように、非対称の窓で長い変換へ切り
換わる前に、最後の短い変換の右側の窓の一部のために使われる。
トルデータが分析変換と合成変換との間で修正されない場合、時間領域信号の完全な再構
成を可能にする。しかしながら、オーディオコーダでは、量子化がスペクトルデータに適
用される。合成変換では、得られた量子化ノイズは、合成窓によって形作られる。長い窓
のトランケーションは、窓形状のステップを導入するので、出力信号の量子化ノイズに不
連続性が生じる可能性がある。これらの不連続性は、クリック状のアーティファクトとし
て聞き取れるようになる。
窓の端に適用して、ゼロへの遷移を円滑にすることができる。フェードアウトは、いくつ
かの異なる方法で行うことができ、例えば、それは線形、正弦または余弦形状であり得る
。フェードアウトの長さは、可聴アーティファクトが発生しないように十分に大きく選択
する必要がある。完全な再構成を失うことなくフェードアウトに利用できる最大長は、短
い変換長と窓のオーバーラップの長さによって決定される。場合によっては、利用できる
長さはゼロであるか、または、アーティファクトを抑制するにはあまりに少ないかも知れ
ない。このような場合には、フェードアウトの長さを延長し、小さな再構成誤差を受け入
れることが有益であり得る。これは、量子化ノイズの不連続性よりも妨げにならないこと
が多いためである。フェードアウトの長さを慎重に調整することで、最良のオーディオ品
質を達成するために、量子化エラーの不連続性に対して再構成エラーを交換することがで
きる。
フェードアウトを伴うトランケートされたオーバーラップの例を示す。
を説明するために論じられる。オーディオ信号は、入力200で分析器202に供給され
る。この分析器は、入力200でオーディオ信号から窓制御信号204を導出するように
構成されており、窓制御信号は、例えば、14Aまたは図14Bに示す第1の窓1400
または1500によって示されるように、第1の非対称窓から第2の窓への変化を示し、
この実施形態では、第2の窓が、図14Aの窓1402または図15Aの窓1502であ
る。窓制御信号204は、再び、代替的に、また合成側での動作に関して、例示的に、図
14Bの1450または図15Bの1550などの第3の窓から、図14Bの1452ま
たは 図15Bの1552などの第3の窓への変更を示す。図示のように、1402のよ
うな第2の窓は、第1の窓1400よりも短く、または、1450または1550のよう
な第3の窓は、1452または1552のような第4の窓よりも短い。
するための窓コンストラクタ206をさらに含み、この窓コンストラクタは、合成側の第
1の非対称窓のトランケートされた第1のオーバーラップ部分、すなわち、図2のケース
Bを使用して、第2の窓の第1のオーバーラップ部分を決定するように構成される。窓コ
ンストラクタは、第1の窓のトランケートされた第2のオーバーラップ部分、すなわち、
非対称窓を使用して、1502または1550などの第3の窓の第2のオーバーラップ部
分を計算するように構成される。
るおよび/または後続の窓は、窓コンストラクタ206から窓掛け部208に送信される
。窓掛け部208は、出力210において信号部分を得るために、第1および第2の窓ま
たは第3および第4の窓をオーディオ信号に適用する。
析器202は、実際のオーディオ信号分析、例えば過渡分析などを行う。第1および第2
の窓は、分析窓であり、窓化された信号は、図1Aに関して後述するようにエンコーダー
側で処理される。
されるか、または実際には存在しない。
オ信号情報およびサイド情報を有するビットストリームのような符号化オーディオ信号で
あり、分析器202は、符号化されたオーディオ信号から、ビットストリーム分析または
ビットストリームまたは符号化信号分析を実行して、エンコーダーによって適用される窓
シーケンスを示す窓制御信号を生成し、そこからデコーダーによって適用される窓シーケ
ンスを導出することができる。
掛けされた信号は、オーディオ信号の合成のためにオーバーラップ加算処理される。
る装置は、オーディオ信号100を窓掛けして、103で示す窓掛け済みサンプルのブロ
ックのシーケンスを提供するための制御可能な窓掛け部102を備える。さらに、エンコ
ーダーは、窓掛け済みサンプルのブロックのシーケンス103を、105で示すスペクト
ル値のフレームのシーケンスを含むスペクトル表現に変換するための変換部104を更に
備える。更に、過渡位置検出部106が設けられる。検出部は、フレームの過渡先読み領
域内の過渡の位置を識別するように構成されている。更に、制御可能な窓掛け部を制御す
るための制御部108が、107で示す過渡の識別された位置に応じて、特定のオーバー
ラップ長を有する特定の窓をオーディオ信号100に適用するよう構成されている。更に
、制御部108は、一実施形態において、窓情報112を、制御可能な窓掛け部102に
だけでなく、その出力において符号化済みオーディオ信号115を提供する出力インター
フェース114にも提供するよう構成されている。スペクトル値のフレームのシーケンス
105を含むスペクトル表現は符号化処理部110に入力され、その符号化処理部110
は、予測操作、時間的雑音整形操作、好ましくは聴覚心理音響モデル若しくは少なくとも
聴覚心理音響原理に関連する量子化操作のような、任意の種類の符号化操作を実施するこ
とができ、又は、ハフマン符号化操作若しくは算術符号化操作のような冗長性を低減する
符号化操作を含んでもよい。符号化処理部110の出力は、その後、出力インターフェー
ス114に伝送され、その後、出力インターフェース114は最終的に、特定の窓情報1
12が符号化済み各フレームに関連付けられた、符号化済みオーディオ信号を提供する。
成されている。グループは、第1オーバーラップ長を有する第1窓、第2オーバーラップ
長を有する第2窓、及び第3オーバーラップ長を有するか又はオーバーラップを有しない
第3窓を含む。第1オーバーラップ長は、第2オーバーラップ長よりも大きく、第2オー
バーラップ長はゼロオーバーラップよりも大きい。特定の窓は、時間的に隣接する2つの
オーバーラップ窓のうちの1つが過渡の位置において第1の窓係数を有し、時間的に隣接
する2つのオーバーラップ窓のうちの他方が過渡の位置において第2の窓係数を有し、第
2の窓係数が第1の係数よりも少なくとも9倍大きくなるように、過渡位置に基づいて制
御可能な窓掛け部102によって選択される。これによって、過渡が第1の(小さい)係
数を有する第1窓によって大幅に抑制され、その過渡が第2の窓係数を有する第2窓によ
っては殆ど影響を受けないことが確実になる。第1の窓係数は、好ましくは0.95~1
.05のように±5%の許容範囲内で1に等しく、第2の窓係数は、好ましくは0に等し
いか又は少なくとも0.05よりも小さい。窓係数は負になる可能性もあり、この場合、
窓係数の関係及び量は絶対値の大きさに関係付けられる。
ンストラクタ206の機能を含み、後述する。さらに、過渡位置検出部106は、実施す
ることができ、ケースAのために、すなわち、分析側の窓の適用については、図2の分析
器202の機能を有することができる。
に対応する、窓掛け済みの(窓掛けされた)オーディオ信号210によって実行される処
理を示す。さらに、窓コンストラクタ206は、図2に具体的には示されていないが、図
1Aの窓情報112を出力インターフェース114に提供し、デコーダー側で動作する分
析器202、すなわち、ケースBについて、符号化された信号から回復することができる
。
であるように、このエイリアシング導入変換は、畳み込みステップ、及び特定の非エイリ
アシング導入変換を使用した後続の変換ステップに分離され得る。一例では、区分が他の
区分に畳み込まれ、畳み込み演算の結果は、その後、DCT変換のような変換を使用して
スペクトルドメインへと変換される。MDCTの場合、DCTIVが適用される。
同様で類似の方法で処理され得る。重複変換として、MDCTは、入力の半数(同数では
なく)の出力を有するという点において、他のフーリエ関連変換と比較して多少異なって
いる。特に、MDCTは、線形関数F:R2N→RNである(ここで、Rは実数の集合を示
す)。2N個の実数x0,...,x2N-1は、以下の式に従って、N個の実数X0,
...,XN-1に変換される。
以下では、MDCT及びIMDCTの正規化の積だけが制約される。)
ると、MDCTは可逆的であるはずがないと考えられるかもしれない。しかしながら、時
間的に隣接したオーバーラップしているブロックのオーバーラップされたIMDCTを追
加することによって、完璧な可逆性が達成され、これによってエラーが消去され、元のデ
ータが回復される。この技法は、時間ドメイン・エイリアシング消去(TDAC)として
知られている。
)
正規化係数は、2を乗算されるべきである(即ち、2/Nになる)。
を、これらの点において関数をゼロに円滑に収束させることによって回避するために、上
述したMDCT及びIMDCTの式におけるxn及びynと乗算される窓関数wn(n=
0,...,2N-1)を使用することによって、変換特性は更に改善される(即ち、本
発明ではMDCTの前とIMDCTの後でデータを窓掛けする)。原則として、x及びy
は異なる窓関数を有することができ、窓関数はブロック毎に変化し得る(特に、サイズの
異なるデータブロックが組み合わされている場合)が、簡潔にするために、本発明では等
しいサイズのブロックについて同一の窓関数である一般的な場合を考察する。
n=w2N-1-nについて、変換は可逆的なままである(即ち、TDACが機能する)
。
様々な窓関数が使用される。修正重複変換として知られている形式を生成する窓が以下
の式によって与えられ、
その窓がMP3及びMPEG-2AACに使用され、
がVorbisに使用される。AC-3はカイザー・ベッセル派生(KBD)窓を使用し
、MPEG-4AACもKBD窓を使用することができる。
ため、信号分析のいくつかの他のタイプに使用される窓とは異なることに留意されたい。
この違いの理由の1つは、MDCT窓が、MDCT(分析)及びIMDCT(合成)の両
方のために、2回適用されることである。
価であり、入力はN/2だけシフトされ、2N個のデータブロックが一度に変換される。
この等価性をより慎重に研究することによって、TDACのような重要な特性を容易に導
き出すことができる。
交互の境界条件に対応することを認識しなければならない。即ち、(DFTの場合のよう
な周期的な境界ではなく)左の境界(n=-1/2周辺)では偶数であり、右の境界(n
=N-1/2周辺)では奇数である、等である。この関係は、以下の恒等式から得られる
。
そして、
xR,...)等に拡張することを考えることができ、ここで、xRは逆順になったxを
示す。
が各々N/2である4つのブロック(a,b,c,d)に分割する。もし、これらのブロ
ックを(MDCTの定義における+N/2項から)N/2だけ右にシフトすると、(b,
c,d)は、N個のDCT-IV入力の端部を過ぎて拡張し、そのため、上述した境界条
件に従って、これらのブロックを「畳み」戻さなければならない。
-bR)のDCT-IVと正しく等価であり、ここで、Rは上記のような反転を示す。
に適用することができる。)同様に、上記IMDCT式はDCT-IV(上記IMDCT
式自体の逆変換である)の正確に1/2であり、その出力は(境界条件を介して)長さ2
Nに拡張され、N/2だけ左にシフトし戻される。この逆DCT-IVは単純に、上記か
ら入力(-cR-d,abR)を戻す。このIMDCTが境界条件を介して拡張されシフ
トされると、以下が得られる。
IMDCT(MDCT(a,b,c,d))=(a-bR,b-aR,c+dR,d+
cR)/2
T出力の半分は冗長である。この入力をサイズNのより大きいブロックA、B、ここでA
=(a,b)及びB=(c,d)、にグループ化すると、この結果は以下のように単純に
書くことができる。
IMDCT(MDCT(A,B))=(A-AR,B+BR)/2
50%オーバーラップしている2N個のブロック(B,C)のMDCTを計算すると仮定
する。このとき、IMDCTは上記と同様に次式をもたらす。
(B-BR,C+CR)/2
このIMDCTが、オーバーラップしている半部における先行するIMDCT結果と加
算されると、反転した項が打ち消し合って単純にBが得られ、元のデータが回復される。
CT-IVの境界を超えて拡張する入力データを使用することによって、ナイキスト周波
数を超える周波数がより低い周波数にエイリアシングされるのと同じように、データがエ
イリアシングされるが、このエイリアシングは、周波数ドメインではなく時間ドメインに
おいて行われるという点が異なっている。a及びbRの(a,b,c,d)のMDCTに
対する寄与分、又は同等に、
IMDCT(MDCT(a,b,c,d))=(a-bR,b-aR,c+dR,d+c
R)/2
の結果に対する寄与分を区別することはできない。組合せc-dR等は、それらが加算さ
れるときに、それらの組合せを打ち消すための正確に適切な正負符号を有する。
MDCTは単純にDCT-IVのシフト置換ではない。この場合、半サンプルだけ更にシ
フトすることは、MDCT/IMDCTがDCT-III/IIと等価になり、分析が上
記と類似していることを意味する。
DCT-IVと正しく等価であることは、上段で見てきた。DCT-IVは、右境界にお
ける関数が奇関数である事例のために設計されており、それ故、右境界に近い値は0に近
い。入力信号が平滑である場合、これが当てはまる。a及びbRの最右端の成分は入力シ
ーケンス(a,b,c,d)内で連続しており、それ故、それらの差は小さい。その間隔
の中央に注目すると、上記式を
(-cR-d,a-bR)=(-d,a)-(b,c)R
と書き直す場合、第2の項(b,c)Rが中央において平滑な遷移を与える。しかしなが
ら、第1の項(-d,a)には、-dの右端がaの左端と交わるような潜在的な不連続性
がある。これが入力シーケンス(a,b,c,d)の境界付近の成分を0に向けて低減す
る窓関数を使用する理由である。
、時間的に隣接するブロックのIMDCTをそれらのオーバーラップしている半分におい
て加算することによって、元のデータが復元されることを示している。窓掛けされたMD
CTについてこの反転特性を導出することは、ほんの僅かながら更に複雑である。
力から成る集合(A,B)及び(B,C)を考察する。上述の説明から、(A,B)及び
(B,C)がMDCT変換され、IMDCT変換され、それらのオーバーラップしている
半分において加算された場合、元のデータである
(B+BR)/2+(B-BR)/2=B
が得られることを想起されたい。ここで、MDCT入力及びIMDCT出力の両方に長さ
2Nの窓関数を乗算すると仮定する。上述のように対称窓関数を想定し、それ故、その関
数の形式は(W,WR)であり、Wは長さNのベクトルであり、Rは前出のように反転を
示す。このとき、プリンセン-ブラッドリー条件は
W+WR 2=(1,1,...)
と書くことができ、2乗及び加算が要素毎に実施される。
T変換し、全ての乗算が要素毎に実施される。この結果はIMDCT変換され、窓関数に
よって再び(要素毎に)乗算されると、最後のNの半部は以下のようになる。
WR・(WRB+(WRB)R)=WR・(WRB+WBR)=WR 2B+WWRBR
/2を乗算しないことに留意されたい。)
半部において以下がもたらされる。
W・(WB-WRBR)=W2B-WWRBR
合、分析/合成窓は異なるが、好ましくは、互いに対称である。その場合、プリンセン-
ブラッドリー(Princen-Bradley)条件は、より一般的な方程式に変化する。
入力インターフェース152は、一方で、符号化された形態のオーディオ信号154を提
供し、他方で、サイド情報を分析器202に提供する。分析器202は、符号化信号15
0から窓情報160を抽出し、この窓情報を窓コンストラクタ206に供給する。さらに
、符号化されたオーディオ信号154は、図2の復号化処理部214に対応するデコーダ
ーまたは復号化処理部156に入力され、窓コンストラクタ206は、制御可能な変換器
158に窓を提供し、これは、IMDCTまたはIMDSTまたはエイリアシング導入順
方向変換とは、逆の他の変換を実行するように構成されている。
可能な変換部158は、周波数-時間変換部170と、続いて接続されている合成窓掛け
部172と、最後のオーバーラップ加算部174とを含む。特に、周波数-時間変換部は
、DCT-IV変換のような変換及び後続の逆畳み込み演算を実施し、それによって、周
波数-時間変換部への入力が例示的にN個のスペクトル値であったのに対して、周波数-
時間変換部170の出力は、第1の又は長い窓について2N個のサンプルを有するように
なる。他方、周波数-時間変換部への入力がN/8個のスペクトル値であるとき、出力は
例示的にMDCT操作についてN/4個の時間ドメイン値となる。
、好ましくはエンコーダー側の窓と正確に同じである合成窓を適用する。従って各サンプ
ルは、オーバーラップ加算が実施される前に、2つの窓によって窓掛けされ、結果として
得られる「合計の窓掛け」は、前述したようなプリンセン-ブラッドリー条件が満たされ
るように、対応する窓係数の2乗である。
復号化済み)オーディオ信号を得るために、対応する正確なオーバーラップ加算を実施す
る。
バイル機器は、一方ではエンコーダー195を備え、他方ではデコーダー196を備える
。更に、本発明の好適な実施形態によれば、エンコーダー195に使用される窓とデコー
ダー196に使用される窓とは互いに同一であるため、エンコーダー105及びデコーダ
ー106の両方が単一のメモリー197のみから同じ窓情報を取り出す。従って、デコー
ダーは、単一セットの窓シーケンス又は窓のみがエンコーダー及びデコーダーの両方に使
用するために格納されている、読み出し専用メモリー197若しくはランダムアクセスメ
モリー又は一般的に任意のメモリー197を有する。単一セットしか必要としないことは
、種々の窓のための種々の窓係数をエンコーダーのために1セット及びデコーダーのため
に1セットとして2回格納する必要がない、という事実に起因して、有利である。本発明
によれば、同一の窓及び窓シーケンスがエンコーダー及びデコーダーに使用されるという
事実に起因して、単一セットの窓係数のみが格納されればよい。従って、図1Dに示す本
発明のモバイル機器のメモリー使用量は、エンコーダー及びデコーダーが異なる窓を有す
るか、又は窓掛け操作以外の処理による特定の後処理が実施される他の概念と比較して、
大幅に低減されている。
800、第2のオーバーラップ部分802、高い値を有する更なる部分804および低い
値を有する更なる部分806を備える。部分804の高い値は1.0の値であるか、また
は、少なくとも0.95より大きく、そして、低い部分806の低い値は、0.0に等し
く、そして、好ましくは0.1未満である。この実施形態では、非対称分析窓の長さは4
0msであり、これは好ましくは、50%の重複加算が使用されるという事実のために2
0msのブロックサイズをもたらす。しかし、他のオーバーラップ率なども同様に使用す
ることができる。
する第2のオーバーラップ部分802よりも大きく、さらに、低い部分806が第2のオ
ーバーラップ部分に先行するという事実の文脈において、図8Aに図示された非対称分析
窓は、ゼロ部分と短い第2のオーバーラップ部分802による低い遅延フィルタリングが
可能であり、さらに長い第1のオーバーラップ部分800のためにかなり良好な分離を有
する。しかし、この長いオーバーラップ部分は、非対称分析窓の最初の半分にあるという
事実のために、追加の遅延を引き起こさない。特定の実施形態では、第1のオーバーラッ
プ部分800は、14.375msに等しく、第2の非オーバーラップ部分または高い部
分は、11.25msに等しく、第3のオーバーラップ部分または第2のオーバーラップ
部分802は、8.75msに等しく、最後の第4の部分または低い部分は、5.625
msに等しい。
ロまたは低い部分があり、それから、第1のオーバーラップ部分812と、第2のオーバ
ーラップ部分814と、一定の部分または第1のオーバーラップ部分812と第2のオー
バーラップ部分814との間に示される高い部分816とを有する。
第2のオーバーラップ部分814よりも短いことが一般に好ましく、また、一定部分また
は高い部分816の長さは、第1のオーバーラップ部分および第2のオーバーラップ部分
の長さの間にあることがさらに好ましく、第1の部分810またはゼロ部分の長さは、第
1のオーバーラップ部分812の長さよりも小さいことがさらに好ましい。
プ部分802の長さよりも長く、高い部分804の長さは、第2のオーバーラップ部分8
02と第1のオーバーラップ部分800との間の長さであり、第4の部分806の長さは
、第2のオーバーラップ部分802の長さよりも短い。
2の窓御信号204によって示されない場合、先行する非対称分析窓807および後続の
分析窓808とのオーバーラップを示す。
窓820で例示する。
算で畳み込まれる畳み込み部分821、822を備えるか、またはデコーダー側で逆畳み
込みされた「逆畳み込み」である。これらの畳み込み821、822は、畳み込みライン
823および824に沿って行われると考えることができ、これらの線も図8A、8Bに
示されており、畳み込みラインは、図8Aおよび8Bの窓の交差点と直接一致しないよう
に見える。これは、図8Aの分析窓または図8Bの合成窓の非対称特性に起因する。
対称分析/合成窓を示す。対称分析窓は、第1の低い部分又はゼロ部分900、第1のオ
ーバーラップ部分902、第2のオーバーラップ部分904、高い部分又は一定部分90
6、および、更なる低い部分又はゼロ部分908を含む。また、図9Aは、畳み込みライ
ン910、911を示している。ここで、MDCTまたはMDSTのようなエイリアシン
グ導入変換によって必要とされる畳み込み演算が実行される。具体的には、エンコーダー
側処理については、畳み込み演算を行い、デコーダー側オーディオ処理については、逆畳
み込み演算を実行する。したがって、線912、913は、左側に関して部分900に対
応する減少部分およびその後のゼロ部分を有し、右側に対して908を有する畳み込み部
分を示す。したがって、マーカー915は、左畳み込み部分912と右畳み込み部分91
3との間の境界を示す。したがって、線912、913は、畳み込み部分を示し、それは
、減少する部分と、左側については部分900および右側については部分908に対応す
る後続のゼロ部分と、を含む。したがって、マーカー915は、左畳み込み部分912と
右畳み込み部分913との間の境界を示す。
ている。なぜなら、左オーバーラップ部分と右オーバーラップ部分は互いに対称的である
からである。すなわち、本実施形態では、3.75msの同じオーバーラップ長を有する
からである。一般に、ゼロ部分900,908をオーバーラップ部分902,904より
も小さくすることが好ましく、その結果、両方のゼロ部分900、908が同じ長さを有
する場合、高い部分906は、単一のゼロ部分の長さの2倍を有する。
。特に、この窓は、図9Aと同様に、ゼロ部分920、第1のオーバーラップ部分922
、一定のまたは高い部分924、第2のオーバーラップ部分926および第2のゼロ部分
または低い部分928を有する。再度、畳み込みライン910および911が示され、ま
た、マーカー915は、左畳み込み部分929と右畳み込み部分930との間の境界を示
す。図示されているように、左オーバーラップ部分922は、1.25msなどの短いオ
ーバーラップ用であり、右オーバーラップ部分926は、3.75msなどのより長いオ
ーバーラップ用です。したがって、この窓は、短いオーバーラップ窓を有する窓掛けから
より高いオーバーラップ窓への遷移窓であるが、このような窓は、両方とも、対称のオー
バーラップを有する窓である。
sのブロックサイズを有する。この窓は、図9Bに類似しているが、実質的に異なる時間
長さを有し、従って、図9の窓は、より短い時間分を有するが、再びゼロ部分のシーケン
ス、短いオーバーラップを有する左オーバーラップ部分、高い部分、後続の第2のオーバ
ーラップ部分および最終ゼロ部分を含む。さらに、図9Cに畳み込みラインおよび畳み込
み部分などが再び示されている。
な畳み込みラインを示し、さらに図9Aの912と913のような畳み込まれた外側窓部
分を有する。
いる。例えば、図9Aを考慮すると、変換長は、15msと5msとの間の差を有する1
0msに相当することが明らかになる。したがって、変換長は、図9Aおよび他の図の「
ブロック」の表記に対応する。しかしながら、実際に窓掛けされた時間部分は、図9Aの
実施形態において、20msのような変換またはブロック長さの2倍である。
応する5msの変換長を有する。
24のような畳み込みラインの間の距離であり、したがって20msであり、窓時間部分
の長さは40msである。
いオーバーラップ部分または窓エッジがトランケートされたときに、畳み込みラインまた
は畳み込みポイントを維持することである。
リングレートを使用し、その長さがサンプリングレートの各々についてのサンプリング値
の整数個に対応するように、窓エッジまたは窓側面の長さが選択される。
ーバーラップが使用されることが概説されている。したがって、図8Aから図15Bの窓
の図に示されているものよりも多くの組み合わせが可能であり、有用であり、特定の部分
に過渡部分を有する特定のオーディオ信号に対して最適な窓シーケンスが選択されること
を確認するために、窓制御信号によって通知される。
いて、左側は、14.375msである非対称分析窓800の長いエッジの元の長さから
8.75msの長さにトランケートされている。したがって、図10Aは、第1の非対称
窓の第1のオーバーラップ部分800からトランケーションによって導出された第1のオ
ーバーラップ部分1000を示す。さらに、図10Aの分析遷移窓は、1.25msの右
オーバーラップ部分、すなわち、短いオーバーラップ部分1002をさらに含む。この窓
は、10msの窓長さに対応する5msのブロックサイズ用です。畳み込みラインは、4
.375msで示されており、すなわち、1006で示されている1004および9.3
75msである。さらに、左畳み込みライン1004のための畳み込み部分1008およ
び右畳み込みライン1006のための畳み込み部分1010が示されている。
第1のオーバーラップ部分は、図10Aの第1のオーバーラップ部分1000に対応する
異なる第1の部分1012および未修正の第2の部分1014を有する。窓は、図10A
に関して異なるものではない。好ましくは、図10Bにおいて、1012で示される第1
のオーバーラップ部分の第1の部分を計算するために、1.25msのサイン・オーバー
ラップ部分、すなわち、例えば図9Bにおいて、922で示される部分が使用される。し
たがって、短い窓の第1のオーバーラップ部分922が、ある意味では「リサイクル」さ
れた非常に良好なフェードイン特性が得られる。したがって、この窓部分は、図9Bの場
合のように、窓掛けのために使用されるだけでなく、トランケートによって生じるアーテ
ィファクトを低減するために、分析遷移窓の実際の計算のためにも使用される。完全な再
構成特性は、図10Aの実際にトランケートされた第1のオーバーラップ部分1000が
使用される場合にのみ得られるが、フェードイン部分を有する図10Bの遷移窓を使用す
ることによって、オーディオ品質を高めることができることが分かった。それにもかかわ
らず、完全な再構成特性に違反するが、このフェードイン部分は、図10Aの左オーバー
ラップ部分1000の左側の不連続性が排除されているため、図10Aの実施形態と比較
してより良いオーディオ品質をもたらす。それにもかかわらず、正弦関数とは異なる他の
フェードインまたは(合成側に関して)フェードアウト特性は、利用可能で有用であれば
使用することができる。
を示しているオーバーラップする状況で、前の窓および左の内の1020は1022で次
の窓の部分に重なる。
概して、右側のオーバーラップ部分1020は図8aの非対称の分析窓の右側部分80
2である、そして、次であるか次の窓の内の1022は、窓の第1のオーバーラップ部分
であるかまたは場合によっては更なる遷移窓の左のオーバーラップ部分である。
プ部分1020と、後続の窓の第1のオーバーラップ部分1022が示されている。
のブロックから10msのブロックへの遷移について、20msのブロックから5msの
ブロックへの遷移が示されている。一般に、20msのブロックは、ロングブロックとみ
なすことができ、5msのブロックは、ショートブロックとみなすことができ、10ms
のブロックは、ミドルブロックとみなすことができる。第1のオーバーラップ部分110
0は、トランケートされているが、わずかな量であり、トランケーションは、1150で
示されている。しかしながら、オーディオ品質をさらに向上させるために、1.25ms
のサインエッジを乗算することによって得られるフェードインは、既に適用されており、
フェードインは実線で示されている。さらに、窓は、高い部分1101と、この場合、3
.75msの長いオーバーラップ部分である第2のオーバーラップ部分1102とを有す
る。したがって、図11Aは、図2の「第2の窓」に対応する最適分析遷移窓を、20m
sの変換長から10msの変換長まで対応させて示しており、ここで、左オーバーラップ
部分1100は、非対称窓の長いエッジ800の可能な限り小さなトランケーションによ
って得られ、加えて、1.25msのサインエッジによりトランケートされたエッジ10
50を乗算することによってフェードインが実行される。説したように、右オーバーラッ
プは、3.75msである。
ら短い変換長への遷移のために代替分析遷移窓を示す。しかし、左のオーバーラップは、
非対称窓の左端をトランケートして、さらに1.25msのサインエッジを使用して乗算
することによりフェードインを実行することによって、わずか8.75msになる。した
がって、図10Aの場合と同様に、オーバーラップまたは左オーバーラップ部分1130
は、8.75msとなる。この窓を適用するために、さらなる変更が行われる。これらの
変更は、第1の低い部分又はゼロ部分1131、第2の高い部分又は一定部分1132お
よび第3または低い部分1133であり、第2のオーバーラップ部分1134は、図11
Aの対応する部分1102と同様であるが、第4のゼロまたは低い部分1133のために
左にシフトされる。さらに、畳み込みライン1104、1106が示され、マーカー11
35が左畳み込み部分1136と右畳み込み部分1137との境界を示す畳み込み部分が
示されている。部分1131、1132、1133の長さは、図11Aのように可能な限
り最小限のトランケーションが行われるという事実によって決定される。例示的には、部
分1131をゼロに設定することができ、1132と1133の長さを対応して増加させ
ることができる。一方、1133の長さはゼロに設定することができ、したがって、11
31の長さは、対応して増加させることができ、または全ての部分1131,1132,
1133は、ゼロとは異なるが、対応する長さは、図11Bの実施形態と異なる。すべて
のこれらの異なる窓の実施において、畳み込みライン1104、1106を介した畳み込
みが対応して可能であることが確実にされるべきであり、第1のオーバーラップ部分11
30の計算が、実際的な実施を容易にする図10Bの左部分1104、1012の計算と
同様である図11Aに関して、利点を有する。しかし、これらの問題が顕著でない場合、
図11Aの窓を使用することができる。なぜならば、第1のオーバーラップ部分のより長
いオーバーラップは、より良い再構成特性を実行し、完全な再構成特性の法則にさらに近
くなるからである。
移窓を示す。5msから20msへの遷移について、そのような分析遷移窓の1つが図1
2aに示されている。左オーバーラップ部分1200は、例えば、1.25msの短いオ
ーバーラップ用であり、右オーバーラップ部分は、8.75msなどの長いオーバーラッ
プ用であり、1202で示されている。図12Bは、10msのブロックから20msの
ブロックへのさらなる分析遷移窓を示す。左オーバーラップ部分は1210で示され、右
オーバーラップ部分は1212で示される。左側のオーバーラップ部分は、3.75ms
の媒体オーバーラップ用であり、右側のオーバーラップ部分は、長いまたは8.75ms
の高いオーバーラップ用である。再び、畳み込みラインおよび畳み込み部分が示されてい
る。図12Bは、オーバーラップ部分1210、1212、左側の低いまたはゼロ部分1
214、中間の高いまたは一定部分1216および右側の低いまたはゼロ部分1218に
加えて、10から20msの分析遷移窓があることを明らかにする。
部分1202は、図8Aの802に示される非対称の分析窓の短い端に対応する。
はケースBの観点からの第3の窓の構成を示す。さらに、図13Aの状況は、図12Aの
状況に類似している。図13Bの状況は、図12Bの状況に類似している。図13Cの状
況は、図10Bに類似しており、図13Dの状況は、図10Cに類似している。
プ部分1302と、対応する畳み込みラインおよび畳み込み部分とを示すロングブロック
からショートブロックへの合成遷移窓を示している。
、左側のオーバーラップは、再び1310で示された長いオーバーラップであり、右側の
オーバーラップは、1312であり、さらに第1の低い部分1314、第2の高い部分1
316および必要に応じて第3の低い部分1318が設けられている。
で例示される第3の合成窓を示す。それは、8.75の長さ、すなわち図8Bの非対称合
成窓の右側または第2のオーバーラップ部分の長さにトランケートされ、すなわち、右側
のオーバーラップ部分814は、合成変移窓の右側のオーバーラップ部分1330を得る
ためにトランケートされ、図13Cの状況では、図10Bに関して分析側で論じたものと
基本的に同様の更なるフェードアウトが実行されている。これは、図2のケースBの第3
の窓の第2のオーバーラップ部分1330の状況を示しているが、フェードアウトではな
く、トランケーションのみで表示される。したがって、図13Cの第1の部分1331は
、図13Dの対応する第1の部分と同様であるが、しかし、第2の部分1332は、フェ
ードアウトのために、図13Dのトランケートされた窓により、1.25msのサインエ
ッジの下降を乗算することによって異なる。
オーバーラップ部分1340を示し、そして、さらに、図13Dは、前の窓の第2のオー
バーラップ部分1342、すなわち、第2のオーバーラップ部分1330および第1のオ
ーバーラップ部分1331からなる第3の窓の前の窓、例えば1.25msの短いオーバ
ーラップに対応する窓を示す。
に類似してフェードインを伴う、または伴わない、最小トランケーションを有する合成窓
または図13Dと同じ種類のトランケーションを有する合成窓が有用であるが、しかし、
今や第1および第2のゼロまたは低い部分および中間の定数部分を有する。
分析窓シーケンスを示し、そして、対応する合成窓シーケンスが図14Bに示される。図
2の用語の第2の窓は1402で示され、この窓は、図10Bに示された窓に対応する。
これに対応して、図2の第3の窓関数1450に対応するマッチング合成窓は、特定の図
には示されていない合成関数であるが、図11Bの分析関数である。
の窓関数1550は、図13Cの合成窓関数に対応する。
ら、図8Aのゼロ部分806も示されている第1の非対称窓関数1400への遷移を示す
。図14Aでは、長い非対称窓1400に続き、その後、トランケートされた第1のオー
バーラップ部分1402を有する第2の窓関数が示されている。次の窓1408は、図9
Bの窓と同様であり、次の窓1410は、図9Cの窓に対応し、最後に窓1412は、再
び、図8Aの非対称分析窓である。
の合成窓1456とを例示し、それから、図13Aに対応する短い遷移窓1458が例示
される。次の窓1460は、また、図9Cに対応する5msのブロックサイズを有する短
い窓でもある。
で反対の遷移を有する中間の窓への遷移を有する。窓1504および1500は、図8A
に対応する。トランケートされてフェードインされた本発明の窓1502の後に、示され
た順序で、窓1506、1508および1510が続く。窓1506は、図9Bの窓に対
応するが、左側への長いオーバーラップおよび右側への短いオーバーラップを有する。窓
1508は、図12Aの窓に対応し、窓1510は、再び長い非対称窓である。
0がある。1554は、図8Bの合成窓に対応し、窓1556についても同様である。窓
1558は、20から10への遷移であり、図13Bに対応する。窓1560は、10か
ら5への遷移であり、図9Bに対応するが、もう一度、右側にオーバーラップする左側へ
の長いオーバーラップを伴う。トランケートされてフェードアウトする本発明の窓155
0に続いて、再び、長い非対称合成窓が後に続く。
コンストラクタは、好ましくは、メモリー300と、窓部分トランケータ302と、フェ
ーダ304とを備える。例えば第1の窓から第2の窓へ又は第3の窓から第4の窓への遷
移を示すアイテム310に示された窓制御情報に応じて、窓部分トランケータ302が起
動される。トランケータは、非対称窓の部分800を取得するため、または第4の窓の第
2のオーバーラップ部分814を取得するために、メモリーにアクセスする。この部分は
、取得ライン308によってメモリー300から窓部分トランケータに取り出される。窓
部分トランケータ302は、説明したような最大のトランケーション長さなどの特定の長
さ、または最大長さよりも短いトランケーションを実施する。トランケートされたオーバ
ーラップ部分または窓エッジ316は、フェーダ304に伝送される。それから、フェー
ダは、フェードインまたはフェードアウト操作、すなわち図10Bの窓に到着する操作、
例えばフェードインなしにトランケートされた窓を示す図10Cの窓からの操作を実行す
る。この目的のために、フェーダは、取得ライン312を介して、短いオーバーラップ部
分のメモリーから、アクセスライン314を介してメモリーにアクセスする。次いで、フ
ェーダ304は、例えばトランケートさられた部分にオーバーラップ部分を乗算すること
によって、ライン316からトランケートされた窓部分でフェードインまたはフェードア
ウト操作を実行する。出力は、出力ライン318において、トランケートされ、フェード
した部分である。
様々な形状および可能性が、最小メモリー使用量を有するように最適化されていることを
示している。本発明の好ましい実施形態は、48kHz、32kHz、25.66kHz
、16kHz、12.8kHzまたは8kHzの6つのサンプリングレートの使用を可能
にする。各サンプリングレートに対して、1組の窓係数または窓部分が格納される。これ
は、20msの非対称窓の第1の部分、20msの非対称窓の第2の部分、3.75ms
のオーバーラップ部分などの10msの対称窓の単一部分および1.25msのオーバー
ラップ部分のような5msの対称窓の単一部分を含む。典型的には、10msの対称窓の
単一の部分は、窓の上向きのエッジであり、ミラーリングなどの直接的な算術演算または
論理演算によって、下降部分を計算することができる。あるいは、降下部分が単一部分と
してメモリー300に格納される場合、ミラーリングによって、または一般的には算術演
算または論理演算によって上昇部分を計算することができる。5msの対称窓の単一部分
についても同様である。当然のことながら、5または190msの長さを有するすべての
窓は、3.75msのような媒体のオーバーラップ部分、または、例えば、1.25ms
の長さを有する短いオーバーラップ部分を有することが可能である。
ロットに示されているように、それ自体で、特定の窓の低いまたはゼロ部分および高いま
たは一部分の長さおよび位置を決定するように構成される。
るために必要である。それゆえ、エンコーダーおよびデコーダーが1つの同じメモリー3
00に依存することを除けば、異なる窓および遷移窓などの浪費量でさえ、各サンプリン
グレートに対して4組の窓係数を格納することによってのみ実現することができる。
オーバーラップ正弦窓を使用するオーディオ符号化システムにおいて実施された。ブロッ
ク長さは、ロングブロックの場合は、20ms、ショートブロックの場合は、10msま
たは5msである。非対称分析窓の左側のオーバーラップは、14.375msの長さを
有し、右側のオーバーラップ長は、8.75msである。短い窓は、3.75msと1.
25msのオーバーラップを使用する。エンコーダー側で20msから10msまたは5
msの変換長に遷移するために、非対称分析窓の左側のオーバーラップ部分は、8.75
msにトランケートさられ、最初の短い変換の左側の窓部分に使用される。1.25ms
の正弦波形状のフェードインは、トランケートされた窓の左端に1.25msの短い窓オ
ーバーラップを乗算することによって適用される。フェードインのために1.25msの
オーバーラップ窓形状を再利用することで、フェードイン形状のオンザフライ計算のため
の複雑さと同様に、追加のROM/RAMテーブルの必要性が回避される。図14Aは、
変換長シーケンス20ms、5ms、5ms、10ms、20msを有する実施例の結果
として生じる窓シーケンスを示す。
ために、非対称合成窓の右側のオーバーラップ部分が8.75msにトランケートされ、
最後の短い変換の右側の窓部分に使用される。エンコーダー側でのフェードインと同様の
1.25msの正弦波形状のフェードアウトがトランケートされた窓の端に適用される。
上記の実施例に対するデコーダー窓シーケンスは、図14Bに示されている。
実施形態のフローチャートを示す。ステップ500において、非対称窓の第1および第2
の部分が取得される。ステップ502において、非対称な第1の分析窓が構築される。し
たがって、図14の分析窓1400または図15Aの1500が生成される。ステップ5
04において、非対称窓の第1の部分は、例えば図3の308で示される取得ラインによ
って取得される。ステップ506において、遷移長さが決定され、遷移は、図3の窓部分
トランケータ302などによって実行される。ステップ508において、メモリー300
に格納されたアイテム401のような5msの対称窓の単一部分が取得される。ステップ
510では、例えば、図3のフェーダ304の操作によって、トランケートされた部分の
フェードインが計算される。ここで、第1のオーバーラップ部分が完成する。ステップ5
12において、例えば長い窓から短い窓への遷移のために、5msの対称窓の単一部分が
取得されるか、または10msの対称窓の単一の部分が、長い窓から中間の窓への遷移の
ために取得される。最後に、第2の部分は、ステップ512で取得されたデータからの論
理演算または算術演算によって決定され、ステップ514によって示される。しかし、ス
テップ512によって図4のメモリー300から取得された対応する対称窓の単一部分は
、既に、第2の部分として、すなわち、下降している窓のエッジとして使用可能である場
合、ステップ514は不要であることに留意されたい。
らなるステップが必要とされる。ここで、第1のゼロ部分、第2のゼロ部分および中間の
高い部分は、窓コンストラクタによって追加的に挿入されなければならず、その一方で、
この挿入は、第2の窓の第1および第2のオーバーラップ部分の決定の前または後に行う
ことができる。
示す。このために、図6Aのステップの手順を実行することができる。ステップ600に
おいて、第3の窓の第1のオーバーラップ部分がメモリーから取得されるか、またはこの
形式で特に利用可能でない場合は、メモリー内のデータから算術演算または論理演算によ
って計算され、合成窓の第1のオーバーラップ部分は、先行する窓のオーバーラップによ
って既に固定されている。非対称窓の第2の部分、すなわち、非対称合成窓の長い部分が
取得され、ステップ604において、トランケーション長さが決定される。ステップ60
6において、この第1の部分は、必要に応じて反映され、その後、決定されたトランケー
ト長さを用いてトランケーションが実行される。ステップ608において、ステップ61
0に示すように、対称窓の5msのオーバーラップ部分の単一部分が取得され、ステップ
608に続いて、トランケートされた部分のフェードアウトが実行される。第3の窓の第
2のオーバーラップ部分が完了し、続いて、非対称の第4の窓関数の第2および第4の部
分が取得され、最後にステップ612に示すように第4の窓を得るために適用される。
関して前に概説したように、異なるトランケーション長さを実行することができる。同一
の状況に対して、最大トランケーション長さ、すなわち図11Aの状況、または図11B
に示す最大トランケーション長さよりも短いトランケーションまでのトランケーションが
存在し得る。このために、図7の手順は、ステップ700で示された遷移窓の長さの表示
から開始する。したがって、ステップ700は、遷移窓が10msのブロックサイズ、す
なわち、20msの長さであるか、それよりも短いか、すなわち、5msのブロックサイ
ズに対して10msの長さの窓であるかどうかの情報を提供する。
析側では、これは、第2のオーバーラップ部分の長さが決定されることを意味し、一方、
合成側については、これは、第1のオーバーラップ部分の長さが決定されることを意味す
る。ステップ702は、遷移窓の「固定」状況が確認されたこと、すなわち、遷移窓が対
称的なオーバーラップを有することを確認する。ここで、ステップ704において、窓の
第2のエッジまたは窓の他のオーバーラップ部分が決定される。基本的に、最大トランケ
ーション長さは、遷移窓の長さと対称オーバーラップ部分の長さとの間の差である。この
長さが非対称窓の長いエッジの長さよりも大きい場合、トランケーションは、全く必要あ
りません。しかし、この差が非対称窓の長いエッジよりも小さい場合、トランケーション
が実行される。最小トランケーション長さ、すなわち、最小トランケーションが得られる
長さは、この差に等しい。必要に応じて、図11Aまたは図10Bに示すように、この最
大長さまでのトランケーション、すなわち、最小のトランケーションを実行し、一定のフ
ェードを適用することができる。図11Aに示すように、特定の実施形態では、畳み込み
ラインが変更されるべきでないという事実のために、畳み込みライン1104、1106
に沿った畳み込みが可能であることを確実にするために、一定数のものが必要である。し
たがって、図11Aの1101に示すような一定数のものは、20ms~10msの分析
遷移窓に必要であるが、これらのものは図10Bの20ms~5msの遷移窓には必要な
い。
る。次に、最大長さよりも小さい長さへのトランケーションが、ステップ710において
実行され、図11Bの状況に至る。残りの窓部分は、0と1で満たされなければならず、
特に、ステップ712において部分1131および1133で示される窓の始めと終わり
にゼロを挿入することによって説明されなければならない。さらに、畳み込みポイント1
104および1106の周りの畳み込みが、図11Bに示すように適切に動作することを
確認するために、714に示すように、高い部分1132を得るために対応する数の1の
挿入は、実行されなければならない。
にあるゼロの数に等しく、図11Bの部分1133におけるいくつかのゼロは、図11B
の第2のオーバーラップ部分1134に直接隣接するゼロの数に対応する。次に、畳み込
みライン1104および1106のまわりのマーカー1135による畳み込みが適切に機
能する。
の長さ、中間の窓のための10msのブロックサイズおよび短い窓のための5msのブロ
ックサイズの変換長で説明されているにもかかわらず、異なるブロックまたは窓サイズを
適用され得ることが強調されている。さらに、本発明は、2つの異なるブロックサイズに
対しても有用であるが、例えば、議論されるように、過渡に対して短い窓関数を非常に良
好に配置するためには、3つの異なるブロックサイズが好ましいことが強調されるべきで
あるマルチオーバーラップ部分、すなわち、図15Aおよび図15Bまたは図14Aおよ
び図14Bのシーケンスで生じる2つ以上の窓間のオーバーラップをさらに論じているP
CT/EP2014/053287に詳細に記載されている。
、本発明はコンピュータ実装された方法によって構成することもできる。後者の場合には
、ブロックは対応する方法ステップを表し、そこでは各ステップが対応する論理的又は物
理的ハードウエアブロックによって実行される機能を表している。
明でもあることは明らかであり、そのブロック又は装置が方法ステップ又は方法ステップ
の特徴に対応することは明らかである。同様に、方法ステップを説明する文脈で示した態
様もまた、対応する装置の対応するブロックもしくは項目又は特徴を表している。方法ス
テップの幾つか又は全てが、例えばマイクロプロセッサ、プログラム可能なコンピュータ
、又は電子回路のようなハードウエア装置によって(又は使用して)実行されてもよい。
幾つかの実施形態では、最も重要なステップの幾つか又はそれ以上がそれら装置によって
実行されてもよい。
インターネットのような無線伝送媒体もしくは有線伝送媒体などの伝送媒体を通じて伝送
することができる。
いて構成可能である。この構成は、その中に格納される電子的に読み取り可能な制御信号
を有し、本発明の各方法が実行されるようにプログラム可能なコンピュータシステムと協
働する(又は協働可能な)、デジタル記憶媒体、例えばフレキシブルディスク,DVD,
ブルーレイ,CD,ROM,PROM,EPROM,EEPROM,フラッシュメモリー
などのデジタル記憶媒体を使用して実行することができる。したがって、デジタル記憶媒
体はコンピュータ読み取り可能であってもよい。
なコンピュータシステムと協働可能で、電子的に読み取り可能な制御信号を有するデータ
キャリアを含む。
として構成することができ、そのプログラムコードは当該コンピュータプログラム製品が
コンピュータ上で作動するときに、本発明の方法の一つを実行するよう作動可能である。
そのプログラムコードは例えば機械読み取り可能なキャリアに記憶されていても良い。
キャリアに記憶されたコンピュータプログラムを含む。
ータ上で作動するときに、上述した方法の1つを実行するためのプログラムコードを有す
るコンピュータプログラムである。
タプログラムを含む、データキャリア(又はデジタル記憶媒体又はコンピュータ読み取り
可能な媒体などの非一時的記憶媒体)である。そのデータキャリア、デジタル記憶媒体、
又は記録された媒体は、典型的に有形及び/又は非一時的である。
ムを表現するデータストリーム又は信号列である。そのデータストリーム又は信号列は、
例えばインターネットを介するデータ通信接続を介して伝送されるよう構成されても良い
。
ンピュータ又はプログラム可能な論理デバイスのような処理手段を含む。
ストールされたコンピュータを含む。
タプログラムを、受信器へ(例えば電子的に又は光学的に)伝送するよう構成された装置
又はシステムを含む。受信器は、例えばコンピュータ、携帯機器、メモリーデバイス又は
それらの類似物であってもよい。装置又はシステムは、例えばコンピュータプログラムを
受信器へと転送するファイルサーバを含んでもよい。
可能な論理デバイスが、上述した方法の幾つか又は全ての機能を実行するために使用され
ても良い。幾つかの実施形態では、書換え可能ゲートアレイは、上述した方法の1つを実
行するためにマイクロプロセッサと協働しても良い。一般的に、そのような方法は、好適
には任意のハードウエア装置によって実行される。
び詳細の変更および変形は、当業者には明らかであることが理解される。したがって、差
し迫った特許請求の範囲によってのみ限定され、本明細書の実施形態の説明および説明に
よって示される特定の詳細によっては限定されないことが意図される。
参照
ion Technology - Coding of audio-visual objects - Part 3: Audio," Geneva, Switze
rland, Aug. 2009.
[2]Internet Engineering Task Force (IETF), RFC 6716, "Definition of the Opus
Audio Codec," Sep. 2012.
[3]C. R. Helmrich, G. Markovic and B. Edler, "Improved Low-Delay MDCT-Based C
oding of Both Stationary and Transient Audio Signals," in Proceedings of the IEE
E 2014 Int. Conference on Acoustics, Speech and Signal Processing (ICASSP), 2014
or PCT/EP2014/053287.
Claims (18)
- オーディオ信号(200)を処理するプロセッサであって、
第1の非対称窓(1400)から第2の窓(1402)への変化を示し、または、第3
の窓(1450)から第4の非対称窓(1452)への変化を示すために、前記オーディ
オ信号(200)から窓制御信号(204)を導出する分析器(202)、
前記第1の非対称窓(1400)の第1のオーバーラップ部分(800)を使用してい
る前記第2の窓(1402)を構築する窓コンストラクタ(206)、および
窓掛けされたオーディオ信号(210)を得るために、前記第1の窓および前記第2の
窓または前記第3の窓および前記第4の窓を適用する窓掛け部(208)を含み、
前記第2の窓(1402)は、前記第1の窓(1400)よりも短いか、または、前記
第3の窓(1450)は、前記第4の窓(1452)よりも短く、
前記窓コンストラクタ(206)は、前記第1の非対称窓のトランケートされた第1の
オーバーラップ部分を使用して前記第2の窓(1402)の第1のオーバーラップ部分(
1000)を決定するように構成され、または、前記窓コンストラクタは、前記第4の非
対称窓(1452)のトランケートされた第2のオーバーラップ部分(814)を使用し
て前記第3の窓(1450)の第2のオーバーラップ部分(1330)を算出するように
構成されている、プロセッサ。 - 前記第1の窓および前記第2の窓は、分析窓であり、前記第3の窓および前記第4の窓
は、合成窓であり、
前記プロセッサは、前記第1の窓および前記第2の窓によって窓掛けされたサンプルを
さらに処理するためのオーディオエンコーダー(110)をさらに含み、または、前記プ
ロセッサは、前記第3の窓および前記第4の窓によって窓掛けされたサンプルをオーバー
ラップ加算するオーバーラップ加算部をさらに含む、請求項1に記載のプロセッサ。 - 前記窓コンストラクタ(206)は、前記第1の窓の前記第1のオーバーラップ部分を
トランケートすることによって、且つ、前記トランケートされた部分をフェードインする
ことによって、前記第2の窓の前記第1のオーバーラップ部分(1000)を導出するよ
うに構成され、または
前記窓コンストラクタ(206)は、前記第4の窓の前記第2のオーバーラップ部分を
トランケートすることによって、且つ、前記トランケートされた部分をフェードアウトす
ることによって、前記第3の窓の前記第2のオーバーラップ部分を導出するように構成さ
れる、請求項1または請求項2に記載のプロセッサ。 - 前記窓コンストラクタ(206)は、サインフェードイン機能またはサインフェードア
ウト機能を用いてフェードインまたはフェードアウトを実行するように構成される、請求
項3に記載のプロセッサ。 - 前記窓コンストラクタ(206)は、前記プロセッサによって使用されるその他の窓の
オーバーラップ部分(401)を使用して前記フェードインまたは前記フェードアウト(
304)を計算するように構成される、請求項3または請求項4に記載のプロセッサ。 - 前記窓コンストラクタ(206)は、使用されるすべてのオーバーラップ部分の最短オ
ーバーラップ部分(401)を使用して前記フェードインまたは前記フェードアウト(3
04)を計算するように構成される、請求項5に記載のプロセッサ。 - 所定のサンプリングレートのために、前記第1の非対称窓の前記第1のオーバーラップ
部分(800)、前記第1の非対称窓の第2のオーバーラップ部分(802)、および、
前記第1の窓よりも短いさらなる窓のための第3のオーバーラップ部分を、その上に格納
しているメモリー(300)をさらに含み、
前記窓コンストラクタ(206)は、
前記メモリー(300)から前記第1の非対称窓の第1のオーバーラップ部分を取得
するように構成され、
前記第1のオーバーラップ部分の長さより短い長さに前記第1のオーバーラップ部分
をトランケートするように構成され、
前記第3のオーバーラップ部分を取得するように構成され、
前記第2の窓の前記第1のオーバーラップ部分を生成するために、前記トランケート
された第1の部分と前記第3のオーバーラップ部分とを乗算するように構成され、または
前記窓コンストラクタ(206)は、
前記メモリー(300)から前記第4の非対称窓の前記第2のオーバーラップ部分を
取得するように構成され、
取得された前記第2のオーバーラップ部分を前記第2のオーバーラップ部分(302
)の長さより短い長さにトランケートするように構成され、
前記第3の窓の前記第2のオーバーラップ部分を生成するために、前記トランケート
された第2の部分と前記第3のオーバーラップ部分とを乗算するように構成される、請求
項1~請求項6のいずれか1項に記載のプロセッサ。 - 前記メモリー(300)は、さらに別の窓の第4のオーバーラップ部分(402)をさ
らに格納し、前記さらに別の窓は、前記第1の窓の長さと前記さらに別の窓の長さとの間
の長さを有する。請求項7に記載のプロセッサ。 - 前記窓コンストラクタ(206)は、前記窓制御信号(204)に応じて、シーケンス
を構築するように構成され、
前記シーケンスは、
前記第1の窓(1400)、
前記第2の窓(1402)、
前記第3のオーバーラップ部分および前記第4のオーバーラップ部分または前記第3
のオーバーラップ部分をのみを使用して構築された追加の窓、および
前記第3のオーバーラップ部分および前記第1の窓の前記第2のオーバーラップ部分
を使用してさらなる追加の窓(1410)を含む、請求項8に記載のプロセッサ。 - 前記窓コンストラクタ(206)は、前記第1の非対称窓の第2のオーバーラップ部分
の長さにトランケートされている前記トランケートされた第1のオーバーラップ部分を用
いて、第1のオーバーラップ部分を決定するように構成され、または
第4の非対称窓の第1のオーバーラップ部分の長さにトランケートされた第4の窓の第
2のオーバーラップ部分を使用して、前記第3の窓の前記第2のオーバーラップ部分を決
定するように構成される、請求項1~請求項9のいずれか1項に記載のプロセッサ。 - 前記窓コンストラクタ(206)は、
前記第1のオーバーラップ部分および前記第2の窓に続くさらなる窓の第1のオーバー
ラップ部分(1022)に対応する第2のオーバーラップ部分(1002)を使用して、
前記第2の窓を決定するように構成され、または
前記第3の窓(1450)に先行するさらなる窓の第2のオーバーラップ部分(134
2)に対応する第1のオーバーラップ部分(1331)を使用することによって前記第3
の窓を構築するように構成されている、請求項1~請求項10のいずれか1項に記載のプ
ロセッサ。 - 前記窓コンストラクタ(206)は、前記第1の非対称窓の前記第1のオーバーラップ
部分または前記第4の非対称窓の前記第2のオーバーラップ部分を、第2の窓に続くさら
なる窓の第1のオーバーラップ部分の長さまたは第3の窓(706、710)に先行する
さらなる窓の第2のオーバーラップ部分の長さより小さい前記第2または第3の窓の窓長
さよりも短いかまたは等しいトランケーション長さにトランケートするように構成される
、請求項1~請求項11のいずれか1項に記載のプロセッサ。 - トランケーション長さが、前記さらなる窓の第1のオーバーラップ部分または前記窓の
第2のオーバーラップ部分の長さよりも小さい窓の長さよりも小さい場合、前記窓コンス
トラクタ(206)は、第2または第3の窓の第1および第2のオーバーラップ部分の前
または後にゼロ(1131、1133)を挿入するように構成(712)され、前記窓コ
ンストラクタ(206)は、さらに前記第2の窓または前記第3の窓の前記第1および第
2のオーバーラップ部分の間にいくつかの「1」の値を挿入するように構成(714;1
132)される、請求項12に記載のプロセッサ。 - 前記第1の非対称窓は、第1のオーバーラップ部分、第2のオーバーラップ部分、前記
第1のオーバーラップ部分と前記第2のオーバーラップ部分との間の第1の高い値部分、
および、前記第2のオーバーラップ部分に続く第2の低い値部分を有し、前記高い値部分
の値は、0.9より大きく、前記低い値部分の値は、0.1よりも小さく、
前記第2のオーバーラップ部分の長さは、前記第1のオーバーラップ部分の長さよりも
小さい、請求項1~請求項3のいずれか1項に記載のプロセッサ。 - 複数の異なるサンプリングレートで動作するように構成された、請求項1~請求項14
のいずれか1項に記載のプロセッサであって、
前記プロセッサは、前記第1または第4の窓(403、404)の第1および第2のオ
ーバーラップ部分と、さらなる窓(402)の対称オーバーラップ部分と、前記さらなる
窓よりも短いさらなる窓の対称オーバーラップ部分(401)とを、格納するように構成
され、および
前記対称オーバーラップ部分と前記さらなる対称オーバーラップ部分は、昇順または降
順部分としてのみ格納され、前記窓コンストラクタ(206)は、算術演算または論理演
算によって、前記格納された昇順または降順の部分から、降順または昇順の部分を導出す
るように構成されている、プロセッサ。 - 請求項1~請求項15のいずれか1項に記載のプロセッサであって、
前記第1の窓は、20msの変換長のために構成され、前記窓コンストラクタは、10m
sまたは5msの変換長のためのさらなる窓をさらに使用するように構成され、および
前記第2の窓は、20msの変換長から10msまたは5msの変換長までの遷移窓で
あるか、または
前記第4の窓は、20msの変換長のために構成され、前記第3の窓は、5ms~20
msの変換長から、または、10ms~20msの変換長からの遷移窓である、プロセッ
サ。 - オーディオ信号(200)を処理する方法であって、
第1の非対称窓(1400)から第2の窓(1402)への変化を示すか、または第3
の窓(1450)から第4の非対称窓(1452)への変化を示すために、前記オーディ
オ信号(200)から窓制御信号(204)を導出するステップと、
前記第1の非対称窓(1400)の第1のオーバーラップ部分(800)を使用して前
記第2の窓(1402)を構築するステップ(206)と、
窓掛けされたオーディオ信号部分(210)を得るために、前記第1および前記第2の
窓または前記第3および前記第4の窓を適用する窓掛け部(208)と、を含み、
前記第2の窓(1402)は、前記第1の窓(1400)よりも小さいか、または、前
記第3の窓(1450)は、前記第4の窓(1452)よりも小さく、
前記窓コンストラクタ(206)は、前記第1の非対称窓のトランケートされた第1の
オーバーラップ部分を使用して前記第2の窓(1402)の第1のオーバーラップ部分(
1000)を決定するように構成され、
前記窓コンストラクタ(206)は、前記第4の非対称窓(1452)のトランケート
された第2のオーバーラップ部分(814)を使用して前記第3の窓(1450)の第2
のオーバーラップ部分(1330)を計算するように構成される、方法。 - 請求項17に記載の方法をコンピュータまたはプロセッサ上で実行するためのコンピュ
ータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14178774.7A EP2980791A1 (en) | 2014-07-28 | 2014-07-28 | Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions |
EP14178774.7 | 2014-07-28 | ||
JP2019198983A JP7043113B2 (ja) | 2014-07-28 | 2019-10-31 | プロセッサおよびトランケートされた分析または合成窓のオーバーラップ部分を使用したオーディオ信号の処理方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019198983A Division JP7043113B2 (ja) | 2014-07-28 | 2019-10-31 | プロセッサおよびトランケートされた分析または合成窓のオーバーラップ部分を使用したオーディオ信号の処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022091803A true JP2022091803A (ja) | 2022-06-21 |
JP7420848B2 JP7420848B2 (ja) | 2024-01-23 |
Family
ID=51224864
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017504679A Active JP6612846B2 (ja) | 2014-07-28 | 2015-07-24 | プロセッサおよびトランケートされた分析または合成窓のオーバーラップ部分を使用したオーディオ信号の処理方法 |
JP2019198983A Active JP7043113B2 (ja) | 2014-07-28 | 2019-10-31 | プロセッサおよびトランケートされた分析または合成窓のオーバーラップ部分を使用したオーディオ信号の処理方法 |
JP2022037055A Active JP7420848B2 (ja) | 2014-07-28 | 2022-03-10 | プロセッサおよびトランケートされた分析または合成窓のオーバーラップ部分を使用したオーディオ信号の処理方法 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017504679A Active JP6612846B2 (ja) | 2014-07-28 | 2015-07-24 | プロセッサおよびトランケートされた分析または合成窓のオーバーラップ部分を使用したオーディオ信号の処理方法 |
JP2019198983A Active JP7043113B2 (ja) | 2014-07-28 | 2019-10-31 | プロセッサおよびトランケートされた分析または合成窓のオーバーラップ部分を使用したオーディオ信号の処理方法 |
Country Status (18)
Country | Link |
---|---|
US (3) | US10262666B2 (ja) |
EP (4) | EP2980791A1 (ja) |
JP (3) | JP6612846B2 (ja) |
KR (1) | KR102006897B1 (ja) |
CN (2) | CN107077854B (ja) |
AR (1) | AR102037A1 (ja) |
AU (1) | AU2015295602B2 (ja) |
CA (1) | CA2956010C (ja) |
ES (2) | ES2940783T3 (ja) |
FI (1) | FI3584792T3 (ja) |
MX (1) | MX369755B (ja) |
MY (1) | MY192272A (ja) |
PL (2) | PL3584792T3 (ja) |
PT (2) | PT3175448T (ja) |
RU (1) | RU2677385C2 (ja) |
SG (1) | SG11201700694PA (ja) |
TW (1) | TWI581252B (ja) |
WO (1) | WO2016016120A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2980791A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions |
US9959877B2 (en) * | 2016-03-18 | 2018-05-01 | Qualcomm Incorporated | Multi channel coding |
JP6976277B2 (ja) * | 2016-06-22 | 2021-12-08 | ドルビー・インターナショナル・アーベー | 第一の周波数領域から第二の周波数領域にデジタル・オーディオ信号を変換するためのオーディオ・デコーダおよび方法 |
US10249307B2 (en) * | 2016-06-27 | 2019-04-02 | Qualcomm Incorporated | Audio decoding using intermediate sampling rate |
EP3483879A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
CN108847258B (zh) * | 2018-06-10 | 2021-06-04 | 北京酷我科技有限公司 | 一种截取音频控件的实现方法 |
CN111402917B (zh) * | 2020-03-13 | 2023-08-04 | 北京小米松果电子有限公司 | 音频信号处理方法及装置、存储介质 |
CN112309425B (zh) * | 2020-10-14 | 2024-08-30 | 浙江大华技术股份有限公司 | 一种声音变调方法、电子设备及计算机可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001127641A (ja) * | 1999-10-25 | 2001-05-11 | Victor Co Of Japan Ltd | オーディオ符号化装置、オーディオ符号化方法、及びオーディオ符号化信号記録媒体 |
JP2002118517A (ja) * | 2000-07-31 | 2002-04-19 | Sony Corp | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 |
JP2010501153A (ja) * | 2006-08-18 | 2010-01-14 | デジタル ライズ テクノロジー シーオー.,エルティーディー. | フレーム型データの可変分解能処理 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5297236A (en) | 1989-01-27 | 1994-03-22 | Dolby Laboratories Licensing Corporation | Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder |
CN1062963C (zh) * | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
CN101035527A (zh) * | 2004-09-13 | 2007-09-12 | 伊利舍医药品公司 | 治疗疾病的方法 |
US7987089B2 (en) * | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
US8036903B2 (en) * | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
CN102177426B (zh) | 2008-10-08 | 2014-11-05 | 弗兰霍菲尔运输应用研究公司 | 多分辨率切换音频编码/解码方案 |
US9384748B2 (en) * | 2008-11-26 | 2016-07-05 | Electronics And Telecommunications Research Institute | Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching |
AR075199A1 (es) | 2009-01-28 | 2011-03-16 | Fraunhofer Ges Forschung | Codificador de audio decodificador de audio informacion de audio codificada metodos para la codificacion y decodificacion de una senal de audio y programa de computadora |
WO2011048117A1 (en) * | 2009-10-20 | 2011-04-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation |
ES2805349T3 (es) * | 2009-10-21 | 2021-02-11 | Dolby Int Ab | Sobremuestreo en un banco de filtros de reemisor combinado |
EP2372705A1 (en) | 2010-03-24 | 2011-10-05 | Thomson Licensing | Method and apparatus for encoding and decoding excitation patterns from which the masking levels for an audio signal encoding and decoding are determined |
EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
CN103282958B (zh) * | 2010-10-15 | 2016-03-30 | 华为技术有限公司 | 信号分析器、信号分析方法、信号合成器、信号合成方法、变换器和反向变换器 |
FR2977969A1 (fr) * | 2011-07-12 | 2013-01-18 | France Telecom | Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee |
TWI606440B (zh) | 2012-09-24 | 2017-11-21 | 三星電子股份有限公司 | 訊框錯誤隱藏裝置 |
EP2720222A1 (en) * | 2012-10-10 | 2014-04-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns |
US9305559B2 (en) | 2012-10-15 | 2016-04-05 | Digimarc Corporation | Audio watermark encoding with reversing polarity and pairwise embedding |
RU2625560C2 (ru) * | 2013-02-20 | 2017-07-14 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ кодирования или декодирования аудиосигнала с использованием перекрытия, зависящего от местоположения перехода |
FR3004876A1 (fr) | 2013-04-18 | 2014-10-24 | France Telecom | Correction de perte de trame par injection de bruit pondere. |
US9431987B2 (en) | 2013-06-04 | 2016-08-30 | Sony Interactive Entertainment America Llc | Sound synthesis with fixed partition size convolution of audio signals |
EP2980791A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions |
-
2014
- 2014-07-28 EP EP14178774.7A patent/EP2980791A1/en not_active Withdrawn
-
2015
- 2015-07-24 PL PL19189446.8T patent/PL3584792T3/pl unknown
- 2015-07-24 PL PL15742237T patent/PL3175448T3/pl unknown
- 2015-07-24 MX MX2017001239A patent/MX369755B/es active IP Right Grant
- 2015-07-24 PT PT157422379T patent/PT3175448T/pt unknown
- 2015-07-24 CA CA2956010A patent/CA2956010C/en active Active
- 2015-07-24 SG SG11201700694PA patent/SG11201700694PA/en unknown
- 2015-07-24 WO PCT/EP2015/066997 patent/WO2016016120A1/en active Application Filing
- 2015-07-24 TW TW104124102A patent/TWI581252B/zh active
- 2015-07-24 EP EP23150316.0A patent/EP4191582B1/en active Active
- 2015-07-24 RU RU2017106179A patent/RU2677385C2/ru active
- 2015-07-24 EP EP15742237.9A patent/EP3175448B1/en active Active
- 2015-07-24 PT PT191894468T patent/PT3584792T/pt unknown
- 2015-07-24 AU AU2015295602A patent/AU2015295602B2/en active Active
- 2015-07-24 MY MYPI2017000130A patent/MY192272A/en unknown
- 2015-07-24 FI FIEP19189446.8T patent/FI3584792T3/fi active
- 2015-07-24 CN CN201580052557.2A patent/CN107077854B/zh active Active
- 2015-07-24 ES ES19189446T patent/ES2940783T3/es active Active
- 2015-07-24 CN CN202110621690.2A patent/CN113990333A/zh active Pending
- 2015-07-24 KR KR1020177004865A patent/KR102006897B1/ko active IP Right Grant
- 2015-07-24 JP JP2017504679A patent/JP6612846B2/ja active Active
- 2015-07-24 EP EP19189446.8A patent/EP3584792B1/en active Active
- 2015-07-24 ES ES15742237T patent/ES2751275T3/es active Active
- 2015-07-28 AR ARP150102393A patent/AR102037A1/es active IP Right Grant
-
2017
- 2017-01-27 US US15/417,236 patent/US10262666B2/en active Active
-
2019
- 2019-02-28 US US16/289,523 patent/US10902861B2/en active Active
- 2019-10-31 JP JP2019198983A patent/JP7043113B2/ja active Active
-
2021
- 2021-01-08 US US17/145,015 patent/US11664036B2/en active Active
-
2022
- 2022-03-10 JP JP2022037055A patent/JP7420848B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001127641A (ja) * | 1999-10-25 | 2001-05-11 | Victor Co Of Japan Ltd | オーディオ符号化装置、オーディオ符号化方法、及びオーディオ符号化信号記録媒体 |
JP2002118517A (ja) * | 2000-07-31 | 2002-04-19 | Sony Corp | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 |
JP2010501153A (ja) * | 2006-08-18 | 2010-01-14 | デジタル ライズ テクノロジー シーオー.,エルティーディー. | フレーム型データの可変分解能処理 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7043113B2 (ja) | プロセッサおよびトランケートされた分析または合成窓のオーバーラップ部分を使用したオーディオ信号の処理方法 | |
US10685662B2 (en) | Apparatus and method for encoding or decoding an audio signal using a transient-location dependent overlap | |
TW201701271A (zh) | 解碼已編碼之音頻訊號之解碼器及編碼音頻訊號之編碼器 | |
BR112017001630B1 (pt) | Processador e método para processamento de um sinal de áudio utilizando análise truncada ou partes de sobreposição da janela de síntese |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220411 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220411 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230309 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230322 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230615 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230919 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240111 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7420848 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |