JP6612846B2 - プロセッサおよびトランケートされた分析または合成窓のオーバーラップ部分を使用したオーディオ信号の処理方法 - Google Patents
プロセッサおよびトランケートされた分析または合成窓のオーバーラップ部分を使用したオーディオ信号の処理方法 Download PDFInfo
- Publication number
- JP6612846B2 JP6612846B2 JP2017504679A JP2017504679A JP6612846B2 JP 6612846 B2 JP6612846 B2 JP 6612846B2 JP 2017504679 A JP2017504679 A JP 2017504679A JP 2017504679 A JP2017504679 A JP 2017504679A JP 6612846 B2 JP6612846 B2 JP 6612846B2
- Authority
- JP
- Japan
- Prior art keywords
- window
- overlap portion
- asymmetric
- overlap
- length
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 42
- 238000000034 method Methods 0.000 title claims description 39
- 238000012545 processing Methods 0.000 title claims description 28
- 230000015572 biosynthetic process Effects 0.000 title description 37
- 238000003786 synthesis reaction Methods 0.000 title description 37
- 230000007704 transition Effects 0.000 claims description 75
- 239000002131 composite material Substances 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 28
- 238000006243 chemical reaction Methods 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 12
- 238000005070 sampling Methods 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 6
- 230000003247 decreasing effect Effects 0.000 claims description 4
- 238000005562 fading Methods 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 2
- 230000001052 transient effect Effects 0.000 description 16
- 230000009466 transformation Effects 0.000 description 15
- 230000003595 spectral effect Effects 0.000 description 10
- 238000013139 quantization Methods 0.000 description 6
- 238000010606 normalization Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 238000000844 transformation Methods 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000011914 asymmetric synthesis Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/028—Voice signal separating using properties of sound source
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M13/00—Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Image Analysis (AREA)
- Complex Calculations (AREA)
Description
・窓の左のオーバーフラップ部分は、完全またはほぼ完全な再構成が達成されるように、前の非対称窓の形状に一致する必要がある。
・オーバーラップしている部分の長さは、変換の長さが短いために制限される。
ここで、Lは、変換長とnのサンプルインデックスを表す。
様々な窓関数が使用される。修正重複変換として知られている形式を生成する窓が以下の式によって与えられ、
その窓がMP3及びMPEG−2AACに使用され、
がVorbisに使用される。AC−3はカイザー・ベッセル派生(KBD)窓を使用し、MPEG−4AACもKBD窓を使用することができる。
そして、
IMDCT(MDCT(a,b,c,d))=(a−bR,b−aR,c+dR,d+cR)/2
IMDCT(MDCT(A,B))=(A−AR,B+BR)/2
(B−BR,C+CR)/2
このIMDCTが、オーバーラップしている半部における先行するIMDCT結果と加算されると、反転した項が打ち消し合って単純にBが得られ、元のデータが回復される。
IMDCT(MDCT(a,b,c,d))=(a−bR,b−aR,c+dR,d+cR)/2
の結果に対する寄与分を区別することはできない。組合せc−dR等は、それらが加算されるときに、それらの組合せを打ち消すための正確に適切な正負符号を有する。
(−cR−d,a−bR)=(−d,a)−(b,c)R
と書き直す場合、第2の項(b,c)Rが中央において平滑な遷移を与える。しかしながら、第1の項(−d,a)には、−dの右端がaの左端と交わるような潜在的な不連続性がある。これが入力シーケンス(a,b,c,d)の境界付近の成分を0に向けて低減す
る窓関数を使用する理由である。
(B+BR)/2+(B−BR)/2=B
が得られることを想起されたい。ここで、MDCT入力及びIMDCT出力の両方に長さ2Nの窓関数を乗算すると仮定する。上述のように対称窓関数を想定し、それ故、その関数の形式は(W,WR)であり、Wは長さNのベクトルであり、Rは前出のように反転を示す。このとき、プリンセン−ブラッドリー条件は
W+WR 2=(1,1,...)
と書くことができ、2乗及び加算が要素毎に実施される。
WR・(WRB+(WRB)R)=WR・(WRB+WBR)=WR 2B+WWRBR
W・(WB−WRBR)=W2B−WWRBR
概して、右側のオーバーラップ部分1020は図8aの非対称の分析窓の右側部分802である、そして、次であるか次の窓の内の1022は、窓の第1のオーバーラップ部分であるかまたは場合によっては更なる遷移窓の左のオーバーラップ部分である。
参照
[2]Internet Engineering Task Force (IETF), RFC 6716, "Definition of the Opus Audio Codec," Sep. 2012.
[3]C. R. Helmrich, G. Markovic and B. Edler, "Improved Low-Delay MDCT-Based Coding of Both Stationary and Transient Audio Signals," in Proceedings of the IEEE 2014 Int. Conference on Acoustics, Speech and Signal Processing (ICASSP), 2014 or PCT/EP2014/053287.
Claims (18)
- オーディオ信号(200)を処理するためのプロセッサであって、
前記オーディオ信号(200)から窓制御信号(204)を導出するアナライザ(202)であって、
前記窓制御信号(204)は、第1のオーバーラップ部分および第2のオーバーラップ部分を含む第1の非対称窓(1400)から前記第1オーバーラップ部分を含む第2の窓(1402)への変化を示し、前記第1の非対称窓(1400)の前記第2のオーバーラップ部分(802)は前記第2の窓(1402)の第1のオーバーラップ部分(1000)と重複する、または、
前記窓制御信号(204)は、第2のオーバーラップ部分(1330)を含む第3の窓(1450)から前記第1のオーバーラップ部分(812)および第2のオーバーラップ部分(814)を含む第4の非対称窓(1452)への変化を示し、前記第3の窓(1450)の前記第2のオーバーラップ部分(1330)は前記第4の非対称窓(1452)の前記第1のオーバーラップ部分(812)と重複し、
前記第2の窓(1402)は前記第1の非対称窓(1400)よりも短い、または前記第3の窓(1450)は前記第4の非対称窓(1452)よりも短い、アナライザ(202)と、
前記第1の非対称窓(1400)の前記第1のオーバーラップ部分(800)を使用して前記第2の窓(1402)を構築するための窓コンストラクタ(206)であって、前記窓コンストラクタ(206)は、前記第1の非対称窓(1400)のトランケートされた第1のオーバーラップ部分を使用して前記第2の窓(1402)の前記第1のオーバーラップ部分(1000)を決定するように構成される、窓コンストラクタ(206)、または
前記第4の非対称窓(1452)の前記第2のオーバーラップ部分を使用して前記第3の窓(1450)を構築するための窓コンストラクタ(206)であって、前記窓コンストラクタは、前記第4の非対称窓(1452)のトランケートされた第2のオーバーラップ部分(814)を使用して前記第3の窓(1450)の前記第2のオーバーラップ部分(1330)を算出するように構成されている、窓コンストラクタ(206)、および
前記第1の非対称窓と前記第2の窓、または前記第3の窓と前記第4の非対称窓を適用して窓掛けされたオーディオ信号部分(210)を得るための窓掛け部(208)を含む、プロセッサ。 - 前記第1の非対称窓および前記第2の窓は、分析窓である、
または
前記第3の窓および前記第4の非対称窓は、合成窓であり、
前記プロセッサは、前記第1の非対称窓および前記第2の窓によって窓掛けされたサンプルをさらに処理するためのオーディオエンコーダ(110)をさらに含む、または、
前記プロセッサは、前記第3の窓および前記第4の非対称窓によって窓掛けされたサンプルをオーバーラップ加算するためのオーバーラップ加算部(174)をさらに含む、請求項1に記載のプロセッサ。 - 前記窓コンストラクタ(206)は、前記第1の非対称窓(1400)の前記第1のオーバーラップ部分(800)をトランケートすること、および、前記トランケートされた部分をフェードインすることによって、前記第2の窓(1402)の前記第1のオーバーラップ部分(1000)を導出するように構成される、または
前記窓コンストラクタ(206)は、前記第4の非対称窓(1452)の前記第2のオーバーラップ部分(1330)をトランケートすること、および、前記トランケートされた部分をフェードアウトすることによって、前記第3の窓(1450)の前記第2のオーバーラップ部分(1330)を導出するように構成される、請求項1または請求項2に記載のプロセッサ。 - 前記窓コンストラクタ(206)は、サインフェードイン機能またはサインフェードアウト機能を用いて前記フェードインまたは前記フェードアウトを実行するように構成される、請求項3に記載のプロセッサ。
- 前記窓コンストラクタ(206)は、前記プロセッサが使用するその他いずれかの窓のオーバーラップ部分(401)を使用して前記フェードインまたはフェードアウト(304)を計算するように構成される、請求項3または請求項4に記載のプロセッサ。
- 前記窓コンストラクタ(206)は、使用されるすべてのオーバーラップ部分のうちの最短のオーバーラップ部分(401)を使用して前記フェードインまたはフェードアウト(304)を計算するように構成される、請求項5に記載のプロセッサ。
- 所定のサンプリングレートについて、前記第1の非対称窓(1400)よりも短いさらなる窓のための前記第1の非対称窓の前記第1のオーバーラップ部分(800)、前記第1の非対称窓の第2のオーバーラップ部分(802)、および、第3のオーバーラップ部分(401)を格納したメモリー(300)をさらに含み、
前記窓コンストラクタ(206)は、
前記メモリー(300)から前記第1の非対称窓(1400)の第1のオーバーラップ部分(800)を取り出し、
前記第1の非対称窓(1400)の前記第1のオーバーラップ部分(800)を、前記第1の非対称窓(1400)の前記第1のオーバーラップ部分(800)の長さより短い長さにトランケートし、
前記さらなる窓のための前記第3のオーバーラップ部分を取り出し、
前記トランケートされた第1の部分と前記さらなる窓のための前記第3のオーバーラップ部分(401)とを乗算して前記第2の窓(1402)の前記第1のオーバーラップ部分(1000)を生成するように構成される、または
前記窓コンストラクタ(206)は、
前記メモリー(300)から前記第4の非対称窓(1452)の前記第2のオーバーラップ部分(814)を取り出し、
前記第4の非対称窓(1452)の前記第2のオーバーラップ部分(814)を前記第4の非対称窓(1452)の前記第2のオーバーラップ部分(814)の長さより短い長さにトランケート(312)し、
前記さらなる窓のための前記第3のオーバーラップ部分(401)を取り出し、且つ、
前記トランケートされた第2のオーバーラップ部分と前記さらなる窓のための前記第3のオーバーラップ部分(401)とを乗算して前記第3の窓(1450)の前記第2のオーバーラップ部分を生成するように構成される、請求項1〜請求項6のいずれか1項に記載のプロセッサ。 - 前記メモリー(300)は、さらに別の窓の第4のオーバーラップ部分(402)をさらに格納し、前記さらに別の窓の長さは、前記第1の非対称窓(1400)の長さと前記さらなる窓の長さの間である、請求項7に記載のプロセッサ。
- 前記窓コンストラクタ(206)は、前記窓制御信号(204)に応じて、シーケンスを構築するように構成され、
前記シーケンスは、
前記第1の非対称窓(1400)、
前記第2の窓(1402)、
前記さらなる窓のための前記第3のオーバーラップ部分(401)および前記さらに別の窓の前記第4のオーバーラップ部分(402)を使用して、または前記さらなる窓のための前記第3のオーバーラップ部分(401)のみを使用して構築された追加の窓、および
前記さらなる窓のための前記第3のオーバーラップ部分(401)および前記第1の非対称窓の前記第2のオーバーラップ部分を使用するさらなる追加の窓(1410)を含む、請求項8に記載のプロセッサ。 - 前記窓コンストラクタ(206)は、前記第1の非対称窓の第2のオーバーラップ部分の長さにトランケートされている前記第1の非対称窓(1400)のトランケートされた前記第1のオーバーラップ部分を用いて、前記第2の窓(1402)の第1のオーバーラップ部分を決定するように構成される、または
前記第4の非対称窓の前記第1のオーバーラップ部分の長さにトランケートされた前記第4の非対称窓の第2のオーバーラップ部分を使用して、前記第3の窓の前記第2のオーバーラップ部分を決定するように構成される、請求項1〜請求項9のいずれか1項に記載のプロセッサ。 - 前記窓コンストラクタ(206)は、
前記第2の窓(1402)の前記第1のオーバーラップ部分(1000)および前記第2の窓(1402)の第2のオーバーラップ部分(1002)を使用して、前記第2の窓を決定するように構成され、前記第2の窓(1402)の前記第2のオーバーラップ部分(1002)は、前記第2の窓(1402)に続くさらなる窓(1408)の第1のオーバーラップ部分(1022)に相当する、または
前記第3の窓(1450)の第1のオーバーラップ部分(1331)を使用することによって、前記第3の窓(1450)を構築するように構成され、前記第3の窓(1450)の前記第1のオーバーラップ部分(1331)は、前記第3の窓(1450)に先行するさらなる窓(1460)の第2のオーバーラップ部分(1342)に相当する、請求項1〜請求項10のいずれか1項に記載のプロセッサ。 - 前記窓コンストラクタ(206)は、前記第1の非対称窓の前記第1のオーバーラップ部分または前記第4の非対称窓の前記第2のオーバーラップ部分を、前記第2または第3の窓の窓長さから、前記第2の窓に続くさらなる窓の前記第1のオーバーラップ部分の長さまたは前記第3の窓(706、710)に先行するさらなる窓の第2のオーバーラップ部分の長さを引いた長さよりも短いかまたは等しいトランケーション長さにトランケートするように構成される、請求項1〜請求項11のいずれか1項に記載のプロセッサ。
- 前記トランケーション長さが、前記窓長さから前記さらなる窓の前記第1のオーバーラップ部分の長さまたは前記窓の第2のオーバーラップ部分の長さを引いた長さよりも短い場合、前記窓コンストラクタ(206)は、前記第2または第3の窓の前記第1および第2のオーバーラップ部分の前または後にゼロ(1131、1133)を挿入する(712)ように構成され、前記窓コンストラクタ(206)はさらに、前記第2の窓または前記第3の窓の前記第1および第2のオーバーラップ部分の間に値「1」(714;1132)をいくつか挿入するように構成される、請求項12に記載のプロセッサ。
- 前記第1の非対称窓は、第1のオーバーラップ部分、第2のオーバーラップ部分、前記第1のオーバーラップ部分と前記第2のオーバーラップ部分との間の第1の高い値部分、および、前記第2のオーバーラップ部分に続く第2の低い値部分を有し、前記高い値部分の値は0.9より大きく、前記低い値部分の値は0.1よりも小さく、
前記第2のオーバーラップ部分の長さは、前記第1のオーバーラップ部分の長さよりも小さい、請求項1〜請求項3のいずれか1項に記載のプロセッサ。 - 複数の異なるサンプリングレートで動作するように構成された、請求項1〜請求項14のいずれか1項に記載のプロセッサであって、
前記プロセッサは、各サンプリングレートについて、前記第1または第4の窓(403、404)の第1および第2のオーバーラップ部分と、さらなる窓(402)の対称オーバーラップ部分と、前記さらなる窓よりも短いさらに別の窓のさらなる対称オーバーラップ部分(401)とを格納するように構成され、且つ、
前記対称オーバーラップ部分と前記さらなる対称オーバーラップ部分は、増加する値のみを有する部分または減少する値のみ有する部分として記憶され、前記窓コンストラクタ(206)は、算術演算または論理演算によって、前記格納された増加部分または減少部分から減少部分または増加部分を導出するように構成されている、プロセッサ。 - 請求項1〜請求項15のいずれか1項に記載のプロセッサであって、
前記第1の非対称窓は、20msの変換長のために構成され、前記窓コンストラクタは、10msまたは5msの変換長のためにはさらなる窓をさらに使用するように構成され、且つ、
前記第2の窓は、変換長20msから変換長10msまたは5msへの遷移窓であるか、または
前記第4の非対称窓は、20msの変換長のために構成され、前記第3の窓は、変換長5msから20msへの、または、変換長10msから20msへの遷移窓である、プロセッサ。 - オーディオ信号(200)を処理する方法であって、
前記オーディオ信号(200)から窓制御信号(204)を導出するステップ(202)であって、
前記窓制御信号(204)は、第1のオーバーラップ部分(800)と第2のオーバーラップ部分(802)を含む第1の非対称窓(1400)から、第1のオーバーラップ部分(1000)を含む第2の窓(1402)への変化を示し、前記第1の非対称窓(1400)の前記第2のオーバーラップ部分(802)は前記第2の窓(1402)の前記第1のオーバーラップ部分(1000)と重複する、または
前記窓制御信号(204)は、第2のオーバーラップ部分(1300)を含む第3の窓(1450)から、第1のオーバーラップ部分(812)と第2のオーバーラップ部分(814)を含む第4の非対称窓(1452)への変化を示し、前記第3の窓(1450)の前記第2のオーバーラップ部分(1330)は前記第4の非対称窓(1452)の前記第1のオーバーラップ部分(812)と重複し、
前記第2の窓(1402)は前記第1の非対称窓(1400)よりも短い、または前記第3の窓(1450)は前記第4の非対称窓(1452)よりも短い、前記オーディオ信号(200)から窓制御信号(204)を導出するステップ(202)と、
前記第1の非対称窓(1400)の第1のオーバーラップ部分(800)を使用して前記第2の窓(1402)を構築するステップ(206)であって、前記構築するステップ(206)は前記第1の非対称窓(1400)のトランケートされた第1のオーバーラップ部分を使用して、前記第2の窓(1402)の前記第1のオーバーラップ部分を決定するステップを含む、前記第2の窓(1402)の窓を構築するステップ(206)、または
前記第4の非対称窓(1452)の前記第2のオーバーラップ部分(1330)を使用して前記第3の窓(1450)を構築するステップ(206)であって、前記構築するステップ(206)は前記第4の非対称窓(1452)のトランケートされたオーバーラップ部分(814)を使用して前記第3の窓(1450)の前記第2のオーバーラップ部分(1330)を計算するステップを含む、前記第3の窓(1450)を構築するステップ(206)、および
窓掛けされたオーディオ信号部分(210)を得るために、前記第1の非対称窓(1400)と前記第2の窓(1402)、または前記第3の窓(1450)と前記第4の非対称窓(1452)を適用するステップ(208)と、を含む、方法。 - コンピュータまたはプロセッサ上で動作している時に、請求項17に記載の方法を実行するためのコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14178774.7 | 2014-07-28 | ||
EP14178774.7A EP2980791A1 (en) | 2014-07-28 | 2014-07-28 | Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions |
PCT/EP2015/066997 WO2016016120A1 (en) | 2014-07-28 | 2015-07-24 | Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019198983A Division JP7043113B2 (ja) | 2014-07-28 | 2019-10-31 | プロセッサおよびトランケートされた分析または合成窓のオーバーラップ部分を使用したオーディオ信号の処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017526005A JP2017526005A (ja) | 2017-09-07 |
JP6612846B2 true JP6612846B2 (ja) | 2019-11-27 |
Family
ID=51224864
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017504679A Active JP6612846B2 (ja) | 2014-07-28 | 2015-07-24 | プロセッサおよびトランケートされた分析または合成窓のオーバーラップ部分を使用したオーディオ信号の処理方法 |
JP2019198983A Active JP7043113B2 (ja) | 2014-07-28 | 2019-10-31 | プロセッサおよびトランケートされた分析または合成窓のオーバーラップ部分を使用したオーディオ信号の処理方法 |
JP2022037055A Active JP7420848B2 (ja) | 2014-07-28 | 2022-03-10 | プロセッサおよびトランケートされた分析または合成窓のオーバーラップ部分を使用したオーディオ信号の処理方法 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019198983A Active JP7043113B2 (ja) | 2014-07-28 | 2019-10-31 | プロセッサおよびトランケートされた分析または合成窓のオーバーラップ部分を使用したオーディオ信号の処理方法 |
JP2022037055A Active JP7420848B2 (ja) | 2014-07-28 | 2022-03-10 | プロセッサおよびトランケートされた分析または合成窓のオーバーラップ部分を使用したオーディオ信号の処理方法 |
Country Status (18)
Country | Link |
---|---|
US (3) | US10262666B2 (ja) |
EP (4) | EP2980791A1 (ja) |
JP (3) | JP6612846B2 (ja) |
KR (1) | KR102006897B1 (ja) |
CN (2) | CN107077854B (ja) |
AR (1) | AR102037A1 (ja) |
AU (1) | AU2015295602B2 (ja) |
CA (1) | CA2956010C (ja) |
ES (2) | ES2940783T3 (ja) |
FI (1) | FI3584792T3 (ja) |
MX (1) | MX369755B (ja) |
MY (1) | MY192272A (ja) |
PL (2) | PL3584792T3 (ja) |
PT (2) | PT3584792T (ja) |
RU (1) | RU2677385C2 (ja) |
SG (1) | SG11201700694PA (ja) |
TW (1) | TWI581252B (ja) |
WO (1) | WO2016016120A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2980791A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions |
US9959877B2 (en) * | 2016-03-18 | 2018-05-01 | Qualcomm Incorporated | Multi channel coding |
JP6976277B2 (ja) * | 2016-06-22 | 2021-12-08 | ドルビー・インターナショナル・アーベー | 第一の周波数領域から第二の周波数領域にデジタル・オーディオ信号を変換するためのオーディオ・デコーダおよび方法 |
US10249307B2 (en) * | 2016-06-27 | 2019-04-02 | Qualcomm Incorporated | Audio decoding using intermediate sampling rate |
EP3483879A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
CN108847258B (zh) * | 2018-06-10 | 2021-06-04 | 北京酷我科技有限公司 | 一种截取音频控件的实现方法 |
CN111402917B (zh) * | 2020-03-13 | 2023-08-04 | 北京小米松果电子有限公司 | 音频信号处理方法及装置、存储介质 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5297236A (en) * | 1989-01-27 | 1994-03-22 | Dolby Laboratories Licensing Corporation | Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder |
CN1062963C (zh) * | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
JP3518737B2 (ja) * | 1999-10-25 | 2004-04-12 | 日本ビクター株式会社 | オーディオ符号化装置、オーディオ符号化方法、及びオーディオ符号化信号記録媒体 |
JP2002118517A (ja) * | 2000-07-31 | 2002-04-19 | Sony Corp | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 |
CN101035527A (zh) * | 2004-09-13 | 2007-09-12 | 伊利舍医药品公司 | 治疗疾病的方法 |
US8744862B2 (en) * | 2006-08-18 | 2014-06-03 | Digital Rise Technology Co., Ltd. | Window selection based on transient detection and location to provide variable time resolution in processing frame-based data |
US7987089B2 (en) | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
US8036903B2 (en) * | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
RU2520402C2 (ru) * | 2008-10-08 | 2014-06-27 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Переключаемая аудио кодирующая/декодирующая схема с мультиразрешением |
US9384748B2 (en) * | 2008-11-26 | 2016-07-05 | Electronics And Telecommunications Research Institute | Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching |
MX2011007925A (es) | 2009-01-28 | 2011-08-17 | Dten Forschung E V Fraunhofer Ges Zur Foeerderung Der Angewan | Codificador de audio, decodificador de audio, información de audio codificada, métodos para la codificación y decodificación de una señal de audio y programa de computadora. |
WO2011047887A1 (en) * | 2009-10-21 | 2011-04-28 | Dolby International Ab | Oversampling in a combined transposer filter bank |
MX2012004648A (es) * | 2009-10-20 | 2012-05-29 | Fraunhofer Ges Forschung | Codificacion de señal de audio, decodificador de señal de audio, metodo para codificar o decodificar una señal de audio utilizando una cancelacion del tipo aliasing. |
EP2372705A1 (en) | 2010-03-24 | 2011-10-05 | Thomson Licensing | Method and apparatus for encoding and decoding excitation patterns from which the masking levels for an audio signal encoding and decoding are determined |
EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
EP2619758B1 (en) * | 2010-10-15 | 2015-08-19 | Huawei Technologies Co., Ltd. | Audio signal transformer and inverse transformer, methods for audio signal analysis and synthesis |
FR2977969A1 (fr) * | 2011-07-12 | 2013-01-18 | France Telecom | Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee |
CN107731237B (zh) * | 2012-09-24 | 2021-07-20 | 三星电子株式会社 | 时域帧错误隐藏设备 |
EP2720222A1 (en) * | 2012-10-10 | 2014-04-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns |
US9305559B2 (en) | 2012-10-15 | 2016-04-05 | Digimarc Corporation | Audio watermark encoding with reversing polarity and pairwise embedding |
SG11201506542QA (en) * | 2013-02-20 | 2015-09-29 | Fraunhofer Ges Forschung | Apparatus and method for encoding or decoding an audio signal using a transient-location dependent overlap |
FR3004876A1 (fr) | 2013-04-18 | 2014-10-24 | France Telecom | Correction de perte de trame par injection de bruit pondere. |
US9431987B2 (en) | 2013-06-04 | 2016-08-30 | Sony Interactive Entertainment America Llc | Sound synthesis with fixed partition size convolution of audio signals |
EP2980791A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions |
-
2014
- 2014-07-28 EP EP14178774.7A patent/EP2980791A1/en not_active Withdrawn
-
2015
- 2015-07-24 ES ES19189446T patent/ES2940783T3/es active Active
- 2015-07-24 CN CN201580052557.2A patent/CN107077854B/zh active Active
- 2015-07-24 SG SG11201700694PA patent/SG11201700694PA/en unknown
- 2015-07-24 MX MX2017001239A patent/MX369755B/es active IP Right Grant
- 2015-07-24 CA CA2956010A patent/CA2956010C/en active Active
- 2015-07-24 AU AU2015295602A patent/AU2015295602B2/en active Active
- 2015-07-24 KR KR1020177004865A patent/KR102006897B1/ko active IP Right Grant
- 2015-07-24 EP EP15742237.9A patent/EP3175448B1/en active Active
- 2015-07-24 PL PL19189446.8T patent/PL3584792T3/pl unknown
- 2015-07-24 EP EP19189446.8A patent/EP3584792B1/en active Active
- 2015-07-24 FI FIEP19189446.8T patent/FI3584792T3/fi active
- 2015-07-24 CN CN202110621690.2A patent/CN113990333A/zh active Pending
- 2015-07-24 TW TW104124102A patent/TWI581252B/zh active
- 2015-07-24 PT PT191894468T patent/PT3584792T/pt unknown
- 2015-07-24 JP JP2017504679A patent/JP6612846B2/ja active Active
- 2015-07-24 PL PL15742237T patent/PL3175448T3/pl unknown
- 2015-07-24 PT PT157422379T patent/PT3175448T/pt unknown
- 2015-07-24 MY MYPI2017000130A patent/MY192272A/en unknown
- 2015-07-24 RU RU2017106179A patent/RU2677385C2/ru active
- 2015-07-24 EP EP23150316.0A patent/EP4191582B1/en active Active
- 2015-07-24 WO PCT/EP2015/066997 patent/WO2016016120A1/en active Application Filing
- 2015-07-24 ES ES15742237T patent/ES2751275T3/es active Active
- 2015-07-28 AR ARP150102393A patent/AR102037A1/es active IP Right Grant
-
2017
- 2017-01-27 US US15/417,236 patent/US10262666B2/en active Active
-
2019
- 2019-02-28 US US16/289,523 patent/US10902861B2/en active Active
- 2019-10-31 JP JP2019198983A patent/JP7043113B2/ja active Active
-
2021
- 2021-01-08 US US17/145,015 patent/US11664036B2/en active Active
-
2022
- 2022-03-10 JP JP2022037055A patent/JP7420848B2/ja active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7043113B2 (ja) | プロセッサおよびトランケートされた分析または合成窓のオーバーラップ部分を使用したオーディオ信号の処理方法 | |
JP6175148B2 (ja) | マルチオーバーラップ部分を使用して符号化済み信号を生成し又は符号化済みオーディオ信号を復号化するための装置及び方法 | |
TWI453731B (zh) | 音訊編碼器與解碼器、用於編碼已取樣音訊信號之訊框及用於解碼已編碼訊框之方法、及電腦程式產品 | |
CA2831176C (en) | Apparatus and method for audio encoding and decoding employing sinusoidal substitution | |
JP6728209B2 (ja) | 符号化されたオーディオ信号を復号するためのデコーダおよびオーディオ信号を符号化するためのエンコーダ | |
CA2921195C (en) | Apparatus and method for processing an audio signal using a combination in an overlap range | |
BR112017001630B1 (pt) | Processador e método para processamento de um sinal de áudio utilizando análise truncada ou partes de sobreposição da janela de síntese |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A529 | Written submission of copy of amendment under article 34 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A529 Effective date: 20170323 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170323 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180508 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20180808 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190205 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190426 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190705 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190802 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191001 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191031 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6612846 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |