JP7258135B2 - 処理されたオーディオ信号表現を提供するための装置およびオーディオ信号プロセッサ、オーディオデコーダ、オーディオエンコーダ、方法、ならびにコンピュータプログラム - Google Patents
処理されたオーディオ信号表現を提供するための装置およびオーディオ信号プロセッサ、オーディオデコーダ、オーディオエンコーダ、方法、ならびにコンピュータプログラム Download PDFInfo
- Publication number
- JP7258135B2 JP7258135B2 JP2021524211A JP2021524211A JP7258135B2 JP 7258135 B2 JP7258135 B2 JP 7258135B2 JP 2021524211 A JP2021524211 A JP 2021524211A JP 2021524211 A JP2021524211 A JP 2021524211A JP 7258135 B2 JP7258135 B2 JP 7258135B2
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- representation
- signal representation
- processed
- input audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 565
- 238000000034 method Methods 0.000 title claims description 155
- 238000004590 computer program Methods 0.000 title claims description 14
- 238000012545 processing Methods 0.000 claims description 307
- 230000003595 spectral effect Effects 0.000 claims description 83
- 238000004458 analytical method Methods 0.000 claims description 63
- 230000006978 adaptation Effects 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 10
- 230000003321 amplification Effects 0.000 claims description 6
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 description 23
- 230000003044 adaptive effect Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 230000009466 transformation Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 8
- 230000002123 temporal effect Effects 0.000 description 6
- 230000003068 static effect Effects 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000005192 partition Methods 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000009432 framing Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 241000473391 Archosargus rhomboidalis Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/45—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Control Of Amplification And Gain Control (AREA)
- Amplifiers (AREA)
- Electrophonic Musical Instruments (AREA)
- Circuits Of Receivers In General (AREA)
Description
yr[n]=f(y[n],wa[n]),n∈[ns;ne]
を提案する。(たとえば、y[n]をyr[n]にマッピングする窓掛け解除関数の)適応は、好ましくは、分析窓waに、たとえば次のパラメータの1つまたは複数に基づく。
・現在のフレームおよび場合によっては過去のフレームの周波数領域における処理において利用可能であり使用されるパラメータ
・現在のフレームの周波数領域表現から導出されるパラメータ
・周波数領域における処理および逆周波数変換の後の現在のフレームの時間信号から導出されるパラメータ
・重複加算を用いた順方向周波数変換および逆方向周波数変換を使用して周波数領域において信号を処理した後の信号のさらなる処理を使用する低遅延処理システム。
・エンコーダにおいて、ダウンミックスが周波数領域のステレオ入力信号を処理することによって作成され、周波数領域ダウンミックスが、EVSのような最新のモノ発話/音楽エンコーダを使用したさらなるモノ符号化のために時間領域へと戻るように変換される、パラメトリックステレオエンコーダまたはステレオデコーダまたはステレオエンコーダ/デコーダシステムにおける使用のため。
・EVSコーディング規格の未来のステレオ拡張、すなわちこのシステムのDFTステレオ部分における使用のため。
・実施形態は3GPP IVAS装置またはシステムにおいて使用され得る。
いくつかの態様が装置の文脈で説明されるが、これらの態様は、対応する方法の説明も表すことが明らかであり、ブロックまたはデバイスは、方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップの文脈で説明される態様は、対応する装置の対応するブロックまたはアイテムまたは特徴の説明も表す。方法ステップの一部またはすべてが、たとえばマイクロプロセッサ、プログラマブルコンピュータ、または電子回路のような、ハードウェア装置によって(またはそれを使用して)実行され得る。いくつかの実施形態では、最も重要な方法ステップのうちの1つまたは複数は、そのような装置によって実行され得る。
なお、更なる実施の態様は以下の通りである。
[実施態様1]
入力オーディオ信号表現(120)に基づいて、処理されたオーディオ信号表現(110)を提供するための装置(100)であって、
前記装置(100)が、前記入力オーディオ信号表現(120)に基づいて、前記処理されたオーディオ信号表現(110)を提供するために、窓掛け解除(130)を適用するように構成され、
前記装置(100)が、1つまたは複数の信号特性(140、140 1 から140 4 )に応じて、および/または、前記入力オーディオ信号表現(120)の提供のために使用される1つまたは複数の処理パラメータ(150、150 1 から150 4 )に応じて、前記窓掛け解除(130)を適応させるように構成される、装置(100)。
[実施態様2]
前記装置(100)が、前記入力オーディオ信号表現(120)を導出するために使用される処理を決定する処理パラメータ(150、150 1 から150 4 )に応じて前記窓掛け解除(130)を適応させるように構成される、実施態様1に記載の装置(100)。
[実施態様3]
前記装置(100)が、前記入力オーディオ信号表現(120)の、および/または、前記入力オーディオ信号表現(120)の導出元の中間信号(123 1 から123 2 )表現の信号特性(140、140 1 から140 4 )に応じて、前記窓掛け解除(130)を適応させるように構成される、実施態様1または2に記載の装置(100)。
[実施態様4]
前記装置(100)が、前記窓掛け解除(130)が適用される信号の時間領域表現の信号特性(140、140 1 から140 4 )を記述する、1つまたは複数のパラメータを取得するように構成され、および/または、
前記装置(100)が、前記窓掛け解除(130)が適用される時間領域入力オーディオ信号の導出元の中間信号(123 1 から123 2 )の周波数領域表現の信号特性(140、140 1 から140 4 )を記述する、1つまたは複数のパラメータを取得するように構成され、
前記装置(100)が、前記1つまたは複数のパラメータに応じて前記窓掛け解除(130)を適応させるように構成される、実施態様3に記載の装置(100)。
[実施態様5]
前記装置(100)が、前記入力オーディオ信号表現(120)の提供のために使用される分析窓掛け(210)を少なくとも部分的に戻すために前記窓掛け解除(130)を適応させるように構成される、実施態様1から4のいずれか一つに記載の装置(100)。
[実施態様6]
前記装置(100)が、後続の処理単位(124 i+1 )の信号値の欠如を少なくとも部分的に補償するために前記窓掛け解除(130)を適応させるように構成される、実施態様1から5のいずれか一つに記載の装置(100)。
[実施態様7]
前記窓掛け解除(130)が、前記処理されたオーディオ信号表現(110)の所与の処理単位(124 i )と少なくとも部分的に時間的に重複する(126)後続の処理単位(124 i+1 )が利用可能になる前に、前記所与の処理単位(124 i )を提供するように構成される、実施態様1から6のいずれか一つに記載の装置(100)。
[実施態様8]
前記装置(100)が、前記所与の処理されたオーディオ信号表現(110)と、前記入力オーディオ信号表現(120)の後続の処理単位(124 i+1 )間の重複加算の結果との偏差を制限するために、前記窓掛け解除(130)を適応させるように構成される、実施態様1から7のいずれか一つに記載の装置(100)。
[実施態様9]
前記装置(100)が、前記処理されたオーディオ信号表現(110)の値を制限するために前記窓掛け解除(130)を適応させるように構成される、実施態様1から8のいずれか一つに記載の装置(100)。
[実施態様10]
前記装置(100)が、入力オーディオ信号表現(120)の処理単位(124 i )の最後の部分(126)において0に収束しない前記入力オーディオ信号表現(120)に対して、前記処理単位(124 i )の前記最後の部分(126)における前記窓掛け解除(130)によって適用されるスケーリングが、前記入力オーディオ信号表現(120)が前記処理単位(124 i )の前記最後の部分(126)において0に収束する場合と比較して低減されるように、前記窓掛け解除(130)を適応させるように構成される、実施態様1から9のいずれか一つに記載の装置(100)。
[実施態様11]
前記装置(100)が、前記窓掛け解除(130)を適応させて、それにより前記処理されたオーディオ信号表現(110)のダイナミックレンジを制限するように構成される、実施態様1から10のいずれか一つに記載の装置(100)。
[実施態様12]
前記装置(100)が、前記入力オーディオ信号表現(120)のDC成分に応じて前記窓掛け解除(130)を適応させるように構成される、実施態様1から11のいずれか一つに記載の装置(100)。
[実施態様13]
前記装置(100)が、前記入力オーディオ信号表現(120)のDC成分を少なくとも部分的に除去するように構成される、実施態様1から12のいずれか一つに記載の装置(100)。
[実施態様14]
前記窓掛け解除(130)が、前記処理されたオーディオ信号表現(110)を取得するために、窓値(132)に応じて、前記入力オーディオ信号表現(120)のDCが除去されたまたはDCが低減されたバージョンをスケーリングするように構成される、実施態様1から13のいずれか一つに記載の装置(100)。
[実施態様15]
前記窓掛け解除(130)が、前記入力オーディオ信号表現(120)のDCが除去されたまたはDCが低減されたバージョンのスケーリングの後で、DC成分を少なくとも部分的に再導入するように構成される、実施態様1から14のいずれか一つに記載の装置(100)。
[実施態様16]
前記窓掛け解除(130)が、
dがDC成分であり、
nが時間インデックスであり、
n s が重複領域の最初のサンプルの時間インデックスであり、
n e が前記重複領域(126)の最後のサンプルの時間インデックスであり、
w a [n]が、前記入力オーディオ信号表現(120)の提供のために使用される分析窓(132)である、実施態様1から15のいずれか一つに記載の装置(100)。
[実施態様17]
前記装置(100)が、前記入力オーディオ信号表現(120)の提供において使用される分析窓(132)が1つまたは複数の0の値を備える時間部分(134)にある、前記入力オーディオ信号表現(120)の1つまたは複数の値を使用して前記DC成分を決定するように構成される、実施態様1から16のいずれか一つに記載の装置(100)。
[実施態様18]
前記装置(100)が、スペクトル領域から時間領域への変換(240)を使用して前記入力オーディオ信号表現(120)を取得するように構成される、実施態様1から17のいずれか一つに記載の装置(100)。
[実施態様19]
処理されるべきオーディオ信号(122)に基づいて、処理されたオーディオ信号表現(110)を提供するためのオーディオ信号プロセッサ(300)であって、
前記オーディオ信号プロセッサ(300)が、処理されるべきオーディオ信号(122)の処理単位の時間領域表現の窓が掛けられたバージョン(123 1 )を取得するために、処理されるべき前記オーディオ信号(122)の前記処理単位の前記時間領域表現に分析窓掛け(210)を適用するように構成され、
前記オーディオ信号プロセッサ(300)が、前記窓が掛けられたバージョン(123 1 )に基づいて、処理されるべき前記オーディオ信号(122)のスペクトル領域表現(123 2 )を取得するように構成され、
前記オーディオ信号プロセッサ(300)が、処理されたスペクトル領域表現(123 3 )を取得するために、前記取得されたスペクトル領域表現(123 2 )にスペクトル領域処理(230)を適用するように構成され、
前記オーディオ信号プロセッサ(300)が、前記処理されたスペクトル領域表現(123 3 )に基づいて、処理された時間領域表現(123 4 )を取得するように構成され、
前記オーディオ信号プロセッサ(300)が、実施態様1から18のいずれか一つに記載の装置(100)を備え、前記装置(100)が、前記処理された時間領域表現(123 3 )を、その入力オーディオ信号表現(120)として取得し、それに基づいて、前記処理されたオーディオ信号表現(110)を提供するように構成される、オーディオ信号プロセッサ。
[実施態様20]
前記装置(100)が、前記分析窓掛け(210)の窓値を使用して前記窓掛け解除(130)を適応させるように構成される、実施態様19に記載のオーディオ信号プロセッサ。
[実施態様21]
符号化されたオーディオ表現(420)に基づいて、復号されたオーディオ表現(410)を提供するためのオーディオデコーダ(400)であって、
前記オーディオデコーダ(400)が、前記符号化されたオーディオ表現(420)に基づいて、符号化されたオーディオ信号(420)のスペクトル領域表現(430)を取得するように構成され、
前記オーディオデコーダ(400)が、前記スペクトル領域表現(430)に基づいて、前記符号化されたオーディオ信号(420)の時間領域表現(440)を取得するように構成され、
前記オーディオデコーダが、実施態様1から18のいずれか一つに記載の装置(100)を備え、
前記装置(100)が、前記時間領域表現(440)を、その入力オーディオ信号表現(120)として取得し、それに基づいて、前記処理されたオーディオ信号表現(110)を提供するように構成される、オーディオデコーダ。
[実施態様22]
前記オーディオデコーダ(400)が、所与の処理単位(124 i )と時間的に重複する後続の処理単位(124 i+1 )が復号される前に、前記所与の処理単位(124 i )の前記オーディオ信号表現(122)を提供するように構成される、実施態様21に記載のオーディオデコーダ。
[実施態様23]
入力オーディオ信号表現に基づいて、符号化されたオーディオ表現を提供するためのオーディオエンコーダであって、
前記オーディオエンコーダが、実施態様1から18のいずれか一つに記載の装置を備え、前記装置が、前記入力オーディオ信号表現に基づいて、処理されたオーディオ信号表現を取得するように構成され、
前記オーディオエンコーダが、前記処理されたオーディオ信号表現を符号化するように構成される、オーディオエンコーダ。
[実施態様24]
前記オーディオエンコーダが、前記処理されたオーディオ信号表現に基づいてスペクトル領域表現を取得するように構成され、前記処理されたオーディオ信号表現が時間領域表現であり、
前記オーディオエンコーダが、前記符号化されたオーディオ表現を取得するために、スペクトル領域符号化を使用して前記スペクトル領域表現を符号化するように構成される、実施態様23に記載のオーディオエンコーダ。
[実施態様25]
前記オーディオエンコーダが、前記符号化されたオーディオ表現を取得するために、時間領域符号化を使用して前記処理されたオーディオ信号表現を符号化するように構成される、実施態様23または24に記載のオーディオエンコーダ。
[実施態様26]
前記オーディオエンコーダが、スペクトル領域符号化と時間領域符号化を切り替える切り替え符号化を使用して、前記処理されたオーディオ信号表現を符号化するように構成される、実施態様23から25のいずれか一つに記載のオーディオエンコーダ。
[実施態様27]
前記装置が、スペクトル領域において、前記入力オーディオ信号表現を形成する複数の入力オーディオ信号のダウンミックスを実行し、ダウンミックスされた信号を前記処理されたオーディオ信号表現として提供するように構成される、実施態様23から26のいずれか一つに記載のオーディオエンコーダ。
[実施態様28]
入力オーディオ信号表現(120)に基づいて、処理されたオーディオ信号表現(110)を提供するための装置(100)であって、
前記装置(100)が、前記入力オーディオ信号表現(120)に基づいて、前記処理されたオーディオ信号表現(110)を提供するために、窓掛け解除(130)を適用するように構成され、
前記装置(100)が、前記入力オーディオ信号表現(120)の提供のために使用される、1つまたは複数の信号特性(140、140 1 から140 4 )に応じて、および/または、1つまたは複数の処理パラメータ(150、150 1 から150 4 )に応じて、前記窓掛け解除(130)を適応させるように構成され、
前記窓掛け解除(130)が、前記入力オーディオ信号表現の提供のために使用される分析窓掛けを少なくとも部分的に戻し、
前記窓掛け(130)が、前記処理されたオーディオ信号表現(110)の所与の処理単位(124 i )と少なくとも部分的に時間的に重複する(126)後続の処理単位(124 i+1 )が利用可能になる前に、前記所与の処理単位(124 i )を提供するように構成される、装置。
[実施態様29]
入力オーディオ信号表現(120)に基づいて、処理されたオーディオ信号表現(110)を提供するための装置(100)であって、
前記装置(100)が、前記入力オーディオ信号表現(120)に基づいて、前記処理されたオーディオ信号表現(110)を提供するために、窓掛け解除(130)を適用するように構成され、
前記装置(100)が、1つまたは複数の信号特性(140、140 1 から140 4 )に応じて、および/または、前記入力オーディオ信号表現(120)の提供のために使用される1つまたは複数の処理パラメータ(150、150 1 から150 4 )に応じて、前記窓掛け解除(130)を適応させるように構成され、
前記窓掛け解除(130)が、前記入力オーディオ信号表現の提供のために使用される分析窓掛けを少なくとも部分的に戻し、
前記装置(100)が、前記窓掛け解除(130)を適応させて、それにより前記処理されたオーディオ信号表現(110)のダイナミックレンジを制限するように構成される、装置。
[実施態様30]
入力オーディオ信号表現に基づいて、処理されたオーディオ信号表現を提供するための方法(500)であって、
前記方法が、前記入力オーディオ信号表現に基づいて、前記処理されたオーディオ信号表現を提供するために、窓掛け解除を適用する(510)ステップを備え、
前記方法が、1つまたは複数の信号特性(140、140 1 から140 4 )に応じて、および/または、前記入力オーディオ信号表現の提供のために使用される1つまたは複数の処理パラメータ(150、150 1 から150 4 )に応じて、前記窓掛け解除を適応させる(520)ステップを備える、方法。
[実施態様31]
処理されるべきオーディオ信号に基づいて、処理されたオーディオ信号表現を提供するための方法(600)であって、
前記方法が、処理されるべきオーディオ信号の処理単位の時間領域表現の窓が掛けられたバージョンを取得するために、処理されるべき前記オーディオ信号の前記処理単位の前記時間領域表現に分析窓掛けを適用する(610)ステップを備え、
前記方法が、前記窓が掛けられたバージョンに基づいて、処理されるべき前記オーディオ信号のスペクトル領域表現を取得する(620)ステップを備え、
前記方法が、処理されたスペクトル領域表現を取得するために、スペクトル領域処理を前記取得されたスペクトル領域表現に適用する(630)ステップを備え、
前記方法が、前記処理されたスペクトル領域表現に基づいて、処理された時間領域表現を取得する(640)ステップを備え、
前記方法が、実施態様30に記載の方法を使用して、前記処理されたオーディオ信号表現を提供する(650)ステップを備え、前記処理された時間領域表現が、実施態様30に記載の方法を実行するための前記入力オーディオ信号として使用される、方法。
[実施態様32]
符号化されたオーディオ表現に基づいて、復号されたオーディオ表現を提供するための方法(700)であって、
前記方法が、前記符号化されたオーディオ表現に基づいて、符号化されたオーディオ信号のスペクトル領域表現を取得する(710)ステップを備え、
前記方法が、前記スペクトル領域表現に基づいて、前記符号化されたオーディオ信号の時間領域表現を取得する(720)ステップを備え、
前記方法が、実施態様30に記載の方法を使用して、前記処理されたオーディオ信号表現を提供する(730)ステップを備え、前記時間領域表現が、実施態様30に記載の方法を実行するための前記入力オーディオ信号として使用される、方法。
[実施態様33]
入力オーディオ信号表現に基づいて、符号化されたオーディオ表現を提供する(930)ための方法(900)であって、
前記方法が、実施態様30に記載の方法を使用して前記入力オーディオ信号表現に基づいて、処理されたオーディオ信号表現を取得する(910)ステップを備え、
前記方法が、前記処理されたオーディオ信号表現を符号化する(920)ステップを備える、方法。
[実施態様34]
コンピュータ上で実行されると、実施態様30、実施態様31、実施態様32、または実施態様33に記載の方法を実行するためのプログラムコードを有する、コンピュータプログラム。
110 処理されたオーディオ信号表現
120 入力オーディオ信号表現
122 信号
123 中間信号
124 処理単位
126 最後の部分
130 窓掛け解除
132 分析窓掛け
140 信号特性
150 処理パラメータ
200 外部デバイス
410 処理されたオーディオ信号表現
420 符号化されたオーディオ表現
430 スペクトル領域表現
440 時間領域表現
800 オーディオエンコーダ
810 符号化されたオーディオ表現
820 処理されたオーディオ信号表現
870 スペクトル領域符号化
872 時間領域符号化
Claims (38)
- 入力オーディオ信号表現(120)に基づいて、処理されたオーディオ信号表現(110)を提供するための装置(100)であって、
前記装置(100)が、前記入力オーディオ信号表現(120)に基づいて、前記処理されたオーディオ信号表現(110)を提供するために、窓掛け解除(130)を適用するように構成され、
前記装置(100)が、1つまたは複数の信号特性(140、1401から1404)に応じて、および/または、前記入力オーディオ信号表現(120)の提供のために使用される1つまたは複数の処理パラメータ(150、1501から1504)に応じて、前記窓掛け解除(130)を適応させるように構成され、
前記窓掛け解除(130)が、前記入力オーディオ信号表現の提供のために使用される分析窓掛けを少なくとも部分的に戻し、
前記窓掛け解除(130)が、前記処理されたオーディオ信号表現(110)の所与の処理単位(124i)と少なくとも部分的に時間的に重複する(126)後続の処理単位(124i+1)が利用可能になる前に、前記所与の処理単位(124i)を提供するように構成される、装置(100)。 - 前記装置(100)が、前記入力オーディオ信号表現(120)を導出するために使用される処理を決定する処理パラメータ(150、1501から1504)に応じて前記窓掛け解除(130)を適応させるように構成される、請求項1に記載の装置(100)。
- 前記装置(100)が、前記入力オーディオ信号表現(120)の、および/または、前記入力オーディオ信号表現(120)の導出元の中間信号(1231から1232)表現の信号特性(140、1401から1404)に応じて、前記窓掛け解除(130)を適応させるように構成される、請求項1または2に記載の装置(100)。
- 前記装置(100)が、前記窓掛け解除(130)が適用される信号の時間領域表現の信号特性(140、1401から1404)を記述する、1つまたは複数のパラメータを取得するように構成され、および/または、
前記装置(100)が、前記窓掛け解除(130)が適用される時間領域入力オーディオ信号の導出元の中間信号(1231から1232)の周波数領域表現の信号特性(140、1401から1404)を記述する、1つまたは複数のパラメータを取得するように構成され、
前記装置(100)が、前記1つまたは複数のパラメータに応じて前記窓掛け解除(130)を適応させるように構成される、請求項3に記載の装置(100)。 - 前記装置(100)が、後続の処理単位(124i+1)の信号値の欠如を少なくとも部分的に補償するために前記窓掛け解除(130)を適応させるように構成される、請求項1から4のいずれか一項に記載の装置(100)。
- 前記装置(100)が、前記所与の処理されたオーディオ信号表現(110)と、前記入力オーディオ信号表現(120)の後続の処理単位(124i+1)間の重複加算の結果との偏差を制限するために、前記窓掛け解除(130)を適応させるように構成される、請求項1から5のいずれか一項に記載の装置(100)。
- 前記装置(100)が、前記処理されたオーディオ信号表現(110)の値を制限するために前記窓掛け解除(130)を適応させるように構成される、請求項1から6のいずれか一項に記載の装置(100)。
- 前記装置(100)が、入力オーディオ信号表現(120)の処理単位(124i)の最後の部分(126)において0に収束しない前記入力オーディオ信号表現(120)に対して、前記処理単位(124i)の前記最後の部分(126)における前記窓掛け解除(130)によって適用されるスケーリングが、前記入力オーディオ信号表現(120)が前記処理単位(124i)の前記最後の部分(126)において0に収束する場合と比較して低減されるように、前記窓掛け解除(130)を適応させるように構成される、請求項1から7のいずれか一項に記載の装置(100)。
- 前記装置(100)が、前記窓掛け解除(130)を適応させて、それにより前記処理されたオーディオ信号表現(110)のダイナミックレンジを制限するように構成される、請求項1から8のいずれか一項に記載の装置(100)。
- 前記装置(100)が、前記入力オーディオ信号表現(120)のDC成分に応じて前記窓掛け解除(130)を適応させるように構成される、請求項1から9のいずれか一項に記載の装置(100)。
- 前記装置(100)が、前記入力オーディオ信号表現(120)のDC成分を少なくとも部分的に除去するように構成される、請求項1から10のいずれか一項に記載の装置(100)。
- 前記窓掛け解除(130)が、前記処理されたオーディオ信号表現(110)を取得するために、窓値(132)に応じて、前記入力オーディオ信号表現(120)のDCが除去されたまたはDCが低減されたバージョンをスケーリングするように構成される、請求項1から11のいずれか一項に記載の装置(100)。
- 前記窓掛け解除(130)が、前記入力オーディオ信号表現(120)のDCが除去されたまたはDCが低減されたバージョンのスケーリングの後で、DC成分を少なくとも部分的に再導入するように構成される、請求項1から12のいずれか一項に記載の装置(100)。
- 前記装置(100)が、前記入力オーディオ信号表現(120)の提供において使用される分析窓(132)が1つまたは複数の0の値を備える時間部分(134)にある、前記入力オーディオ信号表現(120)の1つまたは複数の値を使用して前記DC成分を決定するように構成される、請求項10、11、13、および14のいずれか一項に記載の装置(100)。
- 前記装置(100)が、スペクトル領域から時間領域への変換(240)を使用して前記入力オーディオ信号表現(120)を取得するように構成される、請求項1から15のいずれか一項に記載の装置(100)。
- 処理されるべきオーディオ信号(122)に基づいて、処理されたオーディオ信号表現(110)を提供するためのオーディオ信号プロセッサ(300)であって、
前記オーディオ信号プロセッサ(300)が、処理されるべきオーディオ信号(122)の処理単位の時間領域表現の窓が掛けられたバージョン(1231)を取得するために、処理されるべき前記オーディオ信号(122)の前記処理単位の前記時間領域表現に分析窓掛け(210)を適用するように構成され、
前記オーディオ信号プロセッサ(300)が、前記窓が掛けられたバージョン(1231)に基づいて、処理されるべき前記オーディオ信号(122)のスペクトル領域表現(1232)を取得するように構成され、
前記オーディオ信号プロセッサ(300)が、処理されたスペクトル領域表現(1233)を取得するために、前記取得されたスペクトル領域表現(1232)にスペクトル領域処理(230)を適用するように構成され、
前記オーディオ信号プロセッサ(300)が、前記処理されたスペクトル領域表現(1233)に基づいて、処理された時間領域表現(1234)を取得するように構成され、
前記オーディオ信号プロセッサ(300)が、請求項1から16のいずれか一項に記載の装置(100)を備え、前記装置(100)が、前記処理された時間領域表現(1233)を、その入力オーディオ信号表現(120)として取得し、それに基づいて、前記処理されたオーディオ信号表現(110)を提供するように構成される、オーディオ信号プロセッサ(300)。 - 前記装置(100)が、前記分析窓掛け(210)の窓値を使用して前記窓掛け解除(130)を適応させるように構成される、請求項17に記載のオーディオ信号プロセッサ(300)。
- 符号化されたオーディオ表現(420)に基づいて、復号されたオーディオ表現(410)を提供するためのオーディオデコーダ(400)であって、
前記オーディオデコーダ(400)が、前記符号化されたオーディオ表現(420)に基づいて、符号化されたオーディオ信号(420)のスペクトル領域表現(430)を取得するように構成され、
前記オーディオデコーダ(400)が、前記スペクトル領域表現(430)に基づいて、前記符号化されたオーディオ信号(420)の時間領域表現(440)を取得するように構成され、
前記オーディオデコーダが、請求項1から16のいずれか一項に記載の装置(100)を備え、
前記装置(100)が、前記時間領域表現(440)を、その入力オーディオ信号表現(120)として取得し、それに基づいて、前記処理されたオーディオ信号表現(110)を提供するように構成される、オーディオデコーダ(400)。 - 前記オーディオデコーダ(400)が、所与の処理単位(124i)と時間的に重複する後続の処理単位(124i+1)が復号される前に、前記所与の処理単位(124i)の前記復号されたオーディオ表現(410)を提供するように構成される、請求項19に記載のオーディオデコーダ(400)。
- 入力オーディオ信号表現に基づいて、符号化されたオーディオ表現を提供するためのオーディオエンコーダであって、
前記オーディオエンコーダが、請求項1から16のいずれか一項に記載の装置を備え、前記装置が、前記入力オーディオ信号表現に基づいて、処理されたオーディオ信号表現を取得するように構成され、
前記オーディオエンコーダが、前記処理されたオーディオ信号表現を符号化するように構成される、オーディオエンコーダ。 - 前記オーディオエンコーダが、前記処理されたオーディオ信号表現に基づいてスペクトル領域表現を取得するように構成され、前記処理されたオーディオ信号表現が時間領域表現であり、
前記オーディオエンコーダが、前記符号化されたオーディオ表現を取得するために、スペクトル領域符号化を使用して前記スペクトル領域表現を符号化するように構成される、請求項21に記載のオーディオエンコーダ。 - 前記オーディオエンコーダが、前記符号化されたオーディオ表現を取得するために、時間領域符号化を使用して前記処理されたオーディオ信号表現を符号化するように構成される、請求項21または22に記載のオーディオエンコーダ。
- 前記オーディオエンコーダが、スペクトル領域符号化と時間領域符号化を切り替える切り替え符号化を使用して、前記処理されたオーディオ信号表現を符号化するように構成される、請求項21から23のいずれか一項に記載のオーディオエンコーダ。
- 前記装置が、スペクトル領域において、前記入力オーディオ信号表現を形成する複数の入力オーディオ信号のダウンミックスを実行し、ダウンミックスされた信号を前記処理されたオーディオ信号表現として提供するように構成される、請求項21から24のいずれか一項に記載のオーディオエンコーダ。
- 入力オーディオ信号表現(120)に基づいて、処理されたオーディオ信号表現(110)を提供するための装置(100)であって、
前記装置(100)が、前記入力オーディオ信号表現(120)に基づいて、前記処理されたオーディオ信号表現(110)を提供するために、窓掛け解除(130)を適用するように構成され、
前記装置(100)が、1つまたは複数の信号特性(140、1401から1404)に応じて、および/または、前記入力オーディオ信号表現(120)の提供のために使用される1つまたは複数の処理パラメータ(150、1501から1504)に応じて、前記窓掛け解除(130)を適応させるように構成され、
前記窓掛け解除(130)が、前記入力オーディオ信号表現の提供のために使用される分析窓掛けを少なくとも部分的に戻し、
前記装置(100)が、前記窓掛け解除(130)を適応させて、それにより前記処理されたオーディオ信号表現(110)のダイナミックレンジを制限するように構成される、装置(100)。 - 入力オーディオ信号表現に基づいて、処理されたオーディオ信号表現を提供するための方法(500)であって、
前記方法が、前記入力オーディオ信号表現に基づいて、前記処理されたオーディオ信号表現を提供するために、窓掛け解除を適用する(510)ステップを備え、
前記方法が、1つまたは複数の信号特性(140、1401から1404)に応じて、および/または、前記入力オーディオ信号表現の提供のために使用される1つまたは複数の処理パラメータ(150、1501から1504)に応じて、前記窓掛け解除を適応させる(520)ステップを備え、
前記窓掛け解除が、前記入力オーディオ信号表現の提供のために使用される分析窓掛けを少なくとも部分的に戻し、
前記窓掛け解除(130)が、前記処理されたオーディオ信号表現(110)の所与の処理単位(124i)と少なくとも部分的に時間的に重複する(126)後続の処理単位(124i+1)が利用可能になる前に、前記所与の処理単位(124i)を提供する、方法。 - 処理されるべきオーディオ信号に基づいて、処理されたオーディオ信号表現を提供するための方法(600)であって、
前記方法が、処理されるべきオーディオ信号の処理単位の時間領域表現の窓が掛けられたバージョンを取得するために、処理されるべき前記オーディオ信号の前記処理単位の前記時間領域表現に分析窓掛けを適用する(610)ステップを備え、
前記方法が、前記窓が掛けられたバージョンに基づいて、処理されるべき前記オーディオ信号のスペクトル領域表現を取得する(620)ステップを備え、
前記方法が、処理されたスペクトル領域表現を取得するために、スペクトル領域処理を前記取得されたスペクトル領域表現に適用する(630)ステップを備え、
前記方法が、前記処理されたスペクトル領域表現に基づいて、処理された時間領域表現を取得する(640)ステップを備え、
前記方法が、請求項27に記載の方法を使用して、前記処理されたオーディオ信号表現を提供する(650)ステップを備え、前記処理された時間領域表現が、請求項27に記載の方法を実行するための前記入力オーディオ信号表現として使用される、方法。 - 符号化されたオーディオ表現に基づいて、復号されたオーディオ表現を提供するための方法(700)であって、
前記方法が、前記符号化されたオーディオ表現に基づいて、符号化されたオーディオ信号のスペクトル領域表現を取得する(710)ステップを備え、
前記方法が、前記スペクトル領域表現に基づいて、前記符号化されたオーディオ信号の時間領域表現を取得する(720)ステップを備え、
前記方法が、請求項27に記載の方法を使用して、前記処理されたオーディオ信号表現を提供する(730)ステップを備え、前記時間領域表現が、請求項27に記載の方法を実行するための前記入力オーディオ信号表現として使用される、方法。 - 入力オーディオ信号表現に基づいて、符号化されたオーディオ表現を提供する(930)ための方法(900)であって、
前記方法が、請求項27に記載の方法を使用して前記入力オーディオ信号表現に基づいて、処理されたオーディオ信号表現を取得する(910)ステップを備え、
前記方法が、前記処理されたオーディオ信号表現を符号化する(920)ステップを備える、方法。 - 入力オーディオ信号表現に基づいて、処理されたオーディオ信号表現を提供するための方法(500)であって、
前記方法が、前記入力オーディオ信号表現に基づいて、前記処理されたオーディオ信号表現を提供するために、窓掛け解除を適用する(510)ステップを備え、
前記方法が、1つまたは複数の信号特性(140、1401から1404)に応じて、および/または、前記入力オーディオ信号表現の提供のために使用される1つまたは複数の処理パラメータ(150、1501から1504)に応じて、前記窓掛け解除を適応させる(520)ステップを備え、
前記窓掛け解除(130)を適応させるステップが、適応なしの前記窓掛け解除により引き起こされる大きな増幅が低減されて前記処理されたオーディオ信号表現(110)のダイナミックレンジを制限するように、実行され、
前記窓掛け解除が、前記入力オーディオ信号表現の提供のために使用される分析窓掛けを少なくとも部分的に戻す、方法。 - 入力オーディオ信号表現(120)に基づいて、処理されたオーディオ信号表現(110)を提供するための装置(100)であって、
前記装置(100)が、前記入力オーディオ信号表現(120)に基づいて、前記処理されたオーディオ信号表現(110)を提供するために、窓掛け解除(130)を適用するように構成され、
前記装置(100)が、1つまたは複数の信号特性(140、1401から1404)に応じて、および/または、前記入力オーディオ信号表現(120)の提供のために使用される1つまたは複数の処理パラメータ(150、1501から1504)に応じて、前記窓掛け解除(130)を適応させるように構成され、
前記装置(100)が、入力オーディオ信号表現(120)の処理単位(124i)の最後の部分(126)において0に収束しない前記入力オーディオ信号表現(120)に対して、前記処理単位(124i)の前記最後の部分(126)における前記窓掛け解除(130)によって適用されるスケーリングが、前記入力オーディオ信号表現(120)が前記処理単位(124i)の前記最後の部分(126)において0に収束する場合と比較して低減されるように、前記窓掛け解除(130)を適応させるように構成され、
前記窓掛け解除(130)が、前記入力オーディオ信号表現の提供のために使用される分析窓掛けを少なくとも部分的に戻す、装置。 - 入力オーディオ信号表現(120)に基づいて、符号化されたオーディオ表現を提供するためのオーディオエンコーダであって、
前記オーディオエンコーダが、前記入力オーディオ信号表現(120)に基づいて、処理されたオーディオ信号表現(110)を提供するための装置(100)を備え、
前記オーディオエンコーダが前記処理されたオーディオ信号表現を符号化するように構成され、
前記装置(100)が、前記入力オーディオ信号表現(120)に基づいて、前記処理されたオーディオ信号表現(110)を提供するために、窓掛け解除(130)を適用するように構成され、
前記装置(100)が、1つまたは複数の信号特性(140、1401から1404)に応じて、および/または、前記入力オーディオ信号表現(120)の提供のために使用される1つまたは複数の処理パラメータ(150、1501から1504)に応じて、前記窓掛け解除(130)を適応させるように構成され、
前記窓掛け解除(130)が、前記入力オーディオ信号表現(120)の提供のために使用される分析窓掛けを少なくとも部分的に戻す、オーディオエンコーダ。 - 符号化されたオーディオ表現(420)に基づいて、復号されたオーディオ表現(410)を提供するためのオーディオデコーダ(400)であって、
前記オーディオデコーダ(400)が、前記符号化されたオーディオ表現(420)に基づいて、符号化されたオーディオ信号(420)のスペクトル領域表現(430)を取得するように構成され、
前記オーディオデコーダ(400)が、前記スペクトル領域表現(430)に基づいて、前記符号化されたオーディオ信号(420)の時間領域表現(440)を取得するように構成され、
前記オーディオデコーダが、装置(100)を備え、
前記装置(100)が、前記時間領域表現(440)を、入力オーディオ信号表現(120)として取得し、それに基づいて、処理されたオーディオ信号表現(110)を提供するように構成され、
前記装置(100)が、前記入力オーディオ信号表現(120)に基づいて、前記処理されたオーディオ信号表現(110)を提供するために、窓掛け解除(130)を適用するように構成され、
前記装置(100)が、1つまたは複数の信号特性(140、1401から1404)に応じて、および/または、前記入力オーディオ信号表現(120)の提供のために使用される1つまたは複数の処理パラメータ(150、1501から1504)に応じて、前記窓掛け解除(130)を適応させるように構成され、
前記窓掛け解除(130)が、前記入力オーディオ信号表現(120)の提供のために使用される分析窓掛けを少なくとも部分的に戻し、
前記オーディオデコーダ(400)が、所与の処理単位(124i)と時間的に重複する後続の処理単位(124i+1)が復号される前に、前記所与の処理単位(124i)の前記復号されたオーディオ表現(410)を提供するように構成される、オーディオデコーダ。 - 入力オーディオ信号表現に基づいて、処理されたオーディオ信号表現を提供するための方法(500)であって、
前記方法が、前記入力オーディオ信号表現に基づいて、前記処理されたオーディオ信号表現を提供するために、窓掛け解除を適用する(510)ステップを備え、
前記方法が、1つまたは複数の信号特性(140、1401から1404)に応じて、および/または、前記入力オーディオ信号表現の提供のために使用される1つまたは複数の処理パラメータ(150、1501から1504)に応じて、前記窓掛け解除を適応させる(520)ステップを備え、
入力オーディオ信号表現(120)の処理単位(124i)の最後の部分(126)において0に収束しない前記入力オーディオ信号表現(120)に対して、前記処理単位(124i)の前記最後の部分(126)における前記窓掛け解除(130)によって適用されるスケーリングが、前記入力オーディオ信号表現(120)が前記処理単位(124i)の前記最後の部分(126)において0に収束する場合と比較して低減されるように、前記窓掛け解除(130)の適応が実行され、
前記窓掛け解除が、前記入力オーディオ信号表現の提供のために使用される分析窓掛けを少なくとも部分的に戻す、方法。 - 入力オーディオ信号表現に基づいて、符号化されたオーディオ表現を提供する(930)ための方法(900)であって、
前記方法が、入力オーディオ信号表現に基づいて、処理されたオーディオ信号表現を提供するための方法を使用して前記入力オーディオ信号表現に基づいて、処理されたオーディオ信号表現を取得する(910)ステップを備え、前記処理されたオーディオ信号表現を提供するための方法が、
前記入力オーディオ信号表現に基づいて、前記処理されたオーディオ信号表現を提供するために、窓掛け解除を適用する(510)ステップと、
1つまたは複数の信号特性(140、1401から1404)に応じて、および/または、前記入力オーディオ信号表現の提供のために使用される1つまたは複数の処理パラメータ(150、1501から1504)に応じて、前記窓掛け解除を適応させる(520)ステップと
を備え、
前記窓掛け解除が、前記入力オーディオ信号表現の提供のために使用される分析窓掛けを少なくとも部分的に戻し、
前記符号化されたオーディオ表現を提供する(930)ための方法(900)が、前記処理されたオーディオ信号表現を符号化する(920)ステップを備える、方法。 - 符号化されたオーディオ表現に基づいて、復号されたオーディオ表現を提供するための方法(700)であって、
前記方法が、前記符号化されたオーディオ表現に基づいて、符号化されたオーディオ信号のスペクトル領域表現を取得する(710)ステップを備え、
前記方法が、前記スペクトル領域表現に基づいて、前記符号化されたオーディオ信号の時間領域表現を取得する(720)ステップを備え、
前記方法が、入力オーディオ信号表現に基づいて、処理されたオーディオ信号表現を提供するための方法(500)を使用して、前記処理されたオーディオ信号表現を提供するステップを備え、前記時間領域表現が、前記入力オーディオ信号表現として使用され、前記処理されたオーディオ信号表現を提供するための方法(500)が、
前記入力オーディオ信号表現に基づいて、前記処理されたオーディオ信号表現を提供するために、窓掛け解除を適用する(510)ステップと、
1つまたは複数の信号特性(140、1401から1404)に応じて、および/または、前記入力オーディオ信号表現の提供のために使用される1つまたは複数の処理パラメータ(150、1501から1504)に応じて、前記窓掛け解除を適応させる(520)ステップと
を備え、
前記窓掛け解除が、前記入力オーディオ信号表現の提供のために使用される分析窓掛けを少なくとも部分的に戻し、
前記復号されたオーディオ表現を提供するための方法(700)が、所与の処理単位(124i)と時間的に重複する後続の処理単位(124i+1)が復号される前に、前記所与の処理単位(124i)の前記復号されたオーディオ表現を提供するステップを備える、方法。 - コンピュータ上で実行されると、請求項27から31および35から37のうちのいずれか一項に記載の方法を実行するためのプログラムコードを有する、コンピュータプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021144646A JP7275217B2 (ja) | 2018-11-05 | 2021-09-06 | 処理されたオーディオ信号表現を提供するための装置およびオーディオ信号プロセッサ、オーディオデコーダ、オーディオエンコーダ、方法、ならびにコンピュータプログラム |
JP2021144647A JP7341194B2 (ja) | 2018-11-05 | 2021-09-06 | 処理されたオーディオ信号表現を提供するための装置およびオーディオ信号プロセッサ、オーディオデコーダ、オーディオエンコーダ、方法、ならびにコンピュータプログラム |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18204445 | 2018-11-05 | ||
EP18204445.3 | 2018-11-05 | ||
PCT/EP2019/063693 WO2020094263A1 (en) | 2018-11-05 | 2019-05-27 | Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs |
EPPCT/EP2019/063693 | 2019-05-27 | ||
PCT/EP2019/080285 WO2020094668A1 (en) | 2018-11-05 | 2019-11-05 | Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021144647A Division JP7341194B2 (ja) | 2018-11-05 | 2021-09-06 | 処理されたオーディオ信号表現を提供するための装置およびオーディオ信号プロセッサ、オーディオデコーダ、オーディオエンコーダ、方法、ならびにコンピュータプログラム |
JP2021144646A Division JP7275217B2 (ja) | 2018-11-05 | 2021-09-06 | 処理されたオーディオ信号表現を提供するための装置およびオーディオ信号プロセッサ、オーディオデコーダ、オーディオエンコーダ、方法、ならびにコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022511682A JP2022511682A (ja) | 2022-02-01 |
JP7258135B2 true JP7258135B2 (ja) | 2023-04-14 |
Family
ID=64277495
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021524211A Active JP7258135B2 (ja) | 2018-11-05 | 2019-11-05 | 処理されたオーディオ信号表現を提供するための装置およびオーディオ信号プロセッサ、オーディオデコーダ、オーディオエンコーダ、方法、ならびにコンピュータプログラム |
JP2021144646A Active JP7275217B2 (ja) | 2018-11-05 | 2021-09-06 | 処理されたオーディオ信号表現を提供するための装置およびオーディオ信号プロセッサ、オーディオデコーダ、オーディオエンコーダ、方法、ならびにコンピュータプログラム |
JP2021144647A Active JP7341194B2 (ja) | 2018-11-05 | 2021-09-06 | 処理されたオーディオ信号表現を提供するための装置およびオーディオ信号プロセッサ、オーディオデコーダ、オーディオエンコーダ、方法、ならびにコンピュータプログラム |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021144646A Active JP7275217B2 (ja) | 2018-11-05 | 2021-09-06 | 処理されたオーディオ信号表現を提供するための装置およびオーディオ信号プロセッサ、オーディオデコーダ、オーディオエンコーダ、方法、ならびにコンピュータプログラム |
JP2021144647A Active JP7341194B2 (ja) | 2018-11-05 | 2021-09-06 | 処理されたオーディオ信号表現を提供するための装置およびオーディオ信号プロセッサ、オーディオデコーダ、オーディオエンコーダ、方法、ならびにコンピュータプログラム |
Country Status (16)
Country | Link |
---|---|
US (4) | US11990146B2 (ja) |
EP (3) | EP3877976B1 (ja) |
JP (3) | JP7258135B2 (ja) |
KR (1) | KR20210093930A (ja) |
CN (2) | CN118588097A (ja) |
AR (1) | AR116991A1 (ja) |
AU (4) | AU2019374400B2 (ja) |
BR (1) | BR112021008802A2 (ja) |
CA (3) | CA3118786C (ja) |
ES (1) | ES2967262T3 (ja) |
MX (1) | MX2021005233A (ja) |
PL (1) | PL3877976T3 (ja) |
SG (1) | SG11202104612TA (ja) |
TW (1) | TWI738106B (ja) |
WO (2) | WO2020094263A1 (ja) |
ZA (1) | ZA202103740B (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009131066A1 (ja) | 2008-04-21 | 2009-10-29 | 日本電気株式会社 | 信号分析制御及び信号制御のシステム、装置、方法及びプログラム |
US20130124215A1 (en) | 2010-07-08 | 2013-05-16 | Fraunhofer-Gesellschaft Zur Foerderung der angewanen Forschung e.V. | Coder using forward aliasing cancellation |
JP2014029407A (ja) | 2012-07-31 | 2014-02-13 | Nippon Telegr & Teleph Corp <Ntt> | 雑音抑圧装置、方法、及びプログラム |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB914802A (en) | 1958-04-16 | 1963-01-02 | Emi Ltd | Improvements in or relating to multi-speed mechanisms |
CN1062963C (zh) | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
US6594628B1 (en) * | 1995-09-21 | 2003-07-15 | Qualcomm, Incorporated | Distributed voice recognition system |
ATE315863T1 (de) | 2000-10-30 | 2006-02-15 | Texas Instruments Inc | Verfahren zur schätzung und entfernung eines zeitvarianten dc-offsets |
US7529661B2 (en) * | 2002-02-06 | 2009-05-05 | Broadcom Corporation | Pitch extraction methods and systems for speech coding using quadratically-interpolated and filtered peaks for multiple time lag extraction |
DE102004049457B3 (de) | 2004-10-11 | 2006-07-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren und Vorrichtung zur Extraktion einer einem Audiosignal zu Grunde liegenden Melodie |
EP1861977B1 (en) * | 2005-03-01 | 2009-01-21 | Panasonic Corporation | OFDM receiver and receiving method |
CN101331540A (zh) * | 2005-10-21 | 2008-12-24 | 高通股份有限公司 | 基于频谱动力学的信号编码和解码 |
JP2007316254A (ja) * | 2006-05-24 | 2007-12-06 | Sony Corp | オーディオ信号補間方法及びオーディオ信号補間装置 |
US7809559B2 (en) | 2006-07-24 | 2010-10-05 | Motorola, Inc. | Method and apparatus for removing from an audio signal periodic noise pulses representable as signals combined by convolution |
FR2911228A1 (fr) | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
CN101521010B (zh) * | 2008-02-29 | 2011-10-05 | 华为技术有限公司 | 一种音频信号的编解码方法和装置 |
CA2871268C (en) * | 2008-07-11 | 2015-11-03 | Nikolaus Rettelbach | Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program |
TWI449442B (zh) * | 2009-01-14 | 2014-08-11 | Dolby Lab Licensing Corp | 用於無回授之頻域主動矩陣解碼的方法與系統 |
US8457975B2 (en) * | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
US8374139B2 (en) * | 2009-03-27 | 2013-02-12 | Mediatek Inc. | Low latency synchronization scheme for wireless OFDMA systems |
ES2400661T3 (es) * | 2009-06-29 | 2013-04-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificación y decodificación de extensión de ancho de banda |
GB2472992A (en) * | 2009-08-25 | 2011-03-02 | Zarlink Semiconductor Inc | Reduction of clicking sounds in audio data streams |
US20110087494A1 (en) | 2009-10-09 | 2011-04-14 | Samsung Electronics Co., Ltd. | Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme |
WO2011048117A1 (en) * | 2009-10-20 | 2011-04-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation |
EP2524374B1 (en) * | 2010-01-13 | 2018-10-31 | Voiceage Corporation | Audio decoding with forward time-domain aliasing cancellation using linear-predictive filtering |
EP2761616A4 (en) * | 2011-10-18 | 2015-06-24 | Ericsson Telefon Ab L M | IMPROVED METHOD AND DEVICE FOR AN ADAPTIVE MULTIRATE CODEC |
EP2772914A4 (en) * | 2011-10-28 | 2015-07-15 | Panasonic Corp | DECODER FOR HYBRID SOUND SIGNALS, COORDINATORS FOR HYBRID SOUND SIGNALS, DECODING PROCEDURE FOR SOUND SIGNALS AND CODING SIGNALING PROCESSES |
US20140046670A1 (en) | 2012-06-04 | 2014-02-13 | Samsung Electronics Co., Ltd. | Audio encoding method and apparatus, audio decoding method and apparatus, and multimedia device employing the same |
RU2625560C2 (ru) * | 2013-02-20 | 2017-07-14 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ кодирования или декодирования аудиосигнала с использованием перекрытия, зависящего от местоположения перехода |
CN107750042B (zh) | 2014-01-03 | 2019-12-13 | 杜比实验室特许公司 | 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频 |
US9634624B2 (en) | 2014-12-24 | 2017-04-25 | Stmicroelectronics S.R.L. | Method of operating digital-to-analog processing chains, corresponding device, apparatus and computer program product |
JP6668372B2 (ja) * | 2015-02-26 | 2020-03-18 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 目標時間領域エンベロープを用いて処理されたオーディオ信号を得るためにオーディオ信号を処理するための装置および方法 |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
EP3067886A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
US10504525B2 (en) * | 2015-10-10 | 2019-12-10 | Dolby Laboratories Licensing Corporation | Adaptive forward error correction redundant payload generation |
FR3045915A1 (fr) * | 2015-12-16 | 2017-06-23 | Orange | Traitement de reduction de canaux adaptatif pour le codage d'un signal audio multicanal |
US9959877B2 (en) | 2016-03-18 | 2018-05-01 | Qualcomm Incorporated | Multi channel coding |
US20230123620A1 (en) | 2016-09-15 | 2023-04-20 | Circlesx Llc | System and Method for Trading Emissions Units |
US10210874B2 (en) | 2017-02-03 | 2019-02-19 | Qualcomm Incorporated | Multi channel coding |
US10380989B1 (en) * | 2018-02-22 | 2019-08-13 | Cirrus Logic, Inc. | Methods and apparatus for processing stereophonic audio content |
-
2019
- 2019-05-27 WO PCT/EP2019/063693 patent/WO2020094263A1/en active Application Filing
- 2019-11-05 SG SG11202104612TA patent/SG11202104612TA/en unknown
- 2019-11-05 CA CA3118786A patent/CA3118786C/en active Active
- 2019-11-05 EP EP19795246.8A patent/EP3877976B1/en active Active
- 2019-11-05 CN CN202410742833.9A patent/CN118588097A/zh active Pending
- 2019-11-05 KR KR1020217017136A patent/KR20210093930A/ko not_active Application Discontinuation
- 2019-11-05 AR ARP190103233A patent/AR116991A1/es active IP Right Grant
- 2019-11-05 PL PL19795246.8T patent/PL3877976T3/pl unknown
- 2019-11-05 EP EP23157130.8A patent/EP4207190A1/en active Pending
- 2019-11-05 AU AU2019374400A patent/AU2019374400B2/en active Active
- 2019-11-05 ES ES19795246T patent/ES2967262T3/es active Active
- 2019-11-05 JP JP2021524211A patent/JP7258135B2/ja active Active
- 2019-11-05 CA CA3179298A patent/CA3179298A1/en active Pending
- 2019-11-05 CN CN201980088015.9A patent/CN113272896B/zh active Active
- 2019-11-05 CA CA3179294A patent/CA3179294A1/en active Pending
- 2019-11-05 EP EP23157131.6A patent/EP4207191A1/en active Pending
- 2019-11-05 MX MX2021005233A patent/MX2021005233A/es unknown
- 2019-11-05 TW TW108140137A patent/TWI738106B/zh active
- 2019-11-05 BR BR112021008802-4A patent/BR112021008802A2/pt unknown
- 2019-11-05 WO PCT/EP2019/080285 patent/WO2020094668A1/en unknown
-
2021
- 2021-05-04 US US17/307,739 patent/US11990146B2/en active Active
- 2021-05-05 US US17/308,943 patent/US11804229B2/en active Active
- 2021-05-05 US US17/308,925 patent/US11948590B2/en active Active
- 2021-05-31 ZA ZA2021/03740A patent/ZA202103740B/en unknown
- 2021-09-06 JP JP2021144646A patent/JP7275217B2/ja active Active
- 2021-09-06 JP JP2021144647A patent/JP7341194B2/ja active Active
-
2022
- 2022-11-29 AU AU2022279390A patent/AU2022279390B2/en active Active
- 2022-11-29 AU AU2022279391A patent/AU2022279391B2/en active Active
-
2023
- 2023-09-25 US US18/473,934 patent/US20240013794A1/en active Pending
-
2024
- 2024-05-02 AU AU2024202899A patent/AU2024202899A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009131066A1 (ja) | 2008-04-21 | 2009-10-29 | 日本電気株式会社 | 信号分析制御及び信号制御のシステム、装置、方法及びプログラム |
US20110019761A1 (en) | 2008-04-21 | 2011-01-27 | Nec Corporation | System, apparatus, method, and program for signal analysis control and signal control |
US20130124215A1 (en) | 2010-07-08 | 2013-05-16 | Fraunhofer-Gesellschaft Zur Foerderung der angewanen Forschung e.V. | Coder using forward aliasing cancellation |
JP2013532310A (ja) | 2010-07-08 | 2013-08-15 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | フォワードエイリアシング消去を用いた符号器 |
JP2014029407A (ja) | 2012-07-31 | 2014-02-13 | Nippon Telegr & Teleph Corp <Ntt> | 雑音抑圧装置、方法、及びプログラム |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7126328B2 (ja) | 符号化されたオーディオ信号を復号するためのデコーダおよびオーディオ信号を符号化するためのエンコーダ | |
EP2951814B1 (en) | Low-frequency emphasis for lpc-based coding in frequency domain | |
AU2015258241B2 (en) | Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction | |
JP2016525716A (ja) | 適応位相アライメントを用いたマルチチャネルダウンミックスにおけるコムフィルタアーチファクトの抑制 | |
KR20130133848A (ko) | 스펙트럼 도메인 잡음 형상화를 사용하는 선형 예측 기반 코딩 방식 | |
KR102423959B1 (ko) | 다운샘플링 또는 스케일 파라미터의 보간을 사용하여 오디오 신호를 인코딩 및 디코딩하기 위한 장치 및 방법 | |
CA2979245C (en) | Concept for coding mode switching compensation | |
JP7258135B2 (ja) | 処理されたオーディオ信号表現を提供するための装置およびオーディオ信号プロセッサ、オーディオデコーダ、オーディオエンコーダ、方法、ならびにコンピュータプログラム | |
TWI611398B (zh) | 降尺度解碼器、解碼方法及電腦程式 | |
WO2023198862A1 (en) | Time-domain gain modeling in the qmf domain |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210705 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210705 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220725 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220801 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221028 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230306 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230404 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7258135 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |