JP6859423B2 - チャネル間時間差を推定する装置及び方法 - Google Patents
チャネル間時間差を推定する装置及び方法 Download PDFInfo
- Publication number
- JP6859423B2 JP6859423B2 JP2019235359A JP2019235359A JP6859423B2 JP 6859423 B2 JP6859423 B2 JP 6859423B2 JP 2019235359 A JP2019235359 A JP 2019235359A JP 2019235359 A JP2019235359 A JP 2019235359A JP 6859423 B2 JP6859423 B2 JP 6859423B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- time
- channel
- channels
- spectral
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 69
- 238000001228 spectrum Methods 0.000 claims description 100
- 230000003595 spectral effect Effects 0.000 claims description 78
- 238000012545 processing Methods 0.000 claims description 47
- 238000009499 grossing Methods 0.000 claims description 34
- 238000004590 computer program Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 6
- 230000008878 coupling Effects 0.000 claims description 5
- 238000010168 coupling process Methods 0.000 claims description 5
- 238000005859 coupling reaction Methods 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 description 31
- 238000004364 calculation method Methods 0.000 description 26
- 230000006870 function Effects 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 9
- 238000005314 correlation function Methods 0.000 description 9
- 238000000354 decomposition reaction Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 239000002131 composite material Substances 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 238000013139 quantization Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 208000024875 Infantile dystonia-parkinsonism Diseases 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000004134 energy conservation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000009432 framing Methods 0.000 description 2
- 208000001543 infantile parkinsonism-dystonia Diseases 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 125000000205 L-threonino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])[C@](C([H])([H])[H])([H])O[H] 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Position Fixing By Use Of Radio Waves (AREA)
- Radar Systems Or Details Thereof (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Mobile Radio Communication Systems (AREA)
- Stereo-Broadcasting Methods (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Control Of Eletrric Generators (AREA)
- Emergency Protection Circuit Devices (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
−突出したピークに起因する有効なITD。相互相関関数の[−ITD_MAX,ITD_MAX]境界内の突出したピークが存在する。
−相関なし。2つのチャネル間に相関がない場合、突出したピークがない。しきい値が定義されるべきであり、ピークは有効なITD値と認識されるためにはこのしきい値を超えて十分強くなくてはならない。そうでない場合には、如何なるITD処理も信号伝達されず、つまりITDはゼロに設定され、時間アライメントは実行されない。
−ITD境界の外側。領域[−ITD_MAX,ITD_MAX]の外側の相互相関関数の強いピークは、そのシステムの処理能力を超えるITDが存在するかどうかを決定するために、評価されるべきである。この場合、如何なるITD処理も信号伝達されず、よって時間アライメントは実行されない。
−残差信号の二次的符号化による:
−前の復号化済み中央信号スペクトルを用いて前のDFTフレームから残差サイドスペクトルを予測する、ステレオ充填として知られる残差予測による:
DFTによって実行される、ステレオ処理からの特殊な時間−周波数分解によって、良好な聴覚的シーン分析をもたらす一方で、符号化システムの全体的な遅延が有意に増加しないようにすることが重要である。デフォルトにより、10msの時間分解能(コアコーダの20msフレーミングの2倍)が使用される。分析窓と合成窓は同じであり、対称形である。窓は図7の中で16kHzのサンプリングレートで表現される。発生する遅延を低減するためにオーバーラップ領域が制限され、後段で説明するように、ITDを周波数ドメインにおいて適用する際に循環シフトを釣り合わせるためにゼロパディングもまた追加されることが見て取れる。
ステレオパラメータは、最大限ではステレオDFTの時間分解能において伝送され得る。最小限では、ステレオパラメータはコアコーダのフレーミング分解能、即ち20msへと低減され得る。デフォルトにより、過渡が検出されない場合、パラメータは2つのDFT窓にわたり20ms毎に計算される。パラメータ帯域は、等価方形帯域幅(Equivalent Rectangular Bandwidth)(ERB)の凡そ2倍又は4倍の後に続いてスペクトルの非均一かつ非オーバーラップの分解を構成する。デフォルトにより、16kHz(32kbpsのサンプリングレート、スーパーワイドバンド・ステレオ)の周波数帯域幅について、ERBのスケールの4倍が、合計で12個の帯域について使用される。図8は、ステレオサイド情報が約5kbpsで伝送される構成の一例を要約したものである。
ITDは、位相変換を用いた一般化相互相関(GCC−PHAT)を使用して、到達時間差(TDOA)を推定することにより計算される。
2つのチャネルの時間アライメントの後で、IPDが計算され、この計算は、各パラメータ帯域又は少なくとも所与のipd_max_bandまで、ステレオ構成に依存して行われる。
であり、bは周波数インデックスkが帰属するパラメータ帯域インデックスである。パラメータβは、2つのチャネル間の位相回転の量を分配し、同時にそれらの位相をアラインする役割を担う。βはIPDに依存し、またチャネル同士の相対的な振幅レベルILDにも依存する。あるチャネルがより高い振幅を有する場合、それが主要なチャネルとして認識され、低い振幅を有するチャネルよりも位相回転によって受ける影響が少なくなるであろう。
和差変換は、2つのチャネルの時間及び位相がアラインされたスペクトルに対し、中央信号内でエネルギーが保存される方法で実行される。
は 1/1.2と1.2との間、即ち−1.58dBと+1.58dBの間に制限される。この制限により、M及びSのエネルギーを調整するときにアーチファクトを防止できる。このエネルギー保存は、時間及び位相が事前にアラインされていた場合には重要度が低いことに留意すべきである。代替的に、これら制限は増大又は減少され得る。
であり、かつatan2(x,y)はyに対するxの四象限逆正接(four-quadrant inverse tangent)である。
[備考]
[請求項1]
第1チャネル信号と第2チャネル信号との間のチャネル間時間差を推定する装置であって、
ある時間ブロックにおける前記第1チャネル信号とその時間ブロックにおける前記第2チャネル信号とから、その時間ブロックについての相互相関スペクトルを計算する計算部(1020)と、
前記時間ブロックについての前記第1チャネル信号又は前記第2チャネル信号のスペクトル特性を推定するスペクトル特性推定部(1010)と、
前記スペクトル特性を使用して前記相互相関スペクトルを時間に亘って平滑化し、平滑化された相互相関スペクトルを取得する平滑化フィルタ(1030)と、
前記平滑化された相互相関スペクトルを処理して、前記チャネル間時間差を取得するプロセッサ(1040)と、
を備える装置。
[請求項2]
前記プロセッサ(1040)は、前記平滑化された相互相関スペクトルの振幅を使用して、前記平滑化された相互相関スペクトルを正規化(456)するよう構成される、
請求項1に記載の装置。
[請求項3]
前記プロセッサ(1040)は、
前記平滑化された相互相関スペクトル又は正規化され平滑化された相互相関スペクトルの時間ドメイン表現を計算(1031)し、
前記チャネル間時間差を決定するために、前記時間ドメイン表現を分析(1032)するよう構成される、
請求項1又は2に記載の装置。
[請求項4]
前記プロセッサ(1040)は、前記時間ドメイン表現をローパスフィルタリング(458)し、そのローパスフィルタリングの結果をさらに処理(1033)するよう構成される、
請求項1乃至3のいずれか一項に記載の装置。
[請求項5]
前記プロセッサは、前記平滑化された相互相関スペクトルから決定された時間ドメイン表現内でピーク探索又はピーク・ピッキング操作を実行することにより、前記チャネル間時間差の決定を実行するよう構成される、
請求項1乃至4のいずれか一項に記載の装置。
[請求項6]
前記スペクトル特性推定部(1010)は、前記スペクトル特性として、前記スペクトルのノイズ性又は調性を決定するよう構成され、
前記平滑化フィルタ(1030)は、第1の低いノイズ性特性又は第1の高い調性特性の場合に第1平滑度を用いて時間にわたって強い平滑化を適用し、又は第2の高いノイズ性特性又は第2の低い調性特性の場合に第2平滑度を用いて時間にわたって弱い平滑化を適用するよう構成され、
前記第1平滑度は前記第2平滑度よりも大きく、前記第1のノイズ性特性は前記第2のノイズ性特性に比べてノイズ性が低く、又は、前記第1の調性特性は前記第2の調性特性に比べて調性が高い、
請求項1乃至5のいずれか一項に記載の装置。
[請求項7]
前記スペクトル特性推定部(1010)は、前記特性として、前記第1チャネル信号のスペクトルの第1のスペクトル平坦尺度と前記第2チャネル信号の第2スペクトルの第2のスペクトル平坦尺度とを計算し、
最大値を選択すること、スペクトル平坦尺度間の重み付き平均又は非重み付き平均を決定すること、又は最小値を選択することにより、前記第1と第2のスペクトル平坦尺度から前記スペクトル特性を決定するよう構成される、
請求項1乃至6のいずれか一項に記載の装置。
[請求項8]
前記平滑化フィルタ(1030)は、前記時間ブロックからのある周波数についての相互相関スペクトル値と、少なくとも1つの過去の時間ブロックからの前記周波数についての相互相関スペクトル値との重み付き結合によって、前記周波数について平滑化された相互相関スペクトル値を計算するよう構成され、前記重み付き結合の重みファクタは前記スペクトル特性によって決定される、
請求項1乃至7のいずれか一項に記載の装置。
[請求項9]
前記プロセッサ(1040)は、前記平滑化された相互相関スペクトルから導出された時間ドメイン表現内の有効範囲と無効範囲とを決定するよう構成され、
前記無効範囲内の少なくとも1つの最大ピークが検出され、前記有効範囲内の最大ピークと比較され、前記チャネル間時間差は、前記有効範囲内の最大ピークが前記無効範囲内の少なくとも1つの最大ピークより大きい場合のみ決定される、
請求項1乃至8のいずれか一項に記載の装置。
[請求項10]
前記プロセッサ(1040)は、
前記平滑化された相互相関スペクトルから導出された時間ドメイン表現内でピーク探索操作を実行し、
前記時間ドメイン表現から可変しきい値を決定(1034)し、
あるピークを前記可変しきい値と比較(1035)し、前記チャネル間時間差は前記可変しきい値と所定の関係にあるピークと関連するタイムラグとして決定される、
請求項1乃至9のいずれか一項に記載の装置。
[請求項11]
前記プロセッサは、前記時間ドメイン表現の値の最大の10パーセント内にある1つの値の整数倍に等しい値として前記可変しきい値を決定(1334c)するよう構成される、
請求項10に記載の装置。
[請求項12]
前記プロセッサ(1040)は、前記平滑化された相互相関スペクトルから導出された時間ドメイン表現の複数のサブブロックの各ブロックにおける最大ピーク振幅を決定(1102)するよう構成され、
前記プロセッサ(1040)は、前記複数のサブブロックの前記最大ピーク振幅から導出された平均ピーク振幅に基づいて可変しきい値を計算(1104、1105)するよう構成され、
前記プロセッサは、前記可変しきい値より大きい、前記複数のサブブロックの最大ピークに対応するタイムラグ値として前記チャネル間時間差を決定するよう構成される、
請求項1乃至9のいずれか一項に記載の装置。
[請求項13]
前記プロセッサ(1040)は、前記サブブロック内のピーク間の平均ピークとして決定された前記平均しきい値とある値との乗算(1105)によって可変しきい値を計算するよう構成され、
前記値は、前記第1及び第2のチャネル信号のSNR(信号対ノイズ比)特性によって決定(1104)され、第1値は第1SNR値と関連し、第2値は第2SNR値と関連しており、前記第1値は前記第2値より大きく、前記第1SNR値は前記第2SNR値より大きい、
請求項12に記載の装置。
[請求項14]
前記プロセッサ(1040)は、第3SNR値が前記第2SNR値より低く、かつ前記しきい値と最大ピークとの差が所定値(ε)より低い場合に、前記第2値(alow)より低い第3値(alowest)を使用(1104)するよう構成される、
請求項13に記載の装置。
[請求項15]
第1チャネル信号と第2チャネル信号との間のチャネル間時間差を推定する装置であって、
ある時間ブロックにおける前記第1チャネル信号とその時間ブロックにおける前記第2チャネル信号とから、その時間ブロックについての相互相関スペクトルを計算するステップ(1020)と、
前記時間ブロックについての前記第1チャネル信号又は前記第2チャネル信号のスペクトル特性を推定するステップ(1010)と、
前記スペクトル特性を使用して前記相互相関スペクトルを時間に亘って平滑化し、平滑化された相互相関スペクトルを取得するステップ(1030)と、
前記平滑化された相互相関スペクトルを処理して、前記チャネル間時間差を取得するステップ(1040)と、
を備える装置。
[請求項16]
コンピュータ又はプロセッサ上で作動するとき、請求項15に記載の方法を実行するためのコンピュータプログラム。
Claims (14)
- 第1チャネル信号と第2チャネル信号との間のチャネル間時間差を推定する装置であって、ある時間ブロックにおける前記第1チャネル信号とその時間ブロックにおける前記第2チャネル信号とから、前記第1チャネル信号又は前記第2チャネル信号のスペクトル特性を使用して、その時間ブロックについての相関スペクトルを時間に亘って平滑化し、平滑化された相関スペクトルを取得し、かつ前記平滑化された相関スペクトルを処理して、前記チャネル間時間差を取得する、処理装置を備える、
装置。 - 前記処理装置は、前記平滑化された相関スペクトルを処理するプロセッサ(1040)を備える、
請求項1に記載の装置。 - 前記処理装置は、ノイズ状信号の場合に平滑化が弱く、調性信号の場合に平滑化が強くなるよう、前記平滑化を実行するよう構成される、
請求項1又は2に記載の装置。 - 前記プロセッサ(1040)は、前記平滑化された相関スペクトルの振幅を使用して、前記平滑化された相関スペクトルを正規化(456)するよう構成される、
請求項2に記載の装置。 - 前記プロセッサ(1040)は、
前記平滑化された相関スペクトル又は平滑化され正規化された相関スペクトルの時間ドメイン表現を計算(1031)し、
前記チャネル間時間差を決定するために、前記時間ドメイン表現を分析(1032)するよう構成される、
請求項2に記載の装置。 - 前記プロセッサ(1040)は、前記時間ドメイン表現をローパスフィルタリング(458)し、そのローパスフィルタリングの結果をさらに処理(1033)するよう構成される、
請求項5に記載の装置。 - 前記プロセッサ(1040)は、前記平滑化された相関スペクトルから決定された時間ドメイン表現内でピーク探索又はピーク・ピッキング操作を実行することにより、前記チャネル間時間差の決定を実行するよう構成される、
請求項2に記載の装置。 - 前記処理装置は、前記スペクトル特性を推定するスペクトル特性推定部(1010)と、前記相関スペクトルを平滑化する平滑化フィルタ(1030)と、を備え、
前記スペクトル特性推定部(1010)は、前記スペクトル特性として、前記スペクトルのノイズ性又は調性を決定するよう構成され、
前記平滑化フィルタ(1030)は、第1の低いノイズ性特性又は第1の高い調性特性の場合に第1平滑度を用いて時間にわたって強い平滑化を適用し、又は第2の高いノイズ性特性又は第2の低い調性特性の場合に第2平滑度を用いて時間にわたって弱い平滑化を適用するよう構成され、
前記第1平滑度は前記第2平滑度よりも大きく、前記第1のノイズ性特性は前記第2のノイズ性特性に比べてノイズ性が低く、又は、前記第1の調性特性は前記第2の調性特性に比べて調性が高い、
請求項1に記載の装置。 - 前記処理装置は、前記スペクトル特性を推定するスペクトル特性推定部(1010)を備え、
前記スペクトル特性推定部(1010)は、前記スペクトル特性として、前記第1チャネル信号のスペクトルの第1のスペクトル平坦尺度と前記第2チャネル信号の第2スペクトルの第2のスペクトル平坦尺度とを計算し、
スペクトル平坦尺度の最大値を選択すること、スペクトル平坦尺度間の重み付き平均又は非重み付き平均を決定すること、又はスペクトル平坦尺度の最小値を選択することにより、前記第1と第2のスペクトル平坦尺度から前記第1チャネル信号又は第2チャネル信号のスペクトル特性を決定するよう構成される、
請求項1に記載の装置。 - 前記処理装置は、前記相関スペクトルを平滑化する平滑化フィルタ(1030)を備え、
前記平滑化フィルタ(1030)は、前記時間ブロックからのある周波数についての相関スペクトル値と、少なくとも1つの過去の時間ブロックからの前記周波数についての相関スペクトル値との重み付き結合によって、前記周波数について平滑化された相関スペクトル値を計算するよう構成され、前記重み付き結合の重みファクタは前記第1チャネル信号又は第2チャネル信号のスペクトル特性によって決定される、
請求項1に記載の装置。 - 前記プロセッサ(1040)は、
前記平滑化された相関スペクトルから導出された時間ドメイン表現内でピーク探索操作を実行し、
前記時間ドメイン表現から可変しきい値を決定(1034)し、
あるピークを前記可変しきい値と比較(1035)し、前記チャネル間時間差は前記可変しきい値と所定の関係にあるピークと関連するタイムラグとして決定される、
請求項2に記載の装置。 - 第1チャネル信号と第2チャネル信号との間のチャネル間時間差を推定する方法であって、
ある時間ブロックにおける前記第1チャネル信号とその時間ブロックにおける前記第2チャネル信号とから、前記第1チャネル信号又は前記第2チャネル信号のスペクトル特性を使用して、その時間ブロックについての相関スペクトルを時間に亘って平滑化し、平滑化された相関スペクトルを取得するステップ(1030)と、
前記平滑化された相関スペクトルを処理して、前記チャネル間時間差を取得するステップ(1040)と、
を備える方法。 - 前記平滑化は、ノイズ状信号の場合に平滑化が弱く、調性信号の場合に平滑化が強くなるよう実行される、
請求項12に記載の方法。 - コンピュータ又はプロセッサ上で作動するとき、請求項12又は13に記載の方法を実行するためのコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021051011A JP7161564B2 (ja) | 2016-01-22 | 2021-03-25 | チャネル間時間差を推定する装置及び方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP16152453 | 2016-01-22 | ||
EP16152453.3 | 2016-01-22 | ||
EP16152450.9 | 2016-01-22 | ||
EP16152450 | 2016-01-22 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018538602A Division JP6641018B2 (ja) | 2016-01-22 | 2017-01-20 | チャネル間時間差を推定する装置及び方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021051011A Division JP7161564B2 (ja) | 2016-01-22 | 2021-03-25 | チャネル間時間差を推定する装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020060788A JP2020060788A (ja) | 2020-04-16 |
JP6859423B2 true JP6859423B2 (ja) | 2021-04-14 |
Family
ID=57838406
Family Applications (10)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018510479A Active JP6412292B2 (ja) | 2016-01-22 | 2017-01-20 | スペクトルドメイン・リサンプリングを用いて多チャネル信号を符号化又は復号化する装置及び方法 |
JP2018538601A Active JP6626581B2 (ja) | 2016-01-22 | 2017-01-20 | 1つの広帯域アライメント・パラメータと複数の狭帯域アライメント・パラメータとを使用して、多チャネル信号を符号化又は復号化する装置及び方法 |
JP2018538633A Active JP6730438B2 (ja) | 2016-01-22 | 2017-01-20 | フレーム制御同期化を使用して多チャネル信号を符号化又は復号化する装置及び方法 |
JP2018538602A Active JP6641018B2 (ja) | 2016-01-22 | 2017-01-20 | チャネル間時間差を推定する装置及び方法 |
JP2018181254A Active JP6856595B2 (ja) | 2016-01-22 | 2018-09-27 | スペクトルドメイン・リサンプリングを用いて多チャネル信号を符号化又は復号化する装置及び方法 |
JP2019235359A Active JP6859423B2 (ja) | 2016-01-22 | 2019-12-26 | チャネル間時間差を推定する装置及び方法 |
JP2020114535A Active JP7053725B2 (ja) | 2016-01-22 | 2020-07-02 | フレーム制御同期化を使用して多チャネル信号を符号化又は復号化する装置及び方法 |
JP2021044222A Active JP7258935B2 (ja) | 2016-01-22 | 2021-03-18 | スペクトルドメイン・リサンプリングを用いて多チャネル信号を符号化又は復号化する装置及び方法 |
JP2021051011A Active JP7161564B2 (ja) | 2016-01-22 | 2021-03-25 | チャネル間時間差を推定する装置及び方法 |
JP2022057862A Active JP7270096B2 (ja) | 2016-01-22 | 2022-03-31 | フレーム制御同期化を使用して多チャネル信号を符号化又は復号化する装置及び方法 |
Family Applications Before (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018510479A Active JP6412292B2 (ja) | 2016-01-22 | 2017-01-20 | スペクトルドメイン・リサンプリングを用いて多チャネル信号を符号化又は復号化する装置及び方法 |
JP2018538601A Active JP6626581B2 (ja) | 2016-01-22 | 2017-01-20 | 1つの広帯域アライメント・パラメータと複数の狭帯域アライメント・パラメータとを使用して、多チャネル信号を符号化又は復号化する装置及び方法 |
JP2018538633A Active JP6730438B2 (ja) | 2016-01-22 | 2017-01-20 | フレーム制御同期化を使用して多チャネル信号を符号化又は復号化する装置及び方法 |
JP2018538602A Active JP6641018B2 (ja) | 2016-01-22 | 2017-01-20 | チャネル間時間差を推定する装置及び方法 |
JP2018181254A Active JP6856595B2 (ja) | 2016-01-22 | 2018-09-27 | スペクトルドメイン・リサンプリングを用いて多チャネル信号を符号化又は復号化する装置及び方法 |
Family Applications After (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020114535A Active JP7053725B2 (ja) | 2016-01-22 | 2020-07-02 | フレーム制御同期化を使用して多チャネル信号を符号化又は復号化する装置及び方法 |
JP2021044222A Active JP7258935B2 (ja) | 2016-01-22 | 2021-03-18 | スペクトルドメイン・リサンプリングを用いて多チャネル信号を符号化又は復号化する装置及び方法 |
JP2021051011A Active JP7161564B2 (ja) | 2016-01-22 | 2021-03-25 | チャネル間時間差を推定する装置及び方法 |
JP2022057862A Active JP7270096B2 (ja) | 2016-01-22 | 2022-03-31 | フレーム制御同期化を使用して多チャネル信号を符号化又は復号化する装置及び方法 |
Country Status (20)
Country | Link |
---|---|
US (7) | US10535356B2 (ja) |
EP (5) | EP3405951B1 (ja) |
JP (10) | JP6412292B2 (ja) |
KR (4) | KR102219752B1 (ja) |
CN (6) | CN107710323B (ja) |
AU (5) | AU2017208580B2 (ja) |
BR (4) | BR112017025314A2 (ja) |
CA (4) | CA3011915C (ja) |
ES (5) | ES2790404T3 (ja) |
HK (1) | HK1244584B (ja) |
MX (4) | MX2018008889A (ja) |
MY (4) | MY189205A (ja) |
PL (4) | PL3405951T3 (ja) |
PT (3) | PT3405949T (ja) |
RU (4) | RU2693648C2 (ja) |
SG (3) | SG11201806241QA (ja) |
TR (1) | TR201906475T4 (ja) |
TW (4) | TWI643487B (ja) |
WO (4) | WO2017125559A1 (ja) |
ZA (3) | ZA201804625B (ja) |
Families Citing this family (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010032992A2 (ko) * | 2008-09-18 | 2010-03-25 | 한국전자통신연구원 | Mdct기반의 코너와 이종의 코더간 변환에서의 인코딩 장치 및 디코딩 장치 |
CN107710323B (zh) | 2016-01-22 | 2022-07-19 | 弗劳恩霍夫应用研究促进协会 | 使用频谱域重新取样来编码或解码音频多通道信号的装置及方法 |
CN107731238B (zh) * | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
US10224042B2 (en) * | 2016-10-31 | 2019-03-05 | Qualcomm Incorporated | Encoding of multiple audio signals |
MX2019005147A (es) | 2016-11-08 | 2019-06-24 | Fraunhofer Ges Forschung | Aparato y metodo para codificar o decodificar una se?al multicanal usando una ganancia lateral y una ganancia residual. |
US10475457B2 (en) * | 2017-07-03 | 2019-11-12 | Qualcomm Incorporated | Time-domain inter-channel prediction |
US10839814B2 (en) * | 2017-10-05 | 2020-11-17 | Qualcomm Incorporated | Encoding or decoding of audio signals |
US10535357B2 (en) * | 2017-10-05 | 2020-01-14 | Qualcomm Incorporated | Encoding or decoding of audio signals |
EP4057281A1 (en) * | 2018-02-01 | 2022-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio scene encoder, audio scene decoder and related methods using hybrid encoder/decoder spatial analysis |
US10978091B2 (en) * | 2018-03-19 | 2021-04-13 | Academia Sinica | System and methods for suppression by selecting wavelets for feature compression in distributed speech recognition |
KR102550424B1 (ko) | 2018-04-05 | 2023-07-04 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 채널 간 시간 차를 추정하기 위한 장치, 방법 또는 컴퓨터 프로그램 |
CN110556116B (zh) | 2018-05-31 | 2021-10-22 | 华为技术有限公司 | 计算下混信号和残差信号的方法和装置 |
EP3588495A1 (en) * | 2018-06-22 | 2020-01-01 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Multichannel audio coding |
US11545165B2 (en) | 2018-07-03 | 2023-01-03 | Panasonic Intellectual Property Corporation Of America | Encoding device and encoding method using a determined prediction parameter based on an energy difference between channels |
JP7092048B2 (ja) * | 2019-01-17 | 2022-06-28 | 日本電信電話株式会社 | 多地点制御方法、装置及びプログラム |
EP3719799A1 (en) | 2019-04-04 | 2020-10-07 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | A multi-channel audio encoder, decoder, methods and computer program for switching between a parametric multi-channel operation and an individual channel operation |
WO2020216459A1 (en) * | 2019-04-23 | 2020-10-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for generating an output downmix representation |
CN114051711B (zh) * | 2019-06-18 | 2023-07-18 | 雷蛇(亚太)私人有限公司 | 用于优化在无线人性化接口装置系统中的输入延迟的方法及设备 |
CN110459205B (zh) * | 2019-09-24 | 2022-04-12 | 京东科技控股股份有限公司 | 语音识别方法及装置、计算机可存储介质 |
CN110740416B (zh) * | 2019-09-27 | 2021-04-06 | 广州励丰文化科技股份有限公司 | 一种音频信号处理方法及装置 |
US20220156217A1 (en) * | 2019-11-22 | 2022-05-19 | Stmicroelectronics (Rousset) Sas | Method for managing the operation of a system on chip, and corresponding system on chip |
CN110954866B (zh) * | 2019-11-22 | 2022-04-22 | 达闼机器人有限公司 | 声源定位方法、电子设备及存储介质 |
CN111131917B (zh) * | 2019-12-26 | 2021-12-28 | 国微集团(深圳)有限公司 | 音频频谱实时同步方法、播放装置 |
JP7316384B2 (ja) | 2020-01-09 | 2023-07-27 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、復号装置、符号化方法及び復号方法 |
TWI750565B (zh) * | 2020-01-15 | 2021-12-21 | 原相科技股份有限公司 | 真無線多聲道揚聲裝置及其多音源發聲之方法 |
CN111402906B (zh) * | 2020-03-06 | 2024-05-14 | 深圳前海微众银行股份有限公司 | 语音解码方法、装置、引擎及存储介质 |
US11276388B2 (en) * | 2020-03-31 | 2022-03-15 | Nuvoton Technology Corporation | Beamforming system based on delay distribution model using high frequency phase difference |
CN111525912B (zh) * | 2020-04-03 | 2023-09-19 | 安徽白鹭电子科技有限公司 | 一种数字信号的任意重采样方法及系统 |
CN113223503B (zh) * | 2020-04-29 | 2022-06-14 | 浙江大学 | 一种基于测试反馈的核心训练语音选择方法 |
JP7491376B2 (ja) * | 2020-06-24 | 2024-05-28 | 日本電信電話株式会社 | 音信号符号化方法、音信号符号化装置、プログラム及び記録媒体 |
CN115917643A (zh) * | 2020-06-24 | 2023-04-04 | 日本电信电话株式会社 | 声音信号解码方法、声音信号解码装置、程序以及记录介质 |
CN116348951A (zh) * | 2020-07-30 | 2023-06-27 | 弗劳恩霍夫应用研究促进协会 | 用于编码音频信号或用于解码经编码音频场景的设备、方法及计算机程序 |
WO2022074201A2 (en) | 2020-10-09 | 2022-04-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method, or computer program for processing an encoded audio scene using a bandwidth extension |
BR112023006291A2 (pt) | 2020-10-09 | 2023-05-09 | Fraunhofer Ges Forschung | Dispositivo, método ou programa de computador para processar uma cena de áudio codificada usando uma conversão de parâmetro |
JP2023549033A (ja) | 2020-10-09 | 2023-11-22 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | パラメータ平滑化を用いて符号化されたオーディオシーンを処理するための装置、方法、またはコンピュータプログラム |
WO2022153632A1 (ja) * | 2021-01-18 | 2022-07-21 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 信号処理装置、及び、信号処理方法 |
EP4243015A4 (en) | 2021-01-27 | 2024-04-17 | Samsung Electronics Co., Ltd. | AUDIO PROCESSING APPARATUS AND METHOD |
JP2024521486A (ja) | 2021-06-15 | 2024-05-31 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | コインシデントステレオ捕捉のためのチャネル間時間差(itd)推定器の改善された安定性 |
CN113435313A (zh) * | 2021-06-23 | 2021-09-24 | 中国电子科技集团公司第二十九研究所 | 一种基于dft的脉冲频域特征提取方法 |
JPWO2023153228A1 (ja) * | 2022-02-08 | 2023-08-17 | ||
CN115691515A (zh) * | 2022-07-12 | 2023-02-03 | 南京拓灵智能科技有限公司 | 一种音频编解码方法及装置 |
WO2024053353A1 (ja) * | 2022-09-08 | 2024-03-14 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 信号処理装置、及び、信号処理方法 |
WO2024074302A1 (en) | 2022-10-05 | 2024-04-11 | Telefonaktiebolaget Lm Ericsson (Publ) | Coherence calculation for stereo discontinuous transmission (dtx) |
EP4383254A1 (en) | 2022-12-07 | 2024-06-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder comprising an inter-channel phase difference calculator device and method for operating such encoder |
WO2024160859A1 (en) | 2023-01-31 | 2024-08-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Refined inter-channel time difference (itd) selection for multi-source stereo signals |
WO2024202997A1 (ja) * | 2023-03-29 | 2024-10-03 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | チャネル間時間差推定装置、及び、チャネル間時間差推定方法 |
WO2024202972A1 (ja) * | 2023-03-29 | 2024-10-03 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | チャネル間時間差推定装置、及び、チャネル間時間差推定方法 |
CN117476026A (zh) * | 2023-12-26 | 2024-01-30 | 芯瞳半导体技术(山东)有限公司 | 一种多路音频数据混音的方法、系统、装置及存储介质 |
Family Cites Families (87)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5434948A (en) * | 1989-06-15 | 1995-07-18 | British Telecommunications Public Limited Company | Polyphonic coding |
US5526359A (en) | 1993-12-30 | 1996-06-11 | Dsc Communications Corporation | Integrated multi-fabric digital cross-connect timing architecture |
US6073100A (en) * | 1997-03-31 | 2000-06-06 | Goodridge, Jr.; Alan G | Method and apparatus for synthesizing signals using transform-domain match-output extension |
US5903872A (en) * | 1997-10-17 | 1999-05-11 | Dolby Laboratories Licensing Corporation | Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries |
US6138089A (en) * | 1999-03-10 | 2000-10-24 | Infolio, Inc. | Apparatus system and method for speech compression and decompression |
US6549884B1 (en) * | 1999-09-21 | 2003-04-15 | Creative Technology Ltd. | Phase-vocoder pitch-shifting |
EP1199711A1 (en) * | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Encoding of audio signal using bandwidth expansion |
US7583805B2 (en) * | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
FI119955B (fi) * | 2001-06-21 | 2009-05-15 | Nokia Corp | Menetelmä, kooderi ja laite puheenkoodaukseen synteesi-analyysi puhekoodereissa |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7089178B2 (en) * | 2002-04-30 | 2006-08-08 | Qualcomm Inc. | Multistream network feature processing for a distributed speech recognition system |
WO2003107591A1 (en) * | 2002-06-14 | 2003-12-24 | Nokia Corporation | Enhanced error concealment for spatial audio |
CN100477531C (zh) * | 2002-08-21 | 2009-04-08 | 广州广晟数码技术有限公司 | 用于对多声道数字音频信号进行压缩编码的编码方法 |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7536305B2 (en) * | 2002-09-04 | 2009-05-19 | Microsoft Corporation | Mixed lossless audio compression |
US7394903B2 (en) | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
US7596486B2 (en) | 2004-05-19 | 2009-09-29 | Nokia Corporation | Encoding an audio signal using different audio coder modes |
EP1769491B1 (en) * | 2004-07-14 | 2009-09-30 | Koninklijke Philips Electronics N.V. | Audio channel conversion |
US8204261B2 (en) * | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
US7573912B2 (en) | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
US9626973B2 (en) * | 2005-02-23 | 2017-04-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
US20070055510A1 (en) | 2005-07-19 | 2007-03-08 | Johannes Hilpert | Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding |
KR100712409B1 (ko) * | 2005-07-28 | 2007-04-27 | 한국전자통신연구원 | 벡터의 차원변환 방법 |
TWI396188B (zh) * | 2005-08-02 | 2013-05-11 | Dolby Lab Licensing Corp | 依聆聽事件之函數控制空間音訊編碼參數的技術 |
US8112286B2 (en) * | 2005-10-31 | 2012-02-07 | Panasonic Corporation | Stereo encoding device, and stereo signal predicting method |
US7720677B2 (en) | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
EP1989707A2 (fr) * | 2006-02-24 | 2008-11-12 | France Telecom | Procede de codage binaire d'indices de quantification d'une enveloppe d'un signal, procede de decodage d'une enveloppe d'un signal et modules de codage et decodage correspondants |
DE102006049154B4 (de) * | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
DE102006051673A1 (de) * | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
GB2453117B (en) * | 2007-09-25 | 2012-05-23 | Motorola Mobility Inc | Apparatus and method for encoding a multi channel audio signal |
US9275648B2 (en) * | 2007-12-18 | 2016-03-01 | Lg Electronics Inc. | Method and apparatus for processing audio signal using spectral data of audio signal |
EP2107556A1 (en) * | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
CN101267362B (zh) * | 2008-05-16 | 2010-11-17 | 亿阳信通股份有限公司 | 一种性能指标值正常波动范围的动态确定方法及其装置 |
KR101629862B1 (ko) | 2008-05-23 | 2016-06-24 | 코닌클리케 필립스 엔.브이. | 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더 |
US8355921B2 (en) * | 2008-06-13 | 2013-01-15 | Nokia Corporation | Method, apparatus and computer program product for providing improved audio processing |
EP2144229A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
JP5551694B2 (ja) * | 2008-07-11 | 2014-07-16 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 多くのスペクトルエンベロープを計算するための装置および方法 |
ES2683077T3 (es) | 2008-07-11 | 2018-09-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada |
CN103000178B (zh) * | 2008-07-11 | 2015-04-08 | 弗劳恩霍夫应用研究促进协会 | 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码 |
PT2146344T (pt) * | 2008-07-17 | 2016-10-13 | Fraunhofer Ges Forschung | Esquema de codificação/descodificação de áudio com uma derivação comutável |
US8504378B2 (en) * | 2009-01-22 | 2013-08-06 | Panasonic Corporation | Stereo acoustic signal encoding apparatus, stereo acoustic signal decoding apparatus, and methods for the same |
US8457975B2 (en) * | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
KR101316979B1 (ko) | 2009-01-28 | 2013-10-11 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 코딩 |
BRPI1009467B1 (pt) | 2009-03-17 | 2020-08-18 | Dolby International Ab | Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo |
JP5574498B2 (ja) | 2009-05-20 | 2014-08-20 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、復号装置、およびこれらの方法 |
CN101989429B (zh) | 2009-07-31 | 2012-02-01 | 华为技术有限公司 | 转码方法、装置、设备以及系统 |
JP5031006B2 (ja) | 2009-09-04 | 2012-09-19 | パナソニック株式会社 | スケーラブル復号化装置及びスケーラブル復号化方法 |
CA2778205C (en) * | 2009-10-21 | 2015-11-24 | Dolby International Ab | Apparatus and method for generating a high frequency audio signal using adaptive oversampling |
KR101445296B1 (ko) * | 2010-03-10 | 2014-09-29 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 샘플링 레이트 의존 시간 왜곡 윤곽 인코딩을 이용하는 오디오 신호 디코더, 오디오 신호 인코더, 방법, 및 컴퓨터 프로그램 |
JP5405373B2 (ja) * | 2010-03-26 | 2014-02-05 | 富士フイルム株式会社 | 電子内視鏡システム |
MX2012011532A (es) | 2010-04-09 | 2012-11-16 | Dolby Int Ab | Codificacion a estereo para prediccion de complejos basados en mdct. |
EP2375409A1 (en) | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
PL3779977T3 (pl) | 2010-04-13 | 2023-11-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder audio do przetwarzania audio stereo z wykorzystaniem zmiennego kierunku predykcji |
US8463414B2 (en) * | 2010-08-09 | 2013-06-11 | Motorola Mobility Llc | Method and apparatus for estimating a parameter for low bit rate stereo transmission |
BR122021003688B1 (pt) * | 2010-08-12 | 2021-08-24 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. | Reamostrar sinais de saída de codecs de áudio com base em qmf |
RU2562384C2 (ru) | 2010-10-06 | 2015-09-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Способ и устройство для обработки аудио сигнала и для обеспечения большей детализации во времени для комбинированного унифицированного кодека речи и аудио (usac) |
FR2966634A1 (fr) | 2010-10-22 | 2012-04-27 | France Telecom | Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase |
PL3035330T3 (pl) * | 2011-02-02 | 2020-05-18 | Telefonaktiebolaget Lm Ericsson (Publ) | Określanie międzykanałowej różnicy czasu wielokanałowego sygnału audio |
DK3182409T3 (en) * | 2011-02-03 | 2018-06-14 | Ericsson Telefon Ab L M | DETERMINING THE INTERCHANNEL TIME DIFFERENCE FOR A MULTI-CHANNEL SIGNAL |
SG192746A1 (en) | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Apparatus and method for processing a decoded audio signal in a spectral domain |
AU2012217153B2 (en) * | 2011-02-14 | 2015-07-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion |
EP2710592B1 (en) * | 2011-07-15 | 2017-11-22 | Huawei Technologies Co., Ltd. | Method and apparatus for processing a multi-channel audio signal |
EP2600343A1 (en) * | 2011-12-02 | 2013-06-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for merging geometry - based spatial audio coding streams |
EP2817803B1 (en) | 2012-02-23 | 2016-02-03 | Dolby International AB | Methods and systems for efficient recovery of high frequency audio content |
CN103366751B (zh) * | 2012-03-28 | 2015-10-14 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
CN103366749B (zh) * | 2012-03-28 | 2016-01-27 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
EP2834813B1 (en) | 2012-04-05 | 2015-09-30 | Huawei Technologies Co., Ltd. | Multi-channel audio encoder and method for encoding a multi-channel audio signal |
ES2571742T3 (es) | 2012-04-05 | 2016-05-26 | Huawei Tech Co Ltd | Método de determinación de un parámetro de codificación para una señal de audio multicanal y un codificador de audio multicanal |
KR20150012146A (ko) * | 2012-07-24 | 2015-02-03 | 삼성전자주식회사 | 오디오 데이터를 처리하기 위한 방법 및 장치 |
WO2014043476A1 (en) * | 2012-09-14 | 2014-03-20 | Dolby Laboratories Licensing Corporation | Multi-channel audio content analysis based upmix detection |
US9460729B2 (en) * | 2012-09-21 | 2016-10-04 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
JP5608834B1 (ja) * | 2012-12-27 | 2014-10-15 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 映像表示方法 |
CA2900437C (en) * | 2013-02-20 | 2020-07-21 | Christian Helmrich | Apparatus and method for encoding or decoding an audio signal using a transient-location dependent overlap |
EP2959479B1 (en) * | 2013-02-21 | 2019-07-03 | Dolby International AB | Methods for parametric multi-channel encoding |
TWI546799B (zh) * | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
EP2830061A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
EP2980795A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
WO2016108655A1 (ko) * | 2014-12-31 | 2016-07-07 | 한국전자통신연구원 | 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치 |
US10568072B2 (en) | 2014-12-31 | 2020-02-18 | Lg Electronics Inc. | Method for allocating resource in wireless communication system and apparatus therefor |
EP3067887A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
CN107710323B (zh) * | 2016-01-22 | 2022-07-19 | 弗劳恩霍夫应用研究促进协会 | 使用频谱域重新取样来编码或解码音频多通道信号的装置及方法 |
US10224042B2 (en) | 2016-10-31 | 2019-03-05 | Qualcomm Incorporated | Encoding of multiple audio signals |
-
2017
- 2017-01-20 CN CN201780002248.3A patent/CN107710323B/zh active Active
- 2017-01-20 SG SG11201806241QA patent/SG11201806241QA/en unknown
- 2017-01-20 BR BR112017025314-3A patent/BR112017025314A2/pt active Search and Examination
- 2017-01-20 AU AU2017208580A patent/AU2017208580B2/en active Active
- 2017-01-20 KR KR1020187024177A patent/KR102219752B1/ko active IP Right Grant
- 2017-01-20 PT PT177007077T patent/PT3405949T/pt unknown
- 2017-01-20 CA CA3011915A patent/CA3011915C/en active Active
- 2017-01-20 RU RU2017145250A patent/RU2693648C2/ru active
- 2017-01-20 WO PCT/EP2017/051208 patent/WO2017125559A1/en active Application Filing
- 2017-01-20 PL PL17701669T patent/PL3405951T3/pl unknown
- 2017-01-20 KR KR1020187024171A patent/KR102230727B1/ko active IP Right Grant
- 2017-01-20 JP JP2018510479A patent/JP6412292B2/ja active Active
- 2017-01-20 JP JP2018538601A patent/JP6626581B2/ja active Active
- 2017-01-20 PT PT177016698T patent/PT3405951T/pt unknown
- 2017-01-20 BR BR112018014916-0A patent/BR112018014916A2/pt active Search and Examination
- 2017-01-20 ES ES17700705T patent/ES2790404T3/es active Active
- 2017-01-20 MY MYPI2018001321A patent/MY189205A/en unknown
- 2017-01-20 SG SG11201806246UA patent/SG11201806246UA/en unknown
- 2017-01-20 JP JP2018538633A patent/JP6730438B2/ja active Active
- 2017-01-20 EP EP17701669.8A patent/EP3405951B1/en active Active
- 2017-01-20 PL PL17700707T patent/PL3405949T3/pl unknown
- 2017-01-20 CN CN202210761486.5A patent/CN115148215A/zh active Pending
- 2017-01-20 ES ES17701669T patent/ES2768052T3/es active Active
- 2017-01-20 EP EP17700707.7A patent/EP3405949B1/en active Active
- 2017-01-20 MX MX2018008889A patent/MX2018008889A/es active IP Right Grant
- 2017-01-20 MX MX2018008887A patent/MX2018008887A/es active IP Right Grant
- 2017-01-20 EP EP17700706.9A patent/EP3284087B1/en active Active
- 2017-01-20 CN CN202311130088.4A patent/CN117238300A/zh active Pending
- 2017-01-20 ES ES17700706T patent/ES2727462T3/es active Active
- 2017-01-20 MY MYPI2018001323A patent/MY196436A/en unknown
- 2017-01-20 RU RU2018130151A patent/RU2705007C1/ru active
- 2017-01-20 CN CN201780018903.4A patent/CN108780649B/zh active Active
- 2017-01-20 PT PT17700706T patent/PT3284087T/pt unknown
- 2017-01-20 WO PCT/EP2017/051205 patent/WO2017125558A1/en active Application Filing
- 2017-01-20 CA CA2987808A patent/CA2987808C/en active Active
- 2017-01-20 KR KR1020177037759A patent/KR102083200B1/ko active IP Right Grant
- 2017-01-20 MY MYPI2018001318A patent/MY189223A/en unknown
- 2017-01-20 WO PCT/EP2017/051214 patent/WO2017125563A1/en active Application Filing
- 2017-01-20 CN CN201780019674.8A patent/CN108885879B/zh active Active
- 2017-01-20 PL PL17700706T patent/PL3284087T3/pl unknown
- 2017-01-20 KR KR1020187024233A patent/KR102343973B1/ko active IP Right Grant
- 2017-01-20 MY MYPI2017001705A patent/MY181992A/en unknown
- 2017-01-20 JP JP2018538602A patent/JP6641018B2/ja active Active
- 2017-01-20 AU AU2017208576A patent/AU2017208576B2/en active Active
- 2017-01-20 EP EP17700705.1A patent/EP3405948B1/en active Active
- 2017-01-20 ES ES19157001T patent/ES2965487T3/es active Active
- 2017-01-20 AU AU2017208575A patent/AU2017208575B2/en active Active
- 2017-01-20 SG SG11201806216YA patent/SG11201806216YA/en unknown
- 2017-01-20 MX MX2017015009A patent/MX371224B/es active IP Right Grant
- 2017-01-20 TR TR2019/06475T patent/TR201906475T4/tr unknown
- 2017-01-20 CA CA3011914A patent/CA3011914C/en active Active
- 2017-01-20 ES ES17700707T patent/ES2773794T3/es active Active
- 2017-01-20 BR BR112018014799-0A patent/BR112018014799A2/pt active Search and Examination
- 2017-01-20 CA CA3012159A patent/CA3012159C/en active Active
- 2017-01-20 CN CN201780018898.7A patent/CN108885877B/zh active Active
- 2017-01-20 RU RU2018130272A patent/RU2711513C1/ru active
- 2017-01-20 BR BR112018014689-7A patent/BR112018014689A2/pt active Search and Examination
- 2017-01-20 MX MX2018008890A patent/MX2018008890A/es active IP Right Grant
- 2017-01-20 WO PCT/EP2017/051212 patent/WO2017125562A1/en active Application Filing
- 2017-01-20 EP EP19157001.9A patent/EP3503097B1/en active Active
- 2017-01-20 RU RU2018130275A patent/RU2704733C1/ru active
- 2017-01-20 AU AU2017208579A patent/AU2017208579B2/en active Active
- 2017-01-20 PL PL19157001.9T patent/PL3503097T3/pl unknown
- 2017-01-23 TW TW106102410A patent/TWI643487B/zh active
- 2017-01-23 TW TW106102398A patent/TWI628651B/zh active
- 2017-01-23 TW TW106102409A patent/TWI629681B/zh active
- 2017-01-23 TW TW106102408A patent/TWI653627B/zh active
- 2017-11-22 US US15/821,108 patent/US10535356B2/en active Active
-
2018
- 2018-03-20 HK HK18103855.8A patent/HK1244584B/zh unknown
- 2018-07-11 ZA ZA2018/04625A patent/ZA201804625B/en unknown
- 2018-07-12 US US16/034,206 patent/US10861468B2/en active Active
- 2018-07-13 US US16/035,471 patent/US10424309B2/en active Active
- 2018-07-13 US US16/035,456 patent/US10706861B2/en active Active
- 2018-07-17 ZA ZA2018/04776A patent/ZA201804776B/en unknown
- 2018-07-20 ZA ZA2018/04910A patent/ZA201804910B/en unknown
- 2018-09-27 JP JP2018181254A patent/JP6856595B2/ja active Active
-
2019
- 2019-04-04 US US16/375,437 patent/US10854211B2/en active Active
- 2019-08-09 AU AU2019213424A patent/AU2019213424B8/en active Active
- 2019-12-26 JP JP2019235359A patent/JP6859423B2/ja active Active
-
2020
- 2020-02-19 US US16/795,548 patent/US11410664B2/en active Active
- 2020-07-02 JP JP2020114535A patent/JP7053725B2/ja active Active
-
2021
- 2021-03-18 JP JP2021044222A patent/JP7258935B2/ja active Active
- 2021-03-25 JP JP2021051011A patent/JP7161564B2/ja active Active
-
2022
- 2022-03-31 JP JP2022057862A patent/JP7270096B2/ja active Active
- 2022-05-23 US US17/751,303 patent/US11887609B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6859423B2 (ja) | チャネル間時間差を推定する装置及び方法 | |
TWI714046B (zh) | 用於估計聲道間時間差的裝置、方法或計算機程式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200116 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200116 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A132 Effective date: 20201201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210224 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210325 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6859423 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |