JP2021519950A - 位相値を大きさ値に適用するダウンミキサ、オーディオ符号化装置、方法及びコンピュータプログラム - Google Patents
位相値を大きさ値に適用するダウンミキサ、オーディオ符号化装置、方法及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2021519950A JP2021519950A JP2020554533A JP2020554533A JP2021519950A JP 2021519950 A JP2021519950 A JP 2021519950A JP 2020554533 A JP2020554533 A JP 2020554533A JP 2020554533 A JP2020554533 A JP 2020554533A JP 2021519950 A JP2021519950 A JP 2021519950A
- Authority
- JP
- Japan
- Prior art keywords
- value
- spectral region
- values
- signal
- mod
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000004590 computer program Methods 0.000 title claims abstract description 17
- 230000003595 spectral effect Effects 0.000 claims abstract description 326
- 238000004364 calculation method Methods 0.000 claims description 117
- 230000001066 destructive effect Effects 0.000 claims description 73
- 230000005236 sound signal Effects 0.000 claims description 31
- 238000009499 grossing Methods 0.000 claims description 25
- 230000009467 reduction Effects 0.000 claims description 17
- 230000002829 reductive effect Effects 0.000 claims description 14
- 238000001228 spectrum Methods 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 9
- 230000002123 temporal effect Effects 0.000 claims description 9
- 238000013507 mapping Methods 0.000 description 38
- 238000012937 correction Methods 0.000 description 33
- 238000012545 processing Methods 0.000 description 25
- 239000013598 vector Substances 0.000 description 19
- 230000006870 function Effects 0.000 description 18
- 238000012935 Averaging Methods 0.000 description 14
- 238000007792 addition Methods 0.000 description 14
- 230000003044 adaptive effect Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 10
- 230000008878 coupling Effects 0.000 description 8
- 238000010168 coupling process Methods 0.000 description 8
- 238000005859 coupling reaction Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000003321 amplification Effects 0.000 description 6
- 238000012423 maintenance Methods 0.000 description 6
- 238000003199 nucleic acid amplification method Methods 0.000 description 6
- 239000000872 buffer Substances 0.000 description 5
- 238000009795 derivation Methods 0.000 description 4
- 230000002265 prevention Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 241000209094 Oryza Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000004134 energy conservation Methods 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 241000473391 Archosargus rhomboidalis Species 0.000 description 1
- 101100521334 Mus musculus Prom1 gene Proteins 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000005549 size reduction Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/307—Frequency adjustment, e.g. tone control
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/13—Aspects of volume control, not necessarily automatic, in stereophonic sound systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Amplifiers (AREA)
Abstract
Description
)の算定においてキャンセル度情報を考慮するように構成される。例えば、キャンセル度情報は、入力信号の(例えば、同じスペクトルビンに関連付けられている)スペクトル領域値間の建設的干渉又は破壊的干渉の程度を示す(又は定量的に示す)。さらに、ダウンミキサは、大きさ値(例えば、
)と比較したとき(又はそれに関して)、又はキャンセル度情報が破壊的干渉を示す場合に入力信号のスペクトル領域値のラウドネス値の合計を表す「基準大きさ」と比較したとき(又はそれに関して)、ダウンミックス信号のスペクトル領域値の大きさ値(例えば、
)を選択的に低減(例えば、減衰)するように構成される(ここで、例えば、大きさ値の低減は、キャンセル度情報に応じて連続的に変化してもよい)。強い破壊的干渉が見つかったとき、この場合の位相値は通常信頼できないため、スペクトル領域値の大きさ値を低減することが推奨されることが見出された。言い換えれば、強い破壊的干渉の存在は、通常、位相値を信頼できないものにする、すなわち広い角度範囲で急速に変化させる。このような場合、ダウンミックス信号のスペクトル領域値の大きさ値を低減すると、アーチファクトの低減に役立つ。ただし、入力信号のスペクトル領域値の複素表現を単純に加算する場合と比較して、ダウンミックス信号のスペクトル領域値の大きさ値を適切に制御された方法で低減する方がよいことが見出された。
)の選択的低減がもたらされ、その結果、非支配的な合計値と、その関連する支配的な合計値との間の符号なし比率(例えば、|sumRe−|/sumRe+及び|sumIm−|/sumIm+)の増加によって、ダウンミックス信号のスペクトル領域値の大きさ値(例えば、
)の低減(例えば、スケーリング値Qの低減)がもたらされる。この実施形態は、反対方向に関連付けられた合計値間の比率が、負の(破壊的な)干渉の程度についての信頼できる情報を提供するという考えに基づいている。例えば、最初の非支配的な合計値が最初の支配的な合計値よりも大幅に小さい場合、(最初の支配的な合計に関連付けられている)最初の方向と(最初の非支配的な合計に関連付けられている)3番目の方向との間にキャンセルがないか、わずかしかないと結論付けることができる。同様に、第1の非支配的な合計値と、その関連する第1の支配的な合計値との間の符号なし比率(すなわち、符号を考慮しない比率)が大きくなる(例えば、1に近づく)と、(第1の支配的な合計値が関連付けられている)第1の方向と(第1の非支配的な合計値が関連付けられている)第3の方向との間に比較的強いキャンセルがあると結論付けることができる。結論として、非支配的な合計値と支配的な合計値は、入力信号間のキャンセルを認識するために効率的に使用でき、したがって、ダウンミックス信号のスペクトル領域値の大きさ値の低減を制御するために効率的に使用できる。
)が基準値(例えば、
)に対して選択的に低減され、入力信号のスペクトル領域値の合計ラウドネスに対応するように、また、キャンセル度情報(例えば、Q)が入力信号間の比較的小さい破壊的干渉を示す時点で、大きさ値が基準値(例えば、
)に対して選択的に増やされるように、ダウンミックス信号のスペクトル領域値の大きさ値(例えば、
)を算定するように構成される。キャンセル度情報が比較的大きな破壊的干渉を示す時点でダウンミックス信号のスペクトル領域値の大きさ値を選択的に低減することにより、誤った位相値又は位相値の急速な変化によって引き起こされる可能性のある歪みを回避することができる。一方、キャンセル度情報が入力信号間の比較的小さい破壊的干渉を示す時点でダウンミックス信号のスペクトル領域値の大きさ値を選択的に増加させることによって、大きさ値の低減により引き起こされるエネルギー損失を少なくとも部分的に補償することができる。したがって、全体的な知覚されるラウドネスを維持することができる。ある時点でのダウンミックス信号のスペクトル領域値の大きさの選択的な低減(高い破壊的干渉がある場合)は、歪みのリスクが高くないその他の場合においてダウンミックス信号のスペクトル領域値の大きさの選択的な増加によって(少なくとも部分的に)補償される。したがって、エネルギー損失を少なくとも部分的に補償することができ、ダウンミックス信号の良好な聴覚印象を達成することができる。
)を選択的にどの程度増加させるかを算定するように、構成される。例えば、基準大きさ値に対する大きさ値の選択的増加は、以前に(例えば、時間平均で)大きさ値の比較的強い低減があった場合には、大きさ値が比較的大きい値だけ増加するように、以前に(例えば、時間平均で)大きさ値の比較的小さい低減があった場合には、大きさ値が比較的小さい値だけ増加するように、決定することができる。言い換えれば、基準値に対する大きさ値の選択的な増加の程度は、キャンセル度情報が入力信号間の比較的大きい破壊的干渉を示す時点で大きさ値を選択的に低減することに起因するエネルギーの損失が、キャンセル度情報が比較的小さい破壊的干渉を示す時点で大きさ値を選択的に増加させることによって少なくとも部分的に補償されるように決定することができる。したがって、破壊的干渉が発生する時点での大きさ値の低減によって引き起こされるであろうエネルギー損失を、少なくとも部分的に補償することができ、キャンセル度情報の履歴は、どの程度の補償が適切であるかという信頼できる情報を提供する。
が基準値MRに対してどの程度選択的に増やされるかを算定することができ)、その結果、大きさ値の(過去の/前の)低減を示す時間的平滑化キャンセル度情報の値は、(現在の)マッピングされたキャンセル度値の、瞬時の(現在の)キャンセル度値に対する(少なくとも、入力信号間の比較的小さい破壊的干渉を示す瞬時キャンセル度値に対する)増加をもたらす。したがって、キャンセル度情報の以前の展開によく適合するマッピングされたキャンセル度値を導出することが効果的に可能である。
)を算定する(例えば、計算又は推定する)ことを含む。この方法は、例えば、大きさ値の算定とは別に、(例えば、特定のスペクトルビンに関する)ダウンミックス信号のスペクトル領域値の(好ましくはスカラ)位相値(例えば、PP又は
を算定することを含む。この方法はまた、スペクトル領域値の大きさ値に基づき、(例えば、特定のスペクトルビンに関する)ダウンミックス信号のスペクトル領域値の複素数表現を得るために、位相値(例えば、PP又は
)を適用することを含む。この方法は、上記のダウンミキサと同じ考慮事項に基づく。この方法は、対応するダウンミキサに関しても、本明細書に記載の特徴、機能、及び詳細のいずれかによって補足され得ることにも留意されたい。この方法は、そのような特徴、機能、及び詳細を、個別に、又は組み合わせて使用することで補足され得る。
図1は、本発明の一実施形態による、ダウンミキサ100のブロック概略図を示す。
図2は、本発明の一実施形態による、ダウンミキサのブロック概略図の抜粋である。
)の計算で説明された式を、任意で使用できる。ただし、上記の式を1つ以上使用すれば十分であり、これらの式をすべて組み合わせて使用する必要はないことに留意されたい。
図3は、本発明の実施形態による、位相値算定の概略図を示す。図3による位相値算定は、その全体が300で示されている。位相値算定300は、任意により、図1によるダウンミキサ100の位相値算定130を置き換えられることに留意されたい。位相値算定300は、任意により、(図1によるダウンミキサ100のブロック120を置き換え得る)機能ブロック200と組み合わせて使用できることに留意されたい。しかしながら、位相値算定300は、大きさ値算定120と組み合わせて使用することもできる。
以下では、図5を参照して、ダウンミキサの実施形態について説明する。
入力信号はラウドネスを維持する方法でミックスダウンされ、大きさMR505を形成し、これは、図5において次のように、赤線/実線によって、又は「大きさ計算」とラベル付けされた線によって示される。
図6は、適応する基準大きさを使用したラウドネスダウンミックスによるダウンミキサのブロック概略図を示す。図6によるダウンミキサ600は、図5によるダウンミキサ500に類似しているため、同一の信号、ブロック、特徴、及び機能は再び説明されないことに留意されたい。また、同一の特徴及び信号は、上記の説明が参照されるよう、同一の参照番号で示されることに留意されたい。
人工的に生成されたアーチファクトを克服するための1つの可能性は、基準大きさ(例えば、基準大きさ505)を、聞こえなくなるまで特定の時点で減衰させることである。このために、図5によるダウンミキサ500の「左側の翼」がアクティブ化される(これは、例えば、赤線/破線、又は「任意の大きさ変更」とラベル付けされた線タイプによって示される)。
図7は、複素平面における3つの入力信号のキャンセル度の導出に関する概略図を示す。横軸710は実部(又は実数成分)を示し、縦軸712は虚部(又は虚数成分)を表す。例えば、第1の入力信号のスペクトルビンを表す第1の複素値は、第1のベクトル720aで表され、例えば第2の入力信号のスペクトルビンを表すことができる第2の複素値は、第2のベクトル720bで表され、例えば第3の入力信号のスペクトルビンを表すことができる第3の複素値は、第3のベクトル720cで表される。言い換えれば、図7では、1つの潜在的な概念が、複素平面における3つのベクトル720a、720b、720cによって表される3つの入力信号に基づいて例示的に説明されている。
・3つのベクトルの負の虚部の合計が計算される→sumIm−
・3つのベクトルの正の実部の合計が計算される→sumRe+
・3つのベクトルの負の実部の合計が計算される→sumRe−
・これら4つの合計が、以下の式で結合される。
以下では、エネルギー保存の場合について、(マッピングブロック613によって実行され得る)マッピング処理が例示的に計算される。ただし、様々なマッピング式が可能であることに留意されたい。
−
=[0−1]で平滑化することにより、経時的なキャンセル度を追跡する。
−Qをその値の範囲の上限を超えてマッピングして、1を超える値を可能にして、したがって増幅を可能にする。
ただし、様々な追跡の式及び/又は方法が可能であることに留意されたい。
定数値T=0.6により、Qの値範囲のマッピングを達成でき、これは平均でエネルギー損失を補償することが見出された。指数Tの値は、125を超えるオーディオ信号の信号データベースから経験的に決定されたことに留意されたい。この目的のために、基準大きさのエネルギーが(可聴範囲内の)すべての帯域で合計され、Qmappedで処理された変更された大きさの合計エネルギーと比較され、差分はTで最小化された。ただし、別のマッピング効果が所望される場合、指数Tは引き続き変更可能である。
以下では、ラウドネス維持−マッピング613の代替の実装について説明する。
〇
=[0−1]で平滑化することにより、経時的なキャンセル度を追跡する。
ただし、様々な追跡の式/方法が可能である。
〇Qについて値1に向けて(満足できる)マッピングを行い、したがって基準大きさを増幅しない[212]。
一般的に言えば、このタイプのマッピングは元の基準大きさを維持しようとし、より強い破壊的干渉が検出された場合にのみそれを減衰させる。増幅は生じないが、知覚される全体的なラウドネスは変化しない。より強い破壊的干渉による基準大きさの減衰は、信号によってほとんどマスクされる。
〇定数ゲイン
は勾配の強度であり、例えば、1〜10(又は0.5〜20)の値を取ることができる。
〇勾配
は、キャンセル度の平均によって異なる。
〇
が小さいほど、潜在的なアーチファクトを増幅しないように、マッピングはより慎重に行われる。
〇
が大きいほど、マッピングはより強力になる。
図8は、本発明の別の実施形態による、ダウンミキサのブロック概略図を示す。
以下では、本発明の一態様に従って使用することができる、適応する位相を使用したラウドネスダウンミックスについて説明する。
結論として、複数の入力信号に基づきダウンミックス信号を提供するときにアーチファクトを低減するのに役立つ概念が説明されていることに留意されたい。具体的には、キャンセルから生じる問題が解決された。例えば、2つ以上のポインタ(又はフェーザ又はベクトル)が90°の角度領域の外側に位置するとすぐに、座標系の一方の軸又は両方の軸にキャンセルが生じる。すなわち、ポインタの実数成分又は虚数成分(又はフェーザ又はベクトル)(又は両方)が部分的に又は完全にキャンセルされる。したがって、破壊的干渉/重ね合わせについて述べることができる。したがって、破壊的干渉又は重ね合わせがあるかどうかの問題は、合計ベクトルの長さとは無関係であり、合計ベクトルの長さが2つのベクトルのうち長い方より長いかどうかの問題とも無関係である。
図9は、本発明の一実施形態による、複数の入力信号に基づきダウンミックス信号を提供する方法900のフローチャートを示す。
方法900は、ダウンミックス信号のスペクトル領域値の位相値を算定920することを含む。方法900はまた、スペクトル領域値の大きさ値に基づき、ダウンミックス信号のスペクトル領域値の複素数表現を得るために位相値を適用930することを含む。
図10は、本発明の一実施形態による、オーディオ符号化装置1000のブロック概略図を示す。
いくつかの態様が装置の文脈で説明されたが、これらの態様は、対応する方法の説明も表すことは明らかであり、ブロック又は装置は、方法ステップ又は方法ステップの特徴に対応する。同様に、方法ステップの文脈で説明される態様も、対応する装置の対応するブロック又はアイテム又は特徴の説明を表す。方法ステップの一部又はすべては、例えば、マイクロプロセッサ、プログラム可能なコンピュータ、又は電子回路などのハードウェア装置によって(又はそれを使用して)実行することができる。いくつかの実施形態では、最も重要な方法ステップのうち1つ又は複数は、そのような装置によって実行され得る。
さらに結論として、Nチャネル入力信号をダウンミキシングする場合、Mチャネル出力信号(N>M)を得るために、望ましくない影響が発生する可能性がある。これらの効果は、音の色付け、雰囲気の操作、音声明瞭度の低下、及びその他のアーチファクトの形で現れる可能性がある。
Claims (30)
- 複数の入力信号(110a、110b、210a、210b、500a、500n、1010a、1010n)に基づきダウンミックス信号(592、1022)を提供するためのダウンミキサ(100、500、600、800、1020)であって、
前記入力信号のラウドネス情報に基づき、前記ダウンミックス信号のスペクトル領域値(112、511a、511b)の大きさ値(MR、MMod R、122、221、222、505、506a)を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の位相値(PP、PMod P、132、398、508a、510a)を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値に基づき、前記ダウンミックス信号の前記スペクトル領域値の複素数値表現(112、511a、511b)を得るために、前記位相値(PP、PMod P、132、398、508a、510a)を適用するように構成される、
ダウンミキサ。 - 前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値(MR、MMod R)の前記算定とは別に、前記ダウンミックス信号の前記スペクトル領域値の前記位相値(PP、PMod P)を算定するように構成される、請求項1に記載のダウンミキサ。
- 前記入力信号のスペクトル領域値(110a、110b、210a、210b、501a、501n)のラウドネス値(503a、503b)を算定するように構成され、
前記入力信号の前記スペクトル領域値の前記ラウドネス値に基づき、前記ダウンミックス信号の前記スペクトル領域値に関連付けられた合計ラウドネス値(503d)を導出するように構成され、
前記合計ラウドネス値から前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値(MR、MMod R、122、221、222、505、506a)を導出するように構成される、請求項1又は請求項2に記載のダウンミキサ。 - 前記入力信号のスペクトル領域値の合計(507b、507d)又は加重和(392)を算定して、
前記入力信号のスペクトル領域値の前記合計又は前記加重和に基づき、前記位相値(PP、PMod P、132、398、508a、510a)を算定するように構成される、
請求項1から3のいずれか一項に記載のダウンミキサ。 - 前記ダウンミックス信号の前記スペクトル領域値の極座標表現の絶対値として前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値(MR、MMod R、122、221、222、505、506a)を使用するように、前記ダウンミックス信号の前記スペクトル領域値の前記極座標表現の位相値として前記位相値(PP、PMod P、132、398、508a、510a)を使用するように、及び前記極座標表現に基づき、前記ダウンミックス信号の前記スペクトル領域値のデカルト複素表現(511a、511b)を得るように構成される、
請求項1から4のいずれか一項に記載のダウンミキサ。 - キャンセル度情報(Q、232、612a)を算定し、前記ダウンミックス信号のスペクトル領域値の前記大きさ値(MMod R、222、506a)の前記算定において前記キャンセル度情報を考慮するように構成され、
前記キャンセル度情報が、前記入力信号のスペクトル領域値間の建設的又は破壊的干渉の程度を説明し、
前記キャンセル度情報により破壊的干渉が示される場合に、前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値(MMod R、222、506a)を、前記入力信号の前記スペクトル領域値のラウドネス値の合計を表す大きさ値(MR、221、505)と比較して選択的に低減するように構成される、
請求項1から5のいずれか一項に記載のダウンミキサ。 - 相異なる配向を有する前記入力信号の前記スペクトル領域値(110a、110b、210a、210b、501a、501n)の成分の合計(sumIm+、sumIm−、sumRe+、sumRe−)を算定するように構成され、
相異なる配向を有する前記入力信号の前記スペクトル領域値の成分の前記合計(sumIm+、sumIm−、sumRe+、sumRe−)に基づき、前記キャンセル度情報(Q)を算定するように構成される、
請求項6に記載のダウンミキサ。 - 前記算定された合計のうち、直交する配向に関連付けられており、支配的な合計値として、反対の方向(sumIm−及びsumRe−)に関連付けられている合計以上である2つ(sumIm+及びsumRe+)を選択するように構成され、
−第1の支配的な合計値(sumRe+)の配向と反対の配向に関連付けられた第1の非支配的な合計値(sumRe−)と、前記第1の支配的な合計値(sumRe+)との間の符号なし比率、及び
−第2の支配的な合計値(sumIm+)の配向と反対の配向に関連付けられた第2の非支配的な合計値(sumIm−)と、前記第2の支配的な合計値(sumIm+)との間の符号なし比率に基づき、
前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値(MMod R)の選択的な低減を引き起こすスケーリング値(Q、Qmapped)を算定するように構成され、
その結果、非支配的な合計値とその関連付けられた支配的な合計値との間で符号なし比率(|sumRe−|/sumRe+、|sumIm−|/sumIm+)が増加すると、前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値(MMod R)が低減する、
請求項7に記載のダウンミキサ。 - 以下の式に従って前記キャンセル度情報Qを計算するように構成され、前記式において、
sumRe+は、前記入力オーディオ信号の複素スペクトル領域値(110a、110b、210a、210b、501a、501n)の正の実部の合計であり、
sumRe−は、前記入力オーディオ信号の複素スペクトル領域値の負の実部の合計であり、
sumIm+は、前記入力オーディオ信号の複素スペクトル領域値の正の虚部の合計であり、
sumIm−は、前記入力オーディオ信号の複素スペクトル領域値の負の虚部の合計である、
請求項6から8のいずれか一項に記載のダウンミキサ。
・
及び
の場合:
・
及び
の場合:
・
及び
の場合:
・
及び
の場合:
- 前記ダウンミキサにより算定されるキャンセル度情報(Q、232)が前記入力信号間の比較的大きい破壊的干渉を示す時点で、前記大きさ値(MMod R)が基準値(MR、221)に対して選択的に低減され、前記入力信号のスペクトル領域値の合計ラウドネスに対応するように、また、
前記キャンセル度情報(Q)が前記入力信号間の比較的小さい破壊的干渉を示す時点で、前記大きさ値が前記基準値(MR)に対して選択的に増やされるように、
前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値(MMod R、222)を算定するように構成される、
請求項1から9のいずれか一項に記載のダウンミキサ。 - 前記キャンセル度情報(Q(t))を経時的に追跡するように、また、前記キャンセル度情報の履歴に応じて、前記キャンセル度情報(Q)が前記入力信号間の比較的小さい破壊的干渉を示す時点で、前記基準値(MR)に対して前記大きさ値を選択的にどの程度増加させるかを算定するように構成される、
請求項10に記載のダウンミキサ。 - 前ダウンミキサが、前記キャンセル度情報を追跡するために、無限インパルス応答平滑化演算又はスライディング平均平滑化演算を使用して、瞬時キャンセル度情報(Q(t))に基づき、時間的平滑化キャンセル度情報(Qsmooth(t))を得るように構成される、請求項10又は11に記載のダウンミキサ。
- 前記時間的平滑化キャンセル度情報(Qsmooth(t))に応じて、瞬時キャンセル度値(Q(t))をマッピングされたキャンセル度値(Qmapped)にマッピングするように構成され、
それにより、前記大きさ値の低減を示す前記時間的平滑化キャンセル度情報の値が、前記瞬時キャンセル度値を超える前記マッピングされたキャンセル度値の増加をもたらす、請求項10から12のいずれか一項に記載のダウンミキサ。 - pが0<=p<=1の定数である
により、前の平滑化キャンセル度値Qsmooth(t−1)に基づき、及び瞬時キャンセル度値Q(t)に基づき、更新された平滑化キャンセル度値Qsmooth(t)を得るように構成され、
Gが所定の値又は0.5〜20の間若しくは1〜10の間の定数であり、
mslope(t)が補助変数であり、
max{}が最大演算子であり、
min{}が最小演算子であり、
Q(t)が0〜1の間の範囲であり、前記入力信号間の比較的大きい破壊的干渉には値0を、前記入力信号間の比較的小さい破壊的干渉には値1をとる
により、マッピングされたキャンセル度値Qmapped(t)を得るように構成される、請求項1から13のいずれか一項に記載のダウンミキサ。 - キャンセル度値(Qmapped)を使用して前記入力信号のスペクトル領域値の合計ラウドネスに対応する大きさ値(MR、221)をスケーリングして、前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値(MMod R、222)を得るように構成される、
請求項1から15のいずれか一項に記載のダウンミキサ。 - 前記入力信号のスペクトル領域値(110a、110b、210a、210b、501a、501n)の加重和(392)を算定して、
前記入力信号のスペクトル領域値の前記加重和に基づき前記位相値(398)を算定するように構成され、
所定の干渉レベルより大きい破壊的干渉を回避するような方法で前記入力信号のスペクトル領域値に重み付けするように構成される、
請求項1から16のいずれか一項に記載のダウンミキサ。 - 前記入力信号のスペクトル領域値の加重和(392)を算定して、
前記入力信号のスペクトル領域値の前記加重和に基づき前記位相値(398)を算定するように構成され、
相異なる入力信号における前記それぞれのスペクトルビンの時間平均強度(362、372、382)に応じて前記入力信号のスペクトル領域値を重み付けするように構成される、
請求項1から17のいずれか一項に記載のダウンミキサ。 - 複数の入力オーディオ信号(1010a、1010n)に基づき、符号化されたオーディオ表現(1012)を提供するためのオーディオ符号化装置(1000)であって、
請求項1から18のいずれか一項に記載のダウンミキサを含み、
前記ダウンミキサは、前記複数の入力オーディオ信号のスペクトル領域表現に基づきダウンミックス信号(1022)を提供するように構成され、
前記符号化されたオーディオ表現(1012)を得るために、前記ダウンミックス信号を符号化するように構成される、オーディオ符号化装置。 - 複数の入力信号に基づきダウンミックス信号を提供する方法(900)であって、
前記入力信号のラウドネス情報に基づき、前記ダウンミックス信号のスペクトル領域値の大きさ値(MR、MMod R)を算定(910)することと、
前記ダウンミックス信号のスペクトル領域値の位相値(PP、PMod P)を算定(920)することと、
前記スペクトル領域値の前記大きさ値に基づき、前記ダウンミックス信号の前記スペクトル領域値の複素数表現を得るために前記位相値(PP、PMod P)を適用(930)することとを含む、方法。 - コンピュータプログラムがコンピュータ上で実行されるときに、請求項20に記載の方法を実行するためのコンピュータプログラム。
- 複数の入力信号(110a、110b、210a、210b、500a、500n、1010a、1010n)に基づきダウンミックス信号(592、1022)を提供するためのダウンミキサ(100、500、600、800、1020)であって、
前記入力信号のラウドネス情報に基づき、前記ダウンミックス信号のスペクトル領域値(112、511a、511b)の大きさ値(MR、MMod R、122、221、222、505、506a)を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の位相値(PP、PMod P、132、398、508a、510a)を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値に基づき、前記ダウンミックス信号の前記スペクトル領域値の複素数値表現(112、511a、511b)を得るために、前記位相値(PP、PMod P、132、398、508a、510a)を適用するように構成され、
前記入力信号のスペクトル領域値の合計(507b、507d)又は加重和(392)を算定して、前記入力信号のスペクトル領域値の前記合計又は前記加重和に基づき、前記位相値(PP、PMod P、132、398、508a、510a)を算定するように構成される、ダウンミキサ。 - 複数の入力信号(110a、110b、210a、210b、500a、500n、1010a、1010n)に基づきダウンミックス信号(592、1022)を提供するためのダウンミキサ(100、500、600、800、1020)であって、
前記入力信号のラウドネス情報に基づき、前記ダウンミックス信号のスペクトル領域値(112、511a、511b)の大きさ値(MR、MMod R、122、221、222、505、506a)を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の位相値(PP、PMod P、132、398、508a、510a)を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値に基づき、前記ダウンミックス信号の前記スペクトル領域値の複素数値表現(112、511a、511b)を得るために、前記位相値(PP、PMod P、132、398、508a、510a)を適用するように構成され、
キャンセル度情報(Q、232、612a)を算定し、前記ダウンミックス信号のスペクトル領域値の前記大きさ値(MMod R、222、506a)の前記算定において前記キャンセル度情報を考慮するように構成され、
前記キャンセル度情報は、前記入力信号のスペクトル領域値間の建設的干渉又は破壊的干渉の程度を示し、
前記キャンセル度情報により破壊的干渉が示される場合に、前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値(MMod R、222、506a)を、前記入力信号の前記スペクトル領域値のラウドネス値の合計を表す大きさ値(MR、221、505)と比較して選択的に低減するように構成される、ダウンミキサ。 - 複数の入力信号(110a、110b、210a、210b、500a、500n、1010a、1010n)に基づきダウンミックス信号(592、1022)を提供するためのダウンミキサ(100、500、600、800、1020)であって、
前記入力信号のラウドネス情報に基づき、前記ダウンミックス信号のスペクトル領域値(112、511a、511b)の大きさ値(MR、MMod R、122、221、222、505、506a)を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の位相値(PP、PMod P、132、398、508a、510a)を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値に基づき、前記ダウンミックス信号の前記スペクトル領域値の複素数値表現(112、511a、511b)を得るために、前記位相値(PP、PMod P、132、398、508a、510a)を適用するように構成され、
キャンセル度情報(Q、232、612a)を算定し、前記ダウンミックス信号のスペクトル領域値の前記大きさ値(MMod R、222、506a)の前記算定において、前記キャンセル度情報を考慮するように構成され、
前記キャンセル度情報は、前記入力信号のスペクトル領域値間の建設的干渉又は破壊的干渉の程度を示し、
前記キャンセル度情報により破壊的干渉が示される場合に、前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値(MMod R、222、506a)を、前記入力信号の前記スペクトル領域値のラウドネス値の合計を表す大きさ値(MR、221、505)と比較して選択的に低減するように構成され、
相異なる配向を有する前記入力信号の前記スペクトル領域値(110a、110b、210a、210b、501a、501n)の成分の合計(sumIm+、sumIm−、sumRe+、sumRe−)を算定するように構成され、
相異なる配向を有する前記入力信号の前記スペクトル領域値の成分の前記合計(sumIm+、sumIm−、sumRe+、sumRe−)に基づき、前記キャンセル度情報(Q)を算定するように構成され、
直交する配向に関連付けられており、また支配的な合計値として、反対の方向(sumIm−、sumRe−)に関連付けられている合計以上である前記算定された合計のうち2つ(sumIm+、sumRe+)を選択するように構成され、
−第1の支配的な合計値(sumRe+)の配向と反対の配向に関連付けられた第1の非支配的な合計値(sumRe−)と、前記第1の支配的な合計値(sumRe+)との間の符号なし比率、及び
−第2の支配的な合計値(sumIm+)の配向と反対の配向に関連付けられた第2の非支配的な合計値(sumIm−)と、前記第2の支配的な合計値(sumIm+)との間の符号なし比率に基づき、
前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値(MMod R)の選択的な低減を引き起こすスケーリング値(Q、Qmapped)を算定するように構成され、
その結果、非支配的な合計値とその関連付けられた支配的な合計値との間で符号なし比率(|sumRe−|/sumRe+、|sumIm−|/sumIm+)が増加すると、前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値(MMod R)が低減する、
ダウンミキサ。 - 複数の入力信号(110a、110b、210a、210b、500a、500n、1010a、1010n)に基づきダウンミックス信号(592、1022)を提供するためのダウンミキサ(100、500、600、800、1020)であって、
前記入力信号のラウドネス情報に基づき、前記ダウンミックス信号のスペクトル領域値(112、511a、511b)の大きさ値(MR、MMod R、122、221、222、505、506a)を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の位相値(PP、PMod P、132、398、508a、510a)を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値に基づき、前記ダウンミックス信号の前記スペクトル領域値の複素数値表現(112、511a、511b)を得るために、前記位相値(PP、PMod P、132、398、508a、510a)を適用するように構成され、
キャンセル度情報(Q、232、612a)を算定し、前記ダウンミックス信号のスペクトル領域値の前記大きさ値(MMod R、222、506a)の前記算定において前記キャンセル度情報を考慮するように構成され、
前記キャンセル度情報は、前記入力信号のスペクトル領域値間の建設的干渉又は破壊的干渉の程度を示し、
前記キャンセル度情報により破壊的干渉が示される場合に、前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値(MMod R、222、506a)を、前記入力信号の前記スペクトル領域値のラウドネス値の合計を表す大きさ値(MR、221、505)と比較して選択的に低減するように構成され、
以下の式に従って前記キャンセル度情報Qを計算するように構成され、前記式において、
sumRe+は、前記入力オーディオ信号の複素スペクトル領域値(110a、110b、210a、210b、501a、501n)の正の実部の合計であり、
sumRe−は、前記入力オーディオ信号の複素スペクトル領域値の負の実部の合計であり、
sumIm+は、前記入力オーディオ信号の複素スペクトル領域値の正の虚部の合計であり、
sumIm−は、前記入力オーディオ信号の複素スペクトル領域値の負の虚部の合計である、ダウンミキサ。
及び
の場合:
及び
の場合:
及び
の場合:
及び
の場合:
- 複数の入力信号(110a、110b、210a、210b、500a、500n、1010a、1010n)に基づきダウンミックス信号(592、1022)を提供するためのダウンミキサ(100、500、600、800、1020)であって、
前記入力信号のラウドネス情報に基づき、前記ダウンミックス信号のスペクトル領域値(112、511a、511b)の大きさ値(MR、MMod R、122、221、222、505、506a)を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の位相値(PP、PMod P、132、398、508a、510a)を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値に基づき、前記ダウンミックス信号の前記スペクトル領域値の複素数値表現(112、511a、511b)を得るために、前記位相値(PP、PMod P、132、398、508a、510a)を適用するように構成され、
前記ダウンミキサにより算定されるキャンセル度情報(Q、232)が前記入力信号間の比較的大きい破壊的干渉を示す時点で、前記大きさ値(MMod R)が基準値(MR、221)に対して選択的に低減され、前記入力信号のスペクトル領域値の合計ラウドネスに対応するように、また、
前記キャンセル度情報(Q)が前記入力信号間の比較的小さい破壊的干渉を示す時点で、前記大きさ値が前記基準値(MR)に対して選択的に増やされるように、
前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値(MMod R、222)を算定するように構成される、ダウンミキサ。 - 複数の入力信号(110a、110b、210a、210b、500a、500n、1010a、1010n)に基づきダウンミックス信号(592、1022)を提供するためのダウンミキサ(100、500、600、800、1020)であって、
前記入力信号のラウドネス情報に基づき、前記ダウンミックス信号のスペクトル領域値(112、511a、511b)の大きさ値(MR、MMod R、122、221、222、505、506a)を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の位相値(PP、PMod P、132、398、508a、510a)を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値に基づき、前記ダウンミックス信号の前記スペクトル領域値の複素数値表現(112、511a、511b)を得るために、前記位相値(PP、PMod P、132、398、508a、510a)を適用するように構成され、
pが0<p<1の定数である
により、前の平滑化キャンセル度値Qsmooth(t−1)に基づき、及び瞬時キャンセル度値Q(t)に基づき、更新された平滑化キャンセル度値Qsmooth(t)を得るように構成され、また、
Tが0<T<1の定数であり、
Q(t)が0〜1の間の範囲であり、前記入力信号間の比較的大きい破壊的干渉には値0を、前記入力信号間の比較的小さい破壊的干渉には値1をとる
により、マッピングされたキャンセル度値Qmapped(t)を得るように構成され、
前記マッピングされたキャンセル度値を使用して基準大きさ値(505)をスケーリングして、前記大きさ値(506a)を得るように構成される、ダウンミキサ。 - 複数の入力信号(110a、110b、210a、210b、500a、500n、1010a、1010n)に基づきダウンミックス信号(592、1022)を提供するためのダウンミキサ(100、500、600、800、1020)であって、
前記入力信号のラウドネス情報に基づき、前記ダウンミックス信号のスペクトル領域値(112、511a、511b)の大きさ値(MR、MMod R、122、221、222、505、506a)を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の位相値(PP、PMod P、132、398、508a、510a)を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値に基づき、前記ダウンミックス信号の前記スペクトル領域値の複素数値表現(112、511a、511b)を得るために、前記位相値(PP、PMod P、132、398、508a、510a)を適用するように構成され、
pが0<=p<=1の定数である
により、前の平滑化キャンセル度値Qsmooth(t−1)に基づき、及び瞬時キャンセル度値Q(t)に基づき、更新された平滑化キャンセル度値Qsmooth(t)を得るように構成され、また、
Gが所定の値又は0.5〜20の間若しくは1〜10の間の定数であり、
mslope(t)が補助変数であり、
max{}が最大演算子であり、
min{}が最小演算子であり、
Q(t)が0〜1の間の範囲であり、前記入力信号間の比較的大きい破壊的干渉には値0を、前記入力信号間の比較的小さい破壊的干渉には値1をとる
により、マッピングされたキャンセル度値Qmapped(t)を得るように構成され、
前記マッピングされたキャンセル度値を使用して基準大きさ値(505)をスケーリングして、前記大きさ値(506a)を得るように構成される、
ダウンミキサ。 - 複数の入力信号(110a、110b、210a、210b、500a、500n、1010a、1010n)に基づきダウンミックス信号(592、1022)を提供するためのダウンミキサ(100、500、600、800、1020)であって、
前記入力信号のラウドネス情報に基づき、前記ダウンミックス信号のスペクトル領域値(112、511a、511b)の大きさ値(MR、MMod R、122、221、222、505、506a)を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の位相値(PP、PMod P、132、398、508a、510a)を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値に基づき、前記ダウンミックス信号の前記スペクトル領域値の複素数値表現(112、511a、511b)を得るために、前記位相値(PP、PMod P、132、398、508a、510a)を適用するように構成され、
前記入力信号のスペクトル領域値(110a、110b、210a、210b、501a、501n)の加重和(392)を算定し、前記入力信号のスペクトル領域値の前記加重和に基づき前記位相値(398)を算定するように構成され、
所定の干渉レベルより大きい破壊的干渉を回避するような方法で、前記入力信号のスペクトル領域値に重み付けして、前記加重和を得るように構成され、
前記入力信号のスペクトル領域値(110a、110b、210a、210b、501a、501n)のラウドネス値(503a、503b)を算定するように構成され、
前記入力信号の前記スペクトル領域値の前記ラウドネス値に基づき、前記ダウンミックス信号の前記スペクトル領域値に関連付けられる合計ラウドネス値(503d)を導出するように構成され、
前記合計ラウドネス値から前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値(MR、MMod R、122、221、222、505、506a)を導出するように構成される、
ダウンミキサ。 - 複数の入力信号(110a、110b、210a、210b、500a、500n、1010a、1010n)に基づきダウンミックス信号(592、1022)を提供するためのダウンミキサ(100、500、600、800、1020)であって、
前記入力信号のラウドネス情報に基づき、前記ダウンミックス信号のスペクトル領域値(112、511a、511b)の大きさ値(MR、MMod R、122、221、222、505、506a)を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の位相値(PP、PMod P、132、398、508a、510a)を算定するように構成され、
前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値に基づき、前記ダウンミックス信号の前記スペクトル領域値の複素数値表現(112、511a、511b)を得るために、前記位相値(PP、PMod P、132、398、508a、510a)を適用するように構成され、
前記入力信号のスペクトル領域値の加重和(392)を算定し、前記入力信号のスペクトル領域値の前記加重和に基づき前記位相値(398)を算定するように構成され、
相異なる入力信号における前記それぞれのスペクトルビンの時間平均強度(362、372、382)に応じて前記入力信号のスペクトル領域値を重み付けして、前記加重和を得るように構成され、
前記入力信号のスペクトル領域値(110a、110b、210a、210b、501a、501n)のラウドネス値(503a、503b)を算定するように構成され、
前記入力信号の前記スペクトル領域値の前記ラウドネス値に基づき、前記ダウンミックス信号の前記スペクトル領域値に関連付けられる合計ラウドネス値(503d)を導出するように構成され、
前記合計ラウドネス値から前記ダウンミックス信号の前記スペクトル領域値の前記大きさ値(MR、MMod R、122、221、222、505、506a)を導出するように構成される、ダウンミキサ。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18166174.5 | 2018-04-06 | ||
EP18166174.5A EP3550561A1 (en) | 2018-04-06 | 2018-04-06 | Downmixer, audio encoder, method and computer program applying a phase value to a magnitude value |
PCT/EP2019/058713 WO2019193185A1 (en) | 2018-04-06 | 2019-04-05 | Downmixer, audio encoder, method and computer program applying a phase value to a magnitude value |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021519950A true JP2021519950A (ja) | 2021-08-12 |
JP7343519B2 JP7343519B2 (ja) | 2023-09-12 |
Family
ID=61913031
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020554533A Active JP7343519B2 (ja) | 2018-04-06 | 2019-04-05 | 位相値を大きさ値に適用するダウンミキサ、オーディオ符号化装置、方法及びコンピュータプログラム |
Country Status (9)
Country | Link |
---|---|
US (1) | US11418904B2 (ja) |
EP (5) | EP3550561A1 (ja) |
JP (1) | JP7343519B2 (ja) |
KR (1) | KR102554699B1 (ja) |
BR (1) | BR112020020469A2 (ja) |
CA (1) | CA3095973C (ja) |
ES (1) | ES2973047T3 (ja) |
MX (1) | MX2020010457A (ja) |
WO (1) | WO2019193185A1 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004048741A (ja) * | 2002-06-24 | 2004-02-12 | Agere Systems Inc | オーディオミキシングのための等化技術 |
US20120308018A1 (en) * | 2010-02-12 | 2012-12-06 | Huawei Technologies Co., Ltd. | Stereo signal down-mixing method, encoding/decoding apparatus and encoding and decoding system |
JP2013546013A (ja) * | 2010-10-22 | 2013-12-26 | オランジュ | 逆位相のチャネルに対する、改善されたステレオパラメトリック符号化/復号 |
JP2017501438A (ja) * | 2013-11-27 | 2017-01-12 | ディーティーエス・インコーポレイテッドDTS,Inc. | 高チャンネル数マルチチャンネルオーディオのためのマルチプレットベースのマトリックスミキシング |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7751572B2 (en) * | 2005-04-15 | 2010-07-06 | Dolby International Ab | Adaptive residual audio coding |
WO2007080211A1 (en) | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
EP2323130A1 (en) * | 2009-11-12 | 2011-05-18 | Koninklijke Philips Electronics N.V. | Parametric encoding and decoding |
WO2012006770A1 (en) * | 2010-07-12 | 2012-01-19 | Huawei Technologies Co., Ltd. | Audio signal generator |
JP5775583B2 (ja) | 2010-08-25 | 2015-09-09 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 送信された位相情報を用いてデコリレート済み信号を生成する装置 |
EP2838086A1 (en) | 2013-07-22 | 2015-02-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment |
EP2879131A1 (en) | 2013-11-27 | 2015-06-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder, encoder and method for informed loudness estimation in object-based audio coding systems |
-
2018
- 2018-04-06 EP EP18166174.5A patent/EP3550561A1/en not_active Withdrawn
-
2019
- 2019-04-05 WO PCT/EP2019/058713 patent/WO2019193185A1/en active Application Filing
- 2019-04-05 EP EP19714468.6A patent/EP3776542B1/en active Active
- 2019-04-05 ES ES19714468T patent/ES2973047T3/es active Active
- 2019-04-05 CA CA3095973A patent/CA3095973C/en active Active
- 2019-04-05 MX MX2020010457A patent/MX2020010457A/es unknown
- 2019-04-05 EP EP23196677.1A patent/EP4307720A3/en active Pending
- 2019-04-05 BR BR112020020469-2A patent/BR112020020469A2/pt unknown
- 2019-04-05 EP EP23196675.5A patent/EP4307719A3/en active Pending
- 2019-04-05 EP EP23196679.7A patent/EP4307721A3/en active Pending
- 2019-04-05 KR KR1020207032011A patent/KR102554699B1/ko active IP Right Grant
- 2019-04-05 JP JP2020554533A patent/JP7343519B2/ja active Active
-
2020
- 2020-10-02 US US17/061,993 patent/US11418904B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004048741A (ja) * | 2002-06-24 | 2004-02-12 | Agere Systems Inc | オーディオミキシングのための等化技術 |
US20120308018A1 (en) * | 2010-02-12 | 2012-12-06 | Huawei Technologies Co., Ltd. | Stereo signal down-mixing method, encoding/decoding apparatus and encoding and decoding system |
JP2013546013A (ja) * | 2010-10-22 | 2013-12-26 | オランジュ | 逆位相のチャネルに対する、改善されたステレオパラメトリック符号化/復号 |
JP2017501438A (ja) * | 2013-11-27 | 2017-01-12 | ディーティーエス・インコーポレイテッドDTS,Inc. | 高チャンネル数マルチチャンネルオーディオのためのマルチプレットベースのマトリックスミキシング |
Non-Patent Citations (1)
Title |
---|
HOANG, THI MINH NGUYET ET AL.: ""Parametric stereo extension of ITU-T G.722 based on a new downmixing scheme"", PROC. OF THE 2010 IEEE INTERNATIONAL WORKSHOP ON MULTIMEDIA SIGNAL PROCESSING, JPN6021051841, 4 October 2010 (2010-10-04), pages 188 - 193, XP031830580, ISSN: 0004670792 * |
Also Published As
Publication number | Publication date |
---|---|
KR102554699B1 (ko) | 2023-07-13 |
US20210021955A1 (en) | 2021-01-21 |
JP7343519B2 (ja) | 2023-09-12 |
EP4307720A3 (en) | 2024-02-21 |
RU2020136237A (ru) | 2022-05-06 |
CN112236819A (zh) | 2021-01-15 |
EP3776542B1 (en) | 2023-12-13 |
EP3776542A1 (en) | 2021-02-17 |
EP4307719A2 (en) | 2024-01-17 |
US11418904B2 (en) | 2022-08-16 |
EP4307720A2 (en) | 2024-01-17 |
ES2973047T3 (es) | 2024-06-18 |
EP4307719A3 (en) | 2024-04-24 |
CA3095973C (en) | 2023-05-09 |
WO2019193185A1 (en) | 2019-10-10 |
EP3776542C0 (en) | 2023-12-13 |
BR112020020469A2 (pt) | 2021-04-06 |
RU2020136237A3 (ja) | 2022-05-06 |
EP4307721A2 (en) | 2024-01-17 |
CA3095973A1 (en) | 2019-10-10 |
EP3550561A1 (en) | 2019-10-09 |
MX2020010457A (es) | 2020-11-24 |
KR20210003784A (ko) | 2021-01-12 |
EP4307721A3 (en) | 2024-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7161564B2 (ja) | チャネル間時間差を推定する装置及び方法 | |
US20220358939A1 (en) | Apparatus, method and computer program for upmixing a downmix audio signal using a phase value smoothing | |
KR100904542B1 (ko) | 멀티채널 합성장치 제어 신호를 발생하기 위한 장치 및방법과 멀티채널 합성을 위한 장치 및 방법 | |
EP2499638B1 (en) | Parametric encoding and decoding | |
US11594231B2 (en) | Apparatus, method or computer program for estimating an inter-channel time difference | |
US8818764B2 (en) | Downmixing device and method | |
JP6817433B2 (ja) | 少なくとも2つのチャンネルをダウンミックスするためのダウンミキサおよび方法ならびにマルチチャンネルエンコーダおよびマルチチャンネルデコーダ | |
US10021501B2 (en) | Concept for generating a downmix signal | |
Adami et al. | Down-mixing using coherence suppression | |
JP2021519950A (ja) | 位相値を大きさ値に適用するダウンミキサ、オーディオ符号化装置、方法及びコンピュータプログラム | |
CN112236819B (zh) | 下混合器、音频编码器、方法和计算机可读存储介质 | |
RU2773510C2 (ru) | Понижающий микшер, аудиокодер, способ и компьютерная программа, применяющая значение фазы к значению абсолютной величины | |
JP7275217B2 (ja) | 処理されたオーディオ信号表現を提供するための装置およびオーディオ信号プロセッサ、オーディオデコーダ、オーディオエンコーダ、方法、ならびにコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A529 | Written submission of copy of amendment under article 34 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A529 Effective date: 20201201 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201201 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211227 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220323 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220626 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221028 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230425 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230802 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230831 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7343519 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |