JP7384893B2 - マルチシグナルエンコーダ、マルチシグナルデコーダ、および信号白色化または信号後処理を使用する関連方法 - Google Patents
マルチシグナルエンコーダ、マルチシグナルデコーダ、および信号白色化または信号後処理を使用する関連方法 Download PDFInfo
- Publication number
- JP7384893B2 JP7384893B2 JP2021500045A JP2021500045A JP7384893B2 JP 7384893 B2 JP7384893 B2 JP 7384893B2 JP 2021500045 A JP2021500045 A JP 2021500045A JP 2021500045 A JP2021500045 A JP 2021500045A JP 7384893 B2 JP7384893 B2 JP 7384893B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- signals
- joint
- processing
- energy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 97
- 238000012805 post-processing Methods 0.000 title claims description 16
- 230000002087 whitening effect Effects 0.000 title claims description 8
- 238000012545 processing Methods 0.000 claims description 182
- 230000005236 sound signal Effects 0.000 claims description 107
- 230000003044 adaptive effect Effects 0.000 claims description 86
- 238000001228 spectrum Methods 0.000 claims description 64
- 238000010606 normalization Methods 0.000 claims description 36
- 230000003595 spectral effect Effects 0.000 claims description 33
- 239000013598 vector Substances 0.000 claims description 27
- 238000007781 pre-processing Methods 0.000 claims description 24
- 238000013139 quantization Methods 0.000 claims description 21
- 238000007493 shaping process Methods 0.000 claims description 21
- 238000011049 filling Methods 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 13
- 230000009977 dual effect Effects 0.000 claims description 12
- 230000002123 temporal effect Effects 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 claims description 6
- 230000002441 reversible effect Effects 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 5
- 230000010076 replication Effects 0.000 claims description 4
- 230000008054 signal transmission Effects 0.000 claims description 3
- 238000005429 filling process Methods 0.000 claims 3
- 108091006146 Channels Proteins 0.000 description 267
- 230000000875 corresponding effect Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000008901 benefit Effects 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000001052 transient effect Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004061 bleaching Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/162—Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
Description
a)さらなる符号化のための知覚的に白色化された信号の使用(音声コーダで使用される方法と同様)。これは、いくつかの利点を有する。
・ノイズシェーピング特性/マスキング閾値のコンパクトな表現(たとえばLPC係数として)
・変換および音声コーデックアーキテクチャを統合し、こうしてオーディオ/音声符号化の組み合わせを可能にする
b)パンされたソースを効率的に符号化するための、任意のチャンネルのILDパラメータの使用
c)エネルギーに基づく処理済みチャンネル間の柔軟なビット分布。
一実施形態では、適応ジョイント信号プロセッサ200は、選択された信号ペアの各信号について、L/Rなどの全帯域分離符号化モードの必要なビットレート、M/Sなどの全帯域ジョイント符号化モードの必要なビットレート、またはM/Sなどの帯域ごとジョイント符号化モードのビットレートプラスM/Sマスクなどの帯域ごと信号送信の必要なビットを決定し、帯域の大部分が特定のモードのために決定され、全ての帯域の10%未満である帯域の少数が他の符号化モードに決定されたとき、信号ペアの全ての帯域の特定のモードとして分離符号化モードまたはジョイント符号化モードを決定し、または最も少ない量のビットを必要とする符号化モードを決定するように構成される。ここで、出力インターフェース400は、処理530に関するサイド情報に指示532を含めるように構成されており、指示532は、フレームの符号化モードマスクの代わりにフレームの全ての帯域の前記特定のモードを示す。
さらなる実施形態では、適応ジョイント信号プロセッサ200は、処理済み信号ペアの信号がさらなる信号ペア処理で選択不可能な、非カスケード信号ペア処理を適用するように構成されている。適応ジョイント信号プロセッサ200は、ペアワイズ処理のための信号ペア間の相互相関に基づいて信号ペアを選択するように構成されており、いくつかの選択された信号ペアのペアワイズ処理が並行して実行される。
として、すなわち平均エネルギーを有する参照チャンネルに対する特定のチャンネルkについても示される。ブロック215では、量子化スケーリング比を使用して各チャンネルのスペクトルがスケーリングされる。ブロック215でのスケーリング操作は、ブロック213によって、すなわちアップスケーリングまたはダウンスケーリングのどちらが実行されるべきかという情報によって、制御される。ブロック215の出力は、各チャンネルのスケーリング済みスペクトルを表す。
この実装形態において、コーデックは、ジョイントステレオ符号化について[7]に記載される概念を導入することによって、[6]に記載されるような任意のチャンネルの信号適応型ジョイント符号化の柔軟性を融合するために、新しい概念を使用する。これらは、
a)さらなる符号化のための知覚的に白色化された信号の使用(音声コーダで使用される方法と同様)。これは、いくつかの利点を有する。
・ノイズシェーピング特性/マスキング閾値のコンパクトな表現(たとえばLPC係数として)
・変換および音声コーデックアーキテクチャを統合し、こうしてオーディオ/音声符号化の組み合わせを可能にする
b)パンされたソースを効率的に符号化するための、任意のチャンネルのILDパラメータの使用
c)エネルギーに基づく処理済みチャンネル間の柔軟なビット分布。
記載されたシステムでは、各チャンネルが白色化されたMDCT領域に変換された後、[6]に記載されたアルゴリズムに基づいて、ジョイント符号化のための任意のチャンネル間の様々な類似性の信号適応型の活用が適用される。この手順から、それぞれのチャンネルペアが検出され、帯域ごとのM/S変換を使用して共同で符号化されるように選択される。
M/S変換は、ILDが存在する場合、つまりチャンネルがパンされている場合には、効率的ではない。全てのチャンネルの知覚的に白色化されたスペクトルの振幅を平均エネルギーレベル
に正規化することによって、この問題を回避する。
・各チャンネルのスペクトルを平均エネルギーに向けて正規化する。
(ダウンスケーリング)の場合、
ここで、
はスケーリング比。スケーリング比は均一に量子化され、サイド情報ビットとしてデコーダに送信される。
ここで、
次に、スペクトルが最終的にスケーリングされる量子化スケーリング比は、以下によって与えられる。
(アップスケーリング)の場合、
および
ここで、
は前の場合と同様に計算される。
値に加えて、1ビットフラグ(0=ダウンスケーリング/1=アップスケーリング)が送信される。
は送信されて量子化されたスケーリング値
に使用されるビット数を示し、この値はエンコーダおよびデコーダに知られており、符号化オーディオ信号で送信される必要はない。
このステップでは、どのチャンネルペアが最も高い類似度を有し、したがってステレオジョイント符号化のためのペアとして選択されるのに適しているかを決定および選択するために、各可能なチャンネルペアのチャンネル間で正規化された相互相関値が計算される。各チャンネルペアの正規化相互相関値は、相互スペクトルによって以下のように与えられる。
ここで、
はフレームごとのスペクトル計数の総数、
および
は検討中のチャンネルペアのそれぞれのスペクトル。
チャンネルペア選択および共同で符号化されたステレオ処理
相互相関ベクトルを計算した後、ジョイント符号化のために検討すべき最初のチャンネルペアは、それぞれ最も高い相互相関値、および好ましくは0.3の最小値閾値を有するものである。
このバリエーションでは、相互相関ベクトルは、選択されたチャンネルペアの変更されたスペクトル(M/S変換を有する場合)の影響を受けるチャンネルペアに更新される。たとえば、6つのチャンネルの場合、選択および処理されたチャンネルペアが図4において0でインデックス付けされた場合、つまりチャンネル0をチャンネル1で符号化した場合には、ステレオ処理の後、影響を受けたチャンネルペアの相互相関を、すなわちインデックス0、1、2、3、4、5、6、7、8で再計算する必要が出てくる。
カスケードチャンネルペアツリープロセスは、全ての任意のチャンネルの相関を取り除き、最大のエネルギー圧縮を提供しようとするので、理論的には最適である。他方で、選択されるチャンネルペアの数が
を超える可能性があるためかなり複雑になり、結果的に計算がさらに複雑になり(ステレオ操作のM/S決定プロセスに起因する)、各チャンネルペアについてデコーダに送信される必要がある追加のメタデータも生じる。
多くの場合、フレームごとの任意のチャンネルペアの正規化相互相関値は近い可能性があり、そのため選択は、この近い値の間で頻繁に切り替わる可能性がある。これにより、チャンネルペアツリー切り換えが頻繁に発生し、その結果、出力システムの可聴性が不安定になり得る。したがって、信号の著しい変化があり、任意のチャンネル間の類似性が変化するときにのみ新しいチャンネルペアのセットが選択される、安定化機構を使用することが選択される。これを検出するために、現在のフレームの相互相関ベクトルが前のフレームのベクトルと比較され、特定の閾値よりも差が大きいときに、新しいチャンネルペアの選択が許可される。
の場合には、前のステップで説明されたように、共同で符号化される新しいチャンネルペアの選択が許可される。選択された閾値は、
他方で、差が小さい場合には、前のフレームと同じチャンネルペアツリーが使用される。所与のチャンネルペアごとに、前述のように帯域ごとのM/S操作が適用される。しかしながら、所与のチャンネルペアの正規化相互相関値が0.3の閾値を上回らない場合には、新しいツリーを作成する新しいチャンネルペアの選択が開始される。
チャンネルペア選択のための反復プロセスの終了後に、いずれのチャンネルペアの一部でなく、そのため別々に符号化されるチャンネルが存在する場合がある。これらのチャンネルでは、平均エネルギーレベルに向けたエネルギーレベルの初期の正規化が、元のエネルギーレベルに戻される。アップスケーリングまたはダウンスケーリングを信号送信するフラグに応じて、これらのチャンネルのエネルギーは、量子化スケーリング比の逆数
を使用して復帰される。
IGF分析に関しては、ステレオチャンネルペアの場合、[10]に完全に記載されるように、追加のジョイントステレオ処理が適用される。これが必要なのは、IGFスペクトルの特定の目標範囲では、信号が、相関性の高いパンされた音源であり得るからである。この特定の領域のために選択されたソース領域がうまく相関していない場合、エネルギーが目標領域で一致していても、相関していないソース領域のため、空間像が損なわれる可能性がある。
ジョイントチャンネルペアステレオ処理のプロセスの後、各チャンネルは、エントロピーコーダによって別々に量子化および符号化される。したがって、チャンネルごとに利用可能なビット数が付与されるべきである。このステップでは、処理されたチャンネルのエネルギーを使用して、利用可能な総ビットが各チャンネルに分布される。
で表される。最初のステップとして、ビットを分布させるエネルギーベースの比が計算される。
ここで、入力がLFEチャンネルからも構成されている場合、比の計算では考慮されないことに留意すべきである。LFEチャンネルでは、チャンネルが非ゼロのコンテンツを有する場合にのみ、最小量のビット
が割り当てられる。比は均等に量子化される。
量子化された比
は、送信されたチャンネルスペクトル係数を読み取るために各チャンネルに同じ量のビットを割り当てるためにデコーダから使用されるビットストリーム内に格納される。
によって必要とされる最小量のビットを割り当てる
・残りのビット、すなわち
が、量子化された比
を使用して分割される。
・量子化された比のため、ビットはほぼ分散され、したがって
であり得る。そのため、第2の改良ステップで、差
がチャンネルビット
から比例的に減算される。
・改良ステップの後、
と比較してまだ
の不一致がある場合には、その差(通常は非常に少ないビット)が最大エネルギーを有するチャンネルに寄付される。
はビット分布情報
に使用されるビット数を示し、この値は、エンコーダおよびデコーダに知られており、符号化オーディオ信号で送信される必要がない。
量子化、ノイズ充填、およびレートループを含むエントロピー符号化は、[8]に記載されるとおりである。レートループは、推定された
を使用して最適化されることが可能である。パワースペクトルP(MCLTの大きさ)は、[8]に記載されるように、量子化およびインテリジェントギャップ充填(IGF)の調性/ノイズ測定に使用される。白色化されて帯域ごとにM/S処理されたMDCTスペクトルがパワースペクトルに使用されるため、MDSTスペクトルに対して同じFDNSおよびM/S処理が行われなければならない。MDCTに対して行われたのと同じILDに基づく正規化スケーリングがMDSTスペクトルにも行われなければならない。TNSがアクティブなフレームでは、パワースペクトル計算に使用されるMDSTスペクトルは、白色化およびM/S処理されたMDCTスペクトルから推定される。
復号化プロセスは、共同で符号化されたチャンネルのスペクトルの復号化および逆量子化で始まり、[11]または[12]の6.2.2.「MDCTベースのTCX」に記載されるように、ノイズ充填がこれに続く。各チャンネルに割り当てられたビット数は、ビットストリームに符号化された、ウィンドウ長、ステレオモード、およびビットレート比
に基づいて決定される。各チャンネルに割り当てられたビット数は、ビットストリームを完全に復号化する前にわかっていなければならない。
一実施形態では、ジョイント信号プロセッサ800は、符号化信号から、信号ペアの時間フレームのいくつかの帯域がミッド/サイドまたは左/右符号化のどちらを使用して逆処理されるかを示すフラグを抽出するように構成されている。ジョイント信号プロセッサ800は、フラグの値に応じて、信号ペアのいくつかの帯域にまとめてミッド/サイド処理または左/右処理のどちらかを受けさせるためにこのフラグを使用するように構成されている。ここで、同じ信号ペアの異なる時間フレームについて、または同じ時間フレームの異なる信号ペアについて、符号化信号のサイド情報から各個別の帯域について個別の符号化モードを示す符号化モードマスクが抽出される。ジョイント信号プロセッサ800は、この帯域に関連するビットについて示される個別の帯域について、逆ミッド/サイド処理または左/右処理のいずれかを適用するように構成されている。
前の段落に記載されたように、この実装形態において、コーデックは、ジョイントステレオ符号化について[7]に記載される概念を導入することによって、[6]に記載されるような任意のチャンネルの信号適応型ジョイント符号化の柔軟性を融合するために、新しい手段を使用する。提案された発明の新規性は、以下の違いに要約される。
[1] “Information technology - MPEG audio technologies Part 3: Unified speech and audio coding,” ISO/IEC 23003-3, 2012
Claims (44)
- 少なくとも3つのオーディオ信号を符号化するためのマルチシグナルエンコーダであって、
少なくとも3つの前処理済みオーディオ信号を取得するために各オーディオ信号を個別に前処理するための信号プリプロセッサ(100)であって、前記前処理は、前処理済みオーディオ信号が前処理前の前記信号に対して白色化されるように実行される、信号プリプロセッサ(100)と、
少なくとも3つの共同で処理された信号または少なくとも2つの共同で処理された信号および未処理の信号を取得するために、エネルギーレベルの正規化に続いて、前記少なくとも3つの前処理済みオーディオ信号の処理を実行するための適応ジョイント信号プロセッサ(200)であって、前記エネルギーレベルの正規化を実行するために、前記適応ジョイント信号プロセッサ(200)は、
前記少なくとも3つの前処理済みオーディオ信号の平均エネルギーに関する情報を計算し(212)、
前記少なくとも3つの前処理済みオーディオ信号の各前処理済みオーディオ信号のエネルギーに関する情報を計算して(211)、
前記少なくとも3つの前処理済みオーディオ信号の特定の前処理済みオーディオ信号のために、前記平均エネルギーに関する前記情報および前記少なくとも3つの前処理済みオーディオ信号の前記特定の前処理済みオーディオ信号の前記エネルギーに関する情報に基づいて、広帯域エネルギー正規化値(534)を計算し、および
前記少なくとも3つの前処理済みオーディオ信号の前記特定の前処理済みオーディオ信号の前記広帯域エネルギー正規化値(534)を使用して、前記少なくとも3つの前処理済みオーディオ信号の広帯域エネルギー正規化(210)を実行する、ように構成されており、各前処理済みオーディオ信号は正規化されたエネルギーを有する、適応ジョイント信号プロセッサ(200)と、
1つ以上の符号化信号を取得するために各信号を符号化するための信号エンコーダ(300)と、
前記1つ以上の符号化信号(510)、前記前処理(520)に関するサイド情報、および前記少なくとも3つの前処理済みオーディオ信号の前記広帯域エネルギー正規化値(534)を含む前記処理(530)に関するサイド情報を含む符号化マルチシグナルオーディオ信号を送信または格納するための出力インターフェース(400)と
を含むマルチシグナルエンコーダ。 - 前記適応ジョイント信号プロセッサ(200)は、前記特定の前処理済みオーディオ信号の前記広帯域エネルギー正規化値(534)としてのスケーリング比(534b)を、前記平均エネルギーと、前記特定の前処理済みオーディオ信号の前記エネルギーとから計算する(213、214)ように構成されており、
前記適応ジョイント信号プロセッサ(200)は、前記スケーリング比(534b)がアップスケーリングまたはダウンスケーリングのどちらのものかを示すフラグ(534a)を決定するように構成され、各前処理済みオーディオ信号の前記フラグ(534a)は前記処理(530)に関するサイド情報に含まれる、
請求項1に記載のマルチシグナルエンコーダ。 - 前記適応ジョイント信号プロセッサ(200)は、前記スケーリングがアップスケーリングかダウンスケーリングかに関係なく、前記スケーリング比(534b)を同じ量子化範囲に量子化する(214)ように構成されている、
請求項2に記載のマルチシグナルエンコーダ。 - 前記適応ジョイント信号プロセッサ(200)は、
前記少なくとも3つの前処理済みの信号の前記正規化されたエネルギーを有する前記前処理済みの信号のうちの可能な各信号のペアの相互相関値を計算し(220)、
最も高い相互相関値を有する信号ペアを選択し(229)、
前記選択された信号ペアのジョイントステレオ処理モードを決定し(232a)、
処理済み信号ペアを取得するために前記決定されたジョイントステレオ処理モードにしたがって、前記選択された信号ペアをジョイントステレオ処理する(232b)
ように構成されている、請求項1から3のいずれか一項に記載のマルチシグナルエンコーダ。 - 前記適応ジョイント信号プロセッサ(200)はカスケード信号ペア前処理を適用するように構成されているか、または前記適応ジョイント信号プロセッサ(200)は非カスケード信号ペア処理を適用するように構成されており、
前記カスケード信号ペア前処理において、処理済み信号ペアの前記信号は、更新された相互相関値の計算、最も高い相互相関値を有する前記信号ペアを選択すること、前記選択された信号ペアのジョイントステレオ処理モードの前記決定、および前記決定されたジョイントステレオ処理モードにしたがって前記選択された信号ペアを前記ジョイントステレオ処理することからなる、さらなる反復ステップにおいて選択可能であるか、または
前記非カスケード信号ペア処理において、処理済み信号ペアの前記信号は、前記最も高い相互相関値を有する前記信号ペアをさらに選択すること、前記選択された信号ペアのジョイントステレオ処理モードの前記決定、および前記決定されたジョイントステレオ処理モードにしたがって前記選択された信号ペアを前記ジョイントステレオ処理することにおいて選択可能ではない、
請求項4に記載のマルチシグナルエンコーダ。 - 前記適応ジョイント信号プロセッサ(200)は、ペアワイズ処理手順の後に残る信号として、個別にエンコードされる信号を決定するように構成されており、
前記適応ジョイント信号プロセッサ(200)は、前記ペアワイズ処理手順を実行する前に、前記信号に適用されるエネルギー正規化を復帰させるように構成されているか、または前記ペアワイズ処理手順を実行する前に前記信号に適用される前記エネルギー正規化(210)を少なくとも部分的に復帰させる、
請求項1から5のいずれか一項に記載のマルチシグナルエンコーダ。 - 前記適応ジョイント信号プロセッサ(200)は、前記信号エンコーダ(300)によって処理される各信号について、ビット分布情報(536)を決定するように構成されており、前記出力インターフェース(400)は、各信号について、前記ビット分布情報(536)を前記処理(530)に関する前記サイド情報に導入するように構成されている、
請求項1から6のいずれか一項に記載のマルチシグナルエンコーダ。 - 前記適応ジョイント信号プロセッサ(200)は、前記信号エンコーダ(300)によって処理される各信号の信号エネルギー情報を計算し(282)、
前記信号エンコーダ(300)によって符号化される前記複数の信号の総エネルギーを計算し(284)、
前記信号エネルギー情報および前記総エネルギー情報に基づいて、各信号のビット分布情報(536)を計算する(286)ように構成されており、
前記出力インターフェース(400)は、各信号について、前記ビット分布情報(536)を前記処理(530)に関する前記サイド情報に導入するように構成されている、
請求項1から7のいずれか一項に記載のマルチシグナルエンコーダ。 - 前記適応ジョイント信号プロセッサ(200)は、各信号に初期ビット数を割り当て(290)、前記ビット分布情報(536)に基づいてビット数を割り当て(291)、且つ、さらなる改良ステップを実行する(292)ように構成されており、
前記信号エンコーダ(300)は、信号ごとの前記割り当てられたビットを使用して、前記の各信号の符号化を実行するように構成されている、
請求項8に記載のマルチシグナルエンコーダ。 - 前記信号プリプロセッサ(100)は、各オーディオ信号について、
各オーディオ信号の信号スペクトルを取得するための時間スペクトル変換操作(108、110、112)と、
各信号スペクトルの時間ノイズシェーピング操作(114a、114b)および/または周波数領域ノイズシェーピング操作(116)と
を実行するように構成されており、
前記信号プリプロセッサ(100)は、前記時間ノイズシェーピング操作および/または前記周波数領域ノイズシェーピング操作に続いて、前記信号スペクトルを前記適応ジョイント信号プロセッサ(200)に供給するように構成されており、
前記適応ジョイント信号プロセッサ(200)は、前記受信した信号スペクトルに対して前記少なくとも3つの前処理済みオーディオ信号の前記処理を実行するように構成されている、
請求項1から9のいずれか一項に記載のマルチシグナルエンコーダ。 - 前記適応ジョイント信号プロセッサ(200)は、
選択された信号ペアの各信号について、全帯域分離符号化モードの必要なビットレート、全帯域ジョイント符号化モードの必要なビットレート、または帯域ごとジョイント符号化モードのビットレートプラス帯域ごと信号送信の必要なビットを決定し、
帯域の大部分が特定のモードのために決定され、全ての帯域の10%未満である前記帯域の少数が他の符号化モードに決定されたとき、信号ペアの全ての帯域の前記特定のモードとして前記分離符号化モードまたは前記ジョイント符号化モードを決定し、または最も少ない量のビットを必要とする符号化モードを決定する
ように構成されており、
前記出力インターフェース(400)は、前記処理(530)に関する前記サイド情報に指示(532)を含めるように構成されており、前記指示(532)は、フレームの符号化モードマスクの代わりに前記フレームの全ての帯域の前記特定のモードを示す、
請求項1から10のいずれか一項に記載のマルチシグナルエンコーダ。 - 前記適応ジョイント信号プロセッサ(200)は、最終寄付ステップを実行する(292)ように構成されている、
請求項9に記載のマルチシグナルエンコーダ。 - 前記信号エンコーダ(300)は、個々の各信号の、または2つ以上の信号にわたる、レートループプロセッサを含み、前記レートループプロセッサは、前記特定の信号または2つ以上の信号のビット分布情報(536)を受信および使用するように構成されている、
請求項1から12のいずれか一項に記載のマルチシグナルエンコーダ。 - 前記適応ジョイント信号プロセッサ(200)は、ジョイント符号化のための信号ペアを適応的に選択するように構成されており、または前記適応ジョイント信号プロセッサ(200)は、各選択された信号ペアについて、帯域ごとミッド/サイド符号化モード、全帯域ミッド/サイド符号化モード、または全帯域左/右符号化モードを決定するように構成されており、前記出力インターフェース(400)は、前記処理(530)に関する前記サイド情報に、前記符号化マルチシグナルオーディオ信号において前記選択された符号化モードを指示する情報(532)を含めるように構成されている、
請求項1から13のいずれか一項に記載のマルチシグナルエンコーダ。 - 前記適応ジョイント信号プロセッサ(200)は、ミッド/サイドモードまたは左/右モードで符号化されたときの各帯域での推定ビットレートに基づいて、帯域ごとミッド/サイド対左/右決定を形成するように構成されており、最終的なジョイント符号化モードは、前記帯域ごとミッド/サイド対左/右決定の結果に基づいて決定される、
請求項1から14のいずれか一項に記載のマルチシグナルエンコーダ。 - 前記適応ジョイント信号プロセッサ(200)は、スペクトル帯域複製処理またはインテリジェントギャップ充填処理のパラメータサイド情報を決定するために、前記スペクトル帯域複製処理または前記インテリジェントギャップ充填処理を実行する(260)ように構成されており、前記出力インターフェース(400)は、追加サイド情報として、前記スペクトル帯域複製またはインテリジェントギャップ充填サイド情報(532)を前記処理(530)に関する前記サイド情報に含めるように構成されている、請求項1から15のいずれか一項に記載のマルチシグナルエンコーダ。
- 前記適応ジョイント信号プロセッサ(200)は、符号化信号ペアに対してステレオインテリジェントギャップ充填処理を実行し、個別に符号化される前記少なくとも1つの信号に対して単一信号インテリジェントギャップ充填処理を実行するように構成されている、
請求項16に記載のマルチシグナルエンコーダ。 - 前記少なくとも3つのオーディオ信号は低周波強調信号を含み、前記適応ジョイント信号プロセッサ(200)は信号マスクを適用するように構成され、前記信号マスクはどの信号に対して前記適応ジョイント信号プロセッサ(200)がアクティブになるかを示しており、前記信号マスクは、前記少なくとも3つの前処理済みオーディオ信号のペアワイズ処理で前記低周波強調信号が使用されるべきではないことを示す、
請求項1から7のいずれか一項に記載のマルチシグナルエンコーダ。 - 前記適応ジョイント信号プロセッサ(200)は、各前処理済み信号のエネルギーに関する前記情報として、各前処理済み信号のMDCTスペクトルのエネルギーを計算するように、または
前記少なくとも3つの前処理済みオーディオ信号の前記平均エネルギーに関する前記情報として、前記少なくとも3つの前処理済みオーディオ信号のMDCTスペクトルの平均エネルギーを計算するように構成されている、
請求項1から3のいずれか一項に記載のマルチシグナルエンコーダ。 - 前記適応ジョイント信号プロセッサ(200)は、前記特定の信号の前記エネルギーに関する前記情報および前記少なくとも3つの前処理済みオーディオ信号の前記平均エネルギーに関する前記情報に基づいて、各信号のスケーリング比を計算する(213)ように構成されており、
前記適応ジョイント信号プロセッサ(200)は、量子化スケーリング比値を取得するために前記スケーリング比を量子化する(214)ように構成されており、前記量子化スケーリング比値は、含まれる各信号の前記スケーリング比のサイド情報を前記符号化マルチシグナルオーディオ信号内に誘導するために使用され、
前記適応ジョイント信号プロセッサ(200)は、前記量子化スケーリング比値から量子化スケーリング比を導出するように構成されており、前記前処理済みオーディオ信号は、他の相応にスケーリングされた信号と共に前記スケーリングされた信号のペアワイズ処理に使用される前に、前記量子化スケーリング比を使用してスケーリングされる、
請求項1から3のいずれか一項に記載のマルチシグナルエンコーダ。 - 前記適応ジョイント信号プロセッサ(200)は、どの信号ペアが最も高い類似性を有するか、したがって、前記少なくとも3つの前処理済みオーディオ信号のペアワイズ処理のペアとして選択されるのに適しているかを判定および選択するために、可能な信号ペアの正規化された信号間相互相関値を計算する(221)ように構成されており、
各信号ペアの前記正規化相互相関値は相互相関ベクトルに格納され、
前記適応ジョイント信号プロセッサ(200)は、前のフレームの相互相関ベクトルを現在のフレームの前記相互相関ベクトルと比較すること(222、223)によって、1つ以上の前記前のフレームの信号ペア選択が維持されるべきか否かを決定するように構成されており、前記前のフレームの前記信号ペア選択は、前記現在のフレームの前記相互相関ベクトルと前記前のフレームの前記相互相関ベクトルとの差が所定の閾値を下回るときに維持される(225)、
請求項1から20のいずれか一項に記載のマルチシグナルエンコーダ。 - 前記信号プリプロセッサ(100)は、複数の異なるウィンドウ長から選択された特定のウィンドウ長を使用して時間周波数変換を実行するように構成されており、
前記適応ジョイント信号プロセッサ(200)は、ペアワイズ処理される信号のペアを決定するために前記前処理済みオーディオ信号を比較するときに、前記信号のペアが同じ関連するウィンドウ長を有するか否かを決定するように構成されており、
前記適応ジョイント信号プロセッサ(200)は、2つの信号が、前記信号プリプロセッサ(100)によって適用された同じウィンドウ長に関連付けられているときにのみ、前記2つの信号のペアワイズ処理を可能にするように構成されている、
請求項1から21のいずれか一項に記載のマルチシグナルエンコーダ。 - 前記適応ジョイント信号プロセッサ(200)は、処理済み信号ペアの信号がさらなる信号ペア処理で選択不可能な、非カスケード信号ペア処理を適用するように構成されており、前記適応ジョイント信号プロセッサ(200)は、ペアワイズ処理のための前記信号ペア間の相互相関に基づいて信号ペアを選択するように構成されており、いくつかの選択された信号ペアの前記ペアワイズ処理は並行して実行される、
請求項1に記載のマルチシグナルエンコーダ。 - 前記適応ジョイント信号プロセッサ(200)は、選択された信号ペアについて、ステレオ符号化モードを決定するように構成されており、前記ステレオ符号化モードがデュアルモノモードであると決定されたとき、前記選択された信号ペアに含まれる前記信号は、少なくとも部分的に再スケーリングされ、個別に符号化される信号として指示される、
請求項23に記載のマルチシグナルエンコーダ。 - 前記適応ジョイント信号プロセッサ(200)は、ペアワイズ処理済み信号ペアについて、コア領域のステレオモードがIGF領域のステレオモードとは異なる場合、または前記コア領域の前記ステレオモードが帯域ごとミッド/サイド符号化モードとしてフラグが立てられている場合、ステレオインテリジェントギャップ充填(IGF)操作を実行するように構成されており、または
前記適応ジョイント信号プロセッサ(200)は、コア領域のステレオモードがIGF領域のステレオモードと異ならない場合、または前記コア領域の前記ステレオモードが帯域ごとミッド/サイド符号化モードとしてフラグが立てられていない場合、ペアワイズ処理済み信号ペアの信号には単一信号IGF分析を適用するように構成されている、
請求項16または17に記載のマルチシグナルエンコーダ。 - 前記適応ジョイント信号プロセッサ(200)は、インテリジェントギャップ充填(IGF)操作の結果が前記信号エンコーダ(300)によって個別に符号化される前に、前記インテリジェントギャップ充填(IGF)操作を実行するように構成されており、
量子化および前記インテリジェントギャップ充填(IGF)操作の調性/ノイズ決定にパワースペクトルが使用され、前記信号プリプロセッサ(100)は、MDCT(Modified Discrete Cosine Transform)スペクトルに使用されたのと同じ周波数領域ノイズシェーピングをMDST(Modified Discrete Sine Transform)スペクトルに実行されるように構成されており、
前記適応ジョイント信号プロセッサ(200)は、処理済みMDSTスペクトルの結果が前記信号エンコーダ(300)によって実行された量子化の中で、または前記適応ジョイント信号プロセッサ(200)によって実行されたインテリジェントギャップ充填処理の中で使用されるように、前処理済みMDSTスペクトルに対して、前記MDCTスペクトルに適用されたのと同じミッド/サイド処理を実行するように構成されており、または
前記適応ジョイント信号プロセッサ(200)は、MDSTスペクトルの全帯域スケーリングベクトルに基づいて、同じ量子化されたスケーリングベクトルを使用して前記MDCTスペクトルに対して行われたのと同じ正規化スケーリングを、MDSTスペクトルに対して適用するように構成されている、
請求項1から25のいずれか一項に記載のマルチシグナルエンコーダ。 - 前記適応ジョイント信号プロセッサ(200)は、前記少なくとも3つの共同で処理された信号または少なくとも2つの共同で処理された信号および個別に符号化される信号を取得するために、前記少なくとも3つの前処理済みオーディオ信号のペアワイズ処理を実行するように構成されている、請求項1から26のいずれか一項に記載のマルチシグナルエンコーダ。
- 前記少なくとも3つのオーディオ信号の前記オーディオ信号は、オーディオチャンネルであるか、または
前記少なくとも3つのオーディオ信号の前記オーディオ信号は、音場表現のオーディオ成分信号である、
請求項1から27のいずれか一項に記載のマルチシグナルエンコーダ。 - 前記信号エンコーダ(300)は、少なくとも3つの個別に符号化された信号を取得するために各信号を個別に符号化するように、または2つ以上の信号と共にエントロピー符号化を実行するように構成されている、
請求項1から28のいずれか一項に記載のマルチシグナルエンコーダ。 - 符号化信号を復号化するためのマルチシグナルデコーダであって、
少なくとも3つの符号化信号を復号化して少なくとも3つの復号化信号を取得するための信号デコーダ(700)と、
ジョイント信号プロセッサ(800)であって、
前記符号化信号から、少なくとも3つのジョイントステレオ復号化信号のエネルギー正規化値(534、534a、534b)を抽出し(610)、
前記符号化信号に含まれるサイド情報(530)によって示されるように、ジョイントステレオモードを使用して前記少なくとも3つの復号化信号をペアワイズ処理して少なくとも3つのジョイントステレオ復号化信号を取得すること(820)を含むジョイント信号処理を実行し、
少なくとも3つの処理済み復号化信号を取得するために、前記エネルギー正規化値(534、534a、534b)を使用して、前記少なくとも3つのジョイントステレオ復号化信号をエネルギー再スケーリングする(830)、
ように構成されたジョイント信号プロセッサ(800)と、
前記符号化信号に含まれるサイド情報(530)にしたがって前記少なくとも3つの処理済み復号化信号を後処理するためのポストプロセッサ(900)であって、前記後処理は、前記後処理済み信号が前記後処理前の信号よりも白色度が低くなるように実行され、前記後処理済み信号は復号化オーディオ信号を表す、ポストプロセッサ(900)と
を含む、マルチシグナルデコーダ。 - 前記ジョイント信号プロセッサ(800)は、特定の信号の前記符号化信号から抽出されたエネルギー正規化値(534、534a、534b)が所定の値を有するか否かをチェックするように構成されており、
前記ジョイント信号プロセッサ(800)は、前記エネルギー正規化値(534、534a、534b)が前記所定の値を有するとき、前記特定の信号に対してエネルギー再スケーリングを実行しないように、または低減されたエネルギー再スケーリングのみを実行するように構成されている、
請求項30に記載のマルチシグナルデコーダ。 - 前記信号デコーダ(700)は、
前記符号化信号から、各符号化信号のビット分布値を抽出し(620)、
信号のビット分布値、全ての信号の残りのビットの数、および、さらなる改良ステップ、または、最終寄付ステップを使用して、前記信号の使用されるビット分布を決定し(720)、
各信号の前記使用されるビット分布に基づいて、個々の復号化を実行する(710、730)
ように構成されている、請求項30または31に記載のマルチシグナルデコーダ。 - 前記ジョイント信号プロセッサ(800)は、
スペクトルが強調された個々の信号を取得するために、前記符号化信号のサイド情報を使用して、個別に復号化された信号に対して帯域複製またはインテリジェントギャップ充填処理を実行し(820)、
前記スペクトルが強調された個々の信号を使用して、ジョイント処理モードにしたがってジョイント処理(820)を実行する
ように構成されている、請求項30から32のいずれか一項に記載のマルチシグナルデコーダ。 - 前記ジョイント信号プロセッサ(800)は、目標範囲が別のステレオ表現を有するように示されるとき、ソース範囲をあるステレオ表現から前記別のステレオ表現に変換するように構成されている、
請求項33に記載のマルチシグナルデコーダ。 - 前記ジョイント信号プロセッサ(800)は、
前記符号化信号から、前記エネルギー正規化値(534、534b)がアップスケーリング値またはダウンスケーリング値のどちらであるかを示すフラグ(534、534a)を抽出し、
前記フラグ(534、534a)が第1の値を有するときはダウンスケーリングとして、前記フラグ(534、534a)が前記第1の値とは異なる第2の値を有するときはアップスケーリングとして、前記エネルギー正規化値(534、534b)を使用して前記エネルギー再スケーリングを実行する(830)
ように構成されている、請求項30から34のいずれか一項に記載のマルチシグナルデコーダ。 - 前記ジョイント信号プロセッサ(800)は、
前記符号化信号から、共同符号化操作から得られる信号ペアを示すサイド情報(532)を抽出し(630)、
各信号の元の前処理済みスペクトルに戻すために、前記符号化信号を取得するときに最後の信号ペアから始めて逆ステレオまたはマルチチャンネル処理を実行し(820)、前記符号化信号の前記サイド情報(532)に示される前記ジョイントステレオモードおよび/または帯域ごとミッド/サイド決定に基づいて、前記逆ステレオまたはマルチチャネル処理が実行される
ように構成されている、請求項30から35のいずれか一項に記載のマルチシグナルデコーダ。 - 前記ジョイント信号プロセッサ(800)は、各ジョイントステレオ復号化信号の量子化されたエネルギー正規化値(534、534a、534b)に基づいて、信号ペアに含まれる全てのジョイントステレオ復号化信号を対応する元のエネルギーレベルにエネルギー再スケーリングする(830)ように構成されており、信号ペア処理に関与しなかった他の信号は、信号ペア処理に関与していた前記信号のようにはエネルギー再スケーリングされない、
請求項30から36のいずれか一項に記載のマルチシグナルデコーダ。 - 前記ポストプロセッサ(900)は、各個別の処理済み復号化信号について、時間ノイズシェーピング操作(910)、または周波数領域ノイズシェーピング操作(910)、およびスペクトル領域から時間領域への変換(920)、ならびに後処理済み信号の後続の時間フレーム間の後続の重畳加算操作(930)を実行するように構成されている、
請求項30から37のいずれか一項に記載のマルチシグナルデコーダ。 - 前記ジョイント信号プロセッサ(800)は、前記符号化信号から、信号ペアの時間フレームのいくつかの帯域がミッド/サイドまたは左/右符号化のどちらを使用して逆処理されるかを示すフラグを抽出するように構成されており、前記ジョイント信号プロセッサ(800)は、前記フラグの値に応じて、前記信号ペアの前記いくつかの帯域にまとめてミッド/サイド処理または左/右処理のどちらかを受けさせるためにこのフラグを使用するように構成されており、
同じ信号ペアの異なる時間フレームについて、または同じ時間フレームの異なる信号ペアについて、前記符号化信号の前記サイド情報から各個別の帯域について個別の符号化モードを示す符号化モードマスクが抽出され、前記ジョイント信号プロセッサ(800)は、この帯域に関連するビットについて示される前記個別の帯域について、逆ミッド/サイド処理または左/右処理のいずれかを適用するように構成されている、
請求項30から38のいずれか一項に記載のマルチシグナルデコーダ。 - 前記符号化信号は符号化マルチチャンネル信号であり、前記マルチシグナルデコーダはマルチチャンネルデコーダであり、前記ジョイント信号処理はジョイントチャンネル処理であり、前記少なくとも3つの処理済み復号化信号は少なくとも3つの処理済み復号化チャンネルであり、前記後処理済み信号はチャンネルであり、または
前記符号化信号は、音場表現のオーディオ成分信号を表す符号化多成分信号であり、前記マルチシグナルデコーダは多成分デコーダであり、前記ジョイント信号処理はジョイント成分処理であり、前記少なくとも3つの処理済み復号化信号は少なくとも3つの処理済み復号化成分であり、前記後処理済み信号は成分オーディオ信号である、
請求項30から39のいずれか一項に記載のマルチシグナルデコーダ。 - 少なくとも3つのオーディオ信号のマルチシグナル符号化を実行する方法であって、
少なくとも3つの前処理済みオーディオ信号を取得するために各オーディオ信号を個別に前処理するステップであって、前記前処理は、前処理済みオーディオ信号が前処理前の前記信号に対して白色化されるように実行される、ステップと、
エネルギーレベルの正規化に続いて、少なくとも3つの共同で処理された信号または少なくとも2つの共同で処理された信号および未処理の信号を取得するために、前記少なくとも3つの前処理済みオーディオ信号の処理を実行するステップであって、前記エネルギーレベルの正規化は、
前記少なくとも3つの前処理済みオーディオ信号の平均エネルギーに関する情報を計算すること(212)と、
前記少なくとも3つの前処理済みオーディオ信号の各前処理済みオーディオ信号のエネルギーに関する情報を計算すること(211)と、
前記少なくとも3つの前処理済みオーディオ信号の特定の前処理済みオーディオ信号のために、前記平均エネルギーに関する前記情報および前記少なくとも3つの前処理済みオーディオ信号の前記特定の前処理済みオーディオ信号の前記エネルギーに関する情報に基づいて、広帯域エネルギー正規化値(534)を計算すること、および
前記特定の前処理済みオーディオ信号の前記広帯域エネルギー正規化値(534)を使用して、前記少なくとも3つの前処理済みオーディオ信号の広帯域エネルギー正規化(210)を実行すること、を含み、前記少なくとも3つの前処理済みオーディオ信号の各前処理済みオーディオ信号は正規化されたエネルギーを有する、ステップと、
1つ以上の符号化信号を取得するために各信号を符号化するステップと、
前記1つ以上の符号化信号(510)、前記前処理(520)に関するサイド情報、および前記少なくとも3つの前処理済みオーディオ信号の前記広帯域エネルギー正規化値(534)を含む前記処理(530)に関するサイド情報を含む符号化マルチシグナルオーディオ信号を送信または格納するステップと
を含む方法。 - 符号化信号をマルチシグナル復号化する方法であって、
少なくとも3つの符号化信号を個別に復号化して、少なくとも3つの復号化信号を取得するステップと、
少なくとも3つの処理済み復号化信号を取得するためにジョイント信号処理を実行するステップであって、
前記符号化信号から、少なくとも3つのジョイントステレオ復号化信号のエネルギー正規化値(534、534a、534b)を抽出すること(610)と、
前記符号化信号に含まれるサイド情報(530)によって示されるように、ジョイントステレオモードを使用して前記少なくとも3つの復号化信号をペアワイズ処理すること(820)を含むジョイント信号処理を実行して、前記少なくとも3つのジョイントステレオ復号化信号を取得することと、
少なくとも3つの処理済み復号化信号を取得するために、前記エネルギー正規化値(534、534a、534b)を使用して、前記少なくとも3つのジョイントステレオ復号化信号をエネルギー再スケーリングすること(830)と、
を含む、ジョイント信号処理を実行するステップと、
前記符号化信号に含まれるサイド情報(530)にしたがって前記少なくとも3つの処理済み復号化信号を後処理するステップであって、前記後処理は、前記後処理済み信号が前記後処理前の信号よりも白色度が低くなるように実行され、前記後処理済み信号は復号化オーディオ信号を表す、ステップと
を含む方法。 - コンピュータまたはプロセッサ上で実行されたときに、請求項41の方法を実行するための、コンピュータプログラム。
- コンピュータまたはプロセッサ上で実行されたときに、請求項42の方法を実行するための、コンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023191220A JP2024010207A (ja) | 2018-07-04 | 2023-11-09 | マルチシグナルエンコーダ、マルチシグナルデコーダ、および信号白色化または信号後処理を使用する関連方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18181767 | 2018-07-04 | ||
EP18181767.7 | 2018-07-04 | ||
PCT/EP2019/067256 WO2020007719A1 (en) | 2018-07-04 | 2019-06-27 | Multisignal audio coding using signal whitening as preprocessing |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023191220A Division JP2024010207A (ja) | 2018-07-04 | 2023-11-09 | マルチシグナルエンコーダ、マルチシグナルデコーダ、および信号白色化または信号後処理を使用する関連方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021529354A JP2021529354A (ja) | 2021-10-28 |
JP7384893B2 true JP7384893B2 (ja) | 2023-11-21 |
Family
ID=62985884
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021500045A Active JP7384893B2 (ja) | 2018-07-04 | 2019-06-27 | マルチシグナルエンコーダ、マルチシグナルデコーダ、および信号白色化または信号後処理を使用する関連方法 |
JP2023191220A Pending JP2024010207A (ja) | 2018-07-04 | 2023-11-09 | マルチシグナルエンコーダ、マルチシグナルデコーダ、および信号白色化または信号後処理を使用する関連方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023191220A Pending JP2024010207A (ja) | 2018-07-04 | 2023-11-09 | マルチシグナルエンコーダ、マルチシグナルデコーダ、および信号白色化または信号後処理を使用する関連方法 |
Country Status (15)
Country | Link |
---|---|
US (1) | US20210104249A1 (ja) |
EP (2) | EP4336497A3 (ja) |
JP (2) | JP7384893B2 (ja) |
KR (1) | KR102606259B1 (ja) |
CN (1) | CN112639967A (ja) |
AR (1) | AR116665A1 (ja) |
AU (2) | AU2019298307A1 (ja) |
BR (1) | BR112020026967A2 (ja) |
CA (1) | CA3105508C (ja) |
MX (1) | MX2020014077A (ja) |
RU (1) | RU2769788C1 (ja) |
SG (1) | SG11202012936VA (ja) |
TW (1) | TWI720530B (ja) |
WO (1) | WO2020007719A1 (ja) |
ZA (1) | ZA202100719B (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11664037B2 (en) * | 2020-05-22 | 2023-05-30 | Electronics And Telecommunications Research Institute | Methods of encoding and decoding speech signal using neural network model recognizing sound sources, and encoding and decoding apparatuses for performing the same |
CN113948097A (zh) * | 2020-07-17 | 2022-01-18 | 华为技术有限公司 | 多声道音频信号编码方法和装置 |
CN113948095A (zh) * | 2020-07-17 | 2022-01-18 | 华为技术有限公司 | 多声道音频信号的编解码方法和装置 |
CN114023338A (zh) * | 2020-07-17 | 2022-02-08 | 华为技术有限公司 | 多声道音频信号的编码方法和装置 |
CN113948096A (zh) * | 2020-07-17 | 2022-01-18 | 华为技术有限公司 | 多声道音频信号编解码方法和装置 |
KR20220151953A (ko) * | 2021-05-07 | 2022-11-15 | 한국전자통신연구원 | 부가 정보를 이용한 오디오 신호의 부호화 및 복호화 방법과 그 방법을 수행하는 부호화기 및 복호화기 |
CN115472171A (zh) * | 2021-06-11 | 2022-12-13 | 华为技术有限公司 | 编解码方法、装置、设备、存储介质及计算机程序 |
WO2023113490A1 (ko) * | 2021-12-15 | 2023-06-22 | 한국전자통신연구원 | 복소수 데이터를 이용한 오디오 처리 방법 및 그를 수행하는 장치 |
WO2023153228A1 (ja) * | 2022-02-08 | 2023-08-17 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、及び、符号化方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009524108A (ja) | 2006-01-20 | 2009-06-25 | マイクロソフト コーポレーション | 拡張帯域周波数コーディングによる複素変換チャネルコーディング |
JP2015011076A (ja) | 2013-06-26 | 2015-01-19 | 日本放送協会 | 音響信号符号化装置、音響信号符号化方法、および音響信号復号化装置 |
WO2016142375A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding a multi-channel signal |
JP2016530556A (ja) | 2013-07-22 | 2016-09-29 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | インテリジェントギャップ充填フレームワーク内の2チャネル処理を用いるオーディオ符号器、オーディオ復号器およびその方法 |
JP2016224472A (ja) | 2010-12-21 | 2016-12-28 | ドルビー・インターナショナル・アーベー | 二次元または三次元音場のアンビソニックス表現の一連のフレームをエンコードおよびデコードする方法および装置 |
WO2017125544A1 (en) | 2016-01-22 | 2017-07-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for mdct m/s stereo with global ild with improved mid/side decision |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2676266A (en) | 1951-03-10 | 1954-04-20 | California Inst Res Found | Cloud chamber |
US7840401B2 (en) * | 2005-10-24 | 2010-11-23 | Lg Electronics Inc. | Removing time delays in signal paths |
CN101115051B (zh) * | 2006-07-25 | 2011-08-10 | 华为技术有限公司 | 音频信号处理方法、系统以及音频信号收发装置 |
ATE500588T1 (de) * | 2008-01-04 | 2011-03-15 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
TWI488177B (zh) | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 使用頻譜域雜訊整形之基於線性預測的編碼方案 |
KR102131810B1 (ko) * | 2012-07-19 | 2020-07-08 | 돌비 인터네셔널 에이비 | 다채널 오디오 신호들의 렌더링을 향상시키기 위한 방법 및 디바이스 |
US9401153B2 (en) * | 2012-10-15 | 2016-07-26 | Digimarc Corporation | Multi-mode audio recognition and auxiliary data encoding and decoding |
EP2830053A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
ES2653975T3 (es) * | 2013-07-22 | 2018-02-09 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Decodificador de audio multicanal, codificador de audio multicanal, procedimientos, programa informático y representación de audio codificada mediante el uso de una decorrelación de señales de audio renderizadas |
TWI634547B (zh) * | 2013-09-12 | 2018-09-01 | 瑞典商杜比國際公司 | 在包含至少四音訊聲道的多聲道音訊系統中之解碼方法、解碼裝置、編碼方法以及編碼裝置以及包含電腦可讀取的媒體之電腦程式產品 |
EP3044784B1 (en) * | 2013-09-12 | 2017-08-30 | Dolby International AB | Coding of multichannel audio content |
EP2980794A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
EP3067889A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for signal-adaptive transform kernel switching in audio coding |
EP3067886A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
JP6721977B2 (ja) * | 2015-12-15 | 2020-07-15 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法 |
US10622003B2 (en) * | 2018-07-12 | 2020-04-14 | Intel IP Corporation | Joint beamforming and echo cancellation for reduction of noise and non-linear echo |
-
2019
- 2019-06-27 AU AU2019298307A patent/AU2019298307A1/en not_active Abandoned
- 2019-06-27 MX MX2020014077A patent/MX2020014077A/es unknown
- 2019-06-27 EP EP24153258.9A patent/EP4336497A3/en active Pending
- 2019-06-27 RU RU2021102388A patent/RU2769788C1/ru active
- 2019-06-27 CA CA3105508A patent/CA3105508C/en active Active
- 2019-06-27 WO PCT/EP2019/067256 patent/WO2020007719A1/en active Application Filing
- 2019-06-27 BR BR112020026967-0A patent/BR112020026967A2/pt unknown
- 2019-06-27 SG SG11202012936VA patent/SG11202012936VA/en unknown
- 2019-06-27 KR KR1020217003630A patent/KR102606259B1/ko active IP Right Grant
- 2019-06-27 CN CN201980056603.4A patent/CN112639967A/zh active Pending
- 2019-06-27 JP JP2021500045A patent/JP7384893B2/ja active Active
- 2019-06-27 EP EP19732704.2A patent/EP3818520B1/en active Active
- 2019-07-03 TW TW108123478A patent/TWI720530B/zh active
- 2019-07-04 AR ARP190101899A patent/AR116665A1/es unknown
-
2020
- 2020-12-17 US US17/124,628 patent/US20210104249A1/en active Pending
-
2021
- 2021-02-02 ZA ZA2021/00719A patent/ZA202100719B/en unknown
-
2022
- 2022-09-20 AU AU2022235537A patent/AU2022235537A1/en active Pending
-
2023
- 2023-11-09 JP JP2023191220A patent/JP2024010207A/ja active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009524108A (ja) | 2006-01-20 | 2009-06-25 | マイクロソフト コーポレーション | 拡張帯域周波数コーディングによる複素変換チャネルコーディング |
JP2016224472A (ja) | 2010-12-21 | 2016-12-28 | ドルビー・インターナショナル・アーベー | 二次元または三次元音場のアンビソニックス表現の一連のフレームをエンコードおよびデコードする方法および装置 |
JP2015011076A (ja) | 2013-06-26 | 2015-01-19 | 日本放送協会 | 音響信号符号化装置、音響信号符号化方法、および音響信号復号化装置 |
JP2016530556A (ja) | 2013-07-22 | 2016-09-29 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | インテリジェントギャップ充填フレームワーク内の2チャネル処理を用いるオーディオ符号器、オーディオ復号器およびその方法 |
WO2016142375A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding a multi-channel signal |
WO2017125544A1 (en) | 2016-01-22 | 2017-07-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for mdct m/s stereo with global ild with improved mid/side decision |
Also Published As
Publication number | Publication date |
---|---|
CA3105508A1 (en) | 2020-01-09 |
KR20210040974A (ko) | 2021-04-14 |
CA3105508C (en) | 2024-03-26 |
MX2020014077A (es) | 2021-03-09 |
EP3818520C0 (en) | 2024-01-24 |
ZA202100719B (en) | 2022-08-31 |
CN112639967A (zh) | 2021-04-09 |
TWI720530B (zh) | 2021-03-01 |
AU2022235537A1 (en) | 2022-10-13 |
WO2020007719A1 (en) | 2020-01-09 |
KR102606259B1 (ko) | 2023-11-29 |
EP3818520B1 (en) | 2024-01-24 |
RU2769788C1 (ru) | 2022-04-06 |
TW202016924A (zh) | 2020-05-01 |
JP2024010207A (ja) | 2024-01-23 |
EP4336497A3 (en) | 2024-03-20 |
SG11202012936VA (en) | 2021-01-28 |
EP4336497A2 (en) | 2024-03-13 |
AU2019298307A1 (en) | 2021-02-25 |
US20210104249A1 (en) | 2021-04-08 |
EP3818520A1 (en) | 2021-05-12 |
BR112020026967A2 (pt) | 2021-03-30 |
AR116665A1 (es) | 2021-06-02 |
JP2021529354A (ja) | 2021-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7384893B2 (ja) | マルチシグナルエンコーダ、マルチシグナルデコーダ、および信号白色化または信号後処理を使用する関連方法 | |
JP7122076B2 (ja) | マルチチャネル符号化におけるステレオ充填装置及び方法 | |
CN107430863B (zh) | 用于编码的音频编码器及用于解码的音频解码器 | |
JP7280306B2 (ja) | 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法 | |
CN117612542A (zh) | 用于使用宽频带滤波器生成的填充信号对已编码的多声道信号进行编码或解码的装置 | |
US11527252B2 (en) | MDCT M/S stereo | |
CN110998721B (zh) | 用于使用宽频带滤波器生成的填充信号对已编码的多声道信号进行编码或解码的装置 | |
CA3193869A1 (en) | Method and device for audio band-width detection and audio band-width switching in an audio codec |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210226 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220316 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220318 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220616 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220919 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230110 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230330 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230709 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231011 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231109 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7384893 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |