JP2022126688A - 快適雑音の生成のサポート - Google Patents
快適雑音の生成のサポート Download PDFInfo
- Publication number
- JP2022126688A JP2022126688A JP2022091269A JP2022091269A JP2022126688A JP 2022126688 A JP2022126688 A JP 2022126688A JP 2022091269 A JP2022091269 A JP 2022091269A JP 2022091269 A JP2022091269 A JP 2022091269A JP 2022126688 A JP2022126688 A JP 2022126688A
- Authority
- JP
- Japan
- Prior art keywords
- spatial coherence
- frequency band
- audio channels
- coherence
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 79
- 230000003595 spectral effect Effects 0.000 claims abstract description 57
- 230000005236 sound signal Effects 0.000 claims abstract description 39
- 238000004590 computer program Methods 0.000 claims description 51
- 238000012545 processing Methods 0.000 claims description 30
- 238000001228 spectrum Methods 0.000 claims description 28
- 230000011664 signaling Effects 0.000 claims description 11
- 230000005540 biological transmission Effects 0.000 abstract description 5
- 239000013598 vector Substances 0.000 description 57
- 230000008569 process Effects 0.000 description 21
- 238000004891 communication Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 230000001360 synchronised effect Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W76/00—Connection management
- H04W76/20—Manipulation of established connections
- H04W76/28—Discontinuous transmission [DTX]; Discontinuous reception [DRX]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Stereophonic System (AREA)
Abstract
Description
[lwin(m,n)rwin(m,n)]=[l(m,n)win(n)r(m,n)win(n)],n=0,1,2,…,N-1。
そこで、Sxx(f)およびSyy(f)は、2つのチャネルxおよびyのそれぞれのパワースペクトルを表し、Sxy(f)は、2つのチャネルxおよびyのクロスパワースペクトルである。DFTに基づく解では、スペクトルは、DFTスペクトルによって表され得る。具体的には、一実施形態によれば、フレームインデックスmおよび周波数ビンインデックスkのための空間コヒーレンスC(m,k)は、次のように判定される:
そこで、L(m,k)は、窓処理されるオーディオ信号lwin(m,n)のスペクトルであり、R(m,k)は、窓処理されるオーディオ信号rwin(m,n)のスペクトルであり、そして、*は、複素共役を示す。
そこで、mはフレームインデックスであり、bは周波数帯のインデックスであり、Nbandは、周波数帯の総数であり、limit(b)は、周波数帯bの最も低い周波数ビンを示す。したがって、パラメータlimit(b)は、各周波数帯における第1の係数を示し、周波数帯の間の境界線を規定する。この実施形態において、limit(b)はまた、周波数帯の上限Nband-1を規定するために、周波数帯Nbandについて規定されることになる。limit(b)を得るための異なるやり方が存在し得る。一実施形態によれば、limit(b)は、関数またはルックアップテーブルとして提供される。
を形成し、そこで、Nbndは周波数帯の数であり、bは周波数帯インデックスであり、mはフレームインデックスである。一実施形態において、空間コヒーレンスベクトルCmの値Cb,mは、フレームmおよび帯域bのための重み付けされた空間コヒーレンス値Cw(m,b)に対応する。
の単一のベクトルに記憶され得る。
のコピー、およびビット配分Bmを符号化する。いくつかの実施形態において、前述のエンコーディングステップで使われるビットは、BmおよびBcurr,mに含まれ得る。そのような実施形態において、後述のアルゴリズムにおけるビット配分は、Bm-Bcurr,mによって与えられ得る。
、が得られる。第1の帯域(b=1)について前述の符号化されたコヒーレンス値は存在しない。いくつかの実施形態において、第1の帯域についてのフレーム内予測は、ゼロにセットされ得る、
。いくつかの実施形態において、第1の帯域のフレーム内予測は、平均値
、
、にセットされ得る。
を生み出す。それに応じて、第1の帯域のフレーム内予測は、再構築された値、
、にセットされ得る。ビットカウンタ、Bcurr,mは、係数を符号化するために必要とされるビットの量だけ増やされる。たとえば、3ビットが、係数を符号化するために使用される場合、3ビットが、エンコーディングのために使われるビットの現在の量に追加される、たとえば、Bcurr,m=Bcurr,m+3。
、が、1つまたは複数の先行フレームから前に再構築されたコヒーレンスベクトル要素に基づいて取得される。背景雑音が安定しているまたはゆっくりと変化する場合には、コヒーレンス帯域値Cb,mにおけるフレーム対フレームの変動は、小さくなる。したがって、前のフレームからの値を使用するフレーム間予測は、しばしば、小さい予測残差および小さい残差コーディングビットレートを生じさせる優れた概算になる。一例として、帯域bの最後の再構築された値は、フレーム間予測値のために使用され得る、すなわち、
。2つ以上の先行フレームを考慮するフレーム間線形予測因子は、
として公式化することができ、そこで、
は、フレームmのすべての帯域bのためのフレーム間の予測されたコヒーレンス値の列ベクトルを示し、
は、フレームm-nのすべての帯域bの再構築されたコヒーレンス値を表し、そして、gnは、Ninter先行フレームにわたる線形予測因子係数である。gnは、事前に規定されたセットの予測因子から選択することができ、その場合、使用される予測因子は、デコーダに通信され得るインデックスで表される必要がある。
、に基づいて、計算される。いくつかの実施形態において、スカラ量子化器が、予測残差をインデックスIb,mに量子化するために使用される。そのような実施形態において、インデックスは、Ib,m=SQ(rb,m)によって与えられ、そこで、SQ(x)は、適切な範囲を有するスカラ量子化器関数である。スカラ量子化器の一例は、下記の表1に示される。表1は、予測残差の再構築レベルおよび量子化器インデックスの一例を示す。
が、発見され得る。上方検索は、
が満たされるあるいはテーブル800の最上部に達するまで、継続する。
、I* b,mがビットストリームに出力され、再構築された残差が、最終インデックスに基づいて形成される、すなわち、
。
、これは、ビット制限に達したことBm=Bcurr,mを意味する。そのような場合には、再構築された残差はゼロにセットされ
、インデックスはビットストリームに追加されない。デコーダは、同期されたビットカウンタ、Bcurr,m、を保持するので、デコーダは、この状況を検出し、明示的シグナリングなしに
を使用することができる。
およびビット配分Bmのコピーを取得する。
、が取得される。第1の帯域のフレーム内予測が、エンコーディングプロセス701のステップ740と同様に取得される。それに応じて、第1のフレームのフレーム内予測は、ゼロにセットされ得
、第1の帯域の平均値
またはコヒーレンス値が、ビットストリームから復号され得、そして、第1のフレームのフレーム内予測が、再構築された値にセットされ得る
。係数が復号された場合、ビットカウンタ、Bcurr,m、が、符号化のために必要とされるビットの量だけ増やされる。たとえば、3つのビットが、係数の符号化のために必要とされる場合、ビットカウンタ、Bcurr,m、は、3だけ増やされる、すなわち、Bcurr,m=Bcurr,m+3。
、が、エンコーディングプロセス701のステップ750と同様に取得される。一例として、帯域bの最後の再構築された値は、フレーム間予測値のために使用され得る、すなわち、
。
、が復号される。ビットカウンタ、Bcurr、m、が、ビット制限未満である場合、すなわち、Bcurr、m<Bm、再構築された予測残差は、入手可能な量子化器インデックスから導出される
。ビットカウンタが、ビット制限と等しいまたはこれを超える場合、再構築された予測残差は、ゼロにセットされる、すなわち、
。
が使用される、エンコーダ内で実行されることになる。
少なくとも2つの入力オーディオチャネルのオーディオ信号のスペクトル特性を判定することと、
それぞれの入力オーディオチャネルのオーディオ信号間の空間コヒーレンスを判定することであって、空間コヒーレンスは、知覚的重要性尺度に関連付けられる、空間コヒーレンスを判定することと、
空間コヒーレンスを周波数帯に分けることであって、空間コヒーレンスの圧縮表現は、知覚的重要性尺度に従って各周波数帯内の空間コヒーレンス値に重み付けすることによって、周波数帯ごとに判定される、周波数帯に分けることと、
受信ノードにおける少なくとも2つのオーディオチャネルのための快適雑音の生成を可能にするための、スペクトル特性に関する情報および周波数帯ごとの空間コヒーレンスの圧縮表現に関する情報を受信ノードにシグナリングすることとを含む、方法。
少なくとも2つの入力オーディオチャネルのオーディオ信号のスペクトル特性を判定することであって、スペクトル特性は、知覚的重要性尺度に関連付けられる、スペクトル特性を判定することと、
それぞれの入力オーディオチャネルのオーディオ信号間の空間コヒーレンスを判定することであって、空間コヒーレンスは、周波数帯に分けられ、空間コヒーレンスの1つの単一値は、スペクトル特性の対応する値の知覚的重要性尺度に従って各周波数帯内の空間コヒーレンス値に重み付けすることによって、周波数帯ごとに判定される、空間コヒーレンスを判定することと、
受信ノードにおける少なくとも2つのオーディオチャネルのための快適雑音の生成を可能にするための、スペクトル特性に関する情報および周波数帯ごとの空間コヒーレンスの単一値に関する情報を受信ノードにシグナリングすることとを含む、方法。
そこで、L(m,k)は、窓処理されるオーディオ信号lwin(m,n)のスペクトルであり、R(m,k)は、窓処理されるオーディオ信号rwin(m,n)のスペクトルであり、そして、*は、複素共役を示す。
そこで、Nbandは、周波数帯の総数を示し、そして、limit(b)は、周波数帯bのより低い周波数ビンを示す、項目11に記載の方法。
少なくとも2つの入力オーディオチャネルのオーディオ信号のスペクトル特性を判定することと、
それぞれの入力オーディオチャネルのオーディオ信号間の空間コヒーレンスを判定することであって、空間コヒーレンスは、知覚的重要性尺度に関連付けられる、空間コヒーレンスを判定することと、
空間コヒーレンスを周波数帯に分けることであって、空間コヒーレンスの圧縮表現が、知覚的重要性尺度に従って各周波数帯内の空間コヒーレンス値に重み付けすることによって、周波数帯ごとに判定される、周波数帯に分けることと、
受信ノードにおける少なくとも2つのオーディオチャネルのための快適雑音の生成を可能にするための、スペクトル特性に関する情報および周波数帯ごとの空間コヒーレンスの圧縮表現に関する情報を受信ノードにシグナリングすることと
を送信ノードに行わせるように設定される、送信ノード。
少なくとも2つの入力オーディオチャネルのオーディオ信号のスペクトル特性を判定することであって、スペクトル特性は、知覚的重要性尺度に関連付けられる、スペクトル特性を判定することと、
それぞれの入力オーディオチャネルのオーディオ信号間の空間コヒーレンスを判定することであって、空間コヒーレンスは、周波数帯に分けられ、空間コヒーレンスの1つの単一値は、スペクトル特性の対応する値の知覚的重要性尺度に従って各周波数帯内の空間コヒーレンス値に重み付けすることによって、周波数帯ごとに判定される、空間コヒーレンスを判定することと、
受信ノードにおける少なくとも2つのオーディオチャネルのための快適雑音の生成を可能にするための、スペクトル特性に関する情報および周波数帯ごとの空間コヒーレンスの単一値に関する情報を受信ノードにシグナリングすることと
を送信ノードに行わせるように設定される、送信ノード。
少なくとも2つの入力オーディオチャネルのオーディオ信号のスペクトル特性を判定することと、
それぞれの入力オーディオチャネルのオーディオ信号間の空間コヒーレンスを判定することであって、空間コヒーレンスは、知覚的重要性尺度に関連付けられる、空間コヒーレンスを判定することと、
空間コヒーレンスを周波数帯に分けることであって、空間コヒーレンスの圧縮表現が、知覚的重要性尺度に従って各周波数帯内の空間コヒーレンス値に重み付けすることによって、周波数帯ごとに判定される、周波数帯に分けることと、
受信ノードにおける少なくとも2つのオーディオチャネルのための快適雑音の生成を可能にするための、スペクトル特性に関する情報および周波数帯ごとの空間コヒーレンスの圧縮表現に関する情報を受信ノードにシグナリングすることと
を送信ノードに行わせる、コンピュータプログラム。
少なくとも2つの入力オーディオチャネルのオーディオ信号のスペクトル特性を判定することであって、スペクトル特性は、知覚的重要性尺度に関連付けられる、スペクトル特性を判定することと、
それぞれの入力オーディオチャネルのオーディオ信号間の空間コヒーレンスを判定することであって、空間コヒーレンスは、周波数帯に分けられ、空間コヒーレンスの1つの単一値は、スペクトル特性の対応する値の知覚的重要性尺度に従って各周波数帯内の空間コヒーレンス値に重み付けすることによって、周波数帯ごとに判定される、空間コヒーレンスを判定することと、
受信ノードにおける少なくとも2つのオーディオチャネルのための快適雑音の生成を可能にするための、スペクトル特性に関する情報および周波数帯ごとの空間コヒーレンスの単一値に関する情報を受信ノードにシグナリングすることと
を送信ノードに行わせる、コンピュータプログラム。
Claims (15)
- 受信ノードにおける少なくとも2つのオーディオチャネルのための快適雑音の生成をサポートするための、送信ノードによって実行される方法であって、
少なくとも2つの入力オーディオチャネルのオーディオ信号のスペクトル特性を判定すること(S102)と、
それぞれの前記入力オーディオチャネルの前記オーディオ信号間の空間コヒーレンスを判定すること(S104)であって、前記空間コヒーレンスは、知覚的重要性尺度に関連付けられる、空間コヒーレンスを判定すること(S104)と、
前記空間コヒーレンスを周波数帯に分けること(S106)であって、前記空間コヒーレンスの圧縮表現は、前記知覚的重要性尺度に従って各周波数帯内の前記空間コヒーレンスに重み付けすることによって周波数帯ごとに判定される、周波数帯に分けること(S106)と、
前記受信ノードにおける前記少なくとも2つのオーディオチャネルのための前記快適雑音の前記生成を可能にするための、前記スペクトル特性に関する情報および前記周波数帯ごとの前記空間コヒーレンスの前記圧縮表現に関する情報を前記受信ノードにシグナリングすること(S108)と
を含む、方法。 - 前記空間コヒーレンスの前記圧縮表現が、周波数帯ごとの1つの単一値である、請求項1に記載の方法。
- 前記知覚的重要性尺度が、前記少なくとも2つの入力オーディオチャネルの前記スペクトル特性に基づく、請求項1または2に記載の方法。
- 前記知覚的重要性尺度が、前記少なくとも2つの入力オーディオチャネルのパワースペクトルに基づいて判定される、請求項3に記載の方法。
- 前記知覚的重要性尺度が、前記少なくとも2つの入力オーディオチャネルの加重和のパワースペクトルに基づいて判定される、請求項3に記載の方法。
- 前記スペクトル特性の所与の値の前記知覚的重要性尺度が、前記少なくとも2つの入力オーディオチャネルの前記オーディオ信号の合計のパワースペクトルに基づく、請求項1または2に記載の方法。
- より高いエネルギを有する周波数係数の値に対応する前記空間コヒーレンス値が、より低いエネルギを有する周波数係数の値に対応する前記空間コヒーレンス値と比較して、前記空間コヒーレンスの前記1つの単一値により多くの影響を及ぼすように、各周波数帯内の前記空間コヒーレンス値が、重み付けされる、請求項2に記載の方法。
- lr(m,n)=l(m,n)+r(m,n)のエネルギスペクトル|LR(m,k)|2、ここで、l(m,n)が、左のチャネルの入力信号を示し、r(m,n)が、右のチャネルの入力信号を示す、は、フレームm内の前記知覚的重要性尺度を規定し、前記空間コヒーレンス値を重み付けするために使用される、請求項1に記載の方法。
- 受信ノードにおける少なくとも2つのオーディオチャネルのための快適雑音の生成をサポートするための送信ノード(200a)であって、処理回路(210)を備え、前記処理回路が、
少なくとも2つの入力オーディオチャネルのオーディオ信号のスペクトル特性を判定することと、
それぞれの前記入力オーディオチャネルの前記オーディオ信号間の空間コヒーレンスを判定することであって、前記空間コヒーレンスは、前記知覚的重要性尺度に関連付けられる、空間コヒーレンスを判定することと、
前記空間コヒーレンスを周波数帯に分けることであって、前記空間コヒーレンスの圧縮表現は、前記知覚的重要性尺度に従って各周波数帯内の前記空間コヒーレンスに重み付けすることによって、周波数帯ごとに判定される、周波数帯に分けることと、
前記受信ノードにおける前記少なくとも2つのオーディオチャネルのための前記快適雑音の前記生成を可能にするための、前記スペクトル特性に関する情報および周波数帯ごとの前記空間コヒーレンスの前記圧縮表現に関する情報を前記受信ノードにシグナリングすることと
を前記送信ノードに行わせるように設定された、送信ノード。 - 請求項2から9のいずれか一項に記載の方法を実行するようにさらに設定された、請求項10に記載の送信ノード。
- 請求項10または11に記載の送信ノードを備える無線トランシーバデバイス。
- 前記受信ノードをさらに備える、請求項12に記載の無線トランシーバデバイス。
- 受信ノードにおける少なくとも2つのオーディオチャネルのための快適雑音の生成をサポートするためのコンピュータプログラム(1420)であって、コンピュータコードを備え、コンピュータコードが前記送信ノードの処理回路で実行されるとき、
少なくとも2つの入力オーディオチャネルのオーディオ信号のスペクトル特性を判定することと、
それぞれの前記入力オーディオチャネルの前記オーディオ信号間の空間コヒーレンスを判定することであって、前記空間コヒーレンスは、知覚的重要性尺度に関連付けられる、空間コヒーレンスを判定することと、
前記空間コヒーレンスを周波数帯に分けることであって、前記空間コヒーレンスの圧縮表現は、前記知覚的重要性尺度に従って各周波数帯内の前記空間コヒーレンスに重み付けすることによって、周波数帯ごとに判定される、周波数帯に分けることと、
前記受信ノードにおける前記少なくとも2つのオーディオチャネルのための前記快適雑音の前記生成を可能にするための、前記スペクトル特性に関する情報および周波数帯ごとの前記空間コヒーレンスの前記圧縮表現に関する情報を前記受信ノードにシグナリングすることと
を前記送信ノードに行わせる、コンピュータプログラム。 - 請求項14に記載のコンピュータプログラム、および前記コンピュータプログラムが記憶されるコンピュータ可読記憶媒体を備える、コンピュータプログラム製品(1410)。
Applications Claiming Priority (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862652949P | 2018-04-05 | 2018-04-05 | |
US201862653078P | 2018-04-05 | 2018-04-05 | |
US201862652941P | 2018-04-05 | 2018-04-05 | |
US62/653,078 | 2018-04-05 | ||
US62/652,941 | 2018-04-05 | ||
US62/652,949 | 2018-04-05 | ||
PCT/EP2019/058650 WO2019193156A1 (en) | 2018-04-05 | 2019-04-05 | Support for generation of comfort noise |
JP2020554191A JP7085640B2 (ja) | 2018-04-05 | 2019-04-05 | 快適雑音の生成のサポート |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020554191A Division JP7085640B2 (ja) | 2018-04-05 | 2019-04-05 | 快適雑音の生成のサポート |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024019342A Division JP2024073419A (ja) | 2018-04-05 | 2024-02-13 | 快適雑音の生成のサポート |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022126688A true JP2022126688A (ja) | 2022-08-30 |
JP7438268B2 JP7438268B2 (ja) | 2024-02-26 |
Family
ID=66102706
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020554191A Active JP7085640B2 (ja) | 2018-04-05 | 2019-04-05 | 快適雑音の生成のサポート |
JP2022091269A Active JP7438268B2 (ja) | 2018-04-05 | 2022-06-06 | 快適雑音の生成のサポート |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020554191A Active JP7085640B2 (ja) | 2018-04-05 | 2019-04-05 | 快適雑音の生成のサポート |
Country Status (8)
Country | Link |
---|---|
US (8) | US11495237B2 (ja) |
EP (6) | EP3776546B1 (ja) |
JP (2) | JP7085640B2 (ja) |
KR (3) | KR102548184B1 (ja) |
CN (3) | CN112119457A (ja) |
DK (1) | DK3776547T3 (ja) |
MX (1) | MX2020010468A (ja) |
WO (3) | WO2019193156A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112119457A (zh) | 2018-04-05 | 2020-12-22 | 瑞典爱立信有限公司 | 可截断的预测编码 |
GB2595891A (en) * | 2020-06-10 | 2021-12-15 | Nokia Technologies Oy | Adapting multi-source inputs for constant rate encoding |
AU2021288690A1 (en) * | 2020-06-11 | 2023-01-19 | Dolby Laboratories Licensing Corporation | Methods and devices for encoding and/or decoding spatial background noise within a multi-channel input signal |
GB2596138A (en) * | 2020-06-19 | 2021-12-22 | Nokia Technologies Oy | Decoder spatial comfort noise generation for discontinuous transmission operation |
US20230282220A1 (en) * | 2020-07-07 | 2023-09-07 | Telefonaktiebolaget Lm Ericsson (Publ) | Comfort noise generation for multi-mode spatial audio coding |
GB2598104A (en) * | 2020-08-17 | 2022-02-23 | Nokia Technologies Oy | Discontinuous transmission operation for spatial audio parameters |
WO2022042908A1 (en) * | 2020-08-31 | 2022-03-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel signal generator, audio encoder and related methods relying on a mixing noise signal |
CN117223054A (zh) * | 2021-04-29 | 2023-12-12 | 沃伊斯亚吉公司 | 经解码的声音信号中的多声道舒适噪声注入的方法及设备 |
WO2023031498A1 (en) * | 2021-08-30 | 2023-03-09 | Nokia Technologies Oy | Silence descriptor using spatial parameters |
WO2023110082A1 (en) | 2021-12-15 | 2023-06-22 | Telefonaktiebolaget Lm Ericsson (Publ) | Adaptive predictive encoding |
WO2024056701A1 (en) * | 2022-09-13 | 2024-03-21 | Telefonaktiebolaget Lm Ericsson (Publ) | Adaptive stereo parameter synthesis |
WO2024074302A1 (en) | 2022-10-05 | 2024-04-11 | Telefonaktiebolaget Lm Ericsson (Publ) | Coherence calculation for stereo discontinuous transmission (dtx) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005509926A (ja) * | 2001-11-23 | 2005-04-14 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 知覚ノイズの置換え |
US20170047072A1 (en) * | 2014-02-14 | 2017-02-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Comfort noise generation |
US9865274B1 (en) * | 2016-12-22 | 2018-01-09 | Getgo, Inc. | Ambisonic audio signal processing for bidirectional real-time communication |
Family Cites Families (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7920697B2 (en) | 1999-12-09 | 2011-04-05 | Broadcom Corp. | Interaction between echo canceller and packet voice processing |
US7006636B2 (en) | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US20040002856A1 (en) * | 2002-03-08 | 2004-01-01 | Udaya Bhaskar | Multi-rate frequency domain interpolative speech CODEC system |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
CN1458646A (zh) * | 2003-04-21 | 2003-11-26 | 北京阜国数字技术有限公司 | 一种滤波参数矢量量化和结合量化模型预测的音频编码方法 |
CN1677491A (zh) * | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
CN1677493A (zh) * | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
JP2008519306A (ja) * | 2004-11-04 | 2008-06-05 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 信号の組のエンコード及びデコード |
WO2008004940A1 (en) | 2006-07-07 | 2008-01-10 | Telefonaktiebolaget Lm Ericsson (Publ) | Video data management |
DK3401907T3 (da) * | 2007-08-27 | 2020-03-02 | Ericsson Telefon Ab L M | Fremgangsmåde og indretning til perceptuel spektral afkodning af et audiosignal omfattende udfyldning af spektrale huller |
EP2283483B1 (en) * | 2008-05-23 | 2013-03-13 | Koninklijke Philips Electronics N.V. | A parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder |
EP2345027B1 (en) * | 2008-10-10 | 2018-04-18 | Telefonaktiebolaget LM Ericsson (publ) | Energy-conserving multi-channel audio coding and decoding |
US8817991B2 (en) * | 2008-12-15 | 2014-08-26 | Orange | Advanced encoding of multi-channel digital audio signals |
US20120230405A1 (en) | 2009-10-28 | 2012-09-13 | Media Tek Singapore Pte. Ltd. | Video coding methods and video encoders and decoders with localized weighted prediction |
KR101690252B1 (ko) | 2009-12-23 | 2016-12-27 | 삼성전자주식회사 | 신호 처리 방법 및 장치 |
EP2526546A4 (en) * | 2010-01-22 | 2013-08-28 | Agency Science Tech & Res | METHOD AND DEVICE FOR DETERMINING NUMBER OF BITS FOR ENCODING AUDIO SIGNAL |
US9236063B2 (en) * | 2010-07-30 | 2016-01-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
ES2664090T3 (es) * | 2011-03-10 | 2018-04-18 | Telefonaktiebolaget Lm Ericsson (Publ) | Relleno de subvectores no codificados en señales de audio codificadas por transformada |
RU2571561C2 (ru) * | 2011-04-05 | 2015-12-20 | Ниппон Телеграф Энд Телефон Корпорейшн | Способ кодирования, способ декодирования, кодер, декодер, программа и носитель записи |
CN104396249B (zh) | 2012-06-20 | 2017-12-26 | 寰发股份有限公司 | 可伸缩视频编码的层间预测的方法和设备 |
US9906786B2 (en) | 2012-09-07 | 2018-02-27 | Qualcomm Incorporated | Weighted prediction mode for scalable video coding |
DK2901715T3 (da) | 2012-09-28 | 2017-01-02 | Sonova Ag | Metode til anvendelse af et binauralt høresystem og et binauralt høresystem / method for operating a binaural hearing system and binaural hearing system |
CN107516530B (zh) * | 2012-10-01 | 2020-08-25 | 日本电信电话株式会社 | 编码方法、编码装置以及记录介质 |
US9318092B2 (en) | 2013-01-29 | 2016-04-19 | 2236008 Ontario Inc. | Noise estimation control system |
CN104050969A (zh) * | 2013-03-14 | 2014-09-17 | 杜比实验室特许公司 | 空间舒适噪声 |
EP2976768A4 (en) * | 2013-03-20 | 2016-11-09 | Nokia Technologies Oy | AUDIO SIGNAL ENCODER COMPRISING A MULTI-CHANNEL PARAMETER SELECTOR |
GB2515593B (en) | 2013-12-23 | 2015-12-23 | Imagination Tech Ltd | Acoustic echo suppression |
CN104978970B (zh) * | 2014-04-08 | 2019-02-12 | 华为技术有限公司 | 一种噪声信号的处理和生成方法、编解码器和编解码系统 |
EP2980793A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder, system and methods for encoding and decoding |
US10366698B2 (en) * | 2016-08-30 | 2019-07-30 | Dts, Inc. | Variable length coding of indices and bit scheduling in a pyramid vector quantizer |
US10367948B2 (en) * | 2017-01-13 | 2019-07-30 | Shure Acquisition Holdings, Inc. | Post-mixing acoustic echo cancellation systems and methods |
US10170134B2 (en) | 2017-02-21 | 2019-01-01 | Intel IP Corporation | Method and system of acoustic dereverberation factoring the actual non-ideal acoustic environment |
CN112119457A (zh) | 2018-04-05 | 2020-12-22 | 瑞典爱立信有限公司 | 可截断的预测编码 |
US11025951B2 (en) | 2019-01-13 | 2021-06-01 | Tencent America LLC | Method and apparatus for video coding |
-
2019
- 2019-04-05 CN CN201980031508.9A patent/CN112119457A/zh active Pending
- 2019-04-05 EP EP19716874.3A patent/EP3776546B1/en active Active
- 2019-04-05 US US17/044,740 patent/US11495237B2/en active Active
- 2019-04-05 KR KR1020207031954A patent/KR102548184B1/ko active IP Right Grant
- 2019-04-05 EP EP19717450.1A patent/EP3776547B1/en active Active
- 2019-04-05 WO PCT/EP2019/058650 patent/WO2019193156A1/en active Application Filing
- 2019-04-05 CN CN201980034376.5A patent/CN112154502B/zh active Active
- 2019-04-05 WO PCT/EP2019/058629 patent/WO2019193149A1/en active Application Filing
- 2019-04-05 CN CN202410257919.2A patent/CN118038881A/zh active Pending
- 2019-04-05 KR KR1020207031390A patent/KR102535034B1/ko active IP Right Grant
- 2019-04-05 EP EP21185347.8A patent/EP3913626A1/en active Pending
- 2019-04-05 MX MX2020010468A patent/MX2020010468A/es unknown
- 2019-04-05 EP EP23180564.9A patent/EP4273858A1/en active Pending
- 2019-04-05 US US17/045,103 patent/US11404069B2/en active Active
- 2019-04-05 WO PCT/EP2019/058681 patent/WO2019193173A1/en active Application Filing
- 2019-04-05 EP EP19717452.7A patent/EP3776548A1/en active Pending
- 2019-04-05 US US17/044,732 patent/US11417348B2/en active Active
- 2019-04-05 JP JP2020554191A patent/JP7085640B2/ja active Active
- 2019-04-05 KR KR1020237013683A patent/KR20230058546A/ko active IP Right Grant
- 2019-04-05 EP EP22151769.1A patent/EP4047601A3/en not_active Withdrawn
- 2019-04-05 DK DK19717450.1T patent/DK3776547T3/da active
-
2022
- 2022-06-06 JP JP2022091269A patent/JP7438268B2/ja active Active
- 2022-06-21 US US17/844,803 patent/US11837242B2/en active Active
- 2022-08-03 US US17/817,251 patent/US11978460B2/en active Active
- 2022-11-03 US US17/980,386 patent/US11862181B2/en active Active
-
2023
- 2023-10-26 US US18/383,953 patent/US20240055008A1/en active Pending
- 2023-11-21 US US18/516,046 patent/US20240161758A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005509926A (ja) * | 2001-11-23 | 2005-04-14 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 知覚ノイズの置換え |
US20170047072A1 (en) * | 2014-02-14 | 2017-02-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Comfort noise generation |
US9865274B1 (en) * | 2016-12-22 | 2018-01-09 | Getgo, Inc. | Ambisonic audio signal processing for bidirectional real-time communication |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7438268B2 (ja) | 快適雑音の生成のサポート | |
KR102636424B1 (ko) | 스테레오 사운드 신호의 좌측 및 우측 채널들을 디코딩하는 방법 및 시스템 | |
JP6779966B2 (ja) | 先進量子化器 | |
KR102132798B1 (ko) | 노이즈 신호 처리 및 노이즈 신호 생성 방법, 인코더, 디코더, 및 인코딩 및 디코딩 시스템 | |
US20110064229A1 (en) | Audio signal decoding device and balance adjustment method for audio signal decoding device | |
CN103503065B (zh) | 用于衰减低精确度重构的信号区域的方法和解码器 | |
JP2024073419A (ja) | 快適雑音の生成のサポート | |
WO2009146734A1 (en) | Multi-channel audio coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220629 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220629 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230411 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230614 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230912 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231012 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240116 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240213 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7438268 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |