JP2021529340A - ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 - Google Patents
ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 Download PDFInfo
- Publication number
- JP2021529340A JP2021529340A JP2020570100A JP2020570100A JP2021529340A JP 2021529340 A JP2021529340 A JP 2021529340A JP 2020570100 A JP2020570100 A JP 2020570100A JP 2020570100 A JP2020570100 A JP 2020570100A JP 2021529340 A JP2021529340 A JP 2021529340A
- Authority
- JP
- Japan
- Prior art keywords
- channel signal
- lsf
- lsf parameter
- primary channel
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 143
- 238000001228 spectrum Methods 0.000 claims abstract description 229
- 238000013139 quantization Methods 0.000 claims abstract description 32
- 230000008569 process Effects 0.000 claims description 37
- 230000006837 decompression Effects 0.000 claims description 29
- 238000006243 chemical reaction Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 6
- 230000003595 spectral effect Effects 0.000 claims description 5
- 238000009792 diffusion process Methods 0.000 description 37
- 238000010586 diagram Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 7
- 238000005314 correlation function Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 5
- 230000005284 excitation Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000007480 spreading Effects 0.000 description 3
- 238000009499 grossing Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241000473391 Archosargus rhomboidalis Species 0.000 description 1
- 108010003272 Hyaluronate lyase Proteins 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Abstract
Description
iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
プライマリチャネル信号の量子化されたLSFパラメータに対して平均伸長処理を実行して、スペクトラム拡散LSFパラメータを取得するよう構成され得、平均伸長処理は以下の式に従って実行され得る。
iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
プライマリチャネル信号の量子化されたLSFパラメータに対して平均伸長処理を実行して、スペクトラム拡散LSFパラメータを取得するよう構成され得、平均伸長処理は以下の式に従って実行され得る。
iはベクトルインデックスを表し、βは拡散率を表し、0<β<1であり、
他の可能な請求項
(項目1)
ステレオ信号の符号化方法であって、
上記ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化された線スペクトル周波数LSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階と、
セカンダリチャネル信号の元のLSFパラメータ、および、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、上記現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を決定する段階と、
上記予測残差に対して量子化を実行する段階と
を備える方法。
(項目2)
上記ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化された線スペクトル周波数LSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する上記段階は、
上記プライマリチャネル信号の上記量子化されたLSFパラメータに対して平均伸長処理を実行して、上記スペクトラム拡散LSFパラメータを取得する段階
を含み、上記平均伸長処理は以下の式、すなわち
項目1に記載の符号化方法。
(項目3)
上記ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化された線スペクトル周波数LSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する上記段階は、
上記プライマリチャネル信号の上記量子化されたLSFパラメータを線形予測係数に変換する段階と、
上記線形予測係数を修正して、上記プライマリチャネル信号の修正された線形予測係数を取得する段階と、
上記プライマリチャネル信号の上記修正された線形予測係数をLSFパラメータに変換する段階であって、変換を通じて取得される上記LSFパラメータは、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータである、段階と
を含む、項目1に記載の符号化方法。
(項目4)
上記セカンダリチャネル信号の上記LSFパラメータの上記予測残差は、上記セカンダリチャネル信号の上記元のLSFパラメータと、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータとの間の差である、項目1から3のいずれか一項に記載の符号化方法。
(項目5)
セカンダリチャネル信号の元のLSFパラメータ、および、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記現在のフレームにおける上記セカンダリチャネル信号のLSFパラメータの予測残差を決定する上記段階は、
上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記セカンダリチャネル信号の上記LSFパラメータに対して2ステージ予測を実行して、上記セカンダリチャネル信号の予測されたLSFパラメータを取得する段階と、
上記セカンダリチャネル信号の上記元のLSFパラメータと、上記予測されたLSFパラメータとの間の差を上記セカンダリチャネル信号の上記予測残差として使用する、段階と
を含む、項目1から3のいずれか一項に記載の符号化方法。
(項目6)
セカンダリチャネル信号の元のLSFパラメータ、および、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記現在のフレームにおける上記セカンダリチャネル信号のLSFパラメータの予測残差を決定する上記段階の前に、上記符号化方法は更に、
上記セカンダリチャネル信号の上記LSFパラメータが再使用条件を満たさないと判定する段階
を備える、項目1から5のいずれか一項に記載の符号化方法。
(項目7)
ステレオ信号の復号方法であって、
ビットストリームから上記現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータを取得する段階と、
上記プライマリチャネル信号の上記量子化されたLSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階と、
上記ビットストリームから、上記ステレオ信号における現在のフレームにおけるセカンダリチャネル信号の線スペクトル周波数LSFパラメータの予測残差を取得する段階と、
上記セカンダリチャネル信号の上記LSFパラメータの上記予測残差、および、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記セカンダリチャネル信号の量子化されたLSFパラメータを決定する段階と
を備える復号方法。
(項目8)
上記プライマリチャネル信号の上記量子化されたLSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する上記段階は、
上記プライマリチャネル信号の上記量子化されたLSFパラメータに対して平均伸長処理を実行して、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータを取得する段階
を含み、上記平均伸長処理は、以下の式、すなわち、
項目7に記載の復号方法。
(項目9)
上記ステレオ信号における上記現在のフレームにおける上記プライマリチャネル信号の上記量子化されたLSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する上記段階は、
上記プライマリチャネル信号の上記量子化されたLSFパラメータを線形予測係数に変換する段階と、
上記線形予測係数を修正して、上記プライマリチャネル信号の修正された線形予測係数を取得する段階と、
上記プライマリチャネル信号の上記修正された線形予測係数をLSFパラメータに変換する段階であって、変換を通じて取得された上記LSFパラメータは、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータである、段階と
を含む、項目7に記載の復号方法。
(項目10)
上記セカンダリチャネル信号の上記量子化されたLSFパラメータは、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータと上記予測残差との和である、項目7から9のいずれか一項に記載の復号方法。
(項目11)
上記セカンダリチャネル信号の上記LSFパラメータの上記予測残差、および、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記セカンダリチャネル信号の量子化されたLSFパラメータを決定する上記段階は、
上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記セカンダリチャネル信号の上記LSFパラメータに対して2ステージ予測を実行して、予測されたLSFパラメータを取得する段階と、
上記予測されたLSFパラメータと上記予測残差との和を上記セカンダリチャネル信号の上記量子化されたLSFパラメータとして使用する段階と
を含む、項目7から9のいずれか一項に記載の復号方法。
(項目12)
ステレオ信号符号化装置であって、メモリおよびプロセッサを備え、
上記メモリはプログラムを格納するよう構成され、
上記プロセッサは、上記メモリに格納された上記プログラムを実行するよう構成され。上記メモリ内の上記プログラムが実行されるとき、上記プロセッサは、
上記ステレオ信号における上記現在のフレームにおけるプライマリチャネル信号の量子化された線スペクトル周波数LSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得すること、
セカンダリチャネル信号の元のLSFパラメータ、および、プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、上記現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を決定すること、ならびに、
上記予測残差に対して量子化を実行すること
を行うよう構成される、ステレオ信号符号化装置。
(項目13)
上記プロセッサは、
上記プライマリチャネル信号の上記量子化されたLSFパラメータに対して平均伸長処理を実行して、上記スペクトラム拡散LSFパラメータを取得するよう構成され、上記平均伸長処理は、以下の式、すなわち、
項目12に記載の符号化装置。
(項目14)
上記プロセッサは、
上記プライマリチャネル信号の上記量子化されたLSFパラメータを線形予測係数に変換し、
上記線形予測係数を修正して、上記プライマリチャネル信号の修正された線形予測係数を取得し、
上記プライマリチャネル信号の上記修正された線形予測係数をLSFパラメータに変換するよう構成され、
変換を通じて取得された上記LSFパラメータは、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータである、
項目12に記載の符号化装置。
(項目15)
上記セカンダリチャネル信号の上記LSFパラメータの上記予測残差は、上記セカンダリチャネル信号の上記元のLSFパラメータと、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータとの間の差である、項目12から14のいずれか一項に記載の符号化装置。
(項目16)
上記プロセッサは、
上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記セカンダリチャネル信号の上記LSFパラメータに対して2ステージ予測を実行して、上記セカンダリチャネル信号の予測されたLSFパラメータを取得し、
上記セカンダリチャネル信号の上記元のLSFパラメータと、上記予測されたLSFパラメータとの間の差を、上記セカンダリチャネル信号の上記予測残差として使用するよう構成される、
項目12から14のいずれか一項に記載の符号化装置。
(項目17)
上記セカンダリチャネル信号の上記元のLSFパラメータ、および、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記現在のフレームにおける上記セカンダリチャネル信号の上記LSFパラメータの上記予測残差を決定する前に、上記プロセッサは更に、上記セカンダリチャネル信号の上記LSFパラメータが再使用条件を満たさないと判定するよう構成される、項目12から16のいずれか一項に記載の符号化装置。
(項目18)
メモリおよびプロセッサを備えるステレオ信号復号装置であって、上記メモリはプログラムを格納するよう構成され、上記プロセッサは、上記メモリに格納された上記プログラムを実行するよう構成され、上記メモリにおける上記プログラムが実行される場合、上記プロセッサは、
上記現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータをビットストリームから取得すること、
上記プライマリチャネル信号の上記量子化されたLSFパラメータに対してスペクトラム拡散を実行して、上記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得すること、
上記ステレオ信号における上記現在のフレームにおけるセカンダリチャネル信号の線スペクトル周波数LSFパラメータの予測残差を上記ビットストリームから取得すること、ならびに、
上記セカンダリチャネル信号の上記LSFパラメータの上記予測残差、および、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記セカンダリチャネル信号の量子化されたLSFパラメータを決定すること
を行うよう構成される、ステレオ信号復号装置。
(項目19)
上記プロセッサは、
上記プライマリチャネル信号の上記量子化されたLSFパラメータに対して平均伸長処理を実行して、上記スペクトラム拡散LSFパラメータを取得するよう構成され、上記平均伸長処理は、以下の式、すなわち、
項目18に記載の復号装置。
(項目20)
上記プロセッサは、
上記プライマリチャネル信号の上記量子化されたLSFパラメータを線形予測係数に変換し、
上記線形予測係数を修正して、上記プライマリチャネル信号の修正された線形予測係数を取得し、
上記プライマリチャネル信号の上記修正された線形予測係数をLSFパラメータに変換するよう構成され、
変換を通じて取得された上記LSFパラメータは、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータである、
項目18に記載の復号装置。
(項目21)
上記セカンダリチャネル信号の上記量子化されたLSFパラメータは、上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータと上記予測残差との和である、
項目18から20のいずれか一項に記載の復号装置。
(項目22)
上記プロセッサは、
上記プライマリチャネル信号の上記スペクトラム拡散LSFパラメータに基づいて、上記セカンダリチャネル信号の上記LSFパラメータに対して2ステージ予測を実行して、予測されたLSFパラメータを取得し、
上記予測されたLSFパラメータと上記予測残差との和を上記セカンダリチャネル信号の上記量子化されたLSFパラメータとして使用する
よう構成される、項目18から20のいずれか一項に記載の復号装置。
Claims (28)
- ステレオ信号の符号化方法であって、
ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化された線スペクトル周波数LSFパラメータに対してスペクトラム拡散を実行して、前記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階と、
セカンダリチャネル信号の元のLSFパラメータ、および、前記プライマリチャネル信号のスペクトラム拡散LSFパラメータに基づいて、前記現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を決定する段階と、
前記予測残差に対して量子化を実行する段階と
を備える方法。 - ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化された線スペクトル周波数LSFパラメータに対してスペクトラム拡散を実行して、前記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する前記段階は、
前記プライマリチャネル信号の前記量子化されたLSFパラメータに対して平均伸長処理を実行して、前記スペクトラム拡散LSFパラメータを取得する段階
を含み、前記平均伸長処理は以下の式、すなわち
請求項1に記載の符号化方法。 - ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化された線スペクトル周波数LSFパラメータに対してスペクトラム拡散を実行して、前記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する前記段階は、
前記プライマリチャネル信号の前記量子化されたLSFパラメータを線形予測係数に変換する段階と、
前記線形予測係数を修正して、前記プライマリチャネル信号の修正された線形予測係数を取得する段階と、
前記プライマリチャネル信号の前記修正された線形予測係数をLSFパラメータに変換する段階であって、変換を通じて取得される前記LSFパラメータは、前記プライマリチャネル信号の前記スペクトラム拡散LSFパラメータである、段階と
を含む、請求項1に記載の符号化方法。 - 前記セカンダリチャネル信号の前記LSFパラメータの前記予測残差は、前記セカンダリチャネル信号の前記元のLSFパラメータと、前記プライマリチャネル信号の前記スペクトラム拡散LSFパラメータとの間の差である、請求項1から3のいずれか一項に記載の符号化方法。
- 前記セカンダリチャネル信号の元のLSFパラメータ、および、前記プライマリチャネル信号の前記スペクトラム拡散LSFパラメータに基づいて、前記現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を決定する前記段階は、
前記プライマリチャネル信号の前記スペクトラム拡散LSFパラメータに基づいて、前記セカンダリチャネル信号の前記LSFパラメータに対して2ステージ予測を実行して、前記セカンダリチャネル信号の予測されたLSFパラメータを取得する段階と、
前記セカンダリチャネル信号の前記元のLSFパラメータと、前記予測されたLSFパラメータとの間の差を前記セカンダリチャネル信号の前記LSFパラメータの前記予測残差として使用する、段階と
を含む、請求項1から3のいずれか一項に記載の符号化方法。 - 前記セカンダリチャネル信号の元のLSFパラメータ、および、前記プライマリチャネル信号の前記スペクトラム拡散LSFパラメータに基づいて、前記現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を決定する前記段階の前に、前記符号化方法は更に、
前記セカンダリチャネル信号の前記LSFパラメータが再使用条件を満たさないと判定する段階
を備える、請求項1から5のいずれか一項に記載の符号化方法。 - ステレオ信号の復号方法であって、
ビットストリームから現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータを取得する段階と、
前記プライマリチャネル信号の前記量子化されたLSFパラメータに対してスペクトラム拡散を実行して、前記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する段階と、
前記ビットストリームから、ステレオ信号における現在のフレームにおけるセカンダリチャネル信号の線スペクトル周波数LSFパラメータの予測残差を取得する段階と、
前記セカンダリチャネル信号の前記LSFパラメータの前記予測残差、および、前記プライマリチャネル信号の前記スペクトラム拡散LSFパラメータに基づいて、前記セカンダリチャネル信号の量子化されたLSFパラメータを決定する段階と
を備える復号方法。 - 前記プライマリチャネル信号の前記量子化されたLSFパラメータに対してスペクトラム拡散を実行して、前記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する前記段階は、
前記プライマリチャネル信号の前記量子化されたLSFパラメータに対して平均伸長処理を実行して、前記プライマリチャネル信号の前記スペクトラム拡散LSFパラメータを取得する段階
を含み、前記平均伸長処理は、以下の式、すなわち、
請求項7に記載の復号方法。 - 前記ステレオ信号における前記現在のフレームにおける前記プライマリチャネル信号の前記量子化されたLSFパラメータに対してスペクトラム拡散を実行して、前記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得する前記段階は、
前記プライマリチャネル信号の前記量子化されたLSFパラメータを線形予測係数に変換する段階と、
前記線形予測係数を修正して、前記プライマリチャネル信号の修正された線形予測係数を取得する段階と、
前記プライマリチャネル信号の前記修正された線形予測係数をLSFパラメータに変換する段階であって、変換を通じて取得された前記LSFパラメータは、前記プライマリチャネル信号の前記スペクトラム拡散LSFパラメータである、段階と
を含む、請求項7に記載の復号方法。 - 前記セカンダリチャネル信号の前記量子化されたLSFパラメータは、前記プライマリチャネル信号の前記スペクトラム拡散LSFパラメータと前記予測残差との和である、請求項7から9のいずれか一項に記載の復号方法。
- 前記セカンダリチャネル信号の前記LSFパラメータの前記予測残差、および、前記プライマリチャネル信号の前記スペクトラム拡散LSFパラメータに基づいて、前記セカンダリチャネル信号の量子化されたLSFパラメータを決定する前記段階は、
前記プライマリチャネル信号の前記スペクトラム拡散LSFパラメータに基づいて、前記セカンダリチャネル信号の前記LSFパラメータに対して2ステージ予測を実行して、予測されたLSFパラメータを取得する段階と、
前記予測されたLSFパラメータと前記予測残差との和を前記セカンダリチャネル信号の前記量子化されたLSFパラメータとして使用する段階と
を含む、請求項7から9のいずれか一項に記載の復号方法。 - ステレオ信号の符号化装置であって、
ステレオ信号における現在のフレームにおけるプライマリチャネル信号の量子化された線スペクトル周波数LSFパラメータに対してスペクトラム拡散を実行して、前記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得するよう構成されるスペクトラム拡散モジュールと、
セカンダリチャネル信号の元のLSFパラメータ、および、前記プライマリチャネル信号の前記スペクトラム拡散LSFパラメータに基づいて、前記現在のフレームにおけるセカンダリチャネル信号のLSFパラメータの予測残差を決定するよう構成される決定モジュールと、
前記予測残差に対して量子化を実行するよう構成される量子化モジュールと
を備える符号化装置。 - 前記スペクトラム拡散モジュールは更に、
前記プライマリチャネル信号の前記量子化されたLSFパラメータに対して平均伸長処理を実行して、前記スペクトラム拡散LSFパラメータを取得するよう構成され、前記平均伸長処理は、以下の式、すなわち、
請求項12に記載の符号化装置。 - 前記スペクトラム拡散モジュールは更に、
前記プライマリチャネル信号の前記量子化されたLSFパラメータを線形予測係数に変換し、
前記線形予測係数を修正して、前記プライマリチャネル信号の修正された線形予測係数を取得し、
前記プライマリチャネル信号の前記修正された線形予測係数をLSFパラメータに変換するよう構成され、
変換を通じて取得された前記LSFパラメータは、前記プライマリチャネル信号の前記スペクトラム拡散LSFパラメータである、
請求項12に記載の符号化装置。 - 前記セカンダリチャネル信号の前記LSFパラメータの前記予測残差は、前記セカンダリチャネル信号の前記元のLSFパラメータと、前記プライマリチャネル信号の前記スペクトラム拡散LSFパラメータとの間の差である、請求項12から14のいずれか一項に記載の符号化装置。
- 前記決定モジュールは更に、
前記プライマリチャネル信号の前記スペクトラム拡散LSFパラメータに基づいて、前記セカンダリチャネル信号の前記LSFパラメータに対して2ステージ予測を実行して、前記セカンダリチャネル信号の予測されたLSFパラメータを取得し、
前記セカンダリチャネル信号の前記元のLSFパラメータと、前記予測されたLSFパラメータとの間の差を、前記セカンダリチャネル信号の前記LSFパラメータの前記予測残差として使用するよう構成される、
請求項12から14のいずれか一項に記載の符号化装置。 - 前記決定モジュールは更に、前記セカンダリチャネル信号の前記LSFパラメータが再使用条件を満たさないと判定するよう構成される、
請求項12から16のいずれか一項に記載の符号化装置。 - ステレオ信号の復号装置であって、
ビットストリームから現在のフレームにおけるプライマリチャネル信号の量子化されたLSFパラメータを取得するよう構成される第1取得モジュールと、
前記プライマリチャネル信号の前記量子化されたLSFパラメータに対してスペクトラム拡散を実行し、前記プライマリチャネル信号のスペクトラム拡散LSFパラメータを取得するよう構成されるスペクトラム拡散モジュールと、
前記ビットストリームから、ステレオ信号における前記現在のフレームにおけるセカンダリチャネル信号の線スペクトル周波数LSFパラメータの予測残差を取得するよう構成される第2取得モジュールと、
前記セカンダリチャネル信号の前記LSFパラメータの予測残差、および、前記プライマリチャネル信号の前記スペクトラム拡散LSFパラメータに基づいて、前記セカンダリチャネル信号の量子化されたLSFパラメータを決定するよう構成される決定モジュールと
を備える復号装置。 - 前記スペクトラム拡散モジュールは更に、
前記プライマリチャネル信号の前記量子化されたLSFパラメータに対して平均伸長処理を実行して、前記スペクトラム拡散LSFパラメータを取得するよう構成され、前記平均伸長処理は、以下の式、すなわち、
請求項18に記載の復号装置。 - 前記スペクトラム拡散モジュールは更に、
前記プライマリチャネル信号の前記量子化されたLSFパラメータを線形予測係数に変換し、
前記線形予測係数を修正して、前記プライマリチャネル信号の修正された線形予測係数を取得し、
前記プライマリチャネル信号の前記修正された線形予測係数をLSFパラメータに変換するよう構成され、
変換を通じて取得された前記LSFパラメータは、前記プライマリチャネル信号の前記スペクトラム拡散LSFパラメータである、
請求項18に記載の復号装置。 - 前記セカンダリチャネル信号の前記量子化されたLSFパラメータは、前記プライマリチャネル信号の前記スペクトラム拡散LSFパラメータと前記予測残差との和である、
請求項18から20のいずれか一項に記載の復号装置。 - 前記決定モジュールは更に、
前記プライマリチャネル信号の前記スペクトラム拡散LSFパラメータに基づいて、前記セカンダリチャネル信号の前記LSFパラメータに対して2ステージ予測を実行して、予測されたLSFパラメータを取得し、
前記予測されたLSFパラメータと前記予測残差との和を前記セカンダリチャネル信号の前記量子化されたLSFパラメータとして使用する
よう構成される、請求項18から20のいずれか一項に記載の復号装置。 - プログラムが記録されたコンピュータ可読記憶媒体であって、前記プログラムは、請求項1から6のいずれか一項に記載の符号化方法をコンピュータに実行させる、コンピュータ可読記憶媒体。
- プログラムが記録されたコンピュータ可読記憶媒体であって、前記プログラムは、請求項7から11のいずれか一項に記載の復号方法をコンピュータに実行させる、コンピュータ可読記憶媒体。
- 請求項1から6のいずれか一項に記載の符号化方法をコンピュータに実行させるコンピュータプログラム。
- 請求項7から11のいずれか一項に記載の復号方法をコンピュータに実行させるコンピュータプログラム。
- メモリと
前記メモリに結合され、請求項1から6のいずれか一項に記載の符号化方法を実行するよう構成される少なくとも1つのプロセッサと
を備えるステレオ信号符号化装置。 - メモリと、
前記メモリに結合される、請求項7から11のいずれか一項に記載の復号方法を実行するよう構成される少なくとも1つのプロセッサと
を備えるステレオ信号復号装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022164615A JP7477247B2 (ja) | 2018-06-29 | 2022-10-13 | ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 |
JP2024066011A JP2024102106A (ja) | 2018-06-29 | 2024-04-16 | ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810701919.1A CN110728986B (zh) | 2018-06-29 | 2018-06-29 | 立体声信号的编码方法、解码方法、编码装置和解码装置 |
CN201810701919.1 | 2018-06-29 | ||
PCT/CN2019/093404 WO2020001570A1 (zh) | 2018-06-29 | 2019-06-27 | 立体声信号的编码方法、解码方法、编码装置和解码装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022164615A Division JP7477247B2 (ja) | 2018-06-29 | 2022-10-13 | ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021529340A true JP2021529340A (ja) | 2021-10-28 |
JP7160953B2 JP7160953B2 (ja) | 2022-10-25 |
Family
ID=68986259
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020570100A Active JP7160953B2 (ja) | 2018-06-29 | 2019-06-27 | ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 |
JP2022164615A Active JP7477247B2 (ja) | 2018-06-29 | 2022-10-13 | ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 |
JP2024066011A Pending JP2024102106A (ja) | 2018-06-29 | 2024-04-16 | ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022164615A Active JP7477247B2 (ja) | 2018-06-29 | 2022-10-13 | ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 |
JP2024066011A Pending JP2024102106A (ja) | 2018-06-29 | 2024-04-16 | ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 |
Country Status (7)
Country | Link |
---|---|
US (3) | US11462223B2 (ja) |
EP (2) | EP3806093B1 (ja) |
JP (3) | JP7160953B2 (ja) |
CN (2) | CN115831130A (ja) |
BR (1) | BR112020026932A2 (ja) |
ES (1) | ES2963219T3 (ja) |
WO (1) | WO2020001570A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115472170A (zh) * | 2021-06-11 | 2022-12-13 | 华为技术有限公司 | 一种三维音频信号的处理方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03211599A (ja) * | 1989-11-29 | 1991-09-17 | Communications Satellite Corp <Comsat> | 4.8kbpsの情報伝送速度を有する音声符号化/復号化器 |
JP2007529021A (ja) * | 2003-12-19 | 2007-10-18 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 忠実度最適化可変フレーム長符号化 |
CN102243876A (zh) * | 2010-05-12 | 2011-11-16 | 华为技术有限公司 | 预测残差信号的量化编码方法及装置 |
WO2012066727A1 (ja) * | 2010-11-17 | 2012-05-24 | パナソニック株式会社 | ステレオ信号符号化装置、ステレオ信号復号装置、ステレオ信号符号化方法及びステレオ信号復号方法 |
WO2017049398A1 (en) * | 2015-09-25 | 2017-03-30 | Voiceage Corporation | Method and system for encoding a stereo sound signal using coding parameters of a primary channel to encode a secondary channel |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE519985C2 (sv) * | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
US7013269B1 (en) * | 2001-02-13 | 2006-03-14 | Hughes Electronics Corporation | Voicing measure for a speech CODEC system |
US7003454B2 (en) * | 2001-05-16 | 2006-02-21 | Nokia Corporation | Method and system for line spectral frequency vector quantization in speech codec |
KR101435893B1 (ko) * | 2006-09-22 | 2014-09-02 | 삼성전자주식회사 | 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치 |
CN101067931B (zh) * | 2007-05-10 | 2011-04-20 | 芯晟(北京)科技有限公司 | 一种高效可配置的频域参数立体声及多声道编解码方法与系统 |
CN101393743A (zh) * | 2007-09-19 | 2009-03-25 | 中兴通讯股份有限公司 | 一种可配置参数的立体声编码装置及其编码方法 |
JP4945586B2 (ja) * | 2009-02-02 | 2012-06-06 | 株式会社東芝 | 信号帯域拡張装置 |
CN101695150B (zh) * | 2009-10-12 | 2011-11-30 | 清华大学 | 多声道音频编码方法、编码器、解码方法和解码器 |
CN102044250B (zh) * | 2009-10-23 | 2012-06-27 | 华为技术有限公司 | 频带扩展方法及装置 |
-
2018
- 2018-06-29 CN CN202211200345.2A patent/CN115831130A/zh active Pending
- 2018-06-29 CN CN201810701919.1A patent/CN110728986B/zh active Active
-
2019
- 2019-06-27 ES ES19825743T patent/ES2963219T3/es active Active
- 2019-06-27 WO PCT/CN2019/093404 patent/WO2020001570A1/zh unknown
- 2019-06-27 BR BR112020026932-8A patent/BR112020026932A2/pt unknown
- 2019-06-27 EP EP19825743.8A patent/EP3806093B1/en active Active
- 2019-06-27 EP EP23190581.1A patent/EP4297029A3/en active Pending
- 2019-06-27 JP JP2020570100A patent/JP7160953B2/ja active Active
-
2020
- 2020-12-28 US US17/135,539 patent/US11462223B2/en active Active
-
2022
- 2022-08-23 US US17/893,488 patent/US11790923B2/en active Active
- 2022-10-13 JP JP2022164615A patent/JP7477247B2/ja active Active
-
2023
- 2023-07-31 US US18/362,453 patent/US20240021209A1/en active Pending
-
2024
- 2024-04-16 JP JP2024066011A patent/JP2024102106A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03211599A (ja) * | 1989-11-29 | 1991-09-17 | Communications Satellite Corp <Comsat> | 4.8kbpsの情報伝送速度を有する音声符号化/復号化器 |
JP2007529021A (ja) * | 2003-12-19 | 2007-10-18 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 忠実度最適化可変フレーム長符号化 |
CN102243876A (zh) * | 2010-05-12 | 2011-11-16 | 华为技术有限公司 | 预测残差信号的量化编码方法及装置 |
WO2012066727A1 (ja) * | 2010-11-17 | 2012-05-24 | パナソニック株式会社 | ステレオ信号符号化装置、ステレオ信号復号装置、ステレオ信号符号化方法及びステレオ信号復号方法 |
WO2017049398A1 (en) * | 2015-09-25 | 2017-03-30 | Voiceage Corporation | Method and system for encoding a stereo sound signal using coding parameters of a primary channel to encode a secondary channel |
Non-Patent Citations (1)
Title |
---|
CHRISTIAN R. HELMRICH, ET AL.: ""EFFICIENT TRANSFORM CODING OF TWO-CHANNEL AUDIO SIGNALS BY MEANS OF COMPLEX-VALUED STEREO PREDICTIO", 2011 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), JPN6022005335, 12 July 2011 (2011-07-12), pages 497 - 500, ISSN: 0004706589 * |
Also Published As
Publication number | Publication date |
---|---|
EP3806093B1 (en) | 2023-10-04 |
ES2963219T3 (es) | 2024-03-25 |
WO2020001570A1 (zh) | 2020-01-02 |
EP4297029A3 (en) | 2024-02-28 |
JP2022188262A (ja) | 2022-12-20 |
JP2024102106A (ja) | 2024-07-30 |
US20220406316A1 (en) | 2022-12-22 |
EP3806093A1 (en) | 2021-04-14 |
JP7477247B2 (ja) | 2024-05-01 |
EP4297029A2 (en) | 2023-12-27 |
WO2020001570A8 (zh) | 2020-10-22 |
US11790923B2 (en) | 2023-10-17 |
CN110728986B (zh) | 2022-10-18 |
US20240021209A1 (en) | 2024-01-18 |
BR112020026932A2 (pt) | 2021-03-30 |
JP7160953B2 (ja) | 2022-10-25 |
CN115831130A (zh) | 2023-03-21 |
CN110728986A (zh) | 2020-01-24 |
EP3806093A4 (en) | 2021-07-21 |
US20210125620A1 (en) | 2021-04-29 |
US11462223B2 (en) | 2022-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102288111B1 (ko) | 스테레오 신호의 인코딩 및 디코딩 방법과, 인코딩 및 디코딩 장치 | |
US20220139404A1 (en) | Time-domain stereo encoding and decoding method and related product | |
JP2024102106A (ja) | ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 | |
US20240153511A1 (en) | Time-domain stereo encoding and decoding method and related product | |
KR20220018557A (ko) | 스테레오 코딩 방법 및 디바이스, 및 스테레오 디코딩 방법 및 디바이스 | |
US20220335961A1 (en) | Audio signal encoding method and apparatus, and audio signal decoding method and apparatus | |
JP6951554B2 (ja) | ステレオ信号符号化の間に信号を再構成する方法及び機器 | |
KR102592670B1 (ko) | 스테레오 오디오 신호에 대한 인코딩 및 디코딩 방법, 인코딩 디바이스, 및 디코딩 디바이스 | |
US12057130B2 (en) | Audio signal encoding method and apparatus, and audio signal decoding method and apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210120 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220215 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220509 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220913 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221013 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7160953 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |