JP7432011B2 - 線形予測符号化パラメータの符号化方法および符号化装置 - Google Patents
線形予測符号化パラメータの符号化方法および符号化装置 Download PDFInfo
- Publication number
- JP7432011B2 JP7432011B2 JP2022565904A JP2022565904A JP7432011B2 JP 7432011 B2 JP7432011 B2 JP 7432011B2 JP 2022565904 A JP2022565904 A JP 2022565904A JP 2022565904 A JP2022565904 A JP 2022565904A JP 7432011 B2 JP7432011 B2 JP 7432011B2
- Authority
- JP
- Japan
- Prior art keywords
- lpc
- parameter
- parameters
- channels
- lpc parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 163
- 238000013139 quantization Methods 0.000 claims description 141
- 230000005236 sound signal Effects 0.000 claims description 123
- 230000015654 memory Effects 0.000 claims description 44
- 238000004891 communication Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 11
- 108091006146 Channels Proteins 0.000 description 256
- 238000010586 diagram Methods 0.000 description 28
- 230000008569 process Effects 0.000 description 15
- 238000004422 calculation algorithm Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/087—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
LSFres=LSF-LSFreference (2)
LSFref_Q=LSFres_Q+LSFreference_Q (3)
オーディオ信号の少なくとも2つのチャネルの符号化対象LPCパラメータを取得するように構成された取得ユニット801と、
少なくとも2つのチャネルの符号化対象LPCパラメータから参照LPCパラメータを決定するように構成された決定ユニット802であって、少なくとも2つのチャネルの符号化対象LPCパラメータのうちの参照LPCパラメータ以外のLPCパラメータは非参照LPCパラメータであり、
取得ユニット801は、参照LPCパラメータの直接符号化結果を取得するようにさらに構成され、
決定ユニット802は、参照LPCパラメータに基づいて非参照LPCパラメータの残差を決定するようにさらに構成され、
決定ユニット802は、参照LPCパラメータの直接符号化結果および残差に基づいて、非参照LPCパラメータの残差符号化結果を決定するようにさらに構成される、決定ユニット802と、
参照LPCパラメータの直接符号化結果および非参照LPCパラメータの残差符号化結果を符号化ビットストリームに書き込むように構成された処理ユニット803と
を含む。
少なくとも2つのチャネルの符号化対象LPCパラメータ内にあり、直接量子化符号化のために最小ビット数を必要とするLPCパラメータを参照LPCパラメータとして決定する
ように特に構成される。
少なくとも3つのチャネルの符号化対象LPCパラメータ内の各LPCパラメータと別のLPCパラメータとの差の絶対値を取得し、
各LPCパラメータと他のLPCパラメータとの差の絶対値の平均値を取得する
ように特に構成される。
LPCパラメータ内の、差の絶対値の最小平均値を有するLPCパラメータを、参照LPCパラメータとして決定する
ように特に構成される。
オーディオ信号の複数のチャネルの符号化対象LPCパラメータをグループ化することによって複数のパラメータグループを決定し、複数のパラメータグループのうちの1つは少なくとも2つのチャネルの符号化対象LPCパラメータを含み、複数のパラメータグループ内のLPCパラメータには交差がない
ようにさらに構成される。
オーディオ信号の複数のチャネルのチャネル番号に基づいて複数のパラメータグループを決定する、または、
オーディオ信号の複数のチャネルの各々に対応するスピーカの位置に基づいて複数のパラメータグループを決定する
ように特に構成される。
複数のパラメータグループを決定するために、オーディオ信号の複数のチャネルの符号化対象LPCパラメータをクラスタリングする
ように特に構成される。
複数のチャネルの符号化対象LPCパラメータからM個のLPCパラメータを決定し、M個のLPCパラメータ間の差の絶対値の平均値は、複数のチャネルのLPCパラメータのうちの任意のM個のLPCパラメータ間の差の絶対値の平均値以上であり、M個のLPCパラメータは、M個のパラメータグループのクラスタリングセンタであり、Mは予め設定された値であり、
M個のパラメータグループを決定するために、M個のクラスタリングセンタに基づいてクラスタリングを実行し、M個のパラメータグループ内の第1のパラメータグループ内の第1のLPCパラメータと第2のLPCパラメータとの差の絶対値は、第1のLPCパラメータと第3のLPCパラメータとの差の絶対値よりも小さく、第2のLPCパラメータは、第1のパラメータグループのクラスタリングセンタであり、第3のLPCパラメータは、第2のパラメータグループのクラスタリングセンタであり、第1のパラメータグループおよび第2のパラメータグループは、M個のパラメータグループ内の任意の2つの異なるパラメータグループである、
ように特に構成される。
高次元LPCパラメータグループおよび低次元LPCパラメータグループを取得するために、オーディオ信号の少なくとも2つのチャネルの元のLPCパラメータを分割し、高次元LPCパラメータグループは、少なくとも2つのチャネルの符号化対象LPCパラメータを含むか、または低次元LPCパラメータグループは、少なくとも2つのチャネルの符号化対象LPCパラメータを含む
ように特に構成される。
高次元LPCパラメータグループおよび低次元LPCパラメータグループを取得するために、オーディオ信号の複数のチャネルの元のLPCパラメータを分割し、
高次元LPCパラメータグループ内のLPCパラメータをグループ化することによって複数の高次元パラメータグループを取得し、複数の高次元パラメータグループのうちの1つは少なくとも2つのチャネルの符号化対象LPCパラメータを含み、複数の高次元パラメータグループ内のLPCパラメータには交差がないか、または、
低次元LPCパラメータグループ内のLPCパラメータをグループ化することによって複数の低次元パラメータグループを取得し、複数の低次元パラメータグループのうちの1つは少なくとも2つのチャネルの符号化対象LPCパラメータを含み、複数の低次元パラメータグループ内のLPCパラメータには交差がない、
ように特に構成される。
少なくとも2つのチャネル内の2つのチャネルごとのLPCパラメータ間の差の絶対値が予め設定された閾値以下であると決定し、2つのチャネルのLPCパラメータ間の差は、2つのチャネルのLPCパラメータ間の平均二乗誤差の平均値またはコサイン距離の平均値を含む
ようにさらに構成される。
非参照LPCパラメータの直接符号化結果を取得する
ようにさらに構成される。
第1のビット数と第2のビット数との差が第2の予め設定された閾値以上であると決定する
ようにさらに構成される。第1のビット数は、非参照LPCパラメータを直接符号化するために必要なビット数であり、第2のビット数は、参照LPCパラメータの直接符号化結果および残差に基づいて非参照LPCパラメータを符号化するために必要なビット数である。
802 決定ユニット
803 処理ユニット
900 符号化装置
901 プロセッサ
902 メモリ
903 有線またはワイヤレスネットワークインターフェース
Claims (31)
- 線形予測符号化(LPC)パラメータ符号化方法であって、
オーディオ信号の少なくとも2つのチャネルの符号化対象LPCパラメータを取得するステップと、
前記少なくとも2つのチャネルの前記符号化対象LPCパラメータから参照LPCパラメータを決定するステップであって、前記少なくとも2つのチャネルの前記符号化対象LPCパラメータのうちの前記参照LPCパラメータ以外のLPCパラメータは非参照LPCパラメータである、ステップと、
前記参照LPCパラメータの直接符号化結果を取得するステップと、
前記参照LPCパラメータに基づいて前記非参照LPCパラメータの残差を決定するステップと、
前記参照LPCパラメータの前記直接符号化結果および前記残差に基づいて前記非参照LPCパラメータの残差符号化結果を決定するステップと、
前記参照LPCパラメータの前記直接符号化結果および前記非参照LPCパラメータの前記残差符号化結果を符号化ビットストリームに書き込むステップと
を含む、方法。 - 前記少なくとも2つのチャネルの前記符号化対象LPCパラメータから参照LPCパラメータを決定する前記ステップが、
前記少なくとも2つのチャネルの前記符号化対象LPCパラメータ内にあり、前記参照LPCパラメータとして直接量子化符号化のために最小ビット数を必要とするLPCパラメータを決定するステップ
を含む、請求項1に記載の方法。 - 前記少なくとも2つのチャネルの前記符号化対象LPCパラメータが、少なくとも3つのチャネルの符号化対象LPCパラメータを含み、
前記少なくとも2つのチャネルの前記符号化対象LPCパラメータから参照LPCパラメータを決定する前記ステップは、
前記少なくとも3つのチャネルの前記符号化対象LPCパラメータの各LPCパラメータと別のLPCパラメータとの差の絶対値を取得するステップと、
各LPCパラメータと他のLPCパラメータとの差の絶対値の平均値を取得するステップと、
前記LPCパラメータ内の、前記差の前記絶対値の最小平均値を有するLPCパラメータを、前記参照LPCパラメータとして決定するステップと
を含む、請求項1に記載の方法。 - 前記差が、平均二乗誤差またはコサイン距離を含む、
請求項3に記載の方法。 - 前記オーディオ信号が複数のチャネルを含み、
前記方法は、
前記オーディオ信号の前記複数のチャネルの符号化対象LPCパラメータをグループ化することによって複数のパラメータグループを決定するステップであって、前記複数のパラメータグループのうちの1つは前記少なくとも2つのチャネルの前記符号化対象LPCパラメータを含み、前記複数のパラメータグループ内の前記LPCパラメータには交差がない、ステップ
をさらに含む、請求項1から4のいずれか一項に記載の方法。 - 前記オーディオ信号の前記複数のチャネルの符号化対象LPCパラメータをグループ化することによって複数のパラメータグループを決定する前記ステップが、
前記オーディオ信号の前記複数のチャネルのチャネル番号に基づいて前記複数のパラメータグループを決定するステップ、または、
前記オーディオ信号の前記複数のチャネルの各々に対応するスピーカの位置に基づいて前記複数のパラメータグループを決定するステップ
を含む、請求項5に記載の方法。 - 前記オーディオ信号の前記複数のチャネルの符号化対象LPCパラメータをグループ化することによって複数のパラメータグループを決定する前記ステップが、
前記複数のパラメータグループを決定するために、前記オーディオ信号の前記複数のチャネルの前記符号化対象LPCパラメータをクラスタリングするステップ
を含む、請求項5に記載の方法。 - 前記複数のパラメータグループを決定するために、前記オーディオ信号の前記複数のチャネルの前記符号化対象LPCパラメータをクラスタリングする前記ステップが、
前記複数のチャネルの前記符号化対象LPCパラメータからM個のLPCパラメータを決定するステップであって、前記M個のLPCパラメータ間の差の絶対値の平均値は、前記複数のチャネルの前記LPCパラメータのうちの任意のM個のLPCパラメータ間の差の絶対値の平均値以上であり、前記M個のLPCパラメータは、M個のパラメータグループのクラスタリングセンタであり、Mは予め設定された値である、ステップと、
前記M個のパラメータグループを決定するために、前記M個のクラスタリングセンタに基づいてクラスタリングを実行するステップであって、前記M個のパラメータグループ内の第1のパラメータグループ内の第1のLPCパラメータと第2のLPCパラメータとの差の絶対値は、前記第1のLPCパラメータと第3のLPCパラメータとの差の絶対値よりも小さく、前記第2のLPCパラメータは、前記第1のパラメータグループのクラスタリングセンタであり、前記第3のLPCパラメータは、第2のパラメータグループのクラスタリングセンタであり、前記第1のパラメータグループおよび前記第2のパラメータグループは、前記M個のパラメータグループ内の任意の2つの異なるパラメータグループである、ステップと
を含む、請求項7に記載の方法。 - オーディオ信号の少なくとも2つのチャネルの符号化対象LPCパラメータを取得する前記ステップが、
高次元LPCパラメータグループおよび低次元LPCパラメータグループを取得するために、前記オーディオ信号の前記少なくとも2つのチャネルの元のLPCパラメータを分割するステップであって、前記高次元LPCパラメータグループは、前記少なくとも2つのチャネルの前記符号化対象LPCパラメータを含むか、または前記低次元LPCパラメータグループは、前記少なくとも2つのチャネルの前記符号化対象LPCパラメータを含む、ステップ
を含む、請求項1から4のいずれか一項に記載の方法。 - 前記オーディオ信号が複数のチャネルを含み、
オーディオ信号の少なくとも2つのチャネルの符号化対象LPCパラメータを取得する前記ステップは、
高次元LPCパラメータグループおよび低次元LPCパラメータグループを取得するために、前記オーディオ信号の前記複数のチャネルの元のLPCパラメータを分割するステップと、
前記高次元LPCパラメータグループ内のLPCパラメータをグループ化することによって複数の高次元パラメータグループを取得するステップであって、前記複数の高次元パラメータグループのうちの1つは前記少なくとも2つのチャネルの前記符号化対象LPCパラメータを含み、前記複数の高次元パラメータグループ内のLPCパラメータには交差がない、ステップ、または、
前記低次元LPCパラメータグループ内のLPCパラメータをグループ化することによって複数の低次元パラメータグループを取得するステップであって、前記複数の低次元パラメータグループのうちの1つは前記少なくとも2つのチャネルの前記符号化対象LPCパラメータを含み、前記複数の低次元パラメータグループ内のLPCパラメータには交差がない、ステップと
を含む、請求項1から4のいずれか一項に記載の方法。 - 前記少なくとも2つのチャネルの前記符号化対象LPCパラメータから参照LPCパラメータを決定する前記ステップの前に、前記方法は、
前記少なくとも2つのチャネル内の2つのチャネルごとのLPCパラメータ間の差の絶対値が予め設定された閾値以下であると決定するステップであって、前記2つのチャネルの前記LPCパラメータ間の前記差は、前記2つのチャネルの前記LPCパラメータ間の平均二乗誤差の平均値またはコサイン距離の平均値を含む、ステップ
をさらに含む、請求項1から10のいずれか一項に記載の方法。 - 前記参照LPCパラメータの前記直接符号化結果および前記非参照LPCパラメータの前記残差符号化結果を符号化ビットストリームに書き込む前記ステップの前に、前記方法は、
前記非参照LPCパラメータの直接符号化結果を取得するステップと、
第1の歪みと第2の歪みとの差が第1の予め設定された閾値以下であると決定するステップであって、前記第1の歪みは前記非参照LPCパラメータに対する前記非参照LPCパラメータの前記残差符号化結果の歪みであり、前記第2の歪みは前記非参照LPCパラメータに対する前記非参照LPCパラメータの前記直接符号化結果の歪みである、ステップと
をさらに含む、請求項1から11のいずれか一項に記載の方法。 - 前記参照LPCパラメータの前記直接符号化結果および前記非参照LPCパラメータの前記残差符号化結果を符号化ビットストリームに書き込む前記ステップの前に、前記方法は、
第1のビット数と第2のビット数との差が第2の予め設定された閾値以上であると決定するステップであって、前記第1のビット数は前記非参照LPCパラメータを直接符号化するのに必要なビット数であり、前記第2のビット数は前記参照LPCパラメータの前記直接符号化結果および前記残差に基づいて前記非参照LPCパラメータを符号化するのに必要なビット数である、ステップ
をさらに含む、請求項1から12のいずれか一項に記載の方法。 - オーディオ信号の少なくとも2つのチャネルの符号化対象線形予測符号化(LPC)パラメータを取得するように構成された取得ユニットと、
前記少なくとも2つのチャネルの前記符号化対象LPCパラメータから参照LPCパラメータを決定するように構成された決定ユニットであって、前記少なくとも2つのチャネルの前記符号化対象LPCパラメータのうちの前記参照LPCパラメータ以外のLPCパラメータは非参照LPCパラメータであり、
前記取得ユニットは、前記参照LPCパラメータの直接符号化結果を取得するようにさらに構成され、
前記決定ユニットは、前記参照LPCパラメータに基づいて前記非参照LPCパラメータの残差を決定するようにさらに構成され、
前記決定ユニットは、前記参照LPCパラメータの前記直接符号化結果および前記残差に基づいて、前記非参照LPCパラメータの残差符号化結果を決定するようにさらに構成される、決定ユニットと、
前記参照LPCパラメータの前記直接符号化結果および前記非参照LPCパラメータの前記残差符号化結果を符号化ビットストリームに書き込むように構成された処理ユニットと
を備える、符号化装置。 - 前記決定ユニットが、
前記少なくとも2つのチャネルの前記符号化対象LPCパラメータ内にあり、直接量子化符号化のために最小ビット数を必要とするLPCパラメータを前記参照LPCパラメータとして決定する
ように特に構成される、請求項14に記載の装置。 - 前記少なくとも2つのチャネルの前記符号化対象LPCパラメータが、少なくとも3つのチャネルの符号化対象LPCパラメータを含み、
前記取得ユニットは、
前記少なくとも3つのチャネルの前記符号化対象LPCパラメータの各LPCパラメータと別のLPCパラメータとの差の絶対値を取得し、
各LPCパラメータと他のLPCパラメータとの差の絶対値の平均値を取得する
ように特に構成され、
前記決定ユニットは、
前記LPCパラメータ間の前記差の前記絶対値の最小平均値を有するLPCパラメータを前記参照LPCパラメータとして決定する
ように特に構成される、請求項14に記載の装置。 - 前記差が、平均二乗誤差またはコサイン距離を含む、
請求項16に記載の装置。 - 前記オーディオ信号が複数のチャネルを含み、
前記決定ユニットは、
前記オーディオ信号の前記複数のチャネルの符号化対象LPCパラメータをグループ化することによって複数のパラメータグループを決定し、前記複数のパラメータグループのうちの1つは前記少なくとも2つのチャネルの前記符号化対象LPCパラメータを含み、前記複数のパラメータグループ内の前記LPCパラメータには交差がない
ようにさらに構成される、請求項14から17のいずれか一項に記載の装置。 - 前記決定ユニットが、
前記オーディオ信号の前記複数のチャネルのチャネル番号に基づいて前記複数のパラメータグループを決定するか、または、
前記オーディオ信号の前記複数のチャネルの各々に対応するスピーカの位置に基づいて前記複数のパラメータグループを決定する
ように特に構成される、請求項18に記載の装置。 - 前記決定ユニットは、
前記複数のパラメータグループを決定するために、前記オーディオ信号の前記複数のチャネルの前記符号化対象LPCパラメータをクラスタリングする
ように特に構成される、請求項18に記載の装置。 - 前記決定ユニットが、
前記複数のチャネルの前記符号化対象LPCパラメータからM個のLPCパラメータを決定し、前記M個のLPCパラメータ間の差の絶対値の平均値は、前記複数のチャネルの前記LPCパラメータのうちの任意のM個のLPCパラメータ間の差の絶対値の平均値以上であり、前記M個のLPCパラメータは、M個のパラメータグループのクラスタリングセンタであり、Mは予め設定された値であり、
前記M個のパラメータグループを決定するために、前記M個のクラスタリングセンタに基づいてクラスタリングを実行し、前記M個のパラメータグループ内の第1のパラメータグループ内の第1のLPCパラメータと第2のLPCパラメータとの差の絶対値は、前記第1のLPCパラメータと第3のLPCパラメータとの差の絶対値よりも小さく、前記第2のLPCパラメータは、前記第1のパラメータグループのクラスタリングセンタであり、前記第3のLPCパラメータは、第2のパラメータグループのクラスタリングセンタであり、前記第1のパラメータグループおよび前記第2のパラメータグループは、前記M個のパラメータグループ内の任意の2つの異なるパラメータグループである
ように特に構成される、請求項20に記載の装置。 - 前記取得ユニットが、
高次元LPCパラメータグループおよび低次元LPCパラメータグループを取得するために、前記オーディオ信号の前記少なくとも2つのチャネルの元のLPCパラメータを分割し、前記高次元LPCパラメータグループは、前記少なくとも2つのチャネルの前記符号化対象LPCパラメータを含むか、または前記低次元LPCパラメータグループは、前記少なくとも2つのチャネルの前記符号化対象LPCパラメータを含む
ように特に構成される、請求項14から17のいずれか一項に記載の装置。 - 前記オーディオ信号が複数のチャネルを含み、
前記取得ユニットは、
高次元LPCパラメータグループおよび低次元LPCパラメータグループを取得するために、前記オーディオ信号の前記複数のチャネルの元のLPCパラメータを分割し、かつ
前記高次元LPCパラメータグループ内のLPCパラメータをグループ化することによって複数の高次元パラメータグループを取得し、前記複数の高次元パラメータグループのうちの1つは前記少なくとも2つのチャネルの前記符号化対象LPCパラメータを含み、前記複数の高次元パラメータグループ内のLPCパラメータには交差がないか、または
前記低次元LPCパラメータグループ内のLPCパラメータをグループ化することによって複数の低次元パラメータグループを取得し、前記複数の低次元パラメータグループのうちの1つは前記少なくとも2つのチャネルの前記符号化対象LPCパラメータを含み、前記複数の低次元パラメータグループ内のLPCパラメータには交差がない
ように特に構成される、請求項14から17のいずれか一項に記載の装置。 - 前記決定ユニットが、
前記少なくとも2つのチャネル内の2つのチャネルごとのLPCパラメータ間の差の絶対値が予め設定された閾値以下であると決定し、前記2つのチャネルの前記LPCパラメータ間の前記差は、前記2つのチャネルの前記LPCパラメータ間の平均二乗誤差の平均値またはコサイン距離の平均値を含む
ようにさらに構成される、請求項14から23のいずれか一項に記載の装置。 - 前記取得ユニットが、
前記非参照LPCパラメータの直接符号化結果を取得するようにさらに構成され、
前記決定ユニットが、第1の歪みと第2の歪みとの差が第1の予め設定された閾値以下であると決定し、前記第1の歪みは前記非参照LPCパラメータに対する前記非参照LPCパラメータの前記残差符号化結果の歪みであり、前記第2の歪みは前記非参照LPCパラメータに対する前記非参照LPCパラメータの前記直接符号化結果の歪みである、
ようにさらに構成される、請求項14から24のいずれか一項に記載の装置。 - 前記決定ユニットが、
第1のビット数と第2のビット数との差が第2の予め設定された閾値以上であると決定し、前記第1のビット数は前記非参照LPCパラメータを直接符号化するのに必要なビット数であり、前記第2のビット数は前記参照LPCパラメータの前記直接符号化結果および前記残差に基づいて前記非参照LPCパラメータを符号化するのに必要なビット数である
ようにさらに構成される、請求項14から25のいずれか一項に記載の装置。 - プロセッサおよびメモリを備える符号化装置であって、前記プロセッサおよび前記メモリは互いに接続され、前記メモリはコンピュータプログラムを格納するように構成され、前記コンピュータプログラムはプログラム命令を含み、前記プロセッサは、請求項1から13のいずれか一項に記載の方法を実行するために、前記プログラム命令を呼び出すように構成される、符号化装置。
- 命令を含むコンピュータ可読記憶媒体であって、前記命令がコンピュータ上で実行されると、前記コンピュータは、請求項1から13のいずれか一項に記載の方法を実行することが可能になる、コンピュータ可読記憶媒体。
- プロセッサおよび通信インターフェースを備える符号化装置であって、前記プロセッサは、前記通信インターフェースを介してコンピュータプログラムを読み出して格納し、前記コンピュータプログラムはプログラム命令を含み、前記プロセッサは、請求項1から13のいずれか一項に記載の方法を実行するために、前記プログラム命令を呼び出すように構成される、符号化装置。
- プロセッサおよびメモリを備える符号化装置であって、前記プロセッサは、請求項1から13のいずれか一項に記載の方法を実行するように構成され、前記メモリは、前記符号化ビットストリームを格納するように構成される、符号化装置。
- 請求項1から13のいずれか一項に記載の方法をコンピュータに実行させるプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010349207.5 | 2020-04-28 | ||
CN202010349207.5A CN113571073A (zh) | 2020-04-28 | 2020-04-28 | 一种线性预测编码参数的编码方法和编码装置 |
PCT/CN2021/070115 WO2021218229A1 (zh) | 2020-04-28 | 2021-01-04 | 一种线性预测编码参数的编码方法和编码装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023523074A JP2023523074A (ja) | 2023-06-01 |
JP7432011B2 true JP7432011B2 (ja) | 2024-02-15 |
Family
ID=78157996
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022565904A Active JP7432011B2 (ja) | 2020-04-28 | 2021-01-04 | 線形予測符号化パラメータの符号化方法および符号化装置 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20230046850A1 (ja) |
EP (1) | EP4131262A4 (ja) |
JP (1) | JP7432011B2 (ja) |
KR (1) | KR20230002833A (ja) |
CN (1) | CN113571073A (ja) |
BR (1) | BR112022021656A2 (ja) |
TW (1) | TWI773267B (ja) |
WO (1) | WO2021218229A1 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005115267A (ja) | 2003-10-10 | 2005-04-28 | Nippon Telegr & Teleph Corp <Ntt> | 多チャネル符号化方法、復号方法、これらの装置、プログラムおよびその記録媒体 |
WO2008016098A1 (fr) | 2006-08-04 | 2008-02-07 | Panasonic Corporation | dispositif de codage audio stéréo, dispositif de décodage audio stéréo et procédé de ceux-ci |
WO2018189414A1 (en) | 2017-04-10 | 2018-10-18 | Nokia Technologies Oy | Audio coding |
JP2018533056A (ja) | 2015-09-25 | 2018-11-08 | ヴォイスエイジ・コーポレーション | ステレオ音声信号をプライマリチャンネルおよびセカンダリチャンネルに時間領域ダウンミックスするために左チャンネルと右チャンネルとの間の長期相関差を使用する方法およびシステム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
CN101609680B (zh) * | 2009-06-01 | 2012-01-04 | 华为技术有限公司 | 压缩编码和解码的方法、编码器和解码器以及编码装置 |
BR112012007803B1 (pt) * | 2009-10-08 | 2022-03-15 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Decodificador de sinal de áudio multimodal, codificador de sinal de áudio multimodal e métodos usando uma configuração de ruído com base em codificação de previsão linear |
CN101944362B (zh) * | 2010-09-14 | 2012-05-30 | 北京大学 | 一种基于整形小波变换的音频无损压缩编码、解码方法 |
CN102982807B (zh) * | 2012-07-17 | 2016-02-03 | 深圳广晟信源技术有限公司 | 用于对语音信号lpc系数进行多级矢量量化的方法和系统 |
SG11201608787UA (en) * | 2014-03-28 | 2016-12-29 | Samsung Electronics Co Ltd | Method and device for quantization of linear prediction coefficient and method and device for inverse quantization |
US10109284B2 (en) * | 2016-02-12 | 2018-10-23 | Qualcomm Incorporated | Inter-channel encoding and decoding of multiple high-band audio signals |
-
2020
- 2020-04-28 CN CN202010349207.5A patent/CN113571073A/zh active Pending
-
2021
- 2021-01-04 KR KR1020227040246A patent/KR20230002833A/ko unknown
- 2021-01-04 WO PCT/CN2021/070115 patent/WO2021218229A1/zh unknown
- 2021-01-04 EP EP21796913.8A patent/EP4131262A4/en active Pending
- 2021-01-04 JP JP2022565904A patent/JP7432011B2/ja active Active
- 2021-01-04 BR BR112022021656A patent/BR112022021656A2/pt unknown
- 2021-04-22 TW TW110114545A patent/TWI773267B/zh active
-
2022
- 2022-10-27 US US17/974,851 patent/US20230046850A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005115267A (ja) | 2003-10-10 | 2005-04-28 | Nippon Telegr & Teleph Corp <Ntt> | 多チャネル符号化方法、復号方法、これらの装置、プログラムおよびその記録媒体 |
WO2008016098A1 (fr) | 2006-08-04 | 2008-02-07 | Panasonic Corporation | dispositif de codage audio stéréo, dispositif de décodage audio stéréo et procédé de ceux-ci |
JP2018533056A (ja) | 2015-09-25 | 2018-11-08 | ヴォイスエイジ・コーポレーション | ステレオ音声信号をプライマリチャンネルおよびセカンダリチャンネルに時間領域ダウンミックスするために左チャンネルと右チャンネルとの間の長期相関差を使用する方法およびシステム |
WO2018189414A1 (en) | 2017-04-10 | 2018-10-18 | Nokia Technologies Oy | Audio coding |
Also Published As
Publication number | Publication date |
---|---|
KR20230002833A (ko) | 2023-01-05 |
JP2023523074A (ja) | 2023-06-01 |
EP4131262A4 (en) | 2023-08-16 |
WO2021218229A1 (zh) | 2021-11-04 |
BR112022021656A2 (pt) | 2022-12-20 |
EP4131262A1 (en) | 2023-02-08 |
TW202141470A (zh) | 2021-11-01 |
US20230046850A1 (en) | 2023-02-16 |
CN113571073A (zh) | 2021-10-29 |
TWI773267B (zh) | 2022-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI752281B (zh) | 用以使用量化及熵寫碼來編碼或解碼方向性音訊寫碼參數之設備及方法 | |
US9479886B2 (en) | Scalable downmix design with feedback for object-based surround codec | |
KR101168473B1 (ko) | 오디오 인코딩 시스템 | |
EP1908056A1 (en) | Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding | |
KR20220113842A (ko) | 다채널 오디오 신호들의 렌더링을 향상시키기 위한 방법 및 디바이스 | |
KR20210027236A (ko) | 몰입형 오디오 신호를 포함하는 비트스트림을 생성 또는 디코딩하기 위한 방법 및 디바이스 | |
TWI762008B (zh) | 編碼及解碼浸入式語音及音訊服務位元流之方法、系統及非暫時性電腦可讀媒體 | |
JP2016531327A (ja) | 先進的結合のための非一様パラメータ量子化 | |
US8041041B1 (en) | Method and system for providing stereo-channel based multi-channel audio coding | |
JP2022543083A (ja) | Ivasビットストリームの符号化および復号化 | |
CN109300480B (zh) | 立体声信号的编解码方法和编解码装置 | |
JP7432011B2 (ja) | 線形予測符号化パラメータの符号化方法および符号化装置 | |
RU2811412C1 (ru) | СПОСОБ КОДИРОВАНИЯ ПАРАМЕТРОВ КОДИРОВАНИЯ С ЛИНЕЙНЫМ ПРОГНОЗИРОВАНИЕМ и УСТРОЙСТВО КОДИРОВАНИЯ | |
US20240153512A1 (en) | Audio codec with adaptive gain control of downmixed signals | |
CN114822564A (zh) | 音频对象的比特分配方法和装置 | |
US10916255B2 (en) | Apparatuses and methods for encoding and decoding a multichannel audio signal | |
US20240196156A1 (en) | Binarual rendering | |
RU2802677C2 (ru) | Способы и устройства для формирования или декодирования битового потока, содержащего иммерсивные аудиосигналы | |
WO2022012553A1 (zh) | 多声道音频信号的编解码方法和装置 | |
WO2023221590A1 (zh) | 编解码方法及电子设备 | |
WO2024123936A2 (en) | Binarual rendering | |
WO2024097485A1 (en) | Low bitrate scene-based audio coding | |
TW202411984A (zh) | 用於具有元資料之參數化經寫碼獨立串流之不連續傳輸的編碼器及編碼方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221207 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221207 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240202 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7432011 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |