KR102592670B1 - 스테레오 오디오 신호에 대한 인코딩 및 디코딩 방법, 인코딩 디바이스, 및 디코딩 디바이스 - Google Patents

스테레오 오디오 신호에 대한 인코딩 및 디코딩 방법, 인코딩 디바이스, 및 디코딩 디바이스 Download PDF

Info

Publication number
KR102592670B1
KR102592670B1 KR1020217001234A KR20217001234A KR102592670B1 KR 102592670 B1 KR102592670 B1 KR 102592670B1 KR 1020217001234 A KR1020217001234 A KR 1020217001234A KR 20217001234 A KR20217001234 A KR 20217001234A KR 102592670 B1 KR102592670 B1 KR 102592670B1
Authority
KR
South Korea
Prior art keywords
channel signal
lsf
primary channel
parameters
quantized
Prior art date
Application number
KR1020217001234A
Other languages
English (en)
Other versions
KR20210019546A (ko
Inventor
에얄 쉬로못
조나단 아라스테어 깁스
하이팅 리
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Priority to KR1020237035513A priority Critical patent/KR20230152156A/ko
Publication of KR20210019546A publication Critical patent/KR20210019546A/ko
Application granted granted Critical
Publication of KR102592670B1 publication Critical patent/KR102592670B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 출원은 스테레오 신호 인코딩 방법 및 장치와, 스테레오 신호 디코딩 방법 및 장치를 제공한다. 인코딩 방법은 다음을 포함한다: 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터 및 현재 프레임에서의 2차 채널 신호의 LSF 파라미터에 기초하여 타깃 적응적 확장 인자를 결정하는 단계(S510); 및 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터 및 타깃 적응적 확장 인자를 비트스트림에 기입하는 단계(S530). 이 방법은 2차 채널 신호의 양자화된 LSF 파라미터의 왜곡을 감소시키는 것을 도와서, 비교적 큰 왜곡 편차를 갖는 프레임들의 비율을 감소시키는 것을 돕는다.

Description

스테레오 오디오 신호에 대한 인코딩 및 디코딩 방법, 인코딩 디바이스, 및 디코딩 디바이스
본 출원은 2018년 6월 29일자로 중국 특허청에 출원되고 발명의 명칭이 "STEREO SIGNAL ENCODING METHOD AND APPARATUS, AND STEREO SIGNAL DECODING METHOD AND APPARATUS"인 중국 특허 출원 제201810713020.1호에 대한 우선권을 주장하며, 이는 그 전체가 본 명세서에 참고로 포함된다.
본 출원은 오디오 분야에 관한 것으로, 보다 구체적으로는, 스테레오 신호 인코딩 방법 및 장치, 및 스테레오 신호 디코딩 방법 및 장치에 관한 것이다.
시간 도메인 스테레오 인코딩 방법에서, 인코더 측은 먼저 스테레오 신호에 대해 채널 간(inter-channel) 시간 차이 추정을 수행하고, 추정 결과에 기초하여 시간 정렬을 수행하고, 그 후 시간 정렬된 신호에 대해 시간 도메인 다운믹싱을 수행하고, 마지막으로 다운믹싱 이후에 획득되는 1차 채널 신호 및 2차 채널 신호를 개별적으로 인코딩하여, 인코딩된 비트스트림을 획득한다.
1차 채널 신호 및 2차 채널 신호를 인코딩하는 것은: 1차 채널 신호의 선형 예측 계수(linear prediction coefficient, LPC) 및 2차 채널 신호의 LPC를 결정하고, 1차 채널 신호의 LPC 및 2차 채널 신호의 LPC를 각각 1차 채널 신호의 라인 스펙트럼 주파수(line spectral frequency, LSF) 파라미터 및 2차 채널 신호의 LSF 파라미터로 변환하고, 그 후 1차 채널 신호의 LSF 파라미터 및 2차 채널 신호의 LSF 파라미터에 대해 양자화 인코딩을 수행하는 것을 포함할 수 있다.
1차 채널 신호의 LSF 파라미터 및 2차 채널 신호의 LSF 파라미터에 대해 양자화 인코딩을 수행하는 프로세스는 다음을 포함할 수 있다: 1차 채널 신호의 LSF 파라미터를 양자화하여 1차 채널 신호의 양자화된 LSF 파라미터를 획득하는 것; 및 1차 채널 신호의 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 거리에 기초하여 재사용 결정을 수행하고, 1차 채널 신호의 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 거리가 임계값보다 작거나 같은 경우, 2차 채널 신호의 LSF 파라미터가 재사용 조건을 충족시키는 것으로 결정하는 것, 즉, 2차 채널 신호의 LSF 파라미터에 대해 양자화 인코딩이 수행될 필요가 없지만, 결정 결과는 비트스트림에 기입되는 것. 그에 대응하여, 디코더 측은 결정 결과에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터를 2차 채널 신호의 양자화된 LSF 파라미터로서 직접 사용할 수 있다.
이 프로세스에서, 디코더 측은 1차 채널 신호의 양자화된 LSF 파라미터를 2차 채널 신호의 양자화된 LSF 파라미터로서 직접 사용한다. 이것은 2차 채널 신호의 양자화된 LSF 파라미터의 비교적 심각한 왜곡을 야기한다. 결과적으로, 비교적 큰 왜곡 편차를 갖는 프레임들의 비율이 비교적 높고, 디코딩을 통해 획득되는 스테레오 신호의 품질이 감소된다.
본 출원은, 비교적 큰 왜곡 편차를 갖는 프레임들의 비율을 감소시키고 디코딩을 통해 획득된 스테레오 신호의 품질을 개선하기 위해, 1차 채널 신호의 LSF 파라미터 및 2차 채널 신호의 LSF 파라미터가 재사용 조건을 충족시킬 때 2차 채널 신호의 양자화된 LSF 파라미터의 왜곡을 감소시키는 것을 돕는, 스테레오 신호 인코딩 방법 및 장치, 및 스테레오 신호 디코딩 방법 및 장치를 제공한다.
제1 양태에 따르면, 스테레오 신호 인코딩 방법이 제공된다. 인코딩 방법은 다음을 포함한다: 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터 및 현재 프레임에서의 2차 채널 신호의 LSF 파라미터에 기초하여 타깃 적응적 확장 인자를 결정하는 단계; 및 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터 및 타깃 적응적 확장 인자를 비트스트림에 기입하는 단계.
이 방법에서, 타깃 적응적 확장 인자는 먼저 1차 채널 신호의 양자화된 LSF 파라미터 및 2차 채널 신호의 LSF 파라미터에 기초하여 결정되고, 1차 채널 신호의 양자화된 LSF 파라미터 및 타깃 적응적 확장 인자는 비트스트림에 기입되고 그 후 디코더 측으로 송신되어, 디코더 측이 타깃 적응적 확장 인자에 기초하여 2차 채널 신호의 양자화된 LSF 파라미터를 결정할 수 있게 한다. 1차 채널 신호의 양자화된 LSF 파라미터를 2차 채널 신호의 양자화된 LSF 파라미터로서 직접 사용하는 방법과 비교하여, 이 방법은 2차 채널 신호의 양자화된 LSF 파라미터의 왜곡을 감소시키는 것을 도와서, 비교적 큰 왜곡 편차를 갖는 프레임들의 비율을 감소시킨다.
제1 양태와 관련하여, 제1 가능한 구현에서, 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터 및 현재 프레임에서의 2차 채널 신호의 LSF 파라미터에 기초하여 타깃 적응적 확장 인자를 결정하는 것은 다음을 포함한다: 1차 채널 신호의 양자화된 LSF 파라미터 및 2차 채널 신호의 LSF 파라미터에 기초하여 적응적 확장 인자를 계산하는 것- 1차 채널 신호의 양자화된 LSF 파라미터, 2차 채널 신호의 LSF 파라미터, 및 적응적 확장 인자
Figure 112021004950926-pct00001
는 다음의 관계를 만족시키고:
Figure 112021004950926-pct00002
, 여기서
Figure 112021004950926-pct00003
는 2차 채널 신호의 LSF 파라미터의 벡터이고,
Figure 112021004950926-pct00004
는 1차 채널 신호의 양자화된 LSF 파라미터의 벡터이고,
Figure 112021004950926-pct00005
는 2차 채널 신호의 LSF 파라미터의 평균 벡터이고, i는 벡터 인덱스이고,
Figure 112021004950926-pct00006
이고, i는 정수이고, M은 선형 예측 차수이고, w는 가중 계수임 -; 및
적응적 확장 인자를 양자화하여 타깃 적응적 확장 인자를 획득하는 것.
이 구현에서, 결정된 적응적 확장 인자는 1차 채널 신호의 스펙트럼-확장된 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리를 최소화하는 적응적 확장 인자 이다. 따라서, 적응적 확장 인자 를 양자화하는 것에 의해 획득되는 타깃 적응적 확장 인자에 기초하여 2차 채널 신호의 양자화된 LSF 파라미터를 결정하는 것은 2차 채널 신호의 양자화된 LSF 파라미터의 왜곡을 더 감소시키는 것을 도와서, 비교적 큰 왜곡 편차를 갖는 프레임들의 비율을 감소시키는 것을 더 돕는다.
제1 양태 또는 전술한 가능한 구현 중 어느 하나와 관련하여, 제2 가능한 구현에서, 인코딩 방법은: 타깃 적응적 확장 인자 및 1차 채널 신호의 양자화된 LSF 파라미터에 기초하여 2차 채널 신호의 양자화된 LSF 파라미터를 결정하는 단계를 추가로 포함한다.
제2 가능한 구현을 참조하여, 제3 가능한 구현에서, 타깃 적응적 확장 인자 및 1차 채널 신호의 양자화된 LSF 파라미터에 기초하여 2차 채널 신호의 양자화된 LSF 파라미터를 결정하는 것은 다음을 포함한다: 타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 풀-투-에버리지(pull-to-average) 처리를 수행하여 1차 채널 신호의 확장된 LSF 파라미터를 획득하는 것- 풀-투-에버리지 처리는 다음의 수학식에 따라 수행되고:
Figure 112021004950926-pct00009
, 여기서
Figure 112021004950926-pct00010
는 1차 채널 신호의 확장된 LSF 파라미터를 나타내고,
Figure 112021004950926-pct00011
는 1차 채널 신호의 양자화된 LSF 파라미터의 벡터를 나타내고,
Figure 112021004950926-pct00012
는 벡터 인덱스를 나타내고,
Figure 112021004950926-pct00013
는 타깃 적응적 확장 인자를 나타내고,
Figure 112021004950926-pct00014
는 2차 채널 신호의 LSF 파라미터의 평균 벡터를 나타내고,
Figure 112021004950926-pct00015
이고, 는 정수이고, M은 선형 예측 파라미터를 나타냄 -; 및
1차 채널 신호의 확장된 LSF 파라미터에 기초하여 2차 채널 신호의 양자화된 LSF 파라미터를 결정하는 것.
이 구현에서, 2차 채널 신호의 양자화된 LSF 파라미터는 1차 채널 신호의 양자화된 LSF 파라미터에 대해 풀-투-에버리지 처리를 수행하는 것에 의해 획득될 수 있다. 이것은 2차 채널 신호의 양자화된 LSF 파라미터의 왜곡을 더 감소시키는 것을 돕는다.
제1 양태와 관련하여, 제4 가능한 구현에서, 타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 스펙트럼 확장을 수행하는 것에 의해 획득되는 양자화된 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리가 가장 짧다.
이러한 구현에서, 타깃 적응적 확장 인자는 1차 채널 신호의 스펙트럼-확장된 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리를 최소화하는 적응적 확장 인자 이다. 따라서, 타깃 적응적 확장 인자 에 기초하여 2차 채널 신호의 양자화된 LSF 파라미터를 결정하는 것은 2차 채널 신호의 양자화된 LSF 파라미터의 왜곡을 더 감소시켜, 비교적 큰 왜곡 편차를 갖는 프레임들의 비율을 감소시키는 것을 더 돕는다.
제1 양태와 관련하여, 제5 가능한 구현에서, 타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 스펙트럼 확장을 수행하는 것에 의해 획득되는 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리는 가장 짧다.
타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 스펙트럼 확장을 수행하는 것에 의해 획득되는 LSF 파라미터는 다음의 단계들에 따라 획득된다:
타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터를 변환하여, 선형 예측 계수를 획득하는 단계;
선형 예측 계수를 수정하여 수정된 선형 예측 계수를 획득하는 단계; 및
수정된 선형 예측 계수를 변환하여 타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 스펙트럼 확장을 수행하는 것에 의해 획득되는 LSF 파라미터를 획득하는 단계.
이 구현에서, 타깃 적응적 확장 인자는 1차 채널 신호의 스펙트럼-확장된 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리를 최소화하는 타깃 적응적 확장 인자 이다. 따라서, 타깃 적응적 확장 인자 에 기초하여 2차 채널 신호의 양자화된 LSF 파라미터를 결정하는 것은 2차 채널 신호의 양자화된 LSF 파라미터의 왜곡을 더 감소시켜, 비교적 큰 왜곡 편차를 갖는 프레임들의 비율을 감소시키는 것을 더 돕는다.
2차 채널 신호의 양자화된 LSF 파라미터는 타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 스펙트럼 확장을 수행하는 것에 의해 획득되는 LSF 파라미터이기 때문에, 복잡도가 감소될 수 있다.
구체적으로, 타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 단일-스테이지 예측이 수행되고, 단일-스테이지 예측의 결과가 2차 채널 신호의 양자화된 LSF 파라미터로서 사용된다.
제1 양태 또는 전술한 가능한 구현들 중 어느 하나와 관련하여, 제6 가능한 구현에서, 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터 및 현재 프레임에서의 2차 채널 신호의 LSF 파라미터에 기초하여 타깃 적응적 확장 인자를 결정하는 것 이전에, 인코딩 방법은: 2차 채널 신호의 LSF 파라미터가 재사용 조건을 충족시킨다고 결정하는 것을 추가로 포함한다.
2차 채널 신호의 LSF 파라미터가 재사용 조건을 충족시키는지는 종래 기술에 따라, 예를 들어, 배경기술에서 설명된 결정 방식으로 결정될 수 있다.
제2 양태에 따르면, 스테레오 신호 디코딩 방법이 제공된다. 디코딩 방법은 다음을 포함한다: 디코딩을 통해 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터를 획득하는 단계; 디코딩을 통해 현재 프레임에서의 스테레오 신호의 타깃 적응적 확장 인자를 획득하는 단계; 및 타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터를 확장하여 1차 채널 신호의 확장된 LSF 파라미터를 획득하는 단계- 1차 채널 신호의 확장된 LSF 파라미터는 현재 프레임에서의 2차 채널 신호의 양자화된 LSF 파라미터이거나, 1차 채널 신호의 확장된 LSF 파라미터는 현재 프레임에서의 2차 채널 신호의 양자화된 LSF 파라미터를 결정하기 위해 사용됨 -.
이 방법에서, 2차 채널 신호의 양자화된 LSF 파라미터는 타깃 적응적 확장 인자에 기초하여 결정된다. 1차 채널 신호의 양자화된 LSF 파라미터를 2차 채널 신호의 양자화된 LSF 파라미터로서 직접 사용하는 방법에서의 것과 비교하여, 1차 채널 신호의 선형 예측 스펙트럼 포락선과 2차 채널 신호의 선형 예측 스펙트럼 포락선 사이의 유사도가 사용된다. 이것은 2차 채널 신호의 양자화된 LSF 파라미터의 왜곡을 감소시키는 것을 도와서, 비교적 큰 왜곡 편차를 갖는 프레임들의 비율을 감소시키는 것을 돕는다.
제2 양태와 관련하여, 제1 가능한 구현에서, 타깃 적응적 확장 인자에 기초하여 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터에 대해 스펙트럼 확장을 수행하여 1차 채널 신호의 확장된 LSF 파라미터를 획득하는 것은: 타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 풀-투-에버리지 처리를 수행하여 1차 채널 신호의 확장된 양자화된 LSF 파라미터를 획득하는 것을 포함하고, 여기서 풀-투-에버리지 처리는 다음의 수학식에 따라 수행된다:
Figure 112021004950926-pct00021
.
본 명세서에서,
Figure 112021004950926-pct00022
는 1차 채널 신호의 확장된 LSF 파라미터를 나타내고,
Figure 112021004950926-pct00023
는 1차 채널 신호의 양자화된 LSF 파라미터의 벡터를 나타내고,
Figure 112021004950926-pct00024
는 벡터 인덱스를 나타내고,
Figure 112021004950926-pct00025
는 타깃 적응적 확장 인자를 나타내고,
Figure 112021004950926-pct00026
는 2차 채널 신호의 LSF 파라미터의 평균 벡터를 나타내고,
Figure 112021004950926-pct00027
이고, 는 정수이고, M은 선형 예측 파라미터이다.
이 구현에서, 2차 채널 신호의 양자화된 LSF 파라미터는 1차 채널 신호의 양자화된 LSF 파라미터에 대해 풀-투-에버리지 처리를 수행하는 것에 의해 획득될 수 있다. 이것은 2차 채널 신호의 양자화된 LSF 파라미터의 왜곡을 더 감소시키는 것을 돕는다.
제2 양태와 관련하여, 제2 가능한 구현에서, 타깃 적응적 확장 인자에 기초하여 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터에 대해 스펙트럼 확장을 수행하여 1차 채널 신호의 확장된 LSF 파라미터를 획득하는 것은 다음을 포함한다: 1차 채널 신호의 양자화된 LSF 파라미터를 변환하여, 선형 예측 계수를 획득하는 것; 타깃 적응적 확장 인자에 기초하여 선형 예측 계수를 수정하여, 수정된 선형 예측 계수를 획득하는 것; 및 수정된 선형 예측 계수를 변환하여 변환된 LSF 파라미터를 획득하고, 변환된 LSF 파라미터를 1차 채널 신호의 확장된 LSF 파라미터로서 사용하는 것.
이 구현에서, 2차 채널 신호의 양자화된 LSF 파라미터는 1차 채널 신호의 양자화된 LSF 파라미터에 대해 선형 예측을 수행하는 것에 의해 획득될 수 있다. 이것은 2차 채널 신호의 양자화된 LSF 파라미터의 왜곡을 더 감소시키는 것을 돕는다.
제2 양태 또는 전술한 가능한 구현들 중 어느 하나와 관련하여, 제3 가능한 구현에서, 2차 채널 신호의 양자화된 LSF 파라미터는 1차 채널 신호의 확장된 LSF 파라미터이다.
이 구현에서, 복잡도가 감소될 수 있다.
제3 양태에 따르면, 스테레오 신호 인코딩 장치가 제공된다. 인코딩 장치는 제1 양태 또는 제1 양태의 가능한 구현들 중 어느 하나에 따른 인코딩 방법을 수행하도록 구성된 모듈들을 포함한다.
제4 양태에 따르면, 스테레오 신호 디코딩 장치가 제공된다. 디코딩 장치는 제2 양태 또는 제2 양태의 가능한 구현들 중 어느 하나에 따른 디코딩 방법을 수행하도록 구성된 모듈들을 포함한다.
제5 양태에 따르면, 스테레오 신호 인코딩 장치가 제공된다. 인코딩 장치는 메모리 및 프로세서를 포함한다. 메모리는 프로그램을 저장하도록 구성된다. 프로세서는 프로그램을 실행하도록 구성된다. 메모리에서의 프로그램을 실행할 때, 프로세서는 제1 양태 또는 제1 양태의 가능한 구현들 중 어느 하나에 따른 인코딩 방법을 구현한다.
제6 양태에 따르면, 스테레오 신호 디코딩 장치가 제공된다. 디코딩 장치는 메모리 및 프로세서를 포함한다. 메모리는 프로그램을 저장하도록 구성된다. 프로세서는 프로그램을 실행하도록 구성된다. 메모리에서의 프로그램을 실행할 때, 프로세서는 제2 양태 또는 제2 양태의 가능한 구현들 중 어느 하나에 따른 디코딩 방법을 구현한다.
제7 양태에 따르면, 컴퓨터 판독가능 저장 매체가 제공된다. 컴퓨터 판독가능 저장 매체는 장치 또는 디바이스에 의해 실행될 프로그램 코드를 저장하고, 프로그램 코드는 제1 양태 또는 제1 양태의 가능한 구현들 중 어느 하나에 따른 인코딩 방법을 구현하기 위해 사용되는 명령어를 포함한다.
제8 양태에 따르면, 컴퓨터 판독가능 저장 매체가 제공된다. 컴퓨터 판독가능 저장 매체는 장치 또는 디바이스에 의해 실행될 프로그램 코드를 저장하고, 프로그램 코드는 제2 양태 또는 제2 양태의 가능한 구현들 중 어느 하나에 따른 디코딩 방법을 구현하기 위해 사용되는 명령어를 포함한다.
제9 양태에 따르면, 칩이 제공된다. 칩은 프로세서 및 통신 인터페이스를 포함한다. 통신 인터페이스는 외부 디바이스와 통신하도록 구성된다. 프로세서는 제1 양태 또는 제1 양태의 가능한 구현들 중 어느 하나에 따른 인코딩 방법을 구현하도록 구성된다.
선택적으로, 칩은 메모리를 추가로 포함할 수 있다. 메모리는 명령어를 저장한다. 프로세서는 메모리에 저장되는 명령어를 실행하도록 구성된다. 명령어가 실행될 때, 프로세서는 제1 양태 또는 제1 양태의 가능한 구현들 중 어느 하나에 따른 인코딩 방법을 구현하도록 구성된다.
선택적으로, 칩은 단말 디바이스 또는 네트워크 디바이스에 통합될 수 있다.
제10 양태에 따르면, 칩이 제공된다. 칩은 프로세서 및 통신 인터페이스를 포함한다. 통신 인터페이스는 외부 디바이스와 통신하도록 구성된다. 프로세서는 제2 양태 또는 제2 양태의 가능한 구현들 중 어느 하나에 따른 디코딩 방법을 구현하도록 구성된다.
선택적으로, 칩은 메모리를 추가로 포함할 수 있다. 메모리는 명령어를 저장한다. 프로세서는 메모리에 저장되는 명령어를 실행하도록 구성된다. 명령어가 실행될 때, 프로세서는 제2 양태 또는 제2 양태의 가능한 구현들 중 어느 하나에 따른 디코딩 방법을 구현하도록 구성된다.
선택적으로, 칩은 단말 디바이스 또는 네트워크 디바이스에 통합될 수 있다.
제11 양태에 따르면, 본 출원의 실시예는 명령어를 포함하는 컴퓨터 프로그램 제품을 제공한다. 컴퓨터 프로그램 제품이 컴퓨터 상에서 실행될 때, 컴퓨터는 제1 양태에 따른 인코딩 방법을 수행할 수 있게 된다.
제12 양태에 따르면, 본 출원의 실시예는 명령어를 포함하는 컴퓨터 프로그램 제품을 제공한다. 컴퓨터 프로그램 제품이 컴퓨터 상에서 실행될 때, 컴퓨터는 제2 양태에 따른 디코딩 방법을 수행할 수 있게 된다.
도 1은 본 출원의 실시예에 따른 시간 도메인에서의 스테레오 인코딩 및 디코딩 시스템의 개략 구조도이다.
도 2는 본 출원의 실시예에 따른 모바일 단말의 개략도이다.
도 3은 본 출원의 실시예에 따른 네트워크 요소의 개략도이다.
도 4는 1차 채널 신호의 LSF 파라미터 및 2차 채널 신호의 LSF 파라미터에 대해 양자화 인코딩을 수행하는 방법의 개략 흐름도이다.
도 5는 본 출원의 실시예에 따른 스테레오 신호 인코딩 방법의 개략 흐름도이다.
도 6은 본 출원의 다른 실시예에 따른 스테레오 신호 인코딩 방법의 개략 흐름도이다.
도 7은 본 출원의 다른 실시예에 따른 스테레오 신호 인코딩 방법의 개략 흐름도이다.
도 8은 본 출원의 다른 실시예에 따른 스테레오 신호 인코딩 방법의 개략 흐름도이다.
도 9는 본 출원의 다른 실시예에 따른 스테레오 신호 인코딩 방법의 개략 흐름도이다.
도 10은 본 출원의 실시예에 따른 스테레오 신호 디코딩 방법의 개략 흐름도이다.
도 11은 본 출원의 실시예에 따른 스테레오 신호 인코딩 장치의 개략 구조도이다.
도 12는 본 출원의 다른 실시예에 따른 스테레오 신호 디코딩 장치의 개략 구조도이다.
도 13은 본 출원의 다른 실시예에 따른 스테레오 신호 인코딩 장치의 개략 구조도이다.
도 14는 본 출원의 다른 실시예에 따른 스테레오 신호 디코딩 장치의 개략 구조도이다.
도 15는 1차 채널 신호 및 2차 채널 신호의 선형 예측 스펙트럼 포락선들의 개략도이다. 그리고
도 16은 본 출원의 다른 실시예에 따른 스테레오 신호 인코딩 방법의 개략 흐름도이다.
이하에서는 첨부 도면들을 참조하여 본 출원에서의 기술적 해결책들을 설명한다.
도 1은 본 출원의 예시적인 실시예에 따른 시간 도메인에서의 스테레오 인코딩 및 디코딩 시스템의 개략 구조도이다. 스테레오 인코딩 및 디코딩 시스템은 인코딩 컴포넌트(110) 및 디코딩 컴포넌트(120)를 포함한다.
본 출원에서의 스테레오 신호는 원래의 스테레오 신호일 수 있거나, 복수의 채널 상의 신호들에 포함된 2개의 신호를 포함하는 스테레오 신호일 수 있거나, 복수의 채널 상의 신호들에 포함된 복수의 신호로부터 공동으로 생성되는 2개의 신호를 포함하는 스테레오 신호일 수 있다는 점이 이해되어야 한다.
인코딩 컴포넌트(110)는 시간 도메인에서 스테레오 신호를 인코딩하도록 구성된다. 선택적으로, 인코딩 컴포넌트(110)는 소프트웨어, 하드웨어, 또는 소프트웨어와 하드웨어의 조합의 형태로 구현될 수 있다. 이러한 것은 본 출원의 실시예들에서 제한되지 않는다.
인코딩 컴포넌트(110)가 시간 도메인에서 스테레오 신호를 인코딩하는 것은 다음의 단계들을 포함할 수 있다.
(1) 획득된 스테레오 신호에 대해 시간 도메인 전처리를 수행하여 시간 도메인 전처리된 좌측 채널 신호 및 시간 도메인 전처리된 우측 채널 신호를 획득함.
스테레오 신호는 수집 컴포넌트에 의해 수집되고 인코딩 컴포넌트(110)에 전송될 수 있다. 선택적으로, 수집 컴포넌트 및 인코딩 컴포넌트(110)는 동일한 디바이스에 배치될 수 있다. 대안적으로, 수집 컴포넌트 및 인코딩 컴포넌트(110)는 상이한 디바이스들에 배치될 수 있다.
시간 도메인 전처리된 좌측 채널 신호 및 시간 도메인 전처리된 우측 채널 신호는 전처리된 스테레오 신호에서의 2개의 채널 상의 신호들이다.
선택적으로, 시간 도메인 전처리는 고역 통과 필터링 처리, 프리엠퍼시스(pre-emphasis) 처리, 샘플 레이트 변환, 및 채널 스위칭 중 적어도 하나를 포함할 수 있다. 이러한 것은 본 출원의 실시예들에서 제한되지 않는다.
(2) 시간 도메인 전처리된 좌측 채널 신호 및 시간 도메인 전처리된 우측 채널 신호에 기초하여 시간 추정을 수행하여, 시간 도메인 전처리된 좌측 채널 신호와 시간 도메인 전처리된 우측 채널 신호 사이의 채널 간 시간 차이를 획득함.
예를 들어, 좌측 채널 신호와 우측 채널 신호 사이의 교차-상관 함수는 시간 도메인 전처리된 좌측 채널 신호 및 시간 도메인 전처리된 우측 채널 신호에 기초하여 계산될 수 있다. 그 후, 교차-상관 함수의 최대 값이 검색되고, 최대 값은 시간 도메인 전처리된 좌측 채널 신호와 시간 도메인 전처리된 우측 채널 신호 사이의 채널 간 시간 차이로서 사용된다.
다른 예를 들면, 좌측 채널 신호와 우측 채널 신호 사이의 교차-상관 함수는 시간 도메인 전처리된 좌측 채널 신호 및 시간 도메인 전처리된 우측 채널 신호에 기초하여 계산될 수 있다. 그 후, 현재 프레임의 이전 L개의 프레임(L은 1보다 크거나 같은 정수임) 각각에서의 좌측 채널 신호와 우측 채널 신호 사이의 교차-상관 함수에 기초하여 현재 프레임에서의 좌측 채널 신호와 우측 채널 신호 사이의 교차-상관 함수에 대해 장시간 평활화가 수행되어, 평활화된 교차-상관 함수를 획득한다. 후속하여, 평활화된 교차-상관 함수의 최대 값이 검색되고, 최대 값에 대응하는 인덱스 값이 현재 프레임에서의 시간 도메인 전처리된 좌측 채널 신호와 시간 도메인 전처리된 우측 채널 신호 사이의 채널 간 시간 차이로서 사용된다.
다른 예를 들면, 현재 프레임의 이전 M개의 프레임(M은 1보다 크거나 같은 정수임)에서의 채널 간 시간 차이들에 기초하여 현재 프레임에서의 추정된 채널 간 시간 차이에 대해 프레임 간(inter-frame) 평활화가 수행될 수 있고, 평활화된 채널 간 시간 차이는 현재 프레임에서의 시간 도메인 전처리된 좌측 채널 신호와 시간 도메인 전처리된 우측 채널 신호 사이의 최종 채널 간 시간 차이로서 사용된다.
전술한 채널 간 시간 차이 추정 방법은 단지 예이고, 본 출원의 실시예들은 전술한 채널 간 시간 차이 추정 방법에 제한되지 않는다는 점이 이해되어야 한다.
(3) 채널 간 시간 차이에 기초하여 시간 도메인 전처리된 좌측 채널 신호 및 시간 도메인 전처리된 우측 채널 신호에 대해 시간 정렬을 수행하여, 시간 정렬된 좌측 채널 신호 및 시간 정렬된 우측 채널 신호를 획득함.
예를 들어, 현재 프레임에서의 좌측 채널 신호 및 우측 채널 신호의 1개 또는 2개의 신호는 현재 프레임에서의 추정된 채널 간 시간 차이 및 이전 프레임에서의 채널 간 시간 차이에 기초하여 압축 또는 풀링될 수 있어, 시간 정렬된 좌측 채널 신호와 시간 정렬된 우측 채널 신호 사이에 채널 간 시간 차이가 존재하지 않게 된다.
(4) 채널 간 시간 차이를 인코딩하여 채널 간 시간 차이의 인코딩 인덱스를 획득함.
(5) 시간 도메인 다운믹싱을 위한 스테레오 파라미터를 계산하고, 시간 도메인 다운믹싱을 위한 스테레오 파라미터를 인코딩하여 시간 도메인 다운믹싱을 위한 스테레오 파라미터의 인코딩 인덱스를 획득함.
시간 도메인 다운믹싱을 위한 스테레오 파라미터는 시간 정렬된 좌측 채널 신호 및 시간 정렬된 우측 채널 신호에 대해 시간 도메인 다운믹싱을 수행하기 위해 사용된다.
(6) 시간 도메인 다운믹싱을 위한 스테레오 파라미터에 기초하여 시간 정렬된 좌측 채널 신호 및 시간 정렬된 우측 채널 신호에 대해 시간 도메인 다운믹싱을 수행하여, 1차 채널 신호 및 2차 채널 신호를 획득함.
1차 채널 신호는 채널들 사이의 관련 정보를 나타내기 위해 사용되고, 또한 다운믹싱된 신호 또는 중앙 채널 신호라고 지칭될 수 있다. 2차 채널 신호는 채널들 사이의 차이 정보를 나타내기 위해 사용되고, 또한 잔차 신호 또는 사이드 채널 신호라고 지칭될 수 있다.
시간 정렬된 좌측 채널 신호 및 시간 정렬된 우측 채널 신호가 시간 도메인에서 정렬될 때, 2차 채널 신호는 가장 약하다. 이 경우, 스테레오 신호는 최상의 효과를 갖는다.
(7) 1차 채널 신호 및 2차 채널 신호를 개별적으로 인코딩하여 1차 채널 신호에 대응하는 제1 모노포닉 인코딩된 비트스트림 및 2차 채널 신호에 대응하는 제2 모노포닉 인코딩된 비트스트림을 획득함.
(8) 채널 간 시간 차이의 인코딩 인덱스, 스테레오 파라미터의 인코딩 인덱스, 제1 모노포닉 인코딩된 비트스트림, 및 제2 모노포닉 인코딩된 비트스트림을 스테레오 인코딩된 비트스트림에 기입함.
디코딩 컴포넌트(120)는 인코딩 컴포넌트(110)에 의해 생성된 스테레오 인코딩된 비트스트림을 디코딩하여 스테레오 신호를 획득하도록 구성된다.
선택적으로, 인코딩 컴포넌트(110)는 유선 또는 무선 방식으로 디코딩 컴포넌트(120)에 접속될 수 있고, 디코딩 컴포넌트(120)는 디코딩 컴포넌트(120)와 인코딩 컴포넌트(110) 사이의 접속을 통해, 인코딩 컴포넌트(110)에 의해 생성된 스테레오 인코딩된 비트스트림을 획득할 수 있다. 대안적으로, 인코딩 컴포넌트(110)는 생성된 스테레오 인코딩된 비트스트림을 메모리에 저장할 수 있고, 디코딩 컴포넌트(120)는 메모리에서의 스테레오 인코딩된 비트스트림을 판독한다.
선택적으로, 디코딩 컴포넌트(120)는 소프트웨어, 하드웨어, 또는 소프트웨어와 하드웨어의 조합의 형태로 구현될 수 있다. 이러한 것은 본 출원의 실시예들에서 제한되지 않는다.
디코딩 컴포넌트(120)가 스테레오 인코딩된 비트스트림을 디코딩하여 스테레오 신호를 획득하는 프로세스는 다음의 단계들을 포함할 수 있다:
(1) 스테레오 인코딩된 비트스트림에서의 제1 모노포닉 인코딩된 비트스트림 및 제2 모노포닉 인코딩된 비트스트림을 디코딩하여 1차 채널 신호 및 2차 채널 신호를 획득함.
(2) 스테레오 인코딩된 비트스트림에 기초하여 시간 도메인 업믹싱을 위한 스테레오 파라미터의 인코딩 인덱스를 획득하고, 1차 채널 신호 및 2차 채널 신호에 대해 시간 도메인 업믹싱을 수행하여 시간 도메인 업믹싱된 좌측 채널 신호 및 시간 도메인 업믹싱된 우측 채널 신호를 획득함.
(3) 스테레오 인코딩된 비트스트림에 기초하여 채널 간 시간 차이의 인코딩 인덱스를 획득하고, 시간 도메인 업믹싱된 좌측 채널 신호 및 시간 도메인 업믹싱된 우측 채널 신호에 대해 시간 조정을 수행하여, 스테레오 신호를 획득함.
선택적으로, 인코딩 컴포넌트(110) 및 디코딩 컴포넌트(120)는 동일한 디바이스에 배치될 수 있거나, 상이한 디바이스들에 배치될 수 있다. 디바이스는 모바일 폰, 태블릿 컴퓨터, 랩톱 휴대용 컴퓨터, 데스크톱 컴퓨터, 블루투스 사운드 박스, 레코딩 펜, 또는 웨어러블 디바이스와 같은, 오디오 신호 처리 기능을 갖는 모바일 단말일 수 있거나, 코어 네트워크 또는 무선 네트워크에서 오디오 신호 처리 능력을 갖는 네트워크 요소일 수 있다. 이러한 것은 본 출원의 실시예들에서 제한되지 않는다.
예를 들어, 도 2에 도시된 바와 같이, 이하의 예를 사용하여 설명들이 제공된다: 인코딩 컴포넌트(110)는 모바일 단말(130)에 배치된다. 디코딩 컴포넌트(120)는 모바일 단말(140)에 배치된다. 모바일 단말(130) 및 모바일 단말(140)은 오디오 신호 처리 능력을 갖는 서로 독립적인 전자 디바이스들이다. 예를 들어, 모바일 단말(130) 및 모바일 단말(140) 각각은 모바일 폰, 웨어러블 디바이스, 가상 현실(virtual reality, VR) 디바이스, 증강 현실(augmented reality, AR) 디바이스 등일 수 있다. 또한, 모바일 단말(130)은 무선 또는 유선 네트워크를 통해 모바일 단말(140)에 접속된다.
선택적으로, 모바일 단말(130)은 수집 컴포넌트(131), 인코딩 컴포넌트(110), 및 채널 인코딩 컴포넌트(132)를 포함할 수 있다. 수집 컴포넌트(131)는 인코딩 컴포넌트(110)에 접속되고, 인코딩 컴포넌트(110)는 인코딩 컴포넌트(132)에 접속된다.
선택적으로, 모바일 단말(140)은, 오디오 재생 컴포넌트(141), 디코딩 컴포넌트(120), 및 채널 디코딩 컴포넌트(142)를 포함할 수 있다. 오디오 재생 컴포넌트(141)는 디코딩 컴포넌트(120)에 접속되고, 디코딩 컴포넌트(120)는 채널 디코딩 컴포넌트(142)에 접속된다.
수집 컴포넌트(131)를 사용하여 스테레오 신호를 수집한 후, 모바일 단말(130)은 인코딩 컴포넌트(110)를 사용하여 스테레오 신호를 인코딩하여, 스테레오 인코딩된 비트스트림을 획득한다. 그 후, 모바일 단말(130)은 채널 인코딩 컴포넌트(132)를 사용하는 것에 의해 스테레오 인코딩된 비트스트림을 인코딩하여 송신 신호를 획득한다.
모바일 단말(130)은 무선 또는 유선 네트워크를 통해 송신 신호를 모바일 단말(140)로 전송한다.
송신 신호를 수신한 후, 모바일 단말(140)은 채널 디코딩 컴포넌트(142)를 사용하는 것에 의해 송신 신호를 디코딩하여 스테레오 인코딩된 비트스트림을 획득하고, 디코딩 컴포넌트(120)를 사용하는 것에 의해 스테레오 인코딩된 비트스트림을 디코딩하여 스테레오 신호를 획득하고, 오디오 재생 컴포넌트(141)를 사용하는 것에 의해 스테레오 신호를 재생한다.
예를 들어, 도 3에 도시된 바와 같이, 인코딩 컴포넌트(110) 및 디코딩 컴포넌트(120)가 코어 네트워크 또는 무선 네트워크에서 오디오 신호 처리 능력을 갖는 동일한 네트워크 요소(150)에 배치되는 예가 본 출원의 이 실시예에서 설명을 위해 사용된다.
선택적으로, 네트워크 요소(150)는 채널 디코딩 컴포넌트(151), 디코딩 컴포넌트(120), 인코딩 컴포넌트(110) 및 채널 인코딩 컴포넌트(152)를 포함한다. 채널 디코딩 컴포넌트(151)는 디코딩 컴포넌트(120)에 접속되고, 디코딩 컴포넌트(120)는 인코딩 컴포넌트(110)에 접속되고, 인코딩 컴포넌트(110)는 채널 인코딩 컴포넌트(152)에 접속된다.
다른 디바이스에 의해 전송된 송신 신호를 수신한 후, 채널 디코딩 컴포넌트(151)는 송신 신호를 디코딩하여 제1 스테레오 인코딩된 비트스트림을 획득한다. 디코딩 컴포넌트(120)는 스테레오 인코딩된 비트스트림을 디코딩하여 스테레오 신호를 획득한다. 인코딩 컴포넌트(110)는 스테레오 신호를 인코딩하여 제2 스테레오 인코딩된 비트스트림을 획득한다. 채널 인코딩 컴포넌트(152)는 제2 스테레오 인코딩된 비트스트림을 인코딩하여 송신 신호를 획득한다.
다른 디바이스는 오디오 신호 처리 능력을 갖는 모바일 단말일 수 있거나, 오디오 신호 처리 능력을 갖는 다른 네트워크 요소일 수 있다. 이러한 것은 본 출원의 실시예들에서 제한되지 않는다.
선택적으로, 네트워크 요소에서의 인코딩 컴포넌트(110) 및 디코딩 컴포넌트(120)는 모바일 단말에 의해 전송된 스테레오 인코딩된 비트스트림을 트랜스코딩(transcode)할 수 있다.
선택적으로, 본 출원의 실시예들에서, 인코딩 컴포넌트(110)가 설치되는 디바이스는 오디오 인코딩 디바이스라고 지칭될 수 있다. 실제 구현 동안, 오디오 인코딩 디바이스는 또한 오디오 디코딩 기능을 가질 수 있다. 이러한 것은 본 출원의 실시예들에서 제한되지 않는다.
선택적으로, 본 출원의 실시예들에서, 스테레오 신호만이 설명을 위한 예로서 사용된다. 본 출원에서, 오디오 인코딩 디바이스는 멀티-채널 신호를 추가로 처리할 수 있고, 멀티-채널 신호는 적어도 2개의 채널 신호를 포함한다.
인코딩 컴포넌트(110)는 대수 코드 여기된 선형 예측(algebraic code excited linear prediction, ACELP) 인코딩 방법을 사용하는 것에 의해 1차 채널 신호 및 2차 채널 신호를 인코딩할 수 있다.
ACELP 인코딩 방법은 보통 다음을 포함한다: 1차 채널 신호의 LPC 계수 및 2차 채널 신호의 LPC 계수를 결정하고, 1차 채널 신호의 LPC 계수 및 2차 채널 신호의 LPC 계수 각각을 LSF 파라미터로 변환하고, 1차 채널 신호의 LSF 파라미터 및 2차 채널 신호의 LSF 파라미터에 대해 양자화 인코딩을 수행하는 단계; 적응적 코드 여기를 검색하여 피치 기간 및 적응적 코드북 이득을 결정하고, 피치 기간 및 적응적 코드북 이득에 대해 양자화 인코딩을 개별적으로 수행하는 단계; 대수 코드 여기를 검색하여 대수 코드 여기의 이득 및 펄스 인덱스를 결정하고, 대수 코드 여기의 이득 및 펄스 인덱스에 대해 양자화 인코딩을 개별적으로 수행하는 단계.
도 4는 인코딩 컴포넌트(110)가 1차 채널 신호의 LSF 파라미터 및 2차 채널 신호의 LSF 파라미터에 대해 양자화 인코딩을 수행하는 예시적인 방법을 도시한다.
S410: 1차 채널 신호에 기초하여 1차 채널 신호의 LSF 파라미터를 결정한다.
S420: 2차 채널 신호에 기초하여 2차 채널 신호의 LSF 파라미터를 결정한다.
단계 S410과 단계 S420 사이에는 실행 순서가 없다.
S430: 1차 채널 신호의 LSF 파라미터 및 2차 채널 신호의 LSF 파라미터에 기초하여, 2차 채널 신호의 LSF 파라미터가 재사용 결정 조건을 충족시키는지를 결정한다. 재사용 결정 조건은 줄여서 재사용 조건이라고도 지칭될 수 있다.
2차 채널 신호의 LSF 파라미터가 재사용 결정 조건을 충족시키지 않는 경우, 단계 S440이 수행된다. 2차 채널 신호의 LSF 파라미터가 재사용 결정 조건을 충족시키는 경우, 단계 S450이 수행된다.
재사용은 1차 채널 신호의 양자화된 LSF 파라미터에 기초하여 2차 채널 신호의 양자화된 LSF 파라미터가 획득될 수 있다는 것을 의미한다. 예를 들어, 1차 채널 신호의 양자화된 LSF 파라미터는 2차 채널 신호의 양자화된 LSF 파라미터로서 사용된다. 즉, 1차 채널 신호의 양자화된 LSF 파라미터는 2차 채널 신호의 양자화된 LSF 파라미터로서 재사용된다.
2차 채널 신호의 LSF 파라미터가 재사용 결정 조건을 충족시키는지를 결정하는 것은 2차 채널 신호의 LSF 파라미터에 대한 재사용 결정을 수행하는 것으로 지칭될 수 있다.
예를 들어, 재사용 결정 조건이 1차 채널 신호의 원래의 LSF 파라미터와 2차 채널 신호의 원래의 LSF 파라미터 사이의 거리가 미리 설정된 임계값보다 작거나 같은 것일 때, 1차 채널 신호의 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 거리가 미리 설정된 임계값보다 큰 경우, 2차 채널 신호의 LSF 파라미터가 재사용 결정 조건을 충족시키지 않는다고 결정되거나; 또는 1차 채널 신호의 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 거리가 미리 설정된 임계값보다 작거나 같은 경우, 2차 채널 신호의 LSF 파라미터가 재사용 결정 조건을 충족시킨다고 결정될 수 있다.
전술한 재사용 결정에서 사용되는 결정 조건은 단지 예일 뿐이고, 이것은 본 출원에서 제한되지 않는다는 점이 이해되어야 한다.
1차 채널 신호의 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 거리는 1차 채널 신호의 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 차이를 나타내기 위해 사용될 수 있다.
1차 채널 신호의 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 거리는 복수의 방식으로 계산될 수 있다.
예를 들어, 1차 채널 신호의 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 거리
Figure 112021004950926-pct00029
는 다음의 수학식에 따라 계산될 수 있다:
Figure 112021004950926-pct00030
.
본 명세서에서,
Figure 112021004950926-pct00031
는 1차 채널 신호의 LSF 파라미터 벡터이고,
Figure 112021004950926-pct00032
는 2차 채널 신호의 LSF 파라미터 벡터이고, i는 벡터 인덱스이고, i = 1, ..., 또는 M이고, M은 선형 예측 차수이고,
Figure 112021004950926-pct00033
는 제i 가중 계수이다.
는 또한 가중된 거리라고 지칭될 수 있다. 전술한 수학식은 단지 1차 채널 신호의 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 거리를 계산하기 위한 예시적인 방법이고, 1차 채널 신호의 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 거리는 대안적으로 다른 방법을 사용하는 것에 의해 계산될 수 있다. 예를 들어, 1차 채널 신호의 LSF 파라미터 및 2차 채널 신호의 LSF 파라미터에 대해 감산이 수행될 수 있다.
2차 채널 신호의 원래의 LSF 파라미터에 대해 재사용 결정을 수행하는 것은 또한 2차 채널 신호의 LSF 파라미터에 대해 양자화 결정을 수행하는 것으로 지칭될 수 있다. 결정 결과가 2차 채널 신호의 LSF 파라미터를 양자화하는 것인 경우, 2차 채널 신호의 원래의 LSF 파라미터에 대해 양자화 인코딩이 수행될 수 있고, 양자화 인코딩 후에 획득되는 인덱스가 비트스트림에 기입되어, 2차 채널 신호의 양자화된 LSF 파라미터를 획득한다.
이 단계에서의 결정 결과는 비트스트림에 기입되어, 이 결정 결과를 디코더 측에 송신할 수 있다.
S440: 2차 채널 신호의 LSF 파라미터를 양자화하여 2차 채널 신호의 양자화된 LSF 파라미터를 획득하고, 1차 채널 신호의 LSF 파라미터를 양자화하여 1차 채널 신호의 양자화된 LSF 파라미터를 획득함.
2차 채널 신호의 LSF 파라미터가 재사용 결정 조건을 충족시키지 않을 때, 2차 채널 신호의 LSF 파라미터를 양자화하여 2차 채널 신호의 양자화된 LSF 파라미터를 획득하는 것은 단지 예일 뿐이라는 것을 이해해야 한다. 물론, 2차 채널 신호의 양자화된 LSF 파라미터는 대안적으로 다른 방법을 사용하는 것에 의해 획득될 수 있다. 이것은 본원의 본 실시예에서 제한되지 않는다.
S450: 1차 채널 신호의 LSF 파라미터를 양자화하여 1차 채널 신호의 양자화된 LSF 파라미터를 획득함.
1차 채널 신호의 양자화된 LSF 파라미터는 2차 채널 신호의 양자화된 LSF 파라미터로서 직접 사용된다. 이것은 인코더 측으로부터 디코더 측으로 송신될 필요가 있는 데이터의 양을 감소시켜, 네트워크 대역폭 점유를 감소시킬 수 있다.
도 5는 본 출원의 실시예에 따른 스테레오 신호 인코딩 방법의 개략 흐름도이다. 재사용 결정 결과가 재사용 결정 조건이 충족되는 것임을 알게 될 때, 인코딩 컴포넌트(110)는 도 5에 도시된 방법을 수행할 수 있다.
S510: 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터 및 현재 프레임에서의 2차 채널 신호의 LSF 파라미터에 기초하여 타깃 적응적 확장 인자를 결정함.
현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터 및 현재 프레임에서의 2차 채널 신호의 LSF 파라미터는 종래 기술에서의 방법들에 따라 획득될 수 있고, 세부사항들은 본 명세서에서 설명되지 않는다.
S530: 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터 및 타깃 적응적 확장 인자를 비트스트림에 기입함.
이 방법에서, 타깃 적응적 확장 인자는 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터에 기초하여 결정되는데, 즉, (도 15에 도시된 바와 같이) 1차 채널 신호의 선형 예측 스펙트럼 포락선과 2차 채널 신호의 선형 예측 스펙트럼 포락선 사이의 유사도가 사용될 수 있다. 이러한 방식으로, 인코딩 컴포넌트(110)는 2차 채널 신호의 양자화된 LSF 파라미터를 비트스트림에 기입할 필요가 없을 수 있지만, 타깃 적응적 확장 인자를 비트스트림에 기입할 수 있다. 즉, 디코딩 컴포넌트(120)는 1차 채널 신호의 양자화된 LSF 파라미터 및 타깃 적응적 확장 인자에 기초하여 2차 채널 신호의 양자화된 LSF 파라미터를 획득할 수 있다. 이것은 인코딩 효율을 개선시키는 것을 돕는다.
본 출원의 이 실시예에서, 선택적으로, 도 16에 도시된 바와 같이, S520이 추가로 포함될 수 있다: 타깃 적응적 확장 인자 및 1차 채널 신호의 양자화된 LSF 파라미터에 기초하여 2차 채널 신호의 양자화된 LSF 파라미터를 결정한다.
인코더 측에서 결정되는 2차 채널 신호의 양자화된 LSF 파라미터는 인코더 측에서의 후속 처리를 위해 사용된다는 점에 유의해야 한다. 예를 들어, 2차 채널 신호의 양자화된 LSF 파라미터는 인터 예측을 위해 사용되어, 다른 파라미터 등을 획득할 수 있다.
인코더 측에서, 2차 채널의 양자화된 LSF 파라미터는 타깃 적응적 확장 인자 및 1차 채널 신호의 양자화된 LSF 파라미터에 기초하여 결정되어, 후속 동작에서 2차 채널의 양자화된 LSF 파라미터에 기초하여 획득된 처리 결과가 디코더 측에서의 처리 결과와 일치할 수 있게 된다.
일부 가능한 구현들에서, 도 6에 도시된 바와 같이, S510은 다음의 단계들을 포함할 수 있다: S610: 인트라 예측 방법에 따라 1차 채널 신호의 양자화된 LSF 파라미터에 기초하여 2차 채널 신호의 LSF 파라미터를 예측하여, 적응적 확장 인자를 획득함; 및 S620: 적응적 확장 인자를 양자화하여 타깃 적응적 확장 인자를 획득함.
그에 대응하여, S520은 다음의 단계들을 포함할 수 있다: S630: 타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 풀-투-에버리지 처리를 수행하여 1차 채널 신호의 확장된 LSF 파라미터를 획득함; 및 S640: 1차 채널 신호의 확장된 LSF 파라미터를 2차 채널 신호의 양자화된 LSF 파라미터로서 사용함.
S610에서 1차 채널 신호의 양자화된 LSF 파라미터에 대해 풀-투-에버리지 처리를 수행하는 프로세스에서 사용되는 적응적 확장 인자
Figure 112021004950926-pct00035
는 스펙트럼 확장이 1차 채널 신호의 양자화된 LSF 파라미터에 대해 수행된 후에 획득되는 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 스펙트럼 왜곡이 비교적 작을 수 있게 해야 한다.
또한, 1차 채널 신호의 양자화된 LSF 파라미터에 대해 풀-투-에버리지 처리를 수행하는 프로세스에서 사용되는 적응적 확장 인자 는 1차 채널 신호의 양자화된 LSF 파라미터에 대해 스펙트럼 확장이 수행된 후에 획득되는 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 스펙트럼 왜곡을 최소화할 수 있다.
후속 설명의 용이함을 위해, 1차 채널 신호의 양자화된 LSF 파라미터에 대해 스펙트럼 확장이 수행된 후에 획득되는 LSF 파라미터는 1차 채널 신호의 스펙트럼-확장된 LSF 파라미터라고 지칭될 수 있다.
1차 채널 신호의 스펙트럼-확장된 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 스펙트럼 왜곡은 1차 채널 신호의 스펙트럼-확장된 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리를 계산하는 것에 의해 추정될 수 있다.
1차 채널 신호의 스펙트럼-확장된 양자화된 LSF 파라미터와 2차 채널의 LSF 파라미터 사이의 가중된 거리는 다음의 수학식을 충족시킨다:
Figure 112021004950926-pct00037
.
본 명세서에서,
Figure 112021004950926-pct00038
는 1차 채널 신호의 스펙트럼-확장된 LSF 파라미터 벡터이고,
Figure 112021004950926-pct00039
는 2차 채널 신호의 LSF 파라미터 벡터이고, i는 벡터 인덱스이고, i = 1, ..., 또는 M이고, M은 선형 예측 차수이고,
Figure 112021004950926-pct00040
는 제i 가중 계수이다.
일반적으로, 상이한 선형 예측 차수들은 상이한 인코딩 샘플링 레이트들에 기초하여 설정될 수 있다. 예를 들어, 인코딩 샘플링 레이트가 16KHz일 때, 20차 선형 예측이 수행될 수 있는데, 즉 M=20이다. 인코딩 샘플링 레이트가 12.8KHz일 때, 16차 선형 예측이 수행될 수 있는데, 즉, M=16이다. LSF 파라미터 벡터는 간단히 LSF 파라미터라고도 지칭될 수 있다.
가중 계수 선택은 1차 채널 신호의 스펙트럼-확장된 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 스펙트럼 왜곡을 추정하는 정확도에 큰 영향을 미친다.
가중 계수 는 2차 채널 신호의 LSF 파라미터에 대응하는 선형 예측 필터의 에너지 스펙트럼에 기초한 계산을 통해 획득될 수 있다. 예를 들어, 가중 계수는 다음의 수학식을 충족시킬 수 있다:
Figure 112021004950926-pct00042
.
본 명세서에서,
Figure 112021004950926-pct00043
은 2차 채널 신호의 선형 예측 스펙트럼을 나타내고,
Figure 112021004950926-pct00044
는 2차 채널 신호의 LSF 파라미터 벡터이고, i는 벡터 인덱스이고, i = 1, ..., 또는 M이고, M은 선형 예측 차수이고,
Figure 112021004950926-pct00045
는 벡터의 2-놈(2-norm)의 -p 제곱에 대한 계산을 나타내고, p는 0보다 크고 1보다 작은 소수이다. 일반적으로, p의 값 범위는 [0.1, 0.25]일 수 있다. 예를 들어, p=0.18, p=0.25 등이다.
전술한 수학식이 확장된 후에, 가중 계수는 다음의 수학식을 충족시킨다:
Figure 112021004950926-pct00046
.
본 명세서에서,
Figure 112021004950926-pct00047
는 2차 채널 신호의 제i 선형 예측 계수(i = 1, ..., 또는 M)를 나타내고, M은 선형 예측 차수이고,
Figure 112021004950926-pct00048
는 2차 채널 신호의 제i LSF 파라미터이고, FS는 인코딩 샘플링 레이트이다. 예를 들어, 인코딩 샘플링 레이트는 16KHz이고, 선형 예측 차수 M은 20이다.
물론, 1차 채널 신호의 스펙트럼-확장된 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 스펙트럼 왜곡을 추정하기 위해 사용되는 다른 가중 계수가 대안적으로 사용될 수 있다. 이것은 본원의 본 실시예에서 제한되지 않는다.
스펙트럼-확장된 LSF 파라미터는 다음의 수학식을 충족시킨다고 가정된다.
Figure 112021004950926-pct00049
.
본 명세서에서,
Figure 112021004950926-pct00050
는 1차 채널 신호의 스펙트럼-확장된 LSF 파라미터 벡터이고,
Figure 112021004950926-pct00051
는 적응적 확장 인자이고,
Figure 112021004950926-pct00052
는 1차 채널 신호의 양자화된 LSF 파라미터 벡터이고,
Figure 112021004950926-pct00053
는 2차 채널 신호의 LSF 파라미터의 평균 벡터이고, i는 벡터 인덱스이고, i = 1, ..., 또는 M이고, M은 선형 예측 차수이다.
이 경우에, 적응적 확장 인자
Figure 112021004950926-pct00054
는 1차 채널 신호의 스펙트럼-확장된 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리를 최소화하고 다음의 수학식을 충족시킨다:
Figure 112021004950926-pct00055
.
본 명세서에서,
Figure 112021004950926-pct00056
는 2차 채널 신호의 LSF 파라미터 벡터이고,
Figure 112021004950926-pct00057
는 1차 채널 신호의 양자화된 LSF 파라미터 벡터이고,
Figure 112021004950926-pct00058
는 2차 채널 신호의 LSF 파라미터의 평균 벡터이고, i는 벡터 인덱스이고, i = 1, ..., 또는 M이고, M은 선형 예측 차수이다.
즉, 적응적 확장 인자는 수학식에 따른 계산을 통해 획득될 수 있다. 수학식에 따른 계산을 통해 적응적 확장 인자가 획득된 후에, 적응적 확장 인자가 양자화되어 타깃 적응적 확장 인자를 획득할 수 있다.
S620에서 적응적 확장 인자를 양자화하기 위한 방법은 선형 스칼라 양자화일 수 있거나, 비선형 스칼라 양자화일 수 있다.
예를 들어, 적응적 확장 인자는 비교적 작은 수량의 비트, 예를 들어, 1 비트 또는 2 비트를 사용하여 양자화될 수 있다.
예를 들어, 적응적 확장 인자가 1 비트를 사용하여 양자화될 때, 1 비트를 사용하여 적응적 확장 인자를 양자화하는 코드북은
Figure 112021004950926-pct00059
에 의해 표현될 수 있다. 코드북은 사전 훈련을 통해 획득될 수 있다. 예를 들어, 코드북은 {0.95, 0.70}을 포함할 수 있다.
양자화 프로세스는 코드북에서 일대일 검색을 수행하여 코드북에서의 계산된 적응적 확장 인자
Figure 112021004950926-pct00060
로부터 가장 짧은 거리를 갖는 코드워드를 찾고, 코드워드를
Figure 112021004950926-pct00061
로서 나타내는 타깃 적응적 확장 인자로서 사용하는 것이다. 코드북에서의 계산된 적응적 확장 인자 로부터 가장 짧은 거리를 갖는 코드워드에 대응하는 인덱스가 인코딩되고 비트스트림에 기입된다.
S630에서, 1차 채널 신호의 확장된 LSF 파라미터를 획득하기 위해 타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 풀-투-에버리지 처리가 수행될 때, 풀-투-에버리지 처리는 다음의 수학식에 따라 수행된다:
Figure 112021004950926-pct00063
.
본 명세서에서,
Figure 112021004950926-pct00064
는 1차 채널 신호의 스펙트럼-확장된 LSF 파라미터 벡터이고,
Figure 112021004950926-pct00065
는 타깃 적응적 확장 인자이고,
Figure 112021004950926-pct00066
는 1차 채널 신호의 양자화된 LSF 파라미터 벡터이고,
Figure 112021004950926-pct00067
는 2차 채널의 LSF 파라미터의 평균 벡터이고, i는 벡터 인덱스이고, i = 1, ..., 또는 M이고, M은 선형 예측 차수이다.
일부 가능한 구현들에서, 도 7에 도시된 바와 같이, S510은 S710 및 S720을 포함할 수 있고, S520은 S730 및 S740을 포함할 수 있다.
S710: 인트라 예측 방법에 따라 1차 채널 신호의 양자화된 LSF 파라미터에 기초하여 2차 채널 신호의 LSF 파라미터를 예측하여, 적응적 확장 인자를 획득함.
S720: 적응적 확장 인자를 양자화하여 타깃 적응적 확장 인자를 획득함.
S730: 타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 풀-투-에버리지 처리를 수행하여, 1차 채널 신호의 확장된 LSF 파라미터를 획득함.
S710 내지 S730에 대해서는, S610 내지 S630을 참조한다. 세부사항들은 본 명세서에서 다시 설명하지 않는다.
S740: 1차 채널 신호의 확장된 LSF 파라미터에 기초하여 2차 채널 신호의 LSF 파라미터에 대해 2-스테이지 예측을 수행하여, 2차 채널의 양자화된 LSF 파라미터를 획득함.
선택적으로, 1차 채널 신호의 확장된 LSF 파라미터에 기초하여 2차 채널 신호의 LSF 파라미터에 대해 2-스테이지 예측이 수행되어 2차 채널 신호의 LSF 파라미터의 예측된 벡터를 획득할 수 있고, 2차 채널 신호의 LSF 파라미터의 예측된 벡터는 2차 채널 신호의 양자화된 LSF 파라미터로서 사용된다. 2차 채널 신호의 LSF 파라미터의 예측된 벡터는 다음의 수학식을 충족시킨다:
Figure 112021004950926-pct00068
.
본 명세서에서,
Figure 112021004950926-pct00069
는 1차 채널 신호의 스펙트럼-확장된 LSF 파라미터 벡터이고,
Figure 112021004950926-pct00070
는 2차 채널 신호의 LSF 파라미터의 예측된 벡터이고,
Figure 112021004950926-pct00071
는 2차 채널 신호의 LSF 파라미터에 대해 수행되는 2-스테이지 예측을 표현한다.
선택적으로, 이전 프레임에서의 2차 채널 신호의 양자화된 LSF 파라미터 및 현재 프레임에서의 2차 채널 신호의 LSF 파라미터에 기초하여 인터 예측 방법에 따라 2차 채널 신호의 LSF 파라미터에 대해 2-스테이지 예측이 수행되어 2차 채널 신호의 LSF 파라미터의 2-스테이지 예측된 벡터를 획득할 수 있고, 2차 채널 신호의 LSF 파라미터의 예측된 벡터는 2차 채널 신호의 LSF 파라미터의 2-스테이지 예측된 벡터 및 1차 채널 신호의 스펙트럼-확장된 LSF 파라미터에 기초하여 획득되고, 2차 채널 신호의 LSF 파라미터의 예측된 벡터는 2차 채널 신호의 양자화된 LSF 파라미터로서 사용된다. 2차 채널 신호의 LSF 파라미터의 예측된 벡터는 다음의 수학식을 충족시킨다:
Figure 112021004950926-pct00072
.
본 명세서에서, 는 2차 채널 신호의 LSF 파라미터의 예측된 벡터이고,
Figure 112021004950926-pct00074
는 1차 채널 신호의 스펙트럼-확장된 LSF 파라미터 벡터이고, 는 2차 채널 신호의 LSF 파라미터의 2-스테이지 예측된 벡터이고, i는 벡터 인덱스이고, i = 1, ..., 또는 M이고, M은 선형 예측 차수이다. LSF 파라미터 벡터는 간단히 LSF 파라미터라고도 지칭될 수 있다.
일부 가능한 구현들에서, 도 8에 도시된 바와 같이, S510은 다음과 같은 단계들을 포함할 수 있다: S810: 적응적 확장 인자를 양자화하기 위해 사용되는 코드북에서의 코드워드에 기초하여 1차 채널 신호의 스펙트럼-확장된 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리를 계산하여, 각각의 코드워드에 대응하는 가중된 거리를 획득함; 및 S820: 타깃 적응적 확장 인자로서 최단 가중된 거리에 대응하는 코드워드를 사용함.
그에 대응하여, S520은 S830: 최단 가중된 거리에 대응하는 1차 채널 신호의 스펙트럼-확장된 LSF 파라미터를 2차 채널 신호의 양자화된 LSF 파라미터로서 사용함을 포함할 수 있다.
S830은 또한 다음과 같이 이해될 수 있다: 타깃 적응적 확장 인자에 대응하는 1차 채널 신호의 스펙트럼-확장된 LSF 파라미터를 2차 채널 신호의 양자화된 LSF 파라미터로서 사용함.
본 명세서에서 타깃 적응적 확장 인자로서 최단 가중된 거리에 대응하는 코드워드를 사용하는 것은 단지 예라는 것을 이해해야 한다. 예를 들어, 미리 설정된 임계값보다 작거나 같은 가중된 거리에 대응하는 코드워드가 대안적으로 타깃 적응적 확장 인자로서 사용될 수 있다.
적응적 확장 인자에 대해 양자화 인코딩을 수행하기 위해 N_BITS 비트가 사용되는 경우, 적응적 확장 인자를 양자화하기 위해 사용되는 코드북은
Figure 112021004950926-pct00076
개의 코드워드를 포함할 수 있고, 적응적 확장 인자를 양자화하기 위해 사용되는 코드북은
Figure 112021004950926-pct00077
로서 표현될 수 있다. 적응적 확장 인자를 양자화하기 위해 사용되는 코드북에서의 제n 코드워드
Figure 112021004950926-pct00078
에 대응하는 스펙트럼-확장된 LSF 파라미터
Figure 112021004950926-pct00079
이 제n 코드워드에 기초하여 획득될 수 있고, 그 후 제n 코드워드에 대응하는 스펙트럼-확장된 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리
Figure 112021004950926-pct00080
가 계산될 수 있다.
제n 코드워드에 대응하는 스펙트럼-확장된 LSF 파라미터 벡터는 다음의 수학식을 충족시킨다:
Figure 112021004950926-pct00081
.
본 명세서에서,
Figure 112021004950926-pct00082
는 제n 코드워드에 대응하는 스펙트럼-확장된 LSF 파라미터 벡터이고,
Figure 112021004950926-pct00083
은 적응적 확장 인자를 양자화하기 위해 사용되는 코드북에서의 제n 코드워드이고,
Figure 112021004950926-pct00084
는 1차 채널 신호의 양자화된 LSF 파라미터 벡터이고,
Figure 112021004950926-pct00085
는 2차 채널 신호의 LSF 파라미터의 평균 벡터이고, i는 벡터 인덱스이고, i = 1, ..., 또는 M이고, M은 선형 예측 차수이다.
제n 코드워드에 대응하는 스펙트럼-확장된 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리는 다음의 수학식을 충족시킨다:
Figure 112021004950926-pct00086
.
본 명세서에서, 는 제n 코드워드에 대응하는 스펙트럼-확장된 LSF 파라미터 벡터이고,
Figure 112021004950926-pct00088
는 2차 채널 신호의 LSF 파라미터 벡터이고, i는 벡터 인덱스이고, i = 1, ..., 또는 M이고, M은 선형 예측 차수이고,
Figure 112021004950926-pct00089
는 제i 가중 계수이다.
일반적으로, 상이한 선형 예측 차수들은 상이한 인코딩 샘플링 레이트들에 기초하여 설정될 수 있다. 예를 들어, 인코딩 샘플링 레이트가 16KHz일 때, 20차 선형 예측이 수행될 수 있는데, 즉 M=20이다. 인코딩 샘플링 레이트가 12.8KHz일 때, 16차 선형 예측이 수행될 수 있는데, 즉, M=16이다.
이 구현에서의 가중 계수 결정 방법은 제1 가능한 구현에서의 가중 계수 결정 방법과 동일할 수 있고, 세부사항들은 본 명세서에서 다시 설명되지 않는다.
적응적 확장 인자를 양자화하기 위해 사용되는 코드북에서의 모든 코드워드들에 대응하는 스펙트럼-확장된 LSF 파라미터들과 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리들은
Figure 112021004950926-pct00090
로서 표현될 수 있다. 는 최소 값에 대해 검색된다. 최소 값에 대응하는 코드워드 인덱스
Figure 112021004950926-pct00092
는 다음의 수학식을 충족시킨다:
Figure 112021004950926-pct00093
.
최소 값에 대응하는 코드워드는 양자화된 적응적 확장 인자인데, 즉, 이다.
이하에서는, 1 비트가 적응적 확장 인자에 대해 양자화 인코딩을 수행하기 위해 사용되는 예를 사용하여, 1차 채널 신호의 양자화된 LSF 파라미터 및 2차 채널 신호의 LSF 파라미터에 기초하여 타깃 적응적 확장 인자를 결정하는 제2 가능한 구현을 설명한다.
1 비트를 사용하여 적응적 확장 인자를 양자화하는 코드북은
Figure 112021004950926-pct00095
에 의해 표현될 수 있다. 코드북은 사전 트레이닝, 예를 들어, {0.95, 0.70}을 통해 획득될 수 있다.
적응적 확장 인자를 양자화하기 위해 사용되는 코드북에서의 제1 코드워드
Figure 112021004950926-pct00096
에 따르면, 제1 코드워드에 대응하는 스펙트럼-확장된 LSF 파라미터
Figure 112021004950926-pct00097
이 획득될 수 있고, 여기서
Figure 112021004950926-pct00098
이다.
적응적 확장 인자를 양자화하기 위해 사용되는 코드북에서의 제2 코드워드
Figure 112021004950926-pct00099
에 따르면, 제2 코드워드에 대응하는 스펙트럼-확장된 LSF 파라미터
Figure 112021004950926-pct00100
이 획득될 수 있고, 여기서
Figure 112021004950926-pct00101
이다.
본 명세서에서,
Figure 112021004950926-pct00102
은 제1 코드워드에 대응하는 스펙트럼-확장된 LSF 파라미터 벡터이고,
Figure 112021004950926-pct00103
은 적응적 확장 인자를 양자화하기 위해 사용되는 코드북에서의 제1 코드워드이고,
Figure 112021004950926-pct00104
은 제2 코드워드에 대응하는 스펙트럼-확장된 LSF 파라미터 벡터이고,
Figure 112021004950926-pct00105
은 적응적 확장 인자를 양자화하기 위해 사용되는 코드북에서의 제2 코드워드이고,
Figure 112021004950926-pct00106
는 1차 채널 신호의 양자화된 LSF 파라미터 벡터이고,
Figure 112021004950926-pct00107
는 2차 채널 신호의 LSF 파라미터의 평균 벡터이고, i는 벡터 인덱스이고, i = 1, ..., 또는 M이고, M은 선형 예측 차수이다.
그 후, 제1 코드워드에 대응하는 스펙트럼-확장된 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리
Figure 112021004950926-pct00108
가 계산될 수 있고, 는 다음의 수학식을 충족시킨다:
Figure 112021004950926-pct00110
.
제2 코드워드에 대응하는 스펙트럼-확장된 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리
Figure 112021004950926-pct00111
는 다음의 수학식을 충족시킨다:
Figure 112021004950926-pct00112
.
본 명세서에서,
Figure 112021005109901-pct00113
은 제1 코드워드에 대응하는 스펙트럼-확장된 LSF 파라미터 벡터이고,
Figure 112021005109901-pct00114
은 제2 코드워드에 대응하는 스펙트럼-확장된 LSF 파라미터 벡터이고,
Figure 112021005109901-pct00115
는 2차 채널 신호의 LSF 파라미터 벡터이고, i는 벡터 인덱스이고, i = 1, ..., 또는 M이고, M은 선형 예측 차수이고,
Figure 112021005109901-pct00116
는 제i 가중 계수이다.
일반적으로, 상이한 선형 예측 차수들은 상이한 인코딩 샘플링 레이트들에 기초하여 설정될 수 있다. 예를 들어, 인코딩 샘플링 레이트가 16KHz일 때, 20차 선형 예측이 수행될 수 있는데, 즉 M=20이다. 인코딩 샘플링 레이트가 12.8KHz일 때, 16차 선형 예측이 수행될 수 있는데, 즉, M=16이다. LSF 파라미터 벡터는 간단히 LSF 파라미터라고도 지칭될 수 있다.
적응적 확장 인자를 양자화하기 위해 사용되는 코드북에서의 모든 코드워드들에 대응하는 스펙트럼-확장된 LSF 파라미터들과 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리들은
Figure 112021004950926-pct00117
로서 표현될 수 있다. 은 최소 값에 대해 검색된다. 최소 값에 대응하는 코드워드 인덱스
Figure 112021004950926-pct00119
는 다음의 수학식을 충족시킨다:
Figure 112021004950926-pct00120
.
최소 값에 대응하는 코드워드는 타깃 적응적 확장 인자인데, 즉,
Figure 112021004950926-pct00121
이다.
일부 가능한 구현들에서, 도 9에 도시된 바와 같이, S510은 S910 및 S920을 포함할 수 있고, S520은 S930을 포함할 수 있다.
S910: 적응적 확장 인자를 양자화하기 위해 사용되는 코드북에서의 코드워드에 기초하여 1차 채널 신호의 스펙트럼-확장된 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리를 계산하여, 각각의 코드워드에 대응하는 가중된 거리를 획득함.
S920: 최단 가중된 거리에 대응하는 코드워드를 타깃 적응적 확장 인자로서 사용함.
S910 및 S920에 대해서는, S810 및 S820을 참조한다. 세부사항들은 본 명세서에서 다시 설명하지 않는다.
S930: 최단 가중된 거리에 대응하는 1차 채널 신호의 스펙트럼-확장된 LSF 파라미터에 기초하여 2차 채널 신호의 LSF 파라미터에 대해 2-스테이지 예측을 수행하여, 2차 채널 신호의 양자화된 LSF 파라미터를 획득함.
이 단계에 대해서는 S740을 참조한다. 세부사항들은 본 명세서에서 다시 설명하지 않는다.
일부 가능한 구현들에서, S510은: 타깃 적응적 확장 인자로서, 적응적 확장 인자를 양자화하기 위해 사용되는 코드북에서의 제2 코드워드를 결정하는 것을 포함할 수 있고, 여기서 1차 채널 신호의 양자화된 LSF 파라미터는 제2 코드워드에 기초하여 변환되어 선형 예측 계수를 획득하고, 선형 예측 계수는 스펙트럼-확장된 선형 예측 계수를 획득하도록 수정되고, 스펙트럼-확장된 선형 예측 계수가 변환되어 스펙트럼-확장된 LSF 파라미터를 획득하고, 스펙트럼-확장된 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리는 가장 짧다. S520은: 타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 스펙트럼 확장을 수행하는 것에 의해 획득되는 LSF 파라미터를, 2차 채널 신호의 양자화된 LSF 파라미터로서 사용하는 것을 포함할 수 있다.
적응적 확장 인자를 양자화하기 위해 사용되는 코드북에서의 제2 코드워드는 다음의 몇몇 단계들에 따라 타깃 적응적 확장 인자로서 결정될 수 있다.
단계 1: 1차 채널 신호의 양자화된 LSF 파라미터를 선형 예측 계수로 변환한다.
단계 2: 적응적 확장 인자를 양자화하기 위해 사용되는 코드북에서의 각각의 코드워드에 기초하여 선형 예측 계수를 수정하여, 각각의 코드워드에 대응하는 스펙트럼-확장된 선형 예측 계수를 획득한다.
적응적 확장 인자에 대해 양자화 인코딩을 수행하기 위해 N_BITS 비트가 사용되는 경우, 적응적 확장 인자를 양자화하기 위해 사용되는 코드북은
Figure 112021004950926-pct00122
개의 코드워드를 포함할 수 있고, 적응적 확장 인자를 양자화하기 위해 사용되는 코드북은
Figure 112021004950926-pct00123
로서 표현될 수 있다.
1차 채널 신호의 양자화된 LSF 파라미터를 선형 예측 계수로 변환한 후에 획득되는 선형 예측 계수는 로서 표시되고, i = 1, ..., 또는 M이고, M은 선형 예측 차수인 것으로 가정된다.
이러한 경우, 개의 코드워드에서의 제n 코드워드에 대응하는 수정된 선형 예측자의 전달 함수는 다음의 수학식을 충족시킨다:
Figure 112021004950926-pct00126
, 여기서
Figure 112021004950926-pct00127
이다.
본 명세서에서,
Figure 112021004950926-pct00128
는 1차 채널 신호의 양자화된 LSF 파라미터를 선형 예측 계수로 변환한 후에 획득되는 선형 예측 계수이고,
Figure 112021004950926-pct00129
은 적응적 확장 인자를 양자화하기 위해 사용되는 코드북에서의 제n 코드워드이고, M은 선형 예측 차수이고,
Figure 112021004950926-pct00130
이다.
이 경우에, 제n 코드워드에 대응하는 스펙트럼-확장된 선형 예측 계수는 다음의 수학식을 충족시킨다:
Figure 112021004950926-pct00131
, 여기서 i = 1, ..., 또는 M이고;
Figure 112021004950926-pct00132
이다.
본 명세서에서,
Figure 112021004950926-pct00133
는 1차 채널 신호의 양자화된 라인 스펙트럼 주파수 파라미터를 선형 예측 계수로 변환한 후에 획득되는 선형 예측 계수이고,
Figure 112021004950926-pct00134
는 제n 코드워드에 대응하는 스펙트럼-확장된 선형 예측 계수이고,
Figure 112021004950926-pct00135
은 적응적 확장 인자를 양자화하기 위해 사용되는 코드북에서의 제n 코드워드이고, M은 선형 예측 차수이고,
Figure 112021004950926-pct00136
이다.
단계 3: 각각의 코드워드에 대응하는 스펙트럼-확장된 선형 예측 계수를 LSF 파라미터로 변환하여, 각각의 코드워드에 대응하는 스펙트럼-확장된 LSF 파라미터를 획득한다.
선형 예측 계수를 LSF 파라미터로 변환하기 위한 방법에 대해서는, 종래 기술을 참조한다. 세부사항들은 본 명세서에서 설명되지 않는다. 제n 코드워드에 대응하는 스펙트럼-확장된 LSF 파라미터는
Figure 112021004950926-pct00137
으로서 표시될 수 있고,
Figure 112021004950926-pct00138
이다.
단계 4: 각각의 코드워드에 대응하는 스펙트럼-확장된 LSF 파라미터와 2차 채널 신호의 라인 스펙트럼 주파수 파라미터 사이의 가중된 거리를 계산하여, 2차 채널 신호의 LSF 파라미터의 인트라 예측된(intra-predicted) 벡터 및 양자화된 적응적 확장 인자를 획득한다.
제n 코드워드에 대응하는 스펙트럼-확장된 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리는 다음의 수학식을 충족시킨다:
Figure 112021004950926-pct00139
.
본 명세서에서,
Figure 112021004950926-pct00140
은 제n 코드워드에 대응하는 스펙트럼-확장된 LSF 파라미터 벡터이고,
Figure 112021004950926-pct00141
는 2차 채널 신호의 LSF 파라미터 벡터이고, i는 벡터 인덱스이고, i = 1, ..., 또는 M이고, M은 선형 예측 차수이고,
Figure 112021004950926-pct00142
는 제i 가중 계수이다.
일반적으로, 상이한 선형 예측 차수들은 상이한 인코딩 샘플링 레이트들에 기초하여 설정될 수 있다. 예를 들어, 인코딩 샘플링 레이트가 16KHz일 때, 20차 선형 예측이 수행될 수 있는데, 즉 M=20이다. 인코딩 샘플링 레이트가 12.8KHz일 때, 16차 선형 예측이 수행될 수 있는데, 즉, M=16이다. LSF 파라미터 벡터는 간단히 LSF 파라미터라고도 지칭될 수 있다.
가중 계수는 다음의 수학식을 충족시킬 수 있다:
Figure 112021004950926-pct00143
.
본 명세서에서,
Figure 112021004950926-pct00144
는 2차 채널 신호의 제i 선형 예측 계수를 나타내고, i = 1, ..., 또는 M이고, M은 선형 예측 차수이고,
Figure 112021004950926-pct00145
는 2차 채널 신호의 제i LSF 파라미터이고, FS는 선형 예측 처리의 샘플링 레이트 또는 인코딩 샘플링 레이트이다. 예를 들어, 선형 예측 처리의 샘플링 레이트는 12.8KHz일 수 있고, 선형 예측 차수 M은 16이다.
적응적 확장 인자를 양자화하기 위해 사용되는 코드북에서의 모든 코드워드들에 대응하는 스펙트럼-확장된 LSF 파라미터들과 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리들은
Figure 112021004950926-pct00146
로서 표현될 수 있다. 적응적 확장 인자를 양자화하기 위해 사용되는 코드북에서의 모든 코드워드들에 대응하는 스펙트럼-확장된 LSF 파라미터들과 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리들이 최소 값에 대해 검색된다. 최소 값에 대응하는 코드워드 인덱스
Figure 112021004950926-pct00147
는 다음의 수학식을 충족시킨다:
Figure 112021004950926-pct00148
.
최소 값에 대응하는 코드워드가 양자화된 적응적 확장 인자로서 사용될 수 있다, 즉:
Figure 112021004950926-pct00149
이다.
코드워드 인덱스
Figure 112021004950926-pct00150
에 대응하는 스펙트럼-확장된 LSF 파라미터는 2차 채널의 LSF 파라미터의 인트라 예측된 벡터로서 사용될 수 있는데, 즉:
Figure 112021004950926-pct00151
이다.
본 명세서에서,
Figure 112021004950926-pct00152
는 2차 채널 신호의 LSF 파라미터의 인트라 예측된 벡터이고,
Figure 112021004950926-pct00153
는 코드워드 인덱스 에 대응하는 스펙트럼-확장된 LSF 파라미터이고, i = 1, ..., 또는 M이고, M은 선형 예측 차수이다.
전술한 단계들에 따라 2차 채널 신호의 LSF 파라미터의 인트라 예측된 벡터가 획득된 후에, 2차 채널 신호의 LSF 파라미터의 인트라 예측된 벡터는 2차 채널 신호의 양자화된 LSF 파라미터로서 사용될 수 있다.
선택적으로, 2차 채널 신호의 양자화된 LSF 파라미터를 획득하기 위해, 2차 채널 신호의 LSF 파라미터에 대해 2-스테이지 예측이 대안적으로 수행될 수 있다. 구체적인 구현에 대해서는, S740을 참조한다. 세부사항들은 본 명세서에서 다시 설명하지 않는다.
S520에서, 선택적으로, 2-스테이지 예측보다 많은 멀티-스테이지 예측이 2차 채널 신호의 LSF 파라미터에 대해 대안적으로 수행될 수 있다는 점이 이해되어야 한다. 종래 기술에서의 임의의 기존의 방법은 2-스테이지 예측보다 많은 예측을 수행하기 위해 사용될 수 있고, 세부사항들은 본 명세서에서 설명되지 않는다.
전술한 내용은, 인코딩 컴포넌트(110)가, 1차 채널 신호의 양자화된 LSF 파라미터 및 2차 채널 신호의 원래의 LSF 파라미터에 기초하여, 인코더 측에서 2차 채널 신호의 양자화된 LSF 파라미터를 결정하기 위해 사용될 적응적 확장 인자를 획득하여, 적응적 확장 인자에 기초하여 인코더 측에 의해 결정되는 2차 채널 신호의 양자화된 LSF 파라미터의 왜곡을 감소시켜, 프레임들의 왜곡 레이트를 감소시키는 방법을 설명한다.
적응적 확장 인자를 결정한 후에, 인코딩 컴포넌트(110)는 적응적 확장 인자에 대해 양자화 인코딩을 수행하고, 적응적 확장 인자를 비트스트림에 기입하여, 적응적 확장 인자를 디코더 측으로 송신할 수 있어, 디코더 측이 적응적 확장 인자 및 1차 채널 신호의 양자화된 LSF 파라미터에 기초하여 2차 채널 신호의 양자화된 LSF 파라미터를 결정할 수 있다는 것을 이해해야 한다. 이것은 디코더 측에 의해 획득되는 2차 채널 신호의 양자화된 LSF 파라미터의 왜곡을 감소시킬 수 있어, 프레임들의 왜곡 레이트를 감소시킨다.
일반적으로, 1차 채널 신호를 디코딩하기 위해 디코딩 컴포넌트(120)에 의해 사용되는 디코딩 방법은 1차 채널 신호를 인코딩하기 위해 인코딩 컴포넌트(110)에 의해 사용되는 방법에 대응한다. 유사하게, 2차 채널 신호를 디코딩하기 위해 디코딩 컴포넌트(120)에 의해 사용되는 디코딩 방법은 2차 채널 신호를 인코딩하기 위해 인코딩 컴포넌트(110)에 의해 사용되는 방법에 대응한다.
예를 들어, 인코딩 컴포넌트(110)가 ACELP 인코딩 방법을 사용하는 경우, 디코딩 컴포넌트(120)는 그에 대응하여 ACELP 디코딩 방법을 사용할 필요가 있다. ACELP 디코딩 방법을 사용하여 1차 채널 신호를 디코딩하는 것은 1차 채널 신호의 LSF 파라미터를 디코딩하는 것을 포함한다. 유사하게, ACELP 디코딩 방법을 사용하여 2차 채널 신호를 디코딩하는 것은 2차 채널 신호의 LSF 파라미터를 디코딩하는 것을 포함한다.
1차 채널 신호의 LSF 파라미터 및 2차 채널 신호의 LSF 파라미터를 디코딩하는 프로세스는 다음의 단계들을 포함할 수 있다:
1차 채널 신호의 LSF 파라미터를 디코딩하여 1차 채널 신호의 양자화된 LSF 파라미터를 획득하는 단계;
2차 채널 신호의 LSF 파라미터의 재사용 결정 결과를 디코딩하는 단계; 및
재사용 결정 결과가 재사용 결정 조건이 충족되지 않는 것인 경우, 2차 채널 신호의 LSF 파라미터를 디코딩하여 2차 채널 신호의 양자화된 LSF 파라미터를 획득하는 단계(이것은 단지 예일 뿐임); 또는
재사용 결정 결과가 재사용 결정 조건이 충족되는 것인 경우, 1차 채널 신호의 양자화된 LSF 파라미터를 2차 채널 신호의 양자화된 LSF 파라미터로서 사용하는 단계를 포함한다.
재사용 결정 결과가 재사용 결정 조건이 충족되는 것인 경우, 디코딩 컴포넌트(120)는 1차 채널 신호의 양자화된 LSF 파라미터를 2차 채널 신호의 양자화된 LSF 파라미터로서 직접 사용한다. 이것은 2차 채널 신호의 양자화된 LSF 파라미터의 왜곡을 증가시킴으로써, 프레임들의 왜곡 레이트를 증가시킨다.
2차 채널 신호의 LSF 파라미터의 왜곡이 비교적 심각하고, 결과적으로 프레임들의 왜곡 레이트가 증가한다는 전술한 기술적 문제에 대해, 본 출원은 새로운 디코딩 방법을 제공한다.
도 10은 본 출원의 실시예에 따른 디코딩 방법의 개략 흐름도이다. 재사용 결정 결과가 재사용 조건이 충족되는 것을 알게 될 때, 디코딩 컴포넌트(120)는 도 10에 도시된 디코딩 방법을 수행할 수 있다.
S1010: 디코딩을 통해 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터를 획득한다.
예를 들어, 디코딩 컴포넌트(120)는 수신된 비트스트림을 디코딩하여 적응적 확장 인자의 인코딩 인덱스 beta_index를 획득하고, 적응적 확장 인자의 인코딩 인덱스 beta_index에 기초하여 코드북에서, 인코딩 인덱스 beta_index에 대응하는 코드워드를 찾는다. 코드워드는 타깃 적응적 확장 인자이고,
Figure 112021004950926-pct00155
로서 표시된다. 는 다음의 수학식을 충족시킨다:
Figure 112021004950926-pct00157
.
본 명세서에서,
Figure 112021004950926-pct00158
는 코드북에서의 인코딩 인덱스 beta_index에 대응하는 코드워드이다.
S1020: 디코딩을 통해 현재 프레임에서의 스테레오 신호의 타깃 적응적 확장 인자를 획득한다.
S1030: 타깃 적응적 확장 인자에 기초하여 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터에 대해 스펙트럼 확장을 수행하여, 1차 채널 신호의 확장된 LSF 파라미터를 획득한다.
일부 가능한 구현들에서, 1차 채널 신호의 확장된 LSF 파라미터는 다음의 수학식에 따른 계산을 통해 획득될 수 있다:
Figure 112021004950926-pct00159
.
본 명세서에서,
Figure 112021004950926-pct00160
는 1차 채널 신호의 스펙트럼-확장된 LSF 파라미터 벡터이고,
Figure 112021004950926-pct00161
는 양자화된 적응적 확장 인자이고,
Figure 112021004950926-pct00162
는 1차 채널의 양자화된 LSF 파라미터 벡터이고,
Figure 112021004950926-pct00163
는 2차 채널의 LSF 파라미터의 평균 벡터이고, i는 벡터 인덱스이고, i = 1, ..., 또는 M이고, M은 선형 예측 차수이다.
일부 다른 가능한 구현들에서, 타깃 적응적 확장 인자에 기초하여 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터에 대해 스펙트럼 확장을 수행하여 1차 채널 신호의 확장된 LSF 파라미터를 획득하는 것은 다음을 포함할 수 있다: 1차 채널 신호의 양자화된 LSF 파라미터를 변환하여, 선형 예측 계수를 획득하는 것; 타깃 적응적 확장 인자에 기초하여 선형 예측 계수를 수정하여, 수정된 선형 예측 계수를 획득하는 것; 및 수정된 선형 예측 계수를 변환하여 변환된 LSF 파라미터를 획득하고, 변환된 LSF 파라미터를 1차 채널 신호의 확장된 LSF 파라미터로서 사용하는 것.
일부 가능한 구현들에서, 1차 채널 신호의 확장된 LSF 파라미터는 현재 프레임에서의 2차 채널 신호의 양자화된 LSF 파라미터이다. 즉, 1차 채널 신호의 확장된 LSF 파라미터는 2차 채널 신호의 양자화된 LSF 파라미터로서 직접 사용될 수 있다.
일부 다른 가능한 구현들에서, 1차 채널 신호의 확장된 LSF 파라미터는 현재 프레임에서의 2차 채널 신호의 양자화된 LSF 파라미터를 결정하기 위해 사용된다. 예를 들어, 2차 채널 신호의 LSF 파라미터에 대해 2-스테이지 예측 또는 멀티-스테이지 예측이 수행되어, 2차 채널 신호의 양자화된 LSF 파라미터를 획득할 수 있다. 예를 들어, 1차 채널 신호의 확장된 LSF 파라미터는 종래 기술에서 예측 방식으로 다시 예측되어, 2차 채널 신호의 양자화된 LSF 파라미터를 획득할 수 있다. 이 단계에 대해서는, 인코딩 컴포넌트(110)에서의 구현을 참조한다. 세부사항들은 본 명세서에서 다시 설명하지 않는다.
본 출원의 이 실시예에서, 2차 채널 신호의 LSF 파라미터는 1차 채널 신호들이 유사한 스펙트럼 구조들 및 공진 피크 위치들을 갖는다는 특징을 사용하는 것에 의해 1차 채널 신호의 양자화된 LSF 파라미터에 기초하여 결정된다. 1차 채널 신호의 양자화된 LSF 파라미터를 2차 채널 신호의 양자화된 LSF 파라미터로서 직접 사용하는 방식과 비교하여, 이것은 1차 채널 신호의 양자화된 LSF 파라미터를 충분히 사용하여 인코딩 효율을 개선할 수 있고, 2차 채널 신호의 LSF 파라미터의 특징을 보유하여 2차 채널 신호의 LSF 파라미터의 왜곡을 감소시키는 것을 도울 수 있다.
도 11은 본 출원의 실시예에 따른 인코딩 장치(1100)의 개략 블록도이다. 인코딩 장치(1100)는 단지 예라는 것을 이해해야 한다.
일부 구현들에서, 결정 모듈(1110) 및 인코딩 모듈(1120)은 모바일 단말(130) 또는 네트워크 요소(150)의 인코딩 컴포넌트(110)에 포함될 수 있다.
결정 모듈(1110)은 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터 및 현재 프레임에서의 2차 채널 신호의 LSF 파라미터에 기초하여 타깃 적응적 확장 인자를 결정하도록 구성된다.
인코딩 모듈(1120)은 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터 및 타깃 적응적 확장 인자를 비트스트림에 기입하도록 구성된다.
선택적으로, 결정 모듈은 구체적으로:
1차 채널 신호의 양자화된 LSF 파라미터 및 2차 채널 신호의 LSF 파라미터에 기초하여 적응적 확장 인자를 계산하고- 여기서 1차 채널 신호의 양자화된 LSF 파라미터, 2차 채널 신호의 LSF 파라미터, 및 적응적 확장 인자는 다음의 관계를 충족시키고:
Figure 112021004950926-pct00164
, 여기서
Figure 112021004950926-pct00165
는 2차 채널 신호의 LSF 파라미터의 벡터이고,
Figure 112021004950926-pct00166
는 1차 채널 신호의 양자화된 LSF 파라미터의 벡터이고,
Figure 112021004950926-pct00167
는 2차 채널 신호의 LSF 파라미터의 평균 벡터이고, i는 벡터 인덱스이고,
Figure 112021004950926-pct00168
이고, i는 정수이고, M은 선형 예측 차수이고, w는 가중 계수임 -; 및
적응적 확장 인자를 양자화하여 타깃 적응적 확장 인자를 획득하도록 구성된다.
선택적으로, 결정 모듈은 구체적으로:
타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 풀-투-에버리지 처리를 수행하여 1차 채널 신호의 확장된 LSF 파라미터를 획득하고- 풀-투-에버리지 처리는 다음의 수학식에 따라 수행되고:
Figure 112021004950926-pct00169
, 여기서
Figure 112021004950926-pct00170
는 1차 채널 신호의 확장된 LSF 파라미터를 나타내고,
Figure 112021004950926-pct00171
는 1차 채널 신호의 양자화된 LSF 파라미터의 벡터를 나타내고,
Figure 112021004950926-pct00172
는 벡터 인덱스를 나타내고,
Figure 112021004950926-pct00173
는 타깃 적응적 확장 인자를 나타내고, 는 2차 채널 신호의 LSF 파라미터의 평균 벡터를 나타내고, 이고,
Figure 112021004950926-pct00176
는 정수이고, M은 선형 예측 파라미터를 나타냄 -; 및
1차 채널 신호의 확장된 LSF 파라미터에 기초하여 2차 채널 신호의 양자화된 LSF 파라미터를 결정하도록 구성된다.
선택적으로, 타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 스펙트럼 확장을 수행하는 것에 의해 획득되는 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리가 가장 짧다.
선택적으로, 타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 스펙트럼 확장을 수행하는 것에 의해 획득되는 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리는 가장 짧다.
결정 모듈은 구체적으로, 타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 스펙트럼 확장을 수행하는 것에 의해 획득되는 LSF 파라미터를 다음의 단계들에 따라 획득하도록 구성된다:
타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터를 변환하여, 선형 예측 계수를 획득하는 단계;
선형 예측 계수를 수정하여 수정된 선형 예측 계수를 획득하는 단계; 및
수정된 선형 예측 계수를 변환하여 타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 스펙트럼 확장을 수행하는 것에 의해 획득되는 LSF 파라미터를 획득하는 단계.
선택적으로, 결정 모듈은 타깃 적응적 확장 인자 및 1차 채널 신호의 양자화된 LSF 파라미터에 기초하여 2차 채널 신호의 양자화된 LSF 파라미터를 결정하도록 추가로 구성된다.
선택적으로, 2차 채널 신호의 양자화된 LSF 파라미터는 타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 스펙트럼 확장을 수행하는 것에 의해 획득되는 LSF 파라미터이다.
현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터 및 현재 프레임에서의 2차 채널 신호의 LSF 파라미터에 기초하여 타깃 적응적 확장 인자를 결정하기 전에, 결정 모듈은 2차 채널 신호의 LSF 파라미터가 재사용 조건을 충족시킨다고 결정하도록 추가로 구성된다.
인코딩 장치(1100)는 도 5에 설명된 방법을 수행하도록 구성될 수 있다. 간단히 하기 위해, 세부사항들은 본 명세서에서 다시 설명되지 않는다.
도 12는 본 출원의 실시예에 따른 디코딩 장치(1200)의 개략 블록도이다. 디코딩 장치(1200)는 단지 예라는 점이 이해되어야 한다.
일부 구현들에서, 디코딩 모듈(1220) 및 스펙트럼 확장 모듈(1230)은 모바일 단말(140) 또는 네트워크 요소(150)의 디코딩 컴포넌트(120)에 포함될 수 있다.
디코딩 모듈(1220)은 디코딩을 통해 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터를 획득하도록 구성된다.
디코딩 모듈(1220)은 디코딩을 통해 현재 프레임에서의 스테레오 신호의 타깃 적응적 확장 인자를 획득하도록 추가로 구성된다.
스펙트럼 확장 모듈(1230)은 1차 채널 신호의 확장된 LSF 파라미터에 기초하여 현재 프레임에서의 2차 채널 신호의 양자화된 LSF 파라미터를 결정하도록 구성된다.
선택적으로, 스펙트럼 확장 모듈(1230)은 구체적으로:
타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 풀-투-에버리지 처리를 수행하여 1차 채널 신호의 확장된 LSF 파라미터를 획득하도록 구성되고, 풀-투-에버리지 처리는 다음의 수학식에 따라 수행된다:
Figure 112021004950926-pct00177
.
본 명세서에서,
Figure 112021004950926-pct00178
는 1차 채널 신호의 확장된 LSF 파라미터를 나타내고,
Figure 112021004950926-pct00179
는 1차 채널 신호의 양자화된 LSF 파라미터의 벡터를 나타내고,
Figure 112021004950926-pct00180
는 벡터 인덱스를 나타내고,
Figure 112021004950926-pct00181
는 타깃 적응적 확장 인자를 나타내고,
Figure 112021004950926-pct00182
는 2차 채널 신호의 LSF 파라미터의 평균 벡터를 나타내고,
Figure 112021004950926-pct00183
이고,
Figure 112021004950926-pct00184
는 정수이고, M은 선형 예측 파라미터이다.
선택적으로, 스펙트럼 확장 모듈(1230)은 구체적으로: 1차 채널 신호의 양자화된 LSF 파라미터를 변환하여, 선형 예측 계수를 획득하고; 타깃 적응적 확장 인자에 기초하여 선형 예측 계수를 수정하여, 수정된 선형 예측 계수를 획득하고; 수정된 선형 예측 계수를 변환하여 변환된 LSF 파라미터를 획득하고, 변환된 LSF 파라미터를 1차 채널 신호의 확장된 LSF 파라미터로서 사용하도록 구성된다.
선택적으로, 2차 채널 신호의 양자화된 LSF 파라미터는 1차 채널 신호의 확장된 LSF 파라미터이다.
디코딩 장치(1200)는 도 10에서 설명된 디코딩 방법을 수행하도록 구성될 수 있다. 간단히 하기 위해, 세부사항들은 본 명세서에서 다시 설명되지 않는다.
도 13은 본 출원의 실시예에 따른 인코딩 장치(1300)의 개략 블록도이다. 인코딩 장치(1300)는 단지 예라는 것을 이해해야 한다.
메모리(1310)는 프로그램을 저장하도록 구성된다.
프로세서(1320)는 메모리에 저장되는 프로그램을 실행하도록 구성되고, 메모리에서의 프로그램이 실행될 때, 프로세서(1320)는: 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터 및 현재 프레임에서의 2차 채널 신호의 LSF 파라미터에 기초하여 타깃 적응적 확장 인자를 결정하고; 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터 및 타깃 적응적 확장 인자를 비트스트림에 기입하도록 구성된다.
선택적으로, 프로세서는:
1차 채널 신호의 양자화된 LSF 파라미터 및 2차 채널 신호의 LSF 파라미터에 기초하여 적응적 확장 인자를 계산하고- 여기서 1차 채널 신호의 양자화된 LSF 파라미터, 2차 채널 신호의 LSF 파라미터, 및 적응적 확장 인자는 다음의 관계를 충족시키고:
Figure 112021004950926-pct00185
, 여기서
Figure 112021004950926-pct00186
는 2차 채널 신호의 LSF 파라미터의 벡터이고,
Figure 112021004950926-pct00187
는 1차 채널 신호의 양자화된 LSF 파라미터의 벡터이고,
Figure 112021004950926-pct00188
는 2차 채널 신호의 LSF 파라미터의 평균 벡터이고, i는 벡터 인덱스이고,
Figure 112021004950926-pct00189
이고, i는 정수이고, M은 선형 예측 차수이고, w는 가중 계수임 -; 및
적응적 확장 인자를 양자화하여 타깃 적응적 확장 인자를 획득하도록 구성된다.
선택적으로, 프로세서는:
타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 풀-투-에버리지 처리를 수행하여 1차 채널 신호의 확장된 LSF 파라미터를 획득하고- 풀-투-에버리지 처리는 다음의 수학식에 따라 수행되고:
Figure 112021004950926-pct00190
, 여기서
Figure 112021004950926-pct00191
는 1차 채널 신호의 확장된 LSF 파라미터를 나타내고,
Figure 112021004950926-pct00192
는 1차 채널 신호의 양자화된 LSF 파라미터의 벡터를 나타내고,
Figure 112021004950926-pct00193
는 벡터 인덱스를 나타내고,
Figure 112021004950926-pct00194
는 타깃 적응적 확장 인자를 나타내고,
Figure 112021004950926-pct00195
는 2차 채널 신호의 LSF 파라미터의 평균 벡터를 나타내고,
Figure 112021004950926-pct00196
이고,
Figure 112021004950926-pct00197
는 정수이고, M은 선형 예측 파라미터를 나타냄 -; 및
1차 채널 신호의 확장된 LSF 파라미터에 기초하여 2차 채널 신호의 양자화된 LSF 파라미터를 결정하도록 구성된다.
선택적으로, 타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 스펙트럼 확장을 수행하는 것에 의해 획득되는 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리가 가장 짧다.
선택적으로, 타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 스펙트럼 확장을 수행하는 것에 의해 획득되는 LSF 파라미터와 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리는 가장 짧다.
프로세서는 구체적으로, 타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 스펙트럼 확장을 수행하는 것에 의해 획득되는 LSF 파라미터를, 다음의 단계들에 따라 획득하도록 구성된다: 타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터를 변환하여, 선형 예측 계수를 획득하는 단계; 선형 예측 계수를 수정하여 수정된 선형 예측 계수를 획득하는 단계; 및 수정된 선형 예측 계수를 변환하여 타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 스펙트럼 확장을 수행하는 것에 의해 획득되는 LSF 파라미터를 획득하는 단계.
선택적으로, 2차 채널 신호의 양자화된 LSF 파라미터는 타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 스펙트럼 확장을 수행하는 것에 의해 획득되는 LSF 파라미터이다.
선택적으로, 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터 및 현재 프레임에서의 2차 채널 신호의 LSF 파라미터에 기초하여 타깃 적응적 확장 인자를 결정하기 전에, 프로세서는 2차 채널 신호의 LSF 파라미터가 재사용 조건을 충족시킨다고 결정하도록 추가로 구성된다.
인코딩 장치(1300)는 도 5에서 설명된 인코딩 방법을 수행하도록 구성될 수 있다. 간단히 하기 위해, 세부사항들은 본 명세서에서 다시 설명되지 않는다.
도 14는 본 출원의 실시예에 따른 디코딩 장치(1400)의 개략 블록도이다. 디코딩 장치(1400)는 단지 예라는 점이 이해되어야 한다.
메모리(1410)는 프로그램을 저장하도록 구성된다.
프로세서(1420)는 메모리에 저장되는 프로그램을 실행하도록 구성되고, 메모리에서의 프로그램이 실행될 때, 프로세서는: 디코딩을 통해 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터를 획득하고; 디코딩을 통해 현재 프레임에서의 스테레오 신호의 타깃 적응적 확장 인자를 획득하고; 1차 채널 신호의 확장된 LSF 파라미터에 기초하여 현재 프레임에서의 2차 채널 신호의 양자화된 LSF 파라미터를 결정하도록 구성된다.
선택적으로, 프로세서는:
타깃 적응적 확장 인자에 기초하여 1차 채널 신호의 양자화된 LSF 파라미터에 대해 풀-투-에버리지 처리를 수행하여 1차 채널 신호의 확장된 LSF 파라미터를 획득하도록 구성되고, 풀-투-에버리지 처리는 다음의 수학식에 따라 수행된다:
Figure 112021004950926-pct00198
.
본 명세서에서,
Figure 112021004950926-pct00199
는 1차 채널 신호의 확장된 LSF 파라미터를 나타내고,
Figure 112021004950926-pct00200
는 1차 채널 신호의 양자화된 LSF 파라미터의 벡터를 나타내고,
Figure 112021004950926-pct00201
는 벡터 인덱스를 나타내고,
Figure 112021004950926-pct00202
는 타깃 적응적 확장 인자를 나타내고,
Figure 112021004950926-pct00203
는 2차 채널 신호의 LSF 파라미터의 평균 벡터를 나타내고,
Figure 112021004950926-pct00204
이고,
Figure 112021004950926-pct00205
는 정수이고, M은 선형 예측 파라미터이다.
선택적으로, 프로세서는: 1차 채널 신호의 양자화된 LSF 파라미터를 변환하여, 선형 예측 계수를 획득하고; 타깃 적응적 확장 인자에 기초하여 선형 예측 계수를 수정하여, 수정된 선형 예측 계수를 획득하고; 수정된 선형 예측 계수를 변환하여 변환된 LSF 파라미터를 획득하고, 변환된 LSF 파라미터를 1차 채널 신호의 확장된 LSF 파라미터로서 사용하도록 구성된다.
선택적으로, 2차 채널 신호의 양자화된 LSF 파라미터는 1차 채널 신호의 확장된 LSF 파라미터이다.
디코딩 장치(1400)는 도 10에 설명된 디코딩 방법을 수행하도록 구성될 수 있다. 간단히 하기 위해, 세부사항들은 본 명세서에서 다시 설명되지 않는다.
본 기술분야의 통상의 기술자라면, 본 명세서에서 개시된 실시예들에서 설명된 예들과 연계하여, 전자 하드웨어 또는 컴퓨터 소프트웨어와 전자 하드웨어의 조합에 의해 유닛들 및 알고리즘 단계들이 구현될 수 있다는 것을 알 수 있을 것이다. 기능들이 하드웨어 또는 소프트웨어에 의해 수행되는지는 기술적 해결책들의 특정 응용들 및 설계 제약 조건들에 좌우된다. 본 기술분야의 통상의 기술자는 각각의 특정 응용에 대해 설명되는 기능들을 구현하기 위해 상이한 방법들을 사용할 수 있지만, 이러한 구현이 본 발명의 범위를 벗어나는 것으로 고려되어서는 안 된다.
전술한 시스템, 장치 및 유닛의 상세한 작업 프로세스에 대해, 편리하고 간단한 설명을 위해, 방법 실시예들에서의 대응하는 프로세스를 참조하는 것이 본 기술분야의 통상의 기술자에 의해 명백하게 이해될 수 있다. 세부사항들은 본 명세서에서 다시 설명하지 않는다.
본 출원에서 제공되는 몇몇 실시예들에서, 개시되는 시스템, 장치, 및 방법은 다른 방식으로 구현될 수 있다는 점이 이해되어야 한다. 예를 들어, 설명된 장치 실시예들은 단지 예들이다. 예를 들어, 유닛들로의 분할은 단지 논리적 기능 분할이다. 실제 구현에는 다른 분할 방식이 있을 수 있다. 예를 들어, 복수의 유닛 또는 컴포넌트가 조합되거나 다른 시스템에 통합되거나, 일부 특징들이 무시되거나 수행되지 않을 수 있다. 또한, 표시되는 또는 논의되는 상호 결합들 또는 직접 결합들 또는 통신 접속들은 일부 인터페이스들을 사용하여 구현될 수 있다. 장치들 또는 유닛들 사이의 간접적인 결합들 또는 통신 접속들은 전자적, 기계적 또는 기타의 형태로 구현될 수 있다.
별개의 부분들로서 설명된 유닛들은 물리적으로 분리되거나 분리되지 않을 수 있고, 유닛들로서 표시된 부분들은 물리적 유닛들이거나 아닐 수 있고, 한 위치에 위치할 수 있거나, 복수의 네트워크 유닛에 분산될 수 있다. 이러한 유닛들의 일부 또는 전부는 실시예들의 해결책들의 목적들을 달성하기 위해 실제 요건들에 기초하여 선택될 수 있다.
또한, 본 출원의 실시예들에서의 기능 유닛들은 하나의 처리 유닛으로 통합될 수 있거나, 유닛들 각각은 물리적으로 단독으로 존재할 수 있거나, 2개 이상의 유닛이 하나의 유닛으로 통합될 수 있다.
본 출원의 실시예들에서의 프로세서는 중앙 처리 유닛(central processing unit, CPU)일 수 있다는 점이 이해되어야 한다. 프로세서는 대안적으로 다른 범용 프로세서, 디지털 신호 프로세서(digital signal processor, DSP), 주문형 집적 회로(application specific integrated circuit, ASIC), 필드 프로그램가능 게이트 어레이(field programmable gate array, FPGA) 또는 다른 프로그램가능 논리 디바이스, 이산 게이트 또는 트랜지스터 논리 디바이스, 이산 하드웨어 컴포넌트 등일 수 있다. 범용 프로세서는 마이크로프로세서일 수 있거나, 프로세서는 또한 임의의 종래의 프로세서 등일 수 있다.
기능들이 소프트웨어 기능 유닛의 형태로 구현되고 독립된 제품으로서 판매 또는 사용될 때, 이러한 기능들은 컴퓨터 판독가능 저장 매체에 저장될 수 있다. 이러한 이해에 기초하여, 본 출원의 기술적 해결책들은 본질적으로, 또는 종래 기술에 기여하는 부분은, 또는 기술적 해결책들의 전부 또는 일부는, 소프트웨어 제품의 형태로 구현될 수 있다. 컴퓨터 소프트웨어 제품은 저장 매체에 저장되고, (퍼스널 컴퓨터, 서버, 또는 네트워크 디바이스일 수 있는) 컴퓨터 디바이스에게 본 출원의 실시예들에서 설명되는 방법들의 단계들의 전부 또는 일부를 수행하라고 명령하기 위한 여러 명령어들을 포함한다. 전술한 저장 매체는 USB 플래시 드라이브, 이동식 하드 디스크, 판독 전용 메모리(read-only memory, ROM), 랜덤 액세스 메모리(random access memory, RAM), 자기 디스크, 또는 콤팩트 디스크와 같은, 프로그램 코드를 저장할 수 있는 임의의 매체를 포함한다.
전술한 설명들은 단지 본 출원의 구체적인 구현들이지만, 본 출원의 보호 범위를 제한하도록 의도되는 것은 아니다. 본 출원에서 개시되는 기술적 범위 내에서 본 기술분야의 통상의 기술자에 의해 용이하게 도출되는 임의의 변형 또는 대체는 본 출원의 보호 범위 내에 있을 것이다. 따라서, 본 출원의 보호 범위는 청구항들의 보호 범위에 종속될 것이다.

Claims (22)

  1. 스테레오 신호 인코딩 방법으로서,
    현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터 및 상기 현재 프레임에서의 2차 채널 신호의 LSF 파라미터에 기초하여 타깃 적응적 확장 인자를 결정하는 단계; 및
    상기 현재 프레임에서의 상기 1차 채널 신호의 상기 양자화된 LSF 파라미터 및 상기 타깃 적응적 확장 인자를 비트스트림에 기입하는 단계를 포함하고,
    상기 타깃 적응적 확장 인자는 상기 1차 채널 신호의 스펙트럼-확장된 LSF 파라미터와 상기 2차 채널 신호의 상기 LSF 파라미터 사이의 가중된 거리를 최소화하기 위한 것인, 인코딩 방법.
  2. 제1항에 있어서,
    상기 타깃 적응적 확장 인자를 결정하는 상기 단계는:
    상기 1차 채널 신호의 상기 양자화된 LSF 파라미터 및 상기 2차 채널 신호의 상기 LSF 파라미터에 기초하여 적응적 확장 인자를 계산하는 단계- 상기 1차 채널 신호의 상기 양자화된 LSF 파라미터, 상기 2차 채널 신호의 상기 LSF 파라미터, 및 상기 적응적 확장 인자 β는 다음의 수학식을 충족시키고:
    , 여기서
    는 상기 2차 채널 신호의 상기 LSF 파라미터의 벡터이고, 는 상기 1차 채널 신호의 상기 양자화된 LSF 파라미터의 벡터이고, 는 상기 2차 채널 신호의 상기 LSF 파라미터의 평균 벡터이고, i는 벡터 인덱스이고, 이고, i는 정수이고, M은 선형 예측 차수이고, wi는 제i 가중 계수임 -; 및
    상기 적응적 확장 인자를 양자화하여 상기 타깃 적응적 확장 인자를 획득하는 단계를 포함하는 인코딩 방법.
  3. 제1항에 있어서,
    상기 인코딩 방법은:
    상기 타깃 적응적 확장 인자 및 상기 1차 채널 신호의 상기 양자화된 LSF 파라미터에 기초하여 상기 2차 채널 신호의 양자화된 LSF 파라미터를 결정하는 단계를 추가로 포함하는 인코딩 방법.
  4. 제3항에 있어서,
    상기 2차 채널 신호의 상기 양자화된 LSF 파라미터를 결정하는 상기 단계는:
    상기 타깃 적응적 확장 인자에 기초하여 상기 1차 채널 신호의 상기 양자화된 LSF 파라미터에 대해 풀-투-에버리지(pull-to-average) 처리를 수행하여 상기 1차 채널 신호의 확장된 LSF 파라미터를 획득하는 단계- 상기 풀-투-에버리지 처리는 다음의 수학식에 따라 수행되고:
    , 여기서
    는 상기 1차 채널 신호의 상기 확장된 LSF 파라미터의 벡터를 나타내고, 는 상기 1차 채널 신호의 상기 양자화된 LSF 파라미터의 벡터를 나타내고, 는 벡터 인덱스를 나타내고, 는 상기 타깃 적응적 확장 인자를 나타내고, 는 상기 2차 채널 신호의 상기 LSF 파라미터의 평균 벡터를 나타내고, 이고, 는 정수이고, M은 선형 예측 파라미터를 나타냄 -; 및
    상기 1차 채널 신호의 상기 확장된 LSF 파라미터에 기초하여 상기 2차 채널 신호의 상기 양자화된 LSF 파라미터를 결정하는 단계를 포함하는 인코딩 방법.
  5. 제1항에 있어서,
    상기 타깃 적응적 확장 인자를 결정하는 단계 이전에, 상기 인코딩 방법은:
    상기 2차 채널 신호의 상기 LSF 파라미터가 재사용 조건을 충족시킨다고 결정하는 단계를 추가로 포함하는 인코딩 방법.
  6. 스테레오 신호 디코딩 방법으로서,
    디코딩을 통해 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터를 획득하는 단계;
    디코딩을 통해 상기 현재 프레임에서의 스테레오 신호의 타깃 적응적 확장 인자를 획득하는 단계; 및
    상기 타깃 적응적 확장 인자에 기초하여 상기 1차 채널 신호의 상기 양자화된 LSF 파라미터를 확장하여 상기 1차 채널 신호의 확장된 LSF 파라미터를 획득하는 단계- 상기 1차 채널 신호의 상기 확장된 LSF 파라미터는 상기 현재 프레임에서의 2차 채널 신호의 양자화된 LSF 파라미터이거나, 상기 1차 채널 신호의 상기 확장된 LSF 파라미터는 상기 현재 프레임에서의 2차 채널 신호의 양자화된 LSF 파라미터를 결정하기 위해 사용됨 -를 포함하고,
    상기 타깃 적응적 확장 인자는 상기 1차 채널 신호의 상기 확장된 LSF 파라미터와 상기 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리를 최소화하기 위한 것인, 디코딩 방법.
  7. 제6항에 있어서,
    상기 1차 채널 신호의 상기 양자화된 LSF 파라미터를 확장하는 상기 단계는:
    상기 타깃 적응적 확장 인자에 기초하여 상기 1차 채널 신호의 상기 양자화된 LSF 파라미터에 대해 풀-투-에버리지 처리를 수행하여 상기 1차 채널 신호의 상기 확장된 LSF 파라미터를 획득하는 단계를 포함하고, 상기 풀-투-에버리지 처리는 다음의 수학식에 따라 수행되고:
    , 여기서
    는 상기 1차 채널 신호의 상기 확장된 LSF 파라미터의 벡터를 나타내고, 는 상기 1차 채널 신호의 상기 양자화된 LSF 파라미터의 벡터를 나타내고, 는 벡터 인덱스를 나타내고, 는 상기 타깃 적응적 확장 인자를 나타내고, 는 상기 2차 채널 신호의 LSF 파라미터의 평균 벡터를 나타내고, 이고, 는 정수이고, M은 선형 예측 파라미터를 나타내는 디코딩 방법.
  8. 제6항에 있어서,
    상기 1차 채널 신호의 상기 양자화된 LSF 파라미터를 확장하는 상기 단계는:
    상기 1차 채널 신호의 상기 양자화된 LSF 파라미터를 변환하여, 선형 예측 계수를 획득하는 단계;
    상기 타깃 적응적 확장 인자에 기초하여 상기 선형 예측 계수를 수정하여, 수정된 선형 예측 계수를 획득하는 단계; 및
    상기 수정된 선형 예측 계수를 변환하여 변환된 LSF 파라미터를 획득하고, 상기 변환된 LSF 파라미터를 상기 1차 채널 신호의 상기 확장된 LSF 파라미터로서 사용하는 단계를 포함하는 디코딩 방법.
  9. 스테레오 신호 인코딩 장치로서,
    현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터 및 상기 현재 프레임에서의 2차 채널 신호의 LSF 파라미터에 기초하여 타깃 적응적 확장 인자를 결정하도록 구성된 결정 모듈; 및
    상기 현재 프레임에서의 상기 1차 채널 신호의 상기 양자화된 LSF 파라미터 및 상기 타깃 적응적 확장 인자를 비트스트림에 기입하도록 구성된 인코딩 모듈을 포함하고,
    상기 타깃 적응적 확장 인자는 상기 1차 채널 신호의 스펙트럼-확장된 LSF 파라미터와 상기 2차 채널 신호의 상기 LSF 파라미터 사이의 가중된 거리를 최소화하기 위한 것인, 인코딩 장치.
  10. 제9항에 있어서,
    상기 결정 모듈은: 상기 1차 채널 신호의 상기 양자화된 LSF 파라미터 및 상기 2차 채널 신호의 상기 LSF 파라미터에 기초하여 적응적 확장 인자를 계산하고- 상기 1차 채널 신호의 상기 양자화된 LSF 파라미터, 상기 2차 채널 신호의 상기 LSF 파라미터, 및 상기 적응적 확장 인자 β는 다음의 수학식을 충족시키고:
    , 여기서
    는 상기 2차 채널 신호의 상기 LSF 파라미터의 벡터이고, 는 상기 1차 채널 신호의 상기 양자화된 LSF 파라미터의 벡터이고, 는 상기 2차 채널 신호의 상기 LSF 파라미터의 평균 벡터이고, i는 벡터 인덱스이고, 이고, i는 정수이고, M은 선형 예측 차수이고, wi는 제i 가중 계수임 -; 및
    상기 적응적 확장 인자를 양자화하여 상기 타깃 적응적 확장 인자를 획득하도록 추가로 구성되는 인코딩 장치.
  11. 제9항에 있어서,
    상기 결정 모듈은:
    상기 타깃 적응적 확장 인자 및 상기 1차 채널 신호의 양자화된 LSF 파라미터에 기초하여 상기 2차 채널 신호의 양자화된 LSF 파라미터를 결정하도록 추가로 구성되는 인코딩 장치.
  12. 제11항에 있어서,
    상기 결정 모듈은:
    상기 타깃 적응적 확장 인자에 기초하여 상기 1차 채널 신호의 상기 양자화된 LSF 파라미터에 대해 풀-투-에버리지 처리를 수행하여 상기 1차 채널 신호의 확장된 LSF 파라미터를 획득하고- 상기 풀-투-에버리지 처리는 다음의 수학식에 따라 수행되고:
    , 여기서
    는 상기 1차 채널 신호의 상기 확장된 LSF 파라미터의 벡터를 나타내고, 는 상기 1차 채널 신호의 상기 양자화된 LSF 파라미터의 벡터를 나타내고, 는 벡터 인덱스를 나타내고, 는 상기 타깃 적응적 확장 인자를 나타내고, 는 상기 2차 채널 신호의 상기 LSF 파라미터의 평균 벡터를 나타내고, 이고, 는 정수이고, M은 선형 예측 파라미터를 나타냄 -;
    상기 1차 채널 신호의 상기 확장된 LSF 파라미터에 기초하여 상기 2차 채널 신호의 상기 양자화된 LSF 파라미터를 결정하도록 추가로 구성되는 인코딩 장치.
  13. 제9항에 있어서,
    상기 결정 모듈은:
    상기 2차 채널 신호의 상기 LSF 파라미터가 재사용 조건을 충족시키는지를 결정하도록 추가로 구성되고,
    상기 결정 모듈은, 상기 2차 채널 신호의 상기 LSF 파라미터가 상기 재사용 조건을 충족시킨다고 결정할 때에만, 상기 현재 프레임에서의 상기 1차 채널 신호의 상기 양자화된 LSF 파라미터 및 상기 현재 프레임에서의 상기 2차 채널 신호의 상기 LSF 파라미터에 기초하여 상기 타깃 적응적 확장 인자를 결정하는 인코딩 장치.
  14. 스테레오 신호 디코딩 장치로서,
    디코딩을 통해 현재 프레임에서의 1차 채널 신호의 양자화된 LSF 파라미터를 획득하고; 디코딩을 통해 상기 현재 프레임에서의 스테레오 신호의 타깃 적응적 확장 인자를 획득하도록 구성된 디코딩 모듈; 및
    상기 타깃 적응적 확장 인자에 기초하여 상기 1차 채널 신호의 상기 양자화된 LSF 파라미터를 확장하여 상기 1차 채널 신호의 확장된 LSF 파라미터를 획득하도록 구성된 스펙트럼 확장 모듈- 상기 1차 채널 신호의 상기 확장된 LSF 파라미터는 상기 현재 프레임에서의 2차 채널 신호의 양자화된 LSF 파라미터이거나, 상기 1차 채널 신호의 상기 확장된 LSF 파라미터는 상기 현재 프레임에서의 2차 채널 신호의 양자화된 LSF 파라미터를 결정하기 위해 사용됨 -을 포함하고,
    상기 타깃 적응적 확장 인자는 상기 1차 채널 신호의 상기 확장된 LSF 파라미터와 상기 2차 채널 신호의 LSF 파라미터 사이의 가중된 거리를 최소화하기 위한 것인, 디코딩 장치.
  15. 제14항에 있어서,
    상기 스펙트럼 확장 모듈은:
    상기 타깃 적응적 확장 인자에 기초하여 상기 1차 채널 신호의 상기 양자화된 LSF 파라미터에 대해 풀-투-에버리지 처리를 수행하여 상기 1차 채널 신호의 상기 확장된 LSF 파라미터를 획득하도록 추가로 구성되고, 상기 풀-투-에버리지 처리는 다음의 수학식에 따라 수행되고:
    , 여기서
    는 상기 1차 채널 신호의 상기 확장된 LSF 파라미터의 벡터를 나타내고, 는 상기 1차 채널 신호의 상기 양자화된 LSF 파라미터의 벡터를 나타내고, 는 벡터 인덱스를 나타내고, 는 상기 타깃 적응적 확장 인자를 나타내고, 는 상기 2차 채널 신호의 LSF 파라미터의 평균 벡터를 나타내고, 이고, 는 정수이고, M은 선형 예측 파라미터를 나타내는 디코딩 장치.
  16. 제14항에 있어서,
    상기 스펙트럼 확장 모듈은:
    상기 1차 채널 신호의 상기 양자화된 LSF 파라미터를 변환하여, 선형 예측 계수를 획득하고;
    상기 타깃 적응적 확장 인자에 기초하여 상기 선형 예측 계수를 수정하여, 수정된 선형 예측 계수를 획득하고;
    상기 수정된 선형 예측 계수를 변환하여 변환된 LSF 파라미터를 획득하고, 상기 변환된 LSF 파라미터를 상기 1차 채널 신호의 상기 확장된 LSF 파라미터로서 사용하도록 추가로 구성되는 디코딩 장치.
  17. 스테레오 신호 인코딩 장치로서,
    적어도 하나의 프로세서; 및
    상기 적어도 하나의 프로세서에 의한 실행을 위한 컴퓨터 실행가능 명령어들을 저장하는 메모리를 포함하고, 상기 컴퓨터 실행가능 명령어들은 제1항 내지 제5항 중 어느 한 항에 따른 방법을 수행하도록 상기 적어도 하나의 프로세서에 지시하는 인코딩 장치.
  18. 스테레오 신호 디코딩 장치로서,
    적어도 하나의 프로세서; 및
    상기 적어도 하나의 프로세서에 의한 실행을 위한 컴퓨터 실행가능 명령어들을 저장하는 메모리를 포함하고, 상기 컴퓨터 실행가능 명령어들은 제6항 내지 제8항 중 어느 한 항에 따른 방법을 수행하도록 상기 적어도 하나의 프로세서에 지시하는 디코딩 장치.
  19. 비일시적 컴퓨터 판독가능 저장 매체로서,
    하나 이상의 프로세서에 의해 실행될 때, 상기 하나 이상의 프로세서로 하여금 제1항 내지 제5항 중 어느 한 항에 따른 방법을 수행하게 하는 컴퓨터 명령어들을 저장하는 비일시적 컴퓨터 판독가능 저장 매체.
  20. 비일시적 컴퓨터 판독가능 저장 매체로서,
    하나 이상의 프로세서에 의해 실행될 때, 상기 하나 이상의 프로세서로 하여금 제6항 내지 제8항 중 어느 한 항에 따른 방법을 수행하게 하는 컴퓨터 명령어들을 저장하는 비일시적 컴퓨터 판독가능 저장 매체.
  21. 컴퓨터 프로그램으로서,
    컴퓨터로 하여금 제1항 내지 제5항 중 어느 한 항의 방법을 실행하게 하도록 구성된 컴퓨터 판독가능 저장 매체 상에 저장되는 컴퓨터 프로그램.
  22. 컴퓨터 프로그램으로서,
    컴퓨터로 하여금 제6항 내지 제8항 중 어느 한 항의 방법을 실행하게 하도록 구성된 컴퓨터 판독가능 저장 매체 상에 저장되는 컴퓨터 프로그램.
KR1020217001234A 2018-06-29 2019-06-27 스테레오 오디오 신호에 대한 인코딩 및 디코딩 방법, 인코딩 디바이스, 및 디코딩 디바이스 KR102592670B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020237035513A KR20230152156A (ko) 2018-06-29 2019-06-27 스테레오 오디오 신호에 대한 인코딩 및 디코딩 방법, 인코딩 디바이스, 및 디코딩 디바이스

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201810713020.1 2018-06-29
CN201810713020.1A CN110660400B (zh) 2018-06-29 2018-06-29 立体声信号的编码、解码方法、编码装置和解码装置
PCT/CN2019/093403 WO2020001569A1 (zh) 2018-06-29 2019-06-27 立体声信号的编码、解码方法、编码装置和解码装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020237035513A Division KR20230152156A (ko) 2018-06-29 2019-06-27 스테레오 오디오 신호에 대한 인코딩 및 디코딩 방법, 인코딩 디바이스, 및 디코딩 디바이스

Publications (2)

Publication Number Publication Date
KR20210019546A KR20210019546A (ko) 2021-02-22
KR102592670B1 true KR102592670B1 (ko) 2023-10-24

Family

ID=68986261

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020237035513A KR20230152156A (ko) 2018-06-29 2019-06-27 스테레오 오디오 신호에 대한 인코딩 및 디코딩 방법, 인코딩 디바이스, 및 디코딩 디바이스
KR1020217001234A KR102592670B1 (ko) 2018-06-29 2019-06-27 스테레오 오디오 신호에 대한 인코딩 및 디코딩 방법, 인코딩 디바이스, 및 디코딩 디바이스

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020237035513A KR20230152156A (ko) 2018-06-29 2019-06-27 스테레오 오디오 신호에 대한 인코딩 및 디코딩 방법, 인코딩 디바이스, 및 디코딩 디바이스

Country Status (6)

Country Link
US (3) US11501784B2 (ko)
EP (1) EP3800637B1 (ko)
KR (2) KR20230152156A (ko)
CN (2) CN110660400B (ko)
BR (1) BR112020026954A2 (ko)
WO (1) WO2020001569A1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090262945A1 (en) 2005-08-31 2009-10-22 Panasonic Corporation Stereo encoding device, stereo decoding device, and stereo encoding method
US20100010811A1 (en) * 2006-08-04 2010-01-14 Panasonic Corporation Stereo audio encoding device, stereo audio decoding device, and method thereof
CA2997332A1 (en) 2015-09-25 2017-03-30 Voiceage Corporation Method and system for decoding left and right channels of a stereo sound signal

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE519552C2 (sv) * 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
US7013269B1 (en) * 2001-02-13 2006-03-14 Hughes Electronics Corporation Voicing measure for a speech CODEC system
US7003454B2 (en) * 2001-05-16 2006-02-21 Nokia Corporation Method and system for line spectral frequency vector quantization in speech codec
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
CN101335000B (zh) * 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
EP2214165A3 (en) * 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
CN102243876B (zh) * 2010-05-12 2013-08-07 华为技术有限公司 预测残差信号的量化编码方法及装置
US9424852B2 (en) * 2011-02-02 2016-08-23 Telefonaktiebolaget Lm Ericsson (Publ) Determining the inter-channel time difference of a multi-channel audio signal
EP2834813B1 (en) * 2012-04-05 2015-09-30 Huawei Technologies Co., Ltd. Multi-channel audio encoder and method for encoding a multi-channel audio signal
EP2838086A1 (en) * 2013-07-22 2015-02-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
JP6337122B2 (ja) * 2013-12-17 2018-06-06 ノキア テクノロジーズ オサケユイチア オーディオ信号エンコーダ
CN105336333B (zh) * 2014-08-12 2019-07-05 北京天籁传音数字技术有限公司 多声道声音信号编码方法、解码方法及装置
EP3067889A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for signal-adaptive transform kernel switching in audio coding
JP6864378B2 (ja) * 2016-01-22 2021-04-28 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法
WO2018086947A1 (en) * 2016-11-08 2018-05-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multichannel signal using a side gain and a residual gain

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090262945A1 (en) 2005-08-31 2009-10-22 Panasonic Corporation Stereo encoding device, stereo decoding device, and stereo encoding method
US20100010811A1 (en) * 2006-08-04 2010-01-14 Panasonic Corporation Stereo audio encoding device, stereo audio decoding device, and method thereof
CA2997332A1 (en) 2015-09-25 2017-03-30 Voiceage Corporation Method and system for decoding left and right channels of a stereo sound signal

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Enhanced aacPlus general audio codec Encoder specification Advanced Audio Coding (AAC) part. 3GPP TS 26.403 version 6.0.0 Release 6. 2004.09.
ISO/IEC DIS 23008-3. Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 3: 3D audio. ISO/IEC JTC 1/SC 29/WG 11. 2014.08.05.
ISO/IEC FDIS 23003-1:2006(E). Information technology - MPEG audio technologies Part 1: MPEG Surround. ISO/IEC JTC 1/SC 29/WG 11. 2006.07.21.

Also Published As

Publication number Publication date
WO2020001569A1 (zh) 2020-01-02
EP3800637B1 (en) 2024-05-08
US20230395084A1 (en) 2023-12-07
BR112020026954A2 (pt) 2021-03-30
KR20210019546A (ko) 2021-02-22
CN115132214A (zh) 2022-09-30
US20210118455A1 (en) 2021-04-22
KR20230152156A (ko) 2023-11-02
US20230039606A1 (en) 2023-02-09
CN110660400B (zh) 2022-07-12
EP3800637A4 (en) 2021-08-25
EP3800637A1 (en) 2021-04-07
CN110660400A (zh) 2020-01-07
US11776553B2 (en) 2023-10-03
US11501784B2 (en) 2022-11-15

Similar Documents

Publication Publication Date Title
US11238875B2 (en) Encoding and decoding methods, and encoding and decoding apparatuses for stereo signal
US20240021209A1 (en) Stereo Signal Encoding Method and Apparatus, and Stereo Signal Decoding Method and Apparatus
US11922958B2 (en) Method and apparatus for determining weighting factor during stereo signal encoding
KR102592670B1 (ko) 스테레오 오디오 신호에 대한 인코딩 및 디코딩 방법, 인코딩 디바이스, 및 디코딩 디바이스
US20220335961A1 (en) Audio signal encoding method and apparatus, and audio signal decoding method and apparatus
US11887607B2 (en) Stereo encoding method and apparatus, and stereo decoding method and apparatus
JP6951554B2 (ja) ステレオ信号符号化の間に信号を再構成する方法及び機器
KR102632523B1 (ko) 시간-도메인 스테레오 파라미터에 대한 코딩 방법, 및 관련 제품

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant