KR20190097214A - 스테레오 인코딩 방법 및 스테레오 인코더 - Google Patents

스테레오 인코딩 방법 및 스테레오 인코더 Download PDF

Info

Publication number
KR20190097214A
KR20190097214A KR1020197021048A KR20197021048A KR20190097214A KR 20190097214 A KR20190097214 A KR 20190097214A KR 1020197021048 A KR1020197021048 A KR 1020197021048A KR 20197021048 A KR20197021048 A KR 20197021048A KR 20190097214 A KR20190097214 A KR 20190097214A
Authority
KR
South Korea
Prior art keywords
current frame
time domain
amplitude correlation
amplitude
domain signal
Prior art date
Application number
KR1020197021048A
Other languages
English (en)
Other versions
KR102251639B1 (ko
Inventor
빈 왕
하이팅 리
레이 미아오
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Priority to KR1020217013814A priority Critical patent/KR102501351B1/ko
Publication of KR20190097214A publication Critical patent/KR20190097214A/ko
Application granted granted Critical
Publication of KR102251639B1 publication Critical patent/KR102251639B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)

Abstract

스테레오 인코딩 방법 및 스테레오 인코더가 제공된다. 스테레오 인코딩이 수행될 때, 현재 프레임의 채널 조합 인코딩 솔루션이 먼저 결정되고, 그런 다음 결정된 채널 조합 인코딩 솔루션에 기초하여 현재 프레임의 양자화된 채널 조합 비율 인자 및 양자화된 채널 조합 비율 인자의 인코딩 인덱스가 획득되어, 현재 프레임의 획득된 1차 채널 신호 및 2차 채널 신호가 현재 프레임의 특성을 충족시킴으로써, 인코딩 이후에 획득된 합성된 스테레오 오디오 신호의 사운드 이미지가 안정적이고, 드리프트 현상이 줄어들며, 인코딩 품질이 향상되는 것이 보장된다는 것이 체득될 수 있다.

Description

스테레오 코딩 방법 및 스테레오 코더
본 출원은 2016년 12월 30일자로 "STEREO ENCODING METHOD AND STEREO ENCODER"라는 명칭으로 중국 특허청에 출원된 중국 특허 출원 제201611261548.7호의 우선권을 주장하며, 중국 출원은 그 전체가 본 출원에 참조로 포함된다.
본 출원은 오디오 인코딩 및 디코딩 기술에 관한 것으로, 구체적으로는 스테레오 인코딩 방법 및 스테레오 인코더에 관한 것이다.
삶의 질이 향상됨에 따라, 고품질 오디오에 대한 요구 조건이 지속적으로 증가하고 있다. 모노 오디오와 비교하여, 스테레오 오디오는 각각의 음향 소스 마다 방향 감각과 분배 감각을 가지고 있으며 선명도, 명료도 및 정보의 존재감을 향상시킬 수 있다. 그러므로 스테레오 오디오는 사람들에게 매우 선호되고 있다.
시간 도메인 스테레오 인코딩 및 디코딩 기술(time domain stereo encoding and decoding technology)은 종래 기술의 일반적인 스테레오 인코딩 및 디코딩 기술이다. 기존의 시간 도메인 스테레오 인코딩 기술에서, 입력 신호는 시간 도메인에서 통상 두 개의 모노 신호, 예를 들어 Mid/Sid(M/S: Mid(중간)/Sid(측면)) 인코딩 방법으로 다운 믹싱된다. 먼저, 좌측 채널 및 우측 채널은 중간 채널(Mid channel)과 측면 채널(Side channel)로 다운 믹싱된다. 중간 채널은 0.5*(L+R)이고 두 채널 사이의 상관 관계에 관한 정보를 나타내고, 측면 채널은 0.5*(L-R)이고 두 채널 사이의 차에 관한 정보를 나타내며, 여기서 L은 좌측 채널 신호를 나타내고, R은 우측 채널 신호를 나타낸다. 그 다음에, 중간 채널 신호와 측면 채널 신호는 모노 인코딩 방법을 사용하여 개별적으로 인코딩된다. 중간 채널 신호는 통상적으로 비교적 많은 양의 비트를 사용하여 인코딩되며, 측면 채널 신호는 통상적으로 비교적 적은 양의 비트를 사용하여 인코딩된다.
스테레오 오디오 신호가 기존의 스테레오 인코딩 방법을 사용하여 인코딩될 때, 스테레오 오디오 신호의 신호 타입은 고려되지 않으며, 그 결과 인코딩 이후에 합성된 스테레오 오디오 신호의 사운드 이미지는 불안정하고, 드리프트 현상이 발생하며, 인코딩 품질이 향상될 필요가 있다.
본 발명의 실시예는 스테레오 오디오 신호의 신호 타입에 따라 서로 다른 인코딩 모드가 선택할 수 있도록 하여 인코딩 품질을 향상하는, 스테레오 인코딩 방법 및 스테레오 인코더를 제공한다.
본 발명의 제 1 양태에 따르면, 스테레오 인코딩 방법이 제공되고 스테레오 인코딩 방법은,
스테레오 오디오 신호의 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호 및 우측 채널 시간 도메인 신호에 대해 시간 도메인 전처리(time domain preprocessing)를 수행하여, 현재 프레임을 구성하는 전처리된 좌측 채널 시간 도메인 신호 및 전처리된 우측 채널 시간 도메인 신호를 획득하는 단계 - 시간 도메인 전처리는 필터링 처리를 포함할 수 있고, 특히 고역 통과 필터링 처리일 수 있음 - 와,
현재 프레임을 구성하는 전처리된 좌측 채널 시간 도메인 신호 및 전처리된 우측 채널 시간 도메인 신호에 대해 지연 정렬 처리(delay alignment processing)를 수행하여, 현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호를 획득하는 단계와,
현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 현재 프레임의 채널 조합 솔루션(channel combination solution)을 결정하는 단계 - 채널 조합 솔루션은 포지티브형(positive-like) 신호 채널 조합 솔루션 또는 네거티브형(negative-like) 신호 채널 조합 솔루션을 포함할 수 있음 - 와,
현재 프레임의 결정된 채널 조합 솔루션 및 현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호와 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 현재 프레임의 양자화된 채널 조합 비율 인자(quantized channel combination ratio factor) 및 양자화된 채널 조합 비율 인자의 인코딩 인덱스를 획득하는 단계 - 포지티브형 신호 채널 조합 솔루션 및 네거티브형 신호 채널 조합 솔루션에 대응하는 양자화된 채널 조합 비율 인자 및 양자화된 채널 조합 비율 인자의 인코딩 인덱스를 획득하기 위한 방법은 상이함 - 와,
현재 프레임의 결정된 채널 조합 솔루션에 기초하여 현재 프레임의 인코딩 모드를 결정하는 단계와,
현재 프레임의 인코딩 모드 및 현재 프레임의 양자화된 채널 조합 비율 인자에 기초하여, 현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 정렬 이후에 획득된 우측 채널 시간 도메인 신호를 다운 믹싱하여, 현재 프레임의 1차 채널 신호 및 2차 채널 신호를 획득하는 단계와,
현재 프레임의 1차 채널 신호 및 2차 채널 신호를 인코딩하는 단계를 포함한다.
제 1 양태와 관련하여, 제 1 양태의 구현예에서, 현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 현재 프레임의 채널 조합 솔루션을 결정하는 단계는,
현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 현재 프레임의 신호 타입을 결정하는 단계 - 신호 타입은 포지티브형 신호 또는 네거티브형 신호를 포함함 - 와,
적어도 현재 프레임의 신호 타입에 기초하여 대응적으로 현재 프레임의 채널 조합 솔루션을 결정하는 단계 - 채널 조합 솔루션은 네거티브형 신호를 처리하기 위해 사용되는 네거티브형 신호 채널 조합 솔루션 또는 포지티브형 신호를 처리하기 위해 사용되는 포지티브형 신호 채널 조합 솔루션을 포함함 - 를 포함한다.
제 1 양태 또는 제 1 양태의 전술한 구현예와 관련하여, 제 1 양태의 실시예에서, 현재 프레임의 채널 조합 솔루션이 네거티브형 신호를 처리하기 위해 사용되는 네거티브형 신호 채널 조합 솔루션이면, 현재 프레임의 결정된 채널 조합 솔루션 및 현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호와 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 현재 프레임의 양자화된 채널 조합 비율 인자 및 양자화된 채널 조합 비율 인자의 인코딩 인덱스를 획득하는 단계는,
현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 장기간 평활화(long-term smoothing) 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터(amplitude correlation difference parameter)를 획득하는 단계와,
진폭 상관 차 파라미터를 현재 프레임의 채널 조합 비율 인자로 변환하는 단계와,
현재 프레임의 채널 조합 비율 인자를 양자화하여, 현재 프레임의 양자화된 채널 조합 비율 인자 및 양자화된 채널 조합 비율 인자의 인코딩 인덱스를 획득하는 단계를 포함한다.
제 1 양태 또는 제 1 양태의 구현예 중 어느 하나와 관련하여, 제 1 양태의 구현예에서, 진폭 상관 차 파라미터를 현재 프레임의 채널 조합 비율 인자로 변환하는 단계는,
진폭 상관 차 파라미터에 대해 매핑 처리(mapping processing)를 수행하여 매핑된 진폭 상관 차 파라미터를 획득하는 단계 - 매핑된 진폭 상관 차 파라미터의 값은 미리 설정된 진폭 상관 차 파라미터 값 범위 내에 있음 - 와,
매핑된 진폭 상관 차 파라미터를 현재 프레임의 채널 조합 비율 인자로 변환하는 단계를 포함한다.
제 1 양태 또는 제 1 양태의 구현예 중 어느 하나와 관련하여, 제 1 양태의 구현예에서, 진폭 상관 차 파라미터에 대해 매핑 처리를 수행하는 단계는,
진폭 상관 차 파라미터에 대해 진폭 제한(amplitude limiting)을 수행하여 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 획득하는 단계 - 진폭 제한은 세그먼트화된 진폭 제한(segmented amplitude limiting) 또는 비 세그먼트화된 진폭 제한(non-segmented amplitude limiting)일 수 있고, 진폭 제한은 선형 진폭 제한 또는 비 선형 진폭 제한일 수 있음 - 와,
진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 매핑하여, 매핑된 진폭 상관 차 파라미터를 획득하는 단계를 포함하고, 매핑은 세그먼트화된 매핑 또는 비 세그먼트화된 매핑일 수 있고, 매핑은 선형 매핑 또는 비선형 매핑일 수 있다.
제 1 양태 또는 제 1 양태의 구현예 중 어느 하나와 관련하여, 제 1 양태의 구현예에서, 진폭 상관 차 파라미터에 대해 진폭 제한을 수행하여, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 획득하는 단계는,
진폭 상관 차 파라미터에 대해 다음의 수학식을 사용하여 진폭 제한을 수행하는 단계를 포함하고,
Figure pct00001
, 여기서
diff_lt_corr_limit는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터이고; diff_lt_corr는 진폭 상관 차 파라미터이고; RATIO_MAX는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 최대 값이고; RATIO_MIN는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 최소 값이고; RATIO_MAX > RATIO_MIN 이고; RATIO_MAX 의 값의 범위는 [1.0, 3.0]이고, RATIO_MAX 의 값은 1.0, 1.5, 3.0 등일 수 있고; RATIO_MIN 의 값 범위는 [-3.0, -1.0]이고, RATIO_MIN 의 값은 -1.0, -1.5, -3.0 등일 수 있다.
제 1 양태 또는 제 1 양태의 구현예 중 어느 하나와 관련하여, 제 1 양태의 구현예에서, 진폭 상관 차 파라미터에 대해 진폭 제한을 수행하여, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 획득하는 단계는,
진폭 상관 차 파라미터에 대해 다음의 수학식을 사용하여 진폭 제한을 수행하는 단계를 포함하고,
Figure pct00002
, 여기서
diff_lt_corr_limit는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터이고; diff_lt_corr는 진폭 상관 차 파라미터이고; RATIO_MAX는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 최대 값이고; RATIO_MAX 의 값의 범위는 [1.0, 3.0]이고, RATIO_MAX의 값은 1.0, 1.5, 3.0 등일 수 있다.
제 1 양태 또는 제 1 양태의 구현예 중 어느 하나와 관련하여, 제 1 양태의 구현예에서, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 매핑하여, 매핑된 진폭 상관 차 파라미터를 획득하는 단계는,
진폭 상관 차 파라미터를 다음의 수학식을 사용하여 매핑하는 단계를 포함하고,
Figure pct00003
, 여기서
Figure pct00004
;
Figure pct00005
또는
Figure pct00006
;
Figure pct00007
;
Figure pct00008
또는
Figure pct00009
;
Figure pct00010
;
Figure pct00011
또는
Figure pct00012
;
diff_lt_corr_limit는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터이고, diff_lt_corr_map은 매핑된 진폭 상관 차 파라미터이고, MAP_MAX는 매핑된 진폭 상관 차 피라미터의 최대 값이고, MAP_HIGH는 매핑된 진폭 상관 차 파라미터의 값의 높은 임계치이고, MAP_LOW는 매핑된 진폭 상관 차 파라미터의 값의 낮은 임계치이고, MAP_MIN은 매핑된 진폭 상관 차 파라미터의 최소 값이고, MAP_MAX > MAP_HIGH > MAP_LOW > MAP_MIN이고, MAP_MAX의 범위는 [2.0, 2.5]이고 특정 값은 2.0, 2.2, 2.5 등일 수 있고, MAP_HIGH의 값 범위는 [1.2, 1.7]이고 특정 값은 1.2, 1.5, 1.7 등일 수 있고, MAP_LOW의 값 범위는 [0.8, 1.3]이고 특정 값은 0.8, 1.0, 1.3 등일 수 있으며, MAP_MIN의 값 범위는 [0.0, 0.5]이고 특정 값은 0.0, 0.3, 0.5 등이며;
RATIO_MAX는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 최대 값이고, RATIO_HIGH는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 높은 임계치이고, RATIO_LOW는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 낮은 임계치이고, RATIO_MIN은 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 최소 값이고, RATIO_MAX > RATIO_HIGH > RATIO_LOW > RATIO_MIN이고, 여기서 RATIO_MAX RATIO_MIN의 값에 대해서는 전술한 설명을 참조하고, RATIO_HIGH의 값 범위는 [0.5, 1.0]이고 특정 값은 0.5, 1.0, 0.75 등일 수 있으며, RATIO_LOW의 값 범위는 [-1.0, -0.5]이고 특정 값은 -0.5, -1.0, -0.75 등일 수 있다.
제 1 양태 또는 제 1 양태의 구현예 중 어느 하나와 관련하여, 제 1 양태의 구현예에서, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 매핑하여, 매핑된 진폭 상관 차 파라미터를 획득하는 단계는,
진폭 상관 차 파라미터를 다음의 수학식을 사용하여 매핑하는 단계를 포함하고,
Figure pct00013
, 여기서
diff_lt_corr_map는 매핑된 진폭 상관 차 파라미터이고, diff_lt_corr_limit는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터이고, RATIO_MAX는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 최대 값이고, RATIO_MAX의 값 범위는 [1.0, 3.0]이다.
제 1 양태 또는 제 1 양태의 구현예 중 어느 하나와 관련하여, 제 1 양태의 구현예에서, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 매핑하여, 매핑된 진폭 상관 차 파라미터를 획득하는 단계는,
진폭 상관 차 파라미터를 다음의 수학식을 사용하여 매핑하는 단계를 포함하고,
Figure pct00014
, 여기서
diff_lt_corr_map는 매핑된 진폭 상관 차 파라미터이고; diff_lt_corr_limit는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터이고; a의 값 범위는 [0, 1]이고, 예를 들어 a의 값은 0, 0.3, 0.5, 0.7, 1 등일 수 있고, b의 값 범위는 [1.5, 3]이고, 예를 들어 b의 값은 1.5, 2, 2.5, 3 등일 수 있으며;c의 값 범위는 [0, 0.5]이고, 예를 들어 c의 값은 0, 0.1, 0.3, 0.4, 0.5 등일 수 있다.
제 1 양태 또는 제 1 양태의 구현예 중 어느 하나와 관련하여, 제 1 양태의 구현예에서, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 매핑하여, 매핑된 진폭 상관 차 파라미터를 획득하는 단계는,
진폭 상관 차 파라미터를 다음의 수학식을 사용하여 매핑하는 단계를 포함하고,
Figure pct00015
, 여기서
diff_lt_corr_map는 매핑된 진폭 상관 차 파라미터이고; diff_lt_corr_limit는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터이고; a의 값 범위는 [0.08, 0.12]이고, 예를 들어 a의 값은 0.08, 0.1, 0.12 등일 수 있고; b의 값 범위는 [0.03, 0.07]이고, 예를 들어 b의 값은 0.03, 0.05, 0.07 등일 수 있으며; c의 값 범위는 [0.1, 0.3]이고, 예를 들어 c의 값은 0.1, 0.2, 0.3 등일 수 있다.
제 1 양태 또는 제 1 양태의 구현예 중 어느 하나와 관련하여, 제 1 양태의 구현예에서, 매핑된 진폭 상관 차 파라미터를 현재 프레임의 채널 조합 비율 인자로 변환하는 단계는,
매핑된 진폭 상관 차 파라미터를 다음의 수학식을 사용하여 현재 프레임의 채널 조합 비율 인자로 변환하는 단계를 포함하고,
Figure pct00016
, 여기서
ratio_SM은 현재 프레임의 채널 조합 비율 인자이고, diff_lt_corr_map는 매핑된 진폭 상관 차 파라미터이다.
제 1 양태 또는 제 1 양태의 구현예 중 어느 하나와 관련하여, 제 1 양태의 구현예에서, 현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 획득하는 단계는,
현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 현재 프레임의 기준 채널 신호를 결정하는 단계와,
지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 좌측 채널 진폭 상관 파라미터 및 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 우측 채널 진폭 상관 파라미터를 계산하는 단계와,
좌측 채널 진폭 상관 파라미터 및 우측 채널 진폭 상관 파라미터에 기초하여 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 계산하는 단계를 포함한다.
제 1 양태 또는 제 1 양태의 구현예 중 어느 하나와 관련하여, 제 1 양태의 구현예에서, 좌측 채널 진폭 상관 파라미터 및 우측 채널 진폭 상관 파라미터에 기초하여 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 계산하는 단계는,
좌측 채널 진폭 상관 파라미터에 기초하여 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터를 결정하는 단계와,
우측 채널 진폭 상관 파라미터에 기초하여 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터를 결정하는 단계와,
장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터 및 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터에 기초하여 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 결정하는 단계를 포함한다.
제 1 양태 또는 제 1 양태의 구현예 중 어느 하나와 관련하여, 제 1 양태의 구현예에서, 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터 및 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터에 기초하여 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 결정하는 단계는,
현재 프레임을 구성하는 장기간 평활화 이후에 획득된 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 다음의 수학식을 사용하여 결정하는 단계를 포함하고,
Figure pct00017
, 여기서
diff_lt_corr는 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터이고, tdm_lt_corr_LM_SM cur 는 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터이고, tdm_lt_corr_RM_SM cur 는 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터이다.
제 1 양태 또는 제 1 양태의 구현예 중 어느 하나와 관련하여, 제 1 양태의 구현예에서, 좌측 채널 진폭 상관 파라미터에 기초하여 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터를 결정하는 단계는,
장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터 tdm_lt_corr_LM_SM cur 를 다음의 수학식을 사용하여 결정하는 단계를 포함하고,
Figure pct00018
, 여기서
tdm_lt_corr_LM_SM pre 는 장기간 평활화 이후에 획득되고 현재 프레임의 이전 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터이고, α는 평활화 인자이고, α의 값 범위는 [0, 1]이고, corr_LM은 좌측 채널 진폭 상관 파라미터이며;
우측 채널 진폭 상관 파라미터에 기초하여 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터를 결정하는 단계는,
장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터 tdm_lt_corr_RM_SM cur 를 다음의 수학식을 사용하여 결정하는 단계를 포함하고,
Figure pct00019
, 여기서
tdm_lt_corr_RM_SM pre 장기간 평활화 이후에 획득되고 현재 프레임의 이전 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터이고, β는 평활화 인자이고, β의 값 범위는 [0, 1]이며, corr_RM은 좌측 채널 진폭 상관 파라미터이다.
제 1 양태 또는 제 1 양태의 구현예 중 어느 하나와 관련하여, 제 1 양태의 구현예에서, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 좌측 채널 진폭 상관 파라미터 및 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 우측 채널 진폭 상관 파라미터를 계산하는 단계는,
지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 좌측 채널 진폭 상관 파라미터 corr_LM을 다음의 수학식을 사용하여 결정하는 단계 -
Figure pct00020
, 여기서
Figure pct00021
는 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호이고, N은 현재 프레임의 프레임 길이이고, mono_i(n)은 기준 채널 신호임 - 와,
지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 좌측 채널 진폭 상관 파라미터 corr_RM을 다음의 수학식을 사용하여 결정하는 단계를 포함하고,
Figure pct00022
,여기서
Figure pct00023
는 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호이다.
본 발명의 제 2 양태에 따르면, 스테레오 인코더가 제공되고 스테레오 인코더는 프로세서 및 메모리를 포함하며, 메모리는 실행 가능 명령어를 저장하고, 실행 가능 명령어는 프로세서로 하여금 제 1 양태 또는 제 1 양태의 구현예 중 어느 하나에 따른 방법을 수행하도록 명령하는데 사용된다.
본 발명의 제 3 양태에 따르면, 스테레오 인코더가 제공되고 스테레오 인코더는,
스테레오 오디오 신호의 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호 및 우측 채널 시간 도메인 신호에 대해 시간 도메인 전처리를 수행하여, 현재 프레임을 구성하는 전처리된 좌측 채널 시간 도메인 신호 및 전처리된 우측 채널 시간 도메인 신호를 획득하도록 구성된 전처리 유닛 - 시간 도메인 전처리는 필터링 처리를 포함할 수 있고, 특히 고역 통과 필터링 처리일 수 있음 - 과,
현재 프레임을 구성하는 전처리된 좌측 채널 시간 도메인 신호 및 전처리된 우측 채널 시간 도메인 신호에 대해 지연 정렬 처리를 수행하여, 현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호를 획득하도록 구성된 지연 정렬 처리 유닛과,
현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 현재 프레임의 채널 조합 솔루션을 결정하도록 구성된 솔루션 결정 유닛 - 채널 조합 솔루션은 포지티브형 신호 채널 조합 솔루션 또는 네거티브형 신호 채널 조합 솔루션을 포함할 수 있음 - 과,
현재 프레임의 결정된 채널 조합 솔루션 및 현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호와 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 현재 프레임의 양자화된 채널 조합 비율 인자 및 양자화된 채널 조합 비율 인자의 인코딩 인덱스를 획득하도록 구성된 인자 획득 유닛 - 포지티브형 신호 채널 조합 솔루션 및 네거티브형 신호 채널 조합 솔루션에 대응하는 양자화된 채널 조합 비율 인자 및 양자화된 채널 조합 비율 인자의 인코딩 인덱스를 획득하기 위한 방법은 상이함 - 과,
현재 프레임의 결정된 채널 조합 솔루션에 기초하여 현재 프레임의 인코딩 모드를 결정하도록 구성된 모드 결정 유닛과,
현재 프레임의 인코딩 모드 및 현재 프레임의 양자화된 채널 조합 비율 인자에 기초하여, 현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 정렬 이후에 획득된 우측 채널 시간 도메인 신호를 다운 믹싱하여, 현재 프레임의 1차 채널 신호 및 2차 채널 신호를 획득하도록 구성된 신호 획득 유닛과,
현재 프레임의 1차 채널 신호 및 2차 채널 신호를 인코딩하도록 구성된 인코딩 유닛을 포함한다.
제 3 양태를 참조하면, 제 3 양태의 구현예에서, 솔루션 결정 유닛은 구체적으로,
현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 현재 프레임의 신호 타입을 결정 - 신호 타입은 포지티브형 신호 또는 네거티브형 신호를 포함함 - 하고,
적어도 현재 프레임의 신호 타입에 기초하여 대응적으로 현재 프레임의 채널 조합 솔루션을 결정하도록 구성될 수 있고, 여기서 채널 조합 솔루션은 네거티브형 신호를 처리하기 위해 사용되는 네거티브형 신호 채널 조합 솔루션 또는 포지티브형 신호를 처리하기 위해 사용되는 포지티브형 신호 채널 조합 솔루션을 포함한다.
제 3 양태 또는 제 3 양태의 전술한 구현예와 관련하여, 제 3 양태의 구현예에서, 현재 프레임의 채널 조합 솔루션이 네거티브형 신호를 처리하기 위해 사용되는 네거티브형 신호 채널 조합 솔루션이면, 인자 획득 유닛은 구체적으로,
현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 획득하고,
진폭 상관 차 파라미터를 현재 프레임의 채널 조합 비율 인자로 변환하고,
현재 프레임의 채널 조합 비율 인자를 양자화하여, 현재 프레임의 양자화된 채널 조합 비율 인자 및 양자화된 채널 조합 비율 인자의 인코딩 인덱스를 획득하도록 구성될 수 있다.
제 3 양태 또는 제 3 양태의 구현예 중 어느 하나와 관련하여, 제 3 양태의 구현예에서, 현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 획득할 때, 인자 획득 유닛은 구체적으로,
현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 현재 프레임의 기준 채널 신호를 결정하고,
지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 좌측 채널 진폭 상관 파라미터 및 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 우측 채널 진폭 상관 파라미터를 계산하고,
좌측 채널 진폭 상관 파라미터 및 우측 채널 진폭 상관 파라미터에 기초하여 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 계산하도록 구성될 수 있다.
제 3 양태 또는 제 3 양태의 구현예 중 어느 하나와 관련하여, 제 3 양태의 구현예에서, 좌측 채널 진폭 상관 파라미터 및 우측 채널 진폭 상관 파라미터에 기초하여 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 계산할 때, 상기 인자 획득 유닛은 구체적으로,
좌측 채널 진폭 상관 파라미터에 기초하여 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터를 결정하고,
우측 채널 진폭 상관 파라미터에 기초하여 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터를 결정하고,
장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터 및 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터에 기초하여 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 결정하도록 구성될 수 있다.
제 3 양태 또는 제 3 양태의 구현예 중 어느 하나와 관련하여, 제 3 양태의 구현예에서, 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터 및 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터에 기초하여 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 결정할 때, 인자 획득 유닛은 구체적으로,
현재 프레임을 구성하는 장기간 평활화 이후에 획득된 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 다음의 수학식을 사용하여 결정하도록 구성될 수 있고,
Figure pct00024
, 여기서
diff_lt_corr는 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터이고, tdm_lt_corr_LM_SM cur 는 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터이고, tdm_lt_corr_RM_SM cur 는 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터이다.
제 3 양태 또는 제 3 양태의 구현예 중 어느 하나와 관련하여, 제 3 양태의 구현예에서, 좌측 채널 진폭 상관 파라미터에 기초하여 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터를 결정할 때, 인자 획득 유닛은 구체적으로,
장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터 tdm_lt_corr_LM_SM cur 를 다음의 수학식을 사용하여 결정하도록 구성될 수 있고:
Figure pct00025
, 여기서
tdm_lt_corr_LM_SM pre 는 장기간 평활화 이후에 획득되고 현재 프레임의 이전 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터이고, α는 평활화 인자이고, α의 값 범위는 [0, 1]이고, corr_LM은 좌측 채널 진폭 상관 파라미터이며;
우측 채널 진폭 상관 파라미터에 기초하여 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터를 결정하는 것은,
장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터 tdm_lt_corr_RM_SM cur 를 다음의 수학식을 사용하여 결정하는 것을 포함하고,
Figure pct00026
, 여기서
tdm_lt_corr_RM_SM pre 장기간 평활화 이후에 획득되고 현재 프레임의 이전 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터이고, β는 평활화 인자이고, β의 값 범위는 [0, 1]이며, corr_RM은 좌측 채널 진폭 상관 파라미터이다.
제 3 양태 또는 제 3 양태의 구현예 중 어느 하나와 관련하여, 제 3 양태의 구현예에서, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 좌측 채널 진폭 상관 파라미터 및 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 우측 채널 진폭 상관 파라미터를 계산할 때, 인자 획득 유닛은 구체적으로,
지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 좌측 채널 진폭 상관 파라미터 [ ]를 다음의 수학식을 사용하여 결정 -
Figure pct00027
, 여기서
Figure pct00028
는 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호이고, N은 현재 프레임의 프레임 길이이고, mono_i(n)은 기준 채널 신호임 - 하고,
지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 좌측 채널 진폭 상관 파라미터 corr_RM을 다음의 수학식을 사용하여 결정하는 단계를 포함하고,
Figure pct00029
,여기서
Figure pct00030
는 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호이다.
제 3 양태 또는 제 3 양태의 구현예 중 어느 하나와 관련하여, 제 3 양태의 구현예에서, 진폭 상관 차 파라미터를 현재 프레임의 채널 조합 비율 인자로 변환할 때, 인자 획득 유닛은 구체적으로,
진폭 상관 차 파라미터에 대해 매핑 처리를 수행하여 매핑된 진폭 상관 차 파라미터를 획득 - 매핑된 진폭 상관 차 파라미터의 값은 미리 설정된 진폭 상관 차 파라미터 값 범위 내에 있음 - 하고,
매핑된 진폭 상관 차 파라미터를 현재 프레임의 채널 조합 비율 인자로 변환하도록 구성될 수 있다.
제 3 양태 또는 제 3 양태의 구현예 중 어느 하나와 관련하여, 제 3 양태의 구현예에서, 진폭 상관 차 파라미터에 대해 매핑 처리를 수행할 때, 인자 획득 유닛은 구체적으로,
진폭 상관 차 파라미터에 대해 진폭 제한을 수행하여, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 획득 - 진폭 제한은 세그먼트화된 진폭 제한 또는 비 세그먼트화된 진폭 제한일 수 있고, 진폭 제한은 선형 진폭 제한 또는 비 선형 진폭 제한일 수 있음 - 하고,
진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 매핑하여 매핑된 진폭 상관 차 파라미터를 획득하도록 구성될 수 있고, 여기서 매핑은 세그먼트화된 매핑 또는 비 세그먼트화된 매핑일 수 있으며, 매핑은 선형 매핑 또는 비선형 매핑일 수 있다.
제 3 양태 또는 제 3 양태의 구현예 중 어느 하나와 관련하여, 제 3 양태의 구현예에서, 진폭 상관 차 파라미터에 대해 매핑 처리를 수행하여, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 획득할 때, 인자 획득 유닛은 구체적으로,
진폭 상관 차 파라미터에 대해 다음의 수학식을 사용하여 진폭 제한을 수행하도록 구성될 수 있고,
Figure pct00031
, 여기서
diff_lt_corr_limit는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터이고, diff_lt_corr는 진폭 상관 차 파라미터이고, RATIO_MAX는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 최대 값이고, RATIO_MIN은 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 최소 값이고, RATIO_MAX > RATIO_MIN 이며; RATIO_MAXRATIO_MIN의 값에 대해서는 전술한 설명을 참조하고, 상세한 내용은 다시 설명되지 않는다.
제 3 양태 또는 제 3 양태의 구현예 중 어느 하나와 관련하여, 제 3 양태의 구현예에서, 진폭 상관 차 파라미터에 대해 진폭 제한을 수행하여, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 획득할 때, 인자 획득 유닛은 구체적으로,
진폭 상관 차 파라미터에 대해 다음의 수학식을 사용하여 진폭 제한을 수행하도록 구성될 수 있고,
Figure pct00032
, 여기서
diff_lt_corr_limit는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터이고, diff_lt_corr는 진폭 상관 차 파라미터이고, RATIO_MAX는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 최대 값이다.
제 3 양태 또는 제 3 양태의 구현예 중 어느 하나와 관련하여, 제 3 양태의 구현예에서, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 매핑하여, 매핑된 진폭 상관 차 파라미터를 획득할 때, 인자 획득 유닛은 구체적으로,
진폭 상관 차 파라미터를 다음의 수학식을 사용하여 매핑하도록 구성될 수 있고,
Figure pct00033
, 여기서
Figure pct00034
;
Figure pct00035
또는
Figure pct00036
;
Figure pct00037
;
Figure pct00038
또는
Figure pct00039
;
Figure pct00040
;
Figure pct00041
또는
Figure pct00042
;
diff_lt_corr_limit는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터이고, diff_lt_corr_map는 매핑된 진폭 상관 차 파라미터이고, MAP_MAX는 매핑된 진폭 상관 차 피라미터의 최대 값이고, MAP_HIGH는 매핑된 진폭 상관 차 파라미터의 값의 높은 임계치이고, MAP_LOW는 매핑된 진폭 상관 차 파라미터의 값의 낮은 임계치이고, MAP_MIN은 매핑된 진폭 상관 차 파라미터의 최소 값이고, MAP_MAX > MAP_HIGH > MAP_LOW > MAP_MIN이며, MAP_MAX, MAP_HIGH, MAP_LOW, MAP_MIN의 특정 값에 대해서는 전술한 설명을 참조하고, 상세한 내용은 다시 설명되지 않으며;
RATIO_MAX는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 최대 값이고, RATIO_HIGH는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 높은 임계치이고, RATIO_LOW는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 낮은 임계치이고, RATIO_MIN은 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 최소 값이고, RATIO_MAX > RATIO_HIGH > RATIO_LOW > RATIO_MIN이이며, RATIO_HIGHRATIO_LOW의 값에 대해서는 전술한 설명을 참조하고, 상세한 내용은 다시 설명되지 않는다.
제 3 양태 또는 제 3 양태의 구현예 중 어느 하나와 관련하여, 제 3 양태의 구현예에서, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 매핑하여, 매핑된 진폭 상관 차 파라미터를 획득할 때, 인자 획득 유닛은 구체적으로,
진폭 상관 차 파라미터를 다음의 수학식을 사용하여 매핑하도록 구성될 수 있고,
Figure pct00043
, 여기서
diff_lt_corr_map는 매핑된 진폭 상관 차 파라미터이고, diff_lt_corr_limit는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터이고, RATIO_MAX는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 최대 값이다.
제 3 양태 또는 제 3 양태의 구현예 중 어느 하나와 관련하여, 제 3 양태의 구현예에서, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 매핑하여, 매핑된 진폭 상관 차 파라미터를 획득할 때, 인자 획득 유닛은 구체적으로,
진폭 상관 차 파라미터를 다음의 수학식을 사용하여 매핑하도록 구성될 수 있고,
Figure pct00044
, 여기서
diff_lt_corr_map는 매핑된 진폭 상관 차 파라미터이고; diff_lt_corr_limit는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터이고; a의 값 범위는 [0, 1]이고, b의 값 범위는 [1.5, 3]이며, c의 값 범위는 [0, 0.5]이다.
제 3 양태 또는 제 3 양태의 구현예 중 어느 하나와 관련하여, 제 3 양태의 구현예에서, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 매핑하여, 매핑된 진폭 상관 차 파라미터를 획득할 때, 인자 획득 유닛은 구체적으로,
진폭 상관 차 파라미터를 다음의 수학식을 사용하여 매핑하도록 구성될 수 있고,
Figure pct00045
, 여기서
diff_lt_corr_map는 매핑된 진폭 상관 차 파라미터이고; diff_lt_corr_limit는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터이고; a의 값 범위는 [0.08, 0.12]이고, b의 값 범위는 [0.03, 0.07]이며, c의 값 범위는 [0.1, 0.3]이다.
제 3 양태 또는 제 3 양태의 구현예 중 어느 하나와 관련하여, 제 3 양태의 구현예에서, 매핑된 진폭 상관 차 파라미터를 현재 프레임의 채널 조합 비율 인자로 변환할 때, 인자 획득 유닛은 구체적으로,
매핑된 진폭 상관 차 파라미터를 다음의 수학식을 사용하여 현재 프레임의 채널 조합 비율 인자로 변환하도록 구성될 수 있고,
Figure pct00046
, 여기서
ratio_SM은 현재 프레임의 채널 조합 비율 인자이고, diff_lt_corr_map는 매핑된 진폭 상관 차 파라미터이다.
본 발명의 제 4 양태는 실행 가능 명령어를 저장하도록 구성된 컴퓨터 저장 매체를 제공하고, 실행 가능 명령어가 실행될 때, 제 1 양태 및 제 1 양태의 가능한 구현예에서의 임의의 방법이 구현될 수 있다.
본 발명의 제 5 양태는 컴퓨터 프로그램을 제공하고, 컴퓨터 프로그램이 실행될 때, 제 1 양태 및 제 1 양태의 가능한 구현예에서의 임의의 방법이 구현될 수 있다.
본 발명의 제 2 양태 및 제 2 양태의 가능한 구현예에서 제공된 스테레오 인코더 중 임의의 인코더는 이동 전화, 퍼스널 컴퓨터, 태블릿 컴퓨터, 또는 웨어러블 디바이스일 수 있다.
본 발명의 제 3 양태 및 제 3 양태의 가능한 구현예에서 제공된 스테레오 인코더 중 임의의 인코더는 이동 전화, 퍼스널 컴퓨터, 태블릿 컴퓨터 또는 웨어러블 디바이스일 수 있다.
본 발명의 실시예에서 제공되는 전술한 기술적 해결책으로부터, 스테레오 인코딩이 본 발명의 실시예에서 수행될 때, 현재 프레임의 채널 조합 인코딩 솔루션이 먼저 결정되고, 그런 다음 결정된 채널 조합 인코딩 솔루션에 기초하여 현재 프레임의 양자화된 채널 조합 비율 인자 및 양자화된 채널 조합 비율 인자의 인코딩 인덱스가 획득되어, 현재 프레임의 획득된 1차 채널 신호 및 2차 채널 신호가 현재 프레임의 특성을 충족시킴으로써, 인코딩 이후에 획득된 합성된 스테레오 오디오 신호의 사운드 이미지가 안정적이고, 드리프트 현상이 줄어들며, 인코딩 품질이 향상되는 것이 보장된다는 것을 체득할 수 있다.
도 1은 본 발명의 실시예에 따른 스테레오 인코딩 방법의 흐름도이다.
도 2는 본 발명의 실시예에 따른 채널 조합 비율 인자 및 인코딩 인덱스를 획득하기 위한 방법의 흐름도이다.
도 3은 본 발명의 실시예에 따른 진폭 상관 차 파라미터를 획득하기 위한 방법의 흐름도이다.
도 4는 본 발명의 실시예에 따른 매핑 처리 방법의 흐름도이다.
도 5(a)는 본 발명의 실시예에 따른 진폭 제한 이후에 획득된 진폭 상관 차 파라미터와 매핑된 진폭 상관 차 파라미터 사이의 매핑 관계의 다이어그램이다.
도 5(b)는 본 발명의 실시예에 따른 처리 이후에 획득된 매핑된 진폭 상관 차 파라미터의 개략도이다.
도 6(a)는 본 발명의 다른 실시예에 따른 진폭 제한 이후에 획득된 진폭 상관 차 파라미터와 매핑된 진폭 상관 차 파라미터 사이의 매핑 관계의 다이어그램이다.
도 6(b)는 본 발명의 다른 실시예에 따른 처리 이후에 획득된 매핑된 진폭 상관 차 파라미터의 개략도이다.
도 7은 본 발명의 다른 실시예에 따른 스테레오 인코딩 방법의 흐름도이다.
도 8은 본 발명의 실시예에 따른 스테레오 인코딩 디바이스의 구조도이다.
도 9는 본 발명의 다른 실시예에 따른 스테레오 인코딩 디바이스의 구조도이다.
도 10은 본 발명의 실시예에 따른 컴퓨터의 구조도이다.
아래에서 본 발명의 실시예의 기술적 해결책이 본 발명의 실시예의 첨부 도면을 참조하여 명료하고 완전하게 설명된다. 명백하게, 설명된 실시예는 본 발명의 실시예의 일부에 불과할 뿐이지 전부는 아니다. 본 발명의 실시예에 기초하여 관련 기술분야에서 통상의 기술자에 의해 창의적인 노력없이 획득된 다른 모든 실시예는 본 발명의 보호 범위 내에 있다.
본 발명의 실시예에서 제공되는 스테레오 인코딩 방법은 컴퓨터를 이용하여 구현될 수 있다. 구체적으로, 스테레오 인코딩 방법은 퍼스널 컴퓨터, 태블릿 컴퓨터, 이동 전화, 웨어러블 디바이스 등을 사용하여 구현될 수 있다. 본 발명의 실시예에서 제공된 스테레오 인코딩 방법을 구현하기 위해 컴퓨터 상에는 특별한 하드웨어가 설치되거나, 또는 본 발명의 실시예에서 제공된 스테레오 인코딩 방법을 구현하기 위해 특별한 소프트웨어가 설치될 수 있다. 구현예에서, 본 발명의 실시예에서 제공된 스테레오 인코딩 방법을 구현하기 위한 컴퓨터(100)의 구조가 도 10에 도시되고, 적어도 하나의 프로세서(101), 적어도 하나의 네트워크 인터페이스(104), 메모리(105), 및 이들 장치 사이의 연결 및 통신을 구현하도록 구성된 적어도 하나의 통신 버스(102)를 포함한다. 프로세서(101)는 메모리(105)에 저장된 실행 가능 모듈을 실행하여 본 발명의 시퀀스 변환 방법을 구현하도록 구성된다. 실행 가능 모듈은 컴퓨터 프로그램일 수 있다. 시스템에서 컴퓨터(100)의 기능 및 시퀀스 변환 방법의 응용 시나리오에 따르면, 컴퓨터(100)는 적어도 하나의 입력 인터페이스(106) 및 적어도 하나의 출력 인터페이스(107)를 더 포함할 수 있다.
본 발명의 실시예에서, 스테레오 오디오 신호의 현재 프레임은 좌측 채널 시간 도메인 신호 및 우측 채널 시간 도메인 신호를 포함한다. 좌측 채널 시간 도메인 신호는 x L (n)으로서 표시되고, 우측 채널 시간 도메인 신호는 x R (n)으로서 도시되고, n은 샘플 번호이고, n=0, 1, ..., N-1 이며, N은 프레임 길이이다. 프레임 길이는 상이한 샘플링 레이트 및 상이한 길이의 신호 지속기간에 따라 달라진다. 예를 들어, 스테레오 오디오 신호의 샘플링 레이트가 16 KHz이고, 한 프레임의 신호의 지속기간이 20 ms 이면, 프레임 길이 N = 320, 즉, 프레임 길이는 320 샘플이다.
본 발명의 실시예에서 제공되는 스테레오 인코딩 방법의 절차는 도 1에 도시되며, 다음의 단계를 포함한다.
(101). 스테레오 오디오 신호의 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호 및 우측 채널 시간 도메인 신호에 대해 시간 도메인 전처리를 수행하여, 현재 프레임을 구성하는 전처리된 좌측 채널 시간 도메인 신호 및 전처리된 우측 채널 시간 도메인 신호를 획득한다.
시간 도메인 전처리는 구체적으로 필터링 처리를 포함할 수 있거나 공지된 다른 시간 도메인 전처리 방식일 수 있다. 시간 도메인 전처리의 특정 방식은 본 발명에서 제한되지 않는다.
예를 들면, 구현예에서, 시간 도메인 전처리는 고역 통과 필터링 처리이고, 고역 통과 필터링 처리 이후에 획득되는 신호는 현재 프레임을 구성하고 획득되는 전처리된 좌측 채널 시간 도메인 신호 및 전처리된 우측 채널 시간 도메인 신호이다. 예를 들어, 현재 프레임의 전처리된 좌측 채널 시간 도메인 신호는
Figure pct00047
으로서 표시되고, 현재 프레임의 전처리된 우측 채널 시간 도메인 신호는
Figure pct00048
으로서 표시될 수 있다.
(102). 현재 프레임을 구성하는 전처리된 좌측 채널 시간 도메인 신호 및 전처리된 우측 채널 시간 도메인 신호에 대해 지연 정렬 처리를 수행하여, 현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호를 획득한다.
지연 정렬은 스테레오 오디오 신호 처리에 흔히 사용되는 처리 방법이다. 지연 정렬을 위한 복수의 특정 구현 방법이 있다. 특정 지연 정렬 방법은 본 발명의 이러한 실시예에서 제한되지 않는다.
구현예에서, 현재 프레임을 구성하는 전처리된 좌측 채널 시간 도메인 신호 및 우측 채널 시간 도메인 신호에 기초하여 채널 간 지연 파라미터(inter-channel delay parameter)가 추출될 수 있고, 추출된 채널 간 지연 파라미터가 양자화되며, 그런 다음 양자화된 채널 간 지연 파라미터에 기초하여 현재 프레임을 구성하는 전처리된 좌측 채널 시간 도메인 신호 및 전처리된 우측 채널 시간 도메인 신호에 대해 지연 정렬 처리가 수행된다. 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호는
Figure pct00049
로서 표시될 수 있고, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호는
Figure pct00050
로서 나타낼 수 있다. 채널 간 지연 파라미터는 채널 간 시간차 및 채널 간 위상차 중 적어도 하나를 포함할 수 있다.
다른 구현예에서, 좌측 채널과 우측 채널 사이의 시간 도메인 상호 상관 함수가 현재 프레임의 전처리된 좌측 채널 시간 도메인 신호 및 우측 채널 시간 도메인 신호에 기초하여 계산될 수 있고; 그런 다음 채널 간 지연차가 시간 도메인 상호 상관 함수의 최대 값에 기초하여 결정되며; 결정된 채널 간 지연차가 양자화된 이후에, 양자화된 채널 간 지연차에 기초하여, 하나의 오디오 채널 신호가 기준으로서 선택되고, 다른 오디오 채널 신호에 대해 지연 조정이 수행되어, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호 및 우측 채널 시간 도메인 신호를 획득한다. 선택된 오디오 채널 신호는 현재 프레임의 전처리된 좌측 채널 시간 도메인 신호 또는 현재 프레임의 전처리된 우측 채널 시간 도메인 신호일 수 있다.
(103). 현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 현재 프레임의 채널 조합 솔루션을 결정한다.
구현예에서, 현재 프레임은 지연 정렬을 거치고 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 우측 채널 시간 도메인 신호 사이의 상이한 위상차에 기초하여 네거티브형 신호 또는 포지티브형 신호로 분류될 수 있다. 포지티브형 신호의 처리 및 네거티브형 신호의 처리는 상이할 수 있다. 그러므로 네거티브형 신호 및 포지티브형 신호의 상이한 처리에 기초하여, 현재 프레임의 채널 조합에 대해 두 개의 채널 조합 솔루션: 포지티브형 신호를 처리하기 위한 포지티브형 신호 채널 조합 솔루션 및 네거티브형 신호를 처리하기 위한 네거티브형 신호 채널 조합 솔루션이 선택될 수 있다.
구체적으로, 현재 프레임의 신호 타입은 현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 결정 - 신호 타입은 포지티브형 신호 또는 네거티브형 신호를 포함함 - 될 수 있고, 그런 다음 현재 프레임의 채널 조합 솔루션이 적어도 현재 프레임의 신호 타입에 기초하여 결정된다.
일부 구현예에서, 대응하는 채널 조합 솔루션은 현재 프레임의 신호 타입에 기초하여 직접적으로 선택될 수 있다는 것이 이해될 수 있다. 예를 들어, 현재 프레임이 포지티브형 신호일 때, 포지티브형 신호 채널 조합 솔루션이 직접적으로 선택되거나, 현재 프레임이 네거티브형 신호일 때, 네거티브형 신호 채널 조합 솔루션이 직접적으로 선택된다.
일부 다른 구현예에서, 현재 프레임의 채널 조합 솔루션이 선택될 때, 현재 프레임의 신호 타입 이외에, 현재 프레임의 신호 특성, 현재 프레임의 이전 K 개 프레임의 신호 타입 및 현재 프레임의 이전 K 개 프레임의 신호 특성 중 적어도 하나에 대한 기준이 만들어질 수 있다. 현재 프레임의 신호 특성은 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호 사이의 차 신호, 현재 프레임 의 신호 에너지 비율, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호의 신호 대 잡음 비, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호의 신호 대 잡음 비 등 적어도 하나를 포함할 수 있다. 현재 프레임의 이전 K 개 프레임은 현재 프레임의 이전 프레임을 포함할 수 있고, 현재 프레임의 이전 프레임의 이전 프레임 등을 더 포함할 수 있다는 것이 이해될 수 있다. K의 값은 1 이상의 정수이며, 이전 K 개 프레임은 시간 도메인에서 연속적일 수도 있고 시간 도메인에서 연속적이지 않을 수도 있다. 현재 프레임의 이전 K 개 프레임의 신호 특성은 현재 프레임의 신호 특성과 유사하다. 상세한 내용은 다시 설명되지 않는다.
(104). 현재 프레임의 결정된 채널 조합 솔루션, 및 현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 현재 프레임의 양자화된 채널 조합 비율 인자 및 양자화된 채널 조합 비율 인자의 인코딩 인덱스를 획득한다.
결정된 채널 조합 솔루션이 포지티브형 신호 채널 조합 솔루션일 때, 현재 프레임의 양자화된 채널 조합 비율 인자 및 양자화된 채널 조합 비율 인자의 인코딩 인덱스가 포지티브형 신호 채널 조합 솔루션에 기초하여 획득된다. 결정된 채널 조합 솔루션이 네거티브형 신호 채널 조합 솔루션일 때, 현재 프레임의 양자화된 채널 조합 비율 인자 및 양자화된 채널 조합 비율 인자의 인코딩 인덱스가 네거티브형 신호 채널 조합 솔루션에 기초하여 획득된다.
현재 프레임의 양자화된 채널 조합 비율 인자 및 양자화된 채널 조합 비율 인자의 인코딩 인덱스를 구하는 특정 프로세스는 나중에 상세하게 설명된다.
(105). 현재 프레임의 결정된 채널 조합 솔루션에 기초하여 현재 프레임의 인코딩 모드를 결정한다.
현재 프레임의 인코딩 모드는 적어도 두 개의 미리 설정된 인코딩 모드에서 결정될 수 있다. 미리 설정된 인코딩 모드의 특정 수량 및 미리 설정된 인코딩 모드에 대응하는 특정 인코딩 처리 방식은 필요에 따라 설정되고 조정될 수 있다. 미리 설정된 인코딩 모드의 수량 및 미리 설정된 인코딩 모드에 대응하는 특정 인코딩 처리 방식은 본 발명의 이러한 실시예에서 제한되지 않는다.
구현예에서, 채널 조합 솔루션과 인코딩 모드 사이의 대응 관계는 미리 설정될 수 있다. 현재 프레임의 채널 조합 솔루션이 결정된 이후에, 현재 프레임의 인코딩 모드는 미리 설정된 대응 관계에 기초하여 직접적으로 결정될 수 있다.
다른 구현예에서, 채널 조합 솔루션 및 인코딩 모드를 결정하기 위한 알고리즘이 미리 설정될 수 있다. 알고리즘의 입력 파라미터는 적어도 채널 조합 솔루션을 포함한다. 현재 프레임의 채널 조합 솔루션이 결정된 이후에, 현재 프레임의 인코딩 모드는 미리 설정된 대응 관계에 기초하여 결정될 수 있다. 알고리즘의 입력은 현재 프레임의 일부 특성 및 현재 프레임의 이전 프레임의 특성을 더 포함할 수 있다. 현재 프레임의 이전 프레임은 적어도 현재 프레임의 이전 프레임을 포함할 수 있고, 현재 프레임의 이전 프레임은 시간 도메인에서 연속적일 수 있거나 시간 도메인에서 연속적이지 않을 수 있다.
(106). 현재 프레임의 인코딩 모드 및 현재 프레임의 양자화된 채널 조합 비율 인자에 기초하여, 현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호를 다운 믹싱하여, 현재 프레임의 1차 채널 신호 및 2차 채널 신호를 획득한다.
상이한 인코딩 모드는 상이한 다운 믹싱 처리에 대응할 수 있고, 다운 믹싱 동안, 양자화된 채널 조합 비율 인자는 다운 믹싱 처리를 위한 파라미터로서 사용될 수 있다. 다운 믹싱 처리는 기존의 복수의 다운 믹싱 방식 중 어느 하나의 방식으로 수행될 수 있으며, 특정 다운 믹싱 처리 방식은 본 발명의 실시예에서 제한되지 않는다.
(107). 현재 프레임의 1차 채널 신호 및 2차 채널 신호를 인코딩한다.
특정 인코딩 처리는 기존의 인코딩 모드에서 수행될 수 있으며, 특정 인코딩 방법은 본 발명의 실시예에서 제한되지 않는다. 현재 프레임의 1차 채널 신호 및 2차 채널 신호가 인코딩될 때, 현재 프레임의 1차 채널 신호 및 2차 채널 신호가 직접 인코딩될 수 있거나; 또는 현재 프레임의 1차 채널 신호 및 2차 채널 신호가 처리된 다음에, 현재 프레임의 처리된 1차 채널 신호 및 2차 채널 신호가 인코딩되거나; 또는 1차 채널 신호의 인코딩 인덱스 및 2차 채널 신호의 인코딩 인덱스가 인코딩될 수 있다는 것이 이해될 수 있다.
전술한 설명으로부터, 스테레오 인코딩이 본 실시예에서 수행될 때, 현재 프레임의 채널 조합 인코딩 솔루션이 먼저 결정되고, 그런 다음 결정된 채널 조합 인코딩 솔루션에 기초하여 현재 프레임의 양자화된 채널 조합 비율 인자 및 양자화된 채널 조합 비율 인자의 인코딩 인덱스가 획득되어, 현재 프레임의 획득된 1차 채널 신호 및 2차 채널 신호가 현재 프레임의 특성을 충족시킴으로써, 인코딩 이후에 획득된 합성된 스테레오 오디오 신호의 사운드 이미지가 안정적이고, 드리프트 현상이 줄어들며, 인코딩 품질이 향상되는 것이 보장된다는 것이 체득될 수 있다.
도 2는 본 발명의 실시예에 따른 현재 프레임의 양자화된 채널 조합 비율 인자 및 양자화된 채널 조합 비율 인자의 인코딩 인덱스를 획득하기 위한 방법의 절차를 설명한다. 이 방법은 현재 프레임의 채널 조합 솔루션이 네거티브형 신호를 처리하기 위해 사용되는 네거티브형 신호 채널 조합 솔루션일 때 수행될 수 있으며, 이 방법은 단계(104)의 특정 구현예로서 사용될 수 있다.
(201). 현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호 및 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 획득한다.
구현예에서, 단계(201)의 특정 구현예는 도 3에 도시될 수 있고, 다음의 단계를 포함한다.
(301). 현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 현재 프레임의 기준 채널 신호를 결정한다.
기준 채널 신호는 모노 신호라고 지칭될 수도 있다.
구현예에서, 현재 프레임의 기준 채널 신호 mono_i(n)는 다음의 수학식을 사용하여 획득될 수 있다.
Figure pct00051
(302). 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 좌측 채널 진폭 상관 파라미터 및 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 우측 채널 진폭 상관 파라미터를 계산한다.
구현예에서, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 좌측 채널 진폭 상관 파라미터(corr_LM)는 다음의 수학식을 사용하여 결정될 수 있다:
Figure pct00052
구현예에서, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터(corr_RM)는 다음의 수학식을 사용하여 획득될 수 있다.
Figure pct00053
Figure pct00054
는 절대 값을 획득하는 것을 나타낸다.
(303). 좌측 채널 진폭 상관 파라미터 및 우측 채널 진폭 상관 파라미터에 기초하여 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 계산한다.
구현예에서, 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터 diff_lt_corr는 구체적으로 다음과 같은 방식으로 계산될 수 있다:
장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터 tdm_lt_corr_LM_SM cur corr_LM에 기초하여 결정되고, 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터 tdm_lt_corr_RM_SM cur corr_RM에 기초하여 결정되고, 여기서 tdm_lt_corr_LM_SM cur tdm_lt_corr_RM_SM cur 을 획득하는 특정 프로세스는 본 발명의 이러한 실시예에서 제한되지 않으며, 본 발명의 이러한 실시예에서 제공되는 획득 방식 이외에도, tdm_lt_corr_LM_SM cur tdm_lt_corr_RM_SM cur 을 획득하기 위해 사용될 수 있는 어떠한 종래 기술이라도 사용될 수 있으며,
장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터 diff_lt_corrtdm_lt_corr_LM_SM cur tdm_lt_corr_RM_SM cur 에 기초하여 계산되고, 여기서 구현예에서, diff_lt_corr는 다음의 수학식을 사용하여 획득될 수 있다:
Figure pct00055
(202). 진폭 상관 차 파라미터를 현재 프레임의 채널 조합 비율 인자로 변환한다.
진폭 상관 차 파라미터는 미리 설정된 알고리즘을 사용하여 현재 프레임의 채널 조합 비율 인자로 변환될 수 있다. 예를 들어, 구현예에서, 먼저 매핑 처리가 진폭 상관 차 파라미터에 대해 수행되어 매핑된 진폭 상관 차 파라미터를 획득 - 매핑된 진폭 상관 차 파라미터의 값은 미리 설정된 진폭 상관 차 파라미터 값 범위 내에 있음 - 할 수 있고; 그런 다음 매핑된 진폭 상관 차 파라미터가 현재 프레임의 채널 조합 비율 인자로 변환된다.
구현예에서, 매핑된 진폭 상관 차 파라미터는 다음의 수학식을 사용하여 현재 프레임의 채널 조합 비율 인자로 변환될 수 있고,
Figure pct00056
, 여기서
diff_lt_corr_map는 매핑된 진폭 상관 차 파라미터를 나타내고, ratio_SM은 현재 프레임의 채널 조합 비율 인자를 나타내며, cos(.)은 코사인 연산을 나타낸다.
(203). 현재 프레임의 채널 조합 비율 인자를 양자화하여, 현재 프레임의 양자화된 채널 조합 비율 인자 및 양자화된 채널 조합 비율 인자의 인코딩 인덱스를 획득한다.
양자화 및 인코딩은 현재 프레임의 채널 조합 비율 인자에 대해 수행되어, 현재 프레임의 네거티브형 신호 채널 조합 솔루션에 대응하고 양자화 및 인코딩 이후에 획득되는 초기 인코딩 인덱스 ratio_idx_init_SM 및 현재 프레임의 네거티브형 신호 채널 조합 솔루션에 대응하고 양자화 및 인코딩 후에 획득되는 초기 값 ratio_init_SM qua 가 획득될 수 있다. 구현예에서, ratio_idx_init_SMratio_init_SM qua 는 다음 관계를 충족시키고,
Figure pct00057
, 여기서
ratio_tabl_SM은 네거티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자의 스칼라 양자화를 위한 코드북이다.
양자화 및 인코딩이 현재 프레임의 채널 조합 비율 인자에 대해 수행될 때, 종래 기술의 임의의 스칼라 양자화 방법이 구체적으로 사용될 수 있는데, 예를 들면, 균일 스칼라 양자화 또는 비 균일 스칼라 양자화가 사용될 수 있다는 것을 알아야 한다. 구현예에서, 양자화 및 인코딩 동안 인코딩을 위한 비트의 양은 5 비트, 4 비트, 6 비트 등일 수 있다. 특정 양자화 방법은 본 발명에서 제한되지 않는다.
구현예에서, 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터 tdm_lt_corr_LM_SM cur 은 다음의 수학식을 사용하여 결정될 수 있고,
Figure pct00058
, 여기서
tdm_lt_corr_LM_SM pre 는 장기간 평활화 이후에 획득되고 현재 프레임의 이전 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터이고, α는 평활화 인자이고, α의 값 범위는 [0, 1]이며,corr_LM은 좌측 채널 진폭 상관 파라미터이다.
대응적으로, 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터 tdm_lt_corr_RM_SM cur 은 다음의 수학식을 사용하여 결정될 수 있고,
Figure pct00059
, 여기서
tdm_lt_corr_RM_SM pre 는 장기간 평활화 이후에 획득되고 현재 프레임의 이전 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터이고, β는 평활화 인자이고, β의 값 범위는 [0, 1]이고, corr_RM은 좌측 채널 진폭 상관 파라미터이고; 평활화 인자 α의 값과 평활화 인자 β의 값은 동일할 수도 있고 또는 상이할 수도 있다는 것이 이해될 수 있다.
구체적으로, 구현예에서, 단계(202)에서 진폭 상관 차 파라미터에 대해 매핑 처리를 수행하는 단계는 도 4에 도시되고, 구체적으로는 다음과 같은 단계를 포함할 수 있다.
(401). 진폭 상관 차 파라미터에 대해 진폭 제한을 수행하여, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 획득한다. 구현예에서, 진폭 제한은 세그먼트화된 진폭 제한 또는 비 세그먼트화된 진폭 제한일 수 있고, 진폭 제한은 선형 진폭 제한 또는 비선형 진폭 제한일 수 있다.
특정 진폭 제한은 미리 설정된 알고리즘을 사용함으로써 구현될 수 있다. 본 발명의 이러한 실시예에서 제공되는 진폭 제한을 설명하기 위해 다음과 같은 두 개의 특정 예가 사용된다. 다음의 두 개의 예는 단지 예시일 뿐이지 본 발명의 이러한 실시예에 대해 어떠한 제한도 구성하지 않으며, 진폭 제한이 수행될 때 다른 진폭 제한 방식이 사용될 수 있다는 것을 알아야 한다.
제 1 진폭 제한 방식:
진폭 제한은 진폭 상관 차 파라미터에 대해 다음의 수학식을 사용하여 수행되고,
Figure pct00060
, 여기서
diff_lt_corr_limit는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터이고; diff_lt_corr는 진폭 상관 차 파라미터이고, RATIO_MAX는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 최대 값이고, RATIO_MIN는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 최소 값이고, RATIO_MAX > RATIO_MIN이다. RATIO_MAX는 미리 설정된 경험적 값이다. 예를 들어, RATIO_MAX의 값 범위는 [1.0, 3.0] 일 수 있고, RATIO_MAX는 1.0, 2.0, 3.0 등일 수 있다. RATIO_MIN은 미리 설정된 경험적 값이다. 예를 들어, RATIO_MIN의 값 범위는 [-3.0, -1.0] 일 수 있고, RATIO_MIN은 -1.0, -2.0, -3.0 등일 수 있다. 본 발명의 이러한 실시예에서, RATIO_MAX의 특정 값 및 RATIO_MIN의 특정 값은 제한되지 않는다. 특정 값이 RATIO_MAX > RATIO_MIN를 충족하는 한, 본 발명의 이러한 실시예의 구현예는 영향을 받지 않는다.
제 2 진폭 제한 방식:
진폭 제한은 진폭 상관 차 파라미터에 대해 다음의 수학식을 사용하여 수행되고,
Figure pct00061
, 여기서
diff_lt_corr_limit는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터이고; diff_lt_corr는 진폭 상관 차 파라미터이고; RATIO_MAX는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 최대 값이다. RATIO_MAX는 미리 설정된 경험적 값이다. 예를 들어, RATIO_MAX의 값 범위는 [1.0, 3.0]일 수 있고, RATIO_MAX는 1.0, 1.5, 2.0, 3.0 등일 수 있다.
진폭 제한은 진폭 상관 차 파라미터에 대해 수행되어, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터가 미리 설정된 범위 내에 있도록 함으로써, 인코딩 이후에 획득된 합성된 스테레오 오디오 신호의 사운드 이미지가 안정적이고, 드리프트 현상이 줄어들며, 인코딩 품질이 향상되는 것이 더욱 보장될 수 있다.
(402). 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 매핑하여, 매핑된 진폭 상관 차 파라미터를 획득한다. 구현예에서, 매핑은 세그먼트화된 매핑 또는 비 세그먼트화된 매핑일 수 있고, 매핑은 선형 매핑 또는 비 선형 매핑일 수 있다.
특정 매핑은 미리 설정된 알고리즘을 사용함으로써 구현될 수 있다. 본 발명의 이러한 실시예에서 제공되는 매핑을 설명하기 위해 다음과 같은 네 개의 특정 예가 사용된다. 다음의 네 개의 예는 단지 예시일 뿐이지 본 발명의 이러한 실시예에 어떠한 제한도 구성하지 않으며, 매핑이 수행될 때 다른 매핑 방식이 사용될 수 있다는 것을 알아야 한다.
제 1 매핑 방식:
진폭 상관 차 파라미터는 다음의 수학식을 사용하여 매핑될 수 있고,
Figure pct00062
, 여기서
Figure pct00063
;
Figure pct00064
또는
Figure pct00065
;
Figure pct00066
;
Figure pct00067
또는
Figure pct00068
;
Figure pct00069
;
Figure pct00070
또는
Figure pct00071
;
diff_lt_corr_limit는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터이고, diff_lt_corr_map는 매핑된 진폭 상관 차 파라미터이고, MAP_MAX는 매핑된 진폭 상관 차 피라미터의 최대 값이고, MAP_HIGH는 매핑된 진폭 상관 차 파라미터의 값의 높은 임계치이고, MAP_LOW는 매핑된 진폭 상관 차 파라미터의 값의 낮은 임계치이고, MAP_MIN은 매핑된 진폭 상관 차 파라미터의 최소 값이고, MAP_MAX > MAP_HIGH > MAP_LOW > MAP_MIN이며, MAP_MAX, MAP_HIGH, MAP_LOW, 및 MAP_MIN는 모두 미리 설정된 경험적 값일 수 있다. 예를 들어, MAP_MAX의 값 범위는 [2.0, 2.5] 일 수 있고, 특정 값은 2.0, 2.2, 2.5 등일 수 있다. MAP_HIGH의 값 범위는 [1.2, 1.7] 일 수 있고, 특정 값은 1.2, 1.5, 1.7 등일 수 있다. MAP_LOW의 값 범위는 [0.8, 1.3] 일 수 있고, 특정 값은 0.8, 1.0, 1.3 등일 수 있다. MAP_MIN의 값 범위는 [0.0, 0.5] 일 수 있고, 특정 값은 0.0, 0.3, 0.5 등일 수 있다.
RATIO_MAX는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 최대 값이다. RATIO_HIGH는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 높은 임계치이다. RATIO_LOW는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 낮은 임계치이다. RATIO_MIN은 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 최소 값이다. RATIO_MAX > RATIO_HIGH > RATIO_LOW > RATIO_MIN이다. RATIO_MAX, RATIO_HIGH, RATIO_LOW RATIO_MIN은 모두 미리 설정된 경험적 값일 수 있다. RATIO_MAX RATIO_MIN의 값에 대해서는 전술한 설명을 참조한다. RATIO_HIGH의 값 범위는 [0.5, 1.0] 일 수 있고, 특정 값은 0.5, 1.0, 0.75 등일 수 있다. RATIO_MIN의 값 범위는 [-1.0, -0.5] 일 수 있고, 특정 값은 -0.5, -1.0, -0.75 등일 수 있다.
제 2 매핑 방식:
진폭 상관 차 파라미터는 다음의 수학식을 사용하여 매핑되고,
Figure pct00072
, 여기서
제 2 매핑 방식의 수학식에서 세그먼트 포인트 0.5*RATIO_MAX -0.5*RATIO_MAX는 적응적 결정 방식으로 결정될 수 있다. 적응 선택 인자는 지연 값: delay_com 일 수 있으며, 따라서 세그먼테이션 포인트 diff_lt_corr_limit_s는 다음과 같은 함수로 표현될 수 있다:
Figure pct00073
.
제 3 매핑 방식:
진폭 상관 차 파라미터에 대해 비선형 매핑이 다음의 수학식을 사용하여 수행되고,
Figure pct00074
, 여기서
diff_lt_corr_map는 매핑된 진폭 상관 차 파라미터이고; diff_lt_corr_limit는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터이고; a의 값 범위는 [0, 1]이고, 예를 들어 a의 값은 0, 0.3, 0.5, 0.7, 1 등일 수 있고; b의 값 범위는 [1.5, 3]이고, 예를 들어 b의 값은 1.5, 2, 2.5, 3 등일 수 있으며; c의 값 범위는 [0, 0.5]이고, 예를 들어 c의 값은 0, 0.1, 0.3, 0.4, 0.5 등일 수 있다.
예를 들어, a의 값이 0.5이고, b의 값이 2.0이고, c의 값이 0.3 일 때, diff_lt_corr_mapdiff_lt_corr_limit 사이의 매핑 관계는 도 5(a)에 도시된다. 도 5(a)로부터 diff_lt_corr_map의 값 변화가 [0.4, 1.8]이라는 것이 체득될 수 있다. 대응적으로, 도 5(a)에 도시된 diff_lt_corr_map 에 기초하여, 발명자는 분석을 위해 스테레오 오디오 신호의 세그먼트를 선택하며, 처리 이후에 획득된 스테레오 오디오 신호의 세그먼트의 상이한 프레임의 diff_lt_corr_map의 값은 도 5(b)에 도시된다. diff_lt_corr_map의 값이 상대적으로 작아서, 상이한 프레임의 diff_lt_corr_map 의 값의 차가 상대적으로 분명하게 드러나 보이기 때문에, 각각의 프레임의 diff_lt_corr_map는 아날로그 출력 동안 30000 배 확대된다. 도 5(b)로부터 상이한 프레임의 diff_lt_corr_map 의 변화 범위가 [9000, 15000]라는 것이 체득될 수 있다. 따라서, 대응하는 diff_lt_corr_map의 변화 범위는 [9000/30000, 15000/30000], 즉, [0.3, 0.5]이다. 처리된 스테레오 오디오 신호의 프레임 간 변동은 매끄러우며, 이에 따라 합성된 스테레오 오디오 신호의 사운드 이미지가 안정적이라는 것을 보장한다.
제 4 매핑 방식:
진폭 상관 차 파라미터는 다음의 수학식을 사용하여 매핑되고,
Figure pct00075
, 여기서
diff_lt_corr_map는 매핑된 진폭 상관 차 파라미터이고; diff_lt_corr_limit는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터이고; a의 값 범위는 [0.08, 0.12]이고, 예를 들어 a의 값은 0.08, 0.1, 0.12 등일 수 있고; b의 값 범위는 [0.03, 0.07]고, 예를 들어 b의 값은 0.03, 0.05, 0.07 등일 수 있으며; c의 값 범위는 [0.1, 0.3]이고, 예를 들어 c의 값은 0.1, 0.2, 0.3 등일 수 있다.
예를 들어, a의 값이 0.1이고, b의 값이 0.05이고, c의 값이 0.2 일 때, diff_lt_corr_mapdiff_lt_corr_limit 사이의 매핑 관계는 도 6(a)에 도시된다. 도 6(a)로부터, diff_lt_corr_map의 변화 범위가 [0.2, 1.4]이라는 것이 체득될 수 있다. 대응적으로, 도 6(a)에 도시된 diff_lt_corr_map에 기초하여, 발명자는 분석을 위해 스테레오 오디오 신호의 세그먼트를 선택하며, 처리 이후에 획득된 스테레오 오디오 신호의 세그먼트의 상이한 프레임의 diff_lt_corr_map의 값은 도 6(b)에 도시된다. diff_lt_corr_map의 값이 상대적으로 작아서, 상이한 프레임의 diff_lt_corr_map의 값의 차가 상대적으로 분명하게 드러나 보이기 때문에, 각각의 프레임의 diff_lt_corr_map는 아날로그 출력 동안 30000 배 확대된다. 도 6(b)로부터, 상이한 프레임의 diff_lt_corr_map의 변화 범위가 [4000, 14000]이라는 것이 체득될 수 있다. 그러므로 대응하는 diff_lt_corr_map의 변화 범위는 [4000/30000, 14000/30000], 즉, [0.133, 0.46]이다. 그러므로, 처리된 스테레오 오디오 신호의 프레임 간 변동은 매끄러우며, 이에 따라 합성된 스테레오 오디오 신호의 사운드 이미지가 안정적이라는 것을 보장한다.
진폭 제한 이후에 획득된 진폭 상관 차 파라미터가 매핑되어, 매핑된 진폭 상관 차 파라미터가 미리 설정된 범위 내에 있도록 함으로써, 인코딩 이후에 획득된 합성된 스테레오 오디오 신호의 사운드 이미지가 안정적이고, 드리프트 현상이 줄어들며, 인코딩 품질이 개선되는 것이 더욱 보장될 수 있다. 또한, 세그먼트화된 매핑이 사용될 때, 세그먼트화된 매핑을 위한 세그먼테이션 포인트가 지연 값에 기초하여 적응적으로 결정될 수 있어, 매핑된 진폭 상관 파라미터는 현재 프레임의 특성과 보다 일치하게 됨으로써, 인코딩 이후에 획득된 합성 스테레오 오디오 신호의 사운드 이미지가 안정적이고, 드리프트 현상이 줄어들며, 인코딩 품질이 개선된다.
도 7은 본 발명의 실시예에 따른 스테레오 신호를 인코딩하기 위한 방법의 절차를 도시한다. 절차는 다음의 단계를 포함한다.
(701). 스테레오 오디오 신호의 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호 및 우측 채널 시간 도메인 신호에 대해 시간 도메인 전처리를 수행하여, 현재 프레임을 구성하는 전처리된 좌측 채널 시간 도메인 신호 및 전처리된 우측 채널 시간 도메인 신호를 획득한다.
현재 프레임의 좌측 채널 시간 도메인 신호 및 우측 채널 시간 도메인 신호에 대해 시간 도메인 전처리를 수행하는 단계는 구체적으로: 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호 및 우측 채널 시간 도메인 신호에 대해 고역 통과 필터링 처리를 수행하여, 현재 프레임의 전처리된 좌측 채널 시간 도메인 신호 및 전처리된 우측 시간 도메인 신호를 획득하는 단계를 포함할 수 있다. 현재 프레임의 전처리된 좌측 시간 도메인 신호는
Figure pct00076
로서 표시되고, 현재 프레임의 전처리된 우측 시간 도메인 신호는
Figure pct00077
로서 표시될 수 있다.
구현예에서, 고역 통과 필터링 처리를 수행하는 필터는 차단 주파수가 20 Hz 인 무한 임펄스 응답(IIR: infinite impulse response) 필터일 수 있다. 물론, 처리는 다른 유형의 필터를 사용함으로써 수행될 수도 있다. 사용된 특정 필터의 유형은 본 발명의 이러한 실시예에서 제한되지 않는다. 예를 들어, 구현예에서, 16 KHz의 샘플링 레이트에 대응하는 컷오프 주파수가 20 Hz인 고역 통과 필터의 전달 함수는 다음과 같다:
Figure pct00078
b 0 = 0.994461788958195, b 1 = -1.988923577916390, b 2 = 0.994461788958195, a 1 = 1.988892905899653, a 2 = -0.988954249933127이고, z는 Z-변환의 변환 인자이고, 이에 대응하여,
Figure pct00079
이다.
(702). 현재 프레임을 구성하는 전처리된 좌측 채널 시간 도메인 신호 및 전처리된 우측 채널 시간 도메인 신호에 대해 지연 정렬 처리를 수행하여, 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호 및 우측 채널 시간 도메인 신호를 획득한다.
구체적인 구현에 대해서는 단계(102)의 구현예를 참조하며, 상세한 내용은 다시 설명되지 않는다.
(703). 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호 및 우측 채널 시간 도메인 신호에 대해 시간 도메인 분석을 수행한다.
구현예에서, 시간 도메인 분석은 과도 상태 검출(transient detection)을 포함할 수 있다. 과도 상태 검출은 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호 및 우측 채널 시간 도메인 신호에 대해 에너지 검출을 수행하여, 현재 프레임에서 에너지의 갑작스런 변화가 발생하는지를 검출할 수 있다. 예를 들어, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호의 에너지 E cur _ L 가 계산될 수 있으며, 지연 정렬 이후에 획득되고 이전 프레임을 구성하는 좌측 채널 시간 도메인 신호의 에너지 E pre _ L 와 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호의 에너지 E cur _ L 사이의 차이의 절대 값에 기초하여 과도 상태 검출이 수행되어, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호의 과도 상태 검출 결과가 획득된다.
지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호에 대해 과도 검출을 수행하기 위한 방법은 좌측 채널 시간 도메인 신호에 대해 과도 검출을 수행하는 방법과 동일할 수 있다. 상세한 내용은 다시 설명되지 않는다.
시간 도메인 분석의 결과가 후속의 1차 채널 신호 인코딩 및 2차 채널 신호 인코딩에 사용되기 때문에, 1차 채널 신호 인코딩 및 2차 채널 신호 인코딩 이전에 시간 도메인 분석이 수행되는 한, 본 발명의 구현예는 영향을 받지 않는다는 것을 알아야 한다. 시간 도메인 분석은 과도상태 검출 이외에, 대역 확장 전처리(band expansion preprocessing)와 같은 다른 시간 도메인 분석을 더 포함할 수 있다는 것이 이해될 수 있다.
(704). 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호 및 우측 채널 시간 도메인 신호에 기초하여 현재 프레임의 채널 조합 솔루션을 결정한다.
구현예에서, 현재 프레임의 채널 조합 솔루션을 결정하는 단계는 채널 조합 솔루션 초기 결정(channel combination initial decision) 및 채널 조합 솔루션 수정 결정(channel combination solution modification decision)을 포함한다. 다른 구현예에서, 현재 프레임의 채널 조합 솔루션을 결정하는 것은 채널 조합 솔루션 초기 결정을 포함하고 채널 조합 솔루션 수정 결정을 포함하지 않을 수 있다.
먼저 본 발명의 구현예의 채널 조합 초기 결정이 설명된다:
채널 조합 초기 결정은: 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호 및 우측 채널 시간 도메인 신호에 기초하여 채널 조합 솔루션 초기 결정을 수행하는 단계를 포함하고, 여기서 채널 조합 솔루션 초기 결정은 포지티브 및 네거티브 위상 타입 플래그 및 채널 조합 솔루션의 초기 값을 결정하는 단계를 포함한다. 상세한 내용은 다음과 같다.
A1. 현재 프레임의 포지티브 및 네거티브 위상 타입 플래그의 값을 결정한다.
현재 프레임의 포지티브 및 네거티브 위상 타입 플래그의 값이 결정될 때, 구체적으로는, 현재 프레임의 두 개의 시간 도메인 신호의 상관 값 xorr
Figure pct00080
Figure pct00081
에 기초하여 계산될 수 있고, 그 다음에 현재 프레임의 포지티브 및 네거티브 위상 타입 플래그가 xorr에 기초하여 결정된다. 예를 들어, 구현예에서, 가 포지티브 및 네거티브의 위상 타입 임계치 이하일 때, 포지티브 및 네거티브 위상 타입 플래그는 "1"로 설정되고, 또는 xorr이 포지티브 및 네거티브 위상 타입 임계치보다 클 때, 포지티브 및 네거티브 위상 타입 플래그는 0으로 설정된다. 포지티브 및 네거티브 위상 타입 임계치의 값은 예를 들어, 0.85, 0.92, 2, 2.5 등으로 미리 설정될 수 있다. 또한, 포지티브 및 네거티브 위상 타입 임계치의 특정 값은 경험에 기초하여 설정될 수 있고, 임계치의 특정 값은 본 발명의 이러한 실시예에서 제한되지 않는다.
일부 구현예에서, xorr는 현재 프레임의 신호 포지티브 및 네거티브 위상 타입 플래그의 값을 결정하기 위한 인자일 수 있다. 다시 말해서, 현재 프레임의 신호 포지티브 및 네거티브 위상 타입 플래그의 값이 결정될 때, xorr 뿐만 아니라, 또 다른 인자도 참조될 수 있다. 다른 인자는 다음과 같은 파라미터: 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호 사이의 차 신호, 현재 프레임의 신호 에너지 비율, 지연 정렬 이후에 획득되고 현재 프레임의 이전 N 개 프레임을 구성하는 좌측 채널 시간 도메인 신호와 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호 사이의 차 신호, 및 현재 프레임의 이전 N 개 프레임의 신호 에너지 비율 중 하나 이상일 수 있다. N은 1 이상의 정수이다. 현재 프레임의 이전 N 개 프레임은 시간 도메인에서 현재 프레임과 연속적인 N 개의 프레임이다.
현재 프레임의 획득된 포지티브 및 네거티브 위상 타입 플래그는 tmp_SM_flag로 표시된다. tmp_SM_flag가 1일 때, 이것은 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호가 네거티브형 신호임을 나타낸다. tmp_SM_flag가 0일 때, 이것은 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호가 포지티브형 신호임을 나타낸다.
A2. 현재 프레임의 채널 조합 솔루션 플래그의 초기 값을 결정한다.
현재 프레임의 포지티브 및 네거티브 위상 타입 플래그의 값이 이전 프레임의 채널 조합 솔루션 플래그의 값과 동일하면, 이전 프레임의 채널 조합 솔루션 플래그의 값은 현재 프레임의 채널 조합 솔루션 플래그의 초기 값으로서 사용된다.
현재 프레임의 포지티브 및 네거티브 위상 타입 플래그의 값이 이전 프레임의 채널 조합 솔루션 플래그의 값과 상이하면, 지연 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호의 신호대 잡음비 및 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호의 신호대 잡음비는 신호대 잡음비 임계치와 별도로 비교된다. 지연 정렬 이후에 회득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호의 신호 대 잡음비 및 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호의 신호 대 잡음비가 둘 모두 신호 대 잡음비 임계치보다 적으면, 현재 프레임의 포지티브 및 네거티브 위상 타입 플래그의 값은 현재 프레임의 채널 조합 솔루션 플래그의 초기 값으로서 사용되며; 그렇지 않으면, 이전 프레임의 채널 조합 솔루션의 값이 현재 프레임의 채널 조합 솔루션 플래그의 초기 값으로서 사용된다. 구현예에서, 신호 대 잡음비 임계치의 값은 14.0, 15.0, 16.0 등일 수 있다.
현재 프레임의 채널 조합 솔루션 플래그의 획득된 초기 값은 tdm_SM_flag_loc로서 표시된다.
다음으로 본 발명의 구현예의 채널 조합 수정 결정이 설명된다:
채널 조합 수정 결정은, 현재 프레임의 채널 조합 솔루션 플래그의 초기 값에 기초하여 채널 조합 솔루션 수정 결정을 수행하는 단계 및 현재 프레임의 채널 조합 솔루션 플래그 및 채널 조합 비율 인자 수정 플래그를 결정하는 단계를 포함할 수 있다. 현재 프레임의 획득된 채널 조합 솔루션 플래그는 tdm_SM_flag로서 표시될 수 있고, 획득된 채널 조합 비율 인자 수정 플래그는 tdm_SM_modi_flag로서 표시된다. 상세한 내용은 다음과 같다.
B1. 현재 프레임의 이전 프레임의 채널 조합 비율 인자 수정 플래그가 1이면, 현재 프레임의 채널 조합 솔루션이 네거티브형 신호 채널 조합 솔루션이라고 결정한다.
B2. 현재 프레임의 이전 프레임의 채널 조합 비율 수정 플래그가 0 이면, 다음과 같은 처리를 수행한다:
B21. 현재 프레임이 채널 조합 솔루션 스위칭 조건을 충족하는지를 결정하는데, 이것은 구체적으로 다음과 같은 것을 포함한다:
B211. 현재 프레임의 이전 프레임의 1차 채널 신호의 신호 타입이 음성 신호이면, 현재 프레임의 이전 프레임의 신호 프레임 타입, 현재 프레임의 이전 프레임의 이전 프레임의 신호 프레임 타입, 현재 프레임의 이전 프레임의 원시 코딩 모드(raw coding mode) 및 현재 프레임의 이전 프레임에서 시작하여 현재 프레임에서 끝나는, 현재 프레임의 채널 조합 솔루션을 갖는,연속적인 프레임의 양에 기초하여, 현재 프레임이 채널 조합 솔루션 스위칭 조건을 충족하는지가 결정될 수 있고, 여기서 다음과 같은 두 가지 타입의 결정 중 적어도 하나가 구체적으로 수행될 수 있다:
결정의 첫 번째 타입:
다음의 조건 1a, 1b, 2 및 3이 충족되는지를 결정한다.
조건 1a: 현재 프레임의 이전 프레임의 이전 프레임의 1차 채널 신호의 프레임 타입은 VOICED_CLAS, ONSET, SIN_ONSET, INACTIVE_CLAS 또는 AUDIO_CLAS이고, 현재 프레임의 이전 프레임의 1차 채널 신호의 프레임 타입은 UNVOICED_CLAS 또는 VOICED_TRANSITION이다.
조건 1b: 현재 프레임의 이전 프레임의 이전 프레임의 2차 채널 신호의 프레임 타입은 VOICED_CLAS, ONSET, SIN_ONSET, INACTIVE_CLAS 또는 AUDIO_CLAS이고, 현재 프레임의 이전 프레임의 2차 채널 신호의 프레임 타입은 UNVOICED_CLAS 또는 VOICED_TRANSITION이다.
조건 2: 현재 프레임의 이전 프레임의 1차 채널 신호의 원시 코딩 모드(raw coding mode)도 현재 프레임의 이전 프레임의 2차 채널 신호의 원시 코딩 모드도 VOICED가 아니다.
조건 3: 현재 프레임의 채널 조합 솔루션은 현재 프레임의 이전 프레임의 채널 조합 솔루션과 동일하고, 현재 프레임의 채널 조합 솔루션을 갖는, 현재 프레임에서 끝나는 연속 프레임의 양은 연속 프레임 임계치보다 크다. 구현예에서, 연속 프레임 임계치는 3, 4, 5, 6 등일 수 있다.
조건 1a 및 조건 1b 중 적어도 하나가 충족되고, 조건 2 및 조건 3이 둘 모두 충족되면, 현재 프레임이 채널 조합 솔루션 스위칭 조건을 충족한다고 결정된다.
결정의 두 번째 타입:
다음의 조건 4 내지 7이 충족되는지를 결정한다.
조건 4: 현재 프레임의 이전 프레임의 1차 채널 신호의 프레임 타입은 UNVOICED_CLAS이거나, 또는 현재 프레임의 이전 프레임의 2차 채널 신호의 프레임 타입은 UNVOICED_CLAS이다.
조건 5: 현재 프레임의 이전 프레임의 1차 채널 신호의 원시 코딩 모드도 현재 프레임의 이전 프레임의 2차 채널 신호의 원시 코딩 모드도 VOICED가 아니다.
조건 6: 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호의 장기 제곱 평균 에너지 값(long-term root mean square energy value)이 에너지 임계치보다 적고, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호의 장기 제곱 평균 에너지 값이 에너지 임계치보다 적다. 구현예에서, 에너지 임계치는 300, 400, 450, 500 등일 수 있다.
조건 7: 현재 프레임의 이전 프레임의 채널 조합 솔루션이 현재 프레임까지 계속하여 사용된 프레임의 양이 연속 프레임 임계치보다 크다.
조건 4, 조건 5, 조건 6 및 조건 7이 모두 충족되면, 현재 프레임이 채널 조합 솔루션 스위칭 조건을 충족한다고 결정된다.
B212. 현재 프레임의 이전 프레임의 1차 채널 신호의 프레임 타입이 음악 신호이면, 현재 프레임의 이전 프레임의 1차 채널 신호의 저주파수 대역 신호와 고주파수 대역 신호의 에너지 비율 및 현재 프레임의 이전 프레임의 2차 채널 신호의 저주파수 대역 신호와 고주파수 대역 신호의 에너지 비율에 기초하여, 현재 프레임이 스위칭 조건을 충족하는지를 결정하며, 이것은 구체적으로 다음의 조건 8이 충족되는지를 결정하는 단계를 포함한다:
조건 8: 현재 프레임의 이전 프레임의 1차 채널 신호의 저고주파수 대역 신호 대 고주파수 대역 신호의 에너지 비율이 에너지 비율 임계치보다 크고, 현재 프레임의 이전 프레임의 2차 채널 신호의 저고주파수 대역 신호 대 고주파수 대역 신호의 에너지 비율이 에너지 임계치보다 크다. 구현예에서, 에너지 임계치는 4000, 4500, 5000, 5500, 6000 등일 수 있다.
조건 8이 충족되면, 현재 프레임이 채널 조합 솔루션 스위칭 조건을 충족한다고 결정된다.
B22. 현재 프레임의 이전 프레임의 채널 조합 솔루션의 초기 값이 현재 프레임의 채널 조합 솔루션의 초기 값과 상이하면, 플래그 비트를 1로 설정하고; 현재 프레임이 채널 조합 솔루션 스위칭 조건을 충족하면, 현재 프레임의 채널 조합 솔루션의 초기 값을 현재 프레임의 채널 조합 솔루션으로서 사용하고, 플래그 비트를 1로 설정하며, 여기서 플래그 비트가 1이라는 것은 현재 프레임의 채널 조합 솔루션의 초기 값이 현재 프레임의 이전 프레임의 채널 조합 솔루션의 초기 값과 상이하다는 것을 나타내며, 플래그 비트가 0 이라는 것은 현재 프레임의 채널 조합 솔루션의 초기 값이 현재 프레임의 이전 프레임의 채널 조합 솔루션의 초기 값과 동일하다는 것을 나타낸다.
B23. 플래그 비트가 1이고, 현재 프레임이 채널 조합 솔루션 스위칭 조건을 충족하며, 현재 프레임의 이전 프레임의 채널 조합 솔루션이 현재 프레임의 포지티브 및 네거티브 위상 타입 플래그와 상이하면, 현재 프레임의 채널 조합 솔루션 플래그를 현재 프레임의 이전 프레임의 채널 조합 솔루션 플래그와 상이하도록 설정한다.
B24. 현재 프레임의 채널 조합 솔루션이 네거티브형 신호 채널 조합 솔루션이고, 현재 프레임의 이전 프레임의 채널 조합 솔루션이 포지티브형 신호 채널 조합 솔루션이며, 현재의 채널 조합 비율 인자가 채널 조합 비율 인자 임계치보다 적으면, 현재 프레임의 채널 조합 솔루션을 포지티브형 신호 채널 조합 솔루션으로 수정하고, 현재 프레임의 채널 조합 비율 인자 수정 플래그를 1로 설정한다.
현재 프레임의 채널 조합 솔루션이 포지티브형 신호 채널 조합 솔루션일 때, (705)가 수행되거나; 또는 현재 프레임의 채널 조합 솔루션이 네거티브형 신호 채널 조합 솔루션일 때, (708)이 수행된다.
(5). 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호 및 우측 채널 시간 도메인 신호, 및 현재 프레임의 채널 조합 솔루션 플래그에 기초하여 현재 프레임의 채널 조합 비율 인자를 계산하고 양자화하여, 현재 프레임의 양자화된 채널 조합 비율 인자의 초기 값 및 양자화된 채널 조합 비율 인자의 초기 값의 인코딩 인덱스를 획득한다.
구현예에서, 현재 프레임의 채널 조합 비율 인자의 초기 값 및 채널 조합 비율 인자의 초기 값의 인코딩 인덱스는 구체적으로 다음과 같은 방식으로 획득될 수 있다:
C1. 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호 및 우측 채널 시간 도메인 신호에 기초하여 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호의 프레임 에너지 및 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호의 프레임 에너지를 계산한다.
지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호의 프레임 에너지 rms_L은 다음의 수학식을 사용함으로써 계산을 통해 획득될 수 있다:
Figure pct00082
지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호의 프레임 에너지 rms_R은 다음의 수학식을 사용함으로써 계산을 통해 획득될 수 있다:
Figure pct00083
Figure pct00084
은 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호이며,
Figure pct00085
은 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호이다.
C2. 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호 및 우측 채널 시간 도메인 신호의 프레임 에너지에 기초하여 현재 프레임의 채널 조합 비율 인자의 초기 값을 계산한다.
구현예에서, 현재 프레임의 포지티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자의 초기 값 ratio_init는 다음의 수학식을 사용함으로써 계산을 통해 획득될 수 있다:
Figure pct00086
C3. 계산을 통해 획득된 현재 프레임의 채널 조합 비율 인자의 초기 값을 양자화하여, 현재 프레임의 채널 조합 비율 인자의 양자화된 초기 값 ratio_init qua 및 채널 조합 비율 인자의 양자화된 초기 값에 대응하는 인코딩 인덱스 ratio_idx_init를 획득한다.
구현예에서, ratio_idx_initratio_init qua 는 다음과 같은 관계를 충족시키고,
Figure pct00087
, 여기서
ratio_tabl은 스칼라 양자화를 위한 코드북이다.
구체적으로, 양자화 및 인코딩이 현재 프레임의 채널 조합 비율 인자에 대해 수행될 때, 임의의 스칼라 양자화 방법이 사용될 수 있는데, 예를 들면, 균일 스칼라 양자화 또는 비 균일 스칼라 양자화 방법이 사용될 수 있다. 특정 구현예에서, 양자화 및 인코딩 동안 인코딩을 위한 비트의 양은 5 비트일 수 있다.
구현예에서, 현재 프레임의 채널 조합 비율 인자의 초기 값 및 채널 조합 비율 인자의 초기 값에 대응하는 인코딩 인덱스가 획득된 후에, 현재 프레임의 채널 조합 비율 인자의 초기 값에 대응하는 인코딩 인덱스를 수정할지가 또한 현재 프레임의 채널 조합 비율 인자 플래그 tdm_SM_flag의 값에 기초하여 결정될 수 있다. 예를 들어, 양자화 및 인코딩 동안 인코딩을 위한 비트의 양이 5 비트라고 가정한다. tdm_SM_flag = 1 일 때, 현재 프레임의 채널 조합 비율 인자의 초기 값에 대응하는 인코딩 인덱스 ratio_idx_init는 미리 설정된 값으로 수정될 수 있으며, 이 경우 미리 설정된 값은 15, 14, 13 등일 수 있다. 이에 대응하여, 현재 프레임의 채널 조합 비율 인자의 값은
Figure pct00088
,
Figure pct00089
,
Figure pct00090
등으로 수정된다. tdm_SM_flag = 0 일 때, 현재 프레임의 채널 조합 비율 인자의 초기 값에 대응하는 인코딩 인덱스는 수정되지 않을 수 있다.
본 발명의 일부 구현예에서, 현재 프레임의 채널 조합 비율 인자는 대안적으로 다른 방식으로 획득될 수 있다는 것을 알아야 한다. 예를 들어, 현재 프레임의 채널 조합 비율 인자는 시간 도메인 스테레오 인코딩 방법에서 채널 조합 비율 인자를 계산하기 위한 임의의 방법에 따라 계산될 수 있다. 일부 구현예에서, 현재 프레임의 채널 조합 비율 인자의 초기 값은 고정된 값, 예를 들어 0.5, 0.4, 0.45, 0.55 또는 0.6으로 대안적으로 직접 설정될 수 있다.
(706). 현재 프레임의 채널 조합 비율 인자 수정 플래그에 기초하여, 현재 프레임의 채널 조합 비율 인자의 초기 값이 수정되어야 하는지를 결정하고; 초기 값이 수정되어야 한다고 결정되면, 현재 프레임의 채널 조합 비율 인자의 초기 값 및/또는 채널 조합 비율 인자의 초기 값의 인코딩 인덱스를 수정하여, 현재 프레임의 채널 조합 비율 인자의 수정 값 및 채널 조합 비율 인자의 수정 값의 인코딩 인덱스를 획득하거나; 또는 초기 값이 수정될 필요가 없다고 결정되면, 현재 프레임의 채널 조합 비율 인자의 초기 값 및 채널 조합 비율 인자의 초기 값의 인코딩 인덱스를 수정하는 것을 건너 뛴다.
구체적으로, 채널 조합 비율 인자 수정 플래그 tdm_SM_modi_flag = 1이면, 현재 프레임의 채널 조합 비율 인자의 초기 값은 수정될 필요가 있다. 채널 조합 비율 인자 수정 플래그 tdm_SM_modi_flag = 0이면, 현재 프레임의 채널 조합 비율 인자의 초기 값은 수정될 필요가 없다. 일부 구현예에서, 현재 프레임의 채널 조합 비율 인자의 초기 값은 tdm_SM_modi_flag = 0일 때 수정되고, 현재 프레임의 채널 조합 비율 인자의 초기 값은 tdm_SM_modi_flag = 1일 때 수정되지 않는다는 것이 이해될 수 있다. 특정 방법은 tdm_SM_modi_flag의 값 할당 규칙에 따라 변할 수 있다.
구현예에서, 현재 프레임의 채널 조합 비율 인자의 초기 값 및 채널 조합 비율 인자의 초기 값의 인코딩 인덱스는 다음과 같은 방식으로 변경될 수 있다:
D1. 다음의 수학식에 따라, 현재 프레임의 포지티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자의 수정 값에 대응하는 인코딩 인덱스를 획득한다:
Figure pct00091
, 여기서
tdm_last_ratio_idx는 현재 프레임의 이전 프레임의 채널 조합 비율 인자의 인코딩 인덱스이고, 현재 프레임의 이전 프레임의 채널 조합 방식은 또한 포지티브형 신호 채널 조합 솔루션이다.
D2. 현재 프레임의 채널 조합 비율 인자의 변경 값 ratio_mod qua 을 다음의 수학식에 따라 획득한다:
Figure pct00092
(707). 현재 프레임의 채널 조합 비율 인자의 초기 값, 현재 프레임의 채널 조합 비율 인자의 초기 값의 인코딩 인덱스, 현재 프레임의 채널 조합 비율 인자의 수정 값, 현재 프레임의 채널 조합 비율 인자의 수정 값의 인코딩 인덱스 및 채널 조합 비율 인자 수정 플래그에 기초하여 현재 프레임의 채널 조합 비율 인자 및 현재 프레임의 채널 조합 비율 인자의 인코딩 인덱스를 결정한다. 현재 프레임의 채널 조합 비율 인자의 초기 값이 수정될 때만, 현재 프레임의 채널 조합 비율 인자의 수정 값 및 현재 프레임의 채널 조합 비율 인자의 수정 값의 인코딩 인덱스에 기초하여 현재 프레임의 채널 조합 비율 인자를 결정하는 것이 필요하고; 그렇지 않으면, 현재 프레임의 채널 조합 비율 인자는 현재 프레임의 채널 조합 비율 인자의 초기 값 및 현재 프레임의 채널 조합 비율 인자의 초기 값의 인코딩 인덱스에 기초하여 직접 결정될 수 있다. 그 다음에, 단계(709)가 수행된다.
구현예에서, 구체적으로, 포지티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자 및 채널 조합 비율 인자의 인코딩 지수는 다음과 같은 방식으로 결정될 수 있다:
(E1). 현재 프레임의 채널 조합 비율 인자 ratio를 다음의 수학식에 따라 결정한다:
Figure pct00093
, 여기서
ratio_init qua 는 현재 프레임의 채널 조합 비율 인자의 초기 값이고, ratio_mod qua 는 현재 프레임의 채널 조합 비율 인자의 변경 값이고, tdm_SM_modi_flag는 현재 프레임의 채널 조합 비율 인자 수정 플래그이다.
(E2). 현재 프레임의 채널 조합 비율 인자에 대응하는 인코딩 인덱스 ratio_idx를 다음의 수학식에 따라 결정한다:
Figure pct00094
, 여기서
ratio_idx_init는 현재 프레임의 채널 조합 비율 인자의 초기 값에 대응하는 인코딩 인덱스이고, ratio_idx_mod는 현재 프레임의 채널 조합 비율 인자의 변경 값에 대응하는 인코딩 인덱스이며, tdm_SM_modi_flag는 현재 프레임의 채널 조합 비율 인자 수정 플래그이다.
채널 조합 비율 인자 및 채널 조합 비율 인자의 인코딩 인덱스는 코드북을 사용함으로써 서로에 기초하여 결정될 수 있기 때문에, 전술한 단계(E1 및 E2) 중 어느 하나의 단계가 수행될 수 있고, 그런 다음에 채널 조합 비율 인자 또는 채널 조합 비율 인자의 인코딩 인덱스가 코드북에 기초하여 결정된다.
(708). 현재 프레임의 채널 조합 비율 인자를 계산하고 양자화하여, 현재 프레임의 양자화된 채널 조합 비율 인자 및 양자화된 채널 조합 비율 인자의 인코딩 인덱스를 획득한다.
구현예에서, 현재 프레임의 네거티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자 및 현재 프레임의 네거티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자에 대응하는 인코딩 인덱스는 다음과 같은 방법으로 획득될 수 있다.
(F1). 현재 프레임의 네거티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자를 계산하기 위해 사용되어야 하는 히스토리 버퍼가 재설정(reset)되어야 하는지를 결정한다.
구체적으로, 현재 프레임의 채널 조합 솔루션이 네거티브형 신호 채널 조합 솔루션이고, 현재 프레임의 이전 프레임의 채널 조합 솔루션이 포지티브형 신호 채널 조합 솔루션이면, 히스토리 버퍼가 재설정되어야 한다고 결정된다.
예를 들어, 구현예에서, 현재 프레임의 채널 조합 솔루션 플래그 tdm_SM_flag가 1과 같고, 현재 프레임의 이전 프레임의 채널 조합 솔루션 플래그 tdm_last_SM_flag가 0과 같으면, 히스토리 버퍼는 재설정되어야 한다.
다른 구현예에서, 히스토리 버퍼가 재설정되어야 하는지는 히스토리 버퍼 재설정 플래그 tdm_SM_reset_flag를 사용함으로써 결정될 수 있다. 히스토리 버퍼 재설정 플래그 tdm_SM_reset_flag의 값은 채널 조합 솔루션 초기 결정 및 채널 조합 솔루션 수정 결정의 프로세스에서 결정될 수 있다. 구체적으로, 현재 프레임의 채널 조합 솔루션 플래그가 네거티브형 신호 채널 조합 솔루션에 대응하고, 현재 프레임의 이전 프레임의 채널 조합 솔루션 플래그가 포지티브형 신호 채널 조합 솔루션에 대응하면, tdm_SM_reset_flag의 값은 1로 설정될 수 있다. 물론, tdm_SM_reset_flag의 값은 현재 프레임의 채널 조합 솔루션 플래그가 네거티브형 신호 채널 조합 솔루션에 대응하고, 현재 프레임의 이전 프레임의 채널 조합 솔루션 플래그가 포지티브형 신호 채널 조합 솔루션에 대응함을 나타내는 0으로 대안적으로 설정될 수 있다.
히스토리 버퍼가 재설정될 때, 히스토리 버퍼 내의 모든 파라미터는 미리 설정된 초기 값에 따라 재설정될 수 있다. 대안적으로, 히스토리 버퍼 내의 일부 파라미터는 미리 설정된 초기 값에 따라 재설정될 수 있다. 대안적으로, 히스토리 버퍼 내의 일부 파라미터는 미리 설정된 초기 값에 따라 재설정될 수 있고, 다른 파라미터는 포지티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자를 계산하기 위해 사용되는 히스토리 버퍼 내의 대응하는 파라미터 값에 따라 재설정될 수 있다.
구현예에서, 히스토리 버퍼 내의 파라미터는 다음과 같은 것: 장기간 평활화 이후에 획득되고 현재 프레임의 이전 프레임을 구성하는 좌측 채널 시간 도메인 신호의 장기간 평활화 프레임 에너지, 장기간 평활화 이후에 획득되고 현재 프레임의 이전 프레임을 구성하는 우측 채널 시간 도메인 신호의 장기간 평활화 프레임 에너지, 지연 정렬 이후에 획득되고 현재 프레임의 이전 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터, 지연 정렬 이후에 획득되고 현재 프레임의 이전 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터, 장기간 평활화 이후에 획득되고 현재 프레임의 이전 프레임을 구성하는 좌측 채널 시간 도메인 신호와 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터, 지연 정렬 이후에 획득되고 현재 프레임의 이전 프레임을 구성하는 좌측 채널 시간 도메인 신호의 프레임 간 에너지 차, 지연 정렬 이후에 획득되고 현재 프레임의 이전 프레임을 구성하는 우측 채널 시간 도메인 신호의 프레임 간 에너지 차, 현재 프레임의 이전 프레임의 채널 조합 비율 인자, 현재 프레임의 이전 프레임의 채널 조합 비율 인자의 인코딩 인덱스, SM 모드 파라미터 등 중 적어도 하나를 포함할 수 있다. 이들 파라미터로부터 히스토리 버퍼 내의 파라미터로서 구체적으로 선택된 파라미터는 특정 요건에 기초하여 선택되고 조정될 수 있다. 이에 대응하여, 미리 설정된 초기 값에 따라 재설정을 위해 선택된 히스토리 버퍼 내의 파라미터 또한 특정 요건에 기초하여 선택되고 조정될 수 있다. 구현예에서, 포지티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자를 계산하기 위해 사용되는 히스토리 버퍼 내의 대응하는 파라미터 값에 따라 재설정되는 파라미터는 SM 모드 파라미터 일 수 있으며, SM 모드 파라미터는 YX 모드 내의 대응하는 파라미터의 값에 따라 재설정될 수 있다.
F2. 현재 프레임의 채널 조합 비율 인자를 계산하고 양자화한다.
구현예에서, 현재 프레임의 채널 조합 비율 인자는 구체적으로 다음과 같은 방식으로 구체적으로 계산될 수 있다:
F21. 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호 및 우측 채널 시간 도메인 신호에 대해 신호 에너지 분석(signal energy analysis)을 수행하여, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호의 프레임 에너지, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호의 프레임 에너지, 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호의 장기간 평활화 프레임 에너지, 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호의 장기간 평활화 프레임 에너지, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호의 프레임 간 에너지 차, 및 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호의 프레임 간 에너지 차를 획득한다.
지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호의 프레임 에너지 및 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호의 프레임 에너지는 전술한 설명을 참조한다. 상세한 내용은 여기서 다시 설명되지 않는다.
구현예에서, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호의 장기간 평활화 프레임 에너지 tdm_lt_rms_L_SM cur 은 다음의 수학식을 사용하여 획득될 수 있다:
Figure pct00095
, 여기서
tdm_lt_rms_L_SM pre 은 이전 프레임의 좌측 채널의 장기간 평활화 프레임 에너지이고, A는 업데이트 인자이며, 통상 0과 1 사이의 실수일 수 있고, 예를 들어, 0, 0.3, 0.4, 0.5 또는 1일 수 있다.
구현예에서, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호의 장기간 평활화 프레임 에너지 tdm_lt_rms_R_SM cur 은 다음의 수학식을 사용하여 획득될 수 있다:
Figure pct00096
, 여기서
tdm_lt_rms_R_SM pre 는 이전 프레임의 우측 채널의 장기간 평활화 프레임 에너지이고, B는 업데이트 인자이며, 통상 0과 1 사이의 실수일 수 있고, 예를 들어, 0.3, 0.4 또는 0.5일 수 있으며, 업데이트 인자 B의 값은 업데이트 인자 A의 값과 동일할 수 있거나, 또는 업데이트 인자 B의 값은 업데이트 인자 A의 값과 상이할 수 있다.
구현예에서, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호의 프레임 간 에너지 차 ener_L_dt는 다음의 수학식을 사용하여 획득될 수 있다:
Figure pct00097
구현예에서, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호의 프레임 간 에너지 차 ener_R_dt는 다음의 수학식을 사용하여 획득될 수 있다:
Figure pct00098
F22. 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호 및 우측 채널 시간 도메인 신호에 기초하여 현재 프레임의 기준 채널 신호를 결정한다.
구현예에서, 현재 프레임의 기준 채널 신호 mono_i(n)는 다음의 수학식을 사용하여 획득될 수 있고,
Figure pct00099
, 여기서
기준 채널 신호는 모노 신호라고 지칭될 수도 있다.
F23. 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터를 계산하고, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터를 계산한다.
구현예에서, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 좌측 채널 진폭 상관 파라미터 corr_LM은 다음의 수학식을 사용하여 결정될 수 있다:
Figure pct00100
구현예에서, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터 corr_RM은 다음의 수학식을 사용하여 획득될 수 있고,
Figure pct00101
, 여기서
Figure pct00102
는 절대 값을 획득하는 것을 나타낸다.
F24. corr_LMcorr_RM에 기초하여, 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 계산한다.
구현예에서, 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터 diff_lt_corr는 구체적으로 다음과 같은 방식으로 계산될 수 있다:
F241. corr_LMcorr_RM에 기초하여, 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터 및 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터를 계산한다.
구현예에서, 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터 tdm_lt_corr_LM_SM cur 는 다음의 수학식을 사용하여 결정될 수 있고,
Figure pct00103
, 여기서, tdm_lt_corr_LM_SM pre 는 장기간 평활화 이후에 획득되고 현재 프레임의 이전 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터이고, α는 평활화 인자이고, 0과 1 사이의 미리 설정된 실수, 예를 들어, 0, 0.2, 0.5, 0.8, 또는 1일 수 있거나, 또는 계산을 통해 적응적으로 획득될 수 있다.
구현예에서, 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터 tdm_lt_corr_RM_SM cur 는 다음의 수학식을 사용하여 결정될 수 있고,
Figure pct00104
, 여기서, tdm_lt_corr_RM_SM pre 는 장기간 평활화 이후에 획득되고 현재 프레임의 이전 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 신호 사이의 진폭 상관 파라미터이고, β는 평활화 인자이고, 예를 들어 0과 1 사이의 미리 설정된 실수, 예를 들어, 0, 0.2, 0.5, 0.8 또는 1일 수 있거나, 또는 계산을 통해 적응적으로 획득될 수 있고, 평활화 인수 α의 값과 평활화 인수 β의 값은 동일할 수 있거나, 또는 평활화 인수 α의 값과 평활화 인수 β의 값은 상이할 수 있다.
다른 구현예에서, tdm_lt_corr_LM_SM cur tdm_lt_corr_RM_SM cur 은 구체적으로는 다음과 같은 방식으로 획득될 수 있다:
먼저, corr_LMcurr_RM이 수정되어, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 수정된 진폭 상관 파라미터 corr_LM_mod 및 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 수정된 진폭 상관 파라미터 corr_RM_mod를 획득한다. 구현예에서, corr_LMcurr_RM이 수정될 때, corr_LMcurr_RM은 감쇠 인자로 직접 곱해질 수 있고, 감쇠 인자의 값은 0.70, 0.75, 0.80, 0.85, 0.90 등일 수 있다. 일부 구현예에서, 대응하는 감쇠 인자는 또한 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호의 제곱 평균 및 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호의 제곱 평균에 기초하여 선택될 수 있다. 예를 들어, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호의 제곱 평균 값이 20보다 적을 때, 감쇠 인자의 값은 0.75일 수 있다. 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호의 제곱 평균 값이 20 이상일 때, 감쇠 인자의 값은 0.85일 수 있다.
장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터 diff_lt_corr_LM_tmpcorr_LM_mod tdm_lt_corr_LM_SM pre 에 기초하여 결정되며, 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터 diff_lt_corr_RM_tmpcorr_RM_mod tdm_lt_corr_RM_SM pre 에 기초하여 결정된다. 구현예에서, diff_lt_corr_LM_tmpcorr_LM_mod tdm_lt_corr_LM_SM pre 에 대해 가중 합산(weighted summation)을 수행함으로써 획득될 수 있다. 예를 들어,
Figure pct00105
이고, 여기서 para1의 값 범위는 [0, 1], 예를 들어, 0.2, 0.5 또는 0.8 일 수 있다. diff_lt_corr_RM_tmp를 결정하는 방식은 diff_lt_corr_LM_tmp를 결정하는 방식과 유사하며, 상세한 내용은 다시 설명되지 않는다.
그 다음, 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터의 초기 값 diff_lt_corr_SMdiff_lt_corr_LM_tmp diff_lt_corr_RM_tmp에 기초하여 결정된다. 구현예에서,
Figure pct00106
이다.
그 다음, 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 우측 채널 시간 도메인 신호 사이의 진폭 상관 차의 프레임 간 변화 파라미터(inter-frame change parameter) d_lt_corrdiff_lt_corr_SM와 장기간 평활화 이후에 획득되고 현재 프레임의 이전 프레임을 구성하는 좌측 채널 시간 도메인 신호와 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터 tdm_last_diff_lt_corr_SM에 기초하여 결정된다. 구현예에서,
Figure pct00107
Figure pct00108
이다.
그 다음, 좌측 채널 평활화 인자 및 우측 채널 평활화 인자가 rms_L, rms_R, tdm_lt_rms_L_SM cur , tdm_lt_rms_R_SM cur , ener_L_dt, ener_R_dtdiff_lt_corr에 기초하여 적응적으로 선택될 수 있고, 좌측 채널 평활화 인자 및 우측 채널 평활화 인자의 값은 0.2, 0.3, 0.5, 0.7, 0.8 등일 수 있다. 좌측 채널 평활화 인자의 값 및 우측 채널 평활화 인자의 값은 동일하거나 상이할 수 있다. 구현예에서, rms_L rms_R가 800 미만이고, tdm_lt_rms_L_SM cur rms_L*0.9 미만이며, tdm_lt_rms_R_SM cur rms_R*0.9 미만이면, 좌측 채널 평활화 인자 및 우측 채널 평활화 인자의 값은 0.3일 수 있고; 그렇지 않으면, 좌측 채널 평활화 인자 및 우측 채널 평활화 인자의 값은 0.7일 수 있다.
마지막으로, tdm_lt_corr_LM_SM cur 은 선택된 좌측 채널 평활화 인자에 기초하여 계산되고, tdm_lt_corr_RM_SM cur 은 선택된 우측 채널 평활화 인자에 기초하여 계산된다. 구현예에서, 구체적으로, 선택된 좌측 채널 평활화 인자는 diff_lt_corr_LM_tmpcorr_LM에 대해 가중 합산을 수행하여, tdm_lt_corr_LM_SM cur , 즉,
Figure pct00109
를 획득하는데 사용될 수 있고, 여기서 para1은 선택된 좌측 채널 평활화 인자이다. tdm_lt_corr_RM_SM cur 의 계산에 대해서는 tdm_lt_corr_LM_SM cur 을 계산하기 위한 방법을 참조하며, 상세한 내용은 다시 설명되지 않는다.
본 발명의 일부 구현예에서, tdm_lt_corr_LM_SM cur tdm_lt_corr_RM_SM cur 은 다른 방식으로 대안적으로 계산될 수 있으며, tdm_lt_corr_LM_SM cur tdm_lt_corr_RM_SM cur 을 획득하는 특정 방식은 본 발명의 이러한 실시예에서 제한되지 않는다.
F242. tdm_lt_corr_LM_SM cur tdm_lt_corr_RM_SM cur 에 기초하여, 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터 diff_lt_corr을 계산한다.
구현예에서, diff_lt_corr은 다음의 수학식을 사용하여 획득될 수 있다:
Figure pct00110
F25. diff_lt_corr을 채널 조합 비율 인자로 변환하고 채널 조합 비율 인자를 양자화하여, 현재 프레임의 채널 조합 비율 인자 및 현재 프레임의 채널 조합 비율 인자의 인코딩 인덱스를 결정한다.
구현예에서, diff_lt_corr은 다음과 같은 방식으로 채널 조합 비율 인자로 구체적으로 변환될 수 있다:
F251. diff_lt_corr에 대해 매핑 처리를 수행하여, 좌측 채널과 우측 채널 사이의 매핑된 진폭 상관 차 파라미터의 값 범위가 [MAP_MIN, MAP_MAX] 내에 있도록 한다.
구체적으로, F251의 특정 구현예에 대해서는 도 4의 처리를 참조하며, 상세한 내용은 다시 설명되지 않는다.
F252. diff_lt_corr_map을 채널 조합 비율 인자로 변환한다.
구현예에서, diff_lt_corr_map은 다음과 같은 수학식을 사용하여 채널 조합 비율 인자 ratio_SM으로 직접 변환될 수 있다:
Figure pct00111
, 여기서
cos(.)는 코사인 연산을 나타낸다.
다른 구현예에서, diff_lt_corr_map이 전술한 수학식을 사용하여 채널 조합 비율 인자로 변환되기 이전에, tdm_lt_rms_L_SM cur , tdm_lt_rms_R_SM cur , ener_L_dt, 현재 프레임의 이전 프레임의 인코딩 파라미터, 현재 프레임의 네거티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자, 및 현재 프레임의 이전 프레임의 네거티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자 중 하나에 기초하여, 현재 프레임의 채널 조합 비율 인자가 업데이트되어야 하는지가 먼저 결정될 수 있다. 현재 프레임의 이전 프레임의 인코딩 파라미터는 현재 프레임의 이전 프레임의 1차 채널 신호의 프레임 간 상관 및 현재 프레임의 이전 프레임의 2차 채널 신호의 프레임 간 상관 등을 포함할 수 있다.
현재 프레임의 채널 조합 비율 인자가 업데이트되어야 한다고 결정될 때, diff_lt_corr_map을 변환하는데 사용되는 전술한 수학식은 diff_lt_corr_map을 채널 조합 비율 인자로 변환하는데 사용될 수 있다.
현재 프레임의 채널 조합 비율 인자가 업데이트될 필요가 없다고 결정될 때, 현재 프레임의 이전 프레임의 네거티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자 및 채널 조합 비율 인자에 대응하는 인코딩 인덱스는 현재 프레임의 채널 조합 비율 인자 및 채널 조합 비율 인자에 대응하는 인코딩 인덱스로서 직접 사용될 수 있다.
구현예에서, 다음과 같은 방식으로, 현재 프레임의 네거티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자가 업데이트되어야 하는지가 구체적으로 결정될 수 있다. 현재 프레임의 이전 프레임의 1차 채널 신호의 프레임 간 상관이 0.5 이상이고, 현재 프레임의 이전 프레임의 2차 채널 신호의 프레임 간 상관이 0.3 이상이면, 현재 프레임의 네거티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자가 업데이트되고; 그렇지 않으면, 업데이트가 수행되지 않는다.
현재 프레임의 채널 조합 비율 인자가 결정된 이후에, 현재 프레임의 채널 조합 비율 인자가 양자화될 수 있다.
현재 프레임의 채널 조합 비율 인자가 양자화되어, 현재 프레임의 양자화된 채널 조합 비율 인자의 초기 값 ratio_init_SM qua 및 양자화된 채널 조합 비율 인자의 초기 값의 인코딩 인덱스 ratio_idx_init_SM을 획득한다. ratio_idx_init_SM ratio_init_SM qua 는 다음과 같은 관계를 충족시킨다:
Figure pct00112
, 여기서
ratio_tabl_SM은 네거티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자의 스칼라 양자화를 위한 코드북이며, 여기서 양자화 및 인코딩은 종래 기술의 임의의 스칼라 양자화 방법, 예를 들어 균일 스칼라 양자화 또는 비 균일 스칼라 양자화를 사용할 수 있으며, 구현예에서, 양자화 및 인코딩 동안 인코딩을 위한 비트의 양은 5 비트, 4 비트, 6 비트 등일 수 있다.
네거티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자의 스칼라 양자화를 위한 코드북은 포지티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자의 스칼라 양자화를 위한 코드북과 동일할 수 있고, 이에 따라 채널 조합 비율 인자의 스칼라 양자화를 위한 하나의 코드북 만이 저장될 필요가 있으므로, 저장 공간의 점유를 줄일 수 있다. 네거티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자의 스칼라 양자화를 위한 코드북은 대안적으로 포지티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자의 스칼라 양자화를 위한 코드북과 상이할 수 있다는 것이 이해될 수 있다.
현재 프레임의 채널 조합 비율 인자의 최종 값 및 현재 프레임의 채널 조합 비율 인자의 최종 값의 인코딩 인덱스를 획득하기 위해, 본 발명의 이러한 실시예는 다음과 같은 네 개의 획득 방식을 제공한다.
첫 번째 획득 방법:
ratio_init_SM qua 는 현재 프레임의 채널 조합 비율 인자의 최종 값으로 직접 사용될 수 있고, ratio_idx_init_SM은 현재 프레임의 채널 조합 비율 인자의 최종 인코딩 인덱스로서 직접 사용될 수 있는데, 즉, 현재 프레임의 채널 조합 비율 인자의 최종 값의 인코딩 인덱스 ratio_idx_SM은:
Figure pct00113
를 충족시키며,
현재 프레임의 채널 조합 비율 인자의 최종 값은:
Figure pct00114
를 충족시킨다.
두 번째 획득 방법:
ratio_init_SM qua ratio_idx_init_SM이 획득된 이후에, ratio_init_SM qua ratio_idx_init_SM은 현재 프레임의 이전 프레임의 채널 조합 비율 인자의 최종 값의 인코딩 인덱스 또는 이전 프레임의 채널 조합 비율 인자의 최종 값에 기초하여 수정될 수 있고, 현재 프레임의 채널 조합 비율 인자의 수정된 인코딩 인덱스는 현재 프레임의 채널 조합 비율 인자의 최종 인코딩 인덱스로서 사용되며, 현재 프레임의 수정된 채널 조합 비율 인자는 현재 프레임의 채널 조합 비율 인자의 최종 값으로 사용된다. ratio_init_SM qua ratio_idx_init_SM은 서로에 기초하여 코드북을 사용하여 결정될 수 있기 때문에, ratio_init_SM qua ratio_idx_init_SM이 수정될 때, 둘 중 어느 하나가 수정될 수 있고, 그런 다음 둘 중 다른 하나의 수정 값이 코드북에 기초하여 결정될 수 있다.
구체적으로, 구현예에서, ratio_idx_init_SM은 다음의 수학식을 사용하여 수정되어, ratio_idx_SM을 획득할 수 있다:
Figure pct00115
, 여기서 ratio_idx_SM은 현재 프레임의 채널 조합 비율 인자의 최종 값의 인코딩 인덱스이고, tdm_last_ratio_idx_SM은 현재 프레임의 이전 프레임의 채널 조합 비율 인자의 최종 값의 인코딩 인덱스이고, φ은 네거티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자에 대한 수정 인자이며, φ은 통상적으로 경험적 값이고 0과 1 사이의 실수일 수 있고, 예를 들어, φ의 값은 0, 0.5, 0.8, 0.9 또는 1.0 일 수 있다.
이에 대응하여, 현재 프레임의 채널 조합 비율 인자의 최종 값은 다음의 수학식에 따라 결정될 수 있다:
Figure pct00116
세 번째 획득 방법:
현재 프레임의 양자화되지 않은 채널 조합 비율 인자는 현재 프레임의 채널 조합 비율 인자의 최종 값으로서 직접 사용된다. 다시 말해서, 현재 프레임의 채널 조합 비율 인자의 최종 값 ratio_SM은 다음 수식을 충족시킨다.
Figure pct00117
네 번째 획득 방법:
양자화되고 인코딩된 현재 프레임의 채널 조합 비율 인자는 현재 프레임의 이전 프레임의 채널 조합 비율 인자의 최종 값에 기초하여 수정되고, 현재 프레임의 수정된 채널 조합 비율 인자는 현재 프레임의 채널 조합 비율 인자의 최종 값으로서 사용되고, 그 다음에 현재 프레임의 채널 조합 비율 인자의 최종 값은 양자화되어 현재 프레임의 채널 조합 비율 인자의 최종 값의 인코딩 인덱스를 획득한다.
(709). 이전 프레임의 채널 조합 솔루션의 최종 값과 현재 프레임의 채널 조합 솔루션의 최종 값에 기초하여 인코딩 모드 결정을 수행하고, 현재 프레임의 인코딩 모드를 결정하고, 현재 프레임의 결정된 인코딩 모드에 기초하여 시간 도메인 다운 믹싱 처리를 수행하여, 현재 프레임의 1차 채널 신호 및 2차 채널 신호를 획득한다.
현재 프레임의 인코딩 모드는 적어도 두 개의 미리 설정된 인코딩 모드에서 결정될 수 있다. 미리 설정된 인코딩 모드의 특정 수량 및 미리 설정된 인코딩 모드에 대응하는 특정 인코딩 처리 방식은 필요에 따라 설정되고 조정될 수 있다. 미리 설정된 인코딩 모드의 수량 및 미리 설정된 인코딩 모드에 대응하는 특정 인코딩 처리 방식은 본 발명의 이러한 실시예에서 제한되지 않는다.
가능한 구현예에서, 현재 프레임의 채널 조합 솔루션 플래그는 tdm_SM_flag로서 표시되고, 현재 프레임의 이전 프레임의 채널 조합 솔루션 플래그는 tdm_last_SM_flag로서 표시되며, 이전 프레임의 채널 조합 솔루션 및 현재 프레임의 채널 조합 솔루션은 tdm_last_SM_flag, tdm_SM_flag로서 표시될 수 있다.
포지티브형 신호 채널 조합 솔루션이 0으로 표시되고, 네거티브형 신호 채널 조합 솔루션이 1로 표시된다고 가정하면, 현재 프레임의 이전 프레임의 채널 조합 솔루션과 현재 프레임의 채널 조합 솔루션의 조합은 (01), (11), (10), (00)으로 표시될 수 있고, 네 개의 경우는 각각 인코딩 모드 1, 인코딩 모드 2, 인코딩 모드 3, 인코딩 모드 4에 대응한다. 구현예에서, 현재 프레임의 결정된 인코딩 모드는 stero_tdm_coder_type로서 표시될 수 있고, stero_tdm_coder_type의 값은 전술한 네 개의 경우 (01), (11), (10) 및 (00)에 각각 대응하는 0, 1, 2 또는 3 일 수 있다.
구체적으로, 현재 프레임의 인코딩 모드가 인코딩 모드 1(stereo_tdm_coder_type = 0)이면, 시간 도메인 다운 믹싱 처리는 포지티브형 신호 채널 조합 솔루션으로부터 네거티브형 신호 채널 조합 솔루션으로의 전이에 대응하는 다운 믹싱 처리 방법을 사용하여 수행된다.
현재 프레임의 인코딩 모드가 인코딩 모드 2(stereo_tdm_coder_type = 1)이면, 시간 도메인 다운 믹싱 처리는 네거티브형 신호 채널 조합 솔루션에 대응하는 시간 도메인 다운 믹싱 처리 방법을 사용하여 수행된다.
현재 프레임의 인코딩 모드가 인코딩 모드 3(stereo_tdm_coder_type = 2)이면, 시간 도메인 다운 믹싱 처리는 네거티브형 신호 채널 조합 솔루션으로부터 포지티브형 신호 채널 조합 솔루션로의 전이에 대응하는 다운 믹싱 처리 방법을 사용하여 수행된다.
현재 프레임의 인코딩 모드가 인코딩 모드 4(stereo_tdm_coder_type = 3)이면, 시간 도메인 다운 믹싱 처리는 포지티브형 신호 채널 조합 솔루션에 대응하는 시간 도메인 다운 믹싱 처리 방법을 사용하여 수행된다.
포지티브형 신호 채널 조합 솔루션에 대응하는 시간 도메인 다운 믹싱 처리 방법의 특정 구현예는 다음과 같은 세 개의 구현예 중 어느 하나를 포함할 수 있다:
첫 번째 처리 방식:
현재 프레임의 포지티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자가 고정 계수라고 가정하면, 시간 도메인 다운 믹싱 처리 이후에 획득되고 현재 프레임을 구성하는 1차 채널 신호 Y(n) 및 2차 채널 신호 X(n)는 다음의 수학식에 따라 획득될 수 있다:
Figure pct00118
이 수학식에서, 고정 계수의 값은 0.5로 설정되고, 실제 적용 시, 고정 계수는 다른 값, 예를 들어, 0.4 또는 0.6으로 대안적으로 설정될 수 있다.
두 번째 처리 방식:
시간 도메인 다운 믹싱 처리는 현재 프레임의 포지티브형 신호 채널 조합 솔루션에 대응하는 결정된 채널 조합 비율 인자 ratio에 기초하여 수행되고, 시간 도메인 다운 믹싱 처리 후에 획득되고 현재 프레임을 구성하는 1차 채널 신호 Y(n) 및 2차 채널 신호 X(n)는 다음의 수학식에 따라 획득될 수 있다:
Figure pct00119
세 번째 처리 방식:
포지티브형 신호 채널 조합 솔루션에 대응하는 시간 도메인 다운 믹싱 처리 방법의 제 1 구현예 또는 제 2 구현예를 기초로 하여, 세그먼트화된 시간 도메인 다운 믹싱 처리가 수행된다.
포지티브형 신호 채널 조합 솔루션으로부터 네거티브형 신호 채널 조합 솔루션으로의 전이에 대응하는 세그먼트화된 다운 믹싱 처리는 세 개의 부분: 다운 믹싱 처리 1, 다운 믹싱 처리 2 및 다운 믹싱 처리 3을 포함한다. 특정 처리는 다음과 같다:
다운 믹싱 처리 1은 포지티브형 신호 채널 조합 솔루션을 사용하는 처리의 종료 섹션에 대응한다. 시간 도메인 다운 믹싱 처리는 이전 프레임의 포지티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자를 사용하고 포지티브형 신호 채널 조합 솔루션에 대응하는 시간 도메인 다운 믹싱 처리 방법을 사용함으로써 수행되며, 이에 따라 현재 프레임 및 이전 프레임에서의 처리 결과의 연속성을 보장하기 위해 이전 프레임에서와 동일한 처리 방식이 사용된다.
다운 믹싱 처리 2는 포지티브형 신호 채널 조합 솔루션을 이용하는 처리와 네거티브형 신호 채널 결합 해법을 이용하는 처리의 중첩 섹션에 대응한다. 이전 프레임의 포지티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자를 사용하고 포지티브형 신호 채널 조합 솔루션에 대응하는 시간 도메인 다운 믹싱 처리 방법을 사용함으로써 수행된 시간 도메인 다운 믹싱을 통해 획득된 처리 결과 1과 현재 프레임의 네거티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자를 사용하고 네거티브형 신호 채널 조합 솔루션에 대응하는 시간 도메인 다운 믹싱 처리 방법을 사용함으로써 수행된 시간 도메인 다운 믹싱을 통해 획득된 처리 결과 2에 대해 가중 처리(weighted processing)가 수행되어, 최종 처리 결과를 획득하며, 여기서 가중 처리는 구체적으로는 결과 1의 페이드-아웃 및 결과 2의 페이드-인이고, 상호 대응하는 포인트에서 결과 1과 결과 2의 가중 계수의 합은 1이므로, 중첩 섹션에서 및 시작 섹션과 종료 섹션에서 두 개의 채널 조합 솔루션을 사용함으로써 획득된 처리 결과의 연속성이 보장된다.
다운 믹싱 처리 3은 포지티브형 신호 채널 조합 솔루션을 사용하는 처리의 시작 섹션에 대응한다: 시간 도메인 다운 믹싱 처리는 현재 프레임의 네거티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자를 사용하고 네거티브형 신호 채널 조합 솔루션에 대응하는 시간 도메인 다운 믹싱 처리 방법을 사용함으로써 수행되므로, 현재 프레임 및 이전 프레임에서의 처리 결과의 연속성을 보장하기 위해 다음 프레임에서와 동일한 처리 방식이 사용된다.
네거티브형 신호 채널 조합 솔루션에 대응하는 시간 도메인 다운 믹싱 처리 방법의 특정 구현예는 다음과 같은 구현예를 포함할 수 있다:
첫 번째 구현예에서:
시간 도메인 다운 믹싱 처리는 네거티브형 신호 채널 조합 솔루션에 대응하는 결정된 채널 조합 비율 인자 ratio_SM에 기초하여 수행되고, 그런 다음 시간 도메인 다운 믹싱 처리 이후에 획득되고 현재 프레임을 구성하는 1차 채널 신호 Y(n) 및 2차 채널 신호 X(n)은 다음의 수학식에 따라 획득될 수 있다:
Figure pct00120
,
Figure pct00121
,
Figure pct00122
두 번째 구현예에서:
현재 프레임의 네거티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자가 고정 계수라고 가정하면, 시간 도메인 다운 믹싱 처리 이후에 획득되고 현재 프레임을 구성하는 1차 채널 신호 Y(n) 및 2차 채널 신호 X(n)은 다음의 수학식에 따라 획득될 수 있다:
Figure pct00123
, 여기서
이 수학식에서, 고정 계수의 값은 0.5로 설정되고, 실제 적용 시, 고정 계수는 다른 값, 예를 들어, 0.4 또는 0.6으로 대안적으로 설정될 수 있다.
세 번째 구현예에서:
시간 도메인 다운 믹싱 처리가 수행 될 때, 코덱의 지연을 고려하여 지연 보상이 수행된다. 인코더 단에서의 지연 보상은 delay_com이고, 시간 도메인 다운 믹싱 처리 이후에 획득된 1차 채널 신호 Y(n) 및 2차 채널 신호 X(n)은 다음의 수학식에 따라 획득될 수 있다:
Figure pct00124
Figure pct00125
여기서
Figure pct00126
,
Figure pct00127
,
Figure pct00128
이다.
tdm_last_ratio_idx_SM은 현재 프레임의 이전 프레임의 네거티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자의 최종 인코딩 인덱스이고, tdm_last_ratio_SM은 현재 프레임의 이전 프레임의 네거티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자의 최종 값이다.
네 번째 구현예에서:
시간 도메인 다운 믹싱 처리가 수행될 때, 코덱의 지연에 기초하여 지연 보상이 수행되고, tdm_last_ratioratio_SM과 동일하지 않는 경우가 발생할 수 있다. 이 경우, 시간 도메인 다운 믹싱 처리 이후에 획득되고 현재 프레임을 구성하는 1차 채널 신호 Y(n) 및 2차 채널 신호 X(n)은 다음의 식에 따라 획득될 수 있다:
Figure pct00129
,
Figure pct00130
Figure pct00131
fade_in(i)는 페이드 인 인자이고,
Figure pct00132
를 충족하고; NOVA는 전이 처리 길이이고, NOVA의 값은 0 초과이고 N 미만의 정수일 수 있고, 예를 들어 1, 40, 50 등일 수 있으며; fade_out(i)는 페이드-인 인자이고,
Figure pct00133
를 충족한다.
다섯 번째 구현예에서: 네거티브형 신호 채널 조합 솔루션에 대응하는 시간 도메인 다운 믹싱 처리 방법의 제 1 구현예, 제 2 구현예 및 제 3 구현예를 기초로 하여, 세그먼트화된 시간 도메인 다운 믹싱 처리가 수행된다.
네거티브형 신호 채널 조합 솔루션으로부터 포지티브형 신호 채널 조합 솔루션으로의 전이에 대응하는 세그먼트화된 다운 믹싱 처리는 포지티브형 신호 채널 조합 솔루션으로부터 네거티브형으로의 전이에 대응하는 세그먼트화된 다운 믹싱 처리와 유사하고, 또한 세 개의 부분: 다운 믹싱 처리 4, 다운 믹싱 처리 5 및 다운 믹싱 처리 6를 포함한다. 특정 처리는 다음과 같다:
다운 믹싱 처리 4는 네거티브형 신호 채널 조합 솔루션을 사용하는 처리의 종료 섹션에 대응한다. 시간 도메인 다운 믹싱 처리는 이전 프레임의 네거티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자를 사용하고 제 2 채널 조합 솔루션에 대응하는 시간 도메인 다운 믹싱 처리 방법을 사용함으로써 수행되므로, 현재 프레임 및 이전 프레임에서의 처리 결과의 연속성을 보장하기 위해 이전 프레임에서와 동일한 처리 방식이 사용된다.
다운 믹싱 처리 5는 네거티브형 신호 채널 조합 솔루션을 이용하는 처리와 포지티브형 신호 채널 조합 솔루션을 이용하는 처리의 중첩 섹션에 해당한다. 이전 프레임의 네거티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자를 사용하고 네거티브형 신호 채널 조합 솔루션에 대응하는 시간 도메인 다운 믹싱 처리 방법을 사용함으로써 수행된 시간 도메인 다운 믹싱을 통해 획득된 처리 결과 1과 현재 프레임의 포지티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자를 사용하고 포지티브형 신호 채널 조합 솔루션에 대응하는 시간 도메인 다운 믹싱 처리 방법을 사용함으로써 수행된 시간 도메인 다운 믹싱을 통해 획득된 처리 결과 2에 대해 가중 처리가 수행되어, 최종 처리 결과를 획득하며, 여기서 가중 처리는 구체적으로는 결과 1의 페이드-아웃 및 결과 2의 페이드-인이고, 상호 대응하는 포인트에서 결과 1과 결과 2의 가중 계수의 합은 1이므로, 중첩 섹션에서 및 시작 섹션과 종료 섹션에서 두 개의 채널 조합 솔루션을 사용함으로써 획득된 처리 결과의 연속성이 보장된다.
다운 믹싱 처리 6은 포지티브형 신호 채널 조합 솔루션을 사용하는 처리의 시작 섹션에 대응한다: 시간 도메인 다운 믹싱 처리는 현재 프레임의 포지티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자를 사용하고 포지티브형 신호 채널 조합 솔루션에 대응하는 시간 도메인 다운 믹싱 처리 방법을 사용함으로써 수행되므로, 현재 프레임 및 이전 프레임에서의 처리 결과의 연속성을 보장하기 위해 다음 프레임에서와 동일한 처리 방식이 사용된다.
(710). 1차 채널 신호 및 2차 채널 신호를 별도로 인코딩한다.
구체적으로, 구현예에서, 현재 프레임의 이전 프레임의 1차 채널 신호 및/또는 2차 채널 신호의 인코딩 동안 획득된 파라미터 정보 및 현재 프레임의 제 1 채널 신호 및 제 2 채널 신호의 인코딩을 위한 총 비트 수에 기초하여 현재 프레임의 1차 채널 신호 및 2차 채널 신호의 인코딩을 위한 비트 할당이 수행될 수 있다. 그 다음에 1차 채널 신호와 2차 채널 신호가 비트 할당 결과에 따라 별도로 인코딩되어, 1차 채널 신호의 인코딩 인덱스 및 2차 채널 신호의 인코딩 인덱스를 획득한다. 임의의 모노 오디오 인코딩 기술이 1차 채널 신호 및 2차 채널 신호를 인코딩하기 위해 사용될 수 있으며, 상세한 설명은 여기서 설명되지 않는다.
(711). 현재 프레임의 채널 조합 비율 인자의 인코딩 인덱스, 현재 프레임의 1차 채널 신호의 인코딩 인덱스, 현재 프레임의 2차 채널 신호의 인코딩 인덱스 및 현재 프레임의 채널 조합 솔루션 플래그를 비트스트림에 기입한다.
현재 프레임의 채널 조합 비율 인자의 인코딩 인덱스, 현재 프레임의 1차 채널 신호의 인코딩 인덱스, 현재 프레임의 2차 채널 신호의 인코딩 인덱스 및 채널 현재 프레임의 채널 조합 솔루션 플래그가 비트스트림에 기입되기 전에, 현재 프레임의 채널 조합 비율 인자의 인코딩 인덱스, 현재 프레임의 1차 채널 신호의 인코딩 인덱스, 현재 프레임의 2차 채널 신호의 인코딩 인덱스 및 현재 프레임의 채널 조합 솔루션 플래그 중 적어도 하나가 추가로 처리될 수 있다는 것이 이해될 수 있다. 이 경우, 비트스트림에 기입된 정보는 처리 이후에 획득되는 관련된 정보이다.
구체적으로, 현재 프레임의 채널 조합 솔루션 플래그 tdm_SM_flag가 포지티브형 신호 채널 조합 솔루션에 대응하면, 현재 프레임의 포지티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자의 최종 인코딩 인덱스 ratio_idx가 비트스트림에 기입된다. 채널 조합 솔루션 플래그 tdm_SM_flag가 네거티브형 신호 채널 조합 솔루션에 대응하면, 현재 프레임의 네거티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자의 최종 인코딩 인덱스 ratio_idx_SM가 비트스트림에 기입된다. tdm_SM_flag = 0이면, 현재 프레임의 포지티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자의 최종 인코딩 인덱스 ratio_idx가 비트스트림에 기입되고; 또는 tdm_SM_flag = 1이면, 현재 프레임의 네거티브형 신호 채널 조합 솔루션에 대응하는 채널 조합 비율 인자의 최종 인코딩 인덱스 ratio_idx_SM가 비트스트림에 기입된다.
전술한 설명으로부터, 스테레오 인코딩이 본 실시예에서 수행될 때, 현재 프레임의 채널 조합 인코딩 솔루션이 먼저 결정되고, 그런 다음 결정된 채널 조합 인코딩 솔루션에 기초하여 현재 프레임의 양자화된 채널 조합 비율 인자 및 양자화된 채널 조합 비율 인자의 인코딩 인덱스가 획득되어, 현재 프레임의 획득된 1차 채널 신호 및 2차 채널 신호가 현재 프레임의 특성을 충족시킴으로써, 인코딩 이후에 획득된 합성된 스테레오 오디오 신호의 사운드 이미지가 안정적이고, 드리프트 현상이 줄어들며, 인코딩 품질이 향상되는 것이 보장된다는 것이 체득될 수 있다.
설명을 간략하게 하기 위해, 전술한 방법 실시예는 일련의 행위로서 표현된다는 것을 알아야 한다. 그러나, 관련 기술분야에서 통상의 기술자라면, 본 발명에 따라서, 일부 단계는 다른 순서로 수행되거나 동시에 수행될 수 있기 때문에, 본 발명은 설명된 행위 순서로 제한되지 않는다는 것을 인식할 것이다. 또한, 관련 기술분야에서 통상의 기술자라면 명세서에 기재된 모든 실시예는 예시적인 실시예이고, 관련된 행위 및 모듈은 반드시 본 발명에 필수적인 것이 아니라는 것을 또한 인식하여야 한다.
도 8은 본 발명의 실시예에 따른 시퀀스 변환 장치(800)의 구조를 도시한다. 장치는 적어도 하나의 프로세서(802)(예를 들어, CPU), 적어도 하나의 네트워크 인터페이스(805) 또는 다른 통신 인터페이스, 메모리(806) 및 이들 장치 사이의 연결 및 통신을 구현하도록 구성된 적어도 하나의 통신 버스(803)를 포함한다. 프로세서(802)는 메모리(806)에 저장된 실행 가능 모듈, 예를 들면, 컴퓨터 프로그램을 실행하도록 구성된다. 메모리(806)는 고속 랜덤 액세스 메모리(RAM: Random Access Memory)를 포함할 수 있고, 또는 예를 들어 적어도 하나의 디스크 메모리와 같은 비 휘발성 메모리(non-volatile memory)를 포함할 수 있다. 시스템 내의 게이트웨이와 적어도 하나의 다른 네트워크 요소 사이의 통신 및 연결은 (유선 또는 무선일 수 있는) 적어도 하나의 네트워크 인터페이스(805)를 사용함으로써, 예를 들어 인터넷, 광역 네트워크, 근거리 네트워크, 대도시 영역 네트워크를 사용함으로써 구현된다.
일부 구현예에서, 프로그램(8061)은 메모리(806)에 저장되고, 프로그램(8061)은 프로세서(802)에 의해 실행될 수 있다. 본 발명의 실시예에서 제공되는 스테레오 인코딩 방법은 프로그램이 실행될 때 수행될 수 있다.
도 9는 본 발명의 실시예에 따른 스테레오 인코더(900)의 구조를 도시한다. 스테레오 인코더(900)는,
스테레오 오디오 신호의 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호 및 우측 채널 시간 도메인 신호에 대해 시간 도메인 전처리를 수행하여, 현재 프레임을 구성하는 전처리된 좌측 채널 시간 도메인 신호 및 전처리된 우측 채널 시간 도메인 신호를 획득하도록 구성된 전처리 유닛(901)과,
현재 프레임을 구성하는 전처리된 좌측 채널 시간 도메인 신호 및 전처리된 우측 채널 시간 도메인 신호에 대해 지연 정렬 처리를 수행하여, 현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호를 획득하도록 구성된 지연 정렬 처리 유닛(902)과,
현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 현재 프레임의 채널 조합 솔루션을 결정하도록 구성된 솔루션 결정 유닛(903)과,
현재 프레임의 결정된 채널 조합 솔루션, 및 현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호와 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 현재 프레임의 양자화된 채널 조합 비율 인자 및 양자화된 채널 조합 비율 인자의 인코딩 인덱스를 획득하도록 구성된 인자 획득 유닛(904)과,
현재 프레임의 결정된 채널 조합 솔루션에 기초하여 현재 프레임의 인코딩 모드를 결정하도록 구성된 모드 결정 유닛(905)과,
현재 프레임의 인코딩 모드 및 현재 프레임의 양자화된 채널 조합 비율 인자에 기초하여, 현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 정렬 이후에 획득된 우측 채널 시간 도메인 신호를 다운 믹싱하여, 현재 프레임의 1차 채널 신호 및 2차 채널 신호를 획득하도록 구성된 신호 획득 유닛(906)과,
현재 프레임의 1차 채널 신호 및 2차 채널 신호를 인코딩하도록 구성된 인코딩 유닛(907)을 포함한다.
구현예에서, 솔루션 결정 유닛(903)은 구체적으로,
현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 현재 프레임의 신호 타입을 결정 - 신호 타입은 포지티브형 신호 또는 네거티브형 신호를 포함함 - 하고,
적어도 현재 프레임의 신호 타입에 기초하여 대응적으로 현재 프레임의 채널 조합 솔루션을 결정하도록 구성될 수 있고, 여기서 채널 조합 솔루션은 네거티브형 신호를 처리하기 위해 사용되는 네거티브형 신호 채널 조합 솔루션 또는 포지티브형 신호를 처리하기 위해 사용되는 포지티브형 신호 채널 조합 솔루션을 포함한다.
구현예에서, 현재 프레임의 채널 조합 솔루션이 네거티브형 신호를 처리하기 위해 사용되는 네거티브형 신호 채널 조합 솔루션이면, 인자 획득 유닛(904)은 구체적으로:
현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 획득하고,
진폭 상관 차 파라미터를 현재 프레임의 채널 조합 비율 인자로 변환하고,
현재 프레임의 채널 조합 비율 인자를 양자화하여, 현재 프레임의 양자화된 채널 조합 비율 인자 및 양자화된 채널 조합 비율 인자의 인코딩 인덱스를 획득하도록 구성될 수 있다.
구현예에서, 현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 획득할 때, 인자 획득 유닛(904)은 구체적으로,
현재 프레임을 구성하는 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 현재 프레임의 기준 채널 신호를 결정하고,
지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 좌측 채널 진폭 상관 파라미터 및 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 우측 채널 진폭 상관 파라미터를 계산하고,
좌측 채널 진폭 상관 파라미터 및 우측 채널 진폭 상관 파라미터에 기초하여 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 계산하도록 구성될 수 있다.
구현예에서, 좌측 채널 진폭 상관 파라미터 및 우측 채널 진폭 상관 파라미터에 기초하여 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 계산할 때, 인자 획득 유닛(904)는 구체적으로,
좌측 채널 진폭 상관 파라미터에 기초하여 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터를 결정하고,
우측 채널 진폭 상관 파라미터에 기초하여 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터를 결정하고,
장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터 및 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터에 기초하여 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 결정하도록 구성될 수 있다.
구현예에서, 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터 및 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터에 기초하여 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 결정할 때, 인자 획득 유닛(904)는 구체적으로,
현재 프레임을 구성하는 장기간 평활화 이후에 획득된 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 다음의 수학식을 사용하여 결정하도록 구성될 수 있고,
Figure pct00134
, 여기서
diff_lt_corr은 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터이고, tdm_lt_corr_LM_SM cur 은 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터이고, tdm_lt_corr_RM_SM cur 은 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터이다.
구현예에서, 좌측 채널 진폭 상관 파라미터에 기초하여 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터를 결정할 때, 인자 획득 유닛(904)는 구체적으로,
장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터 tdm_lt_corr_LM_SM cur 을 다음의 수학식을 사용하여 결정하도록 구성될 수 있고,
Figure pct00135
, 여기서
tdm_lt_corr_LM_SM pre 는 장기간 평활화 이후에 획득되고 현재 프레임의 이전 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터이고, α는 평활화 인자이고, α의 값 범위는 [0, 1]이고, corr_LM은 좌측 채널 진폭 상관 파라미터이며;
우측 채널 진폭 상관 파라미터에 기초하여 장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터를 결정하는 것은,
장기간 평활화 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터 tdm_lt_corr_RM_SM cur 을 다음의 수학식을 사용하여 결정하는 것을 포함하고,
Figure pct00136
, 여기서
tdm_lt_corr_RM_SM pre 는 장기간 평활화 이후에 획득되고 현재 프레임의 이전 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터이고, β는 평활화 인자이고, β의 값 범위는 [0, 1]이며, corr_RM은 좌측 채널 진폭 상관 파라미터이다.
구현예에서, 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 좌측 채널 진폭 상관 파라미터 및 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 우측 채널 진폭 상관 파라미터를 계산할 때, 인자 획득 유닛(904)은 구체적으로,
지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 좌측 채널 진폭 상관 파라미터 corr_LM을 다음의 수학식을 사용하여 결정 -
Figure pct00137
, 여기서
Figure pct00138
은 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호이고, N은 현재 프레임의 프레임 길이이고, mono_i(n)은 기준 채널 신호임 - 하고,
지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호와 기준 채널 신호 사이의 좌측 채널 진폭 상관 파라미터 corr_RM을 다음의 수학식을 사용하여 결정하도록 구성될 수 있고,
Figure pct00139
, 여기서
Figure pct00140
은 지연 정렬 이후에 획득되고 현재 프레임을 구성하는 우측 채널 시간 도메인 신호이다.
구현예에서, 진폭 상관 차 파라미터를 현재 프레임의 채널 조합 비율 인자로 변환할 때, 인자 획득 유닛(904)은 구체적으로,
진폭 상관 차 파라미터에 대해 매핑 처리를 수행하여 매핑된 진폭 상관 차 파라미터를 획득 - 매핑된 진폭 상관 차 파라미터의 값은 미리 설정된 진폭 상관 차 파라미터 값 범위 내에 있음 - 하고,
매핑된 진폭 상관 차 파라미터를 현재 프레임의 채널 조합 비율 인자로 변환하도록 구성될 수 있다.
구현예에서, 진폭 상관 차 파라미터에 대해 매핑 처리를 수행할 때, 인자 획득 유닛(904)은 구체적으로,
진폭 상관 차 파라미터에 대해 진폭 제한을 수행하여, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 획득하고,
진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 매핑하여, 매핑된 진폭 상관 차 파라미터를 획득하도록 구성될 수 있다.
구현예에서, 진폭 상관 차 파라미터에 대해 진폭 제한을 수행하여, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 획득할 때, 인자 획득 유닛(904)은 구체적으로,
진폭 상관 차 파라미터에 대해 다음의 수학식을 사용하여 진폭 제한을 수행하도록 구성될 수 있고,
Figure pct00141
, 여기서
diff_lt_corr_limit는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터이고, diff_lt_corr는 진폭 상관 차 파라미터이고, RATIO_MAX는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 최대 값이고, RATIO_MIN는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 최소 값이고, RATIO_MAX > RATIO_MIN 이며; RATIO_MAXRATIO_MIN의 값에 대해서는 전술한 설명을 참조하고, 상세한 내용은 다시 설명되지 않는다.
구현예에서, 진폭 상관 차 파라미터에 대해 진폭 제한을 수행하여, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 획득할 때, 인자 획득 유닛(904)은 구체적으로,
진폭 상관 차 파라미터에 대해 다음의 수학식을 사용하여 진폭 제한을 수행하도록 구성될 수 있다:
Figure pct00142
, 여기서
diff_lt_corr_limit는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터이고, diff_lt_corr는 진폭 상관 차 파라미터이고, RATIO_MAX는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 최대 값이다.
구현예에서, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 매핑하여, 매핑된 진폭 상관 차 파라미터를 획득할 때, 인자 획득 유닛(904)은 구체적으로,
진폭 상관 차 파라미터를 다음의 수학식을 사용하여 매핑하도록 구성될 수 있고,
Figure pct00143
, 여기서
Figure pct00144
;
Figure pct00145
또는
Figure pct00146
;
Figure pct00147
;
Figure pct00148
또는
Figure pct00149
;
Figure pct00150
;
Figure pct00151
또는
Figure pct00152
;
diff_lt_corr_limit는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터이고, diff_lt_corr_map는 매핑된 진폭 상관 차 파라미터이고, MAP_MAX는 매핑된 진폭 상관 차 피라미터의 최대 값이고, MAP_HIGH는 매핑된 진폭 상관 차 파라미터의 값의 높은 임계치이고, MAP_LOW는 매핑된 진폭 상관 차 파라미터의 값의 낮은 임계치이고, MAP_MIN은 매핑된 진폭 상관 차 파라미터의 최소 값이고, MAP_MAX> MAP_HIGH > MAP_LOW > MAP_MIN이며, MAP_MAX, MAP_HIGH, MAP_LOW, MAP_MIN의 특정 값에 대해서는 전술한 설명을 참조하고, 상세한 내용은 다시 설명되지 않으며;
RATIO_MAX는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 최대 값이고, RATIO_HIGH는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 높은 임계치이고, RATIO_LOW는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 낮은 임계치이고, RATIO_MIN은 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 최소 값이고, RATIO_MAX > RATIO_HIGH > RATIO_LOW > RATIO_MIN이이며, RATIO_HIGHRATIO_LOW의 값에 대해서는 전술한 설명을 참조하고, 상세한 내용은 다시 설명되지 않는다.
구현예에서, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 매핑하여, 매핑된 진폭 상관 차 파라미터를 획득할 때, 인자 획득 유닛(904)은 구체적으로,
진폭 상관 차 파라미터를 다음의 수학식을 사용하여 매핑하도록 구성될 수 있고,
Figure pct00153
, 여기서
diff_lt_corr_map는 매핑된 진폭 상관 차 파라미터이고, diff_lt_corr_limit는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터이며, RATIO_MAX는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터의 최대 값이다.
구현예에서, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 매핑하여, 매핑된 진폭 상관 차 파라미터를 획득할 때, 인자 획득 유닛(904)은 구체적으로,
진폭 상관 차 파라미터를 다음의 수학식을 사용하여 매핑하도록 구성될 수 있고,
Figure pct00154
, 여기서
diff_lt_corr_map는 매핑된 진폭 상관 차 파라미터이고, diff_lt_corr_limit는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터이고, a의 값 범위는 [0, 1]이고, b의 값 범위는 [1.5, 3]이며, c의 값 범위는 [0, 0.5]이다.
구현예에서, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 매핑하여, 매핑된 진폭 상관 차 파라미터를 획득할 때, 인자 획득 유닛(904)은 구체적으로,
진폭 상관 차 파라미터를 다음의 수학식을 사용하여 매핑하도록 구성될 수 있고,
Figure pct00155
, 여기서
diff_lt_corr_map는 매핑된 진폭 상관 차 파라미터이고, diff_lt_corr_limit는 진폭 제한 이후에 획득된 진폭 상관 차 파라미터이고, a의 값 범위는 [0.08, 0.12]이고, b의 값 범위는 [0.03, 0.07]이며, c의 값 범위는 [0.1, 0.3]이다.
구현예에서, 매핑된 진폭 상관 차 파라미터를 현재 프레임의 채널 조합 비율 인자로 변환할 때, 인자 획득 유닛(904)은 구체적으로,
매핑된 진폭 상관 차 파라미터를 다음의 수학식을 사용하여 현재 프레임의 채널 조합 비율 인자로 변환하도록 구성될 수 있고,
Figure pct00156
, 여기서
ratio_SM은 현재 프레임의 채널 조합 비율 인자이고, diff_lt_corr_map는 매핑된 진폭 상관 차 파라미터이다.
전술한 설명으로부터, 스테레오 인코딩이 본 실시예에서 수행될 때, 현재 프레임의 채널 조합 인코딩 솔루션이 먼저 결정되고, 그런 다음 결정된 채널 조합 인코딩 솔루션에 기초하여 현재 프레임의 양자화된 채널 조합 비율 인자 및 양자화된 채널 조합 비율 인자의 인코딩 인덱스가 획득되어, 현재 프레임의 획득된 1차 채널 신호 및 2차 채널 신호가 현재 프레임의 특성을 충족시킴으로써, 인코딩 이후에 획득된 합성된 스테레오 오디오 신호의 사운드 이미지가 안정적이고, 드리프트 현상이 줄어들며, 인코딩 품질이 향상되는 것이 보장된다는 것이 체득될 수 있다.
스테레오 인코더 내의 모듈 간의 정보 교환 및 실행 프로세스와 같은 내용은 본 발명의 방법 실시예와 동일한 사상에 기초한다. 그러므로 상세한 내용에 대해서는 본 발명의 방법 실시예에서의 설명을 참조하고, 상세한 설명은 본 명세서에서 더 이상 설명되지 않는다.
관련 기술분야에서 통상의 기술자는 실시예의 방법의 전부 또는 일부의 프로세스가 관련된 하드웨어에 명령을 내리는 컴퓨터 프로그램에 의해 구현될 수 있다는 것을 이해할 수 있다. 프로그램은 컴퓨터 판독 가능 저장 매체에 저장될 수 있다. 프로그램이 실행될 때, 실시예의 방법의 프로세스가 수행된다. 전술한 저장 매체는: 자기 디스크, 광학 디스크, 판독 전용 메모리(Read-Only Memory, ROM) 또는 랜덤 액세스 메모리(Random Access Memory, RAM)를 포함할 수 있다.
본 명세서에서 본 발명의 원리 및 구현예를 설명하기 위해 특정 예가 사용된다. 전술한 실시예의 설명은 본 발명의 방법 및 사상을 이해하는 것을 돕고자 의도된 것일 뿐이다. 또한, 구현예 및 응용 범위와 관련하여, 본 발명의 사상에 따라 관련 기술분야에서 통상의 기술자에 의해 수정이 이루어질 수 있다. 그러므로, 본 명세서는 본 발명에 대한 제한으로 해석되지 않아야 한다.

Claims (34)

  1. 스테레오 인코딩 방법으로서,
    스테레오 오디오 신호의 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호 및 우측 채널 시간 도메인 신호에 대해 시간 도메인 전처리(time domain preprocessing)를 수행하여, 상기 현재 프레임을 구성하는 전처리된 좌측 채널 시간 도메인 신호 및 전처리된 우측 채널 시간 도메인 신호를 획득하는 단계와,
    상기 현재 프레임을 구성하는 상기 전처리된 좌측 채널 시간 도메인 신호 및 상기 전처리된 우측 채널 시간 도메인 신호에 대해 지연 정렬 처리(delay alignment processing)를 수행하여, 상기 현재 프레임을 구성하는 지연 정렬 이후에 획득된 상기 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 상기 우측 채널 시간 도메인 신호를 획득하는 단계와,
    상기 현재 프레임을 구성하는 지연 정렬 이후에 획득된 상기 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 상기 우측 채널 시간 도메인 신호에 기초하여 상기 현재 프레임의 채널 조합 솔루션(channel combination solution)을 결정하는 단계와,
    상기 현재 프레임의 상기 결정된 채널 조합 솔루션 및 상기 현재 프레임을 구성하는 지연 정렬 이후에 획득된 상기 좌측 채널 시간 도메인 신호와 지연 정렬 이후에 획득된 상기 우측 채널 시간 도메인 신호에 기초하여 상기 현재 프레임의 양자화된 채널 조합 비율 인자(channel combination ratio factor) 및 상기 양자화된 채널 조합 비율 인자의 인코딩 인덱스를 획득하는 단계와,
    상기 현재 프레임의 결정된 채널 조합 솔루션에 기초하여 상기 현재 프레임의 인코딩 모드를 결정하는 단계와,
    상기 현재 프레임의 상기 인코딩 모드 및 상기 현재 프레임의 상기 양자화된 채널 조합 비율 인자에 기초하여, 상기 현재 프레임을 구성하는 지연 정렬 이후에 획득된 상기 좌측 채널 시간 도메인 신호 및 정렬 이후에 획득된 상기 우측 채널 시간 도메인 신호를 다운 믹싱하여, 상기 현재 프레임의 1차 채널 신호 및 2차 채널 신호를 획득하는 단계와,
    상기 현재 프레임의 상기 1차 채널 신호 및 상기 2차 채널 신호를 인코딩하는 단계를 포함하는
    스테레오 인코딩 방법.
  2. 제 1 항에 있어서,
    상기 현재 프레임을 구성하는 지연 정렬 이후에 획득된 상기 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 상기 우측 채널 시간 도메인 신호에 기초하여 상기 현재 프레임의 채널 조합 솔루션을 결정하는 단계는,
    상기 현재 프레임을 구성하는 지연 정렬 이후에 획득된 상기 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 상기 우측 채널 시간 도메인 신호에 기초하여 상기 현재 프레임의 신호 타입을 결정하는 단계 - 상기 신호 타입은 포지티브형 신호(positive-like signal) 또는 네거티브형 신호(negative-like signal)를 포함함 - 와,
    적어도 상기 현재 프레임의 상기 신호 타입에 기초하여 상기 현재 프레임의 상기 채널 조합 솔루션을 결정하는 단계를 포함하고, 상기 채널 조합 솔루션은 네거티브형 신호를 처리하기 위해 사용되는 네거티브형 신호 채널 조합 솔루션 또는 포지티브형 신호를 처리하기 위해 사용되는 포지티브형 신호 채널 조합 솔루션을 포함하는
    스테레오 인코딩 방법.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 현재 프레임의 상기 채널 조합 솔루션이 네거티브형 신호를 처리하기 위해 사용되는 상기 네거티브형 신호 채널 조합 솔루션이면, 상기 현재 프레임의 상기 결정된 채널 조합 솔루션, 및 상기 현재 프레임을 구성하는 지연 정렬 이후에 획득된 상기 좌측 채널 시간 도메인 신호와 지연 정렬 이후에 획득된 상기 우측 채널 시간 도메인 신호에 기초하여 상기 현재 프레임의 양자화된 채널 조합 비율 인자 및 상기 양자화된 채널 조합 비율 인자의 인코딩 인덱스를 획득하는 단계는,
    상기 현재 프레임을 구성하는 지연 정렬 이후에 획득된 상기 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 상기 우측 채널 시간 도메인 신호에 기초하여 장기간 평활화(long-term smoothing) 이후에 획득되고 상기 현재 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터(amplitude correlation difference parameter)를 획득하는 단계와,
    상기 진폭 상관 차 파라미터를 상기 현재 프레임의 채널 조합 비율 인자로 변환하는 단계와,
    상기 현재 프레임의 상기 채널 조합 비율 인자를 양자화하여, 상기 현재 프레임의 상기 양자화된 채널 조합 비율 인자 및 상기 양자화된 채널 조합 비율 인자의 상기 인코딩 인덱스를 획득하는 단계를 포함하는
    스테레오 인코딩 방법.
  4. 제 3 항에 있어서,
    상기 진폭 상관 차 파라미터를 상기 현재 프레임의 채널 조합 비율 인자로 변환하는 단계는,
    상기 진폭 상관 차 파라미터에 대해 매핑 처리(mapping processing)를 수행하여 매핑된 진폭 상관 차 파라미터를 획득하는 단계 - 상기 매핑된 진폭 상관 차 파라미터의 값은 미리 설정된 진폭 상관 차 파라미터 값 범위 내에 있음 - 와,
    상기 매핑된 진폭 상관 차 파라미터를 상기 현재 프레임의 상기 채널 조합 비율 인자로 변환하는 단계를 포함하는
    스테레오 인코딩 방법.
  5. 제 4 항에 있어서,
    상기 진폭 상관 차 파라미터에 대해 매핑 처리를 수행하는 단계는,
    상기 진폭 상관 차 파라미터에 대해 진폭 제한(amplitude limiting)을 수행하여, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 획득하는 단계와,
    진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터를 매핑하여, 상기 매핑된 진폭 상관 차 파라미터를 획득하는 단계를 포함하는
    스테레오 인코딩 방법.
  6. 제 5 항에 있어서,
    상기 진폭 상관 차 파라미터에 대해 진폭 제한을 수행하여, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 획득하는 단계는,
    상기 진폭 상관 차 파라미터에 대해 다음의 수학식을 사용하여 진폭 제한을 수행하는 단계를 포함하고,
    Figure pct00157
    , 여기서
    diff_lt_corr_limit는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터이고, diff_lt_corr는 상기 진폭 상관 차 파라미터이고, RATIO_MAX는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터의 최대 값이고, RATIO_MIN는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터의 최소 값이고, RATIO_MAX > RATIO_MIN 이고, RATIO_MAX 의 값의 범위는 [1.0, 3.0]이고, RATIO_MIN 의 값 범위는 [-3.0, -1.0]인
    스테레오 인코딩 방법.
  7. 제 5 항에 있어서,
    상기 진폭 상관 차 파라미터에 대해 진폭 제한을 수행하여, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 획득하는 단계는,
    상기 진폭 상관 차 파라미터에 대해 다음의 수학식을 사용하여 진폭 제한을 수행하는 단계를 포함하고,
    Figure pct00158
    , 여기서
    diff_lt_corr_limit는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터이고; diff_lt_corr는 상기 진폭 상관 차 파라미터이고, RATIO_MAX는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터의 최대 값이고, RATIO_MAX 의 값의 범위는 [1.0, 3.0]인
    스테레오 인코딩 방법.
  8. 제 5 항 내지 제 7 항 중 어느 한 항에 있어서,
    진폭 제한 후에 획득된 상기 진폭 상관 파라미터를 매핑하여, 상기 매핑된 진폭 상관 차 파라미터를 획득하는 단계는,
    상기 진폭 상관 차 파라미터를 다음의 수학식을 사용하여 매핑하는 단계를 포함하고,
    Figure pct00159
    , 여기서
    Figure pct00160
    ;
    Figure pct00161
    또는
    Figure pct00162
    ;
    Figure pct00163
    ;
    Figure pct00164
    또는
    Figure pct00165
    ;
    Figure pct00166
    ;
    Figure pct00167
    또는
    Figure pct00168
    ;
    diff_lt_corr_limit는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터이고, diff_lt_corr_map는 상기 매핑된 진폭 상관 차 파라미터이고, MAP_MAX는 상기 매핑된 진폭 상관 차 피라미터의 최대 값이고, MAP_HIGH는 상기 매핑된 진폭 상관 차 파라미터의 값의 높은 임계치이고, MAP_LOW는 상기 매핑된 진폭 상관 차 파라미터의 값의 낮은 임계치이고, MAP_MIN은 상기 매핑된 진폭 상관 차 파라미터의 최소 값이고, MAP_MAX> MAP_HIGH > MAP_LOW > MAP_MIN이고, MAP_MAX의 범위는 [2.0, 2.5]이고, MAP_HIGH의 값 범위는 [1.2, 1.7]이고, MAP_LOW의 값 범위는 [0.8, 1.3]이고, MAP_MIN의 값 범위는 [0.0, 0.5]이며;
    RATIO_MAX는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터의 최대 값이고, RATIO_HIGH는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터의 높은 임계치이고, RATIO_LOW는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터의 낮은 임계치이고, RATIO_MIN은 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터의 최소 값이고, RATIO_MAX > RATIO_HIGH > RATIO_LOW > RATIO_MIN이고, RATIO_MAX의 값 범위는 [1.0, 3.0]이고, RATIO_HIGH의 값 범위는 [0.5, 1.0]이고, RATIO_LOW의 값 범위는 [-1.0, -0.5]이며, RATIO_MIN의 값 범위는 [-3.0, -1.0]인
    스테레오 인코딩 방법.
  9. 제 5 항 내지 제 7 항 중 어느 한 항에 있어서,
    진폭 제한 후에 획득된 상기 진폭 상관 파라미터를 매핑하여, 상기 매핑된 진폭 상관 차 파라미터를 획득하는 단계는,
    상기 진폭 상관 차 파라미터를 다음의 수학식을 사용하여 매핑하는 단계를 포함하고,
    Figure pct00169
    , 여기서
    diff_lt_corr_map는 매핑된 상기 진폭 상관 차 파라미터이고, diff_lt_corr_limit는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터이고, RATIO_MAX는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터의 최대 값이고, RATIO_MAX의 값 범위는 [1.0, 3.0]인
    스테레오 인코딩 방법.
  10. 제 5 항 내지 제 7 항 중 어느 한 항에 있어서,
    진폭 제한 후에 획득된 상기 진폭 상관 파라미터를 매핑하여, 상기 매핑된 진폭 상관 차 파라미터를 획득하는 단계는,
    상기 진폭 상관 차 파라미터를 다음의 수학식을 사용하여 매핑하는 단계를 포함하고,
    Figure pct00170
    , 여기서
    diff_lt_corr_map는 상기 매핑된 진폭 상관 차 파라미터이고, diff_lt_corr_limit는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터이고, a의 값 범위는 [0, 1]이고, b의 값 범위는 [1.5, 3]이고, c의 값 범위는 [0, 0.5]인
    스테레오 인코딩 방법.
  11. 제 5 항 내지 제 7 항 중 어느 한 항에 있어서,
    진폭 제한 후에 획득된 상기 진폭 상관 파라미터를 매핑하여, 상기 매핑된 진폭 상관 차 파라미터를 획득하는 단계는,
    상기 진폭 상관 차 파라미터를 다음의 수학식을 사용하여 매핑하는 단계를 포함하고,
    Figure pct00171
    , 여기서
    diff_lt_corr_map는 상기 매핑된 진폭 상관 차 파라미터이고, diff_lt_corr_limit는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터이고, a의 값 범위는 [0.08, 0.12]이고, b의 값 범위는 [0.03, 0.07]이며, c의 값 범위는 [0.1, 0.3]인
    스테레오 인코딩 방법.
  12. 제 5 항 내지 제 11 항 중 어느 한 항에 있어서,
    상기 매핑된 진폭 상관 차 파라미터를 상기 현재 프레임의 상기 채널 조합 비율 인자로 변환하는 단계는,
    상기 매핑된 진폭 상관 차 파라미터를 다음의 수학식을 사용하여 상기 현재 프레임의 상기 채널 조합 비율 인자로 변환하는 단계를 포함하고,
    Figure pct00172
    , 여기서
    ratio_SM은 상기 현재 프레임의 상기 채널 조합 비율 인자이고, diff_lt_corr_map는 상기 매핑된 진폭 상관 차 파라미터인
    스테레오 인코딩 방법.
  13. 제 3 항 내지 제 12 항 중 어느 한 항에 있어서,
    상기 현재 프레임을 구성하는 지연 정렬 이후에 획득된 상기 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 상기 우측 채널 시간 도메인 신호에 기초하여 상기 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 상기 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 상기 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터를 획득하는 단계는,
    상기 현재 프레임을 구성하는 지연 정렬 이후에 획득된 상기 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 상기 우측 채널 시간 도메인 신호에 기초하여 상기 현재 프레임의 기준 채널 신호를 결정하는 단계와,
    지연 정렬 이후에 획득되고 상기 현재 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 좌측 채널 진폭 상관 파라미터 및 지연 정렬 이후에 획득되고 상기 현재 프레임을 구성하는 상기 우측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 우측 채널 진폭 상관 파라미터를 계산하는 단계와,
    상기 좌측 채널 진폭 상관 파라미터 및 상기 우측 채널 진폭 상관 파라미터에 기초하여 상기 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 상기 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 상기 우측 채널 시간 도메인 신호 사이의 상기 진폭 상관 차 파라미터를 계산하는 단계를 포함하는
    스테레오 인코딩 방법.
  14. 제 13 항에 있어서,
    상기 좌측 채널 진폭 상관 파라미터 및 상기 우측 채널 진폭 상관 파라미터에 기초하여 상기 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 상기 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 상기 우측 채널 시간 도메인 신호 사이의 상기 진폭 상관 차 파라미터를 계산하는 단계는,
    상기 좌측 채널 진폭 상관 파라미터에 기초하여 장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 진폭 상관 파라미터를 결정하는 단계와,
    상기 우측 채널 진폭 상관 파라미터에 기초하여 장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 우측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 진폭 상관 파라미터를 결정하는 단계와,
    장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 진폭 상관 파라미터 및 장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 우측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 진폭 상관 파라미터에 기초하여 상기 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 상기 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 상기 우측 채널 시간 도메인 신호 사이의 상기 진폭 상관 차 파라미터를 결정하는 단계를 포함하는
    스테레오 인코딩 방법.
  15. 제 14 항에 있어서,
    장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 진폭 상관 파라미터 및 장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 우측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 진폭 상관 파라미터에 기초하여 상기 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 상기 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 상기 우측 채널 시간 도메인 신호 사이의 상기 진폭 상관 차 파라미터를 결정하는 단계는,
    상기 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 상기 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 상기 우측 채널 시간 도메인 신호 사이의 상기 진폭 상관 차 파라미터를 다음의 수학식을 사용하여 결정하는 단계를 포함하고,
    Figure pct00173
    , 여기서
    diff_lt_corr는 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 상기 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 상기 우측 채널 시간 도메인 신호 사이의 상기 진폭 상관 차 파라미터이고, tdm_lt_corr_LM_SM cur 는 장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 상기 진폭 상관 파라미터이고, tdm_lt_corr_RM_SM cur 는 장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 우측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 진폭 상관 파라미터인
    스테레오 인코딩 방법.
  16. 제 14 항 또는 제 15 항에 있어서,
    상기 좌측 채널 진폭 상관 파라미터에 기초하여 장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 진폭 상관 파라미터를 결정하는 단계는,
    장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 진폭 상관 파라미터 tdm_lt_corr_LM_SM cur 을 다음의 수학식을 사용하여 결정하는 단계를 포함하고,
    Figure pct00174
    , 여기서
    tdm_lt_corr_LM_SM pre 는 장기간 평활화 이후에 획득되고 상기 현재 프레임의 이전 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 진폭 상관 파라미터이고, α는 평활화 인자이고, α의 값 범위는 [0, 1]이고, corr_LM은 좌측 채널 진폭 상관 파라미터이며;
    상기 우측 채널 진폭 상관 파라미터에 기초하여 장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 우측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 진폭 상관 파라미터를 결정하는 단계는,
    장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 우측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 진폭 상관 파라미터 tdm_lt_corr_RM_SM cur 을 다음의 수학식을 사용하여 결정하는 단계를 포함하고,
    Figure pct00175
    , 여기서
    tdm_lt_corr_RM_SM pre 장기간 평활화 이후에 획득되고 상기 현재 프레임의 이전 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 진폭 상관 파라미터이고, β는 평활화 인자이고, β의 값 범위는 [0, 1]이며, corr_RM은 상기 좌측 채널 진폭 상관 파라미터인
    스테레오 인코딩 방법.
  17. 제 13 항 내지 제 16 항 중 어느 한 항에 있어서,
    지연 정렬 이후에 획득되고 상기 현재 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 좌측 채널 진폭 상관 파라미터 및 지연 정렬 이후에 획득되고 상기 현재 프레임을 구성하는 상기 우측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 우측 채널 진폭 상관 파라미터를 계산하는 단계는,
    지연 정렬 이후에 획득되고 상기 현재 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 좌측 채널 진폭 상관 파라미터 corr_LM을 다음의 수학식을 사용하여 결정하는 단계 -
    Figure pct00176
    , 여기서
    Figure pct00177
    는 지연 정렬 이후에 획득되고 상기 현재 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호이고, N은 상기 현재 프레임의 프레임 길이이고, mono_i(n)은 기준 채널 신호임 - 와,
    지연 정렬 이후에 획득되고 상기 현재 프레임을 구성하는 상기 우측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 좌측 채널 진폭 상관 파라미터 corr_RM을 다음의 수학식을 사용하여 결정하는 단계를 포함하고,
    Figure pct00178
    ,여기서
    Figure pct00179
    는 지연 정렬 이후에 획득되고 상기 현재 프레임을 구성하는 상기 우측 채널 시간 도메인 신호인
    스테레오 인코딩 방법.
  18. 프로세서 및 메모리를 포함하는 스테레오 인코더로서,
    상기 메모리는 실행 가능 명령어를 저장하고, 상기 실행 가능 명령어는 상기 프로세서로 하여금 다음의 단계,
    스테레오 오디오 신호의 현재 프레임을 구성하는 좌측 채널 시간 도메인 신호 및 우측 채널 시간 도메인 신호에 대해 시간 도메인 전처리(time domain preprocessing)를 수행하여, 상기 현재 프레임을 구성하는 전처리된 좌측 채널 시간 도메인 신호 및 전처리된 우측 채널 시간 도메인 신호를 획득하는 단계와,
    상기 현재 프레임을 구성하는 상기 전처리된 좌측 채널 시간 도메인 신호 및 상기 전처리된 우측 채널 시간 도메인 신호에 대해 지연 정렬 처리(delay alignment processing)를 수행하여, 상기 현재 프레임을 구성하는 지연 정렬 이후에 획득된 상기 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 상기 우측 채널 시간 도메인 신호를 획득하는 단계와,
    상기 현재 프레임을 구성하는 상기 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호 및 상기 지연 정렬 이후에 획득된 우측 채널 시간 도메인 신호에 기초하여 상기 현재 프레임의 채널 조합 솔루션(channel combination solution)을 결정하는 단계와,
    상기 현재 프레임의 상기 결정된 채널 조합 솔루션 및 상기 현재 프레임을 구성하는 지연 정렬 이후에 획득된 상기 좌측 채널 시간 도메인 신호와 지연 정렬 이후에 획득된 상기 우측 채널 시간 도메인 신호에 기초하여 상기 현재 프레임의 양자화된 채널 조합 비율 인자(channel combination ratio factor) 및 상기 양자화된 채널 조합 비율 인자의 인코딩 인덱스를 획득하는 단계와,
    상기 현재 프레임의 상기 결정된 채널 조합 솔루션에 기초하여 상기 현재 프레임의 인코딩 모드를 결정하는 단계와,
    상기 현재 프레임의 상기 인코딩 모드 및 상기 현재 프레임의 상기 양자화된 채널 조합 비율 인자에 기초하여, 상기 현재 프레임을 구성하는 지연 정렬 이후에 획득된 상기 좌측 채널 시간 도메인 신호 및 정렬 이후에 획득된 상기 우측 채널 시간 도메인 신호를 다운 믹싱하여, 상기 현재 프레임의 1차 채널 신호 및 2차 채널 신호를 획득하는 단계와,
    상기 현재 프레임의 상기 1차 채널 신호 및 상기 2차 채널 신호를 인코딩하는 단계를 수행하도록 명령하는데 사용되는
    스테레오 인코더.
  19. 제 18 항에 있어서,
    상기 실행 가능 명령어는 상기 현재 프레임을 구성하는 지연 정렬 이후에 획득된 상기 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 상기 우측 채널 시간 도메인 신호에 기초하여 상기 현재 프레임의 상기 채널 조합 솔루션을 결정할 때 상기 프로세서로 하여금 다음의 단계,
    상기 현재 프레임을 구성하는 지연 정렬 이후에 획득된 상기 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 상기 우측 채널 시간 도메인 신호에 기초하여 상기 현재 프레임의 신호 타입을 결정하는 단계 - 상기 신호 타입은 포지티브형 신호(positive-like signal) 또는 네거티브형 신호(negative-like signal)를 포함함 - 와,
    적어도 상기 현재 프레임의 상기 신호 타입에 기초하여 상기 현재 프레임의 상기 채널 조합 솔루션을 대응적으로 결정하는 단계를 수행하도록 명령하는데 사용되고, 상기 채널 조합 솔루션은 네거티브형 신호를 처리하기 위해 사용되는 네거티브형 신호 채널 조합 솔루션 또는 포지티브형 신호를 처리하기 위해 사용되는 포지티브형 신호 채널 조합 솔루션을 포함하는
    스테레오 인코더.
  20. 제 18 항 또는 제 19 항에 있어서,
    상기 현재 프레임의 상기 채널 조합 솔루션이 네거티브형 신호를 처리하기 위해 사용되는 상기 네거티브형 신호 채널 조합 솔루션이면, 상기 실행 가능 명령어는 상기 현재 프레임의 상기 결정된 채널 조합 솔루션, 및 상기 현재 프레임을 구성하는 상기 지연 정렬 이후에 획득된 좌측 채널 시간 도메인 신호와 지연 정렬 이후에 획득된 상기 우측 채널 시간 도메인 신호에 기초하여 상기 현재 프레임의 양자화된 채널 조합 비율 인자 및 상기 양자화된 채널 조합 비율 인자의 인코딩 인덱스를 획득할 때 상기 프로세서로 하여금 다음의 단계,
    상기 현재 프레임을 구성하는 지연 정렬 이후에 획득된 상기 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 상기 우측 채널 시간 도메인 신호에 기초하여 장기간 평활화(long-term smoothing) 이후에 획득되고 상기 현재 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 우측 채널 시간 도메인 신호 사이의 진폭 상관 차 파라미터(amplitude correlation difference parameter)를 획득하는 단계와,
    상기 진폭 상관 차 파라미터를 상기 현재 프레임의 채널 조합 비율 인자로 변환하는 단계와,
    상기 현재 프레임의 상기 채널 조합 비율 인자를 양자화하여, 상기 현재 프레임의 상기 양자화된 채널 조합 비율 인자 및 상기 양자화된 채널 조합 비율 인자의 상기 인코딩 인덱스를 획득하는 단계를 수행하도록 명령하는데 사용되는
    스테레오 인코더.
  21. 제 19 항에 있어서,
    상기 실행 가능 명령어는 상기 진폭 상관 차 파라미터를 상기 현재 프레임의 상기 채널 조합 비율 인자로 변환할 때 상기 프로세서로 하여금 다음의 단계,
    상기 진폭 상관 차 파라미터에 대해 매핑 처리(mapping processing)를 수행하여 매핑된 진폭 상관 차 파라미터를 획득하는 단계 - 상기 매핑된 진폭 상관 차 파라미터의 값은 미리 설정된 진폭 상관 차 파라미터 값 범위 내에 있음 - 와,
    상기 매핑된 진폭 상관 차 파라미터를 상기 현재 프레임의 상기 채널 조합 비율 인자로 변환하는 단계를 수행하도록 명령하는데 사용되는
    스테레오 인코더.
  22. 제 21 항에 있어서,
    상기 실행 가능 명령어는 상기 진폭 상관 차 파라미터에 대해 매핑 처리를 수행할 때 상기 프로세서로 하여금 다음의 단계,
    상기 진폭 상관 차 파라미터에 대해 진폭 제한(amplitude limiting)을 수행하여, 진폭 제한 이후에 획득된 진폭 상관 차 파라미터를 획득하는 단계와,
    진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터를 매핑하여, 상기 매핑된 진폭 상관 차 파라미터를 획득하는 단계를 수행하도록 명령하는데 사용되는
    스테레오 인코더.
  23. 제 22 항에 있어서,
    상기 실행 가능 명령어는 상기 진폭 상관 차 파라미터에 대해 진폭 제한을 수행하여, 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터를 획득할 때 상기 프로세서로 하여금 다음의 단계,
    상기 진폭 상관 차 파라미터에 대해 다음의 수학식을 사용하여 진폭 제한을 수행하는 단계를 수행하도록 명령하는데 사용되고,
    Figure pct00180
    , 여기서
    diff_lt_corr_limit는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터이고, diff_lt_corr는 상기 진폭 상관 차 파라미터이고, RATIO_MAX는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터의 최대 값이고, RATIO_MIN는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터의 최소 값이고, RATIO_MAX > RATIO_MIN 이며, RATIO_MAX의 값 범위는 [1.0, 3.0]이고, RATIO_MIN의 값 범위는 [-3.0, -1.0]인
    스테레오 인코더.
  24. 제 22 항에 있어서,
    상기 실행 가능 명령어는 상기 진폭 상관 차 파라미터에 대해 진폭 제한을 수행하여, 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터를 획득할 때 상기 프로세서로 하여금 다음의 단계,
    상기 진폭 상관 차 파라미터에 대해 다음의 수학식을 사용하여 진폭 제한을 수행하는 단계를 수행하도록 명령하는데 사용되고,
    Figure pct00181
    , 여기서
    diff_lt_corr_limit는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터이고, diff_lt_corr는 상기 진폭 상관 차 파라미터이고, RATIO_MAX는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터의 최대 값이며, RATIO_MAX의 값 범위는 [1.0, 3.0]인
    스테레오 인코더.
  25. 제 22 항 내지 제 24 항 중 어느 한 항에 있어서,
    상기 실행 가능 명령어는 진폭 제한 이후에 획득된 상기 진폭 상관 파라미터를 매핑하여, 상기 매핑된 진폭 상관 파라미터를 획득할 때 상기 프로세서로 하여금 다음의 단계,
    상기 진폭 상관 차 파라미터를 다음의 수학식을 사용하여 매핑하도록 명령하는데 사용되고,
    Figure pct00182
    , 여기서
    Figure pct00183
    ;
    Figure pct00184
    또는
    Figure pct00185
    ;
    Figure pct00186
    ;
    Figure pct00187
    또는
    Figure pct00188
    ;
    Figure pct00189
    ;
    Figure pct00190
    또는
    Figure pct00191
    ;
    diff_lt_corr_limit는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터이고, diff_lt_corr_map는 상기 매핑된 진폭 상관 차 파라미터이고, MAP_MAX는 상기 매핑된 진폭 상관 차 피라미터의 최대 값이고, MAP_HIGH는 상기 매핑된 진폭 상관 차 파라미터의 값의 높은 임계치이고, MAP_LOW는 상기 매핑된 진폭 상관 차 파라미터의 값의 낮은 임계치이고, MAP_MIN은 상기 매핑된 진폭 상관 차 파라미터의 최소 값이고, MAP_MAX > MAP_HIGH > MAP_LOW > MAP_MIN이고, MAP_MAX의 값 범위는 [2.0, 2.5]이고, MAP_HIGH의 값 범위는 [1.2, 1.7]이고, MAP_LOW의 값 범위는 [0.8, 1.3]이며, MAP_MIN의 값 범위는 [0.0, 0.5]이며;
    RATIO_MAX는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터의 최대 값이고, RATIO_HIGH는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터의 높은 임계치이고, RATIO_LOW는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터의 낮은 임계치이고, RATIO_MIN은 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터의 최소 값이고, RATIO_MAX > RATIO_HIGH > RATIO_LOW > RATIO_MIN이고, RATIO_MAX의 값 범위는 [1.0, 3.0]이고, RATIO_HIGH의 값 범위는 [0.5, 1.0]이고, RATIO_LOW의 값 범위는 [-1.0, -0.5]이며, RATIO_MIN의 값 범위는 [-3.0, -1.0]인
    스테레오 인코더.
  26. 제 22 항 내지 제 24 항 중 어느 한 항에 있어서,
    상기 다음의 단계는 진폭 제한 이후에 획득된 상기 진폭 상관 파라미터가 매핑되어 상기 매핑된 진폭 상관 차 파라미터를 획득할 때 수행되고,
    상기 진폭 상관 차 파라미터를 다음의 수학식을 사용하여 매핑하는 단계를 포함하고,
    Figure pct00192
    , 여기서
    diff_lt_corr_map는 상기 매핑된 진폭 상관 차 파라미터이고, diff_lt_corr_limit는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터이고, RATIO_MAX는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터의 최대 값이며, RATIO_MAX의 값 범위는 [1.0, 3.0]인
    스테레오 인코더.
  27. 제 22 항 내지 제 24 항 중 어느 한 항에 있어서,
    상기 실행 가능 명령어는 진폭 제한 이후에 획득된 상기 진폭 상관 파라미터를 매핑하여, 상기 매핑된 진폭 상관 파라미터를 획득할 때 상기 프로세서로 하여금 다음의 단계,
    상기 진폭 상관 차 파라미터를 다음의 수학식을 사용하여 매핑하는 단계를 수행하도록 명령하는데 사용되고,
    Figure pct00193
    , 여기서
    diff_lt_corr_map는 매핑된 상기 진폭 상관 차 파라미터이고, diff_lt_corr_limit는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터이고, a의 값 범위는 [0, 1]이고, b의 값 범위는 [1.5, 3]이며, c의 값 범위는 [0, 0.5]인
    스테레오 인코더.
  28. 제 22 항 내지 제 24 항 중 어느 한 항에 있어서,
    상기 실행 가능 명령어는 진폭 제한 이후에 획득된 상기 진폭 상관 파라미터를 매핑하여, 상기 매핑된 진폭 상관 파라미터를 획득할 때 상기 프로세서로 하여금 다음의 단계,
    상기 진폭 상관 차 파라미터를 다음의 수학식을 사용하여 매핑하는 단계를 수행하도록 명령하는데 사용되고,
    Figure pct00194
    , 여기서
    diff_lt_corr_map은 매핑된 상기 진폭 상관 차 파라미터이고, diff_lt_corr_limit는 진폭 제한 이후에 획득된 상기 진폭 상관 차 파라미터이고, a의 값 범위는 [0.08, 0.12]이고, b의 값 범위는 [0.03, 0.07]이며, c의 값 범위는 [0.1, 0.3]인
    스테레오 인코더.
  29. 제 22 항 내지 제 28 항 중 어느 한 항에 있어서,
    상기 실행 가능 명령어는 상기 매핑된 진폭 상관 차 파라미터를 상기 현재 프레임의 상기 채널 조합 비율 인자로 변환할 때 상기 프로세서로 하여금 다음의 단계,
    상기 매핑된 진폭 상관 차 파라미터를 다음의 수학식을 사용하여 상기 현재 프레임의 상기 채널 조합 비율 인자로 변환하는 단계를 수행하도록 명령하는데 사용되고,
    Figure pct00195
    , 여기서
    ratio_SM은 상기 현재 프레임의 상기 채널 조합 비율 인자이고, diff_lt_corr_map는 상기 매핑된 진폭 상관 차 파라미터인
    스테레오 인코더.
  30. 제 22항 내지 제 28 항 중 어느 한 항에 있어서,
    상기 실행 가능 명령어는 상기 현재 프레임을 구성하는 지연 정렬 이후에 획득된 상기 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 상기 우측 채널 시간 도메인 신호에 기초하여 상기 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 상기 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 상기 우측 채널 시간 도메인 신호 사이의 상기 진폭 상관 차 파라미터를 획득할 때 상기 프로세서로 하여금 다음의 단계,
    상기 현재 프레임을 구성하는 지연 정렬 이후에 획득된 상기 좌측 채널 시간 도메인 신호 및 지연 정렬 이후에 획득된 상기 우측 채널 시간 도메인 신호에 기초하여 상기 현재 프레임의 기준 채널 신호를 결정하는 단계와,
    지연 정렬 이후에 획득되고 상기 현재 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 좌측 채널 진폭 상관 파라미터 및 지연 정렬 이후에 획득되고 상기 현재 프레임을 구성하는 상기 우측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 우측 채널 진폭 상관 파라미터를 계산하는 단계와,
    상기 좌측 채널 진폭 상관 파라미터 및 상기 우측 채널 진폭 상관 파라미터에 기초하여 상기 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 상기 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 상기 우측 채널 시간 도메인 신호 사이의 상기 진폭 상관 차 파라미터를 계산하는 단계를 수행하도록 명령하는데 사용되는
    스테레오 인코더.
  31. 제 30 항에 있어서,
    상기 실행 가능 명령어는 상기 좌측 채널 진폭 상관 파라미터 및 상기 우측 채널 진폭 상관 파라미터에 기초하여 상기 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 상기 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 상기 우측 채널 시간 도메인 신호 사이의 상기 진폭 상관 차 파라미터를 계산할 때 상기 프로세서로 하여금 다음의 단계,
    상기 좌측 채널 진폭 상관 파라미터에 기초하여 장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 진폭 상관 파라미터를 결정하는 단계와,
    상기 우측 채널 진폭 상관 파라미터에 기초하여 장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 우측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 진폭 상관 파라미터를 결정하는 단계와,
    장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 진폭 상관 파라미터 및 장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 우측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 진폭 상관 파라미터에 기초하여 상기 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 상기 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 상기 우측 채널 시간 도메인 신호 사이의 상기 진폭 상관 차 파라미터를 결정하는 단계를 수행하도록 명령하는데 사용되는
    스테레오 인코더.
  32. 제 31 항에 있어서,
    상기 실행 가능 명령어는 장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 진폭 상관 파라미터 및 장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 우측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 진폭 상관 파라미터에 기초하여 상기 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 상기 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 상기 우측 채널 시간 도메인 신호 사이의 상기 진폭 상관 차 파라미터를 결정할 때 상기 프로세서로 하여금 다음의 단계,
    상기 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 상기 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 상기 우측 채널 시간 도메인 신호 사이의 상기 진폭 상관 차 파라미터를 다음의 수학식을 사용하여 결정하는 단계를 수행하도록 명령하는데 사용되고,
    Figure pct00196
    , 여기서
    diff_lt_corr은 상기 현재 프레임을 구성하는 장기간 평활화 이후에 획득된 상기 좌측 채널 시간 도메인 신호와 장기간 평활화 이후에 획득된 상기 우측 채널 시간 도메인 신호 사이의 상기 진폭 상관 차 파라미터이고, tdm_lt_corr_LM_SM cur 은 장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 진폭 상관 파라미터이고, tdm_lt_corr_RM_SM cur 은 장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 우측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 진폭 상관 파라미터인
    스테레오 인코더.
  33. 제 31 항 또는 제 32 항에 있어서,
    상기 실행 가능 명령어는 상기 좌측 채널 진폭 상관 파라미터에 기초하여 장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 진폭 상관 파라미터를 결정할 때 상기 프로세서로 하여금 다음의 단계,
    장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 진폭 상관 파라미터 tdm_lt_corr_LM_SM cur 을 다음의 수학식을 사용하여 결정하는 단계를 수행하도록 명령하는데 사용되고,
    Figure pct00197
    , 여기서
    tdm_lt_corr_LM_SM pre 는 장기간 평활화 이후에 획득되고 상기 현재 프레임의 이전 프레임을 구성하는 좌측 채널 시간 도메인 신호와 기준 채널 신호 사이의 진폭 상관 파라미터이고, α는 평활화 인자이고, α의 값 범위는 [0, 1]이고, corr_LM은 상기 좌측 채널 진폭 상관 파라미터이며;
    상기 실행 가능 명령어는 상기 우측 채널 진폭 상관 파라미터에 기초하여 장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 우측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 진폭 상관 파라미터를 결정할 때 상기 프로세서로 하여금 다음의 단계,
    장기간 평활화 이후에 획득되고 상기 현재 프레임을 구성하는 상기 우측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 진폭 상관 파라미터 tdm_lt_corr_RM_SM cur 을 다음의 수학식을 사용하여 결정하는 단계를 수행하도록 명령하는데 사용되고,
    Figure pct00198
    , 여기서
    tdm_lt_corr_RM_SM pre 는 장기간 평활화 이후에 획득되고 상기 현재 프레임의 이전 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 진폭 상관 파라미터이고, β는 평활화 인자이고, β의 값 범위는 [0, 1]이며, corr_RM은 좌측 채널 진폭 상관 파라미터인
    스테레오 인코더.
  34. 제 30 항 내지 제 33 항 중 어느 한 항에 있어서,
    상기 실행 가능 명령어는 지연 정렬 이후에 획득되고 상기 현재 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 좌측 채널 진폭 상관 파라미터 및 지연 정렬 이후에 획득되고 상기 현재 프레임을 구성하는 상기 우측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 우측 채널 진폭 상관 파라미터를 계산할 때 상기 프로세서로 하여금 다음의 단계,
    지연 정렬 이후에 획득되고 상기 현재 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 좌측 채널 진폭 상관 파라미터 corr_LM을 다음의 수학식을 사용하여 결정하는 단계 -
    Figure pct00199
    , 여기서
    Figure pct00200
    은 지연 정렬 이후에 획득되고 상기 현재 프레임을 구성하는 상기 좌측 채널 시간 도메인 신호이고, N은 상기 현재 프레임의 프레임 길이이고, mono_i(n)은 상기 기준 채널 신호임 - 와,
    지연 정렬 이후에 획득되고 상기 현재 프레임을 구성하는 상기 우측 채널 시간 도메인 신호와 상기 기준 채널 신호 사이의 상기 좌측 채널 진폭 상관 파라미터 corr_RM을 다음의 수학식을 사용하여 결정하는 단계를 수행하도록 명령하는데 사용되고,
    Figure pct00201
    , 여기서
    Figure pct00202
    은 지연 정렬 이후에 획득되고 상기 현재 프레임을 구성하는 상기 우측 채널 시간 도메인 신호인
    스테레오 인코더.
KR1020197021048A 2016-12-30 2017-12-20 스테레오 인코딩 방법 및 스테레오 인코더 KR102251639B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020217013814A KR102501351B1 (ko) 2016-12-30 2017-12-20 스테레오 인코딩 방법 및 스테레오 인코더

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201611261548.7 2016-12-30
CN201611261548.7A CN108269577B (zh) 2016-12-30 2016-12-30 立体声编码方法及立体声编码器
PCT/CN2017/117588 WO2018121386A1 (zh) 2016-12-30 2017-12-20 立体声编码方法及立体声编码器

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020217013814A Division KR102501351B1 (ko) 2016-12-30 2017-12-20 스테레오 인코딩 방법 및 스테레오 인코더

Publications (2)

Publication Number Publication Date
KR20190097214A true KR20190097214A (ko) 2019-08-20
KR102251639B1 KR102251639B1 (ko) 2021-05-12

Family

ID=62707856

Family Applications (4)

Application Number Title Priority Date Filing Date
KR1020237005305A KR102650806B1 (ko) 2016-12-30 2017-12-20 스테레오 인코딩 방법 및 스테레오 인코더
KR1020247009231A KR20240042184A (ko) 2016-12-30 2017-12-20 스테레오 인코딩 방법 및 스테레오 인코더
KR1020197021048A KR102251639B1 (ko) 2016-12-30 2017-12-20 스테레오 인코딩 방법 및 스테레오 인코더
KR1020217013814A KR102501351B1 (ko) 2016-12-30 2017-12-20 스테레오 인코딩 방법 및 스테레오 인코더

Family Applications Before (2)

Application Number Title Priority Date Filing Date
KR1020237005305A KR102650806B1 (ko) 2016-12-30 2017-12-20 스테레오 인코딩 방법 및 스테레오 인코더
KR1020247009231A KR20240042184A (ko) 2016-12-30 2017-12-20 스테레오 인코딩 방법 및 스테레오 인코더

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020217013814A KR102501351B1 (ko) 2016-12-30 2017-12-20 스테레오 인코딩 방법 및 스테레오 인코더

Country Status (7)

Country Link
US (5) US10714102B2 (ko)
EP (3) EP3547311B1 (ko)
KR (4) KR102650806B1 (ko)
CN (1) CN108269577B (ko)
BR (1) BR112019013599A2 (ko)
ES (2) ES2908605T3 (ko)
WO (1) WO2018121386A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108269577B (zh) * 2016-12-30 2019-10-22 华为技术有限公司 立体声编码方法及立体声编码器
CN109389986B (zh) * 2017-08-10 2023-08-22 华为技术有限公司 时域立体声参数的编码方法和相关产品
GB2582748A (en) * 2019-03-27 2020-10-07 Nokia Technologies Oy Sound field related rendering

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150310871A1 (en) * 2012-07-19 2015-10-29 Nokia Corporation Stereo audio signal encoder
KR20160015280A (ko) * 2013-05-28 2016-02-12 노키아 테크놀로지스 오와이 오디오 신호 인코더
US20160336014A1 (en) * 2015-05-15 2016-11-17 Harman International Industries, Inc. Multi-channel audio upmixer
US20170161309A1 (en) * 2015-12-02 2017-06-08 Sap Se Multi-threaded data analytics
WO2017161309A1 (en) * 2016-03-18 2017-09-21 Qualcomm Incorporated Audio processing for temporally mismatched signals

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6614365B2 (en) 2000-12-14 2003-09-02 Sony Corporation Coding device and method, decoding device and method, and recording medium
JP3951690B2 (ja) * 2000-12-14 2007-08-01 ソニー株式会社 符号化装置および方法、並びに記録媒体
JP2006521577A (ja) * 2003-03-24 2006-09-21 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャネル信号を表す主信号と副信号の符号化
WO2006025337A1 (ja) * 2004-08-31 2006-03-09 Matsushita Electric Industrial Co., Ltd. ステレオ信号生成装置およびステレオ信号生成方法
JP4892184B2 (ja) 2004-10-14 2012-03-07 パナソニック株式会社 音響信号符号化装置及び音響信号復号装置
US8200351B2 (en) * 2007-01-05 2012-06-12 STMicroelectronics Asia PTE., Ltd. Low power downmix energy equalization in parametric stereo encoders
KR101444102B1 (ko) * 2008-02-20 2014-09-26 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
KR101381513B1 (ko) 2008-07-14 2014-04-07 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
KR20110110093A (ko) 2008-10-01 2011-10-06 톰슨 라이센싱 디코딩 장치, 디코딩 방법, 인코딩 장치, 인코딩 방법, 및 편집 장치
KR101600352B1 (ko) * 2008-10-30 2016-03-07 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
CN101533641B (zh) * 2009-04-20 2011-07-20 华为技术有限公司 对多声道信号的声道延迟参数进行修正的方法和装置
CN102157152B (zh) * 2010-02-12 2014-04-30 华为技术有限公司 立体声编码的方法、装置
CN102157149B (zh) * 2010-02-12 2012-08-08 华为技术有限公司 立体声信号下混方法、编解码装置和编解码系统
JP6061121B2 (ja) 2011-07-01 2017-01-18 ソニー株式会社 オーディオ符号化装置、オーディオ符号化方法、およびプログラム
DK3353779T3 (da) * 2015-09-25 2020-08-10 Voiceage Corp Fremgangsmåde og system til kodning af et stereolydssignal ved at anvende kodningsparametre for en primær kanal til at kode en sekundær kanal
FR3045915A1 (fr) * 2015-12-16 2017-06-23 Orange Traitement de reduction de canaux adaptatif pour le codage d'un signal audio multicanal
US9978381B2 (en) * 2016-02-12 2018-05-22 Qualcomm Incorporated Encoding of multiple audio signals
US10217467B2 (en) * 2016-06-20 2019-02-26 Qualcomm Incorporated Encoding and decoding of interchannel phase differences between audio signals
US10224042B2 (en) * 2016-10-31 2019-03-05 Qualcomm Incorporated Encoding of multiple audio signals
CN108269577B (zh) * 2016-12-30 2019-10-22 华为技术有限公司 立体声编码方法及立体声编码器

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150310871A1 (en) * 2012-07-19 2015-10-29 Nokia Corporation Stereo audio signal encoder
KR20160015280A (ko) * 2013-05-28 2016-02-12 노키아 테크놀로지스 오와이 오디오 신호 인코더
US20160336014A1 (en) * 2015-05-15 2016-11-17 Harman International Industries, Inc. Multi-channel audio upmixer
US20170161309A1 (en) * 2015-12-02 2017-06-08 Sap Se Multi-threaded data analytics
WO2017161309A1 (en) * 2016-03-18 2017-09-21 Qualcomm Incorporated Audio processing for temporally mismatched signals

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Bertrand Fatus. Parametric Coding for Spatial Audio. Master’s Thesis, KTH, Stockholm, Sweden. 2015.12. *
Tomas Jansson. UPTEC F11 034 Stereo coding for the ITU-T G. 719 codec. 2011.05.* *

Also Published As

Publication number Publication date
EP3547311B1 (en) 2022-02-02
US20230077905A1 (en) 2023-03-16
KR102251639B1 (ko) 2021-05-12
ES2908605T3 (es) 2022-05-03
EP4030425B1 (en) 2023-09-27
EP4030425A1 (en) 2022-07-20
EP4287184A3 (en) 2024-02-14
US11790924B2 (en) 2023-10-17
KR20240042184A (ko) 2024-04-01
BR112019013599A2 (pt) 2020-01-07
EP4287184A2 (en) 2023-12-06
KR20230026546A (ko) 2023-02-24
US20200321012A1 (en) 2020-10-08
ES2965729T3 (es) 2024-04-16
EP3547311A4 (en) 2019-11-13
CN108269577B (zh) 2019-10-22
US11527253B2 (en) 2022-12-13
EP3547311A1 (en) 2019-10-02
CN108269577A (zh) 2018-07-10
KR102650806B1 (ko) 2024-03-22
US11043225B2 (en) 2021-06-22
KR102501351B1 (ko) 2023-02-17
US20230419974A1 (en) 2023-12-28
US20190325882A1 (en) 2019-10-24
US10714102B2 (en) 2020-07-14
WO2018121386A1 (zh) 2018-07-05
KR20210056446A (ko) 2021-05-18
US20210264925A1 (en) 2021-08-26

Similar Documents

Publication Publication Date Title
US11527253B2 (en) Stereo encoding method and stereo encoder
US11640825B2 (en) Time-domain stereo encoding and decoding method and related product
KR102664355B1 (ko) 오디오 코딩/디코딩 모드를 결정하는 방법 및 관련 제품
US11900952B2 (en) Time-domain stereo encoding and decoding method and related product
US11727943B2 (en) Time-domain stereo parameter encoding method and related product
RU2773022C2 (ru) Способ кодирования и декодирования стерео во временной области и сопутствующий продукт
RU2773421C9 (ru) Способ и соответствующий продукт для определения режима кодирования/декодирования аудио
RU2773421C2 (ru) Способ и соответствующий продукт для определения режима кодирования/декодирования аудио
RU2773636C2 (ru) Способ кодирования стереопараметров временной области и соответствующий продукт

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant