KR20220045053A - 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품 - Google Patents

시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품 Download PDF

Info

Publication number
KR20220045053A
KR20220045053A KR1020227010003A KR20227010003A KR20220045053A KR 20220045053 A KR20220045053 A KR 20220045053A KR 1020227010003 A KR1020227010003 A KR 1020227010003A KR 20227010003 A KR20227010003 A KR 20227010003A KR 20220045053 A KR20220045053 A KR 20220045053A
Authority
KR
South Korea
Prior art keywords
channel
current frame
signal
channel combination
denotes
Prior art date
Application number
KR1020227010003A
Other languages
English (en)
Other versions
KR102492791B1 (ko
Inventor
빈 왕
하이팅 리
레이 먀오
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Priority to KR1020237002617A priority Critical patent/KR102637514B1/ko
Publication of KR20220045053A publication Critical patent/KR20220045053A/ko
Application granted granted Critical
Publication of KR102492791B1 publication Critical patent/KR102492791B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Stereo-Broadcasting Methods (AREA)

Abstract

오디오 인코딩 및 디코딩 방법 및 관련 장치가 제공된다. 오디오 인코딩 방법은: 현재 프레임에 대한 채널 조합 방식을 결정하는 단계; 상기 현재 프레임에 대한 상기 채널 조합 방식이 상기 이전 프레임에 대한 상기 채널 조합 방식과 다를 때 상기 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리(segmented time-domain downmix processing)을 수행하여 상기 현재 프레임의 일차 채널 신호 및 이차 채널 신호를 획득하는 단계; 및 상기 현재 프레임에서의 상기 획득된 일차 채널 신호 및 이차 채널 신호를 인코딩하는 단계를 포함한다.

Description

시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품{TIME-DOMAIN STEREO CODING AND DECODING METHOD AND RELATED PRODUCT}
본 발명은 오디오 인코딩 및 디코딩 기술 분야에 관한 것이며, 특히 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품에 관한 것이다.
삶의 질이 향상됨에 따라 사람들은 고품질 오디오에 대한 요구를 증가시키고 있다. 모노 오디오와 비교하여 스테레오 오디오는 다양한 음원에 대한 방향 감각과 분배 감각을 가지며, 선명도, 명료성 및 정보의 존재감을 향상시킬 수 있으므로 사람들에게 인기가 있다.
파라 메트릭 스테레오 인코딩 및 디코딩 기술에서, 스테레오 신호는 모노 신호 및 공간 인식 파라미터로 변환되고, 멀티채널 신호는 압축된다. 이것은 일반적인 스테레오 인코딩 및 디코딩 기술이다. 그러나 파라 메트릭 스테레오 인코딩 및 디코딩 기술에서, 공간 인식 파라미터는 일반적으로 주파수 영역에서 추출될 필요가 있고 시간-주파수 변환이 수행될 필요가 있기 때문에, 전체 코덱의 지연이 비교적 크다. 따라서, 지연에 대한 요구가 비교적 엄격한 경우에는 시간-도메인 스테레오 인코딩 기술이 더 나은 선택이다.
종래의 시간-도메인 스테레오 인코딩 기술에서, 시간-도메인에서 2개의 모노 신호를 얻기 위해 신호가 다운믹스된다. 예를 들어, MS 인코딩 기술에서, 좌측 및 우측 채널 신호는 먼저 다운믹스되어 중간 채널(Mid 채널) 신호 및 사이드 채널(Side 채널) 신호를 획득한다. 예를 들어 L은 좌측 채널 신호를 나타내고 R은 우측 채널 신호를 나타낸다. 이 경우, 중간 채널 신호는 0.5 x(L R)이고, 중간 채널 신호는 좌측 채널과 우측 채널 사이의 상관에 관한 정보를 나타내고; 사이드 채널 신호는 0.5 x(L - R)이고, 사이드 채널 신호는 좌측 채널과 우측 채널의 차이에 관한 정보를 나타낸다. 그리고 미드 채널 신호와 사이드 채널 신호는 모노 인코딩 방법을 사용하여 별도로 인코딩되고, 미드 채널 신호는 일반적으로 더 많은 양의 비트를 사용하여 인코딩되며, 사이드 채널 신호는 일반적으로 더 적은 양의 비트를 사용하여 인코딩된다.
연구 및 실습을 통해, 종래의 시간-도메인 스테레오 인코딩 기술이 사용될 때 일차 신호의 에너지가 극도로 작거나 심지어 에너지가 누락되어 최종 인코딩 품질이 저하되는 것이 발견되었다.
본 발명의 실시예는 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품을 제공한다.
제1 관점에 따르면, 본 발명의 실시예는 시간-도메인 스테레오 인코딩 방법을 제공하고, 상기 방법은: 현재 프레임에 대한 채널 조합 방식을 결정하는 단계; 현재 프레임에 대한 채널 조합 방식이 이전 프레임에 대한 채널 조합 방식과 다를 때, 현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 채널 신호(primary channel signal) 및 이차 채널 신호(secondary channel signal)를 획득하는 단계; 및 현재 프레임에서의 획득된 일차 채널 신호 및 이차 채널 신호를 인코딩하는 단계를 포함한다.
현재 프레임의 스테레오 신호는 예를 들어 현재 프레임의 좌측 및 우측 채널 신호를 포함한다.
현재 프레임에 대한 채널 조합 방식은 복수의 채널 조합 방식 중 하나이다.
예를 들어, 복수의 채널 조합 방식은 비 상관 신호 채널 조합 방식 및 상관 신호 채널 조합 방식을 포함한다. 상관 신호 채널 조합 방식은 니어 인 페이즈 시그널에 대응하는 채널 조합 방식이다. 비 상관 신호 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식이다. 니어 인 페이즈 시그널에 대응하는 채널 조합 방식은 니어 인 페이즈 시그널에 적용 가능하고, 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 적용 가능하다는 것을 이해할 수 있다.
세그먼트화된 시간-도메인 다운믹스 처리는 현재 프레임에서의 좌측 및 우측 채널 신호가 적어도 2개의 세그먼트로 분할되고, 상이한 시간-도메인 다운믹스 처리 방식이 각 세그먼트에 대해 시간-도메인 다운믹스 처리를 수행하는 데 사용되는 것으로 이해될 수 있다. 비 세그먼트화된 시간-도메인 다운믹스 처리와 비교하여, 세그먼트화된 시간-도메인 다운믹스 처리는 인접한 프레임에 대한 채널 조합 방식이 변경될 때 더 원활한 천이를 얻을 가능성이 더 크다는 것을 이해할 수 있다.
전술한 솔루션에서, 현재 프레임에 대한 채널 조합 방식이 결정될 필요가 있으며, 이는 현재 프레임에 대한 채널 조합 방식에 대한 복수의 가능성이 있음을 나타낸다. 하나의 채널 조합 방식이 존재하는 종래의 솔루션과 비교하여, 복수의 가능한 채널 조합 방식을 갖는 이 솔루션은 복수의 가능한 시나리오와 더 잘 호환되고 매칭될 수 있다. 또한, 현재 프레임에 대한 채널 조합 방식과 이전 프레임에 대한 채널 조합 방식이 다를 때, 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하는 메커니즘이 도입된다. 세그먼트화된 시간-도메인 다운믹스 처리 메커니즘은 채널 조합 방식의 원활한 천이를 구현하고 인코딩 품질을 향상시키는 데 도움이 된다.
또한, 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식이 도입되기 때문에, 현재 프레임의 스테레오 신호가 위상 이외의 신호일 때, 더 많은 목표 채널 조합 방식 및 코딩 모드가 있으며, 이는 인코딩 품질을 향상시키는 데 도움이 된다.
예를 들어, 이전 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식 또는 비 상관 신호 채널 조합 방식일 수 있다. 현재 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식 또는 비 상관 신호 채널 조합 방식일 수 있다. 따라서, 현재 프레임과 이전 프레임에 대한 채널 조합 방식이 다른 경우가 여러 가지 있을 수 있다.
구체적으로, 예를 들어, 이전 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식일 때, 현재 프레임에서의 좌측 및 우측 채널 신호는 좌측 및 우측 채널 신호의 시작 세그먼트, 좌측 및 우측 채널 신호의 중간 세그먼트 및 좌측 및 우측 채널 신호의 종료 세그먼트; 현재 프레임에서의 일차 및 이차 채널 신호는 일차 및 이차 채널 신호의 시작 세그먼트, 일차 및 이차 채널 신호의 중간 세그먼트, 및 일차 및 이차 채널 신호의 종료 세그먼트를 포함한다. 이 경우, 현재 프레임에 대한 채널 조합 방식과 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하여, 현재 프레임에서의 일차 및 이차 채널 신호를 획득하는 단계는:
상기 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용하여, 상기 시작에 대한 시간-도메인 다운믹스 처리를 수행하는 단계; 현재 프레임에서의 일차 및 이차 채널 신호의 시작 세그먼트를 획득하기 위해 현재 프레임에서의 좌측 및 우측 채널 신호의 세그먼트;
상기 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 이용하여, 최종 도메인에 대한 시간-도메인 다운믹스 처리를 수행하는 단계; 현재 프레임에서의 일차 및 이차 채널 신호의 종료 세그먼트를 획득하기 위해 현재 프레임에서의 좌측 및 우측 채널 신호의 세그먼트; 과
상기 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용하여 중간에 시간-도메인 다운믹스 처리를 수행하는 단계; 일차 및 이차 채널 신호의 제1 중간 세그먼트를 획득하기 위해 현재 프레임에서의 좌측 및 우측 채널 신호의 세그먼트; 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용하여 중간에 시간-도메인 다운믹스 처리를 수행하는 단계; 일차 및 이차 채널 신호의 제2 중간 세그먼트를 획득하기 위해 현재 프레임에서의 좌측 및 우측 채널 신호의 세그먼트; 및 일차 및 이차 채널 신호의 제1 중간 세그먼트 및 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리를 수행하여, 현재 프레임에서의 일차 및 이차 채널 신호의 중간 세그먼트를 획득하는 단계를 포함한다.
현재 프레임에서의 좌측 및 우측 채널 신호의 시작 세그먼트, 좌측 및 우측 채널 신호의 중간 세그먼트 및 좌측 및 우측 채널 신호의 종료 세그먼트의 길이는 요구 사항에 기초하여 설정될 수 있다. 현재 프레임에서의 좌측 및 우측 채널 신호의 시작 세그먼트, 좌측 및 우측 채널 신호의 중간 세그먼트 및 좌측 및 우측 채널 신호의 종료 세그먼트의 길이는 동일할 수도 있고 부분적으로 동일할 수도 있고 서로 다를 수도 있다.
현재 프레임에서의 일차 및 이차 채널 신호의 시작 세그먼트, 일차 및 이차 채널 신호의 중간 세그먼트 및 일차 및 이차 채널 신호의 종료 세그먼트의 길이는 요구 사항에 기초하여 설정될 수 있다. 현재 프레임에서의 일차 및 이차 채널 신호의 시작 세그먼트, 일차 및 이차 채널 신호의 중간 세그먼트 및 일차 및 이차 채널 신호의 종료 세그먼트의 길이는 동일할 수도 있고 부분적으로 동일할 수도 있고 서로 다를 수도 있다.
일차 및 이차 채널 신호의 제1 중간 세그먼트 및 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 일차 및 이차 채널 신호의 제1 중간 세그먼트에 대응하는 가중 계수는 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대응하는 가중 계수와 동일할 수 있거나 동일하지 않을 수 있다.
예를 들어, 일차 및 이차 채널 신호의 제1 중간 세그먼트 및 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 일차 및 이차 채널 신호의 제1 중간 세그먼트에 대응하는 가중 계수는 페이드-아웃 팩터이고, 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대응하는 가중 계수가 페이드-인 팩터이다.
일부 가능한 구현에서,
Figure pat00001
; 여기서
Figure pat00002
은 현재 프레임에서 일차 채널 신호의 시작 세그먼트를 나타내고,
Figure pat00003
은 현재 프레임에서 이차 채널 신호의 시작 세그먼트를 나타내고,
Figure pat00004
은 현재 프레임에서 일차 채널 신호의 종료 세그먼트를 나타내고,
Figure pat00005
은 현재 프레임에서 이차 채널 신호의 종료 세그먼트를 나타내고,
Figure pat00006
은 현재 프레임에서 이차 채널 신호의 종료 세그먼트를 나타내고,
Figure pat00007
은 현재 프레임에서 일차 채널 신호의 중간 세그먼트를 나타내고,
Figure pat00008
은 현재 프레임에서 이차 채널 신호의 중간 세그먼트를 나타내고;
Figure pat00009
은 현재 프레임에서의 일차 채널 신호를 나타내고; 그리고
Figure pat00010
은 현재 프레임의 이차 채널 신호를 나타낸다.
예를 들어, 다음과 같다.
Figure pat00011
.
Figure pat00012
은 페이드-인 팩터를 나타내고
Figure pat00013
은 페이드-아웃 팩터를 나타낸다. 예를 들어
Figure pat00014
Figure pat00015
의 합은 1이다.
구체적으로, 예를 들어;
Figure pat00016
Figure pat00017
이다. 확실히,
Figure pat00018
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다. 확실히,
Figure pat00019
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-아웃 팩터일 수 있다.
여기서, n은 샘플링 포인트 수를 나타내고,
Figure pat00020
, 및 0
Figure pat00021
<
Figure pat00022
<
Figure pat00023
이다.
예를 들어
Figure pat00024
은 100, 107, 120, 150 또는 다른 값과 같다.
예를 들어
Figure pat00025
는 180, 187, 200, 203 또는 다른 값과 같다.
여기서,
Figure pat00026
은 현재 프레임에서의 일차 채널 신호의 제1 중간 세그먼트를 나타내고,
Figure pat00027
은 현재 프레임에서 이차 채널 신호의 제1 중간 세그먼트를 나타낸다.
Figure pat00028
Figure pat00029
은 현재 프레임에서의 일차 채널 신호의 제2 중간 세그먼트를 나타내고,
Figure pat00030
은 현재 프레임에서 이차 채널 신호의 제2 중간 세그먼트를 나타낸다.
일부 가능한 구현에서,
Figure pat00031
;
Figure pat00032
;
Figure pat00033
; 및
Figure pat00034
.
Figure pat00035
은 현재 프레임의 좌측 채널 신호를 나타내고
Figure pat00036
은 현재 프레임의 우측 채널 신호를 나타낸다.
Figure pat00037
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pat00038
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pat00039
Figure pat00040
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pat00041
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pat00042
은 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pat00043
, 또는
Figure pat00044
, 또는
Figure pat00045
, 또는
Figure pat00046
, 또는
Figure pat00047
, 또는
Figure pat00048
.
여기서,
Figure pat00049
,
Figure pat00050
Figure pat00051
는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pat00052
은 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pat00053
, 또는
Figure pat00054
, 여기서
Figure pat00055
는 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
구체적으로, 다른 예를 들어, 이전 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식일 때, 현재 프레임에서의 좌측 및 우측 채널 신호는 좌측 및 우측 채널 신호의 시작 세그먼트, 좌측 및 우측 채널 신호의 중간 세그먼트, 및 좌측 및 우측 채널 신호의 종료 세그먼트를 포함하고; 현재 프레임에서의 일차 및 이차 채널 신호는 일차 및 이차 채널 신호의 시작 세그먼트, 일차 및 이차 채널 신호의 중간 세그먼트, 및 일차 및 이차 채널 신호의 종료 세그먼트를 포함한다. 이 경우, 현재 프레임에 대한 채널 조합 방식과 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하여, 현재 프레임에서의 일차 및 이차 채널 신호를 획득하는 단계는:
상기 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써, 현재 프레임에서의 좌측 및 우측 채널 신호의 시작 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호의 시작 세그먼트를 획득하는 단계;
현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써, 현재 프레임에서의 좌측 및 우측 채널 신호의 종료 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호의 종료 세그먼트를 획득하는 단계; 및
상기 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써, 현재 프레임에서의 좌측 및 우측 채널 신호의 중간 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 일차 및 이차 채널 신호의 제3 중간 세그먼트를 획득하고; 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써 현재 프레임에서의 좌측 및 우측 채널 신호의 중간 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 일차 및 이차 채널 신호의 제4 중간 세그먼트를 획득하며; 그리고 일차 및 이차 채널 신호의 제3 중간 세그먼트 및 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리를 수행하여, 현재 프레임에서의 일차 및 이차 채널 신호의 중간 세그먼트를 획득하는 단계를 포함한다.
일차 및 이차 채널 신호의 제3 중간 세그먼트 및 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 일차 및 이차 채널 신호의 제3 중간 세그먼트에 대응하는 가중 계수는 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대응하는 가중 계수와 동일할 수도 있고 동일하지 않을 수도 있다.
예를 들어, 일차 및 이차 채널 신호의 제3 중간 세그먼트 및 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 일차 및 이차 채널 신호의 제3 중간 세그먼트에 대응하는 가중 계수는 페이드-아웃 팩터이고, 일차 채널 신호 및 이차 채널 신호의 제4 중간 세그먼트에 대응하는 가중 계수가 페이드-인 팩터이다.
일부 가능한 구현에서,
Figure pat00056
; 여기서
Figure pat00057
은 현재 프레임에서 일차 채널 신호의 시작 세그먼트를 나타내고,
Figure pat00058
은 현재 프레임에서 이차 채널 신호의 시작 세그먼트를 나타내고,
Figure pat00059
은 현재 프레임에서 일차 채널 신호의 종료 세그먼트를 나타내고,
Figure pat00060
은 현재 프레임에서 이차 채널 신호의 종료 세그먼트를 나타내고,
Figure pat00061
은 현재 프레임에서의 일차 채널 신호의 중간 세그먼트를 나타내고,
Figure pat00062
은 현재 프레임에서 이차 채널 신호의 중간 세그먼트를 나타내고;
Figure pat00063
은 현재 프레임에서의 일차 채널 신호를 나타내고; 및
Figure pat00064
은 현재 프레임의 이차 채널 신호를 나타낸다.
예를 들면 다음과 같다.
Figure pat00065
.
Figure pat00066
은 페이드-인 팩터를 나타내고
Figure pat00067
은 페이드-아웃 팩터를 나타내며
Figure pat00068
Figure pat00069
의 합은 1이다.
구체적으로, 예를 들어;
Figure pat00070
Figure pat00071
이다. 확실히,
Figure pat00072
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다. 확실히,
Figure pat00073
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-아웃 팩터일 수 있다.
여기서, n은 샘플링 포인트 번호를 나타낸다. 예를 들면
Figure pat00074
이다.
여기서 0<
Figure pat00075
<
Figure pat00076
<
Figure pat00077
이다.
예를 들어
Figure pat00078
은 101, 107, 120, 150 또는 다른 값과 같다.
예를 들어
Figure pat00079
는 181, 187, 200, 205 또는 다른 값과 같다.
Figure pat00080
은 현재 프레임에서의 일차 채널 신호의 제3 중간 세그먼트를 나타내고,
Figure pat00081
은 현재 프레임에서 이차 채널 신호의 제3 중간 세그먼트를 나타낸다.
Figure pat00082
Figure pat00083
는 현재 프레임에서의 일차 채널 신호의 제4 중간 세그먼트를 나타내고,
Figure pat00084
는 현재 프레임에서 이차 채널 신호의 제4 중간 세그먼트를 나타낸다.
In some possible implementations, 일부 가능한 구현에서
Figure pat00085
;
Figure pat00086
;
Figure pat00087
; 및
Figure pat00088
.
Figure pat00089
은 현재 프레임의 좌측 채널 신호를 나타내고
Figure pat00090
은 현재 프레임의 우측 채널 신호를 나타낸다.
Figure pat00091
는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pat00092
는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pat00093
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pat00094
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pat00095
는 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pat00096
, 또는
Figure pat00097
, 또는
Figure pat00098
, 또는
Figure pat00099
, 또는
Figure pat00100
, 또는
Figure pat00101
.
여기에서,
Figure pat00102
Figure pat00103
이다.
여기서,
Figure pat00104
은 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pat00105
은 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pat00106
, 또는
Figure pat00107
.
여기서,
Figure pat00108
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
일부 가능한 구현들에서, 현재 프레임에서의 좌측 및 우측 채널 신호는 예를 들어 현재 프레임에서의 원래의 좌측 및 우측 채널 신호일 수 있거나, 시간-도메인 전처리를 거친 좌측 및 우측 채널 신호일 수 있고, 지연 정렬 처리를 거친 좌측 및 우측 채널 신호일 수 있다.
구체적으로 예를 들어
Figure pat00109
, 또는
Figure pat00110
, 또는
Figure pat00111
.
여기에서,
Figure pat00112
은 현재 프레임의 원래 좌측 채널 신호(원래의 좌측 채널 신호는 시간-도메인 전처리를 거치지 않은 좌측 채널 신호이다)를 나타내고,
Figure pat00113
은 현재 프레임의 원래의 우측 채널 신호( 원래의 우측 채널 신호는 시간-도메인 전처리를 거치지 않은 우측 채널 신호이다)를 나타낸다.
Figure pat00114
는 현재 프레임에서 시간-도메인 전처리를 거친 좌측 채널 신호를 나타내고,
Figure pat00115
는 현재 프레임에서 시간-도메인 전처리를 거친 우측 채널 신호를 나타낸다.
Figure pat00116
Figure pat00117
은 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 신호를 나타내고,
Figure pat00118
은 현재 프레임에서 지연 정렬 처리를 거친 우측 채널 신호를 나타낸다.
제2 관점에 따르면, 본 출원의 실시예는 시간-도메인 스테레오 디코딩 방법을 추가로 제공한다. 방법은: 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호를 획득하기 위해 비트스트림에 기초하여 디코딩을 수행하는 단계; 현재 프레임에 대한 채널 조합 방식을 결정하는 단계; 현재 프레임에 대한 채널 조합 방식이 이전 프레임에 대한 채널 조합 방식과 다를 때, 현재에 대한 채널 조합 방식 및 이전 프레임에 대한 프레임 및 채널 조합 방식에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대한 세그먼트화된 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계를 포함한다.
현재 프레임에 대한 채널 조합 방식은 복수의 채널 조합 방식 중 하나이다.
예를 들어, 복수의 채널 조합 방식은 비 상관성 신호 채널 조합 방식 및 상관 신호 채널 조합 방식을 포함한다. 상관 신호 채널 조합 방식은 니어 인 페이즈 시그널에 대응하는 채널 조합 방식이다. 비 상관 신호 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식이다. 니어 인 페이즈 시그널에 대응하는 채널 조합 방식은 니어 인 페이즈 시그널에 적용 가능하고, 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 적용 가능하다는 것을 이해할 수 있다.
세그먼트화된 시간-도메인 업믹스 처리는 현재 프레임에서의 좌측 및 우측 채널 신호가 적어도 2개의 세그먼트로 분할되고, 상이한 시간-도메인 업믹스 처리 방식이 각 세그먼트에 대해 시간-도메인 업믹스 처리를 수행하는 데 사용되는 것으로 이해될 수 있다. 비 세그먼트화된 시간-도메인 업믹스 처리와 비교하여, 세그먼트화된 시간-도메인 업믹스 처리는 인접한 프레임에 대한 채널 조합 방식이 변경될 때 더 원활한 천이를 얻을 가능성이 더 크다는 것을 이해할 수 있다.
전술한 솔루션에서, 현재 프레임에 대한 채널 조합 방식이 결정될 필요가 있으며, 이는 현재 프레임에 대한 채널 조합 방식에 대한 복수의 가능성이 있음을 나타낸다. 하나의 채널 조합 방식이 존재하는 종래의 솔루션과 비교하여, 복수의 가능한 채널 조합 방식을 갖는 이 솔루션은 복수의 가능한 시나리오와 더 잘 호환되고 매칭될 수 있다. 또한, 현재 프레임에 대한 채널 조합 방식과 이전 프레임에 대한 채널 조합 방식이 다를 때, 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 업믹스 처리를 수행하는 메커니즘이 도입된다. 세그먼트화된 시간-도메인 업믹스 처리 메커니즘은 채널 조합 방식의 원활한 천이를 구현하고 인코딩 품질을 향상시키는 데 도움이 된다.
또한, 근사한 위상 신호에 대응하는 채널 조합 방식이 도입되기 때문에, 현재 프레임의 스테레오 신호가 위상 이외의 신호일 때, 더 많은 목표 채널 조합 방식 및 코딩 모드가 있으며, 이는 인코딩 품질을 향상시키는 데 도움이 된다.
예를 들어, 이전 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식 또는 비 상관 신호 채널 조합 방식일 수 있다. 현재 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식 또는 비 상관 신호 채널 조합 방식일 수 있다. 따라서, 현재 프레임과 이전 프레임에 대한 채널 조합 방식이 다른 경우가 여러 가지 있을 수 있다.
구체적으로, 예를 들어, 이전 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식은 비 상관 신호 채널 조합 방식이다. 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호는 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트, 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트, 및 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트를 포함한다. 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호는 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트, 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트, 및 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트를 포함한다. 이 경우, 현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 세그먼트화된 시간-도메인 업믹스 처리를 수행하여, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계는: 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트를 획득하는 단계;
상기 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써, 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트를 획득하는 단계; 및
상기 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써, 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트에 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트를 획득하고; 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트를 획득하며; 그리고 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트를 획득하기 위해, 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리를 수행하는 단계를 포함한다.
재구성된 좌측 및 우측 채널 신호의 시작 세그먼트, 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트 및 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트의 길이는 요구 사항에 기초하여 설정될 수 있다. 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트, 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트의 길이는 동일할 수도 있고 부분적으로 동일할 수도 있고 서로 다를 수도 있다.
디코딩된 일차 및 이차 채널 신호의 시작 세그먼트, 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트, 및 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트의 길이는 요구 사항에 기초하여 설정될 수 있다. 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트, 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트, 및 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트의 길이는 동일할 수도 있고 부분적으로 동일할 수도 있고 서로 다를 수도 있다.
재구성된 좌측 및 우측 채널 신호는 디코딩된 좌측 및 우측 채널 신호일 수 있거나, 지연 조정 처리 및/또는 시간-도메인 후처리가 디코딩된 좌측 및 우측 채널 신호를 획득하기 위해 재구성된 좌측 및 우측 채널 신호에 대해 수행될 수 있다.
재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트에 대응하는 가중 계수는 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대응하는 가중 계수와 동일할 수도 있고 동일하지 않을 수도 있다
예를 들어, 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 가중 계수는 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트에 대응한다. 우측 채널 신호는 페이드-아웃 팩터이고, 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대응하는 가중 계수는 페이드-인 팩터이다.
일부 가능한 구현에서
Figure pat00119
; 여기서
Figure pat00120
은 현재 프레임에서의 재구성된 좌측 채널 신호의 시작 세그먼트를 나타내고,
Figure pat00121
은 현재 프레임에서의 재구성된 우측 채널 신호의 시작 세그먼트를 나타내고,
Figure pat00122
은 현재 프레임에서의 재구성된 좌측 채널 신호의 종료 세그먼트를 나타내고,
Figure pat00123
은 현재 프레임에서의 재구성된 우측 채널 신호의 종료 세그먼트를 나타내고,
Figure pat00124
은 현재 프레임에서의 재구성된 좌측 채널 신호의 중간 세그먼트를 나타내고,
Figure pat00125
은 현재 프레임에서의 재구성된 우측 채널 신호의 중간 세그먼트를 나타내고;
Figure pat00126
은 현재 프레임에서의 재구성된 좌측 채널 신호를 나타내고; 그리고
Figure pat00127
은 현재 프레임에서의 재구성된 우측 채널 신호를 나타낸다.
예를 들면,
Figure pat00128
이다.
예를 들어,
Figure pat00129
은 페이드-인 팩터를 나타내고
Figure pat00130
은 페이드-아웃 팩터를 나타낸다. 예를 들어
Figure pat00131
Figure pat00132
의 합은 1이다.
구체적으로, 예를 들어,
Figure pat00133
Figure pat00134
이다. 확실히,
Figure pat00135
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다. 확실히,
Figure pat00136
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-아웃 팩터일 수 있다.
여기서, n은 샘플링 포인트 번호를 나타내고,
Figure pat00137
이다. 여기서 0<
Figure pat00138
<
Figure pat00139
<
Figure pat00140
이다.
Figure pat00141
은 현재 프레임에서의 재구성된 좌측 채널 신호의 제1 중간 세그먼트를 나타내고,
Figure pat00142
은 현재 프레임에서의 재구성된 우측 채널 신호의 제1 중간 세그먼트를 나타낸다.
Figure pat00143
Figure pat00144
은 현재 프레임에서의 재구성된 좌측 채널 신호의 제2 중간 세그먼트를 나타내고,
Figure pat00145
은 현재 프레임에서의 재구성된 우측 채널 신호의 제2 중간 세그먼트를 나타낸다.
일부 가능한 구현에서,
Figure pat00146
;
Figure pat00147
;
Figure pat00148
; 및
Figure pat00149
.
여기서,
Figure pat00150
은 현재 프레임에서의 디코딩된 일차 채널 신호를 나타내고,
Figure pat00151
은 현재 프레임에서 디코딩된 이차 채널 신호를 나타낸다.
Figure pat00152
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
Figure pat00153
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성되고;
Figure pat00154
는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pat00155
는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pat00156
은 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pat00157
, 또는
Figure pat00158
, 또는
Figure pat00159
, 또는
Figure pat00160
, 또는
Figure pat00161
, 또는
Figure pat00162
.
Figure pat00163
,
Figure pat00164
Figure pat00165
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pat00166
은 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pat00167
, 또는
Figure pat00168
여기서,
Figure pat00169
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
구체적으로, 다른 예에서, 이전 프레임에 대한 채널 조합 방식은 비 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식이다. 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호는 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트, 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트, 및 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트를 포함한다. 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호는 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트, 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트, 및 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트를 포함한다. 이 경우, 현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 세그먼트화된 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계는:
이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트를 획득하는 단계;
상기 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트를 획득하는 단계; 및
상기 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써, 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트를 획득하고; 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트를 획득하며; 그리고 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트를 획득하기 위해, 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리를 수행하는 단계를 포함한다.
재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트에 대응하는 가중 계수는 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대응하는 가중 계수와 동일할 수도 있고 동일하지 않을 수도 있다
예를 들어, 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 가중 계수는 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트에 대응한다. 우측 채널 신호는 페이드-아웃 팩터이고, 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대응하는 가중 계수는 페이드-인 팩터이다.
일부 가능한 구현에서,
*
Figure pat00170
.
여기서,
Figure pat00171
은 현재 프레임에서의 재구성된 좌측 채널 신호의 시작 세그먼트를 나타내고,
Figure pat00172
은 현재 프레임에서의 재구성된 우측 채널 신호의 시작 세그먼트를 나타내고,
Figure pat00173
은 현재 프레임에서의 재구성된 좌측 채널 신호의 종료 세그먼트를 나타내고,
Figure pat00174
은 현재 프레임에서의 재구성된 우측 채널 신호의 종료 세그먼트를 나타내고,
Figure pat00175
은 현재 프레임에서의 재구성된 좌측 채널 신호의 중간 세그먼트를 나타내고,
Figure pat00176
은 현재 프레임에서의 재구성된 우측 채널 신호의 중간 세그먼트를 나타낸다.
여기에서,
Figure pat00177
은 현재 프레임에서의 재구성된 좌측 채널 신호를 나타낸다.
여기서,
Figure pat00178
은 현재 프레임에서의 재구성된 우측 채널 신호를 나타낸다.
예를 들어,
Figure pat00179
이다.
Figure pat00180
은 페이드-인 팩터를 나타내고
Figure pat00181
은 페이드-아웃 팩터를 나타내며
Figure pat00182
Figure pat00183
의 합은 1이다.
구체적으로, 예를 들어;
Figure pat00184
Figure pat00185
이다. 확실히,
Figure pat00186
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다. 확실히,
Figure pat00187
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-아웃 팩터일 수 있다.
여기서, n은 샘플링 포인트 번호를 나타낸다. 예를 들면,
Figure pat00188
이다.
여기서 0<
Figure pat00189
<
Figure pat00190
<
Figure pat00191
이다.
예를 들어
Figure pat00192
은 101, 107, 120, 150 또는 다른 값과 같다.
예를 들어
Figure pat00193
는 181, 187, 200, 205 또는 다른 값과 같다.
Figure pat00194
은 현재 프레임에서의 재구성된 좌측 채널 신호의 제3 중간 세그먼트를 나타내고,
Figure pat00195
은 현재 프레임에서의 재구성된 우측 채널 신호의 제3 중간 세그먼트를 나타낸다.
Figure pat00196
Figure pat00197
는 현재 프레임에서의 재구성된 좌측 채널 신호의 제4 중간 세그먼트를 나타내고,
Figure pat00198
는 현재 프레임에서의 재구성된 우측 채널 신호의 제4 중간 세그먼트를 나타낸다.
일부 가능한 구현에서,
Figure pat00199
;
Figure pat00200
;
Figure pat00201
; 및
Figure pat00202
.
여기서,
Figure pat00203
은 현재 프레임에서의 디코딩된 일차 채널 신호를 나타내고,
Figure pat00204
은 현재 프레임에서 디코딩된 이차 채널 신호를 나타낸다.
Figure pat00205
는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
Figure pat00206
이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pat00207
Figure pat00208
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
Figure pat00209
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pat00210
는 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pat00211
, 또는
Figure pat00212
, 또는
Figure pat00213
, 또는
Figure pat00214
, 또는
Figure pat00215
, 또는
Figure pat00216
.
여기서,
Figure pat00217
, 및
Figure pat00218
; 그리고
여기서,
Figure pat00219
은 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pat00220
은 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pat00221
, 또는
Figure pat00222
.
여기서,
Figure pat00223
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
제3 관점에 따르면, 본 출원의 실시예는 시간-도메인 스테레오 인코딩 장치를 추가로 제공하며, 장치는 서로 연결된 프로세서 및 메모리를 포함할 수 있다. 프로세서는 제1 관점에서 임의의 스테레오 인코딩 방법의 일부 또는 모든 단계를 수행하도록 구성될 수 있다.
제4 관점에 따르면, 본 출원의 실시예는 시간-도메인 스테레오 디코딩 장치를 더 제공하고, 장치는 서로 연결된 프로세서 및 메모리를 포함할 수 있다. 프로세서는 제2 관점에서 임의의 스테레오 디코딩 방법의 일부 또는 모든 단계를 수행하도록 구성될 수 있다.
제5 관점에 따르면, 본 출원의 실시예는 제1 관점의 임의의 방법을 구현하도록 구성된 몇몇 기능 유닛을 포함하는 시간-도메인 스테레오 디코딩 장치를 제공한다.
제6 관점에 따르면, 본 출원의 실시예는 제2 양상의 임의의 방법을 구현하도록 구성된 몇몇 기능 유닛을 포함하는 시간-도메인 스테레오 인코딩 장치를 제공한다.
제7 관점에 따르면, 본 출원의 실시예는 컴퓨터 판독 가능 저장 매체를 제공하고, 컴퓨터 판독 가능 저장 매체는 프로그램 코드를 저장하며, 여기서 프로그램 코드는 제1 관점에서 임의의 방법의 일부 또는 모든 단계를 수행하는 데 사용되는 명령을 포함한다.
제8 관점에 따르면, 본 출원의 실시예는 컴퓨터 판독 가능 저장 매체를 제공하고, 컴퓨터 판독 가능 저장 매체는 프로그램 코드를 저장하며, 여기서 프로그램 코드는 제2 관점에서 임의의 방법의 일부 또는 모든 단계를 수행하는 데 사용되는 명령을 포함한다.
제9 관점에 따르면, 본 출원의 실시예는 컴퓨터 프로그램 제품을 제공하고, 컴퓨터 프로그램 제품이 컴퓨터에서 실행될 때, 컴퓨터는 제1 관점에서 임의의 방법의 일부 또는 모든 단계를 수행할 수 있다.
제10 관점에 따르면, 본 출원의 실시예는 컴퓨터 프로그램 제품을 제공하고, 컴퓨터 프로그램 제품이 컴퓨터에서 실행될 때, 컴퓨터는 제2 관점에서 임의의 방법의 일부 또는 모든 단계를 수행할 수 있다.
다음은 본 출원의 실시예 또는 배경을 설명하는데 필요한 첨부 도면을 설명한다.
도 1은 본 출원의 실시예에 따른 니어 아웃 페이즈 시그널의 개략도이다.
도 2는 본 출원의 실시예에 따른 오디오 인코딩 방법의 개략적인 흐름도이다.
도 3은 본 출원의 실시예에 따라 오디오 디코딩 모드를 결정하기 위한 방법의 개략적인 흐름도이다.
도 4는 본 출원의 실시예에 따른 다른 오디오 인코딩 방법의 개략적인 흐름도이다.
도 5는 본 출원의 실시예에 따른 오디오 디코딩 방법의 개략적인 흐름도이다.
도 6은 본 출원의 실시예에 따른 다른 오디오 인코딩 방법의 개략적인 흐름도이다.
도 7은 본 출원의 실시예에 따른 다른 오디오 디코딩 방법의 개략적인 흐름도이다.
도 8은 본 출원의 실시예에 따른 시간-도메인 스테레오 파라미터 결정 방법의 개략적인 흐름도이다.
도 9a는 본 출원의 실시예에 따른 다른 오디오 인코딩 방법의 개략적인 흐름도이다.
도 9b는 본 출원의 실시예에 따라 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산 및 인코딩하는 방법의 개략적인 흐름도이다.
도 9c는 본 출원의 실시예에 따라 현재 프레임에서의 좌측 채널과 우측 채널 사이의 진폭 상관 차이 파라미터를 계산하기 위한 방법의 개략적인 흐름도이다.
도 9d는 본 출원의 실시예에 따라 현재 프레임에서의 좌측 채널과 우측 채널 사이의 진폭 상관 차이 파라미터를 채널 조합 비율 팩터로 변환하는 방법의 개략적인 흐름도이다.
도 10은 본 출원의 실시예에 따른 다른 오디오 디코딩 방법의 개략적인 흐름도이다.
도 11a는 본 출원의 실시예에 따른 장치의 개략도이다.
도 11b는 본 출원의 실시예에 따른 다른 장치의 개략도이다.
도 11c는 본 출원의 실시예에 따른 다른 장치의 개략도이다.
도 12a는 본 출원의 실시예에 따른 다른 장치의 개략도이다.
도 12b는 본 출원의 실시예에 따른 다른 장치의 개략도이다.
도 12c는 본 출원의 실시예에 따른 다른 장치의 개략도이다.
다음은 본 출원의 실시예에서의 첨부 도면을 참조하여 본 출원의 실시예를 설명한다.
본 명세서의 청구 범위, 청구 범위 및 첨부 도면에 언급된 용어 "포함하다", "가지고 있다" 및 이의 임의의 다른 변형은 비 배타적인 포함을 망라하도록 의도된다. 예를 들어, 일련의 단계 또는 단위를 포함하는 프로세스, 방법, 시스템, 제품 또는 장치는 열거된 단계 또는 단위로 제한되지 않고, 선택적으로 미등록 단계 또는 단위를 더 포함할 수 있거나, 또는 추가로 프로세스, 방법, 제품 또는 장치의 다른 고유 단계 또는 단위를 포함한다. 또한, 용어 "제1", "제2", "제3", "제4" 등은 특정 시퀀스를 설명하는 대신 객체를 구별하는 데 사용된다.
본 출원의 실시예의 솔루션은 설명의 편의를 위해 시간-도메인 시나리오에 특정하기 때문에, 시간-도메인 신호는 간단히 "신호"라고 지칭될 수 있음에 유의해야 한다. 예를 들어, 좌측 채널 시간-도메인 신호는 간단히 "좌측 채널 신호"라고 지칭될 수 있다. 다른 예에서, 우측 채널 시간-도메인 신호는 간단히 "우측 채널 신호"라고 지칭될 수 있다. 다른 예에서, 모노 시간-도메인 신호는 간단히 "모노 신호"라고 지칭될 수 있다. 다른 예에서, 참조 채널 시간-도메인 신호는 간단히 "참조 채널 신호"라고 지칭될 수 있다. 다른 예에서, 일차 채널 시간-도메인 신호는 간단히 "일차 채널 신호"라고 지칭될 수 있다. 이차 채널 시간-도메인 신호는 간단히 "이차 채널 신호"라고 지칭될 수 있다. 다른 예로, 중간 채널(Mid Channel) 시간-도메인 신호를 간단히 "중간 채널 신호"라고 지칭할 수 있다. 다른 예로, 사이드 채널(Side Channel) 시간-도메인 신호를 간단히 "사이드 채널 신호"라고 지칭할 수 있다. 다른 경우는 유추하여 추론할 수 있다.
본 출원의 실시예에서, 좌측 채널 시간-도메인 신호 및 우측 채널 시간-도메인 신호는 총칭하여 "좌측 및 우측 채널 시간-도메인 신호"로 지칭될 수 있거나, 또는 "좌측 및 우측 채널 신호"로 집합적으로 지칭될 수 있음에 유의해야 한다. 다시 말해, 좌측 및 우측 채널 시간-도메인 신호는 좌측 채널 시간-도메인 신호 및 우측 채널 시간-도메인 신호를 포함한다. 다른 예를 들어, 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 시간-도메인 신호는 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 시간-도메인 신호 및 현재 프레임에서 지연 정렬 처리를 거친 우측 채널 시간-도메인 신호를 포함한다. 유사하게, 일차 채널 신호 및 이차 채널 신호는 총칭하여 "일차 및 이차 채널 신호"로 지칭될 수 있다. 즉, 일차 및 이차 채널 신호는 일차 채널 신호 및 이차 채널 신호를 포함한다. 다른 예를 들어, 디코딩된 일차 및 이차 채널 신호는 디코딩된 일차 채널 신호 및 디코딩된 이차 채널 신호를 포함한다. 다른 예에서, 재구성된 좌측 및 우측 채널 신호는 좌측 채널 재구성된 신호 및 우측 채널 재구성된 신호를 포함한다. 나머지는 유추하여 추론할 수 있다.
예를 들어, 종래의 MS 인코딩 기술에서, 좌측 및 우측 채널 신호는 먼저 다운믹스되어 미드 채널(Mid Channel) 신호 및 사이드 채널(Side 채널) 신호를 획득한다. 예를 들어 L은 좌측 채널 신호를 나타내고 R은 우측 채널 신호를 나타낸다. 이 경우, 중간 채널 신호는 0.5 x(L R)이고, 중간 채널 신호는 좌측 채널과 우측 채널 사이의 상관에 관한 정보를 나타내고; 사이드 채널 신호는 0.5 x(L - R)이고, 사이드 채널 신호는 좌측 채널과 우측 채널의 차이에 관한 정보를 나타낸다. 그리고 미드 채널 신호와 사이드 채널 신호는 모노 인코딩 방식으로 별도로 인코딩된다. 중간 채널 신호는 일반적으로 더 많은 양의 비트를 사용하여 인코딩되고, 사이드 채널 신호는 일반적으로 더 적은 양의 비트를 사용하여 인코딩된다.
또한, 일부 솔루션에서, 인코딩 품질을 개선하기 위해, 시간-도메인 다운믹스 처리에서 좌측 채널의 우측 채널에 대한 비율을 나타내는 데 사용되는 시간-도메인 스테레오 파라미터를 추출하기 위해 좌측 및 우측 채널 시간-도메인 신호가 분석된다. 제안된 방법의 목적은, 스테레오 좌측 및 우측 채널 신호 사이의 에너지 차이가 비교적 클 때, 시간-도메인 다운믹스 신호에서, 일차 채널의 에너지가 증가될 수 있고, 이차 채널의 에너지가 감소될 수 있다. 예를 들어 L은 좌측 채널 신호를 나타내고 R은 우측 채널 신호를 나타낸다. 이 경우, 일차 채널(Primary channel) 신호는 Y로 표시되며, 여기서 Y = alpha x L + beta x R 이고, Y는 두 채널 간의 상관에 대한 정보를 나타내고; 이차 채널(Secondary channel)은 X로 표시되며, 여기서 X = alpha x L - beta x R 이고, X는 두 채널 사이의 차이에 대한 정보를 나타낸다. 여기서, 알파 및 베타는 0 내지 1의 실수이다.
도 1은 좌측 채널 신호 및 우측 채널 신호의 진폭 변동을 도시한다. 시간-도메인에서, 특정 위치에서 좌측 채널 신호의 샘플링 포인트의 진폭의 절댓값과 대응하는 위치에서 우측 채널 신호의 샘플링 포인트의 진폭의 절댓값은 기본적으로 동일하지만 진폭에는 반대 부호가 있다. 이것은 전형적인 거의 위상이 다른 신호이다. 도 1은 단지 니어 아웃 오브 페이즈 시그널(near out of phase signal)의 전형적인 예를 도시 한 것이다. 실제로, 거의 위상이 맞지 않는 신호는 좌측 및 우측 채널 신호 간의 위상 차가 약 180도인 스테레오 신호이다. 예를 들어, 좌측 및 우측 채널 신호 사이의 위상 차가
Figure pat00224
에 속하는 스테레오 신호는 0° 내지 90° 사이의 임의의 각도일 수 있는 니어 아웃 오브 페이즈 시그널로 지칭될 수 있다. 예를 들어,
Figure pat00225
는 0°, 5°, 15°, 17°, 20°, 30° 또는 40°의 각도와 같을 수 있다.
유사하게, 니어 인 페이즈 시그널은 좌측 및 우측 채널 신호 사이의 위상 차가 대략 0도인 스테레오 신호이다. 예를 들어, 좌측 및 우측 채널 신호 사이의 위상 차가 [-θ, θ]에 속하는 스테레오 신호는 니어 인 페이즈 시그널이라고 지칭될 수 있다.
Figure pat00226
는 0°와 90° 사이의 각도일 수 있다. 예를 들어,
Figure pat00227
는 0°, 5°, 15°, 17 °, 20 °, 30 ° 또는 40 °의 각도와 같을 수 있다.
좌측 및 우측 채널 신호가 거의 동일한 위상 신호일 때, 시간-도메인 다운믹스 처리를 통해 생성된 일차 채널 신호의 에너지는 일반적으로 이차 채널 신호의 에너지보다 상당히 크다. 일차 채널 신호가 더 많은 양의 비트를 사용하여 인코딩되고 이차 채널 신호가 더 적은 양의 비트를 사용하여 인코딩되면, 더 나은 인코딩 효과가 얻어질 수 있다. 그렇지만, 좌측 및 우측 채널 신호가 거의 위상이 다른 신호일 때, 동일한 시간-도메인 다운믹스 처리 방법이 사용되는 경우, 생성된 일차 채널 신호의 에너지가 매우 작거나 손실되어 최종 인코딩 품질이 감소될 수 있다.
다음은 스테레오 인코딩 및 디코딩 품질을 향상시키는 데 도움이 되는 몇 가지 기술적 솔루션을 계속 설명한다.
본 출원의 실시예에서 언급된 인코딩 장치 및 디코딩 장치는 음성 신호의 수집, 저장 및 외부로의 전송과 같은 기능을 갖는 장치일 수 있다. 구체적으로, 인코딩 장치 및 디코딩 장치는 예를 들어 휴대전화, 서버, 태블릿 컴퓨터, 개인용 컴퓨터 또는 노트북 컴퓨터일 수 있다.
본 출원의 솔루션에서, 좌측 및 우측 채널 신호는 스테레오 신호의 좌측 및 우측 채널 신호인 것으로 이해될 수 있다. 스테레오 신호는 원래의 스테레오 신호, 또는 다중 채널 신호의 2개의 채널 신호를 포함하는 스테레오 신호, 또는 다중 채널 신호의 복수의 채널 신호에 의해 공동으로 생성된 2개의 신호 채널을 포함하는 스테레오 신호일 수 있다. 스테레오 인코딩 방법은 또한 멀티채널 인코딩에 사용되는 스테레오 인코딩 방법일 수 있다. 스테레오 인코딩 장치는 또한 멀티채널 인코딩 장치에서 사용되는 스테레오 인코딩 장치일 수 있다. 스테레오 디코딩 방법은 멀티채널 디코딩에 사용되는 스테레오 디코딩 방법일 수도 있다. 스테레오 디코딩 장치는 또한 멀티채널 디코딩 장치에서 사용되는 스테레오 디코딩 장치일 수 있다. 본 출원의 실시예에서의 오디오 인코딩 방법은 예를 들어, 스테레오 인코딩 시나리오에 고유하고, 본 출원의 실시예에서의 오디오 디코딩 방법은 예를 들어 스테레오 디코딩 시나리오에 고유하다.
다음은 먼저 오디오 코딩 모드를 결정하는 방법을 제공하고, 방법은: 현재 프레임에 대한 채널 조합 방식을 결정하는 단계 및 이전 프레임에 대한 채널 조합 방식 및 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 코딩 모드를 결정하는 단계를 포함한다.
도 2는 본 출원의 실시예에 따른 오디오 인코딩 방법의 개략적인 흐름도이다. 오디오 인코딩 방법의 관련 단계는 인코딩 장치에 의해 구현될 수 있으며, 예를 들어 다음 단계를 포함할 수 있다.
201. 현재 프레임에 대한 채널 조합 방식을 결정한다.
현재 프레임에 대한 채널 조합 방식은 복수의 채널 조합 방식 중 하나이다. 예를 들어, 복수의 채널 조합 방식은 비 상관 신호 채널 조합 방식(anticorrelated signal Channel Combination Scheme) 및 상관 신호 채널 조합 방식(correlated signal Channel Combination Scheme)을 포함한다. 상관 신호 채널 조합 방식은 근거리 신호에 대응하는 채널 조합 방식이다. 비 상관 신호 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식이다. 니어 인 페이즈 시그널에 대응하는 채널 조합 방식은 니어 인 페이즈 시그널에 적용 가능하고, 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 적용 가능하다는 것을 이해할 수 있다.
202. 이전 프레임에 대한 채널 조합 방식 및 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 코딩 모드를 결정한다.
또한, 현재 프레임이 제1 프레임인 경우(즉, 현재 프레임의 이전 프레임이 존재하지 않는 경우), 현재 프레임의 채널 조합 방식에 따라 현재 프레임의 코딩 모드가 결정될 수 있다. 대안적으로, 디폴트 코딩 모드가 현재 프레임의 코딩 모드로서 사용될 수 있다.
현재 프레임의 코딩 모드는 복수의 코딩 모드 중 하나이다. 예를 들어, 복수의 코딩 모드는 상관-비상관 신호 코딩 스위칭 모드(correlated-to-anticorrelated signal coding switching mode), 비상관-상관 신호 코딩 스위칭 모드(anticorrelated-to-correlated signal coding switching mode), 상관 신호 코딩 모드(correlated signal coding mode), 비 상관 신호 코딩 모드(anticorrelated signal coding mode) 등이 있다.
상관-비상관 신호 코딩 스위칭 모드에 대응하는 시간-도메인 다운믹스 모드는 예를 들어 "상관-비상관 신호 다운믹스 스위칭 모드"(correlated-to-anticorrelated signal downmix switching mode)라고 지칭될 수 있다. 비 상관-상관 신호 코딩 스위칭 모드에 대응하는 시간-도메인 다운믹스 모드는, 예를 들어 "비상관-상관 신호 다운믹스 스위칭 모드"(anticorrelated-to-correlated signal downmix switching mode)라고 지칭될 수 있다. 상관 신호 코딩 모드에 대응하는 시간-도메인 다운믹스 모드는 예를 들어 "상관 신호 다운믹스 모드"(correlated signal downmix mode)라고 지칭될 수 있다. 비 상관 신호 코딩 모드에 대응하는 시간-도메인 다운믹스 모드는 예를 들어 "비 상관 다운믹스 모드"(anticorrelated signal downmix mode)로 지칭될 수 있다.
본 출원의 이 실시예에서, 코딩 모드, 디코딩 모드, 및 채널 조합 방식과 같은 객체의 명칭은 모두 예이며, 다른 명칭도 실제 적용에 사용될 수 있음을 이해할 수 있다.
203. 현재 프레임의 코딩 모드에 대응하는 시간-도메인 다운믹스 처리에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호를 획득한다.
현재 프레임에서의 일차 및 이차 채널 신호를 획득하기 위해 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리가 수행될 수 있고, 일차 및 이차 채널 신호는 비트스트림을 얻기 위해 추가로 인코딩된다. 또한, 현재 프레임의 채널 조합 방식 플래그(현재 프레임의 채널 조합 방식 플래그는 현재 프레임에 대한 채널 조합 방식을 나타내기 위해 사용됨)가 비트스트림에 기록될 수 있어서, 디코딩 장치는 비트스트림에 포함된 현재 프레임의 채널 조합 방식 플래그에 기초하여 현재 프레임에 대한 채널 조합 방식을 결정한다.
이전 프레임에 대한 채널 조합 방식 및 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 코딩 모드를 결정하는 다양한 특정 구현이 있을 수 있다.
구체적으로, 예를 들어, 일부 가능한 구현들에서, 이전 프레임에 대한 채널 조합 방식 및 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 코딩 모드를 결정하는 단계는:
이전 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식일 때, 현재 프레임의 코딩 모드가 상관-비상관 신호 코딩 스위칭 모드인 것으로 결정하는 단계 - 상관-비상관 신호 코딩 스위칭 모드에서 시간-도메인 다운믹스 처리는 상관 신호 채널 조합 방식으로부터 비 상관 신호 채널 조합 방식으로의 천이에 대응하는 다운믹스 처리 방법을 사용하여 수행됨 - ; 또는
이전 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식일 때, 현재 프레임의 코딩 모드가 비 상관 신호 코딩 모드인 것으로 결정하는 단계 - 비 상관 신호 코딩 모드에서, 시간-도메인 다운믹스 처리는 비 상관 신호 채널 조합 방식에 대응하는 다운믹스 처리 방법을 사용함으로써 수행됨 - ; 또는
이전 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식일 때, 현재 프레임의 코딩 모드가 비상관-상관 신호 코딩 스위칭 모드인 것으로 결정하는 단계 - 비상관-상관 신호 코딩 스위칭 모드에서, 시간-도메인 다운믹스 처리는 비 상관 신호 채널 조합 방식으로부터 상관 신호 채널 조합 방식으로의 천이에 대응하는 다운믹스 처리 방법을 사용하여 수행되고, 비상관-상관 신호 코딩 스위칭 모드에 대응하는 시간-도메인 다운믹스 처리 방식은 구체적으로 세그먼트화된 시간-도메인 다운믹스 방식일 수 있고, 즉 현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하는 것일 수 있음 - ; 또는
이전 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식일 때, 현재 프레임의 코딩 모드가 상관 신호 코딩 모드인 것으로 결정하는 단계 - 상관 신호 코딩 모드에서, 시간-도메인 다운믹스 처리는 상관 신호 채널 조합 방식에 대응하는 다운믹스 처리 방법을 사용함으로써 수행됨 - 를 포함한다.
상이한 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방식이 일반적으로 다르다는 것을 이해할 수 있다. 또한, 각각의 코딩 모드는 하나 이상의 시간-도메인 다운믹스 처리 방식에 대응할 수 있다.
예를 들어, 일부 가능한 구현들에서, 현재 프레임의 코딩 모드가 상관 신호 코딩 모드인 것으로 결정될 때, 시간-도메인 다운믹스 처리는 상관 신호 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방식을 사용하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 수행되어 현재 프레임에서의 일차 및 이차 채널 신호를 획득한다. 상관 신호 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방식은 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식이다.
다른 예에서, 일부 가능한 구현들에서, 현재 프레임의 코딩 모드가 비 상관 신호 코딩 모드인 것으로 결정될 때, 시간-도메인 다운믹스 처리는 비 상관 신호 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방식을 사용하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 수행되어 현재 프레임에서의 일차 및 이차 채널 신호를 얻는다. 비 상관 신호 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방식은 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식이다.
다른 예에서, 일부 가능한 구현들에서, 현재 프레임의 코딩 모드가 상관-비상관 신호 코딩 스위칭 모드인 것으로 결정될 때, 시간-도메인 다운믹스 처리는 상관-비상관 신호 코딩 스위칭 모드에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 수행되어 현재 프레임에서의 일차 및 이차 채널 신호를 획득한다. 상관-비상관 신호 코딩 스위칭 모드에 대응하는 시간-도메인 다운믹스 처리 방식은 상관 신호 채널 조합 방식으로부터 비 상관 신호 채널 조합 방식으로의 천이에 대응하는 시간-도메인 다운믹스 처리 방식이다. 상관-비상관 신호 코딩 스위칭 모드에 대응하는 시간-도메인 다운믹스 처리 방식은 구체적으로 세그먼트화된 시간-도메인 다운믹스 방식, 즉 현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하는 것일 수 있다.
다른 예에서, 일부 가능한 구현에서, 현재 프레임의 코딩 모드가 비상관-상관 신호 코딩 스위칭 모드인 것으로 결정되면, 시간-도메인 다운믹스 처리는 현재의 좌측 및 우측 채널 신호에 대해 수행된다. 비상관-상관 신호 코딩 스위칭 모드에 대응하는 시간-도메인 다운믹스 처리 방식을 사용하여 현재 프레임에서의 일차 및 이차 채널 신호에 대해 수행되어 현재 프레임에서의 일차 및 이차 채널 신호를 획득한다. 비상관-상관 신호 코딩 스위칭 모드에 대응하는 시간-도메인 다운믹스 처리 방식은 비 상관 신호 채널 조합 방식으로부터 상관 신호 채널 조합 방식으로의 천이에 대응하는 시간-도메인 다운믹스 처리 방식이다.
상이한 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방식이 일반적으로 다르다는 것을 이해할 수 있다. 또한, 각각의 코딩 모드는 하나 이상의 시간-도메인 다운믹스 처리 방식에 대응할 수 있다.
예를 들어, 일부 가능한 구현들에서, 비 상관 신호 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리를 수행하여, 현재 프레임에서의 일차 및 이차 채널을 획득하는 단계는: 현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호를 획득하는 단계; 또는 현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터 및 이전 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리를 수행하여, 현재 프레임에서의 일차 및 이차 채널 신호를 획득하는 단계를 포함할 수 있다.
전술한 솔루션에서, 현재 프레임에 대한 채널 조합 방식이 결정될 필요가 있으며, 이는 현재 프레임에 대한 채널 조합 방식에 대한 복수의 가능성이 있음을 나타낸다. 하나의 채널 조합 방식이 존재하는 종래의 솔루션과 비교하여, 복수의 가능한 채널 조합 방식을 갖는 이 솔루션은 복수의 가능한 시나리오와 더 잘 호환되고 매칭될 수 있다. 전술한 솔루션에서, 현재 프레임의 코딩 모드는 이전 프레임에 대한 채널 조합 방식 및 현재 프레임에 대한 채널 조합 방식에 기초하여 결정될 필요가 있으며, 현재의 코딩 모드에 대한 복수의 가능성이 있다. 단지 하나의 코딩 모드가 존재하는 종래의 솔루션과 비교하여, 복수의 가능한 코딩 모드를 갖는 이 솔루션은 복수의 가능한 시나리오와 더 잘 호환되고 매칭될 수 있다.
구체적으로, 예를 들어, 현재 프레임에 대한 채널 조합 방식이 이전 프레임에 대한 채널 조합 방식과 다를 때, 현재 프레임의 코딩 모드는, 예를 들어, 상관관계와 상관 관계가 없는 것으로 결정될 수 있다 신호 코딩 스위칭 모드 또는 비상관-상관 신호 코딩 스위칭 모드일 수 있다. 이 경우, 현재 프레임에 대한 채널 조합 방식과 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 분할된 시간-도메인 다운믹스 처리가 수행될 수 있다.
현재 프레임에 대한 채널 조합 방식과 이전 프레임에 대한 채널 조합 방식이 다를 때, 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하는 메커니즘이 도입된다. 세그먼트화된 시간-도메인 다운믹스 처리 메커니즘은 채널 조합 방식의 원활한 천이를 구현하고 인코딩 품질을 향상시키는 데 도움이 된다.
이에 대응하여, 다음은 예를 사용하여 시간-도메인 스테레오 디코딩 시나리오를 설명한다.
도 3을 참조하여, 이하에서는 오디오 디코딩 모드를 결정하기 위한 방법을 제공한다. 오디오 디코딩 모드를 결정하기 위한 방법의 관련 단계들은 디코딩 장치에 의해 구현될 수 있고, 방법은 구체적으로 다음 단계들을 포함할 수 있다.
301. 비트스트림에 있는 현재 프레임의 채널 조합 방식 플래그에 기초하여 현재 프레임에 대한 채널 조합 방식을 결정한다.
302. 이전 프레임에 대한 채널 조합 방식 및 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 디코딩 모드를 결정한다.
현재 프레임의 디코딩 모드는 복수의 디코딩 모드 중 하나이다. 예를 들어, 복수의 디코딩 모드는 상관-비상관 신호 디코딩 스위칭 모드(correlated-to-anticorrelated signal decoding switching mode), 비상관-상관 신호 디코딩 스위칭 모드(anticorrelated-to-correlated signal decoding switching mode), 상관 신호 디코딩 모드(correlated signal decoding mode), 비 상관 신호 디코딩 모드(anticorrelated signal decoding mode) 등을 포함할 수 있다.
상관-비상관 신호 디코딩 스위칭 모드에 대응하는 시간-도메인 업믹스 모드는 예를 들어 "상관-비상관 신호 업믹스 스위칭 모드"(correlated-to-anticorrelated signal upmix switching mode)라고 지칭될 수 있다. 비상관-상관 신호 디코딩 스위칭 모드에 대응하는 시간-도메인 업믹스 모드는, 예를 들어 "상관-비상관 신호 업믹스 스위칭 모드"(anticorrelated-to-correlated signal upmix switching mode)라고 지칭될 수 있다. 상관 신호 디코딩 모드에 대응하는 시간-도메인 업믹스 모드는 예를 들어 "상관 신호 업믹스 모드"(correlated signal upmix mode)라고 지칭될 수 있다. 비 상관 신호 디코딩 모드에 대응하는 시간-도메인 업믹스 모드는 예를 들어 "비상관 신호 업믹스 모드"(anticorrelated signal upmix mode)라고 지칭될 수 있다.
본 출원의 이 실시예에서, 코딩 모드, 디코딩 모드, 및 채널 조합 방식과 같은 객체의 명칭은 모두 예이며, 다른 명칭도 실제 적용에 사용될 수 있음을 이해할 수 있다.
일부 가능한 구현들에서, 이전 프레임에 대한 채널 조합 방식 및 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 디코딩 모드를 결정하는 단계는:
이전 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식일 때, 현재 프레임의 디코딩 모드가 상관-비상관 신호 디코딩 스위칭 모드인 것으로 결정하는 단계 - 상관-비상관 신호 디코딩 스위칭 모드에서, 시간-도메인 업믹스 처리는 상관 신호 채널 조합 방식으로부터 비 상관 신호 채널 조합 방식으로의 천이에 대응하는 업믹스 처리 방법을 사용하여 수행됨 - ; 또는
이전 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식일 때, 현재 프레임의 디코딩 모드가 비 상관 신호 디코딩 모드인 것으로 결정하는 단계 - 비 상관 신호 디코딩 모드에서, 시간-도메인 업믹스 처리는 비 상관 신호 채널 조합 방식에 대응하는 업믹스 처리 방법을 사용하여 수행됨 - ; 또는
이전 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식일 때, 현재 프레임의 디코딩 모드가 비상관-상관 신호 디코딩 스위칭 모드인 것으로 결정하는 단계 - 비상관-상관 신호 디코딩 스위칭 모드에서, 시간-도메인 업믹스 처리는 비 상관 신호 채널 조합 방식으로부터 상관 신호 채널 조합 방식으로의 천이에 대응하는 업믹스 처리 방법을 사용하여 수행됨 - ; 또는
이전 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식일 때, 현재 프레임의 디코딩 모드가 상관 신호 디코딩 모드인 것으로 결정하는 단계 - 상관 신호 디코딩 모드에서, 시간-도메인 업믹스 처리는 상관 신호 채널 조합 방식에 대응하는 업믹스 처리 방법을 사용하여 수행됨 - 를 포함한다.
예를 들어, 현재 프레임의 디코딩 모드가 비 상관 신호 디코딩 모드인 것으로 결정되면, 디코딩 장치는 비 상관 신호 디코딩 모드에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득한다.
재구성된 좌측 및 우측 채널 신호는 디코딩된 좌측 및 우측 채널 신호일 수 있거나, 지연 조정 처리 및/또는 시간-도메인 포스트-처리가 재구성된 좌측 및 우측 채널 신호에 대해 수행되어 디코딩된 좌측 및 우측 채널 신호를 획득할 수 있다.
비 상관 신호 디코딩 모드에 대응하는 시간-도메인 업믹스 처리 방식은 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식이고, 비 상관 신호 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식이다.
현재 프레임의 디코딩 모드는 복수의 디코딩 모드 중 하나일 수 있다. 예를 들어, 현재 프레임의 디코딩 모드는 다음과 같은 디코딩 모드: 상관 신호 디코딩 모드, 비 상관 신호 디코딩 모드, 상관-비상관 신호 디코딩 스위칭 모드, 및 비상관-상관 신호 디코딩 스위칭 모드 중 하나일 수 있다.
전술한 솔루션에서, 현재 프레임의 디코딩 모드가 결정될 필요가 있으며, 이는 현재 프레임의 디코딩 모드에 대한 복수의 가능성이 있음을 나타낸다는 것을 이해할 수 있다. 단지 하나의 디코딩 모드가 존재하는 종래의 솔루션과 비교하여, 복수의 가능한 디코딩 모드를 갖는 이 솔루션은 복수의 가능한 시나리오와 더 잘 호환되고 매칭될 수 있다. 또한, 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식이 도입되기 때문에, 현재 프레임의 스테레오 신호가 니어 아웃 오브 페이즈 시그널일 때, 더 많은 목표 채널 조합 방식 및 디코딩 모드가 있으며, 이는 디코딩 품질을 향상시키는 데 도움이 된다.
다른 예로, 현재 프레임의 디코딩 모드가 상관 신호 디코딩 모드인 것으로 결정되면, 디코딩 장치는 상관 신호 디코딩 모드에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득한다. 상관 신호 디코딩 모드에 대응하는 시간-도메인 업믹스 처리 방식은 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식이고, 상관 신호 채널 조합 방식은 근접 신호에 대응하는 채널 조합 방식이다.
다른 예를 들어, 현재 프레임의 디코딩 모드가 상관-비상관 신호 디코딩 스위칭 모드인 것으로 결정될 때, 디코딩 장치는 상관-비상관 신호 디코딩 스위칭 모드에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득한다. 상관-비상관 신호 디코딩 스위칭 모드에 대응하는 시간-도메인 업믹스 처리 방식은 상관 신호 채널 조합 방식으로부터 비 상관 신호 채널 조합 방식으로의 천이에 대응하는 시간-도메인 업믹스 처리 방식이다.
다른 예로, 현재 프레임의 디코딩 모드가 비상관-상관 신호 디코딩 스위칭 모드인 것으로 결정될 때, 디코딩 장치는 비상관-상관 신호 디코딩 스위칭 모드에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득한다. 비상관-비상관 신호 디코딩 스위칭 모드에 대응하는 시간-도메인 업믹스 처리 방식은 비 상관 신호 채널 조합 방식에서 상관 신호 채널 조합 방식으로의 천이에 대응하는 시간-도메인 업믹스 처리 방식이다.
상이한 디코딩 모드에 대응하는 시간-도메인 업믹스 처리 방식이 일반적으로 다르다는 것을 이해할 수 있다. 또한, 각각의 디코딩 모드는 하나 이상의 시간-도메인 업믹스 처리 방식에 대응할 수 있다.
전술한 솔루션에서, 현재 프레임에 대한 채널 조합 방식이 결정될 필요가 있으며, 이는 현재 프레임에 대한 채널 조합 방식에 대한 복수의 가능성이 있음을 나타낸다. 하나의 채널 조합 방식이 존재하는 종래의 솔루션과 비교하여, 복수의 가능한 채널 조합 방식을 갖는 이 솔루션은 복수의 가능한 시나리오와 더 잘 호환되고 매칭될 수 있다. 전술한 솔루션에서, 현재 프레임의 디코딩 모드는 이전 프레임에 대한 채널 조합 방식 및 현재 프레임에 대한 채널 조합 방식에 기초하여 결정될 필요가 있으며, 현재 프레임의 디코딩 모드에 대한 복수의 가능성이 존재한다. 단지 하나의 디코딩 모드가 존재하는 종래의 솔루션과 비교하여, 복수의 가능한 디코딩 모드를 갖는 이 솔루션은 복수의 가능한 시나리오와 더 잘 호환되고 매칭될 수 있다.
또한, 디코딩 장치는 현재 프레임의 디코딩 모드에 대응하는 시간-도메인 업믹스 처리에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득한다.
다음은 인코딩 장치에 의해 현재 프레임에 대한 채널 조합 방식을 결정하는 일부 특정 구현을 설명하기 위해 예를 사용한다. 인코딩 장치에 의해 현재 프레임에 대한 채널 조합 방식을 결정하는 다양한 특정 구현이 있다.
예를 들어, 일부 가능한 구현들에서, 현재 프레임에 대한 채널 조합 방식을 결정하는 단계는: 현재 프레임에 대한 채널 조합 방식을 결정하기 위해 적어도 한 번 현재 프레임에 대한 채널 조합 방식 결정을 수행하는 단계를 포함할 수 있다.
구체적으로, 예를 들어, 현재 프레임에 대한 채널 조합 방식을 결정하는 단계는: 현재 프레임에 대한 초기 채널 조합 방식을 결정하기 위해 현재 프레임에 대한 초기 채널 조합 방식 결정을 수행하는 단계; 및 현재 프레임에 대한 채널 조합 방식을 결정하기 위해 현재 프레임에 대한 초기 채널 조합 방식에 기초하여 현재 프레임에 대한 채널 조합 방식 수정 결정을 수행하는 단계를 포함한다. 또한, 현재 프레임에 대한 초기 채널 조합 방식은 현재 프레임에 대한 채널 조합 방식으로 직접 사용될 수도 있다. 다시 말해서, 현재 프레임에 대한 채널 조합 방식은 현재 프레임에 대한 초기 채널 조합 방식 결정이 수행된 후에 결정되는 현재 프레임에 대한 초기 채널 조합 방식일 수 있다.
예를 들어, 현재 프레임에 대한 초기 채널 조합 방식 결정을 수행하는 단계는: 현재 프레임에서의 좌측 및 우측 채널 신호를 사용하여 현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형을 결정하는 단계; 및 현재 프레임에서의 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형 및 이전 프레임에 대한 상기 채널 조합 방식에 기초하여 현재 프레임에 대한 상기 초기 채널 조합 방식을 결정하는 단계를 포함한다. 현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형은 니어 인 페이즈 시그널 또는 니어 아웃 오브 페이즈 시그널일 수 있다. 현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형은 현재 프레임의 인/아웃 페이즈 플래그의 신호 유형으로 표시될 수 있다(예를 들어, 인/아웃 페이즈 플래그의 신호 유형은 tmp_SM_flag로 표시된다). 구체적으로, 예를 들어, 현재 프레임의 인/아웃 페이즈 플래그의 신호 유형의 값이 "1"인 경우, 현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 인 페이즈 시그널임을 나타내거나; 또는 현재 프레임의 인/아웃 페이즈 플래그의 신호 유형의 값이 "0"인 경우, 현재 프레임에서의 스테레오 신호의 인/아웃 페이즈의 신호 유형이 니어 아웃 오브 페이즈 시그널임을 나타내거나; 또는 그 반대로도 성립한다.
오디오 프레임(예를 들어, 이전 프레임 또는 현재 프레임)에 대한 채널 조합 방식은 오디오 프레임의 채널 조합 방식 플래그로 표시될 수 있다. 예를 들어, 오디오 프레임의 채널 조합 방식 플래그의 값이 "0"인 경우, 이는 오디오 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식임을 나타내고; 또는 오디오 프레임의 채널 조합 방식 플래그의 값이 "1"일 때, 이는 오디오 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식임을 표시하거나; 혹은 그 반대로도 성립한다.
유사하게, 오디오 프레임(예를 들어, 이전 프레임 또는 현재 프레임)에 대한 초기 채널 조합 방식은 오디오 프레임의 초기 채널 조합 방식 플래그로 표시될 수 있다(예를 들어, 초기 채널 조합 방식 플래그는
Figure pat00228
로 표시된다). 예를 들어, 오디오 프레임의 초기 채널 조합 방식 플래그의 값이 "0"인 경우, 오디오 프레임에 대한 초기 채널 조합 방식은 상관 신호 채널 조합 방식임을 나타내거나; 또는 다른 예에서, 오디오 프레임의 초기 채널 조합 방식 플래그의 값이 "1"인 경우, 이는 오디오 프레임에 대한 초기 채널 조합 방식이 비 상관 신호 채널 조합 방식임을 표시하거나; 또는 그 반대로도 성립한다.
현재 프레임에서의 좌측 및 우측 채널 신호를 사용함으로써 현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형을 결정하는 단계는: 현재 프레임에서의 좌측 및 우측 채널 신호 간의 상관 값
Figure pat00229
을 계산하는 단계; 및
Figure pat00230
이 제1 임계치보다 낮거나 같을 때, 현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 인 페이즈 시그널인 것으로 결정하는 단계; 또는
Figure pat00231
이 제1 임계 값보다 클 때, 현재 프레임에서의 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 아웃 오브 페이즈 시그널인 것으로 결정하는 단계를 포함한다. 또한, 현재 프레임의 인/아웃 페이즈 플래그의 신호 유형이 현재 프레임에서의 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형을 나타내는 데 사용되면, 현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 인 페이즈 시그널인 것으로 결정되며, 현재 프레임의 위상 플래그의 인/아웃 페이즈 플래그의 신호 유형의 값이 현재 프레임의 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 인 페이즈 시그널임을 나타내도록 설정될 수 있거나; 또는 현재 프레임의 인/아웃 페이즈 유형이 니어 아웃 오브 페이즈 시그널에 가까운 것으로 판정될 때, 현재 프레임의 인/아웃 위상 플래그의 신호 유형의 값이 현재 프레임에서의 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 아웃 오브 페이즈 시그널임을 나타내도록 설정될 수 있다.
제1 임계 값의 값 범위는 예를 들어(0.5, 1.0) 일 수 있고, 제1 임계 값은 예를 들어 0.5, 0.85, 0.75, 0.65 또는 0.81과 동일할 수 있다.
구체적으로, 예를 들어, 오디오 프레임(예를 들어, 이전 프레임 또는 현재 프레임)의 인/아웃 위상 플래그의 신호 유형의 값이 "0"인 경우, 오디오 프레임의 스테레오 신호의 인/아웃 페이즈의 신호 유형임을 나타내거나; 또는 오디오 프레임(예를 들어, 이전 프레임 또는 현재 프레임)의 인/아웃 페이즈 플래그의 신호 유형의 값이 "1"인 경우, 오디오 프레임의 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 아웃 오브 페이즈 시그널임을 나타내거나; 또는 그 반대로도 성립한다.
예를 들어, 현재 프레임에서의 스테레오 신호의 위상의 위상/부외의 신호 유형 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에 대한 초기 채널 조합 방식을 결정하는 단계는:
현재 프레임에서 스테레오 신호의 위상에 대한 위상의 신호 유형이 니어 인 페이즈 시그널이고 이전 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식일 때, 현재 프레임에 대한 초기 채널 조합 방식이 상관 신호 채널 조합 방식인 것으로 결정하는 단계; 또는 현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 아웃 오브 페이즈 시그널이고 이전 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식일 때, 초기 채널 조합 방식을 결정하는 단계 현재 프레임에 대한 비 상관 신호 채널 조합 방식인 것으로 결정하는 단계; 또는
현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 인 페이즈 시그널이고 이전 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식일 때, 현재 프레임에서의 좌측 및 우측 채널 신호의 신호대잡음비가 모두 제2 임계 값보다 작으면, 현재 프레임에 대한 초기 채널 조합 방식이 상관 신호 채널 조합 방식인 것으로 결정하는 단계; 또는 현재 프레임에서의 좌측 채널 신호의 신호대잡음비 및/또는 현재 프레임에서의 우측 채널 신호의 신호대 잡음비가 제2 임계 값보다 크거나 같으면, 현재 프레임에 대한 초기 채널 조합 방식이 비 상관 신호 채널 조합 방식인 것으로 결정하는 단계; 또는
현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 아웃 오브 페이즈 시그널이고 이전 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식일 때, 현재 프레임에서의 좌측 및 우측 채널 신호의 신호대잡음비 모두가 제2 임계치보다 작으면, 현재 프레임에 대한 초기 채널 조합 방식이 비 상관 신호 채널 조합 방식인 것으로 결정하는 단계; 또는 현재 프레임에서의 좌측 채널 신호의 신호대 잡음비 및/또는 우측 채널 신호의 신호대 잡음비가 제2 임계 값보다 크거나 같으면, 현재 프레임에 대한 초기 채널이 상관 신호 채널 조합 방식인 것으로 결정하는 단계를 포함할 수 있다.
제2 임계 값의 값 범위는 예를 들어 [0.8, 1.2] 일 수 있고, 제2 임계 값은 예를 들어 0.8, 0.85, 0.9, 1, 1.1 또는 1.18과 동일할 수 있다.
현재 프레임에 대한 초기 채널 조합 방식에 기초하여 현재 프레임에 대한 채널 조합 방식 수정 결정을 수행하는 단계는: 이전 프레임의 채널 조합 비율 팩터 수정 플래그, 현재 프레임에서 스테레오 신호의 위상의 인 페이즈/아웃 페이즈의 신호 유형, 및 현재 프레임에 대한 초기 채널 조합 방식에 기초하여 현재 프레임에 대한 채널 조합 방식을 결정하는 단계를 포함할 수 있다.
현재 프레임의 채널 조합 방식 플래그는
Figure pat00232
로 표시될 수 있고, 현재 프레임의 채널 조합 비율 팩터 수정 플래그는
Figure pat00233
로 표시될 수 있다. 예를 들어, 채널 조합 비율 팩터 수정 플래그의 값이 0인 경우, 이는 채널 조합 비율 팩터가 수정될 필요가 없음을 나타내고; 또는 채널 조합 비율 수정 플래그의 값이 1인 경우, 이는 채널 조합 비율 팩터가 수정될 필요가 있음을 나타낸다. 확실히, 채널 조합 비율 팩터 수정 플래그로서 다른 상이한 값이 채널 조합 비율 팩터가 수정될 필요가 있는지를 표시하는 데 사용될 수 있다.
구체적으로, 예를 들어, 현재 프레임에 대한 초기 채널 조합 방식 결정의 결과에 기초하여 현재 프레임에 대한 채널 조합 방식 수정 결정을 수행하는 단계는:
이전 프레임의 채널 조합비 팩터 수정 플래그가 채널 조합비 팩터가 수정될 필요가 있음을 나타내면, 비 상관 신호 채널 조합 방식을 현재 프레임에 대한 채널 조합 방식으로 사용하거나; 또는 이전 프레임의 채널 조합 비율 팩터 수정 플래그가 채널 조합 비율 팩터가 수정될 필요가 없음을 나타내면, 현재 프레임이 스위칭 조건을 만족하는지를 결정하고, 현재 프레임이 스위칭 조건을 만족하는지를 결정하는 결과에 기초하여 현재 프레임에 대한 채널 조합 방식을 결정하는 단계를 포함한다.
현재 프레임이 스위칭 조건을 만족하는지를 판단한 결과에 기초하여 현재 프레임에 대한 채널 조합 방식을 결정하는 단계는:
이전 프레임에 대한 채널 조합 방식이 현재 프레임에 대한 초기 채널 조합 방식과 다르고, 현재 프레임이 스위칭 조건을 만족하고, 현재 프레임에 대한 초기 채널 조합 방식은 상관 신호 채널 조합 방식이며, 채널 이전 프레임에 대한 조합 방식은 비 상관 신호 채널 조합 방식일 때, 현재 프레임에 대한 채널 조합 방식은 비 상관 신호 채널 조합 방식인 것으로 결정하는 단계; 또는
이전 프레임에 대한 채널 조합 방식이 현재 프레임에 대한 초기 채널 조합 방식과 다르고, 현재 프레임이 스위칭 조건을 만족하고, 현재 프레임에 대한 초기 채널 조합 방식이 비 상관 신호 채널 조합 방식이고, 채널 조합 이전 프레임에 대한 방식은 상관 신호 채널 조합 방식이고, 이전 프레임의 채널 조합 비율 팩터는 제1 비율 계수 임계 값보다 작으면, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식인 것으로 결정하는 단계; 또는
이전 프레임에 대한 채널 조합 방식이 현재 프레임에 대한 초기 채널 조합 방식과 다르고, 현재 프레임이 스위칭 조건을 만족하고, 현재 프레임에 대한 초기 채널 조합 방식이 비 상관 신호 채널 조합 방식이고, 채널 조합 이전 프레임에 대한 방식은 상관 신호 채널 조합 방식이고, 이전 프레임의 채널 조합 비율 팩터는 제1 비율 계수 임계 값보다 크거나 같으면, 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식인 것으로 결정하는 단계; 또는
(P-1)번째-전류 프레임에 대한 채널 조합 방식이 P번째-현재 프레임에 대한 초기 채널 조합 방식과 다르고, P번째-현재 프레임이 스위칭 조건을 만족하지 않고, 현재 프레임이 스위칭 조건을 충족하고, 현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 인 페이즈 시그널이고, 현재 프레임에 대한 초기 채널 조합 방식이 상관 신호 채널 조합 방식이고, 이전 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식일 때, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식인 것으로 결정하는 단계; 또는
(P-1)번째-현재 프레임에 대한 채널 조합 방식이 P번째-현재 프레임에 대한 초기 채널 조합 방식과 다르면, P번째-현재 프레임이 스위칭 조건을 만족하지 않고, 현재 프레임이 스위칭 조건을 충족하고, 현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 인 페이즈 시그널이고, 현재 프레임의 초기 채널 조합 방식이 비 상관성 신호 채널 조합 방식이고, 이전 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식이고, 이전 프레임의 채널 조합 비율 팩터는 제2 비율 계수 임계 값보다 작으면, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식인 것으로 결정하는 단계; 또는
(P-1)번째-현재 프레임에 대한 채널 조합 방식이 P번째-현재 프레임에 대한 초기 채널 조합 방식과 다르고, P번째-현재 프레임이 스위칭 조건을 만족하지 않고, 현재 프레임은 스위칭 조건을 만족하고, 현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 아웃 오브 페이즈 시그널이고, 현재 프레임의 초기 채널 조합 방식은 비 상관성 신호 채널 조합 방식이며, 이전 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식이고, 이전 프레임의 채널 조합 비율 팩터는 제2 비율 계수 임계치보다 크거나 같으면, 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식인 것으로 결정하는 단계를 포함할 수 있다.
여기서, P는 1보다 큰 정수일 수 있다. 예를 들어, P는 2, 3, 4, 5, 6 또는 다른 값과 같을 수 있다.
제1 비율 계수 임계 값의 값 범위는 예를 들어 [0.4, 0.6] 일 수 있고, 제1 비율 계수 임계 값은 예를 들어 0.4, 0.45, 0.5, 0.55 또는 0.6과 동일할 수 있다.
제2 비율 계수 임계 값의 값 범위는 예를 들어 [0.4, 0.6] 일 수 있고, 제2 비율 계수 임계 값은 예를 들어 0.4, 0.46, 0.5, 0.56 또는 0.6과 동일할 수 있다.
일부 가능한 구현들에서, 현재 프레임이 스위칭 조건을 충족시키는지를 결정하는 단계는: 이전 프레임에서의 주요 채널 신호의 프레임 유형 및/또는 이전 프레임에서의 이차 채널 신호의 프레임 유형에 기초하여, 현재 프레임이 스위칭 조건을 충족하는지를 판정하는 단계를 포함한다.
일부 가능한 구현들에서, 현재 프레임이 스위칭 조건을 만족하는지를 결정하는 단계는:
제1 조건, 제2 조건 및 제3 조건이 모두 충족될 때, 현재 프레임이 스위칭 조건을 만족하는 것으로 결정하는 단계; 또는 제2 조건, 제3 조건, 제4 조건 및 제5 조건이 모두 충족될 때, 현재 프레임이 스위칭 조건을 만족하는 것으로 결정하는 단계; 또는 제6 조건이 충족될 때, 현재 프레임이 스위칭 조건을 만족하는 것으로 결정하는 단계를 포함할 수 있다.
제1 조건은 다음과 같다: 이전 프레임의 이전 프레임에서 일차 채널 신호의 프레임 유형은 다음: VOICED_CLAS 프레임(유성음 프레임 또는 유성음 프레임을 따라는 특성을 갖는 프레임), ONSET 프레임(음성 시작 프레임), SIN_ONSET 프레임(고조파와 노이즈가 혼합된 시작 프레임), INACTIVE_CLAS 프레임(비활성 특성이 있는 프레임) 및 AUDIO_CLAS(오디오 프레임) 중 하나이고, 이전 프레임의 일차 채널 신호의 프레임 유형은 UNVOICED_CLAS 프레임(수 개의 특성: 무성, 비활성, 잡음 또는 음성 중 하나로 끝나는 프레임) 또는 VOICED_TRANSITION 프레임(유성음 후 전환이 있는 프레임, 프레임은 상당히 약한 음성 특성을 가지고 있거나; 또는 이전 프레임의 이전 프레임에서 이차 채널 신호의 프레임 유형은 다음: VOICED_CLAS 프레임, ONSET 프레임, SIN_ONSET 프레임, INACTIVE_CLAS 프레임 및 AUDIO_CLAS 프레임 중 어느 하나이며 이전 프레임의 이차 채널 신호의 프레임 유형은 UNVOICED_CLAS 프레임 또는 VOICED_TRANSITION 프레임이다.
제2 조건은 다음과 같다: 이전 프레임의 일차 채널 신호 및 이차 채널 신호의 원시 코딩 모드(raw coding modes) 중 어느 것도 VOICED(음성 프레임에 대응하는 코딩 유형)가 아니다.
제3 조건은 다음과 같다: 이전 프레임에서 사용된 채널 조합 방식을 사용하는 이전 프레임 이전의 연속 프레임 수량이 사전 설정된 프레임 수량 임계 값보다 크다. 프레임 수량 임계 값의 값 범위는 예를 들어 [3, 10] 일 수 있다. 예를 들어, 에너지 임계 값은 3, 4, 5, 6, 7, 8, 9 또는 다른 값과 동일할 수 있다.
제4 조건은 다음과 같다: 이전 프레임에서 일차 채널 신호의 프레임 유형이 UNVOICED_CLAS이거나, 또는 이전 프레임에서 이차 채널 신호의 프레임 유형이 UNVOICED_CLAS이다.
제5 조건은 다음과 같다: 현재 프레임에서 좌측 및 우측 채널 신호의 장기 루트 평균 제곱 에너지 값이 에너지 임계 값보다 작다. A 에너지 임계 값의 값 범위는 예를 들어 [300, 500] 일 수 있다. 예를 들어, 에너지 임계 값은 300, 400, 410, 451, 482, 500, 415 또는 다른 값과 동일할 수 있다.
제6 조건은 다음과 같다: 이전 프레임에서 일차 채널 신호의 프레임 유형이 음악 신호이며, 이전 프레임에서 일차 채널 신호의 고주파수 대역에 대한 저주파수 대역의 에너지 비율이 제1 에너지 비율 임계 값이며, 이전 프레임에서 이차 채널 신호의 더 높은 주파수 대역의 에너지 대 저주파수 대역의 에너지 비율은 제2 에너지 비율 임계 값보다 크다.
제1 에너지 비율 임계 값의 범위는 예를 들어 [4000, 6000] 일 수 있다. 예를 들어, 에너지 임계 값은 4000, 4500, 5000, 5105, 5200, 6000, 5800 또는 다른 값과 동일할 수 있다.
제2 에너지 비율 임계 값의 범위는 예를 들어 [4000, 6000] 일 수 있다. 예를 들어, 에너지 임계 값은 4000, 4501, 5000, 5105, 5200, 6000, 5800 또는 다른 값과 동일할 수 있다.
현재 프레임이 스위칭 조건을 만족하는지를 결정하는 다양한 구현이 있을 수 있으며, 이는 상기 예에 제공된 방식으로 제한되지 않는 것으로 이해될 수 있다.
현재 프레임에 대한 채널 조합 방식을 결정하는 일부 구현이 전술한 예에서 제공되지만, 실제 적용은 전술한 예에서의 방식으로 제한되지 않을 수 있다는 것이 이해될 수 있다.
다음은 상호 상관 신호 코딩 모드에 대한 시나리오를 설명하기 위해 예를 더 사용한다.
도 4를 참조하여, 본 출원의 실시예는 오디오 인코딩 방법을 제공한다. 오디오 인코딩 방법의 관련 단계는 인코딩 장치에 의해 구현될 수 있고, 방법은 구체적으로 다음 단계를 포함할 수 있다.
401. 현재 프레임의 코딩 모드를 결정한다.
402. 현재 프레임의 코딩 모드가 비 상관 신호 코딩 모드인 것으로 결정될 때, 비 상관 신호 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방식을 사용하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호를 얻는다.
403. 획득된 일차 및 이차 채널 신호를 현재 프레임에 인코딩한다.
비 상관 신호 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방식은 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식이고, 비 상관 신호 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식이다.
예를 들어, 일부 가능한 구현들에서, 비 상관 신호 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리를 수행하여, 일차 및 이차 채널 신호를 획득하는 단계는: 현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호를 획득하는 단계; 또는 현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호를 획득하기 단계를 포함할 수 있다.
오디오 프레임(예를 들어, 현재 프레임 또는 이전 프레임)에 대한 채널 조합 방식(예를 들어, 비 상관 신호 채널 조합 방식 또는 상관 신호 채널 조합 방식)의 채널 조합 비율 팩터는 미리 설정된 고정 값일 수 있다는 것을 이해할 수 있다. 확실히, 오디오 프레임의 채널 조합 비율 팩터는 또한 오디오 프레임에 대한 채널 조합 방식에 기초하여 결정될 수 있다.
일부 가능한 구현들에서, 대응하는 다운믹스 매트릭스는 오디오 프레임의 채널 조합 비율 팩터에 기초하여 구성될 수 있고, 시간-도메인 다운믹스 처리는 채널 조합 방식에 대응하는 다운믹스 매트릭스를 사용함으로써 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 수행되어 현재 프레임에서의 일차 및 이차 채널 신호를 획득한다.
예를 들어, 현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리가 수행될 때, 현재 프레임에서의 일차 및 이차 채널 신호를 획득한다.
Figure pat00234
다른 예를 들어, 시간-도메인 다운믹스 처리가 현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터 및 이전 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 수행될 때 현재 프레임에서의 일차 및 이차 채널 신호를 획득한다.
Figure pat00235
; 또는
Figure pat00236
; 여기서
delay_com은 인코딩 지연 보상을 나타낸다.
다른 예를 들어, 시간-도메인 다운믹스 처리가 현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터 및 이전 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 수행될 때 현재 프레임에서의 일차 및 이차 채널 신호를 획득한다.
Figure pat00237
;
Figure pat00238
; 또는
Figure pat00239
여기서,
Figure pat00240
은 페이드-인 팩터를 나타낸다. 예를 들어,
Figure pat00241
이다. 확실히,
Figure pat00242
은 대안적으로 n에 기초한 다른 함수 관계의 페이드-인 팩터일 수 있다.
Figure pat00243
은 페이드-아웃 팩터를 나타낸다. 예를 들어,
Figure pat00244
이다. 확실히,
Figure pat00245
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-아웃 팩터일 수 있다.
Figure pat00246
은 천이 처리 길이를 나타낸다.
Figure pat00247
의 값은 특정 시나리오 요구 사항에 따라 설정될 수 있다. 예를 들어,
Figure pat00248
은 3/N과 같거나
Figure pat00249
은 N보다 작은 다른 값일 수 있다.
다른 예를 들어, 상관 신호 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리가 수행될 때, 현재 프레임에서의 일차 및 이차 채널 신호를 획득한다.
Figure pat00250
전술한 예에서,
Figure pat00251
은 현재 프레임에서의 좌측 채널 신호를 나타낸다.
Figure pat00252
은 현재 프레임에서의 우측 채널 신호를 나타낸다.
Figure pat00253
은 현재 프레임에 있으면서 시간-도메인 다운믹스 처리를 통해 획득된 일차 채널 신호를 나타내고;
Figure pat00254
은 현재 프레임에 있으면서 시간-도메인 다운믹스 처리를 통해 획득된 이차 채널 신호를 나타낸다.
전술한 예에서, n은 샘플링 포인트 수를 나타낸다. 예를 들여,
Figure pat00255
이다.
전술한 예에서, delay_com은 인코딩 지연 보상을 나타낸다.
Figure pat00256
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pat00257
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pat00258
는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pat00259
는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pat00260
는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pat00261
는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pat00262
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pat00263
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pat00264
은 복수의 형태를 가질 수 있으며, 예를 들어:
Figure pat00265
, 또는
Figure pat00266
, 여기서
Figure pat00267
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pat00268
는 복수의 형태를 가질 수 있으며, 예를 들어:
Figure pat00269
, 또는
Figure pat00270
, 또는
Figure pat00271
, 또는
Figure pat00272
, 또는
Figure pat00273
, 또는
Figure pat00274
, 여기서
Figure pat00275
,
Figure pat00276
Figure pat00277
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pat00278
는 복수의 형태를 가질 수 있으며, 예를 들어:
Figure pat00279
, 또는
Figure pat00280
, 또는
Figure pat00281
, 또는
Figure pat00282
, 또는
Figure pat00283
, 또는
Figure pat00284
, 여기서
Figure pat00285
,
Figure pat00286
Figure pat00287
은 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
현재 프레임에서의 좌측 및 우측 채널 신호는 구체적으로 현재 프레임에서의 최초의 좌측 및 우측 채널 신호일 수 있고(원래의 좌측 및 우측 채널 신호는 시간-도메인 전처리를 거치지 않은 좌측 및 우측 채널 신호이며, 예를 들어, 샘플링을 통해 획득된 좌측 및 우측 채널 신호일 수 있다), 현재 프레임에서 시간-도메인 전처리를 거친 좌측 및 우측 채널 신호일 수 있거나, 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 신호일 수 있다.
구체적으로, 예를 들어,
Figure pat00288
, 또는
Figure pat00289
, 또는
Figure pat00290
, 여기서
Figure pat00291
는 현재 프레임에서 원래의 좌측 및 우측 채널 신호를 나타내고,
Figure pat00292
는 현재 프레임에서 시간-도메인 전처리를 거친 좌측 및 우측 채널 신호를 나타내며,
Figure pat00293
는 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 신호를 나타낸다.
이에 대응하여, 다음은 비 상관 신호 디코딩 모드에 대한 시나리오를 설명하기 위해 예를 사용한다.
도 5를 참조하여, 본 출원의 실시예는 오디오 디코딩 방법을 추가로 제공한다. 오디오 디코딩 방법의 관련 단계는 디코딩 장치에 의해 구현될 수 있으며, 방법은 구체적으로 다음 단계를 포함할 수 있다.
501. 비트스트림에 기초하여 디코딩을 수행하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호를 획득한다.
502. 현재 프레임의 디코딩 모드를 결정한다.
단계 501 및 단계 502를 수행하기 위한 시퀀스가 없음을 이해할 수 있다.
503. 현재 프레임의 디코딩 모드가 비 상관 신호 디코딩 모드인 것으로 결정될 때, 비 상관 신호 디코딩 모드에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득한다.
재구성된 좌측 및 우측 채널 신호는 디코딩된 좌측 및 우측 채널 신호일 수 있거나, 지연 조정 처리 및/또는 시간-도메인 후처리가 디코딩된 좌측 및 우측 채널 신호를 획득하기 위해 재구성된 좌측 및 우측 채널 신호에 대해 수행될 수 있다.
비 상관 신호 디코딩 모드에 대응하는 시간-도메인 업믹스 처리 방식은 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식이고, 비 상관 신호 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식이다.
현재 프레임의 디코딩 모드는 복수의 디코딩 모드 중 하나일 수 있다. 예를 들어, 현재 프레임의 디코딩 모드는 다음과 같은 디코딩 모드: 상관 신호 디코딩 모드, 비 상관 신호 디코딩 모드, 상관-비상관 신호 디코딩 스위칭 모드, 및 비상관-상관 신호 디코딩 스위칭 모드 중 하나일 수 있다.
전술한 솔루션에서, 현재 프레임의 디코딩 모드가 결정될 필요가 있으며, 이는 현재 프레임의 디코딩 모드에 대한 복수의 가능성이 있음을 나타낸다. 단지 하나의 디코딩 모드가 존재하는 종래의 솔루션과 비교하여, 복수의 가능한 디코딩 모드를 갖는 이 솔루션은 복수의 가능한 시나리오와 더 잘 호환되고 매칭될 수 있다. 또한, 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식이 도입되기 때문에, 현재 프레임의 스테레오 신호가 니어 아웃 오브 페이즈 시그널일 때, 더 많은 목표 채널 조합 방식 및 디코딩 모드가 있으며, 이는 디코딩 품질을 향상시키는 데 도움이 된다.
일부 가능한 구현들에서, 방법은:
현재 프레임의 디코딩 모드가 상관 신호 디코딩 모드인 것으로 결정될 때, 상관 신호 디코딩에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계를 더 포함하며, 상관 신호 디코딩 모드에 대응하는 시간-도메인 업믹스 처리 방식은 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식이고, 상관 신호 채널 조합 방식은 니어 인 페이즈 시그널에 대응하는 채널 조합 방식이다.
일부 가능한 구현들에서, 방법은: 현재 프레임의 디코딩 모드가 상관-비상관 신호 디코딩 스위칭 모드인 것으로 결정될 때, 상관-비상관 신호 디코딩 스위칭 모드에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계를 더 포함할 수 있으며, 여기서, 상관-비상관 신호 디코딩 스위칭 모드에 대응하는 시간-도메인 업믹스 처리 방식은 상관 신호 채널 조합 방식으로부터 비 상관 신호 채널 조합 방식으로의 천이에 대응하는 시간-도메인 업믹스 처리 방식이다.
일부 가능한 구현들에서, 방법은: 현재 프레임의 디코딩 모드가 비상관-상관 신호 디코딩 스위칭 모드인 것으로 결정될 때, 비상관-상관 신호 디코딩 스위칭 모드에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계를 더 포함할 수 있으며, 비상관-상관 신호 디코딩 스위칭 모드에 대응하는 시간-도메인 업믹스 처리 방식은 비 상관 신호 채널 조합 방식으로부터 상관 신호 채널 조합 방식으로의 천이에 대응하는 시간-도메인 업믹스 처리 방식이다.
상이한 디코딩 모드에 대응하는 시간-도메인 업믹스 처리 방식이 일반적으로 다르다는 것을 이해할 수 있다. 또한, 각각의 디코딩 모드는 하나 이상의 시간-도메인 업믹스 처리 방식에 대응할 수 있다.
예를 들어, 일부 가능한 구현들에서, 비 상관 신호 디코딩 모드에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계는:
현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계; 또는 현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터 및 이전 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계를 포함한다.
일부 가능한 구현들에서, 대응하는 업믹스 매트릭스는 오디오 프레임의 채널 조합 비율 팩터에 기초하여 구성될 수 있고, 시간-도메인 업믹스 처리는 대응하는 채널 조합 방식에 대응하는 업믹스 매트릭스를 사용하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 수행되어 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득한다.
예를 들어, 현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리가 수행될 때, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득한다.
Figure pat00294
.
다른 예에서, 시간-도메인 업믹스 처리가 현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터 및 이전 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 수행될 때, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하고,
Figure pat00295
; 또는
Figure pat00296
; 여기서
delay_com은 인코딩 지연 보상을 나타낸다.
다른 예에서, 시간-도메인 업믹스 처리가 현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터 및 현재 프레임에 대한 채널 조합 비율 팩터 및 이전 프레임에 대한 비 상관 신호 채널 조합 방식 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 수행될 때, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하며,
Figure pat00297
;
Figure pat00298
; 또는
Figure pat00299
.
여기서,
Figure pat00300
은 현재 프레임에서 디코딩된 좌측 채널 신호를 나타내고,
Figure pat00301
은 현재 프레임에서의 재구성된 우측 채널 신호를 나타내고,
Figure pat00302
은 현재 프레임에서의 디코딩된 일차 채널 신호를 나타내고,
Figure pat00303
은 현재 프레임에서 디코딩된 이차 채널 신호를 나타낸다.
Figure pat00304
은 천이 처리 길이를 나타낸다.
Figure pat00305
은 페이드-인 팩터를 나타낸다. 예를 들어,
Figure pat00306
이다. 확실히,
Figure pat00307
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다.
Figure pat00308
은 페이드-아웃 팩터를 나타낸다. 예를 들어,
Figure pat00309
이다. 확실히,
Figure pat00310
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-아웃 팩터일 수 있다.
Figure pat00311
은 천이 처리 길이를 나타낸다.
Figure pat00312
의 값은 특정 시나리오 요구 사항에 설정될 수 있다. 예를 들어,
Figure pat00313
은 3/N과 같거나
Figure pat00314
은 N보다 작은 다른 값일 수 있다.
다른 예에서, 현재 도메인에 대한 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리가 수행될 때, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하며,
Figure pat00315
.
전술한 예에서,
Figure pat00316
은 현재 프레임에서 디코딩된 좌측 채널 신호를 나타낸다.
Figure pat00317
은 현재 프레임에서의 재구성된 우측 채널 신호를 나타낸다.
Figure pat00318
은 현재 프레임에서의 디코딩된 일차 채널 신호를 나타낸다.
Figure pat00319
은 현재 프레임에서 디코딩된 이차 채널 신호를 나타낸다.
전술한 예에서, n은 샘플링 포인트 수를 나타낸다. 예를 들면.
Figure pat00320
이다.
전술한 예에서,
Figure pat00321
은 디코딩 지연 보상을 나타낸다.
Figure pat00322
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
Figure pat00323
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pat00324
는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
Figure pat00325
는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pat00326
는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
Figure pat00327
는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pat00328
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
Figure pat00329
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pat00330
는 복수의 형태를 가질 수 있으며, 예를 들어:
Figure pat00331
, 또는
Figure pat00332
, 또는
Figure pat00333
, 또는
Figure pat00334
, 또는
Figure pat00335
, 또는
Figure pat00336
, 여기서
Figure pat00337
,
Figure pat00338
Figure pat00339
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pat00340
는 복수의 형태를 가질 수 있으며, 예를 들어:
Figure pat00341
, 또는
Figure pat00342
, 또는
Figure pat00343
, 또는
Figure pat00344
, 또는
Figure pat00345
, 또는
Figure pat00346
, 여기서
Figure pat00347
, 및
Figure pat00348
; 및
Figure pat00349
은 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pat00350
은 복수의 형태를 가질 수 있으며, 예를 들어:
Figure pat00351
, 또는
Figure pat00352
, 여기서
Figure pat00353
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
다음은 상관-비상관 신호 코딩 스위칭 모드 및 비상관-비상관 신호 코딩 스위칭 모드에 대한 시나리오를 설명하기 위해 예를 사용한다. 상관-비상관 신호 코딩 스위칭 모드 및 비상관-비상관 신호 코딩 스위칭 모드에 대응하는 시간-도메인 다운믹스 처리 방식은 예를 들어, 분할된 시간-도메인 다운믹스 처리 방식이다.
도 6을 참조하여, 본 출원의 실시예는 오디오 인코딩 방법을 제공한다. 오디오 인코딩 방법의 관련 단계는 인코딩 장치에 의해 구현될 수 있고, 방법은 구체적으로 다음 단계를 포함할 수 있다.
601. 현재 프레임에 대한 채널 조합 방식을 결정한다.
602. 현재 프레임에 대한 채널 조합 방식이 이전 프레임에 대한 채널 조합 방식과 다를 때, 현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호를 획득한다.
603. 획득된 일차 및 이차 채널 신호를 현재 프레임에 인코딩한다.
현재 프레임에 대한 채널 조합 방식이 이전 프레임에 대한 채널 조합 방식과 다르면, 현재 프레임의 코딩 모드는 상관-비상관 신호 코딩 스위칭 모드 또는 비상관-상관 신호 코딩 스위칭 모드인 것으로 결정될 수 있다. 현재 프레임의 코딩 모드가 상관-비상관 신호 코딩 스위칭 모드 또는 비상관-상관 신호 코딩 스위칭 모드이면, 예를 들어, 분할된 시간-도메인 다운믹스 처리가 현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 수행될 수 있다.
구체적으로, 예를 들어, 이전 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식일 때, 현재 프레임의 코딩 모드는 상관-비상관 신호 코딩 스위칭 모드인 것으로 결정될 수 있다. 다른 예로, 이전 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식일 때, 현재 프레임의 코딩 모드는 비상관-상관 신호 코딩 스위칭 모드인 것으로 결정될 수 있다. 나머지는 유추하여 추론할 수 있다.
세그먼트화된 시간-도메인 다운믹스 처리는 현재 프레임에서의 좌측 및 우측 채널 신호가 적어도 2개의 세그먼트로 분할되고, 다른 시간-도메인 다운믹스 처리 방식이 각 세그먼트에 대해 시간-도메인 다운믹스 처리를 수행하는 데 사용되는 것으로 이해될 수 있다. 비 세그먼트화된 시간-도메인 다운믹스 처리와 비교하여, 세그먼트화된 시간-도메인 다운믹스 처리는 인접한 프레임에 대한 채널 조합 방식이 변경될 때 더 원활한 천이를 얻을 가능성이 더 크다는 것을 이해할 수 있다.
전술한 솔루션에서, 현재 프레임에 대한 채널 조합 방식이 결정될 필요가 있으며, 이는 현재 프레임에 대한 채널 조합 방식에 대한 복수의 가능성이 있음을 나타낸다. 하나의 채널 조합 방식이 존재하는 종래의 솔루션과 비교하여, 복수의 가능한 채널 조합 방식을 갖는 이 솔루션은 복수의 가능한 시나리오와 더 잘 호환되고 매칭될 수 있다. 또한, 현재 프레임에 대한 채널 조합 방식과 이전 프레임에 대한 채널 조합 방식이 다를 때, 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하는 메커니즘이 도입된다. 세그먼트화된 시간-도메인 다운믹스 처리 메커니즘은 채널 조합 방식의 원활한 천이를 구현하고 인코딩 품질을 향상시키는 데 도움이 된다.
또한, 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식이 도입되기 때문에, 현재 프레임의 스테레오 신호가 니어 아웃 오브 페이즈 시그널일 때, 더 많은 목표 채널 조합 방식 및 코딩 모드가 있으며, 이는 인코딩 품질을 향상시키는 데 도움이 된다.
예를 들어, 이전 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식 또는 비 상관 신호 채널 조합 방식일 수 있다. 현재 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식 또는 비 상관 신호 채널 조합 방식일 수 있다. 따라서, 현재 프레임과 이전 프레임에 대한 채널 조합 방식이 다른 경우가 여러 가지 있을 수 있다.
구체적으로, 예를 들어, 이전 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식일 때, 현재 프레임에서의 좌측 및 우측 채널 신호는 좌측 및 우측 채널 신호의 시작 세그먼트, 좌측 및 우측 채널 신호의 중간 세그먼트 및 좌측 및 우측 채널 신호의 종료 세그먼트를 포함하고; 현재 프레임에서의 일차 및 이차 채널 신호는 일차 및 이차 채널 신호의 시작 세그먼트, 일차 및 이차 채널 신호의 중간 세그먼트, 및 일차 및 이차 채널 신호의 종료 세그먼트를 포함한다. 이 경우, 현재 프레임에 대한 채널 조합 방식과 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하여, 현재 프레임에서의 일차 및 이차 채널 신호를 획득하는 단계는:
이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써, 현재 프레임에서의 좌측 및 우측 채널 신호의 시작 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호의 시작 세그먼트를 획득하는 단계;
현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써, 현재 프레임에서의 좌측 및 우측 채널 신호의 종료 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호의 종료 세그먼트를 획득하는 단계; 및
이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써 현재 프레임에서의 좌측 및 우측 채널 신호의 중간 세그먼트에 대해 시간-도메인 다운믹스 처리를 수행하여 일차 및 이차 채널 신호의 제1 중간 세그먼트를 획득하고; 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써 현재 프레임에서의 좌측 및 우측 채널 신호의 중간 세그먼트에 대해 시간-도메인 다운믹스 처리를 수행하여 일차 및 이차 채널 신호의 제2 중간 세그먼트를 획득하며; 그리고 일차 및 이차 채널 신호의 제1 중간 세그먼트 및 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리를 수행하여, 현재 프레임에서의 일차 및 이차 채널 신호의 중간 세그먼트를 획득하는 단계를 포함할 수 있다.
현재 프레임에서의 좌측 및 우측 채널 신호의 시작 세그먼트, 좌측 및 우측 채널 신호의 중간 세그먼트 및 좌측 및 우측 채널 신호의 종료 세그먼트의 길이는 요구 사항에 기초하여 설정될 수 있다. 현재 프레임에서의 좌측 및 우측 채널 신호의 시작 세그먼트, 좌측 및 우측 채널 신호의 중간 세그먼트 및 좌측 및 우측 채널 신호의 종료 세그먼트의 길이는 동일할 수도 있고 부분적으로 동일할 수도 있고 서로 다를 수 있다.
현재 프레임에서의 일차 및 이차 채널 신호의 시작 세그먼트, 일차 및 이차 채널 신호의 중간 세그먼트 및 일차 및 이차 채널 신호의 종료 세그먼트의 길이는 요구 사항에 기초하여 설정될 수 있다. 현재 프레임에서의 일차 및 이차 채널 신호의 시작 세그먼트, 일차 및 이차 채널 신호의 중간 세그먼트 및 일차 및 이차 채널 신호의 종료 세그먼트의 길이는 동일할 수도 있고 부분적으로 동일할 수도 있고 서로 다를 수도 있다.
일차 및 이차 채널 신호의 제1 중간 세그먼트 및 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 일차 및 이차 채널 신호의 제1 중간 세그먼트에 대응하는 가중 계수는 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대응하는 가중 계수와 동일할 수 있거나 동일하지 않을 수 있다.
예를 들어, 일차 및 이차 채널 신호의 제1 중간 세그먼트 및 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 일차 및 이차 채널 신호의 제1 중간 세그먼트에 대응하는 가중 계수는 일차 채널 신호 및 이차 채널 신호의 제2 중간 세그먼트에 대응하는 가중 계수가 페이드-인 팩터이다.
일부 가능한 구현에서,
Figure pat00354
; 여기서
Figure pat00355
은 현재 프레임에서 일차 채널 신호의 시작 세그먼트를 나타내고,
Figure pat00356
은 현재 프레임에서 이차 채널 신호의 시작 세그먼트를 나타내고,
Figure pat00357
은 현재 프레임에서 일차 채널 신호의 종료 세그먼트를 나타내고,
Figure pat00358
은 현재 프레임에서 이차 채널 신호의 종료 세그먼트를 나타내고,
Figure pat00359
은 현재 프레임에서 일차 채널 신호의 중간 세그먼트를 나타내고,
Figure pat00360
은 현재 프레임에서 이차 채널 신호의 중간 세그먼트를 나타내고;
Figure pat00361
은 현재 프레임에서의 일차 채널 신호를 나타내고; 그리고
Figure pat00362
은 현재 프레임의 이차 채널 신호를 나타낸다.
예를 들어,
Figure pat00363
이다.
예를 들어,
Figure pat00364
은 페이드-인 팩터를 나타내고
Figure pat00365
은 페이드-아웃 팩터를 나타낸다. 예를 들어
Figure pat00366
Figure pat00367
의 합은 1이다.
구체적으로, 예를 들어,
Figure pat00368
Figure pat00369
이다. 확실히,
Figure pat00370
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다. 확실히,
Figure pat00371
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-아웃 팩터일 수 있다.
여기서, n은 샘플링 포인트 번호를 나타낸다.
Figure pat00372
, 및 0<
Figure pat00373
<
Figure pat00374
<
Figure pat00375
이다.
예를 들어
Figure pat00376
은 100, 107, 120, 150 또는 다른 값과 같다.
예를 들어
Figure pat00377
는 180, 187, 200, 203 또는 다른 값과 같다.
여기서,
Figure pat00378
은 현재 프레임에서의 일차 채널 신호의 제1 중간 세그먼트를 나타내고,
Figure pat00379
은 현재 프레임에서 이차 채널 신호의 제1 중간 세그먼트를 나타낸다.
Figure pat00380
은 현재 프레임에서의 일차 채널 신호의 제2 중간 세그먼트를 나타내고,
Figure pat00381
은 현재 프레임에서 이차 채널 신호의 제2 중간 세그먼트를 나타낸다.
일부 가능한 구현에서,
Figure pat00382
;
Figure pat00383
;
Figure pat00384
; 및
Figure pat00385
; 여기서
Figure pat00386
은 현재 프레임에서의 좌측 채널 신호를 나타내고,
Figure pat00387
은 현재 프레임에서 우측 채널 신호를 나타내고; 그리고
Figure pat00388
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pat00389
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성되고;
Figure pat00390
는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pat00391
는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pat00392
는 복수의 가능한 형태를 가질 수 있으며, 이것은 구체적으로 예를 들어:
Figure pat00393
, 또는
Figure pat00394
, 또는
Figure pat00395
, 또는
Figure pat00396
, 또는
Figure pat00397
, 또는
Figure pat00398
, 여기서
Figure pat00399
,
Figure pat00400
Figure pat00401
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pat00402
은 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pat00403
, 또는
Figure pat00404
, 여기서
Figure pat00405
는 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
구체적으로, 다른 예를 들어, 이전 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식일 때, 현재 프레임에서의 좌측 및 우측 채널 신호 좌측 및 우측 채널 신호의 시작 세그먼트, 좌측 및 우측 채널 신호의 중간 세그먼트, 및 좌측 및 우측 채널 신호의 종료 세그먼트를 포함하고; 현재 프레임에서의 일차 및 이차 채널 신호는 일차 및 이차 채널 신호의 시작 세그먼트, 일차 및 이차 채널 신호의 중간 세그먼트, 및 일차 및 이차 채널 신호의 종료 세그먼트를 포함한다. 이 경우, 현재 프레임에 대한 채널 조합 방식과 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하여, 현재 프레임에서의 일차 및 이차 채널 신호를 획득하는 단계는:
이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써, 현재 프레임에서의 좌측 및 우측 채널 신호의 시작 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호의 시작 세그먼트를 획득하는 단계;
현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써, 현재 프레임에서의 좌측 및 우측 채널 신호의 종료 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호의 종료 세그먼트를 획득하는 단계; 및
이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써, 현재 프레임에서의 좌측 및 우측 채널 신호의 중간 세그먼트에 대해 시간-도메인 다운믹스 처리를 수행하여 일차 및 이차 채널 신호의 제3 중간 세그먼트를 획득하고; 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써 현재 프레임에서의 좌측 및 우측 채널 신호의 중간 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 일차 및 이차 채널 신호의 제4 중간 세그먼트를 획득하며; 그리고 일차 및 이차 채널 신호의 제3 중간 세그먼트 및 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리를 수행하여, 현재 프레임에서의 일차 및 이차 채널 신호의 중간 세그먼트를 획득하는 단계를 포함할 수 있다.
일차 및 이차 채널 신호의 제3 중간 세그먼트 및 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 일차 및 이차 채널 신호의 제3 중간 세그먼트에 대응하는 가중 계수는 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대응하는 가중 계수와 동일할 수도 있고 동일하지 않을 수도 있다.
예를 들어, 일차 및 이차 채널 신호의 제3 중간 세그먼트 및 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 일차 및 이차 채널 신호의 제3 중간 세그먼트에 대응하는 가중 계수는 페이드-아웃 팩터이고, 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대응하는 가중 계수는 페이드-인 팩터이다.
일부 가능한 구현에서
Figure pat00406
; 여기서
Figure pat00407
은 현재 프레임에서 일차 채널 신호의 시작 세그먼트를 나타내고,
Figure pat00408
은 현재 프레임에서 이차 채널 신호의 시작 세그먼트를 나타내고,
Figure pat00409
은 현재 프레임에서 일차 채널 신호의 종료 세그먼트를 나타내고,
Figure pat00410
은 현재 프레임에서 이차 채널 신호의 종료 세그먼트를 나타내고,
Figure pat00411
은 현재 프레임에서 일차 채널 신호의 중간 세그먼트를 나타내고,
Figure pat00412
은 현재 프레임에서 이차 채널 신호의 중간 세그먼트를 나타내고;
Figure pat00413
은 현재 프레임에서의 일차 채널 신호를 나타내고; 그리고
Figure pat00414
은 현재 프레임의 이차 채널 신호를 나타낸다.
여기서, 예를 들어,
Figure pat00415
이고,
Figure pat00416
은 페이드-인 팩터를 나타내고
Figure pat00417
은 페이드-아웃 팩터를 나타내며
Figure pat00418
Figure pat00419
의 합은 1이다.
구체적으로, 예를 들어;
Figure pat00420
Figure pat00421
이다. 확실히,
Figure pat00422
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다. 확실히,
Figure pat00423
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-아웃 팩터일 수 있다.
여기서, n은 샘플링 포인트 번호를 나타낸다. 예를 들면,
Figure pat00424
이다.
여기서 0<
Figure pat00425
<
Figure pat00426
<
Figure pat00427
이다.
예를 들어
Figure pat00428
은 101, 107, 120, 150 또는 다른 값과 같다.
예를 들어
Figure pat00429
는 181, 187, 200, 205 또는 다른 값과 같다.
Figure pat00430
은 현재 프레임에서의 일차 채널 신호의 제3 중간 세그먼트를 나타내고,
Figure pat00431
은 현재 프레임에서 이차 채널 신호의 제3 중간 세그먼트를 나타낸다.
Figure pat00432
은 현재 프레임에서의 일차 채널 신호의 제4 중간 세그먼트를 나타내고,
Figure pat00433
은 현재 프레임에서 이차 채널 신호의 제4 중간 세그먼트를 나타낸다.
일부 가능한 구현에서,
Figure pat00434
;
Figure pat00435
;
Figure pat00436
; 및
Figure pat00437
; 여기서
Figure pat00438
은 현재 프레임의 좌측 채널 신호를 나타내고
Figure pat00439
은 현재 프레임의 우측 채널 신호를 나타낸다.
Figure pat00440
는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pat00441
는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pat00442
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pat00443
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pat00444
는 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pat00445
, 또는
Figure pat00446
, 또는
Figure pat00447
, 또는
Figure pat00448
, 또는
Figure pat00449
, 또는
Figure pat00450
, 여기서
Figure pat00451
, and
Figure pat00452
; and
Figure pat00453
, 및
Figure pat00454
; 그리고
Figure pat00455
은 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pat00456
은 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pat00457
, 또는
Figure pat00458
, 여기서
Figure pat00459
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
일부 가능한 구현들에서, 현재 프레임에서의 좌측 및 우측 채널 신호는 예를 들어 현재 프레임에서의 최초의 좌측 및 우측 채널 신호일 수 있거나, 시간-도메인 전처리를 거친 좌측 및 우측 채널 신호일 수 있고, 지연 정렬 처리를 거친 좌측 및 우측 채널 신호일 수 있다.
구체적으로, 예를 들어,
Figure pat00460
, 또는
Figure pat00461
, 또는
Figure pat00462
, 여기서
Figure pat00463
은 현재 프레임의 원래 좌측 채널 신호를 나타내고(원래의 좌측 채널 신호는 시간-도메인 전처리를 거치지 않은 좌측 채널 신호이다),
Figure pat00464
은 현재 프레임의 원래의 우측 채널 신호를 나타내며(원래의 우측 채널 신호는 시간-도메인 전처리를 거치지 않은 우측 채널 신호이다); 그리고
Figure pat00465
는 현재 프레임에서 시간-도메인 전처리를 거친 좌측 채널 신호를 나타내고,
Figure pat00466
는 현재 프레임에서 시간-도메인 전처리를 거친 우측 채널 신호를 나타낸다.
Figure pat00467
은 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 신호를 나타내고, 현재
Figure pat00468
은 프레임에서 지연 정렬 처리를 거친 우측 채널 신호를 나타낸다.
전술한 예에서의 세그먼트화된 시간-도메인 다운믹스 처리 방식은 모든 가능한 구현이 아닐 수 있으며, 실제 응용에서는 다른 세그먼트화된 시간-도메인 다운믹스 처리 방식이 사용될 수도 있음을 이해할 수 있다.
이에 대응하여, 다음은 상관-비상관 신호 디코딩 스위칭 모드 및 비상관-상관 신호 디코딩 스위칭 모드에 대한 시나리오를 설명하기 위해 예를 사용한다. 상관-비상관 신호 디코딩 스위칭 모드 및 비상관-상관 신호 디코딩 스위칭 모드에 대응하는 시간-도메인 다운믹스 처리 방식은 예를 들어 세그먼트화된 시간-도메인 다운믹스 처리 방식이다.
도 7을 참조하여, 본 출원의 실시예는 오디오 디코딩 방법을 제공한다. 오디오 디코딩 방법의 관련 단계는 디코딩 장치에 의해 구현될 수 있으며, 방법은 구체적으로 다음 단계를 포함할 수 있다.
701. 비트스트림에 기초하여 디코딩을 수행하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호를 획득한다.
702. 현재 프레임에 대한 채널 조합 방식을 결정한다.
단계(701) 및 단계(702)를 수행하기 위해 시퀀스가 존재하지 않는 것으로 이해될 수 있다.
703. 현재 프레임에 대한 채널 조합 방식이 이전 프레임에 대한 채널 조합 방식과 다를 때, 현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 세그먼트화된 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 얻는다.
현재 프레임에 대한 채널 조합 방식은 복수의 채널 조합 방식 중 하나이다.
예를 들어, 복수의 채널 조합 방식은 비 상관성 신호 채널 조합 방식 및 상관 신호 채널 조합 방식을 포함한다. 상관 신호 채널 조합 방식은 니어 인 페이즈 시그널에 대응하는 채널 조합 방식이다. 비 상관 신호 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식이다. 니어 인 페이즈 시그널에 대응하는 채널 조합 방식은 니어 인 페이즈 시그널에 적용 가능하고, 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 적용 가능하다는 것을 이해할 수 있다.
세그먼트화된 시간-도메인 업믹스 처리는 현재 프레임에서의 좌측 및 우측 채널 신호가 적어도 2개의 세그먼트로 분할되고, 다른 시간-도메인 업믹스 처리 방식이 각 세그먼트에 대해 시간-도메인 업믹스 처리를 수행하는 데 사용되는 것으로 이해될 수 있다. 비 세그먼트화된 시간-도메인 업믹스 처리와 비교하여, 세그먼트화된 시간-도메인 업믹스 처리는 인접한 프레임에 대한 채널 조합 방식이 변경될 때 더 원활한 천이를 얻을 가능성이 더 크다는 것을 이해할 수 있다.
전술한 솔루션에서, 현재 프레임에 대한 채널 조합 방식이 결정될 필요가 있으며, 이는 현재 프레임에 대한 채널 조합 방식에 대한 복수의 가능성이 있음을 나타낸다. 하나의 채널 조합 방식이 존재하는 종래의 솔루션과 비교하여, 복수의 가능한 채널 조합 방식을 갖는 이 솔루션은 복수의 가능한 시나리오와 더 잘 호환되고 매칭될 수 있다. 또한, 현재 프레임에 대한 채널 조합 방식과 이전 프레임에 대한 채널 조합 방식이 다를 때, 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 업믹스 처리를 수행하는 메커니즘이 도입된다. 세그먼트화된 시간-도메인 업믹스 처리 메커니즘은 채널 조합 방식의 원활한 천이를 구현하고 인코딩 품질을 향상시키는 데 도움이 된다.
또한, 근사한 위상 신호에 대응하는 채널 조합 방식이 도입되기 때문에, 현재 프레임의 스테레오 신호가 위상 이외의 신호일 때, 더 많은 목표 채널 조합 방식 및 코딩 모드가 있으며, 이는 인코딩 품질을 향상시키는 데 도움이 된다.
예를 들어, 이전 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식 또는 비 상관 신호 채널 조합 방식일 수 있다. 현재 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식 또는 비 상관 신호 채널 조합 방식일 수 있다. 따라서, 현재 프레임과 이전 프레임에 대한 채널 조합 방식이 다른 경우가 여러 가지 있을 수 있다.
구체적으로, 예를 들어, 이전 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식은 비 상관 신호 채널 조합 방식이다. 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호는 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트, 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트, 및 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트를 포함한다. 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호는 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트, 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트, 및 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트를 포함한다. 이 경우, 현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 세그먼트화된 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계는: 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트를 획득하는 단계;
현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써, 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트를 획득하는 단계; 및
이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써, 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트를 획득하고; 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트를 획득하며; 그리고 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트를 획득하기 위해, 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리를 수행하는 단계를 포함한다.
재구성된 좌측 및 우측 채널 신호의 시작 세그먼트, 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트 및 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트의 길이는 요구 사항에 기초하여 설정될 수 있다. 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트, 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트의 길이는 동일할 수도 있고 부분적으로 동일할 수도 있고 서로 다를 수도 있다.
디코딩된 일차 및 이차 채널 신호의 시작 세그먼트, 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트, 및 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트의 길이는 요구 사항에 기초하여 설정될 수 있다. 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트, 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트, 및 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트의 길이는 동일할 수도 있고 부분적으로 동일할 수도 있고 서로 다를 수도 있다.
재구성된 좌측 및 우측 채널 신호는 디코딩된 좌측 및 우측 채널 신호일 수 있거나, 지연 조정 처리 및/또는 시간-도메인 후처리가 디코딩된 좌측 및 우측 채널 신호를 획득하기 위해 재구성된 좌측 및 우측 채널 신호에 대해 수행될 수 있다.
재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트에 대응하는 가중 계수는 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대응하는 가중 계수와 동일할 수도 있고 동일하지 않을 수도 있다
예를 들어, 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트에 대응하는 가중 계수는 페이드-아웃 팩터이고, 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대응하는 가중 계수는 페이드-인 팩터이다.
일부 가능한 구현에서
Figure pat00469
; 여기서
Figure pat00470
은 현재 프레임에서의 재구성된 좌측 채널 신호의 시작 세그먼트를 나타내고,
Figure pat00471
은 현재 프레임에서의 재구성된 우측 채널 신호의 시작 세그먼트를 나타낸다.
Figure pat00472
은 현재 프레임에서의 재구성된 좌측 채널 신호의 종료 세그먼트를 나타내고,
Figure pat00473
은 현재 프레임에서의 재구성된 우측 채널 신호의 종료 세그먼트를 나타낸다.
Figure pat00474
은 현재 프레임에서의 재구성된 좌측 채널 신호의 중간 세그먼트를 나타내고,
Figure pat00475
은 현재 프레임에서의 재구성된 우측 채널 신호의 중간 세그먼트를 나타내고;
Figure pat00476
은 현재 프레임에서의 재구성된 좌측 채널 신호를 나타내고; 그리고
Figure pat00477
은 현재 프레임에서의 재구성된 우측 채널 신호를 나타낸다.
예를 들면,
Figure pat00478
이다.
예를 들어,
Figure pat00479
은 페이드-인 팩터를 나타내고
Figure pat00480
은 페이드-아웃 팩터를 나타낸다. 예를 들어
Figure pat00481
Figure pat00482
의 합은 1이다.
구체적으로, 예를 들어,
Figure pat00483
Figure pat00484
이다. 확실히,
Figure pat00485
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다. 확실히,
Figure pat00486
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-아웃 팩터일 수 있다.
여기서, n은 샘플링 포인트 번호를 나타내고,
Figure pat00487
이다. 여기서 0<
Figure pat00488
<
Figure pat00489
<
Figure pat00490
이다.
Figure pat00491
은 현재 프레임에서의 재구성된 좌측 채널 신호의 제1 중간 세그먼트를 나타내고,
Figure pat00492
은 현재 프레임에서의 재구성된 우측 채널 신호의 제1 중간 세그먼트를 나타낸다.
Figure pat00493
은 현재 프레임에서의 재구성된 좌측 채널 신호의 제2 중간 세그먼트를 나타내고,
Figure pat00494
은 현재 프레임에서의 재구성된 우측 채널 신호의 제2 중간 세그먼트를 나타낸다.
일부 가능한 구현에서,
Figure pat00495
;
Figure pat00496
;
Figure pat00497
; 및
Figure pat00498
; 여기서
Figure pat00499
은 현재 프레임에서의 디코딩된 일차 채널 신호를 나타내고,
Figure pat00500
은 현재 프레임에서 디코딩된 이차 채널 신호를 나타내고; 그리고
Figure pat00501
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
Figure pat00502
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성되고;
Figure pat00503
는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내며,
Figure pat00504
는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pat00505
은 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pat00506
, 또는
Figure pat00507
, 또는
Figure pat00508
, 또는
Figure pat00509
, 또는
Figure pat00510
, 또는
Figure pat00511
, 여기서
Figure pat00512
,
Figure pat00513
Figure pat00514
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pat00515
는 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pat00516
, 또는
Figure pat00517
여기서,
Figure pat00518
는 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
구체적으로, 다른 예에서, 이전 프레임에 대한 채널 조합 방식은 비 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식이다. 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호는 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트, 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트, 및 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트를 포함한다. 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호는 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트, 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트, 및 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트를 포함한다. 이 경우, 현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 세그먼트화된 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계는:
이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트를 획득하는 단계;
현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써, 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트를 획득하는 단계; 및
이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써, 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트를 획득하고; 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트를 획득하며; 그리고 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트를 획득하기 위해, 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리를 수행하는 단계를 포함한다.
재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트에 대응하는 가중 계수 제1 채널은 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대응하는 가중 계수와 동일할 수도 있고 동일하지 않을 수도 있다
예를 들어, 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트에 대응하는 가중 계수는 페이드-아웃 팩터이고, 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대응하는 가중 계수는 페이드-인 팩터이다.
일부 가능한 구현에서
Figure pat00519
; 여기서
Figure pat00520
은 현재 프레임에서 재구성된 좌측 채널 신호의 시작 세그먼트를 나타내고,
Figure pat00521
은 현재 프레임에서 재구성된 우측 채널 신호의 시작 세그먼트를 나타내고,
Figure pat00522
은 현재 프레임에서 재구성된 좌측 채널 신호의 종료 세그먼트를 나타내고,
Figure pat00523
은 현재 프레임에서 재구성된 우측 채널 신호의 종료 세그먼트를 나타내고,
Figure pat00524
은 현재 프레임에서 재구성된 좌측 채널 신호의 중간 세그먼트를 나타내고,
Figure pat00525
은 현재 프레임에서 재구성된 우측 채널 신호의 중간 세그먼트를 나타내고,
Figure pat00526
은 현재 프레임에서의 재구성된 좌측 채널 신호를 나타내고; 그리고
Figure pat00527
은 현재 프레임에서의 재구성된 우측 채널 신호를 나타낸다.
예를 들면,
Figure pat00528
이다.
Figure pat00529
은 페이드-인 팩터를 나타내고
Figure pat00530
은 페이드-아웃 팩터를 나타내며
Figure pat00531
Figure pat00532
의 합은 1이다.
구체적으로, 예를 들어,
Figure pat00533
Figure pat00534
이다. 확실히,
Figure pat00535
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다. 확실히,
Figure pat00536
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-아웃 팩터일 수 있다.
여기서, n은 샘플링 포인트 번호를 나타낸다. 예를 들면,
Figure pat00537
이다.
여기서 0<
Figure pat00538
<
Figure pat00539
<
Figure pat00540
이다.
예를 들어
Figure pat00541
은 101, 107, 120, 150 또는 다른 값과 같다.
예를 들어
Figure pat00542
는 181, 187, 200, 205 또는 다른 값과 같다.
Figure pat00543
은 현재 프레임에서의 재구성된 좌측 채널 신호의 제3 중간 세그먼트를 나타내고,
Figure pat00544
은 현재 프레임에서의 재구성된 우측 채널 신호의 제3 중간 세그먼트를 나타낸다.
Figure pat00545
는 현재 프레임에서의 재구성된 좌측 채널 신호의 제4 중간 세그먼트를 나타내고,
Figure pat00546
는 현재 프레임에서의 재구성된 우측 채널 신호의 제4 중간 세그먼트를 나타낸다.
일부 가능한 구현에서,
Figure pat00547
;
Figure pat00548
;
Figure pat00549
; 및
Figure pat00550
; 여기서
Figure pat00551
은 현재 프레임에서의 디코딩된 일차 채널 신호를 나타내고,
Figure pat00552
은 현재 프레임에서 디코딩된 이차 채널 신호를 나타낸다.
Figure pat00553
는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
Figure pat00554
는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pat00555
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
Figure pat00556
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pat00557
는 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pat00558
, 또는
Figure pat00559
, 또는
Figure pat00560
, 또는
Figure pat00561
, 또는
Figure pat00562
, 또는
Figure pat00563
, 여기서
Figure pat00564
, 및
Figure pat00565
; 그리고
Figure pat00566
은 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pat00567
은 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pat00568
, 또는
Figure pat00569
, 여기서
Figure pat00570
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
본 출원의 이 실시예에서, 현재 프레임의 스테레오 파라미터(예를 들어, 채널 조합 비율 팩터 및/또는 채널 간 시간 차이)는 고정된 값일 수 있거나, 또는 현재 프레임에 대한 채널 조합 방식(예를 들어, 상관 신호 채널 조합 방식 또는 비 상관 신호 채널 조합 방식)에 기초하여 결정될 수 있다.
도 8을 참조하여, 다음은 시간-도메인 스테레오 파라미터 결정 방법을 설명하기 위해 예를 사용한다. 시간-도메인 스테레오 파라미터 결정 방법의 관련 단계는 인코딩 장치에 의해 구현될 수 있고, 이 방법은 구체적으로 다음 단계를 포함할 수 있다.
801. 현재 프레임에 대한 채널 조합 방식을 결정한다.
802. 현재 도메인에 대한 채널 조합 방식에 기초하여 현재 프레임의 시간-도메인 스테레오 파라미터를 결정하고, 여기서 시간-도메인 스테레오 파라미터는 채널 조합 비율 팩터 및 채널 간 시간 차이 중 적어도 하나를 포함한다.
현재 프레임에 대한 채널 조합 방식은 복수의 채널 조합 방식 중 하나이다.
예를 들어, 복수의 채널 조합 방식은 비 상관성 신호 채널 조합 방식 및 상관 신호 채널 조합 방식을 포함한다.
상관 신호 채널 조합 방식은 근거리 신호에 대응하는 채널 조합 방식이다. 비 상관 신호 채널 조합 방식은 위상이 거의 없는 신호에 대응하는 채널 조합 방식이다. 니어 인 페이즈 시그널에 대응하는 채널 조합 방식은 니어 인 페이즈 시그널에 적용 가능하고, 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 적용 가능하다는 것을 이해할 수 있다.
현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식인 것으로 결정될 때, 현재 프레임의 시간-도메인 스테레오 파라미터는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터이거나; 또는 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식인 것으로 결정될 때, 현재 프레임의 시간-도메인 스테레오 파라미터는 현재 프레임에 대한 비 상관성 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터이다.
전술한 솔루션에서, 현재 프레임에 대한 채널 조합 방식이 결정될 필요가 있으며, 이는 현재 프레임에 대한 채널 조합 방식에 대한 복수의 가능성이 있음을 나타낸다. 하나의 채널 조합 방식이 존재하는 종래의 솔루션과 비교하여, 복수의 가능한 채널 조합 방식을 갖는 이 솔루션은 복수의 가능한 시나리오와 더 잘 호환되고 매칭될 수 있다. 현재 프레임의 시간-도메인 스테레오 파라미터는 현재 프레임에 대한 채널 조합 방식에 기초하여 결정되기 때문에, 시간-도메인 스테레오 파라미터는 복수의 가능한 시나리오와 더 잘 호환될 수 있고, 인코딩 및 디코딩 품질이 더 개선될 수 있다.
일부 가능한 구현들에서, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터와 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터는 먼저 개별적으로 계산될 수 있다. 그런 다음, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식인 것으로 결정될 때, 현재 프레임의 시간-도메인 스테레오 파라미터는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터인 것으로 결정되거나; 또는 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식인 것으로 결정될 때, 현재 프레임의 시간-도메인 스테레오 파라미터는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터인 것으로 결정된다. 대안적으로, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터가 먼저 계산될 수 있고, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식인 것으로 결정될 때, 현재 프레임의 시간-도메인 스테레오 파라미터가 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터인 것으로 결정되거나, 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식인 것으로 결정될 때, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터가 계산되고, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터가 현재 프레임의 시간-도메인 스테레오 파라미터 로서 결정된다.
대안적으로, 현재 프레임에 대한 채널 조합 방식이 먼저 결정될 수 있다. 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식인 것으로 결정될 때, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터가 계산되고, 현재 프레임의 시간-도메인 스테레오 파라미터는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터이거나; 또는 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식인 것으로 결정될 때, 현재 프레임에 대한 비 상관성 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터가 계산되고, 현재 프레임의 시간-도메인 스테레오 파라미터는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터이다.
일부 가능한 구현들에서, 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 시간-도메인 스테레오 파라미터를 결정하는 단계는: 현재 프레임에 대한 채널 조합 방식에 기초하여, 현재 프레임에 대한 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값을 결정하는 단계를 포함할 수 있다. 현재 프레임에 대한 채널 조합 방식(상관 신호 채널 조합 방식 또는 비 상관 신호 채널 조합 방식)에 대응하는 채널 조합 비율 팩터의 초기 값이 수정될 필요가 없는 경우, 현재 프레임에 대한 채널 조합 방식에 대응하는 채널 조합 비율 팩터는 현재 프레임에 대한 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값과 동일하다. 현재 프레임에 대한 채널 조합 방식(상관 신호 채널 조합 방식 또는 비 상관 신호 채널 조합 방식)에 대응하는 채널 조합 비율 팩터의 초기 값을 수정해야 하는 경우, 현재 프레임에 대한 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값이 수정되어, 현재 프레임에 대한 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값을 획득하며, 현재 프레임에 대한 채널 조합 방식에 대응하는 채널 조합 비율 팩터는 현재 프레임에 대한 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값과 동일하다.
예를 들어, 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 시간-도메인 스테레오 파라미터를 결정하는 단계는: 현재 프레임의 좌측 채널 신호에 기초하여 현재 프레임에서의 좌측 채널 신호의 프레임 에너지를 계산하는 단계; 현재 프레임의 우측 채널 신호에 기초하여 현재 프레임의 우측 채널 신호의 프레임 에너지를 계산하는 단계; 및 현재 프레임의 좌측 채널 신호의 프레임 에너지 및 현재 프레임에서의 우측 채널 신호의 프레임 에너지에 기초하여 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값을 계산하는 단계를 포함한다.
현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값이 수정될 필요가 없는 경우, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값과 동일하고, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값과 동일하다.
현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값이 수정될 필요가 있을 때, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값 및 초기 값의 인코딩된 인덱스가 수정되어, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값 및 수정된 값의 인코딩된 인덱스를 획득한다. 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값과 동일하고, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값의 인코딩된 인덱스와 동일하다.
구체적으로, 예를 들어, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값 및 초기 값의 인코딩된 인덱스가 수정될 때,
Figure pat00571
; 및
Figure pat00572
; 여기서
Figure pat00573
는 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스를 나타내고;
Figure pat00574
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값에 대응하는 인코딩된 인덱스를 나타내고; 그리고
Figure pat00575
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값을 나타낸다.
다른 예를 들어, 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 시간-도메인 스테레오 파라미터를 결정하는 단계는: 현재 프레임의 좌측 채널 신호 및 우측 채널 신호에 기초하여 현재 프레임의 참조 채널 신호를 획득하는 단계; 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 진폭 상관 파라미터를 계산하는 단계; 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 진폭 상관 파라미터를 계산하는 단계; 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 진폭 상관 파라미터 및 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 진폭 상관 파라미터에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터를 계산하는 단계; 및 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터에 기초하여, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 단계를 포함한다.
현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터에 기초하여, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 단계는 예를 들어: 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터에 기초하여 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값을 계산하는 단계; 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 획득하기 위해, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값을 수정하는 단계를 포함한다. 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값이 수정될 필요가 없을 때, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값과 동일하다는 것을 이해할 수 있다.
일부 가능한 구현에서
Figure pat00576
; 및
Figure pat00577
; 여기서
Figure pat00578
;
Figure pat00579
;
Figure pat00580
은 현재 프레임에서 참조 채널 신호를 나타내고; 그리고
Figure pat00581
은 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 신호를 나타내고,
Figure pat00582
은 현재 프레임에서 지연 정렬 처리를 거친 우측 채널 신호를 나타내며,
Figure pat00583
은 현재 프레임에서 좌측 채널 신호와 참조 채널 신호 사이의 진폭 상관 파라미터를 나타내며,
Figure pat00584
은 현재 프레임에서 우측 채널 신호와 참조 채널 신호 사이의 진폭 상관 파라미터를 나타낸다.
일부 가능한 구현들에서, 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 진폭 상관 파라미터 및 현재 프레임에서의 우측 채널 신호 및 참조 채널 신호 사이의 진폭 상관 파라미터에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터를 계산하는 단계는: 지연 정렬 처리를 거친 좌측 채널 신호와 현재 프레임의 참조 채널 신호 사이의 진폭 상관 파라미터에 기초하여 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 계산하는 단계; 지연 정렬 처리를 거친 우측 채널 신호와 현재 프레임의 참조 채널 신호 사이의 진폭 상관 파라미터에 기초하여 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 계산하는 단계; 및 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터 및 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터에 기초하여 현재 프레임에서의 좌측 및 우측 채널 사이의 진폭 상관 차이 파라미터를 계산하는 단계를 포함한다.
예를 들어 다양한 평활화 방식이 있을 수 있다.
Figure pat00585
; 여기서
Figure pat00586
이고, A는 현재 프레임에서의 좌측 채널 신호의 장기 평활화 프레임 에너지의 업데이트 팩터를 나타내고,
Figure pat00587
은 현재 프레임에서의 좌측 채널 신호의 장기 평활화 프레임 에너지를 나타내고,
Figure pat00588
은 현재 프레임의 좌측 채널 신호의 프레임 에너지를 나타내고,
Figure pat00589
은 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 나타내고,
Figure pat00590
은 이전 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 나타내며,
Figure pat00591
는 좌측 채널 평활화 팩터를 나타낸다.
예를 들어,
Figure pat00592
이고; 여기서
Figure pat00593
이고, B는 현재 프레임에서 우측 채널 신호의 장기 평활화 프레임 에너지의 업데이트 팩터를 나타내고,
Figure pat00594
는 현재 프레임에서 우측 채널 신호의 장기 평활화 프레임 에너지를 나타내고,
Figure pat00595
은 우측 채널 신호의 프레임 에너지를 나타내고,
Figure pat00596
은 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 나타내고,
Figure pat00597
는 이전 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 나타내며,
Figure pat00598
는 우측 채널 평활화 팩터를 나타낸다.
일부 가능한 구현에서,
Figure pat00599
; 여기서
Figure pat00600
은 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 나타내고,
Figure pat00601
은 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화된 진폭 상관 파라미터를 나타내고,
Figure pat00602
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터를 나타낸다.
일부 가능한 구현들에서, 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터에 기초하여, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 단계는: 현재 프레임에서의 좌측 및 우측 채널 신호 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터의 값 범위가
Figure pat00603
가 될 수 있도록 하기 위해 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터에 대해 맵핑 처리를 수행하는 단계; 및 좌측 및 우측 채널 신호 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터를 채널 조합 비율 팩터로 변환하는 단계를 포함한다.
일부 가능한 구현들에서, 현재 프레임에서의 좌측 채널 및 우측 채널 사이의 진폭 상관 차이 파라미터에 대한 맵핑 처리를 수행하는 단계는: 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터에 대한 진폭 제한을 수행하는 단계; 및 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭-제한된 진폭 상관 차이 파라미터에 대한 맵핑 처리를 수행하는 단계를 포함한다.
다양한 진폭 제한 방식이 있을 수 있으며, 구체적으로 예를 들면:
Figure pat00604
이고, 여기서
Figure pat00605
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭-제한 진폭 상관 차이 파라미터의 최댓값을 나타내고,
Figure pat00606
은 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭-제한 진폭 상관 차이 파라미터의 최솟값을 나타내며,
Figure pat00607
이다.
구체적으로 예를 들어, 다양한 맵핑 처리 방식이 있을 수 있다:
Figure pat00608
; 여기서
Figure pat00609
;
Figure pat00610
또는
Figure pat00611
;
Figure pat00612
;
Figure pat00613
또는
Figure pat00614
;
Figure pat00615
;
Figure pat00616
또는
Figure pat00617
;
Figure pat00618
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터를 나타내고;
Figure pat00619
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터의 최댓값을 나타내고,
Figure pat00620
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터의 높은 임계치를 나타내고,
Figure pat00621
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터의 낮은 임계치를 나타내고,
Figure pat00622
은 현재 프레임에서의 좌측 및 우측 채널 신호 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터의 최솟값을 나타내며;
Figure pat00623
;
Figure pat00624
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭-제한 진폭 상관 차이 파라미터의 최댓값을 나타내고,
Figure pat00625
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이에 있는 진폭-제한 진폭 상관 차이 파라미터의 높은 임계치를 나타내고,
Figure pat00626
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이에 있는 진폭-제한 진폭 상관 차이 파라미터의 낮은 임계 값을 나타내고,
Figure pat00627
은 현재 프레임에서의 좌측 및 우측 채널 신호 사이에 있는 진폭-제한 진폭 상관 차이 파라미터의 최솟값을 나타내고; 그리고
Figure pat00628
.
다른 예를 들면,
Figure pat00629
; 여기서
Figure pat00630
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭-제한 진폭 상관 차이 파라미터를 나타내고,
Figure pat00631
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터를 나타내고;
Figure pat00632
; 그리고
Figure pat00633
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터의 최대 진폭을 나타내고,
Figure pat00634
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터의 최소 진폭을 나타낸다.
일부 가능한 구현에서,
Figure pat00635
, 여기서
Figure pat00636
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터를 나타내고;
Figure pat00637
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타내거나,
Figure pat00638
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값을 나타낸다.
본 출원의 일부 구현들에서, 채널 조합 비율 팩터가 수정될 필요가 있는 시나리오에서, 채널 조합 비율 팩터가 인코딩되기 전후에 수정이 수행될 수도 있다.
구체적으로, 예를 들어, 현재 프레임에 대한 채널 조합 비율 팩터(예를 들어, 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 또는 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터)의 초기 값이 먼저 계산을 통해 획득될 수 있고, 이어서 채널 조합 비율 팩터의 초기 값이 인코딩되어 현재 프레임의 채널 조합 비율 팩터의 초기 인코딩된 인덱스를 획득하며, 현재 프레임의 채널 조합 비율 팩터의 획득된 초기 인코딩된 인덱스가 수정되어 현재 프레임의 채널 조합 비율 팩터의 인코딩된 인덱스를 획득된다(현재 프레임의 채널 조합 비율 팩터의 인코딩된 인덱스를 획득하는 것은 현재 프레임의 채널 조합 비율 팩터를 얻는 것과 동일하다). 대안적으로, 현재 프레임의 채널 조합 비율 팩터의 초기 값이 먼저 계산을 통해 획득될 수 있고, 이어서 계산을 통해 획득된 현재 프레임의 채널 조합 비율 팩터의 초기 값이 수정되어 현재 프레임의 채널 조합 비율 팩터를 획득하며, 현재 프레임의 획득된 채널 조합 비율 팩터는 현재 프레임의 채널 조합 비율 팩터의 인코딩된 인덱스를 획득하기 위해 인코딩된다.
현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값을 수정하는 다양한 방식이 있다. 예를 들어, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값이 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 획득하기 위해 수정될 필요가 있을 때, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값은 이전 프레임의 채널 조합 비율 팩터 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값에 기초하여 수정될 수 있거나; 또는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값에 기초하여 수정될 수 있다.
예를 들어, 먼저, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값이 수정될 필요가 있는지는 현재 프레임의 좌측 채널 신호의 장기 평활화 프레임 에너지, 현재 프레임에서의 우측 채널 신호의 장기 평활화 프레임 에너지, 현재 프레임에서의 좌측 채널 신호의 프레임 간 에너지 차이, 히스토리 버퍼에서의 이전 프레임의 버퍼링된 인코딩 파라미터(예를 들어, 일차 채널 신호의 프레임 간 상관 및 이차 채널 신호의 프레임 간 상관), 현재 프레임 및 이전 프레임의 채널 조합 방식 플래그, 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터, 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값에 기초하여 판정된다. 수정될 필요가 있으면, 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터가 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터로서 사용되며; 그렇지 않으면, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값이 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터로서 사용된다.
확실히, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 획득하기 위해 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값을 수정하는 특정 구현은 전술한 예에 제한되지 않는다.
803. 현재 프레임의 결정된 시간-도메인 스테레오 파라미터를 인코딩한다.
일부 가능한 구현들에서, 양자화 인코딩은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 결정된 채널 조합 비율 팩터에 대해 수행되고,
Figure pat00639
; 여기서
Figure pat00640
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 대해 스칼라 양자화를 수행하기 위한 코드북을 나타내고;
Figure pat00641
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 인코딩된 인덱스를 나타내고;
Figure pat00642
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 양자화 인코딩된 초기 값을 나타낸다.
일부 가능한 구현에서,
Figure pat00643
, and ,
Figure pat00644
, 여기서
Figure pat00645
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타내고,
Figure pat00646
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스를 나타내거나; 또는
Figure pat00647
, 및,
Figure pat00648
, 여기서
Figure pat00649
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 초기 인코딩된 인덱스를 나타내고;
Figure pat00650
은 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 최종 인코딩된 인덱스를 나타내고;
Figure pat00651
는 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정 팩터이고; 그리고
Figure pat00652
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
일부 가능한 구현들에서, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 획득하기 위해 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값이 수정될 필요가 있을 때, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값에 대해 양자화 인코딩이 먼저 수행되어 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 인코딩된 인덱스를 획득할 수 있고; 그런 다음 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 인코딩된 인덱스는 이전 프레임의 채널 조합 비율 팩터의 인코딩된 인덱스 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 인코딩된 인덱스에 기초하여 수정될 수 있거나; 또는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 인코딩된 인덱스는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 인코딩된 인덱스에 기초하여 수정될 수도 있다.
예를 들어, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 초기 인코딩된 인덱스를 획득하기 위해 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값에 대해 양자화 인코딩이 먼저 수행될 수도 있다. 그런 다음, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값을 수정해야 할 때, 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스로서 사용되며; 그렇지 않으면, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 인코딩된 인덱스는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스로서 사용된다. 마지막으로, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스에 대응하는 양자화 인코딩된 값이 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터로서 사용된다.
또한, 시간-도메인 스테레오 파라미터가 채널 간 시간 차이를 포함하는 경우, 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 시간-도메인 스테레오 파라미터를 결정하는 단계는: 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식일 때 현재 프레임의 채널 간 시간 차이를 계산하는 단계를 포함할 수 있다. 또한, 계산을 통해 획득된 현재 프레임의 채널 간 시간 차이는 비트스트림에 기록될 수 있다. 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식일 때, 현재의 프레임의 채널 간 시간 차이로서 디폴트 채널 간 시간 차이(예를 들어, 0)가 사용된다. 또한, 디폴트 채널 간 시간 차이는 비트스트림에 기록되지 않을 수 있고, 디코딩 장치는 또한 디폴트 채널 간 시간 차이를 사용한다.
다음은 예를 사용하여 시간-도메인 스테레오 파라미터 인코딩 방법을 추가로 제공한다. 방법은 예를 들어: 현재 프레임에 대한 채널 조합 방식을 결정하는 단계; 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 시간-도메인 스테레오 파라미터를 결정하는 단계; 및 현재 프레임의 결정된 시간-도메인 스테레오 파라미터를 인코딩하는 단계를 포함하며, 상기 시간-도메인 스테레오 파라미터는 채널 조합 비율 팩터 및 채널 간 시간 차이 중 적어도 하나를 포함한다.
이에 상응해서, 디코딩 장치는 비트스트림으로부터 현재 프레임의 시간-도메인 스테레오 파라미터를 획득하고, 비트스트림으로부터 획득된 현재 프레임의 시간-도메인 스테레오 파라미터에 기초하여 관련 디코딩을 추가로 수행할 수 있다.
다음은 보다 구체적인 응용 시나리오를 참조하여 예를 사용하여 설명한다.
도 9a는 본 출원의 실시예에 따른 오디오 인코딩 방법의 개략적인 흐름도이다. 본 출원의 이 실시예에서 제공되는 오디오 인코딩 방법은 인코딩 장치에 의해 구현될 수 있고, 이 방법은 구체적으로 다음 단계들을 포함할 수 있다.
901. 현재 프레임에서 원래의 좌측 및 우측 채널 신호에 대해 시간-도메인 전처리를 수행한다.
예를 들어, 스테레오 오디오 신호의 샘플링 레이트가 16 KHz 인 경우, 한 프레임의 신호는 20ms이고, 프레임 길이는 N으로 표시되며, N = 320 인 경우, 프레임 길이는 320개의 샘플링 포인트임을 나타낸다. 현재 프레임의 스테레오 신호는 현재 프레임에서의 좌측 채널 신호 및 현재 프레임의 우측 채널 신호를 포함한다. 현재 프레임에서 원래의 좌측 채널 신호는
Figure pat00653
로 표시되고, 현재 프레임에서 원래의 우측 채널 신호는
Figure pat00654
로 표시되고, n은 샘플링 포인트 수이며, 및
Figure pat00655
이다.
예를 들어, 현재 프레임에서의 원래의 좌측 및 우측 채널 신호에 대해 시간-도메인 전처리를 수행하는 단계는: 현재 프레임에서의 원래의 좌측 및 우측 채널 신호에 대해 고역 통과 필터링 처리를 수행하여 현재 프레임에서 시간-도메인 전처리를 거친 좌측 및 우측 채널 신호를 획득하는 단계를 포함할 수 있고, 현재 프레임에서 시간-도메인 전처리를 거친 좌측 채널 신호는
Figure pat00656
로 표시되고, 현재 프레임에서 시간-도메인 전처리를 거친 우측 채널 신호는
Figure pat00657
로 표시된다. 여기서, n은 샘플링 포인트 수이며,
Figure pat00658
이다. 고역 통과 필터링 처리에서 사용되는 필터는, 예를 들어 차단 주파수가 20Hz인 무한 임펄스 응답(Infinite Impulse Response, IIR) 필터이거나 다른 유형의 필터일 수 있다.
예를 들어, 샘플링 속도가 16KHz이고 차단 주파수가 20Hz인 고역 통과 필터의 전달 함수는 다음과 같을 수 있다:
Figure pat00659
; 여기서
Figure pat00660
= 0.994461788958195,
Figure pat00661
= -1.988923577916390,
Figure pat00662
= 0.994461788958195,
Figure pat00663
= 1.988892905899653,
Figure pat00664
= -0.988954249933127, z는 Z 변환의 변환 팩터이다.
해당 시간-도메인 필터의 전달 함수는 다음과 같이 표현될 수 있다:
Figure pat00665
, 및
Figure pat00666
.
902. 현재 프레임에서 시간-도메인 전처리를 거친 좌측 및 우측 채널 신호에 대해 지연 정렬 처리를 수행하여 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 신호를 얻는다.
지연 정렬 처리를 거친 신호를 간단히 "지연 정렬된 신호"라고 칭할 수 있다. 예를 들어, 지연 정렬 처리를 거친 좌측 채널 신호를 간단히 "지연 정렬된 좌측 채널 신호"라고 칭할 수 있고, 지연 정렬 처리를 거친 우측 채널 신호를 간단히 "지연 정렬된 우측 채널 신호"라고 칭할 수 있다.
구체적으로, 현재 프레임에서 전처리된 좌측 및 우측 채널 신호에 기초하여 채널 간 지연 파라미터를 추출하여 인코딩할 수 있고, 인코딩된 채널 간 지연 파라미터에 기초하여 좌측 및 우측 채널 신호에 대해 지연 정렬 처리를 수행하여, 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 신호를 획득할 수 있다. 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 신호는
Figure pat00667
로 표시되고, 현재 프레임에서 지연 정렬 처리를 거친 우측 채널 신호는
Figure pat00668
로 표시되며, 여기서 n은 샘플링 포인트 수이고,
Figure pat00669
이다.
구체적으로, 예를 들어, 인코딩 장치는 현재 프레임에서 전처리된 좌측 및 우측 채널 신호에 기초하여 좌측 및 우측 채널의 시간-도메인 교차 상관 함수를 계산할 수 있고; 좌측 및 우측 채널 신호 사이의 시간 차이를 결정하기 위해, 좌측 및 우측 채널의 시간-도메인 교차 상관 함수의 최댓값(또는 다른 값)을 검색하고; 좌측 및 우측 채널 사이의 결정된 시차에 대해 양자화 인코딩을 수행하고; 좌측 및 우측 채널들로부터 선택된 하나의 채널의 신호를 기준으로 사용하고, 좌측 및 우측 채널들 간의 양자화-인코딩된 시간 차이에 기초하여 다른 채널의 신호에 대한 지연 조정을 수행하여 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 신호를 획득한다.
지연 정렬 처리의 많은 특정 구현 방법이 존재하며, 특정 지연 정렬 처리 방법은 이 실시예에서 제한되지 않는다는 것을 주목해야 한다.
903. 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 신호에 대해 시간-도메인 분석을 수행한다.
구체적으로, 시간-도메인 분석은 천이 검출 등을 포함할 수 있다. 천이 검출은 현재 프레임에서 지연 정렬 처리된 좌측 및 우측 채널 신호에 대해 수행되는 에너지 검출일 수 있다(구체적으로, 현재 프레임이 급격한 에너지 변화를 갖는지가 검출될 수 있다). 예를 들어, 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 신호의 에너지는
Figure pat00670
로 표현되고, 이전 프레임에서 지연 정렬된 좌측 채널 신호의 에너지는
Figure pat00671
로 표현된다. 이 경우, 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 신호의 천이 검출 결과를 얻기 위해,
Figure pat00672
Figure pat00673
사이의 차이의 절댓값에 기초하여 천이 검출이 수행될 수 있다. 마찬가지로, 현재 프레임에서 지연 정렬 처리를 거친 우측 채널 신호에 대해 동일한 방법으로 천이 검출을 수행할 수 있다. 시간-도메인 분석은 천이 검출 이외의 다른 종래의 방식으로 시간-도메인 분석을 더 포함할 수 있으며, 예를 들어 주파수 대역 확장 전처리를 포함할 수 있다.
단계(903)는 단계(902) 이후 그리고 현재 프레임에서의 일차 채널 신호 및 이차 채널 신호가 인코딩되기 전에 언제든지 수행될 수 있음을 이해할 수 있다.
904. 현재 프레임에 대한 채널 조합 방식을 결정하기 위해 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 신호에 기초하여 현재 프레임에 대한 채널 조합 방식 결정을 수행한다.
본 실시예에서는 2개의 가능한 채널 조합 방식을 예로 들어 설명하고, 이하의 설명에서 상관 신호 채널 조합 방식 및 비 상관 신호 채널 조합 방식으로 각각 지칭된다. 이 실시예에서, 상관 신호 채널 조합 방식은(지연 정렬 후 획득된) 현재 프레임에서의 좌측 및 우측 채널 신호가 니어 인 페이즈 시그널인 경우에 대응하고, 비 상관 신호 채널 조합 방식은(지연 정렬 후 획득된) 현재 프레임에서의 좌측 및 우측 채널 신호가 니어 아웃 오브 페이즈 시그널인 경우에 대응한다. 확실히, "상관 신호 채널 조합 방식" 및 "비 상관 신호 채널 조합 방식" 외에, 실제 응용에서 2개의 가능한 채널 조합 방식을 나타내는 데 다른 명칭이 사용될 수도 있다.
이 실시예의 일부 솔루션에서, 채널 조합 방식 결정은 초기 채널 조합 방식 결정 및 채널 조합 방식 수정 결정으로 분류될 수 있다. 현재 프레임에 대한 채널 조합 방식을 결정하기 위해 현재 프레임에 대해 채널 조합 방식 결정이 수행되는 것으로 이해될 수 있다. 현재 프레임에 대한 채널 조합 방식을 결정하는 구현의 일부 예에 대해서는 전술한 실시예의 관련 설명을 참조한다. 세부 사항은 여기서 다시 설명하지 않는다.
905. 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 신호 및 현재 프레임의 채널 조합 방식 플래그에 기초하여 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산 및 인코딩하여 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값 및 초기 값의 인코딩된 인덱스를 획득한다.
구체적으로, 예를 들어, 현재 프레임에서의 좌측 및 우측 채널 신호의 프레임 에너지는 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 신호에 기초하여 먼저 계산되며, 여기서
현재 프레임에서 좌측 채널 신호의 프레임 에너지
Figure pat00674
은 다음을 충족한다:
Figure pat00675
; 그리고
현재 프레임에서 우측 채널 신호의 프레임 에너지
Figure pat00676
는 다음을 충족한다:
Figure pat00677
; 여기서
Figure pat00678
은 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 신호를 나타내고,
Figure pat00679
는 현재 프레임에서 지연 정렬 처리를 거친 우측 채널 신호를 나타낸다.
그런 다음, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터는 현재 프레임에서의 좌측 채널의 프레임 에너지 및 우측 채널의 프레임 에너지에 기초하여 계산된다. 계산을 통해 획득된 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터
Figure pat00680
는 다음을 충족한다:
Figure pat00681
그런 다음, 계산을 통해 획득된 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터
Figure pat00682
에 대해 양자화 인코딩을 수행하여, 대응하는 인코딩된 인덱스
Figure pat00683
및 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 양자화 인코딩된 채널 조합 비율 팩터
Figure pat00684
를 얻는다:
Figure pat00685
Figure pat00686
여기서,
Figure pat00687
는 스칼라 양자화를 위한 코드북이다. 양자화 인코딩은 임의의 종래의 스칼라 양자화 방법, 예를 들어 균일 스칼라 양자화 또는 불균일 스칼라 양자화를 사용하여 수행될 수 있다. 인코딩에 사용되는 비트량은 예를 들어 5 비트이다. 특정 스칼라 양자화 방법은 본 명세서에서 다시 설명되지 않는다.
현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 양자화 인코딩된 채널 조합 비율 팩터
Figure pat00688
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 획득된 초기 값이고, 인코딩된 인덱스
Figure pat00689
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값에 대응하는 인코딩된 인덱스이다.
또한, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값에 대응하는 인코딩된 인덱스는 현재 프레임의 채널 조합 방식 플래그
Figure pat00690
의 값에 기초하여 추가로 수정될 수 있다.
예를 들어, 양자화 인코딩은 5 비트 스칼라 양자화이다.
Figure pat00691
이면, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값에 대응하는 인코딩된 인덱스
Figure pat00692
가 미리 설정된 값(예를 들어, 15 또는 다른 값)으로 수정되고; 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값은
Figure pat00693
로 수정될 수 있다.
전술한 계산 방법에 더하여, 종래의 시간-도메인 스테레오 인코딩 기술에서 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 임의의 방법이 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 데 사용될 수 있음에 유의해야 한다. 대안적으로, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값은 고정된 값(예를 들어, 0.5 또는 다른 값)으로 직접 설정될 수 있다.
906. 채널 조합 비율 팩터 수정 플래그에 기초하여, 채널 조합 비율 팩터가 수정될 필요가 있는지를 판정한다.
수정될 필요가 있으면, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 채널 조합 비율 팩터의 인코딩된 인덱스가 수정되어, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값 및 수정된 값의 인코딩된 인덱스를 획득한다.
현재 프레임의 채널 조합 비율 수정 플래그는
Figure pat00694
로 표시된다. 예를 들어, 채널 조합 비율 팩터 수정 플래그의 값이 0 인 경우, 이는 채널 조합 비율 팩터가 수정될 필요가 없음을 나타내거나; 또는 채널 조합 비율 수정 플래그의 값이 1인 경우, 이는 채널 조합 비율 수정이 필요함을 나타낸다. 확실히, 채널 조합 비율 팩터 수정 플래그로서 다른 상이한 값이 사용되어 채널 조합 비율 팩터가 수정될 필요가 있는지를 표시할 수 있다.
예를 들어, 채널 조합 비율 팩터 수정 플래그에 기초하여, 채널 조합 비율 팩터가 수정될 필요가 있는지를 결정하는 것은 구체적으로 다음을 포함할 수 있다: 예를 들어, 채널 조합 비율 팩터 수정 플래그
Figure pat00695
이면, 채널 조합 비율 팩터가 수정될 필요가 있는 것으로 결정된다. 다른 예를 들어, 채널 조합 비율 팩터 수정 플래그
Figure pat00696
이면, 채널 조합 비율 팩터가 수정될 필요가 없는 것으로 결정된다.
현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 채널 조합 비율 팩터의 인코딩된 인덱스는 구체적으로 다음을 포함할 수 있다:
예를 들어, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값에 대응하는 인코딩된 인덱스는 다음을 충족한다:
Figure pat00697
, 여기서,
Figure pat00698
는 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스이다.
현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값
Figure pat00699
은 다음을 충족한다:
Figure pat00700
.
907. 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값 및 초기 값의 인코딩된 인덱스, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값 및 수정된 값의 인코딩된 인덱스, 및 채널 조합 비율 팩터 수정 플래그에 기초하여 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터
Figure pat00701
및 인코딩된 인덱스
Figure pat00702
를 결정한다.
구체적으로, 예를 들어, 상관 신호 채널 조합 방식에 대응하여 결정된 채널 조합 비율 팩터는 다음을 충족시킨다:
Figure pat00703
, 여기서
Figure pat00704
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값을 나타내고;
Figure pat00705
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값을 나타내고;
Figure pat00706
는 현재 프레임의 채널 조합 비율 수정 플래그를 나타낸다.
상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 대응하는 결정된 인코딩된 인덱스
Figure pat00707
는 다음을 충족시킨다:
Figure pat00708
, 여기서
Figure pat00709
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값에 대응하는 인코딩된 인덱스를 나타내고,
Figure pat00710
는 현재 프레임에 대한 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값에 대응하는 인코딩된 인덱스를 나타낸다.
908. 현재 프레임의 채널 조합 방식 플래그가 비 상관 신호 채널 조합 방식에 대응하는지를 판정하고, 대응하면, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산 및 인코딩하여, 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 인코딩된 인덱스를 획득한다.
먼저, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 데 사용되는 히스토리 버퍼가 리셋될 필요가 있는지가 판정될 수 있다.
예를 들어, 현재 프레임의 채널 조합 방식 플래그
Figure pat00711
가 1과 같고(예를 들어,
Figure pat00712
가 1과 같다는 것은 현재 프레임의 채널 조합 방식 플래그가 비 상관 신호 채널 조합 방식에 대응함을 나타낸다), 이전 프레임의 채널 조합 방식 플래그
Figure pat00713
가 0과 같으면(예를 들어,
Figure pat00714
가 0과 같다는 것은 이전 프레임의 채널 조합 방식 플래그는 상관 신호 채널 조합 방식에 대응함을 나타낸다), 이것은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 데 사용되는 히스토리 버퍼는 리셋될 필요가 있음을 나타낸다.
히스토리 버퍼 리셋 플래그
Figure pat00715
는 초기 채널 조합 방식 결정 및 채널 조합 방식 수정 결정의 프로세스에서 결정될 수 있고, 그런 다음 히스토리 버퍼 리셋 플래그의 값이 결정되어, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 데 사용되는 히스토리 버퍼가 리셋될 필요가 있는지를 결정한다는 것에 유의해야 한다. 예를 들어,
Figure pat00716
가 1인 경우, 현재 프레임의 채널 조합 방식 플래그는 비 상관 신호 채널 조합 방식에 대응하고, 이전 프레임의 채널 조합 방식 플래그는 관련 신호 채널 조합 방식에 대응한다는 것을 나타낸다. 예를 들어, 히스토리 버퍼 리셋 플래그가 1인 경우, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 데 사용되는 히스토리 버퍼를 리셋할 필요가 있음을 나타낸다. 많은 특정 재설정 방법이 있다. 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 데 사용된 히스토리 버퍼 내의 모든 파라미터는 미리 설정된 초기 값에 기초하여 재설정될 수 있다. 대안적으로, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 데 사용된 히스토리 버퍼 내의 일부 파라미터는 미리 설정된 초기 값에 기초하여 재설정될 수 있다. 대안적으로, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 데 사용된 히스토리 버퍼 내의 일부 파라미터는 미리 설정된 초기 값에 기초하여 재설정될 수 있고, 다른 파라미터는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 데 사용되는 히스토리 버퍼 내의 대응하는 파라미터에 기초하여 재설정될 수 있다.
그런 다음, 현재 프레임의 채널 조합 방식 플래그
Figure pat00717
가 비 상관 신호 채널 조합 방식에 대응하는지가 추가로 결정된다. 비 상관 신호 채널 조합 방식은 니어 아웃 오브 페이즈 스테레오 시그널에 대해 시간-도메인 다운믹싱을 수행하기 에 더 적합한 채널 조합 방식이다. 본 실시예에서, 현재 프레임의 채널 조합 방식 플래그
Figure pat00718
일 때, 현재 프레임의 채널 조합 방식 플래그는 비 상관 신호 채널 조합 방식에 대응한다는 것을 나타낸다. 현재 프레임의 채널 조합 방식 플래그
Figure pat00719
일 때, 현재 프레임의 채널 조합 방식 플래그는 상관 신호 채널 조합 방식에 대응한다는 것을 나타낸다.
현재 프레임의 채널 조합 방식 플래그가 비 상관 신호 채널 조합 방식에 대응하는지를 결정하는 단계는 구체적으로:
현재 프레임의 채널 조합 방식 플래그의 값이 1인지를 결정하는 단계를 포함할 수 있고; 현재 프레임의 채널 조합 방식 플래그
Figure pat00720
이면, 현재 프레임의 채널 조합 방식 플래그는 비 상관 신호 채널 조합 방식에 대응한다는 것을 나타내고, 이 경우, 비 상관 신호 채널에 대응하는 채널 조합 비율 팩터는 현재 프레임에 대한 조합 방식이 계산되고 인코딩될 수 있다.
도 9b를 참조하면, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산 및 인코딩하는 단계는 예를 들어 다음 단계 9081 내지 9085를 포함할 수 있다.
9081. 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 신호에 대한 신호 에너지 분석을 수행한다.
현재 프레임에서의 좌측 채널 신호의 프레임 에너지, 현재 프레임에서의 우측 채널 신호의 프레임 에너지, 현재 프레임에서의 좌측 채널의 장기 평활 프레임 에너지, 현재 프레임에서의 우측 채널의 장기 평활 프레임 에너지, 현재 프레임에서의 좌측 채널의 프레임 간 에너지 차이 및 현재 프레임에서의 우측 채널의 프레임 간 에너지 차이가 개별적으로 획득된다.
예를 들어, 현재 프레임에서 좌측 채널 신호의 프레임 에너지
Figure pat00721
는 다음을 충족한다:
Figure pat00722
; 그리고
현재 프레임에서 우측 채널 신호의 프레임 에너지
Figure pat00723
는 다음을 충족한다:
Figure pat00724
; 여기서
Figure pat00725
은 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 신호를 나타내고,
Figure pat00726
은 현재 프레임에서 지연 정렬 처리를 거친 우측 채널 신호를 나타낸다.
예를 들어, 현재 프레임에서 좌측 채널의 장기 평활 프레임 에너지
Figure pat00727
는 다음을 충족한다:
Figure pat00728
, 여기서
Figure pat00729
는 이전 프레임에서의 좌측 채널의 장기 평활화 프레임 에너지를 나타내고, A는 좌측 채널의 장기 평활화 프레임 에너지의 업데이트 팩터를 나타내고, A는 예를 들어 0 내지 1의 실수일 수 있고, A는 예를 들어 0.4일 수 있다.
예를 들어, 현재 프레임에서 우측 채널의 장기 평활 프레임 에너지
Figure pat00730
는 다음을 충족한다:
Figure pat00731
, 여기서
Figure pat00732
는 이전 프레임에서 우측 채널의 장기 평활 프레임 에너지를 나타내고, B는 우측 채널의 장기 평활 프레임 에너지의 업데이트 팩터를 나타내고, B는 예를 들어 0 내지 1의 실수일 수 있고, B는 예를 들어 좌측 채널의 장기 평활 프레임 에너지의 업데이트 팩터와 동일하거나 상이할 수 있고; 예를 들어, B는 0.4와 동일할 수도 있다.
예를 들어, 현재 프레임에서 좌측 채널의 프레임 간 에너지 차이
Figure pat00733
는 다음을 충족한다:
Figure pat00734
예를 들어, 현재 프레임에서 우측 채널의 프레임 간 에너지 차이
Figure pat00735
는 다음을 충족한다:
Figure pat00736
9082. 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 신호에 기초하여 현재 프레임의 참조 채널 신호를 결정한다. 참조 채널 신호는 또한 모노 신호로 지칭될 수 있다. 참조 채널 신호가 모노 신호로 지칭되는 경우, 참조 채널과 관련된 모든 설명 및 파라미터 이름에 대해, 참조 채널 신호는 모노 신호로 대체될 수 있다.
예를 들어, 참조 채널 신호
Figure pat00737
는 다음을 충족한다:
Figure pat00738
, 여기서
Figure pat00739
은 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 신호이고,
Figure pat00740
은 현재 프레임에서 지연 정렬 처리를 거친 우측 채널 신호이다.
9083. 지연 정렬 처리를 거친 좌측 채널 신호와 현재 프레임에서의 참조 채널 신호 사이의 진폭 상관 파라미터 및 지연 정렬 처리를 거친 우측 채널 신호와 현재 프레임에서의 참조 채널 신호 사이의 진폭 상관 파라미터를 별도로 계산한다.
예를 들어, 지연 정렬 처리를 거친 좌측 채널 신호와 현재 프레임의 참조 채널 신호 사이의 진폭 상관 파라미터
Figure pat00741
는 예를 들어 다음을 충족한다:
Figure pat00742
예를 들어, 지연 정렬 처리를 거친 우측 채널 신호와 현재 프레임의 참조 채널 신호 사이의 진폭 상관 파라미터
Figure pat00743
는 예를 들어 다음을 충족한다:
Figure pat00744
여기서,
Figure pat00745
은 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 신호를 나타내고,
Figure pat00746
은 현재 프레임에서 지연 정렬 처리를 거친 우측 채널 신호를 나타내고,
Figure pat00747
는 현재 프레임에서의 참조 채널 신호를 나타내고,
Figure pat00748
는 절댓값 채택을 나타낸다.
9084. 지연 정렬 처리를 거친 좌측 채널 신호와 현재 프레임의 참조 채널 신호 사이의 진폭 상관 파라미터 및 지연 정렬 처리를 거친 우측 채널 신호와 현재 프레임의 참조 채널 신호 사이의 진폭 상관 파라미터에 기초하여 현재 프레임에서의 좌측 채널과 우측 채널 사이의 진폭 상관 차이 파라미터
Figure pat00749
를 계산한다.
단계 9081은 단계 9082 및 단계 9083 이전에 수행될 수 있거나, 단계 9082 및 단계 9083 이후 및 단계 9084 이전에 수행될 수 있는 것으로 이해될 수 있다.
도 9c를 참조하면, 예를 들어, 현재 프레임에서의 좌측 채널과 우측 채널 사이의 진폭 상관 차이 파라미터
Figure pat00750
를 계산하는 단계는 구체적으로 다음 단계 90841 및 90842를 포함할 수 있다.
90841. 지연 정렬 처리를 거친 좌측 채널 신호와 현재 프레임의 참조 채널 신호 사이의 진폭 상관 파라미터 및 지연 정렬 처리를 거친 우측 채널 신호와 현재 프레임의 참조 채널 신호 사이의 진폭 상관 파라미터에 기초하여 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터(long-term smoothed amplitude correlation parameter) 및 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 계산한다.
예를 들어, 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터 및 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 계산하는 방법은 다음을 포함할 수 있다: 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터
Figure pat00751
은 다음을 만족한다:
Figure pat00752
.
여기서,
Figure pat00753
는 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 나타내고,
Figure pat00754
는 이전 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화된 진폭 상관 파라미터를 나타내고,
Figure pat00755
는 좌측 채널 평활화 팩터를 나타내며,
Figure pat00756
는 0에서 1 사이의 미리 설정된 실수를 나타내고,
Figure pat00757
는 예를 들어 0.2, 0.5 또는 0.8일 수 있다. 대안적으로, 적응 계산을 통해 값이 얻어질 수 있다.
예를 들어, 현재 프레임에서 우측 채널 신호와 참조 채널 신호 간의 장기 평활화 진폭 상관 파라미터
Figure pat00758
는 다음을 충족한다:
Figure pat00759
.
여기서,
Figure pat00760
는 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 나타내고,
Figure pat00761
는 이전 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 나타내며,
Figure pat00762
는 우측 채널 평활화 팩터를 나타내며,
Figure pat00763
는 0에서 1 사이의 미리 설정된 실수일 수 있다.
Figure pat00764
는 좌측 채널 평활화 팩터의 값
Figure pat00765
와 동일하거나 상이할 수 있고,
Figure pat00766
는 예를 들어 0.2, 0.5 또는 0.8과 동일할 수 있다. 대안적으로,
Figure pat00767
의 값은 적응 계산을 통해 얻어질 수 있다.
현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 간의 장기 평활화 진폭 상관 파라미터 및 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 간의 장기 평활화 진폭 상관 파라미터를 계산하는 다른 방법은:
먼저, 지연 정렬 처리를 거친 좌측 채널 신호와 현재 프레임의 참조 채널 신호 사이의 진폭 상관 파라미터
Figure pat00768
를 수정하여, 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 수정된 진폭 상관 파라미터
Figure pat00769
를 획득하고; 지연 정렬 처리를 거친 우측 채널 신호와 현재 프레임의 참조 채널 신호 사이의 진폭 상관 파라미터
Figure pat00770
를 수정하여, 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 수정된 진폭 상관 파라미터
Figure pat00771
를 획득하는 단계;
그런 다음, 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 수정된 진폭 상관 파라미터
Figure pat00772
, 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 수정된 진폭 상관 파라미터
Figure pat00773
, 이전 프레임에서의 좌측 채널 신호와 참조 채널 신호 간의 장기 평활화 진폭 상관 파라미터
Figure pat00774
, 및 이전 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터
Figure pat00775
에 기초하여 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 차이 파라미터
Figure pat00776
및 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터
Figure pat00777
를 결정하는 단계;
그런 다음, 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터
Figure pat00778
및 이전 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터
Figure pat00779
에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터의 초기 값
Figure pat00780
을 획득하고; 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터의 획득된 초기 값
Figure pat00781
및 이전 프레임에서의 좌측 채널과 우측 채널 사이의 진폭 상관 차이 파라미터
Figure pat00782
에 기초하여 현재 프레임에서의 좌측 및 우측 채널 사이의 진폭 상관 차이의 프레임 간 변동 파라미터
Figure pat00783
를 결정하는 단계; 및
마지막으로, 신호 에너지 분석을 통해 획득되는 현재 프레임의 좌측 채널 신호의 프레임 에너지, 현재 프레임의 우측 채널 신호의 프레임 에너지, 현재 프레임의 좌측 채널의 장기 평활화 프레임 에너지, 현재 프레임의 우측 채널의 장기 평활화 프레임 에너지, 현재 프레임의 좌측 채널의 프레임 간 에너지 차이 및 현재 프레임의 우측 채널의 프레임 간 에너지 차이, 및 현재 프레임에서의 좌측 채널과 우측 채널 사이의 진폭 상관 차이의 프레임 간 변동 파라미터에 기초하여, 상이한 좌측 채널 평활화 팩터 및 우측 채널 평활화 팩터를 적응적으로 선택하고, 현재 프레임에서의 좌측 채널 신호 및 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터
Figure pat00784
및 현재 프레임에서의 우측 채널 신호 및 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터
Figure pat00785
를 계산하는 단계
를 포함할 수 있다.
위의 예제로 제공된 두 가지 방법 외에, 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 관계 파라미터와 현재 프레임에서의 우측 채널 신호 및 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 계산하는 방법이 많이 있을 수 있다. 이것은 본 출원에서 제한되지 않는다.
90842. 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터 및 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 차이 파라미터에 기초하여 현재 프레임에서의 좌측 채널 신호와 우측 채널 신호 사이의 진폭 상관 차이 파라미터
Figure pat00786
를 계산한다.
예를 들어, 현재 프레임에서 좌측과 우측 채널 사이의 진폭 상관 차이 파라미터
Figure pat00787
는 다음을 충족한다:
Figure pat00788
, 여기서
Figure pat00789
은 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 나타내고,
Figure pat00790
은 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화된 진폭 상관 파라미터를 나타낸다.
9085. 현재 프레임에서의 좌측 및 우측 채널 사이의 진폭 상관 차이 파라미터
Figure pat00791
를 채널 조합 비율 팩터로 변환하고 인코딩 및 양자화를 수행하여, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 채널 조합 비율 팩터의 인코딩된 인덱스를 결정한다.
도 9d를 참조하면, 현재 프레임에서의 좌측 채널과 우측 채널 사이의 진폭 상관 차이 파라미터를 채널 조합 비율 팩터로 변환하는 가능한 방법은 구체적으로 단계 90851 내지 90853을 포함할 수 있다.
90851. 좌측 채널과 우측 채널 사이의 진폭 상관 차이 파라미터에 대한 맵핑 처리를 수행하여, 좌측 채널과 우측 채널 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터의 값 범위가
Figure pat00792
가 될 수 있도록 한다.
좌측 채널과 우측 채널 사이의 진폭 상관 차이 파라미터에 대한 맵핑 처리를 수행하는 방법은 다음 단계를 포함할 수 있다.
먼저, 좌측 및 우측 채널 사이의 진폭 상관 차이 파라미터에 대해 진폭 제한이 수행된다. 예를 들어, 좌측 채널과 우측 채널 사이의 진폭-제한 진폭 상관 차이 파라미터
Figure pat00793
는 다음을 충족한다:
Figure pat00794
여기서,
Figure pat00795
는 좌측 및 우측 채널 사이의 진폭-제한 진폭 상관 차이 파라미터의 최댓값을 나타내고,
Figure pat00796
은 좌측 및 우측 채널 사이의 진폭-제한 진폭 상관 차이 파라미터의 최솟값을 나타낸다. 예를 들어,
Figure pat00797
는 미리 설정된 경험적 값이고,
Figure pat00798
는 1.5, 3.0 또는 다른 값일 수 있으며;
Figure pat00799
은 미리 설정된 경험적 값이며
Figure pat00800
는 -1.5, -3.0 또는 다른 값일 수 있으며, 여기서
Figure pat00801
이다.
그런 다음, 좌측 및 우측 채널 사이의 진폭-제한 진폭 상관 차이 파라미터에 대해 맵핑 처리가 수행된다. 좌측과 우측 채널 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터
Figure pat00802
는 다음을 충족한다:
Figure pat00803
; 여기서
Figure pat00804
;
Figure pat00805
또는
Figure pat00806
;
Figure pat00807
;
Figure pat00808
또는
Figure pat00809
;
Figure pat00810
; 및
Figure pat00811
또는
Figure pat00812
.
여기서,
Figure pat00813
는 좌측 및 우측 채널 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터의 최댓값을 나타내고,
Figure pat00814
는 좌측 및 우측 채널 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터의 높은 임계 값을 나타내며,
Figure pat00815
는 좌측 및 우측 채널 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터의 낮은 임계 값을 나타내고,
Figure pat00816
은 좌측 및 우측 채널 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터의 최솟값을 나타내며; 여기서
Figure pat00817
.
예를 들어, 본 출원의 일부 실시예에서,
Figure pat00818
는 2.0 일 수 있고,
Figure pat00819
는 1.2 일 수 있고,
Figure pat00820
는 0.8 일 수 있고,
Figure pat00821
은 0.0 일 수 있다. 실제로, 실제 적용에서, 이 값들은 이러한 예에 제한되지 않는다.
Figure pat00822
는 좌측과 우측 채널 사이의 진폭-제한 진폭 상관 차이 파라미터의 최댓값을 나타내고,
Figure pat00823
는 좌측과 우측 채널 사이의 진폭-제한 진폭 상관 차이 파라미터의 높은 임계 값을 나타내며,
Figure pat00824
는 좌측과 우측 채널 사이의 진폭-제한 진폭 상관 차이 파라미터의 낮은 임계 값을 나타내며,
Figure pat00825
은 좌측 및 우측 채널 사이의 진폭-제한 진폭 상관 차이 파라미터의 최솟값을 나타내고; 여기서
Figure pat00826
이다.
예를 들어, 본 출원의 일부 실시예에서,
Figure pat00827
는 1.5이고,
Figure pat00828
는 0.75이고,
Figure pat00829
는 -0.75이며, 그리고
Figure pat00830
는 -1.5이다. 실제로, 실제 적용에서, 이 값들은 이러한 예에 제한되지 않는다.
본 출원의 일부 실시예에서의 다른 방법은 다음과 같다: 좌측 채널과 우측 채널 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터
Figure pat00831
는 다음을 충족한다:
Figure pat00832
여기서,
Figure pat00833
는 좌측 및 우측 채널 사이의 진폭-제한 진폭 상관 차이 파라미터를 나타내고; 여기서
Figure pat00834
여기에서,
Figure pat00835
는 좌측 및 우측 채널 사이의 진폭 상관 차이 파라미터의 최대 진폭을 나타내고,
Figure pat00836
는 좌측 및 우측 채널 사이의 진폭 상관 차이 파라미터의 최소 진폭을 나타낸다.
Figure pat00837
는 미리 설정된 경험적 값일 수 있고,
Figure pat00838
는 예를 들어 1.5, 3.0, 또는 0보다 큰 다른 실수일 수 있다.
90852. 좌측 채널과 우측 채널 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터를 채널 조합 비율로 변환한다.
채널 조합 비율 팩터는 다음을 충족한다.
Figure pat00839
, 여기서
Figure pat00840
는 코사인 연산을 나타낸다.
전술한 방법에 더하여, 다른 방법이 좌측 및 우측 채널 간의 진폭 상관 차이 파라미터를 채널 조합 비율 팩터로 변환하는 데 사용될 수 있으며, 예를 들어:
비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터가 갱신될 필요가 있는지는 신호 에너지 분석을 통해 획득되는 현재 프레임에서의 좌측 채널의 장기 평활화 프레임 에너지, 현재 프레임에서의 우측 채널의 장기 평활화 프레임 에너지, 및 현재 프레임에서의 좌측 채널의 프레임 간 에너지 차이, 그리고 인코더의 히스토리 버퍼 내의 이전 프레임의 버퍼링된 인코딩 파라미터(예를 들어, 일차 채널 신호의 프레임 간 상관 파라미터 및 이차 채널 신호의 프레임 간 상관 파라미터), 현재 프레임 및 이전 프레임의 채널 조합 방식 플래그, 및 현재 프레임 및 이전 프레임의 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 판정된다.
비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터가 업데이트될 필요가 있으면, 좌측 및 우측 채널 간의 진폭 상관 차이 파라미터는 전술한 예의 방법을 사용하여 채널 조합 비율 팩터로 변환되고; 그렇지 않으면, 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 채널 조합 비율 팩터의 인코딩된 인덱스는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 채널 조합 비율 팩터의 인코딩된 인덱스로서 직접 사용된다.
90853. 변환 후 획득된 채널 조합 비율 팩터에 대해 양자화 인코딩을 수행하고, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 결정한다.
구체적으로, 예를 들어, 변환 후 획득된 채널 조합 비율 팩터에 대해 양자화 인코딩이 수행되어, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 초기 인코딩된 인덱스
Figure pat00841
및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 양자화-인코딩된 초기 값
Figure pat00842
를 획득하며; 여기서
Figure pat00843
이고, 그리고
Figure pat00844
은 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 대해 스칼라 양자화를 수행하기 위한 코드북을 나타낸다.
양자화 인코딩은 종래 기술에서의 임의의 스칼라 양자화 방법, 예를 들어 균일 스칼라 양자화 또는 불균일 스칼라 양자화를 사용하여 수행될 수 있다. 인코딩에 사용되는 비트의 양은 5 비트일 수 있다. 구체적인 방법은 여기에 기술되지 않는다. 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 대해 스칼라 양자화를 수행하기 위한 코드북은 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 대한 스칼라 양자화를 수행하기 위한 코드북과 동일하거나 상이할 수 있다. 코드북이 동일하면, 채널 조합 비율에 대한 스칼라 양자화를 수행하는 데 사용되는 하나의 코드북만이 저장될 필요가 있다.
이 경우, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 양자화-인코딩된 초기 값
Figure pat00845
은 다음과 같다:
Figure pat00846
.
예를 들어, 방법은: 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 양자화 인코딩된 초기 값을 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터로서 직접 사용하는 단계, 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 인코딩된 인덱스를 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스로서 직접 사용하는 단계이다.
현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스
Figure pat00847
은 다음을 충족한다:
Figure pat00848
.
현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터는 다음을 충족한다:
Figure pat00849
다른 방법은: 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스 또는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 양자화 인코딩된 초기 값 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 초기 인코딩된 인덱스를 수정하는 단계; 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 인코딩된 인덱스를 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스로서 사용하는 단계; 및 비 상관 신호 채널 조합 방식에 대응하는 수정된 채널 조합 비율 팩터를 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터로서 사용하는 단계일 수 있다.
현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스
Figure pat00850
은 다음을 충족한다:
Figure pat00851
.
여기서,
Figure pat00852
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 초기 인코딩된 인덱스를 나타내고;
Figure pat00853
은 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스이고;
Figure pat00854
는 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정 팩터이다.
Figure pat00855
의 값은 경험적 값일 수 있으며,
Figure pat00856
는 예를 들어 0.8 일 수 있다.
현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터는 다음을 충족한다:
Figure pat00857
다른 방법은: 비 상관 신호 채널 조합 방식에 대응하는 양자화되지 않은 채널 조합 비율 팩터를 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 인자로서 사용하는 단계이다. 다시 말해, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터
Figure pat00858
은 다음을 충족한다:
Figure pat00859
또한, 제4 방법은: 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 양자화되지 않은 채널 조합 비율 팩터를 수정하는 단계; 상기 비 상관 신호 채널 조합 방식에 대응하는 수정된 채널 조합 비율 팩터를 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터로서 사용하는 단계; 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 대한 양자화 인코딩을 수행하여, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스를 획득하는 단계를 포함한다.
전술한 방법들 이외에도, 좌측 및 우측 채널 간의 진폭 상관 차이 파라미터를 채널 조합 비율 팩터로 변환하고 인코딩 및 양자화를 수행하는 많은 방법이 있을 수 있다. 유사하게, 현재 프레임에 대한 비 상관 신호 채널 조합 방식 및 채널 조합 비율 팩터의 인코딩된 인덱스에 대응하는 채널 조합 비율 팩터를 결정하기 위한 많은 상이한 방법이 존재한다. 이것은이 본 출원에서 제한되지 않는다.
909. 현재 프레임의 코딩 모드를 결정하기 위해 이전 프레임의 채널 조합 방식 플래그 및 현재 프레임의 채널 조합 방식 플래그에 기초하여 코딩 모드 결정을 수행한다.
현재 프레임의 채널 조합 방식 플래그는
Figure pat00860
로 표시되고, 이전 프레임의 채널 조합 방식 플래그는
Figure pat00861
로 표시되고, 이전 프레임의 채널 조합 방식 플래그와 현재 프레임의 채널 조합 방식 플래그의 조인트 플래그는
Figure pat00862
로 표시될 수 있다. 코딩 모드 결정은 조인트 플래그에 기초하여 수행될 수 있다. 자세한 내용은 다음 예에 나와 있다.
상관 신호 채널 조합 방식은 0으로 표시되고 비 상관 신호 채널 조합 방식은 1로 표현된다고 가정한다. 이 경우, 이전 프레임의 채널 조합 방식 플래그와 현재 프레임의 채널 조합 방식 플래그의 조인트 플래그는(01), (11), (10), (00)의 4가지 경우가 있고, 현재 프레임의 코딩 모드는: 상관 신호 코딩 모드, 비 상관 신호 코딩 모드, 상관-비상관 신호 코딩 스위칭 모드, 및 비상관-상관 신호 코딩 스위칭 모드로 결정된다. 예를 들어, 이전 프레임의 채널 조합 방식 플래그와 현재 프레임의 채널 조합 방식 플래그의 조인트 플래그가 (00)이면, 현재 프레임의 코딩 모드가 상관 신호 코딩 모드임을 나타내고; 이전 프레임의 채널 조합 방식 플래그와 현재 프레임의 채널 조합 방식 플래그의 조인트 플래그가 (11)이면, 현재 프레임의 코딩 모드가 비 상관 신호 코딩 모드임을 나타내고; 이전 프레임의 채널 조합 방식 플래그와 현재 프레임의 채널 조합 방식 플래그의 조인트 플래그가 (01)이면, 현재 프레임의 코딩 모드가 상관-비상관 신호 코딩 스위칭 모드임을 나타내거나; 또는 이전 프레임의 채널 조합 방식 플래그와 현재 프레임의 채널 조합 방식 플래그의 조인트 플래그가 (10)이면, 현재 프레임의 코딩 모드가 비상관-상관 신호 코딩 전환 모드임을 나타낸다.
910. 현재 프레임의 코딩 모드
Figure pat00863
을 획득한 후, 인코딩 장치는 현재 프레임의 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방법에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 채널 신호 및 이차 채널 신호를 획득한다.
현재 프레임의 코딩 모드는 복수의 코딩 모드 중 하나이다. 예를 들어, 복수의 코딩 모드는 상관-비상관 신호 코딩 스위칭 모드, 비상관-상관 신호 코딩 스위칭 모드, 상관 신호 코딩 모드 및 비상관 신호 코딩 모드를 포함할 수 있다. 상이한 코딩 모드에서의 시간-도메인 다운믹스 처리의 구현에 대해서는, 전술한 실시예에서의 예의 관련 설명을 참조한다. 세부 사항은 여기서 다시 설명하지 않는다.
911. 인코딩 장치는 일차 채널 신호 및 이차 채널 신호를 개별적으로 인코딩하여 인코딩된 일차 채널 신호 및 인코딩된 이차 채널 신호를 획득한다.
구체적으로, 이전 프레임에서의 일차 채널 신호 및/또는 이차 채널 신호의 인코딩에서 획득된 파라미터 정보 및 일차 채널 신호 및 이차 채널 신호를 인코딩하기 위한 비트의 총 수량에 기초하여 일차 채널 신호의 인코딩 및 이차 채널 신호의 인코딩을 위해 비트 할당이 먼저 수행될 수 있다. 그런 다음, 일차 채널 신호와 이차 채널 신호는 비트 할당 결과에 기초하여 별도로 인코딩되어 일차 채널 인코딩의 인코딩된 인덱스 및 이차 채널 인코딩의 인코딩된 인덱스를 획득한다. 일차 채널 인코딩 및 이차 채널 인코딩은 여기에서 더 설명되지 않는 임의의 모노 오디오 인코딩 기술을 사용하여 구현될 수 있다.
912. 인코딩 장치는 채널 조합 방식 플래그에 기초하여 채널 조합 비율 팩터의 대응하는 인코딩된 인덱스를 선택하고, 인코딩된 인덱스를 비트스트림에 기록하고, 인코딩된 일차 채널 신호, 인코딩된 이차 채널 신호 및 현재 프레임의 채널 조합 방식 플래그를 비트스트림에 기록한다.
구체적으로, 예를 들어, 현재 프레임의 채널 조합 방식 플래그
Figure pat00864
가 상관 신호 채널 조합 방식에 대응하는 경우, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스
Figure pat00865
는 비트스트림으로 기록되거나; 또는 현재 프레임의 채널 조합 방식 플래그
Figure pat00866
가 비 상관 신호 채널 조합 방식에 대응하는 경우, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스
Figure pat00867
가 비트스트림에 기록된다. 예를 들어,
Figure pat00868
이면, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스
Figure pat00869
가 비트스트림에 기록되거나; 또는
Figure pat00870
이면, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스
Figure pat00871
이 비트스트림에 기록된다.
또한, 현재 프레임의 인코딩된 일차 채널 신호, 인코딩된 이차 채널 신호 및 채널 조합 방식 플래그가 비트스트림에 기록된다. 비트스트림 기록 동작을 수행하기 위한 시퀀스가 없다는 것이 이해될 수 있다.
이에 상응하여, 다음은 예를 사용하여 시간-도메인 스테레오 디코딩 시나리오를 설명한다.
도 10을 참조하여, 다음은 오디오 디코딩 방법을 추가로 제공한다. 오디오 디코딩 방법의 관련 단계는 구체적으로 디코딩 장치에 의해 구현될 수 있고, 방법은 구체적으로 다음 단계를 포함할 수 있다.
1001. 비트스트림에 기초하여 디코딩을 수행하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호를 획득한다.
1002. 비트스트림에 기초하여 디코딩을 수행하여 현재 프레임의 시간-도메인 스테레오 파라미터를 획득한다.
현재 프레임의 시간-도메인 스테레오 파라미터는 현재 프레임의 채널 조합 비율 팩터를 포함하고(비트스트림은 현재 프레임의 채널 조합 비율 팩터의 인코딩된 인덱스를 포함하고, 디코딩은 현재 프레임의 채널 조합 비율 팩터의 인코딩된 인덱스에 기초하여 수행되어 현재 프레임의 채널 조합 비율 팩터를 획득할 수 있다), 현재 프레임의 채널 간 시간 차이를 더 포함할 수 있다(예를 들어, 비트스트림은 현재 프레임의 채널 간 시간 차이의 인코딩된 인덱스를 포함하고, 디코딩은 현재 프레임의 채널 간 시간 차이의 인코딩된 인덱스에 기초하여 수행되어 현재 프레임의 채널 간 시간 차이를 획득하거나; 또는 비트스트림은 현재 프레임의 채널 간 시간 차이의 절댓값을 포함하고, 디코딩은 현재 프레임의 채널 간 시간 차이의 절댓값의 인코딩된 인덱스에 기초하여 수행되어 현재 프레임의 채널 간 시간 차이의 절댓값을 획득할 수 있다).
1003. 비트스트림에 기초하여, 비트스트림에 포함된 현재 프레임의 채널 조합 방식 플래그를 획득하고, 현재 프레임에 대한 채널 조합 방식을 결정한다.
1004. 현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 디코딩 모드를 결정한다.
현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 디코딩 모드를 결정하는 단계에 대해서는 단계 909에서 현재 프레임의 코딩 모드를 결정하는 방법을 참조한다. 현재 프레임의 디코딩 모드는 복수의 디코딩 모드 중 하나이다. 예를 들어, 복수의 디코딩 모드는 상관-비상관 신호 디코딩 스위칭 모드, 비상관-상관 신호 디코딩 스위칭 모드, 상관 신호 디코딩 모드 및 비상관 신호 디코딩 모드를 포함할 수 있다. 코딩 모드 및 디코딩 모드는 일대일 대응 관계에 있다.
예를 들어, 이전 프레임의 채널 조합 방식 플래그와 현재 프레임의 채널 조합 방식 플래그의 조인트 플래그가 (00)이면, 이전 프레임의 채널 조합 방식 플래그와 현재 프레임의 디코딩 모드가 상관 신호 디코딩 모드임을 나타내고; 이전 프레임의 채널 조합 방식 플래그와 현재 프레임의 채널 조합 방식 플래그의 조인트 플래그가 (11)이면, 현재 프레임의 디코딩 모드가 비 상관 신호 디코딩 모드임을 나타내고; 이전 프레임의 채널 조합 방식 플래그와 현재 프레임의 채널 조합 방식 플래그의 조인트 플래그가 (01)이면, 현재 프레임의 디코딩 모드가 상관-비상관 신호 디코딩 스위칭 모드임을 나타내거나; 또는 이전 프레임의 채널 조합 방식 플래그와 현재 프레임의 채널 조합 방식 플래그의 조인트 플래그가 (10)이면, 현재 프레임의 디코딩 모드가 비상관-상관 신호 디코딩 스위칭 모드임을 나타낸다.
단계 1001, 단계 1002 및 단계 1003 및 1004를 수행하기 위해 필요한 시퀀스가 존재하지 않는 것으로 이해될 수 있다.
1005. 현재 프레임의 결정된 디코딩 모드에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득한다.
상이한 디코딩 모드에서의 시간-도메인 업믹스 처리의 관련 구현에 대해서는, 전술한 실시예에서의 예의 관련 설명을 참조한다. 세부 사항은 여기서 다시 설명하지 않는다.
시간-도메인 업믹스 처리에 사용되는 업믹스 매트릭스는 현재 프레임의 획득된 채널 조합 비율 팩터에 기초하여 구성된다.
현재 프레임에서의 재구성된 좌측 및 우측 채널 신호는 현재 프레임에서 디코딩된 좌측 및 우측 채널 신호로 사용될 수 있다.
대안적으로, 현재 프레임에서의 지연 조정을 거친 재구성된 좌측 및 우측 채널 신호를 획득하기 위해 현재 프레임의 채널 간 시간 차이에 기초하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호에 대해 지연 조정이 수행될 수 있고, 현재 프레임에서 지연 조정을 거친 재구성된 좌측 및 우측 채널 신호는 현재 프레임에서의 디코딩된 좌측 및 우측 채널 신호로 사용될 수 있다. 대안적으로, 또한, 현재 프레임에서 지연 조정을 거친 재구성된 좌측 및 우측 채널 신호에 대해 시간-도메인 후처리가 수행될 수 있고, 현재 프레임에서 시간-도메인 후처리를 거친 좌측 및 우측 채널 신호는 현재 프레임에서의 디코딩된 좌측 및 우측 채널 신호로서 사용될 수 있다.
전술한 내용은 본 출원의 실시예에서의 방법을 상세히 설명한다. 다음은 본 출원의 실시예에서의 장치를 설명한다.
도 11a를 참조하면, 본 출원의 실시예는 장치(1100)를 추가로 제공한다. 장치(1100)는:
서로 연결된 프로세서(1110) 및 메모리(1120)를 포함하며, 프로세서(1110)는 본 출원의 실시예에서 제공되는 임의의 방법의 일부 또는 모든 단계를 수행하도록 구성될 수 있다.
메모리(1120)는 랜덤 액세스 메모리(랜덤 액세스 메모리, RAM), 읽기 전용 메모리(Random Access Memory, ROM), 소거 가능한 프로그램 가능 읽기 전용 메모리(Erasable Programmable Read Only Memory, EPROM), 또는 컴팩트 디스크 읽기 전용 메모리(Compact Disc Read-Only Memory, CD-ROM)를 포함하되 이에 제한되지 않는다. 메모리(1102)는 관련 명령 및 관련 데이터를 저장하도록 구성된다.
확실히, 장치(1100)는 데이터를 수신 및 전송하도록 구성된 송수신기(1130)를 더 포함할 수 있다.
프로세서(1110)는 하나 이상의 중앙 처리 장치(Central Processing Unit, CPU로 약칭)일 수 있다. 프로세서(1110)가 하나의 CPU인 경우, 이 하나의 CPU는 단일 코어 CPU이거나 멀티 코어 CPU일 수 있다. 프로세서(1110)는 구체적으로 디지털 신호 프로세서일 수 있다.
구현 프로세스에서, 전술한 방법의 단계는 프로세서(1110)의 하드웨어 집적 논리 회로를 사용하거나 소프트웨어 형태의 명령을 사용함으로써 구현될 수 있다. 프로세서(1110)는 범용 프로세서, 디지털 신호 프로세서, 애플리케이션 특정 집적 회로, 필드 프로그램 가능 게이트 어레이 또는 다른 프로그램 가능 논리 장치, 이산 게이트 또는 트랜지스터 논리 장치, 또는 이산 하드웨어 구성 요소일 수 있다. 프로세서(1110)는 본 발명의 실시예에 개시된 방법, 단계 및 논리 블록도를 구현 또는 수행할 수 있다. 범용 프로세서는 마이크로프로세서일 수 있거나, 프로세서는 임의의 종래의 프로세서 등일 수 있다. 본 발명의 실시예를 참조하여 개시된 방법의 단계는 하드웨어 디코딩 프로세서를 사용하여 직접 수행되고 달성될 수 있거나, 또는 디코딩 프로세서에서 하드웨어 및 소프트웨어 모듈의 조합을 사용하여 수행되고 달성될 수 있다.
소프트웨어 모듈은 랜덤 액세스 메모리, 플래시 메모리, 판독 전용 메모리, 프로그램 가능 판독 전용 메모리, 전기 소거 가능 프로그램 가능 메모리, 또는 레지스터와 같은 해당 기술 분야의 성숙한 저장 매체에 위치할 수 있다. 저장 매체는 메모리(1120)에 위치된다. 예를 들어, 프로세서(1110)는 메모리(1120)에서 정보를 판독하고, 프로세서(1110)의 하드웨어와 조합하여 전술한 방법의 단계들을 완료할 수 있다.
또한, 장치(1100)는 송수신기(1130)를 더 포함할 수 있다. 송수신기(1130)는 예를 들어 관련 데이터(예를 들어, 명령, 채널 신호 또는 비트스트림)를 수신 및 전송하도록 구성될 수 있다.
예를 들어, 장치(1100)는 도 2 내지 도 9d에 도시된 임의의 실시예에서 대응하는 방법의 일부 또는 모든 단계를 수행할 수 있다.
구체적으로, 예를 들어, 장치(1100)가 전술한 인코딩의 관련 단계를 수행할 때, 장치(1100)는 인코딩 장치(또는 오디오 인코딩 장치)라고 지칭될 수 있다. 장치(1100)가 전술한 디코딩의 관련 단계들을 수행할 때, 장치(1100)는 디코딩 장치(또는 오디오 디코딩 장치)라고 지칭될 수 있다.
도 11b를 참조하면, 장치(1100)가 인코딩 장치인 경우, 장치(1100)는 마이크로폰(1140), 아날로그-디지털 변환기(1150) 등을 더 포함할 수 있다.
예를 들어, 마이크로폰(1140)은 아날로그 오디오 신호를 얻기 위해 샘플링을 수행하도록 구성될 수 있다.
예를 들어, 아날로그-디지털 변환기(1150)는 아날로그 오디오 신호를 디지털 오디오 신호로 변환하도록 구성될 수 있다.
도 11c를 참조하면, 장치(1100)가 인코딩 장치인 경우, 장치(1100)는 스피커(1160), 디지털-아날로그 변환기(1170) 등을 더 포함할 수 있다.
예를 들어, 디지털-아날로그 변환기(1170)는 디지털 오디오 신호를 아날로그 오디오 신호로 변환하도록 구성될 수 있다.
예를 들어, 스피커(1160)는 아날로그 오디오 신호를 재생하도록 구성될 수 있다.
또한, 도 12a를 참조하면, 본 출원의 실시예는 본 출원의 실시예에서 제공되는 임의의 방법을 구현하도록 구성된 몇몇 기능 유닛을 포함하는 장치(1200)를 제공한다.
예를 들어, 장치(1200)가 도 2에 도시된 실시예에서 해당 방법을 수행하는 경우. 장치(1200)는:
현재 프레임에 대한 채널 조합 방식을 결정하고, 이전 프레임에 대한 채널 조합 방식 및 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 코딩 모드를 결정하도록 구성된 제1 결정 유닛(1210); 및
현재 프레임의 코딩 모드에 대응하는 시간-도메인 다운믹스 처리에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호를 획득하도록 구성된 인코딩 유닛(1220) 을 포함할 수 있다.
또한, 도 12b를 참조하면, 장치(1200)는 현재 프레임의 시간-도메인 스테레오 파라미터를 결정하도록 구성된 제2 결정 유닛(1230)을 더 포함할 수 있다. 인코딩 유닛(1220)은 현재 프레임의 시간-도메인 스테레오 파라미터를 인코딩하도록 추가로 구성될 수도 있다.
다른 예를 들어, 도 12c를 참조하면, 장치(1200)가 도 3에 도시된 실시예에서 대응하는 방법을 수행할 때, 장치(1200)는:
비트스트림에 있는 현재 프레임의 채널 조합 방식 플래그에 기초하여 현재 프레임에 대한 채널 조합 방식을 결정하고; 이전 프레임에 대한 채널 조합 방식 및 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 디코딩 모드를 결정하도록 구성된 제3 결정 유닛(1240); 및
비트스트림에 기초하여 디코딩을 수행하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호를 획득하고; 현재 프레임의 디코딩 모드에 대응하는 시간-도메인 업믹스 처리에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하도록 구성된 디코딩 유닛(1250) 을 포함할 수 있다.
장치가 다른 방법을 수행하는 경우는 유추에 의해 추론된다.
본 출원의 실시예는 컴퓨터 판독 가능형 저장 매체를 제공한다. 컴퓨터 판독 가능 저장 매체는 프로그램 코드를 저장하고, 프로그램 코드는 본 출원의 실시예에서 제공되는 임의의 방법으로 일부 또는 모든 단계를 수행하기 위한 명령을 포함한다.
본 출원의 실시예는 컴퓨터 프로그램 제품을 제공한다. 컴퓨터 프로그램 제품이 컴퓨터에서 실행될 때, 컴퓨터는 본 출원의 실시예에서 제공되는 임의의 방법으로 일부 또는 모든 단계를 수행할 수 있다.
전술한 실시예에서, 모든 실시예의 설명은 각각의 초점을 갖는다. 실시예에서 상세하게 설명되지 않은 부분에 대해서는 다른 실시예의 관련 설명을 참조한다.
본 출원에 제공된 여러 실시예에서, 개시된 장치는 다른 방식으로 구현될 수 있음을 이해해야 한다. 예를 들어, 설명된 장치 실시예는 단지 예일 뿐이다. 예를 들어, 유닛 분할은 단지 논리적 기능 분할이거나 실제 구현에서 다른 분할일 수 있다. 예를 들어, 복수의 유닛 또는 구성 요소가 다른 시스템에 결합되거나 통합될 수 있거나, 일부 특징이 무시되거나 수행되지 않을 수 있다. 또한, 표시되거나 설명된 상호 간접 결합 또는 직접 결합 또는 통신 연결은 일부 인터페이스를 사용하여 구현될 수 있다. 장치 또는 유닛 사이의 간접 결합 또는 통신 연결은 전자 또는 다른 형태로 구현될 수 있다.
개별 부품으로 설명된 유닛은 물리적으로 분리되거나 물리적으로 분리되지 않을 수 있으며, 유닛으로 표시되는 구성 요소는 물리적 유닛이거나 아닐 수 있다. 구체적으로, 구성 요소들은 하나의 위치에 위치할 수 있거나 복수의 네트워크 유닛 상에 분배될 수 있다. 유닛의 일부 또는 전부는 실시예의 솔루션의 목적을 달성하기 위한 실제 필요에 따라 선택될 수 있다.
또한, 본 발명의 실시예에서의 기능 유닛은 하나의 처리 유닛에 통합될 수 있거나, 또는 각각의 유닛이 물리적으로 단독으로 존재할 수 있거나, 또는 둘 이상의 유닛이 하나의 유닛에 통합될 수 있다. 통합 유닛은 하드웨어 형태로 구현되거나, 소프트웨어 기능 유닛 형태로 구현될 수 있다.
통합 유닛이 소프트웨어 기능 유닛의 형태로 구현되고 독립적인 제품으로서 판매되거나 사용될 때, 통합 유닛은 컴퓨터 판독 가능 저장 매체에 저장될 수 있다. 이러한 이해에 기초하여, 본 발명의 기술 솔루션은 본질적으로, 또는 종래 기술에 기여하는 부분, 또는 기술 솔루션의 전부 또는 일부가 소프트웨어 제품의 형태로 구현될 수 있다. 컴퓨터 소프트웨어 제품은 저장 매체에 저장되며 컴퓨터 장치(개인용 컴퓨터, 서버, 네트워크 장치 등일 수 있음)에게 본 발명의 실시예에서 설명된 방법의 단계 전부 또는 일부를 수행하도록 지시하기 위한 몇 가지 명령을 포함한다. 상기 저장 매체는 USB 플래시 드라이브, 판독 전용 메모리(Read-Only Memory, ROM), 랜덤 액세스 메모리(Random Access Memory, RAM), 이동식 하드 디스크, 자기 디스크 또는 광디스크와 같은 프로그램 코드를 저장할 수 있는 임의의 매체를 포함한다.

Claims (39)

  1. 오디오 인코딩 방법으로서,
    오디오 신호의 현재 프레임에 대한 채널 조합 방식을 결정하는 단계;
    상기 현재 프레임에 대한 상기 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여, 상기 현재 프레임에 대한 상기 채널 조합 방식이 상기 이전 프레임에 대한 상기 채널 조합 방식과 다를 때 상기 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 믹스 처리(segmented time-domain mix processing)을 수행하여 일차 채널 신호 및 이차 채널 신호를 획득하는 단계; 및
    상기 일차 채널 신호, 상기 이차 채널 신호, 및 상기 현재 프레임에 대한 채널 조합 방식을 나타내는 채널 조합 방식 플래그를 인코딩하여 비트스트림을 획득하는 단계
    를 포함하는 오디오 인코딩 방법.
  2. 제1항에 있어서,
    상기 현재 프레임에 대한 상기 채널 조합 방식은 복수의 채널 조합 방식 중 하나이고, 상기 복수의 채널 조합 방식은 비 상관 신호 채널 조합 방식(anticorrelated signal channel combination scheme) 및 상관 신호 채널 조합 방식(correlated signal channel combination scheme)을 포함하고, 상기 상관 신호 채널 조합 방식은 니어 인 페이즈 시그널(near in phase signal)에 대응하는 채널 조합 방식이고, 상기 비 상관 신호 채널 조합 방식은 니어 아웃 오브 페이즈 시그널(near out of phase signal)에 대응하는 채널 조합 방식인, 오디오 인코딩 방법.
  3. 제2항에 있어서,
    상기 이전 프레임에 대한 상기 채널 조합 방식은 상기 상관 신호 채널 조합 방식이고, 상기 현재 프레임에 대한 상기 채널 조합 방식은 상기 비 상관 신호 채널 조합 방식이고,
    상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호는 상기 좌측 및 우측 채널 신호의 시작 세그먼트, 상기 좌측 및 우측 채널 신호의 중간 세그먼트, 및 상기 좌측 및 우측 채널 신호의 종료 세그먼트를 포함하고, 상기 현재 프레임에서의 상기 일차 및 이차 채널 신호는 상기 일차 및 이차 채널 신호의 시작 세그먼트, 상기 일차 및 이차 채널 신호의 중간 세그먼트, 및 상기 일차 및 이차 채널 신호의 종료 세그먼트를 포함하고; 그리고
    상기 현재 프레임에 대한 상기 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여, 상기 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 믹스 처리(segmented time-domain mix processing)을 수행하여 상기 현재 프레임의 일차 채널 신호 및 이차 채널 신호를 획득하는 단계는:
    상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터(channel combination ratio factor) 및 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 시간-도메인 믹스 처리 방식(time-domain mix processing manner)을 사용함으로써, 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 상기 시작 세그먼트 시작에 대한 시간-도메인 믹스 처리를 수행하여 상기 현재 프레임에서의 상기 일차 및 이차 채널 신호의 상기 시작 세그먼트를 획득하는 단계;
    상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 세그먼트 상기 종료 도메인에 대한 시간-도메인 믹스 처리를 수행하여 상기 현재 프레임에서의 일차 및 이차 채널 신호의 성가 종료 세그먼트를 획득하는 단계; 및
    상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 시간-도메인 믹스 처리 방식을 사용하여 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 상기 중간 세그먼트에 대해 시간-도메인 믹스 처리를 수행하여 상기 일차 및 이차 채널 신호의 제1 중간 세그먼트를 획득하고; 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 믹스 처리 방식을 사용하여 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 상기 중간 세그먼트에 대해 시간-도메인 믹스 처리를 수행하여 상기 일차 및 이차 채널 신호의 제2 중간 세그먼트를 획득하며; 그리고 상기 일차 및 이차 채널 신호의 제1 중간 세그먼트 및 상기 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리를 수행하여, 상기 현재 프레임에서의 상기 일차 및 이차 채널 신호의 중간 세그먼트를 획득하는 단계
    를 포함하는, 오디오 인코딩 방법.
  4. 제3항에 있어서,
    상기 일차 및 이차 채널 신호의 상기 제1 중간 세그먼트에 대응하는 가중 계수는 페이드-아웃 팩터(fade-out factor)이고, 상기 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대응하는 가중 계수는 페이드-인 팩터(fade-in factor)인, 오디오 인코딩 방법.
  5. 제4항에 있어서,
    Figure pat00872
    ; 여기서
    Figure pat00873
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pat00874
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pat00875
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 종료 세그먼트를 나타내고,
    Figure pat00876
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 종료 세그먼트를 나타내고,
    Figure pat00877
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 중간 세그먼트를 나타내고,
    Figure pat00878
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 중간 세그먼트를 나타내고;
    Figure pat00879
    은 상기 현재 프레임에서의 상기 일차 채널 신호를 나타내고;
    Figure pat00880
    은 상기 현재 프레임에서의 이차 채널 신호를 나타내고;
    Figure pat00881
    ;
    Figure pat00882
    는 페이드-인 팩터를 나타내고,
    Figure pat00883
    은 페이드-아웃 팩터를 나타내며,
    Figure pat00884
    Figure pat00885
    의 합은 1이며;
    n은 샘플링 포인트 번호를 나타내고,
    Figure pat00886
    이며;
    Figure pat00887
    이고; 그리고
    Figure pat00888
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 제1 중간 세그먼트를 나타내고,
    Figure pat00889
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 제1 중간 세그먼트를 나타내고,
    Figure pat00890
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 제2 중간 세그먼트를 나타내고,
    Figure pat00891
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 제2 중간 세그먼트를 나타내는, 오디오 인코딩 방법.
  6. 제5항에 있어서,
    Figure pat00892
    Figure pat00893
    인, 오디오 인코딩 방법.
  7. 제5항 또는 제6항에 있어서,
    Figure pat00894
    ;
    Figure pat00895
    ;
    Figure pat00896
    ; 및
    Figure pat00897
    ; 여기서
    Figure pat00898
    은 상기 현재 프레임에서 상기 좌측 채널 신호를 나타내고,
    Figure pat00899
    은 상기 현재 프레임에서 상기 우측 채널 신호를 나타내고;
    Figure pat00900
    은 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 믹스 매트릭스를 나타내고,
    Figure pat00901
    은 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터에 기초하여 구성되고;
    Figure pat00902
    는 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 믹스 매트릭스를 나타내고,
    Figure pat00903
    는 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터에 기초하여 구성되는, 오디오 인코딩 방법.
  8. 제7항에 있어서,
    Figure pat00904
    , 또는
    Figure pat00905
    , 또는
    Figure pat00906
    , 또는
    Figure pat00907
    , 또는
    Figure pat00908
    , 또는
    Figure pat00909
    , 여기서
    Figure pat00910
    ,
    Figure pat00911
    Figure pat00912
    은 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터를 나타내는, 오디오 인코딩 방법.
  9. 제7항 또는 제8항에 있어서,
    Figure pat00913
    , 또는
    Figure pat00914
    , 여기서
    Figure pat00915
    는 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터를 나타내는, 오디오 인코딩 방법.
  10. 제2항에 있어서,
    상기 이전 프레임에 대한 상기 채널 조합 방식은 상기 비 상관 신호 채널 조합 방식이고, 상기 현재 프레임에 대한 상기 채널 조합 방식은 상기 상관 신호 채널 조합 방식이고;
    상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호는 상기 좌측 및 우측 채널 신호의 시작 세그먼트, 상기 좌측 및 우측 채널 신호의 중간 세그먼트, 및 상기 좌측 및 우측 채널 신호의 종료 세그먼트를 포함하고, 상기 현재 프레임의 상기 일차 및 이차 채널 신호는 상기 일차 및 이차 채널 신호의 시작 세그먼트, 상기 일차 및 이차 채널 신호의 중간 세그먼트, 및 상기 일차 및 이차 채널 신호의 종료 세그먼트를 포함하고; 그리고
    상기 현재 프레임에 대한 상기 채널 조합 방식 및 상기 이전 프레임에 대한 상기 채널 조합 방식에 기초하여 상기 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 믹스 처리를 수행하여, 상기 현재 프레임에서의 일차 채널 신호 및 이차 채널 신호를 획득하는 단계는:
    상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 상기 시작 세그먼트에 대한 시간-도메인 믹스 처리를 수행하여 상기 현재 프레임에서의 상기 일차 및 이차 채널 신호의 상기 시작 세그먼트를 획득하는 단계;
    상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 시간-도메인 믹스 처리 방식을 사용하여, 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 상기 종료 세그먼트에 대한 시간-도메인 믹스 처리를 수행하여 상기 현재 프레임에서의 사익 일차 및 이차 채널 신호의 상기 종료 세그먼트를 획득하는 단계; 및
    상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 시간-도메인 믹스 처리 방식을 사용하여, 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 상기 중간 세그먼트에 대한 시간-도메인 믹스 처리를 수행하여 상기 일차 및 이차 채널 신호의 제3 중간 세그먼트를 획득하고; 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 시간-도메인 믹스 처리 방식을 사용하여, 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 상기 중간 세그먼트에 대한 시간-도메인 믹스 처리를 수행하여 상기 일차 및 이차 채널 신호의 제4 중간 세그먼트를 획득하며; 그리고 상기 일차 및 이차 채널 신호의 제3 중간 세그먼트 및 상기 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리를 수행하여, 상기 현재 프레임에서의 상기 일차 및 이차 채널 신호의 중간 세그먼트를 획득하는 단계
    를 포함하는, 오디오 인코딩 방법.
  11. 제10항에 있어서,
    상기 일차 및 이차 채널 신호의 제3 중간 세그먼트 및 상기 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 상기 일차 및 이차 채널 신호의 상기 제3 중간 세그먼트에 대응하는 가중 계수는 페이드-아웃 팩터이고, 상기 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대응하는 가중 계수는 페이드-인 팩터인, 오디오 인코딩 방법.
  12. 제11항에 있어서,
    Figure pat00916
    , 여기서
    Figure pat00917
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pat00918
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pat00919
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 종료 세그먼트를 나타내고,
    Figure pat00920
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 종료 세그먼트를 나타내고,
    Figure pat00921
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 중간 세그먼트를 나타내고,
    Figure pat00922
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 중간 세그먼트를 나타내고;
    Figure pat00923
    은 상기 현재 프레임에서의 상기 일차 채널 신호를 나타내고;
    Figure pat00924
    은 상기 현재 프레임에서의 이차 채널 신호를 나타내고;
    Figure pat00925
    ;
    Figure pat00926
    는 페이드-인 팩터를 나타내고,
    Figure pat00927
    은 페이드-아웃 팩터를 나타내며,
    Figure pat00928
    Figure pat00929
    의 합은 1이며;
    n은 샘플링 포인트 번호를 나타내고,
    Figure pat00930
    이며;
    Figure pat00931
    이고; 그리고
    Figure pat00932
    은 상기 현재 프레임에서 상기 일차 채널 신호의 제3 중간 세그먼트를 나타내고,
    Figure pat00933
    은 상기 현재 프레임에서 상기 이차 채널 신호의 제3 중간 세그먼트를 나타내고,
    Figure pat00934
    은 상기 현재 프레임에서 상기 일차 채널 신호의 제4 중간 세그먼트를 나타내고,
    Figure pat00935
    은 상기 현재 프레임에서 상기 이차 채널 신호의 제4 중간 세그먼트를 나타내는, 오디오 인코딩 방법.
  13. 제12항에 있어서,
    Figure pat00936
    , 및
    Figure pat00937
    인, 오디오 인코딩 방법.
  14. 제12항 또는 제13항에 있어서,
    Figure pat00938
    ;
    Figure pat00939
    ;
    Figure pat00940
    ; 및
    Figure pat00941
    ; 여기서
    Figure pat00942
    은 상기 현재 프레임에서의 상기 좌측 채널 신호를 나타내고,
    Figure pat00943
    은 상기 현재 프레임에서의 상기 우측 채널 신호를 나타내고; 그리고
    Figure pat00944
    는 상기 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 믹스 매트릭스를 나타내고,
    Figure pat00945
    는 상기 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성되고;
    Figure pat00946
    은 상기 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 믹스 매트릭스를 나타내고,
    Figure pat00947
    은 상기 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성되는, 오디오 인코딩 방법.
  15. 제14항에 있어서,
    Figure pat00948
    , 또는
    Figure pat00949
    , 또는
    Figure pat00950
    , 또는
    Figure pat00951
    , 또는
    Figure pat00952
    , 또는
    Figure pat00953
    , 여기서
    Figure pat00954
    Figure pat00955
    ; 그리고
    Figure pat00956
    은 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터를 나타내는, 오디오 인코딩 방법.
  16. 제14항 또는 제15항에 있어서,
    Figure pat00957
    , 또는
    Figure pat00958
    , 여기서
    Figure pat00959
    는 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터를 나타내는, 오디오 인코딩 방법.
  17. 제1항 내지 제8항 및 제10항 내지 제15항 중 어느 한 항에 있어서,
    Figure pat00960
    , 또는
    Figure pat00961
    , 또는
    Figure pat00962
    , 여기서
    Figure pat00963
    은 상기 현재 프레임에서 원래의 좌측 채널 신호를 나타내고,
    Figure pat00964
    은 상기 현재 프레임에서 원래의 우측 채널 신호를 나타내고;
    Figure pat00965
    은 상기 현재 프레임에서 시간-도메인 전처리를 거친 좌측 채널 신호를 나타내고,
    Figure pat00966
    은 상기 현재 프레임에서 시간-도메인 전처리를 거친 우측 채널 신호를 나타내고;
    Figure pat00967
    은 상기 현재 프레임에서 지연 정렬을 거친 좌측 채널 신호를 나타내고,
    Figure pat00968
    은 상기 현재 프레임에서 지연 정렬을 거친 우측 채널 신호를 나타내는, 오디오 인코딩 방법.
  18. 시간-도메인 스테레오 디코딩 방법으로서,
    비트스트림을 수신하는 단계;
    오디오 신호의 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호, 및 상기 현재 프레임에 대한 채널 조합 방식을 얻기 위해 상기 비트스트림에 기초하여 디코딩을 수행하는 단계; 및
    상기 현재 프레임에 대한 상기 채널 조합 방식이 이전 프레임에 대한 채널 조합 방식과 다를 때, 상기 현재 프레임에 대한 상기 채널 조합 방식 및 상기 이전 프레임에 대한 상기 채널 조합 방식에 기초하여 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호에 대해 세그먼트화된 시간-도메인 믹스 처리를 수행하여 상기 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계
    를 포함하는 시간-도메인 스테레오 디코딩 방법.
  19. 제18항에 있어서,
    상기 현재 프레임에 대한 상기 채널 조합 방식은 복수의 채널 조합 방식 중 하나이고, 상기 복수의 채널 조합 방식은 비 상관 신호 채널 조합 방식 및 상관 신호 채널 조합 방식을 포함하고, 상기 상관 신호 채널 조합 방식은 니어 인 페이즈 시그널(near in phase signal)에 대응하는 채널 조합 방식이고, 상기 비 상관 신호 채널 조합 방식은 니어 아웃 오브 페이즈 시그널(near out of phase signal)에 대응하는 채널 조합 방식인, 시간-도메인 스테레오 디코딩 방법.
  20. 제19항에 있어서,
    상기 이전 프레임에 대한 상기 채널 조합 방식은 상기 상관 신호 채널 조합 방식이고, 상기 현재 프레임에 대한 상기 채널 조합 방식은 상기 비 상관 신호 채널 조합 방식이고;
    상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호는 상기 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트, 상기 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트, 및 상기 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트를 포함하고, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호는 상기 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트, 상기 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트, 및 상기 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트를 포함하고; 그리고
    상기 현재 프레임에 대한 상기 채널 조합 방식 및 상기 이전 프레임에 대한 상기 채널 조합 방식에 기초하여 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호에 대해 세그먼트화된 시간-도메인 믹스 처리를 수행하여 상기 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계는:
    상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 시간-도메인 믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 상기 시작 세그먼트에 대한 시간-도메인 믹스 처리를 수행하여 상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호의 상기 시작 세그먼트를 획득하는 단계;
    상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트에 대한 시간-도메인 믹스 처리를 수행하여 상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호의 세그먼트를 획득하는 단계; 및
    상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 시간-도메인 믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 상기 중간 세그먼트에 대한 시간-도메인 믹스 처리를 수행하여 상기 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트를 획득하고; 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 시간-도메인 믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 상기 중간 세그먼트에 대한 시간-도메인 믹스 처리를 수행하여 상기 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트를 획득하며; 그리고 상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트를 획득하기 위해, 상기 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트 및 상기 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리를 수행하는 단계
    를 포함하는, 시간-도메인 스테레오 디코딩 방법.
  21. 제20항에 있어서,
    상기 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트에 대응하는 가중 계수는 페이드-아웃 팩터이고, 상기 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대응하는 가중 계수는 페이드-인 팩터인, 시간-도메인 스테레오 디코딩 방법.
  22. 제21항에 있어서,
    Figure pat00969
    ; 여기서
    Figure pat00970
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pat00971
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pat00972
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 상기 종료 세그먼트를 나타내고,
    Figure pat00973
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 종료 세그먼트를 나타내고,
    Figure pat00974
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 상기 중간 세그먼트를 나타내고,
    Figure pat00975
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 상기 중간 세그먼트를 나타내고;
    Figure pat00976
    은 현재 프레임에서의 재구성된 좌측 채널 신호를 나타내고;
    Figure pat00977
    은 현재 프레임에서의 재구성된 우측 채널 신호를 나타내고;
    Figure pat00978
    ;
    Figure pat00979
    은 페이드-인 팩터를 나타내고,
    Figure pat00980
    은 페이드-아웃 팩터를 나타내며,
    Figure pat00981
    Figure pat00982
    의 합은 1이며;
    n은 샘플링 포인트 번호를 나타내고, 그리고
    Figure pat00983
    이며;
    0<
    Figure pat00984
    <
    Figure pat00985
    <
    Figure pat00986
    이고; 그리고
    Figure pat00987
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 제1 중간 세그먼트를 나타내고,
    Figure pat00988
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 제1 중간 세그먼트를 나타내고,
    Figure pat00989
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 제2 중간 세그먼트를 나타내고,
    Figure pat00990
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 제2 중간 세그먼트를 나타내는, 시간-도메인 스테레오 디코딩 방법.
  23. 제22항에 있어서,
    Figure pat00991
    Figure pat00992
    인, 시간-도메인 스테레오 디코딩 방법.
  24. 제22항 또는 제23항에 있어서,
    Figure pat00993
    ;
    Figure pat00994
    ;
    Figure pat00995
    ; 및
    Figure pat00996
    ; 여기서
    Figure pat00997
    은 상기 현재 프레임에서의 상기 디코딩된 일차 채널 신호를 나타내고,
    Figure pat00998
    은 상기 현재 프레임에서의 디코딩된 이차 채널 신호를 나타내고; 그리고
    Figure pat00999
    은 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 믹스 매트릭스를 나타내고,
    Figure pat01000
    은 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성되고;
    Figure pat01001
    는 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 믹스 매트릭스를 나타내며,
    Figure pat01002
    는 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성되는, 시간-도메인 스테레오 디코딩 방법.
  25. 제24항에 있어서,
    Figure pat01003
    , 또는
    Figure pat01004
    , 또는
    Figure pat01005
    , 또는
    Figure pat01006
    , 또는
    Figure pat01007
    , 또는
    Figure pat01008
    , 여기서
    Figure pat01009
    ,
    Figure pat01010
    Figure pat01011
    은 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터를 나타내는, 시간-도메인 스테레오 디코딩 방법.
  26. 제24항에 있어서,
    Figure pat01012
    , 또는
    Figure pat01013
    , 여기서
    Figure pat01014
    는 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터를 나타내는, 시간-도메인 스테레오 디코딩 방법.
  27. 제19항에 있어서,
    상기 이전 프레임에 대한 채널 조합 방식은 상기 비 상관 신호 채널 조합 방식이고, 상기 현재 프레임에 대한 채널 조합 방식은 상기 상관 신호 채널 조합 방식이고;
    상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호는 상기 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트, 상기 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트, 및 상기 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트를 포함하고, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호는 상기 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트, 상기 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트, 및 상기 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트를 포함하고; 그리고
    상기 현재 프레임에 대한 상기 채널 조합 방식 및 상기 이전 프레임에 대한 상기 채널 조합 방식에 기초하여 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호에 대해 세그먼트화된 시간-도메인 믹스 처리를 수행하여 상기 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계는:
    상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트에 대한 시간-도메인 믹스를 수행하여 상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트를 획득하는 단계;
    상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 시간-도메인 믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트에 대한 시간-도메인 믹스 처리를 수행하여 상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호의 상기 종료 세그먼트를 획득하는 단계; 및
    상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 시간-도메인 믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트에 대한 시간-도메인 믹스 처리를 수행하여 상기 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트를 획득하고; 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 시간-도메인 믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트에 대한 시간-도메인 믹스 처리를 수행하여 상기 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트를 획득하며; 그리고 상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트를 획득하기 위해, 상기 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트 및 상기 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리를 수행하는 단계
    를 포함하는, 시간-도메인 스테레오 디코딩 방법.
  28. 제27항에 있어서,
    상기 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트 및 상기 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 상기 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트에 대응하는 가중 계수는 페이드-아웃 팩터이고, 상기 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대응하는 가중 계수는 페이드-인 팩터인, 시간-도메인 스테레오 디코딩 방법.
  29. 제28항에 있어서,
    Figure pat01015
    ; 여기서
    Figure pat01016
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pat01017
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pat01018
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 상기 종료 세그먼트를 나타내고,
    Figure pat01019
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 상기 종료 세그먼트를 나타내고,
    Figure pat01020
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 상기 중간 세그먼트를 나타내고,
    Figure pat01021
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 상기 중간 세그먼트를 나타내고;
    Figure pat01022
    은 현재 프레임에서의 재구성된 좌측 채널 신호를 나타내고;

    Figure pat01023
    은 현재 프레임에서의 재구성된 우측 채널 신호를 나타내고;
    Figure pat01024
    이고;
    Figure pat01025
    은 페이드-인 팩터를 나타내고,
    Figure pat01026
    은 페이드-아웃 팩터를 나타내며,
    Figure pat01027
    Figure pat01028
    의 합은 1이며;
    n은 샘플링 포인트 번호를 나타내고,
    Figure pat01029
    이며;
    0<
    Figure pat01030
    <
    Figure pat01031
    <
    Figure pat01032
    이고; 그리고
    Figure pat01033
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 제3 중간 세그먼트를 나타내고,
    Figure pat01034
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 제3 중간 세그먼트를 나타내고; 그리고
    Figure pat01035
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 제4 중간 세그먼트를 나타내고,
    Figure pat01036
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 제4 중간 세그먼트를 나타내는, 시간-도메인 스테레오 디코딩 방법.
  30. 제29항에 있어서,
    Figure pat01037
    Figure pat01038
    인, 시간-도메인 스테레오 디코딩 방법.
  31. 제29항 또는 제30항에 있어서,
    Figure pat01039
    ;
    Figure pat01040
    ;
    Figure pat01041
    ; 및
    Figure pat01042
    ; 여기서
    Figure pat01043
    은 상기 현재 프레임에서의 상기 디코딩된 일차 채널 신호를 나타내고,
    Figure pat01044
    은 상기 현재 프레임에서의 상기 디코딩된 이차 채널 신호를 나타내고; 그리고
    Figure pat01045
    는 상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 믹스 매트릭스를 나타내고,
    Figure pat01046
    는 상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성되고;
    Figure pat01047
    은 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 믹스 매트릭스를 나타내고,
    Figure pat01048
    은 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터에 기초하여 구성되는, 시간-도메인 스테레오 디코딩 방법.
  32. 제31항에 있어서,
    Figure pat01049
    , 또는
    Figure pat01050
    , 또는
    Figure pat01051
    , 또는
    Figure pat01052
    , 또는
    Figure pat01053
    , 또는
    Figure pat01054
    , 여기서
    Figure pat01055
    Figure pat01056
    ; 그리고
    Figure pat01057
    은 상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터를 나타내는, 시간-도메인 스테레오 디코딩 방법.
  33. 제31항에 있어서,
    Figure pat01058
    , 또는
    Figure pat01059
    , 여기서
    Figure pat01060
    는 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타내는, 시간-도메인 스테레오 디코딩 방법.
  34. 서로 연결된 프로세서 및 메모리를 포함하는 시간-도메인 스테레오 인코딩 장치로서,
    상기 프로세서는 제1항 내지 제17항 중 어느 한 항에 따른 방법을 수행하도록 구성되어 있는, 시간-도메인 스테레오 인코딩 장치.
  35. 서로 연결된 프로세서 및 메모리를 포함하는 시간-도메인 스테레오 디코딩 장치로서,
    상기 프로세서는 제18항 내지 제33항 중 어느 한 항에 따른 방법을 수행하도록 구성되어 있는, 시간-도메인 스테레오 디코딩 장치.
  36. 컴퓨터 판독 가능형 저장 매체로서,
    상기 컴퓨터 판독 가능 저장 매체는 프로그램 코드를 저장하고, 상기 프로그램 코드는 제1항 내지 제17항 중 어느 한 항에 따른 방법을 수행하는 데 사용되는 명령을 포함하는, 컴퓨터 판독 가능형 저장 매체.
  37. 컴퓨터 판독 가능형 저장 매체로서,
    상기 컴퓨터 판독 가능 저장 매체는 프로그램 코드를 저장하고, 상기 프로그램 코드는 제18항 내지 제33항 중 어느 한 항에 따른 방법을 수행하는 데 사용되는 명령을 포함하는, 컴퓨터 판독 가능형 저장 매체.
  38. 컴퓨터 판독 가능형 저장 매체에 저장된 컴퓨터 프로그램으로서,
    컴퓨터로 하여금 제1항 내지 제17항 중 어느 한 항의 방법을 실행하게 하도록 구성되어 있는, 컴퓨터 판독 가능형 저장 매체에 저장된 컴퓨터 프로그램.
  39. 컴퓨터 판독 가능형 저장 매체에 저장된 컴퓨터 프로그램으로서,
    컴퓨터로 하여금 제18항 내지 제33항 중 어느 한 항의 방법을 실행하게 하도록 구성되어 있는, 컴퓨터 판독 가능형 저장 매체에 저장된 컴퓨터 프로그램.
KR1020227010003A 2017-08-10 2018-08-10 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품 KR102492791B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020237002617A KR102637514B1 (ko) 2017-08-10 2018-08-10 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN201710680152.4 2017-08-10
CN201710680152.4A CN109389985B (zh) 2017-08-10 2017-08-10 时域立体声编解码方法和相关产品
KR1020207006985A KR102380454B1 (ko) 2017-08-10 2018-08-10 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품
PCT/CN2018/100088 WO2019029736A1 (zh) 2017-08-10 2018-08-10 时域立体声编解码方法和相关产品

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020207006985A Division KR102380454B1 (ko) 2017-08-10 2018-08-10 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020237002617A Division KR102637514B1 (ko) 2017-08-10 2018-08-10 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품

Publications (2)

Publication Number Publication Date
KR20220045053A true KR20220045053A (ko) 2022-04-12
KR102492791B1 KR102492791B1 (ko) 2023-01-26

Family

ID=65273291

Family Applications (4)

Application Number Title Priority Date Filing Date
KR1020237002617A KR102637514B1 (ko) 2017-08-10 2018-08-10 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품
KR1020227010003A KR102492791B1 (ko) 2017-08-10 2018-08-10 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품
KR1020247004919A KR20240024354A (ko) 2017-08-10 2018-08-10 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품
KR1020207006985A KR102380454B1 (ko) 2017-08-10 2018-08-10 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020237002617A KR102637514B1 (ko) 2017-08-10 2018-08-10 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품

Family Applications After (2)

Application Number Title Priority Date Filing Date
KR1020247004919A KR20240024354A (ko) 2017-08-10 2018-08-10 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품
KR1020207006985A KR102380454B1 (ko) 2017-08-10 2018-08-10 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품

Country Status (7)

Country Link
US (3) US11355131B2 (ko)
EP (1) EP3657499A4 (ko)
KR (4) KR102637514B1 (ko)
CN (2) CN109389985B (ko)
AU (2) AU2018315436B2 (ko)
BR (1) BR112020002842A2 (ko)
WO (1) WO2019029736A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109389985B (zh) * 2017-08-10 2021-09-14 华为技术有限公司 时域立体声编解码方法和相关产品
WO2021000724A1 (zh) * 2019-06-29 2021-01-07 华为技术有限公司 一种立体声编码方法、立体声解码方法和装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017049396A1 (en) * 2015-09-25 2017-03-30 Voiceage Corporation Method and system for time domain down mixing a stereo sound signal into primary and secondary channels using detecting an out-of-phase condition of the left and right channels

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3566931B2 (ja) * 2001-01-26 2004-09-15 日本電信電話株式会社 音声信号の符号列のパケット組立方法、装置及びパケット分解方法、装置並びにこれらの方法を実行するプログラム、プログラムを記録する記録媒体
EP1851866B1 (en) * 2005-02-23 2011-08-17 Telefonaktiebolaget LM Ericsson (publ) Adaptive bit allocation for multi-channel audio encoding
KR101453732B1 (ko) 2007-04-16 2014-10-24 삼성전자주식회사 스테레오 신호 및 멀티 채널 신호 부호화 및 복호화 방법및 장치
CN100571043C (zh) * 2007-11-06 2009-12-16 武汉大学 一种空间参数立体声编解码方法及其装置
CN101552008B (zh) * 2008-04-01 2011-11-16 华为技术有限公司 语音编码方法及装置、语音解码方法及装置
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
CN102157152B (zh) * 2010-02-12 2014-04-30 华为技术有限公司 立体声编码的方法、装置
EP2609589B1 (en) * 2010-09-28 2016-05-04 Huawei Technologies Co., Ltd. Device and method for postprocessing decoded multi-channel audio signal or decoded stereo signal
FR2966634A1 (fr) 2010-10-22 2012-04-27 France Telecom Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase
CN103180899B (zh) * 2010-11-17 2015-07-22 松下电器(美国)知识产权公司 立体声信号的编码装置、解码装置、编码方法及解码方法
US9460723B2 (en) * 2012-06-14 2016-10-04 Dolby International Ab Error concealment strategy in a decoding system
US9990935B2 (en) 2013-09-12 2018-06-05 Dolby Laboratories Licensing Corporation System aspects of an audio codec
CN104347077B (zh) * 2014-10-23 2018-01-16 清华大学 一种立体声编解码方法
CN109389984B (zh) * 2017-08-10 2021-09-14 华为技术有限公司 时域立体声编解码方法和相关产品
CN109389985B (zh) * 2017-08-10 2021-09-14 华为技术有限公司 时域立体声编解码方法和相关产品

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017049396A1 (en) * 2015-09-25 2017-03-30 Voiceage Corporation Method and system for time domain down mixing a stereo sound signal into primary and secondary channels using detecting an out-of-phase condition of the left and right channels

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Bertrand Fatus. Parametric Coding for Spatial Audio. Master’s Thesis, KTH, Stockholm, Sweden. 2015.12. *
ISO/IEC FDIS 23003-3:2011(E), Information technology - MPEG audio technologies - Part 3: Unified speech and audio coding. ISO/IEC JTC 1/SC 29/WG 11. 2011.09.20. *
JungHoe Kim, et al. Enhanced stereo coding with phase parameters for MPEG unified speech and audio coding. Audio Engineering Society Convention 127. 2009.10.12. *
Recommendation ITU-T G.722. 7 kHz audio-coding within 64 kbit/s. 2012.09. *

Also Published As

Publication number Publication date
AU2018315436B2 (en) 2023-05-04
AU2023210620A1 (en) 2023-08-24
US20200175999A1 (en) 2020-06-04
KR102637514B1 (ko) 2024-02-15
WO2019029736A1 (zh) 2019-02-14
RU2020109682A3 (ko) 2021-11-15
RU2020109682A (ru) 2021-09-10
KR20240024354A (ko) 2024-02-23
US20240153511A1 (en) 2024-05-09
EP3657499A4 (en) 2020-08-26
US20220310101A1 (en) 2022-09-29
KR102380454B1 (ko) 2022-03-29
CN109389985A (zh) 2019-02-26
US11900952B2 (en) 2024-02-13
US11355131B2 (en) 2022-06-07
KR20230017367A (ko) 2023-02-03
AU2018315436A1 (en) 2020-03-05
KR102492791B1 (ko) 2023-01-26
CN109389985B (zh) 2021-09-14
CN113782039A (zh) 2021-12-10
BR112020002842A2 (pt) 2020-07-28
EP3657499A1 (en) 2020-05-27
KR20200035306A (ko) 2020-04-02

Similar Documents

Publication Publication Date Title
KR102492119B1 (ko) 오디오 코딩/디코딩 모드를 결정하는 방법 및 관련 제품
KR102493482B1 (ko) 시간-도메인 스테레오 코딩 및 디코딩 방법, 및 관련 제품
KR102380454B1 (ko) 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품
TWI705432B (zh) 音訊編解碼方法、音頻編解碼裝置及電腦可讀存儲介質
JP2022031698A (ja) 時間領域ステレオパラメータ符号化方法および関連製品
RU2772405C2 (ru) Способ стереокодирования и декодирования во временной области и соответствующий продукт
RU2773022C2 (ru) Способ кодирования и декодирования стерео во временной области и сопутствующий продукт
RU2773421C9 (ru) Способ и соответствующий продукт для определения режима кодирования/декодирования аудио
RU2773636C2 (ru) Способ кодирования стереопараметров временной области и соответствующий продукт
RU2773421C2 (ru) Способ и соответствующий продукт для определения режима кодирования/декодирования аудио

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant