KR20200035306A - 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품 - Google Patents

시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품 Download PDF

Info

Publication number
KR20200035306A
KR20200035306A KR1020207006985A KR20207006985A KR20200035306A KR 20200035306 A KR20200035306 A KR 20200035306A KR 1020207006985 A KR1020207006985 A KR 1020207006985A KR 20207006985 A KR20207006985 A KR 20207006985A KR 20200035306 A KR20200035306 A KR 20200035306A
Authority
KR
South Korea
Prior art keywords
current frame
channel
signal
channel combination
denotes
Prior art date
Application number
KR1020207006985A
Other languages
English (en)
Other versions
KR102380454B1 (ko
Inventor
빈 왕
하이팅 리
레이 먀오
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Priority to KR1020227010003A priority Critical patent/KR102492791B1/ko
Publication of KR20200035306A publication Critical patent/KR20200035306A/ko
Application granted granted Critical
Publication of KR102380454B1 publication Critical patent/KR102380454B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Time-Division Multiplex Systems (AREA)

Abstract

오디오 인코딩 및 디코딩 방법 및 관련 장치가 제공된다. 오디오 인코딩 방법은: 현재 프레임에 대한 채널 조합 방식을 결정하는 단계; 상기 현재 프레임에 대한 상기 채널 조합 방식이 상기 이전 프레임에 대한 상기 채널 조합 방식과 다를 때 상기 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리(segmented time-domain downmix processing)을 수행하여 상기 현재 프레임의 일차 채널 신호 및 이차 채널 신호를 획득하는 단계; 및 상기 현재 프레임에서의 상기 획득된 일차 채널 신호 및 이차 채널 신호를 인코딩하는 단계를 포함한다.

Description

시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품
본 발명은 오디오 인코딩 및 디코딩 기술 분야에 관한 것이며, 특히 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품에 관한 것이다.
삶의 질이 향상됨에 따라 사람들은 고품질 오디오에 대한 요구를 증가시키고 있다. 모노 오디오와 비교하여 스테레오 오디오는 다양한 음원에 대한 방향 감각과 분배 감각을 가지며, 선명도, 명료성 및 정보의 존재감을 향상시킬 수 있으므로 사람들에게 인기가 있다.
파라 메트릭 스테레오 인코딩 및 디코딩 기술에서, 스테레오 신호는 모노 신호 및 공간 인식 파라미터로 변환되고, 멀티채널 신호는 압축된다. 이것은 일반적인 스테레오 인코딩 및 디코딩 기술이다. 그러나 파라 메트릭 스테레오 인코딩 및 디코딩 기술에서, 공간 인식 파라미터는 일반적으로 주파수 영역에서 추출될 필요가 있고 시간-주파수 변환이 수행될 필요가 있기 때문에, 전체 코덱의 지연이 비교적 크다. 따라서, 지연에 대한 요구가 비교적 엄격한 경우에는 시간-도메인 스테레오 인코딩 기술이 더 나은 선택이다.
종래의 시간-도메인 스테레오 인코딩 기술에서, 시간-도메인에서 2개의 모노 신호를 얻기 위해 신호가 다운믹스된다. 예를 들어, MS 인코딩 기술에서, 좌측 및 우측 채널 신호는 먼저 다운믹스되어 중간 채널(Mid 채널) 신호 및 사이드 채널(Side 채널) 신호를 획득한다. 예를 들어 L은 좌측 채널 신호를 나타내고 R은 우측 채널 신호를 나타낸다. 이 경우, 중간 채널 신호는 0.5 x(L R)이고, 중간 채널 신호는 좌측 채널과 우측 채널 사이의 상관에 관한 정보를 나타내고; 사이드 채널 신호는 0.5 x(L - R)이고, 사이드 채널 신호는 좌측 채널과 우측 채널의 차이에 관한 정보를 나타낸다. 그리고 미드 채널 신호와 사이드 채널 신호는 모노 인코딩 방법을 사용하여 별도로 인코딩되고, 미드 채널 신호는 일반적으로 더 많은 양의 비트를 사용하여 인코딩되며, 사이드 채널 신호는 일반적으로 더 적은 양의 비트를 사용하여 인코딩된다.
본 출원의 발명자들은 연구 및 실습을 통해, 종래의 시간-도메인 스테레오 인코딩 기술이 사용될 때 일차 신호의 에너지가 극도로 작거나 심지어 에너지가 누락되어 최종 인코딩 품질이 저하되는 것을 발견했다.
본 발명의 실시예는 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품을 제공한다.
제1 관점에 따르면, 본 발명의 실시예는 시간-도메인 스테레오 인코딩 방법을 제공하고, 상기 방법은: 현재 프레임에 대한 채널 조합 방식을 결정하는 단계; 현재 프레임에 대한 채널 조합 방식이 이전 프레임에 대한 채널 조합 방식과 다를 때, 현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 채널 신호 및 이차 채널 신호를 획득하는 단계; 및 현재 프레임에서의 획득된 일차 채널 신호 및 이차 채널 신호를 인코딩하는 단계를 포함한다.
현재 프레임의 스테레오 신호는 예를 들어 현재 프레임의 좌측 및 우측 채널 신호를 포함한다.
현재 프레임에 대한 채널 조합 방식은 복수의 채널 조합 방식 중 하나이다.
예를 들어, 복수의 채널 조합 방식은 비 상관 신호 채널 조합 방식 및 상관 신호 채널 조합 방식을 포함한다. 상관 신호 채널 조합 방식은 니어 인 페이즈 시그널에 대응하는 채널 조합 방식이다. 비 상관 신호 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식이다. 니어 인 페이즈 시그널에 대응하는 채널 조합 방식은 니어 인 페이즈 시그널에 적용 가능하고, 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 적용 가능하다는 것을 이해할 수 있다.
세그먼트화된 시간-도메인 다운믹스 처리는 현재 프레임에서의 좌측 및 우측 채널 신호가 적어도 2개의 세그먼트로 분할되고, 상이한 시간-도메인 다운믹스 처리 방식이 각 세그먼트에 대해 시간-도메인 다운믹스 처리를 수행하는 데 사용되는 것으로 이해될 수 있다. 비 세그먼트화된 시간-도메인 다운믹스 처리와 비교하여, 세그먼트화된 시간-도메인 다운믹스 처리는 인접한 프레임에 대한 채널 조합 방식이 변경될 때 더 원활한 천이를 얻을 가능성이 더 크다는 것을 이해할 수 있다.
전술한 솔루션에서, 현재 프레임에 대한 채널 조합 방식이 결정될 필요가 있으며, 이는 현재 프레임에 대한 채널 조합 방식에 대한 복수의 가능성이 있음을 나타낸다. 하나의 채널 조합 방식이 존재하는 종래의 솔루션과 비교하여, 복수의 가능한 채널 조합 방식을 갖는 이 솔루션은 복수의 가능한 시나리오와 더 잘 호환되고 매칭될 수 있다. 또한, 현재 프레임에 대한 채널 조합 방식과 이전 프레임에 대한 채널 조합 방식이 다를 때, 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하는 메커니즘이 도입된다. 세그먼트화된 시간-도메인 다운믹스 처리 메커니즘은 채널 조합 방식의 원활한 천이를 구현하고 인코딩 품질을 향상시키는 데 도움이 된다.
또한, 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식이 도입되기 때문에, 현재 프레임의 스테레오 신호가 위상 이외의 신호일 때, 더 많은 목표 채널 조합 방식 및 코딩 모드가 있으며, 이는 인코딩 품질을 향상시키는 데 도움이 된다.
예를 들어, 이전 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식 또는 비 상관 신호 채널 조합 방식일 수 있다. 현재 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식 또는 비 상관 신호 채널 조합 방식일 수 있다. 따라서, 현재 프레임과 이전 프레임에 대한 채널 조합 방식이 다른 경우가 여러 가지 있을 수 있다.
구체적으로, 예를 들어, 이전 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식일 때, 현재 프레임에서의 좌측 및 우측 채널 신호는 좌측 및 우측 채널 신호의 시작 세그먼트, 좌측 및 우측 채널 신호의 중간 세그먼트 및 좌측 및 우측 채널 신호의 종료 세그먼트; 현재 프레임에서의 일차 및 이차 채널 신호는 일차 및 이차 채널 신호의 시작 세그먼트, 일차 및 이차 채널 신호의 중간 세그먼트, 및 일차 및 이차 채널 신호의 종료 세그먼트를 포함한다. 이 경우, 현재 프레임에 대한 채널 조합 방식과 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하여, 현재 프레임에서의 일차 및 이차 채널 신호를 획득하는 단계는:
상기 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용하여, 상기 시작에 대한 시간-도메인 다운믹스 처리를 수행하는 단계; 현재 프레임에서의 일차 및 이차 채널 신호의 시작 세그먼트를 획득하기 위해 현재 프레임에서의 좌측 및 우측 채널 신호의 세그먼트;
상기 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 이용하여, 최종 도메인에 대한 시간-도메인 다운믹스 처리를 수행하는 단계; 현재 프레임에서의 일차 및 이차 채널 신호의 종료 세그먼트를 획득하기 위해 현재 프레임에서의 좌측 및 우측 채널 신호의 세그먼트; 과
상기 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용하여 중간에 시간-도메인 다운믹스 처리를 수행하는 단계; 일차 및 이차 채널 신호의 제1 중간 세그먼트를 획득하기 위해 현재 프레임에서의 좌측 및 우측 채널 신호의 세그먼트; 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용하여 중간에 시간-도메인 다운믹스 처리를 수행하는 단계; 일차 및 이차 채널 신호의 제2 중간 세그먼트를 획득하기 위해 현재 프레임에서의 좌측 및 우측 채널 신호의 세그먼트; 및 일차 및 이차 채널 신호의 제1 중간 세그먼트 및 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리를 수행하여, 현재 프레임에서의 일차 및 이차 채널 신호의 중간 세그먼트를 획득하는 단계를 포함한다.
현재 프레임에서의 좌측 및 우측 채널 신호의 시작 세그먼트, 좌측 및 우측 채널 신호의 중간 세그먼트 및 좌측 및 우측 채널 신호의 종료 세그먼트의 길이는 요구 사항에 기초하여 설정될 수 있다. 현재 프레임에서의 좌측 및 우측 채널 신호의 시작 세그먼트, 좌측 및 우측 채널 신호의 중간 세그먼트 및 좌측 및 우측 채널 신호의 종료 세그먼트의 길이는 동일할 수도 있고 부분적으로 동일할 수도 있고 서로 다를 수도 있다.
현재 프레임에서의 일차 및 이차 채널 신호의 시작 세그먼트, 일차 및 이차 채널 신호의 중간 세그먼트 및 일차 및 이차 채널 신호의 종료 세그먼트의 길이는 요구 사항에 기초하여 설정될 수 있다. 현재 프레임에서의 일차 및 이차 채널 신호의 시작 세그먼트, 일차 및 이차 채널 신호의 중간 세그먼트 및 일차 및 이차 채널 신호의 종료 세그먼트의 길이는 동일할 수도 있고 부분적으로 동일할 수도 있고 서로 다를 수도 있다.
일차 및 이차 채널 신호의 제1 중간 세그먼트 및 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 일차 및 이차 채널 신호의 제1 중간 세그먼트에 대응하는 가중 계수는 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대응하는 가중 계수와 동일할 수 있거나 동일하지 않을 수 있다.
예를 들어, 일차 및 이차 채널 신호의 제1 중간 세그먼트 및 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 일차 및 이차 채널 신호의 제1 중간 세그먼트에 대응하는 가중 계수는 페이드-아웃 팩터이고, 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대응하는 가중 계수가 페이드-인 팩터이다.
일부 가능한 구현에서,
Figure pct00001
; 여기서
Figure pct00002
은 현재 프레임에서 일차 채널 신호의 시작 세그먼트를 나타내고,
Figure pct00003
은 현재 프레임에서 이차 채널 신호의 시작 세그먼트를 나타내고,
Figure pct00004
은 현재 프레임에서 일차 채널 신호의 종료 세그먼트를 나타내고,
Figure pct00005
은 현재 프레임에서 이차 채널 신호의 종료 세그먼트를 나타내고,
Figure pct00006
은 현재 프레임에서 이차 채널 신호의 종료 세그먼트를 나타내고,
Figure pct00007
은 현재 프레임에서 일차 채널 신호의 중간 세그먼트를 나타내고,
Figure pct00008
은 현재 프레임에서 이차 채널 신호의 중간 세그먼트를 나타내고;
Figure pct00009
은 현재 프레임에서의 일차 채널 신호를 나타내고; 그리고
Figure pct00010
은 현재 프레임의 이차 채널 신호를 나타낸다.
예를 들어, 다음과 같다.
Figure pct00011
.
Figure pct00012
은 페이드-인 팩터를 나타내고
Figure pct00013
은 페이드-아웃 팩터를 나타낸다. 예를 들어
Figure pct00014
Figure pct00015
의 합은 1이다.
구체적으로, 예를 들어;
Figure pct00016
Figure pct00017
이다. 확실히,
Figure pct00018
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다. 확실히,
Figure pct00019
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다.
여기서, n은 샘플링 포인트 수를 나타내고,
Figure pct00020
, 및 0
Figure pct00021
<
Figure pct00022
<
Figure pct00023
이다.
예를 들어
Figure pct00024
은 100, 107, 120, 150 또는 다른 값과 같다.
예를 들어
Figure pct00025
는 180, 187, 200, 203 또는 다른 값과 같다.
여기서,
Figure pct00026
은 현재 프레임에서의 일차 채널 신호의 제1 중간 세그먼트를 나타내고,
Figure pct00027
은 현재 프레임에서 이차 채널 신호의 제1 중간 세그먼트를 나타낸다.
Figure pct00028
Figure pct00029
은 현재 프레임에서의 일차 채널 신호의 제2 중간 세그먼트를 나타내고,
Figure pct00030
은 현재 프레임에서 이차 채널 신호의 제2 중간 세그먼트를 나타낸다.
일부 가능한 구현에서,
Figure pct00031
;
Figure pct00032
;
Figure pct00033
; 및
Figure pct00034
.
Figure pct00035
은 현재 프레임의 좌측 채널 신호를 나타내고
Figure pct00036
은 현재 프레임의 우측 채널 신호를 나타낸다.
Figure pct00037
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pct00038
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pct00039
Figure pct00040
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pct00041
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pct00042
은 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pct00043
, 또는
Figure pct00044
, 또는
Figure pct00045
, 또는
Figure pct00046
, 또는
Figure pct00047
, 또는
Figure pct00048
.
여기서,
Figure pct00049
,
Figure pct00050
Figure pct00051
는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pct00052
은 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pct00053
, 또는
Figure pct00054
, 여기서
Figure pct00055
는 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
구체적으로, 다른 예를 들어, 이전 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식일 때, 현재 프레임에서의 좌측 및 우측 채널 신호는 좌측 및 우측 채널 신호의 시작 세그먼트, 좌측 및 우측 채널 신호의 중간 세그먼트, 및 좌측 및 우측 채널 신호의 종료 세그먼트를 포함하고; 현재 프레임에서의 일차 및 이차 채널 신호는 일차 및 이차 채널 신호의 시작 세그먼트, 일차 및 이차 채널 신호의 중간 세그먼트, 및 일차 및 이차 채널 신호의 종료 세그먼트를 포함한다. 이 경우, 현재 프레임에 대한 채널 조합 방식과 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하여, 현재 프레임에서의 일차 및 이차 채널 신호를 획득하는 단계는:
상기 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써, 현재 프레임에서의 좌측 및 우측 채널 신호의 시작 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호의 시작 세그먼트를 획득하는 단계;
현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써, 현재 프레임에서의 좌측 및 우측 채널 신호의 종료 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호의 종료 세그먼트를 획득하는 단계; 및
상기 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써, 현재 프레임에서의 좌측 및 우측 채널 신호의 중간 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 일차 및 이차 채널 신호의 제3 중간 세그먼트를 획득하고; 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써 현재 프레임에서의 좌측 및 우측 채널 신호의 중간 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 일차 및 이차 채널 신호의 제4 중간 세그먼트를 획득하며; 그리고 일차 및 이차 채널 신호의 제3 중간 세그먼트 및 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리를 수행하여, 현재 프레임에서의 일차 및 이차 채널 신호의 중간 세그먼트를 획득하는 단계를 포함한다.
일차 및 이차 채널 신호의 제3 중간 세그먼트 및 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 일차 및 이차 채널 신호의 제3 중간 세그먼트에 대응하는 가중 계수는 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대응하는 가중 계수와 동일할 수도 있고 동일하지 않을 수도 있다.
예를 들어, 일차 및 이차 채널 신호의 제3 중간 세그먼트 및 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 일차 및 이차 채널 신호의 제3 중간 세그먼트에 대응하는 가중 계수는 페이드-아웃 팩터이고, 일차 채널 신호 및 이차 채널 신호의 제4 중간 세그먼트에 대응하는 가중 계수가 페이드-인 팩터이다.
일부 가능한 구현에서,
Figure pct00056
; 여기서
Figure pct00057
은 현재 프레임에서 일차 채널 신호의 시작 세그먼트를 나타내고,
Figure pct00058
은 현재 프레임에서 이차 채널 신호의 시작 세그먼트를 나타내고,
Figure pct00059
은 현재 프레임에서 일차 채널 신호의 종료 세그먼트를 나타내고,
Figure pct00060
은 현재 프레임에서 이차 채널 신호의 종료 세그먼트를 나타내고,
Figure pct00061
은 현재 프레임에서의 일차 채널 신호의 중간 세그먼트를 나타내고,
Figure pct00062
은 현재 프레임에서 이차 채널 신호의 중간 세그먼트를 나타내고;
Figure pct00063
은 현재 프레임에서의 일차 채널 신호를 나타내고; 및
Figure pct00064
은 현재 프레임의 이차 채널 신호를 나타낸다.
예를 들면 다음과 같다.
Figure pct00065
.
Figure pct00066
은 페이드-인 팩터를 나타내고
Figure pct00067
은 페이드-아웃 팩터를 나타내며
Figure pct00068
Figure pct00069
의 합은 1이다.
구체적으로, 예를 들어;
Figure pct00070
Figure pct00071
이다. 확실히,
Figure pct00072
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다. 확실히,
Figure pct00073
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다.
여기서, n은 샘플링 포인트 번호를 나타낸다. 예를 들면
Figure pct00074
이다.
여기서 0<
Figure pct00075
<
Figure pct00076
<
Figure pct00077
이다.
예를 들어
Figure pct00078
은 101, 107, 120, 150 또는 다른 값과 같다.
예를 들어
Figure pct00079
는 181, 187, 200, 205 또는 다른 값과 같다.
Figure pct00080
은 현재 프레임에서의 일차 채널 신호의 제3 중간 세그먼트를 나타내고,
Figure pct00081
은 현재 프레임에서 이차 채널 신호의 제3 중간 세그먼트를 나타낸다.
Figure pct00082
Figure pct00083
는 현재 프레임에서의 일차 채널 신호의 제4 중간 세그먼트를 나타내고,
Figure pct00084
는 현재 프레임에서 이차 채널 신호의 제4 중간 세그먼트를 나타낸다.
In some possible implementations, 일부 가능한 구현에서
Figure pct00085
;
Figure pct00086
;
Figure pct00087
; 및
Figure pct00088
.
Figure pct00089
은 현재 프레임의 좌측 채널 신호를 나타내고
Figure pct00090
은 현재 프레임의 우측 채널 신호를 나타낸다.
Figure pct00091
는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pct00092
는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pct00093
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pct00094
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pct00095
는 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pct00096
, 또는
Figure pct00097
, 또는
Figure pct00098
, 또는
Figure pct00099
, 또는
Figure pct00100
, 또는
Figure pct00101
.
여기에서,
Figure pct00102
Figure pct00103
이다.
여기서,
Figure pct00104
은 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pct00105
은 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pct00106
, 또는
Figure pct00107
.
여기서,
Figure pct00108
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
일부 가능한 구현들에서, 현재 프레임에서의 좌측 및 우측 채널 신호는 예를 들어 현재 프레임에서의 원래의 좌측 및 우측 채널 신호일 수 있거나, 시간-도메인 전처리를 거친 좌측 및 우측 채널 신호일 수 있고, 지연 정렬 처리를 거친 좌측 및 우측 채널 신호일 수 있다.
구체적으로 예를 들어
Figure pct00109
, 또는
Figure pct00110
, 또는
Figure pct00111
.
여기에서,
Figure pct00112
은 현재 프레임의 원래 좌측 채널 신호(원래의 좌측 채널 신호는 시간-도메인 전처리를 거치지 않은 좌측 채널 신호이다)를 나타내고,
Figure pct00113
은 현재 프레임의 원래의 우측 채널 신호( 원래의 우측 채널 신호는 시간-도메인 전처리를 거치지 않은 우측 채널 신호이다)를 나타낸다.
Figure pct00114
는 현재 프레임에서 시간-도메인 전처리를 거친 좌측 채널 신호를 나타내고,
Figure pct00115
는 현재 프레임에서 시간-도메인 전처리를 거친 우측 채널 신호를 나타낸다.
Figure pct00116
Figure pct00117
은 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 신호를 나타내고,
Figure pct00118
은 현재 프레임에서 지연 정렬 처리를 거친 우측 채널 신호를 나타낸다.
제2 관점에 따르면, 본 출원의 실시예는 시간-도메인 스테레오 디코딩 방법을 추가로 제공한다. 방법은: 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호를 획득하기 위해 비트스트림에 기초하여 디코딩을 수행하는 단계; 현재 프레임에 대한 채널 조합 방식을 결정하는 단계; 현재 프레임에 대한 채널 조합 방식이 이전 프레임에 대한 채널 조합 방식과 다를 때, 현재에 대한 채널 조합 방식 및 이전 프레임에 대한 프레임 및 채널 조합 방식에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대한 세그먼트화된 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계를 포함한다.
현재 프레임에 대한 채널 조합 방식은 복수의 채널 조합 방식 중 하나이다.
예를 들어, 복수의 채널 조합 방식은 비 상관성 신호 채널 조합 방식 및 상관 신호 채널 조합 방식을 포함한다. 상관 신호 채널 조합 방식은 니어 인 페이즈 시그널에 대응하는 채널 조합 방식이다. 비 상관 신호 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식이다. 니어 인 페이즈 시그널에 대응하는 채널 조합 방식은 니어 인 페이즈 시그널에 적용 가능하고, 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 적용 가능하다는 것을 이해할 수 있다.
세그먼트화된 시간-도메인 업믹스 처리는 현재 프레임에서의 좌측 및 우측 채널 신호가 적어도 2개의 세그먼트로 분할되고, 상이한 시간-도메인 업믹스 처리 방식이 각 세그먼트에 대해 시간-도메인 업믹스 처리를 수행하는 데 사용되는 것으로 이해될 수 있다. 비 세그먼트화된 시간-도메인 업믹스 처리와 비교하여, 세그먼트화된 시간-도메인 업믹스 처리는 인접한 프레임에 대한 채널 조합 방식이 변경될 때 더 원활한 천이를 얻을 가능성이 더 크다는 것을 이해할 수 있다.
전술한 솔루션에서, 현재 프레임에 대한 채널 조합 방식이 결정될 필요가 있으며, 이는 현재 프레임에 대한 채널 조합 방식에 대한 복수의 가능성이 있음을 나타낸다. 하나의 채널 조합 방식이 존재하는 종래의 솔루션과 비교하여, 복수의 가능한 채널 조합 방식을 갖는 이 솔루션은 복수의 가능한 시나리오와 더 잘 호환되고 매칭될 수 있다. 또한, 현재 프레임에 대한 채널 조합 방식과 이전 프레임에 대한 채널 조합 방식이 다를 때, 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 업믹스 처리를 수행하는 메커니즘이 도입된다. 세그먼트화된 시간-도메인 업믹스 처리 메커니즘은 채널 조합 방식의 원활한 천이를 구현하고 인코딩 품질을 향상시키는 데 도움이 된다.
또한, 근사한 위상 신호에 대응하는 채널 조합 방식이 도입되기 때문에, 현재 프레임의 스테레오 신호가 위상 이외의 신호일 때, 더 많은 목표 채널 조합 방식 및 코딩 모드가 있으며, 이는 인코딩 품질을 향상시키는 데 도움이 된다.
예를 들어, 이전 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식 또는 비 상관 신호 채널 조합 방식일 수 있다. 현재 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식 또는 비 상관 신호 채널 조합 방식일 수 있다. 따라서, 현재 프레임과 이전 프레임에 대한 채널 조합 방식이 다른 경우가 여러 가지 있을 수 있다.
구체적으로, 예를 들어, 이전 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식은 비 상관 신호 채널 조합 방식이다. 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호는 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트, 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트, 및 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트를 포함한다. 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호는 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트, 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트, 및 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트를 포함한다. 이 경우, 현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 세그먼트화된 시간-도메인 업믹스 처리를 수행하여, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계는: 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트를 획득하는 단계;
상기 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써, 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트를 획득하는 단계; 및
상기 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써, 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트에 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트를 획득하고; 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트를 획득하며; 그리고 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트를 획득하기 위해, 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리를 수행하는 단계를 포함한다.
재구성된 좌측 및 우측 채널 신호의 시작 세그먼트, 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트 및 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트의 길이는 요구 사항에 기초하여 설정될 수 있다. 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트, 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트의 길이는 동일할 수도 있고 부분적으로 동일할 수도 있고 서로 다를 수도 있다.
디코딩된 일차 및 이차 채널 신호의 시작 세그먼트, 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트, 및 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트의 길이는 요구 사항에 기초하여 설정될 수 있다. 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트, 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트, 및 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트의 길이는 동일할 수도 있고 부분적으로 동일할 수도 있고 서로 다를 수도 있다.
재구성된 좌측 및 우측 채널 신호는 디코딩된 좌측 및 우측 채널 신호일 수 있거나, 지연 조정 처리 및/또는 시간-도메인 후처리가 디코딩된 좌측 및 우측 채널 신호를 획득하기 위해 재구성된 좌측 및 우측 채널 신호에 대해 수행될 수 있다.
재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트에 대응하는 가중 계수는 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대응하는 가중 계수와 동일할 수도 있고 동일하지 않을 수도 있다
예를 들어, 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 가중 계수는 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트에 대응한다. 우측 채널 신호는 페이드-아웃 팩터이고, 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대응하는 가중 계수는 페이드-인 팩터이다.
일부 가능한 구현에서
Figure pct00119
; 여기서
Figure pct00120
은 현재 프레임에서의 재구성된 좌측 채널 신호의 시작 세그먼트를 나타내고,
Figure pct00121
은 현재 프레임에서의 재구성된 우측 채널 신호의 시작 세그먼트를 나타내고,
Figure pct00122
은 현재 프레임에서의 재구성된 좌측 채널 신호의 종료 세그먼트를 나타내고,
Figure pct00123
은 현재 프레임에서의 재구성된 우측 채널 신호의 종료 세그먼트를 나타내고,
Figure pct00124
은 현재 프레임에서의 재구성된 좌측 채널 신호의 중간 세그먼트를 나타내고,
Figure pct00125
은 현재 프레임에서의 재구성된 우측 채널 신호의 중간 세그먼트를 나타내고;
Figure pct00126
은 현재 프레임에서의 재구성된 좌측 채널 신호를 나타내고; 그리고
Figure pct00127
은 현재 프레임에서의 재구성된 우측 채널 신호를 나타낸다.
예를 들면,
Figure pct00128
이다.
예를 들어,
Figure pct00129
은 페이드-인 팩터를 나타내고
Figure pct00130
은 페이드-아웃 팩터를 나타낸다. 예를 들어
Figure pct00131
Figure pct00132
의 합은 1이다.
구체적으로, 예를 들어,
Figure pct00133
Figure pct00134
이다. 확실히,
Figure pct00135
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다. 확실히,
Figure pct00136
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다.
여기서, n은 샘플링 포인트 번호를 나타내고,
Figure pct00137
이다. 여기서 0<
Figure pct00138
<
Figure pct00139
<
Figure pct00140
이다.
Figure pct00141
은 현재 프레임에서의 재구성된 좌측 채널 신호의 제1 중간 세그먼트를 나타내고,
Figure pct00142
은 현재 프레임에서의 재구성된 우측 채널 신호의 제1 중간 세그먼트를 나타낸다.
Figure pct00143
Figure pct00144
은 현재 프레임에서의 재구성된 좌측 채널 신호의 제2 중간 세그먼트를 나타내고,
Figure pct00145
은 현재 프레임에서의 재구성된 우측 채널 신호의 제2 중간 세그먼트를 나타낸다.
일부 가능한 구현에서,
Figure pct00146
;
Figure pct00147
;
Figure pct00148
; 및
Figure pct00149
.
여기서,
Figure pct00150
은 현재 프레임에서의 디코딩된 일차 채널 신호를 나타내고,
Figure pct00151
은 현재 프레임에서 디코딩된 이차 채널 신호를 나타낸다.
Figure pct00152
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
Figure pct00153
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성되고;
Figure pct00154
는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pct00155
는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pct00156
은 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pct00157
, 또는
Figure pct00158
, 또는
Figure pct00159
, 또는
Figure pct00160
, 또는
Figure pct00161
, 또는
Figure pct00162
.
Figure pct00163
,
Figure pct00164
Figure pct00165
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pct00166
은 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pct00167
, 또는
Figure pct00168
여기서,
Figure pct00169
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
구체적으로, 다른 예에서, 이전 프레임에 대한 채널 조합 방식은 비 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식이다. 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호는 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트, 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트, 및 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트를 포함한다. 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호는 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트, 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트, 및 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트를 포함한다. 이 경우, 현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 세그먼트화된 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계는:
이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트를 획득하는 단계;
상기 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트를 획득하는 단계; 및
상기 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써, 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트를 획득하고; 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트를 획득하며; 그리고 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트를 획득하기 위해, 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리를 수행하는 단계를 포함한다.
재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트에 대응하는 가중 계수는 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대응하는 가중 계수와 동일할 수도 있고 동일하지 않을 수도 있다
예를 들어, 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 가중 계수는 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트에 대응한다. 우측 채널 신호는 페이드-아웃 팩터이고, 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대응하는 가중 계수는 페이드-인 팩터이다.
일부 가능한 구현에서,
Figure pct00170
.
여기서,
Figure pct00171
은 현재 프레임에서의 재구성된 좌측 채널 신호의 시작 세그먼트를 나타내고,
Figure pct00172
은 현재 프레임에서의 재구성된 우측 채널 신호의 시작 세그먼트를 나타내고,
Figure pct00173
은 현재 프레임에서의 재구성된 좌측 채널 신호의 종료 세그먼트를 나타내고,
Figure pct00174
은 현재 프레임에서의 재구성된 우측 채널 신호의 종료 세그먼트를 나타내고,
Figure pct00175
은 현재 프레임에서의 재구성된 좌측 채널 신호의 중간 세그먼트를 나타내고,
Figure pct00176
은 현재 프레임에서의 재구성된 우측 채널 신호의 중간 세그먼트를 나타낸다.
여기에서,
Figure pct00177
은 현재 프레임에서의 재구성된 좌측 채널 신호를 나타낸다.
여기서,
Figure pct00178
은 현재 프레임에서의 재구성된 우측 채널 신호를 나타낸다.
예를 들어,
Figure pct00179
이다.
Figure pct00180
은 페이드-인 팩터를 나타내고
Figure pct00181
은 페이드-아웃 팩터를 나타내며
Figure pct00182
Figure pct00183
의 합은 1이다.
구체적으로, 예를 들어;
Figure pct00184
Figure pct00185
이다. 확실히,
Figure pct00186
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다. 확실히,
Figure pct00187
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다.
여기서, n은 샘플링 포인트 번호를 나타낸다. 예를 들면,
Figure pct00188
이다.
여기서 0<
Figure pct00189
<
Figure pct00190
<
Figure pct00191
이다.
예를 들어
Figure pct00192
은 101, 107, 120, 150 또는 다른 값과 같다.
예를 들어
Figure pct00193
는 181, 187, 200, 205 또는 다른 값과 같다.
Figure pct00194
은 현재 프레임에서의 재구성된 좌측 채널 신호의 제3 중간 세그먼트를 나타내고,
Figure pct00195
은 현재 프레임에서의 재구성된 우측 채널 신호의 제3 중간 세그먼트를 나타낸다.
Figure pct00196
Figure pct00197
는 현재 프레임에서의 재구성된 좌측 채널 신호의 제4 중간 세그먼트를 나타내고,
Figure pct00198
는 현재 프레임에서의 재구성된 우측 채널 신호의 제4 중간 세그먼트를 나타낸다.
일부 가능한 구현에서,
Figure pct00199
;
Figure pct00200
;
Figure pct00201
; 및
Figure pct00202
.
여기서,
Figure pct00203
은 현재 프레임에서의 디코딩된 일차 채널 신호를 나타내고,
Figure pct00204
은 현재 프레임에서 디코딩된 이차 채널 신호를 나타낸다.
Figure pct00205
는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
Figure pct00206
이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pct00207
Figure pct00208
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
Figure pct00209
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pct00210
는 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pct00211
, 또는
Figure pct00212
, 또는
Figure pct00213
, 또는
Figure pct00214
, 또는
Figure pct00215
, 또는
Figure pct00216
.
여기서,
Figure pct00217
, 및
Figure pct00218
; 그리고
여기서,
Figure pct00219
은 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pct00220
은 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pct00221
, 또는
Figure pct00222
.
여기서,
Figure pct00223
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
제3 관점에 따르면, 본 출원의 실시예는 시간-도메인 스테레오 인코딩 장치를 추가로 제공하며, 장치는 서로 연결된 프로세서 및 메모리를 포함할 수 있다. 프로세서는 제1 관점에서 임의의 스테레오 인코딩 방법의 일부 또는 모든 단계를 수행하도록 구성될 수 있다.
제4 관점에 따르면, 본 출원의 실시예는 시간-도메인 스테레오 디코딩 장치를 더 제공하고, 장치는 서로 연결된 프로세서 및 메모리를 포함할 수 있다. 프로세서는 제2 관점에서 임의의 스테레오 인코딩 방법의 일부 또는 모든 단계를 수행하도록 구성될 수 있다.
제5 관점에 따르면, 본 출원의 실시예는 제1 관점의 임의의 방법을 구현하도록 구성된 몇몇 기능 유닛을 포함하는 시간-도메인 스테레오 디코딩 장치를 제공한다.
제6 관점에 따르면, 본 출원의 실시예는 제2 양상의 임의의 방법을 구현하도록 구성된 몇몇 기능 유닛을 포함하는 시간-도메인 스테레오 인코딩 장치를 제공한다.
제7 관점에 따르면, 본 출원의 실시예는 컴퓨터 판독 가능 저장 매체를 제공하고, 컴퓨터 판독 가능 저장 매체는 프로그램 코드를 저장하며, 여기서 프로그램 코드는 제1 관점에서 임의의 방법의 일부 또는 모든 단계를 수행하는 데 사용되는 명령을 포함한다.
제8 관점에 따르면, 본 출원의 실시예는 컴퓨터 판독 가능 저장 매체를 제공하고, 컴퓨터 판독 가능 저장 매체는 프로그램 코드를 저장하며, 여기서 프로그램 코드는 제2 관점에서 임의의 방법의 일부 또는 모든 단계를 수행하는 데 사용되는 명령을 포함한다.
제9 관점에 따르면, 본 출원의 실시예는 컴퓨터 프로그램 제품을 제공하고, 컴퓨터 프로그램 제품이 컴퓨터에서 실행될 때, 컴퓨터는 제1 관점에서 임의의 방법의 일부 또는 모든 단계를 수행할 수 있다.
제10 관점에 따르면, 본 출원의 실시예는 컴퓨터 프로그램 제품을 제공하고, 컴퓨터 프로그램 제품이 컴퓨터에서 실행될 때, 컴퓨터는 제2 관점에서 임의의 방법의 일부 또는 모든 단계를 수행할 수 있다.
다음은 본 출원의 실시예 또는 배경을 설명하는데 필요한 첨부 도면을 설명한다.
도 1은 본 출원의 실시예에 따른 니어 아웃 페이즈 시그널의 개략도이다.
도 2는 본 출원의 실시예에 따른 오디오 인코딩 방법의 개략적인 흐름도이다.
도 3은 본 출원의 실시예에 따라 오디오 디코딩 모드를 결정하기 위한 방법의 개략적인 흐름도이다.
도 4는 본 출원의 실시예에 따른 다른 오디오 인코딩 방법의 개략적인 흐름도이다.
도 5는 본 출원의 실시예에 따른 오디오 디코딩 방법의 개략적인 흐름도이다.
도 6은 본 출원의 실시예에 따른 다른 오디오 인코딩 방법의 개략적인 흐름도이다.
도 7은 본 출원의 실시예에 따른 다른 오디오 디코딩 방법의 개략적인 흐름도이다.
도 8은 본 출원의 실시예에 따른 시간-도메인 스테레오 파라미터 결정 방법의 개략적인 흐름도이다.
도 9a는 본 출원의 실시예에 따른 다른 오디오 인코딩 방법의 개략적인 흐름도이다.
도 9b는 본 출원의 실시예에 따라 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산 및 인코딩하는 방법의 개략적인 흐름도이다.
도 9c는 본 출원의 실시예에 따라 현재 프레임에서의 좌측 채널과 우측 채널 사이의 진폭 상관 차이 파라미터를 계산하기 위한 방법의 개략적인 흐름도이다.
도 9d는 본 출원의 실시예에 따라 현재 프레임에서의 좌측 채널과 우측 채널 사이의 진폭 상관 차이 파라미터를 채널 조합 비율 팩터로 변환하는 방법의 개략적인 흐름도이다.
도 10은 본 출원의 실시예에 따른 다른 오디오 디코딩 방법의 개략적인 흐름도이다.
도 11a는 본 출원의 실시예에 따른 장치의 개략도이다.
도 11b는 본 출원의 실시예에 따른 다른 장치의 개략도이다.
도 11c는 본 출원의 실시예에 따른 다른 장치의 개략도이다.
도 12a는 본 출원의 실시예에 따른 다른 장치의 개략도이다.
도 12b는 본 출원의 실시예에 따른 다른 장치의 개략도이다.
도 12c는 본 출원의 실시예에 따른 다른 장치의 개략도이다.
다음은 본 출원의 실시예에서의 첨부 도면을 참조하여 본 출원의 실시예를 설명한다.
본 명세서의 청구 범위, 청구 범위 및 첨부 도면에 언급된 용어 "포함하다", "가지고 있다" 및 이의 임의의 다른 변형은 비 배타적인 포함을 망라하도록 의도된다. 예를 들어, 일련의 단계 또는 단위를 포함하는 프로세스, 방법, 시스템, 제품 또는 장치는 열거된 단계 또는 단위로 제한되지 않고, 선택적으로 미등록 단계 또는 단위를 더 포함할 수 있거나, 또는 추가로 프로세스, 방법, 제품 또는 장치의 다른 고유 단계 또는 단위를 포함한다. 또한, 용어 "제1", "제2", "제3", "제4" 등은 특정 시퀀스를 설명하는 대신 객체를 구별하는 데 사용된다.
본 출원의 실시예의 솔루션은 설명의 편의를 위해 시간-도메인 시나리오에 특정하기 때문에, 시간-도메인 신호는 간단히 "신호"라고 지칭될 수 있음에 유의해야 한다. 예를 들어, 좌측 채널 시간-도메인 신호는 간단히 "좌측 채널 신호"라고 지칭될 수 있다. 다른 예에서, 우측 채널 시간-도메인 신호는 간단히 "우측 채널 신호"라고 지칭될 수 있다. 다른 예에서, 모노 시간-도메인 신호는 간단히 "모노 신호"라고 지칭될 수 있다. 다른 예에서, 참조 채널 시간-도메인 신호는 간단히 "참조 채널 신호"라고 지칭될 수 있다. 다른 예에서, 일차 채널 시간-도메인 신호는 간단히 "일차 채널 신호"라고 지칭될 수 있다. 이차 채널 시간-도메인 신호는 간단히 "이차 채널 신호"라고 지칭될 수 있다. 다른 예로, 중간 채널(Mid Channel) 시간-도메인 신호를 간단히 "중간 채널 신호"라고 지칭할 수 있다. 다른 예로, 사이드 채널(Side Channel) 시간-도메인 신호를 간단히 "사이드 채널 신호"라고 지칭할 수 있다. 다른 경우는 유추하여 추론할 수 있다.
본 출원의 실시예에서, 좌측 채널 시간-도메인 신호 및 우측 채널 시간-도메인 신호는 총칭하여 "좌측 및 우측 채널 시간-도메인 신호"로 지칭될 수 있거나, 또는 "좌측 및 우측 채널 신호"로 집합적으로 지칭될 수 있음에 유의해야 한다. 다시 말해, 좌측 및 우측 채널 시간-도메인 신호는 좌측 채널 시간-도메인 신호 및 우측 채널 시간-도메인 신호를 포함한다. 다른 예를 들어, 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 시간-도메인 신호는 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 시간-도메인 신호 및 현재 프레임에서 지연 정렬 처리를 거친 우측 채널 시간-도메인 신호를 포함한다. 유사하게, 일차 채널 신호 및 이차 채널 신호는 총칭하여 "일차 및 이차 채널 신호"로 지칭될 수 있다. 즉, 일차 및 이차 채널 신호는 일차 채널 신호 및 이차 채널 신호를 포함한다. 다른 예를 들어, 디코딩된 일차 및 이차 채널 신호는 디코딩된 일차 채널 신호 및 디코딩된 이차 채널 신호를 포함한다. 다른 예에서, 재구성된 좌측 및 우측 채널 신호는 좌측 채널 재구성된 신호 및 우측 채널 재구성된 신호를 포함한다. 나머지는 유추하여 추론할 수 있다.
예를 들어, 종래의 MS 인코딩 기술에서, 좌측 및 우측 채널 신호는 먼저 다운믹스되어 미드 채널(Mid Channel) 신호 및 사이드 채널(Side 채널) 신호를 획득한다. 예를 들어 L은 좌측 채널 신호를 나타내고 R은 우측 채널 신호를 나타낸다. 이 경우, 중간 채널 신호는 0.5 x(L R)이고, 중간 채널 신호는 좌측 채널과 우측 채널 사이의 상관에 관한 정보를 나타내고; 사이드 채널 신호는 0.5 x(L - R)이고, 사이드 채널 신호는 좌측 채널과 우측 채널의 차이에 관한 정보를 나타낸다. 그리고 미드 채널 신호와 사이드 채널 신호는 모노 인코딩 방식으로 별도로 인코딩된다. 중간 채널 신호는 일반적으로 더 많은 양의 비트를 사용하여 인코딩되고, 사이드 채널 신호는 일반적으로 더 적은 양의 비트를 사용하여 인코딩된다.
또한, 일부 솔루션에서, 인코딩 품질을 개선하기 위해, 시간-도메인 다운믹스 처리에서 좌측 채널의 우측 채널에 대한 비율을 나타내는 데 사용되는 시간-도메인 스테레오 파라미터를 추출하기 위해 좌측 및 우측 채널 시간-도메인 신호가 분석된다. 제안된 방법의 목적은, 스테레오 좌측 및 우측 채널 신호 사이의 에너지 차이가 비교적 클 때, 시간-도메인 다운믹스 신호에서, 일차 채널의 에너지가 증가될 수 있고, 이차 채널의 에너지가 감소될 수 있다. 예를 들어 L은 좌측 채널 신호를 나타내고 R은 우측 채널 신호를 나타낸다. 이 경우, 일차 채널(Primary channel) 신호는 Y로 표시되며, 여기서 Y = alpha x L + beta x R 이고, Y는 두 채널 간의 상관에 대한 정보를 나타내고; 이차 채널(Secondary channel)은 X로 표시되며, 여기서 X = alpha x L - beta x R 이고, X는 두 채널 사이의 차이에 대한 정보를 나타낸다. 여기서, 알파 및 베타는 0 내지 1의 실수이다.
도 1은 좌측 채널 신호 및 우측 채널 신호의 진폭 변동을 도시한다. 시간-도메인에서, 특정 위치에서 좌측 채널 신호의 샘플링 포인트의 진폭의 절댓값과 대응하는 위치에서 우측 채널 신호의 샘플링 포인트의 진폭의 절댓값은 기본적으로 동일하지만 진폭에는 반대 부호가 있다. 이것은 전형적인 거의 위상이 다른 신호이다. 도 1은 단지 니어 아웃 오브 페이즈 시그널(near out of phase signal)의 전형적인 예를 도시 한 것이다. 실제로, 거의 위상이 맞지 않는 신호는 좌측 및 우측 채널 신호 간의 위상 차가 약 180도인 스테레오 신호이다. 예를 들어, 좌측 및 우측 채널 신호 사이의 위상 차가
Figure pct00224
에 속하는 스테레오 신호는 0° 내지 90° 사이의 임의의 각도일 수 있는 니어 아웃 오브 페이즈 시그널로 지칭될 수 있다. 예를 들어,
Figure pct00225
는 0°, 5°, 15°, 17°, 20°, 30° 또는 40°의 각도와 같을 수 있다.
유사하게, 니어 인 페이즈 시그널은 좌측 및 우측 채널 신호 사이의 위상 차가 대략 0도인 스테레오 신호이다. 예를 들어, 좌측 및 우측 채널 신호 사이의 위상 차가 [-θ, θ]에 속하는 스테레오 신호는 니어 인 페이즈 시그널이라고 지칭될 수 있다.
Figure pct00226
는 0°와 90° 사이의 각도일 수 있다. 예를 들어,
Figure pct00227
는 0°, 5°, 15°, 17 °, 20 °, 30 ° 또는 40 °의 각도와 같을 수 있다.
좌측 및 우측 채널 신호가 거의 동일한 위상 신호일 때, 시간-도메인 다운믹스 처리를 통해 생성된 일차 채널 신호의 에너지는 일반적으로 이차 채널 신호의 에너지보다 상당히 크다. 일차 채널 신호가 더 많은 양의 비트를 사용하여 인코딩되고 이차 채널 신호가 더 적은 양의 비트를 사용하여 인코딩되면, 더 나은 인코딩 효과가 얻어질 수 있다. 그렇지만, 좌측 및 우측 채널 신호가 거의 위상이 다른 신호일 때, 동일한 시간-도메인 다운믹스 처리 방법이 사용되는 경우, 생성된 일차 채널 신호의 에너지가 매우 작거나 손실되어 최종 인코딩 품질이 감소될 수 있다.
다음은 스테레오 인코딩 및 디코딩 품질을 향상시키는 데 도움이 되는 몇 가지 기술적 솔루션을 계속 설명한다.
본 출원의 실시예에서 언급된 인코딩 장치 및 디코딩 장치는 음성 신호의 수집, 저장 및 외부로의 전송과 같은 기능을 갖는 장치일 수 있다. 구체적으로, 인코딩 장치 및 디코딩 장치는 예를 들어 휴대전화, 서버, 태블릿 컴퓨터, 개인용 컴퓨터 또는 노트북 컴퓨터일 수 있다.
본 출원의 솔루션에서, 좌측 및 우측 채널 신호는 스테레오 신호의 좌측 및 우측 채널 신호인 것으로 이해될 수 있다. 스테레오 신호는 원래의 스테레오 신호, 또는 다중 채널 신호의 2개의 채널 신호를 포함하는 스테레오 신호, 또는 다중 채널 신호의 복수의 채널 신호에 의해 공동으로 생성된 2개의 신호 채널을 포함하는 스테레오 신호일 수 있다. 스테레오 인코딩 방법은 또한 멀티채널 인코딩에 사용되는 스테레오 인코딩 방법일 수 있다. 스테레오 인코딩 장치는 또한 멀티채널 인코딩 장치에서 사용되는 스테레오 인코딩 장치일 수 있다. 스테레오 디코딩 방법은 멀티채널 디코딩에 사용되는 스테레오 디코딩 방법일 수도 있다. 스테레오 디코딩 장치는 또한 멀티채널 디코딩 장치에서 사용되는 스테레오 디코딩 장치일 수 있다. 본 출원의 실시예에서의 오디오 인코딩 방법은 예를 들어, 스테레오 인코딩 시나리오에 고유하고, 본 출원의 실시예에서의 오디오 디코딩 방법은 예를 들어 스테레오 디코딩 시나리오에 고유하다.
다음은 먼저 오디오 코딩 모드를 결정하는 방법을 제공하고, 방법은: 현재 프레임에 대한 채널 조합 방식을 결정하는 단계 및 이전 프레임에 대한 채널 조합 방식 및 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 코딩 모드를 결정하는 단계를 포함한다.
도 2는 본 출원의 실시예에 따른 오디오 인코딩 방법의 개략적인 흐름도이다. 오디오 인코딩 방법의 관련 단계는 인코딩 장치에 의해 구현될 수 있으며, 예를 들어 다음 단계를 포함할 수 있다.
201. 현재 프레임에 대한 채널 조합 방식을 결정한다.
현재 프레임에 대한 채널 조합 방식은 복수의 채널 조합 방식 중 하나이다. 예를 들어, 복수의 채널 조합 방식은 비 상관 신호 채널 조합 방식(anticorrelated signal Channel Combination Scheme) 및 상관 신호 채널 조합 방식(correlated signal Channel Combination Scheme)을 포함한다. 상관 신호 채널 조합 방식은 근거리 신호에 대응하는 채널 조합 방식이다. 비 상관 신호 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식이다. 니어 인 페이즈 시그널에 대응하는 채널 조합 방식은 니어 인 페이즈 시그널에 적용 가능하고, 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 적용 가능하다는 것을 이해할 수 있다.
202. 이전 프레임에 대한 채널 조합 방식 및 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 코딩 모드를 결정한다.
또한, 현재 프레임이 제1 프레임인 경우(즉, 현재 프레임의 이전 프레임이 존재하지 않는 경우), 현재 프레임의 채널 조합 방식에 따라 현재 프레임의 코딩 모드가 결정될 수 있다. 대안적으로, 디폴트 코딩 모드가 현재 프레임의 코딩 모드로서 사용될 수 있다.
현재 프레임의 코딩 모드는 복수의 코딩 모드 중 하나이다. 예를 들어, 복수의 코딩 모드는 상관-비상관 신호 코딩 스위칭 모드(correlated-to-anticorrelated signal coding switching mode), 비상관-상관 신호 코딩 스위칭 모드(anticorrelated-to-correlated signal coding switching mode), 상관 신호 코딩 모드(correlated signal coding mode), 비 상관 신호 코딩 모드(anticorrelated signal coding mode) 등이 있다.
상관-비상관 신호 코딩 스위칭 모드에 대응하는 시간-도메인 다운믹스 모드는 예를 들어 "상관-비상관 신호 다운믹스 스위칭 모드"(correlated-to-anticorrelated signal downmix switching mode)라고 지칭될 수 있다. 비 상관-상관 신호 코딩 스위칭 모드에 대응하는 시간-도메인 다운믹스 모드는, 예를 들어 "비상관-상관 신호 다운믹스 스위칭 모드"(anticorrelated-to-correlated signal downmix switching mode)라고 지칭될 수 있다. 상관 신호 코딩 모드에 대응하는 시간-도메인 다운믹스 모드는 예를 들어 "상관 신호 다운믹스 모드"(correlated signal downmix mode)라고 지칭될 수 있다. 비 상관 신호 코딩 모드에 대응하는 시간-도메인 다운믹스 모드는 예를 들어 "비 상관 다운믹스 모드"(anticorrelated signal downmix mode)로 지칭될 수 있다.
본 출원의 이 실시예에서, 코딩 모드, 디코딩 모드, 및 채널 조합 방식과 같은 객체의 명칭은 모두 예이며, 다른 명칭도 실제 적용에 사용될 수 있음을 이해할 수 있다.
203. 현재 프레임의 코딩 모드에 대응하는 시간-도메인 다운믹스 처리에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호를 획득한다.
현재 프레임에서의 일차 및 이차 채널 신호를 획득하기 위해 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리가 수행될 수 있고, 일차 및 이차 채널 신호는 비트스트림을 얻기 위해 추가로 인코딩된다. 또한, 현재 프레임의 채널 조합 방식 플래그(현재 프레임의 채널 조합 방식 플래그는 현재 프레임에 대한 채널 조합 방식을 나타내기 위해 사용됨)가 비트스트림에 기록될 수 있어서, 디코딩 장치는 비트스트림에 포함된 현재 프레임의 채널 조합 방식 플래그에 기초하여 현재 프레임에 대한 채널 조합 방식을 결정한다.
이전 프레임에 대한 채널 조합 방식 및 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 코딩 모드를 결정하는 다양한 특정 구현이 있을 수 있다.
구체적으로, 예를 들어, 일부 가능한 구현들에서, 이전 프레임에 대한 채널 조합 방식 및 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 코딩 모드를 결정하는 단계는:
이전 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식일 때, 현재 프레임의 코딩 모드가 상관-비상관 신호 코딩 스위칭 모드인 것으로 결정하는 단계 - 상관-비상관 신호 코딩 스위칭 모드에서 시간-도메인 다운믹스 처리는 상관 신호 채널 조합 방식으로부터 비 상관 신호 채널 조합 방식으로의 천이에 대응하는 다운믹스 처리 방법을 사용하여 수행됨 - ; 또는
이전 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식일 때, 현재 프레임의 코딩 모드가 비 상관 신호 코딩 모드인 것으로 결정하는 단계 - 비 상관 신호 코딩 모드에서, 시간-도메인 다운믹스 처리는 비 상관 신호 채널 조합 방식에 대응하는 다운믹스 처리 방법을 사용함으로써 수행됨 - ; 또는
이전 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식일 때, 현재 프레임의 코딩 모드가 비상관-상관 신호 코딩 스위칭 모드인 것으로 결정하는 단계 - 비상관-상관 신호 코딩 스위칭 모드에서, 시간-도메인 다운믹스 처리는 비 상관 신호 채널 조합 방식으로부터 상관 신호 채널 조합 방식으로의 천이에 대응하는 다운믹스 처리 방법을 사용하여 수행되고, 비상관-상관 신호 코딩 스위칭 모드에 대응하는 시간-도메인 다운믹스 처리 방식은 구체적으로 세그먼트화된 시간-도메인 다운믹스 방식일 수 있고, 즉 현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하는 것일 수 있음 - ; 또는
이전 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식일 때, 현재 프레임의 코딩 모드가 상관 신호 코딩 모드인 것으로 결정하는 단계 - 상관 신호 코딩 모드에서, 시간-도메인 다운믹스 처리는 상관 신호 채널 조합 방식에 대응하는 다운믹스 처리 방법을 사용함으로써 수행됨 - 를 포함한다.
상이한 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방식이 일반적으로 다르다는 것을 이해할 수 있다. 또한, 각각의 코딩 모드는 하나 이상의 시간-도메인 다운믹스 처리 방식에 대응할 수 있다.
예를 들어, 일부 가능한 구현들에서, 현재 프레임의 코딩 모드가 상관 신호 코딩 모드인 것으로 결정될 때, 시간-도메인 다운믹스 처리는 상관 신호 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방식을 사용하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 수행되어 현재 프레임에서의 일차 및 이차 채널 신호를 획득한다. 상관 신호 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방식은 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식이다.
다른 예에서, 일부 가능한 구현들에서, 현재 프레임의 코딩 모드가 비 상관 신호 코딩 모드인 것으로 결정될 때, 시간-도메인 다운믹스 처리는 비 상관 신호 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방식을 사용하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 수행되어 현재 프레임에서의 일차 및 이차 채널 신호를 얻는다. 비 상관 신호 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방식은 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식이다.
다른 예에서, 일부 가능한 구현들에서, 현재 프레임의 코딩 모드가 상관-비상관 신호 코딩 스위칭 모드인 것으로 결정될 때, 시간-도메인 다운믹스 처리는 상관-비상관 신호 코딩 스위칭 모드에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 수행되어 현재 프레임에서의 일차 및 이차 채널 신호를 획득한다. 상관-비상관 신호 코딩 스위칭 모드에 대응하는 시간-도메인 다운믹스 처리 방식은 상관 신호 채널 조합 방식으로부터 비 상관 신호 채널 조합 방식으로의 천이에 대응하는 시간-도메인 다운믹스 처리 방식이다. 상관-비상관 신호 코딩 스위칭 모드에 대응하는 시간-도메인 다운믹스 처리 방식은 구체적으로 세그먼트화된 시간-도메인 다운믹스 방식, 즉 현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하는 것일 수 있다.
다른 예에서, 일부 가능한 구현에서, 현재 프레임의 코딩 모드가 비상관-상관 신호 코딩 스위칭 모드인 것으로 결정되면, 시간-도메인 다운믹스 처리는 현재의 좌측 및 우측 채널 신호에 대해 수행된다. 비상관-상관 신호 코딩 스위칭 모드에 대응하는 시간-도메인 다운믹스 처리 방식을 사용하여 현재 프레임에서의 일차 및 이차 채널 신호에 대해 수행되어 현재 프레임에서의 일차 및 이차 채널 신호를 획득한다. 비상관-상관 신호 코딩 스위칭 모드에 대응하는 시간-도메인 다운믹스 처리 방식은 비 상관 신호 채널 조합 방식으로부터 상관 신호 채널 조합 방식으로의 천이에 대응하는 시간-도메인 다운믹스 처리 방식이다.
상이한 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방식이 일반적으로 다르다는 것을 이해할 수 있다. 또한, 각각의 코딩 모드는 하나 이상의 시간-도메인 다운믹스 처리 방식에 대응할 수 있다.
예를 들어, 일부 가능한 구현들에서, 비 상관 신호 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리를 수행하여, 현재 프레임에서의 일차 및 이차 채널을 획득하는 단계는: 현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호를 획득하는 단계; 또는 현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터 및 이전 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리를 수행하여, 현재 프레임에서의 일차 및 이차 채널 신호를 획득하는 단계를 포함할 수 있다.
전술한 솔루션에서, 현재 프레임에 대한 채널 조합 방식이 결정될 필요가 있으며, 이는 현재 프레임에 대한 채널 조합 방식에 대한 복수의 가능성이 있음을 나타낸다. 하나의 채널 조합 방식이 존재하는 종래의 솔루션과 비교하여, 복수의 가능한 채널 조합 방식을 갖는 이 솔루션은 복수의 가능한 시나리오와 더 잘 호환되고 매칭될 수 있다. 전술한 솔루션에서, 현재 프레임의 코딩 모드는 이전 프레임에 대한 채널 조합 방식 및 현재 프레임에 대한 채널 조합 방식에 기초하여 결정될 필요가 있으며, 현재의 코딩 모드에 대한 복수의 가능성이 있다. 단지 하나의 코딩 모드가 존재하는 종래의 솔루션과 비교하여, 복수의 가능한 코딩 모드를 갖는 이 솔루션은 복수의 가능한 시나리오와 더 잘 호환되고 매칭될 수 있다.
구체적으로, 예를 들어, 현재 프레임에 대한 채널 조합 방식이 이전 프레임에 대한 채널 조합 방식과 다를 때, 현재 프레임의 코딩 모드는, 예를 들어, 상관관계와 상관 관계가 없는 것으로 결정될 수 있다 신호 코딩 스위칭 모드 또는 비상관-상관 신호 코딩 스위칭 모드일 수 있다. 이 경우, 현재 프레임에 대한 채널 조합 방식과 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 분할된 시간-도메인 다운믹스 처리가 수행될 수 있다.
현재 프레임에 대한 채널 조합 방식과 이전 프레임에 대한 채널 조합 방식이 다를 때, 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하는 메커니즘이 도입된다. 세그먼트화된 시간-도메인 다운믹스 처리 메커니즘은 채널 조합 방식의 원활한 천이를 구현하고 인코딩 품질을 향상시키는 데 도움이 된다.
이에 대응하여, 다음은 예를 사용하여 시간-도메인 스테레오 디코딩 시나리오를 설명한다.
도 3을 참조하여, 이하에서는 오디오 디코딩 모드를 결정하기 위한 방법을 제공한다. 오디오 디코딩 모드를 결정하기 위한 방법의 관련 단계들은 디코딩 장치에 의해 구현될 수 있고, 방법은 구체적으로 다음 단계들을 포함할 수 있다.
301. 비트스트림에 있는 현재 프레임의 채널 조합 방식 플래그에 기초하여 현재 프레임에 대한 채널 조합 방식을 결정한다.
302. 이전 프레임에 대한 채널 조합 방식 및 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 디코딩 모드를 결정한다.
현재 프레임의 디코딩 모드는 복수의 디코딩 모드 중 하나이다. 예를 들어, 복수의 디코딩 모드는 상관-비상관 신호 디코딩 스위칭 모드(correlated-to-anticorrelated signal decoding switching mode), 비상관-상관 신호 디코딩 스위칭 모드(anticorrelated-to-correlated signal decoding switching mode), 상관 신호 디코딩 모드(correlated signal decoding mode), 비 상관 신호 디코딩 모드(anticorrelated signal decoding mode) 등을 포함할 수 있다.
상관-비상관 신호 디코딩 스위칭 모드에 대응하는 시간-도메인 업믹스 모드는 예를 들어 "상관-비상관 신호 업믹스 스위칭 모드"(correlated-to-anticorrelated signal upmix switching mode)라고 지칭될 수 있다. 비상관-상관 신호 디코딩 스위칭 모드에 대응하는 시간-도메인 업믹스 모드는, 예를 들어 "상관-비상관 신호 업믹스 스위칭 모드"(anticorrelated-to-correlated signal upmix switching mode)라고 지칭될 수 있다. 상관 신호 디코딩 모드에 대응하는 시간-도메인 업믹스 모드는 예를 들어 "상관 신호 업믹스 모드"(correlated signal upmix mode)라고 지칭될 수 있다. 비 상관 신호 디코딩 모드에 대응하는 시간-도메인 업믹스 모드는 예를 들어 "비상관 신호 업믹스 모드"(anticorrelated signal upmix mode)라고 지칭될 수 있다.
본 출원의 이 실시예에서, 코딩 모드, 디코딩 모드, 및 채널 조합 방식과 같은 객체의 명칭은 모두 예이며, 다른 명칭도 실제 적용에 사용될 수 있음을 이해할 수 있다.
일부 가능한 구현들에서, 이전 프레임에 대한 채널 조합 방식 및 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 디코딩 모드를 결정하는 단계는:
이전 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식일 때, 현재 프레임의 디코딩 모드가 상관-비상관 신호 디코딩 스위칭 모드인 것으로 결정하는 단계 - 상관-비상관 신호 디코딩 스위칭 모드에서, 시간-도메인 업믹스 처리는 상관 신호 채널 조합 방식으로부터 비 상관 신호 채널 조합 방식으로의 천이에 대응하는 업믹스 처리 방법을 사용하여 수행됨 - ; 또는
이전 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식일 때, 현재 프레임의 디코딩 모드가 비 상관 신호 디코딩 모드인 것으로 결정하는 단계 - 비 상관 신호 디코딩 모드에서, 시간-도메인 업믹스 처리는 비 상관 신호 채널 조합 방식에 대응하는 업믹스 처리 방법을 사용하여 수행됨 - ; 또는
이전 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식일 때, 현재 프레임의 디코딩 모드가 비상관-상관 신호 디코딩 스위칭 모드인 것으로 결정하는 단계 - 비상관-상관 신호 디코딩 스위칭 모드에서, 시간-도메인 업믹스 처리는 비 상관 신호 채널 조합 방식으로부터 상관 신호 채널 조합 방식으로의 천이에 대응하는 업믹스 처리 방법을 사용하여 수행됨 - ; 또는
이전 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식일 때, 현재 프레임의 디코딩 모드가 상관 신호 디코딩 모드인 것으로 결정하는 단계 - 상관 신호 디코딩 모드에서, 시간-도메인 업믹스 처리는 상관 신호 채널 조합 방식에 대응하는 업믹스 처리 방법을 사용하여 수행됨 - 를 포함한다.
예를 들어, 현재 프레임의 디코딩 모드가 비 상관 신호 디코딩 모드인 것으로 결정되면, 디코딩 장치는 비 상관 신호 디코딩 모드에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득한다.
재구성된 좌측 및 우측 채널 신호는 디코딩된 좌측 및 우측 채널 신호일 수 있거나, 지연 조정 처리 및/또는 시간-도메인 포스트-처리가 재구성된 좌측 및 우측 채널 신호에 대해 수행되어 디코딩된 좌측 및 우측 채널 신호를 획득할 수 있다.
비 상관 신호 디코딩 모드에 대응하는 시간-도메인 업믹스 처리 방식은 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식이고, 비 상관 신호 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식이다.
현재 프레임의 디코딩 모드는 복수의 디코딩 모드 중 하나일 수 있다. 예를 들어, 현재 프레임의 디코딩 모드는 다음과 같은 디코딩 모드: 상관 신호 디코딩 모드, 비 상관 신호 디코딩 모드, 상관-비상관 신호 디코딩 스위칭 모드, 및 비상관-상관 신호 디코딩 스위칭 모드 중 하나일 수 있다.
전술한 솔루션에서, 현재 프레임의 디코딩 모드가 결정될 필요가 있으며, 이는 현재 프레임의 디코딩 모드에 대한 복수의 가능성이 있음을 나타낸다는 것을 이해할 수 있다. 단지 하나의 디코딩 모드가 존재하는 종래의 솔루션과 비교하여, 복수의 가능한 디코딩 모드를 갖는 이 솔루션은 복수의 가능한 시나리오와 더 잘 호환되고 매칭될 수 있다. 또한, 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식이 도입되기 때문에, 현재 프레임의 스테레오 신호가 니어 아웃 오브 페이즈 시그널일 때, 더 많은 목표 채널 조합 방식 및 디코딩 모드가 있으며, 이는 디코딩 품질을 향상시키는 데 도움이 된다.
다른 예로, 현재 프레임의 디코딩 모드가 상관 신호 디코딩 모드인 것으로 결정되면, 디코딩 장치는 상관 신호 디코딩 모드에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득한다. 상관 신호 디코딩 모드에 대응하는 시간-도메인 업믹스 처리 방식은 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식이고, 상관 신호 채널 조합 방식은 근접 신호에 대응하는 채널 조합 방식이다.
다른 예를 들어, 현재 프레임의 디코딩 모드가 상관-비상관 신호 디코딩 스위칭 모드인 것으로 결정될 때, 디코딩 장치는 상관-비상관 신호 디코딩 스위칭 모드에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득한다. 상관-비상관 신호 디코딩 스위칭 모드에 대응하는 시간-도메인 업믹스 처리 방식은 상관 신호 채널 조합 방식으로부터 비 상관 신호 채널 조합 방식으로의 천이에 대응하는 시간-도메인 업믹스 처리 방식이다.
다른 예로, 현재 프레임의 디코딩 모드가 비상관-상관 신호 디코딩 스위칭 모드인 것으로 결정될 때, 디코딩 장치는 비상관-상관 신호 디코딩 스위칭 모드에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득한다. 비상관-비상관 신호 디코딩 스위칭 모드에 대응하는 시간-도메인 업믹스 처리 방식은 비 상관 신호 채널 조합 방식에서 상관 신호 채널 조합 방식으로의 천이에 대응하는 시간-도메인 업믹스 처리 방식이다.
상이한 디코딩 모드에 대응하는 시간-도메인 업믹스 처리 방식이 일반적으로 다르다는 것을 이해할 수 있다. 또한, 각각의 디코딩 모드는 하나 이상의 시간-도메인 업믹스 처리 방식에 대응할 수 있다.
전술한 솔루션에서, 현재 프레임에 대한 채널 조합 방식이 결정될 필요가 있으며, 이는 현재 프레임에 대한 채널 조합 방식에 대한 복수의 가능성이 있음을 나타낸다. 하나의 채널 조합 방식이 존재하는 종래의 솔루션과 비교하여, 복수의 가능한 채널 조합 방식을 갖는 이 솔루션은 복수의 가능한 시나리오와 더 잘 호환되고 매칭될 수 있다. 전술한 솔루션에서, 현재 프레임의 디코딩 모드는 이전 프레임에 대한 채널 조합 방식 및 현재 프레임에 대한 채널 조합 방식에 기초하여 결정될 필요가 있으며, 현재 프레임의 디코딩 모드에 대한 복수의 가능성이 존재한다. 단지 하나의 디코딩 모드가 존재하는 종래의 솔루션과 비교하여, 복수의 가능한 디코딩 모드를 갖는 이 솔루션은 복수의 가능한 시나리오와 더 잘 호환되고 매칭될 수 있다.
또한, 디코딩 장치는 현재 프레임의 디코딩 모드에 대응하는 시간-도메인 업믹스 처리에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득한다.
다음은 인코딩 장치에 의해 현재 프레임에 대한 채널 조합 방식을 결정하는 일부 특정 구현을 설명하기 위해 예를 사용한다. 인코딩 장치에 의해 현재 프레임에 대한 채널 조합 방식을 결정하는 다양한 특정 구현이 있다.
예를 들어, 일부 가능한 구현들에서, 현재 프레임에 대한 채널 조합 방식을 결정하는 단계는: 현재 프레임에 대한 채널 조합 방식을 결정하기 위해 적어도 한 번 현재 프레임에 대한 채널 조합 방식 결정을 수행하는 단계를 포함할 수 있다.
구체적으로, 예를 들어, 현재 프레임에 대한 채널 조합 방식을 결정하는 단계는: 현재 프레임에 대한 초기 채널 조합 방식을 결정하기 위해 현재 프레임에 대한 초기 채널 조합 방식 결정을 수행하는 단계; 및 현재 프레임에 대한 채널 조합 방식을 결정하기 위해 현재 프레임에 대한 초기 채널 조합 방식에 기초하여 현재 프레임에 대한 채널 조합 방식 수정 결정을 수행하는 단계를 포함한다. 또한, 현재 프레임에 대한 초기 채널 조합 방식은 현재 프레임에 대한 채널 조합 방식으로 직접 사용될 수도 있다. 다시 말해서, 현재 프레임에 대한 채널 조합 방식은 현재 프레임에 대한 초기 채널 조합 방식 결정이 수행된 후에 결정되는 현재 프레임에 대한 초기 채널 조합 방식일 수 있다.
예를 들어, 현재 프레임에 대한 초기 채널 조합 방식 결정을 수행하는 단계는: 현재 프레임에서의 좌측 및 우측 채널 신호를 사용하여 현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형을 결정하는 단계; 및 현재 프레임에서의 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형 및 이전 프레임에 대한 상기 채널 조합 방식에 기초하여 현재 프레임에 대한 상기 초기 채널 조합 방식을 결정하는 단계를 포함한다. 현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형은 니어 인 페이즈 시그널 또는 니어 아웃 오브 페이즈 시그널일 수 있다. 현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형은 현재 프레임의 인/아웃 페이즈 플래그의 신호 유형으로 표시될 수 있다(예를 들어, 인/아웃 페이즈 플래그의 신호 유형은 tmp_SM_flag로 표시된다). 구체적으로, 예를 들어, 현재 프레임의 인/아웃 페이즈 플래그의 신호 유형의 값이 "1"인 경우, 현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 인 페이즈 시그널임을 나타내거나; 또는 현재 프레임의 인/아웃 페이즈 플래그의 신호 유형의 값이 "0"인 경우, 현재 프레임에서의 스테레오 신호의 인/아웃 페이즈의 신호 유형이 니어 아웃 오브 페이즈 시그널임을 나타내거나; 또는 그 반대로도 성립한다.
오디오 프레임(예를 들어, 이전 프레임 또는 현재 프레임)에 대한 채널 조합 방식은 오디오 프레임의 채널 조합 방식 플래그로 표시될 수 있다. 예를 들어, 오디오 프레임의 채널 조합 방식 플래그의 값이 "0"인 경우, 이는 오디오 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식임을 나타내고; 또는 오디오 프레임의 채널 조합 방식 플래그의 값이 "1"일 때, 이는 오디오 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식임을 표시하거나; 혹은 그 반대로도 성립한다.
유사하게, 오디오 프레임(예를 들어, 이전 프레임 또는 현재 프레임)에 대한 초기 채널 조합 방식은 오디오 프레임의 초기 채널 조합 방식 플래그로 표시될 수 있다(예를 들어, 초기 채널 조합 방식 플래그는
Figure pct00228
로 표시된다). 예를 들어, 오디오 프레임의 초기 채널 조합 방식 플래그의 값이 "0"인 경우, 오디오 프레임에 대한 초기 채널 조합 방식은 상관 신호 채널 조합 방식임을 나타내거나; 또는 다른 예에서, 오디오 프레임의 초기 채널 조합 방식 플래그의 값이 "1"인 경우, 이는 오디오 프레임에 대한 초기 채널 조합 방식이 비 상관 신호 채널 조합 방식임을 표시하거나; 또는 그 반대로도 성립한다.
현재 프레임에서의 좌측 및 우측 채널 신호를 사용함으로써 현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형을 결정하는 단계는: 현재 프레임에서의 좌측 및 우측 채널 신호 간의 상관 값
Figure pct00229
을 계산하는 단계; 및
Figure pct00230
이 제1 임계치보다 낮거나 같을 때, 현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 인 페이즈 시그널인 것으로 결정하는 단계; 또는
Figure pct00231
이 제1 임계 값보다 클 때, 현재 프레임에서의 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 아웃 오브 페이즈 시그널인 것으로 결정하는 단계를 포함한다. 또한, 현재 프레임의 인/아웃 페이즈 플래그의 신호 유형이 현재 프레임에서의 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형을 나타내는 데 사용되면, 현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 인 페이즈 시그널인 것으로 결정되며, 현재 프레임의 위상 플래그의 인/아웃 페이즈 플래그의 신호 유형의 값이 현재 프레임의 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 인 페이즈 시그널임을 나타내도록 설정될 수 있거나; 또는 현재 프레임의 인/아웃 페이즈 유형이 니어 아웃 오브 페이즈 시그널에 가까운 것으로 판정될 때, 현재 프레임의 인/아웃 위상 플래그의 신호 유형의 값이 현재 프레임에서의 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 아웃 오브 페이즈 시그널임을 나타내도록 설정될 수 있다.
제1 임계 값의 값 범위는 예를 들어(0.5, 1.0) 일 수 있고, 제1 임계 값은 예를 들어 0.5, 0.85, 0.75, 0.65 또는 0.81과 동일할 수 있다.
구체적으로, 예를 들어, 오디오 프레임(예를 들어, 이전 프레임 또는 현재 프레임)의 인/아웃 위상 플래그의 신호 유형의 값이 "0"인 경우, 오디오 프레임의 스테레오 신호의 인/아웃 페이즈의 신호 유형임을 나타내거나; 또는 오디오 프레임(예를 들어, 이전 프레임 또는 현재 프레임)의 인/아웃 페이즈 플래그의 신호 유형의 값이 "1"인 경우, 오디오 프레임의 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 아웃 오브 페이즈 시그널임을 나타내거나; 또는 그 반대로도 성립한다.
예를 들어, 현재 프레임에서의 스테레오 신호의 위상의 위상/부외의 신호 유형 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에 대한 초기 채널 조합 방식을 결정하는 단계는:
현재 프레임에서 스테레오 신호의 위상에 대한 위상의 신호 유형이 니어 인 페이즈 시그널이고 이전 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식일 때, 현재 프레임에 대한 초기 채널 조합 방식이 상관 신호 채널 조합 방식인 것으로 결정하는 단계; 또는 현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 아웃 오브 페이즈 시그널이고 이전 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식일 때, 초기 채널 조합 방식을 결정하는 단계 현재 프레임에 대한 비 상관 신호 채널 조합 방식인 것으로 결정하는 단계; 또는
현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 인 페이즈 시그널이고 이전 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식일 때, 현재 프레임에서의 좌측 및 우측 채널 신호의 신호대잡음비가 모두 제2 임계 값보다 작으면, 현재 프레임에 대한 초기 채널 조합 방식이 상관 신호 채널 조합 방식인 것으로 결정하는 단계; 또는 현재 프레임에서의 좌측 채널 신호의 신호대잡음비 및/또는 현재 프레임에서의 우측 채널 신호의 신호대 잡음비가 제2 임계 값보다 크거나 같으면, 현재 프레임에 대한 초기 채널 조합 방식이 비 상관 신호 채널 조합 방식인 것으로 결정하는 단계; 또는
현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 아웃 오브 페이즈 시그널이고 이전 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식일 때, 현재 프레임에서의 좌측 및 우측 채널 신호의 신호대잡음비 모두가 제2 임계치보다 작으면, 현재 프레임에 대한 초기 채널 조합 방식이 비 상관 신호 채널 조합 방식인 것으로 결정하는 단계; 또는 현재 프레임에서의 좌측 채널 신호의 신호대 잡음비 및/또는 우측 채널 신호의 신호대 잡음비가 제2 임계 값보다 크거나 같으면, 현재 프레임에 대한 초기 채널이 상관 신호 채널 조합 방식인 것으로 결정하는 단계를 포함할 수 있다.
제2 임계 값의 값 범위는 예를 들어 [0.8, 1.2] 일 수 있고, 제2 임계 값은 예를 들어 0.8, 0.85, 0.9, 1, 1.1 또는 1.18과 동일할 수 있다.
현재 프레임에 대한 초기 채널 조합 방식에 기초하여 현재 프레임에 대한 채널 조합 방식 수정 결정을 수행하는 단계는: 이전 프레임의 채널 조합 비율 팩터 수정 플래그, 현재 프레임에서 스테레오 신호의 위상의 인 페이즈/아웃 페이즈의 신호 유형, 및 현재 프레임에 대한 초기 채널 조합 방식에 기초하여 현재 프레임에 대한 채널 조합 방식을 결정하는 단계를 포함할 수 있다.
현재 프레임의 채널 조합 방식 플래그는
Figure pct00232
로 표시될 수 있고, 현재 프레임의 채널 조합 비율 팩터 수정 플래그는
Figure pct00233
로 표시될 수 있다. 예를 들어, 채널 조합 비율 팩터 수정 플래그의 값이 0인 경우, 이는 채널 조합 비율 팩터가 수정될 필요가 없음을 나타내고; 또는 채널 조합 비율 수정 플래그의 값이 1인 경우, 이는 채널 조합 비율 팩터가 수정될 필요가 있음을 나타낸다. 확실히, 채널 조합 비율 팩터 수정 플래그로서 다른 상이한 값이 채널 조합 비율 팩터가 수정될 필요가 있는지를 표시하는 데 사용될 수 있다.
구체적으로, 예를 들어, 현재 프레임에 대한 초기 채널 조합 방식 결정의 결과에 기초하여 현재 프레임에 대한 채널 조합 방식 수정 결정을 수행하는 단계는:
이전 프레임의 채널 조합비 팩터 수정 플래그가 채널 조합비 팩터가 수정될 필요가 있음을 나타내면, 비 상관 신호 채널 조합 방식을 현재 프레임에 대한 채널 조합 방식으로 사용하거나; 또는 이전 프레임의 채널 조합 비율 팩터 수정 플래그가 채널 조합 비율 팩터가 수정될 필요가 없음을 나타내면, 현재 프레임이 스위칭 조건을 만족하는지를 결정하고, 현재 프레임이 스위칭 조건을 만족하는지를 결정하는 결과에 기초하여 현재 프레임에 대한 채널 조합 방식을 결정하는 단계를 포함한다.
현재 프레임이 스위칭 조건을 만족하는지를 판단한 결과에 기초하여 현재 프레임에 대한 채널 조합 방식을 결정하는 단계는:
이전 프레임에 대한 채널 조합 방식이 현재 프레임에 대한 초기 채널 조합 방식과 다르고, 현재 프레임이 스위칭 조건을 만족하고, 현재 프레임에 대한 초기 채널 조합 방식은 상관 신호 채널 조합 방식이며, 채널 이전 프레임에 대한 조합 방식은 비 상관 신호 채널 조합 방식일 때, 현재 프레임에 대한 채널 조합 방식은 비 상관 신호 채널 조합 방식인 것으로 결정하는 단계; 또는
이전 프레임에 대한 채널 조합 방식이 현재 프레임에 대한 초기 채널 조합 방식과 다르고, 현재 프레임이 스위칭 조건을 만족하고, 현재 프레임에 대한 초기 채널 조합 방식이 비 상관 신호 채널 조합 방식이고, 채널 조합 이전 프레임에 대한 방식은 상관 신호 채널 조합 방식이고, 이전 프레임의 채널 조합 비율 팩터는 제1 비율 계수 임계 값보다 작으면, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식인 것으로 결정하는 단계; 또는
이전 프레임에 대한 채널 조합 방식이 현재 프레임에 대한 초기 채널 조합 방식과 다르고, 현재 프레임이 스위칭 조건을 만족하고, 현재 프레임에 대한 초기 채널 조합 방식이 비 상관 신호 채널 조합 방식이고, 채널 조합 이전 프레임에 대한 방식은 상관 신호 채널 조합 방식이고, 이전 프레임의 채널 조합 비율 팩터는 제1 비율 계수 임계 값보다 크거나 같으면, 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식인 것으로 결정하는 단계; 또는
(P-1)번째-전류 프레임에 대한 채널 조합 방식이 P번째-현재 프레임에 대한 초기 채널 조합 방식과 다르고, P번째-현재 프레임이 스위칭 조건을 만족하지 않고, 현재 프레임이 스위칭 조건을 충족하고, 현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 인 페이즈 시그널이고, 현재 프레임에 대한 초기 채널 조합 방식이 상관 신호 채널 조합 방식이고, 이전 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식일 때, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식인 것으로 결정하는 단계; 또는
(P-1)번째-현재 프레임에 대한 채널 조합 방식이 P번째-현재 프레임에 대한 초기 채널 조합 방식과 다르면, P번째-현재 프레임이 스위칭 조건을 만족하지 않고, 현재 프레임이 스위칭 조건을 충족하고, 현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 인 페이즈 시그널이고, 현재 프레임의 초기 채널 조합 방식이 비 상관성 신호 채널 조합 방식이고, 이전 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식이고, 이전 프레임의 채널 조합 비율 팩터는 제2 비율 계수 임계 값보다 작으면, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식인 것으로 결정하는 단계; 또는
(P-1)번째-현재 프레임에 대한 채널 조합 방식이 P번째-현재 프레임에 대한 초기 채널 조합 방식과 다르고, P번째-현재 프레임이 스위칭 조건을 만족하지 않고, 현재 프레임은 스위칭 조건을 만족하고, 현재 프레임에서 스테레오 신호의 인 페이즈/아웃 페이즈의 신호 유형이 니어 아웃 오브 페이즈 시그널이고, 현재 프레임의 초기 채널 조합 방식은 비 상관성 신호 채널 조합 방식이며, 이전 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식이고, 이전 프레임의 채널 조합 비율 팩터는 제2 비율 계수 임계치보다 크거나 같으면, 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식인 것으로 결정하는 단계를 포함할 수 있다.
여기서, P는 1보다 큰 정수일 수 있다. 예를 들어, P는 2, 3, 4, 5, 6 또는 다른 값과 같을 수 있다.
제1 비율 계수 임계 값의 값 범위는 예를 들어 [0.4, 0.6] 일 수 있고, 제1 비율 계수 임계 값은 예를 들어 0.4, 0.45, 0.5, 0.55 또는 0.6과 동일할 수 있다.
제2 비율 계수 임계 값의 값 범위는 예를 들어 [0.4, 0.6] 일 수 있고, 제2 비율 계수 임계 값은 예를 들어 0.4, 0.46, 0.5, 0.56 또는 0.6과 동일할 수 있다.
일부 가능한 구현들에서, 현재 프레임이 스위칭 조건을 충족시키는지를 결정하는 단계는: 이전 프레임에서의 주요 채널 신호의 프레임 유형 및/또는 이전 프레임에서의 이차 채널 신호의 프레임 유형에 기초하여, 현재 프레임이 스위칭 조건을 충족하는지를 판정하는 단계를 포함한다.
일부 가능한 구현들에서, 현재 프레임이 스위칭 조건을 만족하는지를 결정하는 단계는:
제1 조건, 제2 조건 및 제3 조건이 모두 충족될 때, 현재 프레임이 스위칭 조건을 만족하는 것으로 결정하는 단계; 또는 제2 조건, 제3 조건, 제4 조건 및 제5 조건이 모두 충족될 때, 현재 프레임이 스위칭 조건을 만족하는 것으로 결정하는 단계; 또는 제6 조건이 충족될 때, 현재 프레임이 스위칭 조건을 만족하는 것으로 결정하는 단계를 포함할 수 있다.
제1 조건은 다음과 같다: 이전 프레임의 이전 프레임에서 일차 채널 신호의 프레임 유형은 다음: VOICED_CLAS 프레임(유성음 프레임 또는 유성음 프레임을 따라는 특성을 갖는 프레임), ONSET 프레임(음성 시작 프레임), SIN_ONSET 프레임(고조파와 노이즈가 혼합된 시작 프레임), INACTIVE_CLAS 프레임(비활성 특성이 있는 프레임) 및 AUDIO_CLAS(오디오 프레임) 중 하나이고, 이전 프레임의 일차 채널 신호의 프레임 유형은 UNVOICED_CLAS 프레임(수 개의 특성: 무성, 비활성, 잡음 또는 음성 중 하나로 끝나는 프레임) 또는 VOICED_TRANSITION 프레임(유성음 후 전환이 있는 프레임, 프레임은 상당히 약한 음성 특성을 가지고 있거나; 또는 이전 프레임의 이전 프레임에서 이차 채널 신호의 프레임 유형은 다음: VOICED_CLAS 프레임, ONSET 프레임, SIN_ONSET 프레임, INACTIVE_CLAS 프레임 및 AUDIO_CLAS 프레임 중 어느 하나이며 이전 프레임의 이차 채널 신호의 프레임 유형은 UNVOICED_CLAS 프레임 또는 VOICED_TRANSITION 프레임이다.
제2 조건은 다음과 같다: 이전 프레임의 일차 채널 신호 및 이차 채널 신호의 원시 코딩 모드(raw coding modes) 중 어느 것도 VOICED(음성 프레임에 대응하는 코딩 유형)가 아니다.
제3 조건은 다음과 같다: 이전 프레임에서 사용된 채널 조합 방식을 사용하는 이전 프레임 이전의 연속 프레임 수량이 사전 설정된 프레임 수량 임계 값보다 크다. 프레임 수량 임계 값의 값 범위는 예를 들어 [3, 10] 일 수 있다. 예를 들어, 프레임 수량 임계 값은 3, 4, 5, 6, 7, 8, 9 또는 다른 값과 동일할 수 있다.
제4 조건은 다음과 같다: 이전 프레임에서 일차 채널 신호의 프레임 유형이 UNVOICED_CLAS이거나, 또는 이전 프레임에서 이차 채널 신호의 프레임 유형이 UNVOICED_CLAS이다.
제5 조건은 다음과 같다: 현재 프레임에서 좌측 및 우측 채널 신호의 장기 루트 평균 제곱 에너지 값이 에너지 임계 값보다 작다. A 에너지 임계 값의 값 범위는 예를 들어 [300, 500] 일 수 있다. 예를 들어, 프레임 수량 임계 값은 300, 400, 410, 451, 482, 500, 415 또는 다른 값과 동일할 수 있다.
제6 조건은 다음과 같다: 이전 프레임에서 일차 채널 신호의 프레임 유형이 음악 신호이며, 이전 프레임에서 일차 채널 신호의 고주파수 대역에 대한 저주파수 대역의 에너지 비율이 제1 에너지 비율 임계 값이며, 이전 프레임에서 이차 채널 신호의 더 높은 주파수 대역의 에너지 대 저주파수 대역의 에너지 비율은 제2 에너지 비율 임계 값보다 크다.
제1 에너지 비율 임계 값의 범위는 예를 들어 [4000, 6000] 일 수 있다. 예를 들어, 프레임 수량 임계 값은 4000, 4500, 5000, 5105, 5200, 6000, 5800 또는 다른 값과 동일할 수 있다.
제2 에너지 비율 임계 값의 범위는 예를 들어 [4000, 6000] 일 수 있다. 예를 들어, 프레임 수량 임계 값은 4000, 4501, 5000, 5105, 5200, 6000, 5800 또는 다른 값과 동일할 수 있다.
현재 프레임이 스위칭 조건을 만족하는지를 결정하는 다양한 구현이 있을 수 있으며, 이는 상기 예에 제공된 방식으로 제한되지 않는 것으로 이해될 수 있다.
현재 프레임에 대한 채널 조합 방식을 결정하는 일부 구현이 전술한 예에서 제공되지만, 실제 적용은 전술한 예에서의 방식으로 제한되지 않을 수 있다는 것이 이해될 수 있다.
다음은 상호 상관 신호 코딩 모드에 대한 시나리오를 설명하기 위해 예를 더 사용한다.
도 4를 참조하여, 본 출원의 실시예는 오디오 인코딩 방법을 제공한다. 오디오 인코딩 방법의 관련 단계는 인코딩 장치에 의해 구현될 수 있고, 방법은 구체적으로 다음 단계를 포함할 수 있다.
401. 현재 프레임의 코딩 모드를 결정한다.
402. 현재 프레임의 코딩 모드가 비 상관 신호 코딩 모드인 것으로 결정될 때, 비 상관 신호 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방식을 사용하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호를 얻는다.
403. 획득된 일차 및 이차 채널 신호를 현재 프레임에 인코딩한다.
비 상관 신호 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방식은 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식이고, 비 상관 신호 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식이다.
예를 들어, 일부 가능한 구현들에서, 비 상관 신호 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리를 수행하여, 일차 및 이차 채널 신호를 획득하는 단계는: 현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호를 획득하는 단계; 또는 현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호를 획득하기 단계를 포함할 수 있다.
오디오 프레임(예를 들어, 현재 프레임 또는 이전 프레임)에 대한 채널 조합 방식(예를 들어, 비 상관 신호 채널 조합 방식 또는 비 상관 신호 채널 조합 방식)의 채널 조합 비율 팩터는 미리 설정된 고정 값일 수 있다는 것을 이해할 수 있다. 확실히, 오디오 프레임의 채널 조합 비율 팩터는 또한 오디오 프레임에 대한 채널 조합 방식에 기초하여 결정될 수 있다.
일부 가능한 구현들에서, 대응하는 다운믹스 매트릭스는 오디오 프레임의 채널 조합 비율 팩터에 기초하여 구성될 수 있고, 시간-도메인 다운믹스 처리는 채널 조합 방식에 대응하는 다운믹스 매트릭스를 사용함으로써 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 수행되어 현재 프레임에서의 일차 및 이차 채널 신호를 획득한다.
예를 들어, 현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리가 수행될 때, 현재 프레임에서의 일차 및 이차 채널 신호를 획득한다.
Figure pct00234
다른 예를 들어, 시간-도메인 다운믹스 처리가 현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터 및 이전 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 수행될 때 현재 프레임에서의 일차 및 이차 채널 신호를 획득한다.
Figure pct00235
; 또는
Figure pct00236
; 여기서
delay_com은 인코딩 지연 보상을 나타낸다.
다른 예를 들어, 시간-도메인 다운믹스 처리가 현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터 및 이전 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 수행될 때 현재 프레임에서의 일차 및 이차 채널 신호를 획득한다.
Figure pct00237
;
Figure pct00238
; 또는
Figure pct00239
여기서,
Figure pct00240
은 페이드-인 팩터를 나타낸다. 예를 들어,
Figure pct00241
이다. 확실히,
Figure pct00242
은 대안적으로 n에 기초한 다른 함수 관계의 페이드-인 팩터일 수 있다.
Figure pct00243
은 페이드-아웃 팩터를 나타낸다. 예를 들어,
Figure pct00244
이다. 확실히,
Figure pct00245
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-아웃 팩터일 수 있다.
Figure pct00246
은 천이 처리 길이를 나타낸다.
Figure pct00247
의 값은 특정 시나리오 요구 사항에 따라 설정될 수 있다. 예를 들어,
Figure pct00248
은 3/N과 같거나
Figure pct00249
은 N보다 작은 다른 값일 수 있다.
다른 예를 들어, 상관 신호 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리가 수행될 때, 현재 프레임에서의 일차 및 이차 채널 신호를 획득한다.
Figure pct00250
전술한 예에서,
Figure pct00251
은 현재 프레임에서의 좌측 채널 신호를 나타낸다.
Figure pct00252
은 현재 프레임에서의 우측 채널 신호를 나타낸다.
Figure pct00253
은 현재 프레임에 있으면서 시간-도메인 다운믹스 처리를 통해 획득된 일차 채널 신호를 나타내고;
Figure pct00254
은 현재 프레임에 있으면서 시간-도메인 다운믹스 처리를 통해 획득된 이차 채널 신호를 나타낸다.
전술한 예에서, n은 샘플링 포인트 수를 나타낸다. 예를 들여,
Figure pct00255
이다.
전술한 예에서, delay_com은 인코딩 지연 보상을 나타낸다.
Figure pct00256
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pct00257
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pct00258
는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pct00259
는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pct00260
는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pct00261
는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pct00262
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pct00263
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pct00264
은 복수의 형태를 가질 수 있으며, 예를 들어:
Figure pct00265
, 또는
Figure pct00266
, 여기서
Figure pct00267
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pct00268
는 복수의 형태를 가질 수 있으며, 예를 들어:
Figure pct00269
, 또는
Figure pct00270
, 또는
Figure pct00271
, 또는
Figure pct00272
, 또는
Figure pct00273
, 또는
Figure pct00274
, 여기서
Figure pct00275
,
Figure pct00276
Figure pct00277
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pct00278
는 복수의 형태를 가질 수 있으며, 예를 들어:
Figure pct00279
, 또는
Figure pct00280
, 또는
Figure pct00281
, 또는
Figure pct00282
, 또는
Figure pct00283
, 또는
Figure pct00284
, 여기서
Figure pct00285
,
Figure pct00286
Figure pct00287
은 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
현재 프레임에서의 좌측 및 우측 채널 신호는 구체적으로 현재 프레임에서의 최초의 좌측 및 우측 채널 신호일 수 있고(원래의 좌측 및 우측 채널 신호는 시간-도메인 전처리를 거치지 않은 좌측 및 우측 채널 신호이며, 예를 들어, 샘플링을 통해 획득된 좌측 및 우측 채널 신호일 수 있다), 현재 프레임에서 시간-도메인 전처리를 거친 좌측 및 우측 채널 신호일 수 있거나, 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 신호일 수 있다.
구체적으로, 예를 들어,
Figure pct00288
, 또는
Figure pct00289
, 또는
Figure pct00290
, 여기서
Figure pct00291
는 현재 프레임에서 원래의 좌측 및 우측 채널 신호를 나타내고,
Figure pct00292
는 현재 프레임에서 시간-도메인 전처리를 거친 좌측 및 우측 채널 신호를 나타내며,
Figure pct00293
는 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 신호를 나타낸다.
이에 대응하여, 다음은 비 상관 신호 디코딩 모드에 대한 시나리오를 설명하기 위해 예를 사용한다.
도 5를 참조하여, 본 출원의 실시예는 오디오 디코딩 방법을 추가로 제공한다. 오디오 디코딩 방법의 관련 단계는 디코딩 장치에 의해 구현될 수 있으며, 방법은 구체적으로 다음 단계를 포함할 수 있다.
501. 비트스트림에 기초하여 디코딩을 수행하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호를 획득한다.
502. 현재 프레임의 디코딩 모드를 결정한다.
단계 501 및 단계 502를 수행하기 위한 시퀀스가 없음을 이해할 수 있다.
503. 현재 프레임의 디코딩 모드가 비 상관 신호 디코딩 모드인 것으로 결정될 때, 비 상관 신호 디코딩 모드에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득한다.
재구성된 좌측 및 우측 채널 신호는 디코딩된 좌측 및 우측 채널 신호일 수 있거나, 지연 조정 처리 및/또는 시간-도메인 후처리가 디코딩된 좌측 및 우측 채널 신호를 획득하기 위해 재구성된 좌측 및 우측 채널 신호에 대해 수행될 수 있다.
비 상관 신호 디코딩 모드에 대응하는 시간-도메인 업믹스 처리 방식은 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식이고, 비 상관 신호 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식이다.
현재 프레임의 디코딩 모드는 복수의 디코딩 모드 중 하나일 수 있다. 예를 들어, 현재 프레임의 디코딩 모드는 다음과 같은 디코딩 모드: 상관 신호 디코딩 모드, 비 상관 신호 디코딩 모드, 상관-비상관 신호 디코딩 스위칭 모드, 및 비상관-상관 신호 디코딩 스위칭 모드 중 하나일 수 있다.
전술한 솔루션에서, 현재 프레임의 디코딩 모드가 결정될 필요가 있으며, 이는 현재 프레임의 디코딩 모드에 대한 복수의 가능성이 있음을 나타낸다. 단지 하나의 디코딩 모드가 존재하는 종래의 솔루션과 비교하여, 복수의 가능한 디코딩 모드를 갖는 이 솔루션은 복수의 가능한 시나리오와 더 잘 호환되고 매칭될 수 있다. 또한, 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식이 도입되기 때문에, 현재 프레임의 스테레오 신호가 니어 아웃 오브 페이즈 시그널일 때, 더 많은 목표 채널 조합 방식 및 디코딩 모드가 있으며, 이는 디코딩 품질을 향상시키는 데 도움이 된다.
일부 가능한 구현들에서, 방법은:
현재 프레임의 디코딩 모드가 상관 신호 디코딩 모드인 것으로 결정될 때, 상관 신호 디코딩에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계를 더 포함하며, 상관 신호 디코딩 모드에 대응하는 시간-도메인 업믹스 처리 방식은 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식이고, 상관 신호 채널 조합 방식은 니어 인 페이즈 시그널에 대응하는 채널 조합 방식이다.
일부 가능한 구현들에서, 방법은: 현재 프레임의 디코딩 모드가 상관-비상관 신호 디코딩 스위칭 모드인 것으로 결정될 때, 상관-비상관 신호 디코딩 스위칭 모드에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계를 더 포함할 수 있으며, 여기서, 상관-비상관 신호 디코딩 스위칭 모드에 대응하는 시간-도메인 업믹스 처리 방식은 상관 신호 채널 조합 방식으로부터 비 상관 신호 채널 조합 방식으로의 천이에 대응하는 시간-도메인 업믹스 처리 방식이다.
일부 가능한 구현들에서, 방법은: 현재 프레임의 디코딩 모드가 비상관-상관 신호 디코딩 스위칭 모드인 것으로 결정될 때, 비상관-상관 신호 디코딩 스위칭 모드에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계를 더 포함할 수 있으며, 비상관-상관 신호 디코딩 스위칭 모드에 대응하는 시간-도메인 업믹스 처리 방식은 비 상관 신호 채널 조합 방식으로부터 상관 신호 채널 조합 방식으로의 천이에 대응하는 시간-도메인 업믹스 처리 방식이다.
상이한 디코딩 모드에 대응하는 시간-도메인 업믹스 처리 방식이 일반적으로 다르다는 것을 이해할 수 있다. 또한, 각각의 디코딩 모드는 하나 이상의 시간-도메인 업믹스 처리 방식에 대응할 수 있다.
예를 들어, 일부 가능한 구현들에서, 비 상관 신호 디코딩 모드에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계는:
현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계; 또는 현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터 및 이전 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계를 포함한다.
일부 가능한 구현들에서, 대응하는 업믹스 매트릭스는 오디오 프레임의 채널 조합 비율 팩터에 기초하여 구성될 수 있고, 시간-도메인 업믹스 처리는 대응하는 채널 조합 방식에 대응하는 업믹스 매트릭스를 사용하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 수행되어 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득한다.
예를 들어, 현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리가 수행될 때, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득한다.
Figure pct00294
.
다른 예에서, 시간-도메인 업믹스 처리가 현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터 및 이전 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 수행될 때, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하고,
Figure pct00295
; 또는
Figure pct00296
; 여기서
delay_com은 인코딩 지연 보상을 나타낸다.
다른 예에서, 시간-도메인 업믹스 처리가 현재 프레임에 대한 비 상관 신호 채널 조합 방식의 채널 조합 비율 팩터 및 현재 프레임에 대한 채널 조합 비율 팩터 및 이전 프레임에 대한 비 상관 신호 채널 조합 방식 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 수행될 때, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하며,
Figure pct00297
;
Figure pct00298
; 또는
Figure pct00299
.
여기서,
Figure pct00300
은 현재 프레임에서 디코딩된 좌측 채널 신호를 나타내고,
Figure pct00301
은 현재 프레임에서의 재구성된 우측 채널 신호를 나타내고,
Figure pct00302
은 현재 프레임에서의 디코딩된 일차 채널 신호를 나타내고,
Figure pct00303
은 현재 프레임에서 디코딩된 이차 채널 신호를 나타낸다.
Figure pct00304
은 천이 처리 길이를 나타낸다.
Figure pct00305
은 페이드-인 팩터를 나타낸다. 예를 들어,
Figure pct00306
이다. 확실히,
Figure pct00307
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다.
Figure pct00308
은 페이드-아웃 팩터를 나타낸다. 예를 들어,
Figure pct00309
이다. 확실히,
Figure pct00310
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-아웃 팩터일 수 있다.
Figure pct00311
은 천이 처리 길이를 나타낸다.
Figure pct00312
의 값은 특정 시나리오 요구 사항에 설정될 수 있다. 예를 들어,
Figure pct00313
은 3/N과 같거나
Figure pct00314
은 N보다 작은 다른 값일 수 있다.
다른 예에서, 현재 도메인에 대한 상관 신호 채널 조합 방식의 채널 조합 비율 팩터에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리가 수행될 때, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하며,
Figure pct00315
.
전술한 예에서,
Figure pct00316
은 현재 프레임에서 디코딩된 좌측 채널 신호를 나타낸다.
Figure pct00317
은 현재 프레임에서의 재구성된 우측 채널 신호를 나타낸다.
Figure pct00318
은 현재 프레임에서의 디코딩된 일차 채널 신호를 나타낸다.
Figure pct00319
은 현재 프레임에서 디코딩된 이차 채널 신호를 나타낸다.
전술한 예에서, n은 샘플링 포인트 수를 나타낸다. 예를 들면.
Figure pct00320
이다.
전술한 예에서,
Figure pct00321
은 디코딩 지연 보상을 나타낸다.
Figure pct00322
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
Figure pct00323
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pct00324
는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
Figure pct00325
는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pct00326
는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
Figure pct00327
는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pct00328
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
Figure pct00329
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pct00330
는 복수의 형태를 가질 수 있으며, 예를 들어:
Figure pct00331
, 또는
Figure pct00332
, 또는
Figure pct00333
, 또는
Figure pct00334
, 또는
Figure pct00335
, 또는
Figure pct00336
, 여기서
Figure pct00337
,
Figure pct00338
Figure pct00339
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pct00340
는 복수의 형태를 가질 수 있으며, 예를 들어:
Figure pct00341
, 또는
Figure pct00342
, 또는
Figure pct00343
, 또는
Figure pct00344
, 또는
Figure pct00345
, 또는
Figure pct00346
, 여기서
Figure pct00347
, 및
Figure pct00348
; 및
Figure pct00349
은 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pct00350
은 복수의 형태를 가질 수 있으며, 예를 들어:
Figure pct00351
, 또는
Figure pct00352
, 여기서
Figure pct00353
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
다음은 상관-비상관 신호 코딩 스위칭 모드 및 비상관-비상관 신호 코딩 스위칭 모드에 대한 시나리오를 설명하기 위해 예를 사용한다. 상관-비상관 신호 코딩 스위칭 모드 및 비상관-비상관 신호 코딩 스위칭 모드에 대응하는 시간-도메인 다운믹스 처리 방식은 예를 들어, 분할된 시간-도메인 다운믹스 처리 방식이다.
도 6을 참조하여, 본 출원의 실시예는 오디오 인코딩 방법을 제공한다. 오디오 인코딩 방법의 관련 단계는 인코딩 장치에 의해 구현될 수 있고, 방법은 구체적으로 다음 단계를 포함할 수 있다.
601. 현재 프레임에 대한 채널 조합 방식을 결정한다.
602. 현재 프레임에 대한 채널 조합 방식이 이전 프레임에 대한 채널 조합 방식과 다를 때, 현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호를 획득한다.
603. 획득된 일차 및 이차 채널 신호를 현재 프레임에 인코딩한다.
현재 프레임에 대한 채널 조합 방식이 이전 프레임에 대한 채널 조합 방식과 다르면, 현재 프레임의 코딩 모드는 상관-비상관 신호 코딩 스위칭 모드 또는 비상관-비상관 신호 코딩 스위칭 모드인 것으로 결정될 수 있다. 현재 프레임의 코딩 모드가 상관-비상관 신호 코딩 스위칭 모드 또는 비상관-비상관 신호 코딩 스위칭 모드이면, 예를 들어, 분할된 시간-도메인 다운믹스 처리가 현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 수행될 수 있다.
구체적으로, 예를 들어, 이전 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식일 때, 현재 프레임의 코딩 모드는 상관-비상관 신호 코딩 스위칭 모드인 것으로 결정될 수 있다. 다른 예로, 이전 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식일 때, 현재 프레임의 코딩 모드는 비상관-상관 신호 코딩 스위칭 모드인 것으로 결정될 수 있다. 나머지는 유추하여 추론할 수 있다.
세그먼트화된 시간-도메인 다운믹스 처리는 현재 프레임에서의 좌측 및 우측 채널 신호가 적어도 2개의 세그먼트로 분할되고, 다른 시간-도메인 다운믹스 처리 방식이 각 세그먼트에 대해 시간-도메인 다운믹스 처리를 수행하는 데 사용되는 것으로 이해될 수 있다. 비 세그먼트화된 시간-도메인 다운믹스 처리와 비교하여, 세그먼트화된 시간-도메인 다운믹스 처리는 인접한 프레임에 대한 채널 조합 방식이 변경될 때 더 원활한 천이를 얻을 가능성이 더 크다는 것을 이해할 수 있다.
전술한 솔루션에서, 현재 프레임에 대한 채널 조합 방식이 결정될 필요가 있으며, 이는 현재 프레임에 대한 채널 조합 방식에 대한 복수의 가능성이 있음을 나타낸다. 하나의 채널 조합 방식이 존재하는 종래의 솔루션과 비교하여, 복수의 가능한 채널 조합 방식을 갖는 이 솔루션은 복수의 가능한 시나리오와 더 잘 호환되고 매칭될 수 있다. 또한, 현재 프레임에 대한 채널 조합 방식과 이전 프레임에 대한 채널 조합 방식이 다를 때, 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하는 메커니즘이 도입된다. 세그먼트화된 시간-도메인 다운믹스 처리 메커니즘은 채널 조합 방식의 원활한 천이를 구현하고 인코딩 품질을 향상시키는 데 도움이 된다.
또한, 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식이 도입되기 때문에, 현재 프레임의 스테레오 신호가 니어 아웃 오브 페이즈 시그널일 때, 더 많은 목표 채널 조합 방식 및 코딩 모드가 있으며, 이는 인코딩 품질을 향상시키는 데 도움이 된다.
예를 들어, 이전 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식 또는 비 상관 신호 채널 조합 방식일 수 있다. 현재 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식 또는 비 상관 신호 채널 조합 방식일 수 있다. 따라서, 현재 프레임과 이전 프레임에 대한 채널 조합 방식이 다른 경우가 여러 가지 있을 수 있다.
구체적으로, 예를 들어, 이전 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식일 때, 현재 프레임에서의 좌측 및 우측 채널 신호는 좌측 및 우측 채널 신호의 시작 세그먼트, 좌측 및 우측 채널 신호의 중간 세그먼트 및 좌측 및 우측 채널 신호의 종료 세그먼트를 포함하고; 현재 프레임에서의 일차 및 이차 채널 신호는 일차 및 이차 채널 신호의 시작 세그먼트, 일차 및 이차 채널 신호의 중간 세그먼트, 및 일차 및 이차 채널 신호의 종료 세그먼트를 포함한다. 이 경우, 현재 프레임에 대한 채널 조합 방식과 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하여, 현재 프레임에서의 일차 및 이차 채널 신호를 획득하는 단계는:
이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써, 현재 프레임에서의 좌측 및 우측 채널 신호의 시작 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호의 시작 세그먼트를 획득하는 단계;
현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써, 현재 프레임에서의 좌측 및 우측 채널 신호의 종료 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호의 종료 세그먼트를 획득하는 단계; 및
이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써 현재 프레임에서의 좌측 및 우측 채널 신호의 중간 세그먼트에 대해 시간-도메인 다운믹스 처리를 수행하여 일차 및 이차 채널 신호의 제1 중간 세그먼트를 획득하고; 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써 현재 프레임에서의 좌측 및 우측 채널 신호의 중간 세그먼트에 대해 시간-도메인 다운믹스 처리를 수행하여 일차 및 이차 채널 신호의 제2 중간 세그먼트를 획득하며; 그리고 일차 및 이차 채널 신호의 제1 중간 세그먼트 및 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리를 수행하여, 현재 프레임에서의 일차 및 이차 채널 신호의 중간 세그먼트를 획득하는 단계를 포함할 수 있다.
현재 프레임에서의 좌측 및 우측 채널 신호의 시작 세그먼트, 좌측 및 우측 채널 신호의 중간 세그먼트 및 좌측 및 우측 채널 신호의 종료 세그먼트의 길이는 요구 사항에 기초하여 설정될 수 있다. 현재 프레임에서의 좌측 및 우측 채널 신호의 시작 세그먼트, 좌측 및 우측 채널 신호의 중간 세그먼트 및 좌측 및 우측 채널 신호의 종료 세그먼트의 길이는 동일할 수도 있고 부분적으로 동일할 수도 있고 서로 다를 수 있다.
현재 프레임에서의 일차 및 이차 채널 신호의 시작 세그먼트, 일차 및 이차 채널 신호의 중간 세그먼트 및 일차 및 이차 채널 신호의 종료 세그먼트의 길이는 요구 사항에 기초하여 설정될 수 있다. 현재 프레임에서의 일차 및 이차 채널 신호의 시작 세그먼트, 일차 및 이차 채널 신호의 중간 세그먼트 및 일차 및 이차 채널 신호의 종료 세그먼트의 길이는 동일할 수도 있고 부분적으로 동일할 수도 있고 서로 다를 수도 있다.
일차 및 이차 채널 신호의 제1 중간 세그먼트 및 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 일차 및 이차 채널 신호의 제1 중간 세그먼트에 대응하는 가중 계수는 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대응하는 가중 계수와 동일할 수 있거나 동일하지 않을 수 있다.
예를 들어, 일차 및 이차 채널 신호의 제1 중간 세그먼트 및 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 일차 및 이차 채널 신호의 제1 중간 세그먼트에 대응하는 가중 계수는 일차 채널 신호 및 이차 채널 신호의 제2 중간 세그먼트에 대응하는 가중 계수가 페이드-인 팩터이다.
일부 가능한 구현에서,
Figure pct00354
; 여기서
Figure pct00355
은 현재 프레임에서 일차 채널 신호의 시작 세그먼트를 나타내고,
Figure pct00356
은 현재 프레임에서 이차 채널 신호의 시작 세그먼트를 나타내고,
Figure pct00357
은 현재 프레임에서 일차 채널 신호의 종료 세그먼트를 나타내고,
Figure pct00358
은 현재 프레임에서 이차 채널 신호의 종료 세그먼트를 나타내고,
Figure pct00359
은 현재 프레임에서 일차 채널 신호의 중간 세그먼트를 나타내고,
Figure pct00360
은 현재 프레임에서 이차 채널 신호의 중간 세그먼트를 나타내고;
Figure pct00361
은 현재 프레임에서의 일차 채널 신호를 나타내고; 그리고
Figure pct00362
은 현재 프레임의 이차 채널 신호를 나타낸다.
예를 들어,
Figure pct00363
이다.
예를 들어,
Figure pct00364
은 페이드-인 팩터를 나타내고
Figure pct00365
은 페이드-아웃 팩터를 나타낸다. 예를 들어
Figure pct00366
Figure pct00367
의 합은 1이다.
구체적으로, 예를 들어,
Figure pct00368
Figure pct00369
이다. 확실히,
Figure pct00370
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다. 확실히,
Figure pct00371
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다.
여기서, n은 샘플링 포인트 번호를 나타낸다.
Figure pct00372
, 및 0<
Figure pct00373
<
Figure pct00374
<
Figure pct00375
이다.
예를 들어
Figure pct00376
은 100, 107, 120, 150 또는 다른 값과 같다.
예를 들어
Figure pct00377
는 180, 187, 200, 203 또는 다른 값과 같다.
여기서,
Figure pct00378
은 현재 프레임에서의 일차 채널 신호의 제1 중간 세그먼트를 나타내고,
Figure pct00379
은 현재 프레임에서 이차 채널 신호의 제1 중간 세그먼트를 나타낸다.
Figure pct00380
은 현재 프레임에서의 일차 채널 신호의 제2 중간 세그먼트를 나타내고,
Figure pct00381
은 현재 프레임에서 이차 채널 신호의 제2 중간 세그먼트를 나타낸다.
일부 가능한 구현에서,
Figure pct00382
;
Figure pct00383
;
Figure pct00384
; 및
Figure pct00385
; 여기서
Figure pct00386
은 현재 프레임에서의 좌측 채널 신호를 나타내고,
Figure pct00387
은 현재 프레임에서 우측 채널 신호를 나타내고; 그리고
Figure pct00388
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pct00389
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성되고;
Figure pct00390
는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pct00391
는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pct00392
는 복수의 가능한 형태를 가질 수 있으며, 이것은 구체적으로 예를 들어:
Figure pct00393
, 또는
Figure pct00394
, 또는
Figure pct00395
, 또는
Figure pct00396
, 또는
Figure pct00397
, 또는
Figure pct00398
, 여기서
Figure pct00399
,
Figure pct00400
Figure pct00401
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pct00402
은 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pct00403
, 또는
Figure pct00404
, 여기서
Figure pct00405
는 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
구체적으로, 다른 예를 들어, 이전 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식일 때, 현재 프레임에서의 좌측 및 우측 채널 신호 좌측 및 우측 채널 신호의 시작 세그먼트, 좌측 및 우측 채널 신호의 중간 세그먼트, 및 좌측 및 우측 채널 신호의 종료 세그먼트를 포함하고; 현재 프레임에서의 일차 및 이차 채널 신호는 일차 및 이차 채널 신호의 시작 세그먼트, 일차 및 이차 채널 신호의 중간 세그먼트, 및 일차 및 이차 채널 신호의 종료 세그먼트를 포함한다. 이 경우, 현재 프레임에 대한 채널 조합 방식과 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하여, 현재 프레임에서의 일차 및 이차 채널 신호를 획득하는 단계는:
이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써, 현재 프레임에서의 좌측 및 우측 채널 신호의 시작 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호의 시작 세그먼트를 획득하는 단계;
현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써, 현재 프레임에서의 좌측 및 우측 채널 신호의 종료 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호의 종료 세그먼트를 획득하는 단계; 및
이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써, 현재 프레임에서의 좌측 및 우측 채널 신호의 중간 세그먼트에 대해 시간-도메인 다운믹스 처리를 수행하여 일차 및 이차 채널 신호의 제3 중간 세그먼트를 획득하고; 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써 현재 프레임에서의 좌측 및 우측 채널 신호의 중간 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 일차 및 이차 채널 신호의 제4 중간 세그먼트를 획득하며; 그리고 일차 및 이차 채널 신호의 제3 중간 세그먼트 및 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리를 수행하여, 현재 프레임에서의 일차 및 이차 채널 신호의 중간 세그먼트를 획득하는 단계를 포함할 수 있다.
일차 및 이차 채널 신호의 제3 중간 세그먼트 및 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 일차 및 이차 채널 신호의 제3 중간 세그먼트에 대응하는 가중 계수는 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대응하는 가중 계수와 동일할 수도 있고 동일하지 않을 수도 있다.
예를 들어, 일차 및 이차 채널 신호의 제3 중간 세그먼트 및 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 일차 및 이차 채널 신호의 제3 중간 세그먼트에 대응하는 가중 계수는 페이드-아웃 팩터이고, 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대응하는 가중 계수는 페이드-인 팩터이다.
일부 가능한 구현에서
Figure pct00406
; 여기서
Figure pct00407
은 현재 프레임에서 일차 채널 신호의 시작 세그먼트를 나타내고,
Figure pct00408
은 현재 프레임에서 이차 채널 신호의 시작 세그먼트를 나타내고,
Figure pct00409
은 현재 프레임에서 일차 채널 신호의 종료 세그먼트를 나타내고,
Figure pct00410
은 현재 프레임에서 이차 채널 신호의 종료 세그먼트를 나타내고,
Figure pct00411
은 현재 프레임에서 일차 채널 신호의 중간 세그먼트를 나타내고,
Figure pct00412
은 현재 프레임에서 이차 채널 신호의 중간 세그먼트를 나타내고;
Figure pct00413
은 현재 프레임에서의 일차 채널 신호를 나타내고; 그리고
Figure pct00414
은 현재 프레임의 이차 채널 신호를 나타낸다.
여기서, 예를 들어,
Figure pct00415
이고,
Figure pct00416
은 페이드-인 팩터를 나타내고
Figure pct00417
은 페이드-아웃 팩터를 나타내며
Figure pct00418
Figure pct00419
의 합은 1이다.
구체적으로, 예를 들어;
Figure pct00420
Figure pct00421
이다. 확실히,
Figure pct00422
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다. 확실히,
Figure pct00423
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다.
여기서, n은 샘플링 포인트 번호를 나타낸다. 예를 들면,
Figure pct00424
이다.
여기서 0<
Figure pct00425
<
Figure pct00426
<
Figure pct00427
이다.
예를 들어
Figure pct00428
은 101, 107, 120, 150 또는 다른 값과 같다.
예를 들어
Figure pct00429
는 181, 187, 200, 205 또는 다른 값과 같다.
Figure pct00430
은 현재 프레임에서의 일차 채널 신호의 제3 중간 세그먼트를 나타내고,
Figure pct00431
은 현재 프레임에서 이차 채널 신호의 제3 중간 세그먼트를 나타낸다.
Figure pct00432
은 현재 프레임에서의 일차 채널 신호의 제4 중간 세그먼트를 나타내고,
Figure pct00433
은 현재 프레임에서 이차 채널 신호의 제4 중간 세그먼트를 나타낸다.
일부 가능한 구현에서,
Figure pct00434
;
Figure pct00435
;
Figure pct00436
; 및
Figure pct00437
; 여기서
Figure pct00438
은 현재 프레임의 좌측 채널 신호를 나타내고
Figure pct00439
은 현재 프레임의 우측 채널 신호를 나타낸다.
Figure pct00440
는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pct00441
는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pct00442
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
Figure pct00443
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pct00444
는 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pct00445
, 또는
Figure pct00446
, 또는
Figure pct00447
, 또는
Figure pct00448
, 또는
Figure pct00449
, 또는
Figure pct00450
, 여기서
Figure pct00451
, and
Figure pct00452
; and
Figure pct00453
, 및
Figure pct00454
; 그리고
Figure pct00455
은 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pct00456
은 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pct00457
, 또는
Figure pct00458
, 여기서
Figure pct00459
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
일부 가능한 구현들에서, 현재 프레임에서의 좌측 및 우측 채널 신호는 예를 들어 현재 프레임에서의 최초의 좌측 및 우측 채널 신호일 수 있거나, 시간-도메인 전처리를 거친 좌측 및 우측 채널 신호일 수 있고, 지연 정렬 처리를 거친 좌측 및 우측 채널 신호일 수 있다.
구체적으로, 예를 들어,
Figure pct00460
, 또는
Figure pct00461
, 또는
Figure pct00462
, 여기서
Figure pct00463
은 현재 프레임의 원래 좌측 채널 신호를 나타내고(원래의 좌측 채널 신호는 시간-도메인 전처리를 거치지 않은 좌측 채널 신호이다),
Figure pct00464
은 현재 프레임의 원래의 우측 채널 신호를 나타내며(원래의 우측 채널 신호는 시간-도메인 전처리를 거치지 않은 우측 채널 신호이다); 그리고
Figure pct00465
는 현재 프레임에서 시간-도메인 전처리를 거친 좌측 채널 신호를 나타내고,
Figure pct00466
는 현재 프레임에서 시간-도메인 전처리를 거친 우측 채널 신호를 나타낸다.
Figure pct00467
은 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 신호를 나타내고, 현재
Figure pct00468
은 프레임에서 지연 정렬 처리를 거친 우측 채널 신호를 나타낸다.
전술한 예에서의 세그먼트화된 시간-도메인 다운믹스 처리 방식은 모든 가능한 구현이 아닐 수 있으며, 실제 응용에서는 다른 세그먼트화된 시간-도메인 다운믹스 처리 방식이 사용될 수도 있음을 이해할 수 있다.
이에 대응하여, 다음은 상관-비상관 신호 디코딩 스위칭 모드 및 비상관-비상관 신호 디코딩 스위칭 모드에 대한 시나리오를 설명하기 위해 예를 사용한다. 상관-비상관 신호 디코딩 스위칭 모드 및 비상관-비상관 신호 디코딩 스위칭 모드에 대응하는 시간-도메인 다운믹스 처리 방식은 예를 들어 세그먼트화된 시간-도메인 다운믹스 처리 방식이다.
도 7을 참조하여, 본 출원의 실시예는 오디오 디코딩 방법을 제공한다. 오디오 디코딩 방법의 관련 단계는 디코딩 장치에 의해 구현될 수 있으며, 방법은 구체적으로 다음 단계를 포함할 수 있다.
701. 비트스트림에 기초하여 디코딩을 수행하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호를 획득한다.
702. 현재 프레임에 대한 채널 조합 방식을 결정한다.
단계(701) 및 단계(702)를 수행하기 위해 시퀀스가 존재하지 않는 것으로 이해될 수 있다.
703. 현재 프레임에 대한 채널 조합 방식이 이전 프레임에 대한 채널 조합 방식과 다를 때, 현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 세그먼트화된 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 얻는다.
현재 프레임에 대한 채널 조합 방식은 복수의 채널 조합 방식 중 하나이다.
예를 들어, 복수의 채널 조합 방식은 비 상관성 신호 채널 조합 방식 및 상관 신호 채널 조합 방식을 포함한다. 상관 신호 채널 조합 방식은 니어 인 페이즈 시그널에 대응하는 채널 조합 방식이다. 비 상관 신호 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식이다. 니어 인 페이즈 시그널에 대응하는 채널 조합 방식은 니어 인 페이즈 시그널에 적용 가능하고, 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 적용 가능하다는 것을 이해할 수 있다.
세그먼트화된 시간-도메인 업믹스 처리는 현재 프레임에서의 좌측 및 우측 채널 신호가 적어도 2개의 세그먼트로 분할되고, 다른 시간-도메인 업믹스 처리 방식이 각 세그먼트에 대해 시간-도메인 업믹스 처리를 수행하는 데 사용되는 것으로 이해될 수 있다. 비 세그먼트화된 시간-도메인 업믹스 처리와 비교하여, 세그먼트화된 시간-도메인 업믹스 처리는 인접한 프레임에 대한 채널 조합 방식이 변경될 때 더 원활한 천이를 얻을 가능성이 더 크다는 것을 이해할 수 있다.
전술한 솔루션에서, 현재 프레임에 대한 채널 조합 방식이 결정될 필요가 있으며, 이는 현재 프레임에 대한 채널 조합 방식에 대한 복수의 가능성이 있음을 나타낸다. 하나의 채널 조합 방식이 존재하는 종래의 솔루션과 비교하여, 복수의 가능한 채널 조합 방식을 갖는 이 솔루션은 복수의 가능한 시나리오와 더 잘 호환되고 매칭될 수 있다. 또한, 현재 프레임에 대한 채널 조합 방식과 이전 프레임에 대한 채널 조합 방식이 다를 때, 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 업믹스 처리를 수행하는 메커니즘이 도입된다. 세그먼트화된 시간-도메인 업믹스 처리 메커니즘은 채널 조합 방식의 원활한 천이를 구현하고 인코딩 품질을 향상시키는 데 도움이 된다.
또한, 근사한 위상 신호에 대응하는 채널 조합 방식이 도입되기 때문에, 현재 프레임의 스테레오 신호가 위상 이외의 신호일 때, 더 많은 목표 채널 조합 방식 및 코딩 모드가 있으며, 이는 인코딩 품질을 향상시키는 데 도움이 된다.
예를 들어, 이전 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식 또는 비 상관 신호 채널 조합 방식일 수 있다. 현재 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식 또는 비 상관 신호 채널 조합 방식일 수 있다. 따라서, 현재 프레임과 이전 프레임에 대한 채널 조합 방식이 다른 경우가 여러 가지 있을 수 있다.
구체적으로, 예를 들어, 이전 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식은 비 상관 신호 채널 조합 방식이다. 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호는 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트, 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트, 및 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트를 포함한다. 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호는 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트, 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트, 및 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트를 포함한다. 이 경우, 현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 세그먼트화된 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계는: 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트를 획득하는 단계;
현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써, 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트를 획득하는 단계; 및
이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써, 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트를 획득하고; 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트를 획득하며; 그리고 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트를 획득하기 위해, 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리를 수행하는 단계를 포함한다.
재구성된 좌측 및 우측 채널 신호의 시작 세그먼트, 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트 및 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트의 길이는 요구 사항에 기초하여 설정될 수 있다. 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트, 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트의 길이는 동일할 수도 있고 부분적으로 동일할 수도 있고 서로 다를 수도 있다.
디코딩된 일차 및 이차 채널 신호의 시작 세그먼트, 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트, 및 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트의 길이는 요구 사항에 기초하여 설정될 수 있다. 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트, 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트, 및 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트의 길이는 동일할 수도 있고 부분적으로 동일할 수도 있고 서로 다를 수도 있다.
재구성된 좌측 및 우측 채널 신호는 디코딩된 좌측 및 우측 채널 신호일 수 있거나, 지연 조정 처리 및/또는 시간-도메인 후처리가 디코딩된 좌측 및 우측 채널 신호를 획득하기 위해 재구성된 좌측 및 우측 채널 신호에 대해 수행될 수 있다.
재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트에 대응하는 가중 계수는 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대응하는 가중 계수와 동일할 수도 있고 동일하지 않을 수도 있다
예를 들어, 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트에 대응하는 가중 계수는 페이드-아웃 팩터이고, 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대응하는 가중 계수는 페이드-인 팩터이다.
일부 가능한 구현에서
Figure pct00469
; 여기서
Figure pct00470
은 현재 프레임에서의 재구성된 좌측 채널 신호의 시작 세그먼트를 나타내고,
Figure pct00471
은 현재 프레임에서의 재구성된 우측 채널 신호의 시작 세그먼트를 나타낸다.
Figure pct00472
은 현재 프레임에서의 재구성된 좌측 채널 신호의 종료 세그먼트를 나타내고,
Figure pct00473
은 현재 프레임에서의 재구성된 우측 채널 신호의 종료 세그먼트를 나타낸다.
Figure pct00474
은 현재 프레임에서의 재구성된 좌측 채널 신호의 중간 세그먼트를 나타내고,
Figure pct00475
은 현재 프레임에서의 재구성된 우측 채널 신호의 중간 세그먼트를 나타내고;
Figure pct00476
은 현재 프레임에서의 재구성된 좌측 채널 신호를 나타내고; 그리고
Figure pct00477
은 현재 프레임에서의 재구성된 우측 채널 신호를 나타낸다.
예를 들면,
Figure pct00478
이다.
예를 들어,
Figure pct00479
은 페이드-인 팩터를 나타내고
Figure pct00480
은 페이드-아웃 팩터를 나타낸다. 예를 들어
Figure pct00481
Figure pct00482
의 합은 1이다.
구체적으로, 예를 들어,
Figure pct00483
Figure pct00484
이다. 확실히,
Figure pct00485
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다. 확실히,
Figure pct00486
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다.
여기서, n은 샘플링 포인트 번호를 나타내고,
Figure pct00487
이다. 여기서 0<
Figure pct00488
<
Figure pct00489
<
Figure pct00490
이다.
Figure pct00491
은 현재 프레임에서의 재구성된 좌측 채널 신호의 제1 중간 세그먼트를 나타내고,
Figure pct00492
은 현재 프레임에서의 재구성된 우측 채널 신호의 제1 중간 세그먼트를 나타낸다.
Figure pct00493
은 현재 프레임에서의 재구성된 좌측 채널 신호의 제2 중간 세그먼트를 나타내고,
Figure pct00494
은 현재 프레임에서의 재구성된 우측 채널 신호의 제2 중간 세그먼트를 나타낸다.
일부 가능한 구현에서,
Figure pct00495
;
Figure pct00496
;
Figure pct00497
; 및
Figure pct00498
; 여기서
Figure pct00499
은 현재 프레임에서의 디코딩된 일차 채널 신호를 나타내고,
Figure pct00500
은 현재 프레임에서 디코딩된 이차 채널 신호를 나타내고; 그리고
Figure pct00501
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
Figure pct00502
은 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성되고;
Figure pct00503
는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내며,
Figure pct00504
는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pct00505
은 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pct00506
, 또는
Figure pct00507
, 또는
Figure pct00508
, 또는
Figure pct00509
, 또는
Figure pct00510
, 또는
Figure pct00511
, 여기서
Figure pct00512
,
Figure pct00513
Figure pct00514
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pct00515
는 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pct00516
, 또는
Figure pct00517
여기서,
Figure pct00518
는 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
구체적으로, 다른 예에서, 이전 프레임에 대한 채널 조합 방식은 비 상관 신호 채널 조합 방식이고, 현재 프레임에 대한 채널 조합 방식은 상관 신호 채널 조합 방식이다. 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호는 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트, 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트, 및 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트를 포함한다. 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호는 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트, 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트, 및 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트를 포함한다. 이 경우, 현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 세그먼트화된 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계는:
이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트를 획득하는 단계;
현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써, 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트를 획득하는 단계; 및
이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써, 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트를 획득하고; 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트를 획득하며; 그리고 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트를 획득하기 위해, 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리를 수행하는 단계를 포함한다.
재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트에 대응하는 가중 계수 제1 채널은 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대응하는 가중 계수와 동일할 수도 있고 동일하지 않을 수도 있다
예를 들어, 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트 및 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트에 대응하는 가중 계수는 페이드-아웃 팩터이고, 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대응하는 가중 계수는 페이드-인 팩터이다.
일부 가능한 구현에서
Figure pct00519
; 여기서
Figure pct00520
은 현재 프레임에서 재구성된 좌측 채널 신호의 시작 세그먼트를 나타내고,
Figure pct00521
은 현재 프레임에서 재구성된 우측 채널 신호의 시작 세그먼트를 나타내고,
Figure pct00522
은 현재 프레임에서 재구성된 좌측 채널 신호의 종료 세그먼트를 나타내고,
Figure pct00523
은 현재 프레임에서 재구성된 우측 채널 신호의 종료 세그먼트를 나타내고,
Figure pct00524
은 현재 프레임에서 재구성된 좌측 채널 신호의 중간 세그먼트를 나타내고,
Figure pct00525
은 현재 프레임에서 재구성된 우측 채널 신호의 중간 세그먼트를 나타내고,
Figure pct00526
은 현재 프레임에서의 재구성된 좌측 채널 신호를 나타내고; 그리고
Figure pct00527
은 현재 프레임에서의 재구성된 우측 채널 신호를 나타낸다.
예를 들면,
Figure pct00528
이다.
Figure pct00529
은 페이드-인 팩터를 나타내고
Figure pct00530
은 페이드-아웃 팩터를 나타내며
Figure pct00531
Figure pct00532
의 합은 1이다.
구체적으로, 예를 들어,
Figure pct00533
Figure pct00534
이다. 확실히,
Figure pct00535
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다. 확실히,
Figure pct00536
은 대안적으로 n에 기초한 다른 기능 관계의 페이드-인 팩터일 수 있다.
여기서, n은 샘플링 포인트 번호를 나타낸다. 예를 들면,
Figure pct00537
이다.
여기서 0<
Figure pct00538
<
Figure pct00539
<
Figure pct00540
이다.
예를 들어
Figure pct00541
은 101, 107, 120, 150 또는 다른 값과 같다.
예를 들어
Figure pct00542
는 181, 187, 200, 205 또는 다른 값과 같다.
Figure pct00543
은 현재 프레임에서의 재구성된 좌측 채널 신호의 제3 중간 세그먼트를 나타내고,
Figure pct00544
은 현재 프레임에서의 재구성된 우측 채널 신호의 제3 중간 세그먼트를 나타낸다.
Figure pct00545
는 현재 프레임에서의 재구성된 좌측 채널 신호의 제4 중간 세그먼트를 나타내고,
Figure pct00546
는 현재 프레임에서의 재구성된 우측 채널 신호의 제4 중간 세그먼트를 나타낸다.
일부 가능한 구현에서,
Figure pct00547
;
Figure pct00548
;
Figure pct00549
; 및
Figure pct00550
; 여기서
Figure pct00551
은 현재 프레임에서의 디코딩된 일차 채널 신호를 나타내고,
Figure pct00552
은 현재 프레임에서 디코딩된 이차 채널 신호를 나타낸다.
Figure pct00553
는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
Figure pct00554
는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pct00555
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
Figure pct00556
은 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성된다.
Figure pct00557
는 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pct00558
, 또는
Figure pct00559
, 또는
Figure pct00560
, 또는
Figure pct00561
, 또는
Figure pct00562
, 또는
Figure pct00563
, 여기서
Figure pct00564
, 및
Figure pct00565
; 그리고
Figure pct00566
은 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
Figure pct00567
은 복수의 가능한 형태를 가질 수 있으며, 구체적으로 예를 들어:
Figure pct00568
, 또는
Figure pct00569
, 여기서
Figure pct00570
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
본 출원의 이 실시예에서, 현재 프레임의 스테레오 파라미터(예를 들어, 채널 조합 비율 팩터 및/또는 채널 간 시간 차이)는 고정된 값일 수 있거나, 또는 현재 프레임에 대한 채널 조합 방식(예를 들어, 상관 신호 채널 조합 방식 또는 비 상관 신호 채널 조합 방식)에 기초하여 결정될 수 있다.
도 8을 참조하여, 다음은 시간-도메인 스테레오 파라미터 결정 방법을 설명하기 위해 예를 사용한다. 시간-도메인 스테레오 파라미터 결정 방법의 관련 단계는 인코딩 장치에 의해 구현될 수 있고, 이 방법은 구체적으로 다음 단계를 포함할 수 있다.
801. 현재 프레임에 대한 채널 조합 방식을 결정한다.
802. 현재 도메인에 대한 채널 조합 방식에 기초하여 현재 프레임의 시간-도메인 스테레오 파라미터를 결정하고, 여기서 시간-도메인 스테레오 파라미터는 채널 조합 비율 팩터 및 채널 간 시간 차이 중 적어도 하나를 포함한다.
현재 프레임에 대한 채널 조합 방식은 복수의 채널 조합 방식 중 하나이다.
예를 들어, 복수의 채널 조합 방식은 비 상관성 신호 채널 조합 방식 및 상관 신호 채널 조합 방식을 포함한다.
상관 신호 채널 조합 방식은 근거리 신호에 대응하는 채널 조합 방식이다. 비 상관 신호 채널 조합 방식은 위상이 거의 없는 신호에 대응하는 채널 조합 방식이다. 니어 인 페이즈 시그널에 대응하는 채널 조합 방식은 니어 인 페이즈 시그널에 적용 가능하고, 니어 아웃 오브 페이즈 시그널에 대응하는 채널 조합 방식은 니어 아웃 오브 페이즈 시그널에 적용 가능하다는 것을 이해할 수 있다.
현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식인 것으로 결정될 때, 현재 프레임의 시간-도메인 스테레오 파라미터는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터이거나; 또는 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식인 것으로 결정될 때, 현재 프레임의 시간-도메인 스테레오 파라미터는 현재 프레임에 대한 비 상관성 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터이다.
전술한 솔루션에서, 현재 프레임에 대한 채널 조합 방식이 결정될 필요가 있으며, 이는 현재 프레임에 대한 채널 조합 방식에 대한 복수의 가능성이 있음을 나타낸다. 하나의 채널 조합 방식이 존재하는 종래의 솔루션과 비교하여, 복수의 가능한 채널 조합 방식을 갖는 이 솔루션은 복수의 가능한 시나리오와 더 잘 호환되고 매칭될 수 있다. 현재 프레임의 시간-도메인 스테레오 파라미터는 현재 프레임에 대한 채널 조합 방식에 기초하여 결정되기 때문에, 시간-도메인 스테레오 파라미터는 복수의 가능한 시나리오와 더 잘 호환될 수 있고, 인코딩 및 디코딩 품질이 더 개선될 수 있다.
일부 가능한 구현들에서, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터와 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터는 먼저 개별적으로 계산될 수 있다. 그런 다음, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식인 것으로 결정될 때, 현재 프레임의 시간-도메인 스테레오 파라미터는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터인 것으로 결정되거나; 또는 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식인 것으로 결정될 때, 현재 프레임의 시간-도메인 스테레오 파라미터는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터인 것으로 결정된다. 대안적으로, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터가 먼저 계산될 수 있고, 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식인 것으로 결정될 때, 현재 프레임의 시간-도메인 스테레오 파라미터가 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터인 것으로 결정되거나, 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식인 것으로 결정될 때, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터가 계산되고, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터가 현재 프레임의 시간-도메인 스테레오 파라미터 로서 결정된다.
대안적으로, 현재 프레임에 대한 채널 조합 방식이 먼저 결정될 수 있다. 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식인 것으로 결정될 때, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터가 계산되고, 현재 프레임의 시간-도메인 스테레오 파라미터는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터이거나; 또는 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식인 것으로 결정될 때, 현재 프레임에 대한 비 상관성 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터가 계산되고, 현재 프레임의 시간-도메인 스테레오 파라미터는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 스테레오 파라미터이다.
일부 가능한 구현들에서, 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 시간-도메인 스테레오 파라미터를 결정하는 단계는: 현재 프레임에 대한 채널 조합 방식에 기초하여, 현재 프레임에 대한 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값을 결정하는 단계를 포함할 수 있다. 현재 프레임에 대한 채널 조합 방식(상관 신호 채널 조합 방식 또는 비 상관 신호 채널 조합 방식)에 대응하는 채널 조합 비율 팩터의 초기 값이 수정될 필요가 없는 경우, 현재 프레임에 대한 채널 조합 방식에 대응하는 채널 조합 비율 팩터는 현재 프레임에 대한 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값과 동일하다. 현재 프레임에 대한 채널 조합 방식(상관 신호 채널 조합 방식 또는 비 상관 신호 채널 조합 방식)에 대응하는 채널 조합 비율 팩터의 초기 값을 수정해야 하는 경우, 현재 프레임에 대한 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값이 수정되어, 현재 프레임에 대한 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값을 획득하며, 현재 프레임에 대한 채널 조합 방식에 대응하는 채널 조합 비율 팩터는 현재 프레임에 대한 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값과 동일하다.
예를 들어, 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 시간-도메인 스테레오 파라미터를 결정하는 단계는: 현재 프레임의 좌측 채널 신호에 기초하여 현재 프레임에서의 좌측 채널 신호의 프레임 에너지를 계산하는 단계; 현재 프레임의 우측 채널 신호에 기초하여 현재 프레임의 우측 채널 신호의 프레임 에너지를 계산하는 단계; 및 현재 프레임의 좌측 채널 신호의 프레임 에너지 및 현재 프레임에서의 우측 채널 신호의 프레임 에너지에 기초하여 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값을 계산하는 단계를 포함한다.
현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값이 수정될 필요가 없는 경우, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값과 동일하고, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값과 동일하다.
현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값이 수정될 필요가 있을 때, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값 및 초기 값의 인코딩된 인덱스가 수정되어, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값 및 수정된 값의 인코딩된 인덱스를 획득한다. 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값과 동일하고, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값의 인코딩된 인덱스와 동일하다.
구체적으로, 예를 들어, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값 및 초기 값의 인코딩된 인덱스가 수정될 때,
Figure pct00571
; 및
Figure pct00572
; 여기서
Figure pct00573
는 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스를 나타내고;
Figure pct00574
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값에 대응하는 인코딩된 인덱스를 나타내고; 그리고
Figure pct00575
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값을 나타낸다.
다른 예를 들어, 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 시간-도메인 스테레오 파라미터를 결정하는 단계는: 현재 프레임의 좌측 채널 신호 및 우측 채널 신호에 기초하여 현재 프레임의 참조 채널 신호를 획득하는 단계; 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 진폭 상관 파라미터를 계산하는 단계; 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 진폭 상관 파라미터를 계산하는 단계; 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 진폭 상관 파라미터 및 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 진폭 상관 파라미터에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터를 계산하는 단계; 및 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터에 기초하여, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 단계를 포함한다.
현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터에 기초하여, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 단계는 예를 들어: 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터에 기초하여 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값을 계산하는 단계; 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 획득하기 위해, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값을 수정하는 단계를 포함한다. 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값이 수정될 필요가 없을 때, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값과 동일하다는 것을 이해할 수 있다.
일부 가능한 구현에서
Figure pct00576
; 및
Figure pct00577
; 여기서
Figure pct00578
;
Figure pct00579
;
Figure pct00580
은 현재 프레임에서 참조 채널 신호를 나타내고; 그리고
Figure pct00581
은 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 신호를 나타내고,
Figure pct00582
은 현재 프레임에서 지연 정렬 처리를 거친 우측 채널 신호를 나타내며,
Figure pct00583
은 현재 프레임에서 좌측 채널 신호와 참조 채널 신호 사이의 진폭 상관 파라미터를 나타내며,
Figure pct00584
은 현재 프레임에서 우측 채널 신호와 참조 채널 신호 사이의 진폭 상관 파라미터를 나타낸다.
일부 가능한 구현들에서, 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 진폭 상관 파라미터 및 현재 프레임에서의 우측 채널 신호 및 참조 채널 신호 사이의 진폭 상관 파라미터에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터를 계산하는 단계는: 지연 정렬 처리를 거친 좌측 채널 신호와 현재 프레임의 참조 채널 신호 사이의 진폭 상관 파라미터에 기초하여 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 계산하는 단계; 지연 정렬 처리를 거친 우측 채널 신호와 현재 프레임의 참조 채널 신호 사이의 진폭 상관 파라미터에 기초하여 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 계산하는 단계; 및 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터 및 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터에 기초하여 현재 프레임에서의 좌측 및 우측 채널 사이의 진폭 상관 차이 파라미터를 계산하는 단계를 포함한다.
예를 들어 다양한 평활화 방식이 있을 수 있다.
Figure pct00585
; 여기서
Figure pct00586
이고, A는 현재 프레임에서의 좌측 채널 신호의 장기 평활화 프레임 에너지의 업데이트 팩터를 나타내고,
Figure pct00587
은 현재 프레임에서의 좌측 채널 신호의 장기 평활화 프레임 에너지를 나타내고,
Figure pct00588
은 현재 프레임의 좌측 채널 신호의 프레임 에너지를 나타내고,
Figure pct00589
은 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 나타내고,
Figure pct00590
은 이전 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 나타내며,
Figure pct00591
는 좌측 채널 평활화 팩터를 나타낸다.
예를 들어,
Figure pct00592
이고; 여기서
Figure pct00593
이고, B는 현재 프레임에서 우측 채널 신호의 장기 평활화 프레임 에너지의 업데이트 팩터를 나타내고,
Figure pct00594
는 현재 프레임에서 우측 채널 신호의 장기 평활화 프레임 에너지를 나타내고,
Figure pct00595
은 우측 채널 신호의 프레임 에너지를 나타내고,
Figure pct00596
은 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 나타내고,
Figure pct00597
는 이전 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 나타내며,
Figure pct00598
는 우측 채널 평활화 팩터를 나타낸다.
일부 가능한 구현에서,
Figure pct00599
; 여기서
Figure pct00600
은 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 나타내고,
Figure pct00601
은 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화된 진폭 상관 파라미터를 나타내고,
Figure pct00602
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터를 나타낸다.
일부 가능한 구현들에서, 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터에 기초하여, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 단계는: 현재 프레임에서의 좌측 및 우측 채널 신호 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터의 값 범위가
Figure pct00603
가 될 수 있도록 하기 위해 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터에 대해 맵핑 처리를 수행하는 단계; 및 좌측 및 우측 채널 신호 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터를 채널 조합 비율 팩터로 변환하는 단계를 포함한다.
일부 가능한 구현들에서, 현재 프레임에서의 좌측 채널 및 우측 채널 사이의 진폭 상관 차이 파라미터에 대한 맵핑 처리를 수행하는 단계는: 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터에 대한 진폭 제한을 수행하는 단계; 및 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭-제한된 진폭 상관 차이 파라미터에 대한 맵핑 처리를 수행하는 단계를 포함한다.
다양한 진폭 제한 방식이 있을 수 있으며, 구체적으로 예를 들면:
Figure pct00604
이고, 여기서
Figure pct00605
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭-제한 진폭 상관 차이 파라미터의 최댓값을 나타내고,
Figure pct00606
은 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭-제한 진폭 상관 차이 파라미터의 최솟값을 나타내며,
Figure pct00607
이다.
구체적으로 예를 들어, 다양한 맵핑 처리 방식이 있을 수 있다:
Figure pct00608
; 여기서
Figure pct00609
;
Figure pct00610
또는
Figure pct00611
;
Figure pct00612
;
Figure pct00613
또는
Figure pct00614
;
Figure pct00615
;
Figure pct00616
또는
Figure pct00617
;
Figure pct00618
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터를 나타내고;
Figure pct00619
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터의 최댓값을 나타내고,
Figure pct00620
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터의 높은 임계치를 나타내고,
Figure pct00621
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터의 낮은 임계치를 나타내고,
Figure pct00622
은 현재 프레임에서의 좌측 및 우측 채널 신호 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터의 최솟값을 나타내며;
Figure pct00623
;
Figure pct00624
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭-제한 진폭 상관 차이 파라미터의 최댓값을 나타내고,
Figure pct00625
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터의 높은 임계치를 나타내고,
Figure pct00626
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터의 낮은 임계 값을 나타내고,
Figure pct00627
은 현재 프레임에서의 좌측 및 우측 채널 신호 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터의 최솟값을 나타내고; 그리고
Figure pct00628
.
다른 예를 들면,
Figure pct00629
; 여기서
Figure pct00630
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭-제한 진폭 상관 차이 파라미터를 나타내고,
Figure pct00631
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터를 나타내고;
Figure pct00632
; 그리고
Figure pct00633
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터의 최대 진폭을 나타내고,
Figure pct00634
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터의 최소 진폭을 나타낸다.
일부 가능한 구현에서,
Figure pct00635
, 여기서
Figure pct00636
는 현재 프레임에서의 좌측 및 우측 채널 신호 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터를 나타내고;
Figure pct00637
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타내거나,
Figure pct00638
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값을 나타낸다.
본 출원의 일부 구현들에서, 채널 조합 비율 팩터가 수정될 필요가 있는 시나리오에서, 채널 조합 비율 팩터가 인코딩되기 전후에 수정이 수행될 수도 있다.
구체적으로, 예를 들어, 현재 프레임에 대한 채널 조합 비율 팩터(예를 들어, 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 또는 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터)의 초기 값이 먼저 계산을 통해 획득될 수 있고, 이어서 채널 조합 비율 팩터의 초기 값이 인코딩되어 현재 프레임의 채널 조합 비율 팩터의 초기 인코딩된 인덱스를 획득하며, 현재 프레임의 채널 조합 비율 팩터의 획득된 초기 인코딩된 인덱스가 수정되어 현재 프레임의 채널 조합 비율 팩터의 인코딩된 인덱스를 획득된다(현재 프레임의 채널 조합 비율 팩터의 인코딩된 인덱스를 획득하는 것은 현재 프레임의 채널 조합 비율 팩터를 얻는 것과 동일하다). 대안적으로, 현재 프레임의 채널 조합 비율 팩터의 초기 값이 먼저 계산을 통해 획득될 수 있고, 이어서 계산을 통해 획득된 현재 프레임의 채널 조합 비율 팩터의 초기 값이 수정되어 현재 프레임의 채널 조합 비율 팩터를 획득하며, 현재 프레임의 획득된 채널 조합 비율 팩터는 현재 프레임의 채널 조합 비율 팩터의 인코딩된 인덱스를 획득하기 위해 인코딩된다.
현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값을 수정하는 다양한 방식이 있다. 예를 들어, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값이 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 획득하기 위해 수정될 필요가 있을 때, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값은 이전 프레임의 채널 조합 비율 팩터 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값에 기초하여 수정될 수 있거나; 또는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값에 기초하여 수정될 수 있다.
예를 들어, 먼저, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값이 수정될 필요가 있는지는 현재 프레임의 좌측 채널 신호의 장기 평활화 프레임 에너지, 현재 프레임에서의 우측 채널 신호의 장기 평활화 프레임 에너지, 현재 프레임에서의 좌측 채널 신호의 프레임 간 에너지 차이, 히스토리 버퍼에서의 이전 프레임의 버퍼링된 인코딩 파라미터(예를 들어, 일차 채널 신호의 프레임 간 상관 및 이차 채널 신호의 프레임 간 상관), 현재 프레임 및 이전 프레임의 채널 조합 방식 플래그, 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터, 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값에 기초하여 판정된다. 수정될 필요가 있으면, 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터가 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터로서 사용되며; 그렇지 않으면, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값이 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터로서 사용된다.
확실히, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 획득하기 위해 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값을 수정하는 특정 구현은 전술한 예에 제한되지 않는다.
803. 현재 프레임의 결정된 시간-도메인 스테레오 파라미터를 인코딩한다.
일부 가능한 구현들에서, 양자화 인코딩은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 결정된 채널 조합 비율 팩터에 대해 수행되고,
Figure pct00639
; 여기서
Figure pct00640
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 대해 스칼라 양자화를 수행하기 위한 코드북을 나타내고;
Figure pct00641
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 인코딩된 인덱스를 나타내고;
Figure pct00642
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 양자화 인코딩된 초기 값을 나타낸다.
일부 가능한 구현에서,
Figure pct00643
, and ,
Figure pct00644
, 여기서
Figure pct00645
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타내고,
Figure pct00646
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스를 나타내거나; 또는
Figure pct00647
, 및,
Figure pct00648
, 여기서
Figure pct00649
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 초기 인코딩된 인덱스를 나타내고;
Figure pct00650
은 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 최종 인코딩된 인덱스를 나타내고;
Figure pct00651
는 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정 팩터이고; 그리고
Figure pct00652
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타낸다.
일부 가능한 구현들에서, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 획득하기 위해 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값이 수정될 필요가 있을 때, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값에 대해 양자화 인코딩이 먼저 수행되어 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 인코딩된 인덱스를 획득할 수 있고; 그런 다음 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 인코딩된 인덱스는 이전 프레임의 채널 조합 비율 팩터의 인코딩된 인덱스 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 인코딩된 인덱스에 기초하여 수정될 수 있거나; 또는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 인코딩된 인덱스는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 인코딩된 인덱스에 기초하여 수정될 수도 있다.
예를 들어, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 초기 인코딩된 인덱스를 획득하기 위해 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값에 대해 양자화 인코딩이 먼저 수행될 수도 있다. 그런 다음, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값을 수정해야 할 때, 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스로서 사용되며; 그렇지 않으면, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 인코딩된 인덱스는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스로서 사용된다. 마지막으로, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스에 대응하는 양자화 인코딩된 값이 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터로서 사용된다.
또한, 시간-도메인 스테레오 파라미터가 채널 간 시간 차이를 포함하는 경우, 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 시간-도메인 스테레오 파라미터를 결정하는 단계는: 현재 프레임에 대한 채널 조합 방식이 상관 신호 채널 조합 방식일 때 현재 프레임의 채널 간 시간 차이를 계산하는 단계를 포함할 수 있다. 또한, 계산을 통해 획득된 현재 프레임의 채널 간 시간 차이는 비트스트림에 기록될 수 있다. 현재 프레임에 대한 채널 조합 방식이 비 상관 신호 채널 조합 방식일 때, 현재의 프레임의 채널 간 시간 차이로서 디폴트 채널 간 시간 차이(예를 들어, 0)가 사용된다. 또한, 디폴트 채널 간 시간 차이는 비트스트림에 기록되지 않을 수 있고, 디코딩 장치는 또한 디폴트 채널 간 시간 차이를 사용한다.
다음은 예를 사용하여 시간-도메인 스테레오 파라미터 인코딩 방법을 추가로 제공한다. 방법은 예를 들어: 현재 프레임에 대한 채널 조합 방식을 결정하는 단계; 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 시간-도메인 스테레오 파라미터를 결정하는 단계; 및 현재 프레임의 결정된 시간-도메인 스테레오 파라미터를 인코딩하는 단계를 포함하며, 상기 시간-도메인 스테레오 파라미터는 채널 조합 비율 팩터 및 채널 간 시간 차이 중 적어도 하나를 포함한다.
이에 상응해서, 디코딩 장치는 비트스트림으로부터 현재 프레임의 시간-도메인 스테레오 파라미터를 획득하고, 비트스트림으로부터 획득된 현재 프레임의 시간-도메인 스테레오 파라미터에 기초하여 관련 디코딩을 추가로 수행할 수 있다.
다음은 보다 구체적인 응용 시나리오를 참조하여 예를 사용하여 설명한다.
도 9a는 본 출원의 실시예에 따른 오디오 인코딩 방법의 개략적인 흐름도이다. 본 출원의 이 실시예에서 제공되는 오디오 인코딩 방법은 인코딩 장치에 의해 구현될 수 있고, 이 방법은 구체적으로 다음 단계들을 포함할 수 있다.
901. 현재 프레임에서 원래의 좌측 및 우측 채널 신호에 대해 시간-도메인 전처리를 수행한다.
예를 들어, 스테레오 오디오 신호의 샘플링 레이트가 16 KHz 인 경우, 한 프레임의 신호는 20ms이고, 프레임 길이는 N으로 표시되며, N = 320 인 경우, 프레임 길이는 320개의 샘플링 포인트임을 나타낸다. 현재 프레임의 스테레오 신호는 현재 프레임에서의 좌측 채널 신호 및 현재 프레임의 우측 채널 신호를 포함한다. 현재 프레임에서 원래의 좌측 채널 신호는
Figure pct00653
로 표시되고, 현재 프레임에서 원래의 우측 채널 신호는
Figure pct00654
로 표시되고, n은 샘플링 포인트 수이며, 및
Figure pct00655
이다.
예를 들어, 현재 프레임에서의 원래의 좌측 및 우측 채널 신호에 대해 시간-도메인 전처리를 수행하는 단계는: 현재 프레임에서의 원래의 좌측 및 우측 채널 신호에 대해 고역 통과 필터링 처리를 수행하여 현재 프레임에서 시간-도메인 전처리를 거친 좌측 및 우측 채널 신호를 획득하는 단계를 포함할 수 있고, 현재 프레임에서 시간-도메인 전처리를 거친 좌측 채널 신호는
Figure pct00656
로 표시되고, 현재 프레임에서 시간-도메인 전처리를 거친 우측 채널 신호는
Figure pct00657
로 표시된다. 여기서, n은 샘플링 포인트 수이며,
Figure pct00658
이다. 고역 통과 필터링 처리에서 사용되는 필터는, 예를 들어 차단 주파수가 20Hz인 무한 임펄스 응답(Infinite Impulse Response, IIR로 약칭) 필터이거나 다른 유형의 필터일 수 있다.
예를 들어, 샘플링 속도가 16KHz이고 차단 주파수가 20Hz인 고역 통과 필터의 전달 함수는 다음과 같을 수 있다:
Figure pct00659
; 여기서
Figure pct00660
= 0.994461788958195,
Figure pct00661
= -1.988923577916390,
Figure pct00662
= 0.994461788958195,
Figure pct00663
= 1.988892905899653,
Figure pct00664
= -0.988954249933127, z는 Z 변환의 변환 팩터이다.
해당 시간-도메인 필터의 전달 함수는 다음과 같이 표현될 수 있다:
Figure pct00665
, 및
Figure pct00666
.
902. 현재 프레임에서 시간-도메인 전처리를 거친 좌측 및 우측 채널 신호에 대해 지연 정렬 처리를 수행하여 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 신호를 얻는다.
지연 정렬 처리를 거친 신호를 간단히 "지연 정렬된 신호"라고 칭할 수 있다. 예를 들어, 지연 정렬 처리를 거친 좌측 채널 신호를 간단히 "지연 정렬된 좌측 채널 신호"라고 칭할 수 있고, 지연 정렬 처리를 거친 우측 채널 신호를 간단히 "지연 정렬된 좌측 채널 신호"라고 칭할 수 있다.
구체적으로, 현재 프레임에서 전처리된 좌측 및 우측 채널 신호에 기초하여 채널 간 지연 파라미터를 추출하여 인코딩할 수 있고, 인코딩된 채널 간 지연 파라미터에 기초하여 좌측 및 우측 채널 신호에 대해 지연 정렬 처리를 수행하여, 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 신호를 획득할 수 있다. 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 신호는
Figure pct00667
로 표시되고, 현재 프레임에서 지연 정렬 처리를 거친 우측 채널 신호는
Figure pct00668
로 표시되며, 여기서 n은 샘플링 포인트 수이고,
Figure pct00669
이다.
구체적으로, 예를 들어, 인코딩 장치는 현재 프레임에서 전처리된 좌측 및 우측 채널 신호에 기초하여 좌측 및 우측 채널의 시간-도메인 교차 상관 함수를 계산할 수 있고; 좌측 및 우측 채널 신호 사이의 시간 차이를 결정하기 위해, 좌측 및 우측 채널의 시간-도메인 교차 상관 함수의 최댓값(또는 다른 값)을 검색하고; 좌측 및 우측 채널 사이의 결정된 시차에 대해 양자화 인코딩을 수행하고; 좌측 및 우측 채널들로부터 선택된 하나의 채널의 신호를 기준으로 사용하고, 좌측 및 우측 채널들 간의 양자화-인코딩된 시간 차이에 기초하여 다른 채널의 신호에 대한 지연 조정을 수행하여 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 신호를 획득한다.
지연 정렬 처리의 많은 특정 구현 방법이 존재하며, 특정 지연 정렬 처리 방법은 이 실시예에서 제한되지 않는다는 것을 주목해야 한다.
903. 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 신호에 대해 시간-도메인 분석을 수행한다.
구체적으로, 시간-도메인 분석은 천이 검출 등을 포함할 수 있다. 천이 검출은 현재 프레임에서 지연 정렬 처리된 좌측 및 우측 채널 신호에 대해 수행되는 에너지 검출일 수 있다(구체적으로, 현재 프레임이 급격한 에너지 변화를 갖는지가 검출될 수 있다). 예를 들어, 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 신호의 에너지는
Figure pct00670
로 표현되고, 이전 프레임에서 지연 정렬된 좌측 채널 신호의 에너지는
Figure pct00671
로 표현된다. 이 경우, 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 신호의 천이 검출 결과를 얻기 위해,
Figure pct00672
Figure pct00673
사이의 차이의 절댓값에 기초하여 천이 검출이 수행될 수 있다. 마찬가지로, 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 신호에 대해 동일한 방법으로 천이 검출을 수행할 수 있다. 시간-도메인 분석은 천이 검출 이외의 다른 종래의 방식으로 시간-도메인 분석을 더 포함할 수 있으며, 예를 들어 주파수 대역 확장 전처리를 포함할 수 있다.
단계(903)는 단계(902) 이후 그리고 현재 프레임에서의 일차 채널 신호 및 이차 채널 신호가 인코딩되기 전에 언제든지 수행될 수 있음을 이해할 수 있다.
904. 현재 프레임에 대한 채널 조합 방식을 결정하기 위해 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 신호에 기초하여 현재 프레임에 대한 채널 조합 방식 결정을 수행한다.
본 실시예에서는 2개의 가능한 채널 조합 방식을 예로 들어 설명하고, 이하의 설명에서 상관 신호 채널 조합 방식 및 비 상관 신호 채널 조합 방식으로 각각 지칭된다. 이 실시예에서, 상관 신호 채널 조합 방식은(지연 정렬 후 획득된) 현재 프레임에서의 좌측 및 우측 채널 신호가 니어 인 페이즈 시그널인 경우에 대응하고, 비 상관 신호 채널 조합 방식은(지연 정렬 후 획득된) 현재 프레임에서의 좌측 및 우측 채널 신호가 니어 아웃 오브 페이즈 시그널인 경우에 대응한다. 확실히, "상관 신호 채널 조합 방식" 및 "비 상관 신호 채널 조합 방식" 외에, 실제 응용에서 2개의 가능한 채널 조합 방식을 나타내는 데 다른 명칭이 사용될 수도 있다.
이 실시예의 일부 솔루션에서, 채널 조합 방식 결정은 초기 채널 조합 방식 결정 및 채널 조합 방식 수정 결정으로 분류될 수 있다. 현재 프레임에 대한 채널 조합 방식을 결정하기 위해 현재 프레임에 대해 채널 조합 방식 결정이 수행되는 것으로 이해될 수 있다. 현재 프레임에 대한 채널 조합 방식을 결정하는 구현의 일부 예에 대해서는 전술한 실시예의 관련 설명을 참조한다. 세부 사항은 여기서 다시 설명하지 않는다.
905. 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 신호 및 현재 프레임의 채널 조합 방식 플래그에 기초하여 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산 및 인코딩하여 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값 및 초기 값의 인코딩된 인덱스를 획득한다.
구체적으로, 예를 들어, 현재 프레임에서의 좌측 및 우측 채널 신호의 프레임 에너지는 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 신호에 기초하여 먼저 계산되며, 여기서
현재 프레임에서 좌측 채널 신호의 프레임 에너지
Figure pct00674
은 다음을 충족한다:
Figure pct00675
; 그리고
현재 프레임에서 우측 채널 신호의 프레임 에너지
Figure pct00676
는 다음을 충족한다:
Figure pct00677
; 여기서
Figure pct00678
은 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 신호를 나타내고,
Figure pct00679
는 현재 프레임에서 지연 정렬 처리를 거친 우측 채널 신호를 나타낸다.
그런 다음, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터는 현재 프레임에서의 좌측 채널의 프레임 에너지 및 우측 채널의 프레임 에너지에 기초하여 계산된다. 계산을 통해 획득된 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터
Figure pct00680
는 다음을 충족한다:
Figure pct00681
그런 다음, 계산을 통해 획득된 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터
Figure pct00682
에 대해 양자화 인코딩을 수행하여, 대응하는 인코딩된 인덱스
Figure pct00683
및 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 양자화 인코딩된 채널 조합 비율 팩터
Figure pct00684
를 얻는다:
Figure pct00685
Figure pct00686
여기서,
Figure pct00687
는 스칼라 양자화를 위한 코드북이다. 양자화 인코딩은 임의의 종래의 스칼라 양자화 방법, 예를 들어 균일 스칼라 양자화 또는 불균일 스칼라 양자화를 사용하여 수행될 수 있다. 인코딩에 사용되는 비트량은 예를 들어 5 비트이다. 특정 스칼라 양자화 방법은 본 명세서에서 다시 설명되지 않는다.
현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 양자화 인코딩된 채널 조합 비율 팩터
Figure pct00688
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 획득된 초기 값이고, 인코딩된 인덱스
Figure pct00689
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값에 대응하는 인코딩된 인덱스이다.
또한, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값에 대응하는 인코딩된 인덱스는 현재 프레임의 채널 조합 방식 플래그
Figure pct00690
의 값에 기초하여 추가로 수정될 수 있다.
예를 들어, 양자화 인코딩은 5 비트 스칼라 양자화이다.
Figure pct00691
이면, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값에 대응하는 인코딩된 인덱스
Figure pct00692
가 미리 설정된 값(예를 들어, 15 또는 다른 값)으로 수정되고; 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값은
Figure pct00693
로 수정될 수 있다.
전술한 계산 방법에 더하여, 종래의 시간-도메인 스테레오 인코딩 기술에서 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 임의의 방법이 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 데 사용될 수 있음에 유의해야 한다. 대안적으로, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값은 고정된 값(예를 들어, 0.5 또는 다른 값)으로 직접 설정될 수 있다.
906. 채널 조합 비율 팩터 수정 플래그에 기초하여, 채널 조합 비율 팩터가 수정될 필요가 있는지를 판정한다.
수정될 필요가 있으면, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 채널 조합 비율 팩터의 인코딩된 인덱스가 수정되어, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값 및 수정된 값의 인코딩된 인덱스를 획득한다.
현재 프레임의 채널 조합 비율 수정 플래그는
Figure pct00694
로 표시된다. 예를 들어, 채널 조합 비율 팩터 수정 플래그의 값이 0 인 경우, 이는 채널 조합 비율 팩터가 수정될 필요가 없음을 나타내거나; 또는 채널 조합 비율 수정 플래그의 값이 1인 경우, 이는 채널 조합 비율 수정이 필요함을 나타낸다. 확실히, 채널 조합 비율 팩터 수정 플래그로서 다른 상이한 값이 사용되어 채널 조합 비율 팩터가 수정될 필요가 있는지를 표시할 수 있다.
예를 들어, 채널 조합 비율 팩터 수정 플래그에 기초하여, 채널 조합 비율 팩터가 수정될 필요가 있는지를 결정하는 것은 구체적으로 다음을 포함할 수 있다: 예를 들어, 채널 조합 비율 팩터 수정 플래그
Figure pct00695
이면, 채널 조합 비율 팩터가 수정될 필요가 있는 것으로 결정된다. 다른 예를 들어, 채널 조합 비율 팩터 수정 플래그
Figure pct00696
이면, 채널 조합 비율 팩터가 수정될 필요가 없는 것으로 결정된다.
현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 채널 조합 비율 팩터의 인코딩된 인덱스는 구체적으로 다음을 포함할 수 있다:
예를 들어, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값에 대응하는 인코딩된 인덱스는 다음을 충족한다:
Figure pct00697
, 여기서,
Figure pct00698
는 이전 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스이다.
현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값
Figure pct00699
은 다음을 충족한다:
Figure pct00700
.
907. 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값 및 초기 값의 인코딩된 인덱스, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값 및 수정된 값의 인코딩된 인덱스, 및 채널 조합 비율 팩터 수정 플래그에 기초하여 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터
Figure pct00701
및 인코딩된 인덱스
Figure pct00702
를 결정한다.
구체적으로, 예를 들어, 상관 신호 채널 조합 방식에 대응하여 결정된 채널 조합 비율 팩터는 다음을 충족시킨다:
Figure pct00703
, 여기서
Figure pct00704
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값을 나타내고;
Figure pct00705
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값을 나타내고;
Figure pct00706
는 현재 프레임의 채널 조합 비율 수정 플래그를 나타낸다.
상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 대응하는 결정된 인코딩된 인덱스
Figure pct00707
는 다음을 충족시킨다:
Figure pct00708
, 여기서
Figure pct00709
는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 값에 대응하는 인코딩된 인덱스를 나타내고,
Figure pct00710
는 현재 프레임에 대한 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 값에 대응하는 인코딩된 인덱스를 나타낸다.
908. 현재 프레임의 채널 조합 방식 플래그가 비 상관 신호 채널 조합 방식에 대응하는지를 판정하고, 대응하면, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산 및 인코딩하여, 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 인코딩된 인덱스를 획득한다.
먼저, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 데 사용되는 히스토리 버퍼가 리셋될 필요가 있는지가 판정될 수 있다.
예를 들어, 현재 프레임의 채널 조합 방식 플래그
Figure pct00711
가 1과 같고(예를 들어,
Figure pct00712
가 1과 같다는 것은 현재 프레임의 채널 조합 방식 플래그가 비 상관 신호 채널 조합 방식에 대응함을 나타낸다), 이전 프레임의 채널 조합 방식 플래그
Figure pct00713
가 0과 같으면(예를 들어,
Figure pct00714
가 0과 같다는 것은 현재 프레임의 채널 조합 방식 플래그는 상관 신호 채널 조합 방식에 대응함을 나타낸다), 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 데 사용되는 히스토리 버퍼는 리셋될 필요가 있다.
히스토리 버퍼 리셋 플래그
Figure pct00715
는 초기 채널 조합 방식 결정 및 채널 조합 방식 수정 결정의 프로세스에서 결정될 수 있고, 그런 다음 히스토리 버퍼 리셋 플래그의 값이 결정되어, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 데 사용되는 히스토리 버퍼가 리셋될 필요가 있는지를 결정한다는 것에 유의해야 한다. 예를 들어,
Figure pct00716
가 1인 경우, 현재 프레임의 채널 조합 방식 플래그는 비 상관 신호 채널 조합 방식에 대응하고, 이전 프레임의 채널 조합 방식 플래그는 관련 신호 채널 조합 방식에 대응한다는 것을 나타낸다. 예를 들어, 히스토리 버퍼 리셋 플래그가 1인 경우, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 데 사용되는 히스토리 버퍼를 리셋할 필요가 있음을 나타낸다. 많은 특정 재설정 방법이 있다. 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 데 사용된 히스토리 버퍼 내의 모든 파라미터는 미리 설정된 초기 값에 기초하여 재설정될 수 있다. 대안적으로, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 데 사용된 히스토리 버퍼 내의 일부 파라미터는 미리 설정된 초기 값에 기초하여 재설정될 수 있다. 대안적으로, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 데 사용된 히스토리 버퍼 내의 일부 파라미터는 미리 설정된 초기 값에 기초하여 재설정될 수 있고, 다른 파라미터는 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산하는 데 사용되는 히스토리 버퍼 내의 대응하는 파라미터에 기초하여 재설정될 수 있다.
그런 다음, 현재 프레임의 채널 조합 방식 플래그
Figure pct00717
가 비 상관 신호 채널 조합 방식에 대응하는지가 추가로 결정된다. 비 상관 신호 채널 조합 방식은 니어 아웃 오브 페이즈 스테레오 시그널에 대해 시간-도메인 다운믹싱을 수행하기 에 더 적합한 채널 조합 방식이다. 본 실시예에서, 현재 프레임의 채널 조합 방식 플래그
Figure pct00718
일 때, 현재 프레임의 채널 조합 방식 플래그는 비 상관 신호 채널 조합 방식에 대응한다는 것을 나타낸다. 현재 프레임의 채널 조합 방식 플래그
Figure pct00719
일 때, 현재 프레임의 채널 조합 방식 플래그는 상관 신호 채널 조합 방식에 대응한다는 것을 나타낸다.
현재 프레임의 채널 조합 방식 플래그가 비 상관 신호 채널 조합 방식에 대응하는지를 결정하는 단계는 구체적으로:
현재 프레임의 채널 조합 방식 플래그의 값이 1인지를 결정하는 단계를 포함할 수 있고; 현재 프레임의 채널 조합 방식 플래그
Figure pct00720
이면, 현재 프레임의 채널 조합 방식 플래그는 비 상관 신호 채널 조합 방식에 대응한다는 것을 나타내고, 이 경우, 비 상관 신호 채널에 대응하는 채널 조합 비율 팩터는 현재 프레임에 대한 조합 방식이 계산되고 인코딩될 수 있다.
도 9b를 참조하면, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 계산 및 인코딩하는 단계는 예를 들어 다음 단계 9081 내지 9085를 포함할 수 있다.
9081. 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 신호에 대한 신호 에너지 분석을 수행한다.
현재 프레임에서의 좌측 채널 신호의 프레임 에너지, 현재 프레임에서의 우측 채널 신호의 프레임 에너지, 현재 프레임에서의 좌측 채널의 장기 평활 프레임 에너지, 현재 프레임에서의 우측 채널의 장기 평활 프레임 에너지, 현재 프레임에서의 좌측 채널의 프레임 간 에너지 차이 및 현재 프레임에서의 우측 채널의 프레임 간 에너지 차이가 개별적으로 획득된다.
예를 들어, 현재 프레임에서 좌측 채널 신호의 프레임 에너지
Figure pct00721
는 다음을 충족한다:
Figure pct00722
; 그리고
현재 프레임에서 우측 채널 신호의 프레임 에너지
Figure pct00723
는 다음을 충족한다:
Figure pct00724
; 여기서
Figure pct00725
은 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 신호를 나타내고,
Figure pct00726
은 현재 프레임에서 지연 정렬 처리를 거친 우측 채널 신호를 나타낸다.
예를 들어, 현재 프레임에서 좌측 채널의 장기 평활 프레임 에너지
Figure pct00727
는 다음을 충족한다:
Figure pct00728
, 여기서
Figure pct00729
는 이전 프레임에서의 좌측 채널의 장기 평활화 프레임 에너지를 나타내고, A는 좌측 채널의 장기 평활화 프레임 에너지의 업데이트 팩터를 나타내고, A는 예를 들어 0 내지 1의 실수일 수 있고, A는 예를 들어 0.4일 수 있다.
예를 들어, 현재 프레임에서 우측 채널의 장기 평활 프레임 에너지
Figure pct00730
는 다음을 충족한다:
Figure pct00731
, 여기서
Figure pct00732
는 이전 프레임에서 우측 채널의 장기 평활 프레임 에너지를 나타내고, B는 우측 채널의 장기 평활 프레임 에너지의 업데이트 팩터를 나타내고, B는 예를 들어 0 내지 1의 실수일 수 있고, B는 예를 들어 좌측 채널의 장기 평활 프레임 에너지의 업데이트 팩터와 동일하거나 상이할 수 있고; 예를 들어, B는 0.4와 동일할 수도 있다.
예를 들어, 현재 프레임에서 좌측 채널의 프레임 간 에너지 차이
Figure pct00733
는 다음을 충족한다:
Figure pct00734
예를 들어, 현재 프레임에서 우측 채널의 프레임 간 에너지 차이
Figure pct00735
는 다음을 충족한다:
Figure pct00736
9082. 현재 프레임에서 지연 정렬 처리를 거친 좌측 및 우측 채널 신호에 기초하여 현재 프레임의 참조 채널 신호를 결정한다. 참조 채널 신호는 또한 모노 신호로 지칭될 수 있다. 참조 채널 신호가 모노 신호로 지칭되는 경우, 참조 채널과 관련된 모든 설명 및 파라미터 이름에 대해, 참조 채널 신호는 모노 신호로 대체될 수 있다.
예를 들어, 참조 채널 신호
Figure pct00737
는 다음을 충족한다:
Figure pct00738
, 여기서
Figure pct00739
은 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 신호이고,
Figure pct00740
은 현재 프레임에서 지연 정렬 처리를 거친 우측 채널 신호이다.
9083. 지연 정렬 처리를 거친 좌측 채널 신호와 현재 프레임에서의 참조 채널 신호 사이의 진폭 상관 파라미터 및 지연 정렬 처리를 거친 우측 채널 신호와 현재 프레임에서의 참조 채널 신호 사이의 진폭 상관 파라미터를 별도로 계산한다.
예를 들어, 지연 정렬 처리를 거친 좌측 채널 신호와 현재 프레임의 참조 채널 신호 사이의 진폭 상관 파라미터
Figure pct00741
는 예를 들어 다음을 충족한다:
Figure pct00742
예를 들어, 지연 정렬 처리를 거친 우측 채널 신호와 현재 프레임의 참조 채널 신호 사이의 진폭 상관 파라미터
Figure pct00743
는 예를 들어 다음을 충족한다:
Figure pct00744
여기서,
Figure pct00745
은 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 신호를 나타내고,
Figure pct00746
은 현재 프레임에서 지연 정렬 처리를 거친 우측 채널 신호를 나타내고,
Figure pct00747
는 현재 프레임에서의 참조 채널 신호를 나타내고,
Figure pct00748
는 절댓값 채택을 나타낸다.
9084. 지연 정렬 처리를 거친 좌측 채널 신호와 현재 프레임의 참조 채널 신호 사이의 진폭 상관 파라미터 및 지연 정렬 처리를 거친 우측 채널 신호와 현재 프레임의 참조 채널 신호 사이의 진폭 상관 파라미터에 기초하여 현재 프레임에서의 좌측 채널과 우측 채널 사이의 진폭 상관 차이 파라미터
Figure pct00749
를 계산한다.
단계 9081은 단계 9082 및 단계 9083 이전에 수행될 수 있거나, 단계 9082 및 단계 9083 이후 및 단계 9084 이전에 수행될 수 있는 것으로 이해될 수 있다.
도 9c를 참조하면, 예를 들어, 현재 프레임에서의 좌측 채널과 우측 채널 사이의 진폭 상관 차이 파라미터
Figure pct00750
를 계산하는 단계는 구체적으로 다음 단계 90841 및 90842를 포함할 수 있다.
90841. 지연 정렬 처리를 거친 좌측 채널 신호와 현재 프레임의 참조 채널 신호 사이의 진폭 상관 파라미터 및 지연 정렬 처리를 거친 우측 채널 신호와 현재 프레임의 참조 채널 신호 사이의 진폭 상관 파라미터에 기초하여 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터(long-term smoothed amplitude correlation parameter) 및 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 계산한다.
예를 들어, 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터 및 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 계산하는 방법은 다음을 포함할 수 있다: 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터
Figure pct00751
은 다음을 만족한다:
Figure pct00752
.
여기서,
Figure pct00753
는 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 나타내고,
Figure pct00754
는 이전 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화된 진폭 상관 파라미터를 나타내고,
Figure pct00755
는 좌측 채널 평활화 팩터를 나타내며,
Figure pct00756
는 0에서 1 사이의 미리 설정된 실수를 나타내고,
Figure pct00757
는 예를 들어 0.2, 0.5 또는 0.8일 수 있다. 대안적으로, 적응 계산을 통해 값이 얻어질 수 있다.
예를 들어, 현재 프레임에서 우측 채널 신호와 참조 채널 신호 간의 장기 평활화 진폭 상관 파라미터
Figure pct00758
는 다음을 충족한다:
Figure pct00759
.
여기서,
Figure pct00760
는 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 나타내고,
Figure pct00761
는 이전 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 나타내며,
Figure pct00762
는 우측 채널 평활화 팩터를 나타내며,
Figure pct00763
는 0에서 1 사이의 미리 설정된 실수일 수 있다.
Figure pct00764
는 좌측 채널 평활화 팩터의 값
Figure pct00765
와 동일하거나 상이할 수 있고,
Figure pct00766
는 예를 들어 0.2, 0.5 또는 0.8과 동일할 수 있다. 대안적으로,
Figure pct00767
의 값은 적응 계산을 통해 얻어질 수 있다.
현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 간의 장기 평활화 진폭 상관 파라미터 및 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 간의 장기 평활화 진폭 상관 파라미터를 계산하는 다른 방법은:
먼저, 지연 정렬 처리를 거친 좌측 채널 신호와 현재 프레임의 참조 채널 신호 사이의 진폭 상관 파라미터
Figure pct00768
를 수정하여, 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 수정된 진폭 상관 파라미터
Figure pct00769
를 획득하고; 지연 정렬 처리를 거친 우측 채널 신호와 현재 프레임의 참조 채널 신호 사이의 진폭 상관 파라미터
Figure pct00770
를 수정하여, 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 수정된 진폭 상관 파라미터
Figure pct00771
를 획득하는 단계;
그런 다음, 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 수정된 진폭 상관 파라미터
Figure pct00772
, 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 수정된 진폭 상관 파라미터
Figure pct00773
, 이전 프레임에서의 좌측 채널 신호와 참조 채널 신호 간의 장기 평활화 진폭 상관 파라미터
Figure pct00774
, 및 이전 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터
Figure pct00775
에 기초하여 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터
Figure pct00776
및 이전 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터
Figure pct00777
를 결정하는 단계;
그런 다음, 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터
Figure pct00778
및 이전 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터
Figure pct00779
에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터의 초기 값
Figure pct00780
을 획득하고; 현재 프레임에서의 좌측 및 우측 채널 신호 사이의 진폭 상관 차이 파라미터의 획득된 초기 값
Figure pct00781
및 이전 프레임에서의 좌측 채널과 우측 채널 사이의 진폭 상관 차이 파라미터
Figure pct00782
에 기초하여 현재 프레임에서의 좌측 및 우측 채널 사이의 진폭 상관 차이의 프레임 간 변동 파라미터
Figure pct00783
를 결정하는 단계; 및
마지막으로, 신호 에너지 분석을 통해 획득되는 현재 프레임의 좌측 채널 신호의 프레임 에너지, 현재 프레임의 우측 채널 신호의 프레임 에너지, 현재 프레임의 좌측 채널의 장기 평활화 프레임 에너지, 현재 프레임의 우측 채널의 장기 평활화 프레임 에너지, 현재 프레임의 좌측 채널의 프레임 간 에너지 차이 및 현재 프레임의 우측 채널의 프레임 간 에너지 차이, 및 현재 프레임에서의 좌측 채널과 우측 채널 사이의 진폭 상관 차이의 프레임 간 변동 파라미터에 기초하여, 상이한 좌측 채널 평활화 팩터 및 우측 채널 평활화 팩터를 적응적으로 선택하고, 현재 프레임에서의 좌측 채널 신호 및 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터
Figure pct00784
및 현재 프레임에서의 우측 채널 신호 및 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터
Figure pct00785
를 계산하는 단계
를 포함할 수 있다.
위의 예제로 제공된 두 가지 방법 외에, 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 관계 파라미터와 현재 프레임에서의 우측 채널 신호 및 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 계산하는 방법이 많이 있을 수 있다. 이것은 본 출원에서 제한되지 않는다.
90842. 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터 및 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 차이 파라미터에 기초하여 현재 프레임에서의 좌측 채널 신호와 우측 채널 신호 사이의 진폭 상관 차이 파라미터
Figure pct00786
를 계산한다.
예를 들어, 현재 프레임에서 좌측과 우측 채널 사이의 진폭 상관 차이 파라미터
Figure pct00787
는 다음을 충족한다:
Figure pct00788
, 여기서
Figure pct00789
은 현재 프레임에서의 좌측 채널 신호와 참조 채널 신호 사이의 장기 평활화 진폭 상관 파라미터를 나타내고,
Figure pct00790
은 현재 프레임에서의 우측 채널 신호와 참조 채널 신호 사이의 장기 평활화된 진폭 상관 파라미터를 나타낸다.
9085. 현재 프레임에서의 좌측 및 우측 채널 사이의 진폭 상관 차이 파라미터
Figure pct00791
를 채널 조합 비율 팩터로 변환하고 인코딩 및 양자화를 수행하여, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 채널 조합 비율 팩터의 인코딩된 인덱스를 결정한다.
도 9d를 참조하면, 현재 프레임에서의 좌측 채널과 우측 채널 사이의 진폭 상관 차이 파라미터를 채널 조합 비율 팩터로 변환하는 가능한 방법은 구체적으로 단계 90851 내지 90853을 포함할 수 있다.
90851. 좌측 채널과 우측 채널 사이의 진폭 상관 차이 파라미터에 대한 맵핑 처리를 수행하여, 좌측 채널과 우측 채널 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터의 값 범위가
Figure pct00792
가 될 수 있도록 한다.
좌측 채널과 우측 채널 사이의 진폭 상관 차이 파라미터에 대한 맵핑 처리를 수행하는 방법은 다음 단계를 포함할 수 있다.
먼저, 좌측 및 우측 채널 사이의 진폭 상관 차이 파라미터에 대해 진폭 제한이 수행된다. 예를 들어, 좌측 채널과 우측 채널 사이의 진폭-제한 진폭 상관 차이 파라미터
Figure pct00793
는 다음을 충족한다:
Figure pct00794
여기서,
Figure pct00795
는 좌측 및 우측 채널 사이의 진폭-제한 진폭 상관 차이 파라미터의 최댓값을 나타내고,
Figure pct00796
은 좌측 및 우측 채널 사이의 진폭-제한 진폭 상관 차이 파라미터의 최솟값을 나타낸다. 예를 들어,
Figure pct00797
는 미리 설정된 경험적 값이고,
Figure pct00798
는 1.5, 3.0 또는 다른 값일 수 있으며;
Figure pct00799
은 미리 설정된 경험적 값이며
Figure pct00800
는 -1.5, -3.0 또는 다른 값일 수 있으며, 여기서
Figure pct00801
이다.
그런 다음, 좌측 및 우측 채널 사이의 진폭-제한 진폭 상관 차이 파라미터에 대해 맵핑 처리가 수행된다. 좌측과 우측 채널 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터
Figure pct00802
는 다음을 충족한다:
Figure pct00803
; 여기서
Figure pct00804
;
Figure pct00805
또는
Figure pct00806
;
Figure pct00807
;
Figure pct00808
또는
Figure pct00809
;
Figure pct00810
; 및
Figure pct00811
또는
Figure pct00812
.
여기서,
Figure pct00813
는 좌측 및 우측 채널 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터의 최댓값을 나타내고,
Figure pct00814
는 좌측 및 우측 채널 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터의 높은 임계 값을 나타내며,
Figure pct00815
는 좌측 및 우측 채널 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터의 낮은 임계 값을 나타내고,
Figure pct00816
은 좌측 및 우측 채널 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터의 최솟값을 나타내며; 여기서
Figure pct00817
.
예를 들어, 본 출원의 일부 실시예에서,
Figure pct00818
는 2.0 일 수 있고,
Figure pct00819
는 1.2 일 수 있고,
Figure pct00820
는 0.8 일 수 있고,
Figure pct00821
은 0.0 일 수 있다. 실제로, 실제 적용에서, 이 값들은 이러한 예에 제한되지 않는다.
Figure pct00822
는 좌측과 우측 채널 사이의 진폭-제한 진폭 상관 차이 파라미터의 최댓값을 나타내고,
Figure pct00823
는 좌측과 우측 채널 사이의 진폭-제한 진폭 상관 차이 파라미터의 높은 임계 값을 나타내며,
Figure pct00824
는 좌측과 우측 채널 사이의 진폭-제한 진폭 상관 차이 파라미터의 낮은 임계 값을 나타내며,
Figure pct00825
은 좌측 및 우측 채널 사이의 진폭-제한 진폭 상관 차이 파라미터의 최솟값을 나타내고; 여기서
Figure pct00826
이다.
예를 들어, 본 출원의 일부 실시예에서,
Figure pct00827
는 1.5이고,
Figure pct00828
는 0.75이고,
Figure pct00829
는 -0.75이며, 그리고
Figure pct00830
는 -1.5이다. 실제로, 실제 적용에서, 이 값들은 이러한 예에 제한되지 않는다.
본 출원의 일부 실시예에서의 다른 방법은 다음과 같다: 좌측 채널과 우측 채널 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터
Figure pct00831
는 다음을 충족한다:
Figure pct00832
여기서,
Figure pct00833
는 좌측 및 우측 채널 사이의 진폭-제한 진폭 상관 차이 파라미터를 나타내고; 여기서
Figure pct00834
여기에서,
Figure pct00835
는 좌측 및 우측 채널 사이의 진폭 상관 차이 파라미터의 최대 진폭을 나타내고,
Figure pct00836
는 좌측 및 우측 채널 사이의 진폭 상관 차이 파라미터의 최소 진폭을 나타낸다.
Figure pct00837
는 미리 설정된 경험적 값일 수 있고,
Figure pct00838
는 예를 들어 1.5, 3.0, 또는 0보다 큰 다른 실수일 수 있다.
90852. 좌측 채널과 우측 채널 사이에 있으면서 맵핑 처리를 거친 진폭 상관 차이 파라미터를 채널 조합 비율로 변환한다.
채널 조합 비율 팩터는 다음을 충족한다.
Figure pct00839
, 여기서
Figure pct00840
는 코사인 연산을 나타낸다.
전술한 방법에 더하여, 다른 방법이 좌측 및 우측 채널 간의 진폭 상관 차이 파라미터를 채널 조합 비율 팩터로 변환하는 데 사용될 수 있으며, 예를 들어:
비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터가 갱신될 필요가 있는지는 신호 에너지 분석을 통해 획득되는 현재 프레임에서의 좌측 채널의 장기 평활화 프레임 에너지, 현재 프레임에서의 우측 채널의 장기 평활화 프레임 에너지, 및 현재 프레임에서의 좌측 채널의 프레임 간 에너지 차이, 그리고 인코더의 히스토리 버퍼 내의 이전 프레임의 버퍼링된 인코딩 파라미터(예를 들어, 일차 채널 신호의 프레임 간 상관 파라미터 및 이차 채널 신호의 프레임 간 상관 파라미터), 현재 프레임 및 이전 프레임의 채널 조합 방식 플래그, 및 현재 프레임 및 이전 프레임의 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 판정된다.
비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터가 업데이트될 필요가 있으면, 좌측 및 우측 채널 간의 진폭 상관 차이 파라미터는 전술한 예의 방법을 사용하여 채널 조합 비율 팩터로 변환되고; 그렇지 않으면, 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 채널 조합 비율 팩터의 인코딩된 인덱스는 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 채널 조합 비율 팩터의 인코딩된 인덱스로서 직접 사용된다.
90853. 변환 후 획득된 채널 조합 비율 팩터에 대해 양자화 인코딩을 수행하고, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 결정한다.
구체적으로, 예를 들어, 변환 후 획득된 채널 조합 비율 팩터에 대해 양자화 인코딩이 수행되어, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 초기 인코딩된 인덱스
Figure pct00841
및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 양자화-인코딩된 초기 값
Figure pct00842
를 획득하며; 여기서
Figure pct00843
이고, 그리고
Figure pct00844
은 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 대해 스칼라 양자화를 수행하기 위한 코드북을 나타낸다.
양자화 인코딩은 종래 기술에서의 임의의 스칼라 양자화 방법, 예를 들어 균일 스칼라 양자화 또는 불균일 스칼라 양자화를 사용하여 수행될 수 있다. 인코딩에 사용되는 비트의 양은 5 비트일 수 있다. 구체적인 방법은 여기에 기술되지 않는다. 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 대해 스칼라 양자화를 수행하기 위한 코드북은 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 대한 스칼라 양자화를 수행하기 위한 코드북과 동일하거나 상이할 수 있다. 코드북이 동일하면, 채널 조합 비율에 대한 스칼라 양자화를 수행하는 데 사용되는 하나의 코드북만이 저장될 필요가 있다.
이 경우, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 양자화-인코딩된 초기 값
Figure pct00845
은 다음과 같다:
Figure pct00846
.
예를 들어, 방법은: 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 양자화 인코딩된 초기 값을 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터로서 직접 사용하는 단계, 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 초기 인코딩된 인덱스를 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스로서 직접 사용하는 단계이다.
현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스
Figure pct00847
은 다음을 충족한다:
Figure pct00848
.
현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터는 다음을 충족한다:
Figure pct00849
다른 방법은: 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스 또는 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 양자화 인코딩된 초기 값 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 초기 인코딩된 인덱스를 수정하는 단계; 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정된 인코딩된 인덱스를 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스로서 사용하는 단계; 및 비 상관 신호 채널 조합 방식에 대응하는 수정된 채널 조합 비율 팩터를 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터로서 사용하는 단계일 수 있다.
현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스
Figure pct00850
은 다음을 충족한다:
Figure pct00851
.
여기서,
Figure pct00852
은 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 초기 인코딩된 인덱스를 나타내고;
Figure pct00853
은 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스이고;
Figure pct00854
는 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 수정 팩터이다.
Figure pct00855
의 값은 경험적 값일 수 있으며,
Figure pct00856
는 예를 들어 0.8 일 수 있다.
현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터는 다음을 충족한다:
Figure pct00857
다른 방법은: 비 상관 신호 채널 조합 방식에 대응하는 양자화되지 않은 채널 조합 비율 팩터를 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 인자로서 사용하는 단계이다. 다시 말해, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터
Figure pct00858
은 다음을 충족한다:
Figure pct00859
또한, 제4 방법은: 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 양자화되지 않은 채널 조합 비율 팩터를 수정하는 단계; 상기 비 상관 신호 채널 조합 방식에 대응하는 수정된 채널 조합 비율 팩터를 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터로서 사용하는 단계; 및 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 대한 양자화 인코딩을 수행하여, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스를 획득하는 단계를 포함한다.
전술한 방법들 이외에도, 좌측 및 우측 채널 간의 진폭 상관 차이 파라미터를 채널 조합 비율 팩터로 변환하고 인코딩 및 양자화를 수행하는 많은 방법이 있을 수 있다. 유사하게, 현재 프레임에 대한 비 상관 신호 채널 조합 방식 및 채널 조합 비율 팩터의 인코딩된 인덱스에 대응하는 채널 조합 비율 팩터를 결정하기 위한 많은 상이한 방법이 존재한다. 이것은이 본 출원에서 제한되지 않는다.
909. 현재 프레임의 코딩 모드를 결정하기 위해 이전 프레임의 채널 조합 방식 플래그 및 현재 프레임의 채널 조합 방식 플래그에 기초하여 코딩 모드 결정을 수행한다.
현재 프레임의 채널 조합 방식 플래그는
Figure pct00860
로 표시되고, 이전 프레임의 채널 조합 방식 플래그는
Figure pct00861
로 표시되고, 이전 프레임의 채널 조합 방식 플래그와 현재 프레임의 채널 조합 방식 플래그의 조인트 플래그는
Figure pct00862
로 표시될 수 있다. 코딩 모드 결정은 조인트 플래그에 기초하여 수행될 수 있다. 자세한 내용은 다음 예에 나와 있다.
상관 신호 채널 조합 방식은 0으로 표시되고 비 상관 신호 채널 조합 방식은 1로 표현된다고 가정한다. 이 경우, 이전 프레임의 채널 조합 방식 플래그와 현재 프레임의 채널 조합 방식 플래그의 조인트 플래그는(01), (11), (10), (00)의 4가지 경우가 있고, 현재 프레임의 코딩 모드는: 상관 신호 코딩 모드, 비 상관 신호 코딩 모드, 상관-비상관 신호 코딩 스위칭 모드, 및 비상관-상관 신호 코딩 스위칭 모드로 결정된다. 예를 들어, 현재 프레임의 채널 조합 방식 플래그의 조인트 플래그가 (00)이면, 현재 프레임의 코딩 모드가 상관 신호 코딩 모드임을 나타내고; 현재 프레임의 채널 조합 방식 플래그의 조인트 플래그가 (11)이면, 현재 프레임의 코딩 모드가 비 상관 신호 코딩 모드임을 나타내고; 현재 프레임의 채널 조합 방식 플래그의 조인트 플래그가 (01)이면, 현재 프레임의 코딩 모드가 상관-비상관 신호 코딩 스위칭 모드임을 나타내거나; 또는 현재 프레임의 채널 조합 방식 플래그의 조인트 플래그가 (10)이면, 현재 프레임의 코딩 모드가 비상관-상관 신호 코딩 전환 모드임을 나타낸다.
910. 현재 프레임의 코딩 모드
Figure pct00863
을 획득한 후, 인코딩 장치는 현재 프레임의 코딩 모드에 대응하는 시간-도메인 다운믹스 처리 방법에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 채널 신호 및 이차 채널 신호를 획득한다.
현재 프레임의 코딩 모드는 복수의 코딩 모드 중 하나이다. 예를 들어, 복수의 코딩 모드는 상관-비상관 신호 코딩 스위칭 모드, 비상관-상관 신호 코딩 스위칭 모드, 상관 신호 코딩 모드 및 비상관 신호 코딩 모드를 포함할 수 있다. 상이한 코딩 모드에서의 시간-도메인 다운믹스 처리의 구현에 대해서는, 전술한 실시예에서의 예의 관련 설명을 참조한다. 세부 사항은 여기서 다시 설명하지 않는다.
911. 인코딩 장치는 일차 채널 신호 및 이차 채널 신호를 개별적으로 인코딩하여 인코딩된 일차 채널 신호 및 인코딩된 이차 채널 신호를 획득한다.
구체적으로, 이전 프레임에서의 일차 채널 신호 및/또는 이차 채널 신호의 인코딩에서 획득된 파라미터 정보 및 일차 채널 신호 및 이차 채널 신호를 인코딩하기 위한 비트의 총 수량에 기초하여 일차 채널 신호의 인코딩 및 이차 채널 신호의 인코딩을 위해 비트 할당이 먼저 수행될 수 있다. 그런 다음, 일차 채널 신호와 이차 채널 신호는 비트 할당 결과에 기초하여 별도로 인코딩되어 일차 채널 인코딩의 인코딩된 인덱스 및 이차 채널 인코딩의 인코딩된 인덱스를 획득한다. 일차 채널 인코딩 및 이차 채널 인코딩은 여기에서 더 설명되지 않는 임의의 모노 오디오 인코딩 기술을 사용하여 구현될 수 있다.
912. 인코딩 장치는 채널 조합 방식 플래그에 기초하여 채널 조합 비율 팩터의 대응하는 인코딩된 인덱스를 선택하고, 인코딩된 인덱스를 비트스트림에 기록하고, 인코딩된 일차 채널 신호, 인코딩된 이차 채널 신호 및 현재 프레임의 채널 조합 방식 플래그를 비트스트림에 기록한다.
구체적으로, 예를 들어, 현재 프레임의 채널 조합 방식 플래그
Figure pct00864
가 상관 신호 채널 조합 방식에 대응하는 경우, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스
Figure pct00865
는 비트스트림으로 기록되거나; 또는 현재 프레임의 채널 조합 방식 플래그
Figure pct00866
가 비 상관 신호 채널 조합 방식에 대응하는 경우, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스
Figure pct00867
가 비트스트림에 기록된다. 예를 들어,
Figure pct00868
이면, 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스
Figure pct00869
가 비트스트림에 기록되거나; 또는
Figure pct00870
이면, 현재 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터의 인코딩된 인덱스
Figure pct00871
이 비트스트림에 기록된다.
또한, 현재 프레임의 인코딩된 일차 채널 신호, 인코딩된 이차 채널 신호 및 채널 조합 방식 플래그가 비트스트림에 기록된다. 비트스트림 기록 동작을 수행하기 위한 시퀀스가 없다는 것이 이해될 수 있다.
이에 상응하여, 다음은 예를 사용하여 시간-도메인 스테레오 디코딩 시나리오를 설명한다.
도 10을 참조하여, 다음은 오디오 디코딩 방법을 추가로 제공한다. 오디오 디코딩 방법의 관련 단계는 구체적으로 디코딩 장치에 의해 구현될 수 있고, 방법은 구체적으로 다음 단계를 포함할 수 있다.
1001. 비트스트림에 기초하여 디코딩을 수행하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호를 획득한다.
1002. 비트스트림에 기초하여 디코딩을 수행하여 현재 프레임의 시간-도메인 스테레오 파라미터를 획득한다.
현재 프레임의 시간-도메인 스테레오 파라미터는 현재 프레임의 채널 조합 비율 팩터를 포함하고(비트스트림은 현재 프레임의 채널 조합 비율 팩터의 인코딩된 인덱스를 포함하고, 디코딩은 현재 프레임의 채널 조합 비율 팩터의 인코딩된 인덱스에 기초하여 수행되어 현재 프레임의 채널 조합 비율 팩터를 획득할 수 있다), 현재 프레임의 채널 간 시간 차이를 더 포함할 수 있다(예를 들어, 비트스트림은 현재 프레임의 채널 간 시간 차이의 인코딩된 인덱스를 포함하고, 디코딩은 현재 프레임의 채널 간 시간 차이의 인코딩된 인덱스에 기초하여 수행되어 현재 프레임의 채널 간 시간 차이를 획득하거나; 또는 비트스트림은 현재 프레임의 채널 간 시간 차이의 절댓값을 포함하고, 디코딩은 현재 프레임의 채널 간 시간 차이의 절댓값의 인코딩된 인덱스에 기초하여 수행되어 현재 프레임의 채널 간 시간 차이의 절댓값을 획득할 수 있다).
1003. 비트스트림에 기초하여, 비트스트림에 포함된 현재 프레임의 채널 조합 방식 플래그를 획득하고, 현재 프레임에 대한 채널 조합 방식을 결정한다.
1004. 현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 디코딩 모드를 결정한다.
현재 프레임에 대한 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 디코딩 모드를 결정하는 단계에 대해서는 단계 909에서 현재 프레임의 코딩 모드를 결정하는 방법을 참조한다. 현재 프레임의 디코딩 모드는 복수의 디코딩 모드 중 하나이다. 예를 들어, 복수의 디코딩 모드는 상관-비상관 신호 디코딩 스위칭 모드, 비상관-상관 신호 디코딩 스위칭 모드, 상관 신호 코딩 모드 및 비상관 신호 디코딩 모드를 포함할 수 있다. 코딩 모드 및 디코딩 모드는 일대일 대응 관계에 있다.
예를 들어, 현재 프레임의 채널 조합 방식 플래그의 조인트 플래그가 (00)이면, 현재 프레임의 디코딩 모드가 상관 신호 디코딩 모드임을 나타내고; 현재 프레임의 채널 조합 방식 플래그의 조인트 플래그가 (11)이면, 현재 프레임의 디코딩 모드가 비 상관 신호 디코딩 모드임을 나타내고; 현재 프레임의 채널 조합 방식 플래그의 조인트 플래그가 (01)이면, 현재 프레임의 디코딩 모드가 상관-비상관 신호 디코딩 스위칭 모드임을 나타내고; 또는 현재 프레임의 채널 조합 방식 플래그의 조인트 플래그가(10) 인 경우, 현재 프레임의 디코딩 모드가 비상관-상관 신호 디코딩 스위칭 모드임을 나타낸다.
단계 1001, 단계 1002 및 단계 1003 및 1004를 수행하기 위해 필요한 시퀀스가 존재하지 않는 것으로 이해될 수 있다.
1005. 현재 프레임의 결정된 디코딩 모드에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여, 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득한다.
상이한 디코딩 모드에서의 시간-도메인 업믹스 처리의 관련 구현에 대해서는, 전술한 실시예에서의 예의 관련 설명을 참조한다. 세부 사항은 여기서 다시 설명하지 않는다.
시간-도메인 업믹스 처리에 사용되는 업믹스 매트릭스는 현재 프레임의 획득된 채널 조합 비율 팩터에 기초하여 구성된다.
현재 프레임에서의 재구성된 좌측 및 우측 채널 신호는 현재 프레임에서 디코딩된 좌측 및 우측 채널 신호로 사용될 수 있다.
대안적으로, 현재 프레임에서의 지연 조정을 거친 재구성된 좌측 및 우측 채널 신호를 획득하기 위해 현재 프레임의 채널 간 시간 차이에 기초하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호에 대해 지연 조정이 수행될 수 있고, 현재 프레임에서 지연 조정을 거친 재구성된 좌측 및 우측 채널 신호는 현재 프레임에서의 디코딩된 좌측 및 우측 채널 신호로 사용될 수 있다. 대안적으로, 또한, 현재 프레임에서 지연 조정을 거친 재구성된 좌측 및 우측 채널 신호에 대해 시간-도메인 후처리가 수행될 수 있고, 현재 프레임에서 시간-도메인 후처리를 거친 좌측 및 우측 채널 신호는 현재 프레임에서의 디코딩된 좌측 및 우측 채널 신호로서 사용될 수 있다.
전술한 내용은 본 출원의 실시예에서의 방법을 상세히 설명한다. 다음은 본 출원의 실시예에서의 장치를 설명한다.
전술한 내용은 본 출원의 실시예에서의 방법을 상세히 설명한다. 다음은 본 출원의 실시예에서의 장치를 설명한다.
도 11a를 참조하면, 본 출원의 실시예는 장치(1100)를 추가로 제공한다. 장치(1100)는:
서로 연결된 프로세서(1110) 및 메모리(1120)를 포함하며, 프로세서(1110)는 본 출원의 실시예에서 제공되는 임의의 방법의 일부 또는 모든 단계를 수행하도록 구성될 수 있다.
메모리(1120)는 랜덤 액세스 메모리(영어 : 랜덤 액세스 메모리, 짧은 RAM), 읽기 전용 메모리(Random Access Memory, ROM으로 약칭), 소거 가능한 프로그램 가능 읽기 전용 메모리(Erasable Programmable Read Only Memory, EPROM로 약칭), 또는 컴팩트 디스크 읽기 전용 메모리(Compact Disc Read-Only Memory, CD-ROM으로 약칭)를 포함하되 이에 제한되지 않는다. 메모리(1102)는 관련 명령 및 관련 데이터를 저장하도록 구성된다.
확실히, 장치(1100)는 데이터를 수신 및 전송하도록 구성된 송수신기(1130)를 더 포함할 수 있다.
프로세서(1110)는 하나 이상의 중앙 처리 장치(Central Processing Unit, CPU로 약칭)일 수 있다. 프로세서(1110)가 하나의 CPU인 경우, 이 하나의 CPU는 단일 코어 CPU이거나 멀티 코어 CPU일 수 있다. 프로세서(1110)는 구체적으로 디지털 신호 프로세서일 수 있다.
구현 프로세스에서, 전술한 방법의 단계는 프로세서(1110)의 하드웨어 집적 논리 회로를 사용하거나 소프트웨어 형태의 명령을 사용함으로써 구현될 수 있다. 프로세서(1110)는 범용 프로세서, 디지털 신호 프로세서, 애플리케이션 특정 집적 회로, 필드 프로그램 가능 게이트 어레이 또는 다른 프로그램 가능 논리 장치, 이산 게이트 또는 트랜지스터 논리 장치, 또는 이산 하드웨어 구성 요소일 수 있다. 프로세서(1110)는 본 발명의 실시예에 개시된 방법, 단계 및 논리 블록도를 구현 또는 수행할 수 있다. 범용 프로세서는 마이크로프로세서일 수 있거나, 프로세서는 임의의 종래의 프로세서 등일 수 있다. 본 발명의 실시예를 참조하여 개시된 방법의 단계는 하드웨어 디코딩 프로세서를 사용하여 직접 수행되고 달성될 수 있거나, 또는 디코딩 프로세서에서 하드웨어 및 소프트웨어 모듈의 조합을 사용하여 수행되고 달성될 수 있다.
소프트웨어 모듈은 랜덤 액세스 메모리, 플래시 메모리, 판독 전용 메모리, 프로그램 가능 판독 전용 메모리, 전기 소거 가능 프로그램 가능 메모리, 또는 레지스터와 같은 해당 기술 분야의 성숙한 저장 매체에 위치할 수 있다. 저장 매체는 메모리(1120)에 위치된다. 예를 들어, 프로세서(1110)는 메모리(1120)에서 정보를 판독하고, 프로세서(1110)의 하드웨어와 조합하여 전술한 방법의 단계들을 완료할 수 있다.
또한, 장치(1100)는 송수신기(1130)를 더 포함할 수 있다. 송수신기(1130)는 예를 들어 관련 데이터(예를 들어, 명령, 채널 신호 또는 비트스트림)를 수신 및 전송하도록 구성될 수 있다.
예를 들어, 장치(1100)는 도 2 내지 도 9d에 도시된 임의의 실시예에서 대응하는 방법의 일부 또는 모든 단계를 수행할 수 있다.
구체적으로, 예를 들어, 장치(1100)가 전술한 인코딩의 관련 단계를 수행할 때, 장치(1100)는 인코딩 장치(또는 오디오 인코딩 장치)라고 지칭될 수 있다. 장치(1100)가 전술한 디코딩의 관련 단계들을 수행할 때, 장치(1100)는 디코딩 장치(또는 오디오 디코딩 장치)라고 지칭될 수 있다.
도 11b를 참조하면, 장치(1100)가 인코딩 장치인 경우, 장치(1100)는 마이크로폰(1140), 아날로그-디지털 변환기(1150) 등을 더 포함할 수 있다.
예를 들어, 마이크로폰(1140)은 아날로그 오디오 신호를 얻기 위해 샘플링을 수행하도록 구성될 수 있다.
예를 들어, 아날로그-디지털 변환기(1150)는 아날로그 오디오 신호를 디지털 오디오 신호로 변환하도록 구성될 수 있다.
도 11c를 참조하면, 장치(1100)가 인코딩 장치인 경우, 장치(1100)는 스피커(1160), 디지털-아날로그 변환기(1170) 등을 더 포함할 수 있다.
예를 들어, 디지털-아날로그 변환기(1170)는 디지털 오디오 신호를 아날로그 오디오 신호로 변환하도록 구성될 수 있다.
예를 들어, 스피커(1160)는 아날로그 오디오 신호를 재생하도록 구성될 수 있다.
또한, 도 12a를 참조하면, 본 출원의 실시예는 본 출원의 실시예에서 제공되는 임의의 방법을 구현하도록 구성된 몇몇 기능 유닛을 포함하는 장치(1200)를 제공한다.
예를 들어, 장치(1200)가 도 2에 도시된 실시예에서 해당 방법을 수행하는 경우. 장치(1200)는:
현재 프레임에 대한 채널 조합 방식을 결정하고, 이전 프레임에 대한 채널 조합 방식 및 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 코딩 모드를 결정하도록 구성된 제1 결정 유닛(1210); 및
현재 프레임의 코딩 모드에 대응하는 시간-도메인 다운믹스 처리에 기초하여 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 시간-도메인 다운믹스 처리를 수행하여 현재 프레임에서의 일차 및 이차 채널 신호를 획득하도록 구성된 인코딩 유닛(1220) 을 포함할 수 있다.
또한, 도 12b를 참조하면, 장치(1200)는 현재 프레임의 시간-도메인 스테레오 파라미터를 결정하도록 구성된 제2 결정 유닛(1230)을 더 포함할 수 있다. 인코딩 유닛(1220)은 현재 프레임의 시간-도메인 스테레오 파라미터를 인코딩하도록 추가로 구성될 수도 있다.
다른 예를 들어, 도 12c를 참조하면, 장치(1200)가 도 3에 도시된 실시예에서 대응하는 방법을 수행할 때, 장치(1200)는:
비트스트림에 있는 현재 프레임의 채널 조합 방식 플래그에 기초하여 현재 프레임에 대한 채널 조합 방식을 결정하고; 이전 프레임에 대한 채널 조합 방식 및 현재 프레임에 대한 채널 조합 방식에 기초하여 현재 프레임의 디코딩 모드를 결정하도록 구성된 제3 결정 유닛(1240); 및
비트스트림에 기초하여 디코딩을 수행하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호를 획득하고; 현재 프레임의 디코딩 모드에 대응하는 시간-도메인 업믹스 처리에 기초하여 현재 프레임에서의 디코딩된 일차 및 이차 채널 신호에 대해 시간-도메인 업믹스 처리를 수행하여 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하도록 구성된 디코딩 유닛(1250) 을 포함할 수 있다.
장치가 다른 방법을 수행하는 경우는 유추에 의해 추론된다.
본 출원의 실시예는 컴퓨터 판독 가능형 저장 매체를 제공한다. 컴퓨터 판독 가능 저장 매체는 프로그램 코드를 저장하고, 프로그램 코드는 본 출원의 실시예에서 제공되는 임의의 방법으로 일부 또는 모든 단계를 수행하기 위한 명령을 포함한다.
본 출원의 실시예는 컴퓨터 프로그램 제품을 제공한다. 컴퓨터 프로그램 제품이 컴퓨터에서 실행될 때, 컴퓨터는 본 출원의 실시예에서 제공되는 임의의 방법으로 일부 또는 모든 단계를 수행할 수 있다.
전술한 실시예에서, 모든 실시예의 설명은 각각의 초점을 갖는다. 실시예에서 상세하게 설명되지 않은 부분에 대해서는 다른 실시예의 관련 설명을 참조한다.
본 출원에 제공된 여러 실시예에서, 개시된 장치는 다른 방식으로 구현될 수 있음을 이해해야 한다. 예를 들어, 설명된 장치 실시예는 단지 예일 뿐이다. 예를 들어, 유닛 분할은 단지 논리적 기능 분할이거나 실제 구현에서 다른 분할일 수 있다. 예를 들어, 복수의 유닛 또는 구성 요소가 다른 시스템에 결합되거나 통합될 수 있거나, 일부 특징이 무시되거나 수행되지 않을 수 있다. 또한, 표시되거나 설명된 상호 간접 결합 또는 직접 결합 또는 통신 연결은 일부 인터페이스를 사용하여 구현될 수 있다. 장치 또는 유닛 사이의 간접 결합 또는 통신 연결은 전자 또는 다른 형태로 구현될 수 있다.
개별 부품으로 설명된 유닛은 물리적으로 분리되거나 물리적으로 분리되지 않을 수 있으며, 유닛으로 표시되는 구성 요소는 물리적 유닛이거나 아닐 수 있다. 구체적으로, 구성 요소들은 하나의 위치에 위치할 수 있거나 복수의 네트워크 유닛 상에 분배될 수 있다. 유닛의 일부 또는 전부는 실시예의 솔루션의 목적을 달성하기 위한 실제 필요에 따라 선택될 수 있다.
또한, 본 발명의 실시예에서의 기능 유닛은 하나의 처리 유닛에 통합될 수 있거나, 또는 각각의 유닛이 물리적으로 단독으로 존재할 수 있거나, 또는 둘 이상의 유닛이 하나의 유닛에 통합될 수 있다. 통합 유닛은 하드웨어 형태로 구현되거나, 소프트웨어 기능 유닛 형태로 구현될 수 있다.
통합 유닛이 소프트웨어 기능 유닛의 형태로 구현되고 독립적인 제품으로서 판매되거나 사용될 때, 통합 유닛은 컴퓨터 판독 가능 저장 매체에 저장될 수 있다. 이러한 이해에 기초하여, 본 발명의 기술 솔루션은 본질적으로, 또는 종래 기술에 기여하는 부분, 또는 기술 솔루션의 전부 또는 일부가 소프트웨어 제품의 형태로 구현될 수 있다. 컴퓨터 소프트웨어 제품은 저장 매체에 저장되며 컴퓨터 장치(개인용 컴퓨터, 서버, 네트워크 장치 등일 수 있음)에게 본 발명의 실시예에서 설명된 방법의 단계 전부 또는 일부를 수행하도록 지시하기 위한 몇 가지 명령을 포함한다. 상기 저장 매체는 USB 플래시 드라이브, 판독 전용 메모리(Read-Only Memory, ROM), 랜덤 액세스 메모리(Random Access Memory, RAM), 이동식 하드 디스크, 자기 디스크 또는 광디스크와 같은 프로그램 코드를 저장할 수 있는 임의의 매체를 포함한다.

Claims (68)

  1. 오디오 인코딩 방법으로서,
    현재 프레임에 대한 채널 조합 방식을 결정하는 단계;
    상기 현재 프레임에 대한 상기 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여, 상기 현재 프레임에 대한 상기 채널 조합 방식이 상기 이전 프레임에 대한 상기 채널 조합 방식과 다를 때 상기 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리(segmented time-domain downmix processing)을 수행하여 상기 현재 프레임의 일차 채널 신호 및 이차 채널 신호를 획득하는 단계; 및
    상기 현재 프레임에서의 상기 획득된 일차 채널 신호 및 이차 채널 신호를 인코딩하는 단계
    를 포함하는 오디오 인코딩 방법.
  2. 제1항에 있어서,
    상기 현재 프레임에 대한 상기 채널 조합 방식은 복수의 채널 조합 방식 중 하나이고, 상기 복수의 채널 조합 방식은 비 상관 신호 채널 조합 방식(anticorrelated signal channel combination scheme) 및 상관 신호 채널 조합 방식(correlated signal channel combination scheme)을 포함하고, 상기 상관 신호 채널 조합 방식은 니어 인 페이즈 시그널(near in phase signal)에 대응하는 채널 조합 방식이고, 상기 비 상관 신호 채널 조합 방식은 니어 아웃 오브 페이즈 시그널(near out of phase signal)에 대응하는 채널 조합 방식인, 오디오 인코딩 방법.
  3. 제2항에 있어서,
    상기 이전 프레임에 대한 상기 채널 조합 방식은 상기 상관 신호 채널 조합 방식이고, 상기 현재 프레임에 대한 상기 채널 조합 방식은 상기 비 상관 신호 채널 조합 방식이고,
    상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호는 상기 좌측 및 우측 채널 신호의 시작 세그먼트, 상기 좌측 및 우측 채널 신호의 중간 세그먼트, 및 상기 좌측 및 우측 채널 신호의 종료 세그먼트를 포함하고, 상기 현재 프레임에서의 상기 일차 및 이차 채널 신호는 상기 일차 및 이차 채널 신호의 시작 세그먼트, 상기 일차 및 이차 채널 신호의 중간 세그먼트, 및 상기 일차 및 이차 채널 신호의 종료 세그먼트를 포함하고; 그리고
    상기 현재 프레임에 대한 상기 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여, 상기 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리(segmented time-domain downmix processing)을 수행하여 상기 현재 프레임의 일차 채널 신호 및 이차 채널 신호를 획득하는 단계는:
    상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터(channel combination ratio factor) 및 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식(time-domain downmix processing manner)을 사용함으로써, 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 상기 시작 세그먼트 시작에 대한 시간-도메인 다운믹스 처리를 수행하여 상기 현재 프레임에서의 상기 일차 및 이차 채널 신호의 상기 시작 세그먼트를 획득하는 단계;
    상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 세그먼트 상기 종료 도메인에 대한 시간-도메인 다운믹스 처리를 수행하여 상기 현재 프레임에서의 일차 및 이차 채널 신호의 성가 종료 세그먼트를 획득하는 단계; 및
    상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 시간-도메인 다운믹스 처리 방식을 사용하여 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 상기 중간 세그먼트에 대해 시간-도메인 다운믹스 처리를 수행하여 상기 일차 및 이차 채널 신호의 제1 중간 세그먼트를 획득하고; 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용하여 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 상기 중간 세그먼트에 대해 시간-도메인 다운믹스 처리를 수행하여 상기 일차 및 이차 채널 신호의 제2 중간 세그먼트를 획득하며; 그리고 상기 일차 및 이차 채널 신호의 제1 중간 세그먼트 및 상기 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리를 수행하여, 상기 현재 프레임에서의 상기 일차 및 이차 채널 신호의 중간 세그먼트를 획득하는 단계
    를 포함하는, 오디오 인코딩 방법.
  4. 제3항에 있어서,
    상기 일차 및 이차 채널 신호의 상기 제1 중간 세그먼트 및 상기 일차 및 이차 채널 신호의 상기 제2 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 상기 일차 및 이차 채널 신호의 상기 제1 중간 세그먼트에 대응하는 가중 계수는 페이드-아웃 팩터(fade-out factor)이고, 상기 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대응하는 가중 계수는 페이드-인 팩터(fade-in factor)인, 오디오 인코딩 방법.
  5. 제4항에 있어서,
    Figure pct00872
    ; 여기서
    Figure pct00873
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pct00874
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pct00875
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 종료 세그먼트를 나타내고,
    Figure pct00876
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 종료 세그먼트를 나타내고,
    Figure pct00877
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 중간 세그먼트를 나타내고,
    Figure pct00878
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 중간 세그먼트를 나타내고;
    Figure pct00879
    은 상기 현재 프레임에서의 상기 일차 채널 신호를 나타내고;
    Figure pct00880
    은 상기 현재 프레임에서의 이차 채널 신호를 나타내고;
    Figure pct00881
    ;
    Figure pct00882
    는 페이드-인 팩터를 나타내고,
    Figure pct00883
    은 페이드-아웃 팩터를 나타내며,
    Figure pct00884
    Figure pct00885
    의 합은 1이며;
    n은 샘플링 포인트 번호를 나타내고,
    Figure pct00886
    이며;
    Figure pct00887
    이고; 그리고
    Figure pct00888
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 제1 중간 세그먼트를 나타내고,
    Figure pct00889
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 제1 중간 세그먼트를 나타내고,
    Figure pct00890
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 제2 중간 세그먼트를 나타내고,
    Figure pct00891
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 제2 중간 세그먼트를 나타내는, 오디오 인코딩 방법.
  6. 제5항에 있어서,
    Figure pct00892
    Figure pct00893
    인, 오디오 인코딩 방법.
  7. 제5항 또는 제6항에 있어서,
    Figure pct00894
    ;
    Figure pct00895
    ;
    Figure pct00896
    ; 및
    Figure pct00897
    ; 여기서
    Figure pct00898
    은 상기 현재 프레임에서 상기 좌측 채널 신호를 나타내고,
    Figure pct00899
    은 상기 현재 프레임에서 상기 우측 채널 신호를 나타내고;
    Figure pct00900
    은 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
    Figure pct00901
    은 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터에 기초하여 구성되고;
    Figure pct00902
    는 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
    Figure pct00903
    는 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터에 기초하여 구성되는, 오디오 인코딩 방법.
  8. 제7항에 있어서,
    Figure pct00904
    , 또는
    Figure pct00905
    , 또는
    Figure pct00906
    , 또는
    Figure pct00907
    , 또는
    Figure pct00908
    , 또는
    Figure pct00909
    , 여기서
    Figure pct00910
    ,
    Figure pct00911
    Figure pct00912
    은 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터를 나타내는, 오디오 인코딩 방법.
  9. 제7항 또는 제8항에 있어서,
    Figure pct00913
    , 또는
    Figure pct00914
    , 여기서
    Figure pct00915
    는 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터를 나타내는, 오디오 인코딩 방법.
  10. 제2항에 있어서,
    상기 이전 프레임에 대한 상기 채널 조합 방식은 상기 비 상관 신호 채널 조합 방식이고, 상기 현재 프레임에 대한 상기 채널 조합 방식은 상기 상관 신호 채널 조합 방식이고;
    상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호는 상기 좌측 및 우측 채널 신호의 시작 세그먼트, 상기 좌측 및 우측 채널 신호의 중간 세그먼트, 및 상기 좌측 및 우측 채널 신호의 종료 세그먼트를 포함하고, 상기 현재 프레임의 상기 일차 및 이차 채널 신호는 상기 일차 및 이차 채널 신호의 시작 세그먼트, 상기 일차 및 이차 채널 신호의 중간 세그먼트, 및 상기 일차 및 이차 채널 신호의 종료 세그먼트를 포함하고; 그리고
    상기 현재 프레임에 대한 상기 채널 조합 방식 및 상기 이전 프레임에 대한 상기 채널 조합 방식에 기초하여 상기 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하여, 상기 현재 프레임에서의 일차 채널 신호 및 이차 채널 신호를 획득하는 단계는:
    상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 상기 시작 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 상기 현재 프레임에서의 상기 일차 및 이차 채널 신호의 상기 시작 세그먼트를 획득하는 단계;
    상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용하여, 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 상기 종료 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 상기 현재 프레임에서의 사익 일차 및 이차 채널 신호의 상기 종료 세그먼트를 획득하는 단계; 및
    상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 시간-도메인 다운믹스 처리 방식을 사용하여, 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 상기 중간 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 상기 일차 및 이차 채널 신호의 제3 중간 세그먼트를 획득하고; 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 시간-도메인 다운믹스 처리 방식을 사용하여, 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 상기 중간 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 상기 일차 및 이차 채널 신호의 제4 중간 세그먼트를 획득하며; 그리고 상기 일차 및 이차 채널 신호의 제3 중간 세그먼트 및 상기 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리를 수행하여, 상기 현재 프레임에서의 상기 일차 및 이차 채널 신호의 중간 세그먼트를 획득하는 단계
    를 포함하는, 오디오 인코딩 방법.
  11. 제10항에 있어서,
    상기 일차 및 이차 채널 신호의 제3 중간 세그먼트 및 상기 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 상기 일차 및 이차 채널 신호의 상기 제3 중간 세그먼트에 대응하는 가중 계수는 페이드-아웃 팩터이고, 상기 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대응하는 가중 계수는 페이드-인 팩터인, 오디오 인코딩 방법.
  12. 제11항에 있어서,
    Figure pct00916
    , 여기서
    Figure pct00917
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pct00918
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pct00919
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 종료 세그먼트를 나타내고,
    Figure pct00920
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 종료 세그먼트를 나타내고,
    Figure pct00921
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 중간 세그먼트를 나타내고,
    Figure pct00922
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 중간 세그먼트를 나타내고;
    Figure pct00923
    은 상기 현재 프레임에서의 상기 일차 채널 신호를 나타내고;
    Figure pct00924
    은 상기 현재 프레임에서의 이차 채널 신호를 나타내고;
    Figure pct00925
    ;
    Figure pct00926
    는 페이드-인 팩터를 나타내고,
    Figure pct00927
    은 페이드-아웃 팩터를 나타내며,
    Figure pct00928
    Figure pct00929
    의 합은 1이며;
    n은 샘플링 포인트 번호를 나타내고,
    Figure pct00930
    이며;
    Figure pct00931
    이고; 그리고
    Figure pct00932
    은 상기 현재 프레임에서 상기 일차 채널 신호의 제3 중간 세그먼트를 나타내고,
    Figure pct00933
    은 상기 현재 프레임에서 상기 이차 채널 신호의 제3 중간 세그먼트를 나타내고,
    Figure pct00934
    은 상기 현재 프레임에서 상기 일차 채널 신호의 제4 중간 세그먼트를 나타내고,
    Figure pct00935
    은 상기 현재 프레임에서 상기 이차 채널 신호의 제4 중간 세그먼트를 나타내는, 오디오 인코딩 방법.
  13. 제12항에 있어서,
    Figure pct00936
    , 및
    Figure pct00937
    인, 오디오 인코딩 방법.
  14. 제12항 또는 제13항에 있어서,
    Figure pct00938
    ;
    Figure pct00939
    ;
    Figure pct00940
    ; 및
    Figure pct00941
    ; 여기서
    Figure pct00942
    은 상기 현재 프레임에서의 상기 좌측 채널 신호를 나타내고,
    Figure pct00943
    은 상기 현재 프레임에서의 상기 우측 채널 신호를 나타내고; 그리고
    Figure pct00944
    는 상기 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
    Figure pct00945
    는 상기 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성되고;
    Figure pct00946
    은 상기 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
    Figure pct00947
    은 상기 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성되는, 오디오 인코딩 방법.
  15. 제14항에 있어서,
    Figure pct00948
    , 또는
    Figure pct00949
    , 또는
    Figure pct00950
    , 또는
    Figure pct00951
    , 또는
    Figure pct00952
    , 또는
    Figure pct00953
    , 여기서
    Figure pct00954
    Figure pct00955
    ; 그리고
    Figure pct00956
    은 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터를 나타내는, 오디오 인코딩 방법.
  16. 제14항 또는 제15항에 있어서,
    Figure pct00957
    , 또는
    Figure pct00958
    , 여기서
    Figure pct00959
    는 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터를 나타내는, 오디오 인코딩 방법.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서,
    Figure pct00960
    , 또는
    Figure pct00961
    , 또는
    Figure pct00962
    , 여기서
    Figure pct00963
    은 상기 현재 프레임에서 원래의 좌측 채널 신호를 나타내고,
    Figure pct00964
    은 상기 현재 프레임에서 원래의 우측 채널 신호를 나타내고;
    Figure pct00965
    은 상기 현재 프레임에서 시간-도메인 전처리를 거친 좌측 채널 신호를 나타내고,
    Figure pct00966
    은 상기 현재 프레임에서 시간-도메인 전처리를 거친 우측 채널 신호를 나타내고;
    Figure pct00967
    은 상기 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 신호를 나타내고,
    Figure pct00968
    은 상기 현재 프레임에서 지연 정렬 처리를 거친 우측 채널 신호를 나타내는, 오디오 인코딩 방법.
  18. 시간-도메인 스테레오 디코딩 방법으로서,
    현재 프레임에서의 디코딩된 일차 및 이차 채널 신호를 얻기 위해 비트스트림에 기초하여 디코딩을 수행하는 단계;
    상기 현재 프레임에 대한 채널 조합 방식을 결정하는 단계; 및
    상기 현재 프레임에 대한 상기 채널 조합 방식이 이전 프레임에 대한 채널 조합 방식과 다를 때, 상기 현재 프레임에 대한 상기 채널 조합 방식 및 상기 이전 프레임에 대한 상기 채널 조합 방식에 기초하여 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호에 대해 세그먼트화된 시간-도메인 업믹스 처리를 수행하여 상기 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계
    를 포함하는 시간-도메인 스테레오 디코딩 방법.
  19. 제18항에 있어서,
    상기 현재 프레임에 대한 상기 채널 조합 방식은 복수의 채널 조합 방식 중 하나이고, 상기 복수의 채널 조합 방식은 비 상관 신호 채널 조합 방식 및 상관 신호 채널 조합 방식을 포함하고, 상기 상관 신호 채널 조합 방식은 니어 인 페이즈 시그널(near in phase signal)에 대응하는 채널 조합 방식이고, 상기 비 상관 신호 채널 조합 방식은 니어 아웃 오브 페이즈 시그널(near out of phase signal)에 대응하는 채널 조합 방식인, 시간-도메인 스테레오 디코딩 방법.
  20. 제19항에 있어서,
    상기 이전 프레임에 대한 상기 채널 조합 방식은 상기 상관 신호 채널 조합 방식이고, 상기 현재 프레임에 대한 상기 채널 조합 방식은 상기 비 상관 신호 채널 조합 방식이고;
    상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호는 상기 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트, 상기 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트, 및 상기 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트를 포함하고, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호는 상기 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트, 상기 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트, 및 상기 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트를 포함하고; 그리고
    상기 현재 프레임에 대한 상기 채널 조합 방식 및 상기 이전 프레임에 대한 상기 채널 조합 방식에 기초하여 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호에 대해 세그먼트화된 시간-도메인 업믹스 처리를 수행하여 상기 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계는:
    상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 상기 시작 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호의 상기 시작 세그먼트를 획득하는 단계;
    상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호의 세그먼트를 획득하는 단계; 및
    상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 시간-도메인 업믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 상기 중간 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 상기 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트를 획득하고; 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 시간-도메인 업믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 상기 중간 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 상기 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트를 획득하며; 그리고 상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트를 획득하기 위해, 상기 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트 및 상기 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리를 수행하는 단계
    를 포함하는, 시간-도메인 스테레오 디코딩 방법.
  21. 제20항에 있어서,
    상기 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트 및 상기 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 상기 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트에 대응하는 가중 계수는 페이드-아웃 팩터이고, 상기 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대응하는 가중 계수는 페이드-인 팩터인, 시간-도메인 스테레오 디코딩 방법.
  22. 제21항에 있어서,
    Figure pct00969
    ; 여기서
    Figure pct00970
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pct00971
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pct00972
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 상기 종료 세그먼트를 나타내고,
    Figure pct00973
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 종료 세그먼트를 나타내고,
    Figure pct00974
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 상기 중간 세그먼트를 나타내고,
    Figure pct00975
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 상기 중간 세그먼트를 나타내고;
    Figure pct00976
    은 현재 프레임에서의 재구성된 좌측 채널 신호를 나타내고;
    Figure pct00977
    은 현재 프레임에서의 재구성된 우측 채널 신호를 나타내고;
    Figure pct00978
    ;
    Figure pct00979
    는 페이드-인 팩터를 나타내고,
    Figure pct00980
    은 페이드-아웃 팩터를 나타내며,
    Figure pct00981
    Figure pct00982
    의 합은 1이며;
    n은 샘플링 포인트 번호를 나타내고,
    Figure pct00983
    이며;
    Figure pct00984
    이고; 그리고
    Figure pct00985
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 제1 중간 세그먼트를 나타내고,
    Figure pct00986
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 제1 중간 세그먼트를 나타내고,
    Figure pct00987
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 제2 중간 세그먼트를 나타내고,
    Figure pct00988
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 제2 중간 세그먼트를 나타내는, 시간-도메인 스테레오 디코딩 방법.
  23. 제22항에 있어서,
    Figure pct00989
    Figure pct00990
    인, 시간-도메인 스테레오 디코딩 방법.
  24. 제22항 또는 제23항에 있어서,
    Figure pct00991
    ;
    Figure pct00992
    ;
    Figure pct00993
    ; 및
    Figure pct00994
    ; 여기서
    Figure pct00995
    은 상기 현재 프레임에서의 상기 디코딩된 일차 채널 신호를 나타내고,
    Figure pct00996
    은 상기 현재 프레임에서의 디코딩된 이차 채널 신호를 나타내고; 그리고
    Figure pct00997
    은 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
    Figure pct00998
    은 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성되고;
    Figure pct00999
    는 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내며,
    Figure pct01000
    는 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성되는, 시간-도메인 스테레오 디코딩 방법.
  25. 제24항에 있어서,
    Figure pct01001
    , 또는
    Figure pct01002
    , 또는
    Figure pct01003
    , 또는
    Figure pct01004
    , 또는
    Figure pct01005
    , 또는
    Figure pct01006
    , 여기서
    Figure pct01007
    ,
    Figure pct01008
    Figure pct01009
    은 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터를 나타내는, 시간-도메인 스테레오 디코딩 방법.
  26. 제24항 또는 제25항에 있어서,
    Figure pct01010
    , 또는
    Figure pct01011
    , 여기서
    Figure pct01012
    는 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터를 나타내는, 시간-도메인 스테레오 디코딩 방법.
  27. 제19항에 있어서,
    상기 이전 프레임에 대한 채널 조합 방식은 상기 비 상관 신호 채널 조합 방식이고, 상기 현재 프레임에 대한 채널 조합 방식은 상기 상관 신호 채널 조합 방식이고;
    상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호는 상기 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트, 상기 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트, 및 상기 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트를 포함하고, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호는 상기 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트, 상기 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트, 및 상기 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트를 포함하고; 그리고
    상기 현재 프레임에 대한 상기 채널 조합 방식 및 상기 이전 프레임에 대한 상기 채널 조합 방식에 기초하여 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호에 대해 세그먼트화된 시간-도메인 업믹스 처리를 수행하여 상기 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계는:
    상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트에 대한 시간-도메인 업믹스를 수행하여 상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트를 획득하는 단계;
    상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호의 상기 종료 세그먼트를 획득하는 단계; 및
    상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 시간-도메인 업믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 상기 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트를 획득하고; 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 시간-도메인 업믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 상기 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트를 획득하며; 그리고 상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트를 획득하기 위해, 상기 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트 및 상기 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리를 수행하는 단계
    를 포함하는, 시간-도메인 스테레오 디코딩 방법.
  28. 제27항에 있어서,
    상기 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트 및 상기 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 상기 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트에 대응하는 가중 계수는 페이드-아웃 팩터이고, 상기 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대응하는 가중 계수는 페이드-인 팩터인, 시간-도메인 스테레오 디코딩 방법.
  29. 제28항에 있어서,
    Figure pct01013
    ; 여기서
    Figure pct01014
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pct01015
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pct01016
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 상기 종료 세그먼트를 나타내고,
    Figure pct01017
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 상기 종료 세그먼트를 나타내고,
    Figure pct01018
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 상기 중간 세그먼트를 나타내고,
    Figure pct01019
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 상기 중간 세그먼트를 나타내고;
    Figure pct01020
    은 현재 프레임에서의 재구성된 좌측 채널 신호를 나타내고;

    Figure pct01021
    은 현재 프레임에서의 재구성된 우측 채널 신호를 나타내고;
    Figure pct01022
    이고;
    Figure pct01023
    는 페이드-인 팩터를 나타내고,
    Figure pct01024
    은 페이드-아웃 팩터를 나타내며,
    Figure pct01025
    Figure pct01026
    의 합은 1이며;
    n은 샘플링 포인트 번호를 나타내고,
    Figure pct01027
    이며;
    Figure pct01028
    이고; 그리고
    Figure pct01029
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 제3 중간 세그먼트를 나타내고,
    Figure pct01030
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 제3 중간 세그먼트를 나타내고; 그리고
    Figure pct01031
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 제4 중간 세그먼트를 나타내고,
    Figure pct01032
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 제4 중간 세그먼트를 나타내는, 시간-도메인 스테레오 디코딩 방법.
  30. 제29항에 있어서,
    Figure pct01033
    Figure pct01034
    인, 시간-도메인 스테레오 디코딩 방법.
  31. 제29항 또는 제30항에 있어서,
    Figure pct01035
    ;
    Figure pct01036
    ;
    Figure pct01037
    ; 및
    Figure pct01038
    ; 여기서
    Figure pct01039
    은 상기 현재 프레임에서의 상기 디코딩된 일차 채널 신호를 나타내고,
    Figure pct01040
    은 상기 현재 프레임에서의 상기 디코딩된 이차 채널 신호를 나타내고; 그리고
    Figure pct01041
    는 상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
    Figure pct01042
    는 상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성되고;
    Figure pct01043
    은 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
    Figure pct01044
    은 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터에 기초하여 구성되는, 시간-도메인 스테레오 디코딩 방법.
  32. 제31항에 있어서,
    Figure pct01045
    , 또는
    Figure pct01046
    , 또는
    Figure pct01047
    , 또는
    Figure pct01048
    , 또는
    Figure pct01049
    , 또는
    Figure pct01050
    , 여기서
    Figure pct01051
    Figure pct01052
    ; 그리고
    Figure pct01053
    은 상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터를 나타내는, 시간-도메인 스테레오 디코딩 방법.
  33. 제31항 또는 제32항에 있어서,
    Figure pct01054
    , 또는
    Figure pct01055
    , 여기서
    Figure pct01056
    는 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타내는, 시간-도메인 스테레오 디코딩 방법.
  34. 서로 연결된 프로세서 및 메모리를 포함하는 시간-도메인 스테레오 인코딩 장치로서,
    상기 프로세서는 다음 단계:
    현재 프레임에 대한 채널 조합 방식을 결정하는 단계;
    상기 현재 프레임에 대한 상기 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여, 상기 현재 프레임에 대한 상기 채널 조합 방식이 상기 이전 프레임에 대한 상기 채널 조합 방식과 다를 때 상기 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리(segmented time-domain downmix processing)을 수행하여 상기 현재 프레임의 일차 채널 신호 및 이차 채널 신호를 획득하는 단계; 및
    상기 현재 프레임에서의 상기 획득된 일차 채널 신호 및 이차 채널 신호를 인코딩하는 단계
    를 수행하도록 구성되어 있는, 시간-도메인 스테레오 인코딩 장치.
  35. 제34항에 있어서,
    상기 현재 프레임에 대한 상기 채널 조합 방식은 복수의 채널 조합 방식 중 하나이고, 상기 복수의 채널 조합 방식은 비 상관 신호 채널 조합 방식(anticorrelated signal channel combination scheme) 및 상관 신호 채널 조합 방식(correlated signal channel combination scheme)을 포함하고, 상기 상관 신호 채널 조합 방식은 니어 인 페이즈 시그널(near in phase signal)에 대응하는 채널 조합 방식이고, 상기 비 상관 신호 채널 조합 방식은 니어 아웃 오브 페이즈 시그널(near out of phase signal)에 대응하는 채널 조합 방식인, 시간-도메인 스테레오 인코딩 장치.
  36. 제35항에 있어서,
    상기 이전 프레임에 대한 상기 채널 조합 방식은 상기 상관 신호 채널 조합 방식이고, 상기 현재 프레임에 대한 상기 채널 조합 방식은 상기 비 상관 신호 채널 조합 방식이고,
    상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호는 상기 좌측 및 우측 채널 신호의 시작 세그먼트, 상기 좌측 및 우측 채널 신호의 중간 세그먼트, 및 상기 좌측 및 우측 채널 신호의 종료 세그먼트를 포함하고, 상기 현재 프레임에서의 상기 일차 및 이차 채널 신호는 상기 일차 및 이차 채널 신호의 시작 세그먼트, 상기 일차 및 이차 채널 신호의 중간 세그먼트, 및 상기 일차 및 이차 채널 신호의 종료 세그먼트를 포함하고; 그리고
    상기 프로세서가 상기 현재 프레임에 대한 상기 채널 조합 방식 및 이전 프레임에 대한 채널 조합 방식에 기초하여, 상기 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리(segmented time-domain downmix processing)을 수행하여 상기 현재 프레임의 일차 채널 신호 및 이차 채널 신호를 획득하는 것은:
    상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터(channel combination ratio factor) 및 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식(time-domain downmix processing manner)을 사용함으로써, 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 상기 시작 세그먼트 시작에 대한 시간-도메인 다운믹스 처리를 수행하여 상기 현재 프레임에서의 상기 일차 및 이차 채널 신호의 상기 시작 세그먼트를 획득하는 단계;
    상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 세그먼트 상기 종료 도메인에 대한 시간-도메인 다운믹스 처리를 수행하여 상기 현재 프레임에서의 일차 및 이차 채널 신호의 성가 종료 세그먼트를 획득하는 단계; 및
    상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 시간-도메인 다운믹스 처리 방식을 사용하여 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 상기 중간 세그먼트에 대해 시간-도메인 다운믹스 처리를 수행하여 상기 일차 및 이차 채널 신호의 제1 중간 세그먼트를 획득하고; 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용하여 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 상기 중간 세그먼트에 대해 시간-도메인 다운믹스 처리를 수행하여 상기 일차 및 이차 채널 신호의 제2 중간 세그먼트를 획득하며; 그리고 상기 일차 및 이차 채널 신호의 제1 중간 세그먼트 및 상기 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리를 수행하여, 상기 현재 프레임에서의 상기 일차 및 이차 채널 신호의 중간 세그먼트를 획득하는 단계
    를 포함하는, 시간-도메인 스테레오 인코딩 장치.
  37. 제36항에 있어서,
    상기 일차 및 이차 채널 신호의 상기 제1 중간 세그먼트 및 상기 일차 및 이차 채널 신호의 상기 제2 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 상기 일차 및 이차 채널 신호의 상기 제1 중간 세그먼트에 대응하는 가중 계수는 페이드-아웃 팩터이고, 상기 일차 및 이차 채널 신호의 제2 중간 세그먼트에 대응하는 가중 계수는 페이드-인 팩터인, 시간-도메인 스테레오 인코딩 장치.
  38. 제37항에 있어서,
    Figure pct01057
    ; 여기서
    Figure pct01058
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pct01059
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pct01060
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 종료 세그먼트를 나타내고,
    Figure pct01061
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 종료 세그먼트를 나타내고,
    Figure pct01062
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 중간 세그먼트를 나타내고,
    Figure pct01063
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 중간 세그먼트를 나타내고;
    Figure pct01064
    은 상기 현재 프레임에서의 상기 일차 채널 신호를 나타내고;
    Figure pct01065
    은 상기 현재 프레임에서의 이차 채널 신호를 나타내고;
    Figure pct01066
    ;
    Figure pct01067
    는 페이드-인 팩터를 나타내고,
    Figure pct01068
    은 페이드-아웃 팩터를 나타내며,
    Figure pct01069
    Figure pct01070
    의 합은 1이며;
    n은 샘플링 포인트 번호를 나타내고,
    Figure pct01071
    이며;
    Figure pct01072
    이고; 그리고
    Figure pct01073
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 제1 중간 세그먼트를 나타내고,
    Figure pct01074
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 제1 중간 세그먼트를 나타내고,
    Figure pct01075
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 제2 중간 세그먼트를 나타내고,
    Figure pct01076
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 제2 중간 세그먼트를 나타내는, 시간-도메인 스테레오 인코딩 장치.
  39. 제38항에 있어서,
    Figure pct01077
    Figure pct01078
    인, 시간-도메인 스테레오 인코딩 장치.
  40. 제38항 또는 제39항에 있어서,
    Figure pct01079
    ;
    Figure pct01080
    ;
    Figure pct01081
    ; 및
    Figure pct01082
    ; 여기서
    Figure pct01083
    은 상기 현재 프레임에서 상기 좌측 채널 신호를 나타내고,
    Figure pct01084
    은 상기 현재 프레임에서 상기 우측 채널 신호를 나타내고;
    Figure pct01085
    은 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
    Figure pct01086
    은 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터에 기초하여 구성되고;
    Figure pct01087
    는 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
    Figure pct01088
    는 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터에 기초하여 구성되는, 시간-도메인 스테레오 인코딩 장치.
  41. 제40항에 있어서,
    Figure pct01089
    , 또는
    Figure pct01090
    , 또는
    Figure pct01091
    , 또는
    Figure pct01092
    , 또는
    Figure pct01093
    , 또는
    Figure pct01094
    , 여기서
    Figure pct01095
    ,
    Figure pct01096
    Figure pct01097
    은 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터를 나타내는, 시간-도메인 스테레오 인코딩 장치.
  42. 제40항 또는 제41항에 있어서,
    Figure pct01098
    , 또는
    Figure pct01099
    , 여기서
    Figure pct01100
    는 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터를 나타내는, 시간-도메인 스테레오 인코딩 장치.
  43. 제35항에 있어서,
    상기 이전 프레임에 대한 상기 채널 조합 방식은 상기 비 상관 신호 채널 조합 방식이고, 상기 현재 프레임에 대한 상기 채널 조합 방식은 상기 상관 신호 채널 조합 방식이고;
    상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호는 상기 좌측 및 우측 채널 신호의 시작 세그먼트, 상기 좌측 및 우측 채널 신호의 중간 세그먼트, 및 상기 좌측 및 우측 채널 신호의 종료 세그먼트를 포함하고, 상기 현재 프레임의 상기 일차 및 이차 채널 신호는 상기 일차 및 이차 채널 신호의 시작 세그먼트, 상기 일차 및 이차 채널 신호의 중간 세그먼트, 및 상기 일차 및 이차 채널 신호의 종료 세그먼트를 포함하고; 그리고
    상기 프로세서가 상기 현재 프레임에 대한 상기 채널 조합 방식 및 상기 이전 프레임에 대한 상기 채널 조합 방식에 기초하여 상기 현재 프레임에서의 좌측 및 우측 채널 신호에 대해 세그먼트화된 시간-도메인 다운믹스 처리를 수행하여, 상기 현재 프레임에서의 일차 채널 신호 및 이차 채널 신호를 획득하는 것은:
    상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 상기 시작 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 상기 현재 프레임에서의 상기 일차 및 이차 채널 신호의 상기 시작 세그먼트를 획득하는 단계;
    상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 시간-도메인 다운믹스 처리 방식을 사용하여, 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 상기 종료 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 상기 현재 프레임에서의 사익 일차 및 이차 채널 신호의 상기 종료 세그먼트를 획득하는 단계; 및
    상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 시간-도메인 다운믹스 처리 방식을 사용하여, 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 상기 중간 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 상기 일차 및 이차 채널 신호의 제3 중간 세그먼트를 획득하고; 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 시간-도메인 다운믹스 처리 방식을 사용하여, 상기 현재 프레임에서의 상기 좌측 및 우측 채널 신호의 상기 중간 세그먼트에 대한 시간-도메인 다운믹스 처리를 수행하여 상기 일차 및 이차 채널 신호의 제4 중간 세그먼트를 획득하며; 그리고 상기 일차 및 이차 채널 신호의 제3 중간 세그먼트 및 상기 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리를 수행하여, 상기 현재 프레임에서의 상기 일차 및 이차 채널 신호의 중간 세그먼트를 획득하는 단계
    를 포함하는, 시간-도메인 스테레오 인코딩 장치.
  44. 제43항에 있어서,
    상기 일차 및 이차 채널 신호의 제3 중간 세그먼트 및 상기 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 상기 일차 및 이차 채널 신호의 상기 제3 중간 세그먼트에 대응하는 가중 계수는 페이드-아웃 팩터이고, 상기 일차 및 이차 채널 신호의 제4 중간 세그먼트에 대응하는 가중 계수는 페이드-인 팩터인, 시간-도메인 스테레오 인코딩 장치.
  45. 제44항에 있어서,
    Figure pct01101
    , 여기서
    Figure pct01102
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pct01103
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pct01104
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 종료 세그먼트를 나타내고,
    Figure pct01105
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 종료 세그먼트를 나타내고,
    Figure pct01106
    은 상기 현재 프레임에서 상기 일차 채널 신호의 상기 중간 세그먼트를 나타내고,
    Figure pct01107
    은 상기 현재 프레임에서 상기 이차 채널 신호의 상기 중간 세그먼트를 나타내고;
    Figure pct01108
    은 상기 현재 프레임에서의 상기 일차 채널 신호를 나타내고;
    Figure pct01109
    은 상기 현재 프레임에서의 이차 채널 신호를 나타내고;
    Figure pct01110
    ;
    Figure pct01111
    는 페이드-인 팩터를 나타내고,
    Figure pct01112
    은 페이드-아웃 팩터를 나타내며,
    Figure pct01113
    Figure pct01114
    의 합은 1이며;
    n은 샘플링 포인트 번호를 나타내고,
    Figure pct01115
    이며;
    Figure pct01116
    이고; 그리고
    Figure pct01117
    은 상기 현재 프레임에서 상기 일차 채널 신호의 제3 중간 세그먼트를 나타내고,
    Figure pct01118
    은 상기 현재 프레임에서 상기 이차 채널 신호의 제3 중간 세그먼트를 나타내고,
    Figure pct01119
    은 상기 현재 프레임에서 상기 일차 채널 신호의 제4 중간 세그먼트를 나타내고,
    Figure pct01120
    은 상기 현재 프레임에서 상기 이차 채널 신호의 제4 중간 세그먼트를 나타내는, 시간-도메인 스테레오 인코딩 장치.
  46. 제45항에 있어서,
    Figure pct01121
    , 및
    Figure pct01122
    인, 시간-도메인 스테레오 인코딩 장치.
  47. 제44항 또는 제45항에 있어서,
    Figure pct01123
    ;
    Figure pct01124
    ;
    Figure pct01125
    ; 및
    Figure pct01126
    ; 여기서
    Figure pct01127
    은 상기 현재 프레임에서의 상기 좌측 채널 신호를 나타내고,
    Figure pct01128
    은 상기 현재 프레임에서의 상기 우측 채널 신호를 나타내고; 그리고
    Figure pct01129
    는 상기 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
    Figure pct01130
    는 상기 이전 프레임에 대한 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성되고;
    Figure pct01131
    은 상기 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 다운믹스 매트릭스를 나타내고,
    Figure pct01132
    은 상기 현재 프레임에 대한 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성되는, 시간-도메인 스테레오 인코딩 장치.
  48. 제47항에 있어서,
    Figure pct01133
    , 또는
    Figure pct01134
    , 또는
    Figure pct01135
    , 또는
    Figure pct01136
    , 또는
    Figure pct01137
    , 또는
    Figure pct01138
    , 여기서
    Figure pct01139
    Figure pct01140
    ; 그리고
    Figure pct01141
    은 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터를 나타내는, 시간-도메인 스테레오 인코딩 장치.
  49. 제47항 또는 제48항에 있어서,
    Figure pct01142
    , 또는
    Figure pct01143
    , 여기서
    Figure pct01144
    는 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터를 나타내는, 시간-도메인 스테레오 인코딩 장치.
  50. 제34항 내지 제49항 중 어느 한 항에 있어서,
    Figure pct01145
    , 또는
    Figure pct01146
    , 또는
    Figure pct01147
    , 여기서
    Figure pct01148
    은 상기 현재 프레임에서 원래의 좌측 채널 신호를 나타내고,
    Figure pct01149
    은 상기 현재 프레임에서 원래의 우측 채널 신호를 나타내고;
    Figure pct01150
    은 상기 현재 프레임에서 시간-도메인 전처리를 거친 좌측 채널 신호를 나타내고,
    Figure pct01151
    은 상기 현재 프레임에서 시간-도메인 전처리를 거친 우측 채널 신호를 나타내고;
    Figure pct01152
    은 상기 현재 프레임에서 지연 정렬 처리를 거친 좌측 채널 신호를 나타내고,
    Figure pct01153
    은 상기 현재 프레임에서 지연 정렬 처리를 거친 우측 채널 신호를 나타내는, 시간-도메인 스테레오 인코딩 장치.
  51. 서로 연결된 프로세서 및 메모리를 포함하는 시간-도메인 스테레오 디코딩 장치로서,
    상기 프로세서는 다음 단계:
    현재 프레임에서의 디코딩된 일차 및 이차 채널 신호를 얻기 위해 비트스트림에 기초하여 디코딩을 수행하는 단계;
    상기 현재 프레임에 대한 채널 조합 방식을 결정하는 단계; 및
    상기 현재 프레임에 대한 상기 채널 조합 방식이 이전 프레임에 대한 채널 조합 방식과 다를 때, 상기 현재 프레임에 대한 상기 채널 조합 방식 및 상기 이전 프레임에 대한 상기 채널 조합 방식에 기초하여 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호에 대해 세그먼트화된 시간-도메인 업믹스 처리를 수행하여 상기 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계
    를 수행하도록 구성되어 있는, 시간-도메인 스테레오 디코딩 장치.
  52. 제51항에 있어서,
    상기 현재 프레임에 대한 상기 채널 조합 방식은 복수의 채널 조합 방식 중 하나이고, 상기 복수의 채널 조합 방식은 비 상관 신호 채널 조합 방식 및 상관 신호 채널 조합 방식을 포함하고, 상기 상관 신호 채널 조합 방식은 니어 인 페이즈 시그널(near in phase signal)에 대응하는 채널 조합 방식이고, 상기 비 상관 신호 채널 조합 방식은 니어 아웃 오브 페이즈 시그널(near out of phase signal)에 대응하는 채널 조합 방식인, 시간-도메인 스테레오 디코딩 장치.
  53. 제52항에 있어서,
    상기 이전 프레임에 대한 상기 채널 조합 방식은 상기 상관 신호 채널 조합 방식이고, 상기 현재 프레임에 대한 상기 채널 조합 방식은 상기 비 상관 신호 채널 조합 방식이고;
    상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호는 상기 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트, 상기 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트, 및 상기 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트를 포함하고, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호는 상기 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트, 상기 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트, 및 상기 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트를 포함하고; 그리고
    상기 프로세서가 상기 현재 프레임에 대한 상기 채널 조합 방식 및 상기 이전 프레임에 대한 상기 채널 조합 방식에 기초하여 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호에 대해 세그먼트화된 시간-도메인 업믹스 처리를 수행하여 상기 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 것은:
    상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 상기 시작 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호의 상기 시작 세그먼트를 획득하는 단계;
    상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호의 세그먼트를 획득하는 단계; 및
    상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 시간-도메인 업믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 상기 중간 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 상기 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트를 획득하고; 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 시간-도메인 업믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 상기 중간 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 상기 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트를 획득하며; 그리고 상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트를 획득하기 위해, 상기 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트 및 상기 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리를 수행하는 단계
    를 포함하는, 시간-도메인 스테레오 디코딩 장치.
  54. 제53항에 있어서,
    상기 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트 및 상기 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 상기 재구성된 좌측 및 우측 채널 신호의 제1 중간 세그먼트에 대응하는 가중 계수는 페이드-아웃 팩터이고, 상기 재구성된 좌측 및 우측 채널 신호의 제2 중간 세그먼트에 대응하는 가중 계수는 페이드-인 팩터인, 시간-도메인 스테레오 디코딩 장치.
  55. 제54항에 있어서,
    Figure pct01154
    ; 여기서
    Figure pct01155
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pct01156
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pct01157
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 상기 종료 세그먼트를 나타내고,
    Figure pct01158
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 종료 세그먼트를 나타내고,
    Figure pct01159
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 상기 중간 세그먼트를 나타내고,
    Figure pct01160
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 상기 중간 세그먼트를 나타내고;
    Figure pct01161
    은 현재 프레임에서의 재구성된 좌측 채널 신호를 나타내고;
    Figure pct01162
    은 현재 프레임에서의 재구성된 우측 채널 신호를 나타내고;
    Figure pct01163
    ;
    Figure pct01164
    는 페이드-인 팩터를 나타내고,
    Figure pct01165
    은 페이드-아웃 팩터를 나타내며,
    Figure pct01166
    Figure pct01167
    의 합은 1이며;
    n은 샘플링 포인트 번호를 나타내고,
    Figure pct01168
    이며;
    Figure pct01169
    이고; 그리고
    Figure pct01170
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 제1 중간 세그먼트를 나타내고,
    Figure pct01171
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 제1 중간 세그먼트를 나타내고,
    Figure pct01172
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 제2 중간 세그먼트를 나타내고,
    Figure pct01173
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 제2 중간 세그먼트를 나타내는, 시간-도메인 스테레오 디코딩 장치.
  56. 제55항에 있어서,
    Figure pct01174
    Figure pct01175
    인, 시간-도메인 스테레오 디코딩 장치.
  57. 제55항 또는 제56항에 있어서,
    Figure pct01176
    ;
    Figure pct01177
    ;
    Figure pct01178
    ; 및
    Figure pct01179
    ; 여기서
    Figure pct01180
    은 상기 현재 프레임에서의 상기 디코딩된 일차 채널 신호를 나타내고,
    Figure pct01181
    은 상기 현재 프레임에서의 디코딩된 이차 채널 신호를 나타내고; 그리고
    Figure pct01182
    은 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
    Figure pct01183
    은 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성되고;
    Figure pct01184
    는 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내며,
    Figure pct01185
    는 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성되는, 시간-도메인 스테레오 디코딩 장치.
  58. 제57항에 있어서,
    Figure pct01186
    , 또는
    Figure pct01187
    , 또는
    Figure pct01188
    , 또는
    Figure pct01189
    , 또는
    Figure pct01190
    , 또는
    Figure pct01191
    , 여기서
    Figure pct01192
    ,
    Figure pct01193
    Figure pct01194
    은 상기 현재 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터를 나타내는, 시간-도메인 스테레오 디코딩 장치.
  59. 제57항 또는 제58항에 있어서,
    Figure pct01195
    , 또는
    Figure pct01196
    , 여기서
    Figure pct01197
    는 상기 이전 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터를 나타내는, 시간-도메인 스테레오 디코딩 장치.
  60. 제52항에 있어서,
    상기 이전 프레임에 대한 채널 조합 방식은 상기 비 상관 신호 채널 조합 방식이고, 상기 현재 프레임에 대한 채널 조합 방식은 상기 상관 신호 채널 조합 방식이고;
    상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호는 상기 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트, 상기 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트, 및 상기 재구성된 좌측 및 우측 채널 신호의 종료 세그먼트를 포함하고, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호는 상기 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트, 상기 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트, 및 상기 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트를 포함하고; 그리고
    상기 현재 프레임에 대한 상기 채널 조합 방식 및 상기 이전 프레임에 대한 상기 채널 조합 방식에 기초하여 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호에 대해 세그먼트화된 시간-도메인 업믹스 처리를 수행하여 상기 현재 프레임에서의 재구성된 좌측 및 우측 채널 신호를 획득하는 단계는:
    상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 시작 세그먼트에 대한 시간-도메인 업믹스를 수행하여 상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호의 시작 세그먼트를 획득하는 단계;
    상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 시간-도메인 업믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 종료 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호의 상기 종료 세그먼트를 획득하는 단계; 및
    상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터 및 상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 시간-도메인 업믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 상기 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트를 획득하고; 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터 및 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 시간-도메인 업믹스 처리 방식을 사용함으로써, 상기 현재 프레임에서의 상기 디코딩된 일차 및 이차 채널 신호의 중간 세그먼트에 대한 시간-도메인 업믹스 처리를 수행하여 상기 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트를 획득하며; 그리고 상기 현재 프레임에서의 상기 재구성된 좌측 및 우측 채널 신호의 중간 세그먼트를 획득하기 위해, 상기 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트 및 상기 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리를 수행하는 단계
    를 포함하는, 시간-도메인 스테레오 디코딩 장치.
  61. 제60항에 있어서,
    상기 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트 및 상기 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대해 가중 합산 처리가 수행될 때, 상기 재구성된 좌측 및 우측 채널 신호의 제3 중간 세그먼트에 대응하는 가중 계수는 페이드-아웃 팩터이고, 상기 재구성된 좌측 및 우측 채널 신호의 제4 중간 세그먼트에 대응하는 가중 계수는 페이드-인 팩터인, 시간-도메인 스테레오 디코딩 장치.
  62. 제61항에 있어서,
    Figure pct01198
    ; 여기서
    Figure pct01199
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pct01200
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 상기 시작 세그먼트를 나타내고,
    Figure pct01201
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 상기 종료 세그먼트를 나타내고,
    Figure pct01202
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 상기 종료 세그먼트를 나타내고,
    Figure pct01203
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 상기 중간 세그먼트를 나타내고,
    Figure pct01204
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 상기 중간 세그먼트를 나타내고;
    Figure pct01205
    은 현재 프레임에서의 재구성된 좌측 채널 신호를 나타내고;

    Figure pct01206
    은 현재 프레임에서의 재구성된 우측 채널 신호를 나타내고;
    Figure pct01207
    이고;
    Figure pct01208
    는 페이드-인 팩터를 나타내고,
    Figure pct01209
    은 페이드-아웃 팩터를 나타내며,
    Figure pct01210
    Figure pct01211
    의 합은 1이며;
    n은 샘플링 포인트 번호를 나타내고,
    Figure pct01212
    이며;
    Figure pct01213
    이고; 그리고
    Figure pct01214
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 제3 중간 세그먼트를 나타내고,
    Figure pct01215
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 제3 중간 세그먼트를 나타내고; 그리고
    Figure pct01216
    은 상기 현재 프레임에서의 상기 재구성된 좌측 채널 신호의 제4 중간 세그먼트를 나타내고,
    Figure pct01217
    은 상기 현재 프레임에서의 상기 재구성된 우측 채널 신호의 제4 중간 세그먼트를 나타내는, 시간-도메인 스테레오 디코딩 장치.
  63. 제62항에 있어서,
    Figure pct01218
    Figure pct01219
    인, 시간-도메인 스테레오 디코딩 장치.
  64. 제62항 또는 제63항에 있어서,
    Figure pct01220
    ;
    Figure pct01221
    ;
    Figure pct01222
    ; 및
    Figure pct01223
    ; 여기서
    Figure pct01224
    은 상기 현재 프레임에서의 상기 디코딩된 일차 채널 신호를 나타내고,
    Figure pct01225
    은 상기 현재 프레임에서의 상기 디코딩된 이차 채널 신호를 나타내고; 그리고
    Figure pct01226
    는 상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
    Figure pct01227
    는 상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터에 기초하여 구성되고;
    Figure pct01228
    은 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 업믹스 매트릭스를 나타내고,
    Figure pct01229
    은 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터에 기초하여 구성되는, 시간-도메인 스테레오 디코딩 장치.
  65. 제64항에 있어서,
    Figure pct01230
    , 또는
    Figure pct01231
    , 또는
    Figure pct01232
    , 또는
    Figure pct01233
    , 또는
    Figure pct01234
    , 또는
    Figure pct01235
    , 여기서
    Figure pct01236
    Figure pct01237
    ; 그리고
    Figure pct01238
    은 상기 이전 프레임에 대한 상기 비 상관 신호 채널 조합 방식에 대응하는 상기 채널 조합 비율 팩터를 나타내는, 시간-도메인 스테레오 디코딩 장치.
  66. 제64항 또는 제65항에 있어서,
    Figure pct01239
    , 또는
    Figure pct01240
    , 여기서
    Figure pct01241
    는 상기 현재 프레임에 대한 상기 상관 신호 채널 조합 방식에 대응하는 채널 조합 비율 팩터를 나타내는, 시간-도메인 스테레오 디코딩 장치.
  67. 컴퓨터 판독 가능형 저장 매체로서,
    상기 컴퓨터 판독 가능 저장 매체는 프로그램 코드를 저장하고, 상기 프로그램 코드는 제1항 내지 제17항 중 어느 한 항에 따른 방법을 수행하는 데 사용되는 명령을 포함하는, 컴퓨터 판독 가능형 저장 매체.
  68. 컴퓨터 판독 가능형 저장 매체로서,
    상기 컴퓨터 판독 가능 저장 매체는 프로그램 코드를 저장하고, 상기 프로그램 코드는 제18항 내지 제33항 중 어느 한 항에 따른 방법을 수행하는 데 사용되는 명령을 포함하는, 컴퓨터 판독 가능형 저장 매체.
KR1020207006985A 2017-08-10 2018-08-10 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품 KR102380454B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020227010003A KR102492791B1 (ko) 2017-08-10 2018-08-10 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201710680152.4A CN109389985B (zh) 2017-08-10 2017-08-10 时域立体声编解码方法和相关产品
CN201710680152.4 2017-08-10
PCT/CN2018/100088 WO2019029736A1 (zh) 2017-08-10 2018-08-10 时域立体声编解码方法和相关产品

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020227010003A Division KR102492791B1 (ko) 2017-08-10 2018-08-10 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품

Publications (2)

Publication Number Publication Date
KR20200035306A true KR20200035306A (ko) 2020-04-02
KR102380454B1 KR102380454B1 (ko) 2022-03-29

Family

ID=65273291

Family Applications (4)

Application Number Title Priority Date Filing Date
KR1020247004919A KR20240024354A (ko) 2017-08-10 2018-08-10 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품
KR1020207006985A KR102380454B1 (ko) 2017-08-10 2018-08-10 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품
KR1020237002617A KR102637514B1 (ko) 2017-08-10 2018-08-10 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품
KR1020227010003A KR102492791B1 (ko) 2017-08-10 2018-08-10 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020247004919A KR20240024354A (ko) 2017-08-10 2018-08-10 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품

Family Applications After (2)

Application Number Title Priority Date Filing Date
KR1020237002617A KR102637514B1 (ko) 2017-08-10 2018-08-10 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품
KR1020227010003A KR102492791B1 (ko) 2017-08-10 2018-08-10 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품

Country Status (7)

Country Link
US (3) US11355131B2 (ko)
EP (1) EP3657499A4 (ko)
KR (4) KR20240024354A (ko)
CN (2) CN109389985B (ko)
AU (2) AU2018315436B2 (ko)
BR (1) BR112020002842A2 (ko)
WO (1) WO2019029736A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109389985B (zh) 2017-08-10 2021-09-14 华为技术有限公司 时域立体声编解码方法和相关产品
WO2021000724A1 (zh) * 2019-06-29 2021-01-07 华为技术有限公司 一种立体声编码方法、立体声解码方法和装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017049396A1 (en) * 2015-09-25 2017-03-30 Voiceage Corporation Method and system for time domain down mixing a stereo sound signal into primary and secondary channels using detecting an out-of-phase condition of the left and right channels

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3566931B2 (ja) * 2001-01-26 2004-09-15 日本電信電話株式会社 音声信号の符号列のパケット組立方法、装置及びパケット分解方法、装置並びにこれらの方法を実行するプログラム、プログラムを記録する記録媒体
JP4809370B2 (ja) * 2005-02-23 2011-11-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル音声符号化における適応ビット割り当て
KR101453732B1 (ko) 2007-04-16 2014-10-24 삼성전자주식회사 스테레오 신호 및 멀티 채널 신호 부호화 및 복호화 방법및 장치
CN100571043C (zh) * 2007-11-06 2009-12-16 武汉大学 一种空间参数立体声编解码方法及其装置
CN101552008B (zh) * 2008-04-01 2011-11-16 华为技术有限公司 语音编码方法及装置、语音解码方法及装置
EP2323130A1 (en) 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
CN102157152B (zh) * 2010-02-12 2014-04-30 华为技术有限公司 立体声编码的方法、装置
CN103026406B (zh) * 2010-09-28 2014-10-08 华为技术有限公司 用于对已解码多通道音频信号或已解码立体声信号进行后处理的装置和方法
FR2966634A1 (fr) 2010-10-22 2012-04-27 France Telecom Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase
JP5753540B2 (ja) * 2010-11-17 2015-07-22 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America ステレオ信号符号化装置、ステレオ信号復号装置、ステレオ信号符号化方法及びステレオ信号復号方法
EP2862166B1 (en) * 2012-06-14 2018-03-07 Dolby International AB Error concealment strategy in a decoding system
JP6321181B2 (ja) * 2013-09-12 2018-05-09 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ・コーデックのシステム側面
CN104347077B (zh) * 2014-10-23 2018-01-16 清华大学 一种立体声编解码方法
CN109389985B (zh) * 2017-08-10 2021-09-14 华为技术有限公司 时域立体声编解码方法和相关产品
CN109389984B (zh) * 2017-08-10 2021-09-14 华为技术有限公司 时域立体声编解码方法和相关产品

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017049396A1 (en) * 2015-09-25 2017-03-30 Voiceage Corporation Method and system for time domain down mixing a stereo sound signal into primary and secondary channels using detecting an out-of-phase condition of the left and right channels

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Bertrand Fatus. Parametric Coding for Spatial Audio. Master’s Thesis, KTH, Stockholm, Sweden. 2015.12. *
ISO/IEC FDIS 23003-3:2011(E), Information technology - MPEG audio technologies - Part 3: Unified speech and audio coding. ISO/IEC JTC 1/SC 29/WG 11. 2011.09.20. *
JungHoe Kim, et al. Enhanced stereo coding with phase parameters for MPEG unified speech and audio coding. Audio Engineering Society Convention 127. 2009.10.12. *
Recommendation ITU-T G.722. 7 kHz audio-coding within 64 kbit/s. 2012.09. *

Also Published As

Publication number Publication date
KR102380454B1 (ko) 2022-03-29
CN113782039A (zh) 2021-12-10
EP3657499A1 (en) 2020-05-27
AU2018315436B2 (en) 2023-05-04
KR20220045053A (ko) 2022-04-12
US20240153511A1 (en) 2024-05-09
KR102637514B1 (ko) 2024-02-15
US11355131B2 (en) 2022-06-07
AU2018315436A1 (en) 2020-03-05
WO2019029736A1 (zh) 2019-02-14
CN109389985A (zh) 2019-02-26
BR112020002842A2 (pt) 2020-07-28
KR102492791B1 (ko) 2023-01-26
US20200175999A1 (en) 2020-06-04
RU2020109682A3 (ko) 2021-11-15
US11900952B2 (en) 2024-02-13
EP3657499A4 (en) 2020-08-26
AU2023210620A1 (en) 2023-08-24
CN109389985B (zh) 2021-09-14
KR20240024354A (ko) 2024-02-23
RU2020109682A (ru) 2021-09-10
KR20230017367A (ko) 2023-02-03
US20220310101A1 (en) 2022-09-29

Similar Documents

Publication Publication Date Title
KR102492119B1 (ko) 오디오 코딩/디코딩 모드를 결정하는 방법 및 관련 제품
KR102493482B1 (ko) 시간-도메인 스테레오 코딩 및 디코딩 방법, 및 관련 제품
KR102380454B1 (ko) 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품
JP2023129450A (ja) 時間領域ステレオパラメータ符号化方法および関連製品
RU2772405C2 (ru) Способ стереокодирования и декодирования во временной области и соответствующий продукт
RU2773022C2 (ru) Способ кодирования и декодирования стерео во временной области и сопутствующий продукт
RU2773421C9 (ru) Способ и соответствующий продукт для определения режима кодирования/декодирования аудио
RU2773421C2 (ru) Способ и соответствующий продукт для определения режима кодирования/декодирования аудио
RU2773636C2 (ru) Способ кодирования стереопараметров временной области и соответствующий продукт

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant