KR20210095220A - 스테레오 신호를 처리하기 위한 방법 및 디바이스 - Google Patents

스테레오 신호를 처리하기 위한 방법 및 디바이스 Download PDF

Info

Publication number
KR20210095220A
KR20210095220A KR1020217022936A KR20217022936A KR20210095220A KR 20210095220 A KR20210095220 A KR 20210095220A KR 1020217022936 A KR1020217022936 A KR 1020217022936A KR 20217022936 A KR20217022936 A KR 20217022936A KR 20210095220 A KR20210095220 A KR 20210095220A
Authority
KR
South Korea
Prior art keywords
signal
channel
current frame
length
point
Prior art date
Application number
KR1020217022936A
Other languages
English (en)
Other versions
KR102391266B1 (ko
Inventor
이얄 쉴로모트
하이팅 리
레이 먀오
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Priority to KR1020227013611A priority Critical patent/KR102524957B1/ko
Publication of KR20210095220A publication Critical patent/KR20210095220A/ko
Application granted granted Critical
Publication of KR102391266B1 publication Critical patent/KR102391266B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Stereo-Broadcasting Methods (AREA)

Abstract

스테레오 신호 처리 방법 및 장치가 제공되며, 이러한 방법은, 현재 프레임의 스테레오 신호에 대해 지연 추정을 수행하여 현재 프레임의 채널간 시간 차이를 결정하는 단계- 현재 프레임의 채널간 시간 차이는 현재 프레임의 제1 채널 신호와 현재 프레임의 제2 채널 신호 사이의 시간 차이임 -; 및 현재 프레임의 채널간 시간 차이의 부호가 현재 프레임의 이전 프레임의 채널간 시간 차이의 부호와 상이하면, 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 정렬 처리를 수행하고, 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 정렬 처리를 수행하는 단계- 제1 채널 신호는 현재 프레임의 타겟 채널 신호이고, 제2 채널 신호는 이전 프레임의 타겟 채널 신호와 동일한 채널 상에 있음 -를 포함한다.

Description

스테레오 신호를 처리하기 위한 방법 및 디바이스{METHOD AND DEVICE FOR PROCESSING STEREO SIGNAL}
본 출원은 2017년 5월 16일자로 중국 특허청에 출원되고 발명의 명칭이 "STEREO SIGNAL PROCESSING METHOD AND APPARATUS"인 중국 특허 출원 제201710344704.4호에 대한 우선권을 청구하며, 이는 그 전체가 본 명세서에 참조로 원용된다.
<기술 분야>
본 출원은 정보 기술들의 분야에, 특히, 스테레오 신호 처리 방법 및 장치에 관련된다.
삶의 품질이 개선됨에 따라, 사람들은 고-품질 오디오에 대한 요구들을 증가시키고 있다. 모노 오디오와 비교하여, 스테레오 오디오는 각각의 사운드 소스에 대한 분포의 감각 및 방향의 감각을 제공하고, 정보의 개선된 명확성, 명료성, 및 현장 느낌을 제공한다. 따라서, 스테레오 오디오는 매우 인기가 있다. 기존의 시간-도메인 스테레오 인코딩 기술에서는, 일반적으로 좌측 채널 신호 및 우측 채널 신호가 시간 도메인에서 중간 채널(Mid channel) 신호 및 사이드 채널(Side channel) 신호로 다운믹싱된다. 다운믹싱된 중간 채널 신호는 0.5×(L+R)로서 표기될 수 있고, 이는 좌측 채널 신호와 우측 채널 신호 사이의 관련 정보를 표현한다. 다운믹싱된 사이드 채널 신호는 0.5×(L-R)로서 표기될 수 있고, 이는 좌측 채널 신호와 우측 채널 신호 사이의 차이 정보를 표현한다. L은 좌측 채널 신호를 표시하고, R은 우측 채널 신호를 표시한다. 다음으로, 중간 채널 신호 및 사이드 채널 신호는 모노 채널 인코딩 방법을 사용하여 개별적으로 인코딩된다. 중간 채널 신호는 비교적 많은 수량의 비트들을 사용하여 일반적으로 인코딩되고, 사이드 채널 신호는 비교적 적은 수량의 비트들을 사용하여 일반적으로 인코딩된다.
인코딩 효율을 개선하기 위해, 중간 채널 신호는 더 클 필요가 있고, 사이드 채널 신호는 더 작을 필요가 있다. 현재, 시간-도메인 스테레오 인코딩에서는, 중간 채널 신호 및 사이드 채널 신호가 획득되기 이전에, 채널간 시간 차이를 획득하기 위해 좌측 채널 신호 및 우측 채널 신호에 대해 지연 추정을 수행하는데 매칭 알고리즘이 사용되고, 채널간 시간 차이에 기초하여 좌측 채널 신호 및 우측 채널 신호에 대해 지연 정렬 처리가 수행되어, 다운믹싱된 중간 채널 신호가 더 크고, 다운믹싱된 사이드 채널 신호가 더 작다. 채널간 시간 차이에 기초하여 지연 정렬을 수행하기 위한 알고리즘에서는, 일반적으로, 좌측 채널 및 우측 채널로부터 하나의 채널이 선택되고, 이러한 채널의 신호에 대해 지연 정렬 처리가 수행된다. 이러한 채널은 타겟 채널이라고 지칭된다. 다른 채널의 신호에 대해 지연 조절이 수행되지 않고, 이러한 다른 채널은 타겟 채널에 대한 지연 조절을 위한 참조로서 사용된다. 이러한 채널은 참조 채널이라고 지칭된다.
기존의 방법에서는, 현재 프레임의 것인 그리고 지연 추정을 통해 획득되는 채널간 시간 차이의 부호가 이전 프레임의 채널간 시간 차이의 부호와 상이하다는 점이 발견되면, 현재 프레임의 타겟 채널의 선택은 이전 프레임의 타겟 채널의 것과 동일하게 유지된다. 또한, 현재 프레임의 채널간 시간 차이의 추정된 값에 상관없이, 현재 프레임의 채널간 시간 차이는 강제로 제로로 설정된다. 다음으로, 제로로 설정되는 채널간 시간 차이에 기초하여 현재 프레임의 타겟 채널에 대해 지연 정렬 처리가 수행되어, 지연 정렬 처리 이후의 현재 프레임의 타겟 채널과 참조 채널 사이의 지연이 제로라는 점을 보장한다.
전술한 방법에서는, 스테레오 신호들의 2개의 프레임들의 채널간 시간 차이들의 부호들이 변경될 때, 이것은 좌측 및 우측 채널 신호들의 도착 시퀀스가 변경된다는 점을 표시하고, 원래 먼저 도착하는 좌측 채널 신호 대신에 우측 채널 신호가 먼저 도착할 수 있거나, 또는 원래 먼저 도착하는 우측 채널 신호 대신에 좌측 채널 신호가 먼저 도착할 수 있다. 현재 프레임의 채널간 시간 차이가 강제로 제로로 설정되면, 좌측과 우측 채널들 사이의 실제 시간 차이보다는 오히려 제로의 시간 차이에 기초하여 좌측 및 우측 채널들이 조절되고, 이러한 방식으로 획득되는 그리고 지연 조절 이후에 획득되는 좌측 및 우측 채널 신호들에 대해 시간-도메인 다운믹싱 처리가 수행된다. 그러나, 실제로, 이러한 2개의 채널 신호들에 대해 실제 지연 정렬이 구현되지 않는다. 따라서, 2개의 채널들 사이의 상관 성분을 오프셋시키기에 효과적인 방식이 존재하지 않고, 결과적으로, 시간-도메인 다운믹싱이 증가한 이후에 현재 프레임의 사이드 채널 신호의 에너지가 증가하여, 전체 스테레오 인코딩 품질을 감소시킨다.
본 출원은 스테레오 신호 처리 방법 및 장치를 제공하여, 스테레오 신호들의 2개의 프레임들 사이의 채널간 시간 차이의 부호가 변경될 때 채널간 지연들이 정렬되지 않기 때문에 야기되는 스테레오 인코딩의 낮은 인코딩 품질의 문제점을 해결한다.
본 출원의 실시예는, 스테레오 코덱의 인코더 사이드에 적용되는 스테레오 신호 처리 방법을 제공하고, 이러한 방법은,
현재 프레임의 스테레오 신호에 대해 지연 추정을 수행하여 현재 프레임의 채널간 시간 차이를 결정하는 단계- 현재 프레임의 채널간 시간 차이는 현재 프레임의 제1 채널 신호와 현재 프레임의 제2 채널 신호 사이의 시간 차이임 -; 및
현재 프레임의 채널간 시간 차이의 부호가 현재 프레임의 이전 프레임의 채널간 시간 차이의 부호와 상이하면, 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 정렬 처리를 수행하고, 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 정렬 처리를 수행하는 단계- 제1 채널 신호는 현재 프레임의 타겟 채널 신호이고, 제2 채널 신호는 이전 프레임의 타겟 채널 신호와 동일한 채널 상에 있음 -를 포함한다.
본 출원에서 제공되는 방법에 따르면, 현재 프레임의 채널간 시간 차이의 부호가 현재 프레임의 이전 프레임의 채널간 시간 차이의 부호와 상이하다고 결정될 때, 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 정렬 처리가 수행되고, 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 정렬 처리가 수행된다. 따라서, 실제 채널간 시간 차이에 기초하여 현재 프레임의 지연 정렬 처리가 수행될 수 있고, 그렇게 함으로써 더 나은 정렬 효과를 보장하고, 현재 프레임의 채널간 시간 차이가 제로로 강제로 설정되기 때문에, 지연 정렬 처리 이후 현재 프레임의 2개의 채널들 사이의 상관 성분이 오프셋될 수 없고, 결과적으로, 시간-도메인 다운믹싱 이후 현재 프레임의 부 채널 신호의 에너지가 증가하여, 전체 인코딩 품질에 영향을 미친다는 종래-기술 문제점을 회피한다.
선택적으로, 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 정렬 처리를 수행하는 단계는,
현재 프레임의 제1 채널 신호에서의 제1 처리 길이의 신호를 제1 정렬 처리 길이의 신호로 압축하여, 지연 정렬 처리 이후의 현재 프레임의 제1 채널 신호를 획득하는 단계를 포함하고,
제1 처리 길이는 현재 프레임의 채널간 시간 차이 및 제1 정렬 처리 길이에 기초하여 결정되고, 제1 처리 길이는 제1 정렬 처리 길이보다 크다.
선택적으로, 제1 처리 길이는 현재 프레임의 채널간 시간 차이의 절대 값 및 제1 정렬 처리 길이의 합이다.
선택적으로, 제1 처리 길이의 신호의 시작 포인트는 제1 정렬 처리 길이의 신호의 시작 포인트 이전에 위치되고, 제1 처리 길이의 신호의 시작 포인트와 제1 정렬 처리 길이의 신호의 시작 포인트 사이의 길이는 현재 프레임의 채널간 시간 차이의 절대 값이다.
선택적으로, 제1 정렬 처리 길이의 신호의 시작 포인트는 현재 프레임의 제1 채널 신호의 시작 포인트에 또는 현재 프레임의 제1 채널 신호의 시작 포인트 이후에 위치되고, 제1 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제1 채널 신호의 종료 포인트 사이의 길이는 제1 정렬 처리 길이 이상이다.
선택적으로, 제1 정렬 처리 길이의 신호의 시작 포인트는 현재 프레임의 제1 채널 신호의 시작 포인트 이전에 위치되고, 제1 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제1 채널 신호의 시작 포인트 사이의 길이는 전이 섹션 길이 이하이고, 제1 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제1 채널 신호의 종료 포인트 사이의 길이는 제1 정렬 처리 길이 및 전이 섹션 길이의 합 이상이고, 전이 섹션 길이는 현재 프레임의 채널간 시간 차이의 절대 값 이하이다.
선택적으로, 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 정렬 처리를 수행하는 단계는,
현재 프레임의 제2 채널 신호에서의 제2 처리 길이의 신호를 제2 정렬 처리 길이의 신호로 신장시켜, 지연 정렬 처리 이후의 현재 프레임의 제2 채널 신호를 획득하는 단계를 포함하고,
제2 처리 길이는 이전 프레임의 채널간 시간 차이 및 제2 정렬 처리 길이에 기초하여 결정되고, 제2 처리 길이는 제2 정렬 처리 길이 미만이다.
선택적으로, 제2 처리 길이는 제2 정렬 처리 길이와 이전 프레임의 채널간 시간 차이의 절대 값 사이의 차이이다.
선택적으로, 제2 처리 길이의 신호의 시작 포인트는 제2 정렬 처리 길이의 신호의 시작 포인트 이후에 위치되고, 제2 처리 길이의 신호의 시작 포인트와 제2 정렬 처리 길이의 신호의 시작 포인트 사이의 길이는 이전 프레임의 채널간 시간 차이의 절대 값이다.
선택적으로, 제2 정렬 처리 길이의 신호의 시작 포인트는 현재 프레임의 제2 채널 신호의 시작 포인트에 또는 현재 프레임의 제2 채널 신호의 시작 포인트 이후에 위치되고, 제2 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제2 채널 신호의 종료 포인트 사이의 길이는 제2 정렬 처리 길이 이상이다.
선택적으로, 제2 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제2 채널 신호의 시작 포인트 사이의 길이는 제2 미리 설정된 길이와 동일하고; 제1 정렬 처리 길이의 신호의 시작 포인트 및 현재 프레임의 제1 채널 신호의 시작 포인트 사이의 길이는 제2 미리 설정된 길이 및 제2 정렬 처리 길이의 합과 동일하다.
선택적으로, 제1 정렬 처리 길이는 현재 프레임의 프레임 길이 이하이고, 제1 정렬 처리 길이는 미리 설정된 길이이거나, 또는 제1 정렬 처리 길이는 다음의 수학식을 충족하고:
Figure pat00001
L_next_target는 제1 정렬 처리 길이이고, cur_itd는 현재 프레임의 채널간 시간 차이이고, prev_itd는 이전 프레임의 채널간 시간 차이이고, L은 지연 정렬 처리의 처리 길이이다.
선택적으로, 제2 정렬 처리 길이는 현재 프레임의 프레임 길이 이하이고, 제2 정렬 처리 길이는 미리 설정된 길이이거나, 또는 제2 정렬 처리 길이는 다음의 수학식을 충족하고:
Figure pat00002
L_pre_target는 제2 정렬 처리 길이이고, cur_itd는 현재 프레임의 채널간 시간 차이이고, prev_itd는 이전 프레임의 채널간 시간 차이이고, L은 지연 정렬 처리의 처리 길이이다.
선택적으로, 지연 정렬 처리의 처리 길이는 현재 프레임의 프레임 길이 이하이고, 지연 정렬 처리의 처리 길이는 미리 설정된 길이이거나, 또는 지연 정렬 처리의 처리 길이는 다음의 수학식을 충족하고:
Figure pat00003
L은 지연 정렬 처리의 처리 길이이고,
Figure pat00004
는 인접 프레임들의 채널간 시간 차이들 사이의 최대 차이 값이고,
Figure pat00005
는 지연 정렬 처리의 미리 설정된 처리 길이이다.
본 출원의 실시예는 전술한 방법에서 제공되는 임의의 스테레오 신호 처리 방법을 수행하고 구현할 수 있는 스테레오 신호 처리 장치를 제공한다.
가능한 설계에서, 이러한 스테레오 신호 처리 장치는 복수의 기능 모듈들을 포함한다, 예를 들어, 전술한 바에서 제공되는 임의의 스테레오 신호 처리 방법을 구현하도록 구성되는, 처리 유닛 및 송수신기 유닛을 포함한다. 따라서, 현재 프레임의 채널간 시간 차이의 부호가 현재 프레임의 이전 프레임의 채널간 시간 차이의 부호와 상이하다고 결정될 때, 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 정렬 처리가 수행되고, 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 정렬 처리가 수행된다. 따라서, 실제 채널간 시간 차이에 기초하여 현재 프레임의 지연 정렬 처리가 수행될 수 있고, 그렇게 함으로써 더 나은 정렬 효과를 보장하고, 현재 프레임의 채널간 시간 차이가 제로로 강제로 설정되기 때문에, 지연 정렬 처리 이후 현재 프레임의 2개의 채널들 사이의 상관 성분이 오프셋될 수 없고, 결과적으로, 시간-도메인 다운믹싱 이후 현재 프레임의 부 채널 신호의 에너지가 증가하여, 전체 인코딩 품질에 영향을 미친다는 종래-기술 문제점을 회피한다.
본 출원의 실시예는 스테레오 신호 처리 장치를 제공하고, 이러한 장치는 프로세서 및 메모리를 포함하고, 메모리는 실행가능 명령어를 저장하고, 실행가능 명령어는 프로세서에게 다음의 단계들:
현재 프레임의 스테레오 신호에 대해 지연 추정을 수행하여 현재 프레임의 채널간 시간 차이를 결정하는 단계- 현재 프레임의 채널간 시간 차이는 현재 프레임의 제1 채널 신호와 현재 프레임의 제2 채널 신호 사이의 시간 차이임 -; 및
현재 프레임의 채널간 시간 차이의 부호가 현재 프레임의 이전 프레임의 채널간 시간 차이의 부호와 상이하면, 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 정렬 처리를 수행하고, 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 정렬 처리를 수행하는 단계- 제1 채널 신호는 현재 프레임의 타겟 채널 신호이고, 제2 채널 신호는 이전 프레임의 타겟 채널 신호와 동일한 채널 상에 있음 -를 수행하라고 명령하는데 사용된다.
선택적으로, 이러한 실행가능 명령어는 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 정렬 처리를 수행할 때 프로세서에게 다음의 단계들:
현재 프레임의 제1 채널 신호에서의 제1 처리 길이의 신호를 제1 정렬 처리 길이의 신호로 압축하여, 지연 정렬 처리 이후의 현재 프레임의 제1 채널 신호를 획득하는 단계를 수행하라고 명령하는데 사용되고,
제1 처리 길이는 현재 프레임의 채널간 시간 차이 및 제1 정렬 처리 길이에 기초하여 결정되고, 제1 처리 길이는 제1 정렬 처리 길이보다 크다.
선택적으로, 제1 처리 길이는 현재 프레임의 채널간 시간 차이의 절대 값 및 제1 정렬 처리 길이의 합이다.
선택적으로, 제1 처리 길이의 신호의 시작 포인트는 제1 정렬 처리 길이의 신호의 시작 포인트 이전에 위치되고, 제1 처리 길이의 신호의 시작 포인트와 제1 정렬 처리 길이의 신호의 시작 포인트 사이의 길이는 현재 프레임의 채널간 시간 차이의 절대 값이다.
선택적으로, 제1 정렬 처리 길이의 신호의 시작 포인트는 현재 프레임의 제1 채널 신호의 시작 포인트에 또는 현재 프레임의 제1 채널 신호의 시작 포인트 이후에 위치되고, 제1 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제1 채널 신호의 종료 포인트 사이의 길이는 제1 정렬 처리 길이 이상이다.
선택적으로, 제1 정렬 처리 길이의 신호의 시작 포인트는 현재 프레임의 제1 채널 신호의 시작 포인트 이전에 위치되고, 제1 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제1 채널 신호의 시작 포인트 사이의 길이는 전이 섹션 길이 이하이고, 제1 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제1 채널 신호의 종료 포인트 사이의 길이는 제1 정렬 처리 길이 및 전이 섹션 길이의 합 이상이고, 전이 섹션 길이는 현재 프레임의 채널간 시간 차이의 절대 값 이하이다.
선택적으로, 실행가능 명령어는 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 정렬 처리를 수행할 때 프로세서에게 다음의 단계들:
현재 프레임의 제2 채널 신호에서의 제2 처리 길이의 신호를 제2 정렬 처리 길이의 신호로 신장시켜, 지연 정렬 처리 이후의 현재 프레임의 제2 채널 신호를 획득하는 단계를 수행하라고 명령하는데 사용되고,
제2 처리 길이는 이전 프레임의 채널간 시간 차이 및 제2 정렬 처리 길이에 기초하여 결정되고, 제2 처리 길이는 제2 정렬 처리 길이 미만이다.
선택적으로, 제2 처리 길이는 제2 정렬 처리 길이와 이전 프레임의 채널간 시간 차이의 절대 값 사이의 차이이다.
선택적으로, 제2 처리 길이의 신호의 시작 포인트는 제2 정렬 처리 길이의 신호의 시작 포인트 이후에 위치되고, 제2 처리 길이의 신호의 시작 포인트와 제2 정렬 처리 길이의 신호의 시작 포인트 사이의 길이는 이전 프레임의 채널간 시간 차이의 절대 값이다. 선택적으로, 제2 정렬 처리 길이의 신호의 시작 포인트는 현재 프레임의 제2 채널 신호의 시작 포인트에 또는 현재 프레임의 제2 채널 신호의 시작 포인트 이후에 위치되고, 제2 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제2 채널 신호의 종료 포인트 사이의 길이는 제2 정렬 처리 길이 이상이다.
선택적으로, 제2 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제2 채널 신호의 시작 포인트 사이의 길이는 제2 미리 설정된 길이와 동일하고; 제1 정렬 처리 길이의 신호의 시작 포인트 및 현재 프레임의 제1 채널 신호의 시작 포인트 사이의 길이는 제2 미리 설정된 길이 및 제2 정렬 처리 길이의 합과 동일하다.
선택적으로, 제1 정렬 처리 길이는 현재 프레임의 프레임 길이 이하이고, 제1 정렬 처리 길이는 미리 설정된 길이이거나, 또는 제1 정렬 처리 길이는 다음의 수학식을 충족하고:
Figure pat00006
L_next_target는 제1 정렬 처리 길이이고, cur_itd는 현재 프레임의 채널간 시간 차이이고, prev_itd는 이전 프레임의 채널간 시간 차이이고, L은 지연 정렬 처리의 처리 길이이다.
선택적으로, 제2 정렬 처리 길이는 현재 프레임의 프레임 길이 이하이고, 제2 정렬 처리 길이는 미리 설정된 길이이거나, 또는 제2 정렬 처리 길이는 다음의 수학식을 충족하고:
Figure pat00007
L_pre_target는 제2 정렬 처리 길이이고, cur_itd는 현재 프레임의 채널간 시간 차이이고, prev_itd는 이전 프레임의 채널간 시간 차이이고, L은 지연 정렬 처리의 처리 길이이다.
선택적으로, 지연 정렬 처리의 처리 길이는 현재 프레임의 프레임 길이 이하이고, 지연 정렬 처리의 처리 길이는 미리 설정된 길이이거나, 또는 지연 정렬 처리의 처리 길이는 다음의 수학식을 충족하고:
Figure pat00008
L은 지연 정렬 처리의 처리 길이이고,
Figure pat00009
는 인접 프레임들의 채널간 시간 차이들 사이의 최대 차이 값이고,
Figure pat00010
는 지연 정렬 처리의 미리 설정된 처리 길이이다.
본 출원의 실시예는, 스테레오 코덱의 디코더 사이드에 적용되는, 스테레오 신호 처리 방법을 제공하고, 이러한 방법은,
수신된 코드 스트림에 기초하여 현재 프레임의 채널간 시간 차이를 결정하는 단계- 현재 프레임의 채널간 시간 차이는 현재 프레임의 제1 채널 신호와 현재 프레임의 제2 채널 신호 사이의 시간 차이임 -; 및
현재 프레임의 채널간 시간 차이의 부호가 현재 프레임의 이전 프레임의 채널간 시간 차이의 부호와 상이하면, 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 복구 처리를 수행하고, 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 복구 처리를 수행하는 단계- 제1 채널 신호는 현재 프레임의 타겟 채널 신호이고, 제2 채널 신호는 이전 프레임의 타겟 채널 신호와 동일한 채널 상에 있음 -를 포함한다.
본 출원에서 제공되는 방법에 따르면, 현재 프레임의 채널간 시간 차이의 부호가 현재 프레임의 이전 프레임의 채널간 시간 차이의 부호와 상이하다고 결정될 때, 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 복구 처리가 수행되고, 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 복구 처리가 수행된다. 따라서, 실제 채널간 시간 차이에 기초하여 현재 프레임의 지연 복구 처리가 수행될 수 있고, 그렇게 함으로써 더 나은 정렬 효과를 보장하고, 현재 프레임의 채널간 시간 차이가 제로로 강제로 설정되기 때문에, 지연 복구 처리 이후 현재 프레임의 2개의 채널들 사이의 상관 성분이 오프셋될 수 없고, 결과적으로, 시간-도메인 다운믹싱 이후 현재 프레임의 부 채널 신호의 에너지가 증가하여, 전체 디코딩된 신호 품질에 영향을 미친다는 종래-기술 문제점을 회피한다.
선택적으로, 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 복구 처리를 수행하는 단계는,
현재 프레임의 제1 채널 신호에서의 제3 처리 길이의 신호를 제3 정렬 처리 길이의 신호로 신장시켜, 지연 복구 처리 이후의 현재 프레임의 제1 채널 신호를 획득하는 단계를 포함하고,
제3 처리 길이는 현재 프레임의 채널간 시간 차이 및 제3 정렬 처리 길이에 기초하여 결정되고, 제3 처리 길이는 제3 정렬 처리 길이 미만이다.
선택적으로, 제3 처리 길이는 제3 정렬 처리 길이와 현재 프레임의 채널간 시간 차이의 절대 값 사이의 차이이다.
선택적으로, 제3 처리 길이의 신호의 시작 포인트는 제3 정렬 처리 길이의 신호의 시작 포인트 이후에 위치되고, 제3 처리 길이의 신호의 시작 포인트와 제3 정렬 처리 길이의 신호의 시작 포인트 사이의 길이는 현재 프레임의 채널간 시간 차이의 절대 값이다.
선택적으로, 제3 처리 길이의 신호의 시작 포인트는 현재 프레임의 제1 채널 신호의 시작 포인트에 또는 현재 프레임의 제1 채널 신호의 시작 포인트 이후에 위치되고, 제3 처리 길이의 신호의 시작 포인트와 현재 프레임의 제1 채널 신호의 종료 포인트 사이의 길이는 제3 정렬 처리 길이와 현재 프레임의 채널간 시간 차이의 절대 값 사이의 차이 이상이다.
선택적으로, 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 복구 처리를 수행하는 단계는,
현재 프레임의 제2 채널 신호에서의 제4 처리 길이의 신호를 제4 정렬 처리 길이의 신호로 압축하여, 지연 복구 처리 이후의 현재 프레임의 제2 채널 신호를 획득하는 단계를 포함하고,
제4 처리 길이는 이전 프레임의 채널간 시간 차이 및 제4 정렬 처리 길이에 기초하여 결정되고, 제4 처리 길이는 제4 정렬 처리 길이보다 크다.
선택적으로, 제4 처리 길이는 이전 프레임의 채널간 시간 차이의 절대 값 및 제4 정렬 처리 길이의 합이다.
선택적으로, 제4 처리 길이의 신호의 시작 포인트는 제4 정렬 처리 길이의 신호의 시작 포인트 이전에 위치되고, 제4 처리 길이의 신호의 시작 포인트와 제4 정렬 처리 길이의 신호의 시작 포인트 사이의 길이는 이전 프레임의 채널간 시간 차이의 절대 값이다.
선택적으로, 제4 정렬 처리 길이의 신호의 시작 포인트는 현재 프레임의 제2 채널 신호의 시작 포인트에 또는 현재 프레임의 제2 채널 신호의 시작 포인트 이후에 위치되고, 제4 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제2 채널 신호의 종료 포인트 사이의 길이는 제4 정렬 처리 길이 이상이다.
선택적으로, 제4 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제2 채널 신호의 시작 포인트 사이의 길이는 제4 미리 설정된 길이와 동일하고; 제3 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제1 채널 신호의 시작 포인트 사이의 길이는 제4 미리 설정된 길이 및 제4 정렬 처리 길이의 합과 동일하다.
선택적으로, 제3 정렬 처리 길이는 미리 설정된 길이이거나, 또는 제3 정렬 처리 길이는 다음의 수학식을 충족하고:
Figure pat00011
L2_next_target는 제3 정렬 처리 길이이고, cur_itd는 현재 프레임의 채널간 시간 차이이고, prev_itd는 이전 프레임의 채널간 시간 차이이고, L은 지연 정렬 처리의 처리 길이이다.
선택적으로, 제4 정렬 처리 길이는 미리 설정된 길이이거나, 또는 제4 정렬 처리 길이는 다음의 수학식을 충족하고:
Figure pat00012
L2_pre_target는 제4 정렬 처리 길이이고, cur_itd는 현재 프레임의 채널간 시간 차이이고, prev_itd는 이전 프레임의 채널간 시간 차이이고, L은 지연 정렬 처리의 처리 길이이다.
선택적으로, 지연 정렬 처리의 처리 길이는 미리 설정된 길이이거나, 또는 지연 정렬 처리의 처리 길이는 다음의 수학식을 충족하고:
Figure pat00013
L은 지연 정렬 처리의 처리 길이이고,
Figure pat00014
는 인접 프레임들의 채널간 시간 차이들 사이의 최대 차이 값이고,
Figure pat00015
는 지연 정렬 처리의 미리 설정된 처리 길이이다.
본 출원의 실시예는 전술한 방법에서 제공되는 임의의 스테레오 신호 처리 방법을 수행하고 구현할 수 있는 스테레오 신호 처리 장치를 제공한다.
가능한 설계에서, 이러한 스테레오 신호 처리 장치는 복수의 기능 모듈들을 포함한다, 예를 들어, 전술한 바에서 제공되는 임의의 스테레오 신호 처리 방법을 구현하도록 구성되는, 처리 유닛 및 송수신기 유닛을 포함한다. 따라서, 현재 프레임의 채널간 시간 차이의 부호가 현재 프레임의 이전 프레임의 채널간 시간 차이의 부호와 상이하다고 결정될 때, 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 복구 처리가 수행되고, 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 복구 처리가 수행된다. 따라서, 실제 채널간 시간 차이에 기초하여 현재 프레임의 지연 복구 처리가 수행될 수 있고, 그렇게 함으로써 더 나은 정렬 효과를 보장하고, 현재 프레임의 채널간 시간 차이가 제로로 강제로 설정되기 때문에, 지연 복구 처리 이후 현재 프레임의 2개의 채널들 사이의 상관 성분이 오프셋될 수 없고, 결과적으로, 시간-도메인 다운믹싱 이후 현재 프레임의 부 채널 신호의 에너지가 증가하여, 전체 디코딩된 신호 품질에 영향을 미친다는 종래-기술 문제점을 회피한다.
본 출원의 실시예는 스테레오 신호 처리 장치를 제공하고, 이러한 장치는 프로세서 및 메모리를 포함하고, 메모리는 실행가능 명령어를 저장하고, 실행가능 명령어는 프로세서에게 다음의 단계들:
수신된 코드 스트림에 기초하여 현재 프레임의 채널간 시간 차이를 결정하는 단계- 현재 프레임의 채널간 시간 차이는 현재 프레임의 제1 채널 신호와 현재 프레임의 제2 채널 신호 사이의 시간 차이임 -; 및
현재 프레임의 채널간 시간 차이의 부호가 현재 프레임의 이전 프레임의 채널간 시간 차이의 부호와 상이하면, 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 복구 처리를 수행하고, 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 복구 처리를 수행하는 단계- 제1 채널 신호는 현재 프레임의 타겟 채널 신호이고, 제2 채널 신호는 이전 프레임의 타겟 채널 신호와 동일한 채널 상에 있음 -을 수행하라고 명령하는데 사용된다.
선택적으로, 실행가능 명령어는 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 복구 처리를 수행할 때 프로세서에게 다음의 단계들:
현재 프레임의 제1 채널 신호에서의 제3 처리 길이의 신호를 제3 정렬 처리 길이의 신호로 신장시켜, 지연 복구 처리 이후의 현재 프레임의 제1 채널 신호를 획득하는 단계를 수행하라고 명령하는데 사용되고,
제3 처리 길이는 현재 프레임의 채널간 시간 차이 및 제3 정렬 처리 길이에 기초하여 결정되고, 제3 처리 길이는 제3 정렬 처리 길이 미만이다.
선택적으로, 제3 처리 길이는 제3 정렬 처리 길이와 현재 프레임의 채널간 시간 차이의 절대 값 사이의 차이이다.
선택적으로, 제3 처리 길이의 신호의 시작 포인트는 제3 정렬 처리 길이의 신호의 시작 포인트 이후에 위치되고, 제3 처리 길이의 신호의 시작 포인트와 제3 정렬 처리 길이의 신호의 시작 포인트 사이의 길이는 현재 프레임의 채널간 시간 차이의 절대 값이다.
선택적으로, 제3 처리 길이의 신호의 시작 포인트는 현재 프레임의 제1 채널 신호의 시작 포인트에 또는 현재 프레임의 제1 채널 신호의 시작 포인트 이후에 위치되고, 제3 처리 길이의 신호의 시작 포인트와 현재 프레임의 제1 채널 신호의 종료 포인트 사이의 길이는 제3 정렬 처리 길이와 현재 프레임의 채널간 시간 차이의 절대 값 사이의 차이 이상이다.
선택적으로, 실행가능 명령어는 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 복구 처리를 수행할 때 프로세서에게 다음의 단계들:
현재 프레임의 제2 채널 신호에서의 제4 처리 길이의 신호를 제4 정렬 처리 길이의 신호로 압축하여, 지연 복구 처리 이후의 현재 프레임의 제2 채널 신호를 획득하는 단계를 수행하라고 명령하는데 사용되고,
제4 처리 길이는 이전 프레임의 채널간 시간 차이 및 제4 정렬 처리 길이에 기초하여 결정되고, 제4 처리 길이는 제4 정렬 처리 길이보다 크다.
선택적으로, 제4 처리 길이는 이전 프레임의 채널간 시간 차이의 절대 값 및 제4 정렬 처리 길이의 합이다.
본 출원의 실시예는 컴퓨터 저장 매체를 추가로 제공하고, 이러한 저장 매체는 소프트웨어 프로그램을 저장하고, 이러한 소프트웨어 프로그램이 하나 이상의 프로세서에 의해 판독 및 실행될 때, 전술한 설계들 중 임의의 하나에서 제공되는 스테레오 신호 처리 방법이 구현될 수 있다.
본 출원의 실시예는 시스템을 추가로 제공한다. 이러한 시스템은 전술한 설계들 중 임의의 하나에서 제공되는 스테레오 신호 처리 장치를 포함한다. 선택적으로, 이러한 시스템은 본 출원의 실시예들에서 제공되는 해결책에서의 스테레오 신호 처리 장치와 상호작용하는 다른 디바이스를 추가로 포함할 수 있다.
본 출원의 실시예는 명령어를 포함하는 컴퓨터 프로그램 제품을 추가로 제공한다. 이러한 컴퓨터 프로그램 제품이 컴퓨터 상에서 실행될 때, 이러한 컴퓨터는 전술한 양태들에서의 방법들을 수행한다.
도 1은 본 출원의 실시예에 따른 스테레오 신호 처리 방법의 개략 흐름도이다.
도 2는 본 출원의 실시예에 따른 스테레오 신호 처리 방법의 개략도이다.
도 3은 본 출원의 실시예에 따른 스테레오 신호 처리 방법의 개략도이다.
도 4는 본 출원의 실시예에 따른 스테레오 신호 처리 방법의 개략도이다.
도 5는 본 출원의 실시예에 따른 스테레오 신호 처리 방법의 개략도이다.
도 6은 본 출원의 실시예에 따른 스테레오 신호 처리 방법의 개략도이다.
도 7a는 본 출원의 실시예에 따른 스테레오 신호 처리 방법의 개략도이다.
도 7b는 본 출원의 실시예에 따른 스테레오 신호 처리 방법의 개략도이다.
도 8은 본 출원의 실시예에 따른 스테레오 신호 처리 방법의 개략도이다.
도 9는 본 출원의 실시예에 따른 스테레오 신호 처리 방법의 개략도이다.
도 10은 본 출원의 실시예에 따른 스테레오 신호 처리 방법의 개략도이다.
도 11은 본 출원의 실시예에 따른 스테레오 신호 처리 방법의 개략도이다.
도 12는 본 출원의 실시예에 따른 스테레오 신호 처리 방법의 개략도이다.
도 13은 본 출원의 실시예에 따른 스테레오 신호 처리 방법의 개략도이다.
도 14는 본 출원의 실시예에 따른 스테레오 신호 처리 장치의 개략 구조도이다.
도 15는 본 출원의 실시예에 따른 스테레오 신호 처리 장치의 개략 구조도이다.
도 16은 본 출원의 실시예에 따른 스테레오 신호 처리 장치의 개략 구조도이다.
도 17은 본 출원의 실시예에 따른 스테레오 신호 처리 장치의 개략 구조도이다.
다음은 첨부 도면을 참조하여 본 출원을 상세히 추가로 설명한다.
본 출원의 실시예들은 오디오 신호, 특히 스테레오 신호의 인코딩 및 디코딩에 적용가능하다. 현재, 스테레오 신호 인코딩은 다음의 프로세스들: 시간-도메인 사전 처리, 지연 추정 및 인코딩, 지연 정렬, 시간-도메인 분석, 다운믹싱된 파라미터 추출 및 인코딩, 시간-도메인 다운믹싱 처리, 다운믹싱된 신호 인코딩 등을 주로 포함한다. 오디오 신호의 디코딩 프로세스는 오디오 신호의 인코딩 프로세스와 반대일 수 있고, 상세사항들은 본 명세서에 설명되지 않는다.
인코딩 프로세스는 단지 예이고, 실제 인코딩 프로세스는 변경될 수 있다. 이러한 것은 본 출원의 실시예들에서 제한되지 않는다. 본 출원의 실시예들에서는, 지연 정렬이 주로 처리된다. 다음은 지연 정렬을 상세히 설명한다. 또한, 인코딩 프로세스의 다른 단계들에 대해서는, 종래 기술에서의 설명을 참조한다. 상세사항들은 본 명세서에 하나씩 설명되지 않는다.
본 출원의 실시예들에서, 스테레오 신호의 각각의 프레임은 좌측 채널 신호 및 우측 채널 신호를 포함하고, 프레임 길이는 N이고, N은 0보다 큰 양의 정수이다.
도 1은 본 출원의 실시예에 따른 스테레오 신호 처리 방법의 개략 흐름도이다.
도 1을 참조하면, 이러한 방법은 다음 단계들을 포함한다:
단계 101: 현재 프레임의 스테레오 신호에 대해 지연 추정을 수행하여 현재 프레임의 채널간 시간 차이를 결정함- 현재 프레임의 채널간 시간 차이는 현재 프레임의 제1 채널 신호와 현재 프레임의 제2 채널 신호 사이의 시간 차이임 -.
단계 102: 현재 프레임의 채널간 시간 차이의 부호가 현재 프레임의 이전 프레임의 채널간 시간 차이의 부호와 상이하면, 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 정렬 처리를 수행하고, 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 정렬 처리를 수행함- 제1 채널 신호는 현재 프레임의 타겟 채널 신호이고, 제2 채널 신호는 이전 프레임의 타겟 채널 신호와 동일한 채널 상에 있음 -.
현재 프레임의 이전 프레임 및 현재 프레임은 2개의 인접 프레임들이고, 시간 시퀀스에서 연속적이다.
단계 101에서, 현재 프레임에 대해 지연 추정을 수행하는 프로세스는 다음과 같을 수 있다:
단계 1: 현재 프레임의 좌측 채널 신호 및 우측 채널 신호에 대해 시간-도메인 사전 처리를 수행함.
스테레오 신호의 샘플링 레이트가 16 KHz이면, 스테레오 신호의 하나의 프레임의 지속기간은 20 ms이고, 프레임 길이는 N으로서 표기되고, N=320이다, 즉, 프레임 길이는 320개의 샘플링 포인트들이다. 현재 프레임의 스테레오 신호는 현재 프레임의 좌측 채널 신호 및 현재 프레임의 우측 채널 신호를 포함하고, 현재 프레임의 좌측 채널 신호는
Figure pat00016
로서 표기되고, 현재 프레임의 우측 채널 신호는
Figure pat00017
로서 표기되고, n은 샘플링 포인트 시퀀스 번호이고,
Figure pat00018
이다.
현재 프레임의 좌측 채널 신호 및 우측 채널 신호에 대해 시간-도메인 사전 처리를 수행하는 단계는 구체적으로, 현재 프레임의 좌측 채널 신호 및 우측 채널 신호에 대해 고역-통과 필터링 처리를 수행하여 현재 프레임의 사전 처리된 좌측 채널 신호 및 사전 처리된 우측 채널 신호를 획득하는 단계를 포함할 수 있고, 현재 프레임의 사전 처리된 좌측 채널 신호는
Figure pat00019
로서 표기되고, 현재 프레임의 처리된 우측 채널 신호는
Figure pat00020
로서 표기되고, n은 샘플링 포인트 시퀀스 번호이고,
Figure pat00021
이다. 고역-통과 필터링 처리는 컷-오프 주파수가 20 Hz인 무한 임펄스 응답(Infinite Impulse Response, IIR) 필터일 수 있거나, 또는 다른 타입의 필터에 의해 수행될 수 있다. 예를 들어, 샘플링 레이트가 16 KHz이고 대응하는 컷오프 주파수가 20 Hz인 고역-통과 필터의 전달 함수는,
Figure pat00022
Figure pat00023
=0.994461788958195이고,
Figure pat00024
=-1.988923577916390이고,
Figure pat00025
=0.994461788958195이고,
Figure pat00026
=1.988892905899653이고,
Figure pat00027
=-0.988954249933127이고, z는 Z-변환의 변환 인자이다. 대응하여, 시간-도메인 필터링 이후에 획득되는 신호들은 다음과 같다:
Figure pat00028
Figure pat00029
현재 프레임의 좌측 채널 신호 및 우측 채널 신호에 대한 시간-도메인 사전 처리가 의무적이지는 않다는 점이 주목되어야 한다. 시간-도메인 사전 처리 단계가 존재하지 않으면, 지연 추정 및 지연 정렬 처리를 위해 사용되는 좌측 채널 신호 및 우측 채널 신호는 원래 스테레오 신호에서의 좌측 채널 신호 및 우측 채널 신호이다. 본 명세서에서, 원래 스테레오 신호에서의 좌측 채널 신호 및 우측 채널 신호는 아날로그-대-디지털(Analog to Digital, A/D) 변환 이후에 획득되는 수집된 펄스 코드 변조(Pulse Code Modulation, PCM) 신호들이다. 또한, 본 출원의 이러한 실시예에서, 이러한 신호의 샘플링 레이트는 추가로 8 KHz, 16 KHz, 32 KHz, 44.1 KHz, 48 KHz 등일 수 있다. 이러한 것은 본 출원의 이러한 실시예에서 제한되지 않는다.
현재 프레임의 사전 처리된 좌측 채널 신호는
Figure pat00030
로서 표기되고, 현재 프레임의 사전 처리된 우측 채널 신호는
Figure pat00031
로서 표기되고, n은 샘플링 포인트 시퀀스 번호이고,
Figure pat00032
이다.
또한, 사전 처리는 본 출원의 이러한 실시예에서 설명되는 고역-통과 필터링 처리에 더하여 사전-강조 처리와 같은 다른 처리 방식일 수 있다. 이러한 것은 본 출원의 이러한 실시예에서 제한되지 않는다.
단계 2: 현재 프레임의 사전 처리된 좌측 채널 신호 및 사전 처리된 우측 채널 신호에 기초하여 지연 추정을 수행하여, 현재 프레임의 채널간 시간 차이를 획득함.
예를 들어, 좌측 채널과 우측 채널 사이의 교차 상관 계수는 현재 프레임의 사전 처리된 좌측 채널 신호 및 사전 처리된 우측 채널 신호에 기초하여 계산될 수 있다. 다음으로, 교차 상관 계수의 최대 값이 결정되고, 이러한 교차 상관 계수의 최대 값에 기초하여 현재 프레임의 채널간 시간 차이가 결정된다.
구체적으로, Tmax는 현재 샘플링 레이트에서의 채널간 시간 차이의 최대 값에 대응하고, Tmin는 현재 샘플링 레이트에서의 채널간 시간 차이의 최소 값에 대응한다. Tmax 및 Tmin는 미리 설정된 실수들이고, Tmax는 Tmin보다 크다. 본 출원의 이러한 실시예에서, 샘플링 레이트가 16 KHz일 때, Tmax=40이고, Tmin=-40이다. 샘플링 레이트가 32 KHz일 때, Tmax=80이고, Tmin=-80이다. 다른 샘플링 레이트의 경우, Tmax 및 Tmin의 값들은 추가로 설명되지 않는다.
좌측 채널과 우측 채널 사이의 교차 상관 계수는 다음의 방식으로 계산될 수 있다:
Tmin가 0이하이고 Tmax가 0보다 크면, Tmin≤i≤0의 범위 내에서, 좌측 채널과 우측 채널 사이의 교차 상관 계수는 다음의 수학식을 충족한다:
Figure pat00033
0<i≤Tmax의 범위 내에서, 좌측 채널과 우측 채널 사이의 교차 상관 계수는 다음의 수학식을 충족하고:
Figure pat00034
N은 프레임 길이이고,
Figure pat00035
는 현재 프레임의 사전 처리된 좌측 채널 신호이고,
Figure pat00036
는 현재 프레임의 사전 처리된 우측 채널 신호이고,
Figure pat00037
는 좌측 채널과 우측 채널 사이의 교차 상관 계수이고, i는 교차 상관 계수의 인덱스 값이다.
Tmin가 0 이하이고 Tmax가 0 이하이면, Tmin≤i≤Tmax의 범위 내에서, 좌측 채널과 우측 채널 사이의 교차 상관 계수는 다음의 수학식을 충족하고:
Figure pat00038
N은 프레임 길이이고,
Figure pat00039
는 현재 프레임의 사전 처리된 좌측 채널 신호이고,
Figure pat00040
는 현재 프레임의 사전 처리된 우측 채널 신호이고,
Figure pat00041
는 좌측 채널과 우측 채널 사이의 교차 상관 계수이고, i는 교차 상관 계수의 인덱스 값이다.
설정된 Tmin가 0보다 크고 설정된 Tmax가 0보다 크면, Tmin<i≤Tmax의 범위 내에서, 좌측 채널과 우측 채널 사이의 교차 상관 계수는 다음의 수학식을 충족하고:
Figure pat00042
N은 프레임 길이이고,
Figure pat00043
는 현재 프레임의 사전 처리된 좌측 채널 신호이고,
Figure pat00044
는 현재 프레임의 사전 처리된 우측 채널 신호이고,
Figure pat00045
는 좌측 채널과 우측 채널 사이의 교차 상관 계수이고, i는 교차 상관 계수의 인덱스 값이다.
마지막으로, 교차 상관 계수의 획득된 최대 값에 대응하는 인덱스 값이 현재 프레임의 채널간 시간 차이로서 사용된다.
전술한 설명을 참조하면, 본 출원의 이러한 실시예에서, Tmax가 40과 동일하고 Tmin가 -40과 동일할 때, 좌측 채널과 우측 채널 사이의 교차 상관 계수
Figure pat00046
의 최대 값은 Tmin≤i≤Tmax의 범위 내에서 검색되고, 교차 상관 계수의 획득된 최대 값에 대응하는 인덱스 값은 현재 프레임의 채널간 시간 차이로서 사용되고, 이는 cur_itd로서 표기된다.
현재 프레임의 채널간 시간 차이가 추정된 이후에, 현재 프레임의 추정된 채널간 시간 차이에 대해 양자화 및 인코딩이 수행되고, 양자화된 코드 인덱스가 코드 스트림에 기입되고, 이러한 코드 스트림이 디코더 사이드에 송신된다. 선택적으로, 양자화되고 인코딩된 값은 현재 프레임의 채널간 시간 차이로서 사용된다.
위에 설명된 지연 추정 방법에 더하여, 현재 프레임의 채널간 시간 차이는 대안적으로 다른 지연 추정 방법에 따라 결정될 수 있다. 예를 들어, 현재 프레임의 사전 처리된 좌측 채널 신호 및 사전 처리된 우측 채널 신호 또는 현재 프레임의 좌측 채널 신호 및 우측 채널 신호에 기초하여 좌측 채널과 우측 채널 사이의 교차 상관 계수가 계산된다. 다음으로, 제1 M1 오디오 프레임들의 좌측 채널과 우측 채널 사이의 교차 상관 계수(M1은 1 이상인 정수임)에 기초하여, 그리고 현재 프레임의 좌측 채널과 우측 채널 사이의 계산된 교차 상관 계수에 기초하여, 장시간 평활화 처리가 수행되어, 좌측 채널과 우측 채널 사이의 평활화된 교차 상관 계수를 획득한다. 다음으로, 좌측 채널과 우측 채널 사이의 평활화된 교차 상관 계수의 최대 값이 Tmin≤i≤Tmax의 범위 내에서 검색되고, 이러한 최대 값에 대응하는 인덱스 값이 획득되고 현재 프레임의 채널간 시간 차이로서 사용된다. 다른 예를 들어, 제1 M2 오디오 프레임들의 채널간 시간 차이들(M2는 1 이상인 정수) 및 현재 프레임의 추정된 채널간 시간 차이에 기초하여 프레임간 평활화 처리가 대안적으로 수행될 수 있고, 평활화된 채널간 시간 차이는 현재 프레임의 채널간 시간 차이로서 사용된다.
본 출원의 이러한 실시예에서, 현재 프레임의 추정된 채널간 시간 차이가 현재 프레임의 마지막으로 결정된 채널간 시간 차이로서 사용되지만, 현재 프레임의 채널간 시간 차이를 추정하기 위한 방법은 이에 제한되는 것은 아니지만 위에 설명된 방법을 포함한다는 점이 주목되어야 한다.
단계 102에서, 부호는 양의 부호 (+) 또는 음의 부호 (-)를 지칭할 수 있다. 본 출원의 이러한 실시예에서, 이전 프레임은 현재 프레임 이전에 위치되고, 현재 프레임에 인접한다.
현재 프레임의 채널간 시간 차이의 부호가 이전 프레임의 채널간 시간 차이의 부호와 상이하다고 결정될 때, 현재 프레임의 제1 채널 신호 및 제2 채널 신호에 대해 지연 정렬 처리가 개별적으로 수행될 수 있다. 설명의 용이함을 위해, 다음에서 현재 프레임의 제1 채널 신호에 대응하는 채널은 제1 채널이라고 지칭되고, 현재 프레임의 제2 채널 신호에 대응하는 채널은 제2 채널이라고 지칭된다. 제1 채널은 현재 프레임의 타겟 채널이고, 다음-프레임 타겟 채널이라고 추가로 지칭될 수 있거나, 또는 현재 프레임의 표시 타겟 채널이라고 지칭될 수 있거나, 또는 현재 프레임의 이전 프레임의 타겟 채널 이외의 다른 채널이라고 지칭될 수 있다는 점이 주목되어야 한다. 대응하여, 제2 채널은 현재 프레임의 참조 채널이고, 제2 채널은 스테레오 신호의 2개 채널들에 있는 그리고 이전 프레임의 타겟 채널과 동일한 채널이고, 이전-프레임 타겟 채널이라고 추가로 지칭될 수 있거나, 또는 현재 프레임의 표시 참조 채널이라고 지칭될 수 있거나, 또는 현재 프레임의 타겟 채널 이외의 채널이라고 지칭될 수 있다. 예를 들어, 이전 프레임의 타겟 채널이 좌측 채널이면, 제1 채널 신호는 현재 프레임에서의 우측 채널 신호이고, 제2 채널 신호는 현재 프레임에서의 좌측 채널 신호이다. 이전 프레임의 타겟 채널이 우측 채널이면, 제1 채널 신호는 현재 프레임에서의 좌측 채널 신호이고, 제2 채널 신호는 현재 프레임에서의 우측 채널 신호이다.
본 출원의 이러한 실시예에서, 타겟 채널 및 참조 채널은 전용 용어들이다. 구체적으로, 채널간 시간 차이에 기초하여 지연 정렬을 수행하기 위한 기존 알고리즘에서는, 좌측 채널 및 우측 채널로부터 하나의 채널이 선택될 필요가 있고, 선택된 채널의 신호에 대해 지연 정렬 처리가 수행된다. 이러한 채널은 타겟 채널이라고 지칭된다. 다른 채널은 타겟 채널에 대해 지연 정렬 처리를 수행하기 위한 참조로서 사용되고, 참조 채널이라고 지칭된다. 본 출원의 이러한 실시예에서 제안되는 방법에서는, 현재 프레임의 채널간 시간 차이의 부호가 이전 프레임의 채널간 시간 차이의 부호와 상이하다고 결정될 때, 양자 모두의 채널들에 대해 지연 정렬 처리가 수행될 필요가 있다. 따라서, 현재 프레임의 채널간 시간 차이의 부호가 이전 프레임의 채널간 시간 차이의 부호와 상이하다고 결정될 때, 제1 채널은 넓은 의미에서 현재 프레임의 타겟 채널이고, 현재 프레임의 타겟 채널에 대해 지연 정렬 처리가 수행될 필요가 있고; 제2 채널은 넓은 의미에서 현재 프레임의 참조 채널이고, 현재 프레임의 참조 채널에 대해 지연 정렬 처리가 또한 수행될 필요가 있다.
선택적으로, 본 출원의 이러한 실시예에서, 이전 프레임의 타겟 채널 및 참조 채널은 다음의 방식으로 결정되어, 제1 채널 및 제2 채널을 결정할 수 있다: 이전 프레임의 채널간 시간 차이가 0 미만이면, 이전 프레임의 타겟 채널이 좌측 채널이라고 고려될 수 있다. 제2 채널은 스테레오 신호의 2개의 채널들에 있는 그리고 이전 프레임의 타겟 채널과 동일한 채널이기 때문에, 제2 채널은 좌측 채널이고, 제1 채널은 우측 채널이다. 이전 프레임의 채널간 시간 차이가 0 이상이면, 이전 프레임의 타겟 채널이 우측 채널이라고 고려될 수 있다. 제2 채널은 스테레오 신호의 2개의 채널들에 있는 그리고 이전 프레임의 타겟 채널과 동일한 채널이기 때문에, 제2 채널은 우측 채널이고, 제1 채널은 좌측 채널이다.
선택적으로, 본 출원의 이러한 실시예에서, 현재 프레임의 타겟 채널 및 참조 채널은 다음의 방식으로 대안적으로 결정되어, 제1 채널 및 제2 채널을 결정할 수 있다: 현재 프레임의 채널간 시간 차이가 0 이상이라고 결정될 때, 현재 프레임의 타겟 채널이 우측 채널이라고, 즉, 제1 채널이 우측 채널이고, 제2 채널이 좌측 채널이라고 고려될 수 있다. 현재 프레임의 채널간 시간 차이가 0 미만이라고 결정될 때, 현재 프레임의 타겟 채널이 좌측 채널이라고, 즉, 제1 채널이 좌측 채널이고, 제2 채널이 우측 채널이라고 고려될 수 있다.
선택적으로, 본 출원의 이러한 실시예에서, 이전 프레임의 타겟 채널 및 참조 채널은 이전 프레임의 획득된 타겟 채널 인덱스 또는 참조 채널 인덱스에 기초하여 직접 결정되어, 제1 채널 및 제2 채널을 결정할 수 있다.
본 출원의 이러한 실시예에서, 제1 채널 신호 및 제2 채널 신호에 대해 지연 정렬 처리를 수행하기 위한 복수의 방법들이 존재하고, 이들은 다음에서 개별적으로 설명된다.
1. 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 정렬 처리를 수행함.
구체적으로, 현재 프레임의 제1 채널 신호에서의 제1 처리 길이의 신호는 제1 정렬 처리 길이의 신호로 압축되어, 지연 정렬 처리 이후의 현재 프레임의 제1 채널 신호를 획득한다. 제1 처리 길이는 현재 프레임의 채널간 시간 차이 및 제1 정렬 처리 길이에 기초하여 결정되고, 제1 처리 길이는 제1 정렬 처리 길이보다 크다.
본 출원의 이러한 실시예에서, 제1 처리 길이는 현재 프레임의 채널간 시간 차이의 절대 값 및 제1 정렬 처리 길이의 합일 수 있다.
본 출원의 이러한 실시예에서, 제1 정렬 처리 길이는 L_next_target에 의해 표현될 수 있다. 제1 정렬 처리 길이는 현재 프레임의 프레임 길이 이하이고, 제1 정렬 처리 길이는 미리 설정된 길이일 수 있거나, 또는 다른 방식으로 결정될 수 있다. 제1 정렬 처리 길이가 미리 설정된 길이일 때, 제1 정렬 처리 길이는 L, L/2, L/3, 또는 L 이하의 임의의 길이일 수 있고, L은 지연 정렬 처리의 처리 길이이다. 지연 정렬 처리의 처리 길이는 현재 프레임의 프레임 길이 이하이고, 즉, L은 현재 샘플링 레이트에서의 대응하는 프레임 길이 N 이하인 그리고 채널간 시간 차이의 절대 값의 최대 값보다 큰 임의의 미리 설정된 양의 정수이다. 예를 들어, L=290 또는 L=200이다. 본 출원의 이러한 실시예에서, L은 상이한 샘플링 레이트들에 대해 상이한 값들로 설정될 수 있거나, 또는 균일한 값일 수 있다. 일반적으로, 기술자의 경험에 기초하여 값이 미리 설정될 수 있다. 예를 들어, 샘플링 레이트가 16 KHz일 때, L은 290으로 설정된다. 이러한 경우, 본 출원의 이러한 실시예에서, L_next_target=L/2=145이다.
또한, 본 출원의 이러한 실시예에서, 제1 처리 길이의 신호의 시작 포인트는 제1 정렬 처리 길이의 신호의 시작 포인트 이전에 위치되고, 제1 처리 길이의 신호의 시작 포인트와 제1 정렬 처리 길이의 신호의 시작 포인트 사이의 길이는 현재 프레임의 채널간 시간 차이의 절대 값이다.
본 출원의 이러한 실시예에서, 현재 프레임의 채널간 시간 차이는 cur_itd이고, abs(cur_itd)는 현재 프레임의 채널간 시간 차이의 절대 값을 표현한다. 설명의 용이함을 위해, abs(cur_itd)는 다음의 설명에서 제1 지연 길이라고 지칭된다. 이전 프레임의 채널간 시간 차이는 prev_itd이고, abs(prev_itd)는 이전 프레임의 채널간 시간 차이의 절대 값을 표현한다. 설명의 용이함을 위해, abs(prev_itd)는 다음의 설명에서 제2 지연 길이라고 지칭된다.
제1 처리 길이의 신호의 구체적인 위치는 상이한 실제 조건들에 기초하여 결정될 수 있고, 이들은 다음에서 개별적으로 설명된다.
제1 가능한 경우:
도 2는 본 출원의 실시예에 따른 지연 정렬 처리의 개략도이다. 도 2에서, 설명의 용이함을 위해, 동일한 위치에 있는 지연 정렬 처리 이전의 제1 채널 신호에서의 포인트 및 압축 처리 이후의 제1 채널 신호에서의 포인트는 동일한 좌표를 사용하여 마킹되지만, 이러한 것이 좌표가 동일한 포인트들에서의 신호들이 동일하다는 점을 의미하는 것은 아니다. 예를 들어, 현재 프레임의 제1 채널 신호의 시작 포인트의 양자 모두의 좌표들은 지연 정렬 처리 이전에 그리고 압축 처리 이후에 B1로서 마킹된다.
도 2를 참조하면, 제1 정렬 처리 길이의 신호의 시작 포인트는 현재 프레임의 제1 채널 신호의 시작 포인트 B1에 위치된다. 제1 정렬 처리 길이의 신호의 종료 포인트는 C1이고, 시작 포인트 B1로부터 종료 포인트 C1까지의 길이는 제1 정렬 처리 길이와 동일하고, B1=0이고, C1=B1+L_next_target-1이다.
제1 처리 길이의 신호의 시작 포인트 A1은 제1 정렬 처리 길이의 신호의 시작 포인트 B1 이전에 위치되고, 제1 처리 길이의 신호의 시작 포인트 A1과 제1 정렬 처리 길이의 신호의 시작 포인트 B1 사이의 길이는 현재 프레임의 채널간 시간 차이의 절대 값이다. 즉, A1=B1-abs(cur_itd)이다. 제1 처리 길이의 신호의 종료 포인트는 C1이고, 이는 제1 정렬 처리 길이의 신호의 종료 포인트의 좌표와 동일하다.
지연 정렬 처리의 프로세스에서는, 제1 채널 신호에서의 포인트 A1로부터 포인트 C1까지의 신호가 제1 정렬 처리 길이의 신호로 압축되고, 제1 정렬 처리 길이의 압축된 신호는 압축 처리 이후의 제1 채널 신호에서의 시작 포인트 B1로부터 시작하는 제1 정렬 처리 길이의 신호로서 사용된다. 또한, 현재 프레임의 제1 채널 신호에서의 압축되지 않은 신호는 변경되지 않은 채로 남는다, 즉, 지연 정렬 처리 이전의 제1 채널 신호에서의 포인트 C1+1로부터 포인트 E1까지의 신호는 압축 처리 이후의 제1 채널 신호에서의 포인트 C1+1로부터 포인트 E1까지의 신호로서 직접 사용된다. E1은 현재 프레임의 제1 채널 신호의 종료 포인트이고, 현재 프레임의 프레임 길이는 N이고, E1=N-1이다.
본 출원의 이러한 실시예에서, 제1 지연 길이의 신호는 현재 프레임의 제2 채널 신호에서의 포인트 E2-abs(cur_itd)+1로부터 포인트 E2까지의 신호에 기초하여 수동으로 재구성될 수 있고, 제1 지연 길이의 재구성된 신호는 압축 처리 이후의 제1 채널 신호에서의 포인트 E1+1로부터 포인트 G1까지의 신호로서 사용되고, E2는 현재 프레임의 제2 채널 신호의 종료 포인트이고, E2=E1이고, G1=E1+abs(cur_itd)이다.
제1 지연 길이의 신호를 구체적으로 재구성하는 방법은 본 출원의 이러한 실시예에서 제한되지 않는다는 점이 주목되어야 한다. 예를 들어, 현재 프레임의 제2 채널 신호에서의 포인트 E1-abs(cur_itd)+1로부터 포인트 E1까지의 신호는 제1 지연 길이의 재구성된 신호로서 직접 사용될 수 있다.
마지막으로, 압축 처리 이후의 제1 채널 신호에서, 포인트 F1로부터 시작하는 N개의 샘플링 포인트들이 지연 정렬 처리 이후의 현재 프레임의 제1 채널 신호로서 사용된다. 즉, 지연 정렬 처리 이후의 현재 프레임의 제1 채널 신호의 시작 포인트는 포인트 F1이고, 종료 포인트는 포인트 G1이다. 포인트 F1은 현재 프레임의 제1 채널 신호의 시작 포인트 이후에 위치되고, 포인트 F1과 현재 프레임의 제1 채널 신호의 시작 포인트 사이의 길이는 제1 지연 길이이다. 포인트 G1은 현재 프레임의 제1 채널 신호의 종료 포인트 이후에 위치되고, 현재 프레임의 제1 채널 신호의 종료 포인트와 포인트 G1 사이의 길이는 제1 지연 길이이다. 즉, F1=B1+abs(cur_itd)이다.
예를 들어, 도 2를 참조하면, 현재 프레임의 제1 채널이 좌측 채널이고 제2 채널이 우측 채널이면, 좌측 채널 상의 포인트 A1로부터 포인트 C1까지의 신호가 제1 정렬 처리 길이의 신호로 압축되고, 제1 정렬 처리 길이의 압축된 신호는 압축 처리 이후의 좌측 채널 신호에서의 제1 정렬 처리 길이의 신호(즉, 압축 처리 이후의 좌측 채널 신호에서의 포인트 B1로부터 포인트 C1까지의 신호)로서 사용된다. 다음으로, 압축 처리 이전의 좌측 채널 신호에서의 포인트 C1+1로부터 포인트 E1까지의 신호는 압축 처리 이후의 현재 프레임의 좌측 채널 신호에서의 포인트 C1+1로부터 포인트 E1까지의 신호로서 직접 사용된다. 다음으로, 제1 지연 길이의 신호는 현재 프레임의 우측 채널 신호에서의 종료 포인트 이전의 제1 지연 길이의 신호(즉, 현재 프레임의 우측 채널 신호에서의 포인트 E1-abs(cur_itd)+1로부터 포인트 E1까지의 신호)에 기초하여 재구성되고, 제1 지연 길이의 재구성된 신호는 압축 처리 이후의 좌측 채널 신호에서의 종료 포인트 이후의 제1 지연 길이의 신호(즉, 압축 처리 이후의 좌측 채널 신호에서의 포인트 E1+1로부터 포인트 G1까지의 신호)로서 사용된다. 마지막으로, 압축 처리 이후에 획득되는 신호에서의 포인트 F1로부터 포인트 G1까지의 신호는 지연 정렬 처리 이후의 현재 프레임의 좌측 채널 신호로서 사용된다.
현재 프레임의 제1 채널이 우측 채널이고 제2 채널이 좌측 채널일 때, 전술한 설명을 참조한다. 상세사항들은 본 명세서에 설명되지 않는다.
제2 가능한 경우:
도 3은 본 출원의 실시예에 따른 스테레오 신호 처리의 개략도이다. 도 3에서, 설명의 용이함을 위해, 동일한 위치에 있는 지연 정렬 처리 이전의 제1 채널 신호에서의 포인트 및 압축 처리 이후의 제1 채널 신호에서의 포인트는 동일한 좌표를 사용하여 마킹되지만, 이러한 것이 좌표가 동일한 포인트들에서의 신호들이 동일하다는 점을 의미하는 것은 아니다. 예를 들어, 현재 프레임의 제1 채널 신호의 시작 포인트의 양자 모두의 좌표들은 지연 정렬 처리 이전에 그리고 압축 처리 이후에 B1로서 마킹된다.
도 3을 참조하면, 제1 정렬 처리 길이의 신호의 시작 포인트 D1은 현재 프레임의 제1 채널 신호의 시작 포인트 B1 이후에 위치되고, 제1 정렬 처리 길이의 신호의 시작 포인트 D1과 현재 프레임의 제1 채널 신호의 종료 포인트 E1 사이의 길이는 제1 정렬 처리 길이 이상이다. 제1 정렬 처리 길이의 신호의 종료 포인트는 C1이고, 시작 포인트 D1로부터 종료 포인트 C1까지의 길이는 제1 정렬 처리 길이와 동일하고, C1=D1+L_next_target-1이다.
도 3에서, 현재 프레임의 프레임 길이는 N이고, 현재 프레임의 제1 채널 신호의 시작 포인트는 B1=0이고, 현재 프레임의 제1 채널 신호의 종료 포인트는 E1=N-1이다. 제1 정렬 처리 길이의 시작 포인트 D1은 현재 프레임의 제1 채널 신호의 시작 포인트 B1 이후에 위치되고, 제1 정렬 처리 길이의 신호의 시작 포인트 D1과 현재 프레임의 제1 채널 신호의 종료 포인트 E1 사이의 길이는 제1 정렬 처리 길이 이상이다. 설명의 용이함을 위해, 제1 정렬 처리 길이의 신호의 시작 포인트 D1과 제1 채널 신호의 시작 포인트 B1 사이의 길이는 다음에서 제1 미리 설정된 길이라고 지칭된다. 제1 미리 설정된 길이는 0보다 크고 현재 프레임의 프레임 길이와 제1 정렬 처리 길이 사이의 차이 값 이하이고, 실제 상황에 기초하여 구체적으로 설정될 수 있다. 상세사항들은 본 명세서에 설명되지 않는다.
제1 처리 길이의 신호의 시작 포인트 A1은 제1 정렬 처리 길이의 신호의 시작 포인트 D1 이전에 위치되고, 제1 처리 길이의 신호의 시작 포인트 A1과 제1 정렬 처리 길이의 신호의 시작 포인트 D1 사이의 길이는 현재 프레임의 채널간 시간 차이의 절대 값이다. 즉, 제1 처리 길이의 신호의 시작 포인트는 A1=D1-abs(cur_itd)이고, 제1 처리 길이의 신호의 종료 포인트는 C1 이고, 이는 제1 정렬 처리 길이의 신호의 종료 포인트의 좌표와 동일하다.
본 출원의 이러한 실시예에서, 지연 정렬 처리의 프로세스에서는, 신호 압축 동안, 제1 채널 신호에 있는 그리고 제1 처리 길이의 신호의 시작 포인트 이전에 위치되는 제1 미리 설정된 길이의 신호가 압축 처리 이후의 제1 채널 신호의 시작 포인트로부터 시작하는 제1 미리 설정된 길이의 신호로서 직접 사용될 수 있다. 즉, 제1 채널 신호에서의 포인트 H1로부터 포인트 A1-1까지의 신호는 압축된 제1 채널 신호에서의 포인트 B1로부터 포인트 D1-1까지의 신호로서 사용되고, H1=B1-abs(cur_itd)이다.
신호 압축 프로세스에서는, 제1 채널 신호에서의 포인트 A1로부터 포인트 C1까지의 신호가 제1 정렬 처리 길이의 신호로 압축되고, 제1 정렬 처리 길이의 압축된 신호는 압축 처리 이후의 제1 채널 신호에서의 포인트 D1로부터 시작하는 제1 정렬 처리 길이의 신호로서 사용된다. 즉, 제1 정렬 처리 길이의 압축된 신호는 압축 처리 이후의 제1 채널 신호에서의 포인트 D1로부터 포인트 C1까지의 신호로서 직접 사용된다.
또한, 현재 프레임의 제1 채널 신호에서의 압축되지 않은 신호는 변경되지 않은 채로 남는다, 즉, 지연 정렬 처리 이전의 현재 프레임의 제1 채널 신호에서의 포인트 C1+1로부터 포인트 E1까지의 신호는 압축 처리 이후의 제1 채널 신호에서의 포인트 C1+1로부터 포인트 E1까지의 신호로서 직접 사용된다. E1은 현재 프레임의 제1 채널 신호의 종료 포인트이고, 현재 프레임의 프레임 길이는 N이고, E1=N-1이다.
본 출원의 이러한 실시예에서, 제1 지연 길이의 신호는 현재 프레임의 제2 채널 신호에서의 포인트 E2-abs(cur_itd)+1로부터 포인트 E2까지의 신호에 기초하여 수동으로 재구성될 수 있고, 제1 지연 길이의 재구성된 신호는 압축 처리 이후의 제1 채널 신호에서의 포인트 E1+1로부터 포인트 G1까지의 신호로서 사용되고, E2는 현재 프레임의 제2 채널 신호의 종료 포인트이고, E2=E1이고, G1=E1+abs(cur_itd)이다.
제1 지연 길이의 신호를 구체적으로 재구성하는 방법은 본 출원의 이러한 실시예에서 제한되지 않는다는 점이 주목되어야 한다. 예를 들어, 현재 프레임의 제2 채널 신호에서의 포인트 E2-abs(cur_itd)+1로부터 포인트 E2까지의 신호는 제1 지연 길이의 재구성된 신호로서 직접 사용될 수 있다.
마지막으로, 압축 처리 이후의 제1 채널 신호에서, 포인트 F1로부터 시작하는 N개의 샘플링 포인트들이 지연 정렬 처리 이후의 현재 프레임의 제1 채널 신호로서 사용된다. 즉, 지연 정렬 처리 이후의 현재 프레임의 제1 채널 신호의 시작 포인트는 포인트 F1이고, 종료 포인트는 포인트 G1이고, F1=B1+abs(cur_itd)이고, G1=E1+abs(cur_itd)이다.
예를 들어, 도 3을 참조하면, 현재 프레임의 제1 채널은 좌측 채널이고, 제2 채널은 우측 채널이다. 좌측 채널 신호에서의 포인트 H1로부터 포인트 A1-1까지의 신호는 압축 처리 이후의 좌측 채널 신호에서의 포인트 B1로부터 포인트 D1-1까지의 신호로서 직접 사용된다. 좌측 채널 신호에서의 포인트 A1로부터 포인트 C1까지의 신호가 제1 정렬 처리 길이의 신호로 압축되고, 제1 정렬 처리 길이의 압축된 신호는 압축 처리 이후의 좌측 채널 신호에서의 포인트 D1로부터 포인트 C1까지의 신호로서 사용된다. 다음으로, 현재 프레임의 좌측 채널 신호에서의 포인트 C1+1로부터 포인트 E1까지의 신호는 압축 처리 이후의 좌측 채널 신호에서의 포인트 C1+1로부터 포인트 E1까지의 신호로서 직접 사용된다. 다음으로, 제1 지연 길이의 신호가 현재 프레임의 우측 채널 신호에서의 포인트 E2-abs(cur_itd)+1로부터 포인트 E2까지의 신호에 기초하여 수동으로 재구성되고, 제1 지연 길이의 재구성된 신호는 압축 처리 이후의 좌측 채널 신호에서의 포인트 E1+1로부터 포인트 G1까지의 신호로서 사용된다. 마지막으로, 압축 처리 이후에 획득되는 신호에서의 포인트 F1로부터 포인트 G1까지의 신호는 지연 정렬 처리 이후의 현재 프레임의 좌측 채널 신호로서 사용된다.
현재 프레임의 제1 채널이 우측 채널이고 제2 채널이 좌측 채널일 때, 전술한 설명을 참조한다. 상세사항들은 본 명세서에 설명되지 않는다.
제3 가능한 경우:
도 4는 본 출원의 실시예에 따른 스테레오 신호 처리의 개략도이다. 도 4에서, 설명의 용이함을 위해, 동일한 위치에 있는 지연 정렬 처리 이전의 제1 채널 신호에서의 포인트 및 압축 처리 이후의 제1 채널 신호에서의 포인트는 동일한 좌표를 사용하여 마킹되지만, 이러한 것이 좌표가 동일한 포인트들에서의 신호들이 동일하다는 점을 의미하는 것은 아니다. 예를 들어, 현재 프레임의 제1 채널 신호의 종료 포인트의 양자 모두의 좌표들은 지연 정렬 처리 이전에 그리고 압축 처리 이후에 E1로서 마킹된다.
도 4에서, 현재 프레임의 프레임 길이는 N이고, 현재 프레임의 제1 채널 신호의 시작 포인트는 B1=0이고, 현재 프레임의 제1 채널 신호의 종료 포인트는 E1=N-1이다. 제1 정렬 처리 길이의 시작 포인트 D1은 현재 프레임의 제1 채널 신호의 시작 포인트 B1 이전에 위치되고, 제1 정렬 처리 길이의 신호의 시작 포인트 D1과 현재 프레임의 제1 채널 신호의 시작 포인트 B1 사이의 길이는 전이 섹션 길이 이하이고, 제1 정렬 처리 길이의 신호의 시작 포인트 D1과 현재 프레임의 제1 채널 신호의 종료 포인트 E1 사이의 길이는 제1 정렬 처리 길이 및 전이 섹션 길이의 합 이상이다. 설명의 용이함을 위해, 본 출원의 이러한 실시예 및 도 4에서, 전이 섹션 길이는 ts에 의해 표현된다. 이러한 경우, D1=B1-ts이다. 제1 정렬 처리 길이의 신호의 종료 포인트는 C1이고, 시작 포인트 D1로부터 종료 포인트 C1까지의 길이는 제1 정렬 처리 길이와 동일하고, C1=D1+L_next_target-1이다.
본 출원의 이러한 실시예에서, 전이 섹션 길이는 미리 설정된 양의 정수일 수 있고, 미리 설정된 양의 정수는 기술자에 의한 경험에 기초하여 설정될 수 있다. 전이 섹션 길이는 일반적으로 현재 프레임의 채널간 시간 차이의 절대 값의 최대 값 이하이다. 전이 섹션 길이는 대안적으로 현재 프레임의 채널간 시간 차이에 기초하여 계산될 수 있다. 예를 들어, 전이 섹션 길이는 abs(cur_itd)/2이다.
제1 처리 길이의 신호의 시작 포인트 A1은 제1 정렬 처리 길이의 신호의 시작 포인트 D1 이전에 위치되고, 제1 처리 길이의 신호의 시작 포인트 A1과 제1 정렬 처리 길이의 신호의 시작 포인트 D1 사이의 길이는 현재 프레임의 채널간 시간 차이의 절대 값이다. 즉, 제1 처리 길이의 신호의 시작 포인트는 A1=D1-abs(cur_itd)이고, 제1 처리 길이의 신호의 종료 포인트는 C1 이고, 이는 제1 정렬 처리 길이의 신호의 종료 포인트의 좌표와 동일하다.
도 4에서, 제1 정렬 처리 길이의 신호의 시작 포인트 D1과 현재 프레임의 제1 채널 신호의 시작 포인트 B1 사이의 길이는 전이 섹션 길이와 동일하다는 점이 설명을 위한 예로서 사용된다는 점이 주목되어야 한다. 제1 정렬 처리 길이의 신호의 시작 포인트 D1과 현재 프레임의 제1 채널 신호의 시작 포인트 B1 사이의 길이는 대안적으로 전이 섹션 길이 미만일 수 있고, D1<B1이고, D1+ts>B1이다. 전이 섹션 길이 미만인 경우에 대해서는, 본 명세서에서의 설명을 참조한다. 상세사항들은 추가로 설명되지 않는다.
지연 정렬 처리의 프로세스에서는, 제1 채널 신호에서의 포인트 A1로부터 포인트 C1까지의 신호가 제1 정렬 처리 길이의 신호로 압축되고, 제1 정렬 처리 길이의 압축된 신호는 압축 처리 이후의 제1 채널 신호에서의 포인트 D1로부터 시작하는 제1 정렬 처리 길이의 신호로서 사용된다. 즉, 제1 정렬 처리 길이의 압축된 신호는 압축 처리 이후의 제1 채널 신호에서의 포인트 D1로부터 포인트 C1까지의 신호로서 사용된다.
또한, 현재 프레임의 제1 채널 신호에서의 압축되지 않은 신호는 변경되지 않은 채로 남는다, 즉, 지연 정렬 처리 이전의 현재 프레임의 제1 채널 신호에서의 포인트 C1+1로부터 포인트 E1까지의 신호는 압축 처리 이후의 제1 채널 신호에서의 포인트 C1+1로부터 포인트 E1까지의 신호로서 직접 사용된다. E1은 현재 프레임의 제1 채널 신호의 종료 포인트이고, 현재 프레임의 프레임 길이는 N이고, E1=N-1이다.
본 출원의 이러한 실시예에서, 제1 지연 길이의 신호는 현재 프레임의 제2 채널 신호에서의 포인트 E2-abs(cur_itd)+1로부터 포인트 E2까지의 신호에 기초하여 수동으로 재구성될 수 있고, 제1 지연 길이의 재구성된 신호는 압축 처리 이후의 제1 채널 신호에서의 포인트 E1+1로부터 포인트 G1까지의 신호로서 사용되고, E2는 현재 프레임의 제2 채널 신호의 종료 포인트이고, E2=E1이고, G1=E1+abs(cur_itd)이다.
제1 지연 길이의 신호를 구체적으로 재구성하는 방법은 본 출원의 이러한 실시예에서 제한되지 않는다는 점이 주목되어야 한다.
마지막으로, 압축 처리 이후의 제1 채널 신호에서, 포인트 F1로부터 시작하는 N개의 샘플링 포인트들이 지연 정렬 처리 이후의 현재 프레임의 제1 채널 신호로서 사용된다. 즉, 지연 정렬 처리 이후의 현재 프레임의 제1 채널 신호의 시작 포인트는 포인트 F1이고, 종료 포인트는 포인트 G1이고, F1=B1+abs(cur_itd)이다.
예를 들어, 도 4를 참조하면, 현재 프레임의 제1 채널은 좌측 채널이고, 제2 채널은 우측 채널이다. 좌측 채널 신호에서의 포인트 A1로부터 포인트 C1까지의 신호가 제1 정렬 처리 길이의 신호로 압축되고, 제1 정렬 처리 길이의 압축된 신호는 압축 처리 이후의 좌측 채널 신호에서의 포인트 D1로부터 포인트 C1까지의 신호로서 사용된다. 다음으로, 현재 프레임의 좌측 채널 신호에서의 포인트 C1+1로부터 포인트 E1까지의 신호는 압축 처리 이후의 좌측 채널 신호에서의 포인트 C1+1로부터 포인트 E1까지의 신호로서 직접 사용된다. 다음으로, 제1 지연 길이의 신호가 현재 프레임의 우측 채널 신호에서의 포인트 E2-abs(cur_itd)+1로부터 포인트 E2까지의 신호에 기초하여 수동으로 재구성되고, 제1 지연 길이의 재구성된 신호는 압축 처리 이후의 좌측 채널 신호에서의 포인트 E1+1로부터 포인트 G1까지의 신호로서 사용된다. E2는 현재 프레임의 우측 채널 신호의 종료 포인트이다. 마지막으로, 압축 처리 이후에 획득되는 신호에서의 포인트 F1로부터 포인트 G1까지의 신호는 지연 정렬 처리 이후의 현재 프레임의 좌측 채널 신호로서 사용된다.
현재 프레임의 제1 채널이 우측 채널이고 제2 채널이 좌측 채널일 때, 전술한 설명을 참조한다. 상세사항들은 본 명세서에 설명되지 않는다.
선택적으로, 실제 신호와 수동으로 재구성된 신호 사이의 평활화를 추가하기 위해, 평활 전이 섹션이 추가로 설정될 수 있고, 평활 전이 섹션의 길이는 Ts2이다. 평활 전이 섹션의 길이는 미리 설정된 양의 정수로 설정될 수 있고, 평활 전이 섹션의 길이와 전이 섹션 길이 사이의 차이는 프레임 길이와 제1 정렬 처리 길이 사이의 차이 이하이다. 예를 들어, Ts2는 10으로 설정된다.
이러한 경우, 지연 정렬 처리의 프로세스에서는, 제1 채널 신호에서의 포인트 A1로부터 포인트 C1까지의 신호가 제1 정렬 처리 길이의 신호로 압축되고, 제1 정렬 처리 길이의 압축된 신호는 압축 처리 이후의 제1 채널 신호에서의 포인트 D1로부터 시작하는 제1 정렬 처리 길이의 신호로서 사용된다. 즉, 제1 정렬 처리 길이의 압축된 신호는 압축 처리 이후의 제1 채널 신호에서의 포인트 D1로부터 포인트 C1까지의 신호로서 사용된다.
또한, 지연 정렬 처리 이전의 현재 프레임의 제1 채널 신호에서의 포인트 C1+1로부터 포인트 E1-Ts2까지의 신호는 압축 처리 이후의 제1 채널 신호에서의 포인트 C1+1로부터 포인트 E1-Ts2까지의 신호로서 직접 사용된다. E1은 현재 프레임의 제1 채널 신호의 종료 포인트이고, 현재 프레임의 프레임 길이는 N이고, E1=N-1이다. 평활 전이 섹션의 길이의 신호는 현재 프레임의 제2 채널 신호에서의 포인트 E2-abs(cur_itd)-Ts2+1로부터 포인트 E2-abs(cur_itd)까지의 신호에 기초하여 수동으로 재구성되고, 평활 전이 섹션의 길이의 재구성된 신호는 압축 처리 이후의 제1 채널 신호에서의 포인트 E1-Ts2+1로부터 포인트 E1까지의 신호로서 사용된다.
본 출원의 이러한 실시예에서, 제1 지연 길이의 신호는 현재 프레임의 제2 채널 신호에서의 포인트 E2-abs(cur_itd)+1로부터 포인트 E2까지의 신호에 기초하여 수동으로 재구성될 수 있고, 제1 지연 길이의 재구성된 신호는 압축 처리 이후의 제1 채널 신호에서의 포인트 E1+1로부터 포인트 G1까지의 신호로서 사용되고, E2는 현재 프레임의 제2 채널 신호의 종료 포인트이고, E2=E1이고, G1=E1+abs(cur_itd)이다.
제1 지연 길이의 신호 및 평활 전이 섹션의 길이의 신호를 구체적으로 재구성하는 방법은 본 출원의 이러한 실시예에서 제한되지 않는다는 점이 주목되어야 한다.
제2 가능한 경우에서는, 전이 섹션 길이가 또한 설정될 수 있다는 점이 주목되어야 한다. 전이 섹션 길이를 설정하기 위한 구체적인 방법 및 단계, 및 전이 섹션 길이가 설정된 이후에 현재 프레임의 제1 채널 신호에 대해 지연 정렬 처리를 수행하는 프로세스에 대해서는, 전술한 설명을 참조한다. 상세사항들은 본 명세서에 설명되지 않는다. 제2 가능한 경우에, 전이 섹션 길이 및 평활 전이 섹션의 길이가 추가로 설정될 수 있다. 전이 섹션 길이 및 평활 전이 섹션의 길이를 설정하기 위한 구체적인 방법 및 단계, 및 전이 섹션 길이 및 평활 전이 섹션의 길이가 설정된 이후에 현재 프레임의 제1 채널 신호에 대해 지연 정렬 처리를 수행하는 프로세스에 대해서는, 전술한 설명을 참조한다.
전술한 방법에서는, 프레임들 사이의 평활화는 전이 섹션 길이를 추가하는 것 또는 전이 섹션 길이 및 평활 전이 섹션의 길이를 추가하는 것에 의해 추가되고, 지연 정렬 처리 이후의 현재 프레임에서의 2개의 채널 신호들 사이의 정렬의 정확도가 개선되고, 인코딩 품질이 개선된다.
본 출원의 이러한 실시예에서, 제1 처리 길이의 신호를 압축하기 위한 방법은, 큐빅 스플라인 보간 방법을 사용하여 신호를 압축하는 것일 수 있거나, 쿼드러틱 스플라인 보간 방법을 사용하여 신호를 압축하는 것일 수 있거나, 선형 보간 방법을 사용하여 신호를 압축하는 것일 수 있거나, 또는, 쿼드러틱 B-스플라인 보간 방법 또는 큐빅 B-스플라인 보간 방법과 같은, B-스플라인 보간 방법을 사용하여 신호를 압축하는 것일 수 있다는 점이 주목되어야 한다. 구체적인 압축 방법은 본 출원의 이러한 실시예에서 제한되지 않고, 압축은 임의의 기술을 사용하여 처리될 수 있다.
2. 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 정렬 처리를 수행함.
구체적으로, 제2 채널 신호에서의 제2 처리 길이의 신호는 제2 정렬 처리 길이의 신호로 신장되어, 지연 정렬 처리 이후의 현재 프레임의 제2 채널 신호를 획득한다. 제2 처리 길이는 이전 프레임의 채널간 시간 차이 및 제2 정렬 처리 길이에 기초하여 결정되고, 제2 처리 길이는 제2 정렬 처리 길이 미만이다.
본 출원의 이러한 실시예에서, 제2 처리 길이는 제2 정렬 처리 길이와 이전 프레임의 채널간 시간 차이의 절대 값 사이의 차이이다. 본 출원의 이러한 실시예에서, 제2 정렬 처리 길이는 L_pre_target에 의해 표현될 수 있다.
제2 정렬 처리 길이는 미리 설정된 길이일 수 있거나, 또는 다른 방식으로 결정될 수 있다. 제2 정렬 처리 길이는 현재 프레임의 프레임 길이 이하이다. 제2 정렬 처리 길이가 미리 설정된 길이일 때, 제2 정렬 처리 길이는 L, L/2, L/3, 또는 L 이하인 임의의 길이이다. L은 현재 샘플링 레이트에서의 대응하는 프레임 길이 N 이하인 그리고 채널간 시간 차이의 절대 값의 최대 값보다 큰 임의의 미리 설정된 양의 정수이다. 예를 들어, L=290 또는 L=200이다. 본 출원의 이러한 실시예에서, L은 상이한 샘플링 레이트들에 대해 상이한 값들로 설정될 수 있거나, 또는 균일한 값일 수 있다. 일반적으로, 기술자의 경험에 기초하여 값이 미리 설정될 수 있다. 예를 들어, 샘플링 레이트가 16 KHz일 때, L은 290으로 설정된다. 본 출원의 이러한 실시예에서, L_pre_target=L/2=145이다.
또한, 제2 처리 길이의 신호의 시작 포인트는 제2 정렬 처리 길이의 신호의 시작 포인트 이후에 위치되고, 제2 처리 길이의 신호의 시작 포인트와 제2 정렬 처리 길이의 신호의 시작 포인트 사이의 길이는 이전 프레임의 채널간 시간 차이의 절대 값이다.
제2 처리 길이의 신호의 구체적인 위치는 상이한 실제 조건들에 기초하여 결정될 수 있고, 이는 다음에서 개별적으로 설명된다.
제1 가능한 경우:
도 5는 본 출원의 실시예에 따른 스테레오 신호 처리의 개략도이다. 도 5에서, 설명의 용이함을 위해, 동일한 위치에 있는 지연 정렬 처리 이전의 제2 채널 신호에서의 포인트 및 신장 처리 이후의 제2 채널 신호에서의 포인트는 동일한 좌표를 사용하여 마킹되지만, 이러한 것이 좌표가 동일한 포인트들에서의 신호들이 동일하다는 점을 의미하는 것은 아니다. 예를 들어, 현재 프레임의 제2 채널 신호의 시작 포인트의 양자 모두의 좌표들은 지연 정렬 처리 이전에 그리고 신장 처리 이후에 B2로서 마킹된다.
도 5를 참조하면, 현재 프레임의 프레임 길이는 N이고, 현재 프레임의 제2 채널 신호의 시작 포인트는 B2=0이고, 현재 프레임의 제2 채널 신호의 종료 포인트는 E2=N-1이다. 제2 정렬 처리 길이의 시작 포인트는 현재 프레임의 제2 채널 신호의 시작 포인트 B2에 위치된다. 제2 정렬 처리 길이의 신호의 종료 포인트는 C2이고, 시작 포인트 B2로부터 종료 포인트 C2까지의 길이는 제2 정렬 처리 길이와 동일하고, C2=B2+L_pre_target-1이다.
제2 처리 길이의 신호의 시작 포인트 A2는 제2 정렬 처리 길이의 시작 포인트 B2 이후에 위치되고, 제2 처리 길이의 신호의 시작 포인트 A2와 제2 정렬 처리 길이의 시작 포인트 B2 사이의 길이는 이전 프레임의 채널간 시간 차이의 절대 값이다. 제2 처리 길이의 신호의 시작 포인트는 A2=B2+abs(prev_itd)이고, 제2 처리 길이의 신호의 종료 포인트는 C2이고, 이는 제2 정렬 처리 길이의 신호의 종료 포인트의 좌표와 동일하다.
지연 정렬 처리의 프로세스에서는, 제2 채널 신호에서의 포인트 A2로부터 포인트 C2까지의 신호가 제2 정렬 처리 길이의 신호로 신장되고, 제2 정렬 처리 길이의 신장된 신호는 신장 처리 이후의 제2 채널 신호에서의 포인트 B2로부터 시작하는 제2 정렬 처리 길이의 신호로서 사용된다. 즉, 제2 정렬 처리 길이의 신장된 신호는 신장 처리 이후의 제2 채널 신호의 시작 포인트 B2로부터 포인트 C2까지의 신호로서 사용된다.
본 출원의 이러한 실시예에서, 신호 신장 동안, 현재 프레임의 제2 채널 신호에서의 신장되지 않은 신호는 변경되지 않은 채로 남을 수 있다, 즉, 현재 프레임의 제2 채널 신호에서의 포인트 C2+1로부터 포인트 E2까지의 신호는 신장 처리 이후의 제2 채널 신호에서의 포인트 C2+1로부터 포인트 E2까지의 신호로서 직접 사용된다. E2는 현재 프레임의 제2 채널 신호의 종료 포인트이고, 현재 프레임의 프레임 길이는 N이고, E2=N-1이다.
마지막으로, 신장 처리 이후의 제2 채널 신호에서, 시작 포인트 B2로부터 시작하는 N개의 샘플링 포인트들은 지연 정렬 처리 이후의 현재 프레임의 제2 채널 신호로서 사용된다. 즉, 지연 정렬 처리 이후의 현재 프레임의 제2 채널 신호의 시작 포인트는 B2이고, 종료 포인트는 E2이다.
예를 들어, 도 5를 참조하면, 현재 프레임의 제1 채널은 좌측 채널이고, 제2 채널은 우측 채널이다. 현재 프레임의 우측 채널 신호에서의 포인트 A2로부터 포인트 C2까지의 신호는 제2 정렬 처리 길이의 신호로 신장되고, 제2 정렬 처리 길이의 신장된 신호는 신장 처리 이후의 우측 채널 신호에서의 포인트 B2로부터 포인트 C2까지의 신호로서 사용된다. 다음으로, 현재 프레임의 우측 채널 신호에서의 포인트 C2+1로부터 포인트 E2까지의 신호는 신장 처리 이후의 우측 채널 신호에서의 포인트 C2+1로부터 포인트 E2까지의 신호로서 직접 사용된다. 마지막으로, 신장 처리 이후에 획득되는 신호에서의 포인트 B2로부터 포인트 E2까지의 신호는 지연 정렬 처리 이후의 현재 프레임의 우측 채널 신호로서 사용된다.
현재 프레임의 제1 채널이 우측 채널이고 제2 채널이 좌측 채널일 때, 전술한 설명을 참조한다. 상세사항들은 본 명세서에 설명되지 않는다.
제2 가능한 경우:
도 6은 본 출원의 실시예에 따른 스테레오 신호 처리의 개략도이다. 도 6에서, 설명의 용이함을 위해, 동일한 위치에 있는 지연 정렬 처리 이전의 제2 채널 신호에서의 포인트 및 신장 처리 이후의 제2 채널 신호에서의 포인트는 동일한 좌표를 사용하여 마킹되지만, 이러한 것이 좌표가 동일한 포인트들에서의 신호들이 동일하다는 점을 의미하는 것은 아니다.
도 6을 참조하면, 현재 프레임의 프레임 길이는 N이고, 현재 프레임의 제2 채널 신호의 시작 포인트는 B2=0이고, 현재 프레임의 제2 채널 신호의 종료 포인트는 E2=N-1이다. 제2 정렬 처리 길이의 시작 포인트는 현재 프레임의 제2 채널 신호의 시작 포인트 B2 이후에 위치되고, 제2 정렬 처리 길이의 신호의 시작 포인트 D2와 현재 프레임의 제2 채널 신호의 종료 포인트 E2 사이의 길이는 제2 정렬 처리 길이 이상이다. 제2 정렬 처리 길이의 신호의 종료 포인트는 C2=D2+L_pre_target-1이다. 설명의 용이함을 위해, 제2 정렬 처리 길이의 신호의 시작 포인트 D2와 제2 채널 신호의 시작 포인트 B2 사이의 길이는 다음에서 제2 미리 설정된 길이라고 지칭된다. 제2 미리 설정된 길이는 0보다 크고 현재 프레임의 프레임 길이와 제2 정렬 처리 길이 사이의 차이 값 이하일 수 있고, 실제 상황에 기초하여 구체적으로 설정될 수 있다. 상세사항들은 본 명세서에 설명되지 않는다.
제2 처리 길이의 신호의 시작 포인트 A2는 제2 정렬 처리 길이의 시작 포인트 B2 이후에 위치되고, 제2 처리 길이의 신호의 시작 포인트 A2와 제2 정렬 처리 길이의 시작 포인트 B2 사이의 길이는 이전 프레임의 채널간 시간 차이의 절대 값이다. 제2 처리 길이의 신호의 시작 포인트는 A2=D2+abs(prev_itd)이고, 제2 처리 길이의 신호의 종료 포인트의 좌표는 제2 정렬 처리 길이의 신호의 종료 포인트의 좌표와 동일하다, 즉, C2=D2+L_pre_target-1이다.
지연 정렬 처리의 프로세스에서는, 제2 채널 신호에서의 H2=B2+abs(prev_itd)로부터 시작하는 제2 미리 설정된 길이의 신호는 신장 처리 이후의 제2 채널 신호에서의 시작 포인트 B2로부터 시작하는 제2 미리 설정된 길이의 신호로서 직접 사용된다. 즉, 도 6을 참조하면, 현재 프레임의 제2 채널 신호에서의 포인트 H2로부터 포인트 A2-1까지의 신호는 신장 처리 이후의 제2 채널 신호에서의 포인트 B2로부터 포인트 D2-1까지의 신호로서 직접 사용된다.
또한, 제2 채널 신호에서의 포인트 A2로부터 포인트 C2까지의 신호는 제2 정렬 처리 길이의 신호로 신장되고, 제2 정렬 처리 길이의 신장된 신호는 신장 처리 이후의 제2 채널 신호에서의 포인트 D2로부터 시작하는 제2 정렬 처리 길이의 신호로서 사용된다. 즉, 제2 정렬 처리 길이의 신장된 신호는 신장 처리 이후의 제2 채널 신호에서의 포인트 D2로부터 포인트 C2까지의 신호로서 사용된다.
본 출원의 이러한 실시예에서, 신호 신장 동안, 현재 프레임의 제2 채널 신호에서의 신장되지 않은 신호는 변경되지 않은 채로 남을 수 있다, 즉, 현재 프레임의 제2 채널 신호에서의 포인트 C2+1로부터 포인트 E2까지의 신호는 신장 처리 이후의 제2 채널 신호에서의 포인트 C2+1로부터 포인트 E2까지의 신호로서 직접 사용된다. E2는 현재 프레임의 제2 채널 신호의 종료 포인트이고, 현재 프레임의 프레임 길이는 N이고, E2=N-1이다.
마지막으로, 신장 처리 이후의 제2 채널 신호에서, 시작 포인트 B2로부터 시작하는 N개의 샘플링 포인트들은 지연 정렬 처리 이후의 현재 프레임의 제2 채널 신호로서 사용된다. 즉, 지연 정렬 처리 이후의 현재 프레임의 제2 채널 신호의 시작 포인트는 B2이고, 종료 포인트는 E2이다.
예를 들어, 도 6을 참조하면, 현재 프레임의 제1 채널은 좌측 채널이고, 제2 채널은 우측 채널이다. 지연 정렬 처리의 프로세스에서는, 현재 프레임의 우측 채널 신호에서의 포인트 H2로부터 포인트 A2-1까지의 신호는 신장 처리 이후의 우측 채널 신호에서의 포인트 B2로부터 포인트 D2-1까지의 신호로서 직접 사용된다. 현재 프레임의 우측 채널 신호에서의 포인트 A2로부터 포인트 C2까지의 신호는 제2 정렬 처리 길이의 신호로 신장되고, 제2 정렬 처리 길이의 신장된 신호는 신장 처리 이후의 우측 채널 신호에서의 포인트 D2로부터 포인트 C2까지의 신호로서 사용된다. 다음으로, 현재 프레임의 우측 채널 신호에서의 포인트 C2+1로부터 포인트 E2까지의 신호는 신장 처리 이후의 우측 채널 신호에서의 포인트 C2+1로부터 포인트 E2까지의 신호로서 직접 사용된다. 마지막으로, 신장 처리 이후에 획득되는 신호에서의 포인트 B2로부터 포인트 E2까지의 신호는 지연 정렬 처리 이후의 현재 프레임의 우측 채널 신호로서 사용된다.
현재 프레임의 제1 채널이 우측 채널이고 제2 채널이 좌측 채널일 때, 전술한 설명을 참조한다. 상세사항들은 본 명세서에 설명되지 않는다.
본 출원의 이러한 실시예에서, 제2 처리 길이의 신호를 신장하기 위한 방법은, 큐빅 스플라인 보간 방법을 사용하여 신호를 신장하는 것일 수 있거나, 쿼드러틱 스플라인 보간 방법을 사용하여 신호를 신장하는 것일 수 있거나, 선형 보간 방법을 사용하여 신호를 신장하는 것일 수 있거나, 또는, 쿼드러틱 B-스플라인 보간 방법 또는 큐빅 B-스플라인 보간 방법과 같은, B-스플라인 보간 방법을 사용하여 신호를 신장하는 것일 수 있다는 점이 주목되어야 한다. 구체적인 신장 방법은 본 출원의 이러한 실시예에서 제한되지 않고, 신장은 임의의 기술을 사용하여 처리될 수 있다.
본 출원의 이러한 실시예에서, 지연 정렬 처리가 수행된 이후, 현재 프레임의 채널간 시간 차이가 추가로 양자화되고 인코딩되어 현재 프레임의 채널간 시간 차이의 코드 인덱스를 획득할 수 있고, 이러한 코드 인덱스는 코드 스트림에 기입된다. 현재 프레임의 채널간 시간 차이는 대안적으로 단계 101에서 양자화되고 인코딩될 수 있거나, 또는 본 명세서에서 양자화되고 인코딩될 수 있다는 점이 주목되어야 한다. 이러한 것은 본 출원의 이러한 실시예에서 제한되지 않는다.
구체적으로, 코드 인덱스를 코드 스트림에 기입하기 위한 다수의 방법들이 존재할 수 있다. 이러한 것은 본 출원의 이러한 실시예에서 제한되지 않는다. 예를 들어, 현재 프레임의 채널간 시간 차이의 절대 값이 양자화되고 인코딩된 이후, 현재 프레임의 채널간 시간 차이의 절대 값의 코드 인덱스가 코드 스트림에 기입되고, 이러한 코드 스트림은 디코더 사이드에 송신된다. 또한, 현재 프레임의 타겟 채널의 인덱스는 타겟 채널 인덱스로서 코드 스트림에 기입되거나, 또는 현재 프레임의 참조 채널의 인덱스는 참조 채널 인덱스로서 코드 스트림에 기입되고, 코드 스트림은 디코더 사이드에 송신된다.
지연 정렬 처리 이후의 현재 프레임의 좌측 채널 신호는
Figure pat00047
로서 표기되고, 지연 정렬 처리 이후의 현재 프레임의 우측 채널 신호는
Figure pat00048
로서 표기되고, n은 샘플링 포인트 시퀀스 번호이고,
Figure pat00049
이다. 현재 프레임의 채널간 시간 차이의 부호와 이전 프레임의 채널간 시간 차이의 부호에 기초하여, 지연 정렬 처리 이후의 제1 채널 신호는 지연 정렬 처리 이후의 현재 프레임의 좌측 채널 신호일 수 있고
Figure pat00050
로서 표기되거나, 또는 지연 정렬 처리 이후의 제2 채널 신호는 지연 정렬 처리 이후의 현재 프레임의 좌측 채널 신호일 수 있고
Figure pat00051
로서 표기된다. 유사하게, 지연 정렬 처리 이후의 제1 채널 신호는 지연 정렬 처리 이후의 현재 프레임의 우측 채널 신호일 수 있고
Figure pat00052
로서 표기되거나, 또는 지연 정렬 처리 이후의 제2 채널 신호는 지연 정렬 처리 이후의 현재 프레임의 우측 채널 신호일 수 있고
Figure pat00053
로서 표기될 수 있다.
마지막으로, 지연 정렬 처리 이후의 제1 채널 신호 및 지연 정렬 처리 이후의 제2 채널 신호가 인코딩된다.
구체적으로, 지연 정렬 처리 이후의 제1 채널 신호 및 지연 정렬 처리 이후의 제2 채널 신호가 기존의 스테레오 인코딩 방법을 사용하여 인코딩될 수 있고, 인코딩된 코드 스트림이 디코더 사이드에 송신된다. 구체적인 인코딩 방법이 본 출원의 이러한 실시예에서 제한되지 않는다.
선택적으로, 본 출원의 이러한 실시예에서, 제1 정렬 처리 길이가 미리 설정된 길이가 아닐 때, 다음의 수학식이 충족될 수 있다:
Figure pat00054
L_next_target는 제1 정렬 처리 길이이고, cur_itd는 현재 프레임의 채널간 시간 차이이고, prev_itd는 이전 프레임의 채널간 시간 차이이고, L은 지연 정렬 처리의 처리 길이이다.
Figure pat00055
는 절대 값을 취하는 것을 의미한다.
제2 정렬 처리 길이가 미리 설정된 길이가 아닐 때, 다음의 수학식이 충족될 수 있다:
Figure pat00056
L_pre_target는 제2 정렬 처리 길이이고, cur_itd는 현재 프레임의 채널간 시간 차이이고, prev_itd는 이전 프레임의 채널간 시간 차이이고, L은 지연 정렬 처리의 처리 길이이다. L은 현재 샘플링 레이트에서의 대응하는 프레임 길이 N 이하이고 채널간 시간 차이의 절대 값의 최대 값보다 큰 임의의 미리 설정된 양의 정수이다. 예를 들어, L=290 또는 L=200이다.
Figure pat00057
는 절대 값을 취하는 것을 의미한다.
선택적으로, 본 출원의 이러한 실시예에서, 지연 정렬 처리의 처리 길이가 미리 설정된 길이가 아닐 때, 다음의 수학식이 충족될 수 있다:
Figure pat00058
L은 지연 정렬 처리의 처리 길이이고,
Figure pat00059
는 인접 프레임들의 채널간 시간 차이들 사이의 최대 차이 값이고,
Figure pat00060
는 지연 정렬 처리의 미리 설정된 처리 길이이다. 예를 들어,
Figure pat00061
는 인접 프레임들의 채널간 시간 차이들 사이의 최대 차이 값 이상이고 현재 프레임의 프레임 길이 이하일 수 있다, 예를 들어, 290 또는 200이다.
Figure pat00062
는 절대 값을 취하는 것을 의미한다.
Figure pat00063
는 0보다 크고
Figure pat00064
이하인 양의 정수일 수 있고, Tmax는 현재 샘플링 레이트에서의 채널간 시간 차이의 최대 값에 대응하고, Tmin는 현재 샘플링 레이트에서의 채널간 시간 차이의 최소 값에 대응한다. 예를 들어,
Figure pat00065
는 80, 40, 또는 20과 동일하다. 본 출원의 실시예에서,
Figure pat00066
는 20일 수 있다.
다음은 구체적인 실시예를 사용하여 설명을 제공한다.
단계 1: 현재 프레임의 스테레오 신호에 기초하여 지연 추정을 수행하여 현재 프레임의 채널간 시간 차이를 결정함.
이러한 단계의 구체적인 내용에 대해서는, 단계 101을 참조한다. 상세사항들은 본 명세서에 다시 설명되지 않는다.
단계 2: 현재 프레임의 채널간 시간 차이의 부호가 이전 프레임의 채널간 시간 차이의 부호와 상이하면, 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 정렬 처리를 수행함.
단계 3: 현재 프레임의 채널간 시간 차이의 부호가 이전 프레임의 채널간 시간 차이의 부호와 상이하면, 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 정렬 처리를 수행함.
단계 2 및 단계 3을 참조하면, 제2 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제2 채널 신호의 시작 포인트 사이의 길이는 제2 미리 설정된 길이와 동일하고; 제1 정렬 처리 길이의 신호의 시작 포인트 및 현재 프레임의 제1 채널 신호의 시작 포인트 사이의 길이는 제2 미리 설정된 길이 및 제2 정렬 처리 길이의 합과 동일하다. 또한, 제1 정렬 처리 길이는 수학식 8을 충족하고, 제2 정렬 처리 길이는 수학식 9를 충족한다.
도 7a는 본 출원의 실시예에 따른 스테레오 신호 처리의 개략도이다. 도 7a에서, 설명의 용이함을 위해, 동일한 위치에 있는 지연 정렬 처리 이전의 제1 채널 신호에서의 포인트 및 지연 정렬 처리 이후의 제1 채널 신호에서의 포인트는 동일한 좌표를 사용하여 마킹되고; 동일한 위치에 있는 지연 정렬 처리 이전의 제2 채널 신호에서의 포인트 및 지연 정렬 처리 이후의 제2 채널 신호에서의 포인트는 동일한 좌표를 사용하여 마킹된다.
현재 프레임의 프레임 길이는 N이고, 현재 프레임의 제1 채널 신호의 시작 포인트는 B1=0이고, 현재 프레임의 제1 채널 신호의 종료 포인트는 E1=N-1이고, 현재 프레임의 제2 채널 신호의 시작 포인트는 B2=0이고, 현재 프레임의 제2 채널 신호의 종료 포인트는 E2=N-1이다. 제1 정렬 처리 길이의 신호의 시작 포인트는 D1=D2+L_pre_target이고, 제1 정렬 처리 길이의 신호의 종료 포인트는 C1=D1+L_next_target-1이고, 제1 처리 길이의 신호의 시작 포인트는 A1=D1-abs(cur_itd)이고, 제1 처리 길이의 신호의 종료 포인트의 좌표는 제1 정렬 처리 길이의 신호의 종료 포인트의 좌표와 동일하다, 즉, C1=D1+L_next_target-1이다. 제2 정렬 처리 길이의 시작 포인트는 D2이고, 제2 정렬 처리 길이의 종료 포인트는 C2=D2+L_pre_target-1이다. 제2 처리 길이의 신호의 시작 포인트는 A2=D2+abs(prev_itd)이고, 제2 처리 길이의 신호의 종료 포인트는 C2=D2+L_pre_target-1이다. 설명의 용이함을 위해, 제2 정렬 처리 길이의 신호의 시작 포인트 D2와 제2 채널 신호의 시작 포인트 B2 사이의 길이는 다음에서 제2 미리 설정된 길이라고 지칭된다. 제2 미리 설정된 길이는 0보다 크고 현재 프레임의 프레임 길이와 제2 정렬 처리 길이 사이의 차이 값 이하일 수 있고, 실제 상황에 기초하여 구체적으로 설정될 수 있다. 상세사항들은 본 명세서에 설명되지 않는다. 이러한 경우, 도 7a에 도시되는 바와 같이 제1 처리 길이의 신호는 압축되고 제2 처리 길이의 신호는 신장된다.
도 7a를 참조하면, 제1 채널 신호에 대해 지연 정렬 처리를 수행하는 프로세스에서는, 제1 채널 신호에서의 포인트 H1로부터 포인트 A1-1까지의 신호가 압축 처리 이후의 제1 채널 신호에서의 포인트 B1로부터 포인트 D1-1까지의 신호로서 직접 사용되고, H1=B1-abs(cur_itd)이다. 현재 프레임의 제1 채널 신호에서의 포인트 A1로부터 포인트 C1까지의 신호는 제1 정렬 처리 길이의 신호로 압축되고, 제1 정렬 처리 길이의 압축된 신호는 압축 처리 이후의 제1 채널 신호에서의 포인트 D1로부터 포인트 C1까지의 신호로서 사용된다. 다음으로, 현재 프레임의 제1 채널 신호에서의 포인트 C1+1로부터 포인트 E1까지의 신호는 압축 처리 이후의 제1 채널 신호에서의 포인트 C1+1로부터 포인트 E1까지의 신호로서 직접 사용된다. 다음으로, 제1 지연 길이의 신호는 현재 프레임의 제2 채널 신호에서의 종료 포인트 E2 이전의 제1 지연 길이의 신호에 기초하여 수동으로 재구성되고, 제1 지연 길이의 재구성된 신호는 압축 처리 이후의 제1 채널 신호에서의 포인트 E1+1로부터 포인트 G1까지의 신호로서 사용되고, G1=E1+abs(cur_itd)-1이다. 마지막으로, 지연 정렬 처리 이후에 획득되는 신호에서의 포인트 F1로부터 포인트 G1까지의 신호는 지연 정렬 처리 이후의 현재 프레임의 제1 채널 신호로서 사용되고, F1=B1+abs(cur_itd)이다.
제2 채널 신호에 대해 지연 정렬 처리를 수행하는 프로세스에서는, 제2 채널 신호에서의 H2=B2+abs(prev_itd)로부터 시작하는 제2 미리 설정된 길이의 신호는 신장 처리 이후의 제2 채널 신호에서의 시작 포인트 B2로부터 시작하는 제2 미리 설정된 길이의 신호로서 직접 사용된다. 즉, 도 7a를 참조하면, 현재 프레임의 제2 채널 신호에서의 포인트 H2로부터 포인트 A2-1까지의 신호는 신장 처리 이후의 제2 채널 신호에서의 포인트 B2로부터 포인트 D2-1까지의 신호로서 직접 사용된다. 현재 프레임의 제2 채널 신호에서의 포인트 A2로부터 포인트 C2까지의 신호는 제2 정렬 처리 길이의 신호로 신장되고, 제2 정렬 처리 길이의 신장된 신호는 신장 처리 이후의 제2 채널 신호에서의 포인트 D2로부터 포인트 C2까지의 신호로서 사용된다. 다음으로, 현재 프레임의 제2 채널 신호에서의 포인트 C2+1로부터 포인트 E2까지의 신호는 신장 처리 이후의 제2 채널 신호에서의 포인트 C2+1로부터 포인트 E2까지의 신호로서 직접 사용된다. 마지막으로, 지연 정렬 처리 이후에 획득되는 신호에서의 포인트 B2로부터 포인트 E2까지의 신호는 지연 정렬 처리 이후의 현재 프레임의 제2 채널 신호로서 사용된다.
도 7a를 참조하면, 본 출원의 이러한 실시예에서, 제2 정렬 처리 길이의 시작 포인트는 또한 제2 채널 신호의 시작 포인트일 수 있다, 즉, D2=B2이고 D1=B1+L_pre_target이다. 이러한 경우, 도 7b에 도시되는 바와 같이 제1 처리 길이의 신호는 압축되고 제2 처리 길이의 신호는 신장된다.
도 7b는 본 출원의 실시예에 따른 스테레오 신호 처리의 개략도이다. 도 7b에서, 설명의 용이함을 위해, 동일한 위치에 있는 지연 정렬 처리 이전의 제1 채널 신호에서의 포인트 및 지연 정렬 처리 이후의 제1 채널 신호에서의 포인트는 동일한 좌표를 사용하여 마킹되고; 동일한 위치에 있는 지연 정렬 처리 이전의 제2 채널 신호에서의 포인트 및 지연 정렬 처리 이후의 제2 채널 신호에서의 포인트는 동일한 좌표를 사용하여 마킹된다.
도 7b에서, 현재 프레임의 프레임 길이는 N이고, 현재 프레임의 제1 채널 신호의 시작 포인트는 B1=0이고, 현재 프레임의 제1 채널 신호의 종료 포인트는 E1=N-1이다. 제1 정렬 처리 길이의 신호의 시작 포인트는 D1=B1+L_pre_target이고, 제1 정렬 처리 길이의 신호의 종료 포인트는 C1=B1+L_pre_target+L_next_target-1이고, 제1 처리 길이의 신호의 시작 포인트는 A1=B1+L_pre_target-abs(cur_itd)이고, 제1 처리 길이의 신호의 종료 포인트의 좌표는 제1 정렬 처리 길이의 신호의 종료 포인트의 좌표와 동일하다, 즉, C1=B1+L_pre_target+L_next_target-1이다.
현재 프레임의 제2 채널 신호의 시작 포인트는 B2=0이고, 현재 프레임의 제2 채널 신호의 종료 포인트는 E2=N-1이다. 제2 정렬 처리 길이의 시작 포인트는 제2 채널 신호의 시작 포인트 B2이고, 제2 정렬 처리 길이의 종료 포인트는 C2=B2+L_pre_target-1이다. 제2 처리 길이의 신호의 시작 포인트는 A2=B2+abs(prev_itd)이고, 제2 처리 길이의 신호의 종료 포인트는 C2=B2+L_pre_target-1이다.
도 7b를 참조하면, 제1 채널 신호에 대해 지연 정렬 처리를 수행하는 프로세스에서는, 제1 채널 신호에서의 포인트 H1로부터 포인트 A1-1까지의 신호가 압축 처리 이후의 제1 채널 신호에서의 포인트 B1로부터 포인트 D1-1까지의 신호로서 직접 사용되고, H1=B1-abs(cur_itd)이다. 현재 프레임의 제1 채널 신호에서의 포인트 A1로부터 포인트 C1까지의 신호는 제1 정렬 처리 길이의 신호로 압축되고, 제1 정렬 처리 길이의 압축된 신호는 압축 처리 이후의 제1 채널 신호에서의 포인트 D1로부터 포인트 C1까지의 신호로서 사용된다. 다음으로, 현재 프레임의 제1 채널 신호에서의 포인트 C1+1로부터 포인트 E1까지의 신호는 압축 처리 이후의 제1 채널 신호에서의 포인트 C1+1로부터 포인트 E1까지의 신호로서 직접 사용된다. 다음으로, 제1 지연 길이의 신호는 현재 프레임의 제2 채널 신호에서의 종료 포인트 E2 이전의 제1 지연 길이의 신호에 기초하여 수동으로 재구성되고, 제1 지연 길이의 재구성된 신호는 압축 처리 이후의 제1 채널 신호에서의 포인트 E1+1로부터 포인트 G1까지의 신호로서 사용되고, G1=E1+abs(cur_itd)-1이다. 마지막으로, 지연 정렬 처리 이후에 획득되는 신호에서의 포인트 F1로부터 포인트 G1까지의 신호는 지연 정렬 처리 이후의 현재 프레임의 제1 채널 신호로서 사용되고, F1=B1+abs(cur_itd)이다.
제2 채널 신호에 대해 지연 정렬 처리를 수행하는 프로세스에서는, 현재 프레임의 제2 채널 신호에서의 포인트 A2로부터 포인트 C2까지의 신호가 제2 정렬 처리 길이의 신호로 신장되고, 제2 정렬 처리 길이의 신장된 신호는 신장 처리 이후의 제2 채널 신호에서의 포인트 B2로부터 포인트 C2까지의 신호로서 사용된다. 다음으로, 현재 프레임의 제2 채널 신호에서의 포인트 C2+1로부터 포인트 E2까지의 신호는 신장 처리 이후의 제2 채널 신호에서의 포인트 C2+1로부터 포인트 E2까지의 신호로서 직접 사용된다. 마지막으로, 지연 정렬 처리 이후에 획득되는 신호에서의 포인트 B2로부터 포인트 E2까지의 신호는 지연 정렬 처리 이후의 현재 프레임의 제2 채널 신호로서 사용된다.
프레임들 사이의 평활화를 추가하기 위해, 전이 섹션이 또한 설정될 수 있고, 전이 섹션 길이는 ts이다. 선택적으로, 평활 전이 섹션의 길이가 추가로 설정될 수 있고, 평활 전이 섹션의 길이는 Ts2이다. 구체적인 방법에 대해서는, 전술한 설명을 참조한다. 상세사항들은 본 명세서에 설명되지 않는다.
본 출원의 이러한 실시예에서, 현재 프레임의 채널간 시간 차이의 부호가 이전 프레임의 채널간 시간 차이의 부호와 동일하다고 결정되면, 현재 프레임의 채널간 시간 차이 및 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 타겟 채널의 신호에 대해 지연 정렬 처리가 수행될 수 있다. 이러한 경우, 현재 프레임의 타겟 채널 및 이전 프레임의 타겟 채널은 동일한 채널이다. 구체적인 지연 정렬 처리 방법은 본 출원의 이러한 실시예에서 제한되지 않는다.
예를 들어, 가능한 처리 방법은 다음과 같다:
단계 1: 현재 프레임의 추정된 채널간 시간 차이를 현재 프레임의 채널간 시간 차이로서 사용함.
단계 2: 현재 프레임의 채널간 시간 차이 및 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 참조 채널 및 타겟 채널을 선택함. 현재 프레임의 채널간 시간 차이는 cur_itd로서 표기되고, 이전 프레임의 채널간 시간 차이는 prev_itd로서 표기된다. 구체적으로, cur_itd=0이면, 현재 프레임의 타겟 채널은 이전 프레임의 타겟 채널과 일치한다. 예를 들어, 현재 프레임의 타겟 채널 인덱스는 target_idx로서 표기되고, 이전 프레임의 타겟 채널 인덱스는 prev_target_idx로서 표기되고, target_idx=prev_target_idx이다. cur_itd<0이면, 현재 프레임의 타겟 채널은 좌측 채널이다. 예를 들어, 현재 프레임의 타겟 채널 인덱스는 target_idx로서 표기되고, target_idx=0이다. cur_itd>0이면, 현재 프레임의 타겟 채널은 우측 채널이다. 예를 들어, 현재 프레임의 타겟 채널 인덱스는 target_idx로서 표기되고, target_idx=1이다.
또한, 현재 프레임의 타겟 채널 인덱스가 추가로 인코딩되어 코드 스트림에 기입될 수 있고, 이러한 코드 스트림은 디코더 사이드에 송신된다.
단계 3: 현재 프레임의 채널간 시간 차이 및 이전 프레임의 채널간 시간 차이에 기초하여 선택된 타겟 채널의 신호에 대해 지연 정렬 처리를 수행함. 구체적으로, 이러한 단계는 다음과 같을 수 있다:
타겟 채널에 대응하는 채널의 사전 처리된 시간-도메인 신호는 타겟 채널의 신호로서 사용되고, 참조 채널에 대응하는 채널의 사전 처리된 시간-도메인 신호는 참조 채널의 신호로서 사용된다. 예를 들어, 타겟 채널이 좌측 채널이면, 좌측 채널의 사전 처리된 시간-도메인 신호가 타겟 채널의 신호로서 사용되고, 참조 채널이 우측 채널이면, 우측 채널의 사전 처리된 시간-도메인 신호가 참조 채널의 신호로서 사용된다. 타겟 채널이 우측 채널이면, 우측 채널의 사전 처리된 시간-도메인 신호가 타겟 채널의 신호로서 사용되고, 참조 채널이 좌측 채널이면, 좌측 채널의 사전 처리된 시간-도메인 신호가 참조 채널의 신호로서 사용된다.
abs(cur_itd)가 abs(prev_itd)와 동일하면, 타겟 채널의 신호는 압축 또는 신장되지 않는다. abs(cur_itd)-point 신호는 참조 채널 신호에 기초하여 수동으로 재구성되고, 현재 프레임의 타겟 채널 신호의 포인트 B+N으로부터 포인트 B+N+abs(cur_itd)-1까지의 신호로서 사용된다. 현재 프레임의 타겟 채널 신호는 abs(cur_itd) 샘플링 포인트들에 의해 직접 지연되고, 지연 정렬 처리 이후의 현재 프레임의 타겟 채널 신호로서 사용된다. B는 현재 프레임의 타겟 채널 신호에서의 시작 포인트의 좌표를 표현하고, N은 현재 프레임의 프레임 길이를 표현하고, abs()는 동작을 취하는 절대 값을 표현한다. 현재 프레임의 참조 채널 신호는 지연 정렬 처리 이후의 현재 프레임의 참조 채널 신호로서 직접 사용된다.
abs(cur_itd)가 abs(prev_itd) 미만이면, 버퍼링된 타겟 채널 신호의 포인트 B+abs(prev_itd)-abs(cur_itd)로부터 포인트 B+L-1까지의 신호는 L 포인트들의 길이의 신호로 신장되고, 이는 신장 처리 이후의 타겟 채널 신호의 제1 L 포인트들의 신호로서 사용된다. 타겟 채널 신호에서의 포인트 B+L로부터 포인트 B+N-1까지의 신호는 신장 처리 이후의 타겟 채널 신호에서의 포인트 B+L로부터 포인트 B+N-1까지의 신호로서 직접 사용된다. abs(cur_itd)-point 신호는 참조 채널 신호에 기초하여 수동으로 재구성되고 신장 처리 이후의 타겟 채널 신호의 포인트 B+N으로부터 포인트 B+N+abs(cur_itd)-1까지의 신호로서 사용된다. 신장 처리 이후의 타겟 채널 신호에서의 포인트 B+abs(cur_itd)로부터 시작하는 N-point 신호는 지연 정렬 처리 이후의 현재 프레임의 타겟 채널 신호로서 사용된다. 현재 프레임의 참조 채널 신호는 지연 정렬 처리 이후의 현재 프레임의 참조 채널 신호로서 직접 사용된다. B는 현재 프레임의 타겟 채널 신호에서의 시작 포인트의 좌표를 표현하고, N은 현재 프레임의 프레임 길이를 표현하고, L은 지연 정렬 처리의 처리 길이를 표현한다.
abs(cur_itd)가 abs(prev_itd)보다 크면, 버퍼링된 타겟 채널 신호의 포인트 B+abs(prev_itd)-abs(cur_itd)로부터 포인트 B+L-1까지의 신호는 L 포인트들의 길이의 신호로 압축되고, 이는 압축 처리 이후의 타겟 채널 신호의 제1 L 포인트들의 신호로서 사용된다. 타겟 채널 신호에서의 포인트 B+L로부터 포인트 B+N-1까지의 신호는 압축 처리 이후의 타겟 채널 신호에서의 포인트 B+L로부터 포인트 B+N-1까지의 신호로서 직접 사용된다. abs(cur_itd)-point 신호는 참조 채널 신호에 기초하여 수동으로 재구성되고 압축 처리 이후의 타겟 채널 신호의 포인트 B+N으로부터 포인트 B+N+abs(cur_itd)-1까지의 신호로서 사용된다. 압축 처리 이후의 타겟 채널 신호에서의 포인트 B+abs(cur_itd)로부터 시작하는 N-point 신호는 지연 정렬 처리 이후의 현재 프레임의 타겟 채널 신호로서 사용된다. 현재 프레임의 참조 채널 신호는 지연 정렬 처리 이후의 현재 프레임의 참조 채널 신호로서 직접 사용된다. B는 현재 프레임의 타겟 채널 신호에서의 시작 포인트의 좌표를 표현하고, N은 현재 프레임의 프레임 길이를 표현하고, L은 지연 정렬 처리의 처리 길이를 표현한다.
프레임들 사이의 평활화를 추가하기 위해, 전이 섹션이 본 명세서에서 설정될 수 있고, 전이 섹션 길이는 ts이다. 제1 전이 섹션 길이는 미리 설정된 양의 정수로 설정될 수 있고, 미리 설정된 양의 정수는 해당 분야에서의 기술자에 의한 경험에 기초하여 설정될 수 있다. 예를 들어, 제1 전이 섹션 길이는 대안적으로 현재 프레임의 채널간 시간 차이에 기초하여 계산될 수 있다. 예를 들어, ts=abs(cur_itd)/2이다. 유사하게, 실제 신호와 재구성된 신호 사이의 평활화를 추가하기 위해, 평활 전이 섹션이 추가로 설정될 수 있고, 평활 전이 섹션의 길이는 Ts2이다. 평활 전이 섹션의 길이는 미리 설정된 양의 정수로 설정될 수 있다. 예를 들어, Ts2는 10으로 설정된다. 다음으로, 현재 프레임의 채널간 시간 차이 및 이전 프레임의 채널간 시간 차이에 기초하여 선택된 타겟 채널의 신호에 대해 지연 정렬 처리를 수행하는 단계 3은 다음과 같이 변경될 수 있다:
abs(cur_itd)가 abs(prev_itd) 미만이면, 버퍼링된 타겟 채널 신호의 포인트 B-ts+abs(prev_itd)-abs(cur_itd)로부터 포인트 B+L-ts-1까지의 신호는 L의 길이의 신호로 신장되고, 이는 신장 처리 이후의 타겟 채널 신호의 포인트 B-ts로부터 포인트 B+L-ts-1까지의 신호로서 사용된다. 타겟 채널 신호에서의 포인트 B+L-ts로부터 포인트 B+N-Ts2-1까지의 신호는 신장 처리 이후의 타겟 채널에서의 포인트 B+L-ts로부터 포인트 B+N-Ts2-1까지의 신호로서 직접 사용된다. Ts2-point 신호는 참조 채널 신호 및 타겟 채널 신호에 기초하여 생성되고, 신장 처리 이후의 타겟 채널 신호의 포인트 B+N-Ts2로부터 포인트 B+N-1까지의 신호로서 사용된다. abs(cur_itd)-point 신호는 참조 채널 신호에 기초하여 수동으로 재구성되고 신장 처리 이후의 타겟 채널 신호의 포인트 B+N으로부터 포인트 B+N+abs(cur_itd)-1까지의 신호로서 사용된다. 신장 처리 이후의 타겟 채널 신호에서의 포인트 B+abs(cur_itd)로부터 시작하는 N-point 신호는 지연 정렬 처리 이후의 현재 프레임의 타겟 채널 신호로서 사용된다. 현재 프레임의 참조 채널 신호는 지연 정렬 처리 이후의 현재 프레임의 참조 채널 신호로서 직접 사용된다. B는 현재 프레임의 타겟 채널 신호에서의 시작 포인트의 좌표를 표현하고, N은 현재 프레임의 프레임 길이를 표현하고, L은 지연 정렬 처리의 처리 길이를 표현한다.
abs(cur_itd)가 abs(prev_itd)보다 크면, 버퍼링된 타겟 채널 신호의 포인트 B-ts+abs(prev_itd)-abs(cur_itd)로부터 포인트 B+L-ts-1까지의 신호는 L 포인트들의 길이의 신호로 압축되고, 이는 압축 처리 이후의 타겟 채널 신호의 포인트 B-ts로부터 포인트 B+L-ts-1까지의 신호로서 사용된다. 타겟 채널 신호에서의 포인트 B+L-ts로부터 포인트 B+N-Ts2-1까지의 신호는 압축 처리 이후의 타겟 채널 신호에서의 포인트 B+L-ts로부터 포인트 B+N-Ts2-1까지의 신호로서 직접 사용된다. Ts2-point 신호는 참조 채널 신호 및 타겟 채널 신호에 기초하여 생성되고, 압축 처리 이후의 타겟 채널 신호의 포인트 B+N-Ts2로부터 포인트 B+N-1까지의 신호로서 사용된다. abs(cur_itd)-point 신호는 참조 채널 신호에 기초하여 수동으로 재구성되고 압축 처리 이후의 타겟 채널 신호의 포인트 B+N으로부터 포인트 B+N+abs(cur_itd)-1까지의 신호로서 사용된다. 압축 처리 이후의 타겟 채널 신호에서의 포인트 B+abs(cur_itd)로부터 시작하는 N-point 신호는 지연 정렬 처리 이후의 현재 프레임의 타겟 채널 신호로서 사용된다. 현재 프레임의 참조 채널 신호는 지연 정렬 처리 이후의 현재 프레임의 참조 채널 신호로서 직접 사용된다. B는 현재 프레임의 타겟 채널 신호에서의 시작 포인트의 좌표를 표현하고, N은 현재 프레임의 프레임 길이를 표현하고, L은 지연 정렬 처리의 처리 길이를 표현한다.
Ts2 포인트 신호가 참조 채널 신호 및 타겟 채널 신호에 기초하여 생성되고 압축 또는 신장 처리 이후의 타겟 채널 신호의 포인트 B+N-Ts2로부터 포인트 B+N-1까지의 신호로서 사용된다는 것은 구체적으로 다음과 같을 수 있다: Ts2-point 신호는 타겟 채널의 포인트 B+N-Ts2로부터 포인트 B+N-1까지의 신호 및 참조 채널의 포인트 B+N-abs(cur_itd)-Ts2로부터 포인트 B+N-abs(cur_itd)-1까지의 신호에 기초하여 생성되고, 압축 또는 신장 처리 이후의 타겟 채널 신호의 포인트 B+N-Ts2로부터 포인트 B+N-1까지의 신호로서 사용된다. abs(cur_itd)-point 신호가 참조 채널 신호에 기초하여 수동으로 재구성되고 압축 또는 신장 처리 이후의 타겟 채널 신호의 포인트 B+N으로부터 포인트 B+N+abs(cur_itd)-1까지의 신호로서 사용된다는 것은 구체적으로 다음과 같을 수 있다: abs(cur_itd)-point 신호는 참조 채널의 포인트 B+N-abs(cur_itd)로부터 포인트 B+N-1까지의 신호에 기초하여 생성되고, 압축 또는 신장 처리 이후의 타겟 채널 신호의 포인트 B+N으로부터 포인트 B+N+abs(cur_itd)-1까지의 신호로서 사용된다.
지연 정렬 처리 이후의 현재 프레임의 좌측 채널 신호는
Figure pat00067
로서 표기되고, 지연 정렬 처리 이후의 현재 프레임의 우측 채널 신호는
Figure pat00068
로서 표기되고, n은 샘플링 포인트 시퀀스 번호이고,
Figure pat00069
이다. 현재 프레임의 채널간 시간 차이의 부호에 따르면, 지연 정렬 처리 이후의 타겟 채널 신호는 지연 정렬 처리 이후의 현재 프레임의 좌측 채널 신호일 수 있고
Figure pat00070
로서 표기되거나, 또는 지연 정렬 처리 이후의 타겟 채널 신호는 지연 정렬 처리 이후의 현재 프레임의 우측 채널 신호일 수 있고
Figure pat00071
로서 표기된다. 유사하게, 지연 정렬 처리 이후의 참조 채널 신호는 지연 정렬 처리 이후의 현재 프레임의 좌측 채널 신호일 수 있고
Figure pat00072
로서 표기되거나, 또는 지연 정렬 처리 이후의 참조 채널 신호는 지연 정렬 처리 이후의 현재 프레임의 우측 채널 신호일 수 있고
Figure pat00073
로서 표기된다.
지연 정렬 처리 이후의 마지막으로 획득된 신호는 시간-도메인 다운믹싱 처리를 위해 사용되어, 시간-도메인 다운믹싱 처리 이후의 주 채널 신호 및 부 채널 신호를 획득한다. 주 채널 신호 및 부 채널 신호는 개별적으로 인코딩되어, 입력 스테레오 신호를 인코딩한다.
본 출원의 실시예는 디코딩 프로세스에 추가로 적용가능할 수 있고, 이러한 디코딩 프로세스는 인코딩 프로세스의 역 프로세스로서 고려될 수 있고, 다음에서 상세히 설명된다.
도 8은 본 출원의 실시예에 따른 스테레오 신호 처리 방법을 도시하고, 이는 다음을 포함한다:
단계 801: 수신된 코드 스트림에 기초하여 현재 프레임의 채널간 시간 차이를 결정함- 현재 프레임의 채널간 시간 차이는 현재 프레임의 제1 채널 신호와 현재 프레임의 제2 채널 신호 사이의 시간 차이임 -.
단계 801에서, 현재 프레임의 제1 채널 신호 및 현재 프레임의 제2 채널 신호는 수신된 코드 스트림에 기초하여 디코딩을 통해 추가로 획득될 수 있다.
본 출원의 이러한 실시예는, 이러한 방법이 인코더 사이드에 의해 지연 정렬 처리 이후의 제1 채널 신호 및 지연 정렬 처리 이후의 제2 채널 신호를 인코딩하기 위한 인코딩 방법에 대응한다면, 현재 프레임의 제1 채널 신호 및 현재 프레임의 제2 채널 신호를 디코딩하기 위한 방법에 대해 어떠한 제한도 설정하지 않는다. 현재 프레임의 디코딩된 제1 채널 신호, 즉, 지연 복구 처리 이전의 제1 채널 신호는 인코더 사이드 상의 지연 정렬 처리 이후의 인코딩된 제1 채널 신호에 대응한다. 현재 프레임의 디코딩된 제2 채널 신호, 즉, 지연 복구 처리 이전의 제2 채널 신호는 인코더 사이드 상의 지연 정렬 처리 이후의 인코딩된 제2 채널 신호에 대응한다.
단계 801에서, 현재 프레임의 채널간 시간 차이를 디코딩하기 위한 방법은 인코더 사이드 상의 인코딩 방법에 대응할 필요가 있다. 예를 들어, 인코더 사이드가 현재 프레임의 채널간 시간 차이의 절대 값의 코드 인덱스 및 참조 채널 인덱스를 코드 스트림에 기입하고, 이러한 코드 스트림을 디코더 사이드에 송신하면, 디코더 사이드는 수신된 코드 스트림에 기초하여 현재 프레임의 채널간 시간 차이의 절대 값 및 참조 채널 인덱스를 디코딩한다.
대안적으로, 인코더 사이드가 현재 프레임의 채널간 시간 차이의 절대 값의 코드 인덱스 및 타겟 채널 인덱스를 코드 스트림에 기입하고, 이러한 코드 스트림을 디코더 사이드에 송신하면, 디코더 사이드는 수신된 코드 스트림에 기초하여 현재 프레임의 채널간 시간 차이의 절대 값 및 타겟 채널 인덱스를 디코딩한다.
대안적으로, 인코더 사이드가 현재 프레임의 채널간 시간 차이의 코드 인덱스를 코드 스트림에 기입하고 이러한 코드 스트림을 디코더 사이드에 송신하면, 디코더 사이드는 수신된 코드 스트림에 기초하여 현재 프레임의 채널간 시간 차이를 디코딩한다.
이전 프레임의 채널간 시간 차이를 결정하는 방식에 대해서는, 본 명세서에서의 설명을 참조한다. 상세사항들은 추가로 설명되지 않는다.
단계 802: 현재 프레임의 채널간 시간 차이의 부호가 현재 프레임의 이전 프레임의 채널간 시간 차이의 부호와 상이하면, 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 복구 처리를 수행하고, 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 복구 처리를 수행함- 제1 채널 신호는 현재 프레임의 타겟 채널 신호이고, 제2 채널 신호는 이전 프레임의 타겟 채널 신호와 동일한 채널 상에 있음 -.
단계 802에서, 부호는 양의 부호 (+) 또는 음의 부호 (-)를 지칭할 수 있다. 본 출원의 이러한 실시예에서, 이전 프레임은 현재 프레임 이전에 위치되고, 현재 프레임에 인접한다. 다음에서의 설명의 용이함을 위해, 현재 프레임의 제1 채널 신호에 대응하는 채널은 제1 채널이라고 지칭되고, 현재 프레임의 제2 채널 신호에 대응하는 채널은 제2 채널이라고 지칭된다. 제1 채널은 현재 프레임의 타겟 채널이고, 다음-프레임 타겟 채널이라고 추가로 지칭될 수 있거나, 또는 현재 프레임의 표시 타겟 채널이라고 지칭될 수 있거나, 또는 현재 프레임의 이전 프레임의 타겟 채널 이외의 다른 채널이라고 지칭될 수 있다는 점이 주목되어야 한다. 대응하여, 제2 채널은 현재 프레임의 참조 채널이고, 제2 채널은 스테레오 신호의 2개 채널들에 있는 그리고 이전 프레임의 타겟 채널과 동일한 채널이고, 이전-프레임 타겟 채널이라고 추가로 지칭될 수 있거나, 또는 현재 프레임의 표시 참조 채널이라고 지칭될 수 있거나, 또는 현재 프레임의 타겟 채널 이외의 채널이라고 지칭될 수 있다. 예를 들어, 이전 프레임의 타겟 채널이 좌측 채널이면, 제1 채널 신호는 현재 프레임에서의 우측 채널 신호이고, 제2 채널 신호는 현재 프레임에서의 좌측 채널 신호이다. 이전 프레임의 타겟 채널이 우측 채널이면, 제1 채널 신호는 현재 프레임에서의 좌측 채널 신호이고, 제2 채널 신호는 현재 프레임에서의 우측 채널 신호이다.
단계 802에서, 수신된 코드 스트림에 기초하여 디코더 사이드가 현재 프레임의 채널간 시간 차이를 디코딩하면, 디코더 사이드는 현재 프레임의 채널간 시간 차이의 부호가 이전 프레임의 채널간 시간 차이의 부호와 동일한지 직접 결정할 수 있다.
수신된 코드 스트림에 기초하여 디코더 사이드가 현재 프레임의 채널간 시간 차이의 절대 값 및 현재 프레임의 참조 채널 또는 현재 프레임의 채널간 시간 차이의 절대 값 및 현재 프레임의 타겟 채널 인덱스를 디코딩하면, 디코더 사이드는, 현재 프레임의 참조 채널 및 이전 프레임의 참조 채널 인덱스에 기초하여 또는 현재 프레임의 타겟 채널 및 이전 프레임의 참조 채널 인덱스에 기초하여, 현재 프레임의 채널간 시간 차이의 부호가 이전 프레임의 채널간 시간 차이의 부호와 동일한지 결정할 필요가 있다.
본 명세서에서, 현재 프레임의 채널간 시간 차이의 절대 값 및 참조 채널 인덱스가 디코딩된다는 것이 예로서 사용된다. 구체적으로, 현재 프레임의 참조 채널 인덱스가 이전 프레임의 참조 채널 인덱스와 동일하지 않으면, 현재 프레임의 채널간 시간 차이의 부호가 이전 프레임의 채널간 시간 차이의 부호와 상이하다고 결정된다. 현재 프레임의 참조 채널 인덱스가 이전 프레임의 참조 채널 인덱스와 동일하면, 현재 프레임의 채널간 시간 차이의 부호가 이전 프레임의 채널간 시간 차이의 부호와 동일하다고 결정된다. 다른 경우에 대해서는, 본 명세서에서의 설명을 참조한다. 상세사항들은 추가로 설명되지 않는다.
디코더 사이드 상의 지연 복구 처리는 인코더 사이드 상의 지연 정렬 처리에 대응한다. 인코더 사이드가 압축을 수행하면, 디코더 사이드는 압축된 신호를 신장할 필요가 있다. 유사하게, 인코더 사이드가 신장을 수행하면, 디코더 사이드는 신장된 신호를 압축할 필요가 있다.
본 출원의 이러한 실시예에서, 디코딩 프로세스에서는, 제1 채널 신호 및 제2 채널 신호에 대해 지연 복구 처리를 수행하기 위한 복수의 방법들이 존재하고, 이들은 다음에서 개별적으로 설명된다.
1. 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 복구 처리를 수행함.
구체적으로, 현재 프레임의 제1 채널 신호에서의 제3 처리 길이의 신호가 제3 정렬 처리 길이의 신호로 신장되어, 지연 복구 처리 이후의 현재 프레임의 제1 채널 신호를 획득한다. 제3 처리 길이는 현재 프레임의 채널간 시간 차이 및 제3 정렬 처리 길이에 기초하여 결정되고, 제3 처리 길이는 제3 정렬 처리 길이 미만이다.
디코딩 프로세스에서는, 제3 처리 길이가 제3 정렬 처리 길이와 현재 프레임의 채널간 시간 차이의 절대 값 사이의 차이일 수 있고, 제3 정렬 처리 길이가 미리 설정된 길이일 수 있거나, 또는 다른 방식으로 결정될 수 있다, 예를 들어, 수학식 8에 따라 결정될 수 있다. 본 출원의 이러한 실시예에서, 제3 정렬 처리 길이는 현재 프레임의 프레임 길이 이하이다. 제3 정렬 처리 길이가 미리 설정될 때, 제3 정렬 처리 길이는 L, L/2, L/3, 또는 L 이하인 임의의 길이이다. L은 현재 샘플링 레이트에서의 대응하는 프레임 길이 N 이하인 그리고 채널간 시간 차이의 절대 값의 최대 값보다 큰 임의의 미리 설정된 양의 정수이다. 예를 들어, L=290 또는 L=200이다. 본 출원의 이러한 실시예에서, L은 상이한 샘플링 레이트들에 대해 상이한 값들로 설정될 수 있거나, 또는 균일한 값일 수 있다. 일반적으로, 기술자의 경험에 기초하여 값이 미리 설정될 수 있다. 예를 들어, 샘플링 레이트가 16 KHz일 때, L은 290으로 설정된다. 이러한 경우, 제3 정렬 처리 길이는 L/2=145이다.
본 출원의 이러한 실시예에서, 제3 처리 길이의 신호의 시작 포인트는 제3 정렬 처리 길이의 신호의 시작 포인트 이후에 위치되고, 제3 처리 길이의 신호의 시작 포인트와 제3 정렬 처리 길이의 신호의 시작 포인트 사이의 길이는 현재 프레임의 채널간 시간 차이의 절대 값이다.
본 출원의 이러한 실시예에서, 제3 정렬 처리 길이는 L2_next_target에 의해 표현될 수 있고, 제4 정렬 처리 길이는 L2_pre_target에 의해 표현될 수 있다. 인코더 사이드의 제1 정렬 처리 길이는 실제로 인코더 사이드에 대응하는 디코더 사이드의 제3 정렬 처리 길이와 동일하다는 점이 주목되어야 한다. 대응하여, 인코더 사이드의 제2 정렬 처리 길이는 인코더 사이드에 대응하는 디코더 사이드의 제4 정렬 처리 길이와 실제로 동일하다. 설명의 용이함을 위해, 본 명세서에서는 이러한 길이들을 표현하는데 상이한 마크들이 사용된다. 현재 프레임의 채널간 시간 차이는 cur_itd이고, abs(cur_itd)는 현재 프레임의 채널간 시간 차이의 절대 값을 표현한다. 설명의 용이함을 위해, abs(cur_itd)는 다음의 설명에서 제1 지연 길이라고 지칭된다. 이전 프레임의 채널간 시간 차이는 prev_itd이고, abs(prev_itd)는 이전 프레임의 채널간 시간 차이의 절대 값을 표현한다. 설명의 용이함을 위해, abs(prev_itd)는 다음의 설명에서 제2 지연 길이라고 지칭된다.
디코딩 프로세스에서는, 제3 처리 길이의 신호의 구체적인 위치가 상이한 실제 조건들에 기초하여 결정될 수 있고, 이들은 다음에서 개별적으로 설명된다:
제1 가능한 경우:
도 9는 본 출원의 실시예에 따른 스테레오 신호 처리의 개략도이다. 도 9에서, 설명의 용이함을 위해, 동일한 위치에 있는 지연 복구 처리 이전의 제1 채널 신호에서의 포인트 및 신장 처리 이후의 제1 채널 신호에서의 포인트는 동일한 좌표를 사용하여 마킹되지만, 이러한 것이 좌표가 동일한 포인트들에서의 신호들이 동일하다는 점을 의미하는 것은 아니다.
도 9에서, 현재 프레임의 프레임 길이는 N이고, 현재 프레임의 제1 채널 신호의 시작 포인트는 B3=0이고, 현재 프레임의 제1 채널 신호의 종료 포인트는 E3=N-1이다. 제3 처리 길이의 신호의 시작 포인트는 현재 프레임의 제1 채널 신호의 시작 포인트 B3에 위치되고, 제3 처리 길이의 신호의 종료 포인트는 C3=B3-abs(cur_itd)+L2_next_target-1이다.
도 9에서, 제3 정렬 처리 길이의 시작 포인트는 A3=B3-abs(cur_itd)이고, 제3 정렬 처리 길이의 신호의 종료 포인트는 C3이고, 이는 제3 처리 길이의 신호의 종료 포인트의 좌표와 동일하다.
지연 복구 처리의 프로세스에서는, 도 9를 참조하면, 현재 프레임의 제1 채널 신호에서의 포인트 B3으로부터 포인트 C3까지의 신호가 제3 정렬 처리 길이의 신호로 신장되고, 제3 정렬 처리 길이의 신장된 신호는 신장 처리 이후의 제1 채널 신호에서의 제3 정렬 처리 길이의 시작 포인트 A3으로부터 시작하는 제3 정렬 처리 길이의 신호로서 사용된다, 즉, 신장 처리 이후의 제1 채널 신호에서의 제3 정렬 처리 길이의 시작 포인트 A3으로부터 포인트 C3까지의 신호로서 사용된다.
본 출원의 이러한 실시예에서, 신호 신장 동안, 현재 프레임의 제1 채널 신호에서의 포인트 C3+1로부터 포인트 E3까지의 신호가 신장 처리 이후의 제1 채널 신호에서의 포인트 C3+1로부터 포인트 E3까지의 신호로서 직접 사용될 수 있다.
마지막으로, 신장 처리 이후의 제1 채널 신호에서, 시작 포인트 A3으로부터 시작하는 N개의 샘플링 포인트들이 지연 복구 처리 이후의 현재 프레임의 제1 채널 신호로서 사용된다. 즉, 지연 복구 처리 이후의 현재 프레임의 제1 채널 신호의 시작 포인트는 포인트 A3이고, 종료 포인트는 포인트 G3이고, G3=E3-abs(cur_itd)이다.
일반적으로, 제3 처리 길이의 신호의 시작 포인트는 대안적으로 제1 채널 신호의 시작 포인트 이후에 위치될 수 있다. 그러나, 제3 처리 길이의 신호의 시작 포인트가 제1 채널 신호의 시작 포인트 이후에 위치될 때, 제3 처리 길이의 신호의 시작 포인트와 현재 프레임의 제1 채널 신호의 종료 포인트 사이의 길이가 제3 정렬 처리 길이와 현재 프레임의 채널간 시간 차이의 절대 값 사이의 차이 이상이라는 점이 보장될 필요가 있고, 이는 아래에 상세히 설명된다.
제2 가능한 경우:
도 10은 본 출원의 실시예에 따른 스테레오 신호 처리의 개략도이다. 도 10에서, 설명의 용이함을 위해, 동일한 위치에 있는 지연 복구 처리 이전의 제1 채널 신호에서의 포인트 및 신장 처리 이후의 제1 채널 신호에서의 포인트는 동일한 좌표를 사용하여 마킹되지만, 이러한 것이 좌표가 동일한 포인트들에서의 신호들이 동일하다는 점을 의미하는 것은 아니다.
도 10에서, 현재 프레임의 프레임 길이는 N이고, 현재 프레임의 제1 채널 신호의 시작 포인트는 B3=0이고, 현재 프레임의 제1 채널 신호의 종료 포인트는 E3=N-1이다.
도 10에서, 제3 처리 길이의 시작 포인트는 D3이고, 제3 처리 길이의 신호의 종료 포인트는 C3=D3-abs(cur_itd)+L2_next_target-1이다. A3은 제3 정렬 처리 길이의 신호의 시작 포인트이고 A3=D3-abs(cur_itd)이다. 제3 정렬 처리 길이의 신호의 종료 포인트의 좌표는 제3 처리 길이의 신호의 종료 포인트 C3의 좌표와 동일하다, 즉, C3=A3+L2_next_target-1=D3-abs(cur_itd)+L2_next_target-1이다. 제3 처리 길이의 신호의 시작 포인트 D3은 현재 프레임의 제1 채널 신호의 시작 포인트 B3 이후에 위치되고, 제3 처리 길이의 신호의 시작 포인트와 현재 프레임의 제1 채널 신호의 종료 포인트 사이의 길이는 제3 정렬 처리 길이와 현재 프레임의 채널간 시간 차이의 절대 값 사이의 차이 이상이다. 제3 처리 길이의 신호의 시작 포인트 D3과 현재 프레임의 제1 채널 신호의 시작 포인트 B3 사이의 길이는 제3 미리 설정된 길이이다. 제3 미리 설정된 길이는 실제 상황에 기초하여 결정될 수 있고, 제3 미리 설정된 길이는 0보다 크고 현재 프레임의 프레임 길이와 제3 처리 길이 사이의 차이 이하이다. 도 10에서, 제3 미리 설정된 길이가 현재 프레임의 채널간 시간 차이의 절대 값보다 크다는 점은 설명을 위한 예로서 사용된다. 제3 미리 설정된 길이의 다른 경우에 대해서는, 본 명세서에서의 설명을 참조한다.
도 10에서, 제3 처리 길이의 신호의 시작 포인트 D3과 현재 프레임의 제1 채널 신호의 시작 포인트 B3 사이의 길이는 제3 미리 설정된 길이이고, 제3 정렬 처리 길이의 신호의 시작 포인트는 A3이고, A3=D3-abs(cur_itd)이다. H3은 현재 프레임의 제1 채널 신호의 시작 포인트 B3 이전에 위치되고, H3과 A3 사이의 길이는 제3 미리 설정된 길이이고, H3과 B3 사이의 길이는 현재 프레임의 채널간 시간 차이의 절대 값이다, 즉, H3=B3-abs(cur_itd)이다.
포인트 A3은 현재 프레임의 제1 채널 신호의 시작 포인트 B3 이전에 위치될 수 있고, 포인트 A3과 현재 프레임의 제1 채널 신호의 시작 포인트 B3 사이의 길이는 현재 프레임의 채널간 시간 차이의 절대 값 이하이라는 점이 주목되어야 한다. 포인트 A3은 현재 프레임의 제1 채널 신호의 시작 포인트 B3에 위치될 수 있다. 포인트 A3은 대안적으로 현재 프레임의 제1 채널 신호의 시작 포인트 B3 이후에 위치될 수 있고, 포인트 A3과 현재 프레임의 제1 채널 신호의 시작 포인트 B3 사이의 길이는 현재 프레임의 프레임 길이와 제3 정렬 처리 길이 사이의 차이 이하이다. 포인트 A3이 전술한 위치들에 있는 경우들에 대해서는, 본 명세서에서의 설명을 참조한다. 상세사항들은 추가로 설명되지 않는다.
지연 복구 처리의 프로세스에서는, 현재 프레임의 제1 채널 신호의 시작 포인트 B3으로부터 시작하는 제3 미리 설정된 길이의 신호가 제3 정렬 처리 길이의 시작 포인트 A3 이전의 제3 미리 설정된 길이의 신호로서 사용될 수 있다. 도 10을 참조하면, 현재 프레임의 제1 채널 신호에서의 포인트 B3으로부터 포인트 D3-1까지의 신호가 지연 복구 처리 이후의 제1 채널 신호에서의 포인트 H3으로부터 포인트 A3-1까지의 신호로서 사용된다.
다음으로, 현재 프레임의 제1 채널 신호의 시작 포인트로부터 시작하는 제3 처리 길이의 신호가 제3 정렬 처리 길이의 신호로 신장될 수 있고, 제3 정렬 처리 길이의 신장된 신호는 신장 처리 이후의 제1 채널 신호에서의 제3 정렬 처리 길이의 시작 포인트로부터 시작하는 제3 정렬 처리 길이의 신호로서 사용된다. 도 10을 참조하면, 현재 프레임의 제1 채널 신호에서의 시작 포인트 D3으로부터 포인트 C3까지의 신호가 제3 정렬 처리 길이의 신호로 신장되고, 신장 처리 이후의 제1 채널 신호에서의 포인트 A3으로부터 포인트 C3까지의 신호로서 사용된다.
다음으로, 현재 프레임의 제1 채널 신호에서의 포인트 C3+1로부터 포인트 E3까지의 신호는 신장 처리 이후의 제1 채널 신호에서의 포인트 C3+1로부터 포인트 E3까지의 신호로서 사용된다.
마지막으로, 신장 처리 이후의 제1 채널 신호에서의 시작 포인트 H3으로부터 시작하는 N-point 신호는 지연 복구 처리 이후의 현재 프레임의 제1 채널 신호로서 사용된다. 지연 복구 처리 이후의 현재 프레임의 제1 채널 신호의 시작 포인트는 포인트 H3이고, 종료 포인트는 포인트 G3이고, G3=E3-abs(cur_itd)이다.
2. 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 복구 처리를 수행함
구체적으로, 현재 프레임의 제2 채널 신호에서의 제4 처리 길이의 신호가 제4 정렬 처리 길이의 신호로 압축되어, 지연 복구 처리 이후의 현재 프레임의 제2 채널 신호를 획득한다. 제4 처리 길이는 이전 프레임의 채널간 시간 차이 및 제4 정렬 처리 길이에 기초하여 결정되고, 제4 처리 길이는 제4 정렬 처리 길이보다 크다.
본 출원의 이러한 실시예에서, 제4 처리 길이는 이전 프레임의 채널간 시간 차이의 절대 값 및 제4 정렬 처리 길이의 합일 수 있다. 또한, 제4 처리 길이의 신호의 시작 포인트는 제4 정렬 처리 길이의 신호의 시작 포인트 이전에 위치되고, 제4 처리 길이의 신호의 시작 포인트와 제4 정렬 처리 길이의 신호의 시작 포인트 사이의 길이는 이전 프레임의 채널간 시간 차이의 절대 값이다.
제4 정렬 처리 길이는 미리 설정된 길이일 수 있거나, 또는 다른 방식으로 결정될 수 있고, 예를 들어, 수학식 9에 따라 결정된다는 점이 주목되어야 한다. 본 출원의 이러한 실시예에서, 제4 정렬 처리 길이가 현재 프레임의 프레임 길이 이하이고, 제4 정렬 처리 길이가 미리 설정될 때, 제4 정렬 처리 길이는 L, L/2, L/3, 또는 L 이하인 임의의 길이일 수 있다.
본 출원의 이러한 실시예에서, 제4 정렬 처리 길이의 신호의 시작 포인트는 현재 프레임의 제2 채널 신호의 시작 포인트에 위치될 수 있거나, 또는 현재 프레임의 제2 채널 신호의 시작 포인트 이후에 위치될 수 있다. 그러나, 어느 경우에든 상관없이, 제4 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제2 채널 신호의 종료 포인트 사이의 길이는 제4 정렬 처리 길이 이상이고, 이는 다음에서 개별적으로 설명된다.
제1 가능한 경우:
도 11은 본 출원의 실시예에 따른 스테레오 신호 처리의 개략도이다. 도 11에서, 설명의 용이함을 위해, 동일한 위치에 있는 지연 복구 처리 이전의 제2 채널 신호에서의 포인트 및 압축 처리 이후의 제2 채널 신호에서의 포인트는 동일한 좌표를 사용하여 마킹되지만, 이러한 것이 좌표가 동일한 포인트들에서의 신호들이 동일하다는 점을 의미하는 것은 아니다.
도 11에서, 현재 프레임의 프레임 길이는 N이고, 현재 프레임의 제2 채널 신호의 시작 포인트는 B4=0이고, 현재 프레임의 제2 채널 신호의 종료 포인트는 E4=N-1이다.
제4 정렬 처리 길이의 신호의 시작 포인트는 현재 프레임의 제2 채널 신호의 시작 포인트 B4에 위치되고, 제4 정렬 처리 길이의 신호의 종료 포인트는 C4=B4+L2_pre_target-1이다. 제4 처리 길이의 신호의 시작 포인트는 A4=B4-abs(prev_itd)이고, 제4 처리 길이의 신호의 종료 포인트는 C4이고, 이는 제4 정렬 처리 길이의 신호의 시작 포인트의 좌표와 동일하다.
지연 복구 처리의 프로세스에서는, 제4 처리 길이의 신호의 시작 포인트로부터 시작하는 제4 처리 길이의 신호가 제4 정렬 처리 길이의 신호로 압축될 수 있고, 제4 정렬 처리 길이의 압축된 신호는 압축 처리 이후의 제2 채널 신호에서의 포인트 B4로부터 시작하는 제4 정렬 처리 길이의 신호로서 사용된다. 도 11을 참조하면, 포인트 A4로부터 포인트 C4까지의 신호가 제4 정렬 처리 길이의 신호로 압축되고, 제4 정렬 처리 길이의 압축된 신호는 압축 처리 이후의 제2 채널 신호에서의 포인트 B4로부터 포인트 C4까지의 신호로서 사용된다.
다음으로, 현재 프레임의 제2 채널 신호에서의 포인트 C4+1로부터 포인트 E4까지의 신호는 압축 처리 이후의 제2 채널 신호에서의 포인트 C4+1로부터 포인트 E4까지의 신호로서 사용된다.
마지막으로, 압축 처리 이후의 제2 채널 신호에서의 시작 포인트 B4로부터 시작하는 N-point 신호는 지연 복구 처리 이후의 현재 프레임의 제2 채널 신호로서 사용된다, 즉, 지연 정렬 처리 이후의 현재 프레임의 제2 채널 신호의 시작 포인트는 포인트 B4이고, 종료 포인트는 포인트 E4이다.
제2 가능한 경우:
도 12는 본 출원의 실시예에 따른 스테레오 신호 처리의 개략도이다. 도 12에서, 설명의 용이함을 위해, 동일한 위치에 있는 지연 복구 처리 이전의 현재 프레임의 제2 채널 신호에서의 포인트 및 압축 처리 이후의 현재 프레임의 제2 채널 신호에서의 포인트는 동일한 좌표를 사용하여 마킹되지만, 이러한 것이 좌표가 동일한 포인트들에서의 신호들이 동일하다는 점을 의미하는 것은 아니다.
도 12에서, 현재 프레임의 프레임 길이는 N이고, 현재 프레임의 제1 채널 신호의 시작 포인트는 B4=0이고, 현재 프레임의 제1 채널 신호의 종료 포인트는 E4=N-1이다.
제4 정렬 처리 길이의 신호의 시작 포인트는 D4이고, 제4 정렬 처리 길이의 신호의 종료 포인트는 C4=D4+L2_pre_target-1이다. 제4 정렬 처리 길이의 신호의 시작 포인트 D4는 현재 프레임의 제2 채널 신호의 시작 포인트 B4 이후에 위치되고, 제4 정렬 처리 길이의 신호의 시작 포인트 D4와 현재 프레임의 제2 채널 신호의 종료 포인트 E4 사이의 길이는 제4 정렬 처리 길이 이상이다.
설명의 용이함을 위해, 제4 정렬 처리 길이의 신호의 시작 포인트 D4와 현재 프레임의 제2 채널 신호의 시작 포인트 B4 사이의 길이는 제4 미리 설정된 길이이고, 제4 미리 설정된 길이는 0보다 크고 현재 프레임의 프레임 길이와 제4 정렬 처리 길이 사이의 차이 이하이다.
제4 처리 길이의 신호의 시작 포인트는 A4=D4-abs(prev_itd)이고, 제4 처리 길이의 신호의 종료 포인트는 C4이고, 이는 제4 정렬 처리 길이의 신호의 시작 포인트의 좌표와 동일하다.
도 12에서, 포인트 H4와 포인트 A4 사이의 길이는 제4 미리 설정된 길이이고, 포인트 H4와 포인트 B4 사이의 길이는 이전 프레임의 채널간 시간 차이의 절대 값이다, 즉, H4=B4-abs(prev_itd)이다.
지연 복구 처리의 프로세스에서는, 현재 프레임의 제2 채널 신호에서의 제4 미리 설정된 길이의 신호의 시작 포인트 이전의 제4 처리 길이의 신호가 압축 처리 이후의 제2 채널 신호에서의 포인트 B4로부터 시작하는 제4 미리 설정된 길이의 신호로서 직접 사용될 수 있다. 도 12를 참조하면, 포인트 H4로부터 포인트 A4-1까지의 신호는 압축 처리 이후의 제2 채널 신호에서의 포인트 B4로부터 포인트 D4-1까지의 신호로서 사용된다.
다음으로, 현재 프레임의 제2 채널 신호에서의 제4 처리 길이의 신호의 시작 포인트로부터 시작하는 제4 처리 길이의 신호가 제4 정렬 처리 길이의 신호로 압축될 수 있고, 제4 정렬 처리 길이의 압축된 신호는 압축 처리 이후의 제2 채널 신호에서의 제4 정렬 처리 길이의 신호의 시작 포인트로부터 시작하는 제4 정렬 처리 길이의 신호로서 사용된다. 도 12를 참조하면, 현재 프레임의 제2 채널 신호에서의 포인트 A4로부터 포인트 C4까지의 신호가 제4 정렬 처리 길이의 신호로 압축되고, 제4 정렬 처리 길이의 압축된 신호는 압축 처리 이후의 제2 채널 신호에서의 포인트 D4로부터 포인트 C4까지의 신호로서 사용된다.
다음으로, 현재 프레임의 제2 채널 신호에서의 압축되지 않은 신호는 변경되지 않은 채로 유지된다, 즉, 현재 프레임의 제2 채널 신호에서의 포인트 C4+1로부터 포인트 E4까지의 신호는 압축 처리 이후의 제2 채널 신호에서의 포인트 C4+1로부터 포인트 E4까지의 신호로서 사용된다.
마지막으로, 압축 처리 이후의 제2 채널 신호에서의 시작 포인트 B4로부터 시작하는 N-point 신호는 지연 복구 처리 이후의 현재 프레임의 제2 채널 신호로서 사용된다.
다음은 구체적인 실시예를 사용하여 설명을 제공한다.
단계 1: 수신된 코드 스트림에 기초하여 현재 프레임의 채널간 시간 차이를 결정함.
이러한 단계의 구체적인 내용에 대해서는, 단계 801을 참조한다. 상세사항들은 본 명세서에 다시 설명되지 않는다.
단계 2: 현재 프레임의 채널간 시간 차이의 부호가 이전 프레임의 채널간 시간 차이의 부호와 상이하면, 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 복구 처리를 수행함.
단계 3: 현재 프레임의 채널간 시간 차이의 부호가 이전 프레임의 채널간 시간 차이의 부호와 상이하면, 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 복구 처리를 수행함.
단계 2 및 단계 3에서, 제4 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제2 채널 신호의 시작 포인트 사이의 길이는 제4 미리 설정된 길이와 동일하고; 제3 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제1 채널 신호의 시작 포인트 사이의 길이는 제4 미리 설정된 길이 및 제4 정렬 처리 길이의 합과 동일하다. 또한, 제3 정렬 처리 길이는 수학식 8을 충족하고, 제4 정렬 처리 길이는 수학식 9를 충족한다. 이러한 경우, 도 13에 도시되는 바와 같이 제3 처리 길이의 신호는 신장되고 제4 처리 길이의 신호는 압축된다. 도 13에서는, 제4 정렬 처리 길이의 시작 포인트가 현재 프레임의 제1 채널 신호의 시작 포인트에 위치되는 예가 설명을 위해 사용된다. 제4 정렬 처리 길이의 시작 포인트가 다른 위치에 위치될 때는, 제4 정렬 처리 길이의 시작 포인트가 현재 프레임의 제2 채널 신호의 시작 포인트 B4 이후에 위치될 때 제2 채널 신호에 대해 지연 복구 처리가 수행되는 설명, 및 이러한 경우에 제1 채널 신호에 대해 지연 복구 처리가 수행되는 설명을 참조한다. 상세사항들은 본 명세서에 설명되지 않는다.
도 13에서, 현재 프레임의 프레임 길이는 N이고, 현재 프레임의 제2 채널 신호의 시작 포인트는 B4=0이고, 현재 프레임의 제2 채널 신호의 종료 포인트는 E4=N-1이다. 제4 정렬 처리 길이의 신호의 시작 포인트는 현재 프레임의 제2 채널 신호의 시작 포인트 B4에 위치되고, 제4 정렬 처리 길이의 신호의 종료 포인트는 C4=B4+L2_pre_target-1이다. 제4 처리 길이의 신호의 시작 포인트는 A4=B4-abs(prev_itd)이고, 제4 처리 길이의 신호의 종료 포인트는 C4=B4+L2_pre_target-1이다.
현재 프레임의 제1 채널 신호의 시작 포인트는 B3=0이고, 현재 프레임의 제1 채널 신호의 종료 포인트는 E3=N-1이다. 제3 처리 길이의 신호의 시작 포인트는 D3=B4+L2_pre_target이고, D3=C4+1이다. 제3 처리 길이의 신호의 종료 포인트는 C3=A3+L2_next_target-1이고, 제3 정렬 처리 길이의 신호의 시작 포인트는 A3=D3-abs(cur_itd)이고, 제3 정렬 처리 길이의 신호의 종료 포인트는 C3=A3+L_next_target-1이다.
지연 복구 처리의 프로세스에서는, 제1 채널 신호에 대해, 현재 프레임의 제1 채널 신호에서의 포인트 B3으로부터 포인트 D3-1까지의 신호가 신장 처리 이후의 제1 채널 신호에서의 포인트 H3으로부터 포인트 A3-1까지의 신호로서 직접 사용되고, H3=A3-L2_pre_target이다.
다음으로, 현재 프레임의 제1 채널 신호에서의 포인트 D3으로부터 포인트 C3까지의 신호가 제3 정렬 처리 길이의 신호로 신장되고, 제3 정렬 처리 길이의 신장된 신호는 신장 처리 이후의 제1 채널 신호에서의 포인트 A3으로부터 포인트 C3까지의 신호로서 사용된다.
다음으로, 현재 프레임의 제1 채널 신호에서의 포인트 C3+1로부터 포인트 E3까지의 신호는 신장 처리 이후의 제1 채널 신호에서의 포인트 C3+1로부터 포인트 E3까지의 신호로서 사용된다.
마지막으로, 신장 처리 이후의 제1 채널 신호에서의 시작 포인트 A3으로부터 시작하는 N-point 신호는 지연 복구 처리 이후의 현재 프레임의 제1 채널 신호로서 사용된다. 지연 복구 처리 이후의 현재 프레임의 제1 채널 신호의 시작 포인트는 포인트 A3이고, 종료 포인트는 포인트 G3이고, G3=E3-abs(cur_itd)이다.
지연 복구 처리의 프로세스에서는, 제2 채널 신호에 대해, 포인트 A4로부터 포인트 C4까지의 신호가 제4 정렬 처리 길이의 신호로 압축되고, 제4 정렬 처리 길이의 압축된 신호는 압축 처리 이후의 제2 채널 신호에서의 포인트 B4로부터 포인트 C4까지의 신호로서 사용된다.
다음으로, 현재 프레임의 제2 채널 신호에서의 포인트 C4+1로부터 포인트 E4까지의 신호는 압축 처리 이후의 제2 채널 신호에서의 포인트 C4+1로부터 포인트 E4까지의 신호로서 사용된다.
마지막으로, 압축 처리 이후의 제2 채널 신호에서의 시작 포인트 B4로부터 시작하는 N-point 신호는 지연 복구 처리 이후의 현재 프레임의 제2 채널 신호로서 사용된다, 즉, 지연 정렬 처리 이후의 현재 프레임의 제2 채널 신호의 시작 포인트는 포인트 B4이고, 종료 포인트는 포인트 E4이다.
본 출원의 이러한 실시예에서, 신호 신장 또는 압축 방법은 제한되지 않는다는 점이 주목되어야 한다. 상세사항들에 대해서는, 단계 101 및 단계 102에서의 설명을 참조한다. 상세사항들은 본 명세서에 다시 설명되지 않는다.
본 출원의 이러한 실시예에서, 프레임들 사이의 전이 섹션 길이가 존재할 때, 전술한 설명을 참조한다. 상세사항들은 본 명세서에 설명되지 않는다.
동일한 기술적 개념에 기초하여, 본 출원의 실시예는 스테레오 신호 처리 장치를 추가로 제공하고, 이러한 스테레오 신호 처리 장치는 도 1에서의 방법 프로시저를 수행할 수 있다.
도 14에 도시되는 바와 같이, 본 출원의 실시예는 스테레오 신호 처리 장치의 개략 구조도를 제공한다.
도 14를 참조하면, 스테레오 신호 처리 장치(1400)는,
지연 추정 유닛(1401)- 현재 프레임의 스테레오 신호에 기초하여 지연 추정을 수행하여 현재 프레임의 채널간 시간 차이를 결정하도록 구성됨 -; 및
처리 유닛(1402)- 현재 프레임의 채널간 시간 차이의 부호가 이전 프레임의 채널간 시간 차이의 부호와 상이하다고 결정되면, 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 정렬 처리를 수행하도록, 그리고 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 정렬 처리를 수행하도록 구성됨 -을 포함하고, 제1 채널 신호는 현재 프레임의 타겟 채널 신호이고, 제2 채널 신호는 현재 프레임의 스테레오 신호에 있는 그리고 이전 프레임의 타겟 채널 신호와 동일한 채널 상에 있는 신호이다.
선택적으로, 처리 유닛(1402)은 구체적으로,
현재 프레임의 제1 채널 신호에서의 제1 처리 길이의 신호를 제1 정렬 처리 길이의 신호로 압축하여, 지연 정렬 처리 이후의 현재 프레임의 제1 채널 신호를 획득하도록 구성되고,
제1 처리 길이는 현재 프레임의 채널간 시간 차이 및 제1 정렬 처리 길이에 기초하여 결정되고, 제1 처리 길이는 제1 정렬 처리 길이보다 크다.
선택적으로, 제1 처리 길이는 현재 프레임의 채널간 시간 차이의 절대 값 및 제1 정렬 처리 길이의 합이다.
선택적으로, 제1 처리 길이의 신호의 시작 포인트는 제1 정렬 처리 길이의 신호의 시작 포인트 이전에 위치되고, 제1 처리 길이의 신호의 시작 포인트와 제1 정렬 처리 길이의 신호의 시작 포인트 사이의 길이는 현재 프레임의 채널간 시간 차이의 절대 값이다.
선택적으로, 제1 정렬 처리 길이의 신호의 시작 포인트는 현재 프레임의 제1 채널 신호의 시작 포인트에 또는 현재 프레임의 제1 채널 신호의 시작 포인트 이후에 위치되고, 제1 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제1 채널 신호의 종료 포인트 사이의 길이는 제1 정렬 처리 길이 이상이다.
선택적으로, 제1 정렬 처리 길이의 신호의 시작 포인트는 현재 프레임의 제1 채널 신호의 시작 포인트 이전에 위치되고, 제1 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제1 채널 신호의 시작 포인트 사이의 길이는 전이 섹션 길이 이하이고, 제1 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제1 채널 신호의 종료 포인트 사이의 길이는 제1 정렬 처리 길이 및 전이 섹션 길이의 합 이상이고, 전이 섹션 길이는 현재 프레임의 채널간 시간 차이의 절대 값 이하이다.
선택적으로, 처리 유닛(1402)은 구체적으로,
현재 프레임의 제2 채널 신호에서의 제2 처리 길이의 신호를 제2 정렬 처리 길이의 신호로 신장하여, 지연 정렬 처리 이후의 현재 프레임의 제2 채널 신호를 획득하도록 구성되고,
제2 처리 길이는 이전 프레임의 채널간 시간 차이 및 제2 정렬 처리 길이에 기초하여 결정되고, 제2 처리 길이는 제2 정렬 처리 길이 미만이다.
선택적으로, 제2 처리 길이는 제2 정렬 처리 길이와 이전 프레임의 채널간 시간 차이의 절대 값 사이의 차이이다.
선택적으로, 제2 처리 길이의 신호의 시작 포인트는 제2 정렬 처리 길이의 신호의 시작 포인트 이후에 위치되고, 제2 처리 길이의 신호의 시작 포인트와 제2 정렬 처리 길이의 신호의 시작 포인트 사이의 길이는 이전 프레임의 채널간 시간 차이의 절대 값이다.
선택적으로, 제2 정렬 처리 길이의 신호의 시작 포인트는 현재 프레임의 제2 채널 신호의 시작 포인트에 또는 현재 프레임의 제2 채널 신호의 시작 포인트 이후에 위치되고, 제2 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제2 채널 신호의 종료 포인트 사이의 길이는 제2 정렬 처리 길이 이상이다.
선택적으로, 제2 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제2 채널 신호의 시작 포인트 사이의 길이는 제2 미리 설정된 길이와 동일하고; 제1 정렬 처리 길이의 신호의 시작 포인트 및 현재 프레임의 제1 채널 신호의 시작 포인트 사이의 길이는 제2 미리 설정된 길이 및 제2 정렬 처리 길이의 합과 동일하다.
선택적으로, 제1 정렬 처리 길이는 현재 프레임의 프레임 길이 이하이고, 제1 정렬 처리 길이는 미리 설정된 길이이거나, 또는 제1 정렬 처리 길이는 다음의 수학식을 충족하고:
Figure pat00074
L_next_target는 제1 정렬 처리 길이이고, cur_itd는 현재 프레임의 채널간 시간 차이이고, prev_itd는 이전 프레임의 채널간 시간 차이이고, L은 지연 정렬 처리의 처리 길이이다.
선택적으로, 제2 정렬 처리 길이는 현재 프레임의 프레임 길이 이하이고, 제2 정렬 처리 길이는 미리 설정된 길이이거나, 또는 제2 정렬 처리 길이는 다음의 수학식을 충족하고:
Figure pat00075
L_pre_target는 제2 정렬 처리 길이이고, cur_itd는 현재 프레임의 채널간 시간 차이이고, prev_itd는 이전 프레임의 채널간 시간 차이이고, L은 지연 정렬 처리의 처리 길이이다.
선택적으로, 지연 정렬 처리의 처리 길이는 현재 프레임의 프레임 길이 이하이고, 지연 정렬 처리의 처리 길이는 미리 설정된 길이이거나, 또는 지연 정렬 처리의 처리 길이는 다음의 수학식을 충족하고:
Figure pat00076
L은 지연 정렬 처리의 처리 길이이고,
Figure pat00077
는 인접 프레임들의 채널간 시간 차이들 사이의 최대 차이 값이고,
Figure pat00078
는 지연 정렬 처리의 미리 설정된 처리 길이이다.
동일한 기술적 개념에 기초하여, 본 출원의 실시예는 스테레오 신호 처리 장치를 추가로 제공하고, 이러한 스테레오 신호 처리 장치는 도 1에서의 방법 프로시저를 수행할 수 있다.
도 15에 도시되는 바와 같이, 본 출원의 실시예는 스테레오 신호 처리 장치의 개략 구조도를 제공한다.
도 15를 참조하면, 스테레오 신호 처리 장치(1500)는 프로세서(1501) 및 메모리(1502)를 포함한다.
메모리(1502)는 실행가능 명령어를 저장하고, 이러한 실행가능 명령어는 프로세서(1501)에게 다음의 단계들:
현재 프레임의 스테레오 신호에 대해 지연 추정을 수행하여 현재 프레임의 채널간 시간 차이를 결정하는 단계- 현재 프레임의 채널간 시간 차이는 현재 프레임의 제1 채널 신호와 현재 프레임의 제2 채널 신호 사이의 시간 차이임 -; 및
현재 프레임의 채널간 시간 차이의 부호가 현재 프레임의 이전 프레임의 채널간 시간 차이의 부호와 상이하면, 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 정렬 처리를 수행하고, 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 정렬 처리를 수행하는 단계- 제1 채널 신호는 현재 프레임의 타겟 채널 신호이고, 제2 채널 신호는 이전 프레임의 타겟 채널 신호와 동일한 채널 상에 있음 -를 수행하라고 명령하는데 사용된다.
선택적으로, 이러한 실행가능 명령어는 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 정렬 처리를 수행할 때 프로세서(1501)에게 다음의 단계들:
현재 프레임의 제1 채널 신호에서의 제1 처리 길이의 신호를 제1 정렬 처리 길이의 신호로 압축하여, 지연 정렬 처리 이후의 현재 프레임의 제1 채널 신호를 획득하는 단계를 수행하라고 명령하는데 사용되고,
제1 처리 길이는 현재 프레임의 채널간 시간 차이 및 제1 정렬 처리 길이에 기초하여 결정되고, 제1 처리 길이는 제1 정렬 처리 길이보다 크다.
선택적으로, 제1 처리 길이는 현재 프레임의 채널간 시간 차이의 절대 값 및 제1 정렬 처리 길이의 합이다.
선택적으로, 제1 처리 길이의 신호의 시작 포인트는 제1 정렬 처리 길이의 신호의 시작 포인트 이전에 위치되고, 제1 처리 길이의 신호의 시작 포인트와 제1 정렬 처리 길이의 신호의 시작 포인트 사이의 길이는 현재 프레임의 채널간 시간 차이의 절대 값이다.
선택적으로, 제1 정렬 처리 길이의 신호의 시작 포인트는 현재 프레임의 제1 채널 신호의 시작 포인트에 또는 현재 프레임의 제1 채널 신호의 시작 포인트 이후에 위치되고, 제1 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제1 채널 신호의 종료 포인트 사이의 길이는 제1 정렬 처리 길이 이상이다.
선택적으로, 제1 정렬 처리 길이의 신호의 시작 포인트는 현재 프레임의 제1 채널 신호의 시작 포인트 이전에 위치되고, 제1 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제1 채널 신호의 시작 포인트 사이의 길이는 전이 섹션 길이 이하이고, 제1 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제1 채널 신호의 종료 포인트 사이의 길이는 제1 정렬 처리 길이 및 전이 섹션 길이의 합 이상이고, 전이 섹션 길이는 현재 프레임의 채널간 시간 차이의 절대 값 이하이다.
선택적으로, 이러한 실행가능 명령어는 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 정렬 처리를 수행할 때 프로세서(1501)에게 다음의 단계들:
현재 프레임의 제2 채널 신호에서의 제2 처리 길이의 신호를 제2 정렬 처리 길이의 신호로 신장시켜, 지연 정렬 처리 이후의 현재 프레임의 제2 채널 신호를 획득하는 단계를 수행하라고 명령하는데 사용되고,
제2 처리 길이는 이전 프레임의 채널간 시간 차이 및 제2 정렬 처리 길이에 기초하여 결정되고, 제2 처리 길이는 제2 정렬 처리 길이 미만이다.
선택적으로, 제2 처리 길이는 제2 정렬 처리 길이와 이전 프레임의 채널간 시간 차이의 절대 값 사이의 차이이다.
선택적으로, 제2 처리 길이의 신호의 시작 포인트는 제2 정렬 처리 길이의 신호의 시작 포인트 이후에 위치되고, 제2 처리 길이의 신호의 시작 포인트와 제2 정렬 처리 길이의 신호의 시작 포인트 사이의 길이는 이전 프레임의 채널간 시간 차이의 절대 값이다.
선택적으로, 제2 정렬 처리 길이의 신호의 시작 포인트는 현재 프레임의 제2 채널 신호의 시작 포인트에 또는 현재 프레임의 제2 채널 신호의 시작 포인트 이후에 위치되고, 제2 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제2 채널 신호의 종료 포인트 사이의 길이는 제2 정렬 처리 길이 이상이다.
선택적으로, 제2 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제2 채널 신호의 시작 포인트 사이의 길이는 제2 미리 설정된 길이와 동일하고; 제1 정렬 처리 길이의 신호의 시작 포인트 및 현재 프레임의 제1 채널 신호의 시작 포인트 사이의 길이는 제2 미리 설정된 길이 및 제2 정렬 처리 길이의 합과 동일하다.
선택적으로, 제1 정렬 처리 길이는 현재 프레임의 프레임 길이 이하이고, 제1 정렬 처리 길이는 미리 설정된 길이이거나, 또는 제1 정렬 처리 길이는 다음의 수학식을 충족하고:
Figure pat00079
L_next_target는 제1 정렬 처리 길이이고, cur_itd는 현재 프레임의 채널간 시간 차이이고, prev_itd는 이전 프레임의 채널간 시간 차이이고, L은 지연 정렬 처리의 처리 길이이다.
선택적으로, 제2 정렬 처리 길이는 현재 프레임의 프레임 길이 이하이고, 제2 정렬 처리 길이는 미리 설정된 길이이거나, 또는 제2 정렬 처리 길이는 다음의 수학식을 충족하고:
Figure pat00080
L_pre_target는 제2 정렬 처리 길이이고, cur_itd는 현재 프레임의 채널간 시간 차이이고, prev_itd는 이전 프레임의 채널간 시간 차이이고, L은 지연 정렬 처리의 처리 길이이다.
선택적으로, 지연 정렬 처리의 처리 길이는 현재 프레임의 프레임 길이 이하이고, 지연 정렬 처리의 처리 길이는 미리 설정된 길이이거나, 또는 지연 정렬 처리의 처리 길이는 다음의 수학식을 충족하고:
Figure pat00081
L은 지연 정렬 처리의 처리 길이이고,
Figure pat00082
는 인접 프레임들의 채널간 시간 차이들 사이의 최대 차이 값이고,
Figure pat00083
는 지연 정렬 처리의 미리 설정된 처리 길이이다.
동일한 기술적 개념에 기초하여, 본 출원의 실시예는 스테레오 신호 처리 장치를 추가로 제공하고, 이러한 스테레오 신호 처리 장치는 도 8에서의 방법 프로시저를 수행할 수 있다.
도 16에 도시되는 바와 같이, 본 출원의 실시예는 스테레오 신호 처리 장치의 개략 구조도를 제공한다.
도 16을 참조하면, 스테레오 신호 처리 장치(1600)는,
송수신기 유닛(1601)- 수신된 코드 스트림에 기초하여 현재 프레임의 채널간 시간 차이를 결정하도록 구성됨 -; 및
처리 유닛(1602)- 현재 프레임의 채널간 시간 차이의 부호가 이전 프레임의 채널간 시간 차이의 부호와 상이하면, 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 복구 처리를 수행하도록, 그리고 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 복구 처리를 수행하도록 구성됨 -을 포함하고, 제1 채널 신호는 현재 프레임의 타겟 채널 신호이고, 제2 채널 신호는 현재 프레임의 스테레오 신호에 있는 그리고 이전 프레임의 타겟 채널 신호와 동일한 채널 상에 있는 신호이다.
선택적으로, 처리 유닛(1602)은 구체적으로,
현재 프레임의 제1 채널 신호에서의 제3 정렬 처리 길이의 신호를 제3 처리 길이의 신호로 신장하여, 지연 복구 처리 이후의 현재 프레임의 제1 채널 신호를 획득하도록 구성되고,
제3 처리 길이는 현재 프레임의 채널간 시간 차이 및 제3 정렬 처리 길이에 기초하여 결정되고, 제3 처리 길이는 제3 정렬 처리 길이 미만이다.
선택적으로, 제3 처리 길이는 제3 정렬 처리 길이와 현재 프레임의 채널간 시간 차이의 절대 값 사이의 차이이다.
선택적으로, 제3 처리 길이의 신호의 시작 포인트는 제3 정렬 처리 길이의 신호의 시작 포인트 이후에 위치되고, 제3 처리 길이의 신호의 시작 포인트와 제3 정렬 처리 길이의 신호의 시작 포인트 사이의 길이는 현재 프레임의 채널간 시간 차이의 절대 값이다.
선택적으로, 제3 처리 길이의 신호의 시작 포인트는 현재 프레임의 제1 채널 신호의 시작 포인트에 또는 현재 프레임의 제1 채널 신호의 시작 포인트 이후에 위치되고, 제3 처리 길이의 신호의 시작 포인트와 현재 프레임의 제1 채널 신호의 종료 포인트 사이의 길이는 제3 정렬 처리 길이와 현재 프레임의 채널간 시간 차이의 절대 값 사이의 차이 이상이다.
선택적으로, 처리 유닛(1602)은 구체적으로,
현재 프레임의 제2 채널 신호에서의 제4 처리 길이의 신호를 제4 정렬 처리 길이의 신호로 압축하여, 지연 복구 처리 이후의 현재 프레임의 제2 채널 신호를 획득하도록 구성되고,
제4 처리 길이는 이전 프레임의 채널간 시간 차이 및 제4 정렬 처리 길이에 기초하여 결정되고, 제4 처리 길이는 제4 정렬 처리 길이보다 크다.
선택적으로, 제4 처리 길이는 이전 프레임의 채널간 시간 차이의 절대 값 및 제4 정렬 처리 길이의 합이다.
선택적으로, 제4 처리 길이의 신호의 시작 포인트는 제4 정렬 처리 길이의 신호의 시작 포인트 이전에 위치되고, 제4 처리 길이의 신호의 시작 포인트와 제4 정렬 처리 길이의 신호의 시작 포인트 사이의 길이는 이전 프레임의 채널간 시간 차이의 절대 값이다.
선택적으로, 제4 정렬 처리 길이의 신호의 시작 포인트는 현재 프레임의 제2 채널 신호의 시작 포인트에 또는 현재 프레임의 제2 채널 신호의 시작 포인트 이후에 위치되고, 제4 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제2 채널 신호의 종료 포인트 사이의 길이는 제4 정렬 처리 길이 이상이다.
선택적으로, 제4 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제2 채널 신호의 시작 포인트 사이의 길이는 제4 미리 설정된 길이와 동일하고; 제3 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제1 채널 신호의 시작 포인트 사이의 길이는 제4 미리 설정된 길이 및 제4 정렬 처리 길이의 합과 동일하다.
선택적으로, 제3 정렬 처리 길이는 현재 프레임의 프레임 길이 이하이거나, 제3 정렬 처리 길이는 미리 설정된 길이이거나, 또는 제3 정렬 처리 길이는 다음의 수학식을 충족하고:
Figure pat00084
L2_next_target는 제3 정렬 처리 길이이고, cur_itd는 현재 프레임의 채널간 시간 차이이고, prev_itd는 이전 프레임의 채널간 시간 차이이고, L은 지연 정렬 처리의 처리 길이이다.
선택적으로, 제4 정렬 처리 길이는 현재 프레임의 프레임 길이 이하이거나, 제4 정렬 처리 길이는 미리 설정된 길이이거나, 또는 제4 정렬 처리 길이는 다음의 수학식을 충족하고:
Figure pat00085
L2_pre_target는 제4 정렬 처리 길이이고, cur_itd는 현재 프레임의 채널간 시간 차이이고, prev_itd는 이전 프레임의 채널간 시간 차이이고, L은 지연 정렬 처리의 처리 길이이다.
선택적으로, 지연 정렬 처리의 처리 길이는 현재 프레임의 프레임 길이 이하이고, 지연 정렬 처리의 처리 길이는 미리 설정된 길이이거나, 또는 지연 정렬 처리의 처리 길이는 다음의 수학식을 충족하고:
Figure pat00086
L은 지연 정렬 처리의 처리 길이이고,
Figure pat00087
는 인접 프레임들의 채널간 시간 차이들 사이의 최대 차이 값이고,
Figure pat00088
는 지연 정렬 처리의 미리 설정된 처리 길이이다.
동일한 기술적 개념에 기초하여, 본 출원의 실시예는 스테레오 신호 처리 장치를 추가로 제공하고, 이러한 스테레오 신호 처리 장치는 도 8에서의 방법 프로시저를 수행할 수 있다.
도 17에 도시되는 바와 같이, 본 출원의 실시예는 스테레오 신호 처리 장치의 개략 구조도를 제공한다.
도 17을 참조하면, 스테레오 신호 처리 장치(1700)는 프로세서(1701) 및 메모리(1702)를 포함한다.
메모리(1702)는 실행가능 명령어를 저장하고, 이러한 실행가능 명령어는 프로세서(1701)에게 다음의 단계들:
수신된 코드 스트림에 기초하여 현재 프레임의 채널간 시간 차이를 결정하는 단계- 현재 프레임의 채널간 시간 차이는 현재 프레임의 제1 채널 신호와 현재 프레임의 제2 채널 신호 사이의 시간 차이임 -; 및
현재 프레임의 채널간 시간 차이의 부호가 현재 프레임의 이전 프레임의 채널간 시간 차이의 부호와 상이하면, 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 복구 처리를 수행하고, 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 복구 처리를 수행하는 단계- 제1 채널 신호는 현재 프레임의 타겟 채널 신호이고, 제2 채널 신호는 이전 프레임의 타겟 채널 신호와 동일한 채널 상에 있음 -를 수행하라고 명령하는데 사용된다.
선택적으로, 이러한 실행가능 명령어는 현재 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제1 채널 신호에 대해 지연 복구 처리를 수행할 때 프로세서(1701)에게 다음의 단계들:
현재 프레임의 제1 채널 신호에서의 제3 처리 길이의 신호를 제3 정렬 처리 길이의 신호로 신장시켜, 지연 복구 처리 이후의 현재 프레임의 제1 채널 신호를 획득하는 단계를 수행하라고 명령하는데 사용되고,
제3 처리 길이는 현재 프레임의 채널간 시간 차이 및 제3 정렬 처리 길이에 기초하여 결정되고, 제3 처리 길이는 제3 정렬 처리 길이 미만이다.
선택적으로, 제3 처리 길이는 제3 정렬 처리 길이와 현재 프레임의 채널간 시간 차이의 절대 값 사이의 차이이다.
선택적으로, 제3 처리 길이의 신호의 시작 포인트는 제3 정렬 처리 길이의 신호의 시작 포인트 이후에 위치되고, 제3 처리 길이의 신호의 시작 포인트와 제3 정렬 처리 길이의 신호의 시작 포인트 사이의 길이는 현재 프레임의 채널간 시간 차이의 절대 값이다.
선택적으로, 제3 처리 길이의 신호의 시작 포인트는 현재 프레임의 제1 채널 신호의 시작 포인트에 또는 현재 프레임의 제1 채널 신호의 시작 포인트 이후에 위치되고, 제3 처리 길이의 신호의 시작 포인트와 현재 프레임의 제1 채널 신호의 종료 포인트 사이의 길이는 제3 정렬 처리 길이와 현재 프레임의 채널간 시간 차이의 절대 값 사이의 차이 이상이다.
선택적으로, 이러한 실행가능 명령어는 이전 프레임의 채널간 시간 차이에 기초하여 현재 프레임의 제2 채널 신호에 대해 지연 복구 처리를 수행할 때 프로세서(1701)에게 다음의 단계들:
현재 프레임의 제2 채널 신호에서의 제4 처리 길이의 신호를 제4 정렬 처리 길이의 신호로 압축하여, 지연 복구 처리 이후의 현재 프레임의 제2 채널 신호를 획득하는 단계를 포함하고,
제4 처리 길이는 이전 프레임의 채널간 시간 차이 및 제4 정렬 처리 길이에 기초하여 결정되고, 제4 처리 길이는 제4 정렬 처리 길이보다 크다.
선택적으로, 제4 처리 길이는 이전 프레임의 채널간 시간 차이의 절대 값 및 제4 정렬 처리 길이의 합이다.
선택적으로, 제4 처리 길이의 신호의 시작 포인트는 제4 정렬 처리 길이의 신호의 시작 포인트 이전에 위치되고, 제4 처리 길이의 신호의 시작 포인트와 제4 정렬 처리 길이의 신호의 시작 포인트 사이의 길이는 이전 프레임의 채널간 시간 차이의 절대 값이다.
선택적으로, 제4 정렬 처리 길이의 신호의 시작 포인트는 현재 프레임의 제2 채널 신호의 시작 포인트에 또는 현재 프레임의 제2 채널 신호의 시작 포인트 이후에 위치되고, 제4 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제2 채널 신호의 종료 포인트 사이의 길이는 제4 정렬 처리 길이 이상이다.
선택적으로, 제4 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제2 채널 신호의 시작 포인트 사이의 길이는 제4 미리 설정된 길이와 동일하고; 제3 정렬 처리 길이의 신호의 시작 포인트와 현재 프레임의 제1 채널 신호의 시작 포인트 사이의 길이는 제4 미리 설정된 길이 및 제4 정렬 처리 길이의 합과 동일하다.
본 출원의 실시예는 전술한 프로세서에 의해 실행될 필요가 있는 컴퓨터 소프트웨어 명령어를 저장하도록 구성되는 컴퓨터 판독가능 저장 매체를 추가로 제공한다. 이러한 컴퓨터 소프트웨어 명령어는 전술한 프로세서에 의해 실행될 필요가 있는 프로그램을 포함한다.
해당 분야에서의 기술자는 본 출원의 실시예들이 방법, 시스템, 또는 컴퓨터 프로그램 제품으로서 제공될 수 있다는 점을 이해할 것이다. 따라서, 본 출원은 하드웨어 전용 실시예들, 소프트웨어 전용 실시예들, 또는 소프트웨어 및 하드웨어의 조합이 있는 실시예들의 형태를 사용할 수 있다. 또한, 본 출원은 컴퓨터-사용가능 프로그램 코드를 포함하는 하나 이상의 컴퓨터-사용가능 저장 매체(이에 제한되는 것은 아니지만 디스크 메모리, 광 메모리 등을 포함함) 상에 구현되는 컴퓨터 프로그램 제품의 형태를 사용할 수 있다.
본 출원은 본 출원에 따른 방법, 디바이스(시스템), 및 컴퓨터 프로그램 제품의 흐름도들 및/또는 블록도들을 참조하여 설명된다. 이러한 컴퓨터 프로그램 명령어들은 이러한 흐름도들 및/또는 블록도들에서의 각각의 프로세스 및/또는 각각의 블록 및 이러한 흐름도들 및/또는 블록도들에서의 프로세스 및/또는 블록의 조합을 구현하는데 사용될 수 있다는 점이 이해되어야 한다. 이러한 컴퓨터 프로그램 명령어들은 범용 컴퓨터, 전용 컴퓨터, 내장형 프로세서, 또는 머신을 생성하기 위한 임의의 다른 프로그램가능한 데이터 처리 디바이스의 프로세서에 제공될 수 있어, 컴퓨터 또는 임의의 다른 프로그램가능한 데이터 처리 디바이스의 프로세서에 의해 실행되는 명령어들은 흐름도들에서의 하나 이상의 프로세스에서의 및/또는 블록도들에서의 하나 이상의 블록에서의 구체적인 기능을 구현하기 위한 장치를 생성한다.
컴퓨터 또는 임의의 다른 프로그램가능 데이터 처리 디바이스에게 구체적인 방식으로 작동하라고 명령할 수 있는 이러한 컴퓨터 프로그램 명령어들은 컴퓨터 판독가능 메모리에 저장될 수 있어, 이러한 컴퓨터 판독가능 메모리에 저장되는 명령어들은 명령어 장치를 포함하는 아티펙트(artifact)를 생성한다. 이러한 명령어 장치는 흐름도들에서의 하나 이상의 프로세스에서의 및/또는 블록도들에서의 하나 이상의 블록에서의 구체적인 기능을 구현한다.
명백히, 해당 분야에서의 기술자는 본 출원의 범위로부터 벗어나지 않고 본 출원에 다양한 수정들 및 변형들을 행할 수 있다. 본 출원은 다음의 청구항들에 의해 정의되는 보호의 범위 내에 있다면 이러한 수정들 및 변형들을 커버하도록 의도된다.

Claims (1)

  1. 방법.
KR1020217022936A 2017-05-16 2017-12-14 스테레오 신호를 처리하기 위한 방법 및 디바이스 KR102391266B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020227013611A KR102524957B1 (ko) 2017-05-16 2017-12-14 스테레오 신호를 처리하기 위한 방법 및 디바이스

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN201710344704.4 2017-05-16
CN201710344704.4A CN108877815B (zh) 2017-05-16 2017-05-16 一种立体声信号处理方法及装置
KR1020197035065A KR102281614B1 (ko) 2017-05-16 2017-12-14 스테레오 신호를 처리하기 위한 방법 및 디바이스
PCT/CN2017/116204 WO2018209942A1 (zh) 2017-05-16 2017-12-14 一种立体声信号处理方法及装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020197035065A Division KR102281614B1 (ko) 2017-05-16 2017-12-14 스테레오 신호를 처리하기 위한 방법 및 디바이스

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020227013611A Division KR102524957B1 (ko) 2017-05-16 2017-12-14 스테레오 신호를 처리하기 위한 방법 및 디바이스

Publications (2)

Publication Number Publication Date
KR20210095220A true KR20210095220A (ko) 2021-07-30
KR102391266B1 KR102391266B1 (ko) 2022-04-28

Family

ID=64273305

Family Applications (4)

Application Number Title Priority Date Filing Date
KR1020217022936A KR102391266B1 (ko) 2017-05-16 2017-12-14 스테레오 신호를 처리하기 위한 방법 및 디바이스
KR1020237013298A KR20230059178A (ko) 2017-05-16 2017-12-14 스테레오 신호를 처리하기 위한 방법 및 디바이스
KR1020227013611A KR102524957B1 (ko) 2017-05-16 2017-12-14 스테레오 신호를 처리하기 위한 방법 및 디바이스
KR1020197035065A KR102281614B1 (ko) 2017-05-16 2017-12-14 스테레오 신호를 처리하기 위한 방법 및 디바이스

Family Applications After (3)

Application Number Title Priority Date Filing Date
KR1020237013298A KR20230059178A (ko) 2017-05-16 2017-12-14 스테레오 신호를 처리하기 위한 방법 및 디바이스
KR1020227013611A KR102524957B1 (ko) 2017-05-16 2017-12-14 스테레오 신호를 처리하기 위한 방법 및 디바이스
KR1020197035065A KR102281614B1 (ko) 2017-05-16 2017-12-14 스테레오 신호를 처리하기 위한 방법 및 디바이스

Country Status (9)

Country Link
US (3) US11200907B2 (ko)
EP (3) EP3611726B1 (ko)
JP (3) JP6907341B2 (ko)
KR (4) KR102391266B1 (ko)
CN (3) CN108877815B (ko)
BR (1) BR112019024128A2 (ko)
DK (1) DK3916725T3 (ko)
ES (2) ES2939311T3 (ko)
WO (1) WO2018209942A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108877815B (zh) * 2017-05-16 2021-02-23 华为技术有限公司 一种立体声信号处理方法及装置
WO2024100110A1 (en) * 2022-11-09 2024-05-16 Telefonaktiebolaget Lm Ericsson (Publ) Efficient time delay synthesis

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050095896A (ko) * 2003-02-11 2005-10-04 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
US20120232912A1 (en) * 2009-09-11 2012-09-13 Mikko Tammi Method, Apparatus and Computer Program Product for Audio Coding
WO2014161990A1 (en) * 2013-04-05 2014-10-09 Dolby International Ab Audio encoder and decoder
EP2947654A1 (en) * 2010-04-09 2015-11-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction and a transform length indicator
KR20160077201A (ko) * 2013-11-29 2016-07-01 후아웨이 테크놀러지 컴퍼니 리미티드 스테레오 위상 파라미터 인코딩 방법 및 장치
KR102281614B1 (ko) * 2017-05-16 2021-07-29 후아웨이 테크놀러지 컴퍼니 리미티드 스테레오 신호를 처리하기 위한 방법 및 디바이스

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6539357B1 (en) 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
AU2002309146A1 (en) * 2002-06-14 2003-12-31 Nokia Corporation Enhanced error concealment for spatial audio
JP2005223887A (ja) * 2004-01-06 2005-08-18 Pioneer Electronic Corp 音響特性調整装置
JP3694311B2 (ja) 2004-12-20 2005-09-14 ホシザキ電機株式会社 電解水製造装置
CN1937854A (zh) * 2005-09-22 2007-03-28 三星电子株式会社 用于再现双声道虚拟声音的装置和方法
CN101427307B (zh) * 2005-09-27 2012-03-07 Lg电子株式会社 编码/解码多声道音频信号的方法和装置
JP4285469B2 (ja) * 2005-10-18 2009-06-24 ソニー株式会社 計測装置、計測方法、音声信号処理装置
GB2453117B (en) 2007-09-25 2012-05-23 Motorola Mobility Inc Apparatus and method for encoding a multi channel audio signal
JPWO2009081567A1 (ja) * 2007-12-21 2011-05-06 パナソニック株式会社 ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法
JP5153791B2 (ja) * 2007-12-28 2013-02-27 パナソニック株式会社 ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法
US8355921B2 (en) * 2008-06-13 2013-01-15 Nokia Corporation Method, apparatus and computer program product for providing improved audio processing
US8233629B2 (en) * 2008-09-04 2012-07-31 Dts, Inc. Interaural time delay restoration system and method
CN101673545B (zh) * 2008-09-12 2011-11-16 华为技术有限公司 一种编解码方法及装置
WO2010037427A1 (en) * 2008-10-03 2010-04-08 Nokia Corporation Apparatus for binaural audio coding
WO2010084756A1 (ja) * 2009-01-22 2010-07-29 パナソニック株式会社 ステレオ音響信号符号化装置、ステレオ音響信号復号装置およびそれらの方法
WO2010091555A1 (zh) 2009-02-13 2010-08-19 华为技术有限公司 一种立体声编码方法和装置
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
CN102307323B (zh) * 2009-04-20 2013-12-18 华为技术有限公司 对多声道信号的声道延迟参数进行修正的方法
CN101615996B (zh) * 2009-08-10 2012-08-08 华为终端有限公司 下采样方法和下采样装置
CN101695150B (zh) * 2009-10-12 2011-11-30 清华大学 多声道音频编码方法、编码器、解码方法和解码器
CN102157150B (zh) * 2010-02-12 2012-08-08 华为技术有限公司 立体声解码方法及装置
US8463414B2 (en) * 2010-08-09 2013-06-11 Motorola Mobility Llc Method and apparatus for estimating a parameter for low bit rate stereo transmission
US10002614B2 (en) * 2011-02-03 2018-06-19 Telefonaktiebolaget Lm Ericsson (Publ) Determining the inter-channel time difference of a multi-channel audio signal
CN103460283B (zh) * 2012-04-05 2015-04-29 华为技术有限公司 确定多信道音频信号的编码参数的方法及多信道音频编码器
EP2834813B1 (en) * 2012-04-05 2015-09-30 Huawei Technologies Co., Ltd. Multi-channel audio encoder and method for encoding a multi-channel audio signal
WO2014112793A1 (ko) * 2013-01-15 2014-07-24 한국전자통신연구원 채널 신호를 처리하는 부호화/복호화 장치 및 방법
US9407999B2 (en) * 2013-02-04 2016-08-02 University of Pittsburgh—of the Commonwealth System of Higher Education System and method for enhancing the binaural representation for hearing-impaired subjects
US9373320B1 (en) * 2013-08-21 2016-06-21 Google Inc. Systems and methods facilitating selective removal of content from a mixed audio recording
EP2899997A1 (en) * 2014-01-22 2015-07-29 Thomson Licensing Sound system calibration
CN106033671B (zh) * 2015-03-09 2020-11-06 华为技术有限公司 确定声道间时间差参数的方法和装置
US9768948B2 (en) * 2015-09-23 2017-09-19 Ibiquity Digital Corporation Method and apparatus for time alignment of analog and digital pathways in a digital radio receiver
US10152977B2 (en) * 2015-11-20 2018-12-11 Qualcomm Incorporated Encoding of multiple audio signals
CN105405445B (zh) * 2015-12-10 2019-03-22 北京大学 一种基于声道间传递函数的参数立体声编码、解码方法
CN105682000B (zh) * 2016-01-11 2017-11-07 北京时代拓灵科技有限公司 一种音频处理方法和系统
CN106210368B (zh) * 2016-06-20 2019-12-10 百度在线网络技术(北京)有限公司 消除多通道声回波的方法和装置
CN107731238B (zh) 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050095896A (ko) * 2003-02-11 2005-10-04 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
US20120232912A1 (en) * 2009-09-11 2012-09-13 Mikko Tammi Method, Apparatus and Computer Program Product for Audio Coding
EP2947654A1 (en) * 2010-04-09 2015-11-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction and a transform length indicator
WO2014161990A1 (en) * 2013-04-05 2014-10-09 Dolby International Ab Audio encoder and decoder
KR20160077201A (ko) * 2013-11-29 2016-07-01 후아웨이 테크놀러지 컴퍼니 리미티드 스테레오 위상 파라미터 인코딩 방법 및 장치
KR102281614B1 (ko) * 2017-05-16 2021-07-29 후아웨이 테크놀러지 컴퍼니 리미티드 스테레오 신호를 처리하기 위한 방법 및 디바이스

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Bertrand Fatus. Parametric Coding for Spatial Audio. Master’s Thesis, KTH, Stockholm, Sweden. 2015.12. *

Also Published As

Publication number Publication date
CN115641855A (zh) 2023-01-24
US20230395083A1 (en) 2023-12-07
BR112019024128A2 (pt) 2020-06-02
JP6907341B2 (ja) 2021-07-21
CN108877815B (zh) 2021-02-23
JP2021167965A (ja) 2021-10-21
CN111133509B (zh) 2022-11-08
EP3611726B1 (en) 2021-06-02
KR102524957B1 (ko) 2023-04-25
KR20220061250A (ko) 2022-05-12
ES2939311T3 (es) 2023-04-20
JP2023085339A (ja) 2023-06-20
ES2886505T3 (es) 2021-12-20
JP2020520478A (ja) 2020-07-09
US20200082834A1 (en) 2020-03-12
US20220051680A1 (en) 2022-02-17
WO2018209942A1 (zh) 2018-11-22
US11200907B2 (en) 2021-12-14
KR102281614B1 (ko) 2021-07-29
EP4198972A1 (en) 2023-06-21
KR102391266B1 (ko) 2022-04-28
CN111133509A (zh) 2020-05-08
EP3611726A1 (en) 2020-02-19
DK3916725T3 (da) 2023-02-20
EP3916725A1 (en) 2021-12-01
US11763825B2 (en) 2023-09-19
JP7248745B2 (ja) 2023-03-29
KR20190141750A (ko) 2019-12-24
KR20230059178A (ko) 2023-05-03
EP3916725B1 (en) 2022-11-30
CN108877815A (zh) 2018-11-23
EP3611726A4 (en) 2020-03-25

Similar Documents

Publication Publication Date Title
CN104718572B (zh) 音频编码方法和装置、音频解码方法和装置及采用该方法和装置的多媒体装置
EP2124224A1 (en) A method and an apparatus for processing an audio signal
US20230395083A1 (en) Stereo Signal Processing Method and Apparatus
JP2016508618A (ja) 周波数領域におけるlpc系符号化のための低周波数エンファシス
KR20200035138A (ko) 시간-도메인 스테레오 코딩 및 디코딩 방법, 및 관련 제품
US10186273B2 (en) Method and apparatus for encoding/decoding an audio signal
JP2017528753A (ja) スムーズな遷移を取得するために、ゼロ入力応答を用いるオーディオ・デコーダ、方法及びコンピュータ・プログラム
KR102618380B1 (ko) 다운믹스 신호 및 잔차 신호를 계산하는 방법 및 장치
KR102380642B1 (ko) 스테레오 신호 인코딩 방법 및 인코딩 장치
KR20200090856A (ko) 오디오 인코딩 및 디코딩 방법 및 관련 제품
KR102377434B1 (ko) 시간-도메인 스테레오 파라미터에 대한 코딩 방법, 및 관련 제품
RU2773636C2 (ru) Способ кодирования стереопараметров временной области и соответствующий продукт

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right