KR101437127B1 - 가중 윈도우들을 사용한 저-지연 변환 코딩 - Google Patents

가중 윈도우들을 사용한 저-지연 변환 코딩 Download PDF

Info

Publication number
KR101437127B1
KR101437127B1 KR1020097016337A KR20097016337A KR101437127B1 KR 101437127 B1 KR101437127 B1 KR 101437127B1 KR 1020097016337 A KR1020097016337 A KR 1020097016337A KR 20097016337 A KR20097016337 A KR 20097016337A KR 101437127 B1 KR101437127 B1 KR 101437127B1
Authority
KR
South Korea
Prior art keywords
samples
window
frame
short
decoder
Prior art date
Application number
KR1020097016337A
Other languages
English (en)
Other versions
KR20090107051A (ko
Inventor
발라즈 코베시
데이비드 비레트
피에릭 필립
Original Assignee
오렌지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from FR0700056A external-priority patent/FR2911227A1/fr
Application filed by 오렌지 filed Critical 오렌지
Publication of KR20090107051A publication Critical patent/KR20090107051A/ko
Application granted granted Critical
Publication of KR101437127B1 publication Critical patent/KR101437127B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Abstract

본 발명은 서로 다른 길이의 윈도우들을 사용하여, 연속적인 프레임들로서 나타나는 디지털 오디오 신호를 변환 코딩/디코딩하는 것에 관한 것이다. 본 발명의 코딩을 위해서, 현재의 프레임(Ti)내에서 어택(attack)과 같은 특정 사건을 검출(51)하고; 그리고, 적어도 상기 특정 사건이 현재 프레임의 시작부에서 검출된다면, 천이 윈도우의 적용하지 않고 현재 프레임(TI)를 코딩하기(56) 위하여 짧은 윈도우를 바로 적용하는 것이 시도된다. 그러므로, 코딩이 종래의 기술에 비하여 감소된 지연을 갖는다. 또한, 코딩 중에 긴 윈도우로부터 짧은 윈도우로의 직접적인 이행(passing)에 대해 보상하기 위하여 디코딩 중에 애드 혹 프로세싱이 적용된다.

Description

가중 윈도우들을 사용한 저-지연 변환 코딩{Low-delay transform coding, using weighting windows}
본 발명은 디지털 오디오 신호들의 코딩/디코딩에 관한 것이다.
변환 코딩(transform coding) 스키마에서, 데이터율(data rate) 감소를 위하여, 듣는 이가 가능한한 음질 저하를 최저 수준으로 감지하도록 하면서, 샘플들의 코딩에 대한 정밀도를 감소시키는 것이 일반적으로 시도된다.
이를 위하여, 심리음향 모델(psychoacoustic model)을 사용하여, 정량화 연산(quantification operation)에 의해 수행되는 정밀도의 감소가 제어된다. 상기 심리음향 모델은, 사람의 귀의 특성에 대한 지식에 기반하여, 최저로 감지될 수 있는(least-perceptible) 청각 주파수 내에서 정량화 잡음을 조정하는 것을 가능하게 해준다.
본질적으로 주파수 도메인에서의 데이터인 심리음향 모델에서의 데이터를 사용하기 위하여, 이 주파수 도메인에서 정량화를 수행하면서, 시간/주파수 변환을 실행하는 것이 표준적인 관례이다.
도 1은 변환 코더 구조의 도면을 도시한다.
- 분석 필터 FA1, ..., FAn의 뱅크 BA, 입력 신호 X의 어택(attack)
- 정량화 모델 Q와 그 뒤에 오는 코딩 모델 COD
- 코딩된 신호 X'를 전달하는 합성 필터 FS1, ..., FSn의 뱅크 BS
전송전에 데이터율을 줄이기 위하여, 정량화된 주파수 샘플들이 대개 "엔트로픽(entropic)"이라 지칭되는 코딩(손실없는 코딩)을 사용하여 코딩된다. 정량화는 균일한 또는 균일하지 않은 스칼라 정량자(scalar quantifier)에 의해, 또는 벡터 정량자(vector quantifer)에 의해 표준 방식으로 실행된다.
정량화 단계에서 유입되는 잡음은 합성 필터 뱅크에 의해 형상화(shaping)된다(이는 또한 "인버스 변환"이라 지칭된다). 그러므로, 정량화 잡음이 청취 가능하게 되는 것을 막기 위하여, 주파수 또는 시간에 의한, 분석 변환과 관련된 인버스 변환이 반드시 선택되어 정량화 잡음에 효과적으로 집중하도록 해야 한다.
분석 변환은 변환된 도메인에서 샘플 코딩을 쉽게 하도록 해주기 위하여 가능한한 신호 에너지에 집중해야 한다. 특히, 입력 신호에 의존하는 변환 코딩 이득이 가능한한 최대화되어야 한다. 이를 위하여, 다음과 같은 관계식이 사용될 수 있으며, 여기서 K는 상수항이고, 그 값은 바람직하게는 6.02가 될 수 있다.
Figure 112009047735616-pct00001
그러므로, 얻어낸 신호대잡음비(SNR)는 선택된 샘플당 비트 수(R)에 비례하며, 변환 코딩 이득을 나타내는 성분 GTC에 의해 증가된다. 코딩 이득이 클수록, 복원(reconstruction) 품질이 높아진다.
그러므로, 코딩 변환의 중요성이 이해될 수 있다. 코딩 변환은 신호 에너지 (분석 부분에 의해)와 정량화 잡음(합성 부분에 의해) 두가지에 모두 집중할 수 있으므로, 샘플들을 쉽게 코딩할 수 있게 해준다.
오디오 신호들은 비정상적(non-stationary)인 것으로 잘 알려져 있으므로, 오디오 신호의 특성의 함수로서, 시간에 걸쳐 시간/주파수 변환을 조정하는 것이 바람직하다.
표준 코딩 기법들에 대한 몇가지 응용들이 아래에서 설명된다.
변조된 변환(modulated transform)들의 경우에, 표준적인 오디오 코딩 기법들은, 고속 푸리에 변환들(fast Fourier transform) 또는 코사인 변환들에 기초한 고속의 알고리즘들을 사용하여 이러한 코딩 기법들을 실시할 수 있게 해주는 코사인-변조된(cosine-modulated) 필터 뱅크들을 가진다.
이러한 유형의 변환들 중에서, (특히 MP3, MPEG-2 그리고 MPEG-4 AAC 코딩에서)가장 일반적으로 사용되는 변환은 MDCT 변환(변형 이산 코사인 변환)이며, 그것의 식은 다음과 같다.
Figure 112009047735616-pct00002
여기서,
. M은 변환의 사이즈를 나타낸다.
.
Figure 112012096478809-pct00003
은, 주기 1/Fe(샘플링 주파수의 역수)에서 시간 n+tM의 시점에서 디지털화된 음향 샘플들이다.
. t는 프레임 인덱스이다.
.
Figure 112009047735616-pct00004
는 프레임 t 동안 변환된 필드 내의 샘플들이다.
.
Figure 112012096478809-pct00005
는 변환의 기저 함수(base function)이며 여기서 h(n)은 사이즈 2M의 프로토타입 필터로 지칭된다.
초기 시간의 샘플들을 복원하기 위하여, 0≤n≤M-1의 샘플들을 복원하기 위하여 다음의 인버스 변환이 적용된다.
Figure 112009047735616-pct00006
도 1a을 참조하여, 다음과 같이 복원이 수행된다.
. 2M개의 샘플들을 생성하는 샘플들(
Figure 112012096478809-pct00007
)의 인버스 DCT 변환(이후 DCT-1로 표시됨),
. 2M개의 샘플들을 생성하는 샘플들(
Figure 112009047735616-pct00008
)의 인버스 DCT 변환. 여기서, 처음의 M개의 샘플들은 이전 프레임의 나중의 M개의 샘플들과 동일한 시간 지원(temporal support)을 가짐,
. 프레임 Ti의 후반(뒤의 M개의 샘플들)에 대해 합성 윈도우 h(M+n)로 가중하고, 다음 프레임 Ti+1의 전반에 대해 합성 윈도우 h(n)로 가중, 그리고,
. 공통 지원부(common support) 상의 윈도우된 성분들을 가산.
(조건
Figure 112009047735616-pct00009
에 따라)신호의 정확한(완벽한) 복원을 위해서, 다수의 제 약사항들을 만족하는 프로토타입 윈도우 h(n)을 선택하는 것이 적절하다.
일반적으로, 완벽하게 복원될 수 있게 하기 위해서, 다음의 관계식들이 만족되어야한다.
Figure 112009047735616-pct00010
(1)
여기서, 윈도우는 중앙의 샘플과 관련하여 균일하게 대칭된다.
이 두개의 간단한 제약사항들을 만족하는 것은 비교적 간단하며, 이를 위하여, 표준 프로토타입 필터는 다음과 같은 사인 윈도우에 의해 구성된다.
Figure 112009047735616-pct00011
물론, "카이저 바젤 드라이브드(또는 KBD)"라는 이름의 표준 MPEG-4에서 정의된 윈도우들 또는 낮은 오버랩 윈도우들과 같은 다른 형태의 프로토타입 필터들이 존재한다.
긴 윈도우들을 사용하는 MDCT 변환에 의해 처리되는 예가 도 1a에 주어진다. 이 도면에서,
. 파선으로된 화살표들은 감산(substraction)을 나타낸다.
. 실선으로된 화살표들은 가산(addition)을 나타낸다.
. 일점쇄선 화살표들은 코딩을 위한 DCT 프로세스와 디코딩(DEC)을 위한 DCT-1 프로세스를 나타내며, 이 DTC 항은 위에서 주어진 기본 함수의 코사인항에 대응한다.
. 코딩될 신호의 샘플들은 xin으로 표시된 흐름에 존재하며, 도 1b에서 참조부호 a와 b로, 도 1c에서 참조부호 e와 f로 표시되고 원으로 표시된 특정 샘플들의 코딩/디코딩 프로세스의 전개가 그 뒤에 온다.
. xin 샘플들은 프레임들에의해 그룹화되며, 현재의 프레임은 Ti로 표시되고, 이전과 다음의 프레임들은 각각 Ti-1과 Ti+1로 표시된다.
. 참조부호 DEC는 디코더에 의해 (가산-복원과 함께 합성 윈도우들 FS을 사용하여) 실행되는 프로세싱에 관련된다.
. 분석 윈도우들은 FA로 표시되며 합성 윈도우들은 FS로 표시된다.
. n은 윈도우의 중간과 샘플 a의 사이의 거리이다.
참조부호 calc T'i는 분석 윈도우(FA) 및 프레임들(Ti-1, Ti)의 각각의 샘플들을 사용하는, 코딩된 프레임(T'i)의 계산과 관련된다. 여기서, 이것은 단순히 도 1a에 도시된 종래의 예이다. 예를 들어, 코딩된 프레임(T'i)을 계산하기 위하여 프레임들(Ti, Ti+1)을 인덱스할 것으로도 결정될 수 있다. 도 1a의 예에 후속하여, 참조부호 calc T'i+1은 프레임들(Ti와 Ti+1)의 각각의 샘플들을 사용하는, 코딩된 프레임(T'i+1)의 계산과 관련된다.
변환(DCT)과 인버스 변환 DCT-1 전에 얻어지는 항 v1과 v2는 다음의 식들을 사용하여 구해진다.
Figure 112009047735616-pct00012
그러므로, 전체적인 DCT/DCT-1 프로세싱과 합성 윈도우 후에, 다음과 같이 복원 항들(a'와 b')이 쓰여진다.
Figure 112009047735616-pct00013
그리고
Figure 112009047735616-pct00014
Figure 112009047735616-pct00015
그러므로, 관계식(1)을 사용하고 h(M-1-n) = h(n+M)을 공제함으로써, 복원이 완벽하다(a'=a, b'=b)는 것이 검증된다.
위에서 설명한 MDCT 변환의 원리는 자연적으로 ELT("Extended Lapped Transform")라고 지칭되는 변환으로 확장되며, 여기서 기저 함수들의 차수는 변환 사이즈의 두배보다 크며, 구체적으로 다음과 같다.
Figure 112009047735616-pct00016
여기서 0≤k<M이고 L=2KM이며, K는 2보다 큰 양의 정수이다.
복원을 위하여, MDCT 변환에 대해서와 같이 두개의 연속적인 프레임들을 링크(link)시키는 대신, 샘플들의 합성은 K개의 윈도우된 연속적인 프레임들을 필요로 한다.
또한, 윈도우의 대칭의 제약(아래에서 상세하게 설명되는 원리)이 ELT-타입 변환에 대해서는 완화될 수 있다. 분석 윈도우와 합성 윈도우 간의 유사성 제약(constraint of the identity) 또한 완화되어 쌍직교 필터(biorhogonal filter)라는 것이 사용될 수 있다.
코딩될 신호에 대한 변환을 적용할 필요성을 고려하여, 종래의 기술은 "윈도우 스위칭"(즉, 시간에 따라 사용되는 변환의 사이즈를 변경)이라 지칭되는 기법을 허용한다.
윈도우 길이를 변경할 필요성은 특히 다음의 경우에 정당화될 수 있다.
신호, 예를 들어 강한 어택(attack)(예를 들어, "타" 또는 "파"의 발음)으로 특징지어지는 과도(transitory)(비정상적(non-stationary)) 신호를 포함한 음성 신호가 코딩될 때,코딩의 시간적 해상도(resolution)를 증가시켜 코딩 윈도우의 사이즈를 줄이는 것이 적절하며, 그러므로 긴 윈도우로부터 짧은 윈도우로의 이행(passing)이 요구된다. 보다 정확하게는, 종래의 기술에서, 이 경우 긴 윈도우(아래에서 설명될 도 2a)로부터 천이 윈도우(transition window)(아래에서 설명되는 도 2c)로, 그리고 일련의 짧은 윈도우들(아래에서 설명되는 도 2b)로의 이행(passing)이 발생한다. 그러므로, 아래에서 자세히 보여지는 바와 같이, 현재 프레임의 코딩 윈도우 길이를 결정할 수 있게되기 전에, 적어도 하나의 후속 프레임 상에서의 어택을 예상하여, 그 결과로 현재의 프레임을 코딩하는 것이 필요하다.
종래 기술에서의 윈도우 길이 변경의 예는 하기에서 보여진다.
일반적인 예는, 표준 MPEG-AAC에서 규정된 바와 같이, 사이즈 M의 MDCT 변환의 사이즈를 사이즈 M/8으로 변경하는 것이다.
완벽한 복원 특성을 유지하기 위하여, 두 사이즈 간의 천이시에, 위의 식(1)이 다음의 공식으로 대체되어야만 한다.
Figure 112009047735616-pct00017
또한, 서로 다른 사이즈들의 연속적인 프로토타입 필터들에 대해 다음과 같이 관계식이 주어진다.
Figure 112009047735616-pct00018
그러므로, 변환시에, 사이즈 M/2에 대해 대칭성이 존재한다.
서로 다른 타입의 윈도우들이 도 2a 내지 도 2e에 도시된다.
- 도 2a에서는 2M=512 샘플 사이즈의 사인 윈도우(대칭적 사인 함수),
- 도 2b에서는 2Ms=64 샘플 사이즈의 사인 윈도우(대칭적 사인 함수),
- 도 2c에서는 사이즈 512에서 사이즈 64로의 이행을 가능하게 해주는 천이 윈도우,
- 도 2d에서는 사이즈 64에서 사이즈 512로의 이행을 가능하게 해주는 천이 윈도우,
- 도 2e에서는, 위에서 제시된 기본 윈도우들을 사용하여 수행된 예시적인 구성이 도시된다.
각각의 연속은 "윈도우 길이"라고 지칭되는 미리 정해진 한정된 "길이"를 가진다. 그러므로, 도 1a를 참조로 도시된 바와 같이, 코딩될 샘플들이 적어도 쌍을 이루어 결합되며, 상기 결합에서 각각의 윈도우 가중 값들을 사용하여 가중된다.
보다 상세히는, 사인 윈도우들(도 2a 및 도 2b)은 대칭, 즉, 가중 값들이 상기 윈도우를 형성하는 값들의 연속부 중간의 중앙 값의 각 측에서 대략적으로 동일하다. 유익한 실시예는 이러한 윈도우들의 가중 값 변동을 정의하도록 "사인"함수들을 선택하는 것을 포함한다. 다른 윈도우들(예를 들어, MPEG AAC 코더들에서 사용되는 것과 같은)을 선택하는 것도 여전히 가능하다.
그러나, 천이 윈도우들(도 2c와 도 2d)은 비대칭이며, "평탄한" 구간(참조부호 PLA)을 포함하는바, 이는 이 구간들의 가중 값들이 최대이며, 예를 들어 "1"과 같다는 것을 의미한다. 도 1b와 1c를 참조로 하여 보여질 것과 같이, 긴 윈도우에서 짧은 윈도우로의 천이 윈도우를 사용함으로써(도 2c), 샘플 a를 포함하는 (도 1b에서 도시된 예에서의) 두개의 샘플들이 간단하게 인자(factor) "1"에 의해 가중되는 반면, 샘플 b는, 코딩된 프레임(T'i)의 계산에서 인자 "0"에 의해 가중되고, 따라서 샘플 a를 포함하는 두개의 샘플들은 그것들이 코딩된 프레임(T'i)내에 있는 것처럼(DCT는 예외) 간단하게 전송된다.
코딩 시스템에서 가변 사이즈의 변환을 사용하는 것이 아래에서 설명된다. 동작들은 또한 오디오 샘플들을 복원하기 위한 디코더 레벨에서 설명된다.
표준 시스템들에서, 코더는 주로, 시간에 대해 사용되는 변환을 선택한다. 그러므로, AAC 표준에서, 코더는 두개의 비트들을 전송하며, 위에서 주어진 4개의 윈도우 사이즈 구성들 중 하나를 선택하는 것이 가능하다.
천이 윈도우들(긴 윈도우-짧은 윈도우)을 사용하는 MDCT 변환 프로세싱이 도 1b와 1c에 도시된다. 이 도면들은 도 1a에서와 동일한 방식으로 수행되는 계산들을 나타낸다.
도 1b와 1c에서는, FA(예시된 예에서 Ms=M/2)로 표시된 소수의 짧은 분석 윈도우들만이 보여진다. 그러나, 실제로는, 도 2e에 도시된 것과 같이, 연속적인 몇개의 짧은 윈도우들이 제공된다(일반적으로 Ms=M/8). 그러므로, 도 1b와 도 1c에서의 각각의 윈도우(FA)는 실제로 연속적인 짧은 윈도우들을 포함한다는 것이 이해된다.
코딩된 프레임(T'i)(참조부호 calc T'i)을 계산하기 위한 천이 윈도우 FTA(도 1b)는,
- 그것의 상승 에지에서, M개의 샘플들에 대한 긴 하프-윈도우(long half-window)와, 그리고
- 그 하강 에지에서,
. (M/2-Ms/2)개의 샘플들에 대해 제1 평탄 구간 PLA(1과 동일한 가중 값을 가짐)과,
. Ms개의 샘플들에 대한 하강하는 짧은 하프-윈도우(short half-window)와, 그리고
. (M/2-Ms/2)개의 샘플들에 대한 제2 평탄 구간(0과 동일한 가중값을 가짐)을 포함한다.
다음의 코딩된 프레임(T'1+i)(참조부호 calc T'1+i)를 계산하기 위하여, 처음의 (M/2-Ms/2)개의 샘플들이 무시되고 따라서 짧은 윈도우들에 의해 처리되지 않으 며, 그 다음의 Ms개의 샘플들이 도 1b와 도 1c에서 보여지는 짧은 분석 윈도우(FA)의 상승 에지에 의해 가중되고, 다음의 Ms개의 샘플들이 그것의 하강 에지에 의해 가중된다.
아래에서는 다음이 참조된다.
- M은 긴 프레임의 사이즈이다.
- Ms는 짧은 프레임의 사이즈이다.
도 1b에서, 긴 윈도우들과의 유사성을 준수하기 위하여, 짧은 윈도우들만을 사용하여 샘플 b가 합성된다. 그후, 장단 천이 하프-윈도우(long-short transition half-window)의 특정한 형태로 인하여, 분석 및 합성 천이 윈도우들로부터 직접 샘플 a가 복원된다. 천이 윈도우는 도 1b와 도 1c에 FTA로 표시된다.
도 1c에서, 장단 윈도우(long-short window) 및 짧은 윈도우 사이의 천이 영역에 대응되는 샘플들이 계산된다. 도 1a에서의 긴 윈도우들에 대한 계산과의 유사성을 준수하기 위하여, 여기서 e와 f로 표시된(원으로 표시된) 샘플들의 처리가 후속된다.
윈도우 천이 상황들의 두가지 예는 하기에서 설명된다.
첫번째 예에서, 시간 t=720에서의 오디오 신호에서 짧은 윈도우들의 사용을 필요로하는 어택들이 검출된다(도 2e). 코더는, 앞서서 사용된 긴 윈도우들과 후속적인 짧은 윈도우들 사이에 개재된 장단 천이 윈도우들이 사용된다는 것을 디코더에 알려야만 한다.
그러므로, 코더는 디코더에게 다음의 시퀀스를 연속적으로 나타낸다.
. 긴 윈도우
. 장단 천이 윈도우(long-short transition window)
. 짧은 윈도우
. 장단 천이 윈도우,
. 긴 윈도우
디코더는 그후 다음의 관계식을 적용한다.
Figure 112009047735616-pct00019
여기서,
Figure 112009047735616-pct00020
Figure 112009047735616-pct00021
는 시간 t 및 t+1에서의 변환들의 합성 함수들을 나타내며, 서로 다를 수 있다.
기저 함수들
Figure 112012096478809-pct00022
Figure 112012096478809-pct00023
이 서로 다른 "사이즈들"을 가진다면, 도 1b를 참조하여, 다음이 수행된다는 것을 제외하고는 전과 마찬가지로 수행된다.
. 2M개의 샘플들을 생성하는, 샘플
Figure 112009047735616-pct00024
의 사이즈 M의 인버스 DCT 변환.
. 천이 윈도우(FTA)의 하강 부분의 사이즈 M의 인버스 DCT 변환으로부터 기인한 샘플들과, 2Ms개의 샘플들을 생성하는, 샘플
Figure 112012096478809-pct00025
의 사이즈 Ms의 인버스 DCT 변환. 여기서, 처음의 Ms개의 샘플들은, 짧은 윈도우의 상승 부분을 포함하는 오버랩 영역 내에, 길이 Ms의 공통 시간 지원을 가진다.
. 전반부에 대한, 도 1b의 참조부호 FTS로 표시된 윈도우와 천이 윈도우(FTA)의 듀얼 합성 윈도우에 의한 곱셈과, 후반부에 대한 짧은 합성 윈도우(FS)에 의한 곱셈.
. 상기 오버랩 영역에서 이 윈도우된 성분들을 합산, 상기 시간 지원은 초기 프레임 Ti의 종료부에 대응한다.
그러므로 디코더는 코더의 슬레이브이며, 코더에 의해 결정되는 윈도우 타입을 충실히 적용한다.
이 제1 예에서, 코더는 제1 프레임의 샘플들이 도착하는 동안 천이를 검출한다(예를 들어, 도 2e의 프레임 1은 시간 t=512와 t=767 사이의 샘플들을 포함한다.) 그후 코더는 현재의 윈도우가 장단 천이 윈도우여야 하는지 결정하고, 인코딩하고, 전송하며, 디코더에 신호를 보낸다. 그후 8개의 짧은 윈도우들이 샘플들 t=624와 t=911 사이에 연속적으로 적용된다. 그러므로, 천이(t=720)시에, 인코더는 짧은 윈도우들을 사용하며, 이는 신호의 시간 표현(time representation)을 개선하게 해준다.
제2의 예에서, 샘플 t=540에서 천이가 검출된다. 코더가 제1 프레임(예를 들어, 도 2e의 프레임 0)의 샘플들을 수신할 때, 코더는 천이를 검출하지 않으며, 그러므로 긴 윈도우를 선택한다. 제2의 후속하는 프레임(도 2e의 예에서 프레임 1)의 샘플들이 도착하는 동안, 코더는 어택을 검출한다(시간 t=540에서). 이 경우에, 상기 검출은 너무 늦게 수행되어, 천이 윈도우의 사용이 어택 시점에서 짧은 시간 지원(짧은 윈도우들)의 사용으로부터의 이점을 취할 수 없게 한다. 코더는 짧은 윈도우들의 사용을 기대해야만 하며, 그 결과, 적어도 M/2개의 샘플들에 대응하는 추가적인 코딩 지연을 삽입해야 한다.
그러므로, 알려져 있는 종래기술의 단점은, 다음 프레임의 시간 신호에서 어택을 검출하여 짧은 윈도우들로의 이행을 예측할 수 있게 하기 위해서 인코더에 추가적인 지연을 도입할 필요가 있다는 사실에 있다는 것이 이해될 것이다. 이러한 "어택"은 예를 들어, 음성 신호에서의 파열음 과 같은 고강도 과도 신호, 음악 시퀀스에서의 충돌음 신호(percussive signal)의 발생에 대응할 수 있다.
어떤 통신 응용들에서는, 과도 신호들의 검출을 위해 요구되는 추가적인 지연, 및 천이 윈도우들의 사용이 허용되지 않는다. 그러므로, 예를 들어, MPEG-4 AAC 저지연 코더에서는, 짧은 윈도우들이 사용되지 않으며, 긴 윈도우들만이 사용될 수 있다.
본 발명은 상기 상황에 대한 개선을 제공한다.
본 발명은 추가적인 지연의 도입이 요구되지 않는 윈도우들 간의 천이에 관한 것이다.
이를 위하여, 본 발명은 프레임들의 연속으로 나타내어지는 디지털 오디오 신호의 변환 코딩/디코딩 방법을 설명하며, 여기서,
- 각각 상이한 길이들을 가진 적어도 두개의 가중 윈도우들이 제공된다. 그리고,
- 특정 사건이 검출된 프레임을 코딩하기 위하여 짧은 윈도우가 사용된다.
이 특정 사건은 예를 들어, 현재의 프레임이 포함하고 있는 디지털 오디오 신호 내의 강한 어택과 같은 비정상적인 현상일 수 있다.
보다 구체적으로는, 현재의 프레임을 코딩하기 위하여, 현재 프레임에서 특정 사건을 검출하는 것이 필요하다. 그리고,
- 적어도 상기 특정 사건이 현재 프레임의 시작시에 검출된다면, 현재 프레임을 코딩하기 위하여 짧은 윈도우가 적용되는 반면,
- 만약 상기 특정 사건이 현재 프레임 내에서 검출되지 않는다면, 현재 프레임을 코딩하기 위하여 긴 윈도우가 적용된다.
이러한 단계들은 다음의 프레임에 대해 반복되며, 따라서, 본 발명에서는, 종래의 기술에서와 같이 천이 윈도우를 사용하지 않고, 긴 윈도우를 사용하여 주어진 프레임을 코딩하고 이 주어진 프레임 직후에 오는 프레임을 바로 즉시 짧은 윈도우를 사용하여 코딩하는 것이 가능하다.
긴 윈도우로부터 짧은 윈도우로 바로 이행(passing)하는 것을 가능하게 만듦으로써, 특정 사건의 검출이, 더 이상 종래의 기술에서처럼 다음의 프레임 상에서가 아닌, 코딩되는 프레임 상에서 직접 수행될 수 있다. 그러므로, 본 발명의 방법에 의해 수행되는 코딩은 종래의 기술의 코딩들과는 다르게, 고정된 사이즈의 MDCT 변환과 비교하여 추가적인 지연이 없이 수행된다.
본 발명의 다른 특징들 및 이점들은 하기의 상세한 설명 및 첨부의 도면들을 검토함으로써 명백해 질 것이며, 여기서 도 1, 1a, 1b, 1c, 2a, 2b, 2c, 2d, 2e는 종래의 기술이고 위에서 설명되었다.
- 도 3a는 앞서서 설명된 도 1b에서와 같은 샘플 a와 b의 전개 후, 본 발명에서의 코딩/디코딩 처리를 도시한다.
- 도 3b는 앞서서 설명된 도 1c에서와 같은 샘플 e와 f의 전개 후, 본 발명에서의 코딩/디코딩 처리를 도시한다.
- 도 4a 및 4b는 본 발명의 실시예에서 수행되는 디코딩에서의 보상을 위해 사용되는 가중 함수들의 변형 예이다.
- 도 5a는 본 발명에서의 코더에 적용될 수 있는 프로세싱의 예이다.
- 도 5b는 본 발명에서의 디코더에 적용될 수 있는 프로세싱의 예이다.
- 도 6은 코더와 디코더 각각의 구조들과 코딩에서 사용되는 윈도우 타입의 정보의 통신을 도시한다.
- 도 7은 M=512 요소들과 오버랩 계수 K=4를 가진 ELT 변환의 경우에 대한 긴 합성 윈도우를 도시한다.
- 도 8은 오버랩되는 코딩의 콘텍스트에서 과거 샘플들의 영향이 고려되는 실시예의 가중 함수들 w 1,n w 2,n (여기서, n은 0과 M/2-Ms/2 사이의 값들을 포함한다)의 그래프를 나타낸다.
- 도 9는 이 실시예에서의 가중 함수들 w' 1,n w' 2,n (여기서, n은 M/2-Ms/2와 M/2+Ms/2 사이의 값들을 포함한다)의 그래프를 나타낸다.
- 도 10은 이 실시예에서, 가중 함수들 w' 3,n w' 4,n (여기서, n은 M/2-Ms/2와 M/2+Ms/2 사이의 값들을 포함한다)의 그래프를 나타낸다.
- 도 11은 도 8에 도시된 실시예의 변형에서 0과 M/2+Ms/2 사이의 값들을 포함하는 n의 전체 범위에 대해 가중 함수들 w 1,n w 2,n 의 그래프를 나타낸다.
- 도 12는 이 예에서 0과 M/2+Ms/2 사이의 값들을 포함하는 n의 전체 범위에 대해 가중 함수들 w 3,n w 4,n 의 그래프를 나타낸다.
본 발명은 적어도 긴 윈도우로부터 짧은 윈도우로 이행(passing)하기 위하여 천이 윈도우들을 적용하는 것을 피할 수 있게 해준다.
그러므로, 도 2e를 참조로 앞에서 설명한 제2의 예에서, 시간 t=540에서 비정상적인 현상 또는 "어택"이 검출되는 경우, 본 발명은 프레임 0에 대해 긴 윈도우(시간 t=256 에서 t=511까지 확장되는 윈도우)를 사용할 것을 제안한다. 그후, 다음 프레임(t=512 에서 t=767)의 샘플들을 얻고 t=540에서 어택을 검출하는 동안, 코더는 t=368(t=512-M/2-Ms/2에 대응)에서 t=655(t=512+M/2+Ms/2-1에 대응, 여기서, 설명된 예에서의 2*M=512는 긴 윈도우의 사이즈이며 2*Ms=64는 짧은 윈도우의 사이즈이다.)까지의 샘플들을 인코딩하기 위하여, 종래의 기술과 관련하여 도 1b 및 1c에 도시된 표준적인 비대칭의 천이 윈도우를 사용하지 않고, 8개의 짧은 윈도우들을 사용한다.
디코더 레벨에서, 짧은 윈도우들을 사용하여 인코딩된 프레임을 수신하는 동안, 디코더는 다음의 동작들을 진행한다.
. 코더로부터 현재의 프레임에 대해 짧은 윈도우들이 사용되어야만 한다는 것을 나타내는 정보 아이템을 수신.
. 코딩 중에 긴 윈도우에서 짧은 윈도우로의 직접적인 천이에 대해 보상하기 위한 유익한 프로세싱의 적용, 이 프로세싱의 예는 도 5b를 참조로 하여 아래에서 자세히 설명된다.
도 3a 및 3b는, 한편으로 긴 윈도우와 짧은 윈도우 사이에 오버랩을 가지지 않는 영역에서 발견되는 샘플들(a, b)을 얻기 위한(도 3a), 그리고 또 다른 한편으로는 이 오버랩 영역에서 발견되는 샘플들(e, f)을 얻기 위한(도 3b) 본 발명의 코딩/디코딩 기법을 도시한다. 특히, 이 오버랩 영역은 긴 윈도우 FL의 하강 에지와 제1의 짧은 윈도우 FC의 상승 에지에 의해 정의된다.
그러므로, 도 3a와 3b를 참조로 하여, 코딩 중에, 코딩된 프레임 Ti를 구성하기 위하여 프레임 Ti-1과 Ti의 샘플들이 긴 분석 윈도우(FL)에 의해 가중되고, 다음 프레임 T'i와 Ti+1의 샘플들은 천이 윈도우의 적용없이 짧은 분석 윈도우들 (FC)에 의해 직접 가중된다.
도 3a와 3b를 참조하여, (도 3b의 예에서 샘플 E를 선행하는 샘플들에 대한)짧은 윈도우들에 의해 고려되지 않는 값들이, 제1 짧은 분석 윈도우(FC)를 선행한다는 것 또한 이해될 것이다. 보다 구체적으로, 이 프로세싱은, 종래 기술의 코더들/디코더들과 유사한 방식으로, 상기 코딩된 프레임 T'i+1이 될 제1의 M/2-Ms/2 샘플들에 적용된다. 일반적으로, 코딩 중에(그리고 유사하게 디코딩 중에) 수행되는 프로세싱을 가능한한 최소한으로 방해하는 것이 요구된다. 그러므로, 예를 들어, 코딩된 프레임 T'i+1의 제1 샘플들을 무시하는 선택이 이루어 진다.
물론, 도 3a 및 3b에서, 두개의 짧은(Ms = M/2) 분석 윈도우들(FC)이 도시된다. 그럼에도 불구하고, 종래의 기술에서와 같이, 몇몇 짧은 윈도우들의 연속이 제공되어왔으며 짧은 윈도우들의 각각의 연속이 참조 부호 FC를 포함하고 있는 도 3a와 3b에 도시된다.
아래에서, 직전에 선행된 프레임 T'i가 긴 윈도우(FL)를 사용하여 코딩되는 동안 짧은 윈도우(FC)를 사용하여 코딩된 프레임 T'i+1을 디코딩하기 위한 두가지 실시예들이 설명된다.
제1 실시예에서, 디코딩 중에 합성 윈도우들의 사용이 완전히 불필요하게 되며, 그리고 완벽한 복원 특성이 보장되는 것이 증명된다.
도 3a에서, 어택의 검출 중에, 윈도우를 변경하는 것(긴 윈도우에서 짧은 윈도우로 바로)이 요구되며, 처음에 샘플들은 짧은 윈도우들에서만 합성된다(도 3a의 샘플 b). 그후, 미리 계산된 샘플 b의 영향이 긴 분석 윈도우로부터 계산된 값 v1에 대해 보상된다. 상기 샘플에 대한 코딩 계산(코딩된 프레임 T'i)은 다음과 같이 수행된다.
Figure 112009047735616-pct00026
반면, 조합(combination) 전에 오는 짧은 윈도우로부터의 가중 계산이 상이한 시간 지원(코딩된 프레임 T'i+1) 상에서 수행됨에 따라, 샘플 a는 코딩 값 v2에 서 가중되지 않으며, 짧은 윈도우들로부터의 복원 후에, v2=b를 얻게된다.
유익하게, 본 발명의 코딩/디코딩에서 완벽한 복원이 검증된다.
Figure 112009047735616-pct00027
디코딩 중에, 프레임의 시작부의 샘플들(샘플 a와 같은)을 결정하기 전에, v2=b 값들로부터 유도되는 샘플들 및 그 후속하는 샘플들이 먼저 결정되어야만 한다. 그러므로, 디코딩 중에 시간 역전(time reversal)이 수행된다.
도 3b에서, 긴 윈도우(FL)(하강 에지)와 제1의 짧은 윈도우(FC)(상승 에지) 사이의 천이 영역의 코딩 샘플들이 계산된다(그러므로 샘플들 e와 f의 레벨에서). 두개의 윈도우들(FL과 FC) 사이의 이 오버랩 영역에서, 다음의 방정식들에 의해 코딩 계수들(또는 이하에서 "값 v1 및 v2")이 표현된다.
v1 = e*h(M+n)+f*h(2*M-1-n), 그리고
v2 = f*hs(Ms-1-m)-2*hs(m)
디코더에서, 이러한 방정식들의 시스템은 두개의 미지수들을 가지며 그러므로 샘플들(e,f)의 값들을 구하기 위하여 반드시 풀려야 된다
e=[v1*hs(Ms-1-m)-v2*h(2*M-1-n)]/[h(M+n)*hs(Ms-1-m)+hs(m)*h(2*M-1-n)]
f=[v1*hs(m)+v2*h(M+n)]/[hs(Ms-1-m)*h(M+n)+h(2*M-1-n)*hs(m)]
완벽한 복원 특성을 유리하게 증명하는 공식이 또한 도출된다.
e'=[v1*hs(Ms+m)-v2*h(n)]/[h(M+n)*hs(Ms+m)+h(2*M-1-n)*hs(m)] = e,
그리고
f=[v1*hs(2*Ms-1-m)+v2*h(M-1-n)]/[h(M+n)*hs(Ms+m)+h(2*M-1-n)*hs(m)]=f, 여기서 m=n-M/2+Ms/2
종래 기술의 규정들(v2는 도 1c의 아래에서 보여지는 것처럼 짧은 윈도우 hs에 의해 가중되었다)과는 반대로, 값 v2가 긴 윈도우 h에 의해서 가중되는 것에 주목하여야 한다.
제2의 실시예에서, 디코딩 중 합성 윈도우들이 유지된다. 합성 윈도우들은, 도 3a 및 3b에서 도시된 바와 같이, 분석 윈도우들과 동일한(분석 윈도우들과 동일하거나 듀얼인) 형태를 지니며, 긴 합성 윈도우에 대한 참조부호는 FLS로, 짧은 합성 윈도우에 대한 참조부호는 FCS로 표시된다. 이 제2의 실시예는 최신 기술의 디코더들의 동작에 따른 이점을 지니는바, 즉, 긴 분석 윈도우를 사용하여 코딩된 프레임을 디코딩하기 위하여 긴 합성 윈도우를 사용하고, 일련의 짧은 분석 윈도우들을 사용하여 코딩된 프레임을 디코딩하기 위하여 일련의 짧은 합성 윈도우들을 사용한다.
다른 한편으로, 프레임이 장단 천이 윈도우를 사용하여 코딩되었어야 할 때, 긴 윈도우를 사용하여 코딩된 프레임을 디코딩하기 위하여, "보상"에 의해 이 합성 윈도우들의 수정이 적용된다. 즉, 긴 윈도우로부터 짧은 윈도우로의 직접적인 이행(passing)의 영향에 대해 보상하기 위하여, 바로 전의 프레임 T'i이 긴 윈도우(FL)를 사용하여 코딩되었음에도 불구하고 짧은 윈도우(FC)를 사용하여 코딩된 현재의 프레임 T'i+1을 디코딩하기 위하여, 코더에서 아래에서 설명되는 프로세싱이 사용된다.
샘플들(a, b, e, f)을 값들(v1, v2)로 디코딩 및 링크하기 위하여 위에서 주어진 방정식들은, 특히 시간 역전을 수행하는, 다음과 같이 가중된 두 항의 합의 형태로 다시 쓰여질 수 있다.
먼저, 제1의 짧은 합성 윈도우들(FCS) 내에 그리고 위에서 언급한 오버랩 영역(일반적으로, 도 3a에서 예로써 설명된 샘플 v2=b 및 그것에 후속하는 샘플들에서) 후의 위치(position)가 채택된다. 짧은 합성 윈도우들(FCS)만으로부터 오버랩 없이 이 부분을 디코딩하기 위하여, 코딩된 프레임 T'i+1의 값들이 먼저 v2=b(도 3a)으로부터 디코딩된다. 일단 샘플 b와 그것에 후속하는 샘플들이 디코딩되면, 다음의 두 항 가중 합이 적용된다.
Figure 112009047735616-pct00028
, 0≤n≤M/2-Ms/2, 여기서,
-
Figure 112009047735616-pct00029
은 디코딩된 샘플들(완벽한 복원의 코딩/디코딩이므로 초기 샘플들 xn 에 대응한다.)을 나타낸다.
-
Figure 112009047735616-pct00030
은 정정 없이 긴 합성 윈도우 FLS를 사용하여 디코딩되었을(DCT-1 인버스 변환 적용) 샘플들에 대응한다. 그리고,
- sn은 일련의 연속된 짧은 합성 윈도우들(FCS)을 사용하여 완전히 디코딩된 샘플들(일반적으로 샘플 b 및 후속 샘플들)을 나타낸다.
두개의 가중 함수들 w1,n과 w2,n은 다음과 같이 쓰여진다.
Figure 112009047735616-pct00031
그리고,
Figure 112009047735616-pct00032
(여기서 0≤n<M/2-Ms/2)
"샘플들"
Figure 112012096478809-pct00033
은 실제로는 긴 합성 윈도우를 사용하여 합성 및 가중에 의해 불완전하게 디코딩된 값들이라는 것이 이해될 것이다. 일반적으로, 이는 도 3a의 v1 값들과 관련되며, 이 값들은 윈도우(FLS)의 계수들 h(M+n)에 의해 곱해지고, 여기서, 샘플 a와 같은 프레임 Ti의 시작부로부터의 샘플들이 또한 관련된다.
샘플들 b와 그 후속 샘플들은 여기서 먼저 결정되며, 위에서 주어진 식 "sM-1-n"으로 쓰여지고, 그러므로 이 제2의 실시예에서의 디코딩 프로세싱에 의해 제시되는 시간 역전을 보여준다.
후자에는 항 w1,n이 없으므로(h(M+N)에 의한 나눗셈에 의해) 긴 합성 윈도우(FLS)에 의해 수행되는 가중처리가 회피된다는 것에 또한 주목하여야 한다.
또한, 도 3b의 샘플들(e에서 f까지)의 구간에 대응하는, 긴 윈도우(FL)(하강 에지)와 제1의 짧은 윈도우(FC)(상승 에지) 모두에 의해 커버되는 샘플 부분을 복원하기 위하여, 다음과 같은 두개의 가중항들의 조합의 애플리케이션이 선호된다.
Figure 112009047735616-pct00034
, 여기서 m=n-M/2+Ms/2 그리고 M/2-Ms/2≤n<M/2+Ms/2
앞에서와 같이,
Figure 112009047735616-pct00035
항들은 긴 합성 윈도우(FLS)에 의한 합성 및 가중에 의해 불완전하게 재구성되는 값들을 구성하며,
Figure 112009047735616-pct00036
항들은 제1의 짧은 합성 윈도우(FCS) 의 상승 에지로부터 불완전하게 재구성되는 값들을 나타낸다.
여기서,가중 함수 w'1,n 와 w'2,n은 다음에 의해 주어진다.
Figure 112009047735616-pct00037
그리고
Figure 112009047735616-pct00038
이 가중 함수들 w1,n, w2,n, w'1,n 그리고 w'2,n 은 길고 짧은 윈도우들에만 의존하는 고정 요소들에 의해 구성된다. 그러한 가중 함수들의 변형의 예들이 도 4a와 도 4e에서 보여진다. 유익한 실시예에서, 이러한 함수들에 의해 취해지는 값들은 선험적으로(a priori) 계산(도표화(tabulated)됨)될 수 있고 최종적으로 본 발명의 디코더의 메모리에 저장된다.
그러므로, 도 5b를 참조하여, 일 실시예에서, 긴 분석 윈도우로부터 짧은 분석 윈도우로 바로 이행(passing)할 때, 코딩된 프레임 T'i의 디코딩 중의 프로세싱은, 다음의 단계들을 포함할 수 있다. 프레임 T'i(단계(60))를 디코딩하기 위하여, 프레임의 종단의 값 v2=b(단계(63))을 디코딩하기 위하여 먼저 짧은 합성 윈도우가 적용된다(단계(61)). 여기서, b를 결정하기 위하여 다음의 코딩된 프레임 T'i+1 (단계(62))에 의존한다. 그후, 관계식
Figure 112012096478809-pct00039
을 사용하여 그리고 앞에서 계산되어 도표화된 가중 값들 w1,2과 w2,n을 사용(단계(66))하여 0과 M/2-Ms/2 사이의 값들을 포함하는 임의의 n에 대하여 보상을 적용(단계(67))함으로써, 프레임 T'i 시작부의 샘플들 a를 디코딩(단계(65))하기 위하여 긴 합성 윈도우(단계(64))가 적용된다.
코딩된 프레임 T'i의 "중앙" 영역(e와 f사이)의 디코딩은, 그러므로 M/2-Ms/2와 M/2+Ms/2사이의 값들을 포함하는 n에 대하여 병렬로(도 5b의 "+"부호), 길고 짧은 합성 윈도우들을 모두 사용함(단계(68))으로써 그리고 구체적으로 관계식
Figure 112012096478809-pct00040
(여기서, m=n-M/2+Ms/2이고 가중 값들 w'1,n과 w'2,n은 앞에서 계산되어 도표화되었음(단계(70)))으로부터의 보상을 적용함(단계(69))으로써 수행될 수 있다. 마지막으로, 이러한 프로세싱(단계(71))으로부터, 초기 프레임 Ti의 모든 타입의 샘플들(a,b,e 또는 f)이 유추될 수 있다.
위에서 설명된 제1 및 제2의 실시예들은, 긴 분석 윈도우로부터 짧은 분석 윈도우로 직접 이행(passing)하여 코딩된 프레임 T'i를 디코딩하는 중에 완벽한 복원을 보장하며, 그후 코딩 중에, 긴 윈도우로부터 짧은 윈도우로 직접 이행(passing)하는 것을 효과적으로 가능하게 해준다.
이제, 도 5a를 참조로 하여, 적어도 어떤 경우들에 있어서, 장단 천이 윈도우의 코딩 중 애플리게이션을 생략하는 것이 제시되는 실시예가 설명될 것이다.
프레임 Ti를 수신하고(단계(50)), 어택 ATT(테스트(51))와 같은 비정상적인 현상의 존재가 프레임 Ti에 바로 존재하는 디지털 오디오 신호에서 발견된다. 이러한 종류의 현상이 검출되지 않는 한(테스트(51)의 출력에서 화살표 n), 이러한 프레임 Ti의 코딩(단계(56))에 대해 긴 윈도우들의 애플리케이션(단계(52))이 계속된다. 그렇지 않다면(테스트(51)의 출력에서 화살표 y), 사건 ATT가 현재 프레임 Ti(테스트(53))의 시작부(예를 들어, 전반)에 있는지를 결정하는 것이 요구된다. 이 경우(테스트(53)의 출력에서 화살표 y) 짧은 윈도우, 보다 정확하게는 일련의 짧은 윈도우들이 프레임 Ti의 코딩(단계(56))에 대해 직접 적용된다(단계(54)). 이 실시예는 천이 윈도우를 사용하지 않을 수 있게 해주며, 짧은 윈도우를 적용하기 위하여 다음의 프레임 Ti+1에 대해 대기하지 않을 수 있게 해준다.
그러므로, 최신 기술과는 대조적으로, 다음 프레임(Ti+1)에서가 아닌, 코딩되고 있는 프레임(Ti)에서, 비정상적인 현상과 같은 특정 사건을 직접적으로 검출하는 것이 가능하다. 본 발명에서의 코딩 지연은 종래의 기술의 코딩 지연에 비해 감소된다. 사실, 비정상적인 현상이 현재 프레임의 시작시에 검출되면, 짧은 윈도우가 직접 적용되는데, 종래의 기술에서는, 코딩 Ti 중 프레임에 대해 천이 윈도우를 적용할 수 있게 하기 위해서는 다음 프레임 Ti+1에서의 비정상적인 현상을 검출할 필요가 있었을 것이다.
도 5a를 다시 참조하면, 비정상적인 현상이 현재 프레임 Ti의 종단에서 검출되면(예를 들어, 후반)(테스트(53))의 출력에서 화살표 n), 짧은 윈도우들의 연속을 적용하기 전에, 진행중인 프레임(Ti)을 코딩(단계(56))하기 위하여 천이 윈도우(단계(55))를 적용하도록 선택하는 것이 가능하다. 이 실시예는 특히 감소된 코딩 지연을 보장하는 한편, 최신기술의 프로세싱과 동일한 프로세싱을 제시하는것을 가능하게 해준다.
그러므로, 보다 일반적으로, 이 실시예에서 적어도 세개의 가중 윈도우들이 제공된다.
- 짧은 윈도우
- 긴 윈도우, 그리고
- 긴 윈도우의 사용에서 짧은 윈도우의 사용으로 이행(passing)하기 위한 천이 윈도우
그리고, 비정상적인 현상과 같은 특정 사건이 현재 프레임의 끝에서 검출되면(단계(53)), 현재 프레임(Ti)을 코딩(단계(56))하기 위하여 천이 윈도우(단계(55))가 적용된다.
이 실시예의 변형에서, 긴 윈도우의 사용으로부터 짧은 윈도우의 사용으로 이행(passing)하기 위하여, 다음이 제공될 수 있다.
- 현재 프레임 Ti에 대해, 긴 윈도우(FL)의 사용
- 그리고, 특정 사건이 현재 프레임의 끝에서 검출되었다 하더라도, 즉시 계속되는 프레임 Ti+1에 대해, 천이 윈도우를 사용하지 않고, 짧은 윈도우(FC)를 직접적 사용
이러한 변형은 다음의 이점을 가진다. 코더가 디코더에게 윈도우 타입의 변경에 대한 정보 아이템을 송신해야만 하는데, 코더가 디코더에게 짧은 윈도우와 천이 윈도우 간의 선택을 알려줄 필요가 없기 때문에, 이 정보가 단일 비트로 코딩될 수 있다.
그럼에도 불구하고, 짧은 윈도우로부터 긴 윈도우로의 이행(passing)을 위하여, 그리고 특히 계속해서 단일 비트 상의 윈도우 타입 변경에 대한 정보를 확실히 전송하기 위하여, 천이 윈도우가 유지될 수 있으며, 긴 윈도우로부터 짧은 윈도우로의 이행(passing) 정보 아이템을 수신한 후, 디코더는 이를 위하여,
- 짧은 윈도우를 사용하고,
- 그후, 윈도우 타입 변경 정보의 수신이 없는 경우, 짧은 윈도우로부터 긴 윈도우로의 천이 윈도우를 사용하고,
- 그후 마지막으로, 긴 윈도우를 사용한다.
코딩 중에 사용되는 윈도우의 타입 정보의 통신(코더(10)에서 디코더(20)로)은, 도 6에 도시된다. 코더(10)가 코딩 중에 프레임 Ti에 포함된 신호의 강한 어택과 같은 특정 사건의 검출 모듈(11)을 포함하며, 사용할 윈도우의 타입을 이 검출로부터 연역한다는 것이 생각날 것이다. 이를 위하여, 모듈(12)은 사용할 윈도우의 타입을 선택하고, 모듈(12)에 의해 선택되는 분석 윈도우(FA)를 사용하여, 코딩된 프레임 T'i를 전달하는 코딩 모듈(13)에 이 정보를 전송한다. 코딩된 프레임 T'i은 코딩중 사용되는 윈도우 타입에 대한 정보(INF)와 함께 (일반적으로 단일 데이터 흐름에서) 디코더(20)으로 전송된다. 디코더(20)는 코더(10)로부터 수신한 정보(INF)에 따라 합성 윈도우(FS)를 선택하기 위한 모듈(22)을 포함하며, 모듈(23)은 디코딩 프레임
Figure 112012096478809-pct00041
을 전달하기 위하여 프레임 T'i에 디코딩을 적용한다.
본 발명은 또한 도 6의 코더(10)와 같은 코더에 관한 것이며, 상기 코더는 본발명의 방법을 실시하기 위한, 그리고 보다 구체적으로는 도 5a에 도시된 프로세싱 또는 앞에서 설명된 그것의 변형(윈도우 타입 변경 정보를 단일 비트 상에 전송)을 실시하기 위한 것이다.
본 발명은 또한 이러한 코더의 메모리 내에 저장되도록 되어있는 컴퓨터 프로그램에 관한 것이며, 상기 컴퓨터 프로그램은 그러한 프로그램이 코더의 프로세서에 의해 실행될 때, 그러한 프로세싱 또는 그것의 변형을 실시하기 위한 명령어들을 포함한다. 이를 위하여, 도 5a가 그러한 프로그램의 흐름도를 나타낼 수 있다.
위의 제2의 실시예에 따라, 코더(10)는 분석 윈도우들(FA)을 사용하고 디코더(20)는 합성 윈도우들(FS)을 사용할 수 있다는 것이 상기될 것이다. 이들 합성 윈도우들은, 그럼에도 불구하고 앞에서 설명된 보상에 의한 정정을 진행함으로써(가중 함수들 w1,n, w2,n, w'1,n 그리고 w'2,n을 사용함으로써), 분석 윈도우들(FA)과 일치된다.
본 발명은 또한 도 6에 도시된 디코더(20)와 같은 변환 디코더의 메모리 내에 저장하려 의도된 또 다른 컴퓨터 프로그램에 관련되며, 상기 프로그램은, 그러한 프로그램이 이 디코더(20)의 프로세서에 의해 실행될 때, 제 1의 실시예 또는 도 5b를 참조로 위에서 설명된 제2의 실시예에 따라, 디코딩의 실시를 위한 명령어 들을 포함한다.
본 발명은 또한 변환 디코더 그 자체와 관련되며, 상기 디코더를 위한 컴퓨터 프로그램의 명령어들을 저장하는 메모리를 포함한다.
일반적으로, 각각 서로 다른 길이를 지닌 적어도 두가지 타입의 가중 윈도우들을 사용하여 코딩된 연속적인 프레임들에 의해 나타내어지는 신호에 대한 본 발명의 변환 디코딩 방법은, 다음과 같이 수행된다.
긴 윈도우로부터 짧은 윈도우로의 이행(passing)을 위한 정보 아이템을 수신하는 경우:
- 짧은 분석 윈도우(FC)를 사용하여 코딩된 주어진 프레임 T'i+1에 대해 짧은 합성 윈도우(FCS) 타입의 윈도우를 적용하는 디코딩으로부터 샘플들(타입 b의)이 결정된다. 그리고
- 상보 샘플들(complementary samples)은 다음에 의해 얻어질 수 있다.
. 긴 분석 윈도우(FL) 타입을 사용하여 코딩된, 주어진 프레임을 선행하는 프레임 T'i를 부분적으로 디코딩(인버스 변환 DCT-1의 적용).
. 도표화될 수 있으며 디코더의 메모리 내에 저장될 수 있는 가중 함수들과 관련되는 두개의 가중 항들의 조합을 적용.
위의 두번째의 실시예에서, w1,n, w2,n, w'1,n, w'2,n 으로 표시된 함수들이 관련된다.
그러나, 이러한 일반적인 디코딩 프로세싱은 제1과 제2의 실시예들의 두 경 우들에 적용된다.
제2의 실시예에서,
- 먼저, 주어진 프레임(T'i+1)로부터 샘플들(b)이 결정된다(도 5b의 단계(63)). 그리고,
- 그것으로부터, 이전의 프레임(T'i)의 시작에 시간적으로 대응하는 샘플들(a)이 도출되며(단계(65-67)), 이 샘플들은 긴 합성 윈도우(FLS)를 적용하는 디코딩으로부터 시작되며 제2의 실시예에 속한다.
이 경우에,
- M개의 샘플들을 포함하는 프레임,
- 2M개의 샘플들을 포함하는 긴 위도우,
- 2Ms개의 샘들들을 포함하는 짧은 윈도우(여기서 Ms는 M보다 작다)에 대해,
샘플들
Figure 112009047735616-pct00042
(n은 0과 (M/2-Ms/2) 사이의 값들을 포함한며, n=0 은 디코딩되고 있는 프레임의 시작부에 대응한다)은 다음의 두가지 가중 항들의 조합으로 주어진다.
Figure 112009047735616-pct00043
, 여기서
-
Figure 112009047735616-pct00044
은 앞의 프레임 T'i로부터 기인(orignating)되는 값들(v1)이고,
- sM-1-n은 주어진 프레임 T'i+1에 대해 적용되는 짧은 합성 윈도우들을 사용하여 이미 디코딩된 샘플들(b)이며, 그리고
- w1,n 과 w2,n은 가중 함수들이며, 이 가중함수들에서, n의 함수로서 취해진 값들이 도표화되어 디코더의 메모리 내에 저장될 수 있다.
그렇지 않다면, (M/2-Ms/2)와 (M/2+Ms/2) 사이의 값들을 포함하는 n에 대해서, 샘플들 은 두개의 가중 항들의 조합에 의해 주어진다.
Figure 112009047735616-pct00046
(m=n-M/2+Ms/2) 여기서,
-
Figure 112009047735616-pct00047
은 이전 프레임 T'i로부터 기인되는 값들(v1)이며,
-
Figure 112009047735616-pct00048
은 주어진 프레임 T'i+1로부터 기인되는 값들(v2)이고, 그리고
- w'1,n 과 w'2,n은 가중 함수들이며, 이 가중함수들에서, n의 함수로서 취해진 값들이 또한 도표화되어 디코더의 메모리 내에 저장될 수 있다.
그러므로, 본 발명은, 변환의 완벽한 복원 특성을 유지하면서, 종전 기술에 비하여 지연이 감소된, 윈도우들 간의 천이를 제공하는 것을 가능하게 해준다. 이 방법은 모든 타입의 윈도우들(비대칭 윈도우들 그리고 상이한 분석 및 합성 윈도우들)과, 그리고 상이한 변환들 및 필터 뱅크들에 적용될 수 있다.
긴 윈도우에서 보다 짧은 사이즈의 윈도우로 천이하는 경우 위에서 제시되는 보상 프로세싱들은 짧은 윈도우에서 보다 큰 사이즈의 윈도우로 천이하는 경우에 유사하게 그리고 자연적으로 확장된다. 이 경우에, 짧고 긴 천이 윈도우의 부재는 앞에서 제시된 경우와 유사하게 가중함으로써 디코더에서 보상될 수 있다.
본 발명은 어떤 변환 코더에도 적용될 수 있으며, 특히, MPEG-4 "AAC-Low Delay" 표준과 같은 쌍방향 대화형 애플리케이션들에 대한 변환 코더에 적용될 수 있으며, 또한 MDCT 변환들과 다른 변환들, 특히 위에서 언급한 ELT(Extendede Lapped Transform)와 그것의 쌍직교 확장에도 적용될 수 있다.
그러나, 특히 ELT 타입의 변환의 경우에, 변조(v1)로 인한 시간 폴딩 항들(temporal folding terms)이 과거로부터 기인된 시간 폴딩 항들과 결합될 수 있다는 것이 관찰되었다. 그러므로, 위에서 보인 정정 프로세싱은 미래의 샘플들의 영향 현상(또는 "에일리어싱(aliasing")을 고려한다. 반면, 아래에서 제시되는 전개는 과거의 요소들을 또한 고려하여, 적어도 정량화의 부재시 그것들을 취소하여 완벽한 복원을 얻도록 한다. 그러므로, 여기서 합성된 과거 신호와 결합된 추가적인 가중 함수를 정의하는 것이 제시되어, 시간 폴딩 항들을 생략하는 것이 가능해진다.
아래의 ELT 변환을 예로써 고려하는 것이 다음 문헌에서 설명된다. IEEE Transactions on Signal Procesing, Vol.48, No.3(March 2000)의 "Modulated Filter Banks with Arbitrary System Delay: Efficient Implementations and the Time-Varying Case"(Gerald D.T. Schuller, Tanja Karp)
다음의 실시예는, 본 발명의 프레임워크 내에서, 긴 윈도우(예를 들어, 2048개의 샘플들을 갖는)와 짧은 윈도우(예를 들어, 128개의 샘플들을 갖는) 사이에 천이가 없는 이행(passing)을 제시한다.
* 긴 윈도우(K=4, M=512)를 사용한 변환
이것은 저지연 변환이며, 이것의 윈도우는 K.M=2048의 사이즈를 가지고, 이것의 분석은 다음과 같이 쓰여진다.
Figure 112009047735616-pct00049
(0≤k≤M-1)
- M은 얻어진 스펙트럼 요소들의 수이다.
-
Figure 112009047735616-pct00050
) (-2M≤n≤2M-1) 윈도우된 입력 신호의 표시이다, 그리고
-
Figure 112009047735616-pct00051
은 긴 합성 윈도우의 표시이다.
도 7은 M=512 요소들을 가지며 오버랩 계수 K=4를 가진 ELT 변환의 경우에 대한 이러한 긴 합성 윈도우를 도시한다.
인버스 변환은,
Figure 112009047735616-pct00052
(0≤n≤4M-1)
이고, 복원된 신호 xn+tM은 4개의 요소들(K=4)의 오버랩 가산에 의해 얻어진다.
Figure 112009047735616-pct00053
(0≤n≤M-1)
그리고,
Figure 112009047735616-pct00054
합성 윈도우는 다음과 같이 정의된다.
Figure 112009047735616-pct00055
(0≤n≤4M-1)
한편, 분석 윈도우는 샘플들의 순서 반전에 의해 합성 윈도우로부터 정의된다. 즉,
Figure 112009047735616-pct00056
(0≤n≤4M-1)이다.
* 짧은 윈도우를 사용한 변환(k=2, Ms=64)
짧은 윈도우의 경우에, 분석 변환은 다음과 같이 쓰여진다.
Figure 112009047735616-pct00057
(0≤k≤Ms-1)
여기서, 윈도우된 입력 신호로서
Figure 112009047735616-pct00058
(0≤n≤2Ms-1)이고, ws(n)은 짧은 합성 윈도우이다.
인버스 변환은 다음과 같이 쓰여진다.
Figure 112012096478809-pct00129
(0≤n≤2Ms-1)
그리고, 복원된 신호 xn+tM 는 두 요소들(Ks=2)의 오버랩 가산에 의해 얻어진다.
xn+tMs = zt,n + zt-1,n+Ms (0≤n≤Ms-1)
그리고,
Figure 112009047735616-pct00060
이러한 정의에서, t는 짧은 프레임의 인덱스이고, 분석 및 합성 윈도우들은, 서로 대칭이므로, 동일하다.
Figure 112009047735616-pct00061
(0≤n<2Ms)
* 가중 함수들의 표현
이 실시예에서,
- M개의 샘플들을 포함하는 프레임과,
- 4M개의 샘플들을 포함하는 긴 윈도우와,
- 2Ms개의 샘플들을 포함하는 짧은 윈도우(여기서 Ms는 M보다 작다)와,
0과 M/2-Ms/2사이의 값들을 포함하는 n(n=0은 디코딩 중인 프레임의 시작부에 대응한다)에 대해서, 샘플들
Figure 112009047735616-pct00062
은 4개의 가중 항들의 조합에 의해 다음과 같이 주어진다.
Figure 112009047735616-pct00063
(0≤n≤M/2-Ms/2), 여기서
-
Figure 112009047735616-pct00064
은 디코딩된 샘플들을 나타낸다(코딩/디코딩이 완벽한 복원인 경우, 초기 샘플들 xn에 대응)
-
Figure 112009047735616-pct00065
는, 프레임 T'i의 정정 없이 선행 메모리 요소들 zt-1,n+2M + zt-2,n+3M 에 추가하여, 긴 합성 윈도우를 사용함으로써, 주어진 프레임(T'i+1)을 선행하는 프레임(T'i)의 불완전하게 디코딩된 샘플들에 대응한다.
- sn은 (M/2+MS/2≤n<M과 같은 인덱스 n의 샘플에 대해) 프레임 T'i+1의 연속적인 짧은 합성 윈도우들(FCS)을 사용하여 완전하게 디코딩된 샘플들과 그리고 이전 프레임들의 완전하게 디코딩된 샘플들(sn-2M(0≤n<M)로 표시되며, 이는 {s-2M, S-2M+1, ..., S-M-1}과 동일하다)을 나타낸다. 그리고,
- w1,n, w2,n, w3,n 그리고 w4,n은 가중 함수이며, 여기서 상기 가중함수 값들은 n의 함수로 취해지고 도표화되며, 디코더의 메모리 내에 저장되거나 길고 짧은 분석 및 합성 윈도우들의 함수로서 계산될수 있다.
유익하게, 특히 완벽한 복원을 보장하기 위하여, 다음과 같은 식들이 가중 함수들로서 선택될 수 있다.
0≤n<M/2-Ms/2에 대해,
Figure 112009047735616-pct00066
w1,n과 w2,n의 형태가 MDCT 변환의 경우에 앞에서 개시된 것들과 약간 다르다는 것을 알 수 있을 것이다. 사실, 필터들은 더 이상 대칭적이지 않으며(따라서 h2항이 사라진다) 변조 항들은 변경되고, 이는 부호의 변화를 설명해준다.
이 실시예에서, M/2-Ms/2와 M/2+Ms/2 사이의 값들을 포함하는 n에 대해, 샘 플들
Figure 112009047735616-pct00067
이 다음과 같은 4개의 가중 항들의 조합에 의해 주어진다.
Figure 112009047735616-pct00068
,
여기서 m=n-M/2+Ms/2 이고 M/2-Ms/2≤n<M/2+Ms/2 이다.
동일한 기호표시법에 따라,
-
Figure 112009047735616-pct00069
은 주어진 프레임 T'i+1을 선행하는 프레임 T'i의 불완전하게 디코딩된 샘플들이다.
-
Figure 112009047735616-pct00070
은 주어진 프레임 T'i+1의 제1의 짧은 윈도우의 불완전하게 디코딩된 샘플들이다. 그리고,
- sn은 앞의 프레임들(T'i-1, T'i-2, ...)에서 완전히 디코딩된 샘플들을 나타낸다.
w'1,n, w'2,n, w'3,n 그리고 w'4,n은 가중 함수이며, 이 가중 함수의 값들은 n의 함수로서 선택되고, 또한 도표화되어 디코더의 메모리 내에 저장되거나 또는 길고 짧은 분석 및 합성 윈도우들의 함수로서 계산될 수 있다.
바람직하게는, 완벽한 복원을 보장하기 위하여 가중 함수들이 선택될 수 있다.
M/2-Ms/2≤n<M/2+Ms/2 (m=n-M/2+Ms/2) 에 대해서,
Figure 112009047735616-pct00071
이다.
그러므로, 이 실시예에서, 긴 윈도우와 짧은 윈도우 사이의 천이 중에, 다음의 조합으로부터 신호가 복원된다.
- 짧은 윈도우들로부터 복원된 샘플들의 가중된 버전.
- 긴 윈도우로부터 부분적으로 복원된 샘플들의 가중된 버전(메모리 항들 Zt-1,n+2M + Zt-2,n+3M을 적분).
- 그리고 과거의 합성된 신호 샘플들 조합의 가중된 버전.
이 실시예의 변형에서, 함수들 w'3,n과 w'4,n은 크게 다르지 않다는 것을 알 수 있을 것이다. 그들의 수식에서 항 h(4M-1-n)과 h(3M+n) 항들만이 다르다. 일 실시예는 예를 들어, h(4M-1-n)sn-2M + h(3M+n)s-M-1-n 항들을 준비하고, 그 결과를 다음의 함수에 의해 가중하는 것을 포함할 수 있다.
Figure 112009047735616-pct00072
그리고, 그러므로 상기 식은 w'3,n과 w'4,n 함수들에 대응하며, 상기 식으로부터 h(4M-1-n)과 h(3M+n) 항들의 기여는 제거되었다.
이 동일한 원리는 w3,n과 w4,n에도 유사한 방식으로 적용된다.
다른 변형에서, 합성 메모리가 가중된다. 유익하게는, 이러한 가중은, 긴 윈도우로부터 불완전하게 복원된 샘플들이 가중된 메모리 zt-1,n+2M+zt-2,n+3M에 더해지도록 합성 메모리들을 0으로 설정하는 것일 수 있다. 이 경우에, 과거의 합성 신호에 적용된 가중은 달라질 수 있다.
앞에서 개시된 실시예에서 얻어지는 가중 함수들 w와 w'의 특징적인 형태들이 도 9와 10에 도시된다. 특히, 이 그래프들의 y축 값들을 참조하여, 도 9에 도시된 함수들 w'1,n과 w'2,n과 관련하여, 도 10에 도시된 함수들 w'3,n과 w'4,n이 무시(선택된 그들의 값들을 고려하여)될 수 있는것으로 나타난다. 그러므로, 함수들 w'3,n과 w'4,n에서의 항들에 관련된 항들은, 신호
Figure 112009047735616-pct00073
의 복원에 관하여 위에서 주어졌었던 합
Figure 112009047735616-pct00074
에서 생략될 수 있다. 이러한 생략은 낮은 복원 에러가 되게 한다.
또한, 프로세싱의 간결성을 더 많이 고려하는 변형에서, w'3,n과 w'4,n은 매우 유사하게 나타난다. 그러므로, 계산 시간에 있어서의 이득을 얻기 위하여, 이 두 가중 함수들의 조합(예를 들어, 두 함수들의 평균)만을 사용하는 것이 제시된다.
도 8(가중 함수 w1,n과 w2,n의 그래프를 나타냄) 및 도 12(가중 함수 w3,n과 w4,n의 그래프를 나타냄)의 비교는 함수들 w1,n과 w2,n과 관련하여 함수들 w3,n과 w4,n가 동일하게 관찰되게한다.
그러므로, 예를 들어,
Figure 112009047735616-pct00075
또는 적절한 복원 에러를 발생시킬 이 두 함수들의 또 다른 선형 조합을 사용하여,
Figure 112009047735616-pct00076
의 이전 수식을 다음과 같이 단순화하는 것이 가능하다.
-
Figure 112009047735616-pct00077
(함수들 w3,n과 w4,n에 의한 가중들이 생략되는 경우)
- 또는,
Figure 112009047735616-pct00078
함수들 w3,n과 w4,n에 의한 가중의 생략은 신호보다 84dB 낮은 파워를 가지는 복원 에러를 야기할 것이고, 단순한 선형 조합(예를 들어, 이 함수들의 평균) 그 자체는 신호보다 96dB 낮은 에러를 야기할 것이며, 두 경우 모두는 오디오 애플리케이션들에 대해서 이미 매우 만족스럽다. 보통, 실제의 완벽한 복원은 신호보다 120 내지 130 dB 낮은 에러 파워를 측정할 수 있게 해주는 것에 주목하여야 한다.
또한, 가중식[1]에서 메모리 항들 sn-2M과 s-M-1-n을 더 이상 사용하지 않는 것은 과거의 경우에서의 정량화 잡음의 확산(spreading)을 방지해줄 수 있다. 그러므로, 정량화 없는 불완전한 복원이 결국 신호가 코딩되는 때에 정량화 잡음의 제약으로 대체된다.
시간 지원 0-128(도 8 및 도 12)에서, 가중 함수들이 다음의 특정 형태를 가지는 것 또한 이해되어야 한다.
Figure 112009047735616-pct00079
이러한 관측은 설명된 예에서, 0과 128 사이에 있는 0의 진폭을 가진 제1 부분을 포함하는 윈도우 h(n)(도 7) 형태에 의해 설명된다. 결과적으로, 이 예에서, 복잡성의 관점에서, 제1의 복원을 두 단계로 분할하는 것이 바람직하다.
-
Figure 112009047735616-pct00080
(0≤n<128), 그리고
-
Figure 112009047735616-pct00081
(128≤n<M/2-Ms/2=224)
유익한 알고리즘 구조를 가지는 실시예에서, 이하에서 개시되는 바와 같이, 한편으로는 가중 함수들 w1,n과 w2,n(도 11)이, 그리고 다른 한편으로는 w3,n과 w4,n(도 12)이, 0에서부터 (M+Ms)/2까지의 전체 구간에 대해 정의될 수 있다.
제1 단계에서, 복원될 신호
Figure 112009047735616-pct00082
의 일차식의 계산(
Figure 112009047735616-pct00083
로 표시됨)이 다음과 같이 0에서 (M+Ms)/2로 이루어진다.
*
Figure 112009047735616-pct00084
(이 식은 도 11의 0과 M/2+Ms/2 사이의 값들을 포함하는 n의 전체 범위에 대해 함수 w1,n이 계산되게 하며, 도 12에 도시된 이와 동일한 범위에 대해 함수 w3,n과 w4,n이 계산되게 한다.)
0과 M/2-Ms/2 사이의 값들을 포함하는 n(여기서 n=0은 디코딩 프로세스의 프레임의 시작부에 대응한다)에 대해서,
*
Figure 112009047735616-pct00085
(여기서 w2,n은 도 11의 w2,n으로 표시된 곡선의 시작부(x축상의 224 전)에 대응한다.)라 하고,
그리고, M/2-Ms/2와 M/2+Ms/2 사이의 값들을 포함하는 n에 대해서,
Figure 112009047735616-pct00086
, 여기서 m=n-M/2+Ms/2, M/2-Ms/2≤n<M/2+Ms/2 이며, w'2,n은 도 11의 참조 곡선 w2,n의 끝부분(x축 상의 224 후)에 대응한다.
함수 w2,n과 함수 w'2,n에 의해 가중되는 구체적인 프로세싱의 구분은 아래와 같이 설명된다.
각각의 함수 w1,n, w3,n 그리고 w4,n에 대해서, 0과 M/2+Ms/2 사이의 단일의 변동만을 사용하는 것이 가능하다. 반면, 함수들 w2,n과 w'2,n에 대해서
- 함수 w2,n은 완전하게 디코딩된 샘플들을 가중한다.
- 반면, 함수 w'2,n은 불완전하게 디코딩된 샘플들을 가중한다.
또한, 가중함수 w2,n에 대해서만 프로세싱의 "시간 역전"이 발생하고(s가 -n으로 인덱스됨), 가중함수 w'2,n에 대해서는 발생하지 않음을 알 수 있을 것이다.
그러므로, 일반적으로 요약하면, 본 발명은 긴 윈도우(오버랩 K>2인)에서 짧은 윈도우(오버랩 K'<K인)로의 천이 중에, 샘플들의 완전한 디코딩을 위하여 과거 샘플들의 영향을 감소시키는 것을 가능하게 해주며, 과거의 합성 신호와 관련된 적어도 두개의 가중 항들의 조합에 의해 디코딩된 샘플들이 얻어진다.

Claims (13)

  1. 각각이 서로 다른 길이를 가지는 적어도 두가지 타입의 가중 윈도우들을 사용하여 코딩된 연속적인 프레임들에 의해 표현되는 신호의 변환 디코딩(transform decoding)을 위한 방법으로서,
    긴 윈도우로부터 짧은 윈도우로의 이행(passing)에 대한 정보 아이템을 수신하는 경우,
    짧은 합성 윈도우(synthesis window) 타입의 윈도우(61)를, 짧은 분석 윈도우(analysis window)를 사용하여 코딩된 소정 프레임(T'i+1)에 적용하는 디코딩으로부터 샘플들(b)이 결정되고(63), 그리고
    긴 분석 윈도우 타입의 윈도우를 사용하여 코딩되었으며 상기 소정 프레임을 선행하는 프레임(T'i)을 부분적으로 디코딩(DCT-1)함으로써, 그리고 도표화되어(tabulated) 디코더의 메모리에 저장된 가중 함수들(w1,n, w2,n; w'1,n, w'2,n)과 관련된 적어도 두개의 가중 항들의 조합을 적용함으로써 상보 샘플(complementary sample)들(67, 69)이 얻어지는 것을 특징으로하는 변환 디코딩 방법.
  2. 제1 항에 있어서,
    상기 소정 프레임(T'i+1)으로부터 발생된(originated) 샘플들(b)이 먼저 결정되고(63), 그리고
    이들 샘플들로부터, 이전 프레임(T'i)의 시작부에 시간적으로 대응되는 샘플들(a)이 도출되며(65-67), 이들 샘플들은 긴 합성 윈도우를 적용하는 디코딩으로부터 발생되는 것을 특징으로 하는 변환 디코딩 방법.
  3. 제2 항에 있어서,
    프레임은 M개의 샘플들을 포함하며,
    긴 윈도우는 2M개의 샘플들을 포함하며,
    짧은 윈도우는 2Ms개의 샘플들을 포함하며, Ms는 M보다 작고,
    상기 샘플들(
    Figure 112012096478809-pct00087
    , 여기서 n은 0과 (M/2-Ms/2) 사이의 값들을 포함하며, n=0은 디코딩 중인 프레임의 시작부에 대응함)은,
    Figure 112012096478809-pct00088
    타입의 두개의 가중 항들의 조합에 의해 주어지며, 여기서
    Figure 112012096478809-pct00130
    은 상기 이전 프레임(T'i)로부터 발생된 값들(v1)이고, sM-1-n은 상기 소정 프레임(T'i+1)에 적용되는 짧은 합성 윈도우들을 사용하여 이미 디코딩된 샘플들(b)이며, 그리고 w1,n 과 w2,n은 가중 함수들이고, n의 함수로서의 상기 가중 함수들의 값들은 도표화되어 디코더의 메모리 내에 저장되는 것을 특징으로 하는 변환 디코딩 방법.
  4. 제1 항에 있어서,
    프레임은 M개의 샘플들을 포함하며,
    긴 윈도우는 2M개의 샘플들을 포함하며,
    짧은 윈도우는 2Ms개의 샘플들을 포함하며, Ms는 M보다 작고,
    상기 샘플들(
    Figure 112014027441322-pct00090
    , 여기서 n은 (M/2-Ms/2)과 (M/2+Ms/2)사이의 값들을 포함하며, n=0은 디코딩 중인 프레임의 시작부에 대응함)은
    Figure 112014027441322-pct00091
    (m=n-M/2+Ms/2) 타입의 두개의 가중 항들의 조합에 의해 주어지며, 여기서
    Figure 112014027441322-pct00092
    은 상기 이전 프레임(T'i)로부터 기인한 값들(v1)이며,
    Figure 112014027441322-pct00093
    은 상기 소정 프레임(T'i+1)으로부터 기인한 값들(v2)이고, 그리고w'1,n 과 w'2,n은 가중 함수로서, n의 함수로서의 상기 가중 함수들의 값들은 또한 도표화되어 디코더의 메모리 내에 저장되는 것을 특징으로 하는 변환 디코딩 방법.
  5. 제1 항에 있어서,
    오버랩 변환 코딩에 의해 코딩된 프레임들을 디코딩하는 것에 대해, 과거 샘플들의 영향을 감소시키기 위하여, 디코딩될 신호는, 짧은 윈도우들로부터 복원된 샘플들의 가중, 긴 윈도우로부터 부분적으로 복원된 샘플들의 가중, 그리고 과거의 디코딩된 신호의 샘플들의 가중의 조합으로부터 복원되는 것을 특징으로 하는 변환 디코딩 방법.
  6. 제5 항에 있어서,
    프레임은 M개의 샘플들을 포함하며,
    긴 윈도우는 4M개의 샘플들을 포함하며,
    짧은 윈도우는 2Ms개의 샘플들을 포함하며, Ms는 M보다 작고,
    디코딩될 샘플들
    Figure 112012096478809-pct00094
    (샘플 인덱스 n은 0과 (M/2-Ms/2)사이의 값들을 포함하며, n=0은 디코딩 중인 프레임의 시작부에 대응함)은,
    Figure 112012096478809-pct00095
    (0≤n≤M/2-Ms/2) 타입의 4개의 가중 항들의 조합에 의해 생성되며,
    Figure 112012096478809-pct00096
    는, zt-1,n+2M + zt-2,n+3M (여기서, 인덱스 t는 프레임 인덱스)로 표시된 선행 메모리 요소들에 대한 정정 없이 추가적으로 긴 합성 윈도우를 사용함으로써, 상기 소정 프레임(T'i+1)을 선행하는 상기 프레임(T'i)의 불완전하게 디코딩된 샘플들을 표시하며,
    sn은, M/2+Ms/2≤n<M에 대해, 상기 소정 프레임(T'i+1)의 연속적인 짧은 합성 윈도우들(FCS)을 사용하여 완전하게 디코딩된 샘플들을 나타내고, -2M≤n<M에 대해, 선행 프레임들(T'i, T'i-1, T'i-2,…)의 완전하게 디코딩된 샘플들을 나타내며,
    w1,n, w2,n, w3,n 그리고 w4,n 는 각각 샘플 인덱스 n에 의존하는 제1, 제2, 제3, 그리고 제4의 가중 함수들이며, n의 함수로서 적어도 제1과 제2의 가중 함수들(w1,n, w2,n)에 의해 취해지는 값들은 도표화되어 디코더의 메모리 내에 저장되는 것을 특징으로 하는 변환 디코딩 방법.
  7. 제5 항에 있어서,
    프레임은 M개의 샘플들을 포함하며,
    긴 윈도우는 4M개의 샘플들을 포함하며,
    짧은 윈도우는 2Ms개의 샘플들을 포함하며, Ms는 M보다 작고,
    M/2-Ms/2와 M/2+Ms/2 사이의 값들을 포함하는 n에 대하여, 디코딩될 샘플들
    Figure 112014027441322-pct00097
    Figure 112014027441322-pct00098
    타입의 4개의 가중 항들의 조합에 의해 주어지며,
    여기서,
    Figure 112014027441322-pct00099
    은 상기 소정 프레임(T'i+1)을 선행하는 상기 프레임(T'i)의 불완전하게 코딩된 샘플들이고,
    Figure 112014027441322-pct00100
    은 상기 소정 프레임(T'i+1)의 제1의 짧은 윈도우의 불완전하게 디코딩된 샘플들이고, m=n-M/2+Ms/2이며,
    sn은 상기 선행 프레임들(T'i, T'i-1, T'i-2,…)의 완전하게 디코딩된 샘플들을 나타내며,
    w'1,n, w'2,n, w'3,n 그리고 w'4,n은 각각 n에 의존하는 제1, 제2, 제3 그리고 제4의 가중 함수이며, n의 함수로서 적어도 제1과 제2의 가중 함수들(w'1,n, w'2,n)에 의해 취해지는 값들은 도표화되어 디코더의 메모리 내에 저장되는 것을 특징으로 하는 변환 디코딩 방법.
  8. 제6 항에 있어서,
    n의 함수로서 상기 제1 및 제2의 가중 함수들(w1,n, w2,n; w'1,n, w'2,n)에 의해 취해지는 값들만이 도표화되어 상기 디코더의 메모리 내에 저장되도록, 상기 샘플들
    Figure 112014027441322-pct00101
    의 계산에서 상기 제3 및 제4의 가중 함수들(w3,n, w4,n; w'3,n, w'4,n)의 영향은 무시되는 것을 특징으로 하는 변환 디코딩 방법.
  9. 제6 항에 있어서,
    상기 제3 및 제4의 가중 함수들(w3,n, w4,n; w'3,n, w'4,n)은 상기 제3 및 제4의 가중 함수들(w3,n, w4,n; w'3,n, w'4,n)의 선형 조합의 결과인 단일 가중 함수(w3-4,n; w'3-4,n)에 의해 주어지며, 상기 제1 및 제2의 가중 함수들(w1,n, w2,n; w'1,n, w'2,n)에 의해 취해진 값들만이, n의 함수로서 상기 단일 가중 함수(w3-4,n; w'3-4,n)에 의해 취해진 값들과 함께 도표화되어 상기 디코더의 메모리 내에 저장되는 것을 특징으로 하는 변환 디코딩 방법.
  10. 제6 항에 있어서,
    디코딩될 신호
    Figure 112014027441322-pct00102
    의 일차식
    Figure 112014027441322-pct00103
    Figure 112014027441322-pct00104
    타입의 가중 조합에 따라 계산되며,
    0과 M/2-Ms/2 사이의 값들을 포함하는 n에 대해, n=0은 디코딩 중인 프레임의 시작부에 대응하며,
    Figure 112014027441322-pct00105
    이고,
    M/2-Ms/2과 M/2+Ms/2 사이의 값들을 포함하는 n에 대해,
    Figure 112014027441322-pct00106
    (m = n - M/2 + Ms/2)인 것을 특징으로 하는 변환 디코딩 방법.
  11. 각각 서로 다른 길이를 가지는 적어도 두가지 타입의 가중 윈도우들을 사용하는 코더로부터 기인한 연속 프레임들에 의해 나타내어지는 신호의 변환 디코더로서,
    상기 변환 디코더는 적어도,
    긴 윈도우로부터 짧은 윈도우로의 이행(passage) 정보 아이템을 수신하는 수단과;
    짧은 분석 윈도우를 사용하여 코딩된 소정 프레임(T'i+1)에 대해 짧은 합성 윈도우(61) 타입의 윈도우를 적용하는 디코딩으로부터 샘플들(b)을 결정하기 위한 수단과, 그리고
    상보 샘플들(67, 69)을 얻는 수단을 포함하며, 상기 상보 샘플들(67, 69)을 얻는 수단은,
    긴 분석 윈도우 타입의 윈도우를 사용하여 코딩되었으며 상기 소정 프레임에 선행하는 프레임(T'i)을 부분적으로 디코딩(DCT-1)할 수 있으며, 그리고
    도표화되어 상기 디코더의 메모리 내에 저장되는 가중 함수들(w1,n, w2,n; w'1,n, w'2,n)과 관련된 적어도 두개의 가중 항들의 조합을 적용할 수 있는 것을 특징으로 하는 변환 디코더.
  12. 변환 디코더의 프로세서에 의해 실행될 때, 제1 항 내지 제10 항 중 임의의 한 항에 따른 디코딩 방법을 실행하기 위한 명령어들을 포함하는 컴퓨터 프로그램이 저장된, 상기 변환 디코더의 메모리.
  13. 제12 항에 따른 상기 메모리를 포함하는 것을 특징으로 하는 변환 디코더.
KR1020097016337A 2007-01-05 2007-12-18 가중 윈도우들을 사용한 저-지연 변환 코딩 KR101437127B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
FR0700056A FR2911227A1 (fr) 2007-01-05 2007-01-05 Codage par transformee, utilisant des fenetres de ponderation et a faible retard
FR0700056 2007-01-05
FR0702768 2007-04-17
FR0702768A FR2911228A1 (fr) 2007-01-05 2007-04-17 Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
PCT/FR2007/052541 WO2008081144A2 (fr) 2007-01-05 2007-12-18 Codage par transformee, utilisant des fenetres de ponderation et a faible retard

Publications (2)

Publication Number Publication Date
KR20090107051A KR20090107051A (ko) 2009-10-12
KR101437127B1 true KR101437127B1 (ko) 2014-09-03

Family

ID=39540608

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097016337A KR101437127B1 (ko) 2007-01-05 2007-12-18 가중 윈도우들을 사용한 저-지연 변환 코딩

Country Status (8)

Country Link
US (1) US8615390B2 (ko)
EP (1) EP2104936B1 (ko)
JP (1) JP5247721B2 (ko)
KR (1) KR101437127B1 (ko)
AT (1) ATE498886T1 (ko)
DE (1) DE602007012587D1 (ko)
FR (1) FR2911228A1 (ko)
WO (1) WO2008081144A2 (ko)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101952888B (zh) * 2007-12-21 2013-10-09 法国电信 一种具有合适的窗口的基于变换的编码和解码方法
PL3751570T3 (pl) 2009-01-28 2022-03-07 Dolby International Ab Ulepszona transpozycja harmonicznych
CA3107567C (en) 2009-01-28 2022-08-02 Dolby International Ab Improved harmonic transposition
KR101701759B1 (ko) * 2009-09-18 2017-02-03 돌비 인터네셔널 에이비 입력 신호를 전위시키기 위한 시스템 및 방법, 및 상기 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터 판독가능 저장 매체
CN103282958B (zh) * 2010-10-15 2016-03-30 华为技术有限公司 信号分析器、信号分析方法、信号合成器、信号合成方法、变换器和反向变换器
BR112012029132B1 (pt) 2011-02-14 2021-10-05 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Representação de sinal de informações utilizando transformada sobreposta
KR101525185B1 (ko) 2011-02-14 2015-06-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
CN103534754B (zh) 2011-02-14 2015-09-30 弗兰霍菲尔运输应用研究公司 在不活动阶段期间利用噪声合成的音频编解码器
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
JP5625126B2 (ja) 2011-02-14 2014-11-12 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム
CA2827249C (en) 2011-02-14 2016-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
PL3239978T3 (pl) 2011-02-14 2019-07-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodowanie i dekodowanie pozycji impulsów ścieżek sygnału audio
JP5849106B2 (ja) 2011-02-14 2016-01-27 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 低遅延の統合されたスピーチ及びオーディオ符号化におけるエラー隠しのための装置及び方法
FR2977439A1 (fr) * 2011-06-28 2013-01-04 France Telecom Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard.
EP2959481B1 (en) 2013-02-20 2017-04-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an encoded audio or image signal or for decoding an encoded audio or image signal in the presence of transients using a multi overlap portion
EP2830058A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
WO2017050398A1 (en) * 2015-09-25 2017-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding
EP3741885A4 (en) 2018-01-18 2021-10-20 Toray Industries, Inc. COLORABLE POLYOLEFIN FIBERS AND FIBER STRUCTURES THEREFORE
WO2020094263A1 (en) * 2018-11-05 2020-05-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5361278A (en) 1989-10-06 1994-11-01 Telefunken Fernseh Und Rundfunk Gmbh Process for transmitting a signal
WO1998002971A1 (en) 1996-07-11 1998-01-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. A method of coding and decoding audio signals

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4852179A (en) * 1987-10-05 1989-07-25 Motorola, Inc. Variable frame rate, fixed bit rate vocoding method
US5384891A (en) * 1988-09-28 1995-01-24 Hitachi, Ltd. Vector quantizing apparatus and speech analysis-synthesis system using the apparatus
US5173695A (en) * 1990-06-29 1992-12-22 Bell Communications Research, Inc. High-speed flexible variable-length-code decoder
US5347478A (en) * 1991-06-09 1994-09-13 Yamaha Corporation Method of and device for compressing and reproducing waveform data
JP2876497B2 (ja) * 1991-08-23 1999-03-31 松下電器産業株式会社 誤り訂正符復号化方法およびその装置
FR2687871B1 (fr) * 1992-02-25 1995-07-07 France Telecom Procede et dispositif de filtrage pour la reduction des preechos d'un signal audio-numerique.
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
EP0577488B9 (en) * 1992-06-29 2007-10-03 Nippon Telegraph And Telephone Corporation Speech coding method and apparatus for the same
US5689800A (en) * 1995-06-23 1997-11-18 Intel Corporation Video feedback for reducing data rate or increasing quality in a video processing system
BE1010336A3 (fr) * 1996-06-10 1998-06-02 Faculte Polytechnique De Mons Procede de synthese de son.
DE19736669C1 (de) * 1997-08-22 1998-10-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals
US6339804B1 (en) * 1998-01-21 2002-01-15 Kabushiki Kaisha Seiko Sho. Fast-forward/fast-backward intermittent reproduction of compressed digital data frame using compression parameter value calculated from parameter-calculation-target frame not previously reproduced
FR2774827B1 (fr) * 1998-02-06 2000-04-14 France Telecom Procede de decodage d'un flux binaire representatif d'un signal audio
US6975254B1 (en) * 1998-12-28 2005-12-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Methods and devices for coding or decoding an audio signal or bit stream
US7177805B1 (en) * 1999-02-01 2007-02-13 Texas Instruments Incorporated Simplified noise suppression circuit
DE10000934C1 (de) * 2000-01-12 2001-09-27 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Bestimmen eines Codierungs-Blockrasters eines decodierten Signals
US20010044919A1 (en) * 2000-05-05 2001-11-22 Edmonston Brian S. Method and apparatus for improved perormance sliding window decoding
US6587816B1 (en) * 2000-07-14 2003-07-01 International Business Machines Corporation Fast frequency-domain pitch estimation
US6636830B1 (en) * 2000-11-22 2003-10-21 Vialta Inc. System and method for noise reduction using bi-orthogonal modified discrete cosine transform
DE10102154C2 (de) * 2001-01-18 2003-02-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen eines skalierbaren Datenstroms und Verfahren und Vorrichtung zum Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkassenfunktion
DE10102155C2 (de) * 2001-01-18 2003-01-09 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen eines skalierbaren Datenstroms und Verfahren und Vorrichtung zum Decodieren eines skalierbaren Datenstroms
US6885992B2 (en) * 2001-01-26 2005-04-26 Cirrus Logic, Inc. Efficient PCM buffer
KR100591350B1 (ko) * 2001-03-06 2006-06-19 가부시키가이샤 엔.티.티.도코모 오디오 데이터 보간장치 및 방법, 오디오 데이터관련 정보작성장치 및 방법, 오디오 데이터 보간 정보 송신장치 및방법, 및 그 프로그램 및 기록 매체
EP1292036B1 (en) * 2001-08-23 2012-08-01 Nippon Telegraph And Telephone Corporation Digital signal decoding methods and apparatuses
KR100467617B1 (ko) * 2002-10-30 2005-01-24 삼성전자주식회사 개선된 심리 음향 모델을 이용한 디지털 오디오 부호화방법과그 장치
KR100524065B1 (ko) * 2002-12-23 2005-10-26 삼성전자주식회사 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치
US7272551B2 (en) * 2003-02-24 2007-09-18 International Business Machines Corporation Computational effectiveness enhancement of frequency domain pitch estimators
US7876966B2 (en) * 2003-03-11 2011-01-25 Spyder Navigations L.L.C. Switching between coding schemes
US7325023B2 (en) * 2003-09-29 2008-01-29 Sony Corporation Method of making a window type decision based on MDCT data in audio encoding
US7283968B2 (en) * 2003-09-29 2007-10-16 Sony Corporation Method for grouping short windows in audio encoding
US7516064B2 (en) * 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
GB0408856D0 (en) * 2004-04-21 2004-05-26 Nokia Corp Signal encoding
ATE371926T1 (de) * 2004-05-17 2007-09-15 Nokia Corp Audiocodierung mit verschiedenen codierungsmodellen
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
US8744862B2 (en) * 2006-08-18 2014-06-03 Digital Rise Technology Co., Ltd. Window selection based on transient detection and location to provide variable time resolution in processing frame-based data
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7693709B2 (en) * 2005-07-15 2010-04-06 Microsoft Corporation Reordering coefficients for waveform coding or decoding
US7599840B2 (en) * 2005-07-15 2009-10-06 Microsoft Corporation Selectively using multiple entropy models in adaptive coding and decoding
FR2897733A1 (fr) * 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
SG136836A1 (en) * 2006-04-28 2007-11-29 St Microelectronics Asia Adaptive rate control algorithm for low complexity aac encoding
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
JP4836720B2 (ja) * 2006-09-07 2011-12-14 株式会社東芝 ノイズサプレス装置
KR101292771B1 (ko) * 2006-11-24 2013-08-16 삼성전자주식회사 오디오 신호의 오류은폐방법 및 장치
CN101231850B (zh) * 2007-01-23 2012-02-29 华为技术有限公司 编解码方法及装置
PL2346030T3 (pl) * 2008-07-11 2015-03-31 Fraunhofer Ges Forschung Koder audio, sposób kodowania sygnału audio oraz program komputerowy
FR2938688A1 (fr) * 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
US8204744B2 (en) * 2008-12-01 2012-06-19 Research In Motion Limited Optimization of MP3 audio encoding by scale factors and global quantization step size
KR101616054B1 (ko) * 2009-04-17 2016-04-28 삼성전자주식회사 음성 검출 장치 및 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5361278A (en) 1989-10-06 1994-11-01 Telefunken Fernseh Und Rundfunk Gmbh Process for transmitting a signal
WO1998002971A1 (en) 1996-07-11 1998-01-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. A method of coding and decoding audio signals

Also Published As

Publication number Publication date
WO2008081144A3 (fr) 2008-09-18
ATE498886T1 (de) 2011-03-15
EP2104936B1 (fr) 2011-02-16
DE602007012587D1 (de) 2011-03-31
EP2104936A2 (fr) 2009-09-30
WO2008081144A2 (fr) 2008-07-10
JP2010515106A (ja) 2010-05-06
FR2911228A1 (fr) 2008-07-11
US20100076754A1 (en) 2010-03-25
US8615390B2 (en) 2013-12-24
JP5247721B2 (ja) 2013-07-24
KR20090107051A (ko) 2009-10-12

Similar Documents

Publication Publication Date Title
KR101437127B1 (ko) 가중 윈도우들을 사용한 저-지연 변환 코딩
JP6704037B2 (ja) 音声符号化装置および方法
KR100469002B1 (ko) 오디오 코딩 방법 및 장치
RU2713605C1 (ru) Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио
EP4254951A2 (en) Audio decoding method for processing stereo audio signals using a variable prediction direction
EP3693963A1 (en) Simultaneous time-domain and frequency-domain noise shaping for tdac transforms
AU2005213768A1 (en) Audio coding
AU2005213770A1 (en) Audio encoding
JP4699117B2 (ja) 信号符号化装置、信号復号化装置、信号符号化方法、及び信号復号化方法。
RU2776261C1 (ru) Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио
WO2011052191A1 (ja) トーン判定装置およびトーン判定方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170811

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180801

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190801

Year of fee payment: 6