KR101408183B1 - 적응적 윈도를 갖는 변환 기반 코딩/디코딩 - Google Patents

적응적 윈도를 갖는 변환 기반 코딩/디코딩 Download PDF

Info

Publication number
KR101408183B1
KR101408183B1 KR1020107016422A KR20107016422A KR101408183B1 KR 101408183 B1 KR101408183 B1 KR 101408183B1 KR 1020107016422 A KR1020107016422 A KR 1020107016422A KR 20107016422 A KR20107016422 A KR 20107016422A KR 101408183 B1 KR101408183 B1 KR 101408183B1
Authority
KR
South Korea
Prior art keywords
window
coding
windows
analysis
synthesis
Prior art date
Application number
KR1020107016422A
Other languages
English (en)
Other versions
KR20110111231A (ko
Inventor
삐에릭 필리쁘
다비드 뷔레
Original Assignee
오렌지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오렌지 filed Critical 오렌지
Publication of KR20110111231A publication Critical patent/KR20110111231A/ko
Application granted granted Critical
Publication of KR101408183B1 publication Critical patent/KR101408183B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring

Abstract

본 발명은 디지털 신호의 코딩/디코딩을 제공하며, 특히 가중치 윈도를 채용하여 중첩하여 변환을 사용한다. 본 발명에서, 신호의 두개의 연속하고 동일한 크기의 샘플 블록들이 각가 다른 연속하는 윈도에 의해 가중될 수 있다. 이러한 두 개의 윈도는 두개의 블록 각각에 대해 결정되는 신호의 특성(엔트로피, 데이터 레이트/왜곡 등)에 따른 기준에 따라 상호 독립적으로 선택될 수 있다.

Description

적응적 윈도를 갖는 변환 기반 코딩/디코딩{TRANSFORM-BASED CODING/DECODING, WITH ADAPTIVE WINDOWS}
본 발명은 디지털 신호의 코딩 및 디코딩에 관한 것이다.
변환 기반 코딩 기법에서, 최소한의 감지 가능한 열화를 보장하면서, 샘플 코딩 프로세스에 집중하여 정확도를 축소하려는 시도는 흔하다. 이를 위해, 감지 가능한 가중치를 사용하여 양자화 정확도의 축소를 조절한다. 예를 들면 (비디오 코딩을 위한) 인간 눈 또는 (오디오 코딩을 위한) 인간 귀의 공지된 속성에 기반한, 이러한 접근에 따라 최소한의 감지 가능한 주파수 대역에 양자화 노이즈를 배치하는 것이 가능하게 되었다.
정신-시각 또는 정신-청각 모델로부터의 정보를 사용하기 위해, 주파수 도메인에서는 필수적으로, 주파수 도메인에서 수행된 양자화, 시간/주파수 변환을 적용하는 것이 표준화된 방식이다.
도 1은 변환-기반 코딩장치의 구조를 나타낸 도면으로서:
입력 신호 X를 수신하는 분석 필터들(analysis filters) (FA1 내지 FAn)의 뱅크(BA);
코딩 모듈들(COD1 내지 CODn)을 포함하는 코딩 블록(COD)이 뒤따르는 양자화 블록(Q) (대역 양자화 모듈들(Q1,..., Qn)포함); 및
코딩된 신호(X')를 전달하는 합성 필터들(FS1,...,FSn)의 뱅크(BS)를 갖는 변환 기반 코딩기의 구조를 나타낸다.
전송 전 비트 레이트를 더 줄이기 위해, 양자화된 주파수-도메인 샘플들이, 종종 엔드로픽(entropic)(무손실) 코딩 프로세스에 의해 코딩된다. 표준화된 방식으로, 균등(uniform) 또는 비균등(non-uniform) 스칼라 양자화기 또는 벡터 양자화기에 의해 양자화가 수행된다.
양자화 단계에서 도입된 노이즈는 합성 필터들의 뱅크에 의해 형성된다(이 단계는 역 변환을 적용하는 것으로 알려져 있다). 분석 변환(analysis transform)에 연계된, 역 변환은 따라서 주파수 또는 시간 도메인에서 양자화 노이즈가 감지되는 것을 방지하는데 집중하기 위해 선택된다.
분석 변환은 변환된 도메인에서 샘플들의 코딩을 용이하게 하기 위해 신호의 에너지를 최적으로 집중하여야 한다. 이 프로세스는 에너지 압축이라 칭한다. 특히, 입력 신호에 의존하는, 분석 변환의 코딩 이득이 최대화되어야 한다. 이를 위해 다음과 같은 종류의 등식이 사용되며, K는 바람직하게는 6.02 값을 갖는 상수이고, R은 각 선택된 샘플에서 비트의 개수이다:
SNR = G TC + K·R (1)
따라서 획득된 신호/노이즈 비(SNR)는 R 에 더해 변환의 코딩 이득을 나타내는 성분 G TC 에 비례한다.
코딩 이득이 높을수록 재구조화(reconstruction)의 질이 향상된다. 따라서 코딩 프로세스를 위해 사용되는 변환의 중요성은 명확하다. 이에 따라 (합성부를 사용하여) 양자화 노이즈와 (분석부를 사용하여) 신호의 에너지에 집중하게 하는 성능을 사용하여, 샘플 코딩을 용이하게 한다.
오디오 및 비디오 신호는 악명 높게 비안정적으로서, 시간-주파수 변환은 필터들의 뱅크의 입력 신호의 특성의 함수로서 시간에 대해 적용되어야 한다.
통상의 코딩 기술에 대한 소수의 어플리케이션들이 이하 기술된다.
변조된 변환을 갖는 정규(normalized) 오디오 코딩 기술은 코사인 변환 또는 급속 퓨리에 변환(fast Fourier transforms)에 기반한 급속 알고리즘을 사용하는 이러한 코딩 기술의 구현을 가능하게 하는 코사인-변조 필터들의 뱅크를 집적한다.
가장 통용되는 이러한 유형(특히 MP3, MPEG-2, 및 MPEG-4 AAA 코딩)의 변환은, 다음과 같이 표현되는 변형 이산 코사인 변환(MDCT)이다:
Figure 112010047207689-pct00001
Figure 112010047207689-pct00002
여기서:
M 은 변환의 크기;
xn + tM 은 시간 n+tM에서 주기 1/Fe(샘플링 주파수의 역수)를 갖는 디지털 신호의 샘플들;
t 는 프레임 인덱스;
Figure 112010047207689-pct00003
는 프레임 t를 위한 변환된 도메인에서의 샘플들;
Figure 112010047207689-pct00004
는 다음과 같은 변환의 기본 함수:
Figure 112010047207689-pct00005
는 표준 필터(prototype filter) 또는 분석 가중치 윈도라 칭하며 2M 샘플을 포괄한다; 그리고
Cn ,k 는 변조를 한정한다.
이 변환이 오디오 프로세싱에 적용된다. 또한 비디오 프로세싱, 특히 고정 이미지 코딩에서, 표준 방식에서 변환이 행과 열에 성공적으로 적용되는 비디오 프로세싱, 특히 고정 이미지 코딩에 적용된다. 이 원리는 2 차원(two dimensions) 이상을 갖는 신호에 또한 확장된다.
초기 시간 샘플을 복구하기 위해, 두 개의 연속한 변환의 중첩되는 영역에 위치하는
Figure 112010047207689-pct00006
개의 샘플들을 재구성하기 위한 디코딩에 다음의 역 변환이 적용된다. 디코딩된 샘플들은 합성 가중치 윈도가 hs(n)로 표시되고 2M 샘플들을 포괄하며,
Figure 112010047207689-pct00007
이 합성 변환을 한정하는 다음의 등식에 의해 제공된다.
Figure 112010047207689-pct00008
재구성 등식은 디코딩된 샘플들이 또한 다음과 같은 형식으로 기술되게 한다:
Figure 112010047207689-pct00009
이 재구성 등식의 다른 표현은 두개의 역 코사인 변환이 변환 도메인에서 샘플들 (
Figure 112010047207689-pct00010
and
Figure 112010047207689-pct00011
)에 성공적으로 적용될 수 있는 것을 고려하여 그 결과 가중치와 부가적 계산에 의해 조합되게 한다. 이 재구성 방법은 도 2에 도시되고 여기서 변환 도메인의 샘플들은 Xt,k 로 표시되고 시간 도메인의 재구성된 샘플들은
Figure 112010047207689-pct00012
로 표시된다.
MDCT는 통상 분석과 합성을 위해 동일한 윈도를 채용하며 따라서
Figure 112010047207689-pct00013
이다.
(
Figure 112010047207689-pct00014
조건에 따르는) 신호의 재구성의 (완벽이라고 칭해지는) 정확도를 보장하기 위해, 표준 윈도 h(n)은 몇몇 제한조건의 선택이 필요하다.
다음의 등식은 완벽한 재구성을 얻기 위한 충분조건이다. 이 등식은 통상 MDCT에 맞는 윈도의 구성을 위해 채용된다.:
Figure 112010047207689-pct00015
(2)
윈도들은 도 3의 예에서 도시된 바와 같이 중간 샘플에 대해 평탄 대칭이다.
이러한 단순한 제한조건을 만족하는 것은 비교적 단순하며, 이를 위해, 정규 표준 필터는 다음과 같이 기술되는 (도 3의 실선으로 도시된) 정현(sinusoidal) 윈도를 구성할 수 있다:
Figure 112010047207689-pct00016
물론, MPEC-4 표준에서 정의된 (도 3의 점선 곡선에 대응하는) 카이저-베셀-유도 (Kaiser-Bessel-derived: KED) 윈도와 저-중첩(low-overlap) 윈도 같은 다른 형태의 표준 필터가 존재한다.
코딩될 신호에 대한 변환에 적응할 필요성을 고려하면, 종래 기술은 변환이, 아래에서 윈도 스위칭이라 칭하는, 시간에 따라 변화하는데 이용될 수 있도록 한다. 변환의 변화에 있어서, 여기서는 윈도의 가중치 계수들 만이 시간에 따라 변화되도록 사용된 윈도의 크기가 동일하게 유지되는 것이 고려된다.
고정(constant) 윈도를 위한 상기 표현은 다음의 윈도의 변화 상황에 적응된다. 일반성에서 손실없이, 중첩은 MDCT를 위한 단 두개의 연속 프레임을 포함하고 두 연속 프레임(T1, T2)를 위한 변환은 다음과 같이 설명된다. 제1 프레임(T1)은 분석 윈도(ha1)를 사용하고 제2 프레임 (T2)는 분석 윈도(ha2)를 사용한다. 따라서
Figure 112010047207689-pct00017
에 대해:
Figure 112010047207689-pct00018
이다.
동일한 윈도가 연속하는 복수의 프레임에 사용되는 종전의 상황과는 달리, 분석 윈도의 제1 및 제2 반편(halves) 간에는 직접적인 관계가 더 이상 없어, 이는 가중치 계수 ha1(n+M)이 계수 ha1(n)과 독립적일 수 있음을 의미한다. 유사하게, 계수 ha2(n)은 계수 ha2(n+M)과 독립적일 수 있다. 따라서 분석 윈도의 형태가 시간에 따라 진화하는 것이 가능하다.
Figure 112010047207689-pct00019
을 위한, 완벽한 재구성의 조건은:
Figure 112010047207689-pct00020
이다.
Figure 112010047207689-pct00021
을 위한, 상기 조건을 확인하기 위한 매우 단순한 정규 해법은 다음을 선택하는 것이다:
Figure 112010047207689-pct00022
따라서, 도 4를 참조하면, 프레임(T2) (도 4의 점선 곡선)의 제1 반편에서 사용된 분석 윈도는 프레임 (T1) (도 4의 실선 곡선)의 제2 반편에서 사용된 분석 윈도의 거울 버전이다. 다시 말해, 완벽한 재구성을 보장하기 위해, 종래 기술은 거울 효과와는 별개로, 동일한 분석 윈도를 공유하는 섹션들을 통한 점진적인 전이를 시사한다.
거울 효과는 또한 합성과 분석 윈도의 부과된 등식의 효과에 따라 합성 윈도에 또한 적용된다.
거울 효과로 인해, 윈도 ha1에서 계수 ha1(n+M) 다음의 영의 삽입(0값을 갖는 가중치 계수)은 윈도 ha2 (ha2(n) 값에서)의 시작점에 동일한 개수의 영을 삽입하는 효과를 갖는다. 또한, 영의 삽입은 1값을 갖는 동일한 개수의 계수를 M n 역 등급 만큼 부과하는 것을 내포한다. 보다 정확하게는:
Figure 112010047207689-pct00023
이로 인해, 다수의 영을 포함하는 이러한 윈도의 일반적인 형상은, 도 5에 도시된 바와 같이, 사각 윈도의 것과 유사하다. 사각 윈도는 주파수 도메인에서 저급한 분해능과 높은 레벨의 불연속성을 갖는다. 이것이 종래 기술에 따른 코딩기/디코딩기의 제1 문제점이다.
표준화된 공지 코딩기/디코딩기에서, 코딩기는 주로 변환이 시간이 지날때까지 사용되도록 선택한다. 따라서 AAC 규격에서, "Information technology - Coding of audio-visual objects - Part 3: Audio", ISO/IEC 14496-3 (2001) 문서에 기재되어 있는 바와 같이, 코딩기는 이전 프레임에서 실행된 선택에 의해 유도된 제1 반편, 분석 윈도의 제2 반편에 대응하는 윈도 형상을 선택하여 전달한다. AAC 규격에서 비트는 동일 유형의 윈도에서 합성을 위해 사용되도록 하기 위해 디코딩키로 전달된다.
디코딩기는 따라서 코딩기에 종속적이며 코딩기에 의해 결정된 윈도의 유형을 충실히 적용한다.
따라서 종래 기술의 단점은 명확하며, 시간을 지나 사용되는 윈도의 유형을 전이시키기 위해, 완벽한 재구성을 위해서는 삽입되는 반편-윈도를 도입하는 것이 필요하다. 따라서 상기와 같은 분석 윈도 (ha1, ha2) 그 공통 매체에 대해 상호 독립적으로 되도록 할 수 없다.
본 발명은 이 상황을 향상시키기 위한 것이다.
이를 위해 본 발명은 연속 윈도에 관하여 제한이 없는 윈도 간의 전이를 제안한다.
이를 위해, 본 발명은 우선 2M 크기를 갖는 신호의 두 연속된 샘플 블록이 제1 분석 윈도와 제2 분석 윈도에 의해 각각 가중되는, 가중 윈도를 사용하여 중첩하여 디지털 신호를 코딩하는 변환-기반 방법을 제공한다. 이러한 윈도는 각각 상승 에지와 하강 에지를 포함하며, 제2 윈도의 상승 에지는 시간-역전된 제1 윈도의 하강 에지와 다르다.
이러한 특징은 상술된 종래 기술과는 명확히 구별되며, 이에 따라 예를 들면 두 블록 각각에 대해 결정된 신호의 특성에 적절한 기준에 따라 제1 윈도와 제2 윈도가 상호간 완벽하게 독립적으로 선택될 수 있다는 사실이 명시된다.
따라서 적어도 두 가지 유형의 가중치 윈도가 제공되고, 특히 코딩에 있어서 분석을 위해, 예를 들면, 특정 이벤트가 감지되면 현재 블록을 코딩하기 위한 가중치 윈도 유형을 변경할 수 있다. 이 특정 이벤트는 일반적으로 신호의 통계적 습성에서 또는 현재 프레임이 보유하는 디지털 신호의 에너지의 다량의 증가와 같은, 특정 현상 발생에서의 변화가 전형적이다.
이러한 단계를 다음 블록에도 반복하여, 본 발명을 이용하면, 특히 삽입된 윈도에 필수적으로 부과된 종래 기술에 따른 한계와 제한조건 없이, 임의의 유형의 가중치 윈도를 적용하여 임의의 블록을 코딩하고 다른 유형의 가중치 윈도를 직접 적용하여 상기 임의의 블록에 연이어 뒤따르는 블록을 코딩하는 것이 가능하다.
상술한 블록은, 예를 들면, 상기 표시된 바와 같이 신호 프레임에 대응할 수 있다.
한 개의 유형으로부터 다른 유형으로 직접 변화하는 가능성을 제공하여, 본 발명은 이러한 윈도에 의해 포괄되는 신호 각각에 적응된 윈도를 이용하여 코딩을 수행할 수 있게 한다. 따라서 윈도에 의해 포괄되는 신호 세그먼트의 각각에서 향상된 코딩 이득이 획득된다.
종래 기술과 비교할 때, 신호 특성에 대한 윈도의 정확한 적응에 따라 획득되는 코딩 품질이 향상된다.
유사한 방식으로 본 발명은 제1 합성 윈도와 제2 합성 윈도 각각에 의해 가중되는 동일한 크기의 두 개의 연속하는 블록의 신호 샘플들 각각이 상승 에지와 하강 에지를 포함하고 특히 제2 윈도의 상승 에지는 시간-역전된 제2 윈도의 하강 에지와 다른, 가중치 윈도를 사용하여 중첩함으로써 디지털 신호를 디코딩하는 변환-기반 방법을 제공한다.
본 발명의 일 실시예에서, 상술한 두 개의 유형의 분석 윈도의 분석 윈도는 모두 영인 계수를 포함하는 적어도 하나의 말단 부를 포함한다. 디코딩시, 합성 윈도는 따라서 윈도의 시작부에 영을 포함한다.
이에 따라 적용된 변환에 연계된 코딩/디코딩 지연이 감소될 수 있다.
본 발명을 이용하면, 특히 삽입된 윈도에 필수적으로 부과된 종래 기술에 따른 한계와 제한조건 없이, 임의의 유형의 가중치 윈도를 적용하여 임의의 블록을 코딩하고 다른 유형의 가중치 윈도를 직접 적용하여 상기 임의의 블록에 연이어 뒤따르는 블록을 코딩하는 것이 가능하다.
상술한 블록은, 예를 들면, 상기 표시된 바와 같이 신호 프레임에 대응할 수 있다.
한 개의 유형으로부터 다른 유형으로 직접 변화하는 가능성을 제공하여, 본 발명은 이러한 윈도에 의해 포괄되는 신호 각각에 적응된 윈도를 이용하여 코딩을 수행할 수 있게 한다. 따라서 윈도에 의해 포괄되는 신호 세그먼트의 각각에서 향상된 코딩 이득이 획득된다.
종래 기술과 비교할 때, 신호 특성에 대한 윈도의 정확한 적응에 따라 획득되는 코딩 품질이 향상된다.
도 1 내지 도 5는 상술한 종래 기술에 관한 도면이다.
도 6은 본 발명의 다른 형태를 갖는 제1 윈도와 제2 윈도를 포함하는, 윈도 유형의 변화를 나타낸다;
도 7은, 본 발명의 바람직한 실시예로서, 윈도의 말단에 M z 영 계수를 포함하는 분석 윈도를 나타낸다;
도 8은 본 바람직한 실시예에 따라 획득된 코딩/디코딩 지연의 감소를 나타낸다;
도 9는 본 발명의 코딩/디코딩 시스템을 나타낸다;
도 10a는 본 발명의 코딩 방법의 단계들을 나타낸다;
도 10b는 디코딩 방법의 단계들을 나타낸다; 그리고
도 11은 바람직한 합성 윈도 형태를 (점선으로) 나타낸다.
이를 위해 본 발명은 연속 윈도에 관하여 제한이 없는 윈도 간의 전이를 제안한다.
이를 위해, 본 발명은 우선 2M 크기를 갖는 신호의 두 연속된 샘플 블록이 제1 분석 윈도와 제2 분석 윈도에 의해 각각 가중되는, 가중 윈도를 사용하여 중첩하여 디지털 신호를 코딩하는 변환-기반 방법을 제공한다. 이러한 윈도는 각각 상승 에지와 하강 에지를 포함하며, 제2 윈도의 상승 에지는 시간-역전된 제1 윈도의 하강 에지와 다르다.
이러한 특징은 상술된 종래 기술과는 명확히 구별되며, 이에 따라 예를 들면 두 블록 각각에 대해 결정된 신호의 특성에 적절한 기준에 따라 제1 윈도와 제2 윈도가 상호간 완벽하게 독립적으로 선택될 수 있다는 사실이 명시된다.
따라서 적어도 두 가지 유형의 가중치 윈도가 제공되고, 특히 코딩에 있어서 분석을 위해, 예를 들면, 특정 이벤트가 감지되면 현재 블록을 코딩하기 위한 가중치 윈도 유형을 변경할 수 있다. 이 특정 이벤트는 일반적으로 신호의 통계적 습성에서 또는 현재 프레임이 보유하는 디지털 신호의 에너지의 다량의 증가와 같은, 특정 현상 발생에서의 변화가 전형적이다.
이러한 단계를 다음 블록에도 반복하여, 본 발명을 이용하면, 특히 삽입된 윈도에 필수적으로 부과된 종래 기술에 따른 한계와 제한조건 없이, 임의의 유형의 가중치 윈도를 적용하여 임의의 블록을 코딩하고 다른 유형의 가중치 윈도를 직접 적용하여 상기 임의의 블록에 연이어 뒤따르는 블록을 코딩하는 것이 가능하다.
상술한 블록은, 예를 들면, 상기 표시된 바와 같이 신호 프레임에 대응할 수 있다.
한 개의 유형으로부터 다른 유형으로 직접 변화하는 가능성을 제공하여, 본 발명은 이러한 윈도에 의해 포괄되는 신호 각각에 적응된 윈도를 이용하여 코딩을 수행할 수 있게 한다. 따라서 윈도에 의해 포괄되는 신호 세그먼트의 각각에서 향상된 코딩 이득이 획득된다.
종래 기술과 비교할 때, 신호 특성에 대한 윈도의 정확한 적응에 따라 획득되는 코딩 품질이 향상된다.
유사한 방식으로 본 발명은 제1 합성 윈도와 제2 합성 윈도 각각에 의해 가중되는 동일한 크기의 두 개의 연속하는 블록의 신호 샘플들 각각이 상승 에지와 하강 에지를 포함하고 특히 제2 윈도의 상승 에지는 시간-역전된 제2 윈도의 하강 에지와 다른, 가중치 윈도를 사용하여 중첩함으로써 디지털 신호를 디코딩하는 변환-기반 방법을 제공한다.
본 발명의 일 실시예에서, 상술한 두 개의 유형의 분석 윈도의 분석 윈도는 모두 영인 계수를 포함하는 적어도 하나의 말단 부를 포함한다. 디코딩시, 합성 윈도는 따라서 윈도의 시작부에 영을 포함한다.
이에 따라 적용된 변환에 연계된 코딩/디코딩 지연이 감소될 수 있다.
이하 특정 예방책 없이 하나의 분석 윈도에서 다른 윈도로 변화하는 것이 가능하고, 특히 전이 윈도를 갖지 않는 본 발명의 일 실시예를 설명한다. 따라서 코딩에 선택된 분석 윈도는 상호 독립적이며, 코딩 품질 향상되는데 기여한다.
현재 프레임(T2)에 있어서, 여기서는 직전 프레임(T1)을 위한 분석 윈도에 대한 특정 선택이 이미 이루어졌다고 가정한다. 주파수 도메인에서 현재 프레임(T2)의 샘플들을 코딩하기 용이하도록 프레임(T2)을 위해 다른 분석 윈도가 선택된다. 예를 들어, 주파수 도메인에서의 현재 프레임(T2)을 위해 선택된 윈도 (h a 2)는 다음의 등식에 의해 변환된 도메인에서 코딩 이득이 극대화되어야 한다는 기준이 가능하며,
Figure 112010047207689-pct00024
는 변환된 샘플 (
Figure 112010047207689-pct00025
)의 분산 추정치를 나타낸다:
Figure 112010047207689-pct00026

또는, 다른 기준으로는 예를 들어 다음의 형태로 표현되는, 변환 샘플들의 엔트로피의 극소화에 기초할 수 있다.
Figure 112010047207689-pct00027
첫째로 코딩/디코딩 후의 왜곡과 둘째로 코딩을 위해 요구되는 비트 레이트 간의 최적화 절충을 정의하는 보다 복잡한 기준을 예상할 수 있다. 이 보다 복잡한 기준은, 최소화될 것으로서, 예를 들면 다음과 같은 형식으로 기술될 수 있으며, D(X)는 선택된 비트 레이트를 위한 샘플들 (X k )의 왜곡 측정치이고; R(X)는 선택된 비트레이트이다:
Figure 112010047207689-pct00028
,
최종적으로 채용된 기준에 따르면, 최상의 분석 윈도()는 제한된 조합의 집합에서 적절하게 선택된다. 사용되는 분석 필터의 유형(특히 코딩 기준 윈도에 대응하는 분석 표준 필터)이 디코딩기에 알려져야하고 따라서 디코딩기에 전달되어야 한다는 제한 조건은 여전히 부과된다.
윈도(h a 2)는 따라서 분석 윈도의 목록
Figure 112010047207689-pct00029
으로부터 선택될 수 있고, 여기서 Nb는 가능한 선택의 수를 나타낸다. Log2(Nb)보다 크거나 같은 정수에 대해 선택된 윈도 형태의 인덱스를 코딩하기 위한 준비가 있을 수 있고 이어서 코딩된 인덱스가 디코딩기로 전달된다.
이러한 방식으로 결정된 모든 윈도가 M 샘플들에 적용될 수 있고, 2M의 길이를 갖는 분석 윈도(h a 1 및/또는 h a 2)다음과 같이 구성되는데 사용될 수 있으며, 정수(ij)는 0과 Nb-1 사이에 포함된다:
Figure 112010047207689-pct00030

윈도(h i and h j )는, 예를 들면, 다음을 사용하여 구성된다:
다른 형태의 계수 값 (종종 a로 칭함)으로 설정된 변수를 갖는 KBD 윈도 (도 3의 점선);
사인 윈도(sinusoidal windows;
AAC 규격에 기재된 저-중첩(low-overlap)(저-지연: low-delay) 윈도; 또는
예를 들면 "Bancs de Filtres et quantification vectorielle sur resau - Etude conjointe pour la compression d' images", P.Onno, Universite de Rennes 1 thesis (1996)에 기재된 코딩 이득 기준과 같은, 다른 기준에 따라 최적화된 윈도.
디코딩시, 코딩시 사용된 분석 윈도(h a 2)의 유형을 수신한 후 그리고 주파수-도메인 샘플(
Figure 112010047207689-pct00031
)을 디코딩 한 후에 역 DCT 변환을 적용하고, 분석 윈도는 시간 샘플을 재구성하기 위해 적용되어야 한다. 그럼에도 불구하고 여기에 채용된 기준은 기결정된 감지 문턱값에 대응하여 변환 재구성 에러의 감지도가 무시할 정도로 유지되어야한다는 것이다.
프레임(T1 및 T2) 간에 변환에 의해 야기되는 왜곡 없이 공통 부분을 재구성하기 위해, 이 공통 부분을 (
Figure 112010047207689-pct00032
Figure 112010047207689-pct00033
,
Figure 112010047207689-pct00034
)에 영향을 미치는 합성 윈도 부분은 공통 부분(
Figure 112010047207689-pct00035
Figure 112010047207689-pct00036
)에 대한 분석 윈도에 연결되어야 한다. 다음 등은 이 공통 부분에서,
Figure 112010047207689-pct00037
에 대해, 완벽한 재구성을 보장하기 위해 충족되어야하는 조건들을 정의한다:
Figure 112010047207689-pct00038
윈도(
Figure 112010047207689-pct00039
and
Figure 112010047207689-pct00040
)를 위한 등식 시스템을 푸는 것은 조건
Figure 112010047207689-pct00041
에 종속됨이 알려졌다:
Figure 112010047207689-pct00042
합성 윈도(
Figure 112010047207689-pct00043
Figure 112010047207689-pct00044
)의 선택은 따라서 완벽한 재구성을 보장한다.
따라서, 합성에서:
윈도(
Figure 112010047207689-pct00045
)는 프레임(T1)의 제2 부분에 적용되는 역 MDCT를 위해 적용된다; 그리고 윈도 (
Figure 112010047207689-pct00046
)는 프레임(T2)의 제1 반편에 적용되는 역 MDCT를 위해 적용된다.
두 개의 가중치의 결과는 하나씩 더해져서 디코딩된 샘플을 획득하게 된다. 윈도(
Figure 112010047207689-pct00047
Figure 112010047207689-pct00048
)는 분석 윈도의 시간 역산에 이어 수정 인수(correction factor) D'(n)=1/D(n)의 적용에 의해 쉽게 구성될 수 있음을 알 수 있다. 따라서, 윈도(
Figure 112010047207689-pct00049
)는 분석 윈도(
Figure 112010047207689-pct00050
)의 시간 인덱스의 역을 취하여 구성되고, 역으로, 윈도(
Figure 112010047207689-pct00051
)는 분석 윈도(
Figure 112010047207689-pct00052
)의 시간 인덱스의 역을 취하여 구성된다. 수정 인수(윈도 각각에 적용되는 이득에 대응함)는 D'(n)=1/D(n)에 의해 정의된다. 시간 역 또는 시간 인덱스 역 이라는 표현은 여기서 윈도의 형태를 현재 시간 인덱스(n)와 동일 또는 반대인 인덱스 (n)의 함수로서 정의하는 것을 칭한다.
유형 (
Figure 112010047207689-pct00053
)의 윈도는 프레임(T1)의 제2 부분에 적용될 수 있고, 유형(
Figure 112010047207689-pct00054
)의 윈도는 프레임(T2)의 제1 반편에 적용될 수 있다. 이 가중치의 결과는 이어서 합산되고 최종적으로 가중치 인수 D'(n)=1/D(n) 에 의해 가중된다.
괄목할 만한 특징은 가중치 인수 1/D(n)가 진폭(amplitude) 왜곡을 보정하는 단순 이득 인수라는 것이다. 따라서 윈도 (
Figure 112010047207689-pct00055
Figure 112010047207689-pct00056
)를 사용하는 재구성 작업에 따라 시간 역 성분이 분해된 재구성된 신호를 산출한다. 이득 D'(n)는 따라서 단순 진폭 보정치로 간주될 수 있다.
이득 (D(n))을 위한 표현은 또한 다음과 같은 놀라운 특징을 나타낸다:
Figure 112010047207689-pct00057
, 이는 단지 M/2 이득 계수 D(n) 이 산출 및/또는 저장된다는 사실에 반영된다. 이 특징은 또한 합성시 이득 (D' (n))을 위해 적용된다.
제1 실시예는 따라서 분석 윈도 간의 전이의 모든 가능성을 조합하는 모든 합성 윈도의 코딩을 저장한다, 즉, (
Figure 112010047207689-pct00058
과 함께):
Figure 112010047207689-pct00059
본 실시예는 따라서 상당한 양의 메모리를 요구한다.
제2 실시예는 디코딩기의 합성 윈도를 그대로 또는 시간-역 인덱스와 함께 저장한다. 이어서, 이득
Figure 112010047207689-pct00060
,
Figure 112010047207689-pct00061
이 산출되고, 그리고 시간-역 분석 윈도가 재구성을 위해 사용된다. 최종적으로, 합산 이후에 얻어진 결과가 이득(
Figure 112010047207689-pct00062
)에 의해 가중된다.
특정 조합 쌍(i, j)에 대해, n 샘플 세트에 대한 이득이
Figure 112010047207689-pct00063
이 될 수 있다. 이러한 특정 상황에서, 최종 가중치는 생략된다.
이러한 단순화가 이득 (
Figure 112010047207689-pct00064
)이 1에 매우 가까운 경우의 상황에 확장될 수 있고, 특히 보정될 진폭 왜곡이 0.1 dB 이하로 유지되면, 예를 들면, 이득(
Figure 112010047207689-pct00065
)과 1 간의 절대값 차이가, 예를 들면 0.01과 같이, 선택된 문턱값 이하인 경우 실제 반영될 수 있다.
상술한 실시예 모두에서, 이득 함수 (
Figure 112010047207689-pct00066
)와 그 역 함수(
Figure 112010047207689-pct00067
)가 시간에 대해 산출될 수 있고 또는 초기에 요구되면 사용을 위해 저장될 수 있다.
또한 이득 함수(
Figure 112010047207689-pct00068
)가 각 쌍(i, j)에 대해 단지 M/2의 저장 요소를 요구하는 것에 주목하여야 한다. 또한, 어떤 쌍 (i, j)에 대해서도
Figure 112010047207689-pct00069
이므로 모든 조합이 저장될 필요가 없다.
본 발명의 바람직한 실시예는 하기와 같이 지연 감소에 적용된다.
본 특정 실시예에서, 0에서의 가중치 윈도의 정수 부분 (가중치 계수의 인접한 값)이 분석 윈도(
Figure 112010047207689-pct00070
)에 부과된다. 보다 특정하게는, 본 실시예에서는 두 개의 전형적인 윈도로 나타내는 윈도()는
Figure 112010047207689-pct00071
,
Figure 112010047207689-pct00072
범위에서 도 7에 도시된 바와 같이 M z 개의 0 부분을 포함한다.
제1 실시예에서, 종래 기술과는 달리, 윈도(h a 1h a 2)는 M과 2M 사이를 포함하는 범위에서 상호 독립적이다. 윈도(h a 1h a 2)의 선택을 위한 단하나의 조건은 D(n) 값이
Figure 112010047207689-pct00073
에서 0이 아니어야 한다는 것이다. 이 윈도(
Figure 112010047207689-pct00074
)의 이 특정 구조는 합성 윈도가 0과 Mz-1 사이에 영을 포함할 수 있도록 보장한다. 이에 따라 다음과 같은 등식으로부터 결과가 도출된다:
Figure 112010047207689-pct00075
분석을 위해 사용되는 동일한 대칭 윈도(h a 1)에 대해 영 계수의 개수 M z 는 다음 등식에 의해 주어진 이득 D(n)에 대한 조건에 부합하기 위해 조건
Figure 112010047207689-pct00076
을 충족하여야 한다:
Figure 112010047207689-pct00077
분석 윈도 (
Figure 112010047207689-pct00078
)의 부분을 영으로 설정함으로써 하기와 같이 샘플 재구성 지연에 바람직한 효과를 갖는다.
도 8을 참조하면, 프레임(T1) (2M 샘플 크기를 갖음)이 윈도 (h a 1)를 적용하여 처리된다.
이 가중치의 결과는 DCT에 의해 처리된다. 윈도(h a 1)가 영을 포함하므로 프레임(T1)은 간단히 코딩되어 2M- M z 샘플의 말단으로 전달될 수 있다. 프레임 (T1)의 2M 샘플의 말단에서 해당 코딩된 프레임을 전달하기를 기다릴 필요가 없고 다만 그 첫 번째 2M- M z 샘플의 처리를 기다리면 된다. 종래 기술의 표준 윈도를 사용하는 것과 비교할 때 프레임(T1)의 말단의 M z 샘플의 처리에 소요되는 시간에 해당하는 장점을 나타낸다.
합성시, 유사한 합성 윈도(h s 1)는 M z 개의 영에서의(더이상 윈도 말단이 아니라 현재 윈도의 시작점) 최초 계수를 포함하고, 이는, 동일한 방식으로, M z 개 샘플의 장점을 갖고 디코딩된 샘플들을 재구성할 수 있도록 한다. 합성 윈도의 시작점에 해당하는 M z 샘플들은, 윈도(M z ) 시작점의 영향이 없으므로, 도 8로부터 다음 윈도(h s 0)에 의해 실제로 재구성된다. 따라서 연속하는 샘플들이 역 DCT 이후에 M z 디코딩된 샘플들을 유효하게 재구성되기를 다시 기다릴 필요가 없어서, 합성 결과에서 M z 샘플의 부가적 장점이 발생한다.
따라서 분석 윈도(W)의 말단에서 M z 개의 연속하는 영 계수가 부과되어 2M z 샘플의 직접(direct) MDCT와 이어서 역 MDCT 처리에 의해 야기된 지연을 감소시킬 수 있다. 총지연은 따라서 2M2M z 샘플이다. 이러한 지연의 감소는 2MM z 의 효과적 길이를 갖는 윈도에 m이해 달성되며, 종래의 해결책에서 동일한 지연 감소를 위해서는 표준 방식 분석 및 합성 윈도는 동일하고(시간의 역과는 별개로) 효과적 길이는 2M z 2M z 임을 시사한다. 따라서 본 실시예에 따른 긴 윈도가 사용될 수 있고 획득되는 주파수 반응은 따라서 보다 유리하고 코딩 품질이 향상된다.
종래 기술은 윈도의 말단 또는 시작점에 영이 도입되면 가중치 윈도의 중앙 계수에 1의 값이 부과되어, 이러한 유형의 윈도(도 5)의 코딩 특성에 열화가 있으나, 본 발명은 이러한 단점이 없다. 또한, 연속하는 분석 윈도의 선택에 제한 조건이 없으므로, 만족할 만한 코딩 특성을 얻을 수 있다.
따라서 코딩될 신호에 대해 보다 잘 맞는 분석 변환이 영을 그 말단에 포함하는(예를 들면 표준 필터의 목록에서) 분석 필터로부터 선택될 수 있어, 종래 기술과 비교할 때 2M z 만큼 감소된 지연과 최적의 신호 코딩/디코딩이 이루어진다. 본 발명의 특정 실시예가 아래 기술되며, 윈도 쌍 (h a 1h a 2)이 코딩을 위해 선택되어 합성시 보정 (D' (n))을 피할 수 있게 한다. 여기서 합성시 가중 함수 D'(n)가 상수이고 1에 가깝도록 보장하기 위해 초기 분석 윈도를 상당히 보완하는 것은 의문이다.
이를 위해, 분석 윈도 부분이 범위 (
Figure 112010047207689-pct00079
)와 모든 인덱스 n 및 영이 아닌 정규화 요소 ((n),
Figure 112010047207689-pct00080
)에 대해 정의된 윈도(h(n))에 기초하여 결정된다:
Figure 112010047207689-pct00081

이에 따라
Figure 112010047207689-pct00082
에 대해, 다음이 구성된다:
Figure 112010047207689-pct00083
Figure 112010047207689-pct00084

이런 방식으로, 이득 (D' (n))의 디코딩이 모든 n에 대해 균일하고, 합성의 재구성이 동일한 가중치에 의해 완수되되, 시간-역 분석 윈도(h a 1h a 2)의 이러한 가중치에 단순 덧셈이 따른다.
Figure 112010047207689-pct00085
를 위한 영을 포함하고
Figure 112010047207689-pct00086
에 대한 2M z 샘플의 지연을 제한할 수 있는 가능한 윈도 (h(n))는:
Figure 112010047207689-pct00087
반면, 예를 들어
Figure 112010047207689-pct00088
에 대해:
Figure 112010047207689-pct00089
형태 변수 (form parameter)에 따라 변경하는 주파수 선택을 가능하게 하는 다른 가능한 선택은
Figure 112010047207689-pct00090
에 대해 다음과 같이 정의되는 카이저-베셀 윈도에 있다:
Figure 112010047207689-pct00091
,
여기서
Figure 112010047207689-pct00092
,
Figure 112010047207689-pct00093
; 그리고
h(n, a)= 0 그렇지 않으면 (
Figure 112010047207689-pct00094
n 에 대해).
따라서 선택된 초기 윈도 (h(n))로부터 분석 윈도(h a 1h a 2)를 결정하는 것이 가능하고 따라서 시간 역에 의해 간단하게 합성 윈도가 결정될 수 있음을 알 수 있다.
본 발명에 의한 디코딩을 구현하기 위해 두 개의 합성 윈도 부분(h s 1h s 2)을 M z 개의 영 계수를 윈도 시작점에 포함하는 초기 윈도(h(n)로부터 직접 결정할 수도 있다.
사인 초기 윈도(도 11의 실선 곡선)에 기초하여
Figure 112010047207689-pct00095
에 대해:
Figure 112010047207689-pct00096
그리고
Figure 112010047207689-pct00097
에 대해:
Figure 112010047207689-pct00098

합성 윈도 부분(h s 1 and h s 2)은 따라서 다음과 같이 직접 감소된다:
Figure 112010047207689-pct00099
Figure 112010047207689-pct00100
Figure 112010047207689-pct00101
이전과 같이
Figure 112010047207689-pct00102
에 대해:
Figure 112010047207689-pct00103
도 11은 본 실시예에서 실선으로 도시된 사μ인 곡선으로(sinusoidally) 표현되는 초기 윈도(h(n))로부터 획득된 두 개의 윈도 부분(h s 1 and h s 2)에 기인하는 전체적인 합성 윈도(h si )의 형태를 점선으로 나타낸다.
예로서 여기 기재된 본 발명의 실시예는 또한 도 9에 도시된 바와 같은 코딩/디코딩 시스템을 제공한다. 코딩기 COD는 연속하는 샘플(X n )을 포함하는 코딩될 디지털 신호 (S)를 수신한다. 연속하는 샘플들은 연속하는 블록 (B i , B i +1 , 등)에서 샘플들 각각 (단계 101, 도 10a)을 처리한다. 코딩기의 처리 수단(μP)블록(B i )의 내용을, 예를 들어 주어진 기준(엔트로피, 코딩 이득, 왜곡/비트 레이트 등)에 따라, 하나 하나 분석하며(단계 102, 도 10a), 코딩기의 목록 (Dictionary: DIC)으로부터 분석 윈도(ha i) 도출하며, 여기서 윈도는 상술한 기준에 따라 블록(B i )에 가장 적절하다. 이와 같은 방식으로 선택된 분석 가중치 윈도 (ha i )는 현재 블록 (B i )에 적용되고(단계 103, 도 10a), 이어서 코딩된다(단계 104).
이러한 코딩에 따른 결과인 블록(B' i )은 이어서 도 9로부터 코딩된 신호 (S')에서 디코딩기(DECOD)로 전달되며, 선택된 분석 윈도(ha i )의 목록(DIC)에서 코드를 갖는다(단계 105, 도 10a). 물론, 디코딩기(DECOD)는 이전 블록(B' i 1)과 함께 이전에 사용된 분석 윈도(ha i -1)에 지정된 목록(DIC)으로부터 코드를 수신한다. 연속하는 코딩된 블록(B' i , B' i +1, 등)을 포함하는 코딩된 신호(S')와 블록 (B i )의 코딩에서 분석을 위해 사용된 윈도 코드(ha i )를 수신하면(단계 106, 도 10aB), 디코딩기(DECOD)는 그 자체 목록(DIC') (코딩기의 목록(DIC)와 유사함)으로부터 합성을 위해 사용될 반-윈도(half-windows)(hs i -1(n+M) 및 hs i (n))를 결정한다(단계 107). 여기 기재된 예에서, 디코딩기(DECOD)의 처리 수단(μP)은 이전의 분석에서 사용된 윈도(ha i -1)와 연결된 각 시간 인덱스 n에 대해 보정 인수 (D(n))을 추정한다(단계 108). 보정 인수가 1에 가까우면 (예를 들면 문턱값의 절대값 0.1dB), 도 10b의 검사 (109)에서 디코딩기는 보정을 적용하지 않는다 (검사 109로부터 y 화살표 출구). 그렇지 않으면 (n 화살표), 처리 수단(μP)은 상술한 보정 D'(n)=1/D(n)을 적용한다(단계 110). 처리과정은 단계 111에서 (인수 D'에 의해 적절히 보정된) 윈도(hs i )에 의해 가중된 블록(B' i )와 같이 디코딩이 계속되고, 디코딩된 신호(
Figure 112010047207689-pct00104
)의 디코딩된 블록(
Figure 112010047207689-pct00105
,
Figure 112010047207689-pct00106
, 등)이 전달되며, 완벽한 재구성이 이루어지므로 (무손실의) 샘플들(
Figure 112010047207689-pct00107
)은 초기 샘플(X n )의 값을 갖는다.
본 발명은 또한 도 9에 나타낸 유형의 코딩기(COD)를 제공하며, 도 10a의 흐름도로 나타낼 수 있는 알고리즘과 이러한 코딩기의 메모리에서 저장될 컴퓨터 프로그램을 제공한다. 또한 도 9에 나타낸 유형의 디코딩기(DECOD)와 도 10b의 흐름도로 나타낼 수 있는 알고리즘과 이러한 디코딩기의 메모리에 저장될 컴퓨터 프로그램을 제공한다.
DECOD: 디코딩기 COD: 코딩기

Claims (18)

  1. 가중치 윈도를 사용하여 중첩되는 디지털 신호를 코딩하는 변환-기반 방법에 있어서,
    동일한 크기(2M)의 신호 샘플의 연속된 두 개의 블럭이 제1 분석 윈도(ha 1) 및 제2 분석 윈도(ha 2)에 의해 각각 가중되고,
    상기 제1 및 제2 윈도는 각각 상승 에지와 하강 에지를 갖고, 상기 제2 윈도(ha 2)의 상승 에지는 시간-역전된 제1 윈도(ha 1)의 하강 에지와 다른 것을 특징으로 하는 방법.
  2. 제 1 항에 있어서,
    상기 제1 및 제2 윈도는 상기 두 개의 블록 각각에 대해 결정되는 신호의 특성에 따른 기준에 따라 상호 독립적으로 선택되는 것을 특징으로 하는 방법.
  3. 제 2 항에 있어서, 가중치 윈도를 선택하기 위한 상기 기준은 다음의 조합 또는 그 중 하나인 것을 특징으로 하는 방법:
    최대화된 코딩 이득(GTC);
    변환된 샘플의 최소화된 엔트로피 (JH); 및
    상기 코딩을 위해 요구되는 비트레이트와 코딩/디코딩에 의해 야기되는 왜곡 간의 최적화된 차이(trade-off: JRD).
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 블록 코딩을 위해 선택된 가중치 윈도 각각은 가능한 가중치 윈도의 목록에서 선택되며, 윈도우 인덱스는 상기 목록으로부터 각 윈도와 관련되는 것을 특징으로 하는 방법.
  5. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 제1 분석 윈도(ha 1) 및 상기 제2 분석 윈도(ha 2)의 적어도 일부는 영 값인 연속하는 가중치 계수들의 선택된 수(Mz)를 포함하는 적어도 하나의 말단을 포함하고 상기 영 값인 연속하는 가중치 계수의 선택된 수(Mz)는 윈도의 계수의 총 수(2M)의 사분의 일보다 작은 것을 특징으로 하는 방법.
  6. 가중치 윈도를 사용하여 중첩되는 디지털 신호를 디코딩하는 변환-기반 방법에 있어서,
    동일한 크기(2M)의 신호 샘플의 연속된 두 개의 블럭이 제1 합성 윈도(hs 1) 및 제2 합성 윈도(hs 2)에 의해 각각 가중되고,
    상기 제1 및 제2 윈도는 각각 상승 에지와 하강 에지를 갖고, 상기 제2 윈도(hs 2)의 상승 에지는 시간-역전된 제1 윈도(hs 1)의 하강 에지와 다른 것을 특징으로 하는 방법.
  7. 제 6 항에 있어서,
    코딩을 위해 이어서 사용되는 분석 윈도의 정보(cod ( ha i ))가 코딩기로부터 수신되고 상기 제1 및 제2 합성 윈도(h s 1, h s 2)는 코딩시 연속하여 사용된 상기 제2 및 제1 분석 윈도((h a 1, h a 2))로부터 유도되되, 상기 제1 및 제2 합성 윈도는 상기 제2 및 각각 제1 분석 윈도의 가중치 계수의 임시 위치를 역산하고 보정 인수 (1/D(n))를 상기 제2 와 각각 상기 제1 분석 윈도에 적용하여 유도되는 것을 특징으로 하는 방법.
  8. 제 7 항에 있어서, 상기 제1 합성 윈도(h s 1)와 제2 합성 윈도(h s 2)는 상기 제1 및 제2 분석 윈도(h a 1) 및 (h a 2), 각각에, 다음 유형의 등식을 사용하여 유도되는 것을 특징으로 하는 방법:
    Figure 112010047207689-pct00108

    여기서:
    숫자 M은 2M 샘플을 포함하는 샘플 블럭들의 수;
    n 은 0과 M-1 간의 임시 위치 인덱스;
    h(n)은 임시 위치 인덱스 n을 갖는 윈도(h)의 가중치 계수를 나타냄;
    -n은 인덱스 n과 동일 또는 반대를 나타내며, 상기 임시 위치의 역을 표현함; 그리고
    D(n)은 임시 위치 계수 n에 적용되는 상기 보정 인수를 나타내며, 인수는 0과 M-1을 포함하는 사이에서 n에 대해 영이 아니고 다음의 등식으로 나타냄:
    Figure 112010047207689-pct00109
    .
  9. 제7항에 있어서,
    상기 분석 윈도에 대한 상기 정보는 코딩을 위해 사용된 윈도의 목록(DIC)으로부터의 인덱스로 구성되고, 코딩을 위해 선택된 상기 분석 윈도의 인덱스는 디코딩기로 전송되고, 코딩을 위해 사용된 상기 분석 윈도와 유사하고 상기 보정 인수(1/D(n))에 의해 기-보정된 합성 윈도를 포함하는 유사한 목록(DIC')이 디코딩을 위해 제공되며, 상기 유사한 목록으로부터 각 윈도는 상기 디코딩기로 전달된 상기 분석 윈도 인덱스로부터 결정될 수 있는 목록 인덱스를 갖는 것을 특징으로 하는 방법.
  10. 제7항에 있어서, 상기 분석 윈도의 상기 정보는 코딩을 위해 사용된 윈도의 목록(DIC)으로부터의 인덱스로 구성되고 코딩을 위해 사용된 분석 필터의 뱅크의 표준(prototype) 필터로부터 획득된 각각의 윈도를 포함하는 동일한 목록이 디코딩을 위해 제공되며, 디코딩을 위해 다음이 적용되는 것을 특징으로 하는 방법:
    임시 위치 역산; 및
    계수를 위해 추정된 보정 인수가 기설정된 문턱값 내에서 1과 실질적으로 다르면 상기 목록으로부터 윈도의 상기 계수에 상기 보정 인수(1/D(n))를 적용.
  11. 제6항 내지 제10항 중 어느 한 항에 있어서, 상기 합성 윈도의 적어도 일부는 선택된 개수의 연속된 영 값의 가중치 계수를 상기 윈도의 시작점에 포함하고 상기 영 값인 연속하는 가중치 계수들의 선택된 수(Mz)는 윈도의 계수의 총 수(2M)의 사분의 일보다 작은 것을 특징으로 하는 방법.
  12. 제11항에 있어서, 두개의 시간 역산된 분석 윈도 부분에 대응하는 가중치 윈도를 사용하는 합성 과정을 포함하고, 상기 합성 윈도의 가중은 합산의 방식으로 수행되며, 상기 분석 윈도 부분(ha 1ha 2)는 유형
    Figure 112013088388205-pct00110
    Figure 112013088388205-pct00111
    로 표현되는 초기화 윈도 h(n) 의 함수로서 표현되고, M은 2M 샘플을 포함하는 블록의 수이고, n
    Figure 112013088388205-pct00112
    인 임시 인덱스, 그리고
    Figure 112013088388205-pct00113
    Figure 112013088388205-pct00114
    인 임의의 인덱스에 대해 정의된 영 아닌 정규 인수(normalization factor)인 것을 특징으로 하는 방법.
  13. 제12항에 있어서,
    두 개의 합성 윈도 부분(hs 1hs2 )은, 상기 합성 윈도 부분(ha 1ha 2)의 유형
    Figure 112013088388205-pct00115
    Figure 112013088388205-pct00116
    로 표현에 따라 선택된 영 계수의 개수 (Mz)를 그 시작점에 포함하는 초기화 윈도 h(n) 으로부터 직접 결정되고 M은 2M 샘플을 포함하는 블록의 수이고, n
    Figure 112013088388205-pct00117
    인 임시 인덱스, 그리고
    Figure 112013088388205-pct00118
    Figure 112013088388205-pct00119
    인 임의의 인덱스에 대해 정의된 영 아닌 정규 인수(normalization factor)인 것을 특징으로 하는 방법.
  14. 제12항에 있어서, 상기 영 아닌 정규 인수는 다음 유형의 표현에 의해 정의되는 것을 특징으로 하는 방법:
    Figure 112013088388205-pct00120

  15. 제13항에 있어서, 상기 초기화 윈도 h(n) 는 다음의 등식으로 표현되는 것을 특징으로 하는 방법: 여기서, Mz 는 상기 초기화 윈도의 시작점에서 영 계수의 선택된 개수임:
    Figure 112013088388205-pct00121
    ,
    Figure 112013088388205-pct00122
    ; 그리고
    Figure 112013088388205-pct00123
    ,
    Figure 112013088388205-pct00124
    .
  16. 제1항 내지 제3항 중 어느 한 항의 방법을 구현하기 위한 수단을 포함하는 것을 특징으로 하는 가중치 윈도를 사용하여 중첩 디지털 신호를 중첩하여 코딩하는 변환-기반 코딩을 위한 장치.
  17. 제6항 내지 제10항 중 어느 한 항의 방법을 구현하기 위한 수단을 포함하는 것을 특징으로 하는 가중치 윈도를 사용하여 중첩 디지털 신호를 중첩하여 디코딩하는 변환-기반 디코딩을 위한 장치.
  18. 제1항 내지 제3항, 제6항 내지 제10항 중 어느 한 항의 방법을 구현하기 위한 명령어들을 포함하는 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체.
KR1020107016422A 2007-12-21 2008-12-11 적응적 윈도를 갖는 변환 기반 코딩/디코딩 KR101408183B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0760258 2007-12-21
FR0760258 2007-12-21
PCT/FR2008/052286 WO2009081003A1 (fr) 2007-12-21 2008-12-11 Codage/decodage par transformee, a fenetres adaptatives

Publications (2)

Publication Number Publication Date
KR20110111231A KR20110111231A (ko) 2011-10-10
KR101408183B1 true KR101408183B1 (ko) 2014-06-19

Family

ID=39689331

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020107016422A KR101408183B1 (ko) 2007-12-21 2008-12-11 적응적 윈도를 갖는 변환 기반 코딩/디코딩

Country Status (9)

Country Link
US (1) US8253609B2 (ko)
EP (1) EP2232489B1 (ko)
JP (1) JP5328804B2 (ko)
KR (1) KR101408183B1 (ko)
CN (1) CN101952888B (ko)
BR (1) BRPI0821091B1 (ko)
ES (1) ES2666719T3 (ko)
RU (1) RU2488898C2 (ko)
WO (1) WO2009081003A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2977439A1 (fr) 2011-06-28 2013-01-04 France Telecom Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard.
FR2977969A1 (fr) * 2011-07-12 2013-01-18 France Telecom Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee
EP2665208A1 (en) * 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
JP6333379B2 (ja) * 2013-08-23 2018-05-30 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. エイリアシングエラー信号を用いて音声信号を処理するための装置及び方法
US10224042B2 (en) * 2016-10-31 2019-03-05 Qualcomm Incorporated Encoding of multiple audio signals
CN113630104B (zh) * 2021-08-18 2022-08-23 杭州电子科技大学 图滤波器的滤波器组频率选择性误差交替优化设计方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1991016769A1 (en) 1990-04-12 1991-10-31 Dolby Laboratories Licensing Corporation Adaptive-block-length, adaptive-transform, and adaptive-window transform coder, decoder, and encoder/decoder for high-quality audio
WO1998002971A1 (en) 1996-07-11 1998-01-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. A method of coding and decoding audio signals

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3093178B2 (ja) * 1989-01-27 2000-10-03 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 高品質オーディオ用低ビットレート変換エンコーダ及びデコーダ
US5899969A (en) * 1997-10-17 1999-05-04 Dolby Laboratories Licensing Corporation Frame-based audio coding with gain-control words
US5913190A (en) * 1997-10-17 1999-06-15 Dolby Laboratories Licensing Corporation Frame-based audio coding with video/audio data synchronization by audio sample rate conversion
US5903872A (en) * 1997-10-17 1999-05-11 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries
ATE387000T1 (de) * 2001-05-10 2008-03-15 Dolby Lab Licensing Corp Verbesserung der transientenleistung bei kodierern mit niedriger bitrate durch unterdrückung des vorgeräusches
US6963842B2 (en) * 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
US7302111B2 (en) * 2001-09-12 2007-11-27 Micronic Laser Systems A.B. Graphics engine for high precision lithography
DE60208426T2 (de) * 2001-11-02 2006-08-24 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur signalkodierung, signaldekodierung und system zum verteilen von audiodaten
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
WO2004082288A1 (en) * 2003-03-11 2004-09-23 Nokia Corporation Switching between coding schemes
FR2911228A1 (fr) * 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
EP2107556A1 (en) * 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
MY181247A (en) * 2008-07-11 2020-12-21 Frauenhofer Ges Zur Forderung Der Angenwandten Forschung E V Audio encoder and decoder for encoding and decoding audio samples
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1991016769A1 (en) 1990-04-12 1991-10-31 Dolby Laboratories Licensing Corporation Adaptive-block-length, adaptive-transform, and adaptive-window transform coder, decoder, and encoder/decoder for high-quality audio
WO1998002971A1 (en) 1996-07-11 1998-01-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. A method of coding and decoding audio signals

Also Published As

Publication number Publication date
US8253609B2 (en) 2012-08-28
RU2010130311A (ru) 2012-01-27
ES2666719T3 (es) 2018-05-07
EP2232489B1 (fr) 2018-02-07
KR20110111231A (ko) 2011-10-10
JP2011507440A (ja) 2011-03-03
RU2488898C2 (ru) 2013-07-27
CN101952888B (zh) 2013-10-09
JP5328804B2 (ja) 2013-10-30
BRPI0821091B1 (pt) 2020-11-10
BRPI0821091A2 (pt) 2015-06-16
EP2232489A1 (fr) 2010-09-29
CN101952888A (zh) 2011-01-19
WO2009081003A1 (fr) 2009-07-02
US20100283639A1 (en) 2010-11-11

Similar Documents

Publication Publication Date Title
JP5247721B2 (ja) 重み付けウィンドウを用いた低遅延変換符号化
RU2411645C2 (ru) Устройство и способ для генерации значений субполос звукового сигнала и устройство и способ для генерации аудиоотсчетов временной области
US8050933B2 (en) Audio coding system using temporal shape of a decoded signal to adapt synthesized spectral components
EP2378516B1 (en) Analysis filterbank, synthesis filterbank, encoder, decoder, mixer and conferencing system
EP2450883B1 (en) Frame error concealment method and apparatus using regression analysis
KR101408183B1 (ko) 적응적 윈도를 갖는 변환 기반 코딩/디코딩
EP1493146A1 (en) Encoding device and decoding device
KR101966782B1 (ko) 가중 윈도우들을 코딩/디코딩하는 지연최적화 오버랩 변환
CN101325060A (zh) 频谱域中利用自适应切换的时间分辨率对音频信号编解码的方法和设备
RU2530926C2 (ru) Изменение формы шума округления для основанных на целочисленном преобразовании кодирования и декодирования аудио и видеосигнала
EP1649453B1 (en) Low bit-rate audio encoding
EP2407965B1 (en) Method and device for audio signal denoising
WO2003107329A1 (en) Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
JP2007504503A (ja) 低ビットレートオーディオ符号化
US8149927B2 (en) Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
KR100378796B1 (ko) 디지탈 오디오 부호화기 및 복호화 방법
KR102546602B1 (ko) 변조된 랩핑 변환을 위한 분석/합성 윈도우 함수
JP4721355B2 (ja) 符号化データの符号化則変換方法および装置
Leegaard et al. Practical design of delta-sigma multiple description audio coding
JP3361790B2 (ja) オーディオ信号符号化方法、オーディオ信号復号化方法およびオーディオ信号符号化/復号化装置と前記方法を実施するプログラムを記録した記録媒体
Cheng et al. Audio coding and image denoising based on the nonuniform modulated complex lapped transform

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
J201 Request for trial against refusal decision
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180601

Year of fee payment: 5