KR100193353B1

KR100193353B1 - 적응블록길이, 적응변환, 적응윈도우 변환코더, 디코더 및 고품질 오디오용 인코더/디코더

Info

Publication number: KR100193353B1
Application number: KR1019920702394A
Authority: KR
Inventors: 알렌 데이빗슨 그랜트
Original assignee: 쥬더, 에드 에이.; 돌비 라보라토리스 라이쎈싱 코포레이션
Priority date: 1990-04-12
Filing date: 1991-04-12
Publication date: 1999-06-15
Also published as: JPH05506345A; CN1062963C; JP3224130B2; DE69107841D1; CN1055830A; WO1991016769A1; EP0524264A1; AU7760891A; CA2059141A1; CA2059141C; US5394473A; DE69107841T2; ATE119336T1; DK0524264T3; BR9106332A; AU644170B2; ES2068580T3; EP0524264B1

Abstract

본 발명은 일반적으로 음악신호와 같은 오디오신호에 대응하는 정보의 고품질 저비트율의 디지탈 변환 코딩 및 디코딩 장치에 관한 것이다. 보다 상세하게는, 본 발명은 코딩 및 디코딩에서의 신호분석/합성장치에 관한 것이다. 본 발명은 각각의 샘플링된 오디오 세그먼트에 대한 변환블록길이를 적정하게 선택함에 의해 변환코더들안에서 시간분해능과 주파수 분해능사이의 교환을 꾀할 수 있으며, 그리고/또는 적정하게 변환을 선택함에 의해 그리고/또는 적정하게 분석윈도우 또는 분석/합성 윈도우쌍을 선택함에 의해 코딩이득을 최적화할 수 있다.

Description

[발명의 명칭]

적응블록길이, 적응변환, 적응윈도우 변환코더, 디코더 및 고품질 오디오용 인코드/디코더

[기술분야]

본 발명은 일반적으로 음악 또는 음성신호와 같은 오디오신호에 대응하는 정보의 고품질 저비트를 디지탈 변환 코딩 및 디코딩장치에 관한 것이다. 보다 상세하게는, 본 발명은 코딩 및 디코딩에서의 신호분석/합성장치에 관한 것이다. 본 발명은 각각의 샘플링된 오디오세그먼트(audio segment)에 대한 변환블록길이(transform vlock le ngth)를 적정하게 선택함에 의해 변환토더들안의 시간분해능(time resolution) 및 주파수분해능(frequency resolution) 사이의 교환을 꾀할 수 있으며, 그리고/또는 적정하게 분석윈도우(analusis window)나 분석/합성 윈도우 쌍을 선택함에 의해 코딩 이득을 최적화할 수 있다.

본 발명은 모든 이산 직교 변환(discrete orthogonal trans form)에 적용된다. 변환 직교성은 정확한 신호 재구성이 정/역 변환쌍(forward/inverse transform pair)에 의해 달성될 수 있음을 보장해준다. 따라서, 직교변환에 대하여 본 발명은 블록길이의 적정한 선택, 그리고/또는 정보의 손실없이, 즉 양자화오차가 없는 상태에서 변환의 적정한 선택이 가능하며, 본래의 신호가 본 발명의 디코더부에 의해 정확하게 복구될 수 있다.

그러나, 본 발명의 바람직한 실시예에서는 비직교 변환(nonorthogonal transfo rm)이 사용된다. 이 실시예에 있어서, 변환코더는 계수양자화오차와 임계샘플링(critical sampling) 없이 완전한 위신호소거(aliasing cancellation)의 변환특성을 보존한 상태에서 변환, 그리고/또는 분석/합성 윈도우 쌍, 그리고/또는 블록길이에 적응하게 된다.

[배경기술]

[서문]

신호처리기술분야에서는 신호특성상의 인식가능한 손실없이 신호를 재생시키는데 요구되는 정보량을 최소화시키기 위한 많은 관심이 있어왔다. 정보요구량을 감소시킴에 의해, 신호들은 전송채널이나 저장매체에 있어서의 더욱 낮은 정보 요구량이 부과된다. 디지탈코딩기술에 있어서, 최소의 정보요구량은 최소의 바이너리 비트 요구량과 같은 의미를 갖는다.

펄스코드변조(PCM)와 같은 기술에 의해 코딩된 디지탈신호에 대한 비트요구량은 디지탈화된 신호샘플들의 수, 그리고 각 디지탈화된 신호샘플을 표시하는데 사용된 비트수에 비례한다. 주어진 신호세그먼트에 대한 샘플들의 수는 샘플링 비율에 의해 정해진다.

최소의 샘플링 비율은 나이키스트원리(Nyquist theorem)에 의해 제시되어 있다. 나이키스트원리는 샘플사이의 간격이 신호의 최고주파수성분의 ½ 주기보다 크지않을때에 신호가 이산샘플(descrete sample)들로부터 정확하게 복구될 수 있다는 것이다. 샘플링 비율이 이 나이키스트 비율아래로 내려가면, 더욱 높은 주파수 성분이 더욱 낮은 주파수성분으로서 허위 재생(misrepresent)된다. 이 더욱낮은 주파수성분이 진성분(truecomponent)에 대한 위성분(alias)이다.

각각의 디지탈화된 신호샘플을 표시하는데 사용된 비트수는 인코딩된 신호샘플들에 의한 신호재생의 정확성을 설정해 주게된다. 더욱낮은 비트율은 일반적으로 더욱적은 비트들이 각 샘플을 표시하는데에 이용될 수 있다는 것을 의미하며, 따라서 더욱 낮은 비트율은 더욱 큰 양자화 부정확성이나 양자화오차를 의미하게 된다. 많은 적용분야에서 양자화오차는 양자화 잡음으로 나타나며, 만약 이 오차가 충분한 크기를 자질 경우 양자화잡음이 코딩된 신호의 특성을 저하시키게 된다.

[임계대역 및 심리음향적 마스킹]

인간이 정취하는 오디오신호를 코딩하기위한 몇몇 선행기술들이 심리음향적 효과를 이용함에 의해 청각적인 감소를 발생시키지 않고 정보요구량을 감소시키도록 시도되어왔다. 인간의 귀는 가변중심주파수를 갖는 높은 비대칭동조필터(highlu asymm etrical tuned filters)와 유사한 주파수분석 특성을 나타낸다. 명확한 음색(tone)을 검출하기 위한 인간의 귀의 능력은 일반적으로 각 음색사이의 주파수차이가 증가함에 따라 향상되나, 인간의 귀의 판단능력은 전술한 필터의 대역폭보다 적은 주파수차이에 대하여 거의 일정한 상태에 머무르게된다. 따라서, 인간의 귀의 주파수판단능력은 전 오디오 스펙트럼을 통해 이들필터의 대역폭에 따라 변화된다. 이와같은 청각필터의 유효대역폭을 임계대역(critical band)이라 한다. 임계대역안의 우세한신호는 임계대역 외부의 주파수신호보다 이 임계대역안의 다른 신호의 가청도를 더욱 마스킹하게된다. 이 우세한 신호는 마스킹신호와 같은 시간에 발생된 다른 신호는 물론 마스킹신호의 전후에 발생된 다른신호까지 마스킹하게 된다. 임계대역안에서의 전,후 마스킹의 지속기간은 마스킹신호의 크기에 의해 좌우되나, 보통 전 마스킹(premasking)효과는 후마스킹(postmasking) 효과보다 훨씬 짧은 지속기간을 갖는다. Blain Benson 저의 Audio Engin eering Hand Book(McGraw-Hill, San Francisco, 1988)1.40-1.42 페이지 및 4.8-4.10 페이지 참조.

유용한 신호대역폭을 인간의 귀의 임계대역과 비슷한 대역폭을 갖는 주파수대역들로 분할하는 신호녹음 및 전송기술들은 광대역기술들보다 더욱좋은 심리음향적 효과를 얻을 수 있다. 심리음향적 마스킹효과를 얻도록된 기술들은 PCM 코딩시 요구되는 것보다 낮은 비트율을 이용하여 본래의 입력신호와 구별불가능한 신호를 인코딩 및 재생할 수 있다.

임계대역기술들은 신호대역폭을 주파수 대역들로 분할하고, 각 주파수대역에서의 신호를 처리하며, 각 주파수대역에서 처리된 신호로부터 본래의 신호의 복사신호를 재구성하는 것으로 이루어진다. 이와같은 기술들중 2가지는 서브밴브코딩과 변환코딩이다. 서브밴브 및 변환코더들은 잔여 코딩부정확성(잡음)이 주변의 스펙트럼 성분들에 의해 인코딩신호의 주된 특성을 저하시킴이 없이 심리음향적으로 마스킹되는 특정 주파수 대역에서의 전송 정보요구량들을 감소시킬 수 있다.

서브밴브코딩은 디지탈 대역통과 필터들의 뱅크에 의해 이루어질 수 있다. 변환코딩은 디지탈대역통과필터들의 뱅크를 이용하는 여러 가지 시간영역 대주파수 영역의 이산변환중 어느하나에 의해 이루어질 수 있다. 이후의 설명에서는, 특히 변환코더들에 대하여 언급될 것이며, 따라서 서브밴브는 그것이 서브밴브코더나 변환코더중 어느것에 의해 이루어지더라도 전체신호대역폭에서의 선택된 일부분들을 나타낸다. 변환코더에 의해 이루어지는 서브밴드는 하나 또는 그 이상의 인접한 변환계수들의 한 세트에 의해 설정되며, 따라서 서브밴브 대역폭은 변환계수 대역폭의 배수가 된다. 변환계수의 대역폭은 입력신호의 샘플링비율에 비례하며, 입력신호를 재생하기 위한 변환에 의해 발생된 계수들의 수에 반비례한다.

만약, 가청스펙트럼의 전역을 통한 서브밴브대역폭이 대략 이 스펙트럼의 같은 부분들에서의 인간의 귀의 임계대역폭의 반이될 경우, 심리음향적 마스킹이 변환코더들에 의해 더욱 용이하게 이루어질 수 있다. 이것은 서브밴브 및 변환코더들이 전형적으로 고정된 서브밴브 중심주파수들을 가짐에 반하여 인간의 귀의 임계대역들은 청각적자극에 적합한 가변중심 주파수를 갖기 때문이다. 심리음향적 마스킹효과의 이용을 최적화시키기 위하여, 우세한 신호(dominant signal)의 존재로부터 야기되는 임의의 왜곡변형(distortion artifacts)들이 이 우세한 신호를 포함하는 서브밴브에 있도록 제한되어야 한다. 만약, 서브밴브 대역폭이 대략 임계대역의 반이되거나 작을 경우, 그리고 필터선택도가 충분히 높을 경우, 원하지 않는 왜곡생성의 효과적인 마스킹이 서브밴브 통과대역폭의 단부부근의 주파수를 갖는 신호에 대하여도 일어날 가능성이 있게된다. 만약, 서브밴브 대역폭이 임계대역의 반보다 클 경우, 우세한 신호에 의해 인간의 귀의 임계대역이 코더의 서브밴브로부터 벗어나게 될 수 있으며, 이에 의해 인간의 귀의 임계대역폭의 외부에서 발생되는 원하지 않는 왜곡의 일부가 마스킹되지 않을 가능성이 있다. 이 효과는 인간의 귀의 임계대역이 더욱좁은 저주파수에서 가장 심각하다.

우세한 신호 때문에 인간의 귀의 임계대역이 코더서브밴브로부터 벗어나게 되고 이에의해 같은 코더서브밴브내의 다른신호들을 노출시킬 확률은 일반적으로 인간의 귀의 임계대역이 더욱 좁아지는 저주파수에서 더욱 커지게된다. 변환코더들에 있어서, 가장 가능성이 적은 서브밴브는 하나의 변환계수로서, 만약 변환계수대역폭이 인간의 귀의 가장좁은 임계대역폭의 ½을 넘지않을 경우 심리음향적 마스킹이 더욱 용이하게 이루어질 수 있다. 변환계수대역폭은 변환길이를 증가시킴에 의해 감소될 수 있다. 변환길이를 증가시키는 것의 단점중에 하나는 변환을 계산하고 상대적으로 더욱많은 수의 좁은 서브밴브들을 인코딩하는데 따르는 처리의 복잡성이 증가한다는 것이다. 다른 단점들은 다음에 설명한다.

물론, 서브밴브들의 중심주파수가 인간의 귀의 임계대역 중심주파수가 이동되는 만큼 우세신호성분들을 따라서 이동될 수 있다면, 심리음향적 마스킹이 더욱 넓은 서브밴브들을 이용하여 이루어질 수 있다.

심리음향적 마스킹 효과를 이용하기 위한 변환코더의 능역은 또한 변환에 의해 이루어지는 필터뱅크의 선택도에 의존한다. 필터 선택도는 여기에서 서브밴브 대역통과 필터들의 두가지 특성을 나타낸다. 첫번째는 필터통과 대역과 정지대역들 사이의 영역들의 대역폭(전이 대역폭)이다. 두번째는 정지대역들내의 감쇠레벨이다. 따라서, 필터 선택도는 전이 대역들안의 필터 응답곡선의 경사도(전이 대역하강 경사도), 그리고 정지대역들내의 감쇄레벨(정지대역저지 깊이)을 나타낸다.

필터선택도는 다음의 세가지 팩터: 블록길이, 윈도우무게화 함수 그리고 변환을 포함하는 여러 가지 팩터에 의해 직접 영향을 받는다. 매우 일반적인 관념으로서, 블록길이는 코더의 시간 및 주파수 분해능에 영향을 주며, 윈도우 및 변환은 코딩이득에 영향을 준다.

[블록길이]

인코딩될 입력신호는 서브밴브 필터링이전에 샘플링되고 신호샘플 블록들로 분할된다. 신호샘플블록안의 샘플들의 수가 신호샘플 블록길이가 된다.

통상적으로 변환필터 뱅크에 의해 발생된 계수들의 수(변환길이)는 신호 샘플블록 길이와 같으나, 이것이 필수적인 것은 아니다. 예를들어, 본 발명의 실시예(다음에 상세히 설명됨)에서 사용된 중복블록 변환(overlapping-block transform)은 해당기술분야에서 신호샘플블록들을 2N 샘플들로 변환시키는 N길이의 변환으로서 기술된다. 그러나, 이 변환은 또한 오직 N만의 계수들을 발생시키는 2N길이의 변환으로서도 기술될 수 있다. 여기에 기술된 모든 변환들이 신호샘플블록길이와 같은 길이를 갖는다고 생각될 수 있기 때문에, 2개의 길이들이 상호 동의어로서 사용된다.

이 신호샘플블록 길이는 변환코더의 시간 및 주파수 분해능에 영향을 미친다. 이산변환 계수 대역폭이 더욱 넓어지고 필터 선택도가 더욱 낮아지기 때문에(전이대역 하강의 감소비 및 정지대역저지의 감소레벨), 더욱 짧은 블록길이들을 사용하는 변환코더들은 더욱 불충분한 주파수 분해능을 갖게된다. 필터수행에 있어서 이러한 하강 때문에 단일 스펙트럼 성분의 에너지가 아웃하는 변환계수들로 퍼지게 된다. 이와같은 스펙트럼 에너지의 원하지 않는 전파는 사이드로브누설(sidelobe leakage)로 불리는 하강된 필터 수행의 결과에 의한 것이다.

양자화 에러들에 의해 변환 인코더/디코더 시스템이 신호샘플블록의 전체 길이를 통해 샘플링된 신호의 주파수성분들을 스미어(smear)시키기 때문에, 더욱 긴 블록 길이들을 사용하는 변환코더들은 더욱 불충분한 시간 분해능을 갖게 된다. 역변환에 의해 복구된 신호내의 왜곡변형은 신호샘플블록길이 보다 훨씬 짧은 시간간격동안 발생하는 신호진폭상의 큰 변화에 대하여 가장 청휘 가능하게 된다. 이와 같은 진폭변화를 과도현상(transients)라 한다. 이와 같은 변형은 전ㆍ후 관도현상진동(pre-and post -transient ringing)으로서 나타난다.

따라서, 고정된 블록길이 변환 코더들은 주파수 분해능에 대한 선행 시간 분해능을 교환하는 절충블록길이(compromise block length)를 사용하여야 한다. 짧은 블록길이는 더욱 낮은 또는 모든 주파수들에서 인간의 귀의 임계대역폭을 초과하는 공칭 통과대역필터 대역폭이 될 수 있는 서브밴브 필터 선택도를 저하시키게 된다. 비록 공칭 서브밴브 대역폭이 인간의 귀의 대역폭보다 좁더라도 넓은 과도현상대역 그리고/또는 더욱 불충분한 정지대역 저지로서 나타나는 강하된 필터 특성이 인간의 귀의 임계대역폭 외부의 우세신호의 변형들을 초래할 수 있다. 한편, 긴 블록길이는 필터 선택도를 높이게 되나 시간분해능을 감소시키게 되며, 이에 따라 인간의 구의 시간적ㆍ심리음향적 마스킹 간격밖에서 발생하는 청취가능한 신호왜곡을 초래하게 된다.

주파수분해능과 시간분해능을 교환시 발생하는 문제점은 Krah'e에 의한 코더설계론에 나타나있다. Krah'e는 1985년 11월 Mannheim에 음성방송에 관한 NTG 화합의 고음질 디지탈 오디오 신호에 대한 새로운 신호원 코딩방법라는 강의에서 심리음향적 마스킹 효과를 성공적으로 이용하기 위한 충분한 필터 선택도를 얻기 위하여 1024 샘플의 블록길이가 요구되는 적응 변환 코더를 제시하고 있다. 샘플블록내의 전 과도현상(pre-transient) 왜곡은 대략 20mS 정도되는데, 과도현상에 의해 마스킹되지 않는다. 전 과도현상을 향상시키기 위하여 입력신호를 고역통과필터링하고, 과도현상이전에 신호샘플블록안의 신호샘플들을 부스트(boost)하는 인코딩방법을 제시하고 있다. 과도현상 전처리의 이용은 과도현상 이전에 해당량만큼 신호샘플블록안의 복구된 신호샘플들을 감쇄시키는 수신기/디코우더에 부속정보(side information)로서 이루어진다.

이 방법은 여러 가지 문제점이 있다. 첫째, 전 과도현상 부스트는 샘플블록의 스펙트럼 형태를 왜곡시키고, 이에 따라 스펙트럼 형태에 근거한 코딩결정(coding decisi on)을 왜곡시킨다. 이것은 심리음향적 마스킹의 이용능력에 역영향을 미치게한다. 또한, 적응비트할당(adaptive bit allocation)을 이용하는 코더들에 있어서, 전 과도현상 신호샘플들의 부스트가 과도현상의 양자화오차를 증가시키는 경향이 있다. 이 양자화오차의 증가는 과도현상의 스펙트럼 성분들보다 부스트증폭 스펙트럼성분에 의해 초래된다.

이것이 과도현상의 스펙트럼 성분들을 인코우딩 할 수 있는 비트수를 감소시키게 되며, 따라서 과도현상 양자화잡음이 증가하게 된다.

둘째, 전 과도현상 부스트/감쇠처리는 과도현상에 의해 야기된 어떠한 양자화 잡음의 심리음향적 마스킹에 대비하고 있지않다. 과도현상은 그밖의 다른 스펙트럼 성분들을 양자화하기 위한 비트들이 과도현상의 스펙트럼 성분에 대신하여 할당되기 때문에, 적응비트할당을 이용하는 코더들안에서의 양자화오차를 증가시키게 된다. 증가된 양자화잡음은 부스트/감쇠처리가 과도현상이전에 블록길이를 짧게 하지 않기 때문에, 인간의 귀의 전 과도현상 마스킹 간격밖에서는 청취가능하게 된다.

셋째, 전 과도현상 부스트에 의해 증폭된 큰 진폭의 신호샘플들은 그들을 나타내는 인코더의 용량을 초과할수있다(인코더의 다이나믹영역(dynamic range)을 초과할 수 있다). 만약, 인코더의 다이나믹 영역이 증폭된 성분들을 처리할 수 있도록 증가될 경우, 신호를 인코딩하는데 요구되는 비트수도 역시 증가하게 된다. 이 상태는 특히 큰 진폭의 신호들이 저주파 스펙트럼 성분들인 경우이다. 이들의 주파수가 낮기 때문에 큰 진폭의 신호들이 고역통과 필터에 의해 차단되어 과도현상검출처리가 이루어지지 않게 된다. 유럽 특허 EP0251028에는 주파수선택부스트를 적용시키고 과도현상을 만드는 스펙트럼 성분들만을 부스트하는 것이 제안되어있으나, 전 과도현상 부스트가 변환필터링이전의 시간영역에서 발생하기 때문에 변환을 이루는데 필요한 추가적인 필터링단계를 이루기위한 더욱 많은 처리단계가 요구된다.

끝으로, 유럽 특허 EP0251028에는 후단 과도현상처리에 대한 대비가 없기 때문에 신호샘플블록이 인간의 귀의 후단 마스킹간격보다 짧지 않을 경우 후단 과도현상왜곡이 마스킹되지 않게 된다. 이것이 많은 코딩시스템들에 있어서 늘 문제를 발생시키지는 않으나, 코더의 최대블록길이에 불필요한 제한을 주게된다.

다른방법은 Edler의 중복블록변환과 적응윈도우 기능을 갖는 오디오신호의 코딩(Frequenz 지 43권, 1989년 제9권 252-70 페이지)에 제시되어 있는데, 이는 중복블록변환을 위한 변환길이를 적정히 선택할 수 있는 방법이다. 또한 윈도우 무게함수의 적정한 선택에 관한 것도 제시되어 있다.

이 방법은 여러 가지 문제점이 있다. 첫째, 분석/합성 윈도우쌍의 설계가 고가로되며, 필터선택도를 심각하게 강하시키는 윈도우가 필요하다. 이 문제점은 아래에서 더욱 상세히 설명된다.

둘째, 이 방법을 이용하는 실시간(real-time) 시스템들은 분석 및 합성필터링이 매우높은 주파수신호처리가 요구되는 버스트들이 부과되기 때문에, 더욱 빠른 신호처리기들이 요구된다. 분석필터링동안 어떤 신호샘플들은 신호샘플당 2번의 변환이 이루어지는 평균치보다 50% 증가된, 3번의 변환이 이루어져야 한다.

셋째, 이 방법은 블록내에 과도현상발생시간을 생성시키지 않으며, 단지 과도현상이 발생할 뿐이다. 따라서, 이 방법은 과도현상 이전까지 짧은 블록길이로 시프트(shift down) 되는 것을 지연시킬 수 없으며, 과도현상이 지나간후 즉시 전체길이의 블록으로 시프트될 수 없다. 이 방법은 신호가 요구하는것보다 더욱 빨리 필터선택도를 저하시키거나 또는 신호가 요구하는 것보다 더욱길게 필터선택도를 저하시키게 된다.

넷째, Edler의 방법은 과도상태를 잘못검출할 수 있기 때문에 불필요하게 더욱 짧은 블록길이로 시프트될 수 있다. 침묵 및 저레벨 통과동안 음악신호에너지나 저레벨잡음의 변화들이 빈번하게 Edler의 표준에 처하게되나, 이와같은 통과는 드물게는 전 과도현상 시간왜곡을 마스킹하기 위하여 더욱 짧은 블록길이들이 요구된다.

다섯째, 이 방법은 전단 및 후단 과도현상의 마스킹 요구사이에 구별이 없다. 인간의 귀의 후단마스킹 간격이 그 전단마스킹 간격보다 더욱 길어지고, 따라서 더욱짧은 블록실이로의 시프트를 트리거하는데 사용되는 표준과 더욱 짧은 블록의 길이가 신호샘플들이 시프트를 트리거한 과도현상에 선행하느냐 또는 뒤따르냐의 여부에 따라 변화될 수 있다. Edler 방법에서 사용된 한벌의 표준은 보충이나 더욱 짧은 블록다음의 과도현상으로의 불필요한 시프트에 대한 잠재적인 요구 또는 과도현상 이전의 필요한 시프트에 대한 요구의 잠재적 불이행이어야 한다. 이와 유사하게, 하나의 짧은 블록길이가 보충되어야 한다. 이것은 너무 짧아서 필터선택도의 불필요한 저하를 야기시키거나, 또는 너무 길어서 과도현상의 시간왜곡이 마스킹되지 못하게 된다.

[윈도우 무게함수]

이산 변환들은 오직 한정된 길이의 신호세그멘트, 즉 신호샘플블록으로 동작하기 때문에 완전하게 정확한 한벌의 주파수 계수들을 발생시키지 않는다. 정확히 말해서 이산변화들은 무한한 신호샘플블록 길이들이 요구되는 전 주파수영역표시보다 입력 시간영역신호의 시간-주파수 표시를 발생시킨다. 그러나, 설명의 편리함을 위하여 이산변환들의 출력을 주파수-영역 표시라 한다. 사실상, 이산변환은 샘플링된 신호가 그 주기가 신호샘플 블록 길이의 약수인 주파수 성분들을 갖는다는 것을 가정한다. 이것은 한정된 길이의 신호가 주기적이라는 가정과 동일하다. 물론, 일반적으로 이 가정은 진실이 아니다. 가정된 주기성은 의사 스펙트럼성분(phantom spectral component)을 생성시키기 위한 변환을 발생시키는 신호샘플블록의 단부들에서의 불연속성을 생성한다.

이 효과를 최소화시키기위한 하나의 기술은 신호샘플블록의 단부근처의 샘플들이 0이 되거나 또는 0에 가깝도록 신호샘플들을 부과함에 의해 변환이 전에 불연속성을 감소시키는 것이다. 신호샘플블록의 중앙에 있는 샘플들은 일반적으로 변환되지 않은 상태 즉 하나의 펙터(factor)에 의해 부과된 상태로 전해진다. 이 무게함수는 분석윈도우로 불린다. 윈도우의 형태는 필터선택성에 직접 영향을 미친다.

여기서, 분석윈도우는 순방향변환의 적용이전에 수행되는 윈도우함수(windowing function)를 뜻한다. 다음에 기술하는 바와같이 본 발명의 실시예에서 사용된 분석윈도우의 설계는 분석윈도우 설계대상으로 한정된다. 따라서, 당 기술분야에서 공통적으로 사용되는 항목으로서의 분석윈도우의 설계 및 실행특성들은 본 발명에서 실행되는 것과 같은 분석윈도우와는 다르다.

분석윈도우는 시간영역함수이다. 윈도우효과의 보상이 이루어지지 않을 경우 복구된 또는 합성된(synthesized)신호가 분석윈도우의 형태에 따라 왜곡될 것이다. 중복가산(overlap-add)으로 알려진 하나의 보상방법이 알려져 있다. 이 방법에 의하면 코더가 입력신호샘플들의 중복된 블록들을 변환시키게 된다. 2개의 인접한 윈도우가 중복을 통해 하나로 가산되도록 분석윈도우를 세심하게 설계함에 의해 윈도우효과가 정확하게 보상될 것이다.

윈도우형상은 필터선택성에 충분히 영향을 미친다. Harris 저의 이산푸리에변환을 사용한 조파분석으루이한 윈도우의 사용에 대하여 (Proc. IEEE, 66권 1978년 1월 51-83 페이지)를 참고한다. 일반적인 법칙으로서, 더욱, 평활된 윈도우와 더욱 큰 중복간격은 좀더좋은 선택성을 제공한다. 예를들어, Kaiser-Bessel 윈도우는 일반적으로 사인파 테이퍼된 (sine-tapered) 직사각형 윈도우보다 더욱 큰 필어선택성을 제공한다.

이산 푸리에 변환(DFC)과 같은 특정형태의 변환을 사용했을 때, 중복간격안의 신호부분이 두 번, 즉 2개의 중복신호샘플블록 각각에 대하여 한번씩 변환 및 전송되어야 하기 때문에 중복가산은 신호를 나타내는데 요구되는 비트수를 증가시킨다. 중복 가산의 변환을 사용하는 시스템들에서의 신호분석/합성은 임계적으로 샘플링되지 않는다. 임계적으로 샘플링된다는 것은 수신되는 입력신호샘플수와 같은 수의 주파수계수들을 한시간주기를 넘어서 발생시키는 신호분석/합성을 뜻한다. 따라서, 비임계적으로 샘플링되는 시스템에 있어서, 코딩된 신호정보요구량을 최소화시키기 위하여 가능한한 적은 중복간격을 갖는 윈도우를 설계하는 것이 바람직하다.

다음에 기술된, Johnson과 Bradley에 의해 제시된 것을 포함하여 몇가지 변환들 역시 역변환으로부터의 합성출력이 윈도우되도록 요구된다. 합성윈도우는 각각의 합성된 신호블록을 형성하는데 사용된다. 따라서, 합성된 신호는 분석 및 합성윈도우에 의해 무게화된다. 이 2단계 무게화는 수학적으로 분석 및 합성윈도우의 샘플 대 샘플 곱(sample-by-sample product)과 동일한 형태의 윈도우에 의해 한 번 본래의 신호를 무게화하는 것과 유사하다. 따라서, 윈도우왜곡을 보정하기 위한 중복가산을 이용하기 위하여 양 윈도우는 이들 둘의 곱이 중복가산간격을 거쳐 하나로 합쳐지도록 설계되어야한다.

윈도우의 최적성을 추정하는데 사용될 수 있는 하나의 표준이 없을 경우, 윈도우에 사용된 필터의 선택성이 양호하면 윈도우도 일반적으로 양호한 것으로 고려된다. 따라서, 잘 설계된 분석윈도우(오직 분석윈도우만을 사용하는 변환을 위한)나 분석/합성 윈도우 쌍(분석 및 합성윈도우 모두를 사용하는 변환으루이한)은 사이드로브 누설을 감소시킬 수 있다. Edler는 직사각형 윈도우의 변형물들인 윈도우의 사용을 제시하고 있으나, Kaiser Bessel 윈도우와 같은 최대중복을 갖는 더욱 좋은 윈도우의 사용에 대하여는 제시하고 있지 않다. 또한, Edler의 방법은 만약 과도현상이 다음의 중복된 블록안의 어떤 장소에서 발생할 경우 이전의 블록으로 전파되는 전단과도왜곡을 충분히 방지하기 위한 윈도우에 적합할 수 없다.

[변환]

변환코더들이 여러 가지 시간영역 대 주파수영역 변환중의 하나를 수행할 수 있지만, 몇몇 변환들은 오디오신호, 특히 광대역 음악신호의 고음질 저비트율의 코딩을 위하여 다른 변화들보다 더욱 양호하게 동작한다.

변환코딩동작에 대한 하나의 척도는 코딩이득 또는 PCM 코딩에 의해 달성된 변환코딩의 신호대 잡음비(SNR)의 증가에 대한 것이다. 코딩이득은 변환 계수변동의 등비중항(geometric mean)에 대한 등차중앙(arithmetic mean)의 바와같다. Zelin ski 와 Noll 저의 음성신호의 적응변환코딩 IEEE Trans. Acoust., Speech, and Signal Proc., ASSP-25, 1977년 8월, 299-309 페이지)를 참고한다. 주어진 신호샘플블록에 대한 서로다른 변환들의 코딩이득은 변화되지만, 모든 신호샘플블록에 대하여 최대의 코딩 이득을 제공하는 신호와 무관한(Signal-undependent)변환은 없다. 예를들어, 이산 코사인 변환(DCT)은 정상신호(steady-state signal), 즉 현저하게 저주파수인 스펙트럼성분들을 갖는 신호들에 대하여 이산푸리에 변환(DFC)보다 더욱 높은 코딩이득을 제공한다. 한편, BFC는 과도현상 또는 현저하게 고주파수인 스펙트럼 성분들을 갖는 신호들에 대하여 DCT보다 더욱 높은 코딩이득을 제공한다. Jayant와 Noll 저의 파형들의 디지탈 코딩(Englewood Cliffs, NJ:Prentice-Hall, Inc., 1984, 554-56 페이지)를 참고한다.

Zelinski 및 Noll에 의하면, Karhunen-Loeve 변환(KLT)은 변환코딩에 있어 최상으로 수행되며, 주요단점은 변환계수들의 고속계산 알고리즘의 결여가 된다. 추가로, 비정상신호에 대하여, KTL이 시간에 의존되기 때문에 각 시간영역 신호샘플블록들에 대하여 다른 KTL이 사용되어야 한다. 음성신호코딩에 따른 KTL의 계산상의 복잡성을 피하기 위하여, Zelinski와 Noll은 차선적인 시로무관변환, 보다 상세하게는 적응비트할당과 적응양자화에 있어서의 이산 코사인 변환의 사용을 제안하고 있다.

원리적으로, 정방향 및 역방향 변환에 의해 주파수영역 위신호 소거가 이루어지더라도, 양자화 오차 때문에 역변환이 완전히 주파수영역 위신호를 소거시키는 것을 방해하게 된다. 왜곡이 심리음향적으로 마스킹되지 않을 경우, 잔여 주파수영역 위신호 왜곡이 청취가능하게 될 수 있다. 그러나, 짧은 신호샘플블록들에 있어서는, 심리음향적 마스킹을 이루기가 더욱 어렵게 된다. 전술한 바와 같이, 짧은 신호샘플 블록들은 필터 선택도를 떨어뜨리고, 몇개의 변환계수들이 청각적 임계대역보다 넓은 대역폭을 가질수 있는데, 특히 인간의 귀의 임계대역이 가장 큰 분해능을 가지는 저주파수에서 그러하다. 결국, 주파수영역 위신호 왜곡이 마스킹되지 않을 수 있다.

긴 블록길이는 물론 긴 윈도우도 필터 선택도를 향상시킬 수 있으며, 이에 따라 주파수 영역 위신호를 감소시키고 심리음향적 마스킹을 향상시키게 된다. 그러나, 윈도우길이가 코더시스템 십진 팩터를 넘도록 증가하면서, 시간영역 위신호가 발생하게 된다.

주파수영역 및 시간영역 위신호를 소거시킬 수 있는 중복블록 변환이 Johnson과 Bradley 저의 시간영역 위신호 소거를 결합시킨 적응변환코딩(Speech Commun ications, 6권, North Holland ; Elsevier Science Publishers, 1987년, 299-308페이지)에 제시되어 있다. Johnson및 Bradley 변환을 사용한 분석/합성 시스템은 임계적으로 샘플링된다. Edler는 전술한 그의 적응기술에 이 변환을 이용하고 있다. 이 변환은 또한 본 발명의 실시예에서도 사용된다.

Johnson과 Bradley는 이 변환을 사용하는 변환코더가 어떻게 다른 블록 길이들을 또는 분석/합성 윈도우들을 적정히 선택하는가, 그리고 이와 같은 적응이 어떻게 위신호소거 및 임계샘플링의 변환특성을 유지할 수 있는지에 대하여 설명하고 있지 않다. 그들은 또한 어떻게 다른 변환들을 적정하게 선택하는지에 대하여도 제시하고 있지 않다.

[발명의 상세한 설명]

본 발명의 목적은 전술한 문제점이나 제한을 발생시킴이 없이 변환 시간분해능 및 주파수 분해능사이의 교환을 적정하게 최적화시키는 신호분석/합성에 의해 오디오정보 특히 광대역 음악을 디지탈 변환처리 하는 인코더/디코더를 제공하는 것이다. 이 목적은 제2항에 의한 인코더, 그리고 제20항에 의한 디코더에 의해 달성된다.

본발명의 다른 목적은 전술한 문제점이나 제한을 발생시킴이 없이 변환코더 이득을 적정하게 최적화시키며, 임의의 중복 블록 변환에 대하여는 주파수영역 및 시간영역 위신호 소거 및 임계 샘플링을 보존하는 신호분석/합성에 의해 오디오정보 특히 광대역음악을 디지탈 변환처리하는 인코더/디코더를 제공하는 것이다. 이 목적은 제1항에 의한 인코더, 그리고 제2,3항에 의한 디코더에 의해 달성된다.

나머지 청구항들에 의한 본 발명의 특정실시예들에 의해 달성되는 본 발명의 추가적인 목적들은 다음과 같다:

최적의 분석 윈도우 함수 또는 최적의 분석/합성 윈도우쌍 함수의 적정한 선택을 제공하는 것: 고품질 전송 또는 저장, 그리고 광대역 오디오신호의 재생을 제공하여 예를들어, 재생품질이 방송오디오 링크에 적합하도록 하는 것; 컴팩트디스크로부터 얻을 수 있는 것과 같은 양호한 재생품질을 제공하는 것; 인코딩된 신호를 전송하는데 저용량 채널이 요구되는 디지탈 처리시스템에 적용되는 인코더/디코더를 제공하는 것; 그리고 인코딩된 신호를 저장하는데 적은양의 공간이 요구되는 디지탈 처리시스템에 적용되는 인코더/디코더를 제공하는 것이다.

본 발명의 전술한 목적들과 다른 목적들의 더욱 상세한 내용은 본 명세서, 특히 발명을 수행하기 위한 방식에서 설명된다. 본발명은 음악이나 음성과 같은 오디오 신호의 고품질 인코딩 및 디코딩에 관한 것이나, 본 발명의 바람직한 한 실시예는 특히 광대역 음악신호의 인코딩 및 디코딩에 관한 것이다.

본 발명의 바람직한 실시예에서 제시된 바에 의하면, 인코더는 광대역 오디오정보의 디지탈 인코딩을 제공한다. 광대역 오디오신호들은 샘플링되고, 양자화되며, 길이에 있어서 N샘플들로서 시간영역 신호샘플 블록들로 분류된다. 신호분석기는 적당한 변환, 블록길이 그리고 코딩수행을 최적화하기 위한 분석 윈도우함수를 설정하기 위하여 전류신호 샘플블록 값을 구하게 된다. 본실시예에 있어서, 신호 분석기는 인코더가 청취가능한 온도 왜곡을 피하기 위해 더욱 짧은 블록길이를 사용하는 것이 필요한 신호과도현상이 있는지를 실정하는 과도신호 검출기이다. 이와 같은 과도현상을 갖는 샘플블록들은 과도현상에 의해 야기된 코딩왜곡의 심리음향적 마스킹을 보증할 수 있는 충분한 변환주파수 선택도를 보전하기 위하여 최적의 길이의 샘플 서브블록(subblock)들로 세분된다. 각 샘플블록은, 그것의 정상 또는 감소된 길이에 무관하게 과도현상 검출기의 출력에 따라 선택된 분석윈도우 함수에 의해 무게화된다. 주파수 영역변환 계수들은 그후 과도현상 검출기 출력에 의해 선택된 이산 정방향 변환에 의해 분석 윈도우 무게화 시간영역 신호샘플블록에 대응하여 발생된다. 인코더에 사용된 신호 샘플 블록길이, 분석윈도우 함수 및 정방향 변환을 정하기 위한 정보가 디코더로 전달된다.

본 발명의 다른 실시예들에 제시된 바에 의하면, 신호분석기는 과도 현상의 존재에 추가하여 또는 대신에 다른 입력신호 특성들을 생성할 수 있다.

이들 실시예에서, 신호분석기는 입력신호 분석결과에 따라 적어도 하나의 변환, 블록길이 및 분석 윈도우 함수를 설정하게 된다.

또한, 본 발명의 바람직한 실시예에 제시된 바에 의하면, 디코더는 본발명의 인코더에 의해 디지탈적으로 인코딩된 광대역 오디오 신호의 고품질 재생을 제공한다. 이 디코더는 인코딩된 신호로부터 인코더에서 사용된 신호샘플블록길이, 분석 윈도우 함수 및 정방향 변환을 설정하는 정보를 뽑아낸다. 이 정보는 역변환의 길이를 정하고, 분석 윈도우 함수의 선택을 알리며, 이산역변환을 선택하는데 사용된다. 시간영역 신호샘플블록들은 주파수 영역 변환계수들을 발생시킨 인코더에서 사용된 이산변환의 것들과 상반되는 특성들을 갖는 이산 변환에 의한 주파수영역 변환계수들에 대응하여 발생된다. 이 시간영역 신호샘플 블록들은 합성윈도우에 의해 무게화된다. 인코더 분석 윈도우와 디코더 합성 윈도우는 복합 윈도우 함수가 두개의 인접 중복된 샘플블록들이 하나로 합해지도록 형태를 이룬다. 인접한 샘플블록들은 윈도우 무게화의 효과들을 소거시키고, 다음에 고품질 아날로그 출력으로 변환되는 시간 영역 신호의 디지탈 재생을 복구하기 위하여 가산된다.

본 발명의 다른 실시예들에 제시된 바에 의하면, 디코더는 인코딩된 신호로부터 인코더에서 사용된 적어도 하나의 신호샘플 블록길이, 분석 윈도우 함수 및 정방향 변환을 설정하는 정보를 뽑아낸다. 이렇게 뽑아진 정보는 각각 역변환 길이를 정하고, 분석 윈도우 함수의 선택을 알리며, 이산 역변환을 선택하는데 사용된다. 요구되는 이산 변환들을 사용하는 본 발명의 실시예들에 있어서, 시간영역 신호샘플 블록들은 합성윈도우에 의해 무게화된다. 인코더 분석 윈도우 그리고 디코더 합성 윈도우는 복합 윈도우 함수가 두개의 인접중복된 샘플블록들이 하나로 합해지도록 형태를 이룬다.

본 발명의 특정 실시예에 제시된 바에 의하면, 짧은 블록길이들이 과도신호들에 의해 생성된 왜곡변경의 심리음향적 마스킹이 필요할 때 과도현상 검출기는 본발명에서 정상적으로 사용된 최대블록 길이보다 짧은 신호샘플 블록길이들은 적정하게 선택하게 된다. 디지탈화된 신호샘플들은 고역통과 필터를 통과하면서 서브블록들로 분류된다. 각 서브블록내의 피크 진폭은 이전의 블록의 피크 진폭과 비교된다. 만약, 인접한 서브블록들의 피크진폭사이의 변화가 특정 한계를 벗어나지 않을 경우 코더는 최대신호샘플블록 길이를 이용하게 된다. 만약, 인접한 서브블록 사이의 진폭변화가 특정한계를 벗어날 경우에는 더욱 짧은 블록길이가 선택된다.

본 발명의 특정 실시예에 있어서, 분석 윈도우 함수는 관도현상 검출기에 의해 선택된 신호샘플블록 신호내용과 블록길이에 적당한 신호샘플 블록에 대하여 선택된다. 전술한 바와 같이, 이 분석윈도우 함수는 이산변환의 전체 동작을 향상시키기 위하여 신호샘플 블록내의 샘플들을 무게화한다. 본 발명에 의한 인코더의 한 실시예에 있어서, 분석 윈도우는 길이가 다른, 같은 급 또는 같은 형의 윈도우로부터의 다수의 윈도우 함수들로부터 선택된다.

본 발명은 또한 블록길이 또는 입력신호 특성에 따라 적정하게 윈도우 함수형을 선택하거나, 또는 적정하게 윈도우 함수의 파라메타들을 변화시킬수 있다.

예를들어, 본 발명의 일 실시예는 각 신호샘플 블록에 대하여 Kaiser-Bessel 윈도우 함수의 알파 파라메터를 적정하게 선택하며, 과도현상을 갖는 신호샘플 블록들에 대한 앝은 과도현상 밴드 로오프(rolloff)를 희생하여 더욱 높은 정지대역 저지를 제공한다. Kaiser-Bessel 윈도우 함수는 아래에 더욱 상세히 기술된다. 본 발명의 실시예는 적정하게 윈도우 형태를 선택하며, Kaiser-Bessel 또는 Dolph-Chebychev 윈도우와 같은 함수를 적정하게 선택하게 된다. 그러나 윈도우 함수의 선택이 중복가산특성과 같은 어떤 제약들도 어기지 않게 된다.

본 발명의 인코더의 특정실시예에 있어서, 이산변환의 길이가 과도신호검출기에 의해 선택된 신호 샘플블록 길이와 같게 정해진다.

본 발명은 어떠한 직교 시간영역대 주파수영역 변환을 사용할 수 있다.

그러나 본발명의 실시예에서는 변형 이산코사인변환(DCT)와 변형 이산 사인 변환(DST)의 선택적인 적용과 동등한 비직교 이산변환을 사용한다. 다른 실시예에서는 비직교 이산 변환이 단일변형 이산 코사인변환(DCT)에 의해 수행된다.

본 발명은 또한 블록길이 또는 입력신호 특성들에 따라 적정하게 변환을 선택할 수 있다.

예를들어, 본 발명의 일 실시예는 각 신호샘플 블록에 대하여 한벌의 직교변환들중 최대코딩이득을 얻는 변환을 적정하게 선택할 수 있다. 본 발명의 실시예는 보통 종래의 DCT 및 이산 푸리에변환(DFC)를 사용할 수 있다. 저주파성분들의 코딩의 정확성이 최대 음악신호의 주어진 품질을 얻기에 충분하다고 알려져 있다. 종래의 DCT는 저주파 신호에 대하여 코딩이득을 얻을 수 있다. 한편, 고주파성분들의 코딩 정확성은 과도신호에 대한 주어진 레벨의 품질을 얻기 위하여 매우 중요하다. DFC는 고주파신호에 대하여 탁월한 코딩이득을 얻을 수 있다. 따라서, 본 발명의 실시예는 각 신호샘플블록의 코딩에 가장 적합한 변환을 적정하게 선택할 수 있다.

인코더 및 디코더의 바람직한 실시예에 있어서, 심플링 비율은 44.1㎑이다. 샘플링 비율은 임계적이 아니므로, 44.1㎑는 적당한 샘플링 비율이며, 이는 또한 컴팩트디스크에 사용되는 샘플링 비율이기 때문에 편리하다. 본 발명의 다른 실시예는 48㎑ 샘플링 비율을 사용한다. 한편, 44.1㎑ 샘플링 비율을 사용하는 본 발명의 바람직한 실시예에 있어서, 발명의 공칭 주파수 응답이 20㎑로 확장되며, 시간영역 샘플블록들이 최대길이의 1204 샘플들로 이루어진다. 더욱 짧은 길이의 512,256 또는 128 샘플들이 적정하게 선택될 수 있다. WO 90/09022 (1990. 8. 9. 공개) 명세서에 기재된 것과 같은 인코딩기술을 사용하는 본 발명의 실시예에 있어서는, 전문적인 방송에 적용되기 적합한 품질을 갖는 음악코딩은 96kbs(오차 정정코드와 같은 간접정보 포함)보다 많지 않은 직렬 비트률을 이용할 수 있다. 음질의 가변레벨을 이루는 다른 버트율들도 본 발명의 기본 개념내에서 사용될 수 있다.

본 발명 및 바람직한 실시예의 여러 가지 특징들은 다음의 '발명을 실행하기 위한 방식'과 첨부도면에서 더욱 상세히 설명된다.

[도면의 간단한 설명]

제1a,1b도는 본 발명의 바람직한 실시예의 기본적인 기능 구조를 도시한 기능 블록도이다.

제2a,2e도는 본 발명의 일 실시예의 하드웨어 구성을 나타낸 블록도이다.

제3a,3b도는 발명의 2채널 실시예를 위한 프로세서의 직렬통신 인터페이스를 더욱 상세히 나타낸 블록도이다.

제4a,4e도는 일련의 중복 및 윈도우화된 시간영역 신호샘플들로 분류된 시간영역 신호를 도시한 가상적 그래프이다.

제5a,5d도는 E-TDAC 변환에 의해 생성된 사간영역 위신호 왜곡을 도시한 가상적 그래프이다.

제6a,6g도는 E-TDAC 변환신호합성시 중복가산에 의한 시간영역 위신호 소거를 도시한 가상적 그래프이다.

제7a도는 신호채널 시스템에서 프레임을 구성하는 한쌍의 선호샘플 블록들을 도시한 가상적 그래프이다.

제7b도는 2채널 스시템에서 프레임을 구성하는 한쌍의 신호샘플 블록들을 도시한 가상적 그래프이다.

제8a도는 과도현상을 갖는 아날로그 음악신호 세그멘트의 그래프이다.

제8b도는 고정된 신호샘플 블록길이의 512개 샘플들을 사용하는 인코더/디코더 시스템을 통하여 하나의 신호샘플 블록으로부터 복구된 합성음악신호 세그멘트의 그래프이다.

제8c도는 최대 신호샘플 블록길이의 512개 샘플들을 갖는 고정프레임배열 기술을 사용하는 본 발명의 일 실시예에 의해 복구된 합성 음악신호 세그멘트의 그래프이다.

제9도는 본 발명의 일 실시예의 과도현상 검출기 내에서 사용되는 고역통과 필터인 재귀필터의 개략도이다.

제10도는 과도현상 검출기의 일 실시예가 한 신호샘플 블록의 반을 더욱 짧은 길이의 서브블록 체계로 분할하는 방법을 나타낸 가상적 그래프이다.

제11도는 과도현상 검출기의 일 실시예가 체계적 서브프레임 내의 각 서브블록안의 피크진폭 값을 확인하는 방법을 나타낸 가상적 그래프이다.

제12도는 과도현상 검출기의 일 실시예의 비교적 단에서 구성된 노드들을 도시한 2진나무(binary tree)의 가상적 그래프이다.

제13도는 본 발명의 일 실시예에서 이용된 과도현상 검출기의 비교기단의 부분 논리를 나타낸 플로우챠트이다.

제14도는 본 발명의 일 실시예에서 이용된 과도현상 검출기의 비교기단에 의한 2진 나무의 변형처리를 나타낸 가상적 그래프이다.

제15도는 2진나무에 도시된 것에 따라서 과도현상 검출기에 의해 선택된 서브블록 길이들을 나타낸 가상적 그래프이다.

제16도는 본 발명의 일 실시예에서 이용된 과도현상 검출기에 의해 선택된 서브블록 길이 간격들로 겹쳐진 음악신호 파형의 가상적 그래프이다.

제17도는 시간영역 신호샘플 블록을 나타낸 가상적 그래프이다.

제18도는 블록내의 신호가 주기적인 것을 가정한 이산변환에 의해 이루어진 샘플블록의 단부상의 불연속성을 보여주는 시간영역 신호샘플 블록을 나타내는 가상적 그래프이다.

제19도는 함수Y(t)를 얻기 위하여, 함수W(t)에 의해 함수X(t)를 무게화 하는 것을 나타낸 기능블록도이다.

제19b-19d도는 분석윈도우에 의해 시간영역 샘플블록을 무게화하는 것을 나타낸 가상적 그래프이다.

제20도는 본 발명의 바람직한 실시예에 사용적합한 분석-합성윈도우족을 나타낸 그래프이다.

제21a-21c도는 고정프레임 정렬기술을 도시한 신호샘플블록들의 순차를 나타낸 가상적 그래프이다.

제22a도는 오직 윈도우의 반만을 사용하는 필터뱅크의 것과 비교하여 전체적인 대칭 분석 윈도우를 사용하는 필터뱅크의 과도현상 밴드 롤오프 및 정지대역 저지를 나타낸 그래프이다.

제22b도는 비대칭 분석 윈도우를 사용하는 필터뱅크의 것과 비교하여 전체적인 대칭분석 윈도우를 사용하는 필터뱅크의 과도현상을 밴드롤오프 및 정지대역 저지를 나타낸 그래프이다.

제23a도는 종래의 위상조건을 사용하는 E-TDAC에 의해 생성된 시간영역 위성분 신호의 시간반전영역을 나타낸 가상적 그래프이다.

제23b도는 고정 프레임 정렬기술에 의해 요구되는 위상조건을 사용하는 E-TDAC 변환에 의해 생성된 시간영역 위성분신호의 시간-반전영역을 나타낸 가상적 그래프이다.

제23c도는 신호샘플 서브블록안의 시간영역 위신호를 소거하는데 요구되는 위상조건을 사용하는 E-TDAC 변환에 의해 생성된 시간영역 위성분신호의 시간-반전영역을 나타낸 가상적 그래프이다.

제24도는 시간영역 위성분신호의 시간반전 영역을 도시한 브릿지변환을 나타낸 가상적 그래프이다.

제25도는 증가 고정프레임 정렬기술을 도시한 신호샘플블록들의 순차를 나타낸 가상적 그래프이다.

제26a-26f도는 본 발명의 실시예의 증가 고정프레임 정렬에 요구되는 프레임제어 로직을 나타내는 플로우 차트이다.

제27도는 다이나믹프레임 정렬기술을 도시한 가변길이의 신호샘플 블록들의 순차를 나타낸 가상적 그래프이다.

제28도는 인접 윈도우 블록들의 중복가산 특성을 나타낸 가상적 그래프이다.

제29a-29e도는 특히 O-TDAC 변환에 의해 일련의 중복 및 윈도우된 시간영역 신호샘플블록도로 분류된 시간영역 신호를 도시한 가상적 그래프이다.

제30a-30d도는 O-TDAC 변환에 의해 생성된 시간영역 위신호 왜곡을 도시한 가상적 그래프이다.

제31a-31g도는 O-TDAC 변환신호 합성동안 중복가산에 의해 시간영역 위신호 소거를 도시한 가상적 그래프이다.

제32도는 시간영역 위신호를 소거하기 위하여 고정 프레임 정렬에 의해 요구되는 O-TDAC 변환 위상조건을 도시한 가상적 그래프이다.

제33a,33b도는 E-TDAC 및 O-TDAC 변환에 대한 변환 계수 대역폭을 나타내는 가상적 그래프이다.

표 2은 과도현상 검출기의 일실시예의 제1단에 사용된 2㎑ 고역통과 필터의 계수들을 나타낸다.

표 2는 과도현상 검출기의 일실시예의 제1단에 사용된 4㎑ 고역통과 필터의 계수들을 나타낸다.

표 3은 라이징 및 폴링 과도상태를 구성하는데 필요한 신호진폭변화량을 설정하기 위하여 과도현상 검출기의 일실시예의 제4단에 사용된 일련의 어태크/디케이 한계를 나타낸다.

표 4는 라이징 및 폴링 과도상태를 구성하는데 필요한 다른 한계를 설정하기 위하여 과도현상 검출기의 일실시예의 제4단에 사용된 일련의 다른 어태크/디케이 한계를 나타낸다.

[발명을 수행하기 위한 방식]

[Ⅰ. 발명의 하드웨어 구성]

제1a 및 1b도는 본 발명의 바람직한 실시예의 기본적인 기능구조를 나타낸다. 제1a도에 도시된 인코더의 실시예는 시간영역 신호입력단 102, 입력신호를 저역통과 필터링하는 저역통과 필터 104, 저역통과 필터링된 입력 신호를 샘플링하는 신호샘플러 및 양자화기 106, 입력신호 샘플들을 버퍼링 하는 신호샘플버퍼 108, 신호샘플블록을 구성하는 입력신호 샘플들의 수를 선택함으로서 신호샘플 블록길이를 선택하는 과도현상 검출기 110, 분석윈도우 함수에 의해 각 디지탈화된 시간영역 신호블록을 무게화하는 분석 윈도우 112, 샘플링 및 양자화된 신호를 주파수 계수들로 변환하는 디지탈 필터뱅크 116, 선택된 신호샘플 블록길이에 따라 분석윈도우와 필터뱅크 제어하는 프레임 제어기 114, 원하는 레벨의 신호음질 및 심리음향적 효과에 따라 변환 계수들을 인코딩하는 양자화기 118, 그리고 인코딩된 주파수 계수들과 선택된 신호샘플 블록길이를 전송 또는 저장을 위한 비트 스트림(bit stream)으로 조합하는 포맷터 120로 구성된다. 제1a도는 전송로 122를 나타낸 것이나 인코딩된 신호는 차후의 사용을 위해 저장될 수도 있다.

제16도에 나타난 디코더의 실시예는 인코딩된 비트스트림 신호입력단 132, 조합된 비트스트림으로 부터 각각의 인코딩된 주파수계수와 신호샘플 블록길이를 뽑아내는 디포맷터 134, 각각의 인코딩된 계수를 선형값의 변환 계수로 변환하는 선형화기(linearizer) 136, 뽑아진 신호샘플블록길이에 따라 역 필터뱅크와 합성윈도우를 선택하는 프레임 제어기 140, 변환계수들을 시간영역 신호블록으로 변환하는 역 디지탈 필터뱅크 138, 선택된 합성윈도우 함수에 의해 각각의 합성된 시간영역 신호블록을 무게화하는 합성 윈도우 142, 시간영역 신호를 디지탈화된 표시로 복구시키는 신호블록 중복가산기 144, 아날로그 신호발생기 146, 저역통과 필터 148, 그리고 아날로그 신호 출력단 150으로 구성된다.

[A. 하드웨어 처리]

본 발명의 실시예의 기본 하드웨어 구성이 제2a-2e도 및 제3a-3b도에 도시되어 있다. 44.1㎑ 샘플비를 사용하는, 본 발명의 단일 채널비젼의 실시예는 입력된 시간영역신호를 양자화하기 위하여 16비트 아날로그-디지탈 컨버터(ADC)를 이용한다. 각각의 16비트 디지탈화된 샘플은 이후에 계산에 사용되는 24비트어의 16최상위 비트를 형성하는데 사용된다. Motorola DSP 56001 24비트 디지탈 신호처리기(DSP)가 요구되는 계산을 수행하고 인코딩 및 디코딩처리를 제어하는데 사용된다. 정적 랜덤 액세스 메모리(RAM)가 DSP용 프로그램과 데이터 메모리를 제공한다. 16비트 디지탈-아날로그 컨버터(DAC)가 디코딩된 디지탈 신호로부터 아날로그 신호를 발생시키는데 사용된다.

제2a도에 나타난 인코더 하드웨어 구성은 아날로그 신호 입력된 200, 저역통과필터(LPF) 200A, ADC 201, DSP 202, 정적 RAM 203, EPROM 204, 그리고 인코딩된 직렬신호 출력단 206으로 이루어진다. LPF 200A는 입력신호의 대역폭을 제한시킨다. ADC 201는 입력 신호를 샘플링하여 16비트어의 직렬 스트림으로 양자화한다. DSP 202는 디지탈화된 샘플들의 직력스트림을 수신 및 배퍼링하고, 입력신호를 분석하며, 신호샘플 블록길이를 선택하고 샘플들을 블록으로 분류하며, 분석윈도우 함수로 블록들을 무게화하고, 블록들을 주파수영역으로 변환시키는데 요구되는 계산을 수행하며, 변환 계수들을 인코딩하고, 인코딩된 계수들 및 다른 측면정보(side information)를 데이터 스트림으로 포맷팅하며, 직렬 데이터경로 206를 통해 인코딩된 신호를 전송한다. DSP를 위한 프로그래밍 및 데이터 작업영역들은 정적 RAM 203에 저장한다. DSP는 프로그램 ROM보다는 RAM에서 더욱 저렴하게 수행될 수 있는 고속 액세스 시간을 갖는 프로그램 메모리를 요구한다. 결국, EPROM 204은 인코더가 처음으로 '온' 될때, DSP가 RAM 203에 이용가능한 형태로 언팩(unpack)하는, 압축된 포맷의 프로그래밍 및 정적 데이터를 저장하게 된다.

제2b,2c도는 2개의 DSP 인터페이스에 대하여 더욱 상세히 나타낸다. 제2b도는 DSP 202, ADC 201 및 직렬데이타 경로 206를 위한 직렬통신 인터페이스를 나타낸다. 타이밍 발생기 202A는 인코더에 수신클럭과 단어동기신호를 발생시키고 이클럭신호를 인코더로 전송한다. 라인 SCO은 라인 SRD를 따라 ADC 201로부터 DSP 202로 입력되는 디지탈화된 입력신호샘플들의 직렬비트 스트립을 클럭킹한다. 라인 SCI은 ADC와 DSP에 각 16비트어의 시작을 표시하는 단어동기신호를 공급한다. 라인 SCK는 라인 STD을 따라 DSC로부터 직렬데이타 경로로 입력되는 인코딩된 신호의 직렬 비트스트림을 클러킹한다.

제2c도는 메모리 어드레스 인터페이스를 나타낸다. Motorola Dsp 56001에 대한 메모리는 프로그램 ROM, 프로그램, X데이타 및 Y데이타의 4개의 세그멘트들로 나누어진다. 라인 PS이 '로우'일 때 어드레스 스페이스들로 매핑된다. 인버터 205c는 어드레스라인 A15를 '하이'로 설정할 때, 인버터는 RAM 203 및 EPROM 204의 칩선택(CS)라인들을 '로우'로 설정한다. EPROM 204는 CS 및 PS 라인들이 '로우'일 때 선택된다. DSP 202가 A15를 '로우'로 설정할 때 인버터 205c는 RAM 203 및 EPROM 204의 CS 라인을 '하이'로 설정한다. 프로그램 RAM203은 라인 CS이 '하이'이고 라인 PS이 '로우'일 때 선택된다.

RAM 203의 X데이타 뱅크는 DSP가 라인 DS을 '로우'로, 그리고 라인 XY을 '하이'로 가져갈때에 선택된다. RAM 203의 Y 데이터 뱅크는 DSP가 라인 XY을 '로우'로, 라인 CS을 '하이'로 가져갈때에 선택된다.

제2d도에 도시된 디코더 하드웨어 구성은 인코딩된 직렬신호입력경로 207, DSP, 정적 RAM 209, EPROM 210, DAC 212, LPF 213A 및 아날로그 신호 출력단 213으로 이루어진다. DSP 208는 인코딩된 신호를 수신 및 배퍼링하고, 신호를 인코딩된 변환계수들 및 측면정보로 디포맷하며, 인코딩되지 않은 변환계수들을 수신하고, 계수들을 시간영역으로 변환시키는데 요구되는 계산을 수행하며, 계수들을 시간영역 블록들로 분류하고, 블록들을 합성윈도우 함수(만약 인코더/디코더에서 사용된 이산변환이 합성윈도우의 사용을 필요로 하지 않을 경우 합성윈도우 기능은 수행될 필요가 없다)로 무게화하여, 블록들을 디지탈 샘플들의 시간영역 순차신호로 중복가산하고, 그리고 질력비트 스트립내의 디지탈 샘플들을 DAC 212으로 전송한다. DSP에 대한 프로그래밍 및 데이터작업 영역은 정적 RAM 209에 저장된다. EPROM 21은 디코더가 처음으로 '온'될 때 DSP가 이용가능한 형태로 RAM 209에 언팩하는 프로그래밍 및 정적 데이터를 압축된 포맷으로 저장한다. DAC 212는 DSP로 부터 수신되는 직렬데이타 스트립에 대응하는 아날로그 신호를 발생시킨다. LPF 213A는 신호출력 213이 인코더/디코더 처리에 의해 생성된 어떠한 스퓨리어스 고주파성분(spurious highfrequency components)에 의해 영향받지 않게 해준다.

제2e도는 DSP 208는 직렬통신 인터페이스, 직렬신호 입력경로 207 및 DAC 212을 나타낸다. 타이밍 발생기 208A은 인코딩된 직렬비트 입력신호로 부터 타이밍기준 신호를 뽑아내기 위하여 위상동기 루프회로를 사용하며, 수신클럭과 단어동기 신호를 발생하며 클럭신호를 디코더에 전송한다. SCO라인은 라인 STD을 따라 DSP 208로부터 DAC 212로 공급되는 디코딩된 디지탈화된 신호 샘플들의 직렬비트 스트립을 크럭킹한다. 라인 SC2는 DAC과 OSP에 각각의 16비트어의 시작을 표시하는 단어동기 신호를 공급한다. DSP 208와 메모리어드레스 버스사이의 인터페이스는 전술한 인코더에서와 같은 방법으로 이루어진다. 제2c도 참조.

인코더의 2채널 실시예는 제3a도에 나타난 바와 같이 연결되는 LPF 200A와 200B, 그리고 ADC 201A와 201B를 필요로 한다. DSP와 ADC 구성들 사이의 인터페이스는 전술한 단일채널 인코더에서와 유사한 방법으로 동작한다. 타이밍발생기 202A는 멀티플렉서 202B를 제어하기 위하여 DSP의 라인 SC2으로 단어동기신호의 1/2비율로 부가신호를 공급하며, 2개의 ADC로부터 DSP로 현재 디지탈화된 데이터가 전송되고 있음을 표시해준다.

디코더의 2채널 실시예는 DAC 212A와 212B, 그리고 LPF 213A와 213B가 제36도에 나타난 바와 같이 연결되는 것을 필요로 한다. DSP와 DAC 구성들 사이의 인터페이스는 전술한 단일채널 디코더에서와 유사한 방법으로 동작한다. 타이밍발생기 208A는 디멀티플렉서 208B를 제어하기 위하여 DSP의 라인 SC1으로 단어동기신호의 1/2배율로 부가신호를 공급하며 2개의 DAC로 부터 DSP로 현재 디지탈 데이터가 전송되고 있음을 표시해준다.

윈도우잉 또는 고속 푸리에 변환(FFT)와 같은 어떤 기능들을 수행하기 위하여 특정하드웨어가 사용될 수 있다. 인코더/디코더 전체회로는 커스템 설계의 집적회로로 이루어질수 있다. 여러 가지 다른 수행방법이 해당기술 분야의 기술자에 의해 이루어지게 된다.

[B. 입력신호 샘플링 및 버퍼링]

본 발명의 실시예에 있어서, 제1a도에 도시된 신호샘플러 및 양자화기106는 입력신호를 24비트의 정수표시를 하기 위하여 우측에 8개의 0비트들이 추가로 채워지는 16비트의 신호로 양자화하는 아날로그-디지탈 컨버터이다. 모든 이후의 변환계산은 24비트 정수계산으로 이루어진다. 아날로그 입력신호는 제1a도에 블록 104으로 도시된 LPF에 의해 그 대역폭이 제한된다. 본 발명의 실시예에 있어서, 이 필터의 공칭 커트오프 주파수는 20㎑이다.

적어도 다른 품질과 함께 컴팩트디스트(CD)의 음질을 갖는 음악신호는 20㎑의 대역폭을 갖는다. 나이키스트 원리로부터 20㎑의 대역폭을 갖는 신호는 40㎑ 보다 작지 않게 샘플링되어야 한다는 것이 알려져 있다. 44.1㎑의 샘플링 비율은 이 비율이 CD응용분야에 사용되고 있으며, 이에 따라 본 발명을 사용하는데 필요로 하는 수단을 단순화시켜주기 때문에 본 발명의 일실시예에서 선택된다.

많은 전문오디오 응용분야에서 공통적인 비율인 48㎑와 같은 다른 샘플링 비율이 이용될 수도 있다. 다른 샘플링비율이 선택될 경우, 인접한 변환계수들 사이의 주파수분리가 변하고 원하는 신호대역폭을 나타내는데 필요한 계수들의 수가 변화될 것이다. 샘플링 비율에서의 변화가 본 발명에서 이루어졌을때의 전체적인 효과는 해당기술분야의 기술자에게 명백하다.

[Ⅱ. 발명의 바람직한 실행]

A. 분석필터뱅크-정방향 변환]

내부의 상세한 구성은 제1a도에 블록 116으로 표시된 디지탈 필터뱅크 기능을 수행하기 위해서 사용된 이산변환의 선택에 의해 좌우된다. 여러 가지 변환기술의 하나가 필터뱅크를 이루기 위하여 사용될 수 있다. 본 발명의 실시예에서 사용된 변환기술은 최초로 Princen 과 Bradley 저의 시간영역 위신호 소거에 근거한 필터뱅크 설계 (IEEE Trans. on Acoust., Speech, Signal Proc., vol Assp-34, 1986, 1153-1161 페이지)에 기재되어 있다. 이 기술은 짝수적충의 임계적으로 샘플링된 단일-사이드밴드 분석-합성시스템과 등가인 시간영역이 된다. 이 변환을 여기서 짝수 적층의 시간 영역위신호소거(E-TDAC)라 한다. 이 TDAC 변환의 다른 형태가 본 발명의 다른 실시예에서 사용될 수 있다. 이 기술은 Princen, Johnson 및 Bradley 저의 시간영역위신호소거에 근거한 필터 뱅크설계를 사용하는 서브밴드/변환코딩 (ICASSP 1877 Co nf. Proc. 1987년 5월, 2161-64 페이지)에 기재되어 있다. 이 변환은 홀수 적충의 임계적으로 샘플링된 단일-사이드밴드 분석-합성시스템과 등가인 시간영역이 된다. 이것을 여기서 짝수 적층의 시간영역위신호소거(O-TDAC)라 한다.

고속푸리에 변환(FFT)으로 이루어지는 O-TDAC 변환과 이산푸리에변환(DFT)과 같은 다른 변환들을 사용하는 본 발명의 실시예들은 E-TDAC 실시예를 충분히 설명한후에 기술된다.

E-TDAC은 변형된 이산사인변환(DST)과 함께 변형된 이산코사인변환(DCT)의 선택적인 적용과 등가인 변환기능을 이용한다.

방정식 1,2에서 DCT와 DST는 다음과 같다.

여기서, k=주파수계수의수,

n=입력신호 샘플수,

N=신호샘플 블록길이,

m=E-TDAC에 대한 위상항목,

x(n)=샘플n에서의 입력신호 x(t)의 양자화 값,

C(k)=DCT 계수 k, 그리고

S(k)=DST 계수 k, 이다.

E-TDAC 변환은 각 신호샘플블록에 대한 두벌의 스펙트럼 성분들 또는 변환블록들중에서 선택적으로 한벌을 발생시킨다. 이 변환블록들은 다음의 형태로 된다.

여기서, i=신호샘플블록수,

C(k)=DCT 계수(방정식 1참조), 그리고

S(k)=DST 계수(방정식 2참조)이다.

Princen과 Bradley는, 적당한 위상성분 m(방정식6참조)과 세밀하게 설계된 분석-합성 윈도우쌍으로서 E-TDAC 기술은 다음형태의 고정길이 코사인 및 사인 변환블록들의 교번 순차로 부터 입력신호를 정확하게 복구할 수 있다.

여기서, 각 변환블록은 하나의 시간영역 신호샘플블록을 나타낸다. 이 처리는 제4a-4d도, 5a-5d도 및 6a-6g도에 도시되어 있다.

제4a도를 참조하면, 양자화된 입력신호 x(t)가 블록도로 분류되는 것을 볼 수 있다. 제4b도에 나타난 윈도우 함수 Wc에 의해 무게화된 한벌의 블록들은 제4d도에 도시된 신호x_c(t)를 발생시킨다. 신호x_c(t)는 DCT로 입력된다. 1/2블록길이로 제1벌을 중복시키는 또다른 한벌의 샘플링된 입력신호 x(t)의 블록들은 제4c도에 도시된 윈도우 함수 Ws(이 윈도우함수는 Wc와 동일하나 시간적으로 1/2블록길이만큼 시프트된다)에 의해 윈도우잉되어 제4e도에 도시된 신호 x_s(t)를 발생시키며, 그후 DST로 입력된다.

오직 선택적으로 DCT 및 DST 변환블록들을 사용하는 것은 변환 블록들의 버려진 1/2부분에 포함된 정보의 손실을 가져온다. 이 손실은 시간영역 위신호성분을 발생시키게 되나, 왜곡은 방정식 1,2에 대하여 적당한 위상항목을 선택하고, 중복된 시간영역 신호샘플블록들을 정방향 변환시키며, 역반환에 의해 복구된 인접한 시간영역 신호샘플블록들을 가산시킴에 의해 소거될 수 있다.

방정식 1,2에서의 위상 항목 m은 시간영역 위신호왜곡의 위상 시프트를 제어한다. 제5a-5d도 및 제6a-6g도에 이와 같은 왜곡이 도시되어 있다. 역 DCT로부터 복구된 신호 x_c'(t)가 제5a도에 도시되어 있다. 제5a도는 복구된 신호가 윈도우된 본래의 신호(실선)과 시간영역 위신호왜곡(점선)의 2개의 성분으로 구성됨을 나타낸다. 제5c,5d도는 역DST로부터 복구된 신호 x_s'(t)에 대한 유사한 정보를 나타낸다. 이와 같은 위신호왜곡을 소거시키고 정확하게 본래의 시간영역신호를 복구하기 위하여 E-TDAC는 다음과 같은 위신호를 필요로 한다. DCT에 있어서, 시간영역 위신호성분은 샘플블록의 1/4점 부근에서 시간적으로 반전된 샘플링된 신호의 첫번째 1/2부분과 샘플블록의 3/4부근에서 시간적으로 반전된 샘플링된 신호의 두번째 1/2부분으로 이루어진다. DST에 있어서, 위신호성분은 그 진폭의 부호가 반전되는 것외에는 DCT의 위신호성분과 유사하다. 제5b,5d도를 참고할 것. 위신호 소거에 요구되는 위상항목은 다음과 같다.

여기서, N=신호샘플블록길이이다.

E-TDAC는 또한 중복된 신호샘플블록들에 한쌍의 주의깊게 설계된 분석-합성 윈도우들을 적용시키는 것을 필요로 한다. 신호샘플블록들은 100%의 중복, 즉, 주어진 블록의 50%가 이전의 블록에 의해 중복되고, 같은 블록의 50%는 다음 블록에 의해 중복된다. 제6a-6g도는 신호샘플블록들의 중복과 이에 따른 위신호왜곡의 소거를 나타내고 있다. 역DCT 및 DST에 의해 복구된, 제6a,6d도에 도시된 신호들 yc(t),ys(t)는 제6c,6f도에 도시된 신호들 y'c(t), y's(t)를 발생시키기 위하여 제6b,6e도에 도시된 윈도우 함수 Wc(t), Ws(t)에 의해 각각 무게화된다. 이들 윈도우된 신호들의 중복된 블록들이 가산될 때, 위신호성분들이 소거되고, 이에 따라 제6g도에 도시된 신호y(t)는 본래의 입력신호 x(t)의 정확한 복구물로 된다.

합성처리동안 사용된 윈도우설계 및 중복가산은 아래에 더욱 상세히 설명된다. 이점에 있어서는, 변화블록들의 반응 빼는 것이 요구되는 비트율을 반감시키나 신호합성동안 E-TDAC에 요구되는 100%의 윈도우 중복이 요구되는 비트율을 배로 늘리게 된다.

E-TDAC에 사용되는 계산 알고리즘은 고속푸리에 변환(FFT)이다. Cooley와 Tukey 저의 복합푸리에 급수의 기계적 곌산을 위한 알고리즘 (Math. Comput. 19권, 1965년, 297-301페이지)를 참고할 것. 하나의 FFT는 하나의 복합변환의 실수 및 허수 성분으로서 각각의 블록을 설정함에 의해 같은 길이의 신호샘플블록들의 변형 DCT 및 변형 DST를 동시에 수행하는데 사용될 수 있다. 이 기술은 FFT의 산출물과 복합상수의 배열로 인수분해함으로서, DCT계수들이 한벌의 실수값으로 FFT로 나타나고, DST계수들은 한벌의 허수값들로서 표시된다. 따라서, 하나의 신호샘플블록의 DCT는 복합배열 곱셈 및 합셈을 좇는 오직하나의 FFT에 의해 동일한 길이의 다른 신호샘플블록의 DST와 함께 동시에 계산될 수 있다.

2개의 변환을 동시에 계산하기 위하여 하나의 FFT를 사용하는 기본기술은 공지된 것으로서, Brigham의 고속푸리에 변환(Englewood Cliffs, NT: Prentice-Hall, Inc., 1974)에 기재되어 있다. E-TDAC 변환을 위한 변형 DCT 및 변형 DST 의 동시적인 계산에 대한 부가정보는 Lookabaugh의 음성의 가변비 및 적응주파수영역벡터양자화(Stanford, CA: Stamford University, Pho Thesis, 1988년 6월)에 나타나 있다.

본 발명의 단일채널 비젼의 실시예에 있어서, 2개의 인접된 중복 최대길이의 신호샘플 블록들은 버퍼에 저장되고, DCT/DST 블록쌍들로 함께 변환된다. 제7as에 나타난 바와 같이 이 블록쌍이 하나의 프레임을 구성한다. 프레임 내의 양블록들은 이후 전송 또는 저장을 위해 양자화되고 포맷된다.

2채널 시스템에 있어서, 동시적인 블록변환은 2채널 각각으로 부터 최대길이의 신호샘플블록을 처리함에 의해 계산될 수 있다: DCT블록이 하나의 채널에 대하여 발생되고, DST 블록이 2번째 채널에 대하여 발생된다. 이 블록쌍이 하나의 프레임을 구성한다. 제7b도를 참조할 것. 주어진 채널에 대한 코딩된 블록들은 DCT와 DST 사이에서 선정되며, 언제나 다른 채널의 블록들과는 반대의 형태를 취한다. 프레임내의 양블록들은 함께 변환되고 포맷된다.

그러나 본 발명의 실시예에 있어서, 정방향변환의 동시적인 처리는, 본 발명이 신호샘플블록길이, 분석윈도우 또는 분석-합성윈도우쌍, 그리고 변환을 적정하게 선택하기 때문에 더욱 복잡하다. 아래에 설명하는 바와 같이, 블록길이의 적정한 변화는 또한 정방향 변환의 위상항목(방정식 6참조)과 변환길이의 변화를 필요로한다. 블록길이들 사이의 전환에 사용될수 있는 기본적인 방법은 다음에 설명된다.

[B. 산호분석 : 과도현상검출]

본 발명의 실시예에 있어서, 제1a도 내의 블록 110으로 표시된 과도신호검출기는 과도현상검출 입력신호분석을 위한 특정기능을 수행하게 된다. 과도신호검출만을 이용하는 실시예는 다른 실시예들로서 다른 형태의 신호분석이 설명되기전에 설명될 것이다.

과도신호 검출기는 진폭상의 충분히 큰 변화가 검출될 때, 이와 같은 진폭상의 신속한 변화에 대하여 입력신호를 모니터 하고 짧은 신호 샘플블록들을 선택하게 된다. 전술한 바와 같이, 양자화 오차는 이산변환코더가 전체 신호샘플블록 간격을 통한 과도신호들의 스펙트럼 성분을 스미어(smear)하는 원인이 된다. 예를들어, 제8a,8b,8b도를 비교할 것. 이들 도면에 나타난 신호그래프는 과도신호 이전의 '로우'레벨신호를 명확하게 나타내주고 있다. 과도신호의 극단적인 진폭은 그래프의 영역을 벗어나며 따라서 도시되지 않는다. 제8a도는 변환코딩전에 본래의 신호를 나타낸다. 제8a도는 512 샘플블록 길이를 사용하는 비적응 블록길이 변환코더에 의해 복구된 신호를 나타낸다. 과도신호의 고주파성분은 전 샘플블록을 통해 음악신호를 변조시킨다.

이 왜곡은 짧은 블록내에 포함되며 과도신호에 의해 심리음향적으로 마스킹 되기 때문에 짧은 신호샘플블록들을 사용하는 코더에서는 지장을 주지 않는다. 과도 신호검출기는 더욱 짧은 블록이 과도신호 왜곡 변형의 시간적, 심리음향적 마스킹의 보장을 위하여 필요하다고 정해질 때, 짧은 블록길이를 적정하게 선택함에 의해 불충분한 변환필터 뱅크대신 높은 시간적 분해능을 선택할 수 있다. 제8b, 8c도에서의 비교가 이 효과를 나타내고 있다. 제8c도에서, 과도신호이전의 고주파 왜곡 성분은 본 발명의 실시예에 의해 복구된 샘플블록을 사용하는 코더에 대한 경우보다 256 샘플블록으로 시프트 되어 있다. 감소된 필터뱅크 선택도는 불충분한 필터뱅크 수행이 과도신호에 의해 마스킹되기 때문에 일반적으로 과도신호를 포함하는 신호 샘플 서브블록내에서는 문제가 되지 않는다. 그러나, 감소된 코더 수행은 과도신호를 포함하는 블록의 이전 또는 이후의 짧은 서브블록안에서 청취가능할 수 있다. 따라서, 코더가 짧은 블록길이를 이용하는 기간을 최소화하는 것이 중요하다.

과도신호 검출기의 실시예는 4개의 회로부로 구성된다. 제1회로부는 과도신호 검출처리로부터 저주파성분들을 제외시키는 고역통과필터(HPF)이다. HPF는 4차 순환 디지탈 필터로서 이루어진다. 제9도에서 도시된 필터는 다음의 방정식 7,8에 나타난 바와 같이 한쌍의 다른 방정식으로 표현될 수 있다. 등가전달함수는 방정식이 9와 같다.

HPF 커트오프주파수는 1024 샘플최대블록길이를 갖는 본 발명의 실시예에서 2㎑이다. 커프오프주파수는 청취테스트에 의해 실험적으로 설정된다. 각 방정식에 대한 계수값들은 표 1에 나타나 있다. 512샘플의 최대블록길이를 갖는 본 발명의 실시예에서는 4㎑의 커트오프주파수를 갖는 HPF를 사용한다. 이 필터 커트오프주파수에 대한 계수들은 표 2에 나타나 있다.

과도신호검출기의 제2회로부는 고역통과된 신호샘플들을 계층서브프레임(hierachical Subframe)의 서브블록들로 분할한다. 본 발명의 실시예에 있어서, 3가지 레벨의 계층이 사용된다. 제10도를 참조할 것. 1024 샘플최대 길이블록의 반이 레벨1에 위치된다. 레벨2에서, 신호샘플블록의 반이 각각 256 샘플의 2개의 서브블록들로 분할된다. 레벨 3에서, 신호샘플블록의 반은 각각 128 샘플의 4개의 서브블록들로 분할된다. 일반적으로, 서브블록 길이는 다음식으로 표시될 수 있다.

여기서, Nj=0레벨 j상의 서브블록길이, N=최대길이의 신호샘플블록의 길이, 그리고 M=분할계층내의 레벨수이다.

과도신호검출기에서 레벨0이 사용되지 않지만, 개념적으로 최대길이의 신호샘플블록을 나타낸다. 따라서 No=N이다.

과도신호검출기의 제3회로부는 피크진폭검출기이다. 최대진폭을 갖는 시간영역신호 샘플은 현 서브프레임 내에서 모든 계층레벨만의 각 서브블록에 대하여 동일하다. 서브블록의 최대진폭은 다음식으로 표시된다.

여기서, x_n=N/2 샘플수만큼 긴 서브블록의 n번째 신호샘플,

j= 서브프레임 계층레벨수,

k= 레벨 j내의 서브블록수, 그리고

N=최대길이 샘플블록의 길이이다.

기호 P_jo는 현재의 서브프레임내의 레벨 j에서의 첫번째 서브블록 바로 이전의 서브프레임 내의 레벨 j에서의 마지막 서브블록의 피크진폭을 나타내는데 사용된다. 제11도 참조. 예를들어 이전의 서브프레임에서의 P₃₄는 현 서브프레임에 대한 P₃₀으로 표시된다.

과도신호검출기의 제4회로부는 한계 비교기이다. 이 회로단의 제1단은 과도신호검출기가 오직 낮은 진폭신호들이 통과하는 동안 블록 길이들을 변화시키는 것을 방지하여 준다. 이것은 피크값 P₁₁이 침묵한계(silence threshold) Ts를 초과하지 않는, 모든 신호샘플블록들에 대한 최대 값으로 블록길이를 설정해 줌에 의해 달성될 수 있다. 이 한계는 다음과 같이 표시된다.

여기서, Xs=신호샘플들 Xn에 대한 포화값이다. 이 값은 신호샘플이 코더의 표시영역을 포과하기전에 도달할 수 있는 최대값이 된다. 예를들어, 포화값은 24비트 2진 정수 2의 보수표시에 대하여 8,388,607이 된다.

과도신호검출기의 나머지 부분은 피크값 P₁₁이 침묵한계를 초과하지 않을 경우 바이패스된다. 한편, 과도신호가 있을 경우에는 비교기가 샘플링된 신호안에 있는 과도현상에 대하여 적당한, 더욱 적은 신호샘플블록길이를 선택하게 된다. 이 비교기의 제2,3단에서 수행되는 처리는 개념적인 설명이 먼저 주어질 경우 더욱 쉽게 이해될 수 있다. 개념적으로, 제2단은 계층 서브프레임의 각레벨에서의 인접된 서브블록들의 피크진폭들 사이의 비율들을 계산한다. 이 비율들은 다음과 같이 표시된다.

여기에, j=서브프레임 계층레벨의 수, k=레벨j 내에서의 서브블록의 수, 그리고 R_jk=서브블록 피크진폭(방정식11참조)이다.

각 비율 R_jk이 2개의 한계값 T_Aj, T_Dj에 비교된다. T_Aj는 레벨j에 대한 어택 한계값을 나타내며, 언제나 1보다 크다. T_Dj는 레벨 j에 대한 디케이 한계값을 나타내며, 언제나 1보다 작다. 이들 한계에 대한 두벌의 값들이 표 3 및 4에 나타나 있다. 피크진폭의 비율이 이들 한계값중 어느하나를 거칠 경우, 과도신호검출기는 더욱 짧은 샘플블록길이를 선택하게 된다. 이 적응처리는 제3단계에 의해 수행되며 다음의 항에서 설명된다.

제3단을 설명하기 전에 표 3, 4에 나타난 한계값들 사이의 차이를 설명하는 것이 도움이 될 수 있다. 표 3의 한계값들은 라이징 및 폴링 과도현상을 동일하게 처리하는, 즉 진폭상의 특정증가시 진폭상의 어떤 감소시와 같이 같은 블록길이를 선택하게 되는 과도신호 검출기에 의해 수행된 것이다.

그러나, 표 4에 나타난 한계값들은 진폭상의 증가에 대하여 요구되는, 더욱 짧은 블록길이의 주어진 선택에 대하여 진폭상의 더욱 큰 감소를 필요로 한다. 이는 전술한 바와 같이 인간의 귀의 후단 과도현상 마스킹 간격이 일반적으로 그 전단과도현상 마스킹 간격보다 훨씬 길기 때문이다.

비교기의 제3단은 제12도에 나타난 것과 같이 2진값의 마디들로 이루어진 나무를 구성한다. 나무내의 각 마디는 현재의 서브프레임 내에서 선택될 수 있는 잠정적인 서브블록 길이를 나타낸다. 이 나무의 각마디 값들은 다음 식으로 설치된다.

여기서, j=서브프레임 계층레벨의 수,

k=레벨j 내에서의 서브블록의 수, 그리고

R_jk=서브블록 피크진폭비율(방정식13참조)이다.

이후, 나무의 각 마디가 변형된다. 1의 값을 갖는 각 마디에 대하여, 나무의 리프 마디(leaf nodes)(본 발명의 실시예에 있어서 레벨3인)로 시작될 때, 그 모마디(parent node)와 모든 형제마치(sibling node)도 또한 1호 정해진다.

비교기의 제2,3단의 실제적인 기능수행은 오직 수학적인 표현형태에 있어서, 전술한 개념적설명과 다르다. 방정식 13에 표현된 비율값은 P_j(kti)이 0일 때 정의지 않는다. 이 문제는 분할을 피하고 식14을 다음식과 같이 재 정의 함에 의해 해결된다.

여기서, j=서브프레임 계층레벨의 수,

k=레벨j 내에서의 서브블록의 수, 그리고

R_jk=서브블록 피크진폭(방정식11참조)이다.

나무를 구성하고 변형시키는 로직이 제13도의 플로우챠트에 도시되어 있다. 변형전후의 나무의 실예는 제14도에 나타나있다.

비교기의 제4단은 나무로부터 모든 0마디들을 제거시킨다. 만약, 나무가 0마디들 만으로 구성될 경우 과도신호 검출기는 제1a도에서 블록 114로 표시된 프레임 제어기가 가능할 경우 최대길이의 샘플블록을 사용하도록 허여된 것을 표시할 것이다. 그렇지 않으면, 나머지 리프마디들은 서브블록길이들을 설정하게 된다. 레벨j에서의 리프마디들에 대한 서브블록 길이는 방정식 10에서 정해진 것과 같이 Nj이다. 예를들어, 제14도를 참조하면, 제거처리후에 남아 있는 리프마디들은 t₃₁, t_32,및 t₂₂이다. 본 발명의 실시예에 있어서, 이들 서브블록 각각에 대한 길이는 제15도에 나타난 바와 같다. 제16도는 과도신호 파형을 포함하는 신호세그멘트에 대하여 선택된 서브블록 길이들의 실예를 제공한다.

E-EDAC 변환을 사용하는 본 발명의 실시예에 있어서, 과도신호 검출기에 의해 구성된 나무의 리프마디에 의해 표시된 서브블록 길이들의 합은 언제나 N/2개의 샘플들과 같다. 이 합계는 각각 과도신호검출기를 통과하는 동안 지나간 신호샘플들의 수와 같다. 결국, 과도신호 검출기는 오직 한 번 특정신호 샘플을 처리하여야 한다.

해당기술분야의 기술자에게 다른 과도신호검출 및 서브블록길이 선택계획이 본 발명의 범위 또는 요지에서 벗어나지 않는 상태에서 이용될 수 있음을 알아야 한다.

더욱이, 다음에 기술되는 본 발명의 실시예에서는, 윈도우함수 및 변환이 본 발명의 과도신호검출부분에 의해 설정되는 신호샘플블록길이에 따라 선택된다. 윈도우함수 또는 변환은 본 발명의 범위 또는 목적에서 벗어나지 않는 상태에서 과도신호 특성으로부터 직접 선택될 수 있다.

[C. 윈도우잉]

신호샘플블록이 변형되지 않을 경우, 블록안의 신호가 주기적이라는 전제 때문에 존재하지도 않는 스펙트럼 성분들을 잘못 생성하게 된다. 제17도 참조. 이 변환오차는 제18도에 나타난 바와 같이 블록단부에서의 불연속성에 기인한다. 이 불연속성은 이 효과를 최소화하기 위하여 제거될 수 있다. 제19a-19d도는 블록단부 근처의 샘플이 0에 가깝도록 블록을 변형 또는 무게화시키는 방법이 나타나 있다. 제19a도에 도시된 곱셈기 회로는 제19c도에 도시된 무게 함수에 의해 제19b도에 도시된, 샘플링된 입력신호 x(t)를 무게화한다. 그 결과 신호는 제19d도에 도시되어 있다. 이 처리는 제1a도 내의 블록 112로 표시된다. 이 무게화 함수는 분석윈도우로 불리며, 신호샘플블록의 샘플 대 샘플 곱셈이 된다. 전술한 바와 같이, 분석 윈도우들은 그 형태가 디지탈 필터기능에 많은 영향을 주기 때문에 많은 연구가 있어왔다. 대략적으로, 양호한 윈도우는 주어진 레벨의 정지대역 저지 깊이에 대하여 더욱 경사진 과도대역 롤오프를 허용하며, 그 무게화 효과의 수정을 허용한다. 윈도우 설계는 아래에 더욱 상세히 설명된다.

윈도우의 선택은 또한 과도신호 검출기에 의해 선택된 신호 샘플블록길이에 의해 영향을 받는다. 코더가 과도신호 상태에 있어서 신호샘플 블록길이를 적응시키기 때문에, 코더는 또한 적당한 형태에 따라서 신호샘플 블록길이를 적응시키기 때문에, 코더는 또한 적당한 형태와 길이를 갖는 분석 윈도우를 선택하여야 한다. 과도신호 검출기에 의해 선택된 신호샘플 블록길이에 대응하여 분석 윈도우를 선택하는 이와 같은 처리는 제1a도 내의 블록 114으로 표시된 프레임제어기에 의해 수행된다. 이 프레임제어기는 다음에 더욱 상세히 설명된다.

과도신호 검출기가 감소된 블록 길이를 필요로 하는 시점에서, 서브블록들에 대하여 선택된 윈도우는 그것이 대칭이 되거나 또는 그 양단부에서 0이 될 수 있기 때문에 전체 길이블록에 대한 위도우에서 얻을 수 있는 것 아래로 필터선택도를 떨어뜨릴수 있다. 전술한 바와 같이, 차선적인(Suboptimal)윈도우의 사용은 정방향 및 역방향 변환에서의 필터 선택도를 떨어뜨리게 하게된다. 그럼에도 불구하고, 다음과 같은 2가지 이유 때문에 차선적 윈도우가 선택되어야 한다: (1) 본 발명의 실시예에서 사용되는 이산 정방향 및 역방향 변환은 시간영역 위신호 왜곡을 소거시킬수 있도록 윈도우 형태상의 요구 사항이 부과된다. 그리고(2)복합분석/합성윈도우 형태는 인접된 중복 윈도우가 중복간격을 거쳐서 단일화 되도록 합해져야 한다.

주어진 윈도우 함수 W(바람직한 윈도우 함수는 아래에 더욱 상세히 설명됨)에 있어서, 부호 Wab는 0또는 0부근에서 시작되고 Na/2샘플들후에 1또는 1부근의 값으로 상승하며, 다시 Nb/2샘플들 후에는 0또는 0부근의 값으로 떨어지는 복합 윈도우를 표시하기 위하여 사용될 것이다. 윈도우 Wab의 전체길이는 다음식으로 표시될 수 있다.

여기서, 부호 Nx=레벨x에서의 서브블록길이(방정식 10참조)이다. 윈도우 Wab는 a와 b가 같을 경우 대칭이 된다. 이 부호와 함께, 최대길이의 신호샘플블록을 무게화하는데 사용되는 전체길이 윈도우는 Woo로 표시된다. 0또는 0부근의 값에서 시작되며, Na/2 샘플들후에 1 또는 1부근의 인코딩 값으로 상승하는 부분적 윈도우는 부호 Wa⁺로 표시된다. 1또는 1부근의 값에서 시작되며, Na/2 샘플들후에 0또는 0부근의 인코딩 값으로 떨어지는 부분적 윈도우는 부호 Wa^-로 표시된다.

윈도우족이 제20도에 나타나있다. 예를 들어, 윈도우 Woo는 윈도우 W_o ⁺, W₃ ^-의 결합에 의해 표시된다.

[D. 프레임 제어]

제1a도내의 블록 114는 과도신호 검출기의 출력에 따라 분석 윈도우의 선택과 변환 선택을 제어하는 처리단들을 나타낸다. 이들 처리단들은 신호 프레임을 처리하는데 필요한 활동능력을 제어하며, 이에 대하여는 아래에 기술된다. 하나의 FFT로서 동시적인 변환을 수행하기 위한 고려점들이 개략적으로 설명된다.

[I. 고정프레임 정렬]

E-TDAC 변환을 사용하는 본 발명의 실시예에 있어서, 고정프레임정렬(FFA)은 전체길이의 신호샘플블록 쌍들은 물론 서브블록 쌍들에 대한 변환의 동시적인 처리를 가능하게 한다. FFA는 일정한 길이 프레임을 발생시키며, 따라서 프레임 경계들의 정렬이 고정 또는 동기된다. 그러나, FFA는 최대신호샘플블록길이의 ½이 되는 서브블록길이들을 선택하도록 제한된다.

따라서, FFA용의 과도신호검출기가 전술한 바와같은, 계층서브프레임이 오직 하나의 레벨을 갖는 과도신호 검출기보다 더욱 간단해진다.

제21a-21c도는 단일채널시스템내의 윈도우된 신호샘플블록들의 순서를 나타낸다. 블록 A,B는 하나의 FFT에 의한 동시적으로 변환된 2개의 구획을 나타낸다. 블록 C,D는 과도현상발생에 의한, 더욱 짧은 블록길이가 선택되지 않을 경우 동시적으로 변환된다.

21a도에 의하면, 과도현상이 블록 c의 두번째 반쪽부분(서브블록 Cb 안의)과 블록 D의 첫번째 반쪽부분(서브블록 Da 안의)에서 발생한다. 코더는 오직 블록들 C,D안에서의 4개의 서브블록들에 대한 N/2 점 변환으로의 시프트를 필요로한다. 서브블록 Ca,Da에 대하여 사용된 윈도우는 Wo⁺이며, 서브블록 Cb,Db에 대하여 사용된 윈도우는 Wo^-이다. 윈도우 Wo⁺, Wo^-는 그 양단부에서 0으로 되지 않기 때문에 차선적인 것이 된다. 제22a도에 도시된 바와 같이, 차선적인 윈도우의 사용은 필터뱅크선택도에 있어서 심각한 강하를 야기시킨다. 과도신호를 포함하는 서브블록안의 더욱 불충분한 코더동작은 일반적으로 과도신호에 의해 마스킹되고, 상하된 동작은 과도신호를 포함하는 서브블록 전후의 더욱 짧은 길이의 서브블록안에서 청취가능하게 될 수 있다. 그러므로, 과도상태가 지나간 다음 가능한한 신속하게 최대길이의 신호샘플블록들을 재사용하는 것이 바람직하다.

위신호소거를 위해 FFA에서 2개의 다른 E-TDAC 변환의 위상항목이 요구된다. 제23a도는 인접블록들의 중복가산에 의해 시간영역 위신호가 소거되기 전에 역변형 DCT 및 역변형 DST에 의해 복구된 2개의 인접 중복된 전체길이의 신호샘플블록들이 나타나있다. 복구된 신호는 윈도우된 본래의 신호(실선)와 시간영역 위신호왜곡(점선)의 2개의 성분으로 이루어진다. 위신호성분은 윈도우된 본래의 신호의 시간반전 복제물이되나, 시간반전은 2개의 별도영역에서 발생한다. E-TDAC 변환(방정식 1,2참조)에 있어서의 위상항목은 이들 두영역 사이의 경계의 위치를 제어한다. 정상의 E-TDAC에서, 경계는 신호샘플블록의 중간지점에 위치된다. 요구되는 위상항목은 방정식 b에 나타나있다.

제23b도에는 FFA를 사용하는 본 발명의 실시예에 의해 복구되며, 더욱 짧은 서브블록길이로 시프트되는, 2개의 인접중복된 변환블록들이 나타나있다. 전체길이블록은 역변형 DCT에 의해 복구된다. ½ 길이블록은 역변형 DST에 의해 복구된다. DCT 블록내의 위신호성분은 전의것과 같다. 그러나, 인접한 블록들의 중복가산에 의해 위신호를 소거시킬 경우 첫번째 DST 서브블록내의 위신호성분이 완전하게 시간반전된 끝과끝이 일치되어야 한다. 따라서,서브블록에 대하여 다른위상항목이 요구된다. 위신호성분의 끝과끝이 일치되는 반전이 모든 서브블록들에 대하여 요구된다. 적당한 위상항목은 다음과 같다.

위상항목은 더욱 일반적인 형태로 기재될 수 있다.

여기서, =샘플블록의 오른쪽 또는 후단으로부터의 샘플들의 수로 표시되는, 시간반전 영역들 사이의 경계위치이다. 이 방정식은 FFA에서 요구되는 것보다 더욱 일반적인 경우의 표현이되나, 아래에 기술되는 다른 프레임제어기술에 대하여 필요하다.

예를들어, 제23c도는 2개의 서브블록들로 나누어지며 2개의 윈도우에 의해 무게화된 하나의 샘플블록을 나타낸다. 오른쪽 서브블록과 윈도우는 N/4 샘플들의 길이를 갖는다. 이 서브블록안에서, 영역들사이의 경계는 서브블록의 오른쪽 또는 후단으로부터 N/8 샘플들의 지점에 있게된다. N/4 샘플서브블록의 각영역안의 위신호성분의 시간반전을 일으키기에 요구되는 위상항목은 다음과같다.

여기서, N=최대신호샘플 블록길이이다.

제21a도에 도시된 실예에 있어서, 하나의 FFT가 서브블록 Ca에 대한 DCT와 서브블록 Da에 대한 DST를 동시적으로 처리하기 위하여 사용될 수 있다. 마찬가지로, 하나의 FFT가 서브블록 Cb에 대한 DCT와 서브블록 Db에 대한 DST를 동시적으로 처리할수도 있다. 최대길이 블록들의 동시적인 처리는 블록 E,F에 대하여 재개될 수 있다.

제21b도에 도시된 실예는 제21a도에 도시된것과 조금다르다. 제21b도에 도시된 과도현상은 블록 D의 두번째 반쪽에서(서브블록 Db 안의) 발생한다. 이 경우에 있어서, 하나의 FFT에 의한 동시적인 변환처리는 더욱 짧은 서브블록 길이가 제21a도에 도시된 경우보다 더욱 긴 간격동안 사용되는 것을 필요로한다. 따라서 강하된 필터뱅크 선택도에 의해 야기되는 불충분한 코더동작이 더욱긴 간격동안 이루어진다. DCT/DST 블록 쌍들은 서브블록 쌍들 Ca/Da, Cb/Db, Ea/Fa, Eb/Fb에 대하여 동시적으로 처리될 수 있다. 최대길이 블록들의 동시적인 처리는 블록 G,H(블록 G,H는 도시되지 않음)에 대하여 속행된다. 위신호소거를 위해 E-TDAC에서 요구되는 서브블록에 대한 위상항목은 전술한 방정식 16에서와 같다.

제21c도에 도시된 과도현상의 위치는 제21b도에 도시된 것과 같으나, 그 처리순서는 조금 다르다. 제21c도에 도시된 실예에 있어서, 전체길이 블록c은 홀로 변환된다. 써브블록 쌍들 Da/Ea, Db/Eb은 동시적으로 변환된다. 최대길이 블록들의 동시적인 처리는 블록 F,G에 대하여 속행되나, 블록쌍의 이전블록은 이제 DST에 의해 변환된다. 이 순서에 의해 본 발명의 실시예가 더욱 신속하게 최대블록길이 코딩을 속행하게 되나, 블록 C-F을 변환시키는데 요구되는 계산의 수가 고정길이 블록들에 대한 동시적인 변환을 이용하는 순차적 코딩에서 요구되는 수보다 약 20% 크기 때문에, 더욱 빠른 처리가 필요하다.

[2. 증가 고정프레임 정렬]

본 발명의 실시예에서는 고정 또는 동기 프레임 정렬을 발생시키는 증가 고정프레임 정렬(EFA)라 칭하는 기술을 사용하나, 최대 신호샘플 블록길이의 야수의 2배가 되는 서브블록 길이들의 상용이 허용된다. 본 발명의 실시예에 있어서, EFA 기술은 1024, 512, 256, 128 샘플수의 신호샘플 블록길이를 사용할 수 있다(아래에 나타난 바와같이, 어떤 경우에는 64 샘플 블록길이도 또한 사용될 것이다). 실제적으로, 약수들의 2배로 되는 길이 상의 제한이 매우 한정적이지는 않으며, 이는 이산변환의 FFT 동작이 2배인 블록 길이에 대하여 더욱 효과적으로 수행되기 때문이다.

EFA가 충분하게 기술되기전에 브릿지변환(bridge transform)의 개념을 소개하는 것이 필요하다. 브릿지변환은 하나의 신호샘플 블록길이로부터 다른 하나로 시프트를 브릿지하는 변환이다. 예를들어, 제24도에서와같이, 본 발명의 N/4 샘플수의 다른 서브블록을 뒤따르는 N/2 샘플수의 서브블록을 처리하도록 요구된다고 가정한다. 각 서브블록에 대하여 별도의 변환을 수행하는 것이 가능할 것이다. 그러나, N/2 서브블록이 Wo⁺에 의해 윈도우되며, N/4 서브블록이 W₁ ^-에 의해 윈도우되는 것을 주목하자 이들 양 윈도우는 명백히 차선적인 것이며, 필터선택도에 있어서 심각한 강하를 야기시킨다. 예로서, 제22a도를 참조한다.

브릿지변환을 W_j ⁺와 W_j ^-형태의 윈도우의 사용을 피함으로서 필터선택도 강하를 최소화한다. 제24도에 도시된 실예에 있어서, 브릿지변환은 별도의 W_o ⁺및 W₁ ^-윈도우를 각각 사용하는 2개의 변환이 요구되기보다는 하나의 W₁윈도우를 사용하는 하나의 변환을 허용한다. 효과적으로, 브릿지변환은 3N/4 샘플수의 하나의 서브블록을 변환한다. 제22a,22b도를 비교하여 나타난 바와같이, W₀₁윈도우에 대한 필터응답곡선은 윈도우 함수 W_o ⁺또는 다른 부분적 윈도우에 대한 필터응답곡선에 비하여 월등하다.

제24도는 또한 시간영역 위신호소거를 위하여 브릿지 변환에 의해 요구되는 시간반전 영역들을 나타낸다. 시간반전 영역들 사이의 겨예는 브릿지변환에 의해 변환될 신호샘플들을 포함하는 두 개의 서브블록들의 공동단부들에 있다. 이 경계는 2개의 브릿지된 서브블록들의 우측단부로부터 샘플수의 곳에 위치한다. 따라서, 방정식 17으로부터 N/2 대 N/4 브릿지변환에 대하여 요구되는 위상항목은 다음과 같이 나타난다.

여기서, N=최대신호샘플 블록길이이다.

제24도에 도시된 단일 브릿지변환은, 재결합 동작에 의해 계속되는 서브블록들에 대한 변환을 계산하기 위하여 FFT를 사용함에 의해 계산될 수 있다. 이 기술은 해당기술분야에서 잘 알려져 있다. Oppenheim과 Schafer의 디지탈신호처리(Englewood Cliffs, N.J. : Prentice-Hall, Inc., 1975년, 307-314 페이지)를 참고할 것. 이 재결합 동작을 사용될 수도 있다. 동시적인 처리를 위해 요구되는 전후 처리는 정상 전체길이 E-TDAC 변환에 대하여 Brigham과 Lookavaugh에 의해 제시된것과 같은 브릿지변환에서와 동일하다. 그런, E-TDAC에서의 동시적인 처리는 오직 같은 길이와 같은 위상항목을 갖는 변형 DCT 및 변형 DST에 대하여만 가능하다는 것을 조목하는 것이 중요하다.

동시적인 처리는 본 발명의 실시예에서 더욱 늦은 처리기를 사용하는 것을 허용하기 위하여 종종사용된다. 그러나, EFA를 사용하는 본 발명의 단일채널버젼에 대하여 동시적인 처리를 사용함에 얻어지는 장점은 거의 없다. 동시적처리를 사용하는 실시예를 위하여 선택된 처리기는 최악의 경우의 단일 과도현상의 사고를 처리할 수 있어야 한다. 모든 전체길이 블록의 개별적인 변환은 최악의 경우의 단일 과도현상사고를 처리하는 변환 작업보다 조금더 처리기의 작업부하가 걸리게된다. 따라서, 동시적인 처리의 EFA를 사용하는 본 발명에서 요구되는 것보다, 동시적인 처리를 하지않는 EFA를 사용하는 본 발명의 단일채널버젼을 수행하기 위하여 좀더 빠른속도의 처리기가 필요하다.

동시적인 처리는 양채널이 같은 블록길이를 사용하여 코딩될 경우 2채널 시스템에서 장점을 가질 수 있다. 이것은 하나의 2진 나무로부터 양 채널에 대한 서브블록길이를 선택함에 의해 이루어질 수 있다. 이 나무는 2개의 개별적인 나무들, 즉 자체 과도신호검출기를 통해 각 채널을 처리하여 얻어진 각각의 나무에서 해당마디들을 부울(Boolean)처리 또는 결합시킴으로서 구성된다.

EFA에 대한 다음의 설명은 본 발명의 단일채널 실시예를 포함하며 동시적인 처리가 수행되지 않는 것을 가정한다.

제26a-26f도에 도시된 플로우챠트는 DFA에 대한 프레임제어처리를 제어하는데 사용될 수 있는 조직 플로우를 나타낸다. 개략적인 처리과정은 제26a도에 나타나 있다. 블록 2600으로 표시된 초기화단계는 제26b도에 도시되어 있다. 처리구조는 4개의 주요부분들로 이루어진다.

제26c도에 도시된 프레임제어의 제1부분은 서브블록길이를 설정하는 것이다. 하나의 큐(queue)는 어떤 과도신호검출기의 2진 나무마디들이 처리되지 않았는가를 정하기 위하여 검사된다. 만약 처리되지 않았으면, 과도신호검출기는 다음의 신호샘플들을 처리하고, 전술한 바와같이 2진 나무를 구성하며, 상기 큐에 각 리프마디의 레벨이 주어진다. 처음입력은 큐로부터 제거되고 J₁로 배당된다. 이 값이 현재의 서브블록에 대하여 원하는 길이를 설정하게된다. 심볼 J₀는 이전의 서브블록에 대하여 원하는 길이를 설정한다. 만약, 과도현상이 검출되지 않을 경우, 과도신호검출기는 N 샘플수의 블록길이가 사용될 수 있음을 표시하며, 예를들어 J₁=0 일 때 인코더가 전체길이 블록처리를 속행하도록 허용되는지를 정하기위하여 플랙 PARTIAL이 검사되어야 한다. 만약, 그렇지 않을 경우 J₁은 샘플수의 서브블록길이를 설정하는 1의 값으로 된다.

제26도에 도시된 프레임제어의 제2부분은 요구되는 분석윈도우, 변환길이, 그리고 E-TDAC 위상항목을 설정한다. 선택된 윈도우는 W_xy이며, 여기서 x는 J₀의 값으로 생성되며 y는 J₁의 값으로 생성된다. 변환길이 및 위상항목은 제26d도에 도시된것과 유사한 유형으로 정해진다.

제3부분은 제26e도에 도시되어 있다. 이 부분은 플랙 TYPE를 검사함에 의해 요구되는 변화형태를 선택한다. 이 2진 플랙은 변형 DCT 또는 변형 DST가 수행되어야 하는지의 여부를 표시한다.

프레임제어의 제4부분은 제26f도에 나타나있다. 만약 J₀와 J₁이 둘다 0일 경우 전체길이 변환이 바로 수행되었음을 알 수 있다. 양플랙 PARTIAL, BRIDGE이 클리어된다. 만약, 그렇지 않으면 플랙 BRIDGE이 토글된다. 이러한 클리어/토글단계 바로이전에, 플랙은 정상의 또는 브릿지변환이 현재의 변환으로 사용되었는지의 여부를 표시하게된다. 플랙 type이 토글되고, 현 서브블록길이 J₁이 J₀에 할당된다.

제26a도에 도시된 바와같이 플랙 BRIDGE이 클리어될 경우, 다음의 서브블록길이를 얻음에 의해 제1부분에서 퍼리가 계속된다. 그렇지않을 경우, PARTIAL 플랙이 토글되고 제2부분에서 처리가 계속된다.

제25도에는 단일채널시스템에서의 윈도우된 신호샘플블록들의 순서가 도시되어있다. 블록c의 두 번째 반쪽부분과 블록 D의 첫번째 반쪽부분에서 과도현상이 발생한다. 이 서브프레임에 있어서 과도신호검출기에 의해 구성된 2진 나무가 제14도에 나타나있다. 각 서브블록에 대하여 지정된 대응길이가 제15도에 나타나있다. 코더는 W_o3윈도우를 갖는 9N/16 샘플수의 길이에 대한 브릿지변환을 먼저 사용하여 블록C를 처리한다. 다음에, N/8 샘플수의 길이에 대한 하나의 변환이 W₃₃윈도우에 사용된다. 다음에 3N/16 샘플수의 길이에 대한 브릿지변환 W₃₂윈도우에 사용된다. 블록C안의 나머지 N/8 샘플들은 블록E가 시작되는 다음의 서브프레임에서 브릿지변환처리되기 위하여 보존된다.

코더는 N/8 샘플수의 길이의 2개의 변환과 N/4 샘플수의 길이의 하나의 변환으로서 블록D의 첫 번째 반쪽을 변환한다. W₃₃윈도우가 양 N/8 샘플블록들에 대하여 사용되고, W₂₂윈도우가 N/4 샘플블록에 대하여 사용된다. 블록D의 두번째 반쪽은 W₁₁윈도우를 사용하는 N/2 길이변환에 의해 변환된다. D서브블록에 사용된 모든 윈도우들은 최적의 것들이다.

브릿지 변환과 비대칭 윈도우의 사용에 의해 E-TDAC가 방정식 17에 의해 계산된 위상항목을 사용함에 의해 시간영역 위신호를 소거시키게 된다. 이 순차적인 블록들에 대하여 요구되는 시간반전 영역들과 이에 대응하는 위상항목들은 제25도에 나타나있다.

[3. 다이나믹 프레임 정렬]

E-TDAC 변환을 갖는 다이나믹 프레임 정렬(DFC)는 짝수이며 4보다 크거나 같은 임의의 서브블록길이 L를 선택할 수 있으나, FFT에 의해 수행되는 본 발명의 실제적인 실시예는 최대신호샘플 블록길이의 약수의 2배인 서브블록 길이만을 사용한다. 이것은 FFT가 2배인 변환길이에 대하여 가장 효율적으로 수행하기 때문이다. DFA는 많은 경우 서브블록 쌍들에 대한 동시적인 변환처리를 허용하지 않지만, DFA는 코더가 과도상태가 지나간후 바로 최대길이의 신호샘플블록들로 되돌아가는 것을 허용함에 의해 FFA 또는 EFA에 가능한 것 이상으로 코더동작을 향상시킨다. 따라서, DFA는 일반적으로 가변길이의 변환블록 프레임들을 발생시킨다.

DFA는 EFA와 매우 유사하다. 이들 두 기술사이의 주요차이점은 EFA와는 달리 DFA가 고정 또는 동기된 프레임 정렬을 유지하도록 강요되지 않는다는 것이다. DFA는 현재의 블록프레임의 절단에서 자유로우며, 전체길이의 신호샘플블록으로 바로 시프트백(Shift vack)된다. 한편, EFA는 전체길이 블록처리를 속행하기전에 현재의 프레임을 끝내기위하여 적당한 서브블록길이들이 사용된다는 것이 보장되어야한다.

DFA 프레임 제어처리는 오직 몇가지점에서 EFA 프레임제어와 다르다. 이와같은 차이점들은 제26a,26c,26f에 도시된 플로우챠트를 참조하여 설명된다. 먼저, 플랙 PARTIAL은 제26a도의 블록 2660에 나타난 바와같이 토글되지 않으나, 항상 0으로 정해진다. 둘째, 큐가 항상 비어있기 때문에 나무 마디큐가 제26c도의 블록 2611에서와 같이 비어있는지를 정하기위한 검사가 요구되지 않는다. 셋째, 플랙 BRIDGE은 제26f도의 블록 2644에서와 같이 토글되지 않으나, 항상 0으로 정해진다.

DFA 검출기는 항상 각각의 반복에 대하여 N/2개의 새로운 샘플들을 통하도록 진행하지 않는다. 과도신호검출기가 현재의 서브블록에 대하여 N/8 샘플수의 서브블록길이로 시프트되도록 선택되었다고 가정할 때, 과도신호발생기는 다음의 서브프레임을 처리하기전에 오직 N/8 신호샘플수 만큼 진행하게된다. 따라서 EFA와는 달리, DFA 과도신호검출기는 한 번이상 주어진 신호샘플들을 검사할 수 있다.

제27도는 단일채널시스템에서 윈도우된 신호샘플블록들의 순서를 나타낸다. 블록 A,B는 전체길이 블록들이다. 과도현상이 블록C의 두번째 반쪽에서 발생한다. 다음의 설명은 과도신호검출기가 N/8 샘플수의 길이를 갖는 2개의 서브블록들로 시프트되도록 선택되었다고 가정한 것이다.

코더는 W₃윈도우를 사용하여 9N/16 샘플수의 길이의 브릿지변환으로 블록C을 처리하기 시작한다. 절단블록(truncated vlock)인 블록C는 W₃₃윈도우를 사용하는 N/8 샘플수의 길이의 변환에 의해 종료된다. 9N/16 샘플수의 길이의 브릿지변환은 전체길이 블록처리로 시프트백하기 위하여 블록E안의 W₃₀윈도우를 사용한다.

코더는 N/8 샘플길이의 2개의 변환에 의해 절단블록 D을 변환한다. 전체길이블록인 블록F는 절단블록D후에 즉시 시작된다. 블록프레임 경계가 전체블록길이의 ¾만큼 시프트되어 있음에 주목한다.

[F. 계수양자화 및 포맷팅]

정방향 변환에 의해 발생된 주파수계수들은 일반적으로 저비트율 전송이나 효율적인 저장에 적합하지 않다. 신호의 중복이나 부적절성의 잇점을 취함에 의해 비트요구량을 감소시키기위하여 여러 가지 양자화기술들이 사용될 수 있다. 예를들어 Jayant와 Noll의 파형의 디지탈 코딩(Englewood Cliffs, N.J. : Prentice-Hall, Inc., 1984년 563-576 페이지)를 참고한다. 이처리는 제1a도의 블록 118로 표시된다.

포맷처리는 전송 또는 저장을 위하여 양자화 변환계수들과 신호샘플블록 길이를 어셈블링한다. 이처리는 제1a도의 블록 120으로 표시된다. 본 발명의 실시예에 있어서, 서브블록길이들의 특정순서는 서브블록길이들의 모든 가능한 순서표의 지표에 나타나있다. 예를들어, 하나의 표 목록에는 N/2, N/8, N/8 및 N/4 샘플들의 순차적인 서브블록 길이들이 나타나 있다. 다른 목록에는 8개의 N/8 샘플들의 순서가 나타나있다.

프레임 동기비트와 오차 검출/정정 코드들은 전송을 위해 포맷된 데이터로서 사용될 수 있다. 데이터베이스 포인터(database pointer)나 티이들은 저장을 위해 포맷된 데이터로서 가산될 수 있다. 포맷된 프레임은 이제 제1a도에 도시된 경로 122를 따라 전송 또는 저장을 위해 준비된다.

DFA 기술은 신호포맷팅에 있어서 더욱 복잡하게 된다. DFA 포맷팅의 바람직한 수행을 위해 순환버퍼가 이용된다. 변환계수들과 측면정보를 나타내는 적당한 수의 데이터비트가 버퍼링될 때, 이 데이터는 포맷되고 프레임 동기 비트들로 분류되며, 전송 또는 저장된다. 이것이 포맷된 프레임이 일정한 길이를 갖게하여준다. 결국, DFA로 포맷된 프레임은 더 이상 변환블록 프레임에 등가로 되지 않는다. DFA 포맷 프레임은 같은 수의 변환블록들을 포함하도록 보장되지 않는다. 따라서, 디코더에 의해 수신된 변환블록길이정보의 정확성이 매우 임계적이며, 중복 또는 오차정정코드들과 같은 방법에 의해 보존되어야 한다. 변환 블록길이의 코럽션(corruption)에 의해 디코더가 변환블록동기가 재발생될때까지 변환블록과 모든 차후의 블록들을 적절히 디코딩하는 것을 방해하게 된다.

[G. 디포맷팅과 계수선형화]

디지탈화되고 코딩된 신호가 전송신호의 수신이나 저장으로부터의 북원에 의해 신호채널 132로부터 수신될때, 디포맷처리가 이루어지게된다. 디포맷처리는 제1b도안의 블록 134에 의해 표시된다. 디포맷팅은 인코더를 통과한 양자화된 변환계수들과 측면 정보를 뽑아낸다. 변환계수들은 인코더에서 계수들을 양자화하는데 사용된것과 반대되는 처리를 이용하여 선형형태의 표시로 변환된다. 이처리는 제1a도의 블록 136으로 표시된다. 적당한 합성 윈도우함수를 선택하고 역변환의 길이를 정하기위하여 신호샘플블록길이가 사용된다.

[H. 합성필터뱅크-역변환]

제16도의 블록 138은 디포맷팅 및 선형화처리에 의해 시간영역 신호샘플블록으로 복구된 일련의 주파수영역 변환계수들을 변환하는 합성필터뱅크를 나타낸다. 제1a도내의 분석필터뱅크 116에서 사용된 것에 상반되는 변환이 합성필터뱅크 138에의해 수행된다. 본 발명의 실시예에서 사용된 E-TDAC에 대한 역 이산변환들이 변형 역DCT와 변형 역DST의 선택적으로 적용된다.

각 변환의 길이는 포맷된 신호로부터 취출된 각 신호샘플블록길이와 같게 설정된다. 요구되는 위상항목은 전술한 본 발명의 인코더 부분에서 행하여 진것과 같은 방법으로 계산된다.

변환계수들의 반이 전송 또는 저장에서 생략되기 때문에(식 3,4 참조), 이들 계수들은 역변환을 위해 재생성되어야 한다. 빠진 DCT 계수들은 방정식 19에 나타난 유용 DCT 계수들로부터 재생성될 수 있다. 빠진 DST 계수들은 방정식 20에 나타난 바와같이 재생성될 수 있다. 역변형 DCT는 방정식 21에 표시되며, 역변형 DST는 방정식 22에 표시된다.

여기서, K=변환계수번호,

n=신호샘플수,

N=샘플블록길이,

m=E-TDAC(방정식 6참조)에 대한 위상항목,

C(k)=양자화된 DCT계수 K,

S(k)= 양자화된 DST계수 K, 그리고

x(n)=복구된 양자화된 신호 x(n)이다.

제4a-4e도 및 6a-6g도는 분석-합성필터뱅크의 변환처리를 나타낸다. 분석필터뱅크는 시간영역신호를 교번순서의 DCT 및 DST들의 다른 반쪽에 역DST를 적용시킨다. 제5a-5d도에서 보는바와같이 복구된 신호는 위신호왜곡을 포함한다. 이 왜곡은 제1a도 내의 블록 144로 표시된, 차후 시간영역블록의 중복가산처리기간동안 소거된다. 중복가산처리는 아래에 기술된다. 역변환을 위한 계산은 FFT 알고리즘을 이용하여 수행된다. 정방향변환에서 사용된것과 같은 기술이, 하나의 FFT를 사용하여 역변형 DCT와 역변형 DST를 동시적으로 계산하기 위하여 역변환에서 사용될 수 있다.

제16도내의 블록 140으로 표시된 프레임 제어처리는 시간영역 위신호를 소거시키기위하여 역 E-TDAC 변환에 요구되는 서브블록 쌍의 정렬과 위상항목의 선택을 제어한다. 이 처리는 본 발명의 인코더부에서 사용된 프레임제어처리와 대체적으로 같다.

[I. 합성 윈도우]

제6a-6g도에서 인접한 시간영역 신호샘플블록들의 중복가산에 의해 시간영역 위신호를 소거시키는 상태가 도시되어 있다. Princen과 Bradley에 의해 도출된대로 시간영역 위신호왜곡을 소거시키기위하여, E-TDAC 변환은 분석 윈도우와 동일한 합성 윈도우 그리고 인접블록들의 중복가산의 적용이 요구된다. 각 블록은 100% 중복되는데, 50%는 이전의 블록에 의해, 50%는 다음의 블록에 의해 중복된다. 합성윈도우 무게화는 제1a도내의 블록 142으로 표시된다.

분석 및 합성윈도우는 분석-합성에 의한 윈도우가 두개의 인접산출된 윈도우가 중복될 때 항상 하나로 합해지도록 설계되어야 한다. 중복가산처리는 제1b도안의 블록 144로 표시되며, 제6a-6g도에 도시되어 있다. 역 DCT 및 DST에 의해 각각 복구된 신호 yc(t)와 ys(t)가 제6a,6d도에 나타나있다. 각 신호는 일련의 블록들로 분류된다. 각 신호블록은 제6b,6e도에 도시된 합성윈도우 함수에 의해 무게화된다. 신호 yc(t)와 ys(t)의 나머지 블록들은 제6c,6f도에 도시되어있다. 반쪽블록길이에 의해 중복된 2개의 신호는 제6g도에 도시된 신호 y(t)를 발생시키기 위하여 가산된다. 신호 y(t)는 본래의 입력신호는 정확한 재구성이 된다.

제28도에서 나타난 바와같이 어떤시간 not 에서 블록 k와 블록 k+1 사이의 중복간격내에 있는 신호샘플은 2개의 블록의 각각안에서 샘플에 의해 표시된다. 2개의 윈도우된 블록들의 중복가산을 따라서, 시간 not에서 복구된 신호샘플은 윈도우된 블록들 k, k+1로 부터의 샘플들의 합으로 나타나며, 다음식에 의해 표현된다.

여기서, WP_k(n₀t)=WA_k(n₀t)·WS_k(n₀t)={WA_k(n₀t)}²,

WA_k(n₀t)=시간 n₀t에서의 블록 k내의 분석윈도우,

WS_k(n₀t)=시간 n₀t에서의 블록 k내의 합성윈도우, 그리고

WA_k(n₀t)=E-TDAC 변환에 의해 요구되는 WS_k(n₀t)이다.

산출된 윈도우무게화 효과는, 윈도우 중복간격을 거친 2개의 인접산출된 윈도우의 합이 1이 될 때 소거된다. 따라서, 만약 블록 k, k+1 사이의 중복간격내의 모든 시간샘플들 nt에 대하여 다음식이 성립할때 신호 x(nt)가 정확하게 복구될 수 있다.

적당한 중복가산 특성을 갖는 임의의 윈도우가 분석-합성윈도우 쌍을 유도하기 위한 기준으로서 사용될 수 있지만, 본 발명의 실시예에서 사용된 윈도우는 4-7의 범위안의 알파값을 갖는 Kaiser-Bessel 윈도우로부터 유도된다. 방정식 25참조.

여기서, α=Kaiser-Bessel 알파팩터,

n=윈도우 샘플번호,

N=샘플수로된 윈도우길이, 그리고

이다.

유도된 것은 중복간격을 뺀 블록길이와 같은 길이의 직사각형의 윈도우로 된 Kaiser-Bessel 윈도우를 나타낸다. 방정식 26을 참조할 것. 이 방정식은 방정식 27에 나타난 것으로 단순화될 수 있다.

여기서, n=산출윈도우 샘플번호,

V=윈도우 중복간격내의 샘플들의 수,

N=산출윈도우의 원하는 길이,

W(n)=길이 v+1의 개시윈도우 함수,

WP(n)=길이 N의 유도산출윈도우, 그리고

E-TDAC 변환을 사용하는 본 발명의 실시예에 있어서, 분석 및 합성윈도우들은 유도산출윈도우 WP(n)의 평방근을 취함에 의해 얻어진다. 분석 및 합성윈도우들은 100% 윈도우 중복(N/2 샘플수)을 갖는 1024, 512, 256, 128 샘플수의 적당한 길이를 갖는다. 분석윈도우 함수는 방정식 28에 나타나있다.

여기서, N ∈ {128, 256, 512, 1024},

그리고 W(n)=길이 N+1의 Kaiser-Bessel 함수;

α 팩터는 4-7 범위에 있다.

[J. 신호출력]

제1a도내의 블록 146은 디지탈 입력에 대응하여 가변아날로그신호를 발생시키는 종래의 디지탈-아날로그 컨버터를 나타낸다. 디지탈 입력은 중복가산처리에 의해 산출된 24비트 정수단어들의 16개의 최상위 비트들로부터 얻어진다. 아날로그출력은 의사고주파성분을 제거시키기위하여 제1b도내의 블록 148로 도시된 저역통과 필터에 의해 필터링되어야 한다. 본 발명의 실시예에 있어서, 이 필터에 대한 공칭 커트오프 주파수는 20㎑이다. 증폭에 적합한 복구된 오디오신호는 제1b에 도시된 출력단 150에서 출력된다.

[ 3. 본 발명의 다른 O-TDAC 수행]

본 발명의 다른 실시예는 홀수스택(oddly-stacked) 시간영역위신호소거(O-TDAC)라 불리는 변환을 이용한다. 다음의 기술내용은 본 발명의 E-TDAC와 O-TDAC 수행사이의 차이에 대하여 설명한다.

[A. 정방향변환]

O-TDAC는 방정식 29에서 표시되는 변형 이산코사인 변환(DCT)인 변환함수를 이용한다.

여기서, k=주파수계수번호,

n=입력신호샘플번호,

N=샘플블록길이,

m=O-TDAC(방정식 6참조)에 대한 위상항목,

x(n)=샘플 n에서의 입력신호 x(t)의 양자화값,

C(k)=DCT 계수 k이다.

O-TDAC 변환은 다음과 같은 형태의 일련의 스펙트럼계수들 또는 변환블록들을 발생시킨다.

여기서, i=신호샘플블록번호, 그리고

C(k)=DCT 계수(방정식 29참조)이다.

사용된 계산알고리즘은 고속푸리에 변환(FFT)이다. E-TDAC 비젼과는 달리 O-TDAC 수행은 동시적으로 2개의 신호샘플블록들을 변환시키기 위하여 단일의 FFT를 사용할 수 없다. 그러나, 변환의 N²계산상의 복잡성은 E-TDAC 버전에서 사용된 전 곱셈변환-후곱셈 처리(premultiply-transform-postmultiply process)와 유사한 기술을 사용함에 의해 N-log₂N으로 감소될 수 있다. 전곱셈단계는 신호샘플들을 복소함수로 곱함에 의해 실수값의 신호샘플 x(n)의 순서를 복소수값의 순서로 전환시킨다.

여기서,,

n=입력신호샘플번호, 그리고

N=샘플블록길이이다.

FFT에 의해 수행되는 이산푸리에 변환은 변형신호샘플들을 일련의 변환계수들로 전환시킨다. FFT가 복고변환이기 때문에 변형신호샘플세트의 실수 및 허수부가 동시적으로 변환될 수 있다. 끝으로, 후 곱셈단계는 DCT 계수들을 얻는다. 이 처리는 아래의 방정식 32, 33에 나타나 있다.

여기서,,

n=입력신호샘플번호,

N=샘플블록길이,

k=주파수계수번호,

m=O-TDAC(방정식 6참조)에 대한 위상항목,

R(k)=계수 X^*(k)의 실수부,

Q(k)=계수 X^*(k)의 허수부, 그리고

C(k)=DCT 계수 k이다.

본 발명의 단일채널버젼에 대한 실시예에 있어서, 각 신호샘플블록은 FFT를 이용하여 개별적으로 변환된다. 하나의 블록은 하나의 프레임을 구성한다. 2채널 시스템에 있어서, 2채널의 각각으로 부터의 신호샘플블록들은 2개의 FFT 처리에 의해 DCT₁/DCT₂블록쌍으로 변환된다. 이 블록쌍이 하나의 프레임을 구성한다.

Princen, Johnson 및 Bradley는 적당한 위상성분 m(방정식 6참조)과 주의깊게 설계된 분석-합성 윈도우쌍에 의해, O-TDAC 기술이 다음과 같은 형태의 코사인변환 블록들의 순서로부터 정확하게 입력신호를 복구할 수 있음을 알리고 있다.

O-TDAC 변환과 위신호 소거처리는 E-TDAC 변환의 것과 매우 유사하며, 제29a-29b, 30a-30d, 31a-31g 도에 도시되어 있다. 원리적인 차이는 위신호성분의 형태이다. 샘플링된 신호블록의 첫번째 반쪽에 있어서, 위신호성분은 샘플블록의 ¼ 지점부근의 입력신호의 시간반전상(time reversed image)이 되나, 그 진폭의 부호는 입력신호의 부호가 반전된 것이다. 샘플링된 신호 블록의 두번째 반쪽에 있어서, 위신호는 부호의 변환없이 샘플블록의 ¾ 지점부근에서 시간반전된다. 제30b,30d도 참조.

분선 및 합성윈도우의 설계 및 사용은 E-TDAC의 그것과 동일하다. 제31a-31g도 참조. 전술한 E-TDAC에 대한 프레임 정렬기술은 여기에 동일하게 적용된다.

FFA 기술에 대하여 사용된 변환위상항목의 선택을 제외하면, O-TDAC에서 적정하게 신호샘플블록길이를 사용하기 위하여는 E-TDAC에서 필요한 것 이외의 추가적인 고려사항이 요구되지 않는다. 위신호소거에 요구되는 위상항목은, 신호샘플블록들 C-E과 역 O-TDAC 변환에 의해 복구된 3개의 중복된 전체길이 변환블록의 순서가 나타나 있는 제32도에 도시되어있다. 블록 D,E는 FFA 기술에 따라 서브블록들로 분할된다.

중복가산에 의해 위신호소거를 달성하기 위하여, 서브블록, D_a, E_a내의 위신호성분은 윈도우된 본래의 신호에 대하여 시간상으로 역변환되고 지폭상으로 신호반전되어야 한다. 제31a도에서, 이와같은 역변환/반전특성이 O-TDAC를 위하여 좌측영역내의 위신호성분에 나타나있다. 따라서, 역변환 영역들 사이의 경계가 서브블록의 우측단부에 위치되어야 한다. 방정식 17로부터 서브블록 D_a, E_a에 대하여 요구되는 위상항목이 다음과 같음을 알 수 있다.

서브블록 D_b, E_b내의 위신호성분은 오직 시간상으로(35)로 역변환된다. 이 특성이 O-TDAC를 위하여 우측영역에서 나타나게된다. 따라서, 역변환영역들사이의 경계가 서브블록의 좌측단부에 위치되어야 한다. 방정식 17로부터 요구되는 위상항목은 다음과 같다.

여기서, N=최대신호샘플블록길이이다.

FFT를 사용하는 O-TDAC에 대한 위상항목을 설정하기 위한 일반적인 법칙은 다음과 같다. 각각의 전체길이 블록내부의 첫번째 서브블록에 대한 변환은 방정식 35에 나타난 위상항목을 사용한다. 모든 전체길이 블록들과 각 전체길이 블록내부의 두번째 서브블록에 대한 변환은 방정식 36에 나타난 위상항목을 사용한다.

[B. 역 변환]

DCT 변환계수들의 절반은 전송 또는 저장에서 생략되며, 방정식 37에 나타난 상관관계를 사용하는 유용 DCT 블록들로부터 재처리된다. 역변형 DCT는 방정식 38에 나타나있다.

여기서, k=변환계수번호,

n=신호샘플번호,

N=샘플블록길이,

m=E-TDAC(방정식 6참조)에 대한 위상항목,

C(k)=양자화된 DCT 계수 k, 그리고

x(n)=복구된 양자화신호 x(n)이다.

역변환의 O-TDAC 수행은 정방향 O-TDAC 변환에 대하여 전술한바와 유사한 전곱셈변환-후곱셈처리를 이용함에 의해 계산상의 복잡성을 N²에서 N-log₂N로 감소시킬 수 있다. 이 처리는 실수값의 DCT 계수들을 일련의 변형 복소수값의 계수들로 전환시키고, 단일 역 FFT(IFFT)를 사용하여 변형계수들의 실수 및 허수부분을 동시적으로 변환하며, 다음의 방정식에 나타난것과 같이 후곱셈에 의해 시간영역 신호를 얻게된다.

여기서,,

m=O-TDAC(방정식 6참조)에 대한 위상항목,

N=샘플블록길이,

k=주파수계수번호,

n=입력신호샘플번호,

r(n)=샘플 X^*(n)의 실수부, q(n)=샘플 X^*(n)의 허수부, 그리고

(n)=복구된 양자화신호 x(n)이다.

차후의 윈도우잉, 중복가산 및 신호출력 처리는 본 발명의 E-TDAC 수행에 대하여 전술한것과 동일하다.

[C. E-TDAC 및 O-TDAC 변환의 적정한 사용]

전술한 내용으로부터, E-TDAC 및 O-TDAC 변환들 사이에 적정한 선택이 가능하다는 것은 해당기술분야의 기술자에게 명백하다. 분석 및 합성윈도우의 선택적인 처리도 전술한 바와 같다. 시간영역 위신호소거를 위해 요구되는 위상항목들의 계산도 전술한 바와같은 원리를 적용한다. 그러나, 위신호소거를 이룸에 있어서, 시간영역신호성분의 형태가 본 발명이 2개의 TDAC 변화들 사이에서 시프트될 수 있는 방식에 제한을 주게된다.

일반적으로, E-TDAC 변형 DCT를 따르는 O-TDAC 변형 DCT, 또는 O-TDAC 변형 DCT를 따르는 E-TDAC 변형 DCT로의 시프트는 언제라도 이루어질 수 있다. E-TDAC 변형 DST를 따르는 O-TDAC 변형 DCT, 또는 O-TDAC 변형 DCT를 따르는 E-TDAC 변형 DCT로의 시프트는, 만약 그것이 전술한 변환위상항목의 적당한 조정과 함께 반 블록길이로의 시프트에 의해 이루어지지 않을 경우, 이루어지지 않을수도 있다.

변환의 선택은 과도현상 또는 다른 관련신호특성에 대한 코더의 동작을 향상시키기 위하여 사용될 수 있다. 예를들어, 이들 두 TDAC 변환들사이의 스위칭에 대해, 코더/디코더 시스템은 변환계수들의 공칭주파수를 적정하게 시프트시킴에 의해, 단일음색신호의 코딩기능을 개선시킬 수 있다. 인간의 귀의 임계대역들은 청각적 자극에 적합한 가변중심주파수를 갖는다. 서브밴드의 중심주파수를 시프트시킬 수 있는 코더는 단일 주파수에 의해 지배되는 단일음색신호에 대한 심리음향적 효과를 향상시킬 수 있다.

O-TDAC와 E-TDAC 사이에서 시프트하는 인코더 또는 디코더는 두 변환에 대한 변환계수 대역폭상의 차이 때문에 그 서브밴드들의 중심주파수를 시프트시키게 된다. 제33a도에 도시된 바와같이, E-TDAC 변환계수 O(DC 성분)와 계수 N/2는 모든 다른 변환계수들의 ½ 대역폭과 같은 대역폭을 갖는다. 그러나, O-TDAC 변환에 있어서, 각 변환계수는 대역폭과 동일하다. 제33b도 참조. 44.1㎑에서 샘플링되는 1024 샘플블록을 사용하는 본 발명의 실시예에 있어서, 단순히 E-TDAC 변환에서 O-TDAC 변환으로 시프트함에 의해 하나의 변환계수의 공칭주파수를, 예를들어 21.5㎑~43㎑ 사이에서 이동시키는 것이 가능하다.

제1a도내의 블록 110에 의해 표시된 신호분석기는 E-TDAC와 O-TDAC 변환사이를 선택하는 본 발명의 실시예에서 사용될 수 있으며, 분석필터뱅크에서 사용된 변환길이의 2배가 되는 다른변환에 의해 수행될 수 있다. 신호분석기 변환으로부터의 스펙트럼정보를 사용하여 프레임제어기 114는 어떤 스펙트럼성분이 우세하며, 그 성분의 어떤 주파수가 필터뱅크변환계수의 ½ 대역폭안에 있는가를 설정할 수 있다. 프레임제어기는 그후 서브밴드 중심주파수가 우세성분의 그것과 가장 가까운 TDAC 변환을 선택할 수 있게된다.

[Ⅳ. 본 발명의 다른기능 수행]

E-TDAC 변환은 많은 적용분야에서 바람직하지만, E-TDAC 코더에 요구되는 신호처리수단은 이산푸리에 변환(DFT)과 같은 다른 변환을 사용하는 코더에 요구되는 신호처리수단보다 더욱 많아지게 된다. DFC를 사용할 때, 코더는 좀더 작은 메모리와 처리속도가 요구될 수 있다. 본 발명의 DFR 실시예의 기본구조는 합성윈도우 142가 사용되지 않는다는 점을 제외하면 제1a, 1b도에 도시된 구조와 동일하다.

다음의 기술내용은 본 발명의 DFT와 E-TDAC 변환실시예들의 차이점에 대한 것이다.

[A. 과도신호검출기 및 프레임 제어]

E-TDAC 실시예에 대하여 전술한 과도신호검출기의 로직은 디코더가 ½ 블록에 대한 것보다 전체블록에 대한 샘플들을 분석한다는 점을 제외하면 DFT 실시예에서의 로직과 동일하다. 따라서, E-TDAC의 것과 개념적으로 유사한 프레임 제어처리기는 반블록 서브프레임 길이에 대한 것보다는 한번에 전체블록길이에 대한 서브블록 길이들을 선택하게 된다.

[B. 윈도우잉]

분석윈도우는 E-TDAC 변환과 DFT 사이의 차이 때문에, E-TDAC 코더에서 사용되는 것과 다르다. DFT에 의해 수행되는 분석시스템이 임계적으로 샘플링 되지 않기 때문에, 즉 전송비 또는 데이터 저장요구량이 중복간격내의 신호 샘플들에 대하여 2배로 되기 때문에, 입력신호의 샘플블록 중첩의 양을 절감시키는 윈도우 설계를 선택하는 것이 중요하다.

따라서, 본 발명의 DFT 실시예에서 사용된 전체길이의 1024 샘플블록에 대한 바람직한 윈도우는 큰 간격을 통해 단일화된 이득을 나타내며, 이에따라 N/S(512) 샘플들에서 16 샘플들로 블록중복길이를 감소시키게 된다. 이 감소가 디지탈 필터의 정지대역 저지를 떨어트리게 되나 비중복윈도우에 비하여 데이터비율의 알맞은 증가를 발생시킨다.

DFT 윈도우족에서의 윈도우는 E-TDAC 실시예에서의 산출윈도우 WP(n)를 얻기 위하여 사용된 윈도우와 유사하게 유도된다. DFT 실시예에 있어서, 커넬(kernel) Kaiser-Bessel 함수는 17샘플수의 길이를 가지며, 1.5-3의 범위내의 알파팩터를 갖는다. 방정식 25를 참조할 것. DFT 분석윈도우는 Kaiser-Bessel윈도우와 직사각형윈도우의 콘벌루션곱(convolution product)으로부터 얻어진다. 윈도우 Woo에 있어서 직사각형 윈도우의 길이는 1008 샘플수(1024 샘플수의 블록길이-16샘플수의 중복간격)가 된다. 윈도우 W₃₃에 있어서도 이와유사하게 직사각형 윈도우의 길이는 112 샘플수(또는 123-16)가 된다. 이값들은 방정식 27에 대입하면 다음과 같이 2개의 윈도우 함수가 된다.

여기서, W(n)=길이 17의 Kaiser-Bessel 함수이며,

알파팩터는 1.5-3의 범위안에 존재한다.

[C. 분석필터뱅크-정방향변환]

DFT는 필터뱅크를 수행하며, 다음과 같이 표시된다.

여기서,,

k=주파수계수번호,

n=입력신호샘플번호,

N=최대신호샘플블록길이,

x(n)=샘플 n에서의 입력신호 x(t)의 양자화값, 그리고

x(k)=변환주파수계수 k이다.

[D. 합성필터 뱅크-역변환]

DFT는 역필터뱅크를 수행하며 다음과 같이 표시된다.

여기서,,

k=주파수계수번호,

n=입력신호샘플번호,

N=최대신호샘플블록길이,

x(n)=샘플 n에서의 복구된 양자화신호 x(t), 그리고

X(k)=변환주파수계수 k이다.

[E. 합성윈도우]

전술한 바와같이, DFT는 합성윈도우의 사용을 필요로하지 않는다.

[F. 다른변환들]

직교변환이 본 발명의 요지 또는 목적에서 벗어나지 않은 상태에서 사용될 수 있다. DFT에 대하여 전술한 고려점들을 적용하면, 신호과도현상이나 다른 신호특성의 존재에 따라 직교변환을 절정하게 선택하는 것도 가능해진다. 예를들어, 본 발명의 일 실시예에서는 방정식 45에 나타난 종래의 DCT를 일반적으로 사용할 수 있으나, 과도신호가 있는 서브블록을 인코딩하기 위하여 방정식 46에 나타난 종래의 DST 또는 전술한 DFT를 선택할 수도 있다.

역 DCT와 역 DST는 방정식 47,48에 각각 나타나있다.

여기서, k=주파수계수번호,

n=입력신호샘플번호,

N=최대신호샘플블록길이,

x(n)=샘플 n에서의 입력신호 x(t)의 양자화 값,

X(k)=변환주파수계수 k, 그리고

전술한 바와 같이, DCT는 일반적으로 조주파성분들로 특징지워지는 신호들에 대하여 우수한 코더이득을 제공하나, DFT는 일반적으로 고주파성분들로 특징지워지는 신호들에 대하여 더욱 양호하게 수행하게 된다. 보다 상세하게는, Jayant와 Noll에 의해 제시된 바와같이, DCT는 첫번째 정규화된 자동상관(autocorrelation) 계수가 0.95 또는 이보다 높은 신호에 대하여 우수한 코딩이득을 제공하나, DFT는 첫번째 정규화된 자동상관 계수가 -0.95 또는 이보다 낮은 신호에 대하여 우수한 코딩이득을 제공한다. 최초로 정규화된 자동상관 계수는 다음과 같이 정의된다.

여기서, Rxx(1)과 Rxx(0)은 각각 첫 번째 및 0번째 자동상관계수이다.

i번째 자동상관계수는 다음과 같이 정의된다.

DCT와 DFT를 적정하게 선택하는 본 발명의 실시예는 블록에 대한 9₁가 0.8과 같은 한계를 넘을때는, 각 신호샘플블록에 대한 첫번째 정규화된 자동상관계수를 계산하는, 제1a도내의 블록 110으로 표시되는 신호분석기와, 블록에 대한 DCT를 선택하는, 제1a도내의 블록 114로 표시되는 프레임 제어기를 사용할 수 있으나, 그렇지 않을경우에는 DFT를 선택하게 된다.

[G. 증가필터 선택도]

전술한 본 발명의 바람직한 실시예 및 다른 실시예들은 정상보다 높은 시가분해능이 요구될 때 더욱 짧은 블록길이들로 적정하게 시프트하는 인코더 및 디코더에 대하여 기술하였다. 본 발명의다른 실시예는 정상보다 높은 주파수분해능이 요구될 때 더욱 긴 블록길이들로 시프트하게 된다.

더욱 높은 주파수 분해능이 요구되는 것을 표시하는 신호특성의 측정은 Jayant와 Noll의 파형의 디지탈코딩(Englewood Cliffs, N.J : Prentice-Hall, Inc., 1984년 56-58 페이지)에 기재된 것과 같은 스펙트럼 플랫니스측정(spectrum flatness measure)과 상반된 것이다. SFM은 0-1값의 범위에 있는 하나의 수에 의해 신호력의 스펙트럼 밀도의 형태를 기술하고 있다. SFM은 파형예측에 역비례한다. 1값은 백색잡음(Shite noise)의 특성을 갖는 예측불가능신호를 나타낸다. 0값은 완벽하게 예측가능한 신호를 나타낸다.

더욱 긴 블록길이를 적정하게 선택하는 본 발명의 실시예는 SFM을 계산하는 신호분석기와, 역 SFM이 10-15 범위안에 있는 한계값을 초과할 때 더욱 긴 블록길이를 선택하는 프레임제어기를 사용할 수 있다.

해당기술분야의 기술자는 블록길이, 분석윈도우 또는 분석-합성윈도우쌍 그리고 이에 대응하는 변환을 조절하기 위하여 많은 입력 신호특성들을 검출하고 분석하는 것이 가능하는 점을 인식할 수 있다.

Claims

이산시간신호와 음악신호를 나타내는 입력샘플들의 인코딩을위한 인코더에 있어서, 상기 샘플블록들을 하나 또는 그 이상의 분석윈도우 함수들로 무게화시킴에 의해 분석윈도우 무게화 블록들을 발생시키기 위한 분석윈도우수단(112), 상기 분석윈도우 무게화블록들에 이산변환을 적용시킴에 의해 스펙트럼정보를 발생시키기 위한 변환수단(116)으로 구성되어, 상기 제어수단이 다수의 이산변환들로부터 상기의 이산변환을 선택하기 위하여 상기 이산시간신호의, 하나 또는 그이상의 특성에 대응하며, 그리고/또는 신호무관변환인 상기 이산변화에 적응하는 변환적응수단으로 구성된 인코더.
제1항에 있어서, 상기 제어수단(110,114)이 상기 각 샘플블록들을 서브블록들로 분할하기 위한 수단과 상기 서브블록내에서 하나 또는 그 이상의 특성들을 갖는 결과가 발생하는 것을 검출하기 위한 수단(110)으로 구성된 인코더.
이산시간 신호와 특히 음악신호를 나타내는 입력샘플들의 인코딩을위한 인코더에 있어서, (a) 각 샘플블록들을 다른 서브블록길이를 갖는 하나 또는 그이상의 서브블록레벨들로 분할하기 위한 제1수단과, 상기 하나 또는 그이상의 서브블록레벨들내의 인접된 서브블록들내의 상기 이산시간신호의 고역통과필터링된 표시사이의 진폭상의 증가 또는 감소량이 하나 또는 그이상의 트리거 한계값을 초과할 때, 과도현상의 발생을 검출하기 위한 제1수단, 또는 (b) 상기 샘플블록길이와 같거나 적은 간격에서 상기 이산시간신호의 고역통과 필터링된 표시의 진폭상의 증가량이 하나 또는 그 이상의 어택한계값을 초과할 때, 또는 상기 샘플블록길이와 같거나 적은 간격에서 상기 이산시간신호의 상기 고역통과 필터링된 표시의 진폭상의 증가량이 하나 또는 그 이상의 디케이한계값을 초과할 때, 과도신호의 발생을 검출하기 위한 제2수단중 어느 하나로 구성되며, 상기 샘플블록길이와 같은 길이를 갖는 샘플블록으로 상기 입력샘플들을 분류하기 위한 제어수단(110,114), 상기 제어수단이 상기 제1수단으로 구성될 경우, 하나 또는 그이상의 분석윈도우 함수들로 상기 하나 또는 그이상의 서브블록들을 무게화하거나, 또는 상기 제1수단이 상기 제2수단으로 구성될 경우 하나 또는 그이상의 분석윈도우 무게화블록들을 발생시키기위한 분석윈도우 수단(112), 그리고 상기 분석윈도우 무게화블록들에 이산변환을 적용시킴에 의해 스펙트럼 정보를 발생시키기위한 변환수단(116)으로 구성되어, 상기 제어수단이 상기 제1검출수단 또는 상기 제2검출수단중 어느 하나의 출력에 대응하여 상기 샘플블록길이를 적응시키는 것, 상기 하나 또는 그이상의 분석윈도우들을 적응시키는 것, 상기 이산변환을 적응시키는 것, 그리고 다수의 변환들로부터 상기 이산변환을 선택하는것중에 어느 하나를 제공하도록 된 인코더.
제3항에 있어서, 상기 제어수단이 상기 이산변환을 적응시키며, 그리고/또는 다수의 이산변환들로부터 상기 이산변환을 선택하기 위한 변환 적응수단으로 구성된 인코더.
제3,4항에 있어서, 상기 하나 또는 그이상의 트리거한계값이 상기 하나 또는 그이상의 각 서브블록레벨들에 대응하는 한계값들의 계층으로 구성된 인코더.
제3,4 또는 5항에 있어서, 진폭상의 상기 증가가 하나 또는 그이상의 어택한계값을 구성하는 상기 하나 또는 그이상의 트리거한계값들을 초과하거나, 또는 진폭상의 상기 증가가 하나 또는 그 이상의 디케이한계값들을 구성하는 상기 하나 또는 그이상의 트리거한계값들을 초과할 때, 상기 제1검출수단이 과도현상의 발생을 검출하도록 된 인코더.
제1-6항중 어느 하나에 있어서, 상기 제어수단(110,114)이 침묵한계값을 초과하지 않는 진폭을 갖는 상기 이산시간신호의 부분들에 대하여는 각각 상기 하나 또는 그 이상의 특성 또는 상기 과도현상이 발생에 대응하지 않도록 된 인코더.
제1-7항중 어느하나에 있어서, 상기 제어수단(110,114)이 서브블록길이를 적응시키기 위한 수단으로 구성되어, 상기 수단이 상기 각 샘플블록들을 서브블록들로 분할하고, 상기 분석윈도우수단이 하나 또는 그 이상의 분석윈도우 함수들로 각 서브블록을 무게화시키도록 된 인코더.
제1-8항중 어느하나에 있어서, 상기 제어수단(110,114)이 상기 샘플블록길이를 적응시키기 위한 길이 적응수단으로 구성된 인코더.
제8,9항에 잇어서, 상기 제어수단(110,114)이 적응된 샘플블록길이와 적응된 서브블록길이에 각각 대응하여 상기 하나 또는 그이상의 분석윈도우 함수들을 적응시키기위한 윈도우 적응수단으로 구성된 인코더.
제1-9항중 어느하나에 있어서, 상기 제어수단(110,114)이 상기 하나 또는 그이상의 분석윈도우 함수들을 적응시키기위한 윈도우 적응수단으로 구성된 인코더.
제10,11항에 있어서, 상기 윈도우적응수단이 상기 하나 또는 그이상의 분석윈도우 함수들의 형태에 영향을 미치는 하나 또는 그이상의 파라메터들을 적응시킴에의해, 그리고/또는 다수의 함수들로부터 상기 하나 또는 그이상의 분석윈도우 함수들을 선택함에 의해, 상기 하나 또는 그이상의 분석윈도우 함수들을 적응시키도록 된 인코더.
제8,9,10,11-12항에 있어서, 상기 제어수단이 적응 샘플블록과 적응서브블록길이에 각각 대응하여 상기 이산변환을 적응 그리고/또는 선택하기위한 수단으로 구성된 인코더.
제1,2,4,5-13항에 있어서, 상기 변환적응수단이 상기 이산변환의 커넬함수에 영향을 미치는 하나 또는 그이상의 파라메터들을 적응시킴에 의해 상기 이산변환을 적응시키도록 된 인코더.
제1-14항중 어느하나에 있어서, 상기 제어수단(110,114)이 상기 이산시간신호의 우세스펙트럼 성분의 주파수를 발생시키기 위한 수단, 상기 우세스펙트럼성분의 주파수와, 다수의 이산변환으로 구성된 일련의 변환들내의 각각의 변환에 대한 서브밴드의 중심주파수사이의 차이 주파수를 설정하기 위한 수단, 그리고 상기 차이주파수가 충분히 최소화되도록 상기 일련의 변환들로부터 상기 이산변환을 선택하기 위한 수단을 포함하도록 된 인코더.
제1-15항중 어느하나에 있어서, 상기 분석윈도우 무게화블록들이 실수값의 샘플들로 구성되어 짝수스택의 시간영역위신호소거기술에 대응하는 상기 이산변환이 적용되며, 상기 변환수단이 복소수값의 변형 샘플세트들을 얻기 위하여 첫번째 복소함수에 의해 상기 분석윈도 무게화 블록들의 쌍들안의 실수값의 샘플들을 곱셈하기 위한 수단, 상기 복소수값의 변형샘플세트에 대하여 고속푸리에 변환을 적용하기위한 수단, 그리고 상기 스펙트럼 정보를 얻기위하여 두번째 복소함수에 의해 변환결과값들을 곱셈하기 위한 수단으로 구성된 인코더.
제1-5항중 어느한항에 있어서, 상기 분석윈도우 무게화블록들이 실수값의 샘플들로 구성되고 홀수스택의 시간영역위신호 소거기술에 대응하는 상기 이산변환이 적용되며, 상기 변환수단이, 복소수값의 변형 샘플세트들을 얻기 위하여 첫번째 복소함수에 의해 상기 분석윈도우 무게화 블록들내의 실수값의 샘플들을 곱셈하기 위한 수단, 상기 복소수값의 변형샘플세트들에 대하여 고속푸리에 변환을 적용하기위한 수단, 그리고 상기 스펙트럼성분을 얻기위하여 두번째 복소함수에 의해 변환결과값들을 곱셈하기 위한 수단으로 구성된 인코더.
제8,9,10-17항중 어느하나에 있어서, 상기 변환수단이 상기 분석 윈도우 무게화 블록의 쌍들에 하나의 이산변환을 효과적으로 적용하도록 된 인코더.
제1,2,4,5-18항중 어느하나에 있어서, 상기 이산변환이 TDAC 변환이며, 상기 변환적응수단이 상기 이산변환의 TDAC 변환위상 파라메터를 적응하도록 된 인코더.
이산시간 신호와 특히 음악신호의 스펙트럼성분들의 표시들로 구성된 코딩된 신호를 디코딩하기 위한 디코더에 있어서, 스펙트럼 성분들의 상기 표시들을 스펙트럼블록길이와 같은 길이를 갖는 스펙트럼 블록들로 분류하기 위한 역 제어수단(140), 그리고 상기 스펙트럼 블록들에 역 이산변환을 적용함에 의해 샘플블록들을 발생시키기 위한 변환수단으로 구성되어, 상기 제오수단이 다수의 역 이산변환들로부터 상기 역 이산변환을 선택하며 그리고/또는 신호무관변환인 상기 역 이산변환을 적응시키기 위하여, 상기 코딩된 신호에 대응하는 변환적응수단으로 구성된 디코더.
제20항에 있어서, 상기 역 제어수단(14)이 상기 스펙트럼블록길이를 적응시키기 위한 수단으로 구성된 디코더.
제20,21항에 있어서, 상기 역 제어수단(14)이 하나 또는 그이상의 합성윈도우 함수들을 적응시키기위한 수단을 포함하며,상기 코더가 상기 샘플블록들을 상기 하나 또는 그이상의 합성윈도우 함수들로 무게화시킴에 의해 출력샘플들을 발생시키기 위한 합성윈도우 수단을 포함하도록 된 디코더.
제20-22항에 있어서, 상기 역 제어수단(14)이 서브블록길이를 적응시키기위한 수단을 포함하여, 상기 수단이 상기 스펙트럼 블록들을 서브블록들로 분할하고, 상기 변환수단이 상기 각 서브블록에 상기 역 이산변환을 적용하도록 된 디코더.
제20-23항중 어느하나에 있어서, 상기 스펙트럼 성분표시들이 실수값을 가지며, 상기 역 이산변환의 적용이 짝수스택된 시간영역위신호 소거기술에 대체적으로 대응하며, 상기 변환수단이 복소수값의 변형 스펙트럼 새트들을 얻기위하여 첫번째 복소함수에 의해 상기 스펙트럼블록 쌍들안의 스펙트럼성분의 상기 표시들을 곱셈하기 위한 수단, 상기 복소수값의 변형스펙트럼세트들에 대하여 역 고속푸리에 변환을 적용하기 위한 수단, 그리고 상기 샘플블록들의 쌍들을 얻기위하여 두번째 복소함수에 의해 변환결과값들을 곱셈하기 위한 수단으로 구성된 디코더.
제20-23항중 어느하나에 있어서, 스펙트럼성분의 상기 표시들이 실수값을 가지며, 상기 역 이산변환의 적용이 홀수스택된 시간영역위신호 소거기술에 대체적으로 대응하며, 상기 변환수단이 복소수값의 변형 스펙트럼 세트들을 얻기위하여 첫번째 복소함수에 의해 스펙트럼성분의 상기 표시들을 곱셈하기 위한 수단, 상기 복소수값의 변형스펙트럼세트들에 대하여 역 고속푸리에 변환을 적용하기 위한 수단, 그리고 상기 샘플블록들을 얻기위하여 두번째 복소함수에 의해 변환결과값들을 곱셈하기 위한 수단으로 구성된 디코더.
제21,22-25항중 어느하나에 있어서, 상기 변환수단이 상기 스펙트럼블록들의 쌍들에 하나의 역 이산변환을 효과적으로 적용시키도록 된 디코더.
제23,24 또는 25항중 어느하나에 있어서, 상기 변환수단이 상기 서브블록들의 쌍들에 하나의 역 이산변환을 효과적으로 적용시키도록 된 디코더.
제20-27항중 어느하나에 있어서, 상기 역 이산변환이 TDAC 변환이며, 상기 변환적응수단이 상기 역 이산변환의 TDAC 변환위상 파라메터를 적응하도록 된 디코더.