KR100848370B1

KR100848370B1 - 오디오 부호화

Info

Publication number: KR100848370B1
Application number: KR1020067016015A
Authority: KR
Inventors: 게랄트 슐러; 스테판 밥닉; 젠스 히르슈펠트; 만프레드 루츠키
Original assignee: 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우.
Priority date: 2004-02-13
Filing date: 2005-02-10
Publication date: 2008-07-24
Also published as: IL177163A0; KR20060114002A; US20070016402A1; HK1094079A1; CN1918631B; JP4444297B2; WO2005078705A1; RU2346339C2; EP1697928A1; BRPI0506628A; BRPI0506628B1; EP1697928B1; DE102004007191B3; AU2005213770A1; CA2556325C; CA2556325A1; RU2006132739A; AU2005213770B2; NO20064092L; IL177163A

Abstract

본 발명은 오디오 신호 부호화 신호로 부호화하는 방법과 장치로서, 오디오 값 시퀀스의 제 1 블록의 오디오 값에 대한 제 1 리스닝 임계값과 상기 오디오 값 시퀀스의 제 2 블록의 오디오 값에 대한 제 2 리스닝 임계값을 결정하고, 전달 함수가 상기 제 1 리스닝 임계값의 크기의 역수에 대응하도록 파라미터화 가능한 필터(30)의 제 1 파라미터화 버전(version)을 계산하고, 전달 함수가 상기 제 2 리스닝 임계값의 크기의 역수에 대하여 대응하도록 상기 파라미터화 가능 필터의 제 2 파라미터화 버전을 계산하고, 일정 블록에 대응하는 필터링된 오디오 값 블록을 구하기 위하여, 상기 제 2 파라미터화 버전에 의존하는, 미리 정한 방식으로, 미리 정한 파라미터화를 사용하는 파라미터화 가능 필터로써 상기 오디오 값 시퀀스의 일정 오디오값 블록을 필터링하하고; 양자화되고 필터링된 오디오 값 블록을 구하기 위하여 상기 필터링된 오디오 값을 양자화하고; 적어도 상기 제 1 파라미터화 버전과 상기 제 2 파라미터화 버전 사이의 차를 포함하는 상기 제 1 파라미터화 버전과 상기 제 2 파라미터화 버전의 결합을 형성하고, 상기 결합을 포함하고 그리고 양자화되고 필터링된 오디오 값을 파생시킬 수 있는 정보를 상기 부호화된 신호에 통합시키는 수단과 단계들을 포함한다.

부호화, 양자화, 보간, 파라미터화

Description

오디오 부호화{Audio Encoding}

본 발명은 오디오 부호화에 관한 것으로, 특히 오디오 신호가 짧은 지연 시간으로 부호화할 수 있는 오디오 코더, 디코더, 및 일반적인 부호화에 관한 것이다.

현재까지 가장 잘 알려진 오디오 압축 방법에는 MPEG-1 Layer III가 있다. 이러한 압축 방법에서는, 오디오 신호의 샘플 값 또는 오디오 값을 손실 부호화 방식을 이용하여 부호화한다. 압축 과정에서 원래의 오디오 신호에 있어서의 무관성(irrelevance) 및 중복성(redundancy)은 줄어들거나 또는 이론적으로는 제거된다. 상기와 같은 목적을 달성하기 위해서, 동시적(simultaneous) 마스킹 및 순시적(temporal) 마스킹은 음향 심리 모델(psycho-acoustic model)을 이용하여 인식되는데, 즉, 오디오 신호에 따라 일시적으로 변화하는 오디에 마스킹 임계값(threshold)을 계산하거나 결정하고, 이로 인하여 인간이 청각을 통해 인지할 수 있는 특정 주파수 톤(tone)의 크기를 나타내는 것이다. 이러한 정보는 신호를 부호화하는데 사용되며, 이때 오디오 신호의 스펙트럼 값은 마스킹 임계값에 따라서 더 정밀하거나 덜 정밀한 방식 또는 전혀 정밀하지 않은 방식으로 양자화되고, 이를 부호화 신호로 통합하게 된다.

MP3 포맷과 같은 오디오 압축 방법에서는, 오디오 데이터가 압축된 상태로 제한된 비트율을 갖는 전송 채널을 통해서 전송되는 경우, 그 적용에 있어서 제한을 받게 되지만, 반면에 지연 시간은 최소가 된다. 한편, 지연 시간이 오디오 정보를 수록하는데 영향을 미치지 않는 경우도 있다. 짧은 지연 시간을 갖는 부호화기(coder)는 "최단 지연 부호화기(ultra low delay coders)"라고 일컫기도 하는데, 이러한 부호화기는 텔레컨퍼런싱, 무선 확성기, 또는 마이크 등을 통해서 시간에 민감한 오디오 신호가 전송되는 경우에 요구되고 있다. 이를 적용하기 위해, Schuller G. 외 몇 명이 제시한 논문("Perceptual Audio Coding using Adaptive Pre- and Post-Filters and Lossless Compression", IEEE Transactions on Speech and Audio Processing, vol. 10, no. 6, September 2002, pp. 379-390)에서 신호 변환 대신에 두 개의 별개의 변환을 통하여 무관성 감소 및 중복성 감소를 달성하는 오디오 부호화를 제시하고 있다.

이러한 원리에 대해서 도 12 및 도 13을 차례로 참조하여 설명한다. 오디오 신호(902)는 이미 샘플링되어 있으며, 오디오 값 또는 샘플 값(906)의 시퀀스(904)로써 존재하고 있다. 이러한 오디오 신호(902)가 먼저 부호화되고, 오디오 값(906)에 대한 시간적 순서(temporal order)는 화살표(908)로 표시되어 있다. 오디오 값(906)에서 연속된 블록은 "블록#" 형식으로 오름차순으로 표기되어 있는데, 이러한 연속된 블록에 대해서 음향 심리 모델을 이용하여 리스닝 임계값을 계산한다. 도 13은 음향 심리 모델을 이용하여 계산된 주파수(f)에 대한 로그 단위의 그래프로써, a는 오디오 값(906)의 신호 블록(128)에 대한 스펙트럼을, b는 마스킹 임계값을 나타낸다. 전술한 바와 같이, 마스킹 임계값은 인간의 청각으로 인지할 수 없는 주파수의 세기를 지칭한다. 즉, 마스킹 임계값(b)보다 작은 값에 속하는 모든 톤을 말한다. 무관성 감소를 위해서는, 각 블록별로 계산된 리스닝 임계값에 기초하여, 파라미터화 가능한 필터를 제어한 후에 양자화기를 제어한다. 파라미터화 가능한 필터의 파라미터는 주파수 응답이 마스킹 임계값의 크기의 역수에 대응되도록 계산된다. 이 파라미터는 도 12에서 x_#(i)로 도시되었다.

오디오 값(906)을 필터링한 다음에는 일정한 크기의 스텝으로 양자화가 진행된다. 예를 들면, 바로 다음 정수로 반올림하는 경우를 들 수 있다. 이때 발생하는 양자화 잡음은 백색 잡음(white noise)이다. 복호화기에 있어서, 필터링된 신호는 파라미터화 가능한 필터에 의해서 다시 "재변환"되고, 그 전달 함수는 마스킹 임계값 자제의 크기로 설정된다. 이렇게 다시 복호화된 필터링된 신호뿐만 아니라 복호화기 측의 양자화 잡음 또한 마스킹 임계값의 형태나 형상에 맞추어 조정된다. 양자화 잡음을 최대한 마스킹 임계값에 가깝게 일치시키기 위해, 양자화를 실시하기 전에 이미 필터링된 신호에 적용된 증폭 값(a_#)이 각 파라미터 셋(set) 또는 각 파라미터에 대하여 부호화기 측에서 계산된다. 복호화기 측에서 재변환을 실행하기 위해, 증폭 값(a)과 파라미터(x)는 실제 메인 데이터와는 상관없는 별도의 부가 정보(910)로써, 즉, 필터링되고 양자화된 오디오 값(912)으로써, 부호화기로 전송된다. 중복성 감소 과정(914)에서, 예를 들면 부가 정보(910) 및 메인 데이터(912)와 같은 데이터는 무손실 압축, 즉, 엔트로피 부호화를 거치고, 그 결과 부 호화 신호를 얻는다.

전술한 논문에서 제시하고 있는 블록 크기는 128개의 샘플 값(906)에 해당한다. 이렇게 함으로써, 32kHz의 샘플링 율(sampling rate) 8ms에서 지연 시간은 비교적 짧아진다. 상세한 구현 예를 참조하고 있는 상기 논문에서 언급하고 있는 내용에 의하면, 부가 정보 부호화의 효율을 높이기 위해, 예를 들어, 특정 임계값을 넘은 변화가 발생한 경우에, 이미 전송되었던 파라미터 셋과 비교했을 때 변화가 충분하다면, 부가 정보, 즉, 계수(x_#, a_#)만이 전송된다.상기 상세한 구현 예에서는, 현재의 파라미터 셋이 각 블록이 포함하는 모든 샘플 값들에 직접적으로 적용되는 것이 아니라, 가청 부산물 (artifacts: 인공적으로 발생된 것: 인공물, 부산물, 등)을 방지하기 위해 필터 계수(x_#)의 선형 보간(linear interpolation)을 이용하는 것이 바람직하다. 상기 필터 계수에 대한 선형 보간을 실시하기 위해, 필터가 불안정(instability)하지 않도록 하는 격자(lattice) 구조가 제시되었다. 부호화 신호가 제어된 비트율을 갖는 것이 바람직한 경우에 있어서, 상기 논문에서 제시하는 바에 따르면, 필터링된 신호를 시간에 종속적인 증폭 인수(a)를 이용하여 스케일링한 후, 이 신호를 1이 아닌 인수를 이용하여 선택적으로 곱하거나 또는 감소(attenuating)시켜서 가청 간섭(audible interference)이 발생하도록 한다. 이때, 부호화하기 복잡한 오디오 신호가 있는 경우에는 비트율이 감소할 수 있다.

전술한 논문에서 언급된 오디오 부호화 기술에 따르면, 이미 많은 응용 분야에 있어서 지연 시간을 충분히 줄였지만, 상기 기술이 내포하고 있는 문제로써는, 일정 임계값을 초과하는 경우에는 필터 계수만이 전달되더라도, 마스킹 임계값을 전달해야 하는 요구 조건 또는 결과적으로 전처리 필터(pre-filter)라고 불리 우는 부호화기 측 필터의 전달 함수로 인하여, 전송 채널의 로드는 비교적 높다는 점을 들 수 있다.

상기 부호화 기술의 또 다른 문제점으로는, 마스킹 임계값 또는 그 역수가 전송될 파라미터 셋(x_#)에 의해서 복호화기 측에서 사용 가능해야 하므로, 한편으로는 최소 가능 비트율 및 고압축률, 다른 한편으로는 최대 정밀 근접 또는 마스킹 임계값 또는 그 역수의 파라미터화 사이의 절충점을 모색해야 한다는데 있다. 따라서, 상기 오디오 부호화 기술에 의한 마스킹 임계값에 맞추어진 양자화 잡음이 특정 주파수 범위에서 마스킹 임계값을 초과할 수밖에 없고, 그 결과 청취자는 오디오 간섭을 인지하게 된다. 예를 들어, 도 13의 그래프(c)는 복호화기 측 파라미터화 가능한 필터의 파라미터화 주파수 응답을 나타낸다. 도면에서 알 수 있듯이, 후처리 필터(post filter)라고 불리 우는 복호화기 측 필터의 전달 함수가 마스킹 임계값(b)을 초과하는 영역이 존재한다. 이러한 문제가 더욱 가중되는 이유는 파라미터가 전송될 때는 각 파라미터 간에 충분한 변화를 갖는 상태에서 단지 단속적으로(intermittently) 전송되고 그 사이의 값을 보간한다는 사실에서 기인한다. 상기 논문에서 제시했듯이, 노드와 다른 노드 간, 또는 새로운 파라미터와 또 다른 새로운 파라미터 간의 증폭 값(a_#)이 일정할 경우 필터 계수(x_#)를 보간하는 것만으로 가청 간섭을 초래할 수 있다. 상기 논문에서 제시한 보간 방식은, 전송된 증폭 값과 같은 부가 정보 값(a_#)에 적용되는 경우라도, 가청 오디오 부산물은 복호화기 측에 도달하는 오디오 신호에 남아 있을 수 있다.

도 12 및 도 13에 따른 오디오 부호화 기술의 또 다른 문제점은, 필터링된 신호가 예측 불가능한 형태를 띠고 있다는 점에 있는데, 이는 주파수 선택 필터링에 그 원인이 있다. 특히, 많은 개별 하모닉 파형들이 랜덤 하게 중첩되기 때문에, 부호화 신호에 대한 하나 이상의 개별 오디오 값들이 더해져서 매우 큰 값이 되는데, 그 결과 차후에 실행되는 중복성 감소 과정에서 중복성이 감소하는 경우가 드물게 되고, 결국 압축률이 저하된다.

본 발명의 목적은 보다 효과적인 오디오 부호화 구성을 제공하는 것이다.

상기 목적은 청구항 8 또는 청구항 10에 따른 방법과 청구항 1 또는 청구항 9에 따른 장치에 의해 달성된다.

상기 목적을 달성하기 위한 본 발명에 따른 오디오 신호 값의 시퀀스로 구성된 오디오 신호를 부호화 신호로 부호화하는 방법은, 오디오 값 시퀀스의 제 1 블록의 오디오 값을 위해 제 1 리스닝 임계값과 오디오 값 시퀀스의 제 2 블록의 오디오 값을 위해 제 2 리스닝 임계값을 결정하는 단계와; 전달 함수가 제 1 리스닝 임계값의 크기의 역수에 대하여 대응하는 것과 같은 파라미터화 가능한 필터(parameterizable filter : 30)의 제 1 파라미터화 버전(version)과 전달 함수가 제 2 리스닝 임계값의 크기의 역수에 대하여 대체로 대응하는 것과 같은 파라미터화 가능한 필터의 제 2 파라미터화 버전을 계산하는 단계와; 일정 블록에 대응하는 필터링된 블록의 오디오 값을 얻을 수 있는 상기 제 2 파라미터화의 버전에 의존하는 일정 방법에서 일정 파라미터화를 사용하는 상기 파라미터화 가능한 필터를 갖는 오디오 값의 일정 블록의 오디오 값을 필터링하는 단계와; 양자화되고 필터링된 블록의 오디오 값을 얻도록 상기 필터링된 오디오 값을 양자화하는 단계와; 적어도 상기 제 1 파라미터화의 상기 버전과 상기 제 2 파라미터화의 상기 버전 사이의 차를 포함하는 상기 제 1 파라미터화 버전과 상기 제 2 파라미터화 버전의 결합을 형성하는 단계와; 상기 양자화되고 필터링된 오디오 값과 상기 제 1 양자화 버전이 파생될 수 있고 부호화된 신호로의 결합하는 것을 포함하는 정보를 통합하는 단계를 포함한다.

본 발명의 주요한 개념은 고압축율(higher compression ratio)이 연속하는 파라미터의 차를 전송함으로써 달성될 수 있다.

더욱이, 파라미터 사이에 충분한 차가 있을 때만 파라미터의 전송이 이루어 진다면, 본 발명은 이러한 경우에도 역시 파라미터 차가 최소 차이수치 아래로 떨어지지 않을지라도, 그럼에도 불구하고 부호화기 측의 차를 계산하고, 부호화기측의 합계를 계산하는 부가적인 복잡성을 보다 많이 보상하는 파라미터화 대신에 2개의 파라미터화 사이의 차의 전송은 압축 증가를 제공할 것이다.

본 발명의 실시 예에 있어서 연속하는 파라미터화 사이의 순수 차는 전송되는데, 다른 실시 예에 있어서, 전송될 새로운 노드의 파라미터화로부터 시작하는 최소 임계값이 이들 차로부터 감해진다.

본 발명의 바람직한 실시 예는 첨부된 다음 도면을 참조하여 상세하게 설명한다.

도 1은 본 발명의 일 실시 예에 따른 오디오 부호화기의 블록 도이다.

도 2는 도 1에서 도시한 오디오 부호화기의 기능 모드를 데이터 입력 측에서 설명하기 위한 플로우차트이다.

도 3은 도 1에서 도시한 오디오 부호화기의 기능 모드를 음향 심리 모델을 이용하여 입력되는 오디오 신호의 평가에 대하여 설명하기 위한 플로우차트이다.

도 4는 도 1에서 도시한 오디오 부호화기의 기능 모드를 음향 심리 모델을 이용하여 구한 파라미터에 대하여 입력되는 오디오 신호에 적용한 경우를 설명하기 위한 플로우차트이다.

도 5(a)는 입력되는 오디오 신호, 오디오 값의 시퀀스, 및 오디오 값과 관련된 도 4의 동작 단계를 도시한 간략한 블록 도이다.

도 5(b)는 부호화 신호의 셋업을 도시한 간략한 블록 도이다.

도 6은 도 1에서 도시한 오디오 부호화기의 기능 모드를 부호화 신호를 얻기까지의 최종 단계에 관련하여 설명하기 위한 플로우차트이다.

도 7(a)는 본 발명의 일 실시 예에 따른 부호화 스텝 함수를 설명하기 위한 블록 도이다.

도 7(b)는 본 발명의 다른 실시 예에 따른 부호화 스텝 함수를 설명하기 위한 블록 도이다.

도 8은 본 발명의 일 실시 예에 따른 오디오 복호화기에 의해 부호화된 오디오 신호를 복호화할 수 있는 오디오 부호화기의 블록 회로도이다.

도 9는 도 8에서 도시한 오디오 복호화기의 기능 모드를 데이터 입력 측에서 설명하기 위한 플로우차트이다.

도 10은 도 8에서 도시한 오디오 복호화기의 기능 모드를, 미리 복호화되고 양자화되고 필터링된 오디오 신호를 버퍼링하는 단계 및 해당 부가 정보를 포함하지 않는 오디오 블록을 처리하는 단계에 관련하여 설명하기 위한 플로우차트이다.

도 11은 실제의 역 필터링에 관한 도 8의 복호화기의 기능 모드를 설명하는 플로우차트이다.

도 12는 짧은 지연 시간을 갖는 종래의 오디오 부호화 기술에 대하여 간략하게 도시하고 있는 도면이다.

도 13은 오디오 신호 스펙트럼, 리스닝 임계값, 및 복호화기의 후처리 필터에 대한 전달 함수를 보여 주는 그래프이다.

도 1은 본 발명의 일 실시 예에 따른 오디오 부호화기를 나타내는 도면이다. 상기 오디오 부호화기는 부재 번호 10으로 표기되었고, 부호화할 오디오 신호가 입력되는 데이터 입력(12)과 부호화 신호가 출력되는 데이터 출력을 포함한다. 데이터 입력(12)은 도 5(a)를 참조하여 후술하기로 한다. 데이터 입력(12)은 오디오 값들과 샘플 값들의 시퀀스로 이루어진다. 데이터 출력의 정보 내용은 도 5b를 참조하여 추후에 더욱 상세하게 설명한다.

도 1에서 도시된 오디오 부호화기(10)는 무관성 감소부(16) 및 중복성 감소부(18)로 구성된다. 무관성 감소부(16)는 리스닝 임계값 결정 수단(20), 증폭 값 계산 수단(22), 파라미터 계산 수단(24), 노드 비교 수단(26), 양자화기(28), 파라미터화 가능한 전처리 필터(30), 입력 FIFO (first in first out) 버퍼(32), 버퍼 또는 메모리(38), 그리고 곱셈기 또는 곱셈 수단(40)을 포함한다. 중복성 감소부(18)는 압축기(34) 및 비트율 제어기(36)를 포함한다.

무관성 감소부(16) 및 중복성 감소부(18)는 이 순서대로 데이터 입력(12) 및 데이터 출력(14) 사이에서 직렬로 연결된다. 특히, 데이터 입력(12)은 리스닝 임계값 결정 수단(20)의 데이터 입력 및 입력 버퍼(32)의 데이터 입력과 연결된다. 리스닝 임계값 결정 수단(20)의 데이터 출력은 파라미터 계산 수단(24)의 입력 및 동일하게 결정된 리스닝 임계값을 전달하기 위한 증폭 값 계산 수단(22)의 입력에 연결된다. 증폭 값 계산 수단(22) 및 파라미터 계산 수단(24)은 리스닝 임계값에 따라서 파라미터 또는 증폭 값을 계산하며, 그 결과를 동일하게 전달하기 위해서 노드 비교 수단(26)에 연결된다. 비교 결과에 따라, 후술할 노드 비교 수단(26)은 증폭 값 계산 수단(22) 및 파라미터 계산 수단(24)에 의해서 계산된 결과를 입력 파라미터 또는 파라미터로써 파라미터화 가능한 전처리 필터(30)로 전달한다. 파라미터화 가능한 전처리 필터(30)는 입력 버퍼(32)의 데이터 출력과 버퍼(38)의 데이터 입력 사이에 연결되어 있다. 곱셈기(40)는 버퍼(38)의 데이터 출력과 양자화기(28) 사이에 연결된다. 양자화기(28)는 선택적으로 증폭되거나 스케일화될 수 있고, 필수적으로 양자화되는 필터링된 오디오 값들을 중복성 감소부(18)로, 더욱 상세하게는, 압축기(34)의 데이터 입력으로 전달한다. 노드 비교 수단(26)은 정보를 전달하며, 이 정보를 통해서 파라미터화 가능한 전처리 필터(30)로 전달된 입력 파라미터들이 중복성 감소부(18), 더욱 정확하게는 압축기(34)의 또 다른 데이터 입력으로 파생될 수 있다. 비트율 제어기(36)는 파라미터화 가능한 전처리 필터(30)로부터 전송된 양자화 필터 오디오 값이 곱셈기(40)에 의해서 적절한 피승수로 곱해지도록 제공되는 제어 연결을 통해서 곱셈기(40)의 제어 입력에 연결된다. 이에 대해서는 추후에 더욱 상세하게 기술한다. 비트율 제어기(36)는 압축기(34)의 데이터 출력과 오디오 부호화기(10)의 데이터 출력(14) 사이에 연결되어, 곱셈기(40)의 피승수를 적절한 방식으로 결정한다. 각각의 오디오 값이 최초로 양자화기(40)로 전달되는 경우, 피승수는 처음에는 적절한 스케일링 인수로 설정된다. 예를 들면, 1로 설정될 수 있다. 그러나 버퍼(38)는 각 필터 오디오 값을 계속해서 저장함으로써 비트율 제어기(36)가 오디오 값들로 이루어진 블록을 전달하기 위한 피승수를 변경할 수 있도록 하며, 이에 대해서는 추후에 상세하게 기술한다. 비트율 제어기(36)가 이러한 변경을 실행하지 않는 경우에는, 버퍼(38)는 상기 블록에 할당되어 있는 메모리를 해제한다.

도 1의 오디오 부호화기의 셋업에 대하여 먼저 설명한 후에, 도 2 내지 도 7b를 참조하여 기능 모드에 대해서 기술한다.

도 2에서 알 수 있듯이, 오디오 입력(12)에 도달했을 때, 오디오 신호는 이미 아날로그 오디오 신호로부터 오디오 신호 샘플링(50)을 통해서 얻어진다. 오디오 신호는 일정 샘플링 주파수에서 샘플링된다. 일정 샘플링 주파수는 일반적으로 32~48kHz 사이의 값이다. 그 결과, 샘플 값 또는 오디오 값의 시퀀스로 구성된 오디오 신호가 데이터 입력(12)이 된다. 오디오 신호의 부호화가 블록 기반으로 진행되지는 않지만, 후술 되는 내용을 통해서 명백해 지겠지만, 제 52단계에서, 데이터 입력(12)에서 오디오 값들은 최초로 결합하여 오디오 블록들을 형성한다. 오디오 블록들을 형성하기 위한 결합은 후술 되는 내용을 통해 명백해 지겠지만, 리스닝 임계값을 결정하는 목적으로만 행해 지고, 리스닝 임계값 결정 수단(20)의 입력단에서 일어난다. 본 실시 예에서는, 128개의 연속된 오디오 값들이 각각 결합하여 오디오 블록들을 형성하고 있고, 이러한 결합은 한편으로는 연속된 오디오 블록들이 오버랩되지 않고, 다른 한편으로는 서로 이웃하는 블록을 향하도록 행해 지는 것으로 예시하고 있다. 이는 도 5(a)를 참조하여 간단하게 기술한다.

도 5(a)에서, 부재 번호 54는 샘플 값들의 시퀀스를 나타내며, 각 샘플 값은 사각형(56)으로 도시되어 있다. 샘플 값들은 예시적인 것으로, 명확한 설명을 위해서 시퀀스(54)의 일부 샘플 값들만이 도시되어 있다. 128개의 연속된 샘플 값들은 시퀀스(54)에서 중괄호로 묶여서 표시되어 있으며, 각각의 샘플 값들은 본 실시 예에 따라 결합하여 블록을 형성하고 있다. 이때, 바로 옆에 계속되는 128개의 샘플은 다음 블록을 형성한다. 각 블록을 형성하기 위한 결합은 다른 방식으로 실행될 수도 있다. 예를 들면, 블록들이 겹쳐지거나 또는 떨어져 있을 수 있고, 비록 128개의 블록 사이즈가 고음질과 최소한의 지연 시간 사이에서 바람직한 절충점으로써 선호되기는 하지만, 블록 크기는 이와 다를 수 있다.

제52단계에서 리스닝 임계값 결정 수단(20)에 의해서 결합된 오디오 블록들 은 리스닝 임계값 결정 수단(20)에서 블록 단위로 처리된다. 반면에, 후술한 바와 같이, 입력되는 오디오 값들은 파라미터화 가능한 전처리 필터(30)가 전처리 필터링을 실행하기 위해 노드 비교 수단(26)으로부터 입력 파라미터들을 얻을 때까지 입력 버퍼(32)로 버퍼링(54)된다.

도 3에서 알 수 있듯이, 한 개의 오디오 블록을 형성하기 위해, 또는 그 다음의 오디오 블록을 형성하기 위해 데이터 입력(12)에서 충분한 오디오 값들이 입력된 직후에, 제60단계에서 리스닝 임계값 결정 수단(20)의 처리가 시작되어, 리스닝 임계값 결정 수단(20)이 검사를 통해서 감시한다. 처리 가능한 완전한 오디오 블록이 없는 경우에, 리스닝 임계값 결정 수단(20)은 대기한다. 처리해야 하는 완전한 오디오 블록이 존재하는 경우, 제62단계에서 리스닝 임계값 결정 수단(20)은 적절한 음향 심리 모델에 기초하여 리스닝 임계값을 계산한다. 리스닝 임계값을 설명하기 위해 다시 도 12를 참조한다. 특히, 음향 심리 모델에 기초하여, 예를 들어, 스펙트럼(a)의 현재의 오디오 블록에 관한 그래프(b)를 참조한다. 제 62단계에서 결정되는 마스킹 임계값은 주파수 의존적인 함수로써 연속된 오디오 블록들에 대하여 변할 수 있고, 또한 한 오디오 신호에서 다른 오디오 신호에 따라, 예를 들면, 록에서 클래식에 이르기까지 크게 변할 수 있다. 리스닝 임계값은 각 주파수에 대해서 한 임계값을 나타내고 있는데, 이 임계값보다 작은 값에서는 인간의 청력으로 간섭을 인지할 수 없다.

다음 단계인 제 64단계에서, 파라미터 계산 수단(24) 및 증폭 값 계산 수단(22)은 리스닝 임계값 M(f) (여기서, f는 주파수를 의미한다)으로부터 증폭 값(a) 또는 N개의 파라미터 x(i) (i = 1,…, N)의 파라미터 셋을 계산한다. 파라미터 계산 수단(24)이 제 64단계에서 계산한 파라미터 x(i)는 LPC (linear predictive coding) 부호화에서 사용되는 것과 같은 적응 필터 구조로 구현되는 파라미터화 가능한 전처리 필터(30)에 제공된다. 예를 들어, 현재 오디오 블록에 있어서의 128개의 오디오 값들을 s(n)(n = 0, …, 127)이라 하고, 128개의 오디오 값들을 필터링한 결과를 s´(n)라고 하면, 필터는 다음 식을 통해서 구할 수 있다.

여기서, K는 필터 차수를 나타내고,

, (k = 1, …,K)는 필터 계수들을 나타내고, t는 필터 계수들이 연속적인 오디오 블록들에서 변하는 것을 나타내는 인덱스이다. 파라미터 계산 수단(24)은 파라미터

를 계산하여, 파라미터화 가능한 전처리 필터(30)의 전달 함수 H(f)가 대략 마스킹 임계값 M(f)의 크기의 역수와 같도록 한다. 예를 들면 다음 식이 성립한다.

여기서, t에 대한 종속성은 결과적으로 마스킹 임계값 M(f)이 다른 오디오 블록들에 대해서 변하는 것을 나타낸다. 전술한 적응 필터로써 파라미터화 가능한 전처리 필터(30)를 구현하는 경우, 필터 계수

는 다음과 같이 구한다. 즉, 시간 t에서, 블록의 주파수에 대한 푸리에 변환│M(f,t)│²의 이산 역수는 목적 자기 상관 함수(auto-correlation function)

가 된다. 필터 계수

는 다음의 선형 방정식을 풀어서 구한다.

후술할 선형 보간법에서, 파라미터 간에서 발생하는 불안정성을 없애기 위해서, 필터(30)는 격자 구조로 구성되는 것이 바람직하다. 이때, 격자 구조에 대한 필터 계수는 미리 파라미터화하여 반사 계수를 형성한다. 전처리 필터의 설계, 계수들의 계산, 및 재 파라미터화에 대한 더욱 상세한 설명에 대해서는, 명세서의 앞 부분에서 언급했던 Schuller 등에 의한 논문에서, 특히, 제 3장의 381쪽에서 언급되어 있고, 본 명세서에서 이를 참고로 여기에 합체한다.

파라미터 계산 수단(24)은 파라미터화 가능한 전처리 필터(30)에 대해서 파라미터를 계산하여 그 전달 함수가 마스킹 임계값의 역수와 같아지도록 하는 반면에, 증폭 값 계산 수단(22)은 리스닝 임계값에 기초하여 잡음 파워 한계를 계산한다. 후처리 필터링 또는 역 필터링 후에 복호화기 측의 양자화 잡음이 리스닝 임계값 M(f) 보다 작거나 정확하게 일치하도록 하기 위해, 잡음 파워 한계는 양자화기(28)가 어떤 잡음 파워에서 전처리 필터(30)에 의해 필터링된 오디오 신호에 이용되는가를 나타낸다. 증폭 값 계산 수단(22)은, 리스닝 임계값 M의 크기의 제곱 보다 적은 영역으로써, 이러한 잡음 파워 한계 (예,Σ│M(f)│²)를 계산한다. 증폭 값 계산 수단(22)은 잡음 파워 한계로 나눈 양자화 잡음 파워의 분수의 제곱근을 계산함으로써 증폭 값(a)을 잡음 파워 한계로부터 계산한다. 양자화 잡음은 양자화기(28)에 의해서 발생한 잡음이다. 양자화기(28)에 의해 발생한 잡음은 후술된 바와 같이 백색 잡음이므로 주파수에 독립적이다. 양자화 잡음 파워는 양자화 잡음의 제곱이다.

상술한 설명에서처럼, 증폭 값 계산 수단(22)도 증폭 값(a)과는 별도로 잡음 파워 한계를 계산한다. 노드 비교 수단(26)은 증폭 값 계산 수단(22)으로부터 구한 증폭 값(a)으로부터 잡음 파워 한계를 다시 계산할 수 있지만, 증폭 값 계산 수단(22)은 결정된 잡음 파워 한계를 증폭 값(a)과는 별도로 노드 비교 수단(26)으로 전송할 수도 있다.

증폭 값 및 파라미터를 계산한 후, 제 66단계에서, 노드 비교 수단(26)은 방금 계산된 파라미터와 파라미터화 가능한 전처리 필터(30)에 전달된 현재의 마지막 파라미터와의 차이가 일정 임계값보다 더 큰지 확인한다. 제 66단계의 확인 결과, 방금 계산된 파라미터와 현재의 파라미터의 차이가 일정 임계값보다 크다면, 방금 계산된 필터 계수 및 방금 계산된 증폭 값 또는 잡음 파워 한계는 후술할 보간법에 사용되기 위해서 노드 비교 수단(26)에 버퍼링 되고, 제 68단계에서, 노드 비교 수단(26)은 방금 계산된 필터 계수를 전처리 필터(30)로 전달하고, 제 70단계에서, 방금 계산된 증폭 값을 파라미터화 가능한 전처리 필터(30)로 전달한다. 그러나 이러한 경우가 아니고, 방금 계산된 파라미터와 현재의 파라미터와의 차이가 일정 임계값 이상이 아니라면, 제 72단계에서, 노드 비교 수단(26)은 방금 계산된 파라미터 대신에 현재의 노드 파라미터만을 파라미터화 가능한 전처리 필터(30)로 전달한다. 예를 들면, 현재의 노드 파라미터는 제 66단계에서 긍정적인 결과를 얻은 파라미터로써, 이전의 노드 파라미터와의 차이가 일정 임계값 이상이 될 수 있다. 제 70단계 및 제 72단계 후에, 도 3의 단계는 다음 오디오 블록을 처리하는 단계, 예를 들면, 쿼리 단계(60)로 돌아간다.

방금 계산된 파라미터가 현재의 노드 파라미터와 다르지 않고, 결과적으로 제 72단계에서 전처리 필터(30)가 적어도 마지막 오디오 블록에 대해서 이미 구한 노드 파라미터를 다시 구한 경우에, 가능한 전처리 필터(30)는 이 노드 파라미터를 FIFO(32)에 저장된 이 오디오 블록의 모든 샘플 값들에 적용하게 되고, 이에 대해서는 추후 논의된다. 이렇게 하여, 현재의 블록은 FIFO(32)로부터 추출되고, 양자화기(28)는 전처리 필터링된 오디오 값들로부터 얻어진 오디오 블록을 입력받는다.

도 4는 방금 계산된 파라미터 및 방금 계산된 증폭 값을 입력받은 경우에 있어서 파라미터화 가능한 전처리 필터(30)의 기능 모드를 더욱 상세하게 도시한 것이다. 이때, 상기 값들은 현재의 노드 파라미터와 크게 다르다. 도 3을 참조하면, 연속된 오디오 블록 각각에 대한 도 4에 따른 단계는 도시되지 않았고, 단지 현재 노드 파라미터와는 크게 다른 각 파라미터의 오디오 블록들만이 도시되었다. 전술한 바와 같이 다른 오디오 블록들은 각각 이들 오디오 블록들의 샘플 값들에 대하여 현재 노드 파라미터 및 해당 현재 증폭 값을 적용함으로써 전처리 필터링된 다.

제 80단계에서, 파라미터화 가능한 전처리 필터(30)는 방금 계산된 필터 계수 또는 오래된 노드 파라미터들이 노드 비교 수단(26)으로부터 전달되었는지를 확인한다. 전처리 필터(30)는 이러한 전달 과정이 발생할 때까지 확인 과정(80)을 수행한다.

이러한 전달 과정이 발생하자마자, 파라미터화 가능한 전처리 필터(30)는 버퍼(32)에 저장된 오디오 값들의 현재 오디오 블록을 처리하기 시작한다. 버퍼(32)에 대한 파라미터는 방금 계산된 상태이다. 도 5(a)에서, 0의 값을 갖는 오디오 값 이전에 위치하는 모든 오디오 값들(56)은 이미 처리된 후 메모리(32)로 전달된 상태를 예로 들어 도시하였다. 블록(0), 즉, x₀(i), 앞의 오디오 블록에 대하여 계산된 파라미터는 전에 전처리 필터(30)로 전달된 노드 파라미터와는 일정 임계값 이상 다르기 때문에, 0으로 표기된 오디오 값 앞에 위치한 오디오 값들의 블록은 처리된 상태이다. 파라미터(x₀(i))는 본 발명에서 기술했듯이 노드 파라미터이다. 0으로 표기된 오디오 값 앞에 위치하는 오디오 블록의 오디오 값들은 파라미터 셋(a₀, x₀(i))에 기초하여 처리된다.

도 5(a)에서, 0부터 127에 해당하는 오디오 값들을 포함하는 블록(0)에 대해서 계산된 파라미터와 앞에 있는 블록에서 참조하는 파라미터 x₀(i)와의 차이는 일정 임계값 이하이다. 따라서 블록(0)은 전처리 필터(30)에 의해서 FIFO(32)의 밖 으로 추출된다. 여기서, 제 72단계에서 제공된 파라미터 x₀(i)를 이용하여 0부터 127까지의 모든 샘플 값들에 대해서 화살표(81)에 "직접 적용"이라고 표기되어 있는 것처럼 동등하게 처리된 후에, 양자화기(28)로 전달된다.

블록(1)에 대하여 계산된 파라미터는 여전히 FIFO(32)에 위치하고 있으나, 도 5(a)를 참조하면, 파라미터(x₀(i))와의 차이는 일정 임계값 이상이고, 따라서 제 68단계에서는 파라미터(x₁(i))로써, 증폭 값(a1)(제 70단계) 과 함께, 가능하다면 해당 잡음 파워 한계와 함께, 전처리 필터(30)로 전달된다. 이때, 도 5의 인덱스(a, x)는 노드들의 인덱스이고, 후술할 보간법에서 이용하게 된다. 보간법은 블록(1)의 샘플 값들(128-255)에 대해서 실시되고, 화살표(82)로 표기되었고, 도 4의 제 80단계 이후의 단계들에 의해서 구현된다. 제 80단계에서, 1로 표기된 오디오 블록이 발생한 경우에 처리가 시작된다.

파라미터 셋(a₁, x₁)이 전달되는 시점에서 메모리(32)에 존재하는 블록은 오디오 값들(128-255), 예를 들어, 마지막 오디오 블록(0)이 전처리 필터(30)에 의해서 처리된 후의 현재 오디오 블록들뿐이다. 제 80단계에서 노드 파라미터x₁(i)를 전달하기로 결정한 후, 제 84단계에서 전처리 필터(30)는 증폭 값(a₁)에 대응하는 잡음 파워 한계(q₁)를 결정한다. 전술한 제 64단계에서 설명했듯이, 이러한 과정이 실행될 때는, 이 값을 전처리 필터(30)로 전달하는 노드 비교 수단(26) 또는 이 값을 다시 계산하는 전처리 필터(30)가 사용된다.

다음으로, 제 86단계에서 인덱스(j)가 샘플 값으로 초기화되어 FIFO 메모리(32)에 남아 있는 가장 오래된 샘플 값 또는 현재 오디오 블록(블록(1))의 첫 번째 샘플 값 (예를 들어, 도 5의 예제에서 샘플 값(120))을 나타낸다. 제 88단계에서, 파라미터화 가능한 전처리 필터(30)는 필터 계수(x₀)와 필터 계수(x₁)를 보간한다. 이때, 파라미터 (x₀)는 이전 블록(0)의 오디오 값의 숫자인 127을 갖는 노드에서의 노드 역할을 한다. 또한, 파라미터(x₁)는 현재 블록(1)의 오디오 값의 숫자인 255를 갖는 노드에서 노드 역할을 한다. 결과적으로, 오디오 값 위치(127, 255)는 노드(0) 및 노드(1)로 참조되고, 이때, 도 5(a)에서 도시된 노드들을 참조하는 노드 파라미터들은 화살표(90) 및 화살표(92)로 표시되었다.

제 88단계에서, 파라미터화 가능한 전처리 필터(30)는 상기 두 노드 간의 필터 계수(x₀)와 필터 계수(x₁)를 선형 보간 형식으로 보간하여, 샘플 위치 (j) (예를 들어, x(t_j)(i), (i = 1 ,…,N))에서 보간된 필터 계수들을 구한다.

다음으로, 제 90단계에서, 파라미터화 가능한 전처리 필터(30)는 잡음 파워 한계(q₁)와 잡음 파워 한계(q₀)를 보간하여, 샘플 위치(j)(예, q(t_j))에서 보간된 잡음 파워 한계를 구한다.

제 92단계에서, 파라미터화 가능한 전처리 필터(30)는 결과적으로 보간된 잡음 파워 한계 및 양자화된 잡음 파워에 기초하여 샘플 위치(j)에 대하여 증폭 값을 계산한다. 또한, 바람직하게는, 보간된 필터 계수들, 즉, 예를 들 어,

의 제곱근에 의존적인 값들을 계산한다. 도 3의 제 64단계를 설명할 때 이를 참조한다.

다음으로, 제 94단계에서, 파라미터화 가능한 전처리 필터(30)는 계산된 증폭 값 및 보간된 필터 계수들을 샘플 위치(j)에서의 샘플 값에 적용하여, 이 샘플 위치(예를 들어, s´(t_j))에서의 필터링된 샘플 값을 구한다.

다음으로, 제 96단계에서, 파라미터화 가능한 전처리 필터(30)는 샘플 위치(j)가 현재 노드가 도달했는가를 확인한다. 현재 노드는 노드(1)일 수 있고, 도 5(a)인 경우에는, 샘플 위치(255), 즉, 증폭 값 이외에 파라미터화 가능한 전처리 필터(30)로 전달되는 파라미터가 보간 등에 의하지 않고 직접적으로 유효하게 되는 샘플 값이 될 수 있다. 그 밖의 경우라면, 파라미터화 가능한 전처리 필터(30)는 인덱스(j)를 1만큼 증가시키고, 제 88단계 내지 제 96단계가 반복된다. 제 96단계의 확인 결과가 긍정적인 경우라면, 제 100단계에서 파라미터화 가능한 전처리 필터(30)는 노드 비교 수단(26)으로부터 전송된 최종 증폭 값 및 노드 비교 수단(26)으로부터 전송된 최종 필터 계수 값들을 보간에 의하지 않고 직접 새로운 노드에서의 샘플 값에 적용한다. 이때, 현재 블록, 즉, 블록(1)이 처리된다. 또한, 다음 오디오 블록(블록(2))의 파라미터가 파라미터(x₁(i))와 크게 다른지의 여부에 따라서, 처리되어야 하는 다음 블록과 관련된 제 80단계가 다시 실시된다. 이때, 다음 블록은 다음 오디오 블록(블록(2)) 또는 그 다음의 다른 오디오 블록일 수 있다.

도 3 및 도 4를 참조하여 상기 단계의 목적 및 배경에 대하여 먼저 기술하고, 필터링된 샘플 값들(s´)을 처리하는 경우의 단계를 도 5를 참조하여 설명하기로 한다. 필터링의 목적은 적응 필터를 이용하여 입력(12)에서의 오디오 신호를 필터링하는데 있다. 그 전달 함수는 리스닝 임계값의 역수에 최대한 근접하도록 계속해서 조정되는데, 이는 시간이 흐를수록 변하게 된다. 이렇게 하는 이유는, 복호화기 측에서 전달 함수를 역 필터링할 때, 전달 함수를 계속해서 리스닝 임계값에 맞추어 조정해야 하는, 다시 말하면, 리스닝 잡음의 형태와 동일하게 조정해야 하는 경우에, 필터링된 오디오 신호를 적응 필터 등에 의해 양자화함에 따라서 주파수가 일정한 양자화 잡음과 같은 백색 양자화 잡음이 발생하기 때문이다.

제 94단계 및 제 100단계에서, 전처리 필터(30)에 대한 증폭 값의 적용이란 오디오 신호 또는 필터링된 오디오 신호, 즉, 샘플 값들(s) 또는 필터링된 샘플 값들(s´)을 증폭 인수로 곱하는 것이다. 이는 추후 상세히 기술할 양자화에 의해 필터링된 오디오 신호로 도입되는 양자화 잡음을 설정하기 위함이고, 또 복호화기 측에서 역 필터링하여 리스닝 임계값의 한계를 초과하지 않도록 최대한으로 리스닝 임계값의 형태에 맞추어 조정하기 위함이다. 이는 Parsevals 공식에 의해 예시될 수 있는데, 이 공식에 따르면 함수의 크기의 제곱은 푸리에 변환 크기의 제곱과 같아진다. 복호화기 측에서, 증폭 값을 오디오 신호에 곱한 결과는, 필터링된 오디오 신호를 증폭 값으로 나눌 때 다시 반전되며, 양자화 잡음 파워는 인수(a^-2, a )만큼 감소하여, 증폭 값이 된다. 결과적으로, 양자화 잡음 파워는 증폭화 값을 전 처리 필터(30)에 적용함으로써 최적인 최대 상태로 설정될 수 있다. 이는 양자화 스텝 크기가 증가함을 의미하고, 따라서 부호화되는 양자화 스텝의 수는 줄어들게 되어, 결과적으로 중복성 감소부에의 압축은 향상된다.

반면에, 전처리 필터(30)의 효과는 신호를 마스킹 임계값에 정규화하는 것으로 간주할 수 있으며, 그 결과 양자화 간섭 또는 양자화 잡음의 레벨이 시간 및 주파수에 대하여 일정하게 유지될 수 있다. 오디오 신호가 시간 도메인에 있는 경우, 양자화는 일정하고 균일하게 단계적으로 실시되며, 이는 추후에 논의된다.. 이러한 방식에 의해, 가능한 어떠한 무관성도 원 신호로부터 이론적으로 제거가능하고, 양자화되고 전처리 필터링된 오디오 신호에서 남아 있는 무관성을 제거하는데 무손실 압축 기술이 사용될 수 있다. 이는 추후에 논의된다.

도 5(a)를 참조하면, 물론 사용된 필터 계수들 및 증폭 값들(a₀, a₁, x₀, x₁)은 반드시 복호화기 측에서 부가 정보로써 사용 가능해야 함이 명백하다. 이러한 값들을 전달함에 있어서의 복잡도를 해결하려면, 새로운 필터 계수들 및 각 블록에 대한 새로운 증폭 값들을 사용하지 않으면 된다. 다시 말하면, 임계값 확인 단계(66)는 충분한 파라미터 변경을 포함한 부가 정보로써 파라미터를 전달할 때만 실행되고, 그렇지 않은 경우에는 부가 정보 또는 파라미터들을 전송하지 않는다. 오래된 파라미터부터 새로운 파라미터까지, 상기 파라미터들을 이미 수신한 오디오 블록들을 보간한다. 제 88단계에서 필터 계수들은 전술한 방식에 의해서 보간된다. 증폭에 대한 보간은 우회적으로, 즉, 잡음 파워 한계(q₀, q₁)의 선형 보간 단 계(90)를 거쳐서 실시된다. 증폭 값을 통한 직접 보간법과 비교해 보면, 선형 보간법이 더 향상된 리스닝 결과를 보여 주고, 잡음 파워 한계에 관한 가청 부산물은 더 적어진다.

다음으로, 전처리 필터링된 신호의 다음 단계를 도 6을 참조하여 설명한다. 기본적으로는 양자화 및 중복성 감소에 대한 설명을 포함한다. 우선, 파라미터화 가능한 전처리 필터(30)에서 출력된 필터링된 샘플 값들이 버퍼(38)에 저장되고, 동시에 버퍼(38)로부터 곱셈기(40)로 전달되도록 한다. 처음 전송되는 것이므로, 곱셈기(40)에 의해서 스케일링 인수 등이 변경되지 않은 상태로 양자화기(28)로 최초로 전송된다. 상한선 이상으로 필터링된 오디오 값들은 제 110단계에서 삭제되고, 제 112단계에서 양자화된다. 단계 110 및 단계 112는 양자화기(28)에 의해서 실행된다. 특히, 단계 110 및 단계 112는 상기 필터링된 오디오 신호들(s´)을 양자화함으로써 양자화 스텝 함수를 이용하여 양자화기(28)에 의해 한번에 실행되는 것이 바람직하다. 양자화 스텝 함수는 부동 소수점 영역에 예시적으로 존재하는 필터링된 샘플 값들(s´)을 다수의 정수 양자화 스텝 값들 또는 인덱스로 매핑한다. 임계값보다 큰 필터링된 샘플 값들이 양자화되어 하나의 양자화 스텝 또는 동일한 양자화 스텝이 되도록, 양자화 스텝 함수는 필터링된 샘플 값들에 대해서 특정 임계값으로부터 평평한 경사 갖는다. 이러한 양자화 스텝 함수의 일 예가 도 7(a)에 도시되어 있다.

도 7(a)에서 필터링되고 양자화된 샘플 값들은 기호(σ´)로 나타내었다. 양자화 스텝 함수는 임계값보다 작은 상수의 스텝 크기를 갖는 것이 바람직하다. 즉, 다음 양자화 스텝으로의 점프는 입력 값들(s´)을 따라서 일정한 간격으로 항상 발생한다. 상기 실시 예에서, 임계값에 대한 스텝 크기는 양자화 스텝의 수가 2의 제곱에 대응되도록 조정하는 것이 바람직하다. 입력되는 필터링된 샘플 값들(s´)이 속한 부동 소수점 영역과 비교해 보면, 부동 소수점 영역으로 표시된 부분에서의 최대값이 임계값을 초과할 수 있도록, 상기 임계값은 작은 값을 갖는다.

그 이유는, 전처리 필터(30)에 의해 출력된 필터링된 오디오 신호에 포함되는 오디오 값 중에는, 때로는 하모닉 파형들이 바람직하지 않게 축적되어 매우 큰 값으로 가산되는 오디오 값들이 포함하는 것이 알려져 있기 때문이다. 또한, 도 7(a)에서 도시한 앙쟈화 스텝 함수에 의해서 달성되는 것처럼, 이러한 값들을 제거함으로써 데이터가 크게 감소되지만, 음질의 손상은 적다고 알려져 있다. 다시 말하면, 필터링된 오디오 신호에서 이러한 특정 위치들이 형성될 때는 파라미터화 가능한 전처리 필터(30)에서 주파수 선택 필터링을 사용하여 이들을 제거하더라도 음질 손상이 거의 없도록 인위적으로 형성된다.

도 7(a)에서 도시한 양자화 스텝 함수에 대한 더욱 상세한 예로는, 모든 필터링된 샘플 값들(s´)을 임계값에 이르기까지 바로 다음 정수로 반올림한 후, 최대 양자화 스텝 (예를 들면, 256)보다 큰 값으로 필터링된 모든 샘플 값들을 양자화한다. 이러한 경우는 도 7(a)에서 도시하고 있다.

양자화 스텝 함수의 또 다른 예가 도 7(b)에 도시되어 있다. 임계값에 이르기까지, 도 7(b)에서 도시된 양자화 스텝 함수는 도 7(a)에서 도시된 함수에 상응한다. 양자화 스텝 함수에서, 임계값 이상의 샘플 값들(s´)에 대하여 갑자기 평 평한 경사를 갖기보다는, 임계값보다 작은 영역에서의 경사보다 더 작은 경사가 계속된다. 반면에, 양자화 스텝 크기는 임계값보다 크다. 그 결과, 도 7(a)에서 도시한 양자화 함수와 비슷한 유사 효과를 이룰 수 있지만, 반면에 임계값보다 큰 또는 작은 양자화 스텝 함수의 다른 스텝 크기들로 인해서 더욱 복잡해 진다. 한편, 필터링 정도가 매우 높은 오디오 값들(s´)이 완전히 제거되지 않고 단지 양자화 스텝 크기보다 크게 양자화될 뿐이므로 음질은 개선된다.

전술한 바와 같이, 부호화기 측에서는, 필터링되고 양자화된 오디오 값들(σ´)이 반드시 사용 가능할 뿐 아니라, 전처리 필터(30)에 대한 입력 파라미터들이 이러한 값들, 즉, 해당 증폭 값에 대한 힌트를 포함하는 노드 파라미터를 필터링하는데 있어서 기초가 되어야 한다. 제 114단계에서, 압축기(34)는 최초의 압축을 시도한 후, 127 및 255와 같은 노드들에서의 증폭 값들(a₀, a₁)을 포함하는 부가 정보, 상기 노드들에서의 필터 계수들(x₀, x₁), 및 필터링되고 양자화된 샘플 값들(σ´)을 일시적으로 필터링된 신호로 압축한다. 압축기(34)는 무손실 부호화기로서, 예측 및/또는 적응 기능이 있거나 또는 없는 호프만 부호화기 또는 산술 부호화기일 수 있다.

샘플링된 오디오 값들(σ´)이 전달되는 메모리(38)는 버퍼로써 기능한다. 이때 버퍼의 블록 크기란 압축기(34)가 오디오 값들(σ´)을 처리하는데 적절한 크기를 말하고, 오디오 값들(σ´)은 양자화기(28)에서 출력되며, 전술한 바와 같이 필터링되고, 양자화되고, 또한 스케일링된 상태이다. 상기 블록 크기는 리스닝 임 계값 결정 수단(20)에서 사용되었던 오디오 블록들의 블록 크기와는 다를 수 있다.

*전술한 바와 같이, 비트율 제어기(36)는 최초 압축 시도에서는 피승수 1을 사용하여 곱셈기(40)를 제어하여, 필터링된 오디오 값들이 전처리 필터(30)에서 양자화기(28)를 거치는 동안에, 또 그 결과 필터링되고 양자화된 오디오 신호들이 압축기(34)를 거치는 동안에 변하지 않도록 한다. 제 116단계에서, 압축기(34)는 특정 압축 블록 크기가, 즉, 샘플링 되고 양자화된 오디오 값들의 일정 개수가, 임시 부호화된 신호로 부호화되었는지 아닌지를 감시하거나, 또는 필터링되고 양자화된 오디오 신호들(σ´)이 현재의 임시 부호화된 신호로 부호화 될 것인지 아닌지를 감시한다. 상기 압축 블록 크기에 도달하지 못했다면, 압축기(34)는 현재 압축 단계(114)를 계속 실시한다. 상기 압축 블록 크기에 도달했다면, 제 118단계에서 비트율 제어기(36)는 압축 단계에서 요구되는 비트 크기가 바람직한 비트율에 명시된 크기보다 큰지 아닌지를 확인한다. 상기 조건을 만족하지 않는 경우, 제 120단계에서 비트율 제어기(36)는 요구되는 비트 크기가 바람직한 비트율에서 지시한 비트 크기보다 작은지 아닌지를 확인한다. 상기 조선을 만족하는 경우, 제 122단계에서 비트율 제어기(36)는, 바람직한 비트율에서 지시한 비트 크기에 도달할 때까지 부호화된 신호를 필러(filler) 비트로 채운다. 다음으로, 제 124단계에서, 부호화된 신호가 출력된다. 제 122단계 대신에 실행될 수 있는 단계로써, 비트율 제어기(36)는 메모리(38)에 여전히 저장되어 있는 필터링된 오디오 값들(σ´)의 압축 블록을 양자화기(28)로 전달하는데, 여기서 압축 블록의 최종 압축은 곱셈기(40)가 1보다 큰 피승수로 곱하여 이루어진다. 또한, 점선으로 도시된 제 125단계에서 나타낸 바와 같이, 바람직한 비트율에서 지시한 비트 크기에 도달할 때까지, 다시 제 110단계 내지 제 118단계를 거친다.

제 118단계에서의 확인 결과 요구되는 비트율이 바람직한 비트율에서 지시한 것보다 큰 경우에, 비트율 제어기(36)는 곱셈기(40)가 피승수를 0과 1 사이로 제한된 인수만 가질 수 있도록 변경한다. 이 과정은 제 126단계에서 실행된다. 제 126단계 후, 비트율 제어기(36)는 압축에 사용되는 필터링된 오디오 신호들(σ´)의 최종 압축 블록을 재출력을 위해 메모리(38)로 제공한다. 이때, 이 값들을 제 126단계에서 설정한 인수로 곱하고, 그 결과는 다시 양자화기(28)로 제공된다. 여기서 제 110단계 내지 제118단계가 다시 실행되고, 그 결과 그때까지 일시적으로 부호화되었던 신호는 제거된다.

제 110단계 내지 제 116단계를 다시 실시하는 경우에 있어서, 물론 제 114단계에서도, 제 126단계(또는 제 125단계)에서 사용된 인수는 부호화된 신호와 일체화된다.

제 126단계 이후의 단계들은 상기 인수에 의해서 양자화기(28)의 유효 스텝 크기를 증가시키는 것을 목적으로 한다. 다시 말하면, 양자화 잡음은 마스킹 임계값보다 큰 일정한 값을 가지며, 그 결과 가청 간섭 또는 가청 잡음을 초래하지만, 비트율은 감소한다. 제 110단계 내지 제 116단계를 다시 거친 후에, 제 118단계에서 요구되는 비트 크기가 바람직한 비트율에서 지시한 값보다 크다고 결정되었다면, 상기 인수는 제 126단계 등에서 다시 감소하게 된다.

제 124단계에서, 상기 데이터가 최종적으로 부호화된 신호로써 출력된 경우, 다음 압축 블록은 결과적으로 필터링되고 양자화된 오디오 값들(σ´)로부터 실행되게 된다.

사전에 초기화된 값은 1 이외의 다른 값으로써 상기 곱셈 인수로 사용될 수도 있다. 그 후, 스케일링은 도 6의 최상단에 도시된 바와 같이 최초의 경우에 있어서 발생할 수 있다.

도 5(b)는 일반적으로 부재 번호 130으로 표기한 부호화 신호를 다시 도시하고 있다. 부호화 신호는 부가 정보 및 부가 정보 사이에 존재하는 메인 데이터를 포함한다. 전술한 바와 같이, 상기 부가 정보에 포함되는 정보는 특정 오디오 블록을 파생할 수 있다. 이때, 특정 오디오 블록이란, 필터 계수가 크게 변하여 오디오 블록의 시퀀스, 증폭 값, 및 필터 계수 값이 발생하게 된 오디오 블록을 말한다. 필요하다면, 상기 부가 정보는 비트 제어기에 사용된 증폭 값에 관련된 정보를 더 포함할 수 있다. 증폭 값 및 잡음 파워 한계(q)의 상호 의존성에 의해서, 상기 부가 정보는 필요에 따라서 증폭 값(a_#)으로부터 노드(#)까지 떨어져 있을 수 있고, 동시에 잡음 파워 한계(q_#)를 포함할 수 있다. 또한, 잡음 파워 한계만을 포함할 수도 있다. 상기 부가 정보는 부호화된 신호 내에서, 상기 부가 정보 내지 필터 계수들 및 해당 증폭 값 또는 해당 잡음 파워 한계의 위치는 해당 증폭 값들 또는 해당 잡음 파워 한계를 갖는 필터 계수들을 파생시키는 메인 데이터 내지 필터링되고 양자화된 오디오 값들(σ´)의 오디오 블록 앞에 배치되는 것이 바람직하 다. 즉, 부가 정보(a₀, x₀(i))가 블록(-1) 다음에 위치하고, 부가 정보(a₁, x₁(i))가 블록(1) 다음에 위치될 수 있다. 반면에, 상기 메인 데이터, 즉, 오디오 블록들에 큰 변화가 생긴 결과 필터 계수들이 발생하게 되는 종류의 오디오 블록을 제외하면, 이러한 종류에 해당하는 다음 오디오 블록, 예를 들어, 도 5의 오디오 값들(σ´(t₀)-σ´(t₂₅₅))을 포함하는 필터링되고 양자화된 오디오 값들(σ´)은 항상 부가 정보 블록(132) 내지 두 개의 오디오 블록들(블록 (-1))중의 첫 번째 블록과, 다른 부가 정보 블록(134) 내지 두 개의 오디오 블록들(블록 (1))중의 두 번째 블록 사이에 배치된다. 상기 오디오 값들(σ´(t₀)-σ´(t₁₂₇))은 복호화 가능하거나 또는 도 5(a)를 참조하여 전술한 바와 같이, 부가 정보(132)만을 이용하여 도출된다. 반면에, 오디오 값들(σ´(t₁₂₈)-σ´(t₂₅₅))은 샘플 값 번호가 127인 노드에서의 값들로써 부가 정보(132)를 이용한 보간법을 통해서 구해 지고, 샘플 값 번호가 255인 노드에서의 값으로써 부가 정보(134)를 이용한 보간을 통해서 구해 진다. 복호화는 단지 상기 두 개의 정보를 통해서만 가능하다.

또한, 증폭 값 또는 잡음 파워 한계에 관한 부가 정보 및 각 부가 정보 블록(132, 134)에 포함된 필터 계수들이 항상 서로 독립적으로 통합되어 있는 것은 아니다. 다시 말하면, 현재 부가 정보는 이전의 부가 정보 블록과는 다르게 전송된다. 도 5(b)를 예를 들면, 부가 정보 블록(132)은 시간(t_-1)에서의 노드에 관한 증폭 값(a₀) 및 필터 계수들(x₀)을 포함한다. 부가 정보 블록(132)에서 이러한 값 들은 블록 자체로부터 파생된 것일 수 있다. 그러나, 시간(t₂₅₅)에서의 노드에 관한 부가 정보는 상기 블록만으로는 더 이상 부가 정보 블록(134)로부터 파생되지 않는다. 다시 말하면, 부가 정보 블록(134)은 시간(t₂₅₅)에서의 노드에서 증폭 값(a₁)과 시간(t₀)에서의 노드에서 증폭 값 간의 차이 및 필터 계수들(x₁)과 필터 계수들(x₀)간의 차이에 관한 정보만을 포함한다. 부가 정보 블록(134)은 결과적으로 a₁ 내지 a₀ 및 x₁(i) 내지 x₀(i)의 정보만을 포함한다. 그러나, 이전 노드에 대한 차이뿐만이 아니라, 단속적(intermitting) 시간에 대해서 필터링된 계수 및 증폭 값 또는 잡음 파워 한계는 완전하게 전송되어야 한다. 예를 들면, 수신기 또는 복호화기가 부호화 데이터에 포함된 전송 중인 스트림으로 매 초마다 래치(latching)되도록 한다. 여기에 대해서는 추후 논의된다.

이러한 종류의 부가 정보를 부가 정보 블록들(132, 134)로 병합함에 따라서 압축률을 더 높일 수 있는 가능성을 제공하는 이점이 있다. 그 이유는, 이전 노드의 필터 계수들로 변경된 필터 계수들이 충분하게 발생할 때만 상기 부가 정보가 전송 가능한 경우라면, 제 66단계의 쿼리에도 불구하고 차이 결과 값이 적기 때문에, 엔트로피 부호화에 있어서는 이점으로 작용한다. 그 결과, 부호화기 측에서의 차이를 계산하거나 복호화기 측의 합을 계산하는 경우에 복잡도 면에서 유리하다.

오디오 부호화기의 구현에 대하여 설명한 후에, 도 1의 오디오 부호화기(10)에 의해 생성된 부호화 신호를 재생 가능하거나 처리 가능한 오디오 신호로 복호화 하기에 적합한 오디오 부호화기의 구현에 대하여 서술한다.

이러한 복호화기의 셋업에 대하여 도 8에서 도시하고 있다. 부재 번호 210으로 표시된 상기 부호화기는 해독기(decompressor)(212), FIFO 메모리(214), 곱셈기(216), 및 파라미터화 가능한 후처리 필터(218)를 포함한다. 해독기(212), FIFO 메모리(214), 곱셈기(216), 및 파라미터화 가능한 후처리 필터(218)는 이 순서대로 데이터 입력(220) 및 복호화기(210)의 데이터 출력(222) 사이에 연결된다. 이때, 부호화 신호는 데이터 입력(220)에서 입력받는다. 오디오 부호화기(10)의 데이터 입력(12)중에서 원래의 오디오 신호와 다른 복호화 오디오 신호는 오디오 부호화기(10)에 포함된 양자화기(28)에서 발생한 양자화 잡음에 의해서 데이터 출력(222)에서 출력된다. 해독기(212)는 또 다른 데이터 출력에서 곱셈기(216)의 제어 입력에 연결되어 피승수를 전달하고, 또 다른 데이터 출력을 거쳐서 파라미터화 가능한 후처리 필터(218)의 파라미터 입력에 전달한다.

도 9에서 도시한 것처럼, 제 224단계에서 해독기(212)는 데이터 입력(220)에서의 압축된 신호를 해독하여 필터링되고 양자화된 오디오 데이터, 즉, 샘플 값들(σ´)을 얻고, 필터 계수들 및 증폭 값들 또는, 증폭 값들 대신에 노드들에서 잡음 파워 한계들을 지칭하는 것으로 알려진 부가 정보 블록(132, 134)에 포함된 해당 부가 정보를 얻는다.

도 10에서 도시한 것처럼, 제 226단계에서, 해독기(212)는 표시된 순서대로 해독된 신호를 확인하여 필터 계수들을 갖는 부가 정보가 이전의 부가 정보 블록과의 차이가 없이 자체적으로 포함된 형태로 상기 해독 신호에 포함되어 있는지 아닌 지를 확인한다. 반면에, 해독기(212)는 최초의 부가 정보 블록(132)을 검색한다. 해독기(212)가 무엇인가 발견하게 되면, 제 228단계에서, 양자화되고 필터링된 오디오 값들(σ´)은 FIFO 메모리(214)에 버퍼링된다. 양자화되고 필터링된 오디오 값들(σ´)의 완성된 오디오 블록이 직접적인 다음 부가 정보 블록 없이 제 228단계 중에 저장된 경우, 제 228단계에서, 제 226단계에서 입력된 파라미터에 관한 부가 정보에 포함된 정보 및 후처리 필터의 증폭 값을 이용하여 최초로 후처리 필터링되고, 곱셈기(216)에서 증폭된다. 그 결과 복호화가 완성되고, 해당 복호화 오디오 블록을 얻는다.

제 230단계에서, 해독기(212)는 해독된 신호에 대하여 임의의 종류의 부가 정보 블록이 발생했는지를 감시한다. 여기서, 부가 정보 블록은 절대적인 필터 계수들 또는 필터 계수들이 이전 부가 정보 블록에 대한 차이를 갖는 부가 정보 블록을 말한다. 도 5(b)의 예를 참조하면, 제 230단계에서, 해독기(212)는 제 226단계에서 부가 정보 블록(132)을 인식함으로써 부가 정보 블록(134)의 발생을 인식할 수 있다. 그 결과, 필터링되고 양자화된 오디오 값들(σ´(t₀)-σ´(t₁₂₇))의 블록은 제 228단계에서 부가 정보(132)를 이용하여 복호화될 수도 있다. 해독된 신호의 부가 정보 블록(134)이 아직 발생하지 않았다면, 전술한 바와 같이, 제 226단계의 부가 정보를 이용하여 버퍼링이 계속되거나, 블록 복호화가 제 228단계에서 계속될 수 있다.

부가 정보 블록(132)이 발생하자마자, 제 232단계에서, 해독기(212)는 부가 정보 블록(134)의 차분 값들 및 부가 정보 블록(132)의 파라미터 값들을 가산함으로써 노드(1)에서의 파라미터 값들(a₁, x₁(i))을 계산한다. 물론, 현재 부가 정보 블록이 차분 값을 갖지 않는 자체적인 부가 정보 블록인 경우에 제 232단계는 생략된다. 전술한 바와 같이, 이 단계는 매 초마다 발생할 수도 있다. 부호화기(210)의 대기 시간(waiting time)이 너무 길지 않게 하기 위해, 파라미터 값들이 다른 부가 정보 블록과는 무관하게 절대적으로 파생되는 부가 정보 블록(132)은 충분히 좁게 배치되어 있어서, 라디오 전송 또는 방송 전송 등과 같은 경우에 오디오 부호화기(210)의 스위치를 켤 때의 시간 및 끌 때의 시간은 너무 길지 않게 된다. 바람직하게는, 차분 값들을 가지고 그 사이에 배치된 부가 정보 블록(132)의 개수는 미리 고정된 개수로 부가 정보 블록들(132) 사이에 배치되어서, 부호화기는 부가 정보 블록 타입(132)이 다시 부호화된 신호에서 존재할 수 있다는 것을 인식한다. 다른 부가 정보 블록 타입은 해당 플래그에 의해서 표시될 수도 있다.

도 11에서 도시된 것처럼, 새로운 노드에 대한 부가 정보 블록이 도달한 후, 특히 제 226단계 및 제 232단계 후에, 제 234단계에서 동일한 값의 인덱스(j)가 최초로 0으로 초기화된다. 이 값은 현재 부가 정보와 관련이 있는 FIFO 메모리(214)에 현재 남아 있는 오디오 블록의 최초 샘플 값의 샘플 위치에 해당한다. 제 234단계는 파라미터화 가능한 후처리 필터(218)에서 실행된다. 제 236단계에서, 파라미터화 가능한 후처리 필터(218)는 새로운 노드에서 잡음 파워 한계를 계산한다. 이때, 이 단계는 도 4에서 나타낸 제 84단계에 해당하고, 노드들에서 증폭 값들 외 에 잡음 파워 한계가 전송되는 경우 이 단계는 생략할 수 있다. 다음으로, 제 238단계 및 제 240단계에서, 후처리 필터(218)는 필터 계수들 및 도 4에서 도시된 보간 단계(88, 89)에 해당하는 잡음 파워 한계를 보간한다. 제 242단계에서, 제 238단계 및 제 240단계에서의 보간된 잡음 파워 한계 및 보간된 필터 계수들에 기초한 샘플 위치(j)에서 증폭 값의 계산 과정은 도 4에서 도시한 제 92단계와 상응한다. 제 244단계에서, 후처리 필터(218)는 제 242단계에서 계산된 증폭 값, 및 보간된 필터 계수들을 샘플 위치(j)에서 샘플 값에 적용한다. 이 단계와 도 4에서 도시한 제 94단계와 다른 점은, 파라미터화 가능한 후처리 필터의 전달 함수가 리스닝 임계값의 역수에 상응하지 않고 리스닝 임계값 자체에 상응하도록, 보간된 필터 계수들이 양자화되고 필터링된 오디오 값들(σ´)에 적용된다는 사실에 있다. 또한, 위치(j)에서 양자화되고 필터링된 샘플 값들(σ´) 또는 이미 필터링되고 양자화된 후 역 필터링되고 샘플 값에 대하여, 후처리 필터는 곱셈 인수를 이용하여 곱셈을 실행하지 않고, 곱셈 인수를 이용하여 나눗셈을 실행한다.

제 246단계에서는 후처리 필터(218)가 샘플 위치(j)를 갖는 현재 노드에 아직 도달하지 않았는지 확인하고, 아직 도달하지 않았을 경우, 제 248단계에서 샘플 위치 인덱스(j)를 증가시키고, 제 238단계 및 제 246단계를 실행한다. 제 250단계에서, 노드가 도달한 경우에 한하여 증폭 값 및 새로운 노드의 필터 계수들을 노드에서의 샘플 값에 적용한다. 이때, 제 218단계에서와 같이, 상기 적용 과정은 증폭 값을 이용한 나눗셈 및 리스닝 임계값과 동일하게 하는 전달 함수를 갖는 필터링을 포함하고, 리스닝 임계값의 역수는 포함하지 않는다. 제 250단계 후, 현재 오디오 블록은 두 개의 노드 파라미터간의 보간을 통하여 복호화된다.

전술한 바와 같이, 제 110단계 및 제 112단계에서 부호화할 때 양자화로 인해 발생된 잡음의 형태와 크기는 필터링되고, 리스닝 임계값 및 제 218단계 및 제 224단계에서의 증폭 값을 적용하는 과정에 맞추어 조정된다.

필터링되고 양자화된 오디오 값들이 부호화 신호로서 부호화되기 전에 비트율 제어기에 의해서 제 126단계에서 또 다른 곱셈 과정으로 거쳐야 하는 경우에, 이 인수는 제 218단계 및 제 224단계에서 또한 사용될 수 있다. 그 대신에, 도 11의 과정에서 구한 오디오 값들은 물론 또 다른 곱셈 과정을 거쳐서 낮은 비트율 때문에 약해진 오디오 값들을 다시 적절하게 증폭할 수도 있다.

도 3, 도 4, 도 6, 및 도 9 내지 도 11의 플로우차트는 도 1의 부호화기 또는 도 8의 복호화기의 기능 모드를 설명하기 위한 것이다. 플로우차드에서 블록으로 표시된 각 단계는 전술한 바와 같이 해당 수단을 이용하여 구현된다. 개별 단계의 구현은 ASIC 회로와 같은 하드웨어 또는 서브루틴과 같은 소프트웨어로 구현될 수 있다. 특히, 상기 도면들에서 도시된 블록에 기재된 설명들은 대략적으로 각 블록에 해당하는 각 단계에서 참조하는 프로세스를 보여 주는 반면에, 블록간의 화살표는 각각 부호화기 및 복호화기로 동작할 때 단계별 순서를 보여 준다.

전술한 바와 같이, 상기 부호화 기술은 여러 면에서 변할 수 있다. 예를 들어, 파라미터 및 증폭 값 또는 잡음 파워 한계는, 특정 오디오 블록에 대하여 결정되었던 것처럼 각 오디오 블록의 최종 오디오 값, 예를 들어, 현재 오디오 블록에서 128번째 값은, 이전 실시 예에서와 같이 현재 오디오 값에 대한 보간을 생략하 기 위해 특정 오디오 값에 대하여 직접적으로 유효해야 할 필요는 없다. 다시 말하면, 각 오디오 값에 대하여 보간이 필요하도록 일시적으로 이러한 노드 파라미터 값들을 현재 오디오 블록의 오디오 값들에 대한 샘플링 시간(t_n, n = 0, … ,127) 사이에 존재하는 노드에 연관시키는 것이 가능하다. 특히, 오디오 블록에 대하여 결정된 파라미터 또는 현재 오디오 블록에 대하여 결정된 증폭 값은 간접적으로 또 다른 값에 적용될 수 있다. 또 다른 값은 오디오 블록의 중간에 위치하는 오디오 값이 될 수 있으며, 이 값은 예를 들어 128개의 오디오 값들을 갖는 상기 블록 크기인 경우에는 64번째 오디오 값이 될 수 있다.

상기 실시 예에서는 제어된 비트율을 갖는 부호화된 신호를 발생시키기 위해서 고안된 오디오 부호화 기술에 대하여 언급했었다. 그러나 모든 경우에 있어서 비트율을 제어해야 할 필요가 있는 것은 아니다. 이러한 이유로 제 116단계 내지 제 122단계, 및 제 126단계는 생략될 수 있다.

충실한 설명을 위해서, 제 114단계를 참조하여 설명한 압축 기술을 참조하여 본 명세서의 소개 부분에서 기술된 Schuller 등에 의한 문서를 참조하였고, 특히, 제 IV장의 무손실 부호화를 이용한 중복성 감소에 관한 내용을 여기에 참고로 합체한다.

이전 실시 예를 참조하여 다음 사항을 설명한다. 전술한 내용에 따르면 임계값은 양자화 시에 항상 일정하게 유지되거나 또는 양자화 단계 함수도 항상 일정하게 유지된다. 즉, 필터링된 오디오 신호에서 발생한 부산물을 항상 양자화되거 나 또는 대략적인 양자화에 의해서 삭제된다. 하지만, 그 결과, 음질이 가청 수준으로 손상된다. 만약 오디오 신호의 복잡도가 이러한 측정 방법을 사용하도록 요구하는 경우라면, 즉, 만약 부호화에 요구되는 비트율이 바람직한 비트율을 초과하는 경우라면, 이러한 측정 방법만을 이용하는 것이 가능하다. 이 경우에, 도 7(a) 및 도 7(b)에서 도시한 양자화 스텝 함수들 외에도, 전처리 필터의 출력에서 가능한 모든 값들의 전체 영역에 대하여 일정한 양자화 스텝 크기를 갖는 함수가 사용될 수 있다. 항상 일정한 양자화 스텝 크기를 갖는 양자화 스텝 함수를 사용하거나 또는 도 7(a) 또는 도 7(b)에 따른 양자화 스텝 함수들 중의 어느 한 함수를 사용하기 위해서, 양자화기는 음질 손실을 적게 하면서 신호에 응답하여 양자화 스텝을 임계값보다 큰 값을 갖도록 감소시키거나 또는 임계값보다 큰 상태에서 제거되도록 할 수 있다. 대신에, 임계값은 점차적으로 감소할 수 있다. 이 경우에, 임계값 감소 과정이 제 126단계의 인수 감소 과정 대신 실행될 수 있다. 제 110단계를 거치지 않고 최초의 압축을 시도한 후에 비트율이 여전히 너무 높은 경우라면 (제 118단계), 제 126단계의 변형 예에서, 일시적으로 압축된 신호는 선택적 임계값 양자화에 의해서 처리될 뿐이다. 또 다른 전송에서, 필터링된 오디오 값들은 오디오 임계값 이상에서 평평한 경사를 갖는 양자화 스텝 함수에 의하여 양자화될 수 있다. 제 126단계를 변형한 예에서, 임계값을 감소시킴으로써 양자화 스텝 함수의 또 다른 변경을 통해서 비트율을 더 감소할 수 있다.

또한, 상술한 실시예의 여러 관점은 장점을 가지나 필수적인 것은 아니다. 상술한 오디오 코딩 구성에 있어서 보간이 생략될 수도 있다. 특히, 각각의 오디오 블록에 대해 파라미터화와 증폭값 또는 파라미터화와 잡음파워한계를 전송하는 것이 가능한데, 그것들은 각각의 오디오 블록에 대해 계산되어 연속하는 파라미터화가 언급된 소정 수치 보다 작은 차이로 다르게 될 때는 하나도 내보지 않을 수 있다.

또한, 파라미터화하는데 차 부호화을 적용하는 것이 가능하겠지만, 증폭값 또는 잡음파워한계(noise power limit)에 적용하는 것은 가능하지 않을 것이다.

또한, 다른 방법으로 차이 부가블록들(134) 내에서 필터 계수를 전송하는 것을 상술한 부호화 스킴에서 상상할 수 있는데, 즉, 예를 들면, 현재 필터 계수에서 이전에 전송된 필터 계수를 빼고, 다시 단계 66의 최소 임계값을 뺀다.

상술한 오디오 부호화 구성은 다른 것들 중에서 매우 작은 지연 시간을 갖고 오디오 코더 내에서 효율적으로 전송하는 부가 정보와 필연적으로 관련이 있다. 적당하게 복원된 오디오 신호를 위해 순차적으로 부호화기로 전송되는 부가 정보는 단지 서서히 유용하게 변화하는 특성을 갖는다. 이것은 단지 차가 전송되기 때문인데, 이에 비트 율이 감소한다. 더욱이, 충분히 변화할 때 단지 그것들은 전송될 것이다. 때때로 절대 값(absolute value)은 과거 값(past value)을 잃었을 경우 전송될 것이다. 다르게 표현하면, 전처리 필터 또는 계수로부터의 부가 정보는 복호화기 내의 후처리 필터가 역전달함수을 갖는 것과 같이 부가 정보는 전송되어 오디오 신호가 다시 적당하게 복원될 수 있게 할 것이다. 이러한 것을 위해 요구되는 비트율은 차 전송에 의해 감소되나, 단지 그것은 충분한 크기를 갖일 때 그렇하다. 그것들 차이는 작은 값은 가지며 더욱 주기적으로 발생하는데, 이것은 부호화시 그것 이 더 작은 비트를 요구하기 때문이다. 그러므로 차 부호화는 특정한 성과를 얻는데, 이는 차가 연속적으로 변하는 오디오 신호들과 함께 꾸준히 변하기 때문이다.

특히, 조건에 따라서, 본 발명의 오디오 코딩 기술은 소프트웨어로 구현될 수도 있다. 디지털 저장 매체, 특히 디스크 또는 전자적으로 읽기 가능한 제어 신호를 갖는 CD상에서 구현 가능하고, 해당 방법이 실행되도록 프로그램 가능한 컴퓨터 시스템과 연계할 수 있다. 일반적으로, 본 발명은 기계적으로 읽기 가능한 캐리어에 저장된 프로그램 코드를 갖고, 컴퓨터 프로그램 제품이 컴퓨터상에서 동작할 때 본 발명의 방법을 수행하기 위한 컴퓨터 프로그램 제품에 포함된다. 한편, 본 발명은 컴퓨터 프로그램이 컴퓨터상에서 동작할 때 상기 방법을 수행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램으로써 구현될 수도 있다.

특히, 플로우차트의 블록에 표시된 단계들은 개별적으로 구현되거나 또는 여러 개를 서브 프로그램 루틴으로 그룹화하여 구현될 수 있다. 또한, 본 발명의 장치는 물론 집적회로 형태로 구현할 수도 있다. 예를 들어, 각 블록은 ASIC의 개별 회로로써 구현될 수 있다.

특히, 조건에 따라서, 본 발명의 기술은 소프트웨어로 구현될 수도 있다. 디지털 저장 매체, 특히 디스크 또는 전자적으로 읽기 가능한 제어 신호를 갖는 CD상에서 구현 가능하고, 해당 방법이 실행되도록 프로그램 가능한 컴퓨터 시스템과 연계할 수 있다. 일반적으로, 본 발명은 기계적으로 읽기 가능한 캐리어에 저장된 프로그램 코드를 갖고, 컴퓨터 프로그램 제품이 컴퓨터상에서 동작할 때 본 발명의 방법을 수행하기 위한 컴퓨터 프로그램 제품에 포함된다. 한편, 본 발명은 컴퓨터 프로그램이 컴퓨터상에서 동작할 때 상기 방법을 수행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램으로써 구현될 수도 있다.

Claims

오디오 값 시퀀스의 오디오 신호를 부호화 신호로 부호화하기 위한 장치로서

오디오 값 시퀀스의 제 1 블록의 오디오 값을 위한 제 1 리스닝 임계값과 오디오 값 시퀀스의 제 2 블록의 오디오 값을 위한 제 2 리스닝 임계값을 결정하는 수단과;

전달 함수가 제 1 리스닝 임계값의 크기의 역수에 대응하도록 파라미터화 가능한 필터(30)의 제 1 파라미터화 버전(version)을 계산하고, 전달 함수가 제 2 리스닝 임계값의 크기의 역수에 대하여 대응하도록 파라미터화 가능한 필터의 제 2 파라미터화 버전을 계산하는 수단(24)과;

일정 블록에 대응하는 필터링된 오디오 값 블록을 구하기 위하여, 상기 제 2 파라미터화 버전에 의존하는, 미리 정한 방식으로, 미리 정한 파라미터화를 사용하는 파라미터화 가능한 필터로써 상기 오디오 값 시퀀스의 일정 오디오값 블록을 필터링하는 수단과;

양자화되고 필터링된 오디오 값 블록을 구하기 위하여 상기 필터링된 오디오 값을 양자화하는 수단과;

적어도 상기 제 1 파라미터화 버전과 상기 제 2 파라미터화 버전 사이의 차를 포함하는 상기 제 1 파라미터화 버전과 상기 제 2 파라미터화 버전의 결합을 형성하는 수단과;

상기 결합을 포함하고, 그리고 양자화되고 필터링된 오디오 값과 상기 제 1 양자화 버전을 파생시킬 수 있는 정보를 상기 부호화된 신호에 통합시키는 수단을 포함하는 오디오 신호 부호화 장치.
제 1 항에 있어서, 상기 필터링하는 수단은,

상기 제 1 파라미터화 버전과 상기 제 2 파라미터화 버전 사이를 보간하여, 상기 오디오 값의 일정 블록의 미리 정한 일정한 오디오값에 대하여 파라미터화 가능 필터(30)의 보간 파라미터화 버전을 구하는 보간수단과,

상기 일정 오디오 값에 파라미터화 가능 필터(30)의 상기 보간된 파라미터화 버전을 적용하는 수단을 포함하는 오디오 신호 부호화 장치.
제 1 항 또는 제 2항에 있어서,

상기 통합하는 수단은 엔트로피 코더를 포함하는 오디오 신호 부호화 장치.
제 1 항 또는 제 2항에 있어서,

상기 제 1 및 제 2 리스닝 임계값을 결정하는 수단과 상기 계산하는 수단은 상기 오디오 값 시퀀스의 수개의 후속하여 연속하는 블록의 오디오 값에 대하여 상기 제 1 블록의 오디오 값으로부터 시작하는 리스닝 임계값을 결정하도록 형성되거나, 또는 전달함수가 각각의 리스닝 임계값의 크기의 역수에 대하여 대응하는 것과 같이 파라미터화 가능한 필터의 파라미터화를 계산하도록 형성되고, 그리고

상기 제 1 파라미터화로부터 일정 수치 이상으로 다른지를 체크하고, 상기 제 1 파라미터화로부터 일정 수치 이상으로 첫번째로 다른 그 파라미터화를 여러 파라미터화 중에서 제 2 파라미터화로 선택하는 수단을 추가로 포함하는 오디오 신호 부호화 장치.
제 1 항 또는 제 2항에 있어서, 상기 결합은 상기 차에서 상기 일정 수치를 뺀 것을 특징으로 하는 오디오 신호 부호화 장치.
제 1 항 또는 제 2항에 있어서,

제 1 마스킹 임계값에 의존하는 제 1 잡음 파워 한계와 제 2 마스킹 임계값에 의존하는 제 2 잡음 파워 한계를 결정하는 수단(22)을 더 포함하고,

상기 필터링 수단은,

오디오 값의 상기 일정 블록의 미리 정한 오디오 값에 대하여 보간된 잡음 파워 한계를 얻기 위하여, 상기 제 1 잡음 파워 한계와 상기 제 2 잡음 파워 한계 사이를 보간하는 수단(90)과,

일정 양자화 규칙과 상기 보간된 잡음 파워 한계에 따른 양자화에 의해 일어나는 양자화 노이즈 파워에 의존하는 중간 스케일링 값을 결정하는 수단(92)과, 그리고

스케일 필터링된 오디오 값을 얻기 위해 상기 중간 스케일링 값을 상기 일정 오디오 값에 적용하는 수단(94)을 포함하여 이루어 지는 것이 특징인 오디오 신호 부호화 장치.
제 1 항 또는 제 2항에 있어서,

수개의 연속하는 일정 블록을 처리하여, 상기 양자화되고 필터링된 오디오 값과 제 1 및 제 2 파라미터화의 버전을 포함하는 정보를 상기 부호화 신호에 간헐적으로 통합하는 것을 특징으로 하는 오디오 신호 부호화 장치.
오디오 값 시퀀스로된 오디오 신호를 부호화 신호로 부호화하기 위한 방법으로서

상기 오디오 값 시퀀스의 제 1 블록의 오디오 값에 대한 제 1 리스닝 임계값과 상기 오디오 값 시퀀스의 제 2 블록의 오디오 값에 대한 제 2 리스닝 임계값을 결정하는 단계와;

전달 함수가 상기 제 1 리스닝 임계값의 크기의 역수에 대응하도록 파라미터화 가능한 필터(30)의 제 1 파라미터화 버전(version)을 계산하고, 전달 함수가 상기 제 2 리스닝 임계값의 크기의 역수에 대하여 대응하도록 상기 파라미터화 가능 필터의 제 2 파라미터화 버전을 계산하는 단계와;

상기 일정 블록에 대응하는 필터링된 오디오 값 블록을 구하기 위하여, 상기 제 2 파라미터화 버전에 의존하는, 미리 정한 방식으로, 미리 정한 파라미터화를 사용하는 파라미터화 가능 필터로써 상기 오디오 값 시퀀스의 일정 오디오값 블록을 필터링하는 단계와;

양자화되고 필터링된 오디오 값 블록을 구하기 위하여 상기 필터링된 오디오 값을 양자화하는 단계와;

적어도 상기 제 1 파라미터화 버전과 상기 제 2 파라미터화 버전 사이의 차를 포함하는 상기 제 1 파라미터화 버전과 상기 제 2 파라미터화 버전의 결합을 형성하는 단계와; 그리고

상기 결합을 포함하고 그리고 양자화되고 필터링된 오디오 값을 파생시킬 수 있는 정보를 상기 부호화된 신호에 통합시키는 단계를 포함하는 오디오 신호 부호화 방법.
부호화 신호를 오디오 신호로 복호화하는 장치로서,

상기 부호화신호는 정보를 가지고 있는데, 상기 정보로부터 양자화되고 필터링된 블록의 오디오 값 블록 및 제 1 리스닝 임계값의 크기의 역수에 대응하는 파라미터화 가능 필터의 전달 함수가 따르는 제1파라미터화 버전이 파생되며, 상기 정보는 제 2 리스닝 임계값의 크기의 역수에 대응하는 파라미터화 가능 필터의 전달 함수에 따른 제2파라미터화 버전과 상기 제1파라미터화 버전과, 그리고 적어도 상기 제 1 파라미터화 버전과 상기 제 2 파라미터화 버전 사이의 차를 포함하는 결합을 가지고 있는 부호화된 신호를 오디오 신호로 복호화하는 장치에 있어서,

상기 부호화 신호로부터 상기 제 1 파라미터화 버전을 파생시키는 파생 수단과;

상기 제 1 파라미터화 버전과 상기 차를 합하여 상기 제 2 파라미터화 버전을 구하는 계산 수단과;

상기 전달함수가 상기 리스닝 임계값의 크기에 대응되는 상기 제2파라미터화 버전를 사용하는 파라미터화 가능 필터로서 상기 양자화 필터링된 블록의 오디오 값을 필터링하여, 상기 오디오 신호의 복호화된 오디오 값 블록을 얻는 필터링 수단을 포함하는 복호화 장치.
부호화 신호를 오디오 신호로 복호화하는 방법으로서,

상기 부호화신호는 정보를 가지고 있는데, 양자화되고 필터링된 블록의 오디오 값 블록 및 상기 정보로부터 제 1 리스닝 임계값의 크기의 역수에 대응하는 파라미터화 가능 필터의 전달 함수가 따르는 제1파라미터화 버전이 파생되며, 상기 정보는 제 2 리스닝 임계값의 크기의 역수에 대응하는 파라미터화 가능 필터의 전달 함수에 따른 제2파라미터화 버전과 상기 제1파라미터화 버전과 그리고 적어도 상기 제 1 파라미터화 버전과 상기 제 2 파라미터화 버전 사이의 차를 포함하는 결합을 가지고 있는 부호화된 신호를 오디오 신호로 복호화하는 방법에 있어서,

상기 부호화 신호로부터 상기 제 1 파라미터화 버전을 파생시키는 단계;

상기 제 1 파라미터화 버전과 상기 차를 합하여 상기 제 2 파라미터화 버전을 구하는 계산하는 단계;

상기 전달함수가 상기 리스닝 임계값의 크기에 대응하도록 상기 제2파라미터화 버전를 사용하는 파라미터화 가능 필터로 상기 양자화 필터링된 오디오 값 블록을 필터링하여, 상기 오디오 신호의 복호화된 오디오 값 블록을 얻는 필터링 단계를 포함하는 부호화 신호의 복호화 방법.
컴퓨터 프로그램이 컴퓨터에서 작동할 때 제 8 항 또는 제 10 항에 따른 방법을 수행하는 프로그램 코드를 구비한 컴퓨터 프로그램을 가지는 컴퓨터 판독가능한 저장매체.