KR101008520B1

KR101008520B1 - 오디오 신호 코딩

Info

Publication number: KR101008520B1
Application number: KR1020057009408A
Authority: KR
Inventors: 에릭 게. 페. 쉬에이어스; 아놀두스 베. 요트. 오멘; 마테우스 요트. 아. 만스
Original assignee: 코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date: 2002-11-28
Filing date: 2003-10-31
Publication date: 2011-01-14
Also published as: BR0316611A; KR20050086809A; EP1568010A1; DE60310449T2; ES2278192T3; US7644001B2; DE60310449D1; PL376889A1; CN100405460C; US20060147047A1; AU2003274520A1; JP4538324B2; MXPA05005602A; RU2005120236A; WO2004049309A1; ATE348386T1; EP1568010B1; CN1717577A; JP2006508384A

Abstract

오디오 신호를 코딩하는 방법에서, 제 1 순간(ti)에 오디오 신호의 양상들을 표시하는 제 1 파라미터(P1, 1)의 값이 제 1 계산된 값(A1, i)을 얻기 위해 계산된다. 차후의 제 2 순간(t2)에 오디오 신호의 양상들을 표시하는 제 2 파라미터(P2, i)의 값은 제 2의 계산된 값(A2, i)을 얻기 위해 계산된다. 제 1 파라미터(P1, i)의 수와 제 2 파라미터(P2, i)의 수는 서로 다르다. 제 2 파라미터(P2, i)의 서브셋(SUS2, i)은 오디오 신호의 주파수 범위(FR)의 특정한 부분(SFRAi)과 관련된다. 오디오 신호의 이러한 주파수 범위(FR)는 바람직하게는 오디오 신호에 존재하는 모든 f 주파수를 커버하기 위해 선택된다. 제 2 파라미터(P2, i)의 서브셋(SUS2, i)의 값(A2, i)은 주파수 범위(FR)의 이러한 동일한 특정한 부분(SFRAi)과 관련된 제 1 계산된 값(들)(A1, i)의 서브셋(SUS1, i)과 이러한 서브셋(SUS2, i)의 차이를 기초로 해서 코딩된다. 그에 따라, 제 2 파라미터(P2,i)의 차분적으로 코딩된 값(7)은 동일한 주파수 하위범주(SFRAi)와 실질적으로 관련된 제 1 파라미터(P1, i)와 제 2 파라미터(P2, i)의 값들간의 차이를 코딩함으로써 얻어진다. 이로 인해, 파라미터의 수가 시간에 따라 변하지만 파라미터(P1, i; P2, i)를 차분적으로 코딩하게 된다.

Description

오디오 신호 코딩{CODING AN AUDIO SIGNAL}

본 발명은 오디오 신호를 코딩하는 방법, 오디오 신호를 코딩하기 위한 인코더, 및 오디오 신호를 공급하기 위한 장치에 관한 것이다.

스테레오 프로그램 자료의 비트율을 감소하고자 제안되었던 오디오 코더에서의 종래기술의 해법은 세기 스테레오 및 M/S 스테레오를 포함한다.

세기 스테레오 알고리즘에서, (전형적으로는 5kHz를 초과하는) 높은 주파수는 이들 주파수 영역을 위한 원래의 스테레오 신호를 닮은 디코딩된 오디오 신호를 복구하게 하는 시변(time-varying) 및 주파수-의존성의 스케일 인자 또는 세기 인자와 결합된 단일 오디오 신호(즉, 모노)에 의해 표현된다.

M/S 알고리즘에서, 신호는 합계(또는 중간, 또는 공통) 신호 및 차이(또는 측면, 또는 비공통) 신호로 분해된다. 이 분해는 종종 원칙적인 성분 분석이나 시변 스케일 인자와 결합된다. 이들 신호는 그러면 (둘 모두인 파형-코더인) 변환-코더나 하위-대역-코더에 의해 독립적으로 코딩된다. 이러한 알고리즘에 의해 달성된 정보 감소의 양은 소스 신호의 공간 특성에 상당히 의존한다. 예컨대, 만약 소스 신호가 모노럴 신호(monaural)라면, 차이 신호는 0이고 버려질 수 있다. 그러나, 좌측 및 우측 오디오 신호의 상관이 낮다면(이것은 종종 더 높은 주파수 영역에 대 한 경우이다), 이러한 방식은 아주 적은 비트율 감소를 제공한다. 더 낮은 주파수 영역에 대해, M/S 코딩은 일반적으로 상당한 장점을 제공한다.

오디오 신호의 파라미터 설명은 특히 오디오 코딩 분야에서 근래에 관심을 얻고 있다. 오디오 신호를 설명하는 송신 (양자화된) 파라미터는 수신단에서 인지할 수 있고 실질적으로 동일한 신호를 재합성하기 위한 아주 적은 송신 성능만을 필요로 한다는 점이 알려져 왔다. 한 유형의 파라미터 오디오 코더는 코딩 모너럴 신호를 중점적으로 다루며, 스테레오 신호는 이중 모노 신호로서 처리된다.

파라미터 오디오 코더의 또 다른 유형이 EP-A-1107232에 개시되어 있다. 이러한 파라미터 오디오 인코더는 좌측 채널 신호와 우측 채널 신호로 구성된 스테레오 오디오 신호의 표현을 생성하기 위한 파라미터 코딩 방식을 사용한다. 송신 대역폭을 효율적으로 사용하기 위해, 이러한 표현은 좌측 채널 신호와 우측 채널 신호의 결합인 모노럴 신호에만 관련된 정보와 파라미터 정보를 포함한다. 스테레오 신호는 파라미터 정보와 함께 모노럴 신호를 기초로 해서 복구될 수 있다. 파라미터 정보는 좌측 및 우측 채널의 세기 및 위상 특징을 포함하는 스테레오 오디오 신호의 국부 큐(cues)를 포함한다.

파라미터 정보는 파라미터가 결정되게되는 오디오 신호의 주파수 범위에서 오디오 신호의 양상을 특징화하는 파라미터에 의해 표현된다. 코딩된 오디오 신호는 코딩될 오디오 신호의 전체 대역폭 도는 주파수 범위에 대해 결정된 단일 포괄적인 파라미터(또는 포괄적인 파라미터 세트) 및 코딩된 모노럴 오디오 신호 및/도는 오디오 신호의 주파수 범위의 대응하는 하위-범위에 대해 결정된 하나 이상의 로컬 파라미터(또는 로컬 파라미터 세트){주파수 범위의 이들 하위-범위는 또한 빈(bins)으로 지칭된다}를 포함한다.

많은 오디오 코딩 방식은 그 양이 시간에 따라서 변하는 파라미터를 사용하며, 그 예로는 MPEG-1 레이어-III(mp3), AAC(Advanced Audio Coding)와 같은 파형-코더에서, MDCT(Modified Discrete Cosine Transfer) 계수의 수는 시간에 따라서 변할 수 있다.

아직 공개되지 않은 유럽특허출원 제 2002 02076588.9호(대리인 관리번호 PHNL020356)는 파라미터 스테레오 표현에 사용되는 {또한 빈(bin)으로 지칭되는} 주파수 하위-범위의 수는 프레임마다 변할 수 있음을 개시한다.

아직 공개되지 않은 유럽특허출원 제 2002 0277869.2호(대리인 관리번호 PHNL020692)는 연속 프레임의 대응하는 파라미터는 시간에 따라서 차분적으로 인코딩될 수 있음을 개시한다. 이러한 방식으로, 시간 방향에서의 중복도는 제거될 수 있다. 파라미터의 개수는 연속 프레임에서 동일하다.

E.G.P Schuijers 등이, Leuven Belgium에서 2002년 11월 15일에 오디오 처리 및 코딩을 기초로 한 모델에 관한 제 1 IEEE Benelux 워크샵(MPCA 2002)에서 제안한 "고품질 오디오용 파라미터 코딩에서의 개선"에서, 파라미터 스테레오 설명을 통해 연장되었던 파라미터 코딩 방식이 설명되어 있다. 이러한 설명은 세 개의 파라미터에 의해 입체음향(binaural) 큐를 모델링하고자 한다: 채널간 세기 차이(IID: Inter-Channel Intensity Difference), 채널간 시간 차이(ITD: Inter-channel Time Difference), 및 채널간 교차상관(ICC: Inter-channel Cross Correlation). 이들 파라미터는 인간 청각 시스템을 닮은 균일하지 않은 주파수 그리드에 근거하여 추정된다. 이러한 그리드 상의 주파수 빈의 개수는 전형적으로는 20이다. 유럽 특허 출원 제 2002 02077869.2에서, 이들 파라미터를 코딩하기 위한 조정 가능한 접근법이 제안되었다.

이러한 파라미터 코딩 방식에 대해, 스펙트럼 포락선을 프레임마다 설명하는데 사용된 LPC(선형 예측 코딩: Linear Predictive Coding) 계수의 개수를 변경할 가능성이 또한 있다.

본 발명의 제 1 양상은 청구항 1에 개시된 오디오 신호를 코딩하는 방법을 제공한다. 본 발명의 제 2 양상은 청구항 10에 기재된 오디오 신호를 코딩하기 위한 인코더를 제공한다. 본 발명의 제 3 양상은 청구항 11에 기재된 오디오 신호를 공급하기 위한 장치를 제공한다. 유리한 실시예가 종속항에 한정되어 있다.

본 발명의 제 1 양상에 따른 방법에서, 파라미터의 개수가 연속 프레임에서 서로 다를 때 차분적인 코딩이 실행된다. 이것은 파라미터의 좀더 효율적인 코딩을 제공하며, 그에 따라 코딩된 파라미터에 더 적은 대역폭이 필요하게 될 것이다.

오디오 신호를 코딩하는 방법에서, 제 1 순간에 오디오 신호의 양상을 표시하는 제 1 파라미터의 값은 제 1 계산된 값을 얻기 위해 계산된다. 제 2의 차후의 순간에 오디오 신호의 양상을 표시하는 제 2 파라미터 값은 제 2 계산된 값을 얻기 위해 계산된다. 제 1 파라미터의 개수와 제 2 파라미터의 개수는 서로 다르다. 제 2 파라미터의 서브셋은 오디오 신호의 주파수 범위의 특정한 부분과 관련된다. 제 2 파라미터의 서브셋의 값은 이러한 서브셋과 주파수 범위의 이러한 실질적으로 동일한 특정한 부분과 관련된 제 1 계산된 값(들)의 서브셋간의 차이를 기초로 해서 코딩된다.

이로 인해, 비록 파라미터의 개수가 시간에 따라서 변화할 지라도 파라미터를 차분적으로 코딩하게 된다.

제 2항에서 한정된 실시예에서, 특정한 주파수 하위-범위나 빈 내에서, 단일 파라미터가 제 1 순간에 제 1 프레임에서 사용하기 위해 계산되어야 한다. 실질적으로 이러한 동일한 주파수 하위-범위 내에서, 몇몇 파라미터는 제 2 순간에 제 2 프레임에서 사용하기 위해 계산되어야 한다. 제 2 프레임에서 사용하기 위한 몇몇 파라미터 각각은 단일 파라미터의 값에 대한 그 차이를 기초로 해서 차분적으로 코딩된다.

만약 주파수 하위-범위가 몇몇 파라미터 중 하나가 특정한 주파수 하위-범위에 의해 완전히 커버되지 않은 주파수 하위-범위와 관련된다는 점에서 동일하지 않는다면, 이러한 파라미터가 단일 파라미터 및 단일 파라미터에 의해 커버되지 않는 주파수 범위와 관련된 파라미터 모두에 대해 코딩되는 정정이 적용될 수 있다.

제 3항에 한정된 실시예에서, 특정한 주파수 하위-범위나 빈 내에서, 몇몇 파라미터는 제 1 순간에 제 1 프레임에서 사용하기 위해 계산되어야 한다. 실질적으로 이러한 동일한 주파수 하위-범위 내에서, 단일 파라미터가 제 2 순간에 제 2 프레임에서 사용하기 위해 계산되어야 한다. 단일 파라미터의 값은 몇몇 파라미터의 평균값에 대해 차분적으로 코딩된다.

제 4항에 한정된 실시예에서, 평균값은 몇몇 파라미터의 값의 가중된 합으로서 계산된다.

제 5항에 한정된 실시예에서, 모든 가중치는 제 2 프레임의 단일 파라미터와 대응하는 제 1 프레임의 몇몇 파라미터의 개수에 의해 1을 나누는 것과 같다.

제 6항에 한정된 실시예에서, 가중치는 몇몇 파라미터 각각이 대응하는 주파수 하위-범위의 크기에 대응하기 위해 선택된다.

제 7항에 한정된 실시예에서, 단일 파라미터의 주파수 하위-범위는 몇몇 파라미터 중 하나의 주파수 범위를 단지 부분적으로 커버하고, 이러한 하나의 파라미터의 값의 평균값에 대한 기여는 몇몇 파라미터 중 다른 파라미터보다 더 작은 주파수 하위-범위는 동일하지 않다. 바람직하게, 그 기여는 몇몇 파라미터의 주파수 범위를 단지 부분적으로 커버하는 단일 파라미터의 주파수 하위-범위에 의해 커버되는 몇몇 파라미터의 주파수 범위의 백분율에 의존한다.

제 8항에 한정된 실시예에서, 오디오 신호는 파라미터의 서로 다른 세트에 의해 코딩된다. 포괄적인 파라미터는 오디오 신호의 전체 주파수 범위에 대해 계산된다. 이들 포괄적인 파라미터는 기본(더 낮은) 품질로 오디오 신호를 디코딩하게 한다. 디코딩 오디오 신호의 개선된 품질을 가능케 하기 위해, 추가 파라미터가 코딩될 수 있다. 이들 추가 파라미터의 개수는 시간에 다라 변할 수 있다. 제 1 프레임 동안에 필요한 제 1 파라미터의 개수는 연속 제 2 프레임 동안에 필요한 제 2 파라미터의 개수보다 더 작다. 제 1 파라미터 각각과 제 2 파라미터 중 대응하는 파라미터는 동일한 주파수 하위-범위를 실질적으로 커버한다. 제 2 파라미터 값이 코딩되어야 하는 주파수 하위-범위에서, 이러한 파라미터 값은 실질적으로 동일한 주파수 하위-범위와 관련된 대응하는 제 1 파라미터의 값에 대해 차분적으로 코딩된다. 제 2 파라미터가 코딩되어야 하지만 어떠한 대응하는 제 1 파라미터 값도 이용가능하지 않은 주파수 범위에서, 제 2 파라미터의 값은 포괄적인 값(들)에 대해 차분적으로 코딩된다.

제 9항에 한정된 실시예에서, 오디오 신호는 파라미터의 서로 다른 세트에 의해 코딩된다. 포괄적인 파라미터는 오디오 신호의 전체 주파수 범위에 대해 계산된다. 이들 포괄적인 파라미터는 기본(더 낮은) 품질로 오디오 신호를 디코딩하게 한다. 디코딩된 오디오 신호의 개선된 품질을 가능케 하기 위해, 추가 파라미터가 코딩될 수 있다. 이들 추가 파라미터의 양은 시간에 따라 변할 수 있다. 제 1 프레임 동안에 필요한 제 1 파라미터의 개수는 연속적인 제 2 프레임 동안에 필요한 제 2 파라미터의 개수보다 더 크다. 제 1 파라미터 각각과 제 2 파라미터의 대응하는 파라미터는 실질적으로 동일한 주파수 하위-범위를 커버한다. 제 2 파라미터 값이 코딩되어야 하는 주파수 하위-범위에서, 이러한 파라미터 값은 실질적으로 동일한 주파수 하위-범위와 관련된 대응하는 제 1 파라미터의 값에 대해 차분적으로 코딩된다. 제 1 파라미터 값이 이용 가능하지만 어떠한 대응하는 제 2 파라미터도 코딩되지 않는 주파수 범위에서, 어떤 동작도 발생하지 않아야 한다.

본 발명의 이들 및 다른 양상은 후술된 실시예로부터 명백하게 되며 이러한 실시예를 참조하여 설명될 것이다.

도 1은 본 발명의 실시예에 따른 인코더의 블록도.

도 2는 제 1 프레임 동안의 파라미터의 개수가 제 2 프레임동안보다 더 작은 상황을 개략적으로 표현한 도면.

도 3은 제 1 프레임 동안에 파라미터의 개수가 제 2 프레임 동안보다 더 작은 상황을 개략적으로 표현한 또 다른 도면.

도 4는 제 1 프레임 동안에 파라미터의 개수가 제 2 프레임 동안보다 더 높은 상황을 개략적으로 표현한 도면.

도 5는 제 1 프레임 동안의 파라미터의 개수가 제 2 프레임 동안에서보다 더 높은 상황을 개략적으로 표현한 또 다른 도면.

도 6은 제 1 프레임 동안의 파라미터의 개수가 제 2 프레임 동안보다 더 작은 상황을 개략적으로 표현한 도면.

도 7은 제 1 프레임 동안의 파라미터의 개수가 제 2 프레임 동안에서보다 더 높은 상황을 개략적으로 표현한 도면.

서로 다른 도면에서의 동일한 참조번호는 동일한 기능을 실행하는 동일한 요소나 동일한 신호를 지칭한다.

도 1은 본 발명의 실시예에 따른 인코더의 블록도를 도시한다. 입력(IN)은 오디오 신호(1)를 수신한다. 오디오 신호(1)는 데이터-감소가 달성되도록 코딩되어야 한다. 데이터 감소는 오디오 신호의 특정한 양상을 파라미터로 표현함으로써 가능하게 된다. 이들 파라미터는 오디오 신호(1)의 특정한 주파수 범위 내에서 오디 오 신호(1)의 특정한 양상을 한정한다. 오디오 신호(1)의 특정한 주파수 범위는 오디오 신호(1)에 존재하는 모든 주파수를 커버하거나 오디오 신호(1)에서 존재하는 주파수의 하위-범위일 수 있다. 파라미터는 변화하는 오디오 신호(1)를 표현할 수 있기 위해 시간적으로 정기적으로 결정되어야 한다. 보통, 파라미터는 결정되고 프레임으로 불리는 정기적인 시간 기간에 코딩된다. 오디오 신호(1)가 파라미터에 의해 표현되고 파라미터가 코딩되는 정확한 방식은 본 발명에서 중요하지 않으며, 많은 알려진 접근이 구현될 수 있다. 본 발명은, 심지어 코딩될 파라미터의 수가 연속적인 프레임에 걸쳐서 서로 다른 경우에도, 파라미터가 차분적으로 코딩된다는 사실에 관한 것이다.

계산 유닛(2)은 오디오 신호(1)를 수신하고, 계산된 값(3)을 매 프레임마다 공급한다. 계산된 값(3)은 차분적으로 코딩되어야 하는 파라미터를 표현한다. 코딩된 값은 특정한 파라미터에서 이용 가능해야 한다. 메모리(4)는 계산된 값(3)을 매 프레임마다 저장하고, 저장된 값(5)을 공급한다. 인코더(6)는 현재 프레임의 계산된 값(3)과 선행하는 프레임의 저장된 값(5)의 차이를 코딩하고, 차분적으로 코딩된 파라미터 값(7)을 공급한다. 차분적으로 코딩된 파라미터 값(7)은 유닛(8)에서 코딩된 모노럴 오디오 신호와 결합되어 출력(OUT)에서 코딩된 오디오 신호(9)를 공급할 수 있다.

인코더는 전용 하드웨어를 포함하거나 계산 및 다른 단계를 실행하는 적절하게 프로그램된 프로세서일 수 있다.

도 2는 제 1 프레임(t1) 동안의 파라미터의 개수는 제 2 프레임(t2) 동안보 다 더 작은 상황의 개략적인 표현을 도시한다. 파라미터(P1, 1 내지 P1, 4)(또한 P1, i로 지칭됨) 및 그 관련된 주파수 하위 범위(SFRA1 내지 SFRA4)(또한 SFRAi로 지칭됨)는 제 1 프레임(t1) 동안에 좌측에서 도시된다. 파라미터(P2, 1 내지 P2, 16)(또한 P2, i로 지칭됨) 및 그 관련된 주파수 하위 범위(SFRB1 내지 SFRB16)(또한 SFRBi로 지칭됨)는 제 1 프레임(t1)에 이어서 오는 제 2 프레임(t2) 동안 우측에서 도시되어 있다.

파라미터(P1, i)는 계산된 값(Ai)을 가지며, 파라미터(P2, i)는 계산된 값(Bi)을 갖는다. 파라미터(P1, i 또는 P2, i) 중 특정한 하나는 지수(i)에 대한 수를 대체함으로써 달성된다.

전체 주파수 범위는 FR로 표시된다. 제 1 계산된 값(들)(SUS1, i)의 서브셋 각각은 단일의 계산된 값(A1, i)을 포함한다. 제 2 계산된 값(들)(SUS2, i)의 서브셋 각각은 하나보다 많은(도 2에 도시된 예에서는 4) 계산된 값(A2, i)을 포함한다.

그 결과, 동일한 주파수 하위 범위(SFRAi)에 대응하는 관련된 서브셋(SUS1, i 및 SUS2, i)에서, 항상 네 개의 제 2 계산된 값(들)(Bi)은 하나의 제 1 계산된 값(들)(Ai)에 대응한다. 네 개의 제 2 계산된 값(들)(Bi) 각각은 동일한 하나의 제 1 계산된 값(들)(Ai)에 대해 차분적으로 코딩된다. 이것은 네 개의 코딩된 값 각각은 대응하는 제 2 계산된 값(들)(Bi) - 제 1 계산된 값(들)(Ai)과 같다는 점을 의미한다.

도 3은 제 1 프레임 동안의 파라미터의 개수가 제 2 프레임 동안보다 더 작 은 상황의 또 다른 개략적인 표현을 도시한다. 도 2와는 대조적으로, 이제 주파수 하위 범위(SFRB1 내지 SFRB4)를 함께 결합함으로써 얻은 주파수 하위 범위는 주파수 범위(SFRA1)와 동일하기보다는 약간 더 작다. 주파수 하위 범위(SFRB5)는 부분적으로는 주파수 범위(SFRA1) 내에서 발생하고, 부분적으로는 주파수 범위(SFRA2) 내에서 발생한다. 파라미터(P2,1 내지 P2,4)의 코딩된 값은 파라미터(P1, 1)의 값(A1)에 대해 차분적으로 코딩된다. 파라미터(P2, 5)의 코딩된 값은 파라미터(P1, 2)의 값(A1)이나 값(A2)에 대해 차분적으로 코딩될 수 있다. 파라미터(P2, 5)의 값을 값(B5)과 값(A1 및 A2)의 가중된 합의 차이로서 코딩하는 것이 또한 가능하다. 바람직하게는, 값(A1 및 A2)은 주파수 범위(SFRA1 및 SFRA2) 각각과 주파수 범위(SFRB5)의 겹침에 따라서 가중된다.

도 4는 제 1 프레임 동안의 파라미터의 개수가 제 2 프레임 동안보다 더 높은 상황의 개략적인 표현을 도시한다. 도 4는 도 2에 도시된 것과 유사한 상황을 도시하지만, 이제 프레임(t1)은 후속 프레임(t2)보다 더 많은 개수의 파라미터(P1, i)를 갖는다.

파라미터(P2, 1 및 P2, 2)(또한 P2, i로 지칭됨) 및 그 관련된 주파수 하위범위(SFRB1 및 SFRB2)(또한 SFRBi로 지칭됨)는 제 2 프레임(t2)을 위해 우측에 도시된다. 파라미터(P1, 1 내지 P1, 7)(또한 P1, I로 지칭됨) 및 그 관련된 주파수 하위 범위(SFRA1 내지 SFRA7)(또한 SFRAi로 지칭됨)는 제 1 프레임(t1)을 위해 좌측에 도시된다.

파라미터(P1, i)는 계산된 값(Ai)을 가지고, 파라미터(P2, i)는 계산된 값 (Bi)을 갖는다. 파라미터(P1, i 또는 P2, i) 중 특정한 하나는 지수(i)에 대한 수를 대체함으로써 달성된다.

제 2 계산된 값(들)(SUS2, i)의 서브셋 각각은 단일 계산된 값(Bi)을 포함한다. 제 1 계산된 값(들)(SUS1, i)의 서브셋 각각은 하나보다 많은 (도 4에 도시된 예에서는 3임) 계산된 값(Ai)을 포함한다.

그 결과, 동일한 주파수 하위 범위(SFRBi)에 대응하는 관련된 서브셋(SUS1, i 및 SUS2, i)에서, 항상 하나의 제 2 계산된 값(들)(Bi)이 세 개의 제 1 계산된 값(들)(Ai)에 대응한다.

제 2 계산된 값(Bi)은 관련된 계산된 값(Ai) 그룹의 계산된 가중 평균에 대해 차분적으로 코딩된다. 값(Ai)은, 이들 값이 주파수 범위(SFRBi) 내에 있거나 적어도 부분적으로 이 범위와 겹치는 주파수 하위 범위(SFRAi)에 속해 있는 파라미터(P1, i)에 속해 있다면, 값(Bi)과 관련된다.

가중된 평균은 다음과 같이 계산된다:

여기서, V_group은 그룹 파라미터 값을 표시하며, M은 관련된 계산된 값(Ai)의 그룹에 속해 있는 파라미터의 개수이며, qi는 다음의 관계가 지켜지는 가중 함수이다:

예컨대, 가중치(qi)는 1/M인 것으로 선택되지만, 또한 특정한 파라미터가 속 해 있는 주파수 하위 범위나 빈의 크기는 좋은 선택이다.

도 5는 제 1 프레임 동안의 파라미터의 개수가 제 2 프레임 동안보다 더 높은 상황의 또 다른 개략적인 표현을 도시한다.

도 4의 예에서, 프레임(t1) 내의 한 그룹에 속한 빈은 항상 프레임(t2)의 단일 빈 내에 완전히 속해 있다. 이것은 도 5에서 값(A3)과 관련된 빈이 값(B1)과 관련된 빈 내에 부분적으로만 있는 경우는 아니다. 가중된 값에 대해 차분적 코딩 값(B1)에서, 값(A3)에 대한 가중치는 더 작게 선택될 수 있다. 바람직하게, 이 가중치의 감소는 완전히 빈(B1) 내에 있는 A1 및 A2의 빈의 백분율로서 B1의 빈 내에 있는 A3의 빈의 부분에 관련된다.

예컨대, 도 2 내지 도 5에 도시된 차분 코딩은 E.G.P Schuijers 등이, Leuven Belgium에서 2002년 11월 15일에 오디오 처리 및 코딩을 기초로 한 모델에 관한 제 1 IEEE Benelux 워크샵(MPCA 2002)에서 제안한"고품질 오디오용 파라미터 코딩에서의 개선"에서 제공된 파라미터 코딩 방식에 관련되어 있으며, 여기서, 품질/비트율 교환(trade-off)으로 인해, IID/ITD/ICC 파라미터에 사용된 빈의 수는 전형적인 20 대신에 10 또는 40 주파수 빈으로 스위칭할 수 있다.

도 6은 제 1 프레임 동안의 파라미터의 개수는 제 2 프레임 동안에서보다 더 작은 상황의 개략적인 표현을 도시한다.

도 2 내지 도 5는 특정한 고정 주파수 영역(SF)에 대응하는 가변적인 수의 파라미터(P1, i 및 P2, i)(의 세트)를 도시했다. 그 결과, 파라미터의 개수가 변한다면, 주파수 하위-범위(SFRAi 또는 SFRBi)의 크기는 모든 주파수 하위-범위(SFRAi 또는 SFRBi)가 함께 고정된 주파수 범위(SF)를 커버하도록 그에 맞게 변화할 것이다.

대안적으로 도 6 및 도 7에 도시된 바와 같이, 각 파라미터(P1, i 및 P2, i)는 특정한 주파수 영역(SFRAi 및 SFRBi) 각각에 속한다, 즉 특정한 파라미터(P1, i 또는 P2, i)가 적용된 주파수 영역(SFRAi 또는 SFRBi)은 일정하다. 만약 프레임(t1 또는 t2)의 파라미터(P1, i 및 P2, i)의 개수가 변한다면, 모든 주파수 영역(SFRAi 또는 SFRBi)에 의해 함께 커버되는 주파수 범위의 전체 크기는 변화한다. 이것은 ITD 파라미터에 대한 경우일 수 있다.

프레임(t1)에서, 최좌측 열은 전체 주파수 범위(FR)에 대한 오디오 신호(1)의 양상을 표시하는 포괄적인 파라미터(들)(GB1)를 지시한다. 인접한 열은 C1 내지 C5로 표시된 5개의 파라미터(또는 예컨대 IID 및/또는 ICC 파라미터와 같은 파라미터 세트)를 도시한다. 파라미터(또는 파라미터 세트)(Ci) 각각은 전체 주파수 범위(FR)의 관련된 주파수 하위 범위에 대해 관련된다. 주파수 하위 범위는 함께 전체 주파수 범위(FR)를 커버한다. 프레임(t1) 내의 최우측 열은 두 파라미터(또는 파라미터 세트)가 값(A1 및 A2) 각각에 의해 한정되는 두 개의 주파수 하위 범위(SFRA1 및 SFRA2)를 도시한다.

프레임(t2)에서, 최좌측 열은 포괄적인 파라미터(들)(GB1)에 대응하는 포괄적인 파라미터(들)(GB2)를 지시한다. 중간 열은 파라미터(C1 내지 C5)에 대응하는 5개의 파라미터(D1 내지 D5)를 지시한다. GB1 및 D1 내지 D5와 관련된 주파수 범위는 GB2 및 C1 내지 C5 각각과 관련된 주파수 범위와 동일하다. 프레임(t2) 내의 최 우측 열은 세 개의 주파수 하위 범위(SFRB1 내지 SFRB3)와 관련 파라미터의 값(B1 내지 B3)을 도시한다. 값(B1 및 B2)과 관련된 주파수 하위 범위(SFRB1 및 SFRB2)는 값(A1 및 A2) 각각과 관련된 주파수 하위 범위(SFRA1 및 SFRA2)와 동일하다. 값(B1 및 B2)은 값(A1 및 A2) 각각에 대해 차분적으로 코딩된다. 프레임(t1)에서 프레임(t2) 내의 주파수 하위 범위(SFRB3)에 대응하는 어떠한 주파수 하위 범위도 없으므로, 프레임(t1)에서의 값에 대해 값(B3)을 차분적으로 코딩하는 것은 가능하지 않다. 여전히, 데이터 감소는 값(B3)을 포괄적인 파라미터(들)(GB2)에 대해 코딩함으로써 가능하다.

그에 따라, 일반적으로, 특정한 프레임에서의 값(Ai)을 갖는 파라미터의 빈의 개수는 그 다음 프레임에서의 값(Bi)을 갖는 대응하는 파라미터의 빈의 개수보다 더 작다면, 차분 코딩은 두 프레임에 실제 존재하는 빈에서만 실행된다. 선행하는 빈을 갖지 않는 빈은 포괄적인 값(GB2)에 대해 차분적으로 코딩된다.

도 7은 제 1 프레임 동안의 파라미터의 개수가 제 2 프레임 동안에서보다 더 높은 상황의 개략적인 표현을 도시한다.

프레임(t1)에서, 최좌측 열은 전체 주파수 범위(FR)에 대한 오디오 신호(1)의 양상을 표현하는 포괄적인 파라미터(들)(GB1)를 지시한다. 인접한 중간 열은 C1 내지 C5로 표시된 5개의 파라미터(또는 예컨대, IID 및/또는 ICC 파라미터와 같은 파라미터 세트)를 도시한다. 파라미터(또는 파라미터 세트) Ci 각각은 전체 주파수 범위(FR)의 관련된 주파수 하위 범위에 대해 관련된다. 주파수 하위 범위는 함께 전체 주파수 범위(FR)를 커버한다. 프레임(t1)에서 최우측 열은 세 개의 파라미터( 또는 파라미터 세트)가 값(A1 내지 A3) 각각에 의해 한정된 세 개의 주파수 하위 범위(SFRA1 내지 SFRA3)를 도시한다.

프레임(t2)에서, 최좌측 열은 포괄적인 파라미터(들)(GB1)에 대응하는 포괄적인 파라미터(들)(GB2)를 지시한다. 중간 열은 파라미터(C1 내지 C5)에 대응하는 5개의 파라미터(D1 내지 D5)를 지시한다. GB1 및 D1 내지 D5와 관련된 주파수 범위는 GB2 및 C1 내지 C5와 각각 관련된 주파수 범위와 동일하다. 프레임(t2)에서의 최우측 열은 관련된 파라미터의 값(B1 및 B2)과 두 개의 주파수 하위 범위(SFRB1 및 SFRB2)를 도시한다. 값(B1 및 B2)과 관련된 주파수 하위 범위(SFRB1 및 SFRB2)는 값(A1 및 A2)과 관련된 주파수 하위-범위(SFRA1 및 SFRA2)와 동일하다. 값(B1 및 B2)은 값(A1 및 A2) 각각에 대해 차분적으로 코딩된다.

그에 따라, 일반적으로, 만약 특정한 프레임에서의 값(Ai)을 갖는 파라미터의 빈의 개수는 그 다음 프레임에서의 값(Bi)을 갖는 대응하는 파라미터의 빈의 개수보다 더 크다면, 차분 코딩이 두 프레임에서 실제 존재하는 빈에서만 실행된다.

도 6 및 도 7 모두에 대해 설명된 코딩 알고리즘은 비트스트림에서의 신호화를 필요로 하지 않는다.

예컨대, 도 6 및 도 7에 도시된 상황에서, Ai 및 Bi 값은 ITD 빈의 개수를 표현하며, 실제 구현시에, ITD 빈의 개수는 11과 16 사이에서 변할 수 있다.

전술한 실시예는 본 발명을 제한하기보다는 예시한 것이라는 점과, 당업자는 첨부한 청구항의 범위에서 벗어나지 않고 많은 대안적인 실시예를 설계할 수 있을 것이라는 점을 주목해야 한다.

예컨대, 연속적인 프레임의 대응하는 빈에서의 파라미터의 절대수 및 그 변화는 단지 예이다. 실제 상황에서, 빈의 개수는 실제 오디오 신호 및 디코딩될 오디오의 품질(또는 이용 가능한 최대 비트스트림)에 의존한다. 예컨대, 도 6 및 도 7에 도시된 상황에서, Ai 및 Bi 값은 ITD 빈의 개수를 표현하며, 특정한 실제 구현시에, ITD 빈의 개수는 11과 16 사이에서 변할 수 있다.

청구항에서, 괄호 내의 임의의 참조번호는 청구항을 제한하는 것으로 해석되지 않아야 한다. "포함하다"라는 말은 청구항에 나열된 요소나 단계이외의 요소나 단계의 존재를 배제하지 않는다. 본 발명은 여러 별도의 요소를 포함하는 하드웨어 및 적절히 프로그램된 컴퓨터에 의해 구현될 수 있다. 몇몇 수단을 열거하는 디바이스 청구항에서, 이들 수단 중 몇몇은 하나의 동일한 하드웨어 아이템에 의해 구현될 수 있다. 특정한 조처가 서로 다른 종속항에서 열거된다는 단순한 사실이 이들 조처의 결합이 유익하게 사용될 수 없다는 점을 지시하지 않는다.

상술한 바와 같이, 본 발명은 오디오 신호를 코딩하는 방법, 오디오 신호를 코딩하기 위한 인코더, 및 오디오 신호를 공급하기 위한 장치에 이용된다.

Claims

오디오 신호를 코딩하는 방법으로서,

제 1 계산된 값을 얻기 위해 제 1 순간에 오디오 신호의 양상들을 표시하는 제 1 개수의 제 1 파라미터의 값을 계산하는 단계와,

제 2 계산된 값을 얻기 위해 제 2의 차후의 순간에 오디오 신호의 양상을 표시하는 제 2 개수의 제 2 파라미터의 값을 계산하는 단계로서, 상기 제 1 개수 및 상기 제 2 개수는 서로 다른, 제 2 파라미터의 값 계산 단계와,

상기 제 2 파라미터의 차분적으로 코딩된 값을 얻기 위해 주파수 범위의 특정한 부분과 관련된 제 2 계산된 값(들)의 서브셋과, 상기 주파수 범위의 상기 특정한 부분과 관련된 상기 제 1 계산된 값(들)의 서브셋의 차이를 기초로 해서 오디오 신호의 주파수 범위의 특정한 부분과 관련된 제 2 파라미터 서브셋을 코딩하는 단계와,

오디오 신호의 전체 주파수 범위에 대한 포괄적인 값(global values)을 계산하는 단계를 포함하고,

상기 제 1 파라미터 각각과 상기 제 2 파라미터의 대응하는 하나는 동일한 주파수 범위를 커버하고, 상기 제 1 파라미터의 개수는 상기 제 2 파라미터의 개수보다 더 작고, 상기 제 1 계산된 값(들)의 서브셋은 상기 제 1 파라미터의 각각에 대한 값을 포함하고, 상기 제 2 계산된 값의 서브셋은 상기 제 2 파라미터의 각각에 대한 값을 포함하고, 제 1 및 제 2 계산된 값이 계산되는 주파수 범위에서, 상기 차분적으로 코딩된 값은 상기 대응하는 제 1 및 제 2 계산된 값의 차이를 기초로 하고, 제 2 파라미터가 계산되지만 어떠한 제 1 파라미터도 계산되지 않는 주파수 범위에서, 상기 코딩된 값은 상기 대응하는 제 2 파라미터 및 상기 포괄적인 값의 차이를 기초로 하는,

오디오 신호 코딩 방법.
제 1항에 있어서, 상기 제 1 파라미터와 상기 제 2 파라미터 모두는 동일한 주파수 범위를 커버하고, 상기 제 1 계산된 값(들)의 서브셋은 상기 동일한 주파수 범위의 하위-범위인 주파수 범위의 특정한 부분에 대한 한 값을 포함하고, 상기 제 2 계산된 값의 서브셋은 적어도 두 개의 제 2 계산된 값을 포함하고, 상기 제 2 계산된 값 각각은 대응하는 제 2 계산된 값과 하나의 값의 차이를 기초로 해서 차분적으로 코딩된 값 중 하나에 대응하는, 오디오 신호 코딩 방법.
오디오 신호를 코딩하는 인코더로서,

제 1 계산된 값을 얻기 위해 제 1 순간에 오디오 신호의 양상을 표시하는 제 1 파라미터의 값을 계산하기 위한 수단과,

제 2 계산된 값을 얻기 위해 제 2의 차후의 순간에 상기 오디오 신호의 양상을 표시하는 제 2 파라미터의 값을 계산하기 위한 수단으로서, 상기 제 1 파라미터의 개수와 상기 제 2 파라미터의 개수는 서로 다른, 제 2 파라미터 값 계산 수단과,

상기 제 2 파라미터의 차분적으로 코딩된 값을 얻기 위해 상기 오디오 신호의 주파수 범위의 특정한 부분과 관련된 상기 제 2 계산된 값(들)의 서브셋과 상기 주파수 범위의 상기 특정한 부분과 관련된 상기 제 1 계산된 값(들)의 서브셋의 차이를 기초로 해서 상기 특정한 부분과 관련된 상기 제 2 파라미터의 서브셋을 코딩하기 위한 수단과,

오디오 신호의 전체 주파수 범위에 대한 포괄적인 값(global values)을 계산하는 수단을 포함하고,

상기 제 1 파라미터 각각과 상기 제 2 파라미터의 대응하는 하나는 동일한 주파수 범위를 커버하고, 상기 제 1 파라미터의 개수는 상기 제 2 파라미터의 개수보다 더 작고, 상기 제 1 계산된 값(들)의 서브셋은 상기 제 1 파라미터의 각각에 대한 값을 포함하고, 상기 제 2 계산된 값의 서브셋은 상기 제 2 파라미터의 각각에 대한 값을 포함하고, 제 1 및 제 2 계산된 값이 계산되는 주파수 범위에서, 상기 차분적으로 코딩된 값은 상기 대응하는 제 1 및 제 2 계산된 값의 차이를 기초로 하고, 제 2 파라미터가 계산되지만 어떠한 제 1 파라미터도 계산되지 않는 주파수 범위에서, 상기 코딩된 값은 상기 대응하는 제 2 파라미터 및 상기 포괄적인 값의 차이를 기초로 하는,

오디오 신호를 코딩하는 인코더.
오디오 신호를 공급하기 위한 장치로서,

오디오 신호를 수신하기 위한 입력과,

상기 오디오 신호를 인코딩하여 인코딩된 오디오 신호를 얻기 위한 제 3항에 기재된 인코더와,

상기 인코딩된 오디오 신호를 공급하기 위한 출력을,

포함하는, 오디오 신호를 공급하기 위한 장치.
삭제
삭제
삭제
삭제
삭제
삭제
삭제