KR101870594B1

KR101870594B1 - 스펙트럼의 피크 위치의 코딩 및 디코딩

Info

Publication number: KR101870594B1
Application number: KR1020177025171A
Authority: KR
Inventors: 폴로댜 그랜카로프; 시그루두르 스베리손
Original assignee: 텔레폰악티에볼라겟엘엠에릭슨(펍)
Priority date: 2013-10-18
Filing date: 2014-10-10
Publication date: 2018-06-22
Also published as: US20210050027A1; US20180247658A1; US9997165B2; KR101782278B1; MX2019011955A; PT3471096T; PT3058567T; RU2017138252A; ZA201801760B; RU2765886C1; AU2019201596A1; TR201901696T4; CN110910894A; EP3471096B1; KR20160070148A; MY176776A; BR112016007515B1; BR112016007515A2; CA2927877A1; ES2814601T3

Abstract

코더와 디코더 및 이들에서의 방법으로서, 오디오 코딩에서 스펙트럼의 피크 위치의 코딩 및 디코딩을 위해 제공된다. 제1측면에 따르면, 스펙트럼의 피크 위치의 코딩을 위한 오디오 시그널 세그먼트 코딩 방법이 제공된다. 방법은, 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위해서 최소 수의 비트를 요구하는 2개의 무손실 스펙트럼의 피크 위치 코딩 방안 중 어떤 하나를 결정하는 단계와; 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위해서 최소 수의 비트를 요구하는 스펙트럼의 피크 위치 코딩 방안을 선택하는 단계를 포함하여 구성된다. 2개의 무손실 스펙트럼의 피크 위치 코딩 방안 중 제1의 것은 주기적 또는 세미-주기적 스펙트럼의 피크 위치 분포에 대해서 적합하고; 2개의 무손실 스펙트럼의 피크 위치 코딩 방안 중 제2의 것은 드문 스펙트럼의 피크 위치 분포에 대해서 적합하다.

Description

스펙트럼의 피크 위치의 코딩 및 디코딩{CODING AND DECODING OF SPECTRAL PEAK POSITIONS}

일반적으로, 제안된 기술은 오디오 시그널 세그먼트 코딩/디코딩에 관한 것으로, 특히 스펙트럼의 피크 위치의 코딩/디코딩에 관한 것이다.

많은 오디오 코딩 기술은 휴먼 히어링(human hearing)의 특성을 활용한다. 예를 들어, 휴먼 청각 시스템은 이러한 약한 톤에 대해서 덜 민감하므로, 강한 톤 근처의 약한 톤(tone)은 코딩될 필요가 없을 수 있다. 통상적인, 소위 지각의 오디오 코딩(perceptual audio coding)에 있어서, 다른 주파수 데이터의 양자화는 휴먼 히어링의 모델에 기반한다. 예를 들어, 지각적으로 중요한 주파수 데이터가 더 많은 비트 및 따라서 더 미세한 양자화에 할당되고, 역으로도 된다.

한 타입의 오디오 코딩은, 소위 변환 코딩(transform coding)이다. 변환 코딩에 있어서, 입력 오디오 샘플의 블록은, 예를 들어 수정된 이산 코사인 변환(Modified Discrete Cosine Transform)을 통해서, 변환, 처리, 및 양자화된다. 변환된 계수의 양자화는 지각의 중요성에 기반해서 수행된다. 인코딩될 필요가 있는 한 오디오 파라미터는 스펙트럼의 피크의 위치이다. 변환 도메인에 있어서, 오디오 세그먼트에 대한 한 예의 스펙트럼의 피크 위치를 도 1a에 나타낸다. 전형적으로, 스펙트럼의 피크 위치는 호프만 코딩과 같은 무손실 코딩 방안에 의해 인코딩된다. 그런데, 종래 기술 해결책은 스펙트럼 피크의 인코딩에서 많은 비트를 소비한다.

종래 기술 해결책에서보다 더 효율적인 방법으로 스펙트럼의 피크 위치를 인코딩하는 것이 바람직하게 된다.

제1측면에 따르면, 스펙트럼의 피크 위치의 코딩을 위한 오디오 시그널 세그먼트 코딩 방법이 제공된다. 방법은, 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위해서 최소 수의 비트를 요구하는 2개의 무손실 스펙트럼의 피크 위치 코딩 방안 중 어떤 하나를 결정하는 단계와; 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위해서 최소 수의 비트를 요구하는 스펙트럼의 피크 위치 코딩 방안을 선택하는 단계를 포함하여 구성한다. 2개의 무손실 스펙트럼의 피크 위치 코딩 방안 중 제1의 것은 주기적 또는 세미-주기적 스펙트럼의 피크 위치 분포에 대해서 적합하고; 2개의 무손실 스펙트럼의 피크 위치 코딩 방안 중 제2의 것은 드문 스펙트럼의 피크 위치 분포에 대해서 적합하다. 이는, 또한, 이하 기술된 모든 측면에 대해서 유효하다.

제2측면에 따르면, 스펙트럼의 피크 위치의 코딩을 위한 오디오 시그널 세그먼트 코더가 제공된다. 코더는, 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위해서 최소 수의 비트를 요구하는 2개의 무손실 스펙트럼의 피크 위치 코딩 방안 중 어떤 하나를 결정하도록 구성되고; 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위해서 최소 수의 비트를 요구하는 스펙트럼의 피크 위치 코딩 방안을 선택하도록 더 구성된다.

제3측면에 따르면, 제2측면에 따른 오디오 시그널 세그먼트 코더를 포함하여 구성되는 유저 단말이 제공된다.

제4측면에 따르면, 스펙트럼의 피크 위치의 디코딩을 위한 오디오 시그널 세그먼트 디코딩 방법이 제공된다. 방법은, 오디오 시그널 세그먼트의 코딩된 스펙트럼의 피크 위치를 수신하는 단계와; 스펙트럼의 피크 위치를 코딩하기 위해 선택되었던 2개의 무손실 코딩 방안 중 무손실 코딩 방안의 인디케이터를 수신하는 단계를 포함하여 구성된다. 방법은, 가리켜진 코딩 방안에 부합해서 스펙트럼의 피크 위치를 디코딩하는 단계를 더 포함하여 구성된다.

제5측면에 따르면, 스펙트럼의 피크 위치의 디코딩을 위한 오디오 시그널 세그먼트 디코더가 제공된다. 디코더는, 오디오 시그널 세그먼트의 코딩된 스펙트럼의 피크 위치를 수신하고; 스펙트럼의 피크 위치를 코딩하기 위해 선택되었던 2개의 무손실 코딩 방안 중 무손실 코딩 방안의 인디케이터를 수신하도록 구성된다. 디코더는, 가리켜진 코딩 방안에 부합해서 스펙트럼의 피크 위치를 디코딩하도록 더 구성된다.

제6측면에 따르면, 제5측면에 따른 오디오 시그널 세그먼트 디코더를 포함하여 구성되는 모바일 단말이 제공된다.

추가의 목적 및 그 장점과 함께 실시형태가 첨부 도면과 함께 취해진 이항의 상세한 설명을 참조로 만들어짐으로써 최상으로 이해된다.

도 1a 및 1b는 스펙트럼의 피크 위치 분포의 예들이다.
도 2-4는 예시하는 실시형태의 제안된 기술의 코딩 방법을 도시하는 흐름도.
도 5-9는 예시하는 실시형태의 제안된 코더를 도시하는 블록도.
도 10은 실시형태의 제안된 유저 단말을 도시하는 블록도.
도 11은 실시형태의 제안된 기술의 디코딩 방법을 도시하는 흐름도.
도 12-15는 예시하는 실시형태의 제안된 디코더를 도시하는 블록도.
도 16은 실시형태의 제안된 유저 단말을 도시하는 블록도.

도면을 통해서, 동일 참조 부호는 유사한 또는 대응하는 엘리먼트에 대해서 사용될 수 있다.

제안된 기술은, 오디오 시그널의 짧은 세그먼트, 예를 들어 10-40 ms로부터 추출됨에 따라, 스펙트럼의 피크 위치의 무손실 코딩을 다룬다. 또한, 제안된 기술은 본 기술에 따라서 코딩된 스펙트럼의 피크 위치의 디코딩을 다룬다.

스펙트럼의 피크 위치를 인코딩하기 위한 통상적인 방법이 오디오 시그널 내의 피크 위치가 분포에서 매우 갑작스러운 변화를 가질 수 있고, 이것이 단일 코딩 방안으로 피크 위치를 코딩하는 것을 비효율적으로 만드는 사실을 해결하는데 실패한 것을, 본 발명자들은 인식한다. 소정의 경우에 있어서, 스펙트럼은 세미-주기적이 될 수 있는데, 이는 차동, 또는 델타 코딩 방안을 매우 효율 좋게 만든다. 다른 경우에 있어서, 스펙트럼의 피크는 클러스터될 수 있어서, 큰 드문 영역을 남긴다.

제안된 기술의 중요 개념은, 다른 피크 위치 분포들에 대해서 전용의 코딩 방안을 사용하고, 폐쇄된 루프 방식으로 코딩 방안들 사이에서 스위칭하는 것이다. 각각의 다른 코딩 방안은 특정 피크 위치 분포에 대해서 적합하게 되어야 한다. 적합하게 하는 것은, 예를 들어 코딩 방안이 소정 타입의 스펙트럼의 피크 분포에 대해서 특히 효율적인 것을 의미한다. 여기서, 코딩 방안 A가 피크 분포 C에 대해서 적합하고 코딩 방안 B가 피크 분포 D에 대해서 적합한 것으로 언급될 때, A는 피크 분포 C에 대해서 B보다 일반적으로 더 효율적인 한편, B는 피크 분포 D에 대해서 A보다 일반적으로 더 효율적인 것으로 상정할 수 있다.

무손실 방식으로 압축 및 전송되어야 하는 N 스펙트럼의 피크 위치의 세트 ｛P₁, P₂, P₃, ..., P_N｝를 갖는 것으로 상정하자. 피크의 수만 아니라 그들의 분포는 시간에 따라 변화한다. 스펙트럼의 피크 위치의 2개의 다른 세트의 예들이 도 1a 및 1b에 도시된다.

도 1a는 주기적인 것에 근접한 스펙트럼의 피크 분포를 도시한다. 이 경우는, 이하 기술된, 예를 들어 델타 코딩에 의해 효율적으로 핸들링된다.

도 1b는 드문 및 2개의 이웃하는 피크 사이에서 큰 거리를 갖는 스펙트럼의 피크 분포를 도시한다. 이 경우는 피크 사이의 큰 델타에 기인해서 델타 코딩으로 핸들링하기 어렵다.

피크의 수 및 그들의 분포에서의 큰 변동이, 장점을 갖고, 대안적인 압축 또는 코딩 방안으로 핸들링될 수 있는 것이 본 발명자가 발견되었다. 여기서는 2개의 예시의 코딩 방안에 초점을 맞추는데, 이들은 델타 코딩 및 드문 코딩으로 표시될 수 있고, 이하 기술된다. 대안적으로, 델타 코딩은 주기적 코딩으로 표시될 수 있다. 그런데, 이는, 또한, 다른 스펙트럼의 피크 위치 분포에 대해서 적합한 2개 이상의 코딩 방안을 사용하기 위해 실행 가능하다.

델타 코딩(Delta Coding)

이 코딩 방안은 도 1a에 도시된 것과 같은 피크 분포에 대해서 적합한데, 이는 주기적 또는 세미-주기적 또는 주기적인 것에 근접한 것으로서 특성을 가질 수 있다. 델타 코딩의 개념은 차이를 형성하는 것인데, 이 차이는 오디오 시그널 세그먼트에서 연속적인 스펙트럼의 피크 위치 P_j 또는 ｛P₁, P₂, P₃, ..., P_N｝사이의, d 또는 △로 표시되고, 오디오 시그널 세그먼트는 이하와 같다:

d₁ = P₁ - P₀

d₂ = P₂ - P₁

...

d_N = P_N - P_N _- ₁ (1)

그 다음, 델타로도 표시는 차이는 적합한 코딩 방법을 사용해서 인코딩된다. 차이들에 대한 바람직한 코딩 방법은 호프만 코딩이다. 다른 사이즈의 M 델타를 갖는 것으로 상정하자. 이들은, 예들 들어 이하의 가변 길이 코드워드로 맵핑된다.

｛d(1), d(2), d(3), ..., d(M)｝→｛0, 10, 11, ..., 111110｝ (2)

여기서, d(1)은 가장 흔한 것 같이 보이고 그러므로 최단 코드워드 "0"에 맵핑되는 차이 또는 스텝 사이즈 dj인 한편, d(M)은 매우 드문 및 그러므로 최장 코드워드 "111110"에 맵핑된다. 이 예에 있어서, 최장 코드워드는 6 비트를 요구하지만, 더 긴 및 더 짧은 최장 코드워드 모두가 또한, 실행가능하다. 가장 빈번한 델타를 최단 코드워드에 맵핑 및 드문 델타를 최장 코드워드에 맵핑함으로써, 델타를 인코딩하기 위해 사용된 비트 수가 최소화될 것이다. 이 코딩 방법은 너무 빈번하게 보이는 너무 많은 다른 스텝 사이즈가 없는 한 효율적이다. 다르게 말하면: 다른 스텝 사이즈가 많을 수록, 코드워드는 더 길고, 긴 코드워드로 맵핑된 스텝 사이즈가 흔히 보일 때, 코딩 방법의 효율은 감소한다.

호프만 코드워드는 디코더로 전송되고, 그 다음 대응하는 델타는 디코더에 의해 추출된다. dj 및 Pj-1를 앎으로써, 디코더는 반복으로 Pj를 재구성할 수 있다.

델타에 부가해서, 디코더는 초기 위치 P0를 알 필요가 있다. 피크들 간의 최소 거리에 부가된 제약에 기인해서, P0는 특별한 경우로서 고려된다. 예를 들어, 2개의 이웃하는 피크가 적어도 2 엠프티 위치에 의해 분리되어야 하는 제한이 있을 수 있다. 이 경우 3보다 더 짧은 델타가 없으므로, 호프만 코드워드는 나머지의 세그먼트 또는 프레임 동안 이러한 델타에 대해서 필요로 되지 않는다. 그런데, 오디오 시그널 세그먼트 내의 바로 첫 번째의 피크 P0는, 3보다 작은 제로로부터 오프셋과 함께 스케일(스펙트럼)의 개시에서 나타날 수 있다. 3보다 작은 이들 가능한 초기 델타에 대해서 호프만 코드워드의 수를 부가하지 않고 이 문제를 회피하기 위해서, 3으로부터 결정된 오프셋이 0으로부터 결정된 오프셋 대신 사용된다. 따라서, P0가, 예를 들어 위치 1 내에 위치될 때, △= 4에 대한 코드워드가 사용된다. 이러한 단순한 동작의 결과는, 사용된 호프만 코드워드의 수를 제한하는 것이 가능한 것이다. 이는, 일반적으로 적은 호프만 코드워드가 더 짧은 호프만 코드워드를 주므로, 사용된 호프만 코드워드의 길이를 최소화할 수 있다.

드문 코딩(Sparse Coding)

이 코딩 방안은 도 1b에 도시된 것과 같은 피크 분포에 대해서 적합한데, 이는 드문(sparse)으로서 특징을 가질 수 있다. 드문은, 연속적인 피크들 사이에 큰 거리가 있을 수 있고, 피크가 반드시 주기적일 필요가 없는 것을 의미하는 것으로 고려된다. 스펙트럼의 피크 위치 벡터의 이하의 예를 상정하면, 여기서 일들 "1"은 피크의 존재를 가리키고, 제로의 "0"은 피크의 부재를 가리킨다:

｛01000000000000000100｝ (3)

델타 코딩에 있어서, 이는 ｛P1 = 2 및 P2 = 18｝을 의미한다. 거리 16이 더 인증적인 예의 벡터에서 매우 이격된 것으로 고려되지 않을 수 있음에도, 상기 예시하는 피크 위치 벡터는 다른 피크 차이들과 관련해서 매우 멀리 이격되는 스펙트럼의 피크를 도시하게 된다.

이 드문 코딩 방안의 제1스텝은, 예를 들어 5 비트의 동등한 사이즈 그룹을 형성하는 것이다:

｛01000, 00000, 00000, 00100｝ (4)

그 다음, 각각의 그룹은, 예를 들어 각각의 그룹 내의 엘리먼트를 OR-함으로써 비-제로(non-zero) 엘리먼트에 대해서 체크된다. 결과는 제2비트 벡터 내에 기억되는데, 이는 5배 더 짧다. 이 비트 벡터는 더 용이하게 구별되도록 하기 위해서 이하 굵게 도시된다:

｛01000, 00000, 00000, 00100｝→｛1001｝ (5)

이 예시하는 실시형태에 있어서, 디코더로 전송되어야 하는 비트스트림은 이하와 같게 된다:

｛1001, 01000, 00100｝ (6)

디코더는 비트스트림으로부터 시그널링 계층 "1001"을 판독한다. 이들 4 비트는 비트스트림에서 뒤따르게 될 것이 제1 및 제4그룹의 디스크립션인 한편, 제2 및 제3그룹이 제로로 충전되어야 하는 것을 가리킨다.

2개의 연속적인 피크들 사이의 최소 허용된 거리에서의 상기된 언급된 제약때문에, 상기 방안은, 추가의, 더 무손실인, 압축 이득을 달성하기 위해서 수정될 수 있다. 각각의 5-dim 벡터에 대해서 8개의 가능한 레벨만이 있으므로, 피크가 적어도 2개의 위치에 의해 분리되어야 하는 제약에 기인해서, 이들 벡터는, 이하의 표 1에서 보는 바와 같이, 3 비트로만 인덱싱될 수 있다. 이 실시형태에 있어서, 비트스트림은 다음과 같이 보이고:

｛1001, 001, 010｝ (7)

5 비트 대신, 상기 예에서와 같이, 3 비트만이 각각의 비-제로 비트 그룹을 식별하기 위해 요구된다.

표 1 : 5-dim 벡터의 인덱싱. 3-비트 인덱스는 비트스트림으로부터 추출되고, 대응하는 5-dim 벡터, 상기 및 표에서 표시된 그룹은, 재구성된다.

그룹	인덱스
10000	000
01000	001
00100	010
00010	011
00001	100
10010	101
10001	110
01001	111

대안적인 무손실 드문 스펙트럼의 피크 위치 코딩 방안은 [1]에 기술된 바와 같이 OR-하는 비트의 논리적인 동작(logical operation: 논리적 연산)에 기반할 수 있다.

상기된 코딩 방안 각각은 소정 피크 위치 분포에 대한 문제점을 갖는다:

· 드문 코딩 방안의 문제점은, 입력이 충분히 드물지 않으면, 이것이 데이터의 양을 실재적으로 증가시킬 수 있는 것이다.

· 델타 코딩 방안의 문제점은, 이것이, 예를 들어 다수의 거리가 작을 때 매우 큰 델타 스텝인 가외치(outlier)에 대해서 매우 비효율적인 것이다.

그런데, 상기된 2개의 코딩 방안은 서로 보완하는 것으로서 볼 수 있고, 매우 효율적인 코딩 시스템이 그들의 강점을 조합함으로써 형성될 수 있는 것이 발명자들에 의해 실현되었다. 한 예의 폐쇄된 루프 결정 로직은 이하와 같이 약술된다:

Ld > Ls이면

드문 코딩 사용,

그렇지 않으면

델타 코딩 사용 (8)

여기서,

Ld는 델타 코딩 방안에 의해 소비된 비트의 전체 수이고,

Ls는 드문 코딩 방안에 의해 소비된 비트의 전체 수이다.

결정 로직(8)은 코딩 방안들 모두가 실재적으로 수행될 수 있는 것을 요구한다. 몇몇 경우에 있어서, 2개의 연속적인 피크들 사이의 최대 거리 dmax가, 사전 기억된 호프만 표에 기반해서, 델타 코드에 대해서 가능한 최대 거리 T보다 클 때, 델타 코딩 방안에 의해 소비된 전체 수의 비트 Ld는 명확히 계산될 수 없다. 이러한 경우를 커버하기 위해서 결정 로직(8)은 다음으로 약간 수정될 수 있다:

(dmax > T) 또는 (Ld> Ls)｝이면

Use 드문 코딩 사용,

그렇지 않으며

델타 코딩 사용 (9)

거리 dmax> T이면 델타 코딩은 명확히 수행되지 않아야 하므로, 결정 로직(9)에서의 OR-구문의 제1부분는 쇼트컷(shortcut)으로서 고려될 수 있다. 다르게 표현하면: 기준 dmax> T가 오디오 시그널 세그먼트 또는 프레임에 대해서 수행될 때, 델타 코딩은 수행되지 않아야하고, 양쪽 코딩 방법으로부터의 결과를 비교하지 않고 드문 코딩을 사용하도록 결정될 수 있다. 즉, 이 경우, Ld는 디폴트에 의해 Ls보다 큰 것으로 고려될 수 있고, 드문 코딩만이 수행될 필요가 있다.

도 2 및 3은 적어도 한 실시형태에 따라 제안된 기술의 방법을 도시하는 흐름도이다. 방법은, 오디오 인코더로 표시될 수도 있는, 오디오 코더에 의해 수행되는 것이 의도되는데, 오디오 시그널 세그먼트를 인코딩하기 위해서 동작가능하다. 이 실시형태에 있어서는, 결정 로직(9)이 구현되고, 예시하는 수의 무손실 코딩 방안은 2개이다. 본 방법은, 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위해서 최소 수의 비트를 요구하는 2개의 무손실 스펙트럼의 피크 위치 코딩 방안 중 어떤 하나를 결정(201)하는 단계와; 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위해서 최소 수의 비트를 요구하는 스펙트럼의 피크 위치 코딩 방안을 선택(202)하는 단계를 포함하여 구성된다. 또한, 이 실시형태는 도 3을 참조로 더 상세히 기술된다. 액션 301에서, dmax, 대안적으로 표시된 Δmax가 T보다 큰지가 결정된다(dmax> T). 조건은, 분명히, 대안적으로, 예를 들어 dmax≥ T로서 공식이 만들어진다. dmax가 T보다 끌 때, 드문 코딩이 선택(304)되고, 스펙트럼의 피크 위치는 드문 코딩 방안을 사용해서 코딩될 수 있다. 이는, dmax> T일 때, 스펙트럼의 피크 위치를 인코딩하기 전에 사용하기 위한 어떤 코딩 방안에 관해서 결정할 수 있게 한다. 델타 코딩은 T보다 작은 델타를 효율적으로 코딩하는 한편 T보다 큰 델타를 반드시 핸들링할 필요가 없게 구성될 수 있다. 즉, 호프만 표의 사이즈는 드문 피크 위치 코딩 방안과 함께 최적화될 수 있어서 상기 소정 사이즈인 델타에 대한 드문 코딩 방안의 효율이 이러한 델타가 호프만 표로 표현되지 않는 것에 의해 활용되도록 한다. 이 최적화는 호프만 표 내의 전체 짧은 코드워드 사이즈로 귀결되는데, 이는 코딩 효율에 대해서 매우 이익이 된다. 드문 코딩 방안은 dmax> T에 대해서 최소 수의 비트를 요구하는 코딩 방안이다.

dmax가 T보다 크지 않을 때, 즉 조건 301이 이행되지 않을 때; 스펙트럼의 피크 위치는 양쪽 코딩 방안을 사용해서 인코딩(302)된다. 즉, 스펙트럼의 피크 위치는 델타 코딩 및 드문 코딩 각각을 사용해서 인코딩되어, 2개의 다른 결과를 부여한다. 각각의 코딩 방안은 소정 수의 비트를 요구하여, 상기 Ld와 Ls 참조, 스펙트럼의 피크 위치의 현재의 세트를 인코딩한다. 이 수의 비트는 관찰되고, 수들은 현재 피크 분포에 대해서 가장 효율적이었던 어떤 코딩 방안을 결정하기 위해서 비교될 수 있다. 다른 방법에 대해서 요구된 각각의 수의 비트에 기반해서, 스펙트럼의 피크 위치의 현재의 세트를 인코딩하기 위해 최소 수의 비트를 요구하는 어떤 코딩 방안이 결정될 수 있고, 최소 수의 비트가 요구된 코딩 방안이 선택(303)될 수 있다. 결정하는, 즉 이 경우에서 요구된 수의 비트를 비교하는 것은, 액션 303 또는 액션 302 내에 통합되는 것으로서 간주될 수 있다. 그 다음, 액션 304 또는 액션 303에서 선택된 코딩 방안은, 인코딩된 스펙트럼의 피크 위치와 관련해서 디코더에 가리켜질 수 있다(306). 이것은, 선택된 코딩 방안의 사용에 의해 인코딩되었던 코딩된 스펙트럼의 피크 위치의 버전의 전송과 관련된다. 다른 선택되지 않은, 코딩 방안으로 인코딩된 버전은 사용되지 않고, 폐기될 수 있다.

2개의 무손실 스펙트럼의 피크 위치 코딩 방안 중 제1의 것으로도 표시될 수 있는 델타 코딩은, 주기적 또는 세미-주기적 스펙트럼의 피크 위치 분포의 인코딩에 대해서 적합하고; 2개의 무손실 스펙트럼의 피크 위치 코딩 방안 중 제2의 것으로도 표시될 수도 있는 드문 코딩은, 드문 스펙트럼의 피크 위치 분포에 대해서 적합하다. 바람직하게는, 델타 코딩은, 상기된 바와 같이, 피크 위치의 델타 코딩 및 델타 코드의 호프만 코딩을 포함하여 구성된다. 대안적으로, 이는 델타-호프만 코딩으로서 언급된다.

드문 스펙트럼의 피크 위치 코딩 방안은, 상기된 바와 같이, 스펙트럼의 피크 위치를 나타내는 비트 벡터를 연속적인 동등한 사이즈 비트 그룹으로 분할하는 단계(표현 (4) 참조)와; 그룹 비트 벡터를 형성하기 위해서 각각의 비트 그룹 내의 비트를 OR-하는 단계(표현 (5) 참조)와; 2개의 연속적인 피크들 사이의 최소 허용된 거리에서의 제약을 활용함으로써 비-제로 비트 그룹을 압축하는 단계(표현 (6) 및 표 1 참조); 및 그룹 비트 벡터와 압축된 비-제로 비트 그룹을 연결함으로써 압축된 비트 벡터를 더 형성하는 단계(표현 (7) 참조)를 포함한다. 여기서, 또한, 용어 "OR-하는"은 그룹 내의 비트가 몇몇 다른 방식으로 일들 "1들"에 대해서 체크되어, OR-하는 것과 동일한 결과를 부여하는 변형을 수용하는 것으로 고려된다. 예를 들어, 그룹의 비트는 차례로 체크될 수 있고, "1"이 검출되면, 그룹은 비-제로 비트 그룹이 되는 것으로 결정된다.

도 4는 상기된 적어도 결정 로직(8)을 구현하는 실시형태에 따른 제안된 기술의 방법을 도시하는 흐름도이다. 스텝 401은 다른 스펙트럼의 피크 위치 분포에 대해서 적합한 적어도 2개의 무손실 스펙트럼의 피크 위치 코딩 방안에 따라서 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩한다. 스텝 402는 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위해서 최소 수의 비트를 요구하는 스펙트럼의 피크 위치 코딩 방안을 선택한다. 액션 401 및 402는 도 3의 액션 302 및 303와 동일하게 될 수 있다.

여기서 기술된 스텝, 기능, 과정, 모듈, 유닛 및/또는 블록은, 일반 목적 전자 회로 및 애플리케이션-특정 회로 양쪽을 포함하는 이산 회로 또는 집적된 회로 기술과 같은 소정의 통상적인 기술을 사용해서 하드웨어로 구현될 수 있다.

특정 예들은 하나 이상의 적합하게 구성된 디지털 시그널 프로세서 및 다른 공지된 전자 회로, 예를 들어 특화된 기능을 수행하기 위해서 상호 연결된 이산 로직 게이트, 또는 애플리케이션 특정 집적된 회로(ASICs)를 포함한다.

대안적으로, 상기된 적어도 몇몇 스텝, 기능, 과정, 모듈, 유닛 및/또는 블록은 하나 이상의 처리하는 유닛을 포함하는 적합 처리 회로에 의한 실행을 위한 컴퓨터 프로그램와 같은 소프트웨어로 구현될 수 있다.

여기서 나타낸 흐름도 또는 도면은, 하나 이상의 프로세서에 의해 수행될 때, 컴퓨터 흐름도 또는 도면으로서 간주될 수 있다. 대응하는 장치는 기능 모듈의 그룹으로서 규정될 수 있는데, 여기서 프로세서에 의해 수행된 각각의 스텝은 기능 모듈에 대응한다. 이 경우, 기능 모듈은 프로세서상에서 구동하는 컴퓨터 프로그램으로서 구현된다.

처리 회로의 예들은, 이에 제한되지 않지만, 하나 이상의 마이크로프로세서, 하나 이상의 디지털 시그널 프로세서, DSP, 하나 이상의 중앙 처리 유닛, CPU, 비디오 가속 하드웨어, 및/또는 하나 이상의 필드 프로그램가능 게이트 어래이, FPGA, 또는 하나 이상의 프로그램가능 로직 컨트롤러, PLC와 같은 소정의 적합한 프로그램가능 로직 회로를 포함한다.

또한, 제안된 기술이 구현되는 소정의 통상적인 장치 또는 유닛의 일반적인 처리 능력을 재사용하는 것이 가능하게 될 수 있는 것으로 이해되어야 한다. 또한, 예를 들어 현존하는 소프트웨어를 재프로그래밍함으로써 또는 신규 소프트웨어 구성요소를 부가함으로써, 현존하는 소프트웨어를 재사용하는 것이 가능하게 될 수 있다.

또한, 여기서 기술된 실시형태는 오디오 시그널을 인코딩할 수 있는 인코더와 관련된다. 코더는, 상기된 코더에 의해 수행된 방법의 적어도 한 실시형태를 수행하도록 구성된다. 코더는 상기된 및, 예를 들어 도 3에 도시된 방법과 동일한 기술적인 형태, 목적 및 장점과 연관된다. 코더는 불필요한 반복을 회피하기 위해서, 간략히 기술될 것이다.

이하, 스펙트럼의 피크 위치의 코딩을 위한 상기된 방법의 실행을 가능하게 하기 위해 구성된 예시하는 코더(500)가 도 5를 참조로 기술될 것이다. 코더는 유저 단말 내에 구성될 수 있거나 또는 게이트웨이와 같은 네트워크 노드 내에 구성될 수 있다. 코더(500)는, 상기된 2개의 무손실 스펙트럼의 피크 위치 코딩 방안을 수행하는 기능성과 함께 구성되는 것으로 상정될 수 있다.

도 5는 제안된 코더(10)의 실시형태를 도시하는 블록도이다. 이 실시형태는 프로세서(22) 형태의 처리 수단 및 메모리(24)를 포함한다. 메모리는, 예를 들어 처리 수단에 의해 실행될 때, 코더(10)가 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위해서 최소 수의 비트를 요구하는 2개의 무손실 스펙트럼의 피크 위치 코딩 방안 중 어떤 하나를 결정하게 하는 컴퓨터 프로그램 형태의 명령을 포함하여 구성될 수 있다. 바람직하게는, 코더(10)는, 상기된 바와 같이, 결정 로직(9)에 적용하도록 구성된다. 이는, 파라미터 dmax가 문턱을 초과하는 지를 결정함으로써, 그렇지 않으면, 양쪽 코딩 방안으로 스펙트럼의 피크 위치를 코딩한 후, 스펙트럼의 피크 위치를 인코딩하기 위해 2개의 코딩 방안에 의해 요구된 비트의 수를 비교함으로써 수행될 수 있다. 더욱이, 명령의 실행은, 코더(10)가 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위해서 최소 수의 비트를 요구하는 스펙트럼의 피크 위치 코딩 방안을 선택하게 한다. 코더(10)는 2개의 코딩 방안으로 구성되는데, 이들은 메모리(24) 내에 기억된 명령의 부분이 될 수 있거나, 또는 대안적으로 코더(도시 생략)의 몇몇 다른 부분에서 구현될 수 있다. 이전과 같이, 2개의 무손실 스펙트럼의 피크 위치 코딩 방안 중 제1의 것은 주기적 또는 세미-주기적 스펙트럼의 피크 위치 분포에 대해서 적합하고; 2개의 무손실 스펙트럼의 피크 위치 코딩 방안 중 제2의 것은 드문 스펙트럼의 피크 위치 분포에 대해서 적합하다. 이는, 또한, 코더(10)가 2개의 다른 코딩 모드에서 스펙트럼의 피크를 인코딩하기 위해 동작가능한 것으로서 기술될 수 있다;

명령은 컴퓨터 판독가능한 매체(유형의 비-트랜지터리 매체) 상의 컴퓨터 프로그램 프로덕트(20)로서 기억될 수 있고, 도면의 좌측의 대시 화살표로 가리켜지는 바와 같이, 메모리(24)에 전달될 수 있다. 오디오 시그널 세그먼트는 입력 유닛 IN에 걸쳐서 프로세서(22)로 포워드되고, 코딩된 스펙트럼의 피크 위치는 출력 유닛 OUT에 걸쳐서 디코더로 포워드된다. 선택된 코딩 방안은, 도 5에 대시 화살표로 가리켜지는 바와 같이, 디코더에 명확히 시그널링될 수 있거나, 또는 대안으로서, 이는 가능한 디코딩 모드에서 수신된 비트 스트림의 시험 디코딩 및 성공적이었던 것을 선택함으로써, 디코더에서 검출될 수 있다. 제1대안은 덜 복잡하지만, 더 넓은 대역폭을 요구한다. 제2대안은 더 좁은 대역폭을 요구하지만, 더 복잡하다. 유사한 대안들을 이하 기술된 다른 실시형태에 적용한다.

코더(10)의 대안적인 실시형태를 도 6에 나타낸다. 도 6은 오디오 시그널을 인코딩하도록 동작가능한 코더(10)를 도시한다. 코더(10)는 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위해서 최소 수의 비트를 요구하는 2개의 무손실 스펙트럼의 피크 위치 코딩 방안 중 어떤 하나를 결정하도록 구성된 결정 유닛(603)을 포함하여 구성된다. 더욱이, 코더(10)는, 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위해서 최소 수의 비트를 요구하는 스펙트럼의 피크 위치 코딩 방안을 선택하도록 구성된 선택 유닛(604)을 포함하여 구성된다.

도 7은 제안된 코더(10)의 예시하는 실시형태를 도시하는 블록도이다. 코더(10)는, 상기된 바와 같이, 적어도 결정 로직(8)을 구현하는 스펙트럼의 피크 위치의 코딩을 위한 방법을 수행하도록 구성된다. 오디오 시그널 세그먼트는 시그널 분석 유닛(16)으로 포워드되는데, 이는 코딩 목적을 위해 세그먼트를 분석한다. 이 분석으로부터 추출된 형태 중 하나는 스펙트럼의 피크 위치의 세트이다. 이 분석은 적합한 종래 기술 방법의 사용에 의해 수행될 수 있다. 이들 스펙트럼의 피크 위치는, 다른 스펙트럼의 피크 위치 분포에 대해서 적합한 적어도 2개의 무손실 스펙트럼의 피크 위치 코딩 방안에 따라서 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하도록 구성된 스펙트럼의 피크 위치 코더(12)로 포워드된다. 각각의 코딩 방안의 비트의 전체 수, 즉 스펙트럼의 피크 위치를 인코딩하기 위한 각각의 방법에 의해 요구된 비트의 수는, 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위해서 최소 수의 비트를 요구하는 스펙트럼의 피크 위치 코딩 방안을 선택하도록 구성된 코딩 방안 선택기(14)로 포워드된다. 선택된 코딩된 스펙트럼의 피크 위치는 출력 유닛(18)으로 포워드되고 디코더로 포워드된다.

도 8은 다른 실시형태의 제안된 코더(10)를 도시하는 블록도이다. 스펙트럼의 피크 위치의 세트는 코더(10)로 포워드되는데, 이 코더는 다른 스펙트럼의 피크 위치 분포에 대해서 적합한 적어도 2개의 무손실 스펙트럼의 피크 위치 코딩 방안에 따라서 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위한 스펙트럼의 피크 위치 코딩 모듈(12)을 포함한다. 또한, 코더(10)는 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위해서 최소 수의 비트를 요구하는 스펙트럼의 피크 위치 코딩 방안을 선택하기 위한 코딩 방안 선택 모듈(14)을 포함한다. 선택된 코딩된 스펙트럼의 피크 위치는 디코더로 포워드된다. 또한, 선택된 코딩 방안은, 상기된 바와 같이, 디코더에 가리켜질 수 있다.

코더(10)가 상기된 결정 로직(9)을 지원하도록 구성될 때, 코딩 방안 선택 모듈(14)은, 2개의 연속적인 피크 위치 사이의 최대 거리와 관련된 기준에도 의존하는, 스펙트럼의 피크 위치를 코딩하기 위해서 최소 수의 비트를 요구하는 적어도 2개의 무손실 스펙트럼의 피크 위치 코딩 방안 중 어떤 것을 결정하도록 더 구성되어야 한다. 즉, 코딩 방안 선택 모듈(14)은, 스펙트럼의 피크 위치의 인코딩 전에, 최대 거리 dmax가 사전 결정된 문턱을 초과하는지를 결정하고, 결과에 따라서 액션을 취한다, 도 3 참조.

도 9는 다른 실시형태의 제안된 코더(10)를 도시하는 블록도이다. 이 실시형태는, 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위한 컴퓨터 프로그램(30)을 실행하는, 예를 들어 마이크로프로세서인 프로세서(22)에 기반한다. 컴퓨터 프로그램은 메모리(24) 내에 기억된다. 프로세서(22)는 시스템 버스를 통해서 메모리와 통신한다. 인입하는 오디오 시그널 세그먼트는 프로세서(22) 및 메모리(24)가 접속된 I/O 버스를 제어하는 입력/출력(I/O) 컨트롤러(26)에 의해 수신된다. 소프트웨어(30)로부터 획득된 코딩된 스펙트럼의 피크 위치는 I/O 버스를 통해서 I/O 컨트롤러(26)에 의해 메모리(24)로부터 출력된다. 컴퓨터 프로그램(30)은 다른 스펙트럼의 피크 위치 분포에 대해서 적합한 2개의 무손실 스펙트럼의 피크 위치 코딩 방안에 따라서 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위한 코드 유닛(32) 및 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위해서 최소 수의 비트를 요구하는 스펙트럼의 피크 위치 코딩 방안을 결정 및 선택하기 위한 코드 유닛(34)을 포함한다.

메모리 내에 상주하는 컴퓨터 프로그램은, 프로세서에 의해 실행될 때, 상기된 스텝 및/또는 태스크의 적어도 부분을 수행하도록 구성된 적합한 기능 모듈로서 편제될 수 있다. 한 예의 이러한 기능 모듈은 도 8에 도시된다. 소프트웨어 또는 컴퓨터 프로그램은 컴퓨터 프로그램 프로덕트로서 실현될 수 있는데, 이는 정상적으로는 컴퓨터-판독가능한 매체(유형의 비-트랜지터리 매체) 상에 수반 또는 기억된다. 컴퓨터-판독가능한 매체는, 이에 제한되지 않지만, ROM(Read-Only Memory), RAM(Random Access Meory), CD, DVD(Digital Versatile Disc), USB(Universal Serial Bus), 메모리, HDD(Hard Disk Drive) 스토리지 장치, 플래시 메모리, 또는 소정의 다른 통상적인 메모리 장치를 포함하는, 하나 이상의 제거가능한 또는 비-제거가능한 메모리 장치를 포함할 수 있다. 따라서, 컴퓨터 프로그램은 그 처리 회로에 의한 실행을 위해 컴퓨터 또는 등가의 처리 장치의 동작 메모리 내에 로딩될 수 있다.

예를 들어, 컴퓨터 프로그램은 처리 회로에 의해 실행가능한 명령을 포함하는데, 이에 의해 처리 회로는 여기서 기술된 스텝, 기능, 과정 및/또는 블록을 실행할 수 있거나 실행하도록 동작가능하다. 컴퓨터 또는 처리 회로는 여기서 기술된 스텝, 기능, 과정 및/또는 블록만을 실행하기 위해 전용으로 되어야 하지는 않고, 다른 태스크도 실행할 수 있다.

또한, 제안된 기술은 상기된 바와 같이 오디오 시그널 세그먼트 코더를 포함하는 유저 단말을 포함한다. 유저 단말은 유선 또는 무선 장치가 될 수 있다.

여기서 사용됨에 따라, 용어 "무선 장치"는 UE(유저 장비), 모바일 폰, 셀룰러 폰, 무선 통신 능력이 구비된 PDA(Personal Digital Assistant), 스마트 폰, 랩탑 또는 퍼스널 컴퓨터, PC를 구비한 내부 또는 외부 모바일 광대역 모뎀, 무선 통신 능력을 갖춘 태블릿 PC, 포터블 전자 무선 통신 장치, 무선 통신 능력이 구비된 센서 장치 등을 언급할 수 있다. 특히, 용어 "UE"는 소정의 관련 통신 표준을 따르는 무선 통신을 위한 무선 회로를 구비한 소정의 장치를 포함하여 구성되는 비-제한하는 용어로서 해석되어야 한다.

여기서 사용됨에 따라, 용어 "유선 장치"는, 네트워크에 유선 접속을 위해 구성될 때, 무선 통신 능력이 있는 또는 없는, 적어도 몇몇 상기 장치의, 예를 들어 PC를 언급할 수 있다.

도 10은 실시형태의 제안된 유저 단말(50)을 도시하는 블록도이다. 이 예는 UE를 도시한다. 마이크로폰으로부터의 오디오 시그널은 아날로그/디지털 컨버터 A/D로 포워드되고, 디지털 시그널은 제안된 기술에 따라서 코더(10)에 의해 처리된다. 특히, 코더(10)는 상기된 바와 같이 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩한다(전형적으로, 코더는 오디오 시그널 세그먼트의 주파수 변환 및 세그먼트를 기술하는 다른 파라미터의 코딩과 같은 다른 태스크를 수행할 수 있지만, 이들 태스크는 이들이 종래 기술에서 널리 공지되고 제안된 기술의 본질적인 부분을 형성하지 않으므로, 기술되지 않는다). 코딩된 스펙트럼의 피크 위치(및 다른 파라미터)는 디코더로의 전송을 위해 무선 유닛(40)으로 포워드된다. 옵션으로, 선택된 코딩 방안은, 상기된 바와 같이, 또한 디코더로 포워드된다.

여기서 기술된 실시형태는, 또한, 스펙트럼의 피크 위치의 디코딩을 위한 오디오 시그널 세그먼트 디코딩 방법과 관련된다. 방법은 이전에 기술된 코딩 방법에 대응하는 방법이다.

도 11은 실시형태의 제안된 기술의 디코딩 방법을 도시하는 흐름도이다. 액션 1101에서, 오디오 시그널 세그먼트의 코딩된 스펙트럼의 피크 위치가 수신된다. 액션 1102에서, 스펙트럼의 피크 위치를 코딩하기 위해 선택되었던 코딩 방안의 인디케이터가 수신된다. 액션 1103에서, 스펙트럼의 피크 위치가 가리켜진 코딩 방안에 대응하는 디코딩 모드에서 디코딩된다. 이는, 또한, 스펙트럼의 피크 위치가 가리켜진 코딩 방안에 따라, 즉 가리켜진 코딩 방안에 대응하는 디코딩 방안의 사용에 의해, 디코딩된 것으로서 표현될 수 있다. 가리켜진 코딩 방안은, 2개의 무손실 스펙트럼의 피크 코딩 방안 중 하나인데, 여기서, 이전과 같이, 2개의 무손실 스펙트럼의 피크 위치 코딩 방안 중 제1의 것은 주기적 또는 세미-주기적 스펙트럼의 피크 위치 분포에 대해서 적합하고; 2개의 무손실 스펙트럼의 피크 위치 코딩 방안 중 제2의 것은 드문 스펙트럼의 피크 위치 분포에 대해서 적합하다.

드문 스펙트럼의 피크 위치 분포에 대해서 적합한 코딩 방안이 가리켜질 때, 코딩된 스펙트럼의 피크 위치는 그룹 비트 벡터 및 그룹 비트 벡터에 의해 가리켜진 압축된 비-제로 비트 그룹의 형태로 수신될 수 있다. 이는, 초기에 기술된 바와 같은 드문 코딩 방안에 대응한다. 그 다음, 그룹 비트 벡터 내의 각각의 위치는 비트의 연속적인 동등한 사이즈 그룹을 나타낼 수 있다. 더욱이, 스펙트럼의 피크를 포함하여 구성되는 동등한 사이즈 그룹은 스펙트럼의 피크를 포함하여 구성되지 않은 동등한 사이즈 그룹으로부터 분리가능해야 한다. 스펙트럼의 피크를 포함하여 구성되는 동등한 사이즈 그룹은, 비-제로 비트 그룹으로도 표시될 수 있고, 스펙트럼의 피크를 포함하여 구성되지 않는 동등한 사이즈 그룹보다 그룹 비트 벡터에서 다르게 가리켜진다. 예를 들어, 비-제로 비트 그룹은, 상기 표현 (5)-(7)과 같이, 그룹 비트 벡터에서 "1"로 가리켜질 수 있고, 스펙트럼의 피크를 포함하여 구성되지 않는 그룹은 "0"으로 가리켜질 수 있다.

있다면, 그룹 비트 벡터로 가리켜진 비-제로 비트 그룹은, 그 다음 2개의 연속적인 피크들 사이의 최소 허용된 거리에서의 제약에 기반해서 압축 해제될 수 있다. 즉, 압축 형태로 그룹 비트 벡터에 연결될 수 있는 비-제로 비트 그룹은, 예를 들어 상기된 표 1과 같은 표의 사용에 의해 압축 해제될 수 있다. 피크 사이의 최소 허용된 거리에 관한 제약 또는 제한에 기인해서, 비-제로 비트 그룹에 대해서 모든 시퀀스가 가능하지 않고, 따라서 각각의 가능한 시퀀스가 더 짧은 시퀀스로 맵핑될 수 있는데, 이전에 기술된 바와 같이, 즉 압축될 수 있다.

"제로-비트" 그룹, 즉 있다면 그룹 비트 벡터로 가리켜진 소정의 스펙트럼의 피크를 포함하여 구성되지 않은 그룹은, 제로들의 시퀀스를 생성함으로써, 압축 해제될 수 있다. 그룹은 동등한 사이즈가 되어야 하므로, 제로들의 이러한 시퀀스는 압축 해제된 비-제로 비트 그룹과 동일 사이즈가 되어야 한다. 전형적으로, 드문 코딩 방안 또는 모드가 드문 스펙트럼의 피크 분포에 대해서 적용되는 것이 주어지면, 그룹 비트 벡터에서 가리켜진 제로-비트가 될 수 있다.

가리켜진 스펙트럼의 피크 위치 코딩 방안이 주기적 또는 세미-주기적 스펙트럼의 피크 위치 분포에 대해서 적합한 코딩 방안일 때, 수신된 스펙트럼의 피크 위치의 디코딩은, 이전에 기술된 인코딩에 대응하는 호프만 디코딩 및 델타 디코딩을 포함하여 구성될 수 있다. 호프만 디코딩을 위해 사용된 호프만 표의 사이즈는, 이전에 기술된 바와 같이, 제2스펙트럼의 피크 위치 코딩 방안과 함께 최적화될 수 있다.

대안적인 실시형태에 있어서, 인코더는 디코더에 선택된 코딩 방안을 가리키지않는데, 제안된 기술의 디코딩 방법은 다른 스펙트럼의 피크 위치 분포에 대해서 적합한 2개의 스펙트럼의 피크 위치 디코딩 모드에서 스펙트럼의 피크 위치의 소위 시험 디코딩을 포함하여 구성될 수 있다. 스펙트럼의 피크 위치의 성공적으로 디코딩된 세트로 귀결되는 디코딩 방안 또는 모드가 선택된 코딩 방안에 대응하기 위해서 상정된다.

또한, 여기서 기술된 실시형태는 오디오 시그널을 디코딩하도록 동작가능한 디코더와 관련된다. 디코더는, 상기된 스펙트럼의 피크 위치의 디코딩을 위한 오디오 시그널 세그먼트 디코딩 방법의 적어도 한 실시형태를 수행하도록 구성된다. 디코더는 상기된 스펙트럼의 피크 위치의 코딩 및 디코딩을 위한 대응하는 코더 및 방법과 동일한 기술적인 형태, 목적 및 장점과 연관된다. 디코더는 불필요한 반복을 회피하기 위해서 간략히 기술될 것이다.

도 12는 실시형태의 제안된 오디오 시그널 세그먼트 디코더(110)를 도시하는 블록도이다. 입력 유닛(116)은 코딩된 스펙트럼의 피크 위치 및 코딩 방안 인디케이터를 수신한다. 디코더(110)는, 다른 스펙트럼의 피크 위치 분포에 대해서 적합한 2개의 스펙트럼의 피크 위치 코딩 모드 중 가리켜진 하나에 대응하는 디코딩 모드에서 스펙트럼의 피크 위치를 디코딩하도록 구성된 스펙트럼의 피크 위치 디코더(112)를 포함한다. 출력 유닛(118)은 디코딩된 스펙트럼의 피크 위치를 출력한다. 소정 "디코딩 모드"에서 디코딩하는 것은, 수신된 코딩된 스펙트럼의 피크 위치를 디코딩하기 위해서 소정의 가리켜진 코딩 방안에 대응하는 디코딩 방안을 사용하는 것으로 대안적으로 표현될 수 있다.

한 실시형태에 있어서, 스펙트럼의 피크 위치 디코더(112)는 오디오 시그널 세그먼트의 코딩된 스펙트럼의 피크 위치를 수신하고; 스펙트럼의 피크 위치를 코딩하기 위해 선택되었던 코딩 방안의 인디케이터를 수신하며; 가리켜진 코딩 방안에 대응하는 디코딩 모드에서 스펙트럼의 피크 위치를 디코딩하도록 구성된다. 후자는, 예를 들어 가리켜진 코딩 방안에 기반한 디코딩 스펙트럼의 피크 위치로서, 또는 가리켜진 코딩 방안에 따라서 스펙트럼의 피크 위치를 디코딩하는 것으로서 대안적으로 표현될 수 있다. 도 13은 다른 실시형태의 제안된 오디오 시그널 세그먼트 디코더(110)를 도시하는 블록도이다. 코딩된 스펙트럼의 피크 위치 및 코딩 방안 인디케이터가 스펙트럼의 피크 위치 디코딩 모듈(112)로 포워드되는데, 이는 디코딩된 스펙트럼의 피크 위치를 출력한다.

한 실시형태에 있어서, 도 13의 디코더(110)는 스펙트럼의 피크 위치를 코딩하기 위해 선택되었던 코딩 방안의 수신된 인디케이터에 대응하는 디코딩 모드에서 오디오 시그널 세그먼트의 코딩된 스펙트럼의 피크 위치를 스펙트럼의 피크 위치로 디코딩하기 위한 스펙트럼의 피크 위치 디코딩 모듈(112)을 포함한다.

다른 실시형태에 있어서, 도 13의 디코더(110)는, 다른 스펙트럼의 피크 위치 분포에 대해서 적합한 적어도 2개의 스펙트럼의 피크 위치 디코딩 모드에서 오디오 시그널 세그먼트의 수신된 코딩된 스펙트럼의 피크 위치를 스펙트럼의 피크 위치로 시험 디코딩하고, 성공적으로 디코딩된 스펙트럼의 피크 위치의 세트를 출력하기 위한 스펙트럼의 피크 위치 디코딩 모듈(112)을 포함한다.

도 14는 실시형태의 제안된 디코더를 도시하는 블록도이다. 이 실시형태는 프로세서(22) 및 메모리(24)를 포함하는데, 여기서 메모리는 프로세서에 의해 실행가능한 명령을 포함한다. 명령의 실행은, 디코더(110)가, 다른 스펙트럼의 피크 위치 분포에 대해서 적합한 적어도 2개의 스펙트럼의 피크 위치 코딩 모드 중 하나에 대응하는 디코딩 모드에서 스펙트럼의 피크 위치를 디코딩하도록 동작하게 한다. 명령은 컴퓨터 프로그램 프로덕트(120)로서 컴퓨터 판독가능한 매체 상에 기억될 수 있고, 도면의 우측에 대시 화살표로 가리켜지는 바와 같이 메모리(24)에 전달될 수 있다. 코딩된 스펙트럼의 피크 위치 및 코딩 방안은 입력 유닛 IN에 걸쳐서 프로세서(22)로 포워드되고, 디코딩된 스펙트럼의 피크 위치는 출력 유닛 OUT에 걸쳐서 출력된다.

한 실시형태에 있어서, 프로세서에 의한 명령의 실행은, 도 14의 디코더가, 오디오 시그널 세그먼트의 코딩된 스펙트럼의 피크 위치를 수신하고; 스펙트럼의 피크 위치를 코딩하기 위해 선택되었던 코딩 방안의 인디케이터를 수신하며; 가리켜진 코딩 방안에 대응하는 디코딩 모드에서 스펙트럼의 피크 위치를 디코딩하도록 동작하게 한다.

도 14는 다른 실시형태의 제안된 디코더(110)를 도시하는 블록도이다. 이 실시형태는, 예를 들어 마이크로프로세서인 프로세서(22)에 기반하는데, 이는 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 디코딩하기 위한 컴퓨터 프로그램(130)을 실행한다. 컴퓨터 프로그램은 메모리(24) 내에 기억된다. 프로세서(22)는 시스템 버스를 통해서 메모리와 통신한다. 인입하는 코딩된 스펙트럼의 피크 위치 및 코딩 방안 인디케이터는 I/O 버스를 제어하는 입력/출력(I/O) 컨트롤러(26)에 의해 수신되는데, 이에 대해서 프로세서(22) 및 메모리(24)가 접속된다. 소프트웨어(130)로부터 획득된 (디코딩된) 스펙트럼의 피크 위치는 I/O 버스를 통해서 I/O 컨트롤러(26)에 의해 메모리(24)로부터 출력되다. 컴퓨터 프로그램(130)은 오디오 시그널 세그먼트의 코딩된 스펙트럼의 피크 위치를 수신하기 위한 코드 유닛(132), 스펙트럼의 피크 위치를 코딩하기 위해 선택되었던 코딩 방안의 인디케이터를 수신하기 위한 코드 유닛(134), 가리켜진 코딩 방안에 대응하는 디코딩 모드에서 스펙트럼의 피크 위치를 디코딩하기 위한 코드 유닛(136)을 포함한다. 또한, 후자는: 가리켜진 코딩 방안에 부합해서 스펙트럼의 피크 위치를 디코딩하기 위한 것으로서 표현될 수 있다.

메모리 내에 상주하는 컴퓨터 프로그램은, 프로세서에 의해 실행될 때, 상기된 스텝 및/또는 태스크의 적어도 부분을 수행하도록 구성 적합한 기능 모듈로서 편제될 수 있다. 한 예의 이러한 기능 모듈이 도 15에 도시된다.

도 16은 제안된 유저 단말의 실시형태를 도시하는 블록도이다. 예는 UE를 도시한다. 안테나로부터의 무선 시그널은 무선 유닛(160)으로 포워드되고, 무선 유닛으로부터의 디지털 시그널은 제안된 기술에 따라서 디코더(110)에 의해 처리된다. 특히, 디코더(110)는 상기된 바와 같이 오디오 시그널 세그먼트의 코딩된 스펙트럼의 피크 위치를 디코딩한다(전형적으로, 코더는 세그먼트를 기술하는 다른 파라미터의 디코딩과 같은 다른 태스크를 수행할 수 있지만, 이들 태스크는 이들이 종래 기술에서 널리 공지되고 제안된 기술의 본질적인 부분을 형성하지 않으므로, 기술되지 않는다). 디코딩된 스펙트럼의 피크 위치(및 다른 파라미터)는, 라우드스피커에 접속된 시그널 재구성 유닛(142)으로 포워드된다. 또한, 선택된 코딩 방안은, 상기된 바와 같이 디코더에서 수신된다.

상기된 실시형태는 단지 예로서 주어진 것이고, 제안된 기술은 이에 제한되지 않는 것으로 이해되어야 한다. 다양한 수정, 결합 및 변화가 본 발명 범위로부터 벗어남이 없이 실시형태로 만들어질 수 있는 것이 종래 기술의 당업자에 의해 이해될 것이다. 특히, 다른 실시형태들에서의 다른 부분적인 해결책들이 기술적으로 가능한 다른 구성에서 결합될 수 있다.

약어
ASIC Application Specific Integrated Circuit
CPU Central Processing Units
DSP Digital Signal Processor
FPGA Field Programmable Gate Array
PLC Programmable Logic Controller
참조
[1] D. Salomon, G. Motta, "Handbook of Data Compression", Fifth Edition, 2010, p. 1111.

Claims

오디오 시그널 세그먼트의 스펙트럼의 피크 위치의 코딩을 위한 방법으로서:
- 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위해서 최소 수의 비트를 요구하는 2개의 무손실 코딩 방안 중 어떤 하나를 결정(201)하는 단계로서, 2개의 무손실 코딩 방안은 주기적 또는 세미-주기적 스펙트럼의 피크 위치 분포를 코딩하기 위해 적합한 제1무손실 코딩 방안 및 드문 스펙트럼의 피크 위치 분포를 코딩하기 위해 적합한 제2무손실 코딩 방안을 포함하는, 결정하는 단계와;
- 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위해서 최소 수의 비트를 요구하는 코딩 방안을 선택(202)하는 단계와,
- 선택된 코딩 방안을 디코더에 가리키는(306) 단계를 포함하고;
제2무손실 코딩 방안은:
- 스펙트럼의 피크 위치를 나타내는 비트 벡터를 연속적인 동등한 사이즈 비트 그룹으로 분할하는 단계와;
- 그룹 비트 벡터를 형성하기 위해서 각각의 비트 그룹 내의 비트를 OR-하는 단계와;
- 2개의 연속적인 피크들 사이의 최소 허용된 거리에서의 제약을 활용함으로써 비-제로 비트 그룹을 압축하는 단계와;
- 전송을 위해 그룹 비트 벡터와 압축된 비-제로 비트 그룹을 제공하는 단계를 포함하여 구성되는 것을 특징으로 하는 방법.
제1항에 있어서,
결정은, 2개의 무손실 코딩 방안을 사용하는 오디오 시그널 세그먼트의 코딩(302, 401) 후 각각의 방안에 대해서 요구된 비트의 수를 비교하는 것에 기반하는 것을 특징으로 하는 방법.
제1항에 있어서,
제1무손실 코딩 방안은:
- 피크 위치의 델타 코딩;
- 델타 코드의 호프만 코딩을 포함하여 구성되는 것을 특징으로 하는 방법.
제1항에 있어서,
2개의 연속적인 피크들 사이의 최대 거리 dmax를 결정하고, dmax가 문턱 T를 초과하지 않으면, 상기 결정 단계 및 선택 단계를 수행하는 것을 특징으로 하는 방법.
제4항에 있어서,
문턱 T는 사전에 기억된 호프만 표에 기반해서 제1무손실 코딩 방안에 의해 코딩되는 것이 가능한 2개의 연속적인 피크들 사이의 최대 거리를 나타내는 것을 특징으로 하는 방법.
오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위한 오디오 코더(10)로서:
- 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위해서 최소 수의 비트를 요구하는 2개의 무손실 코딩 방안 중 어떤 하나를 결정(201)하고, 2개의 무손실 코딩 방안은 주기적 또는 세미-주기적 스펙트럼의 피크 위치 분포를 코딩하기 위해 적합한 제1무손실 코딩 방안 및 드문 스펙트럼의 피크 위치 분포를 코딩하기 위해 적합한 제2무손실 코딩 방안을 포함하며;
- 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위해서 최소 수의 비트를 요구하는 코딩 방안을 선택하고,
- 선택된 코딩 방안을 디코더에 가리키도록 구성되며;
제2무손실 코딩 방안은:
- 스펙트럼의 피크 위치를 나타내는 비트 벡터를 연속적인 동등한 사이즈 비트 그룹으로 분할하고;
- 그룹 비트 벡터를 형성하기 위해서 각각의 비트 그룹 내의 비트를 OR-하며;
- 2개의 연속적인 피크들 사이의 최소 허용된 거리에서의 제약을 활용함으로써 비-제로 비트 그룹을 압축하고;
- 전송을 위해 그룹 비트 벡터와 압축된 비-제로 비트 그룹을 제공하는 것을 특징으로 하는 오디오 코더.
제6항에 있어서,
2개의 무손실 코딩 방안을 사용하는 오디오 시그널 세그먼트의 코딩(302, 401) 후 각각의 방안에 대해서 요구된 비트의 수를 비교하는 것에 기반해서, 최소 수의 비트를 요구하는 2개의 무손실 코딩 방안 중 어떤 하나를 결정하도록 더 구성되는 것을 특징으로 하는 오디오 코더.
제6항에 있어서,
제1무손실 코딩 방안은:
- 피크 위치의 델타 코딩;
- 델타 코드의 호프만 코딩을 포함하여 구성되는 것을 특징으로 하는 오디오 코더.
제6항에 있어서,
2개의 연속적인 피크 사이의 최대 거리 dmax를 결정하고,
dmax가 문턱 T를 초과하지 않으면, 오디오 시그널 세그먼트의 스펙트럼의 피크 위치를 코딩하기 위해 최소 수의 비트를 요구하는 2개의 무손실 코딩 방안 중 어떤 하나를 결정하고, 최소 수의 비트를 요구하는 코딩 방안을 선택하도록 더 구성되는 것을 특징으로 하는 오디오 코더.
제9항에 있어서,
문턱 T는 사전에 기억된 호프만 표에 기반해서 제1무손실 코딩 방안에 의해 코딩되는 것이 가능한 2개의 연속적인 피크들 사이의 최대 거리를 나타내는 것을 특징으로 하는 오디오 코더.
청구항 제6항 내지 제10항 중 어느 한 항에 따른 오디오 코더(10)를 포함하여 구성되는 것을 특징으로 하는 유저 장비.
제11항에 있어서,
모바일 폰, 셀룰러 폰, 무선 통신 능력이 구비된 PDA(Personal Digital Assistant), 스마트 폰, 랩탑, 퍼스널 컴퓨터(PC), 무선 통신 능력을 갖춘 태블릿 PC, 포터블 전자 무선 통신 장치 및, 무선 통신 능력이 구비된 센서 장치 중 하나인 것을 특징으로 하는 유저 장비.
청구항 제6항 내지 제10항 중 어느 한 항에 따른 오디오 코더(10)를 포함하여 구성되는 것을 특징으로 하는 네트워크 노드.
명령을 포함하여 구성되는 컴퓨터 프로그램(30)을 기억하는 컴퓨터 판독가능한 기록 매체로서, 프로세서에 의해 실행될 때, 프로세서가 청구항 제1항 내지 제5항 중 어느 한 항에 따른 방법을 수행하게 하는 것을 특징으로 하는 컴퓨터 판독가능한 기록 매체.