KR20130133847A

KR20130133847A - 오디오 신호 트랙들의 펄스 포지션들의 인코딩 및 디코딩

Info

Publication number: KR20130133847A
Application number: KR1020137024213A
Authority: KR
Inventors: 톰 배크스트로엠; 귈라우메 푸쉬
Original assignee: 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Priority date: 2011-02-14
Filing date: 2012-02-10
Publication date: 2013-12-09
Also published as: EP2676267A1; TR201903388T4; ES2715191T3; CA2827156C; EP3471092B1; EP3471092A1; PL2676267T3; HK1245987B; EP3239978B1; ZA201306841B; PL3471092T3; CN103460284A; SG192747A1; AR085361A1; CA2827156A1; RU2013142068A; US9595263B2; PT3239978T; BR112013020700B1; MX2013009345A

Abstract

인코드된 오디오 신호를 디코딩하는 장치가 제공되며, 여기서 하나 또는 그 이상의 트랙들이 인코드된 오디오 신호와 연관되고, 각 트랙들은 복수의 트랙 포지션들과 복수의 펄스들을 가진다. 디코딩 장치가 펄스 정보 디코더(110) 및 신호 디코더(120)를 가진다. 펄스 정보 디코더(110)가 복수의 펄스 포지션들을 디코드하도록 구성된다. 여기서, 펄스 포지션들 각각이 트랙의 펄스들 중 하나의 포지션을 나타내도록 트랙들 중 하나의 트랙 포지션들 중 하나를 나타내고, 여기서 펄스 정보 디코더가 복수의 펄스 포지션들을 적어도 하나의 트랙들의 트랙 포지션들 수를 나타내는 트랙 포지션들 숫자, 적어도 하나의 트랙들의 펄스들의 전체 수를 나타내는 전체 펄스들 숫자 및 하나의 상태 번호를 사용하여 디코드하도록 구성된다. 신호 디코더(120)가 인코드된 오디오 신호를 복수의 펄스 포지션들과 인코드된 오디오 신호와 연관된 복수의 예측 필터 계수들을 사용하여 합성된 오디오 신호를 생성함으로써 디코드하도록 구성된다.

Description

오디오 신호 트랙들의 펄스 포지션들의 인코딩 및 디코딩{ENCODING AND DECODING OF PULSE POSITIONS OF TRACKS OF AN AUDIO SIGNAL}

본 발명은 오디오 프로세싱 및 오디오 코딩 분야에 관한 것으로, 특히 오디오 신호에서 트랙들의 펄스 포지션들의 인코딩 및 디코딩에 관한 것이다.

오디오 프로세싱 및/또는 코딩이 많은 방식들에서 발전하고 있다. 오디오 코딩에서, 선형 예측 코더들이 중요한 역할을 한다. 예를 들어, 스피치(speech)를 포함하는 오디오 신호와 같은 오디오 신호를 인코딩 할 때, 선형 예측 인코더들이 일반적으로 오디오 신호의 스펙트럼의 포락선(envelope)의 표현을 인코드한다. 이를 위해, 선형 예측 인코더들이 인코드된 형태에서 사운드의 스펙트럼의 포락선을 표현하기 위한 예측 필터 계수들을 결정할 수 있다. 이후에 예측 필터 계수들을 사용하여 합성 오디오 신호를 생성함으로써 인코드된 오디오 신호를 디코드하도록 필터 계수들이 선형 예측 디코더에 의해 사용될 수 있다.

선형 예측 코더들에 대한 중요한 예들이 ACELP(Algebraic Code-Exited Linear Prediction coders) 코더들이다. ACELP 코더들은 예를 들어, USAC(Unified Speech and Audio Coding)에서 넓게 사용되고, 예를 들어, LD-USAC(Low Delay Unified Speech and Audio Coding)에서 추가의 응용 분야를 가질 수 있다.

예측 필터 계수들을 결정함으로써 ACELP 인코더들이 일반적으로 오디오 신호를 인코드한다. 더 나은 인코딩을 획득하기 위해서, ACELP 인코더들은 목표 신호로 불리기도 하는 잔여 신호(residual signal)를 인코드될 오디오 신호와 이미 결정된 예측 필터 계수들에 기초하여 결정한다. 잔여 신호가 예를 들어, 인코드되는 오디오 신호와 예측 필터 계수들과 가능하게는 피치(pitch) 분석 결과의 적응 필터 계수들에 의해서 인코드되는 신호 부분들 간의 차이를 나타내는 다른 신호 표현이 될 수 있다. ACELP 인코더는 이후 잔여 신호를 인코드하는 것이 목적으로 한다. 이를 위해, 인코더가 잔여 신호를 인코드하는데 사용되는 대수 코드북(algebraic codebook) 파라미터들을 인코드한다.

잔여 신호를 인코드하기 위해, 대수 코드북들이 사용된다. 일반적으로, 대수 코드북들은 예를 들어, 각 16개의 트랙 포지션들을 포함하는 4개의 트랙과 같은, 복수의 트랙들을 포함한다. 이와 같은 구성에서, 예를 들어, 인코드되는 오디오 신호의 서브프레임의 샘플들의 수에 상응하여, 4·16=64 샘플 포지션들이 각 대수 코드북에 의해서 표현될 수 있다.

코드북의 트랙들이 인터리브될 수 있으며, 이는 코드북의 트랙 0이 서브프레임의 샘플들 0, 4, 8, ..., 60을 대표하고, 트랙 1이 서브프레임의 샘플들 1, 5, 9, ..., 61을 대표하고, 트랙 2가 서브프레임의 샘플들 2, 6, 10, ..., 62를 대표하고, 트랙 3이 서브프레임의 샘플들 3, 7, 11, ..., 63을 대표하는 것과 같다. 각 트랙은 고정된 수의 펄스들을 가질 수 있다. 또는 트랙당 펄스들의 수는 예를 들어, 다른 조건들에 따라서 변할 수 있다. 펄스는, 예를 들어, 양 또는 음이 될 수 있고, 예를 들어, +1(양의 펄스) 또는 0(음의 펄스)으로 표현될 수 있다.

잔여 신호를 인코드하기 위해, 인코딩할때, 코드북 구성이 잔여 신호의 나머지 신호 부분을 가장 잘 표현하도록 선택될 수 있다. 이를 위하여, 사용가능한 펄스들은 인코드되는 최적의 신호 부분을 반영하도록 적절한 트랙 포지션들에 위치할 수 있다. 더욱이, 상응하는 펄스가 양인지 음인지 여부에 특정화 될 수 있다.

디코더 측에서, ACELP 디코더가 먼저 대수 코드북 파라미터들을 디코드한다. ACELP 디코더가 적응 코드북 파라미터들 또한 디코드 할 수 있다. 대수 코드북 파라미터를 결정하기 위해서, ACELP 디코더가 대수 코드북의 각 트랙에 대한 복수의 펄스 포지션들을 결정할 수 있다. 더욱이, ACELP 디코더가 또한 트랙 포지션의 펄스가 양인지 음인지 여부를 디코드 할 수 있다. 뿐만 아니라, ACELP 디코더가 적응 코드북 파라미터들도 디코드 할 수 있다. 이 정보에 기초하여, ACELP 디코더가 일반적으로 여기 신호(exicitation signal)를 생성한다. 디코드된 오디오 신호를 획득하기 위하여 합성 오디오 신호를 생성하도록 ACELP 디코더가 그 후에 예측 필터 계수들을 여기 신호에 적용한다.

ACLEP에서, 트랙에 대한 펄스들이 일반적으로 다음과 같이 인코드된다. 트랙이 길이가 16이고, 이 트랙에 대한 펄스의 수가 1이면, 펄스 포지션을 포지션(4비트)와 부호(1비트), 총 5비트로 인코드 할 수 있다. 트랙의 길이가 16이고, 펄스들의 수가 2이면, 첫 번째 펄스는 포지션(4비트)와 부호(1비트)로 인코드 된다. 왜냐하면, 두 번째 펄스의 부호를 첫 번째 펄스의 좌측에 있으면, 양으로, 첫 번째 펄스의 우측에 있으면, 음으로, 첫 번째 펄스와 같은 위치에 있으면 같은 부호로 선택할 수 있기 때문에 두 번째 펄스에 대해서, 포지션 4비트만 필요하다. 종합하면, 그러므로 2개의 펄스들을 인코드하는데 9비트가 필요하다. 펄스 포지션들을 각각 5비트씩으로 인코딩하는 것과 비교하면 매 펄스 쌍에 대해서 1비트를 절약한다.

둘 이상의 다수의 펄스들의 인코딩에 있어서, 펄스들을 쌍으로 인코드 할 수 있고, 펄스들의 수가 홀수이면, 마지막 펄스는 따로 인코드한다. 예를 들어, 5개 펄스들의 트랙에 대해서, 9+9+5=23 비트가 필요하다. 4개의 트랙들이 있으면, 4×23=92 비트들이 4개의 트랙들과 트랙당 5 펄스들을 가진 길이 64의 서브프레임을 인코딩하는데 필요하다. 그러나, 추가로 비트의 수가 더 감소하면, 높게 평가될 수 있다.

본 발명의 목적은 오디오 신호의 트랙들의 펄스들의 인코딩 및 디코딩에 대한 향상된 개념을 제공하는 것이다.

본 발명의 목적은 오디오 신호의 트랙들의 펄스들의 인코딩 및 디코딩에 대한 향상된 개념을 제공하는 것이다. 본 발명의 목적들은 청구항 1에 따른 디코딩하는 장치, 청구항 9에 따른 인코딩하는 장치, 청구항 13에 따른 디코딩하는 방법, 청구항 14에 따른 인코딩하는 방법 및 청구항 15에 따른 컴퓨터 프로그램에 의해 획득된다.

실시예들에 따르면, 하나의 상태 번호(state number)가 디코딩하는 장치를 위하여 사용 가능하다고 가정된다. 이에 더하여 인코드된 오디오 신호와 연관되는 적어도 하나의 트랙들의 트랙 포지션들의 전체 수를 나타내는 트랙 포지션들 숫자(track positions number) 및 적어도 하나의 트랙들의 펄스들의 수를 나타내는 전체 펄스들 숫자(total pulses number)가 본 발명의 디코딩하는 장치를 위하여 사용 가능하다고 가정된다. 바람직하게는 트랙 포지션들 숫자 및 전체 펄스들 숫자가 인코드된 오디오 신호와 연관된 각 트랙들에 대하여 사용 가능하다.

예를 들어, 5개의 펄스들을 가진 4개의 트랙들을 가지면, 대략 6.6×10^21 상태들에 이를 수 있으며, 실시예들에 따라 73비트들로 인코드 될 수 있고, 위에 기술된 92비트를 사용하는 최첨단 인코더 보다 대략 21%정도 더 효율적이다.

먼저, 효율적인 방법으로 오디오 신호의 트랙의 복수의 펄스 포지션들을 인코드하는 방법에 대한 개념이 제공된다. 다음에서, 트랙의 펄스들의 포지션뿐만 아니라 펄스가 양인지 음인지 여부를 인코드하는 것을 허용하는 개념까지 확장된다. 더욱이, 그 후에 효율적인 방식으로 복수의 트랙들에 대한 펄스 정보를 인코드하는 것을 허용하는 개념까지 확장된다. 개념들은 디코더 측에서 상응하여 적용된다.

이에 더하여, 실시예들은 인코딩 전략이 미리 결정된 수의 비트를 사용하면,각 트랙에서 동일한 수의 펄스들을 가진 어느 설정에서 동일한 수의 비트가 필요하다는 결과에 기초한다. 만약 사용 가능한 비트의 수가 고정되면, 얼마나 많은 펄스들이 미리 결정된 품질의 인코딩을 가능하게 하는 주어진 비트의 양으로 인코드 되는 것이 가능한 것인지를 직접 선택하는 것이 가능하다. 더욱이, 이런 접근 방법으로, 원하는 비트율이 구해질 때까지 다른 펄스들의 양으로 시도할 필요가 없을 뿐 아니라 직접 정확한 양의 펄스들을 선택할 수 있고, 따라서 복잡도가 감소한다.

위의 가정들에 기초하여, 오디오 신호 프레임의 트랙의 복수의 펄스 포지션들이 인코드 또는 디코드 될 수 있다.

본 발명이 어떤 종류의 오디오 신호의, 예를 들어, 스피치 신호들 또는 음악 신호들의 인코딩 또는 디코딩에 사용될 수 있지만, 본 발명은 특히 스피치 신호의 인코딩 또는 디코딩에 유용하다.

다른 실시예에서, 펄스 정보 디코더가 트랙 포지션들 숫자, 전체 펄스들 숫자 및 상태 번호를 사용하여 복수의 펄스 부호들을 디코드하도록 추가적으로 구성되고, 여기서 펄스들의 부호들 각각은 복수의 펄스들중 하나의 부호를 나타낸다. 신호 디코더가 추가적으로 복수의 펄스 부호들을 이용하여 합성 오디오 신호를 생성함으로써 인코드된 오디오 신호를 디코드하도록 구성될 수 있다.

추가의 실시예에 따르면, 여기서 하나 또는 그 이상의 트랙들이 적어도 하나의 마지막 트랙 및 하나 또는 그 이상의 다른 트랙들을 포함할 수 있고, 펄스 정보 디코더가 제1 서브상태 번호 및 제2 서브상태 번호를 상태 번호로부터 생성하도록 구성될 수 있다. 펄스 정보 디코더가 제1 서브상태 번호에 기초하여 펄스 포지션들의 제1 그룹을 디코드하도록 구성될 수 있고, 펄스 정보 디코더가 이에 더해서 제2 서브상태 번호에 기초하여 펄스 포지션들의 제2 그룹을 디코드하도록 구성될 수 있다. 펄스 포지션들의 제2 그룹이 마지막 트랙의 트랙 포지션들을 나타내는 펄스 포지션들로만 구성될 수 있다. 펄스 포지션들의 제1 그룹이 하나 또는 그 이상의 다른 트랙들의 트랙 포지션들을 나타내는 펄스 포지션들로만 구성될 수 있다.

다른 실시예에 따르면, 상태 번호를 나눗셈의 결과로 정수 부분과 나머지 부분을 획득하기 위하여 상태 번호를 f(p_k, N)으로 나누어서 제1 서브상태 번호 및 제2 서브상태 번호로 분리하도록 펄스 정보 디코더가 구성될 수 있고, 여기서, 정수 부분이 제1 서브상태 번호이고, 나머지가 제2 서브상태 번호이며, p_k는 하나 또는 그 이상의 트랙들 각각의 펄스들의 수를 나타내고, N이 하나 또는 그 이상의 트랙들 각각의 트랙 포지션들 수를 나타낸다. f(p_k, N)는 p_k펄스들을 가진 길이 N의 트랙에서 획득할 수 있는 상태들의 수를 반환하는 함수이다.

다른 실시예에서, 펄스 정보 디코더가 상태 번호 또는 업데이트된 상태 번호를 임계 값과 비교하는 테스트를 수행하도록 구성될 수 있다.

펄스 정보 디코더가 상태 번호 또는 업데이트된 상태 번호가 임계 값보다 큰지, 크거나 동일한지, 작은지, 또는 작거나 동일한지 비교하는 테스트를 수행하도록 구성될 수 있고, 여기서 분석부는 상태 번호 또는 테스트 결과에 종속되어 업데이트된 상태 번호를 업데이트 하도록 추가로 구성된다.

일 실시예에서, 펄스 정보 디코더가 상태 번호 또는 업데이트된 상태 번호를 복수의 트랙들 중 하나의 각 트랙 포지션에 대한 임계 값과 비교하도록 구성될 수 있다.

일 실시예에 따르면, 펄스 정보 디코더가 트랙들 중 하나를 복수의 트랙 포지션들 중 적어도 하나의 트랙 포지션을 포함하는 제1 트랙 부분과 복수의 트랙 포지션들 중 다른 나머지 트랙 포지션을 포함하는 제2 트랙 부분으로 나누도록 구성될 수 있다. 제1 서브상태 번호 및 제2 서브상태 번호를 상태 번호를 기초로하여 생성하도록 펄스 정보 디코더가 구성될 수 있다. 더욱이, 제1 서브상태 번호를 기초로하여 제1 트랙 부분과 연관된 펄스 포지션들의 제1 그룹을 디코드하도록 펄스 정보 디코더가 구성될 수 있다. 더욱이, 제2 서브상태 번호를 기초로하여 제2 트랙 부분과 연관된 펄스 포지션들의 제2 그룹을 펄스 정보 디코더가 디코드하도록 구성될 수 있다.

일 실시예에 따르면, 오디오 신호를 인코딩하는 장치를 제공한다. 인코딩하는 장치는 오디오 신호와 연관된 복수의 예측 필터 계수를 오디오 신호에 기초한 잔여 신호와 복수의 예측 필터 계수를 생성하기 위하여 결정하도록 구성된 신호 처리기를 포함한다. 더욱이, 인코딩하는 장치가 오디오 신호를 인코드하기 위하여 하나 또는 그 이상의 트랙들과 관련된 복수의 펄스 포지션들 및 잔여 신호와 연관된 하나 또는 그 이상의 트랙들을 인코드하도록 구성된 펄스 정보 인코더를 포함한다. 각 트랙은 복수의 트랙 포지션들 및 복수의 펄스들을 가진다. 펄스 포지션들 각각은 트랙의 펄스들 중 하나의 포지션을 나타내기 위한 트랙들 중 하나의 트랙 포지션들 중 하나를 나타낸다. 펄스 정보 인코더가 복수의 펄스 포지션들을 상태 번호를 생성함으로써 인코드하도록 구성되고, 펄스 포지션들이 상태 번호, 적어도 하나의 트랙들의 트랙 포지션들 수를 나타내는 트랙 포지션들 숫자 및 적어도 하나의 트랙들의 펄스들이 전체 수를 나타내는 전체 펄스들 숫자만을 기초로 하여 디코드될 수 있도록 한다.

다른 실시예에 따르면, 펄스 정보 인코더가 복수의 펄스 부호들을 인코드하도록 구성될 수 있고, 여기서 펄스 부호들 각각이 복수의 펄스들 중 하나의 부호를 타나낸다. 펄스 정보 인코더가 복수의 펄스 부호들을 상태 번호를 생성함으로써 인코드하도록 추가로 구성될 수 있고, 펄스 부호들이 상태 번호, 적어도 하나의 트랙들의 트랙 포지션들 수를 나타내는 트랙 포지션들 숫자 및 전체 펄스 숫자만을 기초로 하여 디코드 될 수 있도록 한다.

일 실시예에서, 펄스 정보 인코더가 상태 번호를 획득하기 위해서 정수 값을 트랙들 중 하나의 각 트랙 포지션에 대해서 트랙 포지션의 각 펄스에 대한 중간 번호에 가산하도록 구성된다.

다른 실시예에 따르면, 펄스 정보 인코더가 트랙들 중 하나를 복수의 트랙 포지션들 중 적어도 하나의 트랙 포지션을 포함하는 제1 트랙 부분과 복수의 트랙 포지션들 중 나머지 다른 트랙포지션을 포함하는 제2 트랙 부분으로 나누도록 구성될 수 있다. 더욱이, 펄스 정보 인코더가 제1 부분과 연관된 제1 서브상태 번호를 인코드하도록 구성될 수 있다. 뿐만 아니라, 펄스 정보 인코더가 제2 부분과 연관된 제2 서브상태 번호를 인코드하도록 구성될 수 있다. 더욱이, 펄스 정보 인코더가 상태 번호를 획득하기 위해서 제1 서브상태 번호와 제2 서브상태 번호를 결합하도록 구성될 수 있다.

인코딩하는 장치와 향상된 인코딩 또는 디코딩 개념을 가진 상응하는 디코딩하는 장치가 제공되면 매우 높게 평가될 수 있고, 여기서 장치들은 펄스 정보를 펄스 정보 표현에 대하여 보다 적은 비트들을 사용하는 향상된 방법의 인코드 또는 디코드하는 수단을 가지며, 이것은 예를 들어 인코드된 오디오 신호를 각각 전송하기 위한 전송률을 감소시키는 것 그리고, 예를 들어 각각의 인코드된 오디오 신호를 저장하기 위한 저장소(storage)를 감소시키는 것이 될 수 있다.

도 1은 본 발명의 실시예에 따른 인코드된 오디오 신호를 디코딩하는 장치를 나타내는 블록도이다.
도 2는 본 발명의 실시예에 따른 오디오 신호를 인코딩하는 장치를 나타내는 블록도이다.
도 3은 부호를 갖지 않은 두 개의 펄스들과 세 개의 트랙 포지션들을 가진 트랙에 대한 모든 가능한 설정을 나타내는 도면이다.
도 4는 부호를 가진 하나의 펄스와 두 개의 트랙 포지션들을 가진 트랙에 대한 모든 가능한 설정을 나타내는 도면이다.
도 5는 부호를 가진 두 개의 펄스들과 두 개의 트랙 포지션들을 가진 트랙에 대한 모든 가능한 설정을 나타내는 도면이다.
도 6은 본 발명의 실시예에 따른 펄스 정보 디코더에 의해 수행되는 처리 단계들을 나타내는 흐름도이다.
도 7은 본 발명의 실시예에 따른 펄스 정보 인코더에 의해 수행되는 처리 단계들을 나타내는 흐름도이다.

도 1은 인코드된 오디오 신호를 디코딩하는 장치를 나타내며, 하나 또는 그 이상의 트랙들이 인코드된 오디오 신호와 연관되고, 트랙들 각각은 복수의 트랙 포지션들과 복수의 펄스들을 가진다.

디코딩 장치는 펄스 정보 디코더(110)과 신호 디코더(120)를 포함한다. 펄스 정보 디코더(110)가 복수의 펄스 포지션들을 디코드하도록 구성된다. 펄스 포지션들 각각은 트랙의 펄스들 중 하나의 포지션을 나타내도록 트랙들 중 하나의 트랙 포지션들 중 하나를 나타낸다.

펄스 정보 디코더(110)가 적어도 하나의 트랙들의 트랙 포지션들의 전체 수를 나타내는 트랙 포지션들 숫자(track positions number)와 적어도 하나의 트랙들의 펄스들의 전체 수를 나타내는 전체 펄스들 숫자(total pulses number)와 하나의 상태 번호(state number)를 사용하여 복수의 펄스 포지션들을 디코드하도록 구성된다.

신호 디코더(120)가 복수의 펄스 포지션들과 인코드된 오디오 신호와 연관된 복수의 예측 필터 계수들을 사용하여 합성된 오디오 신호를 생성함으로써 인코드된 오디오 신호를 디코드하도록 구성된다.

상태 번호는 다음에 기술될 실시예에 따른 인코더에 의하여 인코드될 수 있는 수이다. 상태 번호는 예를 들어 압축된 표현에서 복수의 펄스 포지션들에 대한 정보를 포함하며, 예를 들어 표현은 적은 비트들을 필요로 하고, 디코더 측에서 트랙 포지션들과 전체 펄스들 수에 관한 정보가 사용가능할 때 디코드 될 수 있다.

일 실시예에서, 오디오 신호의 각 트랙 또는 하나의 트랙 포지션들 숫자 및/또는 전체 펄스들 숫자가 디코더 측에서 사용가능할 수 있으며, 왜냐하면, 트랙 포지션들 숫자 및/또는 전체 펄스들 숫자는 변하지 않는 정적 값이고 수신기에 의해 알려진 값이기 때문이다. 예를 들어서, 트랙 포지션들 숫자는 각 트랙에 대하여 항상 16이 될 수 있고, 전체 펄스들 숫자는 항상 4가 될 수 있다.

다른 실시예에서, 오디오 신호의 각 트랙 또는 하나의 트랙 포지션들 숫자 및/또는 전체 펄스들 숫자가 디코딩하는 장치로 예를 들어 인코딩하는 장치에 의하여 명확하게 전송될 수 있다.

추가의 실시예에서, 디코더가 오디오 신호의 각 트랙 또는 하나의 트랙 포지션들 숫자 및/또는 전체 펄스들 숫자를 다른 파라미터들을 분석함으로써 결정할 수 있고, 다른 파라미터들이 명백하게 트랙 포지션들 숫자 및/또는 전체 펄스들 숫자를 서술하지는 않으나, 트랙 포지션들 숫자 및/또는 전체 펄스들 숫자가 도출될 수 있다.

다른 실시예에서, 오디오 신호의 각 트랙 또는 하나의 트랙 포지션들 숫자 및/또는 전체 펄스들 숫자를 도출하기 위하여 디코더는 다른 사용가능한 데이터를 분석할 수 있다.

추가의 실시예에서, 펄스 정보 디코더가 펄스가 양의 펄스인지 음의 펄스인지 디코드하도록 구성될 수 있다.

다른 실시예에서, 펄스 정보 디코더가 추가로 복수의 트랙들에 대한 펄스들의 정보를 포함하는 펄스 정보를 디코드하도록 구성될 수 있다. 펄스 정보는 예를 들어, 트랙에서 펄스들의 포지션에 관한 정보 및/또는 펄스가 양의 펄스인지 음의 펄스인지 여부에 관한 정보가 될 수 있다.

도 2는 신호 처리기(210)와 펄스 정보 인코더(220)를 포함하는 오디오 신호를 인코딩하는 장치를 나타낸다.

신호 처리기(210)가 오디오 신호에 기초한 잔여 신호(residual signal)와 복수의 예측 필터 계수들을 생성하기 위해서 오디오 신호와 연관된 복수의 예측 필터 계수를 결정하도록 구성된다.

펄스 정보 인코더(220)가 오디오 신호를 인코드하기 위해서 하나 또는 그 이상의 트랙들과 관련된 복수의 펄스 포지션들을 인코드하도록 구성된다. 하나 또는 그 이상의 트랙들이 신호 처리기(210)에 의해 생성된 잔여 신호와 연관된다. 트랙들 각각은 복수의 트랙 포지션들과 복수의 펄스들을 가진다. 더욱이, 펄스 포지션들 각각이 트랙의 펄스들 중 하나의 포지션을 나타내도록 트랙들 중 하나의 트랙 포지션들 중 하나를 나타낸다.

펄스 정보 인코더(220)가 복수의 펄스 포지션들을 상태 번호를 생성함으로써 펄스 포지션들이 상태 번호, 적어도 하나의 트랙들의 트랙 포지션들의 전체 수를 나타내는 트랙 포지션들 숫자 및 적어도 하나의 트랙들의 펄스들의 전체 수를 나타내는 전체 펄스 숫자만을 기초로 하여 디코드 될 수 있도록 인코드 하기 위해 구성된다.

다음에서, 상태 번호를 생성함으로써 펄스 포지션들과 가능한 펄스 부호(양의 펄스 또는 음의 펄스)를 인코딩하는 것과 관련된 본 발명의 실시예들의 기본 개념이 제시된다.

본 발명의 실시예들의 인코딩 원칙은 n 트랙 포지션들을 가진 하나의 트랙에서 k 펄스들의 모든 가능한 구성의 상태 목록이 고려되면, 트랙의 펄스들의 실제 상태를 인코드하는데 충분하다는 결과에 기초를 둔다. 가능한 적은 비트에 의한 상태의 인코딩이 바람직한 압축 인코딩을 제공한다. 이에 의하여, 상태 목록의 개념이 제공되며, 여기서 펄스 포지션들의 각 성좌(constellation)와 또한 가능한 펄스 부호들이 하나의 상태를 표현하고, 각 상태는 고유하게 열거된다.

도 3은 두 개의 펄스들과 세 개의 트랙 포지션을 가진 하나의 트랙이 고려될 때, 모든 가능한 설정들이 그려진 간단한 경우를 나타낸다. 두 펄스들은 동일한 트랙 포지션에 위치할 수 있다. 도 3의 예에서, 펄스들의 부호(예를 들면, 펄스가 양인지 음인지)는 고려되지 않으며, 이와 같은 예에서, 모든 펄스들은 예를 들어, 양으로 고려된다.

도 3에서, 세 개의 트랙 포지션들(도 3에서, 트랙 포지션들 1,2 및 3)을 가진 하나의 트랙에서 두 개의 방향성 없는(undirected) 펄스들의 위치하는 모든 가능한 상태들이 나타내어진다. 트랙에서 펄스들이 분배되는 방법을 묘사한 6개의 다른 가능한 상태(도 3에서, 0 부터 5까지 열거됨)만 존재한다. 이에 의하면, 실제 현재 구성을 묘사하기 위해서 범위 0 부터 5까지의 상태 번호를 사용하는 것으로 충분하다. 예를 들면, 도 3의 예에서 상태 번호가 4이고, 디코더가 인코딩 구조를 알고 있으면, 디코더가 상태 번호 4는 트랙이 트랙 포지션 1에 하나의 펄스와 다른 펄스는 트랙 포지션 3에 가진 것으로 결론내릴 수 있다. 이에 의하면, 도 3의 예에서, 도 3의 6가지 다른 상태들 중 하나로 식별하기 위한 상태 번호를 인코드하기 위하여 3비트로 충분하다.

도 4는 두 개의 트랙 포지션들(도 4에서, 트랙 포지션 1 및 2)을 가진 하나의 트랙에서 하나의 방향성을 가진 펄스의 위치에 대한 모든 가능한 상태들을 묘사하는 경우를 나타낸다. 도 4에서, 펄스들의 부호(펄스가 양인지 음인지)가 고려된다. 트랙에서 펄스가 분배되는 방법과 그의 부호(양 또는 음)를 묘사하는 4가지 가능한 상태들(도 4에서 0 부터 3까지 열거됨)이 있다. 범위 0 부터 3까지의 상태 번호를 사용하여 실제 현재 구성을 묘사하는데 충분하다. 예를 들어, 도 4의 예에서 상태 번호가 2이고, 디코더가 인코딩 구조를 알고 있으면, 디코더가 상태 번호 2가 트랙 포지션 1에 양의 펄스인 하나의 펄스를 가진 트랙을 의미하는 것으로 결론내릴 수 있다.

도 5는 두 개의 펄스들과 두 개의 트랙 포지션들을 가진 트랙이 고려될 때, 모든 가능한 구성들이 묘사된 추가의 경우를 나타낸다. 펄스들은 동일한 트랙 포지션에 위치할 수 있다. 도 5에서 보여지는 예에서, 펄스들의 부호(예를 들어, 펄스가 양인지 음인지)가 고려된다. 동일한 트랙 포지션에 있는 펄스들은 동일한 부호(예를 들어, 동일한 트랙 포지션의 트랙들은 모두 양이거나 모두 음이다)를 가진다고 가정된다.

도 5에서, 두 개의 트랙 포지션들(도 5에서, 트랙 포지션 1 및 2)을 가진 트랙에서 두 부호를 가지고 위치한 펄스들(예를 들어 펄스들은 양 또는 음인)의 모든 가능한 상태들이 나타내어진다. 트랙에서 펄스들이 분배될 수 있는 방법들을 묘사하는 8 가지의 다른 가능한 상태들(도 5에서 0부터 7까지 열거됨)이 있다. 이에 의하면, 실제 구성을 묘사하는데 범위 0 부터 7까지의 상태 번호를 사용하면 충분하다. 예를 들어, 도 5의 예에서 상태 번호가 3이고, 디코더가 인코딩 구조를 알면, 디코더가 상태 번호 3이 트랙 포지션 1에 양인 하나의 펄스와 트랙 포지션 2에 음인 하나의 펄스를 가진 트랙으로 결론 내릴 수 있다. 이에 의하면, 도 5의 예에서, 도 5의 8가지 다른 상태들 중 하나로 식별하기 위하여 상태 번호를 인코드하기에 3비트로 충분하다.

ACELP에서, 잔여 신호는 고정된 수의 부호표시된(signed) 펄스들로 인코드될 수 있다. 위에 서술한 것처럼, 펄스들은 예를 들어, 트랙 0이 mod(n,4)==0 인 포지션을 포함하고, 트랙 1이 mod(n,4)==1인 포지션을 포함하는 방식이 되도록 4개의 인터레이싱 된 트랙들로 분배될 수 있다. 각 트랙은 미리 정의된 수의 부호표시된 단위 펄스들을 가질 수 있고, 펄스들은 중첩될 수 있으나, 중첩되는 경우 펄스들은 동일한 부호를 갖는다.

펄스들을 인코딩함으로써, 펄스 포지션들과 그들의 부호로부터 가장 작은 가능한 비트들 양을 사용하는 표현으로 매핑하는 것이 달성되야 한다. 이에 더하여, 펄스 코딩이 고정된 비트 소비를 가져야 하며, 즉, 어떤 펄스 성좌가 동일한 수의 비트를 가진다.

각 트랙은 먼저 독립적으로 인코드되고, 각 트랙의 상태들은 전체 서브프레임의 상태를 표현하는 하나의 번호로 결합된다. 모든 상태가 동일한 확률을 가지고 고정된 비트 소비가 주어지면, 이런 접근은 수학적으로 최적의 비트 소모를 제공한다.

상태 열거(state enumeration) 개념은 다른 상태 성좌들의 압축 표현을 사용하여 또한 설명될 수 있다:

우리가 코드하고자 하는 잔여 신호를 x _n 하자. 예를 들어 대수 코드북의 4로 인터리브된 트랙들을 고려하고, 샘플들

을 가진 제1 트랙, 샘플들

을 가진 제2 트랙 등등을 가정한다. 제1 트랙이 하나의 부호표시된 단위로 양자화되고, T=8, 트랙의 길이는 2라고 가정한다(T=인코드될 잔여 신호의 길이(샘플들)). T=8이고, 잔여 신호를 인코드하는데 사용되는 트랙들이 4이면, 4개의 트랙들 각각은 2개의 트랙 포지션들을 갖는다. 예를 들어, x0과 x4 두 개의 트랙 포지션을 갖는 제1 트랙이 고려된다. 제1 트랙의 펄스는 다음의 성좌들의 어느 하나에 나타날 수 있다:

이 구성에 대하여 4가지 다른 상태들이 있다.

유사하게, 두 개의 트랙 포지션들 x0 및 x4를 가진 제1 트랙에서 두 개의 펄스들이 있으면, 펄스들은 다음의 성좌들에서 할당될 수 있다.

따라서 이 구성은 8가지 상태를 가진다.

잔여 신호의 길이가 T=12로 확장되면, 4개 트랙 각각은 3개의 트랙 포지션들을 갖는다. 제1 트랙이 하나 더 샘플을 제공받아, 트랙 포지션들이 x0, x4, x8을 가지게 되며, 다음과 같다:

위 표는 만일 x8=0(x8에 펄스 없음)이면, x0 과 x4에 대한 8가지 다른 상태들이 있음; 만일 x8=1(x8에 하나의 양의 펄스)이면, x0과 x4에 대한 4 가지 다른 상태들이 있음; 만일 x8=-1(x8에 하나의 음의 펄스)이면, x0과 x4에 대한 4 가지 다른 상태들이 있음; 만일 x8=2(x8에 두 개의 양의 펄스)이면, x0과 x4에 대한 하나의 상태있음; 만일 x8=-2(x8에 두 개의 음의 펄스)이면, x0과 x4에 대한 하나의 상태가 있음을 의미한다.

여기서, 첫 줄에 대한 상태들의 수는 두 개의 이전 표들로부터 획득한 것이다. 첫 번째 줄에서 상태들의 수를 추가함으로써, 이 구성이 18개의 상태들을 가지는 것을 볼 수 있다.

T=12인 예에서, 모든 18가지 다른 가능한 상태들을 인코드하는데 5비트로 충분하다. 예를 들어 인코더는 범위[0,...,17]에서 18가지 구성들 중 하나를 특정하기 위하여 상태 번호를 선택할 수 있다. 만일 디코더가 인코딩 구조를 알고 있다면, 예를 들어, 상태 번호가 표현하는 구성을 알고 있다면, 디코더는 트랙에 대한 펄스 포지션들과 펄스 부호들을 디코드할 수 있다.

아래에서, 실시예에 따른 적절한 인코딩 방법들과 상응하는 디코딩 방법들이 제공될 것이다. 실시예에 따르면, 인코딩하는 장치가 아래에 제시되는 인코딩 방법들 중 하나를 수행하도록 구성되어 제공된다. 더욱이, 추가의 실시예에 따르면, 디코딩하는 장치가 아래에 제시되는 디코딩 방법들 중 하나를 수행하도록 구성되어 제공된다.

실시예들에서, 상태 번호를 생성하거나 상태 번호, p 펄스들을 가진 N 트랙 포지션들에 대한 가능한 구성들의 수를 디코드하는것이 계산되어 질 수 있다.

펄스들은 부호화 될 수 있고, 재귀 공식(recursive formular)이 사용될 수 있다. 재귀 공식은 N 트랙 포지션들과 부호표시된 p 펄스들(펄스들은 양 또는 음이 될 수 있고, 동일한 트랙 포지션의 펄스들은 동일한 부호를 가진다)을 가진 트랙에 대한 f(p, N) 상태들의 수를 계산하며, 여기서 재귀 공식 f(p, N) 이 다음과 같이 정의된다:

초기 조건들은

이며, 하나 또는 그 이상의 펄스들을 가진 하나의 포지션은 부호에 대하여 하나의 비트(2 상태들)을 필요로 하기 때문이다.

재귀 공식이 모든 다른 성좌들의 합계이다.

다시 말해, 주어진 p 펄스들에서, 현재 포지션 q_N이 0내지 p펄스들을 가질수 있고, 따라서 나머지 N-1 포지션들이 p-q_N펄스들을 가진다. 현재 포지션에서 상태들의 수와 나머지 N-1 포지션들이 펄스들의 조합들을 가진 상태들의 수를 획득하기 위하여 곱해지고, 조합들은 전체 상태들의 수를 획득하기 위하여 합계된다.

실시예들에서, 재귀 함수는 반복(iterative) 알고리즘에 의해 계산되어 질 수 있고, 여기서 재귀는 반복에 의해 대체된다.

f(p,N)의 평가가 실시간 어플리케이션들에 대해서 수적으로 상대적으로 복잡하기 때문에 일부 실시예들에 따르면, 룩업 테이블은 f(p,N)을 계산하기 위해서 사용될 수 있다. 일부 실시예들에 따르면, 테이블은 오프-라인에서 계산되어질 수 있다.

다음에서, 상태 번호의 인코딩과 디코딩에 대한 추가의 개념이 제공된다:

N 트랙 포지션들과 부호표시된 p 펄스들을 가진 트랙에 대한 가능한 구성들의 수를 f(p, N)이라고 하자.

펄스 정보 인코더가 트랙을 분석할 수 있다: 만일 트랙에서 제1 포지션이 펄스를 가지고 있지 않다면, 나머지 N-1 포지션들이 부호표시된 p 펄스들을 가지고, 이 성좌를 기술하기 위해서, 단지 f(p, N-1) 상태들만 필요하다.

그 외에는, 만일 제1 포지션이 하나 또는 그 이상의 펄스들을 가지면, 펄스 정보 인코더가 f(p, N-1) 보다 큰 전체 상태를 정의할 수 있다.

펄스 정보 디코더에서, 펄스 정보 디코더가 예를 들어, 마지막 포지션에서 출발하고, 임계 값 예를 들어 f(p,N-1)을 가진 상태와 비교할 수 있다. 만일 임계값 보다 크면, 펄스 정보 디코더가 마지막 포지션이 적어도 하나의 펄스를 가진다고 결정할 수 있다. 펄스 정보 디코더가 상태로부터 f(p, N-1)을 차감함으로써 업데이트된 상태 번호를 획득하고, 남은 펄스들의 수를 하나 차감하여 상태를 업데이트 할 수 있다.

반면에, 마지막 포지션에 펄스가 하나도 없으면, 펄스 정보 디코더가 남은 포지션들의 수를 하나 차감할 수 있다. 이 절차를 남은 펄스가 없을 때까지 반복하여 펄스들의 부호화되지 않은 포지션들을 제공한다.

펄스들의 부호들을 고려하기 위해서, 펄스 정보 인코더가 상태의 가장 낮은비트에서 펄스들을 인코드 할 수 있다. 다른 실시예에서, 펄스 정보 인코더가 상태의 가장 높은 나머지 비트에서 부호를 인코드 할 수 있다. 그러나, 가장 낮은 비트에서 펄스 부호를 인코드하는 것이 이것이 정수 계산에 비하여 처리하기 쉽기 때문에 바람직하다.

펄스 정보 디코더에서 주어진 포지션의 첫 펄스가 발견되면, 펄스의 부호는 마지막 비트에 의해 결정된다. 업데이트된 상태 번호를 획득하기 위해서 남은 상태가 하나 오른쪽으로 이동된다.

실시예에서, 펄스 정보 디코더가 다음의 디코딩 알고리즘을 적용하도록 구성된다. 이 디코딩 알고리즘의 단계별 접근 방식에서, 각 트랙 포지션에 대한, 예를 들어, 번갈아서, 상태 번호 또는 업데이트된 상태 번호가 임계 값, 예를 들어 f(p,k-1)과 비교된다.

실시예에 따른, 펄스 정보 디코더 알고리즘이 제공된다:

실시예에 따른 펄스 정보에 관하여 펄스 정보 인코더가 다음의 인코딩 알고리즘을 적용하도록 구성된다. 펄스 정보 인코더가 펄스 정보 디코더와 같은 단계를 역 순서로 수행한다.

실시예에 따른, 펄스 정보 인코더 알고리즘이 제공된다:

이 알고리즘을 사용한 상태 번호 인코딩에서, 펄스 정보 인코더가 하나의 정수를 예를 들어, 알고리즘이 완수되기 이전의 상태 번호, 중간 번호(예를 들어, 중간 상태 번호)에 트랙들 중 하나의 각 펄스 포지션에 대한 트랙 포지션에서 각 펄스에 대하여 상태 번호(값)을 얻기 위해추가가한다.

예를 들어, 펄스 포지션들과 펄스 부호들인 펄스 정보의 인코딩 및 디코딩에 대한 접근이, 번갈아 단계별로 인코딩 및 디코딩 방법들에 의하여 트랙 포지션들이 고려되는 것처럼 "단계별 인코딩(step-by-step encoding)"과 "단계별 디코딩(step-by-step decoding)"으로 불릴 수 있다.

도 6은 본 발명의 일 실시예에 따른 펄스 정보 디코더에 의하여 수행되는 처리 단계를 묘사하는 흐름도이다.

현재 트랙 포지션 k를 N으로 설정한다(610). 여기서, N은 하나의 트랙에서 트랙 포지션의 수를 표현하고, 여기서 트랙 포지션들은 1부터 N까지 열거된다.

k 가 1보다 크거나 같은지 판단하고(620), 즉 고려되지 않은 트랙 포지션들이 남아 있는지 여부를 테스트한다. 만약 k가 1보다 크지 않거나 같지 않다면, 모든 트랙 포지션들이 고려되었고 프로세스는 종료한다.

반면에 상태가 f(p, k-1)보다 크거나 같은지 판단한다(630). 판단 결과가 크거나 같다면, k 포지션에 적어도 하나의 펄스가 존재한다. 판단 결과가 크지 않거나 같지 않다면, k 트랙 포지션에 펄스는 존재하지 않고, 프로세스는 단계 640으로 계속되며, 여기서 k는 1이 차감되고, 다음 트랙 포지션이 고려될 것이다.

그러나, 상태가 f(p, k-1)보다 크거나 같다면, 프로세스는 단계 642로 계속되고, 트랙 포지션 k에서 펄스가 놓여지고, 그 후에, 상태가 f(p, k-1)만큼 차감하여 업데이트 된다(644). 그 후에, 현재 펄스가 트랙 포지션 k에서 첫번째 발견된 펄스인지 판단한다(650). 판단 결과가 그렇지 않다면, 단계 680에서 남아 있는 펄스들의 수를 1만큼 차감하고, 프로세스는 단계 630으로 계속된다.

만약, 트랙 포지션 k에서 첫 번째 발견된 펄스인 경우, 프로세스는 단계 660으로 계속되고, 상태 s의 가장 낮은 비트의 설정 여부를 판단한다(660). 판단 결과 가장 낮은 비트가 설정되었으면, 이 트랙 포지션에서 펄스들의 부호가 음으로 설정되고(662), 다른 경우에는 트랙 포지션들의 부호가 양으로 설정된다(664). 두 경우 모두 상태는 오른쪽으로 한단계 이동(s:=s/2) 된다(670). 그 후에 또한, 남은 펄스들의 수가 1만큼 차감되고(680) 프로세스는 단계 630으로 계속된다.

도 7은 본 발명의 일 실시예에 따른 펄스 정보 인코더에 의하여 수행되는 처리 단계를 묘사하는 흐름도이다.

발견된 펄스들 p의 수를 0으로, 상태 s를 0으로 그리고 고려되는 트랙 포지션 k를 1로 설정한다(710).

k가 N 보다 작거나 같은지 판단하고(720), 즉 고려되지 않은 트랙 포지션들이 남아있는지 여부를 판단한다(여기서, N은 하나의 트랙에서 트랙 포지션들의 수를 의미한다). 만약 k가 N 보다 작거나 같지 않다면, 모든 트랙 포지션들은 고려되었고, 프로세스는 종료된다.

k가 N 보다 작거나 같다면, 포지션 k에 적어도 하나의 펄스가 존재하는지 여부를 판단한다(730). 판단 결과 펄스가 존재하지 않으면, 프로세스는 단계 740으로 계속되어, k가 1 증가되고 다음 트랙 포지션이 고려될 것이다.

그러나, 적어도 하나의 펄스가 트랙 포지션 k에 존재하면, 현재 고려되는 펄스가 트랙 포지션 k에서 마지막 펄스인지 여부를 판단한다(750). 판단 결과, 마지막 펄스가 아니면, 상태 s에 f(p, k-1)이 추가되어 상태 s가 업데이트 되고, 발견된 펄스들 p의 수가 1증가되고(770), 그리고 프로세스는 단계 780으로 계속된다.

만약 현재 고려중인 펄스가 트랙 포지션 k에서 마지막 펄스이면, 단계 750 이후에 프로세스는 단계 755로 계속되어, 상태를 한 단계 왼쪽으로 이동(s:=s*2)한다(755). 그 후에, 펄스의 부호가 음인지 판단한다(760). 만약 부호가 음이면, s의 가장 낮은 비트를 1로 설정한다(762); 그렇지 않다면, s의 가장 낮은 비트를 0으로 설정한다(또는 아무것도 하지 않는다)(764). 이 후, 두 경우 모두 상태 s를 상태 s에 f(p,k-1)을 더하고, 발견된 펄스들 p의 수를 1 증가하여 업데이트하고(770), 그리고 프로세스는 단계 780으로 게속된다.

포지션 k에 다른 펄스가 존재하는지 여부를 판단한다(780). 다른 펄스가 존재하면, 프로세스는 단계 750으로 계속되고, 그렇지 않다면, 프로세스는 단계 740으로 계속된다.

다음에서, 복수의 트랙들에 상태를 인코딩하는 합동 상태 번호(joint state number)를 생성하는 개념이 제공된다.

유감스럽게도, 하나의 트랙에서 가능한 상태들의 범위는 많은 경우에 2의 배수가 아니고, 각 상태의 이진 표현은 따라서 비효율적이다. 예를 들면, 가능한 상태들의 수가 5라면, 이진 수를 사용하여 표현하려면 3비트가 필요하다. 그러나, 각 5개의 상태들을 가진 4개의 트랙들이 있으면, 전체 서브 프레임에 대하여 5×5×5×5=625 상태들을 가지고 10비트들을 사용하여 표현할 수 있다(4×3=12비트 대신). 이는 3 대신에 트랙당 2.5비트들과 상응하고 따라서 트랙당 0.5 비트나 동등하게 서브프레임당 2비트를 절약할 수 있다(전체 비트 소모의 20%). 따라서, 이진 표현의 비효율성을 줄이기 위해서 각 트랙의 상태들을 하나의 합동 상태로 통합하는 것이 중요하다. 전송되는 어떤 수들에 대해서 동일한 접근을 사용할 수 있다. 예를 들면, 각 서브 프레임이 펄스들의 포지션들을 표현하는 상태를 가질 수 있으므로, 각 프레임은 예를 들어, 4개의 서브 프레임을 가지고, 이 상태들은 하나의 합동 상태 번호로 통합될 수 있다.

예를 들어, 4개의 트랙들을 가진 서브 프레임이 주어지면, 각 트랙의 상태들을 같이 인코딩함으로써 효율을 향상시켜서 비트 소비를 감소시킬 수 있다. 예를 들어, 각 트랙이 p_k 펄스들을 가지고, 각 트랙의 길이가 N이면, 예를 들어, N 트랙 포지션들을 가지면, 각 트랙의 상태가 범위 0 내지 f(p,N)-1이다. 각 트랙들의 상태 s_k가 공식을 가진 서브 프레임들의 합동 상태 s로 결합될 수 있다(서브 프레임당 4개의 트랙을 가정)

각 트랙의 상태들이 디코더에서 합동 상태를 f(p_k,N)으로 나눔으로써 결정될 수 있으며, 나머지가 마지막 트랙의 상태이고, 정수 부분이 나머지 트랙들의 합동 상태이다. 만약 트랙들의 수가 4가 아니면, 즉시 위의 수식에서 조건의 수를 적절하게 더하거나 차감할 수 있다.

트랙당 펄스들의 수가 클때, 가능한 상태들의 수도 커진다. 예를 들어, 트랙당 6개의 펄스들을 가진 4개의 트랙들과 트랙 길이 N=16이면, 상태는 83비트이고, 이는 일반적인 CPU들의 최대 이진 수의 길이를 초과한다. 매우 긴 정수를 가지고 일반적인 방법들을 사용하여 위의 공식을 평가하기 위해서 일부 추가의 단계가 따라온다.

상태 확률들이 동일하다고 가정할 때, 이 접근이 트랙 상태들의 대수 코딩과 같은 것을 역시 관찰할 수 있다.

위에서, 예를 들어, 포지션들 및 트랙의 펄스들의 가능한 부호들과 같은 트랙의 펄스 정보 인코딩 및 디코딩에 대한 단계별 접근을 제시하고 있다. 다른 실시예들은 "분할 및 정복(split-and-conquer)" 접근이라고 불리는 다른 접근을 제공한다.

분할 및 정복 접근을 적용하도록 구성된 펄스 정보 인코더가 하나의 트랙을 두 개의 트랙 부분 x₁ 및 x₂로 분리하고, 이는 두 개의 벡터(x=[x₁x₂])로 고려될 수 있다. 기본 아이디어는 두 벡터 x1 과 x2를 각각 인코드하고, 공식에 의해서 둘을 통합하는 것이다.

위의 수학식에서, 펄스들의 수를 이미 알고 있을 때, 즉, 벡터들이 각각 p1 및 p2=p-p1일 때, 벡터 x1 및 x2의 상태들을 s(x1) 및 s(x2)로 표시한다. 벡터 x1에서 0 내지 p1-1 펄스들을 가진 모든 상태들을 고려하기 위해서, 위 수학식에서 합산 항이 추가된다.

위의 알고리즘/공식이 다음의 두 이전 프로세싱 단계들을 적용함으로써 인터레이스된 트랙들을 인코드하도록 적용될 수 있다. 먼저, 트랙 k에 대한 모든 샘플들로 벡터

를 구성하고, 이들 벡터들을

의 정의에 의해서 통합한다. 단지 샘플들의 순서를 재배열하여 트랙 1로부터 모든 샘플들이 제1 그룹에 위치하도록하고 나머지도 같은 방식으로 위치하도록 한다.

두 번째로, 트랙당 펄스들의 수는 일반적으로 고정되어있다. 트랙 1이 항상 p1 펄스들을 가지면, 모든 k≠p1에 대하여 트랙 1에서 상태들의 수는 f(k,N1)=0 이다. p1 펄스들을 가지지 않은 트랙 1에 대한 상태가 존재하지 않는 것을 말하는 다른 방식이다. 공식적으로, 상태들의 수 공식은 다음과 같이 정의될 수 있다:

p_k펄스들을 가진 완전한 트랙

에 대한,

일 경우 상태들의 수는

N>1 인 경우에

그리고 N=1인 경우,

샘플들을 재배열함으로써, 그리고 상태들의 수에 대한 위의 정의(수학식 4)를 사용하여, 수학식 3에 의해서 모든 트랙들의 합동 상태를 계산할 수 있다. 상태들의 수가 대부분 0을 포함하므로, 트랙들의 상태를 통합할 때, 수학식 3의 합산은 0이다. 그러므로 두 트랙들의 통합은 수학식 2와 동일하다. 유사하게, 모든 4개의 트랙들(또는 5)의 통합이 두 개의 접근을 통하여 또한 동일한 결과를 제공하는 것을 즉시 보여줄 수 있다.

일 실시예에 따르면, 재배열이 인코더에 대한 전처리 단계로서 사용될 수 있다. 다른 실시예에서, 재배열은 인코더에 통합될 수 있다. 유사하게 일 실시예에서, 재배열이 디코더에 대한 후처리 단계로서 사용될 수 있다. 다른 실시예에서, 재배열은 디코더에 통합될 수 있다.

트랙에서 펄스들의 수가 고정되지 않으면, 상태들의 수 공식을 즉시 적절하게 조정할 수 있고, 여전히 동일한 인코딩 알고리즘을 사용한다.

"트랙 데이터 결합(Combining track data)" 섹션에서 제시된 접근 방법을 관찰하면, 위의 방법은 통합하는 트랙의 순서가 적절하게 선택되면 동일한 결과를 제공한다. 유사하게, 단계별 접근과 분할 및 정복 접근도 동일한 결과를 제공한다. 그러므로, 어떤 것이 더 구현에 실용적인지 또는 어떤 접근이 플랫폼의 계산적 제한에서 더 적합한지에 따라서 디코더 및 인코더에서 사용할 접근이 무엇인지 독립적으로 선택할 수 있다.

실시예에 따르면, 펄스 정보 인코더 알고리즘이 제공되고, 다음과 같이 의사 코드로 기술될 수 있다.

일 실시예에 따른 이 같은 인코딩 알고리즘에서, 펄스 정보 인코더가 트랙들 중 하나를 제1 트랙 부분과 제2 트랙 부분으로 분리하도록 구성된다. 펄스 정보 인코더가 제1 트랙 부분과 연관된 제1 서브상태 번호(substate number)를 인코드하도록 구성된다. 게다가, 펄스 정보 인코더가 제2 트랙 부분과 연관된 제2 서브상태 번호를 인코더하도록 구성된다. 더욱이, 펄스 정보 인코더가 상태 번호를 획득하기 위해서 제1 서브상태 번호와 제2 서브상태 번호를 결합하도록 구성된다.

유사하게, 일 실시예에 따르면, 아래와 같이 유사 코드로 기술될 수 있는 펄스 정보 디코더 알고리즘이 제공된다:

분할 및 정복 접근을 실현하는 일 실시예에서, 펄스 정보 디코더가 제1 서브상태 번호와 제2 서브상태 번호를 상태 번호에 기초하여 생성하도록 구성된다. 펄스 정보 디코더가 제1 서브상태 번호에 기초하여 트랙들 중 하나의 제1 부분의 펄스 포지션들의 제1 그룹을 디코드하도록 구성된다. 더욱이, 펄스 정보 디코더가 제2 서브상태 번호에 기초하여 트랙들 중 하나에서 제2 부분의 펄스 포지션들의 제2 그룹을 디코드하도록 구성된다.

비록 몇몇의 측면들은 장치의 관점에서 설명되었지만, 이러한 측면들은 상응하는 방법의 설명을 또한 나타내는 것을 명확하며, 여기서 블록 또는 장치는 방법의 단계 또는 방법의 단계의 특징에 대응한다. 유사하게, 방법의 단계의 관점에서 설명된 측면들은 상응하는 장치에 대해 상응하는 블록 또는 아이템 또는 특징의 설명을 또한 나타낸다.

특정 구현 요구들에 따르면, 발명의 실시예들은 하드웨어 또는 소프트웨어에서 구현될 수 있다. 구현은 디지털 저장 매체(예를 들어, 플로피 디스크(floppy disk), DVD, CD, ROM, PROM, EPROM, EEPROM 또는 플래시 메모리(FLASH memory))를 사용하여 실행될 수 있으며, 디지털 저장 매체는 그것들에 저장된 전자적으로 판독가능한 제어 신호들을 가지며, 이는 프로그래밍 가능한 컴퓨터 시스템과 협력하며(또는 협력하는 것이 가능하며), 그로 인해 각각의 방법이 수행된다.

발명에 따른 몇몇 실시예들은 전자적으로 판독가능한 제어 신호들을 가지는 데이터 캐리어(carrier)를 포함하며, 이는 프로그래밍 가능한 컴퓨터 시스템과 협력하는 것이 가능하며, 그로 인해 명세서에 설명된 방법들 중 하나는 수행된다.

일반적으로, 컴퓨터 프로그램 제품이 컴퓨터에서 동작하는 경우, 본 발명의 실시예들은 프로그램 코드, 방법들 중 하나의 수행을 위해 동작하는 프로그램 코드를 가지는 컴퓨터 프로그램 제품으로서 수행될 수 있다. 예를 들어, 프로그램 코드는 기계 판독가능한 캐리어 상에 저장될 수 있다.

다른 실시예들은 명세서에 설명된 방법들 중 하나의 수행을 위한 컴퓨터 프로그램을 포함하며, 이는 기계 판독가능한 캐리어 상에 또는 비-일시적인 저장 장치에 저장된다.

즉, 컴퓨터 프로그램이 컴퓨터상에서 동작하는 경우, 따라서 방법 발명의 실시예는 명세서에 설명된 방법들 중 하나의 수행을 위한 프로그램 코드를 가지는 컴퓨터 프로그램을 포함한다.

따라서, 방법 발명의 추가 실시예는 데이터 캐리어(또는 디지털 저장 매체, 또는 컴퓨터 판독가능한 매체)이며, 데이터 캐리어는, 자신에 기록되는, 명세서에 설명된 방법들 중 하나의 수행을 위한 컴퓨터 프로그램을 포함한다.

따라서, 방법 발명의 추가 실시예는 데이터 스트림 또는 명세서에 설명된 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 표현하는 신호들의 시퀀스(sequence)이다. 예를 들어, 데이터 스트림 또는 신호들의 시퀀스는 데이터 통신 연결(예를 들어, 인터넷 또는 라디오 채널)을 통해 전송되기 위해 구성될 수 있다.

추가 실시예는 명세서에 설명된 방법들 중 하나의 실행을 위해 적응되거나 또는 구성되는 처리부(예를 들어, 컴퓨터 또는 프로그래밍 가능한 논리 디바이스(device))를 포함한다.

추가 실시예는 명세서에 설명된 방법들 중 하나의 실행을 위해 설치된 컴퓨터 프로그램을 가지는 컴퓨터를 포함한다.

몇몇 실시예들에서, 프로그래밍 가능한 논리 디바이스(예를 들어, FPGA)는 명세서에 설명된 방법들의 몇몇 또는 모든 기능들의 수행을 위해 사용될 수 있다. 몇몇 실시예들에서, FPGA는 명세서에 설명된 방법들 중 하나를 수행하기 위해 마이크로프로세서와 동작할 수 있다. 일반적으로, 방법들은 어떠한 하드웨어 장치에 의해서도 바람직하게 수행된다.

상기에서 설명된 실시예들은 본 발명의 원칙들을 위해 단순하게 설명되었다. 구성들의 수정들과 변화들 및 명세서에 기재된 상세한 설명들은 당업자에게 자명할 것으로 이해된다. 따라서, 이것은 계류된(impending) 특허 청구항들의 범위에 의해 오직 제한되고 실시예들에 대한 기재 및 설명에 의해 제시된 특정 상세한 설명들에 의해 제한되지 않음을 의미한다.

Claims

하나 또는 그 이상의 트랙들이 인코드된 오디오 신호와 연관되고, 상기 트랙들 중 각각은 복수의 트랙 포지션들과 복수의 펄스들을 가지는 상기 인코드된 오디오 신호를 디코딩하는 장치에 있어서,
복수의 펄스 포지션들을 디코딩하는 펄스 정보 디코더(110)로서, 여기서 상기 펄스 포지션들 각각은 상기 트랙의 상기 펄스들 중 하나의 포지션을 나타내도록 상기 트랙들 중 하나의 트랙 포지션들 중 하나를 나타내고,
적어도 하나의 상기 트랙들의 상기 트랙 포지션들의 전체 수를 나타내는 트랙 포지션들 숫자(track positions number), 적어도 하나의 상기 트랙들의 상기 펄스들의 전체 수를 나타내는 전체 펄스들 숫자(total pulses number) 및 하나의 상태 번호(state number)를 사용하여 상기 복수의 펄스 포지션들을 디코드하도록 구성된 펄스 정보 디코더(110); 및
상기 복수의 펄스 포지션들과 상기 인코드된 오디오 신호와 연관된 복수의 예측 필터 계수들을 사용하여 합성된 오디오 신호를 생성함으로써 상기 인코드된 오디오 신호를 디코딩하는 신호 디코더(120)를 포함하는 디코딩 장치.
청구항 1에 있어서,
상기 펄스 정보 디코더(110)는, 상기 트랙 포지션들 숫자, 상기 전체 펄스들 숫자 및 상기 상태 번호를 사용하여 복수의 펄스 부호들을 디코드하도록 추가적으로 구성되고, 여기서 상기 펄스 부호들 각각은 상기 복수의 펄스들 중 하나의 부호를 나타내며,
상기 신호 디코더(120)는, 상기 복수의 펄스 부호들을 추가적으로 사용하여 합성된 오디오 신호를 생성함으로써 상기 인코드된 신호를 디코드하도록 구성되는 것을 특징으로 하는 디코딩 장치.
청구항 1 또는 2에 있어서,
상기 하나 또는 그 이상의 트랙들이 적어도 하나의 마지막 트랙과 하나 또는 그 이상의 다른 트랙들을 포함하고,
상기 펄스 정보 디코더(110)는 상기 상태 번호로부터 제1 서브상태 번호(substate number)와 제2 서브상태 번호를 생성하도록 구성되고,
상기 펄스 정보 디코더(110)는 상기 제1 서브상태 번호를 기초로 하여 상기 펄스 포지션들의 제1 그룹을 디코드하도록 구성되고,
상기 펄스 정보 디코더(110)가 상기 제2 서브상태 번호를 기초로 하여 상기 펄스 포지션들의 제2 그룹을 디코드하도록 구성되고,
상기 펄스 포지션들의 상기 제2 그룹은 상기 마지막 트랙의 트랙 포지션들을 나타내는 펄스 포지션들로만 구성되고,
상기 펄스 포지션들의 상기 제1 그룹은 상기 하나 또는 그 이상의 다른 트랙들을 나타내는 펄스 포지션들로만 구성되는 것을 특징으로 하는 디코딩 장치.
청구항 3에 있어서,
상기 펄스 정보 디코더는 나눗셈의 결과로 정수 부분과 나머지 부분을 획득하기 위해 상기 상태 번호를 f(p_k, N)로 나눔으로써 상기 제1 서브상태 번호와 상기 제2 서브상태 번호를 생성하도록 구성되고,
상기 정수 부분이 상기 제1 서브상태 번호, 상기 나머지 부분이 상기 제2 서브상태 번호이고,
p_k가 상기 하나 또는 그 이상의 트랙들 중 각각에 대하여 상기 펄스들의 수를 나타내고, N이 상기 하나 또는 그 이상의 트랙들 중 각각에 대하여 상기 트랙 포지션들의 수를 나타내는 것을 특징으로 하는 디코딩 장치.
상기 청구항들 중 어느 하나에 있어서,
상기 펄스 정보 디코더(110)가 상기 상태 번호 또는 업데이트된 상태 번호를 임계 값과 비교하는 테스트를 수행하도록 구성되는 것을 특징으로 하는 디코딩 장치.
청구항 5에 있어서,
상기 펄스 정보 디코더(110)는 상기 상태 번호 또는 업데이트된 상태 번호가 임계 값보다 큰지, 크거나 동일한지, 작은지, 작거나 동일한지 비교함으로써 상기 테스트를 수행하도록 구성되고, 상기 펄스 정보 디코더(110)가 상기 상태 번호 또는 상기 테스트의 결과에 따라 업데이트된 상태 번호를 업데이트하도록 추가적으로 구성되는 것을 특징으로 하는 디코딩 장치.
청구항 6에 있어서,
상기 펄스 정보 디코더(110)는 상기 상태 번호 또는 상기 업데이트된 상태 번호를 상기 복수의 트랙들 중 하나에서 각 트랙 포지션에 대한 임계 값과 비교하도록 구성되는 것을 특징으로 하는 디코딩 장치.
청구항 1 내지 3 중 어느 하나에 있어서,
상기 펄스 정보 디코더(110)는 상기 트랙들 중 하나를 상기 복수의 트랙 포지션들 중 적어도 두 개의 트랙 포지션들을 포함하는 제1 트랙 부분과 상기 복수의 트랙 포지션들 중 적어도 두 개의 다른 트랙 포지션들을 포함하는 제2 트랙 부분으로 분리하도록 구성되고,
상기 펄스 정보 디코더(110)는 제1 서브상태 번호 및 제2 서브상태 번호를 상기 상태 번호를 기초로 하여 생성하도록 구성되고,
상기 펄스 정보 디코더(110)는 상기 제1 서브상태 번호를 기초로 하여 상기 제1 트랙 부분과 연관된 펄스 포지션들의 제1 그룹을 디코딩하도록 구성되고,
상기 펄스 정보 디코더(110)는 상기 제2 서브상태 번호를 기초로 하여 상기 제2 트랙 부분과 연관된 펄스 포지션들의 제2 그룹을 디코딩하도록 구성되는 것을 특징으로 하는 디코딩 장치.
오디오 신호를 인코딩하는 장치에 있어서,
상기 오디오 신호와 연관된 복수의 예측 필터 계수들을 결정하고, 상기 오디오 신호에 기초한 잔여 신호(residual signal)와 상기 복수의 예측 필터 계수들을 생성하는 신호 처리기(210); 및
상기 오디오 신호, 상기 잔여 신호와 연관된 하나 또는 그 이상의 트랙들, 복수의 트랙 포지션들 및 복수의 펄스들을 가진 트랙들 중 각각을 인코딩하기 위해 상기 하나 또는 그 이상의 트랙들과 관련된 복수의 펄스 포지션들을 인코딩하는 펄스 정보 인코더(220)를 포함하되,
여기서 상기 펄스 포지션들 각각은 상기 트랙의 상기 펄스들 중 하나의 포지션을 나타내도록 상기 트랙들 중 하나의 트랙 포지션들 중 하나를 나타내고,
상기 펄스 정보 인코더(220)는 상기 펄스 포지션들이 상기 상태 번호, 적어도 하나의 상기 트랙들의 상기 트랙 포지션들의 전체 수를 나타내는 트랙 포지션들 숫자(track position number) 및 적어도 하나의 상기 트랙들의 상기 펄스들의 전체 수를 나타내는 전체 펄스들 숫자(total pulses number)만을 기초로 하여 디코드될 수 있도록 상태 번호(state number)를 생성함으로써 상기 복수의 펄스 포지션들을 인코드하도록 구성되는 것을 특징으로하는 인코딩 장치.
청구항 9에 있어서,
상기 펄스 정보 인코더(220)는 복수의 펄스 부호들을 인코드하도록 구성되며, 상기 펄스 부호들 각각이 상기 복수의 펄스 부호들의 중 하나의 부호를 나타내고,
상기 펄스 정보 인코더(220)는 상기 복수의 펄스 부호들을 상기 상태 번호를 생성함으로써 인코드하여, 상기 펄스 부호들이 상기 상태 번호, 적어도 하나의 트랙들의 트랙 포지션들의 전체 수를 나타내는 상기 트랙 포지션들 숫자 및 전체 펄스들 숫자만을 기초로 하여 디코드될 수 있도록 구성되는 것을 특징으로 하는 인코딩 장치.
청구항 9 또는 10에 있어서,
상기 펄스 정보 인코더(220)는 상기 상태 번호를 획득하도록 상기 트랙들 중 하나의 각 트랙 포지션에 대한 트랙 포지션에서 각 펄스에 대한 중간 번호(intermediate number)에 정수 값을 가산하도록 구성된 것을 특징으로 하는 인코딩 장치.
청구항 9 또는 10에 있어서,
상기 펄스 정보 인코더(220)는 상기 트랙들 중 하나를 상기 복수의 트랙 포지션들 중 적어도 두 개의 트랙 포지션들을 포함하는 제1 트랙 부분과 상기 복수의 트랙 포지션들 중 적어도 두 개의 다른 트랙 포지션들을 포함하는 제2 트랙 부분으로 분리하도록 구성되고,
상기 펄스 정보 인코더(220)는 제1 부분과 연관된 제1 서브상태 번호를 인코드하도록 구성되고,
상기 펄스 정보 인코더(220)는 제2 부분과 연관된 제2 서브상태 번호를 인코드하도록 구성되고,
상기 펄스 정보 인코더(220)는 상기 상태 번호를 획득하기 위하여 제1 서브상태 번호와 제2 서브상태 번호를 결합하도록 구성되는 것을 특징으로 하는 인코딩 장치.
하나 또는 그 이상의 트랙들이 인코드된 오디오 신호와 연관되고, 상기 트랙들 중 각각은 복수의 트랙 포지션들과 복수의 펄스들을 가지는 상기 인코드된 오디오 신호를 디코딩하는 방법에 있어서,
복수의 펄스 포지션들을 디코딩하는 단계로서, 여기서 상기 펄스 포지션들 각각은 상기 트랙의 상기 펄스들 중 하나의 포지션을 나타내도록 상기 트랙들 중 하나의 상기 트랙 포지션들 중 하나를 나타내고,
여기서 상기 복수의 펄스 포지션들이 적어도 하나의 상기 트랙들의 상기 트랙 포지션들의 전체 수를 나타내는 트랙 포지션들 숫자(track position number), 상기 적어도 하나의 트랙들의 펄스들의 전체 수를 나타내는 전체 펄스 숫자(total pulses number) 및 하나의 상태 번호(state number)를 사용함으로써 디코드되는 상기 복수의 펄스 포지션들을 디코딩하는 단계; 및
상기 복수의 펄스 포지션들과 상기 인코드된 오디오 신호와 연관된 복수의 예측 필터 계수를 사용하여 합성 오디오 신호를 생성함으로써 인코드된 오디오 신호를 디코딩하는 단계를 포함하는 디코딩 방법.
오디오 신호를 인코딩하는 방법에 있어서,
상기 오디오 신호와 연관된 복수의 예측 필터 계수들을 결정하고, 상기 오디오 신호에 기초하는 잔여 신호(residual signal)와 복수의 예측 필터 계수들을 생성하는 단계; 및
상기 오디오 신호, 상기 잔여 신호와 연관된 하나 또는 그 이상의 트랙들, 복수의 트랙 포지션들 및 복수의 펄스들을 가진 트랙들 각각을 인코드하도록 상기 하나 또는 그 이상의 트랙들과 관련된 복수의 펄스 포지션들을 인코딩하는 단계를 포함하되,
여기서 상기 펄스 포지션들의 각각은 상기 트랙의 펄스들 중 하나의 포지션을 나타내도록 상기 트랙들 중 하나의 상기 트랙 포지션들 중 하나를 나타내고,
여기서 상기 펄스 포지션들이 상태 번호(state number), 적어도 하나의 상기 트랙들의 상기 트랙 포지션들의 전체 수를 나타내는 트랙 포지션들 숫자(track positions number) 및 적어도 하나의 상기 트랙들의 상기 펄스들의 전체 수를 나타내는 전체 펄스들 숫자(total pulses number)만을 기초로하여 디코드될 수 있도록 상기 상태 번호를 생성함으로써 상기 복수의 펄스 포지션들이 인코드되는 것을 특징으로 하는 인코딩 방법.
컴퓨터(computer) 또는 신호 프로세서(signal processor)에서 실행될 때, 청구항 13 또는 14의 방법을 구현하는 컴퓨터 프로그램.