KR100415356B1 - 다중 채널 신호 인코딩 및 디코딩 방법 및 장치 - Google Patents

다중 채널 신호 인코딩 및 디코딩 방법 및 장치 Download PDF

Info

Publication number
KR100415356B1
KR100415356B1 KR10-2001-7004041A KR20017004041A KR100415356B1 KR 100415356 B1 KR100415356 B1 KR 100415356B1 KR 20017004041 A KR20017004041 A KR 20017004041A KR 100415356 B1 KR100415356 B1 KR 100415356B1
Authority
KR
South Korea
Prior art keywords
channel
matrix
transfer function
filter block
synthesis
Prior art date
Application number
KR10-2001-7004041A
Other languages
English (en)
Other versions
KR20010099659A (ko
Inventor
민데토르뵈른
Original Assignee
텔레폰악티에볼라겟엘엠에릭슨(펍)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 텔레폰악티에볼라겟엘엠에릭슨(펍) filed Critical 텔레폰악티에볼라겟엘엠에릭슨(펍)
Publication of KR20010099659A publication Critical patent/KR20010099659A/ko
Application granted granted Critical
Publication of KR100415356B1 publication Critical patent/KR100415356B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture

Abstract

다중 채널 신호 인코더는 매트릭스값 전달 함수를 갖는 분석 필터 블록과, 하나 이상의 0이 아닌 비대각선 소자를 갖는 분석부를 포함한다. 대응하는 합성부는 역매트릭스값 전달 함수를 갖는 합성 필터 블록(12M)을 포함한다. 이러한 구조는 선형 예측 분석 합성 신호 인코딩 시에 채널내 중복 및 채널간 중복을 모두 감소시킨다.

Description

다중 채널 신호 인코딩 및 디코딩 방법 및 장치{MULTI-CHANNEL SIGNAL ENCODING AND DECODING}
기존의 음성 코딩 방법은 통상적으로 단일 채널 음성 신호를 기초로 하고 있다. 일 예는 정규 전화 및 셀룰러 전화의 접속에 사용되는 음성 코딩이다. 음성 코딩은 주파수 제한 무선 인터페이스의 대역폭 사용을 감소시키도록 무선 링크에 사용된다. 음성 코딩의 잘 공지된 예는 PCM(펄스 코드 변조), ADPCM(적응성 차동 펄스 코드 변조), 서브-대역 코딩, 변환 코딩, LPC(선형 예측 코딩) 보코딩, 및 CELP(코드 여기 선형 예측) 코딩[1-2]와 같은 하이브리드 코딩이다.
오디오/음성 통신이 하나 이상의 입력 신호를 사용하는 환경에서, 예컨대 스테레오 확성기 및 2개의 마이크로폰(스테레오 마이크로폰)을 구비한 컴퓨터 워크 스테이션에서, 2개의 오디오/음성 채널이 스테레오 신호를 송신하는데 필요하다. 다중 채널 환경의 다른 예는 2, 3 또는 4개의 채널 입/출력을 갖는 회의실이다. 이러한 유형의 애플리케이션은 인터넷에 사용되고 3 세대 셀룰러 시스템에 사용될 것으로 기대된다.
음악 코딩의 영역으로부터, 결합 코딩 기술이 사용되는 경우, 상관 다중 채널이 더 효율적으로 코딩된다는 것은 공지되어 있으며, 개관은 [3]에 제공되어 있다. [4-6]에서는, 매트릭싱(또는 합 및 차 코딩)이라 칭해지는 기술이 사용된다. 채널간 중복을 감소시키기 위해 예측이 또한 사용되는데([4-7] 참조), 여기서 예측은 강도 코딩 또는 스펙트럼 예측에 사용된다. [8]에 공지되어 있는 다른 기술은 시간 정렬 합 및 차 신호, 및 채널 사이의 예측을 사용한다. 게다가, 파형 코딩 방법에서 채널 사이의 중복을 제거하기 위해 예측이 사용되고 있다[9]. 스테레오 채널의 문제점은 에코 소거 영역에 있으며, 개관은 [10]에 제공되어 있다.
설명된 기술 상태로부터, 결합 코딩 기술은 채널간 중복을 이용한다. 이러한 특징은 더 높은 비트레이트에서의 오디오(음악) 코딩 및 MPEG에서의 서브-대역 코딩과 같은 파형 코딩과 관련하여 사용되고 있다. 16∼20 kb/s의 M(채널의 수)배 이하로 비트레이트를 한 층 감소시키기 위해, 그리고 이것을 행하기 위해, 광대역(대략 7 kHz) 또는 협대역(3 내지 4 kHz) 신호는 더 효율적인 코딩 기술을 필요로 한다.
본 발명은 스테레오 오디오 신호와 같은 다중 채널 신호의 인코딩 및 디코딩에 관한 것이다.
도 1은 종래의 단일 채널 LPAS 음성 인코더에 대한 블록도이다.
도 2는 본 발명에 따른 다중 채널 LPAS 음성 인코더의 분석부에 대한 실시예의 블록도이다.
도 3은 본 발명에 따른 다중 채널 LPAS 음성 인코더의 합성부에 대한 예시적인 실시예의 블록도이다.
도 4는 다중 채널 신호 가산기 블록을 제공하기 위한 단일 채널 신호 가산기의 변형을 도시하는 블록도이다.
도 5는 다중 채널 LPC 분석 필터 블록을 제공하기 위한 단일 채널 LPC 분석 필터의 변형을 도시하는 블록도이다.
도 6은 다중 채널 가중 필터 블록을 제공하기 위한 단일 채널 가중 필터의 변형을 도시하는 블록도이다.
도 7은 다중 채널 에너지 계산 블록을 제공하기 위한 단일 채널 에너지 계산기의 변형을 도시하는 블록도이다.
도 8은 다중 채널 LPC 합성 필터 블록을 제공하기 위한 단일 채널 LPC 합성 필터의 변형을 도시하는 블록도이다.
도 9는 다중 채널 고정 코드북 블록을 제공하기 위한 단일 채널 고정 코드북의 변형을 도시하는 블록도이다.
도 10은 다중 채널 지연 소자 블록을 제공하기 위한 단일 채널 지연 소자의 변형을 도시하는 블록도이다.
도 11은 다중 채널 장기간 예측자 합성 블록을 제공하기 위한 단일 채널 장기간 예측자 합성 블록의 변형을 도시하는 블록도이다.
도 12는 다중 채널 LPC 분석 필터 블록의 다른 실시예를 도시하는 블록도이다.
도 13은 도 12의 분석 필터 블록에 대응하는 다중 채널 LPC 합성 필터 블록의 실시예를 도시하는 블록도이다.
도 14는 다른 종래의 단일 채널 LPAS 음성 인코더의 블록도이다.
도 15는 본 발명에 따른 다중 채널 LPAS 음성 인코더의 분석부의 예시적인 실시예의 블록도이다.
도 16은 본 발명에 따른 다중 채널 LPAS 음성 인코더의 합성부의 예시적인 실시예의 블록도이다.
도 17은 도 15의 다중 채널 장기간 예측자 분석 필터 블록을 제공하기 위한 도 14의 단일 채널 장기간 예측자 분석 필터의 변형을 도시하는 블록도이다.
도 18은 본 발명에 따른 탐색 방법의 예시적인 실시예를 도시하는 흐름도이다.
도 19는 본 발명에 따른 탐색 방법의 다른 예시적인 실시예를 도시하는 흐름도이다.
본 발명의 목적은 다중 채널 분석 합성 신호 코딩에서의 코딩 비트레이트를 단일(모노) 채널 비트레이트의 M(채널의 수)배의 코딩 비트레이트에서 낮은 비트레이트로 감소시키는 것이다.
이러한 목적은 첨부된 청구의 범위에 따라 해결된다.
간략하게, 본 발명은 다중 채널 카운터파트(counterpart)를 사용하여 단일 채널 선형 예측 분석 합성(LPAS) 인코더내의 상이한 소자를 일반화하는 것을 수반한다. 가장 기본적인 변형은 매트릭스값 전달 함수를 갖는 필터 블록으로 대체되는 분석 및 합성 필터이다. 이러한 매트릭스 값 전달 함수는 채널간 중복을 감소시키는 비대각선 매트릭스 소자를 갖는다. 다른 기본적인 특징은 최상의 코딩 파라미터에 대한 탐색이 폐쇄 루프(분석 합성)에서 실행된다는 것이다.
본 발명의 다른 목적 및 장점과 함께 본 발명은 첨부 도면과 이하의 설명을 참조함으로써 최상으로 이해될 수 있다.
본 발명은 종래의 단일 채널 선형 예측 분석 합성(LPAS) 음성 인코더를 도입함으로써, 그리고 이것을 다중 채널 LPAS 음성 인코더로 변환시키는 상기 인코더의 각 블록에서의 변형을 설명함으로써 이제 기술될 것이다.
도 1은 종래의 단일 채널 LPAS 음성 인코더의 블록도이다(더 상세한 설명은 [11] 참조). 인코더는 2개의 부분, 즉 합성부 및 분석부(대응하는 디코더는 합성부만을 포함)를 포함한다.
합성부는 여기 신호[i(n)]를 수신하고 합성 음성 신호를 출력하는 LPC 합성 필터(12)를 포함한다. 여기 신호[i(n)]는 가산기(22)에서 2개의 신호[u(n) 및 v(n)]를 가산함으로써 형성된다. 신호[u(n)]는 고정 코드북(16)으로부터의 신호[f(n)]를 이득 소자(20)의 이득(gF)만큼 스케일링함으로써 형성된다. 신호[v(n)]는 적응 코드북(14)으로부터 여기 신호[i(n)]의 지연("래그(lag)"를 지연시킴으로써) 버전을 이득 소자(18)의 이득(gA)만큼 스케일링함으로써 형성된다. 적응 코드북은 여기 신호[i(n)]를 하나의 서브-프레임 길이(N)만큼 지연시키는 지연 소자(24)를 포함하는 피드백 루프에 의해 형성된다. 따라서, 적응 코드북은 코드북으로 시프트되는 이전의 여기 신호[i(n)]를 포함한다(가장 오래된 여기는 코드북으로부터 시프트되어 폐기된다). LPC 합성 필터 파라미터는 매 20∼40 ms마다 일반적으로 갱신되는 프레임인 반면, 적응 코드북은 매 5∼10 ms마다 갱신되는 서브-프레임이다.
LPAS 인코더의 분석부는 착신 음성 신호[s(n)]의 LPC 분석을 실행하고, 여기 분석을 또한 실행한다.
LPC 분석은 LPC 분석 필터(10)에 의해 실행된다. 이 필터는 상기 음성 신호[s(n)]를 수신하고 이 신호의 파라미터 모델을 프레임마다 형성한다. 모델 파라미터는 실제 음성 프레임 벡터, 및 모델에 의해 생성된 대응하는 신호 벡터 사이의 차이만큼 형성된 잔여 벡터의 에너지를 최소로 하기 위해 선택된다. 모델 파라미터는 분석 필터(10)의 필터 계수로 표시된다. 이러한 필터 계수는 필터의 전송 함수[A(z)]를 정의한다. 분석 필터(12)가 1/A(z)와 적어도 거의 동일한 전송 함수를 갖기 때문에, 이러한 필터 계수는 제어 대쉬선으로 지시된 바와 같이 합성 필터(12)를 또한 제어한다.
여기 분석은 음성 신호 벡터{s(n)]를 최상으로 정합하는 합성 신호 벡터로 나타나는 고정 코드북 벡터(코드북 인덱스), 이득(gF), 적응 코드북 벡터(지연) 및 이득(gA)의 최상의 조합을 결정하도록 실행된다(여기에서 {}는 벡터 또는 프레임을 형성하는 샘플의 집합을 나타낸다). 이것은 상기 파라미터의 모든 가능한 조합을 테스트하는 철저한 탐색으로 행해진다(일부 파라미터가 다른 파라미터와 무관하게 결정되고 나머지 파라미터에 대한 탐색 중에 고정 유지되는 서브 최적 탐색 스킴(scheme)이 또한 가능하다). 합성 벡터[]가 대응하는 음성 벡터[{s(n)}]에 얼마나 근접하는지를 테스트하기 위해, 차 벡터[{e(n)}]의 에너지(가산기(26)에서 형성됨)는 에너지 계산기(30)에서 계산될 수 있다. 그러나, 큰 에러가 큰 진폭 주파수 대역에 의해 마스크되는 방식으로 에러가 재분배되는 가중 에러 신호 벡터의 에너지[{ew(n)}]를 고려하는 것이 더욱 효율적이다. 이것은 가중 필터(28)에서 행해진다.
도 1의 단일 채널 LPAS 인코더를 본 발명에 따른 다중 채널 LPAS 인코더로의 변형은 도 2 내지 도 13을 참조하여 이제 설명될 것이다. 2 채널(스테레오) 음성 신호가 가정되지만, 동일한 원리가 2 이상의 채널에 또한 사용될 수 있다.
도 2는 본 발명에 따른 다중 채널 LPAS 음성 인코더의 분석부에 대한 실시예의 블록도이다. 도 2에서, 입력 신호는 신호 성분[s1(n), s2(n)]으로 표시된 바와 같이 현재의 다중 채널 신호이다. 도 1의 LPC 분석 필터(10)는 매트릭스값 전달 함수[A(z)]를 갖는 LPC 분석 필터 블록(10M)으로 대체되어 있다. 이 블록은 도 5를 참조하여 더 상세히 설명된다. 유사하게도, 가산기(26), 가중 필터(28) 및 에너지 계산기(30)는 각각 대응하는 다중 채널 블록(26M, 28M 및 30M)으로 대체된다. 이러한 블록은 각각 도 4, 도 6 및 도 7에서 더 상세히 설명된다.
도 3은 본 발명에 따른 다중 채널 LPAS 음성 인코더의 합성부에 대한 실시예의 블록도이다. 다중 채널 디코더는 이러한 합성부에 의해 또한 형성될 수 있다. 여기서, 도 1의 LPC 합성 필터(12)는 A(z)의 역과 적어도 거의 동일한(노테이션(notation)으로 표시된 바와 같은) 매트릭스값 전달 함수[A-1(z)]를 갖는 LPC 합성 필터 블록(12M)으로 대체되어 있다. 이 블록은 도 8을 참조하여 더 상세히 설명된다. 유사하게도, 가산기(22), 고정 코드북(16), 이득 소자(20), 지연 소자(24), 적응 코드북(14) 및 이득 소자(18)는 각각 대응하는 다중 채널 블록(22M, 16M, 24M, 14M 및 18M)으로 대체된다. 이 블록은 도 4, 및 도 9 내지 도 11에서 더 상세히 설명된다.
도 4는 단일 채널 신호 가산기의 다중 채널 신호 가산기 블록으로의 변형을 도시하는 블록도이다. 이것은 가산기의 수를 인코딩될 채널의 수로 증가시키는 것만을 수반하므로 가장 용이한 변형이다. 동일한 채널에 대응하는 신호만이 가산된다(채널간 처리 없음).
도 5는 단일 채널 LPC 분석 필터의 다중 채널 LPC 분석 필터 블록으로의 변형을 도시하는 블록도이다. 단일 채널의 경우(도 5의 상부)에, 예측기[P(z)]는 잔여 신호[r(n)]를 생성하도록 가산기(50)의 음성 신호[s(n)]로부터 감산되는 모델 신호를 예측하는데 사용된다. 다중 채널의 경우(도 5의 하부)에, 이러한 2개의 예측기[P11(z) 및 P22(z)] 및 2개의 가산기(50)가 있다. 그러나, 이러한 다중 채널 LPC 분석 블록은 2개의 채널을 완전히 독립적인 것으로 취급하고 채널간 중복을 이용하지 않는다. 이러한 중복을 이용하기 위해, 2개의 채널간 예측기[P12(z) 및 P21(z)] 및 2개의 추가 가산기(52)가 있다. 채널간 예측을 가산기(52)내의 채널내 예측에 가산함으로써, 잔여 신호[r1(n), r2(n)]의 변화(에러)를 감소시키는 더 정확한 예측이 얻어진다. 예측기[P11(z), P22(z), P12(z), P21(z)]에 의해 형성되는 다중 채널 예측기의 목적은 음성 프레임 상의 r1(n)2+r2(n)2의 합을 최소로 하는 것이다. 예측기(동일한 차수로 되지 않아도 됨)는 공지된 선형 예측 분석의 다중 채널 확장을 사용함으로써 계산될 수 있다. 일 예는 반사 계수 기반 예측기를 기술하는 [9]에서 찾을 수 있다. 예측 계수는 선 스펙트럼 주파수 도메인과 같은 적절한 도메인으로 변환한 후 다중 차원 벡터 양자화기에 의해 효율적으로 코딩되는 것이 바람직하다.
수학적으로, LPC 분석 필터 블록은 아래와 같이 (z-도메인에) 표현될 수 있다:
(여기서, E는 단위 매트릭스를 나타냄) 또는 컴팩트한 벡터 표기로
R(z)=A(z)S(z)이다.
이러한 표현으로부터, 채널의 수는 벡터 및 매트릭스의 차원을 증가시킴으로써 증가될 수 있다는 것이 명백해진다.
도 6은 단일 채널 가중 필터를 다중 채널 가중 필터 블록으로의 변형을 도시하는 블록도이다. 단일 채널 가중 필터(28)는 아래 형태의 전달 함수를 일반적으로 가지며:
여기서, β는 상수이고, 일반적으로 0.8 내지 1.0의 범위에 있다. 더 일반적인 형태는 아래와 같다:
여기서, α≥β는 다른 상수이고, 일반적으로 0.8 내지 1.0의 범위에 또한 있다. 다중 채널 경우로의 자연적인 변형은 아래와 같다:
W(z)=A-1(z/β)A(z/α)
여기서, W(z), A-1(z) 및 A(z)는 현재 매트릭스값이다. 도 6에 도시되어 있는 더 신축적인 해결방안은 채널내 가중을 위한 인자(a 및 b)(상기 α 및 β에 대응) 및 채널간 가중을 위한 인자(c 및 d)를 사용한다(모든 인자는 0.8 내지 1.0의 범위에 일반적으로 있다). 이러한 가중 필터 블록은 수학적으로 아래와 같이 표현될 수 있다:
이러한 표현으로부터, 채널의 수는 매트릭스의 차원을 증가시킴으로써 그리고 추가 인자를 도입함으로써 증가될 수 있다는 것이 명백해진다.
도 7은 단일 채널 에너지 계산기를 다중 채널 에너지 계산기 블록으로의 변형을 도시하는 블록도이다. 단일 채널의 경우에, 에너지 계산기(12)는 음성 프레임의 가중 에러 신호[ew(n)]에 대한 각 샘플의 제곱의 합을 결정한다. 다중 채널의 경우에, 에너지 계산기(12M)는 소자(70)의 각 성분[ew1(n), ew2(n)]에 대한 프레임의 에너지를 유사하게 결정하고, 총 에너지(ETOT)를 얻기 위해 가산기(72)에서 이러한 에너지를 가산한다.
도 8은 단일 채널 LPC 합성 필터를 다중 채널 LPC 합성 필터 블록으로의 변형을 도시하는 블록도이다. 도 1의 단일 채널 인코더에서, 여기 신호[i(n)]는 도 5의 상부에서 단일 채널 합성 필터의 잔여 신호[r(n)]와 이상적으로는 동일해야 한다. 이러한 조건이 충족되는 경우, 전달 함수[1/A(z)]를 갖는 합성 필터는 음성 신호[s(n)]와 동일한 추정치[]를 생성한다. 유사하게도, 다중 채널 인코더에서, 여기 신호[i1(n), i2(n)]는 도 5의 아래 부분의 잔여 신호[r1(n), r2(n)]와 이상적으로 동일해야 한다. 이 경우에, 도 1의 합성 필터(12)의 변형은 매트릭스값 전달 함수를 갖는 합성 필터 블록(12M)이다. 이 블록은 도 5의 분석 블록의 매트릭스값 전달 함수[A(z)]의 적어도 거의 (매트릭스) 역 A-1(z)인 전달 함수를 가져야 한다. 수학적으로, 분석 블록은 아래와 같이 (z-도메인에서) 표현될 수 있다:
또는 컴팩트한 벡터 표기로
이다.
이러한 표현으로부터, 채널의 수는 벡터 및 매트릭스의 차원을 증가시킴으로써 증가될 수 있다는 것이 명백해진다.
도 9는 단일 채널 고정 코드북을 다중 채널 고정 코드북 블록으로의 변형을 도시하는 블록도이다. 단일 채널 경우의 단일 고정 코드북은 고정 다중 코드북(16M)으로 형식적으로 대체된다. 그러나, 양 채널은 동일한 유형의 신호를 반송하기 때문에, 이것은 실제로 하나의 고정 코드북만을 가지는 것으로 충분하고 이러한 단일 코드북으로부터 2개의 채널에 대한 다른 여기[f1(n), f2(n)]를 선택하는 것으로 충분하다. 고정 코드북은 예컨대 대수 형태로 이루어질 수 있다([12] 참조). 게다가, 단일 채널 경우의 단일 이득 소자(20)는 수 개의 이득 소자를 포함하는 이득 블록(20M)으로 대체된다. 수학적으로, 이득 블록은 아래와 같이 (시간 도메인에서) 표현될 수 있다:
또는 컴팩트한 벡터 표기로
U(n)=gFf(n)이다.
이러한 표현으로부터, 채널의 수는 벡터 및 매트릭스의 차원을 증가시킴으로써 증가될 수 있다는 것이 명백해진다.
도 10은 단일 채널 지연 소자를 다중 채널 지연 소자 블록으로의 변형을 도시하는 블록도이다. 이 경우에, 지연 소자는 각 채널에 제공된다. 모든 신호는 서브-프레임 길이(N)만큼 지연된다.
도 11은 단일 채널 장기간 예측기 합성 블록을 다중 채널 장기간 예측기 합성 블록으로의 변형을 도시하는 블록도이다. 단일 채널의 경우에, 적응 코드북(14), 지연 소자(24) 및 이득 소자(18)의 조합은 장기간 예측기(LTP)로 간주될 수 있다. 이러한 3개의 블록에 대한 동작은 아래와 같이 수학적으로(시간 도메인에서) 표현될 수 있다:
여기서,는 시간 시프트 연산자를 나타낸다. 따라서, 여기[v(n)]는 gA에 의해 스케일링되고 이노베이션(innovation)[i(n)]의 래그만큼 지연된 버전이다. 다중 채널의 경우에, 개별 성분[i1(n), i2(n)]에 대해 상이한 지연(lag11, lag22)이 있고, 또한 채널간 상관을 모델링하는 분리 지연(lag11, lag22)을 갖는 i1(n), i2(n)의 교차 접속이 있다. 게다가, 이러한 4개의 신호는 상이한 이득 gA11, gA22, gA12, gA21을 가질 수 있다. 수학적으로, 다중 채널 장기간 예측기 합성 블록의 기능은 아래와 같이 시간 도메인으로 표현될 수 있다:
또는 컴팩트한 벡터 표기로
이다.
여기서,
는 소자 방식 매트릭스 승산을 나타내고,
는 매트릭스값 시간 시프트 연산자를 나타낸다.
이러한 표현으로부터, 채널의 수는 벡터 및 매트릭스의 차원을 증가시킴으로써 증가될 수 있다는 것이 명백해진다. 낮은 복잡성 또는 낮은 비트레이트를 달성하기 위해, 래그 및 이득의 결합 코딩이 사용될 수 있다. 상기 래그는 예컨대, 델타 코딩될 수 있고, 과도한 경우에 단일 래그만이 사용될 수 있다. 상기 이득은 벡터 양자화 또는 차동 인코딩될 수 있다.
도 12는 다중 채널 LPC 분석 필터 블록의 다른 실시예를 도시하는 블록도이다. 이 실시예에서, 입력 신호[s1(n), s2(n)]는 가산기(54)에서 합 및 차 신호[s1(n)+s2(n) 및 s1(n)-s2(n)]를 형성함으로써 선처리된다. 그 후, 이러한 합 및 차 신호는 도 5에서와 같이 동일한 분석 필터 블록으로 전송된다. 이것은 합 신호가 차 신호보다 더 복잡한 것으로 기대되기 때문에, (합 및 차) 채널 사이의 상이한 비트 할당을 갖는 것이 가능해진다. 따라서, 합 신호 예측기[P11(z)]는 일반적으로 차 신호 예측기[P22(z)]보다 더 높은 차수로 된다. 게다가, 합 신호 예측기는 더 높은 비트레이트 및 더 정교한 양자화기를 필요로 한다. 합 및 차 채널 사이의 비트 할당은 고정형 또는 적응형일 수 있다. 합 및 차 신호가 부분 직교로서 간주될 수 있기 때문에, 합 및 차 신호 사이의 교차 상관이 또한 감소되어, 이것은 더 간단한(낮은 차수의) 예측기[P12(z), P21(z)]를 유도한다. 이것은 필요한 비트레이트를 또한 감소시킨다.
도 13은 도 12의 분석 필터에 대응하는 다중 채널 LPC 합성 필터 블록의 일 실시예를 도시하는 블록도이다. 여기서, 도 8에 따른 합성 필터 블록으로부터의 출력 신호는 합 및 차 신호의 추정치로부터 추정치[]를 복구하도록 가산기(82)에서 후처리된다.
도 12 및 도 13을 참조하여 설명된 실시예는 매트릭싱으로 칭해지는 일반적인 기술의 특수한 경우이다. 일반적인 개념인 매트릭싱은 최초 벡터값 입력 신호를 새로운 벡터값 신호로 변환시키는 것이며, 그 성분 신호는 최초 신호 성분보다 덜 상관(더 직교)된다. 전형적인 변환의 예는 아다마르(Hadamard) 및 월시(Walsh) 변환이다. 예컨대, 2 차 및 4차 아다마르 변환 매트릭스는 다음과 같이 주어진다:
아다마르 매트릭스 H2는 도 12의 실시예를 제공한다. 아다마르 매트릭스 H4는 4 채널 코딩에 사용된다. 이러한 유형의 매트릭싱 장점은 매트릭스의 형태가 고정되기 때문에(입력 신호의 완전한 직교가 가변 시간 변환 매트릭스를 필요로 하고, 이것은 디코더에 송신되어야 하므로 필요한 비트레이트를 증가시킨다), 임의의 정보를 디코더의 변환 매트릭스에 전송할 필요없이 인코더의 복잡성 및 필요한 비트레이트가 감소된다는 것이다. 변환 매트릭스가 고정되어 있기 때문에, 디코더에 사용되는 그 역도 고정되며, 따라서 디코더에서 미리 계산되어 저장될 수 있다.
상술한 합 및 차 기술의 변형은 "좌측" 채널, 및 "좌측" 채널과 이득 인자로 승산되는 "우측" 채널 사이의 차를 코딩하는 것이며, 즉
이다.
여기서 L, R은 좌측 및 우측 채널이고, C1, C2는 인코딩될 결과적인 채널이며, 이득은 스케일 인자이다. 스케일 인자는 디코더에 고정될 수 있고, 공지되어 있으며, 디코더에서 계산 또는 예측, 양자화 및 송신될 수 있다. 디코더에서의 C1, C2를 디코딩한 후에, 좌측 및 우측 채널은 아래에 따라 재구성된다
여기서, ^은 추정량을 나타낸다. 실제로, 이 기술은 매트릭싱의 특수한 경우로 또한 간주될 수 있으며, 여기서 변환 매트릭스는 다음과 같이 주어진다
이 기술은 2차원보다 더 크도록 확장될 수도 있다. 일반적인 경우에, 변환 매트릭스는 다음과 같이 주어진다
여기서, N은 채널의 수를 나타낸다.
매트릭싱이 사용되는 경우에, 결과적인 채널은 매우 상이할 수 있다. 따라서, 가중 프로세스에서 이러한 채널을 상이하게 취급하는 것이 바람직할 수 있다. 이 경우에, 더 일반적인 가중 매트릭스는 아래에 따라 사용될 수 있다
여기서 매트릭스의 요소는
이며
일반적으로 0.6 내지 1.0의 범위에 있다. 이러한 표현으로부터, 채널의 수는 가중 매트릭스의 차원을 증가시킴으로써 증가될 수 있다는 것이 명백해진다. 따라서, 일반적인 경우에, 가중 매트릭스는 아래와 같이 기록될 수 있다:
여기서, N은 채널의 수를 나타낸다. 이전에 제공된 가중 매트릭스의 모든 예는 더 일반적인 매트릭스의 특수한 경우이다.
도 14는 다른 종래의 단일 채널 LPAS 음성 인코더의 블록도이다. 도 1의 실시예와 도 14의 실시예의 본질적인 차이점은 분석부의 실행이다. 도 14에서, 장기간 예측기(LTP) 분석 필터(11)는 잔여 신호[r(n)]의 중복을 더 감소시키기 위해 LPC 분석 필터(10) 뒤에 설치된다. 이러한 분석의 목적은 적응 코드북에서 확률 지연값을 찾는 것이다. 이러한 확률 지연값 근처의 지연값만이 탐색되어(적응 코드북(14)까지 파선의 제어 라인으로 표시된 바와 같이), 탐색 절차의 복잡성을 실질적으로 감소시킨다.
도 15는 본 발명에 따른 다중 채널 LPAS 음성 인코더의 분석부에 대한 예시적인 실시예의 블록도이다. 여기서, LTP 분석 필터 블록(11M)은 도 14의 LTP 분석 필터(11)의 다중 채널 변형이다. 이러한 블록의 목적은 탐색 절차의 복잡성을 실질적으로 감소시키는 확률 지연값(lag11, lag12, lag21, lag22)를 찾는 것이며, 이하에 더 상세히 설명될 것이다.
도 16은 본 발명에 따른 다중 채널 LPAS 음성 인코더의 합성부에 대한 예시적인 실시예의 블록도이다. 이 실시예와 도 3의 실시예의 차이점은 분석부로부터 적응 코드북(14M)까지의 지연 제어 라인이다.
도 17은 도 14의 단일 채널 LTP 분석 필터(11)를 도 15의 다중 채널 LTP 분석 필터 블록(11M)으로의 변형을 도시하는 블록도이다. 좌측부는 단일 채널 LTP 분석 필터(11)를 나타낸다. 적절한 지연값 및 이득값을 선택함으로써, 프레임 상의 예측 신호 및 LPC 분석 필터(12)로부터의 신호[r(n)] 사이의 차이점인 잔여 신호 [re(n)]의 제곱 합이 최소로 된다. 얻어진 지연값은 탐색 절차의 시작점을 제어한다. 도 17의 우측부는 대응하는 다중 채널 LTP 분석 필터 블록(11M)을 나타낸다. 원리는 동일하지만, 여기서 총 잔여 신호의 에너지는 적절한 지연값(lag11, lag12, lag21, lag22) 및 이득 인자(gA11, gA12, gA21, gA22)를 선택함으로써 최소로 된다. 얻어진 지연값은 탐색 절차의 시작점을 제어한다. 블록(11M) 및 도 11의 다중 채널 장기간 예측기(18M) 사이의 유사성에 주의하라.
단일 채널 LPAS 인코더내의 상이한 소자를 다중 채널 LPAS 인코더내의 대응하는 블록으로의 변형을 설명하면, 최적의 코딩 파라미터를 찾기 위한 탐색 절차를 논의하는 것이 적절하다.
가장 명백하고 최적인 탐색 방법은 lag11, lag12, lag21, lag22, gA11, gA12, gA21, gA22, 고정 코드북 인덱스[gF1및 gF2]의 모든 가능한 조합에 대한 가중 에러의 총 에너지를 계산하고, 현재의 음성 프레임의 표시로서 가장 낮은 에러를 제공하는 조합을 선택하는 것이다. 그러나, 이 방법은 특히 채널의 수가 증가되는 경우 매우 복잡하다.
도 2 및 도 3의 실시예에 적당한 덜 복잡하고 부분적으로 최적인 방법은 도 18에 또한 도시되어 있는 아래의 알고리즘이다(필터 물결 현상(ringing)의 감산이 취해지고 명백히 언급되지 않음).
A. 하나의 프레임(예컨대, 20 ms)에 대한 다중 채널 LPC 분석을 실행한다.
B. 각 서브프레임(예컨대, 5 ms)에 대해 아래의 단계를 실행한다:
B1. 폐쇄 루프 탐색에서 모든 가능한 지연값의 철저한(동시 및 완전한) 탐색을 실행한다;
B2. LTP 이득을 벡터 양자화한다;
B3. 고정 코드북에서의 나머지 탐색 시에 적응 코드북으로부터의 여기(excitation)에 대한 기여(정확히 결정된 지연/이득에 대한)를 감산한다;
B4. 폐쇄 루프 탐색에서 고정 코드북 인덱스의 철저한 탐색을 실행한다;
B5. 고정 코드북 이득을 벡터 양자화한다;
B6. LTP를 갱신한다.
도 15 및 도 16의 실시예에 적당한 덜 복잡하고 부분적으로 최적인 방법은 도 19에 또한 도시되어 있는 아래의 알고리즘이다(필터 물결 현상의 감산이 취해지고 명백히 언급되지 않음).
A. 하나의 프레임에 대한 다중 채널 LPC 분석을 실행한다.
C. LTP 분석에서 지연의 (개방 루프) 추정치(전체 프레임에 대한 추정치의 하나의 세트, 프레임의 더 작은 부분에 대한 하나의 세트, 예컨대, 1/2 프레임 각각에 대한 하나의 세트 또는 각 서브프레임에 대한 하나의 세트)를 결정한다.
D. 각 서브프레임에 대해, 아래의 단계를 실행한다:
D1. 채널 1(lag11)에 대한 내부 지연을 추정치 근처의 몇 개의 샘플(예컨대, 4∼16)만을 탐색한다;
D2. 지연 후보 수(예컨대, 2∼6)를 저장한다;
D3. 채널 2(lag22)에 대한 내부 지연을 추정치 근처의 몇 개의 샘플(예컨대, 4∼16)만을 탐색한다;
D4. 지연 후보 수(예컨대, 2∼6)를 저장한다;
D5. 채널 1 - 채널 2(lag12)에 대한 내부 지연을 추정치 근처의 몇 개의 샘플(예컨대, 4∼16)만을 탐색한다;
D6. 지연 후보 수(예컨대, 2∼6)를 저장한다;
D7. 채널 2 - 채널 1(lag21)에 대한 내부 지연을 추정치 근처의 몇 개의 샘플(예컨대, 4∼16)만을 탐색한다;
D8. 지연 후보 수(예컨대, 2∼6)를 저장한다;
D9. 저장된 지연 후보의 모든 조합에 대해서만 완전한 탐색을 실행한다;
D10. LTP 이득을 벡터 양자화한다;
D11. 고정 코드북에서의 나머지 탐색에서 적응 코드북으로부터 여기에 대한 기여(정확히 결정된 지연/이득에 대한)를 감산한다;
D12. 몇 개의(예컨대, 2∼8) 인덱스 후보를 찾기 위해 고정 코드북 1을 탐색한다;
D13. 인덱스 후보를 저장한다;
D14. 몇 개의(예컨대, 2∼8) 인덱스 후보를 찾기 위해 고정 코드북 2를 탐색한다;
D15. 인덱스 후보를 저장한다;
D16. 양 고정 코드북의 저장된 인덱스 후보의 모든 조합에 대해서만 완전한 탐색을 실행한다;
D17. 고정 코드북 이득을 벡터 양자화한다;
D18. LTP를 갱신한다.
최종적으로 설명된 알고리즘에서, 채널의 탐색 순서는 서브프레임에서 서브프레임까지 교환될 수 있다.
매트릭싱이 사용되는 경우, 먼저 우위의 채널(합 채널)을 항상 탐색하는 것이 바람직하다.
본 발명은 음성 신호에 관하여 설명되어 있지만, 동일한 원리가 다중 채널 오디오 신호에 적용될 수 있음은 명백하다. 다른 유형의 다중 채널 신호는 이러한 유형의 데이터 압축 예컨대, 다중점 온도 측정, 지진 측정 등에 또한 적합하다. 실제로, 계산적인 복잡성이 관리될 수 있는 경우, 동일한 원리가 비디오 신호에도 적용될 수 있다. 이 경우에, 각 픽셀의 시간 변화는 채널로서 간주될 수 있고, 인접 픽셀이 종종 상관되기 때문에, 픽셀간 중복이 데이터 압축 목적으로 이용될 수 있다.
당업자라면 다양한 변형 및 변화가 첨부된 청구 범위에 의해 한정되는 범위로부터 벗어남 없이 본 발명에 대해 이루어질 수 있음을 이해할 것이다.
참조 문헌
[1] A. Gersho, "Advances in Speech and Audio Compression", Proc. of the IEEE, Vol. 82, No. 6, pp 900-918, June 1994.
[2] A. S. Spanias, "Speech Coding: A Tutorial Review", Proc. of the IEEE, Vol 82, No. 10, pp 1541-1582, Oct 1994.
[3] P. Noll, Wideband Speech and Audio Coding", IEEE Commun. Vol. 31, No. 11, pp 34-44, 1993.
[4] B. Grill et. al. "Improved MPEG-2 Audio Multi-Channel Encoding", 96thAudio Engineering Society Convention, pp 1-9, 1994.
[5] W. R. Th. Ten Kate et. al. "Matrixing of Bit Rate Reduced Audio Signals", Proc. ICASSP, Vol. 2, pp 205-208, 1992.
[6] M. Bosi et. al. "ISO/IEC MPEG-2 Advanced Audio Coding", 101stAudio Engineering Society Convention, 1996.
[7] EP 0 797 324 A2, Lucent Technologies Inc. "Enhanced stereo coding method using temporal envelope shaping"
[8] WO90/16136, British Telecom. "Polyphonic coding"
[9] WO 97/04621, Robert Bosch Gmbh, "Process for reducing redundancy during the coding of multichannel signals and device for decoding redundancy reduced multichannel signals"
[10] M. Mohan Sondhi et. al. "Stereophonic Acoustic Echo Cancellation - An Overview of the Fundamental Problem", IEEE Signal Processing Letters, Vol. 2, No. 8, August 1995.
[11] P. Kroon, E. Deprettere, "A Class of Analysis-by-Synthesis Predictive Coders fot High Quality Speech Coding at Rates Between 4.8 and 16 kbits/s", IEEE Journ. Sel. Areas Com., Vol SAC-6, No. 2, pp353-363, Feb 1988.
[12] C, Laflamme et. al., "16 Kbps Wideband Speech Coding Technique Based on Algebraic CELP", Proc. ICASSP, 1991, pp13-16.

Claims (26)

  1. 다중 채널 신호 인코더에 있어서,
    제 1 매트릭스값 전달 함수를 갖는 분석 필터 블록(10M)과, 하나 이상의 0이 아닌 비대각선 소자[-P12(z), -P21(z)]를 포함하는 분석부; 및
    제 2 매트릭스값 전달 함수를 갖는 합성 필터 블록(12M)과, 하나 이상의 0이 아닌 비대각선 소자[(A-1 12(z), A-1 21(z))]를 포함하는 합성부를 포함하며;
    이것에 의해 선형 예측 분석 합성 신호 인코딩 시에 채널내 중복 및 채널간 중복을 모두 감소시키는 것을 특징으로 하는 다중 채널 신호 인코더.
  2. 제 1 항에 있어서,
    상기 제 2 매트릭스값 전달 함수는 상기 제 1 매트릭스값 전달 함수의 역인 것을 특징으로 하는 다중 채널 신호 인코더.
  3. 제 1 항 또는 제 2 항에 있어서,
    으로 정의되는 다중 채널 장기간 예측기 합성 블록을 포함하고,
    여기서, gA는 이득 매트릭스를 나타내며,
    는 소자 방식 매트릭스 승산을 나타내고,
    는 매트릭스값 시간 시프트 연산자를 나타내며,
    i(n)은 벡터값 합성 필터 블록 여기를 나타내는 것을 특징으로 하는 다중 채널 신호 인코더.
  4. 제 1 항에 있어서,
    로 정의되는 매트릭스값 전송 함수 W(z)를 갖는 다중 채널 가중 필터 블록을 포함하고,
    여기서, N은 채널의 수를 나타내며,
    Aij, i=1..N, j=1..N은 상기 분석 필터 블록의 개별 매트릭스 소자의 전달 함수를 나타내고,
    A-1 ij, i=1..N, j=1..N은 상기 합성 필터 블록의 개별 매트릭스 소자의 전달 함수를 나타내며,
    αij, βij, i=1..N, j=1..N은 미리 정해진 상수인 것을 특징으로 하는 다중 채널 신호 인코더.
  5. 제 4 항에 있어서,
    W(z)=A-1(z/β)A(z/α)로서 정의된 매트릭스값 전송 함수를 갖는 가중 필터 블록을 포함하고,
    여기서, A는 상기 분석 필터 블록의 매트릭스값 전달 함수를 나타내며,
    A-1는 상기 합성 필터 블록의 매트릭스값 전달 함수를 나타내고,
    α, β는 미리 정해진 상수인 것을 특징으로 하는 다중 채널 신호 인코더.
  6. 제 1 항 또는 제 2 항에 있어서,
    다중 고정 코드북 인덱스 및 대응하는 고정 코드북 이득을 포함하는 것을 특징으로 하는 다중 채널 신호 인코더.
  7. 제 1 항 또는 제 2 항에 있어서,
    인코딩 전에 다중 채널 입력 신호를 매트릭싱하는 수단을 포함하는 것을 특징으로 하는 다중 채널 신호 인코더.
  8. 제 7 항에 있어서,
    상기 매트릭싱 수단은 아다마르형의 변환 매트릭스를 정의하는 것을 특징으로 하는 다중 채널 신호 인코더.
  9. 제 7 항에 있어서,
    상기 매트릭싱 수단은 아래의 형태의 변환 매트릭스를 정의하고,
    여기서, gainij, i=2..N, j=2..N은 스케일 인자를 나타내며,
    N은 인코딩될 채널의 수를 나타내는 것을 특징으로 하는 다중 채널 신호 인코더.
  10. 다중 채널 선형 예측 부넉 합성 신호 디코더에 있어서,
    매트릭스값 변환 함수를 갖는 합성 필터 블록(12M)과, 하나 이상의 0이 아닌 비대각선 소자[A-1 12(z), A-1 21(z)]를 포함하는 것을 특징으로 하는 다중 채널 선형 예측 분석 합성 신호 디코더.
  11. 제 10 항에 있어서,
    으로 정의되는 다중 채널 장기간 예측기 합성 블록을 포함하고,
    여기서, gA는 이득 매트릭스를 나타내며,
    는 소자 방식 매트릭스 승산을 나타내고,
    는 매트릭스값 시간 시프트 연산자를 나타내며,
    i(n)은 벡터값 합성 필터 블록 여기를 나타내는 것을 특징으로 하는 다중 채널 선형 예측 분석 합성 신호 디코더.
  12. 제 10 항 또는 제 11 항에 있어서,
    다중 고정 코드북 인덱스 및 대응하는 고정 코드북 이득을 포함하는 것을 특징으로 하는 다중 채널 선형 예측 분석 합성 신호 디코더.
  13. 다중 채널 음성 인코더를 포함하는 송신기에 있어서:
    제 1 매트릭스값 전달 함수를 갖는 분석 필터 블록(10M)과, 하나 이상의 0이 아니 비대각선 소자[-P12(z), -P21(z)]를 포함하는 음성 분석부; 및
    제 2 매트릭스값 전달 함수를 갖는 합성 필터 블록(12M)과, 하나 이상의 0이 아닌 비대각선 소자[A-1 12(z), A-1 21(z)]를 포함하는 음성 합성부를 포함하며;
    이것에 의해 선형 예측 분석 합성 신호 인코딩 시에 채널내 중복 및 채널간 중복을 모두 감소시키는 것을 특징으로 하는 다중 채널 음성 인코더를 포함하는 송신기.
  14. 제 13 항에 있어서,
    상기 제 2 매트릭스값 전달 함수는 상기 제 1 매트릭스값 전달 함수의 역인 것을 특징으로 하는 다중 채널 음성 인코더를 포함하는 송신기.
  15. 제 13 항 또는 제 14 항에 있어서,
    으로 정의되는 다중 채널 장기간 예측기 합성 블록을 포함하고,
    여기서, gA는 이득 매트릭스를 나타내며,
    는 소자 방식 매트릭스 승산을 나타내고,
    는 매트릭스값 시간 시프트 연산자를 나타내며,
    i(n)은 벡터값 합성 필터 블록 여기를 나타내는 것을 특징으로 하는 다중 채널 음성 인코더를 포함하는 송신기.
  16. 제 13 항에 있어서,
    로 정의되는 매트릭스값 전송 함수 W(z)를 갖는 다중 채널 가중 필터 블록을 포함하고,
    여기서, N은 채널의 수를 나타내며,
    Aij, i=1..N, j=1..N은 상기 분석 필터 블록의 개별 매트릭스 소자의 전달 함수를 나타내고,
    A-1 ij, i=1..N, j=1..N은 상기 합성 필터 블록의 개별 매트릭스 소자의 전달 함수를 나타내며,
    αij, βij, i=1..N, j=1..N은 미리 정해진 상수를 나타내는 것을 특징으로 하는 다중 채널 음성 인코더를 포함하는 송신기.
  17. 제 16 항에 있어서,
    W(z)=A-1(z/β)A(z/α)로 정의된 매트릭스값 전달 함수를 갖는 가중 필터 블록을 포함하고,
    여기서, A는 상기 분석 필터 블록의 매트릭스값 전달 함수를 나타내며,
    A-1는 상기 합성 필터 블록의 매트릭스값 전달 함수를 나타내고,
    α, β는 미리 정해진 상수를 나타내는 것을 특징으로 하는 다중 채널 음성 인코더를 포함하는 송신기.
  18. 제 13 항 또는 제 14 항에 있어서,
    다중 고정 코드북 인덱스 및 대응하는 고정 코드북 이득을 포함하는 것을 특징으로 하는 다중 채널 음성 인코더를 포함하는 송신기.
  19. 제 13 항 또는 제 14 항에 있어서,
    인코딩하기 전에 다중 채널 입력 신호를 매트릭싱하는 수단을 포함하는 것을 특징으로 하는 다중 채널 음성 인코더를 포함하는 송신기.
  20. 제 19 항에 있어서,
    상기 매트릭싱 수단은 아다마르형의 변환 매트릭스를 정의하는 것을 특징으로 하는 다중 채널 음성 인코더를 포함하는 송신기.
  21. 제 19 항에 있어서,
    상기 매트릭싱 수단은 아래의 형태의 변환 매트릭스를 정의하고,
    여기서, gainij, i=2..N, j=2..N은 스케일 인자를 나타내며,
    N은 인코딩될 채널의 수를 나타내는 것을 특징으로 하는 다중 채널 음성 인코더를 포함하는 송신기.
  22. 다중 채널 선형 예측 분석 합성 음성 디코더를 포함하는 수신기에 있어서:
    매트릭스값 전송 함수를 갖는 음성 합성 필터 블록(12M)과, 하나 이상의 0이 아닌 비대각선 소자[A-1 12(z), A-1 21(z)]를 포함하는 것을 특징으로 하는 다중 채널 선형 예측 분석 합성 음성 디코더를 포함하는 수신기.
  23. 제 22 항에 있어서,
    으로 정의되는 다중 채널 장기간 예측기 합성 블록을 포함하고,
    여기서, gA는 이득 매트릭스를 나타내며,
    는 소자 방식 매트릭스 승산을 나타내고,
    는 매트릭스값 시간 시프트 연산자를 나타내며,
    i(n)은 벡터값 합성 필터 블록 여기를 나타내는 것을 특징으로 하는 다중 채널 선형 예측 분석 합성 음성 디코더를 포함하는 수신기.
  24. 제 22 항 또는 제 23 항에 있어서,
    다중 고정 코드북 인덱스 및 대응하는 고정 코드북 이득을 포함하는 것을 특징으로 하는 다중 채널 선형 예측 분석 합성 음성 디코더를 포함하는 수신기.
  25. 다중 채널 선형 예측 분석 합성 음성 인코딩 방법에 있어서,
    음성 프레임의 다중 채널 선형 예측 코딩 분석 단계, 및
    상기 음성 프레임의 각 서브프레임에 대해 아래의 단계들: 즉
    채널간 및 채널 내부 지연을 모두 철저하게 탐색하는 단계;
    장기간 예측기 이득을 벡터 양자화하는 단계;
    결정된 적응 코드북 여기를 감산하는 단계;
    고정 코드북을 철저하게 탐색하는 단계;
    고정 코드북 이득을 벡터 양자화하는 단계;
    장기간 예측기를 갱신하는 단계를 실행하는 단계를 포함하는 것을 특징으로 하는 다중 채널 선형 예측 분석 합성 음성 인코딩 방법.
  26. 다중 채널 선형 예측 분석 합성 음성 인코딩 방법에 있어서,
    음성 프레임의 다중 채널 선형 예측 코딩 분석 단계, 및
    상기 음성 프레임의 각 서브프레임에 대해 아래의 단계들: 즉
    채널간 및 채널 내부 지연을 모두 추정하는 단계;
    추정치 근처의 채널간 및 채널내 지연 후보를 모두 결정하는 단계;
    지연 후보를 저장하는 단계;
    저장된 채널간 및 채널내 지연 후보를 철저하게 탐색하는 단계;
    장기간 예측기 이득을 벡터 양자화하는 단계;
    결정된 적응 코드북 여기를 감산하는 단계;
    고정 코드북 인덱스 후보를 결정하는 단계;
    인덱스 후보를 저장하는 단계;
    상기 저장된 인덱스 후보를 포괄적으로 탐색하는 단계;
    고정 코드북 이득을 벡터 양자화하는 단계;
    장기간 예측기를 갱신하는 단계를 실행하는 단계를 포함하는 것을 특징으로 하는 다중 채널 선형 예측 분석 합성 음성 인코딩 방법.
KR10-2001-7004041A 1998-09-30 1999-09-15 다중 채널 신호 인코딩 및 디코딩 방법 및 장치 KR100415356B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE9803321A SE519552C2 (sv) 1998-09-30 1998-09-30 Flerkanalig signalkodning och -avkodning
SE9803321-0 1998-09-30

Publications (2)

Publication Number Publication Date
KR20010099659A KR20010099659A (ko) 2001-11-09
KR100415356B1 true KR100415356B1 (ko) 2004-01-16

Family

ID=20412777

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2001-7004041A KR100415356B1 (ko) 1998-09-30 1999-09-15 다중 채널 신호 인코딩 및 디코딩 방법 및 장치

Country Status (10)

Country Link
US (1) US6393392B1 (ko)
EP (1) EP1116223B1 (ko)
JP (1) JP4743963B2 (ko)
KR (1) KR100415356B1 (ko)
CN (1) CN1132154C (ko)
AU (1) AU756829B2 (ko)
CA (1) CA2344523C (ko)
DE (1) DE69940068D1 (ko)
SE (1) SE519552C2 (ko)
WO (1) WO2000019413A1 (ko)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE519985C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
SE519981C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
SE519976C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
EP1235203B1 (en) * 2001-02-27 2009-08-12 Texas Instruments Incorporated Method for concealing erased speech frames and decoder therefor
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7299190B2 (en) 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
JP4676140B2 (ja) 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP2005202248A (ja) * 2004-01-16 2005-07-28 Fujitsu Ltd オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
EP1564650A1 (en) * 2004-02-17 2005-08-17 Deutsche Thomson-Brandt Gmbh Method and apparatus for transforming a digital audio signal and for inversely transforming a transformed digital audio signal
CN1954362B (zh) 2004-05-19 2011-02-02 松下电器产业株式会社 音频信号编码装置及音频信号解码装置
KR101183857B1 (ko) * 2004-06-21 2012-09-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 다중 채널 오디오 신호를 인코딩/디코딩하기 위한 방법 및 장치
US7475011B2 (en) * 2004-08-25 2009-01-06 Microsoft Corporation Greedy algorithm for identifying values for vocal tract resonance vectors
CN101027718A (zh) * 2004-09-28 2007-08-29 松下电器产业株式会社 可扩展性编码装置以及可扩展性编码方法
RU2007111717A (ru) * 2004-09-30 2008-10-10 Мацусита Электрик Индастриал Ко., Лтд. (Jp) Устройство масштабируемого кодирования, устройство масштабируемого декодирования и его способ
US20090028240A1 (en) * 2005-01-11 2009-01-29 Haibin Huang Encoder, Decoder, Method for Encoding/Decoding, Computer Readable Media and Computer Program Elements
JP4887282B2 (ja) * 2005-02-10 2012-02-29 パナソニック株式会社 音声符号化におけるパルス割当方法
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
ATE521143T1 (de) * 2005-02-23 2011-09-15 Ericsson Telefon Ab L M Adaptive bitzuweisung für die mehrkanal- audiokodierung
US8000967B2 (en) * 2005-03-09 2011-08-16 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity code excited linear prediction encoding
RU2007139784A (ru) * 2005-04-28 2009-05-10 Мацусита Электрик Индастриал Ко., Лтд. (Jp) Устройство кодирования звука и способ кодирования звука
KR101259203B1 (ko) * 2005-04-28 2013-04-29 파나소닉 주식회사 음성 부호화 장치와 음성 부호화 방법, 무선 통신 이동국 장치 및 무선 통신 기지국 장치
US7562021B2 (en) 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
FR2901433A1 (fr) * 2006-05-19 2007-11-23 France Telecom Conversion entre representations en domaines de sous-bandes pour des bancs de filtres variant dans le temps
US7797155B2 (en) * 2006-07-26 2010-09-14 Ittiam Systems (P) Ltd. System and method for measurement of perceivable quantization noise in perceptual audio coders
BRPI0809940A2 (pt) 2007-03-30 2014-10-07 Panasonic Corp Dispositivo de codificação e método de codificação
JPWO2008132826A1 (ja) * 2007-04-20 2010-07-22 パナソニック株式会社 ステレオ音声符号化装置およびステレオ音声符号化方法
JPWO2008132850A1 (ja) * 2007-04-25 2010-07-22 パナソニック株式会社 ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
US8374883B2 (en) * 2007-10-31 2013-02-12 Panasonic Corporation Encoder and decoder using inter channel prediction based on optimally determined signals
KR101086304B1 (ko) * 2009-11-30 2011-11-23 한국과학기술연구원 로봇 플랫폼에 의해 발생한 반사파 제거 신호처리 장치 및 방법
US9584235B2 (en) * 2009-12-16 2017-02-28 Nokia Technologies Oy Multi-channel audio processing
TWI634547B (zh) 2013-09-12 2018-09-01 瑞典商杜比國際公司 在包含至少四音訊聲道的多聲道音訊系統中之解碼方法、解碼裝置、編碼方法以及編碼裝置以及包含電腦可讀取的媒體之電腦程式產品
KR102636396B1 (ko) * 2015-09-25 2024-02-15 보이세지 코포레이션 스테레오 사운드 신호를 1차 및 2차 채널로 시간 영역 다운 믹싱하기 위해 좌측 및 우측 채널들간의 장기 상관 차이를 이용하는 방법 및 시스템
CN109427338B (zh) * 2017-08-23 2021-03-30 华为技术有限公司 立体声信号的编码方法和编码装置
CN115132214A (zh) * 2018-06-29 2022-09-30 华为技术有限公司 立体声信号的编码、解码方法、编码装置和解码装置
WO2020009082A1 (ja) * 2018-07-03 2020-01-09 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置及び符号化方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0016427A2 (en) * 1979-03-15 1980-10-01 CSELT Centro Studi e Laboratori Telecomunicazioni S.p.A. Multi-channel digital speech synthesizer
WO1990016136A1 (en) * 1989-06-15 1990-12-27 British Telecommunications Public Limited Company Polyphonic coding
WO1993005503A1 (en) * 1991-08-28 1993-03-18 Massachusetts Institute Of Technology Multi-channel signal separation
JPH07175499A (ja) * 1993-10-26 1995-07-14 Sony Corp 符号化装置及び方法、記録媒体、並びに復号化装置及び方法
JPH07199993A (ja) * 1993-11-23 1995-08-04 At & T Corp 音響信号の知覚符号化
US5511093A (en) * 1993-06-05 1996-04-23 Robert Bosch Gmbh Method for reducing data in a multi-channel data transmission
WO1997004621A1 (de) * 1995-07-20 1997-02-06 Robert Bosch Gmbh Verfahren zur redundanzreduktion bei der codierung von mehrkanaligen signalen und vorrichtung zur dekodierung von redundanzreduzierten, mehrkanaligen signalen

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4636799A (en) 1985-05-03 1987-01-13 United Technologies Corporation Poled domain beam scanner
US4706094A (en) 1985-05-03 1987-11-10 United Technologies Corporation Electro-optic beam scanner
GB2211965B (en) * 1987-10-31 1992-05-06 Rolls Royce Plc Data processing systems
JP3112462B2 (ja) * 1989-10-17 2000-11-27 株式会社東芝 音声符号化装置
DE69025188T2 (de) * 1990-11-05 1996-11-07 Philips Electronics Nv Digitales Übertragungssystem, Gerät zur Aufnahme und/oder Wiedergabe und Sender sowie Empfänger zur Anwendung im Übertragungssystem
WO1993010571A1 (en) 1991-11-14 1993-05-27 United Technologies Corporation Ferroelectric-scanned phased array antenna
JPH0677840A (ja) * 1992-08-28 1994-03-18 Fujitsu Ltd ベクトル量子化装置
TW272341B (ko) * 1993-07-16 1996-03-11 Sony Co Ltd
JP3435674B2 (ja) * 1994-05-06 2003-08-11 日本電信電話株式会社 信号の符号化方法と復号方法及びそれを使った符号器及び復号器
US6307962B1 (en) * 1995-09-01 2001-10-23 The University Of Rochester Document data compression system which automatically segments documents and generates compressed smart documents therefrom
US5812971A (en) 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
US5924062A (en) * 1997-07-01 1999-07-13 Nokia Mobile Phones ACLEP codec with modified autocorrelation matrix storage and search

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0016427A2 (en) * 1979-03-15 1980-10-01 CSELT Centro Studi e Laboratori Telecomunicazioni S.p.A. Multi-channel digital speech synthesizer
WO1990016136A1 (en) * 1989-06-15 1990-12-27 British Telecommunications Public Limited Company Polyphonic coding
WO1993005503A1 (en) * 1991-08-28 1993-03-18 Massachusetts Institute Of Technology Multi-channel signal separation
US5511093A (en) * 1993-06-05 1996-04-23 Robert Bosch Gmbh Method for reducing data in a multi-channel data transmission
JPH07175499A (ja) * 1993-10-26 1995-07-14 Sony Corp 符号化装置及び方法、記録媒体、並びに復号化装置及び方法
JPH07199993A (ja) * 1993-11-23 1995-08-04 At & T Corp 音響信号の知覚符号化
WO1997004621A1 (de) * 1995-07-20 1997-02-06 Robert Bosch Gmbh Verfahren zur redundanzreduktion bei der codierung von mehrkanaligen signalen und vorrichtung zur dekodierung von redundanzreduzierten, mehrkanaligen signalen

Also Published As

Publication number Publication date
EP1116223B1 (en) 2008-12-10
JP4743963B2 (ja) 2011-08-10
CN1320258A (zh) 2001-10-31
CA2344523A1 (en) 2000-04-06
JP2002526798A (ja) 2002-08-20
DE69940068D1 (de) 2009-01-22
SE9803321L (sv) 2000-03-31
EP1116223A1 (en) 2001-07-18
SE9803321D0 (sv) 1998-09-30
CN1132154C (zh) 2003-12-24
US6393392B1 (en) 2002-05-21
CA2344523C (en) 2009-12-01
WO2000019413A1 (en) 2000-04-06
AU756829B2 (en) 2003-01-23
SE519552C2 (sv) 2003-03-11
AU1192100A (en) 2000-04-17
KR20010099659A (ko) 2001-11-09

Similar Documents

Publication Publication Date Title
KR100415356B1 (ko) 다중 채널 신호 인코딩 및 디코딩 방법 및 장치
RU2765565C2 (ru) Способ и система для кодирования стереофонического звукового сигнала с использованием параметров кодирования первичного канала для кодирования вторичного канала
USRE49363E1 (en) Variable bit rate LPC filter quantizing and inverse quantizing device and method
RU2369917C2 (ru) Способы улучшения характеристик многоканальной реконструкции на основе прогнозирования
CA2524243C (en) Speech coding apparatus including enhancement layer performing long term prediction
JP2820107B2 (ja) 改良されたベクトル励起源を有するデジタル音声コーダ
EP1991986B1 (en) Methods and arrangements for audio coding
EP1755109B1 (en) Scalable encoding and decoding apparatuses and methods
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
US7283957B2 (en) Multi-channel signal encoding and decoding
EP2030199B1 (en) Linear predictive coding of an audio signal
US7263480B2 (en) Multi-channel signal encoding and decoding
JP2014500521A (ja) 低ビットレート低遅延の一般オーディオ信号の符号化
CN101842832A (zh) 编码装置和解码装置
JPH04270398A (ja) 音声符号化方式
US20040044524A1 (en) Multi-channel signal encoding and decoding
Kataoka et al. An 8-kb/s conjugate structure CELP (CS-CELP) speech coder
JPH10240299A (ja) 音声符号化及び復号装置
Harma et al. An experimental audio codec based on warped linear prediction of complex valued signals
KR100718487B1 (ko) 디지털 음성 코더들에서의 고조파 잡음 가중
JP3192051B2 (ja) 音声符号化装置
Tseng An analysis-by-synthesis linear predictive model for narrowband speech coding
Miki et al. Pitch synchronous innovation code excited linear prediction (PSI‐CELP)
JPH09120300A (ja) ベクトル量子化装置
Harborg et al. A Wideband CELP Coder at 16 kbit/s for Real Time Applications

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121224

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20131224

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20141222

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20151223

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20161227

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20171226

Year of fee payment: 15

FPAY Annual fee payment

Payment date: 20181220

Year of fee payment: 16