KR20050007574A - 오디오 코딩 - Google Patents

오디오 코딩 Download PDF

Info

Publication number
KR20050007574A
KR20050007574A KR10-2004-7019512A KR20047019512A KR20050007574A KR 20050007574 A KR20050007574 A KR 20050007574A KR 20047019512 A KR20047019512 A KR 20047019512A KR 20050007574 A KR20050007574 A KR 20050007574A
Authority
KR
South Korea
Prior art keywords
order
audio signal
audio
impulse response
filter
Prior art date
Application number
KR10-2004-7019512A
Other languages
English (en)
Other versions
KR101038446B1 (ko
Inventor
덴브린커알버투스씨.
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20050007574A publication Critical patent/KR20050007574A/ko
Application granted granted Critical
Publication of KR101038446B1 publication Critical patent/KR101038446B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Cereal-Derived Products (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Complex Calculations (AREA)

Abstract

오디오 신호(x(n))을 엔코딩하는 방법이 개시된다. 상기 방법은 K 차수의 무한 임펄스 응답(IIR) 필터 형태 특성들((0...k-1)을 제공하기 위해 주파수 민감성 파라미터(()에 따르고 오디오 신호(x(n))에 대한 추정을 제공하기 위해 민감성 파라미터(()와 선형적으로 결합될 수 있는 오디오 신호를 모델링하는 단계를 포함하며, IIR 필터 형태 모델은 최소 위상 필터의 요건들을 만족시킨다. K 차수의 세트의 특성들((0....k-1)은 최소 위상 필터의 요건들을 만족시키는 유한 임펄스 응답(FIR) 필터 형태 특성들과 호환가능한 K+1 차수의 세트의 특성들(c0...k)을 제공하기 위해 민감성 파라미터(()의 함수로서 변환된다. K+1 차수의 세트의 특성들(c0...k)은 K 차수의 세트의 특성들을 제공하기 위해 정규화된다. 엔코딩된 오디오 스트림(50)은 K 차수의 정규화된 세트의 특성들(d1...k)의 표현들(LAR, LSF들)을 포함하기 위해 발생된다.

Description

오디오 코딩{Audio coding}
선형 예측 코딩(LPC)은 종종 오디오 및 음성 코딩에 이용된다. 도 1(a)는 엔코더 기반 종래 LPC에 대해 K 차수의 유한 임펄스 응답(FIR) 형태 예측 필터(10) 구성 요소를 도시한다. 필터는 신호의 이전 견본들의 K 선형 조합으로부터 발생된 주어진 신호 x(n)에 대한 추정을 제공한다. 도 1(a)의 예에서, x(n) 및 r(n)에 관련된 필터 F(z)의 전달 함수는 하기처럼 표현될 수 있다.
예측 계수들은 어떤 기준, 일반적으로 가중 평균-제곱 오류(weighted mean-squared error)에 기초하여 계산된다.
추정은 잔류 신호 r(n)을 제공하기 위해 신호 x(n)으로부터 차례로 감해진다. 이 잔류 신호 및 예측 필터에 대한 정보 즉, 예측 계수들는 일반적으로 더 효율적인 형식으로 저장되거나 전송된다. 예컨대, 예측 계수들는 반사 계수들의 세트 상에 맵될수 있고, 이것들은 차례로 로그 영역 비율들(LAR)에 맵된다. 대안으로, 예측 계수들는 신호 x(n)을 나타내는 비트스트림에서 잔류 신호에 따라 엔코딩되기 이전에 선 스펙트럼 주파수들(LSF)에 직접 맵될 수 있다(양자화 민감도들 관점에서, LAR 및 LSF 도메인들은 바람직하다). 역코사인 반사 계수들(ASRCs)과 같은 대안 표현들 및 선 스펙트럼 쌍들(LSPs)은 또한 이용될 수 있다.
도 1(b)의 디코더에서 잔류 신호 및 예측 필터에 대한 정보는 원래 신호 x(n)를 재건(또는 접근하는데) 사용된다. 도 1로부터 유사 메커니즘들은 엔코더 및 디코더에서 나타나는 것이 명확하다. 하지만 디코더의 안정성 특히, 필터 F(z)가 일반적으로 최소-위상 필터인 신호 x(n)에 대한 비트스트림을 엔코딩하기 전에 양자화 동안 신호로 소개될 수 있는 왜곡에 관련되는 것을 주목하는 것이 중요하다. 그것은 전달 함수 F(z)의 모든 근들(극들 및 영들)이 유닛 서클 안에 존재해야 한다고 말하는 것이고 이것은 일반적으로 FIR 필터들에 대해 확신시키는 것이 가능하다.
위에서 기술된 형태의 FIR 필터를 사용하는 것은 엔코더가 가청 과정(auditory process)의 사이코 아쿠아스틱(psycho acoustic) 모델을 고려하여 조정되어 작동하도록 할 수 없다.
"와프된 선형 예측들에 대한 대안들(Alternatives for Warped Linear Predictors)" (V. Voitishchuk et al., pp710-713, Proc. ProRISC Workshop CSSP, Veldhoven (NL), 29-30 Nov.2001) 및 "IIR 필터들을 사용하는 선형 예측 구조들의 안정성(Stability of Linear Predictive Structures using IIR filters)" (A.C.den Brinker, pp.317-320, Proc. ProRisc Workshop CSSP, Voldhoven (NL), 29-30 Nov.2001)에서, 유한 임펄스 응답(IIR) 형태 필터들로서 더 흥미 있고 더 정상적으로 생각되는 주파수들의 범위들 쪽으로 인코더/디코더를 조정하도록 이용될 수 있는 라구에르 및 카우츠 형태의 필터들은 도 2(a) 및 2(b)로 도시되는 형식으로 표현될 수 있다.
x(n) 및 r(n)와 관련된 도 2(a)의 필터에 대한 전체 전달 함수는
여기서 세트 Hk는 지속, 임시, 선형 및 선형-독립 필터들에 속한 전달 함수이다.
라구에르 필터들로서 세트 Hk즉,
으로 선택되는 것으로 도시되고, 여기서 λ∈(-1, 1)이고, 전체 전달 함수 F는 최소-위상 IIR 필터가 될 수 있다.
여기에서 λ이 실수이고 0 보다 더 크면, 모델링은 사람의 귀가 더욱 민감한 더 낮은 주파수들로 이동하고, 반면에 λ이 0 보다 더 작으면, 모델링은 더 낮은 주파수들 쪽으로 이동한다. 여기에서 λ= 0은 도 1의 종래 경우에 대응한다.
하지만, 예측 계수들과 관련된 다항식의 근들이 홀로 최소 위상 필터를 제공할 수 없는 것으로 도 2에서 도시된 형태의 필터들에 대해 예측 계수들을 전송하는 문제들이 존재하고, 이것은 이러한 파라미터들의 양자화동안 소개된 소음 또는 왜곡 때문에 디코더에서 불안정을 야기할 수 있다.
본 발명은 오디오 신호를 코딩 및 디코딩하는 것에 관한 것이다.
도 1(a) 및 1(b)는 종래의 선형 예측 구조에 대해 엔코더 및 디코더를 도시한 도면.
도 2(a) 및 2(b)는 대안 선형 예측 기법에 대해 엔코더 및 디코더를 도시한 도면.
도 3(a) 및 3(b)는 본 발명의 제 1 실시예에 따른 선형 예측 기법에 대해 개별적으로 엔코더 및 디코더를 도시한 도면.
도 4는 본 발명의 제 2 실시예에 따라 엔코더를 도시한 도면.
도 5는 본 발명의 제 1 및 제 2 실시예를 포함하는 일반적 엔코더를 도시한 도면.
도 6은 오디오 코더 및 오디오 플레이어를 포함하는 시스템을 도시한 도면.
본 발명에 따라 제 1 항에서 청구된 오디오 신호를 엔코딩하는 방법이 제공된다.
본 발명의 바람직한 실시예들은 라구에르 형태 예측 계수들이 FIR 시스템의 예측 계수들에 맵되도록 허용하는 종래 LPC 기법의 확대를 제공한다. 따라서, 종래 선형 예측 코딩 기술들은 라구에르 예측 계수들을 양자화 및 전송 또는 기억하도록 사용될 수 있다.
본 발명의 실시예들은 첨부된 도면들을 참조하여 지금 기술될 것이다.
도 2의 스키마(schema)를 사용하여 나타낸 라구에르(Laguerre) 필터 형태에 대하여, 전체 전달 함수 F(z)는 수학식 2 및 3의 조합으로 표현될 수 있다.
계수들은 예컨대 보이티쉬추크 등 및 덴 브리커(Voitishchuk et al and den Briker)에 의해 개시된 데이터-입력 윈도잉 방법을 사용하여 최적화 된다면 전달 함수 F(z)는 최소-위상 시스템이 될 수 있는 것으로 공지된다.
본 발명의 제 1 실시예에서, 위의 필터는 K 차수의 최소-위상 FIR 필터로 맵되어, 이런 라구에르 형태 예측 계수들은 표준 기술들에 의해 전송되고 양자화된다.
본 발명의 제 1 실시예에 따라 엔코더(14)를 도시하는 도 3(a)를 지금 언급해보자. 엔코더(14)는 보이티쉬추크 등 및 덴 브리커에 의해 게시된 형태의 라구에르 필터 구성 요소(16)를 포함한다. 구성 요소(16)은 필터의 주파수 민감도를 결정하는 λ의 값을 제공받는다. 이 값은 도 3(b)의 디코더(22)에 의해 나중에 사용되는 엔코더에 의해 발생되는 비트스트림(50)에서 인코더될 수 있거나, 그렇지 않다면 λ의 값은 디코더(22)에 의해 공지된다.
신호 x(n)에 대해, 구성 요소는 예측 계수들의 세트를 제공한다. λ값과 함께 이러한 것들은 합성기 구성 요소(18)에 공급되고, 도 2(a)에 도시된 형태로 신호의 추정을 발생한다.
하지만, 바람직한 실시예에서 예측 계수들은 변환 구성 요소(20)에 변환된다. 구성 요소(20)에 의해 실행된 변환은 하기처럼 상위 삼각 토에플리츠 매트릭스(upper Triangular Toeplitz matrix)의 형태를 사용하여 도시된다.
는 라구에르 예측 계수들이고, p =. K + 1 계수들 c는를 가진 K번-차수 FIR 필터의 전달 함수와 관련될 수 있다. 예측 계수들는 최소-위상 필터 F(z)를 소유한다면 그 때는 최소-위상 FIR 필터를 나타낸다.
도 3(b)의 디코더(22)에서, 역 변환은 순 변환 구성 요소에 의해 발생된 계수들 c0...ck상의 구성 요소(24)에 의해 실행된다. 구성 요소(24)에 의해 엔코더(14)에 이용된 동일 λ으로 공급되고, 구성 요소(24)에 의해 실행된 변환은 하기처럼 상위 삼각 토에플리츠의 형태를 사용하여 도시된다.
이 역 변환으로부터, 다음을 알 수 있다;
계수들(c0...ck)은 선형 제약(linear constraint) 즉,
에 붙인다.는 다음과 같이 c1...ck로 부터 재구성될 수 있으므로 파라미터 c0는 리던던트로서 고려될 수 있다.
엔코더(14)로 되돌아가면, 제 1 실시예에서 계수들(c0...ck)은 정규화 구성 요소(26)에 전달된다. 구성 요소는 한 세트의 계수들(d0...dk)을 제공하기 위해 c0의 값으로 계수들(c0...ck)을 나눈다. 하지만, 계수들(c0...ck)이 최소 위상 필터를 나타내면, d0의 값은 항상 1이고 계수들(d1...dk)은 전달 함수를 갖는 K 차수의 최소 위상 FIR 필터의 예측 계수들에 대응함을 알게된다. 구성 요소(26)에 실행된 정규화는 단지 일정 인자로 모든 계수들을 나누는 것이기 때문에, 변환 구성 요소(20) 및 정규화 구성 요소(26)의 차수는 변할 수 있다. 즉, 우리는 먼저 정규화를 한다음 변환을 할 수 있다. 엔코더에서 이것은 나중 변화들에 대응하여 먼저 c0의 계산을 요구한다. 또한, 역 변환 및 비-정규화의 순서의 동일 변화가 후술되는 디코더에서 이루어 질 수 있음을 알게된다.
정규화 구성 요소(26)는 계수들이 바람직하게 LAR 또는 LSF 계수들에 변환되고 인덱싱이 다르고 신호들이 역방향이 되는 것을 제외하고 도 1(a)의계수들의 양자화에 대응하는 형식으로 양자화되는 구성 요소(28)에 계수들(d0...dk)을 통과한다. 구성 요소(28)은 또한 잔류 신호 r(n)을 수신하고, 적절한 것으로 이것을 양자화하며 신호 x(n)을 나타내는 비트스트림(50)을 발생하는 멀티플렉싱 유닛(30)에 값들을 통과시킨다. 따라서, 이 비트스트림은 종래의 FIR 필터 파라미터들을 포함하는 비트스트림을 구비한 동일 형식으로 전송될 수 있는 것을 알 수 있다. 대안으로, 비트스트림은 어떤 점에서 λ의 값을 포함하도록 경미하게 수정될 수 있지만, 그것의 형식은 변할 필요가 없다.
이제 도 3(b)의 디코더(22)로 돌아가면 비트스트림(50)은 디-멀티플렉싱 유닛(32)에 의해 디코딩된다. 추출된 파라미터들은 잔류 신호 r(n) 및 종래 형식의 정규화된 FIR 형태 필터 파라미터들을 발생하는 비-양자화 구성 요소에 제공된다.
비-양자화 구성요소(36)는 c0의 값을 결정하기 위해 가장 먼저 이용된다. 수학식 5로부터
임을 알 수 있고, 인코더에서 사용된 값 λ이 제공될 때 구성 요소(36)는 c0에 대한 값을 결정하기 위해 다음 수학식을 사용할 수 있다.
수학식 7에 대해 비-정규화 구성요소가 단지 파라미터들(d1...dk)로 제공되는 동안, d0=1로 추정될 수 있는 것으로 알아야 한다. 잔존하는 계수들(c1...ck)로 결정되는 c0는 다음과 같이 구성 요소(36)에 의해 결정된다.
계수들(c0...ck)은 위에서 기술된 역 변환 유닛(24)에 의해 제공되고, 이것은 추정된 신호를 발생하기 위해 도 2(a)에서 도시된 디코더 합성기 구성 요소 18'에 의해 차례로 사용될 수 있는 라구에르 필터 예측 계수들의 세트를 제공한다. 이것은 최종 디코딩된 신호 x(n)를 제공하기 위해 비-양자화 구성 요소(34)에 의해 제공된 잔류 신호 r(n)으로 결합된다.
바람직한 실시예의 변동들이 가능한 것으로 보여진다. 예컨대, 도 4에서 본 발명의 제 2 실시예에서 적응된 인코더(14')는 "PARCOR 음성 분석-합성에서 스펙트럼 평활화 기술(Spectral smoothing technique in PARCOR speech analysis-synthesis)"(Y. Tohkura and F. Itakura and S. Hashimoto, IEEE Trans. Acoust. Speech Signal Process. vol. 26, pp. 587-596, 1978)에서 개시된 피크 확장 또는 대역폭 확장/확대/넓힘(extension/expansion/widenig)을 제공한다. 선형 예측 코딩에서 스펙트럼 피크 확장은 기하급수적-감소 시퀀스에 의해 임펄스 응답(예측 계수들)을 곱함으로써 행해진다.
본 발명에 관련하여, 피크 확장은 변환 구성 요소(20)와 제 1 실시예의 적응된 정규화 구성요소(26')간의 피크 확장 구성 요소(38)를 삽입함으로써 구현된다.
원래 라구에르 필터 형태 예측 계수들를 계수들(c0...ck)로 변환한 후, 인코더는 피크 확장이 요구되면 결정한다. 그렇다면, 계수들(c0...ck)이 피크 확장 구성 요소(38)로 통과된다. 이것은 계수들(c0...ck)을 예컨대 다음 형식의 피크 확장 구성 요소와 곱한다.
, 여기에서 이고
이전처럼, 선형 제약이 계수들에 적용될 필요가 있다. 따라서, 계수들의 피크 확장 세트로 공급된다면, 구성 요소(38 또는 26')은 하기의 식처럼 곱셈기 cf를 결정한다.
계수들은 이러한 곱셈기에 의해 분할되어 발생된 계수들는 수학식 5의 제약들을 이행한다. 정규화 구성 요소(26')는 그 때 정규화된 형태FIR 계수들(d1...k)을 이전처럼 제공하기 위해 계수들()을 정규화한다.
피크 확장은 피크 확장 신호를 판독하는 디코더 내에서 결국 합성될 신호에 영향을 미치고, 그와 같은 상이한 잔류 신호 r(n)은 피크 확장이 적용된다면 엔코더 14' 내에서 계산되어져야 한다.
따라서, 제 2 실시예에서 도 2(b)에서 처럼 비-양자화 구성 요소는 계수들 (d1...k)이 디코더내에서 발생될 것처럼 정확하게 계수들(d1...k)을 제공하기 위해 구성 요소(28)에 의해 발생된 양자화 신호로 제공받는다. 이러한 것들은 피크 확장 신호에 대해 디코더 내에서 발생된 것처럼 예측 계수들의 세트를 발생하기 위해 도 2(b)의 구성 요소들에 다시 대응하여 개별적으로 구성 요소들(36 및 24)에 의해 역으로 변환되고 차례로 비-정규화된다. 합성기(18)는 그 때 피크 확장이 적용되거나 적용되지 않고 잔류 신호 r(n)을 발생하기 위해 신호 x(n)로부터 이것을 감산하는 것에 따라 예측 계수또는중 하나를 사용한다.
계수들(또는) 역 변환 구성 요소(24)로 직접 제공된다면, 동일 예측 계수들위에서 처럼 제공되지 않을 것이다. 그럼에도 불구하고, 이것은 인코더 내의 구성 요소들(34 및 36)에 대한 요구를 제거하고 엔코더가 계산적으로 제한되는 것이 받아들여질 수 있다.
그와 같은 피크 확장에 대한 비트스트림이 디코딩될 때, 발생하는 예측 계수들이 스펙트럼의 피크 확장 라구에르 예측 필터의 계수들이고, 피크 확장은 주파수 와프 도메인(frequency warped domain)에서 실행된다. 이것은 엔코더가 사이코-어쿠어스틱(psycho-acoustically) 대응 스케일 상에서 피크 확장을 실제로 실행하고 또한 예컨대 피크 확장 함수가 사이코-어쿠어스틱 함수에 기초하여 선택되는 것을 허용한다.
제 2 실시예의 변경들에서, 피크 확장은 잔류 신호의 발생에 대해 요구된 적절한 변화들을 구비한 계수들 c0...k보다 오히려 계수들 d1...k로 적용될 수 있다.
위에서 설명된 것처럼, 엔코더 내에서 사용된 예측 계수들은 원래 오디오 신호의 최종 추정을 발생하기 위해 디코더 내에서 이용된 것과 같을 것이다. 도 5는 제 1 및 제 2 실시예들의 엔코더들을 포함하는 엔코더 14"의 더욱 일반적인 형태를 도시한다. 이 엔코더에서, 변환, 정규화, 양자화 및 선택적인 피크 확장의 단계들은 구성 요소들(20, 26', 28 및 38/38')을 개별적으로 이전 처럼 실행될 수 있다(도 5에서, 구성 요소들(38/38')은 피크 확장이 38 이전 또는 38' 정규화 후에 발생할 수 있는 것을 지시한다).
하지만 제 2 실시예에서 잔류 신호를 발생하기 위해 엔코더에 의해 이용된 예측 계수들은 디코더에 이용된 것과 정확히 동일한 것으로 하는 것처럼 엔코더의 일반적인 형식에서, 양자화 신호는 비-양자화, 비-정규화 및 역 변환 구성 요소(24, 26, 24)를 개별적으로 전달하게 한다.
본 발명은 첫 2개의 실시예들에 있어서 신호 x(n)으로부터 이것을 덜고 신호를 합성함으로써 잔류 신호의 발생에 제한되지 않는다. 본 발명의 이러한 면은 디코더에서 이용되어질 예측 계수들 및 신호의 모델 측면과 신호 그 자체 x(n)간의 차의 지시 b를 발생하기 위해 주파수 민감성 파라미터 λ를 이상적으로 사용하는 인코더 18"를 포함함으로써 더 일반적으로 생각될 수 있다.
디코더에서(도시 않됨), 대응하는 구성 요소는 원래 오디오 신호의 최종 추정을 발생하기 위해 이 지시 b와 예측 계수들 및 주파수 민감성 파라미터 λ를 결합한다.
도 6은 도 3 (a) 또한 4로 도시되는 것으로 엔코더 14, 14'를 포함하는 오디오 코더(1) 및 도 3(b)에서 도시되는 디코더(22)를 포함하는 오디오 플레이어(3)를 포함하는 본 발명에 따른 오디오 시스템을 도시한다. 엔코딩된 오디오 스트림(50)은 통신 채널(2)을 통해 오디오 코더로부터 오디오 플레이어까지 공급되고, 통신 채널(2)은 무선 접속, 데이터 버스 또는 기억 매체가 될 수 있다. 통신 채널(2)이 기억 매체인 경우에서, 기억 매체는 시스템에서 고정될 수 있거나 소니 코포레이션으로 부터의 메모리 스틱TM(Memory StickTM)과 같은 고정 상태 기억 장치, 이동가능 디스크가 될 수 있다. 통신 채널(2)은 오디오 시스템의 일부가 될 수 있지만, 종종 외부 오디오 시스템이 될 것이다.
위에서-언급된 실시예들은 본 발명을 오히려 본 발명을 제한하고, 당업자들은 첨부된 청구범위들의 범위를 벗어나지 않고 많은 대안의 실시예들을 설계할 것이다. 청구범위들에서, 괄호들 사이의 위치하는 어떤 참조 신호들은 청구범위를 제한하도록 해석되지 않는다. 본 발명은 여러 구별된 요소들을 포함하는 하드웨어 및 적절히 프로그램된 컴퓨터에 의해 구현될 수 있다. 여러 수단을 열거하는 장치 청구 범위에서 이러한 여러 수단은 하드웨어의 하나 및 동일 아이템에 의해 구현될 수 있다. 어떤 측정들이 상호 다르게 의존하는 청구 범위들로 인용되는 단순한 사실은 이러한 측정들의 조합이 이점으로 사용될 수 없도록 지시하지 않는다.

Claims (14)

  1. 오디오 신호를 엔코딩하는 방법에 있어서,
    상기 오디오 신호에 대한 추정을 제공하기 위해 주파수 민감성 파라미터(frequency sensitizing parameter)와 선형적으로 결합될 수 있는 K 차수의 제 1 세트의 무한 임펄스 응답 필터 형태 특성들을 제공하기 위해 상기 주파수 민감성 파라미터에 따라 상기 오디오 신호를 모델링하는 단계;
    유한 임펄스 응답 필터 형태 특성들과 호환가능한 제 2 세트의 특성들을 제공하기 위해 상기 민감성 파라미터의 함수로서 상기 제 1 세트 또는 제 3 세트의 특성들을 변환하는 단계;
    상기 제 3 세트의 특성들을 제공하기 위해 상기 제 1 세트 또는 상기 제 2 세트의 특성들을 정규화하는 단계; 및
    K 차수의 특성들의 변환되고 정규화된 세트의 표현들을 포함하는 엔코딩된 오디오 스트림을 발생하는 단계를 포함하는, 오디오 신호 엔코딩 방법.
  2. 제 1 항에 있어서,
    상기 IIR 필터 형태 필터 특성들은 최소 위상 필터의 요건들을 만족시키고 상기 FIR 필터 형태 특성들은 최소 위상 필터의 요건들을 만족시키는, 오디오 신호 엔코딩 방법.
  3. 제 1 항에 있어서,
    잔류 신호를 제공하기 위해 상기 오디오 신호로부터 상기 추정을 감산하는 단계를 더 포함하고, 상기 발생하는 단계는 상기 엔코딩된 오디오 스트림에 상기 잔류 신호를 포함시키는 단계를 포함하는, 오디오 신호 엔코딩 방법.
  4. 제 1 항에 있어서,
    상기 모델링 단계는 상기 오디오 신호를,
    인 전달 함수를 가지는 라구에르 형(Laguerre type) 필터로 모델링하는 단계를 포함하는, 오디오 신호 엔코딩 방법.
  5. 제 4 항에 있어서,
    상기 변환 단계는,
    인 매트릭스 변환에 따라 상기 라구에르 필터 계수들을 변환하는 단계를 포함하고,인, 오디오 신호 엔코딩 방법.
  6. 제 5 항에 있어서,
    상기 정규화 단계는 상기 제 2 세트의 특성들 중 하나에 의해 K+1 차수의 상기 제 2 세트의 특성들을 분할하는 단계, 및 K 차수의 상기 제 3 세트의 특성들로서 상기 특성들의 분할된 세트의 나머지를 제공하는 단계를 포함하는, 오디오 신호 엔코딩 방법.
  7. 제 1 항에 있어서,
    상기 발생하는 단계는 상기 비트스트림에 상기 주파수 민감성 파라미터를 포함시키는, 오디오 신호 엔코딩 방법.
  8. 제 1 항에 있어서,
    상기 K+1 차수의 특성들의 세트를 피크 확대하는 단계를 더 포함하는, 오디오 신호 엔코딩 방법.
  9. 오디오 신호를 디코딩하는 방법에 있어서,
    유한 임펄스 응답 필터 형태 특성들과 호환가능한 K 차수의 제 1 세트의 특성들을 제공하기 위해 오디오 신호의 표현들을 포함하는 엔코딩된 오디오 스트림을 판독하는 단계;
    비-정규화 특성을 제공하기 위해 상기 K 차수의 제 1 세트의 특성들과 주파수 민감성 파라미터를 결합하는 단계;
    제 2 세트의 특성들을 제공하기 위해 상기 비-정규화 특성의 함수로서 제 1 또는 제 3 무한 임펄스 응답 필터 형태 세트의 특성들을 비-정규화하는 단계;
    제 3 세트의 특성들을 제공하기 위해 상기 민감성 파라미터의 함수로서 상기 제 1 또는 제 2 세트 특성들을 변환하는 단계; 및
    상기 주파수 민감성 파라미터의 선형 결합으로서의 상기 오디오 신호와 K 차수의 비-정규화되고 변환된 세트의 특성들을 합성하는 단계를 포함하는, 오디오 신호 디코딩 방법.
  10. 오디오 코더에 있어서,
    오디오 신호에 대한 추정을 제공하기 위해 주파수 민감성 파라미터와 선형적으로 결합될 수 있는 K 차수의 제 1 세트의 무한 임펄스 응답 필터 형태 특성들을 제공하기 위해 상기 주파수 민감성 파라미터에 따라 상기 오디오 신호를 모델링하는 수단;
    유한 임펄스 응답 필터 형태 특성들과 호환가능한 제 2 세트의 특성들을 제공하기 위해 상기 민감성 파라미터의 함수로서 상기 제 1 세트 또는 제 3 세트의 특성들을 변환하는 수단;
    상기 제 3 세트의 특성들을 제공하기 위해 상기 제 1 세트 또는 상기 제 2 세트의 특성들을 정규화하는 수단; 및
    K 차수의 특성들의 변환되고 정규화된 세트의 표현들을 포함하는 엔코딩된 오디오 스트림을 발생하는 수단을 포함하는, 오디오 코더.
  11. 오디오 플레이어에 있어서,
    유한 임펄스 응답 필터 형태 특성들과 호환가능한 K 차수의 제 1 세트의 특성들을 제공하기 위해 오디오 신호의 표현들을 포함하는 엔코딩된 오디오 스트림을 판독하는 수단;
    비-정규화 특성을 제공하기 위해 상기 K 차수의 제 1 세트의 특성들과 주파수 민감성 파라미터를 결합하는 수단;
    제 2 세트의 특성들을 제공하기 위해 상기 비-정규화 특성의 함수로서 제 1 또는 제 3 무한 임펄스 응답 필터 형태 세트의 특성들을 비-정규화하는 수단;
    제 3 세트의 특성들을 제공하기 위해 상기 민감성 파라미터의 함수로서 상기 제 1 세트 또는 제 2 세트의 특성들을 변환하는 수단; 및
    상기 주파수 민감성 파라미터의 선형 결합으로서의 상기 오디오 신호와 K 차수의 비-정규화되고 변환된 세트의 특성들을 합성하는 수단을 포함하는, 오디오 플레이어.
  12. 제 10 항에서 청구된 오디오 코더 및 제 11 항에서 청구된 오디오 플레이어를 포함하는, 오디오 시스템.
  13. K 차수의 세트의 특성들에 대응하는 오디오 신호의 표현들을 포함하는 오디오 스트림에 있어서,
    상기 K 차수의 세트의 특성들은 유한 임펄스 응답 필터 형태 특성들과 호환 가능한 K+1 차수의 세트의 특성들을 제공하기 위해 주파수 민감성 파라미터와 결합가능하고, 상기 K+1 차수의 세트의 특성들은 K 차수의 무한 임펄스 응답 필터 형태 세트의 특성들을 제공하기 위해 상기 민감성 파라미터의 함수로서 변환가능한, 오디오 스트림.
  14. 제 13 항에 청구된 오디오 스트림이 기억된, 오디오 매체.
KR1020047019512A 2002-05-30 2003-05-16 오디오 코딩 KR101038446B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP02077128.3 2002-05-30
EP02077128 2002-05-30
PCT/IB2003/002044 WO2003102922A1 (en) 2002-05-30 2003-05-16 Audio coding

Publications (2)

Publication Number Publication Date
KR20050007574A true KR20050007574A (ko) 2005-01-19
KR101038446B1 KR101038446B1 (ko) 2011-06-01

Family

ID=29595018

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020047019512A KR101038446B1 (ko) 2002-05-30 2003-05-16 오디오 코딩

Country Status (9)

Country Link
US (1) US20050228656A1 (ko)
EP (1) EP1514262B1 (ko)
JP (1) JP4446883B2 (ko)
KR (1) KR101038446B1 (ko)
CN (1) CN100343895C (ko)
AT (1) ATE336781T1 (ko)
AU (1) AU2003230132A1 (ko)
DE (1) DE60307634T2 (ko)
WO (1) WO2003102922A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140139601A (ko) * 2012-05-10 2014-12-05 돌비 레버러토리즈 라이쎈싱 코오포레이션 복수-스테이지 iir 필터 및 이를 사용한 데이터의 병렬화된 필터링

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080015878A (ko) * 2005-05-25 2008-02-20 코닌클리케 필립스 일렉트로닉스 엔.브이. 복수 채널 신호의 예측 엔코딩
DE102006022346B4 (de) * 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
EP2745427B1 (en) * 2012-06-18 2017-12-27 Telefonaktiebolaget LM Ericsson (publ) Prefiltering in mimo receiver
US9548056B2 (en) * 2012-12-19 2017-01-17 Dolby International Ab Signal adaptive FIR/IIR predictors for minimizing entropy
PL3462449T3 (pl) * 2014-01-24 2021-06-28 Nippon Telegraph And Telephone Corporation Urządzenie, sposób i program do analizy liniowo-predykcyjnej oraz nośnik zapisu
CN109188069B (zh) * 2018-08-29 2020-08-28 广东石油化工学院 一种用于负载开关事件检测的脉冲噪声滤除方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4493048A (en) * 1982-02-26 1985-01-08 Carnegie-Mellon University Systolic array apparatuses for matrix computations
US7423983B1 (en) * 1999-09-20 2008-09-09 Broadcom Corporation Voice and data exchange over a packet based network
JP2001134295A (ja) * 1999-08-23 2001-05-18 Sony Corp 符号化装置および符号化方法、記録装置および記録方法、送信装置および送信方法、復号化装置および符号化方法、再生装置および再生方法、並びに記録媒体
US6931373B1 (en) * 2001-02-13 2005-08-16 Hughes Electronics Corporation Prototype waveform phase modeling for a frequency domain interpolative speech codec system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140139601A (ko) * 2012-05-10 2014-12-05 돌비 레버러토리즈 라이쎈싱 코오포레이션 복수-스테이지 iir 필터 및 이를 사용한 데이터의 병렬화된 필터링
US9324335B2 (en) 2012-05-10 2016-04-26 Dolby Laboratories Licensing Corporation Multistage IIR filter and parallelized filtering of data with same

Also Published As

Publication number Publication date
ATE336781T1 (de) 2006-09-15
AU2003230132A1 (en) 2003-12-19
DE60307634D1 (de) 2006-09-28
WO2003102922A1 (en) 2003-12-11
US20050228656A1 (en) 2005-10-13
JP2005528646A (ja) 2005-09-22
EP1514262B1 (en) 2006-08-16
KR101038446B1 (ko) 2011-06-01
CN100343895C (zh) 2007-10-17
DE60307634T2 (de) 2007-08-09
EP1514262A1 (en) 2005-03-16
CN1656537A (zh) 2005-08-17
JP4446883B2 (ja) 2010-04-07

Similar Documents

Publication Publication Date Title
EP0673014B1 (en) Acoustic signal transform coding method and decoding method
AU700205B2 (en) Improved adaptive codebook-based speech compression system
KR101373004B1 (ko) 고주파수 신호 부호화 및 복호화 장치 및 방법
RU2389085C2 (ru) Способы и устройства для введения низкочастотных предыскажений в ходе сжатия звука на основе acelp/tcx
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
CA2140329C (en) Decomposition in noise and periodic signal waveforms in waveform interpolation
JP5350393B2 (ja) オーディオコーディングシステム、オーディオデコーダ、オーディオエンコーディング方法及びオーディオデコーディング方法
RU2483364C2 (ru) Схема аудиокодирования/декодирования с переключением байпас
JP3317470B2 (ja) 音響信号符号化方法、音響信号復号化方法
MX2011000362A (es) Esquema de codificacion/decodificacion de audio a baja velocidad binaria y conmutadores en cascada.
JPH03211599A (ja) 4.8kbpsの情報伝送速度を有する音声符号化/復号化器
JPH10282999A (ja) オーディオ信号を符号化する方法及び装置、並びに符号化されたオーディオ信号を復号する方法及び装置
KR20030046468A (ko) 부호화 음향 신호를 지각적으로 개선 강화시키는 방법 및장치
US6778953B1 (en) Method and apparatus for representing masked thresholds in a perceptual audio coder
CN117940994A (zh) 基于长期预测和/或谐波后置滤波生成预测频谱的处理器
EP0926659B1 (en) Speech encoding and decoding method
JPH0341500A (ja) 低遅延低ビツトレート音声コーダ
JP3087814B2 (ja) 音響信号変換符号化装置および復号化装置
KR101038446B1 (ko) 오디오 코딩
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP4281131B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JPH05500573A (ja) 低減されたスペクトルひずみを有するポストフィルタを備えたデジタル音声デコーダ
JP3138574B2 (ja) 線形予測係数補間装置
JP4618823B2 (ja) 信号符号化装置及び方法
JPH05232995A (ja) 一般化された合成による分析音声符号化方法と装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140519

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150526

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160517

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170517

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20180517

Year of fee payment: 8