KR100408911B1 - 선스펙트럼제곱근을발생및인코딩하는방법및장치 - Google Patents

선스펙트럼제곱근을발생및인코딩하는방법및장치 Download PDF

Info

Publication number
KR100408911B1
KR100408911B1 KR10-1998-0700709A KR19980700709A KR100408911B1 KR 100408911 B1 KR100408911 B1 KR 100408911B1 KR 19980700709 A KR19980700709 A KR 19980700709A KR 100408911 B1 KR100408911 B1 KR 100408911B1
Authority
KR
South Korea
Prior art keywords
square root
coefficients
generating
linear
spectral
Prior art date
Application number
KR10-1998-0700709A
Other languages
English (en)
Other versions
KR19990036044A (ko
Inventor
윌리암 알 가드너
샤라스 만주나스
피터 몬타
Original Assignee
퀄컴 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퀄컴 인코포레이티드 filed Critical 퀄컴 인코포레이티드
Publication of KR19990036044A publication Critical patent/KR19990036044A/ko
Application granted granted Critical
Publication of KR100408911B1 publication Critical patent/KR100408911B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

본 발명은 선형 예측 계수 데이터의 인코딩방법을 제공한다. 본 발명은 선형 예측 계수 데이터를 선스펙트럼 코사인 데이터(103)으로 변환한다. 선스펙트럼 코사인 데이터는 두 개의 귀납적으로 정의된 벡터(104)를 발생시키는데 사용된다. 상기 귀납적으로 정의된 벡터는 감도 자기상관 값(106a 내지 106N) 및 감도 상호상관(107a 내지 107N)을 계산하는데 사용된다. 선스펙트럼 코사인 값들은 선스펙트럼 제곱근 값들의 셋을 계산하는데 사용된다.

Description

선 스펙트럼 제곱근을 발생 및 인코딩하는 방법 및 장치
디지털 기술에 의한 음성의 전송은 널리 알려져 있고, 특히 장거리 및 디지털 무선 전화의 응용에 널리 이용되고 있다. 이는, 채널을 통하여 전송되는 정보로부터 재구성된 음성 품질을 유지하면서 그 정보의 양을 최소화하는 방법에 대하여 관심을 불러 일으켰다. 연속적인 음성 신호를 단순히 샘플링하고 각각의 샘플을 양자화하여 음성을 전송하는 경우에는, 종래의 아날로그 전화와 동등한 재구성된 음성 품질을 얻기 위해서는 64 kbps 정도의 데이터 레이트가 필요하다. 그러나, 음성 분석, 후속의 적당한 코딩, 전송, 및 수신기에서의 재합성을 이용하여, 데이터 레이트를 현저하게 감소시킬 수 있다.
인간의 음성 생성 모델의 파라미터를 추출하여 음성을 압축하는 장치를 보코더(vocoder)라고 부른다. 이러한 장치는 입력 음성을 분석하여 관련 파라미터를 추출하는 인코더, 및 그 인코더로부터 전송 채널을 통하여 수신된 파라미터를 사용하여 음성을 재합성하는 디코더를 구비한다. 시변 음성 신호를 정확하게 표현하기 위하여, 상기의 모델 파라미터를 주기적으로 갱신한다. 음성은 시간의 블록이나 분석 프래임으로 분할하고, 그 파라미터를 계산하고 양자화한다. 그 양자화된 파라미터를 전송 채널을 통해 전송하고, 이들 양자화된 파라미터로부터 수신기에서 음성을 재합성한다.
음성 압축의 알고리즘에서 코드 여기 선형 예측 코딩 (CELP) 방법이 많이 사용되고 있다. 예를 들어, CELP 코딩 알고리즘은 1988년의 토마스 이 트레매인(Thomas E. Tremain) 등의 논문 "Precedings of the Mobile Satellite Conference" 에서 "4.8 kbps Code Excited Linear Predictive Coding" 에 개시되어 있다. 이러한 형태의 특별히 유용한 보코더의 예로는 발명의 명칭이 "가변율 보코더(Variable Rate Vocoder)" 인 미국 특허 등록공보 5414796 호에 기재되어 있으며, 본 발명의 양수인에 양수되었으며, 여기에 참조한다.
많은 음성 압축 알고리즘에서는, 음성 신호의 스펙트럼 크기를 모델링하기 위하여 필터를 사용한다. 이 필터의 계수가 선형 예측 기술을 이용하여 각 음성의 프래임당 계산되므로, 이 필터를 선형 예측 코딩 필터라고 부른다. 필터 계수를 결정하면 그 필터 계수를 양자화하여야 한다. LPC (Linear Predictive Coding) 필터 계수를 양자화하는 유용한 방법을 이용하여 음성 신호를 인코딩하는데 소요되는 비트율을 감소시킬 수 있다.
LPC 필터 계수의 양자화하는 한 방법으로는, 필터 계수를 선 선펙트럼 쌍(LSP; Line Spectral Pair) 파라미터로 변환하는 단계와 LSP 파라미터를 양자화하는 단계를 포함한다. 그 후, 양자화된 LSP 들을 디코더에서 음성 합성 모델에서사용하는 LPC 필터 계수로 다시 변환시킨다. 양자화는, LSP 파라미터가 LPC 파라미터보다 더 우수한 양자화 특성을 갖고 있고, 양자화된 LSP 파라미터의 오더링 (ordering) 특성이 최종으로 양자화된 LPC 필터의 안정화를 보증할 수 없기 때문에, LSP 영역에서 행한다.
특정한 LSP 파라미터 세트에 있어서, 하나의 파라미터에서의 양자화 오차가 다른 LSP 파라미터의 양자화 오차의 동일한 양에 의하여 생기는 변화보다 LPC 필터의 응답에서 더 많은 변화, 즉, 더 큰 식별력 저하를 야기할 수 있다. 이러한 양자화의 식별력의 효과는, 양자화 오차에 덜 민감한 LSP 파라미터에 더 많은 양자화 오차를 허용함으로써 최소화시킬 수 있다. 양자화 오차의 최적의 분포를 결정하기 위해서는 LSP 파라미터의 각각의 감도가 결정하여야 한다. 최적 LSP 파라미터를 인코딩하는 바람직한 방법 및 장치는, 발명의 명칭이 "선 스펙트럼 쌍 주파수의 감도 가중 벡터 양자화 (Sensitivity Weighted Vector Quantization of Line Spectral Pair Frequencies)" 인 1994년 8월 4일자로 출원된 미국 특허출원번호 제 08/286150 호에 자세히 개시되어 있으며, 이는 본 발명의 양수인에 양수되었고 여기에 참조로 기재되었다.
발명의 개요
본 발명은 신규하고 향상된 선 스펙트럼 제곱근 (LSS) 값을 이용한 LPC 파라미터의 양자화 방법 및 장치에 대한 것이다. 본 발명은 LPC 필터 계수를 LPC 계수보다 더 쉽게 양자화되면서 LSP 주파수 인코딩의 주된 장점인 양자화 오차에 대해 감도를 감소시키는 대체 데이터의 세트로 변환한다. 또한, LPC 계수로부터 LSS 값으로의 변환과 LSS 값으로부터 LPC 계수로의 변환은, 계산에 있어서 LPC 계수와 LSP 파라미터사이의 변환보다 덜 복잡하다.
본 발명은 음성 프로세싱에 관한 것이다. 특히, 본 발명은 음성 인코딩 시스템에서의 선형 예측의 LPC 계수의 인코딩 방법과 장치에 있어서 신규하고 향상된 방법과 장치를 제공하는 데에 있다.
본 발명의 특징, 목적, 및 장점은 아래에서 설명될 자세한 설명에서 첨부된 도면과 함께 설명함으로써 명백하게 될 것이다.
도 1 은 LPC 계수의 발생과 인코딩을 위한 종래기술의 장치를 나타내는 블록선도이다.
도 2 는 본 발명의 선 스펙트럼 코사인 값을 재분포시키는데 사용되는 표준화 함수의 플롯을 나타낸다.
도 3 은 본 발명의 선 스페트럼 제곱근을 인코딩하기위한 감도치를 발생시키기위한 장치를 나타내는 블록도이다.
도 4 는 선 스펙트럼 제곱근 값을 인코딩하기위한 전체적인 양자화 메커니즘을 나타내는 블록도이다.
도 1은 LPC 계수(a(1),a(2),...,a(N)) 를 결정하고 이 LPC 계수들로부터 LSP 주파수 (ω(1),ω(2),...,ω(N)) 를 발생시켜 LPC 필터 데이터를 발생 및 인코딩하는 종래의 장치를 보여준다. N 은 LPC 필터의 필터 계수의 개수이다. 음성 자기상관 (autocorrelation) 부 (1) 는 아래의 식 (1) 에 따라 음성 샘플들 (s(n))의 프레임으로부터 한 세트의 자기상관 값들 (R(0) 내지 R(N))을 계산한다.
여기서, L은 LPC 계수를 계산하고 있는 프래임의 음성 샘플의 개수이다. 이 실시예들에서, 프래임의 샘플들의 개수는 160 (L=160)이고, LPC 필터 계수의 개수는 10 (N=10)이다.
선형 예측 계수 (LPC) 계산부 (2) 는 한 세트의 자기상관 값 (R(0) 내지 R(N)) 으로부터 LPC 계수(a(1),a(2),...,a(N))를 결정한다. 이 LPC 계수는 1978년 프렌티스-홀 (Prentice-Hall) 사의 라비너 및 샤퍼 (Rabiner & Schafer)에 의한 "음성신호의 디지털 프로세싱(Digital Processing of Speech Signal)"에서 논의된 더어빈스 회귀법(Durbin's recursion) 을 이용하여 자기상관에 의하여 구할 수 있다. 그 알고리즘을 아래의 식 (2) 내지 (7) 에서 설명한다.
N 개의 LPC 계수는 1≤j≤N 에 대해 αj (10)으로 표시한다. 음성 자기상관부 (1) 와 LPC 계산부 (2) 의 동작은 잘 알려져 있다. 이 바람직한 실시예에서, 포르만트 (formant) 필터는 10 번째의 필터이며, 11 개의 자기상관 값들 (R(0) 내지R(10)) 은 자기상관부 (1) 에 의하여 계산되고, 10 개의 LPC 계수들 (a(0) 내지 s(10)) 은 LPC 계산부 (2) 에 의하여 계산된다.
LSP 연산부 (3) 는 한 세트의 LPC 계수들을 LSP 주파수 값들 (ω1내지 ωN)의 세트으로 변환된다. LSP 계산부 (3) 의 동작은 잘 알려져 있으며, 상술한 바와 같이 미국특허 제 5414796 호에 기재되어 있다. LSP 주파수를 사용하게 된 동기는 "ICASSP'84"에 실린 수웅 및 주앙 (Soong and Juang)의 "선 스펙트럼 쌍 및 음성 데이터 압축 (Line Spectral Pair and Speech Data Compression)"이라는 논문에서 기재되어 있다.
LSP 파라미터의 계산은 아래의 수식 (8) 및 (9) 에 표 1 와 함께 나타나 있다. LSP 주파수는 다음의 수식들의 0 과 π 의 사이에 존재하는 N 개의 근을 나타낸다.
여기서, n=1,2,..., N/2 에 대해 pn및 qn의 값들은 표 1 에서 귀납적으로 정의된다.
표 1 에서 a(1),,a(N) 의 값들은 LPC 분석의 결과로서 스케일링된 계수이다. LSP 주파수의 특징은, LPC 필터가 안정한 동안에는, 두 함수의 근은 교번하며, 즉, 최소근 (ω1)은 p(ω)의 최소근이고, 그 다음의 최소근 (ω2)은 q(ω)의 최소근이다. N 개의 주파수들 가운데, 기수 주파수는 p(ω)의 근이고, 우수 주파수는 q(ω)의 근이다.
식 (8) 및 (9) 를 풀어서 LSP 주파수를 구하는 것은 계산상 상당히 복잡한 연산이다. LPC 계수를 LSP 주파수로, 다시 LSP 주파수로부터 LPC 계수로의 변환시에, 계산상 부담의 주된 원인의 하나는, 광범위한 삼각함수의 사용으로부터 발생한다.
계산상의 복잡함을 감소시키는 한 방법으로는 치환하는 방법이 있다.
n>1 에 대해 cos() 의 값을, 다음의 삼각함수 법칙의 귀납적 사용을 통하여χ의 거듭제곱수의 조합으로 표현할 수 있다.
이 법칙을 확장하여 사용하면, 다음과 같이 나타낼 수 있다.
이렇게 치환을 하고 공통의χ의 거듭제곱수의 항들을 묶음으로써, 식 (8) 및 (9) 를 아래의χ의 다항식으로 간단히 할 수 있다.
그럼으로써, 값(χ1 …χN) 을 제공함으로써 LSP 주파수 (ω1…ωN) 에 의해 제공된 정보를 제공할 수 있게 되며, 이를 선 스펙트럼 코사인 (χ1 …χN) 이라고 한다. N 개의 라인 스펙트럼 코사인 값들을 결정하는 것은 식 (14) 및 (15) 의 N 개의 근을 구하는 것을 포함한다. 이러한 절차는 아무런 삼각함수적인 계산을 필요로 하지 않고, 따라서 계산의 복잡함을 크게 감소시킨다. 선 스펙트럼 코사인 값을 양자화하는 데에 있어서의 문제는, LSP 주파수와는 반대로, +1 과 -1 근처의 값을 가지는 선 스펙트럼 코사인 값이 양자화 노이즈에 상당히 민감하다는데 있다.
본 발명에서는, 선 스펙트럼 코사인 값들을 여기서 언급한 선 스펙트럼 제곱근 (LSS) 값 (y1 …yN)으로 변환함으로써 선스펙트럼 코사인 값을 양자화 노이즈에 더욱 둔감하게 한다. 선 스펙트럼 코사인 (χ1 …χN) 값을 선스펙트럼 제곱근 (y1…yN) 값으로 변환하는데 사용하는 계산은 아래의 식 (16)에 나타나 있다.
여기서 χi은 i번째 선 스펙트럼 코사인 값을 나타내고, yi 는 대응하는 i번째 선 스펙트럼 제곱근 값을 나타낸다. 선 스펙트럼 코사인으로부터 선 스펙트럼 제곱근으로의 변환은 선 스펙트럼 코사인으로부터 LSP 로의 변환, 즉, ω=arccos(x) 로의 스케일링된 (scaled) 근사로서 나타낼 수 있다. 도 2 는 d; 식 (16) 의 함수의 플롯을 나타낸 것이다.
이러한 변환으로 인하여, 선 프펙트럼 제곱근 값들은 선 스펙트럼 코사인 값보다 더욱 균일하게 양자화 노이즈에 민감하게 되고, LSP 주파수와 동일한 특성을 갖게 된다. 그러나, LPC 계수와 LSS 값 사이의 변환은 곱과 제곱근 계산을 필요로 하게 되어, LPC 계수와 LSP 주파수 사이의 변환에서 소요되는 삼각함수 계산보다 계산이 간단하게 된다.
본 발명의 개량된 실시예에서는, 선 스펙트럼 제곱근 값들은 계산된 감도 값과 여기에 설명된 코드북 선택 방법과 장치에 따라서 인코딩한다. 본 발명의 선 스펙트럼 제곱근 값을 인코딩하는 방법 및 장치는 최소한의 비트수를 사용하여 인코딩된 음성의 인식 품질을 최대화 할수 있다.
도 3 은 본 발명의 선 스펙트럼 코사인 값 (χ(1),χ(2),,χ(N))과 선 스펙트럼 제곱근 값 (S1,S2,,SN) 의 양자화 감도의 발생을 위한 장치를 나타낸 것이다. 상술한 바와 같이, N 은 LPC 필터의 필터 계수의 개수이다. 음성 자기상관부 (101) 는 상기 식 (1)에 따라 한 세트의 자기상관 값들 (R(0) 내지 R(N))을 음성 샘플의 프레임 s(n) 으로부터 계산한다.
선형 예측 계수 (LPC) 계산부 (102) 는 상기 세트의 자기상관 값들 (R(0) 내지 R(N) 로부터 LPC 계수들 (a(1) 내지 a(N)) 을 상기 식 (2) 내지 (7) 의 설명에 따라 계산한다. 선형 스펙트럼 코사인 계산부 (103) 는 상기의 수식 (14) 내지 (15)에 설명한 바와 같이 한 세트의 LPC 계수들을 선형 스펙트럼 코사인 값 (χ1내지χN)으로 변환한다. 감도 계산부 (108) 는 아래에 설명한 바와 같이, 감도 값 (S1내지 SN)을 생성한다.
P 및 Q 계산부 (104) 는 2 개의 새로운 벡터값을 다음의 식 (17) 내지 (22)을 사용하여 LPC 계수로부터 계산한다.
다항식 제산부 (105A 내지 105N) 는 다항식 제산을 행하여 Ji(1) 내지 Ji(N)으로 이루어진 한 세트의값을 제공하며, 여기서 i 는 감도 값을 계산하기 위한선 스펙트럼 코사인 값의 인덱스이다. 홀수값의 인덱스 (χ 1,χ 3,χ 5등)를 가지는 선 스펙트럼 코사인 값에 대해, 다음과 같이 긴 제산을 수행된다.
그리고 짝수값의 인덱스 (χ 2,χ 4,χ 6등) 를 가지는 선 스펙트럼 코사인 값에 대해서는, 다음의 긴 제산을 수행한다.
i 가 홀수일 때,
이러한 대칭성 때문에, N 개의 Ji값의 전체 세트를 결정하는데 상기 제산의 절반만을 행하는 것이 필요하다. 마찬가지로, i 가 짝수일때에는,
이러한 비대칭성 때문에, 상기 제산의 절반만을 행하는 것이 필요하다.
감도 자기 상관부 (106A 내지 106N) 는 다음의 식을 사용하여 세트의 자기상관 값을 계산한다.
감도 상호 상관부 (107A 내지 107N) 는 한 세트의값을 음성으로부터의자기상관 값과 상호 상관시켜, 그 결과를로 가중시킴으로써 선 스펙트럼 제곱근 값의 감도를 계산한다. 이러한 연산은 다음의 식 (28)에 따라서 행해진다.
도 4 는 이러한 선 스펙트럼 제곱근 값의 세트는 발생 및 양자화하는 본 발명의 장치를 나타낸 것이다. 본 발명은 여기서 설명한 함수를 수행하도록 프로그래밍된 디지털 신호 프로세서 (DSP) 또는 주문형 집적회로 (ASIC) 에서 구현될 수 있다. 각 부 (111, 112, 및 113) 는, 도 3 의 블록 (101, 102 및 103) 에 대해 상술한 바와 같이 연산한다. 선 스펙트럼 코사인 계산부 (113)는 선 스펙트럼 코사인 값 (χ 1,…,χ N ) 을 선 스펙트럼 제곱근 계산부 (121) 에 상기의 식 (16) 에 따라 제공하여, 선 스펙트럼 제곱근 값 ( y(1),,y(N))을 계산한다.
감도 계산부 (114) 는 선 스펙트럼 코사인 값 (χ 1,…,χ N) 을 선 스펙트럼 코사인 계산부 (113) 로부터 수신하고, LPC 값 (a(1),,a(N)) 을 LPC 계산부 (112)으로부터 수신하고, 자기상관 값 (R(0) 내지 R(N)) 을 음성 자기상관부 (111)로부터 수신한다. 감도 계산부 (114) 는, 한 세트의 감도 값(S1,…,SN) 을 도 3 의 감도 계산부 (108) 에 대해 설명한 바와 같이 발생시킨다.
일단 한 세트의 선 스펙트럼 제곱근 값 (y(1),,y(N)) 과 한 세트의 감도값(S1,…,SN) 을 계산하면, 선 스펙트럼 제곱근 값의 양자화를 시작한다. △y1,△y2,△yN(1)를 포함하는 선 스펙트럼 제곱근 값의 차의 제 1 서브벡터를 감산기 (115a) 에서 계산한다.
상기 N(1), N(2) 등의 값의 세트는 선 스펙트럼 제곱근 벡터의 서브벡터로의 분할을 정의한다. N=10 인 바람직한 실시예에서는, 선 스펙트럼 제곱근 벡터를 2 개의 성분으로 된 5 개의 서브벡터로 분할하여, N(1)=2, N(2)=4, N(3)=6, 및 N(5)=10 이 되도록 한다. V 는 서브벡터의 개수이다. 이 바람직한 실시예에서는, V=5 이다.
대체 실시예에서는, 선 스펙트럼 제곱근 벡터를 다른 차원의 다른 개수의 서브벡터로 분할할 수도 있다. 예를 들어, 제 1 서브벡터에서의 3 개의 성분, 제 2 서브벡터에서 3 개의 성분, 및 제 3 서브벡터에서 4 개의 성분으로된 3 개의 서브벡터로 분할하면 N(1)=3, N(2)=6, 및 N(3)=10 이 된다. 이 실시예에서는, V=3 이다.
선 스펙트럼 제곱근 차의 제 1 서브벡터를 감산기 (115a) 에서 계산한 후, 각 부 (116a, 117a, 118a, 및 119a) 로 양자화시킨다. 118a 는 선 스펙트럼 제곱근 차 벡터의 코드북이다. 바람직한 실시예에서는, 그러한 벡터가 64개 있다. 선 스펙트럼 제곱근 차 벡터의 코드북을 잘 알려진 벡터 양자화 트레이닝 알고리즘을 사용하여 결정할 수 있다. 인덱스 발생기 1 (117a) 는 코드북 인덱스 (m) 를 코드북 (118a) 에 제공한다. 코드북부 (118a)는 인덱스 (m) 에 응답하여 성분 (△y1(m),△yN(1)(m)) 으로 이루어진 m 번째 코드벡터를 제공한다.
오차 계산 및 극소화부 (116a)는 선 스팩트럼 제곱근 차의 본래의 서브벡터를 선 스펙트럼 제곱근 차의 m 번째 코드벡터로 양자화함으로써 생기는 근사 스펙트럼 왜곡을 나타내는 감도 가중 오차 (E(m))를 계산한다. 바람직한 실시예에서는, E(m) 을 다음의 식으로 계산한다.
은 LSS 값의 감도 가중 제곱 오차이다. 식 (31) 내지 (36) 에 나타난 감도 가중 제곱 오차를 결정하는 과정은 각 선 스팩트럼 제곱근 값에 양자화 오차를 축적하고, 그 양자화 오차를 그 LSS 값의 감도에 의하여 가중한다.
E(m) 을 코드북의 모든 코드벡터에 대하여 계산한 후, 오차 계산 및 최소화부 (116a) 는 E(m) 을 최소화시키는 인데스 m 을 선택한다. 이 값 (m)은 코드북 1 의 인덱스이며, I1로 표현된다. (△y1,△yN(1))의 양자화된 값은으로 표기되며, (△y1(I1),△yN(1)(I 1)) 과 같은 세트이다.
가산부 (119a) 에서 제 1 서브벡터의 양자화된 선 스펙트럼 제곱근 값을 다음과 같이 계산한다.
블록 (119a)에서 계산한 양자화된 선 스펙트럼 제곱근 값N(1)+1 내지N(2) 의 i 에 대한 yi를 △yN(1)+1, △yN(1)+2,△yN(2)로 이루어진 선 스펙트럼 제곱근 차를 이루는 제 2 서브벡터를 계산하는데 사용하면, 이들은 다음과 같다.
선택 인덱스 값 (I 2) 의 선택을 위한 연산은 상기의I 1을 선택하는 것과 동일한 방법으로 수행된다.
동일한 방법으로 나머지 서브벡터를 연속하여 양자화한다. 모든 서브벡터의 연산은 본질적으로 동일하며, 예를 들어, 1부터 V-1번째 서브벡터가 모두 양자화한 후에 마지막 서브벡터 (V 번째 서브벡터) 를 양자화한다. 선 스펙트럼 제곱근의 차를 이루는 V 번째 서브벡터는 감산부 (115V) 에 의하여 다음과 같이 계산된다.
E(m) 을 최소화하는 V 번째 코드북에서 코드벡터를 찾음으로써 V 번째 서브벡터를 양자화하며, E(m) 은 다음과 같은 루프에 의하여 계산된다.
일단 V 번째 서브벡터의 최적의 코드벡터를 결정하면, 그 서브벡터의 양자화된 선 스펙트럼 제곱근 값 및 양자화된 선 스펙트럼 제곱근 차를 상술한 바와 같이 계산한다. 이 과정은, 모든 서브벡터가 양자화될 때까지 연속하여 반복한다.
도 3 및 4에서는, 블록들을 지정된 기능을 행하는 구조 블록으로서 구현시키거나, 또는 블록들을 디지털 신호 프로세서 (DSP) 나 주문형 집적회로 (ASIC) 의 프로그램에서 수행되는 기능을 나타내도록 할수도 있다. 본 발명의 함수적인 설명은 과도한 실험을 하지 않고도 DSP 또는 ASIC 에서 당업자가 본 발명을 구현할 수 있도록 한다.
바람직한 실시예에 대한 상술한 설명은, 당업자가 본 발명을 실시할 수 있게 하기 위한 것이다. 당업자는 본 발명을 다양하게 변형할 수 있으며, 여기서 정의된 본질적인 원리는 창의력을 요하지 않고서도 다른 실시예에도 적용할 수 있을 것이다. 그러므로, 본 발명은 여기에 나타낸 실시예에 한정되는 것이 아니라, 여기에 개시된 원리와 신규한 특징에 부합되는 광범위한 범위로 해석되어야 한다.

Claims (20)

  1. 선형 예측 코더에서, 선형 예측 코딩 (LPC) 계수들을 발생 및 인코딩하는 장치로서,
    디지털화된 음성 샘플을 수신하고, 상기 디지털화된 음성 샘플의 LPC 계수의 세트를 선형 예측 코딩 포맷에 따라 발생시키는 LPC 발생 수단;
    상기 LPC 계수의 세트를 수신하고, 선 스펙트럼 코사인 값의 세트를 선 스펙트럼 코사인 변환 포맷에 따라 발생시키는 선형 스펙트럼 코사인 발생 수단; 및
    상기 선 스펙트럼 코사인 값의 세트를 수신하고, 선 스펙트럼 제곱근 값의 세트를 제곱근 변환 포맷에 따라 발생시키는 선 스펙트럼 코사인 발생 수단을 구비하는 것을 특징으로 하는 장치.
  2. 제 1 항에 있어서, 상기 제곱근 변환 포맷은,
    여기서χ i는 i번째 선 스펙트럼 코사인 값이고, yi는 이에 해당하는 선 스펙트럼 제곱근 값으로 하는 것을 특징으로 하는 장치.
  3. 제 1 항에 있어서, 상기 선형 스펙트럼 코사인 값의 세트 및 선형 예측 코딩(LPC) 계수의 세트를 수신하고, 몫 계수의 세트를 소정의 다항식 제산 포맷에 따라서 발생시키는 다항식 제산 수단; 및
    상기 몫 계수들의 세트, 상기 선 스펙트럼 코사인 값, 및 음성 자기상관 계수들을 수신하고, 선 스펙트럼 제곱근 감도 계수들의 세트를 가중 상호상관 계산 포맷에 따라서 계산하는 감도 상호상관 수단을 더 구비하는 것을 특징으로 하는 장치.
  4. 제 3 항에 있어서, 상기 다항식 제산 수단과 상기 감도 상호상관 장치 사이에 배치되며, 상기 몫 계수의 세트를 수신하고, 상기 몫 계수의 세트의 감도 자기상관 값의 세트를 소정의 자기상관 계산 포맷에 따라서 발생시키는 감도 자기상관 수단을 더 구비하는 것을 특징으로 하는 장치.
  5. 제 3 항에 있어서, 상기 다항식 제산 장치의 전단에 배치되며, 상기 LPC 계수들의 세트를 수신하고, 벡터들의 세트를 소정의 벡터 발생 포맷에 따라 발생시키는 벡터 계산 수단을 더 구비하는 것을 특징으로 하는 장치.
  6. 제 5 항에 있어서, 상기 벡터 계산 수단은 상기 벡터의 세트중의 2 개의 벡터 (P&Q)를
    에 따라 계산하는 것을 특징으로 하는 장치.
  7. 제 6 항에 있어서, 상기 다항식 제산 수단은 홀수의 선 스펙트럼 제곱근 값에 대하여 상기 몫 계수 (J i)를 아래의 식,
    에 따라서 제공되며, 여기서Z는 다항식의 변수,χ i는 i번째 선 스펙트럼 코사인 값, N은 필터 탭들의 개수인 것을 특징으로 하는 장치.
  8. 제 6 항에 있어서, 상기 다항식 제산 수단은 짝수의 선 스펙트럼 제곱근 값에 대하여 상기 몫 계수 (J i) 를 아래의 식,
    에 따라서 제공되며, 여기서Z는 다항식의 변수,χ i는 i번째 선 스펙트럼 코사인 값, N은 필터 탭들의 개수인 것을 특징으로 하는 장치.
  9. 제 3 항에 있어서, 상기 감도 상호상관 장치는, 상기 선 스펙트럼 제곱근 감도 값을 다음의 식,
    에 따라 제공하며, 여기서χ i는 i번째 선 스펙트럼 코사인 값,R(k)는 은성 샘플들의 세트의 k 번째 음성 자기상관 계수,R J i(k)는 상기 몫 계수의 k 번째 자기상관 계수인 것을 특징으로 하는 장치.
  10. 선형 예측 코더에서, 선형 예측 코딩 (LPC) 계수들을 발생 및 인코딩하는 서브시스템에 있어서,
    디지털화된 음성 샘플을 수신하는 입력과 LPC 계수들의 세트를 제공하는 출력을 가지는 LPC 발생기;
    상기 LPC 발생기의 출력에 접속된 입력을 가지는 선 스펙트럼 코사인 발생기; 및
    상기 선 스펙트럼 코사인 발생기의 출력과 접속된 입력, 및 출력을 가지는 선 스펙트럼 제곱근 발생기를 구비하는 것을 특징으로 하는 서브시스템.
  11. 제 10 항에 있어서, 상기 선 스펙트럼 제곱근 발생기의 출력에 접속된 입력,및 출력을 가지는 다항식 제산 계산기; 및
    상기 선 스펙트럼 제곱근 발생기의 출력에 접속된 입력, 및 출력을 가지는 감도 상호상관 계산기를 더 구비하는 것을 특징으로 하는 서브시스템.
  12. 제 11 항에 있어서, 상기 다항식 제산 계산기와 상기 감도 상호상관 계산기의 사이에 배치되며, 상기 선 스펙트럼 제곱근 발생기의 출력에 접속된 입력, 및 상기 감도 상호상관 계산기의 입력에 접속된 출력을 가지는 감도 자기상관 계산기를 더 구비하는 것을 특징으로 하는 서브시스템.
  13. 선형 예측 코더에서, 선형 예측 코딩(LPC) 계수들을 발생 및 인코딩하는 방법으로서,
    선형 예측 코딩 포맷에 따라 상기 디지털 음성 샘플의 LPC 계수들의 세트를 발생시키는 단계;
    선 스펙트럼 코사인 변환 포맷에 따라, 선 스펙트럼 코사인 값에 따라 선 스펙트럼 코사인 값의 세트를 발생시키는 단계; 및
    제곱근 변환 포맷에 따라 선 스펙트럼 제곱근 값의 세트를 발생시키는 단계를 구비하는 것을 특징으로 하는 방법.
  14. 제 13 항에 있어서, 선 스펙트럼 제곱근 값의 세트를 발생시키는 상기의 단계에서 상기 제곱근은,
    이며, 여기서χ i는 i번째 선 스펙트럼 코사인 값이고, yi는 대응하는 i 번째 선 스펙트럼 제곱근 값으로 하는 것을 특징으로 하는 방법.
  15. 제 13 항에 있어서,
    소정의 다항식 제산 포맷에 따라 몫 계수들의 세트를 발생시키는 단계; 및
    가중 상호상관 계산 포맷에 따라 선 스펙트럼 제곱근 감도 계수들의 세트를 계산하는 단계를 더 구비하는 것을 특징으로 하는 방법.
  16. 제 15 항에 있어서, 소정의 자기상관 계산 포맷에 따라서 몫 계수들의 상기 세트의 감도 자기상관 값들의 세트를 발생시키는 단계를 더 구비하는 것을 특징으로 하는 방법.
  17. 제 15 항에 있어서, 소정의 벡터 발생 포맷에 따라 벡터들의 세트를 발생시키는 단계를 더 구비하는 것을 특징으로 하는 방법.
  18. 제 17 항에 있어서,
    벡터들의 세트를 발생시키는 단계는, 다음과 같은 단계,
    를 가지는 것을 특징으로 하는 방법.
  19. 제 18 항에 있어서, 홀수의 선 스펙트럼 제곱근 값에 대하여 상기 몫 계수(J i)의 세트를 발생시키는 상기의 단계는, 다음과 같은 다항식,
    제산을 행하는 단계를 구비하며, 여기서Z는 다항식의 변수,χ i는 i번째 선 스펙트럼 코사인 값, N은 필터 탭들의 개수인 것을 특징으로 하는 방법.
  20. 제 18 항에 있어서, 짝수의 선 스펙트럼 제곱근 값에 대하여 상기 몫 계수(J i)의 세트를 발생시키는 상기의 단계는, 다음과 같은 다항식,
    제산을 행하는 단계를 구비하며, 여기서Z는 다항식의 변수,χ i는 i번째 선스펙트럼 코사인 값, N은 필터 탭들의 개수인 것을 특징으로 하는 방법.
KR10-1998-0700709A 1995-08-01 1996-08-01 선스펙트럼제곱근을발생및인코딩하는방법및장치 KR100408911B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/509,848 US5754733A (en) 1995-08-01 1995-08-01 Method and apparatus for generating and encoding line spectral square roots
US08/509,848 1995-08-01
US8/509,848 1995-08-01

Publications (2)

Publication Number Publication Date
KR19990036044A KR19990036044A (ko) 1999-05-25
KR100408911B1 true KR100408911B1 (ko) 2004-04-03

Family

ID=24028330

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-1998-0700709A KR100408911B1 (ko) 1995-08-01 1996-08-01 선스펙트럼제곱근을발생및인코딩하는방법및장치

Country Status (21)

Country Link
US (1) US5754733A (ko)
EP (1) EP0842509B1 (ko)
JP (2) JP3343125B2 (ko)
KR (1) KR100408911B1 (ko)
CN (1) CN1147833C (ko)
AR (1) AR000436A1 (ko)
AT (1) ATE218740T1 (ko)
BR (1) BR9609841B1 (ko)
CA (1) CA2228172A1 (ko)
DE (1) DE69621620T2 (ko)
DK (1) DK0842509T3 (ko)
ES (1) ES2176478T3 (ko)
FI (1) FI980207A (ko)
IL (2) IL118977A (ko)
MX (1) MX9800851A (ko)
MY (1) MY112330A (ko)
PT (1) PT842509E (ko)
RU (1) RU98103512A (ko)
TW (1) TW410273B (ko)
WO (1) WO1997005602A1 (ko)
ZA (1) ZA966401B (ko)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0821505A1 (en) * 1996-07-25 1998-01-28 Hewlett-Packard Company Apparatus providing connectivity between devices attached to different interfaces of the apparatus
FI973873A (fi) * 1997-10-02 1999-04-03 Nokia Mobile Phones Ltd Puhekoodaus
JPH11296904A (ja) 1998-04-03 1999-10-29 Toshiba Corp 情報記録媒体およびこれに用いられる樹脂基板の製造方法
US7003454B2 (en) * 2001-05-16 2006-02-21 Nokia Corporation Method and system for line spectral frequency vector quantization in speech codec
US8352248B2 (en) * 2003-01-03 2013-01-08 Marvell International Ltd. Speech compression method and apparatus
US7272557B2 (en) * 2003-05-01 2007-09-18 Microsoft Corporation Method and apparatus for quantizing model parameters
US8920343B2 (en) 2006-03-23 2014-12-30 Michael Edward Sabatino Apparatus for acquiring and processing of physiological auditory signals
ATE518224T1 (de) 2008-01-04 2011-08-15 Dolby Int Ab Audiokodierer und -dekodierer
PL3779975T3 (pl) 2010-04-13 2023-12-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder audio i powiązane sposoby przetwarzania wielokanałowych sygnałów audio stereo z wykorzystaniem zmiennego kierunku predykcji
KR101747917B1 (ko) * 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
JP5625126B2 (ja) * 2011-02-14 2014-11-12 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
EP2676264B1 (en) 2011-02-14 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder estimating background noise during active phases
US9609370B2 (en) 2011-05-31 2017-03-28 Alcatel Lucent Video delivery modification based on network availability
US9071954B2 (en) 2011-05-31 2015-06-30 Alcatel Lucent Wireless optimized content delivery network
US20140358529A1 (en) * 2013-05-29 2014-12-04 Tencent Technology (Shenzhen) Company Limited Systems, Devices and Methods for Processing Speech Signals
EP2824661A1 (en) 2013-07-11 2015-01-14 Thomson Licensing Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals
JP6422813B2 (ja) * 2015-04-13 2018-11-14 日本電信電話株式会社 符号化装置、復号装置、これらの方法及びプログラム
JP6668496B2 (ja) * 2015-12-01 2020-03-18 ヨン キム,ベ 生理活性物質複合体、その製造方法及びそれを含有する化粧料組成物

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5012518A (en) * 1989-07-26 1991-04-30 Itt Corporation Low-bit-rate speech coder using LPC data reduction processing
US4975956A (en) * 1989-07-26 1990-12-04 Itt Corporation Low-bit-rate speech coder using LPC data reduction processing
CA2635914A1 (en) * 1991-06-11 1992-12-23 Qualcomm Incorporated Error masking in a variable rate vocoder

Also Published As

Publication number Publication date
DK0842509T3 (da) 2002-10-07
IL123119A0 (en) 1998-09-24
MX9800851A (es) 1998-04-30
MY112330A (en) 2001-05-31
IL118977A0 (en) 1996-10-31
AU702506B2 (en) 1999-02-25
JPH11510274A (ja) 1999-09-07
KR19990036044A (ko) 1999-05-25
FI980207A (fi) 1998-03-31
PT842509E (pt) 2002-10-31
TW410273B (en) 2000-11-01
CN1195414A (zh) 1998-10-07
BR9609841B1 (pt) 2009-01-13
BR9609841A (pt) 1999-03-09
ES2176478T3 (es) 2002-12-01
US5754733A (en) 1998-05-19
EP0842509A1 (en) 1998-05-20
AU6688596A (en) 1997-02-26
ZA966401B (en) 1998-03-09
ATE218740T1 (de) 2002-06-15
JP2003050600A (ja) 2003-02-21
RU98103512A (ru) 2000-01-27
WO1997005602A1 (en) 1997-02-13
FI980207A0 (fi) 1998-01-29
CN1147833C (zh) 2004-04-28
AR000436A1 (es) 1997-06-18
EP0842509B1 (en) 2002-06-05
DE69621620T2 (de) 2003-02-06
IL118977A (en) 2000-01-31
CA2228172A1 (en) 1997-02-13
JP3343125B2 (ja) 2002-11-11
DE69621620D1 (de) 2002-07-11

Similar Documents

Publication Publication Date Title
KR100408911B1 (ko) 선스펙트럼제곱근을발생및인코딩하는방법및장치
EP0443548B1 (en) Speech coder
US5517595A (en) Decomposition in noise and periodic signal waveforms in waveform interpolation
US6122608A (en) Method for switched-predictive quantization
EP0504627B1 (en) Speech parameter coding method and apparatus
US5339384A (en) Code-excited linear predictive coding with low delay for speech or audio signals
EP0337636B1 (en) Harmonic speech coding arrangement
US5485581A (en) Speech coding method and system
EP2254110B1 (en) Stereo signal encoding device, stereo signal decoding device and methods for them
EP0501421B1 (en) Speech coding system
EP0477960A2 (en) Linear prediction speech coding with high-frequency preemphasis
US6889185B1 (en) Quantization of linear prediction coefficients using perceptual weighting
US5526464A (en) Reducing search complexity for code-excited linear prediction (CELP) coding
US4720865A (en) Multi-pulse type vocoder
US5839102A (en) Speech coding parameter sequence reconstruction by sequence classification and interpolation
EP0899720B1 (en) Quantization of linear prediction coefficients
US5704001A (en) Sensitivity weighted vector quantization of line spectral pair frequencies
EP0483882A2 (en) Speech parameter encoding method capable of transmitting a spectrum parameter with a reduced number of bits
JP3194930B2 (ja) 音声符号化装置
JP3252285B2 (ja) 音声帯域信号符号化方法
AU702506C (en) Method and apparatus for generating and encoding line spectral square roots
EP0755047B1 (en) Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
EP0910064B1 (en) Speech parameter coding apparatus
JPH0844396A (ja) 音声符号化装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121030

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20131030

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20141030

Year of fee payment: 12

LAPS Lapse due to unpaid annual fee