KR20070051878A - 스케일러블 부호화 장치 및 스케일러블 부호화 방법 - Google Patents

스케일러블 부호화 장치 및 스케일러블 부호화 방법 Download PDF

Info

Publication number
KR20070051878A
KR20070051878A KR1020077005226A KR20077005226A KR20070051878A KR 20070051878 A KR20070051878 A KR 20070051878A KR 1020077005226 A KR1020077005226 A KR 1020077005226A KR 20077005226 A KR20077005226 A KR 20077005226A KR 20070051878 A KR20070051878 A KR 20070051878A
Authority
KR
South Korea
Prior art keywords
lsp
autocorrelation coefficient
narrowband
order
autocorrelation
Prior art date
Application number
KR1020077005226A
Other languages
English (en)
Inventor
히로유키 에하라
도시유키 모리이
Original Assignee
마츠시타 덴끼 산교 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마츠시타 덴끼 산교 가부시키가이샤 filed Critical 마츠시타 덴끼 산교 가부시키가이샤
Publication of KR20070051878A publication Critical patent/KR20070051878A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

협대역 LSP로부터 광대역 LSP로의 변환 성능을 높여, 고성능의 대역 스케일러블 LSP 부호화를 실현할 수 있는 스케일러블 부호화 장치. 이 장치에서는, 자기 상관 계수 변환부(301)가, Mn차의 협대역 LSP를 Mn차의 자기 상관 계수로 변환하고, 역 시간창(Lag Window)부(302)가, 자기상관계수에 걸려 있는 시간창과 역특성의 창(역 시간창)을 걸고, 외삽부(303)가 역 시간창이 걸려 있는 자기상관계수에 대해서 외삽 처리를 행하여 자기상관계수의 차수를 (Mn+Mi)차로 확장하고, 업 샘플부(304)가, (Mn+Mi)차의 자기상관계수에 대해서 시간 영역에서의 업 샘플 처리와 등가인 자기 상관 영역에서의 업 샘플 처리를 행하여 Mw차의 자기상관계수를 구하고, 시간창부(305)가, Mw차의 자기상관계수에 대해서 시간창을 걸고, LSP 변환부(306)가, 시간창이 걸려 있는 자기상관계수를 LSP로 변환한다.

Description

스케일러블 부호화 장치 및 스케일러블 부호화 방법{SCALABLE ENCODING DEVICE AND SCALABLE ENCODING METHOD}
본 발명은, 이동 통신 시스템이나 인터넷 프로토콜을 이용한 패킷 통신 시스템 등에 있어서, 음성 통신을 행할 때에 이용되는 스케일러블 부호화(scalable coding) 장치 및 스케일러블 부호화 방법에 관한 것이다.
VoIP(Voice over IP) 등과 같이 패킷을 이용한 음성 통신에 있어서는, 음성 데이터의 부호화에 프레임 소실 내성이 있는 부호화 방식이 요망되고 있다. 인터넷 통신에 대표되는 패킷 통신에 있어서는, 폭주 등에 의해 전송로 상에서 패킷이 파기되는 일이 있기 때문이다.
프레임 소실 내성을 높이는 방법의 하나로서, 전송 정보의 일부가 소실되더라도 나머지 일부로부터 복호 처리를 행하도록 함으로써 프레임 소실의 영향을 가능한 한 줄이는 방법이 있다(예를 들면, 특허 문헌 1 참조). 특허 문헌 1에는, 스케일러블 부호화를 이용하여 코어 레이어의 부호화 정보와 확장 레이어의 부호화 정보를 다른 패킷에 채워서 전송하는 방법이 개시되어 있다. 또, 패킷 통신의 애 플리케이션으로서, 굵은 회선(브로드밴드 회선)과 가는 회선(전송 레이트가 낮은 회선)이 혼재하는 네트워크를 이용한 멀티 캐스트 통신(1 대 복수의 통신)을 들 수 있다. 이러한 불균일한 네트워크 상에서 다지점간 통신을 행하는 경우에도, 각각의 네트워크에 대응하여 부호화 정보가 계층화되어 있으면 네트워크마다 다른 부호화 정보를 보낼 필요가 없기 때문에, 스케일러블 부호화가 효과적이다.
예를 들면, 음성 신호의 고능률적인 부호화를 가능하게 하는 CELP 방식을 베이스로 한, 신호 대역폭으로(주파수축 방향으로) 스케일러빌리티(scalability)를 가지는 대역 스케일러블 부호화 기술로서 특허 문헌 2에 개시되어 있는 기술이 있다. 특허 문헌 2에서는, 음성 신호의 스펙트럼 포락 정보를 LSP(선 스펙트럼 쌍) 파라미터로 표현하는 CELP 방식의 예가 표시되고 있다. 여기서는, 협대역 음성용의 부호화부(코어 레이어)에서 얻어진 양자화 LSP 파라미터(협대역 부호화 LSP)를 이하의 식(1)을 이용해 광대역 음성 부호화용의 LSP 파라미터로 변환하고, 변환한 LSP 파라미터를 광대역 음성용 부호화부(확장 레이어)에서 이용함으로써, 대역 스케일러블 LSP 부호화 방법을 실현하고 있다.
Figure 112007018079815-PCT00001
또한, fw(i)는 광대역 신호에 있어서의 i차 LSP 파라미터, fn(i)는 협대역 신호에 있어서의 i차 LSP 파라미터, Pn은 협대역 신호의 LSP 분석 차수, Pw는 광대역 신호의 LSP 분석 차수를 각각 나타내고 있다.
특허 문헌 2에 있어서는, 협대역 신호로서 샘플링 주파수가 8kHz, 광대역 신 호로서 샘플링 주파수가 16kHz, 광대역 LSP의 분석 차수가 협대역 LSP의 분석 차수의 2배인 경우를 예로 들어 설명하고 있기 때문에, 협대역 LSP로부터 광대역 LSP로의 변환이 식(1)로 표시되는 바와 같은 단순한 식으로 행해질 수 있다. 그런데, 광대역 LSP의 저차측(低次側)의 Pn차의 LSP 파라미터가 존재하는 위치는, 고차측(高次側)의 (Pw-Pn)차를 포함한 광대역 신호 전체에 대해서 결정되기 때문에, 그 위치는 반드시 협대역 LSP의 Pn차의 LSP 파라미터에 대응하는 것은 아니다. 이 때문에, 식(1)로 표시되는 변환에서는 높은 변환 효율(협대역 LSP로부터 광대역 LSP를 예측한다고 본 경우, 예측 정밀도라고 말할 수도 있음)은 얻어지지 않는다. 따라서, 식(1)에 기초하여 설계된 광대역 LSP 부호화기에는, 부호화 성능을 개선할 여지가 남아 있다.
그래서, 예를 들면, 비특허 문헌 1에는, 식(1)의 i차의 협대역 LSP 파라미터에 곱하는 변환 계수를 0.5로 하는 대신에, 이하의 식(2)으로 나타내는 바와 같이, 변환계수의 최적화 알고리즘을 이용하여 차수마다 최적 변환 계수 β(i)를 구하는 방법이 개시되어 있다.
Figure 112007018079815-PCT00002
다만, fw_n(i)는 제 n 프레임에 있어서의 i차의 광대역 양자화 LSP 파라미터, α(i)×L(i)는 예측 오차 신호를 양자화한 벡터의 i차의 요소(α(i)는 i차 보정 계수), L(i)는 LSP 예측 잔차 벡터, β(i)는 예측 광대역 LSP에 대한 보정 계수, fn_n(i)는 제 n 프레임에 있어서의 협대역 LSP 파라미터이다. 이러한 변환 계 수의 최적화에 의해, 특허 문헌 2와 동일한 구성의 LSP 부호화기이면서, 보다 높은 부호화 성능을 실현하고 있다.
여기서, 예를 들면, 비특허 문헌 2에 의하면, LSP 파라미터의 분석 차수는, 주파수 범위가 3~4 kHz인 협대역의 음성 신호에 대해서는 8~10차 정도가 적당하고, 또, 주파수 범위가 5~8 kHz인 광대역의 음성 신호에 대해서는 12~16차 정도가 적당하다고 되어 있다.
(특허 문헌 1) 일본 공개 특허 공보 제 2003-241799 호
(특허 문헌 2) 일본 등록 특허 공보 제 3134817 호
(비특허 문헌 1) K.Koishida et al, "Enhancing MPEG-4 CELP by jointly optimized inter/intra-frame LSP predictors", IEEE Speech Coding Workshop 2000, Proceeding, pp.90-92, 2000
(비특허 문헌 2) 사이토 슈조·나카타 카즈오 공저, 「음성 정보 처리의 기초」, 오무사, 1981년 11월 30일, p.91
발명이 해결하고자 하는 과제
그렇지만, 광대역 LSP의 저차측(低次側)인 Pn차 LSP 파라미터의 위치는 광대역 신호 전체에 대해서 결정되기 때문에, 예를 들면, 비특허 문헌 2와 같이, 협대역 LSP의 분석 차수를 10차, 광대역 LSP의 분석 차수를 16차로 했을 경우, 광대역 LSP 16차중 저차측(협대역 LSP 파라미터의 1~10차가 존재하는 대역에 상당)에 존재 하는 LSP 파라미터의 개수는 8개 이하인 수가 많다. 따라서, 식(2)를 이용한 변환에서는, 광대역 LSP 파라미터(16차)의 저차측에 있어서 협대역 LSP 파라미터(10차)와의 대응관계가 1 대 1이 아니게 되어 버린다. 즉, 광대역 LSP의 10차의 성분이 4kHz를 초과하는 대역에 존재할 경우에 있어서도, 이 광대역 LSP의 10차의 성분을, 4kHz 이하의 대역에 존재하는 협대역 LSP의 10차의 성분과 대응화시키는 것이 되어 버려, 그 결과, 광대역 LSP와 협대역 LSP와의 대응화가 부적절하게 된다. 따라서, 식(2)에 기초하여 설계된 광대역 LSP 부호화기에 있어서도, 여전히 부호화 성능을 개선할 여지가 남아 있다.
본 발명의 목적은, 협대역 LSP로부터 광대역 LSP로의 변환 성능(협대역 LSP로부터 광대역 LSP를 예측할 때의 예측 정밀도)을 높여, 고성능의 대역 스케일러블 LSP 부호화를 실현할 수 있는 스케일러블 부호화 장치 및 스케일러블 부호화 방법을 제공하는 것이다.
과제를 해결하기 위한 수단
본 발명의 스케일러블 부호화 장치는, 협대역 LSP 파라미터로부터 광대역 LSP 파라미터를 얻는 스케일러블 부호화 장치로서, 협대역 LSP 파라미터를 자기 상관 계수로 변환하는 제1 변환 수단과, 상기 자기 상관 계수를 업 샘플링하는 업 샘플링 수단과, 업 샘플링된 상기 자기 상관 계수를 LSP 파라미터로 변환하는 제2 변환 수단과, 상기 LSP 파라미터의 주파수 대역을 광대역으로 변환하고 광대역 LSP 파라미터를 얻는 제3 변환 수단을 구비하는 구성을 취한다.
발명의 효과
본 발명에 의하면, 협대역 LSP로부터 광대역 LSP로의 변환 성능을 높여, 고성능의 대역 스케일러블 LSP 부호화를 실현할 수 있다.
도 1은 본 발명의 한 실시형태에 따른 스케일러블 부호화 장치의 주요한 구성을 나타내는 블록도,
도 2는 상기 실시형태에 따른 광대역 LSP 부호화부의 주요한 구성을 나타내는 블록도,
도 3은 상기 실시형태에 따른 변환부의 주요한 구성을 나타내는 블록도,
도 4는 상기 실시형태에 따른 스케일러블 부호화 장치의 동작 흐름도,
도 5는 Mn차의 자기상관계수를 확장하여 얻어지는 (Mn+Mi)차의 자기상관계수를 나타내는 그래프,
도 6은 도 5의 각 결과에 대해서 업 샘플 처리를 행하여 얻어지는 자기상관계수로부터 구한 LPC를 나타내는 그래프,
도 7은 LSP의 시뮬레이션 결과(Fs:8 kHz 협대역 음성 신호를 12차로 분석한 LSP),
도 8은 LSP의 시뮬레이션 결과(협대역 음성 신호를 12차로 분석한 LSP를 도 1에 나타내는 스케일러블 부호화 장치에 의해 Fs:16 kHz의 18차 LSP로 변환한 경우),
도 9는 LSP의 시뮬레이션 결과(광대역 음성 신호를 18차로 분석한 LSP)이다.
발명을 실시하기 위한 최선 형태
이하, 본 발명의 실시형태에 대해서, 첨부 도면을 참조하여 상세히 설명한다.
도 1은 본 발명의 한 실시형태에 따른 스케일러블 부호화 장치의 주요한 구성을 나타내는 블록도이다.
본 실시형태에 따른 스케일러블 부호화 장치는, 다운 샘플부(101), LSP 분석부(협대역용)(102), 협대역 LSP 부호화부(103), 음원 부호화부(협대역용) (104), 위상 보정부(105), LSP 분석부(광대역용) (106), 광대역 LSP 부호화부(107), 음원 부호화부(광대역용)(108), 업 샘플부(109), 가산기(110), 및 다중화부(111) 를 구비한다.
다운 샘플부(101)는, 입력 음성 신호에 대해 다운 샘플링 처리를 행하고 협대역 신호를 LSP 분석부(협대역용)(102) 및 음원 부호화부 (협대역용)(104)에 출력한다. 또한, 입력 음성 신호는, 디지털화된 신호이며, 필요에 따라서 HPF나 배경 잡음 억압 처리 등의 전(前)처리가 가해져 있다.
LSP 분석부(협대역용)(102)는, 다운 샘플부(101)로부터 입력된 협대역 신호에 대해서 LSP(선 스펙트럼 쌍) 파라미터를 산출하여, 협대역 LSP 부호화부(103)에 출력한다. 보다 구체적으로는, LSP 분석부 (협대역용)(102)는, 협대역 신호로부터 자기상관계수를 구하고, 이 자기상관계수를 LPC(선형 예측 계수)로 변환한 후, LPC를 LSP로 변환함으로써 협대역 LSP 파라미터를 산출한다(자기상관계수로부터 LPC, LPC로부터 LSP로의 구체적인 변환 절차에 대해서는, 예를 들면, ITU-T 권고 G.729(3.2.3절 LP to LSP conversion)에 개시되어 있음). 이 때, LSP 분석부(협대역용)(102)는, 자기상관계수의 중지 오차를 경감시키기 위해서, 자기상관계수에 시간창(Lag Window)이라고 불리는 창을 건다(시간창에 대해서는, 예를 들면, 나카미조 다카요시, 「현대 제어 시리즈 신호 해석과 시스템 분류」, 코로나사, p.36, 2.5.2장 참조).
협대역 LSP 부호화부(103)는, LSP 분석부(협대역용)(102)로부터 입력된 협대역 LSP 파라미터를 부호화하여 얻어지는 협대역의 양자화 LSP 파라미터를 광대역 LSP 부호화부(107) 및 음원 부호화부(협대역용)(104)에 출력한다. 또, 협대역 LSP 부호화부(103)는 부호화 데이터를 다중화부(111)에 출력한다.
음원 부호화부(협대역용)(104)는, 협대역 LSP 부호화부(103)로부터 입력된 협대역의 양자화 LSP 파라미터를 선형 예측 계수로 변환하고, 얻어진 선형 예측 계수를 이용하여 선형 예측 합성 필터를 구축한다. 음원 부호화부(104)는, 이 선형 예측 합성 필터를 이용하여 합성되는 합성 신호와 별도로 다운 샘플부(101)로부터 입력된 협대역 입력 신호 사이의 청각적 보정 오차를 구하고, 이 청각적 보정 오차를 최소로 하는 음원 파라미터의 부호화를 행한다. 얻어진 부호화 정보는 다중화부(111)에 출력된다. 또, 음원 부호화부(104)는, 협대역 복호 음성 신호를 생성하여 업 샘플부(109)에 출력한다.
또한 협대역 LSP 부호화부(103) 또는 음원 부호화부(협대역용)(104)에 대해서는, LSP 파라미터를 이용하는 CELP형 음성 부호화 장치에서 일반적으로 이용되고 있는 회로를 적용할 수 있으며, 예를 들면, 특허 문헌 2 또는 ITU-T권고 G.729 등에 기재되어 있는 기술을 이용할 수 있다.
업 샘플부(109)는, 음원 부호화부(104)에서 합성된 협대역 복호 음성 신호가 입력되고, 그 협대역 복호 음성 신호에 업 샘플 처리를 가하여 가산기(110)에 출력한다.
가산기(110)는, 위상 보정부(105)로부터 위상 보정 후의 입력 신호, 업 샘플부(109)로부터 업 샘플된 협대역 복호 음성 신호가 각각 입력되어, 양 신호의 차분 신호를 구하여 음원 부호화부(광대역용)(108)에 출력한다.
위상 보정부(105)는, 다운 샘플부(101) 및 업 샘플부(109)에서 생기는 위상의 어긋남(지연)을 보정하기 위한 것이다. 위상 보정부(105)는, 다운 샘플 처리 및 업 샘플 처리가 직선위상 저역통과 필터와 샘플 솎아내기/영(0)점 삽입에 의해 행해지는 경우는, 직선위상 저역통과 필터에 의해 생기는 지연 분량만큼 입력 신호를 지연시키는 처리를 행하여, LSP 분석부(광대역용)(106) 및 가산기(110)에 출력한다.
LSP 분석부(광대역용)(106)는, 위상 보정부(105)로부터 출력되는 광대역 신호에 대해서 LSP 분석을 행하고, 얻어진 광대역 LSP 파라미터를 광대역 LSP 부호화부(107)에 출력한다. 보다 구체적으로는, LSP 분석부(광대역용)(106)는, 광대역 신호로부터 자기상관계수를 구하고, 이 자기상관계수를 LPC로 변환한 후, LPC를 LSP로 변환함으로써 광대역 LSP 파라미터를 산출한다. 이 때, LSP 분석부(광대역용)(106)는, LSP 분석부(협대역용)(102)과 마찬가지로, 자기상관계수의 중지 오차를 경감시키기 위해서, 자기상관계수에 시간창(Lag Window)을 곱한다.
광대역 LSP 부호화부(107)는, 도 2에 나타내는 바와 같이, 변환부(201) 및 양자화부(202)를 구비한다. 변환부(201)는, 협대역 LSP 부호화부(103)로부터 입력되는 협대역의 양자화 LSP를 변환해서 예측 광대역 LSP를 구하여, 양자화부(202)에 출력한다. 변환부(201)의 자세한 구성 및 동작에 대해서는 후술한다. 양자화부(202)는, LSP 분석부(광대역용)(106)로부터 입력된 광대역 LSP와 LSP 변환부로부터 입력된 예측 광대역 LSP의 오차 신호를, 벡터 양자화 등의 수법을 이용하여 부호화하고, 얻어지는 광대역의 양자화 LSP를 음원 부호화부 (광대역용)(108)에 출력함과 동시에, 얻어지는 부호 정보를 다중화부(111)에 출력한다.
음원 부호화부(광대역용)(108)는, 광대역 LSP 부호화부(107)로부터 입력된, 양자화된 광대역 LSP 파라미터를 선형 예측 계수로 변환하고, 얻어진 선형 예측 계수를 이용하여 선형 예측 합성 필터를 구축한다. 그리고, 이 선형 예측 합성 필터를 이용하여 합성되는 합성 신호와 위상 보정된 입력 신호 사이의 청각적 보정 오차를 구하고, 이 청각적 보정 오차를 최소로 하는 음원 파라미터를 결정한다. 보다 상세하게는, 음원 부호화부(108)에는, 광대역 입력 신호와 업 샘플 후의 협대역 복호 신호의 오차 신호가 별도로 가산기(110)로부터 입력되며, 이 오차 신호와 음원 부호화부(108)에서 생성되는 복호 신호 사이의 오차가 구해져, 이 오차에 청각적 보정이 가해진 것이 최소가 되도록 음원 파라미터가 결정된다. 구해진 음원 파 라미터의 부호 정보는, 다중화부(111)에 출력된다. 이 음원 부호화에 대해서는, 예를 들면, K. Koishida et al, "A 16-kbit/s bandwidth scalable audio coder based on the G.729 standard, IEEE Proc. ICASSP 2000, pp.1149-1152, 2000에 개시되어 있다.
다중화부(111)에는, 협대역 LSP 부호화부(103)로부터는 협대역 LSP의 부호화 정보가, 음원 부호화부(협대역용)(104)로부터는 협대역 신호의 음원 부호화 정보가, 광대역 LSP 부호화부(107)로부터는 광대역 LSP의 부호화 정보가, 그리고, 음원 부호화부(광대역용)(108)로부터는 광대역 신호의 음원 부호화 정보가 입력된다. 다중화부(111)는, 이러한 정보를 다중화하여 비트 스트림으로서 전송로에 송출한다. 또한 비트 스트림은, 전송로의 사양에 따라, 전송 채널 프레임에 프레임화되거나 패킷화되거나 한다. 또, 전송로 오류에 대한 내성을 높이기 위해서, 오류 보호, 오류 검출 부호의 부가, 인터리브 처리 등을 적용하거나 한다.
도 3은 상기 변환부(201)의 주요한 구성을 나타내는 블록도이다. 변환부(201)는, 자기상관계수 변환부(301), 역(逆)시간창 부(302), 외삽(外揷)부(303), 업 샘플부(304), 시간창 부(305), LSP 변환부(306), 곱셈부(307) 및 변환계수 테이블(308)을 구비한다.
자기상관계수 변환부(301)는, Mn차의 협대역 LSP를 Mn차의 자기상관계수로 변환하여 역시간창부(302)에 출력한다. 보다 구체적으로는, 자기상관계수 변환부(301)는, 협대역 LSP 부호화부(103)로부터 입력되는 협대역의 양자화 LSP 파라미터를 LPC(선형 예측 계수)로 변환한 후, LPC를 자기상관계수로 변환한다.
LSP로부터 LPC로의 변환에 대해서는, 예를 들면, P.Kabal and R. P.Ramachandran, "The Computation of Line Spectral Frequencies Using Chevyshev Polynomials", IEEE Trans. on Acoustics, Speech, and Signal Processing, vol. ASSP-34, no. 6, December 1986에 개시되어 있다(이 문헌에 있어서의 LSF는 본 실시형태에 있어서의 LSP와 동일한 의미이다). 또, 예를 들면, ITU-T 권고 G.729(3.2.6절 LSP to LP conversion)에도 LSP로부터 LPC로의 구체적인 변환 절차가 개시되어 있다.
또, LPC로부터 자기상관계수로의 변환에 대해서는, 레빈슨 더빈(Levinson-Durbin)의 알고리즘(예를 들면, 나카미조 다카요시, 「현대 제어 시리즈 신호 해석과 시스템 분류」, 코로나사, p.71, 3.6.3장 참조)를 이용하여 행한다. 구체적으로는 식(3)에 따라 행한다.
Figure 112007018079815-PCT00003
역(逆)시간창부(302)는, 입력된 자기상관계수에 대해, 그 자기상관계수에 걸려 있는 시간창과 역특성의 시간창(역 시간창)을 건다. 상기와 같이, LSP 분석부(협대역용)(102)에서는, 자기상관계수로부터 LPC로의 변환시에 자기상관계수에 시간창이 걸리기 때문에, 자기상관계수 변환부(301)로부터 역시간창부(302)에 입력되는 자기상관계수에는 아직도 시간창이 걸려 있는 채이다. 그래서, 역시간창 부(302)는, 후술하는 외삽 처리의 정밀도를 높이기 위해서, 입력된 자기상관계수에 대해 역시간창을 걸어, LSP 분석부(협대역용)(102)에 있어서 시간창을 걸기 전의 자기상관계수로 되돌려, 외삽부(303)에 출력한다.
협대역의 부호화 레이어에서는 Mn차를 초과하는 차수의 자기상관계수는 부호화되지 않기 때문에, Mn 차까지의 정보만으로부터 Mn차를 초과하는 차수의 자기상관계수를 구할 필요가 있다. 그래서, 외삽부(303)는, 역시간창부(302)로부터 입력되는 자기상관계수에 대해서 외삽 처리를 행하여, 자기상관계수의 차수를 확장하고, 차수 확장 후의 자기상관계수를 업 샘플부(304)에 출력한다. 즉, 외삽부(303)는 Mn차의 자기상관계수를 (Mn+Mi)차로 확장한다. 이 외삽 처리를 행하는 것은, 후술하는 업 샘플 처리에 있어서, Mn차보다 고차(高次)의 자기상관계수가 필요해 지기 때문이다. 또, 후술하는 업 샘플 처리시의 중지 오차를 저감시키기 위해서, 본 실시형태에서는, 협대역 LSP 파라미터의 분석 차수를 광대역 LSP 파라미터의 분석 차수의 1/2 이상으로 한다. 즉, (Mn+Mi)차를 Mn차의 2배 미만으로 한다. 외삽부(303)는 레빈슨 더빈의 알고리즘(식(3))에 있어서 Mn차를 초과하는 부분에서의 반사 계수를 0으로 함으로써 재귀적으로 (Mn+1)차~(Mn+Mi)차의 자기상관계수를 구한다. 식(3)에 있어서 Mn차를 초과하는 부분에서의 반사계수를 0으로 하면 식(4)가 얻어진다.
Figure 112007018079815-PCT00004
식(4)는 식(5)와 같이 전개할 수 있다. 식(5)에 나타내는 바와 같이, 반사 계수를 0으로 하여 얻어지는 자기상관계수 Rm +1은, 입력 신호 시간 파형 xt +m+1-i(i=1~m)으로부터 선형 예측에 의해 얻어지는 예측값
Figure 112007018079815-PCT00005
과 입력 신호 시간 파형xt와의 상호 상관임을 알 수 있다. 즉, 외삽부(303)에서는, 선형 예측을 이용해 자기상관계수의 외삽 처리를 행하고 있는 것이 된다. 이러한 외삽 처리를 행함으로써, 후술하는 업 샘플 처리에 의해, 안정된 LPC로 변환 가능한 자기상관계수를 얻을 수 있다.
Figure 112007018079815-PCT00006
업 샘플부(304)는, 외삽부로부터 입력되는 자기상관계수, 즉, 차수를 (Mn+Mi)차로 확장된 자기상관계수에 대해서, 시간 영역에서의 업 샘플 처리와 등가인 자기 상관 영역에서의 업 샘플 처리를 행하고, Mw차의 자기상관계수를 얻는다. 이 업 샘플 후의 자기상관계수는 시간창부(305)에 출력된다. 업 샘플 처리는 sinc 함수를 컨볼루션(convolution)하는 보간 필터(폴리페이즈 필터, FIR 필터 등)를 이용하여 행한다. 이하에서 자기상관계수의 업 샘플 처리의 구체적 절차에 대해 설명한다.
이산화(discrete)된 신호 x(nt)로부터 연속 신호 u(t)를 sinc 함수를 이용하여 보간하는 경우, 식(6)과 같이 표시된다. 따라서, u(t)의 샘플링 주파수를 2배로 업 샘플할 경우는, 식(7) 및 식(8)에 나타내는 바와 같이 된다.
Figure 112007018079815-PCT00007
Figure 112007018079815-PCT00008
Figure 112007018079815-PCT00009
식(7)은 업 샘플 후에 짝수 샘플이 되는 점을 나타내고 있으며, 업 샘플 전의 x(i)가 그대로 u(2i)가 된다.
또, 식(8)은 업 샘플 후에 홀수 샘플이 되는 점을 나타내고 있으며, x(i)에 sinc 함수를 컨볼루션함으로써 u(2i+1)가 구해진다. 이 컨볼루션 처리는, x(i)의 시간축을 반전한 것과 sinc 함수와의 적화(積和)로 표시된다. 적화처리는 x(i)의 전후의 점을 이용하여 행해지므로, 적화에 필요한 데이터수를 예를 들면 2N+1이라고 했을 경우, u(2i+1)의 점을 구하려면 x(i-N)~x(i+N)이 필요하게 된다. 따라서, 이 업 샘플 처리에 있어서는, 업 샘플 전의 데이터의 시간장(時間長)이 업 샘플 후의 데이터의 시간장보다 길 필요가 있다. 이 때문에, 본 실시형태에서는, 광대역 신호에 대한 대역폭당의 분석 차수를 협대역 신호에 대한 대역폭당의 분석 차수보다 상대적으로 작게 하고 있다.
또, 업 샘플된 자기 상관 함수 R(j)는, x(i)를 업 샘플한 u(i)를 이용하여 식(9)과 같이 표시된다.
Figure 112007018079815-PCT00010
식(9)에 식(7) 및 식(8)을 대입하여 정리하면, 식(10) 및 식(11)이 얻어진 다. 식(10)은 짝수 샘플이 되는 점을 나타내고, 식(11)은 홀수 샘플이 되는 점을 나타낸다.
Figure 112007018079815-PCT00011
Figure 112007018079815-PCT00012
여기서, 식(10) 및 식(11)에 있어서 r(j)는 업 샘플 전의 x(i)의 자기상관계수이다. 따라서, 식(10) 및 식(11)을 이용하여 업 샘플 전의 자기상관계수 r(j)를 R(j)로 업 샘플하면, 시간 영역에서의 x(i)로부터 u(i)로의 업 샘플을 행한 후 자기상관계수를 구한 것과 등가가 되는 것을 알 수 있다. 이와 같이 하여, 업 샘플부(304)가, 시간 영역에서의 업 샘플 처리와 등가인 자기상관 영역에서의 업 샘플 처리를 행함으로써, 업 샘플로 인한 오차 발생을 최소한으로 억제할 수 있다.
또한 업 샘플 처리는, 식(6)~식(11)에서 나타낸 처리 외에, 예를 들면, ITU-T 권고 G.729(3.7절)에 기재되어 있는 처리를 이용하여 근사적으로 행하는 것도 가능하다. ITU-T 권고 G.729에서는, 피치 분석에 있어서 분수 정밀도 피치 탐색을 행하는 목적으로 상호 상관계수의 업 샘플을 행하고 있다. 예를 들면, 정규화 상호 상관계수를 1/3 정밀도로 보간(3배의 업 샘플에 상당함)하고 있다.
시간창부(305)는, 업 샘플부(304)로부터 입력되는 업 샘플 후의 Mw차의 자기상관계수에 대해서 광대역용(고(高) 샘플링 레이트용)의 시간창을 걸어, LSP 변환부(306)에 출력한다.
LSP 변환부(306)는, 시간창이 걸려 있는 Mw차의 자기상관계수(분석 차수가 협대역 LSP 파라미터의 분석 차수의 2배 미만의 자기상관계수)를 LPC로 변환한 후, LPC를 LSP로 변환하여 Mw차 LSP 파라미터를 구한다. 이에 의해, Mw차의 협대역 LSP가 얻어진다. Mw차의 협대역 LSP는 곱셈부(307)에 출력된다.
곱셈부(307)는, LSP 변환부(306)로부터 입력되는 Mw차의 협대역 LSP에, 변환계수 테이블(308)에 격납되어 있는 변환계수를 곱하여, Mw차의 협대역 LSP의 주파수 대역을 광대역으로 변환한다. 이 변환에 의해, 곱셈부(307)는, Mw차의 협대역 LSP로부터 Mw차의 예측 광대역 LSP를 구하여 양자화부(202)에 출력한다. 또한 여기서는, 변환계수는 미리 변환계수 테이블(308)에 격납되어 있는 것으로 했지만, 적응적으로 산출한 변환계수를 이용해도 좋다. 예를 들면, 직전 프레임에 있어서의 광대역 양자화 LSP의 협대역 양자화 LSP에 대한 비(比)를 변환계수로서 이용할 수 있다.
이상과 같이 하여, 변환부(201)는 협대역 LSP 부호화부(103)로부터 입력되는 협대역 LSP를 변환하여 예측 광대역 LSP를 구한다.
다음에, 본 실시형태에 따른 스케일러블 부호화 장치의 동작 흐름에 대해서 도 4를 이용해 설명한다. 도 4에 있어서는, 일례로서 협대역 음성 신호(8kHz 샘플링, Fs:8kHz)에 대해서는 12차의 LSP 분석을 행하고, 광대역 음성 신호(16 kHz 샘플링, Fs:16 kHz)에 대해서는 18차의 LSP 분석을 행하는 경우를 나타내고 있다.
우선, Fs:8kHz(협대역)에 있어서, 협대역 음성 신호(401)를 12차의 자기상관계수(402)로 변환하고, 12차의 자기상관계수(402)를 12차의 LPC(403)로 변환하고, 그리고, 12차의 LPC(403)를 12차의 LSP(404)로 변환한다.
여기서, 12차의 LSP(404)는 12차의 LPC(403)로, 12차의 LPC(403)는 12차의 자기상관계수(402)로 가역적으로 변환하는(되돌림) 것이 가능하다. 한편, 12차의 자기상관계수(402)를 원래의 음성 신호(401)로 되돌릴 수는 없다.
그래서, 본 실시형태에 따른 스케일러블 부호화 장치에서는, 시간 영역에서의 업 샘플과 등가인 업 샘플을 자기상관 영역에서 행함으로써, Fs:16kHz(광대역)의 자기상관계수(405)를 구한다. 즉, Fs:8kHz의 12차의 자기상관계수(402)를 업 샘플하여, Fs:16kHz의 18차의 자기상관계수(405)를 구한다.
그리고, Fs:16kHz(광대역)에 있어서, 18차의 자기상관계수(405)를 18차의 LPC(406)로 변환하고, 18차의 LPC(406)를 18차의 LSP(407)로 변환한다. 이 18차의 LSP(407)가 예측 광대역 LSP로서 사용된다.
또한 Fs:16kHz(광대역)에 있어서는, 광대역 음성 신호를 기초로 자기상관계수를 구하는 것과 의사(疑似)적으로 등가인 처리를 행할 필요가 있기 때문에, 자기상관 영역에서의 업 샘플을 행할 때는, 상기와 같이, Fs:8 kHz의 자기상관계수의 차수:12차를 18차로 확장하는 자기상관계수의 외삽 처리를 행한다.
다음에, 역시간창부(302)에 의한 역시간창 걸기 및 외삽부(303)에 의한 외삽 처리의 효과에 대해 도 5 및 도 6을 이용해 설명한다.
도 5는, Mn 다음의 자기상관계수를 확장하여 얻어지는 (Mn+Mi)차의 자기상관계수를 나타내는 그래프이다. 도 5에 있어서, (501)은, 실제의 협대역 입력 음성 신호(낮은 샘플링 레이트)로부터 구한 자기상관계수이며, 이것이 이상적인 자기상관계수이다. 이에 대해, (502)는, 본 실시형태와 같이, 자기상관계수에 역시간 창을 건 뒤에 외삽 처리를 행하여 구한 자기상관계수이다. 또, (503)은, 자기상관계수에 역시간창을 걸지않고 그대로 외삽 처리를 행하고 구한 자기상관계수이다. 또한, (503)에서는 스케일을 맞추기 위해서 외삽 처리를 행한 후에 역시간창을 걸고 있다. 도 5의 결과로부터, 외삽한 부분(Mi=5의 부분)에 있어서, (503)이 (502)보다 왜곡되어 있는 것을 알 수 있다. 즉, 본 실시형태와 같이 자기상관계수에 역시간창을 건 뒤에 외삽 처리를 행함으로써, 자기상관계수의 외삽 처리의 정밀도를 높일 수 있다. 또한 504는, 본 실시형태와 같은 외삽 처리를 행하지 않고, 자기상관계수의 Mi차를 영(0)채우기로 확장하여 구한 자기상관계수이다.
도 6은, 도 5의 각 결과에 대해서 업 샘플 처리를 행하고 얻어지는 자기상관계수로부터 구한 LPC 스펙트럼 포락을 나타내는 그래프이다. (601)은, 4kHz 이상의 대역을 포함한 광대역 신호로부터 구한 LPC 스펙트럼 포락이다. 또, (602)는 (502)에, (603)은 (503)에, (604)는 504에 각각 대응한다. 도 6에 나타내는 결과, Mi차를 영채우기로 확장하여 구한 자기상관계수(504)에 대해서 업 샘플 처리를 행하여 얻어지는 자기상관계수로부터 LPC를 구하면, 스펙트럼 특성이 (604)에 나타내는 바와 같이 발진 상태에 빠져 버린다. 이와 같이, Mi차(확장 부분)를 영채우기로 확장하면, 자기상관계수의 적절한 보간(업 샘플)을 할 수 없기때문에, 자기상관계수를 LPC로 변환했을 때에 발진해 버려, 안정된 필터가 얻어지지 못하게 되어 버린다. 이와 같이 LPC가 발진 상태에 빠지면, LPC로부터 LSP로의 변환 처리를 할 수 없게 되어 버린다. 이에 대해서, 본 실시형태와 같은 외삽 처리를 행하고 Mi차를 확장한 자기상관계수를 업 샘플링한 자기상관계수로부터 LPC를 구하면, (602) 및 (603)과 같이 되어, 광대역 신호의 4kHz 미만의 협대역 성분이 정밀도 좋게 구해지는 것을 알 수 있다. 이와 같이, 본 실시형태에 의하면, 자기상관계수의 업 샘플을 정밀도 좋게 행할 수 있다. 즉, 본 실시형태에 의하면, 식(4) 및 식(5)에 나타내는 바와 같은 외삽 처리를 행함으로써, 자기상관계수에 대해서 적절한 업 샘플 처리를 행할 수 있어, 안정된 LPC를 얻을 수 있다.
다음에, LSP의 시뮬레이션 결과를 도 7~도 9에 나타낸다. 도 7은 Fs:8kHz의 협대역 음성 신호를 12차로 분석한 LSP를 나타내며, 도 8은 협대역 음성 신호를 12차로 분석한 LSP를 도 1에 나타내는 스케일러블 부호화 장치에 의해 Fs:16kHz의 18차 LSP로 변환했을 경우를 나타내며, 도 9는 광대역 음성 신호를 18차로 분석한 LSP를 나타낸다. 도 7~도 9에 있어서, 실선은 입력 음성 신호(광대역)의 스펙트럼 포락을 나타내며, 파선은 LSP를 나타낸다. 이 스펙트럼 포락은, 여자 목소리의 「관리 시스템」의 일본어「かんり」의 「ん」부분이다. 또한 최근의 CELP 방식에 있어서는, 협대역용에서는 분석 차수가 10~14차, 광대역용에서는 16~20차 정도의 CELP 방식이 사용되는 일이 많기 때문에, 도 7에 있어서 협대역의 분석 차수를 12차로 하고, 도 8 및 도 9에 있어서 광대역의 분석 차수를 18차로 하고 있다.
우선, 도 7과 도 9를 비교한다. 도 7과 도 9에 있어서 같은 차수끼리의 LSP의 대응 관계에 주목하면, 예를 들면, 도 7에 있어서의 LSP(L1~L12)중 8차의 LSP(L8)는 스펙트럼 피크(701)(왼쪽으로부터 2번째의 스펙트럼 피크) 부근에 있지만, 도 9에 있어서의 8차의 LSP(L8)는 스펙트럼 피크(702)(왼쪽으로부터 3번째의 스펙트럼 피크) 부근에 있다. 즉, 도 7과 도 9는, 같은 차수의 LSP가 완전히 다른 위치에 있다. 따라서, 협대역 음성 신호를 12차로 분석한 LSP와 광대역 음성 신호를 18차로 분석한 LSP를 직접 대응화하는 것은 적절하지 못하다고 말할 수 있다.
이에 대해, 도 8과 도 9를 비교하면, 같은 차수끼리의 LSP의 대응이 전체적으로 잘 취해져 있음을 알 수 있다. 특히, 3.5 kHz 이하의 저역에 있어서, 대응 관계가 잘 취해져 있다는 것을 알 수 있다. 이와 같이, 본 실시형태에 의하면, 임의 차수의 협대역(저(低) 샘플링 주파수) LSP 파라미터를 임의의 차수의 광대역(고(高) 샘플링 주파수) LSP 파라미터로 정밀도 좋게 변환할 수 있다.
이상 설명한 바와 같이 하여, 본 실시형태에 따른 스케일러블 부호화 장치는 주파수축 방향으로 스케일러빌리티(scability)를 가지는 협대역 및 광대역의 양자화 LSP 파라미터를 얻는다.
본 발명에 따른 스케일러블 부호화 장치는, 이동 통신 시스템에 있어서의 통신 단말장치 및 기지국 장치에 탑재하는 것도 가능하며, 이에 의해 상기와 같은 작용 효과를 가지는 통신 단말장치 및 기지국 장치를 제공할 수 있다.
또한 상기 실시형태에서는, 업 샘플부(304)가 샘플링 주파수를 2배로 하는 업 샘플 처리를 행하는 경우를 일례로서 설명했다. 그러나, 본 발명은, 업 샘플 처리에 대해, 샘플링 주파수를 2배로 하는 것에 한정되지 않는다. 즉, 샘플링 주파수를 n배(n은 2이상의 자연수)로 하는 업 샘플 처리이면 좋다. 또, 샘플링 주파수를 n배로 하는 업 샘플의 경우는, 본 발명에서는, 협대역 LSP 파라미터의 분석 차수를 광대역 LSP 파라미터의 분석 차수의 1/n이상, 즉, (Mn+Mi)차를 Mn차의 n배 미만으로 한다.
또, 상기 실시형태에서는, LSP 파라미터를 부호화하는 경우에 대해 설명했지만, ISP(Immittance Spectrum Pairs) 파라미터에 대해서도 본 발명은 적용 가능하다.
또, 상기 실시형태에서는, 대역 스케일러블 부호화의 레이어가 2개일 경우, 즉, 협대역 및 광대역의 2개의 주파수 대역으로 되는 대역 스케일러블 부호화를 예로 들어 설명했지만, 본 발명은, 3개 이상의 주파수 대역(레이어)으로 되는 대역 스케일러블 부호화 또는 대역 스케일러블 복호화에 대해서도 적용 가능하다.
또, 일반적으로 시간창(Lag Window) 걸기란, 별도로 백색 노이즈 보정(White-noise Correction)으로 불리는 처리 (입력 음성 신호에 미약한 노이즈 플로어를 가산하는 것과 등가인 처리로서, 0차의 자기상관계수에 1보다 조금 큰 수(예를 들면 1.0001)를 곱하는 처리 또는 0차 이외의 모든 자기상관계수를 1보다 조금 큰 수(예를 들면 1.0001)로 나누는 처리)가 자기상관계수에 대해서 행해진다. 본 실시형태에서는, White-noise Correction에 대해서는 기재하지 않았지만, 시간창 걸기의 처리에 White-noise Correction을 포함하는(즉, 시간창의 계수에 대해서 White-noise Correction을 가한 것을 실제의 시간창 계수로서 사용함) 것은 일반적으로 행해지고 있는 일이다. 따라서, 본 발명에 있어서도 White-noise Correction을 시간창(Lag Window) 걸기 처리 안에 포함해도 좋다.
또, 상기 실시형태에서는, 본 발명을 하드웨어로 구성하는 경우를 예로 들어 설명했지만, 본 발명은 소프트웨어로 실현되는 것도 가능하다.
또, 상기 실시형태의 설명에 이용한 각 기능 블록은, 전형적으로는 집적회로 인 LSI로서 실현된다. 이들은 개별적으로 1칩화 되어도 좋고, 일부 또는 모두를 포함하도록 1칩화 되어도 좋다.
여기에서는, LSI라고 했지만, 집적도의 차이에 따라, IC, 시스템 LSI, 슈퍼 LSI, 울트라 LSI라고 호칭되는 일도 있다.
또, 집적회로화의 수법은 LSI에 한정하는 것은 아니며, 전용 회로 또는 범용 프로세서로 실현되어도 좋다. LSI 제조 후에, 프로그램하는 것이 가능한 FPGA(Field Programmable Gate Array)나, LSI 내부의 회로 셀의 접속이나 설정을 재구성가능한 리컨피규러블 프로세서를 이용해도 좋다.
또, 반도체 기술의 진보 또는 파생하는 별개의 기술에 의해 LSI에 대체되는 집적회로화의 기술이 등장하면, 당연히 그 기술을 이용해 기능 블록의 집적화를 행하여도 좋다. 바이오 기술의 적응 등이 가능성으로서 있을 수 있다.
본 명세서는, 2004년 9월 6일에 출원한 일본 특허 출원 제 2004-258924 호에 기초하는 것이다. 이 내용은 모두 여기에 포함시켜 놓는다.
본 발명에 따른 스케일러블 부호화 장치 및 스케일러블 부호화 방법은, 이동 통신 시스템이나 인터넷 프로토콜을 이용한 패킷 통신 시스템 등에 있어서의 통신 장치의 용도에 적용할 수 있다.

Claims (8)

  1. 협대역 LSP 파라미터로부터 광대역 LSP 파라미터를 얻는 스케일러블 부호화 장치로서,
    협대역 LSP 파라미터를 자기 상관 계수로 변환하는 제1 변환 수단과,
    상기 자기상관계수를 업 샘플링하는 업 샘플링 수단과,
    업 샘플링된 상기 자기상관계수를 LSP 파라미터로 변환하는 제2 변환 수단과,
    상기 LSP 파라미터의 주파수 대역을 광대역으로 변환하여 광대역 LSP 파라미터를 얻는 제3 변환 수단
    을 구비하는 스케일러블 부호화 장치.
  2. 제 1 항에 있어서,
    상기 업 샘플링 수단은, 상기 자기상관계수의 샘플링 주파수를 n배(n은 2이상의 자연수)로 하고,
    상기 제2 변환 수단은, 상기 협대역 LSP 파라미터의 분석 차수의 n배 미만의 분석 차수의 상기 자기상관계수를 상기 LSP 파라미터로 변환하는
    스케일러블 부호화 장치.
  3. 제 1 항에 있어서,
    상기 자기상관계수의 차수를 확장하는 외삽 처리를 행하는 외삽 수단을 더 구비하는 스케일러블 부호화 장치.
  4. 제 1 항에 있어서,
    상기 자기상관계수에 대해, 상기 협대역 LSP 파라미터에 걸려 있는 시간창과 역특성의 창을 거는 창 걸기 수단을 더 구비하는 스케일러블 부호화 장치.
  5. 제 1 항에 있어서,
    상기 업 샘플링 수단은, 시간 영역에서의 업 샘플링과 등가인 자기 상관 영역에서의 업 샘플링을 행하는 스케일러블 부호화 장치.
  6. 청구항 1에 기재한 스케일러블 부호화 장치를 구비하는 통신 단말장치.
  7. 청구항 1에 기재한 스케일러블 부호화 장치를 구비하는 기지국 장치.
  8. 협대역 LSP 파라미터로부터 광대역 LSP 파라미터를 얻는 스케일러블 부호화 방법으로서,
    협대역 LSP 파라미터를 자기상관계수로 변환하는 제1 변환 공정과,
    상기 자기상관계수를 업 샘플링하는 업 샘플링 공정과,
    업 샘플링된 상기 자기상관계수를 LSP 파라미터로 변환하는 제2 변환 공정과,
    상기 LSP 파라미터의 주파수 대역을 광대역으로 변환하여 광대역 LSP 파라미터를 얻는 제3 변환 공정
    을 구비하는 스케일러블 부호화 방법.
KR1020077005226A 2004-09-06 2005-09-02 스케일러블 부호화 장치 및 스케일러블 부호화 방법 KR20070051878A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004258924 2004-09-06
JPJP-P-2004-00258924 2004-09-06

Publications (1)

Publication Number Publication Date
KR20070051878A true KR20070051878A (ko) 2007-05-18

Family

ID=36036295

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077005226A KR20070051878A (ko) 2004-09-06 2005-09-02 스케일러블 부호화 장치 및 스케일러블 부호화 방법

Country Status (10)

Country Link
US (1) US8024181B2 (ko)
EP (1) EP1785985B1 (ko)
JP (1) JP4937753B2 (ko)
KR (1) KR20070051878A (ko)
CN (1) CN101023472B (ko)
AT (1) ATE406652T1 (ko)
BR (1) BRPI0514940A (ko)
DE (1) DE602005009374D1 (ko)
RU (1) RU2007108288A (ko)
WO (1) WO2006028010A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101878292B1 (ko) * 2014-04-25 2018-07-13 가부시키가이샤 엔.티.티.도코모 선형 예측 계수 변환 장치 및 선형 예측 계수 변환 방법

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006030865A1 (ja) * 2004-09-17 2006-03-23 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置、スケーラブル復号化装置、スケーラブル符号化方法、スケーラブル復号化方法、通信端末装置および基地局装置
KR20070085982A (ko) * 2004-12-10 2007-08-27 마츠시타 덴끼 산교 가부시키가이샤 광대역 부호화 장치, 광대역 lsp 예측 장치, 대역스케일러블 부호화 장치 및 광대역 부호화 방법
DE602006015461D1 (de) * 2005-05-31 2010-08-26 Panasonic Corp Einrichtung und verfahren zur skalierbaren codierung
EP1898397B1 (en) * 2005-06-29 2009-10-21 Panasonic Corporation Scalable decoder and disappeared data interpolating method
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
US8069035B2 (en) * 2005-10-14 2011-11-29 Panasonic Corporation Scalable encoding apparatus, scalable decoding apparatus, and methods of them
US8086452B2 (en) * 2005-11-30 2011-12-27 Panasonic Corporation Scalable coding apparatus and scalable coding method
JP5159318B2 (ja) * 2005-12-09 2013-03-06 パナソニック株式会社 固定符号帳探索装置および固定符号帳探索方法
JP5173795B2 (ja) * 2006-03-17 2013-04-03 パナソニック株式会社 スケーラブル符号化装置およびスケーラブル符号化方法
WO2008001866A1 (fr) * 2006-06-29 2008-01-03 Panasonic Corporation dispositif de codage vocal et procédé de codage vocal
WO2008108077A1 (ja) * 2007-03-02 2008-09-12 Panasonic Corporation 符号化装置および符号化方法
KR100921867B1 (ko) * 2007-10-17 2009-10-13 광주과학기술원 광대역 오디오 신호 부호화 복호화 장치 및 그 방법
CN101620854B (zh) * 2008-06-30 2012-04-04 华为技术有限公司 频带扩展的方法、系统和设备
PL3300076T3 (pl) 2008-07-11 2019-11-29 Fraunhofer Ges Forschung Koder audio i dekoder audio
CN101609678B (zh) 2008-12-30 2011-07-27 华为技术有限公司 信号压缩方法及其压缩装置
WO2012053149A1 (ja) * 2010-10-22 2012-04-26 パナソニック株式会社 音声分析装置、量子化装置、逆量子化装置、及びこれらの方法
CN102783034B (zh) * 2011-02-01 2014-12-17 华为技术有限公司 用于提供信号处理系数的方法和设备
CN103918028B (zh) * 2011-11-02 2016-09-14 瑞典爱立信有限公司 基于自回归系数的有效表示的音频编码/解码
US9542149B2 (en) 2011-11-10 2017-01-10 Nokia Technologies Oy Method and apparatus for detecting audio sampling rate
EP2750130B1 (en) * 2012-12-31 2015-11-25 Nxp B.V. Signal processing for a frequency modulation receiver
WO2014138539A1 (en) * 2013-03-08 2014-09-12 Motorola Mobility Llc Conversion of linear predictive coefficients using auto-regressive extension of correlation coefficients in sub-band audio codecs
EP4336500A3 (en) 2014-04-17 2024-04-03 VoiceAge EVS LLC Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
WO2017005296A1 (en) 2015-07-06 2017-01-12 Nokia Technologies Oy Bit error detector for an audio signal decoder
US10824917B2 (en) 2018-12-03 2020-11-03 Bank Of America Corporation Transformation of electronic documents by low-resolution intelligent up-sampling

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US539355A (en) * 1895-05-14 Cushion-stamp
US93279A (en) * 1869-08-03 Gustav cramer and julius gross
JP3483958B2 (ja) 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
JP2956548B2 (ja) * 1995-10-05 1999-10-04 松下電器産業株式会社 音声帯域拡大装置
JP3747492B2 (ja) * 1995-06-20 2006-02-22 ソニー株式会社 音声信号の再生方法及び再生装置
US5710863A (en) * 1995-09-19 1998-01-20 Chen; Juin-Hwey Speech signal quantization using human auditory models in predictive coding systems
TW321810B (ko) * 1995-10-26 1997-12-01 Sony Co Ltd
JPH09127985A (ja) * 1995-10-26 1997-05-16 Sony Corp 信号符号化方法及び装置
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
CN1231050A (zh) * 1997-07-11 1999-10-06 皇家菲利浦电子有限公司 具有改进谐波语音编码器的发射机
JP3134817B2 (ja) 1997-07-11 2001-02-13 日本電気株式会社 音声符号化復号装置
US6539355B1 (en) * 1998-10-15 2003-03-25 Sony Corporation Signal band expanding method and apparatus and signal synthesis method and apparatus
JP2000122679A (ja) 1998-10-15 2000-04-28 Sony Corp 音声帯域拡張方法及び装置、音声合成方法及び装置
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6732070B1 (en) * 2000-02-16 2004-05-04 Nokia Mobile Phones, Ltd. Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching
FI119576B (fi) * 2000-03-07 2008-12-31 Nokia Corp Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
US7013269B1 (en) * 2001-02-13 2006-03-14 Hughes Electronics Corporation Voicing measure for a speech CODEC system
DE60120504T2 (de) * 2001-06-26 2006-12-07 Nokia Corp. Verfahren zur transcodierung von audiosignalen, netzwerkelement, drahtloses kommunikationsnetzwerk und kommunikationssystem
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
JP2003241799A (ja) 2002-02-15 2003-08-29 Nippon Telegr & Teleph Corp <Ntt> 音響符号化方法、復号化方法、符号化装置、復号化装置及び符号化プログラム、復号化プログラム
JP4433668B2 (ja) 2002-10-31 2010-03-17 日本電気株式会社 帯域拡張装置及び方法
US7272567B2 (en) * 2004-03-25 2007-09-18 Zoran Fejzo Scalable lossless audio codec and authoring tool
BRPI0510303A (pt) * 2004-04-27 2007-10-02 Matsushita Electric Ind Co Ltd dispositivo de codificação escalável, dispositivo de decodificação escalável, e seu método
US20080249766A1 (en) * 2004-04-30 2008-10-09 Matsushita Electric Industrial Co., Ltd. Scalable Decoder And Expanded Layer Disappearance Hiding Method

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101878292B1 (ko) * 2014-04-25 2018-07-13 가부시키가이샤 엔.티.티.도코모 선형 예측 계수 변환 장치 및 선형 예측 계수 변환 방법
KR20180123742A (ko) * 2014-04-25 2018-11-19 가부시키가이샤 엔.티.티.도코모 선형 예측 계수 변환 장치 및 선형 예측 계수 변환 방법
US10163448B2 (en) 2014-04-25 2018-12-25 Ntt Docomo, Inc. Linear prediction coefficient conversion device and linear prediction coefficient conversion method
US10714108B2 (en) 2014-04-25 2020-07-14 Ntt Docomo, Inc. Linear prediction coefficient conversion device and linear prediction coefficient conversion method
US10714107B2 (en) 2014-04-25 2020-07-14 Ntt Docomo, Inc. Linear prediction coefficient conversion device and linear prediction coefficient conversion method
US11222644B2 (en) 2014-04-25 2022-01-11 Ntt Docomo, Inc. Linear prediction coefficient conversion device and linear prediction coefficient conversion method

Also Published As

Publication number Publication date
EP1785985A4 (en) 2007-11-07
US20070271092A1 (en) 2007-11-22
CN101023472A (zh) 2007-08-22
US8024181B2 (en) 2011-09-20
BRPI0514940A (pt) 2008-07-01
JPWO2006028010A1 (ja) 2008-05-08
RU2007108288A (ru) 2008-09-10
EP1785985A1 (en) 2007-05-16
WO2006028010A1 (ja) 2006-03-16
DE602005009374D1 (de) 2008-10-09
EP1785985B1 (en) 2008-08-27
JP4937753B2 (ja) 2012-05-23
ATE406652T1 (de) 2008-09-15
CN101023472B (zh) 2010-06-23

Similar Documents

Publication Publication Date Title
KR20070051878A (ko) 스케일러블 부호화 장치 및 스케일러블 부호화 방법
JP5143193B2 (ja) スペクトル包絡情報量子化装置、スペクトル包絡情報復号装置、スペクトル包絡情報量子化方法及びスペクトル包絡情報復号方法
JP4546464B2 (ja) スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
RU2434324C1 (ru) Устройство масштабируемого декодирования и устройство масштабируемого кодирования
US8543392B2 (en) Encoding device, decoding device, and method thereof for specifying a band of a great error
JP4220461B2 (ja) 時間的に離散した音声信号のアップサンプリングした信号を発生する方法と装置
EP1846920B1 (en) Method for generating concealment frames in communication system
JP5339919B2 (ja) 符号化装置、復号装置およびこれらの方法
KR101209410B1 (ko) 분석 필터뱅크, 합성 필터뱅크, 인코더, 디코더, 믹서 및 회의 시스템
JP5619176B2 (ja) 改良された励起信号帯域幅拡張
JP5036317B2 (ja) スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
WO2007052612A1 (ja) ステレオ符号化装置およびステレオ信号予測方法
WO2006041055A1 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
US20100250260A1 (en) Encoder
RU2459283C2 (ru) Кодирующее устройство, декодирующее устройство и способ
JP2005114814A (ja) 音声符号化・復号化方法、音声符号化・復号化装置、音声符号化・復号化プログラム、及びこれを記録した記録媒体
JP5774490B2 (ja) 符号化装置、復号装置およびこれらの方法

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid