KR20070085982A - 광대역 부호화 장치, 광대역 lsp 예측 장치, 대역스케일러블 부호화 장치 및 광대역 부호화 방법 - Google Patents

광대역 부호화 장치, 광대역 lsp 예측 장치, 대역스케일러블 부호화 장치 및 광대역 부호화 방법 Download PDF

Info

Publication number
KR20070085982A
KR20070085982A KR1020077013054A KR20077013054A KR20070085982A KR 20070085982 A KR20070085982 A KR 20070085982A KR 1020077013054 A KR1020077013054 A KR 1020077013054A KR 20077013054 A KR20077013054 A KR 20077013054A KR 20070085982 A KR20070085982 A KR 20070085982A
Authority
KR
South Korea
Prior art keywords
lsp
wideband
error
prediction
quantized
Prior art date
Application number
KR1020077013054A
Other languages
English (en)
Inventor
히로유키 에하라
고지 요시다
도시유키 모리이
Original Assignee
마츠시타 덴끼 산교 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마츠시타 덴끼 산교 가부시키가이샤 filed Critical 마츠시타 덴끼 산교 가부시키가이샤
Publication of KR20070085982A publication Critical patent/KR20070085982A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Amplifiers (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

협대역 LSP와 광대역 LSP를 대응화시킨 변환 테이블의 사이즈를 억제하면서, 협대역 LSP로부터 광대역 LSP를 높은 양자화 효율인 한편, 고정밀도로 예측할 수 있는 광대역 LSP 예측 장치 등을 제공한다. 이 장치에 있어서, 비선형 예측부(102)는, 협대역-광대역 변환부(101)로부터 입력되는 변환 광대역 LSP를 이용해 비선형 예측을 행하고, 그 비선형 예측 결과를 증폭기(103)에 입력시킨다. 변환 광대역 LSP는 증폭기(104)에 입력된다. 가산기(122)는, 증폭기(103, 104)로부터 각각 입력되는 곱셈 결과(벡터)를 가산한다.

Description

광대역 부호화 장치, 광대역 LSP 예측 장치, 대역 스케일러블 부호화 장치 및 광대역 부호화 방법{WIDE-BAND ENCODING DEVICE, WIDE-BAND LSP PREDICTION DEVICE, BAND SCALABLE ENCODING DEVICE, WIDE-BAND ENCODING METHOD}
본 발명은 음성 신호를 대역 스케일러블(Scalable)로 부호화하는 대역 스케일러블 부호화 장치, 그 일부로서 동작하는 광대역 부호화 장치, 광대역 부호화 장치에 탑재되는 광대역 LSP(Line Spectrum Pair:선 스펙트럼 쌍) 예측 장치, 및 그 광대역 부호화 장치에 의해 생성된 광대역 부호화 데이터 등을 복호하는 대역 스케일러블 복호 장치에 관한 것이다.
신호 대역으로 스케일러빌리티(Scalability)를 가지는 엠베디드(embedded) 가변 레이트 음성 부호화 방식은 종래의 전화 서비스부터 현장감 있는 광대역 음성 통신 서비스까지를 서포트할 수 있는 음성 부호화 방식으로서 주목받고 있다. 또, 스케일러블부호화 정보는, 전송로상의 임의의 노드(node)에서 자유롭게 부호화 정보를 삭감할 수 있으므로, IP망으로 대표되는 패킷망을 이용한 통신에 있어서의 폭주(congestion) 제어에 효과적이다. 이러한 배경에서, ITU-T(International Telecommunication Union Telecommunication standardization sector) SG16(Study Group 16)에 있어서도, 음성 신호의 대역 스케일러블 임베디드 가변 레이트 부호화 방식의 표준화가 행해지고 있다.
한편, 음성 신호의 부호화에 있어서, LSP 파라미터는 스펙트럼 포락 정보를 효율적으로 표현하는 파라미터로서 널리 이용되고 있어, 대역 스케일러블 음성 부호화에 있어서도 LSP 파라미터의 부호화는 필수 요소 기술의 하나이다.
LSP 파라미터에 대역 스케일러빌리티를 가지게 할 경우, 협대역 신호를 분석하여 얻어지는 협대역 LSP 파라미터를 이용해 광대역 LSP 파라미터를 예측 양자화하게 된다. 그 때문에, 광대역 LSP 파라미터의 예측 양자화에 있어서의 예측 정밀도나 양자화 효율은 음성 신호의 대역 스케일러블 부호화 성능에 직접적인 영향을 주는 중요한 지표이다.
이러한 광대역 LSP 파라미터를 예측 양자화하는 기술로서, 부호화한 협대역 LSP 파라미터로부터 광대역 LSP 파라미터를 코드북 매핑과 같은 비선형 예측 기술을 사용하여 예측하고, 그 예측 결과와 실제의 광대역 LSP 파라미터를 비교하여 예측 오차를 생성하고, 생성한 예측 오차와 부호화한 협대역 LSP 파라미터를 동시에 전송하는 기술이 알려져 있다(예를 들면 특허 문헌 1 참조). 또, 코드북 매핑 등을 이용해 협대역 LSF(Line Spectral Frequency) 파라미터로부터 광대역 LSF 파라미터를 예측하고, 예측 잔차를 부호화하는 기술도 알려져 있다(예를 들면 특허 문헌 2 참조).
[특허 문헌 1] 일본 특허 공표 제2003-534578호 공보
[특허 문헌 2] 일본 특허 공개 평성6-118995호 공보
발명의 개시
발명이 해결하려고 하는 과제
그렇지만, 특허 문헌 1에는, 특허 문헌 2에 개시된 방법으로 광대역 LSP(LSF와 동일 의미) 파라미터를 예측하고, 다시 예측 잔차를 부호화하는 「개념」은 나타나 있지만, 그 구체적인 기술(記述)로서는, 코드북 매핑 기술을 사용한다고 하는 정도이다.
여기서, 특허 문헌 2에 기재된 방법으로 광대역 LSP 파라미터를 예측할 경우, 그 양자화 성능은 예측 성능에 의존하고, 또 그 예측 성능은 변환 테이블의 크기나 변환 테이블을 학습을 이용해 작성할 때의 학습 데이터 등에 의존한다. 대규모의 학습 데이터를 이용해 사이즈가 큰 변환 테이블을 설계하면, 다양한 협대역 신호와 광대역 신호를 대응화할 수 있으므로, 일반적으로 높은 예측 성능이 얻어진다. 그런 한편, 실제 애플리케이션에 있어서, 거대한 학습 데이터를 이용하여 무한대의 변환 테이블을 작성해 사용하는 것은 불가능하다. 따라서, 현실적으로는, 어느 정도 한정된 규모의 학습 데이터를 이용하여, 어느 정도 현실적인 사이즈의 변환 테이블을 작성해 사용하게 된다. 변환 테이블의 사이즈는 메모리량 이외에도 변환 처리에 필요로 하는 연산 처리량과도 관계하기 때문에, 메모리량이나 연산 처리량에 제약이 있는 애플리케이션, 예를 들면 휴대 단말 등에서 사용되는 애플리케이션에 대해서는, 한층 더 변환 테이블의 사이즈를 작게 하지 않으면 안된다. 그 리고, 변환 테이블의 사이즈가 작으면 협대역 신호와 광대역 신호의 관련화가 한정되기 때문에, 광대역 LSP 파라미터의 예측 성능이 낮아진다. 즉, 이 변환 테이블의 크기가 충분하지 않으면, 협대역 LSP 파라미터로부터 광대역 LSP 파라미터를 비선형 예측할 때의 양자화 효율이 저하해 버려, 특히 음성 신호의 특징이 잘 나타나는 저역 성분에 대해서는, 비선형 예측을 행함으로써 그 품질이 오히려 열화되는 경우도 있다.
이와 같이, 특허 문헌 1에는, 코드북 매핑 기술만을 사용하여 협대역 LSP 파라미터로부터 광대역 LSP 파라미터를 예측할 경우에 생기는 기술적 과제에 대한 시사는 없으며, 당연히 그 해결 수단에 대한 사상(思想)도 개시되어 있지 않다. 즉, 특허 문헌 1에 기재된 기술(技術)에, 특허 문헌 2에 기재된 바와 같은 코드북 매핑 기술을 그대로 적용하여도, 협대역 LSP 파라미터로부터 광대역 LSP 파라미터를 예측할 때의 양자화 효율과 예측 정밀도를 확실하게 개선할 수는 없다.
따라서, 본 발명의 목적은, 협대역 LSP와 광대역 LSP를 대응화시킨 변환 테이블의 사이즈를 억제하면서, 협대역 LSP로부터 광대역 LSP를 높은 양자화 효율인 한편, 고정밀도로 예측할 수 있는 광대역 부호화 장치 등을 제공하는 것이다.
과제를 해결하기 위한 수단
본 발명에 따른 광대역 부호화 장치는, 음성 신호의 양자화 협대역 LSP를 이용해 광대역 LSP를 부호화하는 광대역 부호화 장치로서, 업 샘플링에 의해, 상기 양자화 협대역 LSP를 해당 양자화 협대역 LSP의 정보를 가지는 광대역의 제 1 LSP로 변환하는 변환 수단과, 비선형 예측 처리에 의해, 상기 제 1 LSP로부터 광대역의 제 2 LSP를 예측하는 예측 수단과, 상기 제 1 LSP와 상기 제 2 LSP의 가중 합을 이용하여 예측 광대역 LSP를 생성하는 생성 수단과, 상기 예측 광대역 LSP와 상기 광대역 LSP간의 오차를 최소로 하는 부호화 데이터를 구하는 부호화 수단을 구비하는 구성을 취한다.
또, 본 발명에 따른 광대역 LSP 예측 장치는, 음성 신호의 양자화 협대역 LSP로부터 광대역 LSP를 예측하는 광대역 LSP 예측 장치로서, 업 샘플링에 의해, 상기 양자화 협대역 LSP를 해당 양자화 협대역의 LSP 정보를 가지는 광대역의 제 1 LSP로 변환하는 변환 수단과, 비선형 예측 처리에 의해, 상기 제 1 LSP로부터 광대역의 제 2 LSP를 예측하는 예측 수단과, 상기 제 1 LSP와 상기 제 2 LSP의 가중 합을 이용해 예측 광대역 LSP를 생성하는 생성 수단을 구비하는 구성을 취한다.
즉, 본 발명에 의하면, 음성 신호의 양자화 협대역 LSP를 업 샘플링하여 변환한 변환 광대역 LSP(제 1 LSP)와, 이 변환 광대역 LSP를 이용해 비선형 예측을 행한 비선형 예측 결과(제 2 LSP)에 각각 가중을 행하여, 그 가산 결과를 이용함으로써, 양자화 협대역 LSP로부터 음성 신호의 광대역 LSP를 예측한다. 또, 이 예측에 의해 얻어지는 예측 광대역 LSP와 별도로 입력되는 광대역 LSP간의 오차를 구하고, 이것을 최소화함으로써 광대역 LSP의 부호화를 행한다.
또, 본 발명에 따른 광대역 부호화 장치는, 주파수축 방향으로 스케일러빌리티를 가지는 부호화 데이터를 생성하는 대역 스케일러블 부호화 장치, 및 이에 대응하는 대역 스케일러블 복호 장치에 탑재된다.
[발명의 효과]
본 발명에 의하면, 음성 신호의 대역 스케일러블 부호화에 있어서, 변환 광대역 LSP나 음성 신호의 광대역 LSP를 나타내는 기준 벡터인 각종 코드 벡터를 복수 포함하여 구성되는 각종 코드북의 사이즈를 억제하는 한편, 양자화 협대역 LSP로부터 음성 신호의 광대역 LSP를 예측할 때의 양자화 효율과 예측 정밀도를 동시에 개선할 수 있다.
도 1은 실시형태 1에 따른 광대역 부호화 장치의 주요한 구성요소를 나타내는 블록도,
도 2는 실시형태 1에 있어서의 비선형 예측부의 주요한 내부 구성을 나타내는 블록도,
도 3은 실시형태 1에 따른 광대역 복호 장치의 주요한 구성요소를 나타내는 블록도,
도 4는 실시형태 1에 있어서의 비선형 예측부의 변형예를 나타내는 블록도,
도 5는 실시형태 1에 있어서의 비선형 예측부의 변형예를 나타내는 블록도,
도 6은 실시형태 2에 따른 광대역 부호화 장치의 주요한 구성요소를 나타내 는 블록도,
도 7은 실시형태 2에 따른 광대역 복호 장치의 주요한 구성요소를 나타내는 블록도,
도 8은 실시형태 3에 따른 광대역 부호화 장치의 주요한 구성요소를 나타내는 블록도,
도 9는 실시형태 3에 있어서의 비선형 예측부의 주요한 내부 구성을 나타내는 블록도,
도 10은 실시형태 3에 따른 광대역 복호 장치의 주요한 구성요소를 나타내는 블록도,
도 11은 실시형태 3에 따른 광대역 부호화 장치의 주요한 구성요소를 나타내는 블록도,
도 12는 실시형태 3에 따른 광대역 복호 장치의 주요한 구성요소를 나타내는 블록도,
도 13은 실시형태 4에 따른 광대역 부호화 장치의 주요한 구성요소를 나타내는 블록도,
도 14는 실시형태 4에 따른 광대역 복호 장치의 주요한 구성요소를 나타내는 블록도,
도 15는 실시형태 4에 따른 광대역 부호화 장치의 주요한 구성요소를 나타내는 블록도,
도 16은 실시형태 4에 따른 광대역 복호 장치의 주요한 구성요소를 나타내는 블록도,
도 17은 실시형태 5에 있어서의 비선형 예측부의 주요한 내부 구성을 나타내는 블록도,
도 18은 실시형태 5에 있어서의 비선형 예측부의 베리에이션(variation)을 나타내는 도면,
도 19는 실시형태 6에 따른 광대역 부호화 장치의 주요한 구성요소를 나타내는 블록도,
도 20은 실시형태 6에 있어서의 비선형 예측부의 주요한 내부 구성을 나타내는 블록도,
도 21은 실시형태 6에 따른 광대역 복호 장치의 주요한 구성요소를 나타내는 블록도,
도 22는 실시형태 6에 있어서의 비선형 예측부의 주요한 내부 구성을 나타내는 블록도,
도 23은 실시형태 7에 따른 광대역 부호화 장치의 주요한 구성요소를 나타내는 블록도,
도 24는 실시형태 7에 있어서의 비선형 예측부의 주요한 내부 구성을 나타내는 블록도,
도 25는 실시형태 7에 따른 광대역 복호 장치의 주요한 구성요소를 나타내는 블록도,
도 26은 실시형태 8에 따른 광대역 부호화 장치의 주요한 구성요소를 나타내 는 블록도,
도 27은 실시형태 8에 있어서의 비선형 예측부의 주요한 내부 구성을 나타내는 블록도,
도 28은 실시형태 8에 따른 광대역 복호 장치의 주요한 구성요소를 나타내는 블록도이다.
발명을 실시하기 위한 최선의 형태
이하, 본 발명에 따른 실시형태에 대해서, 도면을 적절하게 참조하면서 상세히 설명한다. 그리고, 본 발명에서는, 음성 신호를 분석하여 얻어지는 LSP 파라미터를 간단히 「LSP」라고 부른다. 또, 본 발명에서는, 「LSP」 대신에 「ISP(Immittance Spectral Pair)」를 사용할 수도 있다.
(실시형태 1)
도 1은 본 발명의 실시형태 1에 따른 광대역 LSP 예측 장치를 구비하는 광대역 부호화 장치(100)의 주요한 구성요소를 나타내는 블록도이다. 또한, 본 실시형태에서는, 광대역 부호화 장치(100)가 대역 스케일러블 부호화 장치의 일부로서 사용되는 경우를 예로 들어 설명한다. 본 실시형태에 따른 광대역 LSP 예측 장치, 광대역 부호화 장치, 대역 스케일러블 부호화 장치 등은, 휴대 전화 등의 통신 단말 장치나 기지국 장치 등에 탑재될 수 있는 것이다.
광대역 부호화 장치(100)는, 협대역-광대역 변환부(101), 비선형 예측 부(102), 증폭기(103),(104),(121), LSP 예측 잔차 코드북(110), 가산기(122), 오차 산출부(123), 오차 최소화 결정부(124) 및 예측 계수 테이블(131)을 구비한다. 또, LSP 예측 잔차 코드북(110)은, 3 단계로 구성된 코드북으로서, 초단(初段) 코드북(CBa)(111), 제 2단 코드북(CBb)(112), 가산기(113),(115) 및 제 3단 코드북(CBc)(114)을 구비한다.
협대역-광대역 변환부(101)는, 도시하지 않은 협대역 LSP 양자화기로부터 입력되는 음성 신호의 양자화 협대역 LSP를, 예를 들면 다음의 수학식 (1) 등을 이용하여 업 샘플링해 광대역 LSP로 변환하여, 얻어지는 변환 광대역 LSP를 비선형 예측부(102)와 증폭기(104)에 입력시킨다.
Figure 112007041858759-PCT00001
수학식 (1)에 있어서, fw(i)는 음성 신호의 i차 광대역 LSP, fn(i)는 음성 신호의 i차 협대역 LSP, Pn는 협대역 LSP의 LSP 분석 차수, Pw는 광대역 LSP의 LSP 분석 차수를 각각 나타낸다(예를 들면 일본 특허 공개 평성11-30997호 공보 참조).
비선형 예측부(102)는, 협대역-광대역 변환부(101)로부터 입력되는 변환 광대역 LSP를 이용해 음성 신호의 광대역 LSP를 비선형 예측하고, 그 비선형 예측 결과를 증폭기(103)에 입력시킨다. 또한, 비선형 예측부(102)의 내부 구성 및 그 동작 등에 대해서는 후술한다.
증폭기(103)는, 비선형 예측부(102)로부터 입력되는 비선형 예측 결과에 대해서, 후술하는 예측 계수 테이블(131)로부터 통지되는 가중 계수 β1(벡터 요소마 다 값을 가짐)를 곱하고, 그 곱셈 결과를 가산기(122)에 입력시킨다.
증폭기(104)는, 협대역-광대역 변환부(101)로부터 입력되는 변환 광대역 LSP에, 예측 계수 테이블(131)로부터 통지되는 가중 계수 β2를 곱하고, 그 곱셈 결과를 가산기(122)에 입력시킨다. 또한, 본 실시형태에서는, 증폭기(103)에서의 곱셈 결과와 증폭기(104)에서의 곱셈 결과의 가산 결과가 음성 신호의 광대역 LSP의 예측 결과이다.
LSP 예측 잔차 코드북(110)은, 음성 신호의 광대역 LSP를 예측한 예측 결과와 그 음성 신호의 광대역 LSP의 잔차(殘差)를 나타내는 기준 벡터인 LSP 예측 잔차 코드 벡터를 복수 포함하여 구성되는 코드북으로서, 후술하는 오차 최소화 결정부(124)로부터의 통지에 따라, 그 통지된 LSP 예측 잔차 코드 벡터를 생성해 증폭기(121)에 입력시킨다.
CBa(111)는, 오차 최소화 결정부(124)로부터의 통지에 따라, 통지된 초단 코드 벡터를 가산기(113)에 입력시킨다.
CBb(112)도, 오차 최소화 결정부(124)로부터의 통지에 따라, 통지된 제 2단 코드 벡터를 가산기(113)에 입력시킨다.
가산기(113)는, CBa(111)로부터 입력되는 초단 코드 벡터와 CBb(112)로부터 입력되는 제 2단 코드 벡터를 가산하고, 그 가산 결과를 가산기(115)에 입력시킨다.
CBc(114)는, 오차 최소화 결정부(124)로부터의 통지에 따라, 통지된 제 3단 코드 벡터를 가산기(115)에 입력시킨다.
가산기(115)는, 가산기(113)로부터 입력되는 가산 결과와 CBc(114) 로부터 입력되는 제 3단 코드 벡터를 가산하고, 그 가산 결과를 LSP 예측 잔차 코드 벡터로서 증폭기(121)에 입력시킨다.
증폭기(121)는, LSP 예측 잔차 코드북(110)으로부터 입력되는 LSP 예측 잔차 코드 벡터에, 예측 계수 테이블(131)로부터 지시된 가중 계수 β4를 곱하고, 그 곱셈 결과를 가산기(122)에 입력시킨다.
가산기(122)는, 증폭기(103),(104),(121)로부터 각각 입력되는 곱셈 결과(벡터)를 가산하고, 그 가산 결과를 양자화 광대역 LSP 후보로서 오차 산출부(123)에 입력시킨다. 또, 가산기(122)는, 후술하는 오차 최소화 결정부(124)가 초단 코드 벡터~제 3단 코드 벡터와 예측 계수 세트를 각각 결정하면, 그 때의 가산 결과를 양자화 광대역 LSP로서 광대역 부호화 장치(100)의 외부로 필요에 따라 출력한다. 이 외부로 출력된 양자화 광대역 LSP는 음성 신호를 부호화하는 도시하지 않은 다른 블록 등에서의 처리에 이용된다.
오차 산출부(123)는, 양자화 타겟(target)이 되는 음성 신호의 광대역 LSP와, 가산기(122)로부터 입력되는 가산 결과(양자화 광대역 LSP 후보)의 오차를 산출하고, 산출한 오차를 오차 최소화 결정부(124)에 입력시킨다. 또한, 오차 산출부(123)에서 산출되는 오차는 입력된 LSP 벡터간의 제곱 오차이면 된다. 또, 입력된 LSP 벡터의 특징에 따라 가중을 행하도록 하면, 한층 더 청감상의 품질을 좋게 할 수 있다. 예를 들면, ITU-T권고 G.729에서는, 3.2.4장(Quantization of the LSP coefficients)의 (21)식의 가중 제곱 오차(가중 유클리드 거리)를 이용하여 오차 최소화를 행한다.
오차 최소화 결정부(124)는, 오차 산출부(123)로부터 입력되는 오차가 최소가 되는 초단 코드 벡터~제 3단 코드 벡터와 예측 계수 세트를 결정하고, 결정한 초단 코드 벡터~제 3단 코드 벡터와 예측 계수 세트를 나타내는 부호화 데이터를 생성하고, 생성한 부호화 데이터를 도시하지 않은 무선 송신부 등에 입력시킨다. 또한, 오차 최소화 결정부(124)는, 오차 산출부(123)로부터 입력되는 오차가 최소가 되는 초단 코드 벡터~제 3단 코드 벡터와 예측 계수 세트를 결정할 때에, CBa(111), CBb(112) 및 CBc(114)와 예측 계수 테이블(131)에 대해, 그 출력을 순차적으로 변경하도록 통지한다. 즉, 오차 최소화 결정부(124)는, 부호화 데이터로 표시되는 초단 코드 벡터~제 3단 코드 벡터와 예측 계수 세트를 시행 착오적으로 결정한다.
예측 계수 테이블(131)은, 증폭기(103),(104),(121)에 지시하는 가중 계수의 조합인 예측 계수 세트를 복수 저장하고 있어, 오차 최소화 결정부(124)로부터의 통지에 따라, 저장하고 있는 예측 계수 세트 중에서 통지된 1 세트를 선택하고, 선택한 예측 계수 세트에 포함된 가중 계수를 사용하도록, 증폭기(103),(104),(121)에 각각 지시한다.
또한, 광대역 부호화 장치(100)는, 도시하지 않은 무선 송신부를 구비하여, 음성 신호의 양자화 협대역 LSP를 소정 방식으로 부호화한 부호화 데이터와, 오차 최소화 결정부(124)로부터 입력되는 양자화 광대역 LSP 후보와 음성 신호의 광대역 LSP와의 오차가 최소가 되는 초단 코드 벡터~제 3단 코드 벡터와 예측 계수 세트를 나타내는 부호화 데이터, 즉 양자화 광대역 LSP를 구성하는 부호화 데이터를 포함한 무선 신호를 생성하고, 생성한 무선 신호를 후술하는 광대역 복호 장치(300)를 탑재하는 휴대 전화 등의 통신 단말 장치에 무선 송신한다. 또한, 광대역 부호화 장치(100)로부터 송신된 무선 신호는, 일단 기지국 장치에 수신되어 증폭 등 된 후에, 광대역 복호 장치(300)에 수신된다.
도 2는 본 실시형태에 있어서의 비선형 예측부(102)의 주요한 내부 구성을 나타내는 블록도이다. 비선형 예측부(102)는 오차 산출부(201), 최소화부(202), 분류용 코드북(210) 및 광대역 코드북(220)을 구비한다. 또, 분류용 코드북(210)은 분류용 코드 벡터(CVk: k=1~n)를 저장하는 n개의 분류용 코드 벡터 저장부(211) 및 선택부(212)를 구비한다. 또, 광대역 코드북(220)은, 광대역 코드 벡터(CVk': k=1~n)를 저장하는 n개의 광대역 코드 벡터 저장부(221) 및 선택부(222)를 구비한다. 여기서, 1개의 분류용 코드 벡터 저장부(211)에는, 1 종류의 CVk가 저장되어 있는 것으로 하고, 마찬가지로 1개의 광대역 코드 벡터 저장부(221)에는, 1 종류의 CVk'가 저장되어 있는 것으로 한다. 또한, 도 2에서는, 동일한 기능을 발휘하는 복수의 구성요소에 대해서 각각 다른 참조번호를 교부하고 있지만, 본 명세서에서는, 이러한 구성요소에 대해 총괄적으로 설명할 경우에는, 그 참조번호를 생략한다.
협대역-광대역 변환부(101)는, 협대역 LSP의 차원 수를 단순히 광대역 LSP의 차원수로 변환하는 업 샘플링을 행한다. 이 업 샘플링에 의하면, 광대역 LSP에 협대역 LSP의 특징이 반영되어, 변환 광대역 LSP의 저역부(협대역 LSP가 정의되는 대역)에 원래의 협대역 LSP의 특징이 나타난다. 따라서, 협대역-광대역 변환부(101)에서 얻어지는 변환 광대역 LSP는, 업 샘플링에 의해 외관상 광대역으로 되어 있지만, 음성 신호로서는 실질적으로 협대역의 데이터인 채이다. 비선형 예측부(102)는, 이 변환 광대역 LSP를, 협대역용 코드북(분류용 코드북(210)) 및 광대역용 코드북(광대역 코드북(220))을 이용해 아래와 같이 코드북 매핑을 이용한 벡터 양자화를 행하여, 얻어지는 코드 벡터를 음성 신호의 광대역 LSP의 비선형 예측 결과로서 출력한다.
오차 산출부(201)는, 협대역-광대역 변환부(101)로부터 입력되는 변환 광대역 LSP와, 후술하는 분류용 코드북(210)으로부터 순차적으로 입력되는 CVk(k=1~n)의 제곱 오차를 순서에 따라 산출하고, 그 산출 결과를 최소화부(202)에 입력시킨다. 또한, 오차 산출부(201)는, 벡터의 유클리드 거리(즉, 제곱 오차)를 산출해도 좋고, 벡터의 가중 유클리드 거리(즉, 가중 제곱 오차)를 산출해도 좋다.
최소화부(202)는, 오차 산출부(201)로부터 변환 광대역 LSP와 CVk의 제곱오차가 입력될 때마다, 분류용 코드북(210)으로부터 오차 산출부(201)에 CVk+1이 입력되도록 선택부(212)에 대해서 지시함과 동시에, CV1~CVn에 대한 제곱 오차를 축적하고, 축적한 것 중에서 최소의 제곱 오차를 나타내는 CVk를 특정하고, 그 특정한 CVk의 「k」를 광대역 코드북(220)에 있어서의 선택부(222)에 통지한다.
분류용 코드북(210)은, CVk를 복수 포함하여 구성되어, 최소화부(202)로부터 지시된 CVk를 오차 산출부(201)에 입력시킨다.
분류용 코드 벡터 저장부(211)는, 변환 광대역 LSP를 나타내는 기준 벡터인 CVk를 각각 저장하여, 선택부(212)에 의해 오차 산출부(201)와 접속되었을 때에, 저장한 CVk를 선택부(212)를 경유해 오차 산출부(201)에 입력시킨다.
선택부(212)는, 최소화부(202)로부터의 지시에 따라, 오차 산출부(201)에 접속할 분류용 코드 벡터 저장부(211-1)~(211-n)를 순차적으로 전환하여, CV1~CVn을 순차적으로 오차 산출부(201)에 입력시킨다.
광대역 코드북(220)은, CVk에 대응화된 CVk'를 복수 포함하여 구성되어, 최소화부(202)로부터의 통지에 따라, 최소화부(202)가 특정한 CVk에 대응화된 CVk'를 비선형 예측 결과로서 선출하고, 그 선출한 비선형 예측 결과를 증폭기(103)에 입력시킨다.
광대역 코드 벡터 저장부(221)는, CVk 각각과 대응화된 CVk'를 복수 포함하여 구성되어, 후술하는 선택부(222)에 의해 증폭기(103)와 접속되었을 때에, 보유하는 CVk'를 증폭기(103)에 입력시킨다. 또한, CVk와 CVk'의 대응화는 학습 데이터를 이용해 설계된다. 구체적으로는, 학습 데이터가 되는 음성 신호로부터 쌍이 되는 협대역 스펙트럼 데이터와 광대역 스펙트럼 데이터를 생성하고, 협대역 스펙트럼 데이터(또는 광대역 스펙트럼 데이터)를 LBG 알고리즘 등을 이용하여 n클래스로 클러스터링(Clustring)하여 CVk를 작성한다. 그리고, 각 클래스로 클러스터링된 스펙트럼 데이터의 쌍으로 되어있는 광대역 스펙트럼 데이터(또는 협대역 스펙트럼 데이터)의 평균값을 구하여 광대역의 n클래스의 CVk'를 작성함으로써, CVk와 CVk'의 대응화를 행한다.
선택부(222)는, 최소화부(202)로부터 k가 통지되었을 때에, 최소화부(202)가 특정한 CVk에 대응화된 CVk'를 저장하는 광대역 코드 벡터 저장부(221)와 증폭기(103)를 접속시킨다.
이와 같이, 본 실시형태에서는, 비선형 예측부(102)에 있어서, 코드북 매핑 기술을 사용한 비선형 예측이 행해진다.
도 3은 본 실시형태에 따른 광대역 LSP 예측 장치를 구비하는 광대역 복호 장치(300)의 주요한 구성요소를 나타내는 블록도이다. 광대역 복호 장치(300)는 협대역-광대역 변환부(101), 비선형 예측부(102), 증폭기(103),(104),(121), LSP 예측 잔차 코드북(110), 가산기(122), 예측 계수 테이블(131) 및 인덱스 복호부(324)를 구비한다. 따라서, 광대역 복호 장치(300)는, 광대역 부호화 장치(100)의 구성요소와 동일한 구성요소를 많이 구비하기 때문에, 본 실시형태에서는, 이러한 동일한 구성요소에 대해서는, 그 설명을 생략한다.
인덱스 복호부(324)는, 광대역 부호화 장치(100)로부터 송신된 무선 신호에 포함되는 양자화 광대역 LSP를 구성하는 부호화 데이터를 받아, 광대역 복호 장치(300)에 있어서의 LSP 예측 잔차 코드북(110)의 CBa(111), CBb(112) 및 CBc(114)와 예측 계수 테이블(131)에 대해서, 이들이 출력해야 할 초단 코드 벡터~제 3단 코드 벡터나 예측 계수 세트를 통지한다.
또한, 광대역 복호 장치(300)는, 도시하지 않은 무선 수신부를 구비하여, 이 무선 수신부에 있어서, 광대역 부호화 장치(100)로부터 송신된 무선 신호를 수신하 여, 그 무선 신호에 포함되는 음성 신호의 양자화 협대역 LSP를 나타내는 부호화 데이터 및 양자화 광대역 LSP를 구성하는 부호화 데이터를 추출한다. 또, 광대역 복호 장치(300)는, 도시하지 않은 협대역 LSP 복호부를 구비하여, 이 협대역 LSP 복호부에 있어서, 무선 수신부에서 추출한 음성 신호의 양자화 협대역 LSP를 복호한다. 그리고, 광대역 복호 장치(300)에 있어서, 도시하지 않은 무선 수신부는, 그 추출한 양자화 광대역 LSP를 구성하는 부호화 데이터를 인덱스 복호부(324)에 입력시키고, 또 도시하지 않은 협대역 LSP 복호부는, 복호한 음성 신호의 양자화 협대역 LSP를 협대역-광대역 변환부(101)에 입력시킨다.
따라서, 광대역 복호 장치(300)는, 광대역 부호화 장치(100)와 동일한 구성요소를 구비하여, 광대역 부호화 장치(100)에 의해 생성된 음성 신호의 양자화 협대역 LSP와 양자화 광대역 LSP를 구성하는 부호화 데이터를 기초로, 이 구성요소를 동작시킴으로써, 광대역 부호화 장치(100)가 생성한 양자화 광대역 LSP와 동일한 양자화 광대역 LSP를 생성하게 된다.
이와 같이, 본 실시형태에서는, 가중 계수 β1을 곱한 비선형 예측 결과와 가중 계수 β2를 곱한 변환 광대역 LSP의 합(合)을 이용해 음성 신호의 광대역 LSP를 예측하여, 또 그 예측 결과와 실제 음성 신호의 광대역 LSP의 잔차를 산출하여 그 잔차에 가장 근사(近似)하는 LSP 예측 잔차 코드 벡터를 생성한다. 또, 본 실시형태에서는, 음성 신호의 광대역 LSP의 예측 결과와 LSP 예측 잔차 코드 벡터에 가중 계수 β4를 곱한 벡터를 가산함으로써, 양자화 광대역 LSP를 생성한다. 즉, 본 실시형태에 의하면, 종래 기법과 같이 비선형 예측만, 또는, 업 샘플에 의해서만 음성 신호의 광대역 LSP를 예측하는 것이 아니라, 비선형 예측에 의한 예측값과 업 샘플에 의한 예측값을 동시에 최대한으로 이용한다. 그 때문에, 본 실시형태에 의하면, 음성 신호의 양자화 협대역 LSP로부터 음성 신호의 광대역 LSP를 예측할 경우의 예측 성능을 높일 수 있으며, 그 결과로서, 이 경우에 있어서의 양자화 성능도 개선할 수 있다.
또, 본 실시형태에서는, 동일 프레임 내의 서로 유사한 이러한 값을 동시에 고려하고 있으므로, 프레임내 상관을 이용하여 예측을 행하게 되어, 예측 성능을 높일 수 있으며, 그 결과로서, 이 경우에 있어서의 양자화 성능도 개선할 수 있다.
또, 본 실시형태에 의하면, 양자화 광대역 LSP 후보가 각각 다른 신호 처리에 의해 생성된 벡터의 조합으로 구성되기 때문에, 비선형 예측부(102)의 예측 성능이 낮은 경우라 하더라도, 예측 계수 테이블(131)이 증폭기(103),(104),(121)에 지시하는 가중 계수를 적절히 조절함으로써, 양자화 광대역 LSP의 예측 정밀도를 개선할 수 있다. 따라서, 본 실시형태에 의하면, 비선형 예측부(102)의 예측 성능에 대한 요구 조건을 완화할 수 있다. 여기서, 일반적으로, 비선형 예측의 예측 성능이 높을수록, 비선형 예측에 필요한 메모리량이나 연산 처리량은 많아진다. 그 때문에, 전술한 바와 같이 비선형 예측의 예측 성능에 대한 요구 조건이 완화된다고 하는 것은, 그 메모리량이나 연산 처리량을 적게 억제할 수 있다고 하는 것이다. 즉, 본 실시형태에 의하면, 비선형 예측부(102)에 있어서의 메모리량이나 연산 처리량에 제약이 있는 경우라 하더라도, 그 정해진 메모리량이나 연산 처리량의 범위 내에서, 비선형 예측의 예측 효과를 최대한 이용할 수 있다. 환언하면, 본 실시형태에 의하면, 양자화 광대역 LSP의 예측 성능을 고성능화할 수 있음과 동시에, 복수의 예측 성분 및 그들에 곱하는 가중 계수를 자유롭게 설계하거나 설정하거나 할 수 있는 설계 자유도의 향상을 꾀할 수 있기 때문에, 광대역 부호화 장치에 대해서, 오류 내성과 양자화 성능의 밸런스를 임의로 설정할 수 있다.
또한, 본 실시형태에 대해서, 이하와 같이 변형하거나 응용하거나 해도 좋다.
본 실시형태에서는, 비선형 예측부(102)에 있어서 코드북 매핑 기술을 사용해 비선형 예측을 행하는 경우에 대해 설명했지만, 본 발명은 이 경우로 한정되는 것은 아니며, 예를 들면 비선형 예측부(102)에 있어서 뉴럴네트(Neural Network)나 변환 함수를 이용한 사상(寫像) 변환 등을 사용해 비선형 예측을 행하여도 좋다.
또, 본 실시형태에서는, 비선형 예측부(102)에 있어서, CVk와 CVk'가 1 대 1로 대응화되는 경우에 대해 설명했지만, 본 발명은 이 경우로 한정되는 것은 아니며, 예를 들면 1개의 CVk에 복수의 CVk'가 대응화되고, 분류용 코드북(210)으로부터 광대역 코드북(220)에 CVk'의 선출에 필요한 정보가 더 전송되도록 해도 좋다. 이와 같이 하면, 비선형 예측부(102)에 있어서의 비선형 예측에 필요한 전송 데이터량을 거의 증가시키는 일 없이, 비선형 예측 성능을 효과적으로 개선할 수 있다.
또, 본 실시형태에서는, 비선형 예측부(102)의 주요한 내부 구성이 도 2에 나타내는 형태인 경우에 대해서 설명했지만, 본 발명은 이 경우로 한정되는 것은 아니며, 예를 들면 비선형 예측부(102)의 주요한 내부 구성이 도 4에 나타내는 형 태이어도 좋다.
여기서, 도 4는 본 실시형태의 변형예에 있어서의 비선형 예측부(102)의 주요한 내부 구성을 나타내는 블록도이다. 이 변형예에 있어서도, 비선형 예측부(102)는 코드북 매핑 기술을 사용하여 비선형 예측을 행한다.
도 4에 나타내는 변형예에 있어서, 비선형 예측부(102)는 분류용 코드 벡터 저장부(211), 광대역 코드 벡터 저장부(221), 가중 계수 결정부(401) 및 가중 합 산출부(402)를 구비한다. 이 변형예에 있어서, 분류용 코드 벡터 저장부(211)와 광대역 코드 벡터 저장부(221)는, 본 실시형태와 동일하게 대응화되어 있어, 가중 계수 결정부(401)는 CVk 각각에 가중 계수를 시행 착오적으로 곱하여, 그 곱셈 결과와 변환 광대역 LSP와의 오차가 최소가 되는 가중 계수의 조합을 결정하고, 결정한 가중 계수의 조합을 가중 합 산출부(402)에 통지한다.
가중 합 산출부(402)는, 가중 계수 결정부(401)로부터 결정된 가중 계수의 조합을 통지받으면, CVk에 대응화된 CVk'를 광대역 코드 벡터 저장부(221)로부터 추출하고, 추출한 CVk'에 통지된 가중 계수를 각각 곱해 그 곱셈 결과를 가산하여, 그 가산 결과를 비선형 예측 결과로서, 증폭기(103)에 입력시킨다.
이와 같이, 도 4에 나타내는 변형예에 의하면, 비선형 예측부(102)로부터 증폭기(103)에 입력되는 비선형 예측 결과가 가중 계수를 각각 곱한 복수의 CVk'의 총합(總合)으로 구성되기 때문에, 비선형 예측 결과의 미세한 조절이 가능하게 되어, 비선형 예측부(102)의 예측 성능을 한층 높일 수 있다.
또, 본 발명에 있어서, 비선형 예측부(102)의 주요한 내부 구성은, 예를 들 면 도 5에 나타내는 형태이어도 좋다. 여기서, 도 5는 본 실시형태의 변형예에 있어서의 비선형 예측부(102)의 주요한 내부 구성을 나타내는 블록도이다.
도 5에 나타내는 변형예에서는, 비선형 예측부(102)는 복수의 변환 함수를 이용하여 비선형 예측을 행한다. 이 변형예에 있어서, 비선형 예측부(102)는 가중 계수 결정부(501), 가중 합 산출부(502) 및 변환 함수 k(k=1~m)를 각각 보유하는 m개의 변환 함수 보유부(511)를 구비한다.
변환 함수 보유부(511)는 각각, 협대역-광대역 변환부(101)로부터 입력되는 변환 광대역 LSP를 보유하는 변환 함수 k(k=1~m)를 이용해 벡터 변환하고, 변환 후의 벡터를 가중 합 산출부(502)에 입력시킨다. 또한, 변환 함수 k는, 미리 학습 데이터를 이용해 작성할 수 있지만, 특별히 한정되는 것은 아니다.
가중 계수 결정부(501)는 변환 함수 보유부(511)로부터 가중 합 산출부(502)에 입력되는 벡터에 곱할 가중 계수를 각각 결정한다. 즉, 협대역-광대역 변환부(101)로부터 입력되는 변환 광대역 LSP를 이용하여, 상기의 가중 계수를 결정하고, 결정한 가중 계수를 가중 합 산출부(502)에 통지한다. 이 가중 계수의 결정 방법으로서는, 예를 들면 특정 대표 벡터에 가까운 입력 벡터에 대해서 특정한 변환 함수를 학습해 설계하여, 각 변환 함수에 할당된 대표 벡터와의 유사도를 기초로 결정하는 방법 등을 들 수 있다.
가중 합 산출부(502)는, 가중 계수 결정부(501)로부터 통지된 가중 계수를 변환 함수 보유부(511)로부터 입력되는 각 벡터에 곱하고, 그 곱셈 결과를 전부 가산하여, 그 가산 결과를 비선형 예측 결과로서 증폭기(103)에 입력시킨다.
또, 본 실시형태에서는, LSP 예측 잔차 코드북(110) 및 예측 계수 테이블(131)은, 비선형 예측부(102)와 관련화되지 않은 경우에 대해 설명했지만, 본 발명은 이 경우로 한정되는 것은 아니며, 예를 들면 비선형 예측부(102) 내에서 결정된 분류 결과 k나 가중 계수 세트를 이용해 변환 광대역 LSP의 클래스 분류를 행하여, 결정된 클래스마다 다른 LSP 예측 잔차 코드북(110)이나 예측 계수 테이블(131)을 전환하여 사용하도록 해도 좋다. 이와 같이, LSP 예측 잔차 코드북이나 예측 계수 테이블의 멀티 모드화를 행하면, 비선형 예측 처리 도중에 얻어지는 정보를 이용할 뿐이기 때문에, 모드 판정을 위한 추가 처리나 새로운 전송 정보를 필요로 하는 일 없이, 비선형 예측부(102)의 예측 성능을 한층 개선할 수 있다.
(실시형태 2)
도 6은 본 발명의 실시형태 2에 따른 광대역 LSP 예측 장치를 구비하는 광대역 부호화 장치(600)의 주요한 구성요소를 나타내는 블록도이다. 광대역 부호화 장치(600)는, 실시형태 1에 따른 광대역 부호화 장치(100)에 있어서, 가산기(122) 및 예측 계수 테이블(131) 대신에 가산기(622) 및 예측 계수 테이블(631)을 구비하고, 또, 지연기(601),(612), 나눗셈기(602) 및 증폭기(603),(604),(605)를 더 구비하는 것이다. 따라서, 광대역 부호화 장치(600)는, 광대역 부호화 장치(100)와 동일한 동작을 행하는 구성요소를 많이 구비하기 때문에, 본 실시형태에서는, 광대역 부호화 장치(600)에 대해, 중복을 피하기 위해, 광대역 부호화 장치(100)와 상위한 구성요소에 대해서만 설명한다.
지연기(601)는, 협대역-광대역 변환부(101)로부터 입력되는 변환 광대역 LSP를 1 프레임 시간 지연시켜, 지연시킨 1 프레임전(前)의 변환 광대역 LSP를 나눗셈기(602)에 입력시킨다.
나눗셈기(602)는, 지연기(601)로부터 입력되는 1 프레임 전의 변환 광대역 LSP를, 후술하는 지연기(612)로부터 입력되는 1 프레임전의 양자화 광대역 LSP로 나누어, 그 나눗셈 결과를 증폭기(603)에 입력시킨다.
증폭기(603)는, 협대역-광대역 변환부(101)로부터 입력되는 변환 광대역 LSP에 대해서 나눗셈기(602)로부터 입력되는 나눗셈 결과를 증폭 계수로 하여 곱해서, 그 곱셈 결과를 증폭기(604)에 입력시킨다.
증폭기(604)는, 예측 계수 테이블(631)로부터 지시된 가중 계수 β6을, 증폭기(603)로부터 입력되는 변환 광대역 LSP에 곱하여, 그 곱셈 결과를 가산기(622)에 입력시킨다.
증폭기(605)는, 지연기(612)로부터 입력되는 1 프레임전의 양자화 광대역 LSP에, 예측 계수 테이블(631)로부터 지시된 예측 계수 β5를 곱하여, 그 곱셈 결과를 가산기(622)에 입력시킨다.
가산기(622)는, 증폭기(103),(104),(121),(604),(605)로부터 각각 입력되는 곱셈 결과를 가산하여, 그 가산 결과 즉 양자화 광대역 LSP 후보를 오차 산출부(123)에 입력시킨다. 또한, 오차 최소화 결정부(124)에서 결정된 오차를 최소로 하는 초단 코드 벡터~제 3단 코드 벡터와 예측 계수 세트를 이용했을 때에 가산 기(622)로부터 출력되는 양자화 광대역 LSP는, 지연기(612)에 입력됨과 동시에, 광대역 부호화 장치(600)의 외부로 필요에 따라 출력한다.
지연기(612)는, 가산기(622)로부터 입력되는 양자화 광대역 LSP를 1 프레임 시간 지연시켜, 그 1 프레임전의 양자화 광대역 LSP를 나눗셈기(602)와 증폭기(605)에 각각 입력시킨다.
예측 계수 테이블(631)은, 증폭기(103),(104),(121),(604),(605)에 지시하는 가중 계수의 조합인 예측 계수 세트를 복수 저장하고 있어, 오차 최소화 결정부(124)로부터의 통지에 따라, 저장된 예측 계수 세트 중에서 통지된 1 세트를 선택하여, 선택한 예측 계수 세트의 각 가중 계수를 증폭기(103),(104),(121),(604),(605)에 각각 지시한다.
도 7은 본 발명의 실시형태 2에 따른 광대역 LSP 예측 장치를 구비하는 광대역 복호 장치(700)의 주요한 구성요소를 나타내는 블록도이다. 광대역 복호 장치(700)는, 실시형태 1에 따른 광대역 복호 장치(300)에 있어서, 가산기(122) 및 예측 계수 테이블(131) 대신에 가산기(622) 및 예측 계수 테이블(631)을 구비하고, 또 지연기(601),(612), 나눗셈기(602) 및 증폭기(603),(604),(605)를 더 구비하는 것이다. 따라서, 광대역 복호 장치(700)의 주요한 구성요소는 전부, 광대역 복호 장치(300)나 광대역 부호화 장치(600)의 구성요소와 동일한 동작을 행하기 때문에, 본 실시형태에서는, 중복을 피하기 위해, 광대역 복호 장치(700)에 대한 설명을 생략한다.
이와 같이, 본 실시형태에 의하면, 광대역 부호화 장치(600) 또는 광대역 복 호 장치(700)에 있어서, 양자화 협대역 LSP로부터 음성 신호의 광대역 LSP를 예측할 때, 1 프레임전(前)의 양자화 광대역 LSP가 이용되기 때문에, 프레임간 상관과 프레임내 상관을 효율적으로 이용하여, 음성 신호의 대역 스케일러블 부호화 또는 그 복호에 있어서의 예측 성능을 개선할 수 있다.
또한, 본 실시형태에서도, 실시형태 1과 마찬가지로, 비선형 예측부(102)의 내부 구성을 도 4 및 도 5에 나타내는 형태로 해도 좋다. 또, 본 실시형태에서도, 비선형 예측부(102)의 내부에서 얻어지는 정보를 이용해 변환 광대역 LSP의 클래스 분류를 행하고, LSP 예측 잔차 코드북(110)과 예측 계수 테이블(631)의 적어도 한쪽을 분류된 클래스에 따라 전환하는 멀티 모드 구성으로 해도 좋다.
(실시형태 3)
도 8은, 본 발명의 실시형태 3에 따른 광대역 LSP 예측 장치를 구비하는 광대역 부호화 장치(800)의 주요한 구성요소를 나타내는 블록도이다. 광대역 부호화 장치(800)는, 실시형태 1에 따른 광대역 부호화 장치(100)에 있어서, 증폭기(801)를 더 구비하는 것이다. 또, 비선형 예측부(102), 가산기(122) 및 예측 계수 테이블(131)은, 그 기본적 동작은 동일하지만, 새로운 동작도 행하므로, 비선형 예측부(102a), 가산기(122a), 예측 계수 테이블(131a)과 같이 나타낸다. 따라서, 광대역 부호화 장치(800)는, 광대역 부호화 장치(100)와 동일한 동작을 행하는 구성요소를 많이 구비하므로, 본 실시형태에서는, 광대역 부호화 장치(800)에 대해, 중복을 피하기 위해, 광대역 부호화 장치(100)와 상위한 구성요소에 대해서만 설명한 다.
비선형 예측부(102a)는, 후술하는 바와 같이, 그 비선형 예측 결과를 증폭기(801)에도 입력시킨다.
예측 계수 테이블(131a)은, 증폭기(103),(104),(121),(801)에 지시하는 가중 계수의 조합인 예측 계수 세트를 복수 저장하고 있어, 오차 최소화 결정부(124)로부터의 통지에 따라, 저장하고 있는 예측 계수 세트 중에서 통지된 1 세트를 선택하여, 선택한 예측 계수 세트에 포함되는 가중 계수를 사용하도록, 증폭기(103),(104),(121),(801)에 각각 지시한다.
증폭기(801)는, 비선형 예측부(102a)로부터 입력되는 비선형 예측 결과에 대해서, 예측 계수 테이블(131a)로부터 통지되는 가중 계수 β3을 곱하여, 그 곱셈 결과를 가산기(122a)에 입력시킨다.
가산기(122a)는, 증폭기(103),(104),(121),(801)로부터 각각 입력되는 곱셈 결과(벡터)를 가산하여, 그 가산 결과, 즉 음성 신호의 광대역 LSP의 예측 결과를 출력한다.
또한, 본 실시형태에서는, 설명을 간단히 하기 위해, 각 가중 계수의 표기를 실시형태 1과 동일하게 하고 있지만, 이러한 값은 설계 단계에 있어서의 최적화에 의해 정해지는 값으로서, 실제값은 실시형태 1과는 다르다.
도 9는 본 실시형태에 있어서의 비선형 예측부(102a)의 주요한 내부 구성을 나타내는 블록도이다.
실시형태 1에 있어서의 비선형 예측부(102)는, 협대역-광대역 변환부(101)로부터 입력되는 변환 광대역 LSP와 가장 근사(近似)하는 코드 벡터를, 분류용 코드북(210)으로부터 선택하고, 그 코드 벡터에 대응하는 광대역 코드북(220)의 코드 벡터를 증폭기(103)에 출력한다. 이것에 반해, 본 실시형태에 있어서의 비선형 예측부(102a)는 분류용 코드북(210)에서 최종적으로 선택된 코드 벡터를 증폭기(801)에 출력한다.
도 10은 본 실시형태에 따른 광대역 LSP 예측 장치를 구비하는 광대역 복호 장치(1000)의 주요한 구성요소를 나타내는 블록도이다. 또한, 광대역 복호 장치(1000)는, 실시형태 1에 따른 광대역 복호 장치(300)와 동일한 기본적 구성을 취하고 있으며, 또 증폭기(801) 등에 대해서도 이미 설명했으므로, 여기에서는 설명을 생략한다.
이와 같이, 본 실시형태에 의하면, 실질적으로는 협대역 LSP인 변환 광대역 LSP와, 코드북 매핑 후의 광대역 LSP(비선형 예측 광대역 LSP)와, 코드북 매핑용 코드북에서 벡터 양자화된 변환 광대역 LSP의 3개 LSP의 가중 합을 가지고 음성 신호의 광대역 LSP의 예측 결과로 하고 있다. 즉, 음성 신호의 광대역 LSP를 예측하는 예측 광대역 LSP는, 이하의 수학식 (2)로 표시된다.
예측 광대역 LSP
 =β2×협대역 LSP+β1×비선형 예측 광대역 LSP+β3×코드북 매핑용 코드북에서 벡터 양자화된 협대역 LSP … (2)
한편, 실시형태 1에서는, 협대역 LSP를 코드북 매핑에 의해 광대역 LSP로 변환하여, 변환 전후의 LSP의 가중 합을 광대역 LSP의 예측 결과로 하고 있으므로, 예측 광대역 LSP는, 이하의 수학식 (3)으로 표시되게 된다.
예측 광대역 LSP
 =β2×협대역 LSP+β1×비선형 예측 광대역 LSP … (3)
따라서, 실시형태 1과 비교해, 코드북 매핑용 코드북에서 벡터 양자화된 협대역 LSP도 더 고려하게 되기 때문에, 예측 성능이 한층 더 향상하여, 부호화 성능을 향상시킬 수 있다.
또한, 본 실시형태는, 실시형태 2와 조합할 수도 있다. 도 11, 도 12는 본 실시형태를 실시형태 2와 조합한 경우의 광대역 부호화 장치(1100) 및 광대역 복호 장치(1200)의 주요한 구성요소를 나타내는 블록도이다. 기본적 동작은 이미 나타낸 바와 같으므로 설명을 생략한다.
(실시형태 4)
실시형태 3에서 나타낸 각 증폭기에서 곱해지는 가중 계수는 반드시 양(+)의 수인 것만은 아니다. 예를 들면, 각 계수의 최적값을 시뮬레이션에 의해 구하면, β1이 양(+)의 수일 때, β3은 -β1에 가까운 음(-)의 값이 되고, β2는 1.0에 가까운 값이 되는 수가 많다.
이러한 상황 하에서는, 상기 수학식 (2)는, 협대역-광대역 변환부(101)로부 터 입력되는 협대역 LSP와 협대역용 코드북에 저장되어 있는 코드 벡터의 가중 오차를, 광대역용 코드북으로부터 출력되는 코드 벡터에 가산함으로써, 예측 광대역 LSP를 구하고 있는 것에 상당한다. 이 때, 실시형태 3에서 나타낸 비선형 예측부(102a), 증폭기(801), 가산기(122a)의 전체를, 1개의 비선형 예측부(102b)로 간주할 수 있다.
도 13은 본 발명의 실시형태 4에 따른 광대역 LSP 예측 장치를 구비하는 광대역 부호화 장치(1300)의 주요한 구성요소를 나타내는 블록도이다. 또한, 광대역 부호화 장치(1300)도, 실시형태 1에 따른 광대역 부호화 장치(100)와 동일한 동작을 행하는 구성요소를 많이 구비한다.
이 구성에 의하면, β3=-β1로서, 감산기(1301)가 협대역 LSP와 코드북 매핑용 코드북에서 벡터 양자화된 협대역 LSP의 차(差)를 산출함으로써, 예측 광대역 LSP를 아래의 수학식 (4)와 같이 구할 수 있다.
예측 광대역 LSP
 =β1×비선형 예측 광대역 LSP+β2×(협대역 LSP-코드북 매핑용 코드북에서 벡터 양자화된 협대역 LSP) … (4)
도 14는 본 실시형태에 따른 광대역 LSP 예측 장치를 구비하는 광대역 복호 장치(1400)의 주요한 구성요소를 나타내는 블록도이다. 기본적 동작은 이미 나타낸 대로이므로 설명을 생략한다.
이와 같이, 본 실시형태에 의하면, 상기 수학식 (4)의 예측 모델을 이용함으 로써, 예측 계수(가중 계수)의 수를 하나 줄일 수 있어, 그 만큼 메모리량을 절약할 수 있다.
또한, 본 실시형태는, 실시형태 2와 조합할 수도 있다. 도 15, 도 16은 본 실시형태를 실시형태 2와 조합한 경우의 광대역 부호화 장치(1500) 및 광대역 복호 장치(1600)의 주요한 구성요소를 나타내는 블록도이다. 이것들도 기본적 동작은 이미 나타낸 대로이므로 설명을 생략한다.
(실시형태 5)
본 발명의 실시형태 5에 따른 광대역 부호화 장치의 기본적 구성은, 실시형태 1에 따른 광대역 부호화 장치(100)와 동일하다. 따라서, 실시형태 1과 다른 구성인 비선형 예측부(102c)에 대해 이하에서 설명한다.
도 17은 비선형 예측부(102c)의 주요한 내부 구성을 나타내는 블록도이다.
비선형 예측부(102c)는 실시형태 1에 나타낸 광대역 코드북(220)(도 2 참조)이 다단(多段) 구성으로 되어 있다. 즉, 본 실시형태에 따른 광대역 코드북(220c)은 멀티 스테이지화 되어 있다. 도 17의 예에서는, 2 스테이지화이다. 여기서, x는 광대역 코드북(220c)의 초단 코드북(221-11~221-1x)이 저장하는 코드 벡터수를 나타내고 있으며, y는 광대역 코드북(220c)의 2단째 코드북(221-21~221-2y)이 저장하는 코드 벡터수를 나타내고 있다. 양자에게는 n=x×y의 관계가 있다.
분류용 코드북(210)의 분류용 코드 벡터 CVk와 광대역 코드북(220c)으로부터 생성되는 광대역 코드 벡터 CVk'와의 대응화는, 예를 들면 이하와 같이 미리 설계 해 둔다. 여기에서는, x=8, y=8, n=64의 경우를 예로 들어 설명한다.
Figure 112007041858759-PCT00002
상기와 같이, 분류용 코드 벡터 CVk와 광대역 코드 벡터 CVk'를 대응화시켜 두면, 분류용 코드북(210)으로부터 선택된 코드 벡터의 인덱스의 상위 3비트가, 광대역 코드북(220c)의 초단 코드북(221-11~ 221-1x)으로부터 선택되는 코드 벡터 번호가 되고, 또, 분류용 코드북(210)으로부터 선택된 코드 벡터의 인덱스의 하위 3비트가, 광대역 코드북(220c)의 2단째 코드북(221-21~221-2y)으로부터 선택되는 코드 벡터 번호가 된다. 따라서, 분류용 코드 벡터 CVk와 광대역 코드 벡터 CVk'의 대응 관계를 별개의 메모리에 보유해 둘 필요가 없다.
이와 같이, 본 실시형태에 의하면, 분류용 코드북(210) 또는 광대역 코드북(220)의 적어도 한쪽을 멀티 스테이지화하므로, 비선형 예측 처리에 필요한 메모리량을 삭감할 수 있다.
또한, 실시형태 1에 있어서, 광대역 코드북(220)이 아니라 분류용 코드북(210)쪽을 멀티 스테이지화하는 구성도 가능하다. 그러나, 광대역 코드북(220)쪽이 분류용 코드북(210)보다 벡터의 차원수가 많을 경우, 광대역 코드북(220)쪽을 멀티 스테이지화하는 것이 메모리의 삭감량은 커진다.
또, 본 실시형태는 실시형태 3, 4에도 적용할 수 있다. 이 경우, 실시형태 3에서 나타낸 비선형 예측부(102a)는 도 18에 나타내는 비선형 예측부(102c)와 같이 된다.
(실시형태 6)
도 19는 본 발명의 실시형태 6에 따른 광대역 부호화 장치(1900)의 주요한 구성요소를 나타내는 블록도이다. 광대역 부호화 장치(1900)는, 실시형태 1에 따른 광대역 부호화 장치(100)와 동일한 동작을 행하는 구성요소를 많이 구비하기 때문에, 본 실시형태에서도, 중복을 피하기 위해서, 광대역 부호화 장치(100)와 상위한 구성요소에 대해서만 설명한다.
광대역 부호화 장치(1900)는, 코드북 매핑의 후보를 선택하고, 이 선택에 관한 정보를 광대역 복호 장치에 출력한다. 구체적으로는, 분류용 코드북에서 복수의 후보 코드 벡터를 선택하고, 이들 중에서 가장 입력 광대역 LSP 벡터와의 오차가 작은 것을 선택하여, 이 선택 정보를 부호화 데이터와 함께 광대역 복호 장치에 전송한다.
도 20은 비선형 예측부(102d)의 주요한 내부 구성을 나타내는 블록도이다.
후보 선택부(2001)는, 실시형태 1에 나타낸 최소화부(202)와 마찬가지로, 제곱 오차를 최소로 하는 1개의 분류용 코드 벡터를 선택한다. 또 후보 선택부(2001)는, 제곱 오차가 작은 순서로 복수의 분류용 코드 벡터(후보 코드 벡터)를 선택하고, 광대역 코드북(220)에 대해, 선택한 복수의 후보 코드 벡터에 각각 대응하는 복수의 광대역 코드 벡터를 출력하도록 지시한다. 또한, 도 20에서는 후보수가 4인 경우를 예로 들고 있다. 이하의 설명에 있어서도 후보수는 4로 한다.
광대역 코드북(220)은 후보 선택부(2001)로부터 지시된 4개의 광대역 코드 벡터를 후보 코드 벡터 코드북(2002)에 출력한다.
후보 코드 벡터 코드북(2002)은 입력된 복수의 광대역 코드 벡터를 후보 코드 벡터 저장부 CVa~CVd에 저장한다. 이 때, 4개의 광대역 코드 벡터는, 오차 산출부(201)에서 산출된 오차가 작은 쪽부터, CVa, CVb, CVc, CVd 차례로 저장된다. 이 4개의 광대역 코드 벡터는 오차 최소화 결정부(2006)로부터의 지시에 따라 1개씩 오차 산출부(2005)에 출력된다.
오차 산출부(2005)는, 입력된 광대역 LSP와 광대역 코드 벡터의 오차를 오차 산출부(201)와 동일하게 산출하여, 오차 최소화 결정부(2006)에 출력한다.
오차 최소화 결정부(2006)는, 후보 코드 벡터 코드북(2002)에 저장된 복수의 광대역 코드 벡터 중에서, 가장 입력 광대역 LSP 벡터와의 오차가 작아지는 것을 귀환 제어를 이용하여 구한다. 구체적으로는, 오차 최소화 결정부(2006)는, 실시형태 1에 나타낸 최소화부(202)와 마찬가지로, 후보 코드 벡터 코드북(2002)에 저장된 4개의 광대역 코드 벡터 중에서, 오차 산출부(2005)로부터 출력되는 오차가 최소가 되는 코드 벡터를 1개 선택하여, 후보 코드 벡터 코드북(2002)에 대해, 이 선택된 광대역 코드 벡터를 증폭기(103)에 출력하도록 지시한다. 또, 오차 최소화 결정부(2006)는 이 선택된 광대역 코드 벡터에 관한 정보(선택 정보)도 출력한다.
도 21은 본 실시형태에 따른 광대역 부호화 장치(1900)에서 생성된 부호화 데이터 및 선택 정보를 복호하는 광대역 복호 장치(2100)의 주요한 구성요소를 나타내는 블록도이다. 광대역 복호 장치(2100)는, 실시형태 1에 따른 광대역 복호 장치(300)와 동일한 동작을 행하는 구성요소를 많이 구비하기 때문에, 중복을 피하기 위해서, 광대역 복호 장치(300)와 상위한 구성요소에 대해서만 설명한다.
비선형 예측부(102e)는, 상기의 비선형 예측부(102d)로부터 전송되어 온 선택 정보가 입력되어, 이 선택 정보에 기초하는 비선형 예측 결과를 증폭기(103)에 출력한다. 도 22는 비선형 예측부(102e)의 주요한 내부 구성을 나타내는 블록도이다.
선택 정보 복호부(2201) 이외의 구성은 상기의 비선형 예측부(102d)와 동일하므로 그 설명을 생략한다. 선택 정보 복호부(2201)는, 입력된 선택 정보를 복호하여, 이 선택 정보로 특정된 코드 벡터를 출력하도록, 후보 코드 벡터 코드북(2002)에 지시를 내린다.
이와 같이, 본 실시형태에 의하면, 분류용 코드북으로부터 복수의 후보를 선택하고, 예측 오차 또는 양자화 오차를 최소로 하는 코드 벡터를 복수의 후보 중에서 또 선택하므로, 비선형 예측의 예측 정밀도를 개선할 수 있다.
또한, 본 실시형태에 따른 비선형 예측부(102d),(102e)는 실시형태 3, 4에도 적용 가능하다.
(실시형태 7)
도 23은 본 발명의 실시형태 7에 따른 광대역 부호화 장치(2300)의 주요한 구성요소를 나타내는 블록도이다. 광대역 부호화 장치(2300)도 실시형태 6과 마찬가지로, 실시형태 1에 따른 광대역 부호화 장치(100)와 동일한 동작을 행하는 구성요소를 많이 구비하기 때문에, 중복을 피하기 위해서, 광대역 부호화 장치(100)와 상위한 구성요소에 대해서만 설명한다.
본 실시형태에서는, 비선형 예측부(102f)가, 양자화 결과(오차 최소화 결정부(124f)의 출력)를 이용하여 코드북 매핑의 후보를 선택하는 점이 실시형태 6과 다르다. 따라서, 비선형 예측부(102f) 내부에서 광대역 LSP와의 오차를 최소화하는 일은 하지 않고, 비선형 예측부(102f) 외부의 오차 최소화 결정부(124f)가, 광대역 LSP와의 오차를 최소화하는 귀환 제어를 행한다.
비선형 예측부(102f)는, 오차 최소화 결정부(124f)로부터의 지시에 따라, 소정수의 비선형 예측 결과를 증폭기(103)에 순차적으로 출력한다. 도 23의 예에서는, 비선형 예측부(102f)는, CVa~CVd에 저장되어 있는 4개의 코드 벡터를 소정수의 비선형 예측 결과로서 증폭기(103)에 출력한다.
오차 최소화 결정부(124f)는 이 소정수의 비선형 예측 결과를 각각 이용했을 경우의 초단 코드 벡터~제 3단 코드 벡터와 예측 계수의 세트를 결정한다. 그리고, 이들 파라미터 중에서, 오차 산출부(123)로부터 출력되는 오차가 가장 작아지 는 비선형 예측 결과를 구하여, 이 비선형 예측 결과 및 해당 비선형 예측 결과를 이용했을 경우에 결정되는 초단 코드 벡터~제 3단 코드 벡터와 예측 계수의 세트를 부호화 데이터로서 무선 송신부(도시하지 않음) 등에 출력한다.
도 24는 비선형 예측부(102f)의 주요한 내부 구성을 나타내는 블록도이다. 실시형태 6에 나타낸 비선형 예측부(102d)와 동일한 구성에 대해서는, 중복을 피하기 위해 설명을 생략한다.
후보 코드 벡터 코드북(2002)은, 오차 최소화 결정부(124f)로부터의 지시 정보가 입력되어, 그 지시 정보를 기초로 1개의 코드 벡터를 선택하여, 증폭기(103)에 출력한다.
도 25는 본 실시형태에 따른 광대역 부호화 장치(2300)에서 생성된 부호화 데이터를 복호하는 광대역 복호 장치(2500)의 주요한 구성요소를 나타내는 블록도이다.
광대역 부호화 장치(2300)가 생성한 부호화 데이터에는, 실시형태 1에서 나타낸 정보에 더해, 비선형 예측부(102f)로부터 출력되는 비선형 예측 결과의 선택 정보가 포함되어 있다. 그래서, 인덱스 복호부(324f)는 입력된 부호화 데이터로부터 상기 선택 정보를 복호하여 비선형 예측부(102f)에 입력시킨다.
비선형 예측부(102f)는 입력된 선택 정보에 기초한 비선형 예측 결과를 증폭기(103)에 출력한다. 또한, 비선형 예측부(102f)의 내부 구성은 도 24에 나타낸 구성과 동일하다.
이와 같이, 본 실시형태에 의하면, 분류용 코드북으로부터 복수의 후보를 선 택하고, 예측 오차 또는 양자화 오차를 최소로 하는 코드 벡터를 복수의 후보 중에서 또 선택하므로, 비선형 예측의 예측 정밀도를 개선할 수 있다.
또한, 본 실시형태에 따른 비선형 예측부(102f), 오차 최소화 결정부(124f) 및 인덱스 복호부(324f)는 실시형태 4에도 적용 가능하다.
(실시형태 8)
도 26은 본 발명의 실시형태 8에 따른 광대역 부호화 장치(2600)의 주요한 구성요소를 나타내는 블록도이다. 광대역 부호화 장치(2600)는, 실시형태 3에 따른 광대역 부호화 장치(800)(도 8 참조)와 동일한 동작을 행하는 구성요소를 많이 구비하므로, 본 실시형태에서도, 중복을 피하기 위해, 광대역 부호화 장치(800)와 상위한 구성요소에 대해서만 설명한다.
비선형 예측부(102g)는, 오차 최소화 결정부(124g)로부터의 지시에 따라, 분류용 코드북으로부터 복수의 후보 코드 벡터를 선택하여, 이 코드 벡터에 대응하는 광대역 코드북의 코드 벡터를 증폭기(103)에 출력함과 동시에, 분류 코드북으로부터 선택된 후보 벡터 자체도 증폭기(801)에 출력한다.
오차 최소화 결정부(124g)는 소정수의 광대역 코드 벡터와 분류용 코드 벡터의 세트를 이용했을 경우의 초단 코드 벡터~제 3단 코드 벡터와 예측 계수의 세트를 결정한다. 그리고, 이들 파라미터 중에서, 오차 산출부(123)로부터 출력되는 오차를 가장 작게 하는 분류용 코드 벡터와 광대역 코드 벡터의 세트를 구해, 이 세트와, 이 세트를 이용했을 경우에 결정되는 초단 코드 벡터~제 3단 코드 벡터 및 예측 세트를 나타내는 부호화 데이터를 생성하여, 무선 송신부(도시하지 않음) 등에 입력시킨다.
도 27은 비선형 예측부(102g)의 주요한 내부 구성을 나타내는 블록도이다. 실시형태 7에 나타낸 비선형 예측부(102f)와 동일한 구성에 대해서는, 중복을 피하기 위해 설명을 생략한다.
실시형태 7에 나타낸 비선형 예측부(102f)에 대해, 후보 코드 벡터(분류용 코드 벡터) 코드북(2701)이 추가된 구성이다. 후보 코드 벡터 코드북(2701) 이외의 구성은, 비선형 예측부(102f)와 동일하므로, 그 설명을 생략한다. 후보 코드 벡터 코드북(2701)은, 오차 최소화 결정부(124g)로부터의 지시 정보를 기초로 코드 벡터를 선택하여, 증폭기(801)에 출력한다.
비선형 예측부(102g)는, 비선형 예측 결과(광대역 코드 벡터)와 이에 대응하는 분류용 코드 벡터를 증폭기(103)에 출력한다. 출력되는 광대역 코드 벡터 및 분류용 코드 벡터는, 1 종류가 아니라, 오차 최소화 결정부(124g)로부터의 지시에 따라, 소정수의 광대역 코드 벡터 및 분류용 코드 벡터가 증폭기(103) 및 증폭기(801)에 순차적으로 입력된다.
도 28은 본 실시형태에 따른 광대역 부호화 장치(2600)에서 생성된 부호화 데이터를 복호하는 광대역 복호 장치(2800)의 주요한 구성요소를 나타내는 블록도이다. 광대역 복호 장치(2800)는, 실시형태 3에 따른 광대역 복호 장치(1000)와 동일한 동작을 행하는 구성요소를 많이 구비하기 때문에, 본 실시형태에서도, 중복을 피하기 위해서, 광대역 복호 장치(1000)와 상위한 구성요소에 대해서만 설명한 다.
본 실시형태에 따른 광대역 복호 장치(2800)에 있어서, 부호화 데이터는, 실시형태 3에 있어서의 부호화 데이터에 포함되는 정보에 더해, 비선형 예측부(102g)로부터 출력되는 광대역 코드 벡터와 분류용 코드 벡터의 세트의 선택 정보를 포함하고 있다. 인덱스 복호부(324g)는, 이 부호화 데이터로부터 상기 선택 정보를 복호하여, 비선형 예측부(102g)에 출력한다. 비선형 예측부(102g)는, 입력된 선택 정보를 기초로 광대역 코드 벡터 및 분류용 코드 벡터를 구하여, 광대역 코드 벡터를 증폭기(103)에, 분류용 코드 벡터를 증폭기(801)에 각각 출력한다. 비선형 예측부(102g)의 내부 구성은, 도 27에 나타낸 비선형 예측부(102g)와 동일하므로, 그 설명을 생략한다.
또한, 본 실시형태에 따른 비선형 예측부(102g), 오차 최소화 결정부(124g) 및 인덱스 복호부(324g)는 실시형태 4에도 적용 가능하다.
이상, 본 발명의 각 실시형태에 대해서 설명했다.
본 발명에 따른 광대역 부호화 장치 등은, 상기 각 실시형태로 한정되지 않고, 여러 가지 변경해서 실시할 수 있다.
본 발명에 따른 광대역 부호화 장치 등은, 이동체 통신 시스템에 있어서의 통신 단말 장치 및 기지국 장치에 탑재할 수 있으며, 이로 말미암아 상기와 같은 작용 효과를 가지는 통신 단말 장치, 기지국 장치 및 이동체 통신 시스템을 제공할 수 있다.
또한, LSP는 LSF(Line Spectral Frequency)라고도 불린다. LSP와 LSF는 구 별되는 경우도 있지만(예를 들면 ITU-T권고 G.729에서는, LSF의 여현(Cosine)을 취한 것을 LSP라고 정의하고 있음), 본 명세서에서는 양자의 구별은 하지 않고 동의어로서 취급하고 있다. 즉, LSP를 LSF라고 바꿔읽어도 좋다.
또, 여기에서는, 본 발명의 예측 및 부호화 대상이 LSP인 경우를 예로 들어 설명했지만, LSP 이외의 스펙트럼 포락 파라미터의 예측 및 부호화에도 적용 가능하다. 스펙트럼 포락 파라미터의 구체적인 예로서는, FFT(고속 푸리에 변환) 파워 스펙트럼이나 MDCT(수정 이산 여현 변환)의 포락 정보 등을 들 수 있다. 이 경우, 협대역-광대역 변환부(101)에 있어서의 업 샘플링은, 협대역의 스펙트럼 포락 파라미터를 저역부의 스펙트럼 포락 파라미터로 하고, 고역부를 영(Zero)을 채움으로써 실현하는 것이 일반적이다. 또, LSP와 상호 변환 가능한 파라미터인 LPC(선형 예측 계수), PARCOR 계수(편자기 상관 계수), 자기 상관 함수, LPC 캡스트럼, 반사 계수 등도 스펙트럼 포락 정보에 포함된다. 이 경우, 협대역-광대역 변환부(101)에 있어서의 업 샘플링은, 이러한 파라미터를 일단 LSP로 변환하여 LSP 영역에서 실시형태에서 설명한 바와 같은 업 샘플링을 행하여도 좋고, LPC 캡스트럼이나 자기 상관 함수의 영역에 있어서 데이터를 내삽(보간)함으로써 업 샘플링을 실현해도 좋다. 데이터 내삽에는, 몇 개의 보간 방법이 알려져 있지만, SINC 함수를 이용한 보간 필터로 실현하는 방법이 비교적 널리 이용되고 있다. SINC 함수를 이용한 보간 필터에 의한 데이터 내삽 처리는, 예를 들면 ITU-T권고 G.729에도 개시되어 있으며, 적응 코드북의 음원 벡터 생성이나 피치 탐색시의 자기 상관 함수 내삽 등에 이용되고 있다. 협대역-광대역 변환부(101) 이외의 블록 동작에 대해서는, 실시형 태에 있어서의 LSP를 각각의 파라미터로 바꿔읽으면 된다.
또한, 본 명세서에서는 비선형 예측부(102)에 입력되는 양자화 협대역 LSP는, 협대역-광대역 변환부(101)에 의해 업 샘플링된 LSP로 했지만, 협대역-광대역 변환부(101)를 경유하지 않고 업 샘플링 되기 전의 양자화 협대역 LSP이어도 좋다.
또, 여기에서는, 본 발명을 하드웨어로 구성하는 경우를 예로 들어 설명했지만, 본 발명을 소프트웨어로 실현하는 것도 가능하다. 예를 들면, 본 발명에 따른 광대역 LSP 예측 방법의 알고리즘을 프로그램 언어를 이용해 기술(記述)하고, 이 프로그램을 메모리에 기억시켜 놓고 정보처리 수단을 이용하여 실행시킴으로써, 본 발명의 광대역 LSP 예측 장치와 동일한 기능을 실현할 수 있다.
또, 상기 각 실시형태의 설명에 이용한 각 기능 블록은 전형적으로는 집적 회로인 LSI로서 실현된다. 이들은 개별적으로 1칩화 되어도 좋고, 일부 또는 모두를 포함하도록 1칩화 되어도 좋다.
여기에서는, LSI라고 했지만, 집적도의 차이에 따라, IC, 시스템 LSI, 슈퍼 LSI, 울트라 LSI라고 호칭되는 일도 있다.
또, 집적 회로화의 수법은 LSI에 한정하는 것은 아니며, 전용 회로 또는 범용 프로세서로 실현해도 좋다. LSI 제조 후에, 프로그램하는 것이 가능한 FPGA(Field Programmable Gate Array)나, LSI 내부의 회로 셀의 접속이나 설정을 재구성 가능한 리컨피규러블 프로세서를 이용해도 좋다.
또, 반도체 기술의 진보 또는 파생하는 별개 기술에 의해 LSI에 대체되는 집적 회로화의 기술이 등장하면, 당연히 그 기술을 이용하여 기능 블록의 집적화를 행하여도 좋다. 바이오 기술의 적응 등이 가능성으로서 있을 수 있다.
본 명세서는, 2004년 12월 10일에 출원한 일본 특허 출원 제2004-358260호, 2005년 3월 29일에 출원한 일본 특허 출원 제2005-095345호, 및 2005년 9월 30일에 출원한 일본 특허 출원 제2005-286532호에 기초하고 있는 것이다. 이 내용은 모두 여기에 포함시켜 놓는다.
본 발명에 따른 광대역 부호화 장치 등은, 음성 신호의 대역 스케일러블 부호화 또는 그 복호에 있어서, 한정된 메모리량으로 실현 가능한 비선형 예측을 이용하면서도 예측 성능이 높은 예측기를 실현하여 양자화기의 양자화 효율을 개선할 수 있다고 하는 효과를 가지며, 이용 가능한 메모리량에 제한이 있는 한편, 저속(低速) 무선 통신을 강요당하는 휴대 전화 등의 통신 단말 장치 등으로서 유용하다.

Claims (17)

  1. 음성 신호의 양자화 협대역 LSP를 이용해 광대역 LSP를 부호화하는 광대역 부호화 장치로서,
    업 샘플링에 의해, 상기 양자화 협대역 LSP를 상기 양자화 협대역 LSP의 정보를 가지는 광대역의 제 1 LSP로 변환하는 변환 수단과,
    비선형 예측 처리에 의해, 상기 제 1 LSP 또는 상기 양자화 협대역 LSP를 이용해 광대역의 제 2 LSP를 예측하는 예측 수단과,
    상기 제 1 LSP와 상기 제 2 LSP의 가중 합을 이용해 예측 광대역 LSP를 생성하는 생성 수단과,
    상기 예측 광대역 LSP와 상기 광대역 LSP간의 오차를 최소로 하는 부호화 데이터를 구하는 부호화 수단
    을 구비하는 광대역 부호화 장치.
  2. 제 1 항에 있어서,
    상기 예측 수단은, 비선형 예측 처리로서, 코드북 매핑에 의한 벡터 양자화를 이용하는 광대역 부호화 장치.
  3. 제 1 항에 있어서,
    상기 예측 수단은,
    제 1 LSP 또는 상기 양자화 협대역 LSP를 나타내는 기준 벡터인 분류용 코드 벡터를 복수 포함하여 구성되는 분류용 코드북과,
    상기 제 1 LSP와 상기 분류용 코드 벡터와의 오차, 또는 상기 양자화 협대역 LSP와 상기 분류용 코드 벡터와의 오차를 산출하는 오차 산출 수단과,
    상기 분류용 코드북 중에서 상기 오차 산출 수단에서의 오차가 최소로 되는 분류용 코드 벡터를 특정하는 최소화 수단과,
    상기 분류용 코드 벡터에 대응화된 광대역 코드 벡터를 복수 포함하여 구성되어, 상기 최소화 수단에 의해 특정된 분류용 코드 벡터에 대응화된 광대역 코드 벡터를 출력하는 제 1 광대역 코드북을 구비하는
    광대역 부호화 장치.
  4. 제 3 항에 있어서,
    상기 생성 수단은, 상기 제 1 LSP와 상기 제 2 LSP의 가중 합 대신에, 상기 제 1 LSP와 상기 제 2 LSP와 상기 예측 수단의 분류용 코드 벡터로 벡터 양자화된 제 1 LSP의 가중 합을 이용하는 광대역 부호화 장치.
  5. 제 3 항에 있어서,
    상기 생성 수단은, 상기 제 1 LSP 대신에, 상기 제 1 LSP와 상기 예측 수단의 분류용 코드 벡터로 벡터 양자화된 제 1 LSP와의 차(差)를 이용하는 광대역 부호화 장치.
  6. 제 3 항에 있어서,
    상기 분류용 코드북에 포함되는 분류용 코드 벡터, 또는 상기 제 1 광대역 코드북에 포함되는 광대역 코드 벡터가 다단(多段) 구성으로 되어 있는 광대역 부호화 장치.
  7. 제 1 항에 있어서,
    상기 예측 수단은,
    상기 제 1 LSP 또는 상기 양자화 협대역 LSP를 나타내는 기준 벡터인 분류용 코드 벡터를 복수 포함하여 구성되는 분류용 코드북과,
    상기 제 1 LSP와 상기 분류용 코드 벡터와의 오차, 또는 상기 양자화 협대역 LSP와 상기 분류용 코드 벡터와의 오차를 산출하는 제 1 오차 산출 수단과,
    상기 분류용 코드북 중에서, 상기 제 1 오차 산출 수단에서의 오차가 작은 분류용 코드 벡터를 오차가 작은 쪽부터 소정수만큼 선택하는 선택 수단과,
    상기 분류용 코드 벡터에 대응화된 광대역 코드 벡터를 복수 포함하여 구성되어, 상기 선택 수단에 의해 선택된 소정수의 분류용 코드 벡터에 대응화된 소정수의 광대역 코드 벡터를 출력하는 제 1 광대역 코드북과,
    상기 음성 신호의 광대역 LSP와 상기 소정수의 광대역 코드 벡터와의 오차를 산출하는 제 2 오차 산출 수단과,
    상기 소정수의 광대역 코드 벡터 중에서 상기 제 2 오차 산출 수단에서의 오차가 최소로 되는 광대역 코드 벡터를 선택함과 아울러, 선택된 광대역 코드 벡터에 관한 선택 정보를 출력하는 최소화 수단을 구비하는
    광대역 부호화 장치.
  8. 제 1 항에 있어서,
    상기 예측 수단은,
    상기 제 1 LSP 또는 상기 양자화 협대역 LSP를 나타내는 기준 벡터인 분류용 코드 벡터를 복수 포함하여 구성되는 분류용 코드북과,
    상기 제 1 LSP와 상기 분류용 코드 벡터와의 오차, 또는 상기 양자화 협대역 LSP와 상기 분류용 코드 벡터와의 오차를 산출하는 오차 산출 수단과,
    상기 분류용 코드북 중에서, 상기 오차 산출 수단에서의 오차가 작은 분류용 코드 벡터를 오차가 작은 쪽부터 소정수만큼 선택하는 선택 수단과,
    상기 분류용 코드 벡터에 대응화된 광대역 코드 벡터를 복수 포함하여 구성되어, 상기 선택 수단에 의해 선택된 소정수의 분류용 코드 벡터에 대응화된 소정수의 광대역 코드 벡터를 출력하는 제 1 광대역 코드북을 구비하고,
    상기 부호화 수단은, 상기 소정수의 광대역 코드 벡터 중에서, 상기 예측 광대역 LSP와 상기 광대역 LSP간의 오차를 최소로 하는 광대역 코드 벡터를 출력함과 아울러, 상기 광대역 코드 벡터에 대응하는 가중 계수를 나타내는 부호화 데이터를 출력하는
    광대역 부호화 장치.
  9. 제 8 항에 있어서,
    상기 생성 수단은, 상기 제 1 LSP와 상기 제 2 LSP의 가중 합 대신에, 상기 제 1 LSP와 상기 제 2 LSP와 상기 예측 수단의 분류용 코드 벡터로 벡터 양자화된 제 1 LSP의 가중 합을 이용하는 광대역 부호화 장치.
  10. 제 1 항에 있어서,
    상기 예측 수단은,
    상기 제 1 LSP 또는 상기 양자화 협대역 LSP를 나타내는 기준 벡터인 분류용 코드 벡터를 복수 포함하여 구성되는 분류용 코드북과,
    복수의 상기 분류용 코드 벡터에 가중 계수를 곱한 곱셈 결과를 가산한 가산 결과와 상기 제 1 LSP와의 오차, 또는 상기 가산 결과와 상기 양자화 협대역 LSP와의 오차를 산출하여, 산출한 오차가 최소로 되는 상기 가중 계수를 결정하는 가중 계수 결정 수단과,
    상기 분류용 코드 벡터에 대응화된 광대역 코드 벡터를 복수 포함하여 구성되어, 상기 가중 계수 결정 수단에 의해 결정된 가중 계수를 상기 광대역 코드 벡터에 곱한 곱셈 결과를 가산하는 제 2 광대역 코드북을 구비하는
    광대역 부호화 장치.
  11. 제 1 항에 있어서,
    상기 예측 광대역 LSP를 지연시키는 지연 수단을 더 구비하며,
    상기 생성 수단은, 상기 제 1 LSP와 상기 제 2 LSP의 가중 합 대신에, 상기 제 1 LSP와 상기 제 2 LSP와 상기 지연 수단으로 지연된 과거의 예측 광대역 LSP의 가중 합을 이용하는
    광대역 부호화 장치.
  12. 음성 신호의 양자화 협대역 LSP로부터 광대역 LSP를 예측하는 광대역 LSP 예측 장치로서,
    업 샘플링에 의해, 상기 양자화 협대역 LSP를 상기 양자화 협대역 LSP의 정보를 가지는 광대역의 제 1 LSP로 변환하는 변환 수단과,
    비선형 예측 처리에 의해, 상기 제 1 LSP로부터 광대역의 제 2 LSP를 예측하는 예측 수단과,
    상기 제 1 LSP와 상기 제 2 LSP의 가중 합을 이용해 예측 광대역 LSP를 생성하는 생성 수단
    을 구비하는 광대역 LSP 예측 장치.
  13. 음성 신호의 협대역 LSP를 부호화하여 양자화 협대역 LSP를 생성하는 협대역 부호화 수단과,
    상기 양자화 협대역 LSP를 이용해 상기 음성 신호의 광대역 LSP를 부호화하는 광대역 부호화 수단
    을 구비하되,
    상기 광대역 부호화 수단은,
    업 샘플링에 의해, 상기 양자화 협대역 LSP를 상기 양자화 협대역 LSP의 정보를 가지는 광대역의 제 1 LSP로 변환하는 변환 수단과,
    비선형 예측 처리에 의해, 상기 제 1 LSP 또는 상기 양자화 협대역 LSP를 이용해 광대역의 제 2 LSP를 예측하는 예측 수단과,
    상기 제 1 LSP와 상기 제 2 LSP의 가중 합을 이용해 예측 광대역 LSP를 생성 하는 생성 수단과,
    상기 예측 광대역 LSP와 상기 광대역 LSP간의 오차를 최소로 하는 부호화 데이터를 구하는 부호화 수단을 구비하는
    대역 스케일러블 부호화 장치.
  14. 음성 신호의 양자화 협대역 LSP를 나타내는 부호화 데이터를 복호하여 양자화 협대역 LSP를 생성하는 협대역 복호 수단과,
    상기 음성 신호의 양자화 광대역 LSP에 관한 부호화 데이터를 복호하는 복호 수단과,
    상기 복호 수단에 의해 복호된 양자화 광대역 LSP에 관한 정보에 따라, 상기 양자화 협대역 LSP로부터 양자화 광대역 LSP를 생성하는 광대역 복호 수단
    을 구비하되,
    상기 광대역 복호 수단은,
    업 샘플링에 의해, 상기 양자화 협대역 LSP를 상기 양자화 협대역 LSP의 정보를 가지는 광대역의 제 1 LSP로 변환하는 변환 수단과,
    비선형 예측 처리에 의해, 상기 제 1 LSP 또는 상기 양자화 협대역 LSP를 이용해 광대역의 제 2 LSP를 예측하는 예측 수단과,
    상기 정보에 따라, 상기 제 1 LSP와 상기 제 2 LSP의 가중 합을 이용해 양자화 광대역 LSP를 생성하는 생성 수단을 구비하는
    대역 스케일러블 복호 장치.
  15. 청구항 1에 기재된 광대역 부호화 장치를 구비하는 통신 단말 장치.
  16. 청구항 1에 기재된 광대역 부호화 장치를 구비하는 기지국 장치.
  17. 음성 신호의 양자화 협대역 LSP를 이용해 광대역 LSP를 부호화하는 광대역 부호화 방법으로서,
    업 샘플링에 의해, 상기 양자화 협대역 LSP를 상기 양자화 협대역 LSP의 정보를 가지는 광대역의 제 1 LSP로 변환하는 스텝과,
    비선형 예측 처리에 의해, 상기 제 1 LSP 또는 상기 양자화 협대역 LSP를 이용해 광대역의 제 2 LSP를 예측하는 스텝과,
    상기 제 1 LSP와 상기 제 2 LSP의 가중 합을 이용해 예측 광대역 LSP를 생성하는 스텝과,
    상기 예측 광대역 LSP와 상기 광대역 LSP간의 오차를 최소로 하는 부호화 데이터를 구하는 스텝
    을 포함하는 광대역 부호화 방법.
KR1020077013054A 2004-12-10 2005-12-09 광대역 부호화 장치, 광대역 lsp 예측 장치, 대역스케일러블 부호화 장치 및 광대역 부호화 방법 KR20070085982A (ko)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JPJP-P-2004-00358260 2004-12-10
JP2004358260 2004-12-10
JPJP-P-2005-00095345 2005-03-29
JP2005095345 2005-03-29
JPJP-P-2005-00286532 2005-09-30
JP2005286532 2005-09-30

Publications (1)

Publication Number Publication Date
KR20070085982A true KR20070085982A (ko) 2007-08-27

Family

ID=36578022

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077013054A KR20070085982A (ko) 2004-12-10 2005-12-09 광대역 부호화 장치, 광대역 lsp 예측 장치, 대역스케일러블 부호화 장치 및 광대역 부호화 방법

Country Status (8)

Country Link
US (1) US8229749B2 (ko)
EP (1) EP1818913B1 (ko)
JP (1) JP4903053B2 (ko)
KR (1) KR20070085982A (ko)
CN (1) CN101076853B (ko)
AT (1) ATE520124T1 (ko)
BR (1) BRPI0515814A (ko)
WO (1) WO2006062202A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019004592A1 (ko) * 2017-06-27 2019-01-03 한양대학교 산학협력단 생성적 대립 망 기반의 음성 대역폭 확장기 및 확장 방법

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
EP2202727B1 (en) * 2007-10-12 2018-01-10 III Holdings 12, LLC Vector quantizer, vector inverse quantizer, and the methods
EP2234104B1 (en) * 2008-01-16 2017-06-14 III Holdings 12, LLC Vector quantizer, vector inverse quantizer, and methods therefor
JP5423684B2 (ja) * 2008-12-19 2014-02-19 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
US8493244B2 (en) 2009-02-13 2013-07-23 Panasonic Corporation Vector quantization device, vector inverse-quantization device, and methods of same
EP2555191A1 (en) 2009-03-31 2013-02-06 Huawei Technologies Co., Ltd. Method and device for audio signal denoising
US8447617B2 (en) * 2009-12-21 2013-05-21 Mindspeed Technologies, Inc. Method and system for speech bandwidth extension
EP2559026A1 (en) * 2010-04-12 2013-02-20 Freescale Semiconductor, Inc. Audio communication device, method for outputting an audio signal, and communication system
US8000968B1 (en) 2011-04-26 2011-08-16 Huawei Technologies Co., Ltd. Method and apparatus for switching speech or audio signals
CN102339607A (zh) * 2010-07-16 2012-02-01 华为技术有限公司 一种频带扩展的方法和装置
ES2592522T3 (es) * 2011-11-02 2016-11-30 Telefonaktiebolaget L M Ericsson (Publ) Codificación de audio basada en representación de coeficientes auto-regresivos
ES2762325T3 (es) 2012-03-21 2020-05-22 Samsung Electronics Co Ltd Procedimiento y aparato de codificación/decodificación de frecuencia alta para extensión de ancho de banda
EP2830063A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for decoding an encoded audio signal
US9524720B2 (en) 2013-12-15 2016-12-20 Qualcomm Incorporated Systems and methods of blind bandwidth extension
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
US11599773B2 (en) 2018-12-27 2023-03-07 Micron Technology, Inc. Neural networks and systems for decoding encoded data
US11424764B2 (en) 2019-11-13 2022-08-23 Micron Technology, Inc. Recurrent neural networks and systems for decoding encoded data
US11563449B2 (en) 2021-04-27 2023-01-24 Micron Technology, Inc. Systems for error reduction of encoded data using neural networks
US11755408B2 (en) 2021-10-07 2023-09-12 Micron Technology, Inc. Systems for estimating bit error rate (BER) of encoded data using neural networks

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
JP3483958B2 (ja) * 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
JP3189614B2 (ja) * 1995-03-13 2001-07-16 松下電器産業株式会社 音声帯域拡大装置
JP2956548B2 (ja) 1995-10-05 1999-10-04 松下電器産業株式会社 音声帯域拡大装置
CN1170269C (zh) * 1996-11-07 2004-10-06 松下电器产业株式会社 声源矢量生成装置以及声音编码装置和声音解码装置
JP3541680B2 (ja) * 1998-06-15 2004-07-14 日本電気株式会社 音声音楽信号の符号化装置および復号装置
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
FI119576B (fi) * 2000-03-07 2008-12-31 Nokia Corp Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
JP2003534578A (ja) * 2000-05-26 2003-11-18 セロン フランス エスアーエス 狭帯域で符号化される信号を送信する送信器、受信側において符号化信号の帯域を拡大する受信器、対応する送信及び受信方法、及び、そのシステム
JP2002055699A (ja) * 2000-08-10 2002-02-20 Mitsubishi Electric Corp 音声符号化装置および音声符号化方法
EP1199711A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Encoding of audio signal using bandwidth expansion
JP2002202799A (ja) * 2000-10-30 2002-07-19 Fujitsu Ltd 音声符号変換装置
US7113522B2 (en) * 2001-01-24 2006-09-26 Qualcomm, Incorporated Enhanced conversion of wideband signals to narrowband signals
WO2003042981A1 (en) * 2001-11-14 2003-05-22 Matsushita Electric Industrial Co., Ltd. Audio coding and decoding
AU2003234763A1 (en) * 2002-04-26 2003-11-10 Matsushita Electric Industrial Co., Ltd. Coding device, decoding device, coding method, and decoding method
JP2003323199A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
WO2004027368A1 (en) * 2002-09-19 2004-04-01 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method
US7254533B1 (en) * 2002-10-17 2007-08-07 Dilithium Networks Pty Ltd. Method and apparatus for a thin CELP voice codec
RU2007108288A (ru) * 2004-09-06 2008-09-10 Мацусита Электрик Индастриал Ко., Лтд. (Jp) Устройство масштабируемого кодирования и способ масштабируемого кодирования
KR100721537B1 (ko) * 2004-12-08 2007-05-23 한국전자통신연구원 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법
US7596491B1 (en) * 2005-04-19 2009-09-29 Texas Instruments Incorporated Layered CELP system and method
SI1875463T1 (sl) * 2005-04-22 2019-02-28 Qualcomm Incorporated Sistemi, postopki in naprava za glajenje faktorja ojačenja

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019004592A1 (ko) * 2017-06-27 2019-01-03 한양대학교 산학협력단 생성적 대립 망 기반의 음성 대역폭 확장기 및 확장 방법
US11238877B2 (en) 2017-06-27 2022-02-01 Iucf-Hyu (Industry-University Cooperation Foundation Hanyang University) Generative adversarial network-based speech bandwidth extender and extension method

Also Published As

Publication number Publication date
JP4903053B2 (ja) 2012-03-21
BRPI0515814A (pt) 2008-08-05
EP1818913A1 (en) 2007-08-15
ATE520124T1 (de) 2011-08-15
US8229749B2 (en) 2012-07-24
CN101076853A (zh) 2007-11-21
EP1818913A4 (en) 2009-01-14
EP1818913B1 (en) 2011-08-10
WO2006062202A1 (ja) 2006-06-15
US20090292537A1 (en) 2009-11-26
CN101076853B (zh) 2010-10-13
JPWO2006062202A1 (ja) 2008-06-12

Similar Documents

Publication Publication Date Title
KR20070085982A (ko) 광대역 부호화 장치, 광대역 lsp 예측 장치, 대역스케일러블 부호화 장치 및 광대역 부호화 방법
JP5143193B2 (ja) スペクトル包絡情報量子化装置、スペクトル包絡情報復号装置、スペクトル包絡情報量子化方法及びスペクトル包絡情報復号方法
KR101412255B1 (ko) 부호화 장치, 복호 장치 및 이들의 방법
KR100487136B1 (ko) 음성복호화방법및장치
RU2509379C2 (ru) Устройство и способ квантования и обратного квантования lpc-фильтров в суперкадре
KR100469224B1 (ko) 음성부호화방법및장치
US8364495B2 (en) Voice encoding device, voice decoding device, and methods therefor
JP4546464B2 (ja) スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
KR20080074234A (ko) Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, 기록 매체, 음성 부호화 장치, 음성 복호화장치, 음성 신호 송신 장치, 및 음성 신호 수신 장치
JPWO2008047795A1 (ja) ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
RU2469421C2 (ru) Векторный квантователь, инверсный векторный квантователь и способы
JPH056199A (ja) 音声パラメータ符号化方式
KR20070083856A (ko) 스케일러블 부호화 장치, 스케일러블 복호화 장치 및이러한 방법
JPWO2011045926A1 (ja) 符号化装置、復号装置およびこれらの方法
US20130268268A1 (en) Encoding of an improvement stage in a hierarchical encoder
JP3905706B2 (ja) 音声符号化装置、音声処理装置及び音声処理方法
KR20110132339A (ko) 톤 판정 장치 및 톤 판정 방법
JP4937746B2 (ja) 音声符号化装置および音声符号化方法
RU2464650C2 (ru) Устройство и способ кодирования, устройство и способ декодирования
JPH07134600A (ja) 音声符号化装置及び音声復号化装置
JPH0844398A (ja) 音声符号化装置
WO2008076534A2 (en) Code excited linear prediction speech coding
GB2436192A (en) A speech encoded signal and a long term predictor (ltp) logic comprising ltp memory and which quantises a memory state of the ltp logic.

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid