KR20090117877A - 부호화 장치 및 부호화 방법 - Google Patents

부호화 장치 및 부호화 방법 Download PDF

Info

Publication number
KR20090117877A
KR20090117877A KR1020097016990A KR20097016990A KR20090117877A KR 20090117877 A KR20090117877 A KR 20090117877A KR 1020097016990 A KR1020097016990 A KR 1020097016990A KR 20097016990 A KR20097016990 A KR 20097016990A KR 20090117877 A KR20090117877 A KR 20090117877A
Authority
KR
South Korea
Prior art keywords
gain
search
encoding
pulse
spectrum
Prior art date
Application number
KR1020097016990A
Other languages
English (en)
Other versions
KR101414359B1 (ko
Inventor
도시유키 모리이
마사히로 오시기리
도모후미 야마나시
Original Assignee
파나소닉 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 파나소닉 주식회사 filed Critical 파나소닉 주식회사
Publication of KR20090117877A publication Critical patent/KR20090117877A/ko
Application granted granted Critical
Publication of KR101414359B1 publication Critical patent/KR101414359B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

정보 비트가 적은 경우라 하더라도 청감적으로 양호한 음질을 얻는 부호화 장치. 이 부호화 장치에서는, 셰이프 양자화부(111)는, 소정의 탐색 구간을 복수로 분할한 밴드마다 펄스를 탐색하여 부호화하는 구간 탐색부(121)와, 이 탐색 구간 전체에 걸쳐서 펄스의 탐색을 행하는 전체 탐색부(122)를 구비하고, 입력 스펙트럼의 셰이프를 소수(少數)의 펄스 위치, 극성으로 양자화한다. 게인 양자화부(112)는, 셰이프 양자화부(111)에 의해 탐색된 펄스의 게인을 밴드마다 산출하여 양자화한다.

Description

부호화 장치 및 부호화 방법{ENCODING DEVICE AND ENCODING METHOD}
본 발명은, 음성 신호나 오디오 신호를 부호화하는 부호화 장치 및 부호화 방법에 관한 것이다.
이동체 통신에 있어서는, 전파등의 전송로 용량이나 기억 매체의 유효 이용을 꾀하기 위해, 음성이나 화상의 디지탈 정보에 대해 압축 부호화를 행하는 일이 필수이며, 지금까지 많은 부호화/복호 방식이 개발되어 왔다.
그 중에서, 음성 부호화 기술은, 음성의 발성기구를 모델화하여 벡터 양자화를 교묘하게 응용한 기본 방식「CELP」(Code Excited Linear Prediction)에 의해 성능이 크게 향상하였다. 또, 오디오 부호화 등의 악음(樂音) 부호화 기술은, 변환 부호화 기술(MPEG 표준 ACC나 MP3 등)에 의해 성능이 크게 향상하였다.
한편, ITU-T(International Telecommunication Union-Telecommunication Standardization Sector) 등에서 표준화가 진행되고 있는 스케일러블 코덱은, 종래의 음성 대역(300 Hz~3.4 kHz)부터 광대역(~7 kHz)까지를 커버하는 사양(仕樣)으로 되어 있고, 비트 레이트(bit rate)도 32 kbps 정도와 높은 레이트까지 설정되고 있다. 따라서, 광대역 코덱으로는 음악도 어느 정도 부호화하지 않으면 안되기 때문에, CELP와 같은, 인간의 발성 모델에 기초한, 종래의 저(低)비트레이트 음성 부호 화 방법만으로는 대응할 수 없다. 그래서, 먼저 권고화된 ITU-T표준 G.729.1에서는, 광대역 이상의 음성의 부호화에는 오디오 코덱의 부호화 방식인 변환 부호화를 이용하고 있다.
특허 문헌 1에는, 스펙트럼 파라미터와 피치 파라미터를 이용하는 부호화 방식에 있어서, 스펙트럼 파라미터로 음성 신호에 역필터를 통과시킴으로써 얻어지는 신호를 직교변환하여 부호화하는 것, 및 그 부호화의 예로서 대수적 구조의 코드북을 이용해 부호화하는 방법이 표시되어 있다.
또, 특허 문헌 2에는, 선형 예측 파라미터와 잔차성분으로 분리하여 행하는 부호화 방식으로서, 잔차성분을 직교변환하고, 그 파워로 잔차 파형을 정규화한 후, 게인의 양자화와 정규화잔차의 양자화를 행하는 것이 개시되어 있다. 또, 특허 문헌 2에는, 정규화잔차의 양자화 방법으로서 벡터 양자화를 들고 있다.
또, 비특허 문헌 1에는, TCX(변환 부호화된 구동 음원과 스펙트럼 파라미터 필터링으로 모델화한 부호화 기본 방식)에 있어서, 음원 스펙트럼을 개량한 대수적 코드북으로 부호화하는 방법이 개시되고, 이 방법은 ITU-T표준 G.729.1에 채용되어 있다.
또, 비특허 문헌 2에는, MPEG 표준 방식 「TC-WVQ」의 기재가 있다. 이 방식도, 직교변환 방법으로서 DCT(이산 코사인 변환)를 이용하여, 선형 예측잔차를 변환하여 스펙트럼을 벡터 양자화하는 것이다.
상기 4개의 선행 기술등에 의해, 음성 신호의 유효한 부호화 요소기술인 선형 예측 파라미터와 같은 스펙트럼 파라미터의 양자화를 부호화에 사용할 수 있어, 오디오 부호화의 효율화나 저(低)레이트화를 실현할 수 있게 되었다.
[특허 문헌 1] 특개평 10-260698호 공보
[특허 문헌 2] 특개평 07-261800호 공보
[비특허 문헌 1] Xie, Adoul, "EMBEDDED ALGEBRAIC VECTOR QUANTIZERS(EAVQ) WITH APPLICATION TO WIDEBAND SPEECH CODING" ICASSP' 96
[비특허 문헌 2] Moriya, Honda, "Transform Coding of Speech Using a Weighted Vector Quantizer" IEEE journal on selected areas in communications, Vol.6, No.2, February 1988
그렇지만, 특히 스케일러블 코덱의 비교적 낮은 계층에서는, 할당되는 비트수가 적기 때문에, 음원의 변환 부호화 성능이 충분하지는 않았다. 예를 들면, ITU-T표준 G.729.1에서는 전화 대역(300 Hz~3.4 kHz)의 제2 계층까지에 12 kbps의 비트레이트가 있지만, 다음의 광대역(50 Hz~7 kHz)을 취급하는 제3 계층에는 2 kbps 할당밖에 없다. 이와 같이 정보 비트가 적을 경우는, 직교변환으로 얻어진 스펙트럼을, 코드북을 이용한 벡터 양자화로 부호화하는 방법으로는 청감적으로 충분한 성능을 얻을 수 없다.
본 발명의 목적은, 정보 비트가 적은 경우라 하더라도 청감적으로 양호한 음질을 얻을 수 있는 부호화 장치 및 부호화 방법을 제공하는 것이다.
본 발명의 부호화 장치는, 주파수 스펙트럼의 셰이프(Shape)를 부호화하는 셰이프 양자화 수단과, 상기 주파수 스펙트럼의 게인을 부호화하는 게인 양자화 수단을 구비하여, 상기 셰이프 양자화 수단은, 소정의 탐색 구간을 복수로 분할한 밴드마다 제 1 고정 파형을 탐색하는 구간 탐색 수단과, 상기 소정의 탐색 구간 전체에 걸쳐서 제 2 고정 파형을 탐색하는 전체 탐색 수단을 구비하는 구성을 취한다.
본 발명의 부호화 방법은, 주파수 스펙트럼의 셰이프를 부호화하는 셰이프 양자화 공정과, 상기 주파수 스펙트럼의 게인을 부호화하는 게인 양자화 공정을 구비하고, 상기 셰이프 양자화 공정은, 소정의 탐색 구간을 복수로 분할한 밴드마다 제1고정 파형을 탐색하는 구간 탐색 공정과, 상기 소정의 탐색 구간 전체에 걸쳐서 제2 고정 파형을 탐색하는 전체 탐색 공정을 구비하는 방법을 취한다.
본 발명에 의하면, 에너지가 존재하는 주파수(위치)를 정확하게 부호화할 수 있으므로, 스펙트럼 부호화에 특유한 정성적(定性的)인 성능의 향상을 꾀할 수 있어, 저(低)비트레이트의 경우라도 양호한 음질을 얻을 수 있다.
도 1은 본 발명의 한 실시형태에 따른 음성 부호화 장치의 구성을 나타내는 블록도이다.
도 2는 본 발명의 한 실시형태에 따른 음성 복호 장치의 구성을 나타내는 블록도이다.
도 3은 본 발명의 한 실시형태에 따른 구간 탐색부의 탐색 알고리즘의 흐름도이다.
도 4는 본 발명의 한 실시형태에 따른 구간 탐색부에 있어서 탐색된 펄스로 표현된 스펙트럼의 예를 나타내는 도면이다.
도 5는 본 발명의 한 실시형태에 따른 전체 탐색부의 탐색 알고리즘의 흐름도이다.
도 6은 본 발명의 한 실시형태에 따른 전체 탐색부의 탐색 알고리즘의 흐름도이다.
도 7은 본 발명의 한 실시형태에 따른 구간 탐색부 및 전체 탐색부에 있어서 탐색된 펄스로 표현된 스펙트럼의 예를 나타내는 도면이다.
도 8은 본 발명의 한 실시형태에 따른 스펙트럼 복호부의 복호 알고리즘의 흐름도이다.
CELP 방식등의 음성 신호의 부호화에서는, 음성 신호는 음원과 합성 필터로 표시되는 일이 많으며, 시계열 벡터인 음원 신호가 그 신호를 닮은 형상의 벡터를 복호할 수 있으면, 합성 필터로 입력 음성에 가까운 파형을 얻을 수 있으며, 청감적으로도 양호한 음질을 얻을 수 있다. 이것은, CELP에서 이용되는 대수적 코드북의 성공과도 이어져있는 정성적인 성질이다.
한편, 주파수 스펙트럼(벡터)의 부호화에서는, 합성 필터의 성분은 스펙트럼 게인이 되므로, 그 게인의 왜곡보다 파워가 큰 성분의 주파수(위치) 왜곡에 큰 웨이트가 있다. 즉, 입력 스펙트럼을 닮은 형상의 벡터를 복호하는 것보다, 높은 에너지가 있는 위치를 정확하게 탐색하여, 해당 에너지가 있는 위치의 펄스를 복호하는 편이, 청감적으로 양호한 음질을 얻는 것으로 이어진다.
본 발명자는, 이 점에 착목하여 본 발명을 하기에 이르렀다. 즉, 본 발명에 서는, 주파수 스펙트럼을 소수(少數)의 펄스로 부호화하는 모델로 하여, 부호화할 음성 신호(시계열 벡터)를 직교변환으로 주파수 영역으로 변환하고, 부호화 대상 주파수 구간을 복수의 밴드로 나누어, 각 밴드 각각에 1 펄스, 다시 부호화 대상 주파수 구간 전체에서 수 펄스를 탐색한다.
또, 본 발명에서는, 셰이프(형상) 양자화와 게인(크기) 양자화로 나누어, 셰이프 양자화에서는, 이상(理想) 게인을 가정하여 진폭은 「1」로 극성(+-)의 펄스를 오픈루프 탐색하고, 특히, 부호화 대상 주파수 구간 전체에서의 탐색에서는, 동일한 장소에 2개 펄스를 출력하지 않도록 하여, 펄스 위치의 전송 정보로서 복수 펄스의 위치조합을 부호화할 수 있도록 한다.
이하, 본 발명의 한 실시형태에 대해서, 도면을 이용해 설명한다.
도 1은, 본 실시형태에 따른 음성 부호화 장치의 구성을 나타내는 블록도이다. 도 1에 나타내는 음성 부호화 장치는, LPC 분석부(101), LPC 양자화부(102), 역필터(103), 직교변환부(104), 스펙트럼 부호화부(105), 및 다중화부(106)를 구비한다. 스펙트럼 부호화부(105)는, 셰이프 양자화부(111) 및 게인 양자화부(112)를 구비한다.
LPC 분석부(101)는, 입력 음성 신호에 대해서 선형 예측 분석을 행하고, 분석 결과인 스펙트럼 포락 파라미터를 LPC 양자화부(102)에 출력한다. LPC 양자화부(102)는, LPC 분석부(101)로부터 출력된 스펙트럼 포락 파라미터(LPC:선형 예측 계수)의 양자화 처리를 행하고, 양자화 LPC를 나타내는 부호를 다중화부(106)에 출력한다. 또, LPC 양자화부(102)는, 양자화 LPC를 나타내는 부호를 복호하여 얻어 지는 복호 파라미터를 역필터(103)에 출력한다. 또한, 파라미터의 양자화에서는, 벡터 양자화(VQ), 예측 양자화, 다단 VQ, 스플릿 VQ등의 형태가 이용된다.
역필터(103)는, 복호 파라미터를 이용해 입력 음성에 대해서 역필터를 통과시켜, 얻어진 잔차성분을 직교변환부(104)에 출력한다.
직교변환부(104)는, 잔차성분에 사인창(sine window)등의 정합(整合) 창함수를 곱하고, MDCT를 이용해 직교변환을 행하여, 주파수 축으로 변환된 스펙트럼(이하,「입력 스펙트럼」이라고 함)을 스펙트럼 부호화부(105)에 출력한다. 또한, 직교변환에는 그 밖에 FFT, KLT, 웨이브렛 변환등이 있으며, 사용 방법은 다르지만 어느 것을 사용하더라도 입력 스펙트럼으로의 변환이 가능하다.
또한, 역필터(103)와 직교변환부(104)는 그 처리순서를 반대로 하는 경우도 있다. 즉, 입력 음성을 직교변환한 것에 대해서 역필터의 주파수 스펙트럼으로 나눗셈(대수(對數)축에서 감산)을 행하면 동일한 입력 스펙트럼이 얻어진다.
스펙트럼 부호화부(105)는, 입력 스펙트럼을, 스펙트럼의 셰이프와 게인으로 나누어 양자화하고, 얻어진 양자화 부호를 다중화부(106)에 출력한다. 셰이프 양자화부(111)는, 입력 스펙트럼의 셰이프를 소수(少數)의 펄스의 위치, 극성으로 양자화하고, 게인 양자화부(112)는, 셰이프 양자화부(111)에 의해 탐색된 펄스의 게인을 밴드마다 산출하여 양자화한다. 또한, 셰이프 양자화부(111), 게인 양자화부(112)의 상세한 것에 대해서는 후술한다.
다중화부(106)는, LPC 양자화부(102)로부터 양자화 LPC를 나타내는 부호를 입력시키고, 스펙트럼 부호화부(105)로부터 양자화 입력 스펙트럼을 나타내는 부호 를 입력시켜, 이러한 정보를 다중화하여 부호화 정보로서 전송로에 출력한다.
도 2는, 본 실시형태에 따른 음성 복호 장치의 구성을 나타내는 블록도이다. 도2에 나타내는 음성 복호 장치는, 분리부(201), 파라미터 복호부(202), 스펙트럼 복호부(203), 직교변환부(204), 및 합성 필터(205)를 구비한다.
도 2에 있어서, 부호화 정보는, 분리부(201)에 의해 개개의 부호로 분리된다. 양자화 LPC를 나타내는 부호는 파라미터 복호부(202)에 출력되고, 입력 스펙트럼의 부호는 스펙트럼 복호부(203)에 출력된다.
파라미터 복호부(202)는, 스펙트럼 포락 파라미터의 복호를 행하고, 복호에 의해 얻어진 복호 파라미터를 합성 필터(205)에 출력한다.
스펙트럼 복호부(203)는, 도 1에 나타낸 스펙트럼 부호화부(105)의 부호화 방법에 대응하는 방법에 의해 셰이프 벡터 및 게인을 복호하고, 복호한 셰이프 벡터에 복호 게인을 곱함으로써 복호 스펙트럼을 얻어, 복호 스펙트럼을 직교변환부(204)에 출력한다.
직교변환부(204)는, 스펙트럼 복호부(203)로부터 출력된 복호 스펙트럼에 대해서 도 1에 나타낸 직교변환부(104)의 역(逆)변환을 행하고, 변환에 의해 얻어진 시계열의 복호잔차신호를 합성 필터(205)에 출력한다.
합성 필터(205)는, 파라미터 복호부(202)로부터 출력된 복호 파라미터를 사용하여, 직교변환부(204)로부터 출력된 복호잔차신호에 대해 합성 필터를 통과시켜 출력 음성을 얻는다.
또한, 도 1의 역필터(103)와 직교변환부(104)의 처리순서를 반대로 할 경우, 도2의 음성 복호 장치에서는, 직교변환을 하기 전에 복호 파라미터의 주파수 스펙트럼으로 적산(積算)(대수축에서 합산)을 행하고, 얻어진 스펙트럼에 대해서 직교변환을 행한다.
다음에, 셰이프 양자화부(111), 게인 양자화부(112)의 상세한 것에 대해서 설명한다. 셰이프 양자화부(111)는, 소정의 탐색 구간을 복수로 분할한 밴드마다 펄스를 탐색하는 구간 탐색부(121)와, 이 탐색 구간 전체에 걸쳐서 펄스를 탐색하는 전체 탐색부(122)를 구비한다.
탐색의 기준이 되는 식은 이하의 수학식(1)이다. 또한, 식(1)에 있어서, E는 부호화 왜곡, si는 입력 스펙트럼, g는 최적 게인, δ은 델타 함수, p는 펄스 위치이다.
Figure 112009049669221-PCT00001
코스트 함수를 최소로 하는 펄스의 위치는, 상기 식(1)에 의해, 각각의 밴드 안에서 입력 스펙트럼의 절대값|sp| 가 최대가 되는 위치이고, 극성은, 그 펄스 위치의 입력 스펙트럼 값의 극성(極性)이다.
이하, 입력 스펙트럼의 벡터 길이가 80 샘플, 밴드수가 5이고, 각 밴드에서 1개의 펄스와 전체에서 3개의 펄스, 합계 8개의 펄스로 스펙트럼을 부호화하는 경우를 예로 설명한다. 이 경우, 각 밴드의 길이는 16 샘플이 된다. 또한, 탐색되는 펄스의 진폭은 「1」로 고정되며, 극성은 「+-」이다.
구간 탐색부(121)는, 밴드마다, 에너지가 최대인 위치, 극성(+-)을 탐색하고, 1개씩 펄스를 출력한다. 본 예에서는, 밴드수가 5이고, 밴드마다, 펄스의 위치를 나타내기 위해 4비트(위치의 엔트리:16), 극성을 나타내기 위해 1비트(+-) 필요하므로, 합계 25비트의 정보 비트가 된다.
구간 탐색부(121)의 탐색 알고리즘의 흐름을 도3에 나타낸다. 또한, 도3의 흐름도에서 사용되는 기호의 내용은 다음과 같다.
i:위치
b:밴드의 번호
max:최대값
c:카운터
pos[b]:탐색 결과(위치)
pol[b]:탐색 결과(극성)
s[i]:입력 스펙트럼
도 3에 나타내는 것처럼, 구간 탐색부(121)는, 밴드마다(0≤b≤4), 각 샘플(0≤c≤15)의 입력 스펙트럼s[i]를 계산하여, 최대값max를 구한다.
구간 탐색부(121)에 있어서 탐색된 펄스로 표현된 스펙트럼의 예를 도4에 나타낸다. 도4에 나타내는 것처럼, 밴드폭 16 샘플의 5개 밴드에, 진폭 「1」, 극성 「+-」의 펄스가 1개씩 출력된다.
전체 탐색부(122)는, 탐색 구간 전체에 걸쳐서, 3개의 펄스를 출력할 위치를 탐색해, 펄스의 위치와 극성을 부호화한다. 전체 탐색부(122)에 있어서의 탐색에 서는, 적은 정보 비트, 적은 계산량으로 정확한 위치를 부호화하기 위해 다음의 4개 조건으로 탐색을 행한다. (1) 동일한 위치에 2개 이상의 펄스를 출력하지 않는다. 본 예에서는, 구간 탐색부(121)에 있어서 밴드마다 출력한 펄스의 위치에도 출력하지 않는 것으로 한다. 이 연구에 의해, 진폭 성분의 표현에 정보 비트를 사용하지 않기 때문에 효율적으로 정보 비트를 사용할 수 있다. (2) 펄스를 1개씩 차례로 오픈 루프로 탐색한다. 탐색 도중에는, (1)의 룰에 따라, 이미 결정된 펄스의 위치에 대해서는 탐색의 대상밖으로 한다. (3) 위치 탐색에서는, 펄스가 출력되지않는 편이 좋은 경우도 1개의 위치로서 부호화한다. (4) 게인을 밴드마다 부호화하는 것을 고려하여, 밴드마다 이상(理想) 게인에 의한 부호화 왜곡을 평가하면서 펄스를 탐색한다.
전체 탐색부(122)는, 입력 스펙트럼 전체에 걸쳐 1개의 펄스 탐색을 다음의 2 단계 코스트 평가로 행한다. 우선, 제1 단계로서 전체 탐색부(122)는, 각 밴드에서의 코스트를 평가하여, 가장 코스트 함수가 작아지는 위치와 극성을 구한다. 그리고, 제2 단계로서 전체 탐색부(122)는, 상기 탐색이 1개의 밴드 내를 종료할 때마다 전체 코스트를 평가하고, 이것이 최소가 되는 펄스의 위치와 극성을 최종 결과로서 보존한다. 이 탐색을 각 밴드에서 순서대로 행해 간다. 이 탐색은, 상기 (1) 내지 (4)의 조건에 맞도록 행해진다. 그리고, 1개의 펄스 탐색이 종료하면, 그 펄스가 탐색 위치에 있는 것으로 하여, 다음 펄스의 탐색을 행한다. 이것을 반복하여 소정의 갯수(본 예에서는, 3개)가 될 때까지 탐색을 행한다.
전체 탐색부(122)의 탐색 알고리즘의 흐름을 도 5에 나타낸다. 도 5는, 전 (前)처리의 흐름도이고, 도 6은, 본 탐색의 흐름도이다. 또, 도 6의 흐름도에, 상기(1)(2)(4)의 조건에 대응하는 부분에 대해서 나타낸다.
도 5의 흐름도에서 사용되는 기호의 내용은 이하와 같다.
c :카운터,
pf[*]:펄스 유무 플래그
b:밴드의 번호,
pos[*]: 검색 결과(위치)
n_s[*]: 상관값
n_max[*]: 상관값 최대
n2_s[*]:상관값 제곱
n2_max[*]: 상관값 제곱 최대
d_s[*]: 파워값
d_max[*]: 파워값 최대
s[*]: 입력 스펙트럼
도 6의 흐름도에서 사용되는 기호의 내용은 다음과 같다.
i:펄스 번호
i0:펄스 위치
cmax:코스트 함수의 최대값
pf[*]: 펄스 유무 플래그(0:무, 1:유)
ii0: 밴드내의 상대적 펄스 위치
nom: 스펙트럼 진폭
nom2: 분자항(스펙트럼 파워)
den:분모항
n_s[*]: 상관값
d_s[*]: 파워값
s[*]: 입력 벡터
n2_s[*]: 상관값 제곱
n_max[*]: 상관값 최대
n2_max[*]: 상관값 제곱 최대
idx_max[*]: 각 펄스의 탐색된 결과(위치)(또한, idx_max[*]의 0~4까지는 도3의 pos(b)와 동일하다.)
fd0, fd1, fd2: 일시 기억용 버퍼(실수(實數)형)
id0, id1: 일시 기억용 버퍼(정수(整數)형)
id0_s, id1_s: 일시 기억용 버퍼(정수형)
>>: 비트 쉬프트 (오른쪽으로 쉬프트)
&: 비트열로서의 앤드
또한, 도 5, 도 6의 탐색에 있어서, idx_max[*]가 「-1」인 채일 경우가, 상기 조건(3)의 펄스가 출력되지않는 편이 좋은 경우이다. 이 구체적 현상으로서는, 밴드마다 탐색한 펄스나 전범위에서 탐색한 펄스로 스펙트럼을 충분히 근사(近似)할 수 있어, 더 이상 동일 크기의 펄스를 출력해봐야 오히려 부호화 왜곡이 크 게 되어 버리는 경우등을 들 수 있다.
탐색한 펄스의 극성은, 입력 스펙트럼의 그 위치의 극성이며, 전체 탐색부(122)는, 이 극성을 3(개)ㅧ1=3비트로 부호화 한다. 또한, 위치가 「-1」일 경우, 즉 펄스가 출력되지 않는 경우는 극성은 어는쪽이라도 상관없다. 하지만, 비트오류 검출에 이용되는 경우도 있기때문에, 통상 어느쪽인가로 고정된다.
또, 전체 탐색부(122)는, 펄스의 위치 정보를, 펄스 위치의 조합의 수로 부호화한다. 본 예에서는, 입력 스펙트럼이 80 샘플이고, 밴드마다 5 펄스가 이미 출력되고 있으므로, 펄스가 출력되지 않는 경우도 고려하면 위치의 베리에이션은 이하의 수학식(2)의 계산에 의해 17비트로 표시할 수 있다.
Figure 112009049669221-PCT00002
또한, 동일한 위치에 2개 펄스가 출력되지 않도록 한다는 룰에 따라, 조합 수를 적게할 수 있어, 이 룰의 효과는, 전체에서 탐색하는 펄스수가 많을수록 커진다.
여기서, 전체 탐색부(122)에 있어서 탐색한 펄스의 위치를 부호화하는 방법에 대해 상세하게 설명한다. (1) 3개 펄스의 위치를 그 크기로 정렬(sorting)하여, 작은 수치부터 큰 수치로 배열한다. 그리고, 「-1」에 대해서는 그대로 둔다. (2) 밴드마다 출력되는 펄스의 위치분만큼 왼쪽으로 채워, 위치의 수치를 작게 한다. 이것으로 구해지는 수치를 「위치 수」라고 부른다. 또한, 「-1」에 대해서 는 그대로 둔다. 예를 들면, 펄스의 위치가 66이고, 이것보다 작은 위치에는, 0~15, 16~31, 32~47, 48~64에 1개씩 펄스가 있었다고 하면, 위치수는 「66-4=62」가 된다. (3) 「-1」을 「그 펄스의 최대값+1」의 위치수로 설정한다. 이 경우, 실제로 펄스가 존재하는 위치수와 혼동되지 않도록 조정하면서 값의 순번을 정한다. 이에 의해, 펄스#0의 위치수는 0부터 73까지, 펄스#1의 위치수는 펄스#0의 위치수부터 74까지, 펄스#2의 위치수는 펄스#1의 위치수부터 75까지의 범위로 한정되어, 하위의 위치수가 상위의 위치수를 넘지 않게 된다. (4) 그리고, 조합의 부호를 구하는 이하의 수학식(3)에 나타내는 통합 처리에 의해, 위치수(i0, i1, i2)를 통합하여 부호(c)를 얻는다. 이 통합 처리는 크기의 순번이 있을 경우에 전부의 조합을 통합하는 계산 처리이다.
Figure 112009049669221-PCT00003
(5) 그리고, 이 c의 17비트와 극성 비트 3을 합쳐서 20비트의 부호를 얻는다.
또한, 상기 위치수 중에서, 펄스#0이 「73」, 펄스#1이 「74」, 펄스#2가 「75」인 경우가, 그 펄스가 출력되지않는 경우를 나타내는 위치수가 된다. 예를 들어 3개의 위치수가(73,-1,-1)이라고 할 경우, 앞의 1개의 위치수와 「출력되지않는 경우」의 위치수의 관계로, (-1, 73,-1)로 순서를 바꾸어, (73, 73, 74)로 된다.
이와 같이, 본 예와 같이, 입력 스펙트럼을 8개의 펄스열(밴드마다 5개, 전체 3개)로 나타내는 모델의 경우, 정보 비트 45비트로 부호화할 수 있다.
구간 탐색부(121) 및 전체 탐색부(122)에서 탐색된 펄스로 표현된 스펙트럼의 예를 도7에 나타낸다. 또한, 도7에 있어서, 보다 굵게 표현된 펄스가 전체 탐색부(122)에 있어서 탐색된 펄스이다.
게인 양자화부(112)는, 각 밴드의 게인을 양자화한다. 8개의 펄스는 각 밴드에 배치되어 있으므로, 게인 양자화부(112)는, 그 펄스와 입력 스펙트럼과의 상관을 분석하여 게인을 구한다.
게인 양자화부(112)는, 이상(理想) 게인을 구한 뒤 스칼라 양자화나 벡터 양자화로 부호화할 경우, 우선, 이하의 수학식 (4)로 이상(理想) 게인을 구한다. 또한, 식(4)에 있어서, gn는 밴드 n의 이상(理想)게인, s(i+16 n)은 밴드 n의 입력 스펙트럼, vn(i)는 밴드 n의 셰이프를 복호한 벡터이다.
Figure 112009049669221-PCT00004
그리고, 게인 양자화부(112)는, 이상 게인을 스칼라 양자화(SQ)하거나, 또는, 5개의 게인을 한꺼번에 벡터 양자화를 이용해 부호화한다. 벡터 양자화할 경우는, 예측 양자화, 다단 VQ, 스플릿 VQ등에 의해 효율좋게 부호화할 수 있다. 또, 게인은, 청감적으로는 대수로 들리기때문에, 게인을 대수 변환한 뒤에 SQ, VQ 하면 청감적으로 양호한 합성음을 얻을 수 있다.
또한, 이상 게인을 구하는 것이 아니라, 부호화 왜곡을 직접 평가하는 방법도 있다. 예를 들면, 5개의 게인을 VQ하는 경우, 이하의 수학식(5)를 최소로 한다. 또한, 수학식(5)에 있어서, Ek는 k번째 게인 벡터의 왜곡, s(i+16 n)는 밴드 n의 입력 스펙트럼, gn (k)는 k번째 게인 벡터의 n번째 요소,vn(i)는 밴드 n의 셰이프를 복호한 셰이프 벡터이다.
Figure 112009049669221-PCT00005
 
이어서, 스펙트럼 복호부(203)에 있어서의, 전체에서 탐색한 3개의 펄스 위치의 복호 방법에 대해 설명한다.
스펙트럼 부호화부(105)의 전체 탐색부(122)에서는, 상기식(3)을 이용해, 위치수(i0, i1, i2)를 1개의 부호로 통합했다. 스펙트럼 복호부(203)에서는, 이 반대 처리를 행하는 것이 된다. 즉, 스펙트럼 복호부(203)에서는, 통합식의 값을, 각 위치수를 옮겨가면서 순서대로 계산하고, 그 값을 밑돌 경우에 그 위치수를 고정하고, 이것을 낮은 위치수부터 상위를 향해 1개씩 행해감으로써 복호한다. 도8은, 스펙트럼 복호부(203)의 복호 알고리즘을 나타내는 흐름도이다.
또한, 도8에 있어서, 에러 처리로 되어 있는 스텝으로 진행하는 것은, 입력 인 통합된 위치의 부호 k가 비트 에러로 이상(異常)이 되어 버린 경우이다. 따라서, 이 경우에는, 소정의 에러 처리를 이용하여 위치를 구하지 않으면 안된다.
또, 복호기에서의 계산량은, 루프 처리가 있는만큼, 부호기보다 증가하게 된다. 그렇지만, 각각의 루프는 오픈 루프이므로 코덱의 처리 전체량으로 보면, 복호기의 계산량은 그다지 큰 것은 아니다.
이와 같이, 본 실시형태에 의하면, 에너지가 존재하는 주파수(위치)를 정확하게 부호화할 수 있으므로, 스펙트럼 부호화에 특유의 정성적인 성능 향상을 꾀할 수 있어, 저비트레이트인 경우에 있어서도 양호한 음질을 얻을 수 있다.
또한, 본 실시형태에서는, 셰이프 부호화 후에 게인 부호화를 행하는 경우에 대해서 설명했지만, 본 발명에서는, 게인 부호화의 후에 셰이프 부호화를 행하여도 동일한 성능을 얻을 수 있다. 또, 밴드마다의 게인 부호화를 행한 뒤에 복호 게인으로 스펙트럼을 정규화하고, 본 발명의 셰이프 부호화를 행한다고 하는 방법이라도 좋다.
또, 상기 실시형태에서는, 스펙트럼의 셰이프의 양자화시에, 스펙트럼의 길이를 80, 밴드수를 5, 각 밴드에서 탐색하는 펄스수를 1개, 전구간에서 탐색하는 펄스수를 3개로 하는 경우를 예로 들었지만, 본 발명은 상기 수치에 전혀 의존하지 않으며, 다른 경우라 하더라도 동일한 효과를 얻을 수 있다.
또, 본 발명은, 밴드폭이 충분히 촘촘하고 비교적 많은 게인을 부호화할 수 있으며, 정보 비트수가 충분히 많을 경우에는, 밴드마다의 펄스 탐색만, 또는 복수의 밴드에 걸친 넓은 구간의 펄스 탐색만으로 성능을 얻을 수도 있다.
또, 상기 실시형태에서는, 동일한 위치에 2개 펄스를 출력하지 않는다라는 조건을 설정했지만, 본 발명에서는, 부분적으로 이 조건을 완화해도 좋다. 예를 들면, 밴드마다 탐색되는 펄스와, 복수 밴드에 걸친 넓은 구간에서 탐색되는 펄스가 동일한 위치에 출력되는 것을 인정한다고 하면, 밴드마다의 펄스를 지울 수 있거나, 진폭이 2배인 펄스를 출력하거나 할 수 있다. 이 조건을 완화하기 위해서는, 펄스 유무 플래그 pf[*]를 밴드마다의 펄스에 대해서 격납하지않으면 된다. 즉, 도 5의 맨 아래 스텝의 pf[pos[b]]=1을 생략하면 된다. 또, 이 조건을 완화하는 다른 방법으로서, 넓은 구간의 펄스 탐색시에 펄스 유무 플래그에 격납하지않으면 된다. 즉, 도 6의 맨 아래 스텝의 마지막의 pf[idx_max[i+5]]=1을 생략하면 된다. 단, 이 경우에는 위치의 베리에이션이 증가한다. 본 실시형태에 나타낸 것처럼 단순한 조합은 아니기 때문에, 경우분류를 하고 그 경우마다 조합을 부호화할 필요가 있다.
또, 본 실시형태에서는 직교변환 후의 스펙트럼에 대해서 펄스에 의한 부호화를 이용했지만, 본 발명은 이것에 한하지 않으며, 다른 벡터에도 적용할 수 있다. 예를 들면, FFT나 복소(複素) DCT등에서는 복소수 벡터에 본 발명을 적용하면 되고, 웨이브렛 변환등에서는 시계열의 벡터에 본 발명을 적용하면 된다. 또, 본 발명은, CELP의 음원 파형등, 시계열 벡터에도 적용할 수 있다. CELP의 음원 파형의 경우는 합성 필터를 수반하므로, 코스트 함수가 행렬 계산이 될 뿐이다. 다만, 필터를 수반할 경우는 펄스의 탐색은 오픈 루프로는 성능이 충분하지 못하기 때문에, 어느 정도 클로즈드 루프(Closed-loop) 탐색을 행하지 않으면 안 된다. 펄스 가 많을 경우 등은 빔 서치등을 행하여, 계산량을 적게 억제하는 것도 유효하다.
또, 본 발명에서는, 탐색하는 파형이 펄스(임펄스)로 한정되지 않으며, 다른 고정 파형(듀얼 펄스, 삼각파, 임펄스 응답의 유한파, 필터의 계수, 적응적으로 형상을 바꾸는 고정 파형 등)으로도 완전히 동일한 방법으로 탐색할 수 있고, 동일한 효과를 얻을 수 있다.
또, 본 실시형태에서는, CELP에 대해서 이용하는 경우에 대해서 설명했지만, 본 발명은 이것에 한하지 않으며, 다른 코덱도 유효하다.
또, 본 발명에 따른 신호는, 음성 신호 뿐만이 아니라, 오디오 신호라도 좋다. 또, 입력 신호 대신에, LPC 예측잔차신호에 대해 본 발명을 적용하는 구성이어도 좋다.
또, 본 발명에 따른 부호화 장치 및 복호 장치는, 이동체 통신 시스템에 있어서의 통신 단말장치 및 기지국 장치에 탑재하는 것이 가능하며, 이에 의해 상기와 동일한 작용 효과를 가지는 통신 단말장치, 기지국 장치, 및 이동체 통신 시스템을 제공할 수 있다.
또, 여기에서는, 본 발명을 하드웨어로 구성하는 경우를 예로 들어 설명했지만, 본 발명을 소프트웨어로 실현하는 것도 가능하다. 예를 들면, 본 발명에 따른 알고리즘을 프로그램 언어를 이용하여 기술하고, 이 프로그램을 메모리에 기억해 두고 정보처리 수단을 이용해 실행시킴으로써, 본 발명에 따른 부호화 장치와 동일한 기능을 실현할 수 있다.
또, 상기 실시형태의 설명에 이용한 각 기능 블록은, 전형적으로는 집적회로 인 LSI로서 실현된다. 이들은 개별적으로 1 칩화되어도 좋고, 일부 또는 모두를 포함하도록 1 칩화되어도 좋다.
또, 여기에서는 LSI라고 했지만, 집적도의 차이에 따라, IC, 시스템 LSI, 슈퍼 LSI, 울트라 LSI등으로 호칭되는 일도 있다.
또, 집적회로화의 수법은 LSI에 한하는 것은 아니며, 전용 회로 또는 범용 프로세서로 실현되어도 좋다. LSI 제조 후에, 프로그램화하는 것이 가능한 FPGA(Field Programmable Gate Array)나, LSI 내부의 회로 셀의 접속 혹은 설정을 재구성 가능한 리컨피규러블 프로세서를 이용해도 좋다.
또, 반도체 기술의 진보 또는 파생하는 별개의 기술에 의해, LSI에 대체되는 집적회로화의 기술이 등장하면, 당연히, 그 기술을 이용하여 기능 블록의 집적화를 행해도 좋다. 바이오 기술의 적용 등이 가능성으로서 있을 수 있다.
2007년 3월 2 일에 출원한 특허출원 2007-053497의 일본 출원에 포함되는 명세서, 도면 및 요약서의 개시 내용은, 모두 본 원에 원용된다.
본 발명은, 음성 신호나 오디오 신호를 부호화하는 부호화 장치, 및 부호화된 신호를 복호하는 복호 장치 등에 이용하기에 매우 적합하다.

Claims (6)

  1. 주파수 스펙트럼의 셰이프를 부호화하는 셰이프 양자화 수단과,
    상기 주파수 스펙트럼의 게인을 부호화하는 게인 양자화 수단을 구비하고,
    상기 셰이프 양자화 수단은,
    소정의 탐색 구간을 복수로 분할한 밴드마다 제1 고정 파형을 탐색하는 구간 탐색 수단과,
    상기 소정의 탐색 구간 전체에 걸쳐서 제2 고정 파형을 탐색하는 전체 탐색 수단을 구비하는 부호화 장치.
  2. 제 1항에 있어서,
    상기 전체 탐색 수단은, 밴드마다의 이상(理想) 게인에 의한 부호화 왜곡을 평가하면서 상기 제2 고정 파형을 탐색하는 부호화 장치.
  3. 제 1항에 있어서,
    상기 전체 탐색 수단은, 상기 제2 고정 파형의 위치 정보를, 상기 제2 고정 파형의 위치의 조합 수로 부호화하는 부호화 장치.
  4. 제 1항에 있어서,
    게인 양자화 수단은, 상기 제1 고정 파형 및 상기 제2 고정 파형의 게인을 밴드마다 산출하여 부호화하는 부호화 장치.
  5. 주파수 스펙트럼의 셰이프를 부호화하는 셰이프 양자화 수단과,
    상기 주파수 스펙트럼의 게인을 부호화하는 게인 양자화 수단을 구비하고,
    상기 셰이프 양자화 수단은, 소정의 탐색 구간을 복수로 분할한 밴드마다의 이상 게인에 의한 부호화 왜곡을 평가하면서 고정 파형을 탐색하는 부호화 장치.
  6. 주파수 스펙트럼의 셰이프를 부호화하는 셰이프 양자화 공정과,
    상기 주파수 스펙트럼의 게인을 부호화하는 게인 양자화 공정을 구비하고,
    상기 셰이프 양자화 공정은,
    소정의 탐색 구간을 복수로 분할한 밴드마다 제1 고정 파형을 탐색하는 구간 탐색 공정과,
    상기 소정의 탐색 구간 전체에 걸쳐서 제2 고정 파형을 탐색하는 전체 탐색 공정을 구비하는, 부호화 방법.
KR1020097016990A 2007-03-02 2008-02-29 부호화 장치 및 부호화 방법 KR101414359B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JPJP-P-2007-053497 2007-03-02
JP2007053497 2007-03-02
PCT/JP2008/000397 WO2008108076A1 (ja) 2007-03-02 2008-02-29 符号化装置および符号化方法

Publications (2)

Publication Number Publication Date
KR20090117877A true KR20090117877A (ko) 2009-11-13
KR101414359B1 KR101414359B1 (ko) 2014-07-22

Family

ID=39737974

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097016990A KR101414359B1 (ko) 2007-03-02 2008-02-29 부호화 장치 및 부호화 방법

Country Status (11)

Country Link
US (1) US8719011B2 (ko)
EP (1) EP2128858B1 (ko)
JP (1) JP5190445B2 (ko)
KR (1) KR101414359B1 (ko)
CN (1) CN101622663B (ko)
BR (1) BRPI0808198A8 (ko)
DK (1) DK2128858T3 (ko)
ES (1) ES2404408T3 (ko)
MX (1) MX2009009229A (ko)
RU (1) RU2463674C2 (ko)
WO (1) WO2008108076A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011071335A3 (ko) * 2009-12-10 2011-11-03 엘지전자 주식회사 음성 신호 부호화 방법 및 장치

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2009125588A1 (ja) * 2008-04-09 2011-07-28 パナソニック株式会社 符号化装置および符号化方法
CN102396024A (zh) 2009-02-16 2012-03-28 韩国电子通信研究院 使用自适应正弦波脉冲编码的用于音频信号的编码/解码方法及其设备
JP5764488B2 (ja) 2009-05-26 2015-08-19 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 復号装置及び復号方法
IL295473B2 (en) 2010-07-02 2023-10-01 Dolby Int Ab After–selective bass filter
CN104347079B (zh) * 2010-08-24 2017-11-28 Lg电子株式会社 处理音频信号的方法和设备
WO2013051210A1 (ja) * 2011-10-07 2013-04-11 パナソニック株式会社 符号化装置及び符号化方法
US9336788B2 (en) * 2014-08-15 2016-05-10 Google Technology Holdings LLC Method for coding pulse vectors using statistical properties
US10277997B2 (en) 2015-08-07 2019-04-30 Dolby Laboratories Licensing Corporation Processing object-based audio signals
JP7016660B2 (ja) * 2017-10-05 2022-02-07 キヤノン株式会社 符号化装置、その制御方法、および制御プログラム、並びに撮像装置

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5701392A (en) * 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
JP3264679B2 (ja) 1991-08-30 2002-03-11 沖電気工業株式会社 コード励振線形予測符号化装置及び復号化装置
JP3343965B2 (ja) * 1992-10-31 2002-11-11 ソニー株式会社 音声符号化方法及び復号化方法
JP3186007B2 (ja) 1994-03-17 2001-07-11 日本電信電話株式会社 変換符号化方法、復号化方法
CA2154911C (en) * 1994-08-02 2001-01-02 Kazunori Ozawa Speech coding device
JP3747492B2 (ja) * 1995-06-20 2006-02-22 ソニー株式会社 音声信号の再生方法及び再生装置
TW321810B (ko) * 1995-10-26 1997-12-01 Sony Co Ltd
WO1998040877A1 (fr) * 1997-03-12 1998-09-17 Mitsubishi Denki Kabushiki Kaisha Codeur vocal, decodeur vocal, codeur/decodeur vocal, procede de codage vocal, procede de decodage vocal et procede de codage/decodage vocal
JP3147807B2 (ja) * 1997-03-21 2001-03-19 日本電気株式会社 信号符号化装置
JP3063668B2 (ja) * 1997-04-04 2000-07-12 日本電気株式会社 音声符号化装置及び復号装置
JP3185748B2 (ja) 1997-04-09 2001-07-11 日本電気株式会社 信号符号化装置
CA2233896C (en) * 1997-04-09 2002-11-19 Kazunori Ozawa Signal coding system
JP3954716B2 (ja) * 1998-02-19 2007-08-08 松下電器産業株式会社 音源信号符号化装置、音源信号復号化装置及びそれらの方法、並びに記録媒体
JP3199020B2 (ja) * 1998-02-27 2001-08-13 日本電気株式会社 音声音楽信号の符号化装置および復号装置
US6353808B1 (en) * 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
US20020016161A1 (en) * 2000-02-10 2002-02-07 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for compression of speech encoded parameters
WO2002029782A1 (en) * 2000-10-02 2002-04-11 The Regents Of The University Of California Perceptual harmonic cepstral coefficients as the front-end for speech recognition
JP3582589B2 (ja) * 2001-03-07 2004-10-27 日本電気株式会社 音声符号化装置及び音声復号化装置
AU2003234763A1 (en) * 2002-04-26 2003-11-10 Matsushita Electric Industrial Co., Ltd. Coding device, decoding device, coding method, and decoding method
EP1691344B1 (en) * 2003-11-12 2009-06-24 HONDA MOTOR CO., Ltd. Speech recognition system
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
EP1761916A1 (en) * 2004-06-22 2007-03-14 Koninklijke Philips Electronics N.V. Audio encoding and decoding
CN101107505A (zh) * 2005-01-26 2008-01-16 松下电器产业株式会社 语音编码装置和语音编码方法
JP4907522B2 (ja) * 2005-04-28 2012-03-28 パナソニック株式会社 音声符号化装置および音声符号化方法
JP4850827B2 (ja) * 2005-04-28 2012-01-11 パナソニック株式会社 音声符号化装置および音声符号化方法
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
DE602006018618D1 (de) * 2005-07-22 2011-01-13 France Telecom Verfahren zum umschalten der raten- und bandbreitenskalierbaren audiodecodierungsrate
JP2007053497A (ja) 2005-08-16 2007-03-01 Canon Inc 映像表示装置及び映像表示方法
EP1953736A4 (en) * 2005-10-31 2009-08-05 Panasonic Corp STEREO CODING DEVICE AND METHOD FOR PREDICTING STEREO SIGNAL
EP1990800B1 (en) * 2006-03-17 2016-11-16 Panasonic Intellectual Property Management Co., Ltd. Scalable encoding device and scalable encoding method
JP4823001B2 (ja) * 2006-09-27 2011-11-24 富士通セミコンダクター株式会社 オーディオ符号化装置
US20080243518A1 (en) * 2006-11-16 2008-10-02 Alexey Oraevsky System And Method For Compressing And Reconstructing Audio Files
JP5113799B2 (ja) 2009-04-22 2013-01-09 株式会社ニフコ 回転ダンパー

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011071335A3 (ko) * 2009-12-10 2011-11-03 엘지전자 주식회사 음성 신호 부호화 방법 및 장치
CN102656629A (zh) * 2009-12-10 2012-09-05 Lg电子株式会社 编码语音信号的方法和设备
US9076442B2 (en) 2009-12-10 2015-07-07 Lg Electronics Inc. Method and apparatus for encoding a speech signal

Also Published As

Publication number Publication date
RU2009132936A (ru) 2011-03-10
MX2009009229A (es) 2009-09-08
CN101622663A (zh) 2010-01-06
US8719011B2 (en) 2014-05-06
RU2463674C2 (ru) 2012-10-10
US20100057446A1 (en) 2010-03-04
EP2128858B1 (en) 2013-04-10
JP5190445B2 (ja) 2013-04-24
BRPI0808198A8 (pt) 2017-09-12
DK2128858T3 (da) 2013-07-01
BRPI0808198A2 (pt) 2014-07-08
EP2128858A4 (en) 2012-03-14
ES2404408T3 (es) 2013-05-27
JPWO2008108076A1 (ja) 2010-06-10
WO2008108076A1 (ja) 2008-09-12
EP2128858A1 (en) 2009-12-02
KR101414359B1 (ko) 2014-07-22
CN101622663B (zh) 2012-06-20

Similar Documents

Publication Publication Date Title
JP5190445B2 (ja) 符号化装置および符号化方法
US8386267B2 (en) Stereo signal encoding device, stereo signal decoding device and methods for them
KR101414341B1 (ko) 부호화 장치 및 부호화 방법
EP0942411B1 (en) Audio signal coding and decoding apparatus
CN101878504A (zh) 使用时间分辨率能选择的低复杂性频谱分析/合成
KR101390051B1 (ko) 벡터 양자화 장치, 벡터 역양자화 장치, 및 이러한 방법
WO2009125588A1 (ja) 符号化装置および符号化方法
US20050114123A1 (en) Speech processing system and method
EP0810584A2 (en) Signal coder
EP0871158A2 (en) System for speech coding using a multipulse excitation
US20100094623A1 (en) Encoding device and encoding method
JP5525540B2 (ja) 符号化装置および符号化方法
Bouzid et al. Switched split vector quantizer applied for encoding the LPC parameters of the 2.4 Kbits/s MELP speech coder
Ramachandran Quantization of discrete time signals
CA2991341A1 (en) Bit error detector for an audio signal decoder
Ramadan Compressive sampling of speech signals
Ozaydin Residual Lsf Vector Quantization Using Arma Prediction

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
N231 Notification of change of applicant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170601

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180329

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190327

Year of fee payment: 6