KR100309727B1 - 오디오 신호 부호화 장치 및 복호화 장치와 오디오 신호 부호화 및 복호화 방법 - Google Patents

오디오 신호 부호화 장치 및 복호화 장치와 오디오 신호 부호화 및 복호화 방법 Download PDF

Info

Publication number
KR100309727B1
KR100309727B1 KR1019997001099A KR19997001099A KR100309727B1 KR 100309727 B1 KR100309727 B1 KR 100309727B1 KR 1019997001099 A KR1019997001099 A KR 1019997001099A KR 19997001099 A KR19997001099 A KR 19997001099A KR 100309727 B1 KR100309727 B1 KR 100309727B1
Authority
KR
South Korea
Prior art keywords
quantization
band
vector quantizer
stage
vector
Prior art date
Application number
KR1019997001099A
Other languages
English (en)
Other versions
KR20000023852A (ko
Inventor
츠시마미네오
노리마츠다케시
이시카와도모카즈
Original Assignee
마츠시타 덴끼 산교 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마츠시타 덴끼 산교 가부시키가이샤 filed Critical 마츠시타 덴끼 산교 가부시키가이샤
Publication of KR20000023852A publication Critical patent/KR20000023852A/ko
Application granted granted Critical
Publication of KR100309727B1 publication Critical patent/KR100309727B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3082Vector coding

Abstract

오디오 신호 부호화 장치 및 복호화 장치에 있어서, 복호화 장치에 의해, 부호화 장치로부터의 정보를 전부 사용하지 않는 것도 오디오 신호의 재생을 실행할 수 있는 부호화 장치와, 이것에 대한 복호화 장치를 제공한다.
부호화 장치(1)를 구성하는 양자화부를, 저역, 중역, 고역의 소양자화부로 이루어지는 제 1 소양자화부(501)와, 제 1 소양자화부(501)의 양자화 오차를 더욱 양자화하는 제 2 소양자화부(502)와, 제 1 소양자화부(501)와 제 2 소양자화부(502)에서 처리를 실행한 후 한층 더 양자화 오차를 양자화하는 제 3 소양자화부(503)를 갖는 구조로 한다.

Description

오디오 신호 부호화 장치 및 복호화 장치와 오디오 신호 부호화 및 복호화 방법{AUDIO SIGNAL ENCODER, AUDIO SIGNAL DECODER, AND METHOD FOR ENCODING AND DECODING AUDIO SIGNAL}
오디오 신호를 효율적으로 부호화 및 복호화하는 여러가지 방법이 제안되고 있다. 음악 신호등 20kHz 이상의 주파수 대역을 갖는 오디오 신호는, 특히 최근, MPEG 오디오 방식 등이 있다. MPEG 방식에 대표되는 부호화 방식은, 시간축의 디지탈 오디오 신호를 코사인 변환 등의 직교 변환을 이용하여 주파수축상의 데이터로 변환하여, 그 주파수축상의 정보를 인간의 청각적인 감도 특성을 이용하여 청각적으로 중요한 정보로부터 부호화해 가는 방식으로, 청각적으로 중요하지 않은 정보나 용장인 정보는 부호화하지 않는 방식이다. 원 디지탈 신호의 정보량에 대하여 상당히 적은 정보량으로 표현하고자 하는 경우, 벡터 양자화의 방법을 이용한 TC-WVQ 등의 부호화 방식이 있다. MPEG 오디오 및 TC-WVQ는 각각 ISO/IEC 표준 IS-11172-3 및 T.Moriya, H.Suga:An 8 Kbits transform coder for noisy channels, Proc.ICASSP 89,pp196-199 등에 기술되어 있다. 여기에서 도 24를 이용하여 종래의 오디오 부호화 장치의 구성에 대하여 설명한다.
도 24에 있어서, (1601)은 입력 신호를 주파수 변환하는 FFT부, (1602)는 주파수 변환된 입력 신호 중의 특정한 대역을 부호화하도록 최소 가청 한계와 마스킹 특성 산출에 의한 적응 비트 할당의 산출을 실행하는 적응 비트 할당 산출부, (1603)은 입력 신호를 복수의 대역으로 분할하는 서브 밴드 대역 분할부, (1604)는 복수로 분할된 대역의 각 성분을 환산 계수를 이용하여 정규화하는 환산 계수 정규화부, (1605)는 환산 계수 정규화부(1604)의 정규화 출력을, 상기 적응 비트 할당 산출부(1602)로부터의 비트 할당에 따라 스칼라 양자화하는 스칼라 양자화부이다.
다음에 동작에 대하여 설명한다. 입력 신호는, FFT부(1601)와, 서브 밴드 대역 분할부(1603)에 입력된다. FFT부(1601)에서는, 입력 신호를 주파수 변환하여, 그 출력을 적응 비트 할당부(1602)에 입력한다. 적응 비트 할당부(1602)에서는, 인간의 청각 특성에 근거하여 정의된 최소 가청 한계와, 마스킹 특성을 바탕으로, 임의의 대역 성분에 대하여 어느 정도 정보량을 부여해야 하는가를 산출하여,그 대역마다의 정보량 배분을 인덱스로 부호화한다.
한편, 서브 밴드 대역 분할부(1603)에서는 입력 신호를 예를 들어, 32의 대역으로 분할하여 출력한다. 그리고 환산 계수 정규화부(1604)에서는 상기 서브 밴드 대역 분할부(1603)에서 분할된 각각의 대역 성분에 대하여, 소정의 대표값을 갖고 정규화를 실행한다. 해당 정규화의 값은 인덱스 IND1로서 양자화된다. 스칼라 양자화부(1605)에서는 상기 적응 비트 할당 산출부(1602)에서 산출된 비트 배분을 바탕으로, 환산 계수 정규화부(1604)의 출력을 스칼라 양자화하여, 그 양자화값을 인덱스 IND2로서 부호화한다.
종래의 오디오 신호 부호화 장치는 이상과 같이 구성되어 있고, MPEG 오디오방식은, 1 채널당 64000 비트/초 이상의 정보량으로 부호화되어 사용되는 방법이 일반적으로, 그 이하의 정보량으로는, 재생 가능한 주파수 대역폭이나 복호된 오디오 신호의 주관적인 품질이 현저히 열화하는 경우가 있다. 이것은, 도 24에 나타낸 예와 같이, 부호화된 정보를 크게 나누어, 적응 비트 할당부(1602)에 의한 비트 배분, 환산 계수 정규화부(1604)에 의한 대역 대표값, 스칼라 양자화부(1605)에 의한 양자화값의 3가지로 이루어지며, 높은 압축율의 경우에는, 정보량이 양자화값 출력에 충분히 배분되지 않기 때문이다. 또한, 종래의 오디오 신호의 부호화 장치에 있어서는, 부호화하는 정보량과 복호화하는 정보량을 동일하게 하여, 부호화 장치 및 복호화 장치를 구성하는 방법이 일반적이다. 예를 들면, 1초 사이에 128000 bit의 정보량으로 부호화하는 방법에서는, 그 복호화 장치로는 128000 bit의 정보량을 복호화하도록 구성되어 있다.
그러나, 이상과 같은 것으로부터, 종래의 오디오 신호 부호화 장치 및 복호화 장치에서는, 양호한 음질을 얻기 위해서는 고정된 정보량으로 부호화 및 복호화를 실행해야만 하고, 높은 압축율로써 고품질인 음질을 얻을 수 없었다.
본 발명은 이상과 같은 문제점을 해결하기 위해서 이루어진 것으로, 적은 정보량으로 부호화 및 복호화를 실행하여도, 높은 품질과 넓은 재생 주파수 대역을 얻을 수 있고, 또한 부호화 및 복호화시의 정보량을 고정의 값이 아니라 이것을 가변으로 실행할 수 있는 오디오 신호 부호화 장치 및 복호화 장치, 또한, 오디오 신호 부호화·복호화 방법을 제공하는 것을 목적으로 한다.
또한, 본 발명은, 양자화 효율을 더욱 크게 향상시킬 수 있는 오디오 신호 부호화 장치 및 복호화 장치, 또한, 오디오 신호 부호화·복호화 방법을 제공하는 것을 목적으로 한다.
발명의 개시
상기의 과제를 해결하기 위해서, 본 발명의 청구항 1의 발명은, 입력 오디오 신호를 주파수 변환하여 얻어진 주파수 특성 신호 계열에 대하여 벡터 양자화를 실행하여 오디오 신호의 부호화를 실행하는 오디오 신호 부호화 장치에 있어서, 상기 주파수 특성 신호 계열 또는 그 일부를 벡터 양자화하는 제 1 단째의 벡터 양자화기와, 상기 제 1 단째의 벡터 양자화기에 의한 양자화 오차 성분을 벡터 양자화하는 제 2 단째의 벡터 양자화기를 적어도 갖는 다단 양자화 수단을 구비하고, 상기 다단 양자화 수단의 각 단의 양자화 수단은, 상기 주파수 특성 신호 계열을, 적어도 2개 이상의 복수의 단 사이에서 중복하는 부분을 가질 수 있는 주파수 대역으로 각 단마다의 분할 방법에 의해 분할한, 복수의 주파수 대역 중 어느 하나의 대역의 계수열을 벡터 양자화하는 적어도 하나 이상의 분할화 벡터 양자화기를 구비한 것을 특징으로 하는 것이다.
본 발명의 청구항 2의 발명은, 청구항 1에 기재된 오디오 신호 부호화 장치에 있어서, 상기 주파수 특성 신호 계열을 정규화하여, 그 출력을 상기 다단 양자화 수단에 부가하는 정규화 수단을 구비한 것이다.
본 발명의 청구항 3의 발명은, 청구항 1 또는 청구항 2에 기재된 오디오 신호 부호화 장치에 있어서, 상기 각 단의 양자화 수단은, 양자화해야 할 상기 주파수 특성 신호 계열의 분할한 주파수 대역으로서, 양자화 오차의 에너지 가산합이 큰 대역을 적절히 선택하여, 양자화를 실행하는 것으로 한 것이다.
본 발명의 청구항 4의 발명은, 청구항 1 또는 청구항 2에 기재된 오디오 신호 부호화 장치에 있어서, 상기 각 단의 양자화 수단은, 양자화해야 할 상기 주파수 특성 신호 계열의 분할한 주파수 대역으로서, 인간의 청각적인 성질인 청각 감도 특성에 근거하여, 그 중요도가 높은 대역에 큰 값을 가중한 양자화 오차의 에너지 가산합이 큰 대역을 적절히 선택하여, 양자화를 실행하는 것으로 한 것이다.
본 발명의 청구항 5의 발명은, 청구항 1∼청구항 4중 어느 한 항에 기재된 오디오 신호 부호화 장치에 있어서, 상기 다단 양자화 수단을 구성하는 제 1 단째의 벡터 양자화기와 제 2 단째의 벡터 양자화기 사이에 제 1 양자화 대역 선택부를, 상기 제 2 단째의 벡터 양자화기와 상기 제 3 단째의 벡터 양자화기 사이에 제2 양자화 대역 선택부를 구비하고, 상기 제 1 양자화 대역 선택부는, 상기 제 1 단째의 벡터 양자화기의 양자화 오차의 출력을 그 입력으로 하여, 상기 제 2 단째의 벡터 양자화기가 양자화해야 할 대역을 선택하는 것이고, 상기 제 2 양자화 대역 선택부는, 상기 제 2 단째의 벡터 양자화기의 양자화 오차의 출력을 그 입력으로 하여, 상기 제 3 단째의 벡터 양자화기가 양자화해야 할 대역을 선택하는 것으로 한 것이다.
본 발명의 청구항 6의 발명은, 청구항 5에 기재된 오디오 신호 부호화 장치에 있어서, 상기 다단 양자화 수단은, 상기 주파수 특성 신호 계열의 상기 분할한 각 주파수 대역마다의 각 계수열을, 제 i 단째의 분할화된 벡터 양자화기에 의해서 독립적으로 양자화하는 복수의 제 i 단째의 분할화 벡터 양자화기와, 양자화해야 할 입력 신호의 각 주파수 대역을, 적어도 한번은 전부 양자화하는 전 대역 양자화부로 이루어지는 제 j 단째의 벡터 양자화기를 구비하고 있는 것으로 한 것이다.
본 발명의 청구항 7의 발명은, 청구항 1에 기재된 오디오 신호 부호화 장치에 있어서, 상기 다단 양자화 수단은, 전단(前段)의 벡터 양자화기가 코드북을 이용하는 벡터 양자화 방법을 이용하여 벡터 양자화에 있어서의 양자화 오차를 산출하고, 후단(後段)의 벡터 양자화기가, 해당 산출한 양자화 오차에 대하여 벡터 양자화를 더 실행하는 것으로 한 것이다.
본 발명의 청구항 8의 발명은, 청구항 2에 기재된 오디오 신호 부호화 장치에 있어서, 상기 다단 양자화 수단은, 전단 벡터 양자화기가 코드북을 이용하는 벡터 양자화 방법을 이용하여 벡터 양자화에 있어서의 양자화 오차를 산출하고, 후단의 벡터 양자화기가, 해당 산출한 양자화 오차에 대하여 벡터 양자화를 더 실행하는 것으로 한 것이다.
본 발명의 청구항 9의 발명은, 청구항 8에 기재된 오디오 신호 부호화 장치에 있어서, 상기 다단 양자화 수단의 벡터 양자화기는, 벡터 양자화에 있어서의 상기 코드북내의 최적한 코드를 검색할 때에 이용하는 코드간 거리의 계산에 있어서, 상기 정규화 수단에서 출력되는 입력 신호의 정규화 성분을 가중으로서 이용하여 해당 거리를 계산하며, 최소 거리를 부여하는 코드를 추출하는 것으로 한 것이다.
본 발명의 청구항 10의 발명은, 청구항 9에 기재된 오디오 신호 부호화 장치에 있어서, 상기 다단 양자화 수단의 벡터 양자화기는, 상기 정규화 수단에 의해 출력된 주파수 특성 신호 계열의 정규화 성분과, 인간의 청각적인 성질인 청각 감도 특성을 고려한 값 양자를 가중으로서, 상기 거리를 계산하여, 최소 거리를 부여하는 코드를 추출하는 것으로 한 것이다.
본 발명의 청구항 11의 발명은, 청구항 2 및 청구항 8∼청구항 10 중 어느 한 항에 기재된 오디오 신호 부호화 장치에 있어서, 상기 정규화 수단은, 상기 주파수 특성 신호 계열의 개형(槪形)을 대략 정규화하는 주파수 개형 정규화부를 구비한 것으로 한 것이다.
본 발명의 청구항 12의 발명은, 청구항 2 및 청구항 8∼청구항 10 중 어느 한 항에 기재된 오디오 신호 부호화 장치에 있어서, 상기 정규화 수단은, 상기 주파수 특성 신호 계열을, 복수의 연속한 단위 주파수 대역의 각 성분으로 나눠, 각 단위 대역의 계수열을 1개의 값으로 제산함으로써 정규화하는 대역 진폭 정규화부를 구비한 것으로 한 것이다.
본 발명의 청구항 13의 발명은, 청구항 1에 기재된 오디오 신호 부호화 장치에 있어서, 상기 다단 양자화 수단은, 상기 주파수 특성 신호 계열의 상기 분할한 각 주파수 대역마다의 각 계수열을, 분할화 벡터 양자화기에 의해서 독립적으로 양자화하는 벡터 양자화기와, 양자화해야 할 입력 신호의 각 주파수 대역을, 적어도 한번은 전부 양자화하는 전(全) 대역 양자화부로 이루어지는 벡터 양자화기를 구비하고 있는 것으로 한 것이다.
본 발명의 청구항 14의 발명은, 청구항 13에 기재된 오디오 신호 부호화 장치에 있어서, 상기 다단 양자화 수단은, 저역의 분할화 벡터 양자화기와 중역(中域)의 분할화 벡터 양자화기와 고역(高域)의 분할화 벡터 양자화기로 이루어지는 제 1 벡터 양자화기와, 이것의 후단에 접속되는 제 2 벡터 양자화기와, 이것의 후단에 접속되는 제 3 벡터 양자화기를 구비하고, 해당 다단 양자화 수단에 입력된 주파수 특성 신호 계열을 3가지의 대역으로 분할하며, 해당 3가지 대역 중의 낮은 대역 성분의 주파수 특성 신호 계열을 상기 저역의 분할화 벡터 양자화기로 양자화하고, 상기 3가지 대역 중의 중간 대역 성분의 주파수 특성 신호 계열을 상기 중역의 분할화 벡터 양자화기로 양자화하며, 상기 3가지 대역 중의 높은 대역 성분의 주파수 특성 신호 계열을 상기 고역의 분할화 벡터 양자화기에 의해 각각 독립적으로 양자화를 실행하여, 상기 제 1 벡터 양자화기를 구성하는 각각의 분할화 벡터 양자화기로 주파수 특성 신호 계열에 대한 양자화 오차를 산출해서, 이것을 후단의 상기 제 2 벡터 양자화기로의 입력으로 하고, 상기 제 2 벡터 양자화기에서는, 해당 제 2 벡터 양자화기가 양자화하는 대역폭분의 양자화를 실행하고, 해당 제 2 벡터 양자화기로의 입력에 대한 양자화 오차를 산출하여 이것을 상기 제 3 벡터 양자화기로의 입력으로 하며, 상기 제 3 벡터 양자화기에서는, 해당 제 3 벡터 양자화기가 양자화하는 대역폭분의 양자화를 실행하는 것으로 한 것이다.
본 발명의 청구항 15의 발명은, 청구항 14에 기재된 오디오 신호 부호화 장치에 있어서, 상기 다단 양자화 수단을 구성하는 제 1 벡터 양자화기와 제 2 벡터 양자화기 사이에 제 1 양자화 대역 선택부를 마련함과 동시에, 상기 제 2 벡터 양자화기와 상기 제 3 벡터 양자화기 사이에 제 2 양자화 대역 선택부를 마련하고, 상기 제 1 양자화 대역 선택부는, 상기 제 1 벡터 양자화기의 출력을 그 입력으로 하여, 상기 제 2 벡터 양자화기가 양자화해야 할 대역을 선택하며, 상기 제 2 벡터 양자화기는, 상기 제 1 양자화 대역 선택부에서 선택된 대역의, 상기 3가지 벡터 양자화기로 이루어지는 제 1 벡터 양자화기의 양자화 오차에 대하여, 해당 제 2 벡터 양자화기가 양자화하는 대역폭분의 양자화를 실행해서, 해당 제 2 벡터 양자화기로의 입력에 대한 양자화 오차를 산출하여, 이것을 상기 제 2 양자화 대역 선택부로의 입력으로 하고, 상기 제 2 양자화 대역 선택부는, 상기 제 2 벡터 양자화기로부터의 양자화 오차를 입력으로 하여, 상기 제 3 벡터 양자화기가 양자화해야 할 대역을 선택하며, 상기 제 3 벡터 양자화기는, 상기 제 2 양자화 대역 선택부가 선택한 대역의 상기 제 2 벡터 양자화기로부터의 양자화 오차에 대하여, 해당 제 2 벡터 양자화기가 양자화하는 대역폭분의 양자화를 실행하는 것으로 한 것이다.
본 발명의 청구항 16의 발명은, 청구항 14에 기재된 오디오 신호 부호화 장치에 있어서, 상기 제 1 벡터 양자화기 대신에, 상기 저역의 분할화 벡터 양자화기와, 중역의 분할화 벡터 양자화기와, 고역의 분할화 벡터 양자화기를 이용하여 상기 제 2 벡터 양자화기 또는 제 3 벡터 양자화기를 구성하는 것으로 한 것이다.
본 발명의 청구항 17의 발명은, 청구항 1에 기재된 오디오 신호 부호화 장치로부터의 출력인 부호를 그 입력으로 하여, 이것을 복호화하여 원(元) 입력 오디오 신호에 상당하는 신호를 출력하는 오디오 신호 복호화 장치에 있어서, 상기 오디오 신호 부호화 장치의 양자화 수단이 출력한 부호의 적어도 일부를 이용하여 역양자화를 실행하는 역양자화부와, 해당 역양자화부의 출력인 주파수 특성 신호 계열을 이용하여, 주파수 특성 신호 계열을 원(元) 오디오 입력 신호에 상당하는 신호로 변환하는 역주파수 변환부를 구비한 것으로 한 것이다.
본 발명의 청구항 18의 발명은, 청구항 2에 기재된 오디오 신호 부호화 장치로부터의 출력인 부호를 그 입력으로 하여, 이것을 복호화하여 원 입력 오디오 신호에 상당하는 신호를 출력하는 오디오 신호 복호화 장치에 있어서, 주파수 특성 신호 계열을 재생하는 역양자화부와, 해당 역양자화부의 출력인 주파수 특성 신호 계열을 이용하여, 상기 오디오 신호 부호화 장치의 출력인 부호를 바탕으로 정규화 성분을 재생해서, 상기 주파수 특성 신호 계열과 정규화 성분을 승산하여 출력하는 역정규화부와, 해당 역정규화부의 출력을 수신하여, 주파수 특성 신호 계열을 원 오디오 신호에 상당하는 신호로 변환하는 역주파수 변환부를 구비한 것으로 한 것이다.
본 발명의 청구항 19의 발명은, 청구항 13에 기재된 오디오 신호 부호화 장치로부터의 출력인 부호를 그 입력으로 하여, 이것을 복호화하여 원 오디오 신호에 상당하는 신호를 출력하는 오디오 신호 복호화 장치에 있어서, 상기 오디오 신호 부호화 장치에 있어서의 양자화 수단을 구성하는 벡터 양자화기의 전부 또는 일부가 부호를 출력한 경우에서도, 출력된 부호를 이용하여 역양자화를 실행하는 역양자화부를 구비한 것으로 한 것이다.
본 발명의 청구항 20의 발명은, 청구항 19에 기재된 오디오 신호 복호화 장치에 있어서, 상기 역양자화부는, 임의 단의 소정 대역의 양자화 부호의 역양자화에 있어서, 해당 소정 대역의 다음 단의 양자화 부호의 역양자화와, 해당 임의 단의 해당 소정의 대역과는 서로 다른 대역의 양자화 부호의 역양자화를 교대로 실행하는 것으로, 해당 소정 대역의 다음 단의 양자화 부호가 존재하지 않는 경우에는, 또한 다른 대역의 양자화 부호의 역양자화를 계속하여 실행하고, 상기 소정의 대역과는 서로 다른 대역의 양자화 부호가 존재하지 않는 경우에는, 또한 다음 단의 양자화 부호의 역양자화를 계속하여 실행하는 것으로 한 것이다.
본 발명의 청구항 21의 발명은, 청구항 14에 기재된 오디오 신호 부호화 장치로부터의 출력인 부호를 그 입력으로 하여, 이것을 복호화하여 원 오디오 신호에 상당하는 신호를 출력하는 오디오 신호 복호화 장치에 있어서, 상기 오디오 신호 부호화 장치에 있어서의 제 1 벡터 양자화기를 구성하는 3가지의 분할화 벡터 양자화기로부터 전부 또는 일부가 부호를 출력한 경우에서도, 상기 제 1 벡터 양자화기를 구성하는 저역의 분할화 벡터 양자화기로부터의 부호만을 이용하여 역양자화를 실행하는 역양자화부를 구비한 것으로 한 것이다.
본 발명의 청구항 22의 발명은, 청구항 21에 기재된 오디오 신호 복호화 장치에 있어서, 상기 역양자화부가, 상기 제 1 벡터 양자화기를 구성하는 저역의 분할화 벡터 양자화기로부터의 부호에 덧붙여, 상기 제 2 벡터 양자화기로부터의 부호를 이용하여 역양자화를 실행하는 것으로 한 것이다.
본 발명의 청구항 23의 발명은, 청구항 22에 기재된 오디오 신호 복호화 장치에 있어서, 상기 역양자화부가, 상기 제 1 벡터 양자화부를 구성하는 저역의 분할화 벡터 양자화기로부터의 부호와, 상기 제 2 벡터 양자화기로부터의 부호에 덧붙여, 상기 제 1 벡터 양자화기를 구성하는 중역의 분할화 벡터 양자화기로부터의 부호를 이용하여 역양자화를 실행하는 것으로 한 것이다.
본 발명의 청구항 24의 발명은, 청구항 23에 기재된 오디오 신호 복호화 장치에 있어서, 상기 역양자화부가, 상기 제 1 벡터 양자화기를 구성하는 저역의 분할화 벡터 양자화기로부터의 부호와, 상기 제 2 벡터 양자화기로부터의 부호와, 상기 제 1 벡터 양자화기를 구성하는 중역의 분할화 벡터 양자화기로부터의 부호에 덧붙여, 상기 제 3 벡터 양자화기로부터의 부호를 이용하여 역양자화를 실행하는 것으로 한 것이다.
본 발명의 청구항 25의 발명은, 청구항 24에 기재된 오디오 신호 복호화 장치에 있어서, 상기 역양자화부가, 상기 제 1 벡터 양자화기를 구성하는 저역의 분할화 벡터 양자화기로부터의 부호와, 상기 제 2 벡터 양자화기로부터의 부호와, 상기 제 1 벡터 양자화기를 구성하는 중역의 분할화 벡터 양자화기로부터의 부호와, 상기 제 3 벡터 양자화기로부터의 부호에 덧붙여, 상기 제 1 벡터 양자화기를 구성하는 고역의 분할화 벡터 양자화기로부터의 부호를 이용하여 역양자화를 실행하는 것으로 한 것이다.
본 발명의 청구항 26의 발명은, 입력 오디오 신호를 주파수 변환하여 얻어진 주파수 특성 신호 계열을 수신하여, 이것을 부호화하여 출력하고, 해당 출력된 부호 신호를 입력으로 하여, 이것을 복호화하여 원 입력 오디오 신호에 상당하는 신호를 재생하는 오디오 신호 부호화·복호화 방법에 있어서, 상기 주파수 특성 신호 계열을, 적어도 2개 이상의 주파수 대역으로 분할한 대역에 상당하는 계수열로 나눠, 각각 독립적으로 양자화하여 출력하고, 수신한 양자화 완료의 신호로부터, 상기 분할된 대역에 상당하는 임의의 대역의 데이터를 역양자화함으로써, 원 오디오 입력 신호에 상당하는 신호를 재생하는 것으로 한 것이다.
본 발명의 청구항 27의 발명은, 청구항 26에 기재된 오디오 신호 부호화·복호화 방법에 있어서, 상기 양자화는, 산출된 양자화 오차를 더욱 양자화하도록 단계적으로 실행되고, 상기 역양자화는, 대역을 확장하는 방향의 역양자화와, 상기 양자화시의 양자화 단계가 깊게 되는 방향의 역양자화를 반복하여 교대로 실행하는 것으로 한 것이다.
본 발명의 청구항 28의 발명은, 청구항 27에 기재된 오디오 신호 부호화·복호화 방법에 있어서, 상기 대역을 확장하는 방향의 역양자화는, 인간의 청각 심리 특성을 고려한 순으로써 대역을 확장하여 실행하는 것으로 한 것이다.
본 발명의 청구항 29의 발명은, 청구항 26∼청구항 28 중 어느 한 항에 기재된 오디오 신호 부호화·복호화 방법에 있어서, 부호화측에 있어서는, 상기 주파수특성 신호 계열을 정규화한 후, 해당 주파수 특성 신호 계열을, 적어도 2개 이상의 주파수 대역으로 분할한 대역에 상당하는 계수열로 나눠, 각각 독립적으로 양자화하여 출력하는 처리를 실행하고, 복호화측에 있어서는, 상기 부호화측으로부터의 정규화에 관한 부호를 이용하여, 상기 부호화측으로부터의 부호를 역정규화한 후, 해당 역정규화한 부호에 대하여, 상기 분할된 대역에 상당하는 임의의 대역의 데이터를 역양자화함으로써, 원 오디오 입력 신호에 상당하는 신호를 재생하는 것으로 한 것이다.
본 발명의 청구항 30의 발명은, 입력 오디오 신호를 주파수 변환하여 얻어진 주파수 특성 신호 계열에 대하여, 정규화 및 벡터 양자화를 실행하여, 오디오 신호의 부호화를 실행하는 오디오 신호 부호화 장치에 있어서, 상기 주파수 특성 신호 계열 또는 그 일부를 정규화 및 벡터 양자화하는 제 1 단째의 정규화, 벡터 양자화기와, 상기 제 1 단째의 벡터 양자화기에 의한 양자화 오차 성분을 정규화 및 벡터 양자화하는 제 2 단째의 정규화, 벡터 양자화기를 적어도 갖는 다단 양자화 수단을 구비하고, 상기 다단 양자화 수단의 각 단의 양자화 수단은, 상기 주파수 특성 신호 계열을, 적어도 2개 이상의 복수의 단 사이에서 중복하는 부분을 가질 수 있는 주파수 대역으로 각 단마다의 분할의 방법으로 분할한, 복수의 주파수 대역 중 어느 한 대역의 계수열을 정규화 및 벡터 양자화한 적어도 하나 이상의 분할화된 정규화, 벡터 양자화기를 구비한 것을 특징으로 하는 것이다.
본 발명의 청구항 31의 발명은, 청구항 30의 오디오 신호 부호화 장치에 있어서, 상기 다단 양자화 수단을 구성한 제 1 단째의 정규화, 벡터 양자화기와 제 2단째의 정규화, 벡터 양자화기 사이에 제 1 양자화 대역 선택부를, 상기 제 2 단째의 정규화, 벡터 양자화기와, 상기 제 3 단째의 정규화, 벡터 양자화기 사이에 제 2 양자화 대역 선택부를 구비하고, 상기 제 1 양자화 대역 선택부는, 상기 제 1 단째의 정규화, 벡터 양자화기의 양자화 오차의 출력을 그 입력으로 하여, 상기 제 2 단째의 정규화, 벡터 양자화기가 양자화해야 할 대역을 선택하며, 그 선택한 대역의 양자화 오차 출력을, 상기 제 2 단째의 정규화, 벡터 양자화기에 출력하는 것이고, 상기 제 2 양자화 대역 선택부는, 상기 제 2 단째의 정규화, 벡터 양자화기의 양자화 오차의 출력을 그 입력으로 하여, 해당 제 3 단째의 정규화, 벡터 양자화기가 양자화해야 할 대역을 선택하며, 그 선택한 대역의 양자화 오차 출력을, 상기 제 3 단째의 정규화, 벡터 양자화기에 출력하는 것으로 한 것이다.
본 발명의 청구항 32의 발명은, 청구항 31에 기재된 오디오 신호 부호화 장치에 있어서, 상기 다단 양자화 수단의 2 단째 이후의 각 단의 정규화, 벡터 양자화기는, 정규화, 양자화해야 할 상기 주파수 특성 신호 계열이 분할한 주파수 대역 중, 전단의 정규화, 벡터 양자화기의 출력인 양자화 오차의 에너지 가산합이 큰 대역을, 적절히 선택하여, 정규화, 양자화를 실행하는 것으로 한 것이다.
본 발명의 청구항 33의 발명은, 청구항 31에 기재된 오디오 신호 부호화 장치에 있어서, 상기 다단 양자화 수단의 2 단째 이후의 각 단의 정규화, 벡터 양자화기는, 정규화, 양자화해야 할 상기 주파수 특성 신호 계열이 분할한 주파수 대역 중, 인간의 청각적인 성질인 청각 감도 특성에 근거하여, 그 중요도가 높은 대역에 큰 값을 가중한, 전단의 정규화, 벡터 양자화기의 출력인 양자화 오차의 에너지 가산합이 큰 대역을, 적절히 선택하여 정규화, 양자화를 실행하는 것으로 한 것이다.
본 발명의 청구항 34의 발명은, 청구항 30∼청구항 33 중 어느 한 항에 기재된 오디오 신호 부호화 장치로부터의 출력인 부호를 그 입력으로 하여, 이것을 복호화하여 원 입력 오디오 신호에 상당하는 신호를 출력하는 오디오 신호 복호화 장치에 있어서, 상기 오디오 신호 부호화 장치의 양자화부의 각 양자화기로부터의 신호를 수신하여, 상기 주파수 특성 신호 계열의 복수의 주파수 대역으로 분할한 각 주파수 대역의 계수열에 상당하는 신호를 재생하는 역양자화부와, 해당 복수의 역양자화부의 각각에 마련되고, 그 출력인 주파수 특성 신호 계열의 계수열과, 상기 오디오 신호 부호화 장치의 출력인 정규화에 관한 부호를 바탕으로 재생한 정규화 성분을 승산하여, 부호화전의 주파수 특성 신호 계열의 각 계수열에 상당하는 신호를 출력하는 복수의 역정규화부와, 해당 복수의 역정규화부의 출력을 수신하여, 이들을 원 오디오 신호에 상당하는 신호로 변환하는 역주파수 변환부를 구비한 것으로 한 것이다.
본 발명의 청구항 35의 발명은, 입력 오디오 신호를 주파수 변환하여 얻어진 주파수 특성 신호 계열을 수신하여, 이것을 부호화하여 출력하고, 해당 출력된 부호 신호를 입력으로 하여, 이것을 복호화하여 원 입력 오디오 신호에 상당하는 신호를 재생하는 오디오 신호 부호화·복호화 방법에 있어서, 상기 주파수 특성 신호 계열을, 적어도 2개 이상의 주파수 대역으로 분할한 대역에 상당하는 계수열로 나눠, 각각 독립적으로 정규화, 양자화하여 출력하고, 수신한 양자화 완료의 신호로부터, 부호화측으로부터의 정규화에 관한 부호를 이용하여, 상기 분할된 대역에 상당하는 임의의 대역의 데이터를 역정규화, 역양자화함으로써, 원 오디오 입력 신호에 상당하는 신호를 재생하는 것으로 한 것이다.
본 발명의 청구항 36의 발명은, 청구항 35에 기재된 오디오 신호 부호화·복호화 방법에 있어서, 상기 정규화, 양자화는, 산출된 양자화 오차를 또한 정규화, 양자화하도록 단계적으로 실행되고, 상기 역정규화, 역양자화는, 대역을 확장하는 방향의 역정규화, 역양자화와, 상기 양자화시의 양자화 단계가 깊게 되는 방향의 역정규화, 역양자화를 반복하여 교대로 실행하는 것으로 한 것이다.
본 발명의 청구항 37의 발명은, 청구항 36에 기재된 오디오 신호 부호화·복호화 방법에 있어서, 상기 대역을 확장하는 방향의 역정규화, 역양자화는, 인간의 청각 심리 특성을 고려한 순으로 대역을 확장하여 실행하는 것으로 한 것이다.
본 발명의 청구항 38의 발명은, 입력 오디오 신호를 주파수 변환하여 얻어진 주파수 특성 신호 계열에 대하여, 벡터 양자화를 실행하여, 오디오 신호의 부호화를 실행하는 오디오 신호 부호화 장치에 있어서, 상기 주파수 특성 신호 계열을 벡터 양자화하는 제 1 단째의 벡터 양자화기와, 상기 제 1 단째의 벡터 양자화기에 의한 양자화 오차 성분을 벡터 양자화하는 제 2 단째의 벡터 양자화기를 적어도 갖는 다단 양자화 수단을 구비하고, 상기 다단 양자화 수단의 각 단의 양자화 수단은, 상기 주파수 특성 신호 계열 또는 전단의 양자화 수단에 의한 양자화 오차 성분을 전부 벡터 양자화하는 전대역 벡터 양자화기로 이루어지는 것을 특징으로 하는 것이다.
이상과 같이, 본 발명에 관한 오디오 신호 부호화 장치 및 복호화 장치, 혹은 부호화·복호화 방법에 의하면, 양자화에는 벡터 양자화의 방법을 이용하는 등을 실행하여 높은 정보 압축율에 있어서도 양자화 가능한 구성을 가짐과 동시에, 양자화시의 정보량의 배분을, 재생 대역의 확장에 기여하는 정보량과 품질 향상에 기여하는 정보량의 양자를 교대로 배분하여 간다고 하는 구성을 채용하여, 우선 부호화 장치에 있어서는, 제 1 단계로서, 입력의 오디오 신호를 주파수 영역의 신호로 변환하여, 변환된 주파수 신호의 일부를 부호화하고, 제 2 단계에서는, 부호화되어 있지 않은 주파수 신호의 일부와, 제 1 단계의 양자화 오차 신호를 부호화하여, 제 1 단계의 부호에 부가하며, 제 3 단계에서는, 또한 부호화되어 있지 않은 주파수 신호의 일부와, 제 1 단계 및 제 2 단계의 양자화 오차 신호의 부호화를 실행하여, 제 1 단계, 제 2 단계의 부호에 부가하고, 마찬가지로 더욱 단계를 거듭하여 부호화를 실행하는 한편, 복호화 장치에서는, 제 1 단계의 부호화된 부호만을 이용하여 복호를 실행하는 것도, 제 1 단계와 제 2 단계의 복호화된 부호를 이용하여 복호를 실행하는 것도, 제 1 단계로부터 제 3 단계 이상의 단계의 복호화된 부호를 이용하여 복호를 실행하는 것도 가능하게 하여, 복호화의 순서는, 대역 확장에 기여하는 것과, 품질 향상에 기여하는 것을 교대로 복호하는 구성으로 하였기 때문에, 고정된 정보량으로 부호화 및 복호화를 실행하지 않아도, 양호한 음질을 얻는 수 있고, 또한, 높은 압축율로써 고품질인 소리를 얻을 수 있게 되는 효과를 얻을 수 있다.
또한, 본 발명에 관한 오디오 신호 부호화 장치 및 복호화 장치, 혹은 부호화·복호화 방법에 의하면, 양자화 수단으로 양자화하기 전에, 정규화 수단을 마련하여, 입력 오디오 신호의 정규화를 실행한 후에 양자화를 실행하도록 하였기 때문에, 정규화 수단과 양자화 수단이 각각의 능력을 풀(full)로 발휘한 부호화를 실행하여, 원(元) 오디오 신호가 갖는 정보량을 손실시키는 일 없이, 양자화 오차가 적은, 양자화 효율이 좋은 양자화를 실행할 수 있어, 오디오 신호의 종류에 따라서는 그 효과를 보다 크게 발휘할 수 있는 것이다. 또한, 상기에서 설명한 바와 같이, 양자화시의 정보량의 배분을 재생 대역의 확장에 기여하는 정보량과 품질 향상에 기여하는 정보량 양자를 교대로 배분하여 간다고 하는 구성을 채용함으로써, 수신측에서의 정보량이 한정되어 있을 때에는, 대역이 좁고 얕은 영역에서밖에 역양자화를 실행할 수 없지만, 이 역양자화를 순차적으로, 대역을 넓히는 방향과 역양자화의 깊이를 깊게 하는 방향으로 교대로 확장하여, 수신측에서의 정보량을 증대하여 감으로써,부호화 장치로부터 송신되어 오는 정보량에 관계없이, 부호화된 오디오 신호의 소망하는 정보량분을 복호화할 수 있고, 이와 같이, 수신자측에서의 통신 환경 등에 따라 복호하는 정보량을 변화시키도록 함으로써, 예를 들어, 통상의 공중 전화망을 이용하고 있는 것과 같은 경우에 있어서도, 안정하게 고품위한 음질을 얻을 수 있게 되는 효과를 얻을 수 있다.
또한, 본 발명에 관한 오디오 신호 부호화 장치 및 복호화 장치, 혹은 부호화·복호화 방법에 의하면, 다단 양자화를 실행하는 양자화 수단의 전단에 각각 정규화 수단을 마련하여, 분할한 각 주파수마다, 또한 각 단의 양자화마다 정규화를 실행한 후 양자화를 실행하도록 하였기 때문에, 주파수 영역마다의 정규화에 의해 각 주파수 영역의 오디오 신호가 갖는 정보량에 따른 적절한 부호화, 즉, 정규화수단과 양자화 수단이 각각의 능력을 풀로 발휘한 부호화를 실행하여, 원 오디오 신호가 갖는 정보량을 손실시키는 일 없어, 따라서 양자화 오차가 적고, 양자화 효율이 좋은 양자화를 실행할 수 있어, 오디오 신호의 종류에 의해서는 그 효과를 보다 크게 발휘할 수 있는 것이다. 또한, 복호화측의 역정규화, 역양자화를, 양자화의 대역이 넓게 되는 방향과, 양자화의 깊이가 깊게 되는 방향을 교대로 실행하도록 하면, 상기와 같이, 부호화 장치로부터 송신되어 오는 정보량에 관계없어, 부호화된 오디오 신호의 소망하는 정보량분을 복호화할 수 있어, 즉, 수신자측에서의 통신 환경 등에 따라서, 복호하는 정보량을 변화시킬 수 있어, 예를 들어, 통상의 공중 전화망을 이용하고 있는 것과 같은 경우에 있어서도, 안정하게 고품위한 음질을 얻을 수 있는 효과를 얻을 수 있다.
본 발명은, 음성 신호와 음악 신호 등의 오디오 신호를 부호화하는 오디오 신호 부호화 장치, 특히 오디오 신호를 직교 변환 등의 방법을 이용하여 시간 영역으로부터 주파수 영역으로 변환하며, 그 변환한 신호를 원(源) 오디오 신호와 비교하여 될 수 있는 한 적은 부호열로 표현할 수 있도록 효율적으로 부호화하는 장치 및 부호화된 신호인 부호화열의 전부 혹은 그 일부만을 이용하여, 높은 품질과 광 대역인 오디오 신호를 복호 가능한 구성의 복호화 장치와 그 오디오 신호 부호화·복호화 방법에 관한 것이다.
도 1은 본 발명의 오디오 신호 부호화 장치 및 복호화 장치의 전체적인 구성을 도시하는 도면이다.
도 2는 상기 오디오 신호 부호화 장치를 구성하는 정규화부의 일례를 나타내는 구성도이다.
도 3은 상기 오디오 신호 부호화 장치를 구성하는 주파수 개형 정규화부의 일례를 나타내는 구성도이다.
도 4는 상기 오디오 신호 부호화 장치를 구성하는 양자화부의 실시예 1에 있어서의 구성도이다.
도 5는 상기 오디오 신호 부호화 장치를 구성하는 양자화부의 실시예 2에 있어서의 구성도이다.
도 6은 상기 오디오 신호 부호화 장치를 구성하는 양자화부의 실시예 3에 있어서의 구성도이다.
도 7은 상기 오디오 신호 복호화 장치를 구성하는 역양자화부의 실시예 4에 있어서의 구성도이다.
도 8은 상기 오디오 신호 복호화 장치를 구성하는 역양자화부의 실시예 4에 있어서의 일례의 구성도이다.
도 9는 상기 오디오 신호 복호화 장치를 구성하는 역양자화부의 실시예 4에 있어서의 다른 예의 구성도이다.
도 10은 상기 오디오 신호 복호화 장치를 구성하는 역양자화부의 실시예 4에 있어서의 또 다른 예의 구성도이다.
도 11은 상기 오디오 신호 복호화 장치를 구성하는 역양자화부의 실시예 4에 있어서의 또 다른 예의 구성도이다.
도 12는 역정규화부의 일실시예의 구성도이다.
도 13은 상기 부호화 장치에 있어서의 양자화부의 상세한 동작을 설명하기 위한 도면이다.
도 14는 상기 복호화 장치에 있어서의 역양자화부의 상세한 동작을 설명하기 위한 도면이다.
도 15는 상기 실시예 4에 있어서의 역양자화부의 역양자화 순서의 동작을 설명하기 위한 도면이다.
도 16은 주파수 개형 역정규화부의 일실시예의 구성도이다.
도 17은 종래 및 본 발명의 오디오 신호 부호화 장치에 있어서의 양자화의 방법을 설명하기 위한 도면이다.
도 18은 본 발명의 실시예 5에 의한 오디오 신호 부호화 장치에 있어서의 양자화부의 구성도이다.
도 19는 본 발명의 실시예 5에 의한 오디오 신호 부호화 장치의 동작의 전체를 설명하기 위한 파형도이다.
도 20은 본 발명의 실시예 1∼3(도 (a)) 및 실시예 5(도 (b), (c))에 의한 오디오 신호 부호화 장치의 구성의 개략을 도시한 도면이다.
도 21은 본 발명의 실시예 5에 의한 오디오 신호 부호화 장치의 동작의 전체를 설명하기 위한 파형도이다.
도 22는 본 발명의 실시예 5에 의한 오디오 신호 부호화 장치에 있어서의 제 1 단째∼제 3 단째의 정규화, 양자화 수단에 의한, 정규화, 양자화의 방법의 일례를 설명하는 도면이다.
도 23은 본 발명의 실시예 5에 의한 오디오 신호 부호화 장치에 대한, 오디오 신호 복호화 장치의 구성을 설명하는 도면이다.
도 24는 종래의 오디오 신호 부호화 장치의 구성을 도시하는 도면이다.
발명을 실시하기 위한 최선의 형태
이하, 본 발명의 실시예에 대하여, 도면을 이용하여 설명한다.
실시예 1
도 1은 본 발명의 실시예 1에 의한 오디오 신호 부호화 장치 및 복호화 장치의 전체의 구성을 도시하는 도면이다. 도 1에 있어서, (1)은 부호화 장치이고, (2)는 복호화 장치이다. 부호화 장치(1)에 있어서, (101)은 입력 신호를 소정의 값의 프레임수로 되도록 분할하는 프레임 분할부, (102)는 시간축상에서, 입력 신호와 윈도우 함수를 곱하는 윈도우 설정부, (103)은 변형 이산 코사인 변환(Modified discrete cosine transform)을 실행하는 MDCT부, (104)는 프레임 분할부(101)로부터의 출력인 시간축의 신호와, MDCT부(103)로부터의 출력인 MDCT 계수 양자를 입력으로 하여 그 MDCT 계수를 정규화하는 정규화부, (105)는 정규화된 MDCT 계수를 입력으로 하여 양자화를 실행하는 양자화부이다. 또, 여기서는, 시간 주파수 변환으로서 MDCT를 이용한 경우에 대하여 설명하지만, 이것은 이산 퓨리에 변환(DFT:Discrete Fourier Transform)을 이용하여도 좋다.
복호화 장치(2)에 있어서, (106)은 부호화 장치(1)로부터 출력된 신호(인덱스 IND2)를 수신하여 이것을 역양자화하는 역양자화부, (107)은 역양자화부(106)의 출력을, 부호화 장치(1)의 정규화부(104)로부터의 인덱스 IND1을 이용하여, 역정규화하는 역정규화부, (108)은 역정규화부(107)의 출력을 변형 이산 코사인 변환하는 역MDCT부, (109)는 역MDCT부(108)의 출력에 대하여 윈도우 설정을 실행하는 윈도우설정부, (110)은 윈도우 설정부(109)의 출력에 대하여, 프레임 중첩을 실행하는 프레임 중첩부이다.
이상과 같이 구성된 오디오 신호 부호화 장치 및 복호화 장치의 동작에 대하여 기술한다.
부호화 장치(1)에 입력되는 신호는, 시간적으로 연속하는 디지탈 신호 계열이라고 한다. 예를 들어, 음성 신호를 샘플링 주파수 48kHz에서, 16 비트로 양자화한 디지탈 신호라고 한다. 이 입력 신호는, 소정의 일정한 샘플수에 도달할 때까지 프레임 분할부(101)에서 축적되어, 축적된 샘플수가 규정의 프레임 길이에 도달하면 출력을 실행한다. 여기서, 프레임 분할부(101)의 프레임 길이는, 예를 들어, 128, 256, 512, 1024, 2048, 4096 샘플 등이다. 프레임 분할부(101)에서는 입력 신호의 특징에 따라 프레임 길이를 가변 출력하는 것도 가능하다. 또한, 프레임 분할부(101)는 소정의 쉬프트 길이마다 출력을 실행하는 구성의 것으로, 예를 들어, 프레임 길이를 4096 샘플로 한 경우에 있어서, 프레임 길이의 절반의 쉬프트 길이를 설정하면, 프레임 길이가 2048 샘플에 도달하는 것에 상당하는 시간마다 최신의 4096 샘플을 출력하는 등의 구성을 가진다. 당연하지만 프레임 길이나 샘플링 주파수가 변하여도, 마찬가지로 쉬프트 길이를 프레임 길이의 절반으로 설정한 구성을 갖는 것은 가능하다.
그리고 이 프레임 분할부(101)로부터의 출력은, 후단의 윈도우 설정부(102)와 정규화부(104)로 각각 입력된다. 윈도우 설정부(102)에서는, 상기 프레임 분할부(101)로부터의 출력 신호에 대하여, 시간축상에서 윈도우 함수를 곱해, 윈도우설정부(102)의 출력으로 한다. 이 상태는, 예를 들면, 수학식 1로 나타내어진다.
단, 여기에서, xi는 프레임 분할부(101)로부터의 출력이며, hi는 윈도우 함수, hxi는 윈도우 설정부(102)로부터의 출력이다. 또한, i는 시간의 접미부(suffix)이다. 또, 수학식 1로 나타낸 윈도우 함수 hi는 일례이고, 윈도우 함수는 반드시 수학식 1의 것일 필요는 없다. 윈도우 함수의 선택은, 윈도우 설정부(102)에 입력되는 신호의 특징과, 프레임 분할부(101)의 프레임 길이와, 시간적으로 전후로 위치하는 프레임에 있어서의 윈도우 함수의 형상에 의존한다. 예를 들어, 윈도우 설정부(102)에 입력되는 신호의 특징으로서, 프레임 분할부(101)의 프레임 길이를 N으로 한 경우, N/4마다 입력되는 신호의 평균 전원을 산출하여, 그 평균 전원이 대단히 크게 변동하는 경우에는, 프레임 길이를 N 보다도 짧게 하여 수학식 1에 나타낸 연산을 실행하는 등의 선택을 실행한다. 또한, 전(前) 시각의 프레임의 윈도우 함수의 형상과 후(後) 프레임의 윈도우 함수의 형상에 따라, 현재 시각의 프레임의 윈도우 함수의 형상에 왜곡이 없도록 적절히 선택하는 것이 바람직하다.
이어서 윈도우 설정부(102)로부터의 출력은, MDCT부(103)에 입력되고 여기서 변형 이산 코사인 변환이 실시되어 MDCT 계수가 출력된다. 변형 이산 코사인 변환의 일반식은 수학식 2로 나타낸다.
이와 같이 MDCT부(103)의 출력인 MDCT 계수는, 수학식 2의 yk로 나타낼 수 있다라고 하면, MDCT부(103)의 출력은 주파수 특성을 나타내고, yk의 변수 k가 0에 가까울수록 낮은 주파수 성분에, 0로부터 증대하여 N/2-1에 가까울수록 높은 주파수 성분의 선형에 대응한다. 정규화부(104)에서는, 프레임 분할부(101)로부터의 출력인 시간축의 신호 xi와, MDCT부(103)로부터의 출력인 MDCT 계수 yk양자를 입력으로 하여, 몇개의 파라미터를 이용해서 MDCT 계수를 정규화한다. 여기서 MDCT 계수의 정규화란, 저역 성분과 고역 성분에서 대단히 크기에 차이가 있는 MDCT 계수의 크기의 편차를 억압하는 것을 의미하고, 예를 들어, 저역 성분이 고역 성분에 대하여 대단히 큰 경우 등은, 저역 성분으로는 큰 값, 고역 성분으로는 작은 값으로 되도록 파라미터를 선출하며, 이것으로 상기 MDCT 계수를 제산함으로써 MDCT 계수의 크기의 편차를 억압하는 것을 가르킨다. 또한 정규화부(104)에서는, 정규화에 이용한 파라미터를 표현하는 인덱스 IND1을 부호화한다.
양자화부(105)에서는, 정규화부(104)에서 정규화된 MDCT 계수를 입력으로 하여, MDCT 계수의 양자화를 실행한다. 이 때, 해당 양자화부(105)는, 해당 양자화한 값과, 코드북 중에 있는 복수의 코드 인덱스에 대응하는 각 양자화 출력 사이의 차가 가장 작아지도록, 그와 같은 해당 코드 인덱스를 출력한다. 이 경우, 상기 양자화부(105)에서 양자화한 값과, 해당 양자화부(105)로부터 출력되는 코드 인덱스에 대응하는 값의 차가, 양자화 오차이다.
한편, 복호화 장치(2)에서는, 부호화 장치(1)의 정규화부(104)로부터의 인덱스 IND1과, 양자화부(105)로부터의 인덱스 IND2를 이용하여 복호를 실행한다. 역양자화부(106)에서는, 양자화부(105)로부터의 인덱스 IND2를 이용하여, 상기 부호화 장치(1)에 있어서의, 정규화된 시점에서의 MDCT 계수의 재생을 실행한다. 역양자화부(106)에서는, 인덱스의 전부를 이용하여도 좋고, 그 일부분을 이용하여 MDCT 계수의 재생을 실행하여도 좋다. 당연하지만, 정규화부(104)로부터의 출력과, 역양자화부(106)의 출력은, 양자화부(105)에 의한 양자화시에 양자화 오차를 따르기 때문에, 양자화전의 상태와 반드시 일치하지 않는다.
역정규화부(107)에서는, 부호화 장치(1)의 정규화부(104)로부터의 인덱스 IND1로부터, 부호화 장치(1)에서 정규화에 이용한 파라미터의 복원을 실행하여, 역양자화부(106)의 출력과 해당 파라미터를 승산하여, MDCT 계수의 복원을 실행한다. 역MDCT부(108)에서는, 역정규화부(107)로부터의 출력인 MDCT 계수로부터, 역MDCT를 실행하여, 주파수 영역의 신호로부터 시간 영역의 신호로의 복원을 실행한다. 상기 역MDCT 계산은, 예를 들면, 수학식 3으로 나타내어진다.
여기서, yyk는 역정규화부(107)에서 복원된 MDCT 계수로, xx(n)은 역MDCT 계수이고, 이것을 역MDCT부(108)의 출력으로 한다.
윈도우 설정부(109)에서는, 역MDCT부(108)로부터의 출력 xx(n)을 이용하여 윈도우 설정을 실행한다. 윈도우 설정은, 부호화 장치(1)의 윈도우 설정부(102)에서 이용한 윈도우를 이용하며, 예를 들면, 수학식 4로 나타내어지는 처리를 실행한다.
여기서, z(i)는, 윈도우 설정부(109)의 출력이다.
프레임 중첩부(110)에서는, 윈도우 설정부(109)로부터의 출력을 이용하여, 오디오 신호를 재생한다. 윈도우 설정부(109)로부터의 출력은, 시간적으로 중복된 신호로 되어 있기 때문에, 프레임 중첩부(110)에서는, 예를 들어, 수학식 5를 이용하여 복호화 장치(2)의 출력 신호로 한다.
여기서, zm(i)는 제 m 시각 프레임의 제 i 번째의 윈도우 설정부(109)의 출력 신호 z(i)이고, zm-1(i)는 제 m-1 시각 프레임의 제 i 번째의 윈도우 설정부(109)의 출력 신호이며, SHIFT는 부호화 장치의 쉬프트 길이에 상당하는 샘플수이고, out(i)는 프레임 중첩부(110)의 제 m 시각 프레임에 있어서의 복호화 장치(2)의 출력 신호로 한다.
다음에 도 2를 이용하여, 상기 정규화부(104)의 상세한 일례를 설명한다. 도 2에 있어서, (201)은 프레임 분할부(101)와 MDCT부(103)의 출력을 수신하는 주파수 개형 정규화부, (202)는 주파수 개형 정규화부(201)의 출력을 수신하여, 대역 테이블(203)을 참조하여 정규화를 실행하는 대역 진폭 정규화부이다.
다음에 동작에 대하여 설명한다. 주파수 개형 정규화부(201)에서는, 프레임 분할부(101)로부터의 시간축상의 데이터 출력을 이용하여, 대략 주파수의 개형인 주파수 개형을 산출하고, 이것으로 MDCT부(103)로부터의 출력인 MDCT 계수를 제산한다. 주파수 개형을 표현하는데 이용한 파라미터는 인덱스 IND1로서 부호화된다. 대역 진폭 정규화부(202)에서는, 주파수 개형 정규화부(201)로부터의 출력 신호를 입력으로 하여, 대역 테이블(203)에서 표시된 대역마다 정규화를 실행한다. 예를 들어, 주파수 개형 정규화부(201)의 출력인 MDCT 계수가, dct(i)(i=0∼2047)로 하여, 대역 테이블(203)이, 예를 들어, (표 1)에 표시되는 것과 같은 것이라고 하면, 수학식 6 등을 이용하여 각 대역마다의 진폭의 평균값을 산출한다.
여기서, bjlow, bjhigh는 대역 테이블(203)에 표시된 j 번째의 대역에 있어서의 dct(i)가 속하는 가장 저역(低域)의 인덱스 i와, 가장 고역(高域)의 인덱스 i를 각각 나타내고 있다. 또한, p는 거리 계산에 있어서의 규칙(norme)이고, 2 등이 바람직하다.
avej는, 각 대역 번호 j에 있어서의 진폭의 평균값이다. 대역 진폭 정규화부(202)에서는, avej를 양자화하여, qavej를 산출하고, 예를 들면, 수학식 7을 이용하여 정규화한다.
avej의 양자화는 스칼라 양자화를 이용하여도 좋고, 코드북을 이용하여 벡터 양자화를 실행하여도 좋다. 대역 진폭 정규화부(202)에서는, qavej를 표현하는데 이용한 파라미터의 인덱스 IND1을 부호화한다.
또, 부호화 장치(1)에 있어서의 정규화부(104)의 구성은, 도 2의 주파수 개형 정규화부(201)와 대역 진폭 정규화부(202)의 양자를 이용한 구성의 것을 나타내었지만, 주파수 개형 정규화부(201)만을 이용한 구성이어도 좋고, 대역 진폭 정규화부(202)만을 이용한 구성이어도 좋다. 또한, MDCT부(103)로부터 출력되는 MDCT 계수의 저역 성분과 고역 성분에서 큰 편차가 없는 경우에는, 양쪽 모두를 이용하지 않는 구성으로, MDCT부(103)의 출력 신호를 그대로 양자화부(105)에 입력하는 구성으로 하여도 좋다.
다음에 도 3을 이용하여, 도 2의 주파수 개형 정규화부(201)의 상세에 대하여 설명한다. 도 3에 있어서, (301)은 프레임 분할부(101)의 출력을 수신하는 선형 예측 분석부, (302)는 선형 예측 분석부(301)의 출력을 수신하는 개형 양자화부, (303)은 MDCT부(103)의 출력을 수신하는 포락 특성 정규화부이다.
다음에 상기 주파수 개형 정규화부(201)의 동작에 대하여 설명한다. 상기 선형 예측 분석부(301)에서는, 프레임 분할부(101)로부터의 시간축상의 오디오 신호를 입력으로 하여, 선형 예측 분석(Linear Predictive Coding)을 실행한다. 선형 예측 분석의 선형 예측 계수(LPC 계수)는, 해밍 윈도우 등의 윈도우 설정된 신호의 자기 상관 함수를 산출하여, 정규 방정식 등을 푸는 것에 의해 일반적으로 산출 가능하다. 산출된 선형 예측 계수는, 선 스펙트럼쌍 계수(LSP(Line Spectrum Pair) 계수) 등으로 변환되어, 개형 양자화부(302)에서 양자화된다. 여기서의 양자화 방법으로는 벡터 양자화를 이용하여도 좋고, 스칼라 양자화를 이용하여도 좋다. 그리고 개형 양자화부(302)에서 양자화된 파라미터가 표현하는 주파수 전달 특성을 포락 특성 정규화부(303)에서 산출하여, MDCT부(103)로부터의 출력인 MDCT 계수를 이것으로 제산함으로써 정규화한다. 구체적인 산출예로서는, 개형 양자화부(302)에서 양자화된 파라미터와 등가인 선형 예측 계수를, qlpc(i)라고 하면, 포락 특성 정규화부(303)에서 산출되는 상기 주파수 전달 특성은, 예를 들면, 수학식 8로 나타낼 수 있다.
여기서 ORDER는 10∼40 정도가 바람직하다. fft()는 고속 퓨리에 변환을 의미한다. 산출된 주파수 전달 특성 env(i)를 이용하여, 포락 특성 정규화부(303)에서는, 예를 들면 하기에 나타내는 수학식 9를 이용하여 정규화를 실행한다.
여기서, mdct(i)는 MDCT부(103)로부터의 출력 신호이고, fdct(i)는 정규화된 포락 특성 정규화부(303)로부터의 출력 신호이다.
다음에 도 4를 이용하여, 부호화 장치(1)에 있어서의 양자화부(105)의 상세에 대하여 설명한다. 도 4에 있어서, (401)은 제 1 소양자화부, (402)는 제 1 소양자화부(401)의 출력을 수신하는 제 2 소양자화부, (403)은 제 2 소양자화부(402)의 출력을 수신하는 제 3 소양자화부이다.
다음에 상기 양자화부(105)의 동작에 대하여 설명한다. 상기 제 1 소양자화부(401)에 입력되는 신호는 부호화 장치의 정규화부(104)로부터의 출력이고, 정규화된 MDCT 계수이다. 단, 정규화부(104)을 가지지 않는 구성에서는, MDCT부(103)의 출력으로 된다. 제 1 소양자화부(401)에서는, 입력된 MDCT 계수를 스칼라 양자화 또는 벡터 양자화하여, 양자화에 이용한 파라미터를 표현하는 인덱스를 부호화한다. 또한, 양자화에 의한 입력 MDCT 계수에 대한 양자화 오차를 산출하여, 이것을 제 2 소양자화부(402)로 출력한다. 여기서, 제 1 소양자화부(401)에서는, 모든 MDCT 계수를 양자화하여도 좋고, 일부만을 양자화하도록 하여도 좋다. 당연하지만, 일부만을 양자화한 경우에는, 제 1 소양자화부(401)에서 양자화되지 않은 대역의 양자화 오차는, 양자화되지 않은 대역의 입력 MDCT 계수 그 자체로 된다.
이어서, 제 2 소양자화부(402)에서는, 제 1 소양자화부(401)의 MDCT 계수의 양자화 오차를 입력으로 하여, 그것을 더욱 양자화한다. 이 때의 양자화도 제 1 소양자화부(401)와 같이, 스칼라 양자화를 이용하여도 좋고, 벡터 양자화를 이용하여도 좋다. 그리고, 제 2 소양자화부(402)에서는, 양자화에 이용한 파라미터를 표현하는 인덱스로 부호화한다. 또한, 양자화에 의한 양자화 오차를 산출하여, 그것을 제 3 소양자화부(403)로 출력한다. 이 제 3 소양자화부(403)는, 상기 제 2 소양자화부와 구성은 동일하다. 여기서, 상기 제 1 소양자화부(401), 제 2 소양자화부(402), 제 3 소양자화부(403)가 양자화하는 MDCT 계수의 개수, 즉, 대역폭은 반드시 균일할 필요는 없고, 또한, 양자화하는 대역도 동일할 필요도 없다. 이 때, 인간의 청각 특성을 고려하여, 제 2 소양자화부(402), 제 3 소양자화부(403)는, 함께 저역 주파수 성분을 나타내는 MDCT 계수의 대역을 양자화하도록 설정하는 것이 바람직하다.
이와 같이 본 실시예 1에 의한 오디오 신호 부호화 장치에 따르면, 양자화를 실행할 때에, 양자화부를 계층적으로 마련하여, 즉 다단 양자화 수단을 구성하여, 전단과 후단에서의 양자화부가 양자화하는 대역폭을 가변으로 함으로써, 입력 MDCT 계수 중, 임의의 대역, 예를 들어, 인간에게 있어서 청각적으로 중요한 저역 주파수 성분에 상당하는 계수를 중점적으로 양자화하도록 하였기 때문에, 저 비트 레이트, 즉 높은 압축율로 오디오 신호를 부호화한 경우에서도, 수신측에 있어서, 고품위한 음성의 재생을 실행하도록 할 수 있다.
(실시예 2)
다음에 도 5를 이용하여, 본 발명의 실시예 2에 의한 오디오 신호 부호화 장치에 대하여 설명한다. 본 실시예 2에서는, 부호화 장치(1)에서의 양자화부(105)의 구성만이 상기 실시예 1과 상이하기 때문에, 여기서는, 양자화부의 구성에 대해서만 설명한다. 도 5에 있어서, (501)은 제 1 소양자화부, (502)는 제 2 소양자화부, (503)은 제 3 소양자화부이다. 상기 실시예 1과의 구성상의 상이점은, 제 1 양자화부(501)가, 입력 MDCT 계수를 3가지의 대역(고역, 중역, 저역)으로 분할하여 독립적으로 양자화를 실행하는 점으로, 이들 제 1 소양자화부(501)를 구성하는 각 대역의 양자화부가, 소위 '분할화 벡터 양자화기'에 상당한다. 일반적으로 벡터 양자화의 방법을 이용하여 양자화를 실행하는 경우에 있어서, 입력 MDCT 계수로부터 몇개의 요소를 추출하여, 벡터를 구성하며, 벡터 양자화할 수 있다. 본 실시예 2의 제 1 소양자화부(501)에서는, 입력 MDCT 계수로부터 몇개의 요소를 추출하여 벡터를 구성할 때에, 저역의 양자화는 저역만의 요소를 이용하여 양자화하고, 중역의 양자화는 중역만의 요소를 이용하며, 고역의 양자화는 고역만의 요소를 이용하여, 각각 벡터 양자화하는 구성으로 되어 있다.
또, 본 실시예 2에서는, 양자화시에, 저역, 중역, 고역의 3가지의 대역으로 분할하는 방법을 일례로서 설명하였지만, 분할하는 대역의 수는 3 이외의 수이어도 무방하다. 또한, 제 2 소양자화부(502), 제 3 소양자화부(503)에 대해서도, 제 1 양자화부(501)와 같이, 대역을 몇 개인가로 분할하여 양자화를 실행하는 구성으로 하여도 무방하다.
이와 같이 본 실시예 2에 따르면, 다단 양자화 수단에 있어서, 우선 제 1 단에서는, 입력 MDCT 계수를 3가지의 대역으로 분할하여 독립적으로 양자화를 실행하도록 하였기 때문에, 청각적으로 중요한 대역을 우선적으로 양자화하는 등의 처리를, 제 1 회째의 양자화시에 실행할 수 있고, 후단의 양자화부(502, 503)에 있어서, 또한 단계적으로 해당 청각적으로 중요한 대역의 MDCT 계수의 양자화를 실행하도록 함으로써, 양자화 오차를 보다 저감할 수 있으며, 수신측에 있어서, 보다 고품위한 음질의 재현을 가능하게 할 수 있다.
(실시예 3)
다음에 도 6을 이용하여, 본 발명의 실시예 3에 의한 오디오 신호 부호화 장치에 대하여 설명한다. 본 실시예 3에서는, 부호화 장치(1)에 있어서의 양자화부(105)의 구성만이 상기 실시예 1과 상이한 것이기 때문에, 여기서는, 양자화부의 구성에 대해서만 설명한다. 도 6에 있어서, (601)은 제 1 소양자화부, (602)는 제 1 양자화 대역 선택부, (603)은 제 2 소양자화부, (604)는 제 2 양자화 대역 선택부, (605)는 제 3 소양자화부이다. 상기 실시예 2와의 구성상의 상이점은, 제 1 양자화 대역 선택부(602)와, 제 2 양자화 대역 선택부(604)가 부가된 점이다.
이하 동작에 대하여 설명한다. 상기 제 1 양자화 대역 선택부(602)에서는, 제 1 소양자화부(601)의 양자화 오차인 출력 (fdcterr(i))를 이용하여, 제 2 소양자화부(602)에서 어느 대역의 MDCT 계수를 양자화해야 할 것인가를 산출한다. 예를 들어, 수학식 10에서 부여하는 esum(j)를 최대로 하는 j를 산출하여, j×OFFSET으로부터 j×OFFSET+BANDWIDTH의 대역을 양자화하면 좋다.
여기서, OFFSET는 정수이고, BANDWIDTH는 제 2 소양자화부(603)가 양자화하는 대역폭에 상당하는 총 샘플이다. 제 1 양자화 대역 선택부(602)에서는, 예를 들어, 수학식 10에서, esum(i)의 최대값을 부여한 j 등을, 부호화하여 인덱스 IND2로 한다. 제 2 소양자화부(603)에서는, 이들 인덱스 IND2를 수신하여, 제 1 양자화 대역 선택부(602)에서 선택된 대역을 양자화한다. 제 2 양자화 대역 선택부(604)는, 제 2 소양자화부(603)의 양자화 오차인 출력을 그 입력으로 하여, 해당 제 2 양자화 대역 선택부(604)의 선택한 대역을, 상기 제 3 소양자화부(605)에 입력시키는 것을 제외하고는, 상기 제 1 양자화 대역 선택부(602)와 같은 구성으로 이것을 실현하는 것이 가능하다.
또, 제 1 양자화 대역 선택부(602) 및 제 2 양자화 대역 선택부(604)에서는, 수학식 10을 이용하여, 다음 양자화부가 양자화해야 할 대역을 선택하는 구성을 설명하였지만, 수학식 11의, 정규화부(104)에서 정규화에 이용한 값 및 인간의 주파수에 대한 상대적인 청각 감도 특성을 고려에 넣은 값을 승산한 값을 이용하여, 양자화해야 할 대역을 산출하도록 하여도 좋다.
여기서, env(i)는 MDCT 부(103)의 출력을 정규화부(104)의 출력으로 제산한 것이고, zxc(i)는 인간의 주파수에 대한 상대적인 청각 감도 특성을 고려에 넣은 테이블이며, 그 일례를 (표 2)에 나타내었다. 또한, 수학식 11에 있어서, zxc(i)는 전부 1로서 고려에 넣지 않은 구성이어도 좋다.
또한, 양자화 대역 선택부는 반드시 복수개 마련하지 않아도 좋고, 제 1 양자화 대역 선택부(602)만을 이용한 구성 혹은 제 2 양자화 대역 선택부(604)만을 이용한 구성으로도 좋다.
이와 같이 본 실시예 3에서는, 다단 양자화 수단에 의해 다단적으로 양자화를 할 때에, 전단의 양자화부와 다음 단의 양자화부의 사이에 양자화 대역 선택부를 마련하여, 양자화하는 대역을 가변으로 하여 적절히 선택하도록 함으로써, 입력 신호에 따라 적절히, 양자화하는 대역을 변화시키는 것이 가능해져, 양자화의 자유도를 향상할 수 있어, 양자화가 필요한 부분을 중점적으로 양자화하여, 양자화 효율을 크게 향상시킬 수 있다.
이하에, 도 1 및 도 13을 이용하여, 상기 실시예 1∼3의 부호화 장치(1)에 있어서의 양자화부(106)의 양자화 방법의 상세한 동작에 대하여 설명한다. 각 소양자화부에 입력되는 MDCT 계수(1401)는, 그 MDCT 계수(1401)로부터 몇개를 골라내어 음원 서브 벡터(1403)를 구성한다. 마찬가지로, 정규화부(104)에 있어서, 정규화부(104)의 입력인 MDCT 계수를, 정규화부(104)의 출력인 MDCT 계수로 나눈 계수열을, 정규화 성분(1402)로 했을 때, 해당 정규화 성분(1402)에 대해서도, 음원 서브 벡터(1403)를 MDCT 계수(1401)로부터 골라낸 것과 같은 규칙으로, 해당 정규화 성분(1402)으로부터 추출하여, 가중치 서브 벡터(1404)를 구성할 수 있다. 이와 같이, 음원 서브 벡터(1403) 및 가중치 서브 벡터(1404)를, MDCT 계수(1401) 및 정규화 성분(1402)으로부터 각각 추출하는 규칙은, 예를 들면, 수학식 14로 나타내는 방법 등이 있다.
여기서, i 번째의 음원 서브 벡터의 j 번째의 요소는 subvector i(j)이고, MDCT 계수(1401)는 vector()이며, MDCT 계수(1401)의 총 요소수가 TOTAL이고, 음원 서브 벡터(1403)의 요소수가 CR, VTOTAL은, TOTAL과 동일한 값이나 보다 큰 값으로, VTOTAL/CR이 정수값으로 되도록 설정한다. 예를 들어, TOTAL이 2048일 때, CR이 19이고, VTOTAL이 2052, CR이 23이고, VTOTAL이 2070, CR이 21이고, VTOTAL이 2079 등이다. 가중치 서브 벡터(1404)에 대해서도, 수학식 14의 순서로 추출 가능하다.
벡터 양자화기(1405)에서는, 코드북(1409) 중의 코드 벡터 중으로부터, 음원 서브 벡터(1403)와의 거리가, 가중치 서브 벡터(1404)로 가중하여 가장 작아지는 것을 찾아, 그 최소의 거리를 부여한 코드 벡터의 인덱스 IND2와, 최소의 거리를 부여한 코드 벡터와 입력 음원 서브 벡터(1403)의 양자화 오차에 상당하는 잔차 서브 벡터(1410)를 출력한다. 실제의 계산 순서예에서는, 해당 벡터 양자화기(1405)는, 거리 계산 수단(1406), 코드 결정 수단(1407) 및 잔차 생성 수단(1408)의 3가지의 구성 요소를 갖는 것으로서 설명한다. 거리 계산 수단(1406)에서는, 예를 들어, 수학식 15를 이용하여, i 번째의 음원 서브 벡터(1403)와, 코드북(1409)의 k번째의 코드 벡터의 거리를 산출한다.
여기서 wj는 가중치 서브 벡터의 j 번째의 요소, ck(j)는 k 번째의 코드 벡터의 j 번째의 요소, R, S는 거리 계산의 규칙이고, R, S의 값으로서는 1, 15, 2 등이 바람직하다. 또, 이 거리 계산의 규칙 R과, S는 동일한 값일 필요는 없다. dik는 i 번째의 음원 서브 벡터에 대한 k 번째의 코드 벡터의 거리를 의미한다. 코드 결정 수단(1407)에서는, 수학식 15 등에서 산출된 거리 중에서 최소로 되는 코드 벡터를 선출하여, 그 인덱스를 부호화한다(IND2). 예를 들어, diu가 최소값인 경우, i 번째의 서브 벡터에 대한 부호화되는 인덱스는 u로 된다. 잔차 생성 수단(1408)에서는, 코드 결정 수단(1407)에서 선출한 코드 벡터를 이용하여, 수학식 16을 이용하여, 잔차 서브 벡터(1410)를 생성한다.
여기서 i 번째의 잔차 서브 벡터(1410)의 j 번째의 요소는, resi(j)이고, 코드 결정 수단(1407)에서 선출된 u 번째의 코드 벡터의 j 번째의 요소를, cu(j)로 한다. 잔차 서브 벡터(1410)는, 수학식 14의 역과정 등을 실행함으로써, 그 이후의 소양자화부의 양자화 대상으로 되는 MDCT 계수로서 유지된다. 단, 소정 대역의 양자화가 그 이후의 소양자화부에 영향을 부여하지 않은 대역의 양자화를 실행하고있는 경우, 즉 이후의 소양자화부가 양자화를 실행하는 일이 없는 경우에는, 잔차 생성 수단(1408), 잔차 서브 벡터(1410) 및 MDCT 계수(1411)의 생성은 필요없다. 또 코드북(1409)이 가지는 코드 벡터의 개수는 몇개여도 무방하지만, 메모리 용량, 계산 시간 등을 고려하면, 64 정도로 하는 것이 바람직하다.
또, 상기 벡터 양자화기(1405)의 다른 실시예에서, 이하와 같은 구성도 가능하다. 즉, 거리 계산 수단(1406)에서는, 수학식 17을 이용하여 거리를 산출한다.
단, K는 코드북(1409)의 코드 검색에 이용하는 코드 벡터의 총수이다.
코드 결정 수단(1407)에서는, 수학식 17에서 산출된 거리 dik의 최소값을 부여하는 k를 선출하여, 그 인덱스를 부호화한다(IND2). 단, k는 0으로부터 2K-1까지의 값으로 된다. 잔차 생성 수단(1408)에서는, 수학식 18을 이용하여 잔차 서브 벡터(1410)를 생성한다.
코드북(1409)이 가지는 코드 벡터의 개수는 몇개여도 무방하지만, 메모리의 용량, 계산 시간 등을 고려하면, 64 정도로 하는 것이 바람직하다.
또한, 가중치 서브 벡터(1404)에서는, 이것을 정규화 성분(1402)만으로부터 생성하는 구성에 대하여 기술하였지만, 가중치 서브 벡터(1404)에, 인간의 청각 특성을 고려한 가중치를 더 곱하여, 가중치 서브 벡터를 생성하는 것도 가능하다.
이상과 같은 본 실시예 3에 의하면, 제 1 소양자화부와 제 2 소양자화부 사이에 제 1 양자화 대역 선택부를, 제 2 소양자화부와 제 3 소양자화부 사이에 제 2 양자화 대역 선택부를, 각각 마련하고, 상기 제 2 소양자화부, 제 3 소양자화부에서 양자화하는 대역을 가변으로 하여 적절히 선택하도록 하였기 때문에, 입력 신호에 따라 적절히 양자화하는 대역을 변화시키는 것이 가능해져, 양자화의 자유도를 향상시킬 수 있고, 양자화가 필요한 부분을 중점적으로 양자화하여, 양자화 효율을 크게 향상시킬 수 있는 효과를 얻을 수 있다.
또한, 상기 실시예 1∼3에서는, 입력 오디오 신호를 주파수 변환하여 얻어진 주파수 특성 신호 계열에 대하여, 벡터 양자화를 실행하여, 오디오 신호의 부호화를 실행하는 오디오 신호 부호화 장치에 있어서, 상기 주파수 특성 신호 계열 또는 그 일부를 벡터 양자화하는 제 1 단째의 벡터 양자화기와, 상기 제 1 단째의 벡터 양자화기에 의한 양자화 오차 성분을 벡터 양자화하는 제 2 단째의 벡터 양자화기를, 적어도 갖는 다단 양자화 수단을 구성하도록 함과 동시에, 해당 다단 양자화 수단의 각 단의 양자화 수단은, 상기 주파수 특성 신호 계열을, 적어도 2개 이상의 복수의 단 사이에서 중복하는 부분을 가질 수 있는 주파수 대역으로 각 단마다의 분할의 방법으로 분할한, 복수의 주파수 대역 중 어느 하나의 대역의 계수열을 벡터 양자화한, 적어도 하나 이상의 분할화 벡터 양자화기를 구비한 구성으로 할 수있고, 이러한 구성에 의해, 입력 MDCT 계수 중, 임의의 대역, 예를 들어, 인간에게 있어서 청각적으로 중요한 저역 주파수 성분에 상당하는 계수를 중점적으로, 소망하는 깊이로 양자화하도록 하는 한편, 복호화측에서는, 복수 단계의 복호화된 부호를 이용하여 복호를 실행하는 것도 가능하게 하고, 또한, 복호화의 순서는, 대역 확장에 기여하는 것과, 품질 향상에 기여하는 것을 교대로 복호하는 구성을 채용하는 것으로도 가능하게 함으로써, 저 비트 레이트, 즉 높은 압축율로 오디오 신호를 부호화한 경우에서도, 또한, 고정된 정보량으로 부호화 및 복호화를 실행하지 않아도, 수신측에 있어서, 고품위한 음성의 재생을 실행하도록 할 수 있는 효과를 얻을 수 있다.
(실시예 4)
다음에 도 1, 도 7∼도 11을 이용하여, 본 발명의 실시예 4에 의한 오디오 신호 복호화 장치에 대하여 설명한다. 부호화 장치(1)로부터의 출력인 인덱스는, 정규화부(104)가 출력한 인덱스 IND1과, 양자화부(105)가 출력한 인덱스 IND2로 크게 나뉘어진다.
정규화부(104)가 출력한 인덱스 IND1은, 역정규화부(107)에서 복호하고, 양자화부(105)가 출력한 인덱스 IND2는 역양자화부(106)에서 복호한다. 여기서 역양자화부(106)에서는, 양자화부(105)가 출력한 인덱스 IND2의 일부분만을 이용하여 복호하는 것도 가능하다.
즉, 이하에, 부호화 장치(1)에 있어서의 양자화부(105)의 구성을 도 5에 나타내는 구성의 것으로 한 경우에, 복호화 장치(1)에 있어서, 도 7의 구성을 갖는 역양자화부를 이용하여 역양자화를 실행하는 경우에 대하여 설명한다. 도 7에 있어서, (701)은 제 1 저역 성분의 역양자화부이다. 이 제 1 저역 성분의 역양자화부(701)에서는, 제 1 소양자화부(501)의 저역 성분의 인덱스 IND21만을 이용하여 복호화를 실행한다.
이와 같이 함으로써, 즉 상기한 바와 같이 제 1 저역 성분의 역양자화부(701)에서는, 제 1 소양자화부(501)의 저역 성분의 인덱스만을 이용하여 복호화를 실행하도록 함으로써, 부호화 장치(1)로부터 송신되어 오는 정보량에 관계하지 않고, 부호화된 오디오 신호의 소망하는 정보량분을 복호화할 수 있다. 즉, 수신측에서 복호화하는 정보량이 제한되어 있는 경우에 있어서도, 부호화하는 정보량과 복호화하는 정보량을 서로 다른 값으로 하여, 소망하는 정보량분만큼을 복호화하도록 할 수 있다. 따라서, 수신자측에서의 통신 환경 등에 따라서, 복호하는 정보량을 변화시킬 수 있어, 예를 들어, 통상의 공중 전화망을 이용하고 있는 것과 같은 경우에 있어서도, 안정하게 고품위한 음질을 얻을 수 있게 된다.
도 8은 역양자화를 2 단계로 실행할 때의 오디오 신호 복호화 장치의 역양자화부의 구성을 도시한 도면으로, 도 8에 있어서, (704)는 제 2 역양자화부이다. 이 제 2 역양자화부(704)에서는, 제 2 소양자화부(502)의 인덱스 IND3을 이용하여 복호화를 실행한다. 따라서, 제 1 저역 성분의 역양자화부(701)로부터의 출력 IND21'과, 제 2 역양자화부(704)로부터의 출력 IND3'의 가산값이, 역양자화부(106)의 출력으로서 출력되게 된다. 단, 여기서의 가산은, 양자화시에 각각의 소양자화부가 양자화한 대역과 동일한 대역에 가산하여 간다.
이와 같이, 제 1 소양자화부(저역)의 인덱스 IND21을 제 1 저역 성분의 역양자화부(701)에 의해 복호화함과 동시에, 제 2 소양자화부의 인덱스 IND3을 역양자화할 때에, 상기 제 1 저역 성분의 역양자화부(701)의 출력 IND21'도 해당 역양자화의 대상으로 가산하여 역양자화를 실행하도록 함으로써, 역양자화를 2 단계로 실행할 수 있고, 다단계에 의해 양자화된 오디오 신호를 정확히 복호화할 수 있어, 보다 고품질인 음질을 얻는 것이 가능하게 된다.
또한, 도 9는 역양자화를 2 단계로 실행할 때에, 대상으로 되는 대역을 확대하여 실행하도록 한 오디오 신호 복호화 장치의 역양자화부의 구성을 도시한 도면으로, 도 9에 있어서, (702)는 제 1 중역 성분의 역양자화부이다. 이 제 1 중역 성분의 역양자화부(702)에서는, 제 1 소양자화부(501)의 중역 성분의 인덱스 IND22를 이용하여 복호화를 실행한다. 따라서, 제 1 저역 성분의 역양자화부(701)로부터의 출력 IND21'과, 제 2 역양자화부(704)로부터의 출력 IND3'과, 제 1 중역 성분의 역양자화부(702)로부터의 출력 IND22'의 가산값이, 역양자화부(106)의 출력으로서 출력되게 된다. 단, 여기서의 가산은, 양자화시에 각각의 소양자화부가 양자화한 대역과 동일한 대역에 가산하여 간다. 이와 같이 함으로써, 재생되는 소리의 대역을 확대할 수 있어, 보다 고품질인 오디오 신호의 재생을 실행할 수 있게 된다.
또한, 도 10은, 도 9의 구성을 갖는 역양자화부에서, 역양자화하는 단수를 3 단계로 실행할 때의 오디오 신호 복호화 장치의 역양자화부의 구성을 도시한 도면으로, 도 10에 있어서, (705)는 제 3 역양자화부이다. 제 3 역양자화부(705)에서는, 제 3 소양자화부(503)의 인덱스를 이용하여 복호화를 실행한다. 따라서, 제 1 저역 성분의 역양자화부(701)로부터의 출력 IND21'과, 제 2 역양자화부(704)로부터의 출력 IND3'과, 제 1 중역 성분의 역양자화부(702)로부터의 출력 IND22'과, 제 3 역양자화부(705)로부터의 출력 IND4'의 가산값이, 역양자화부(106)의 출력으로서 출력되게 된다. 단, 여기서의 가산은, 양자화시에, 각각의 소양자화부가 양자화한 대역과 동일한 대역으로 가산하여 간다.
또한, 도 11은, 도 10의 구성을 갖는 역양자화부에서, 역양자화를 3 단계로 실행할 때에, 대상으로 되는 대역을 확대하여 실행하도록 한 오디오 신호 복호화 장치의 역양자화부의 구성을 도시한 도면으로, 도 11에 있어서, (703)은 제 1 고역 성분의 역양자화부이다. 제 1 고역 성분의 역양자화부(703)에서는, 제 1 소양자화부(501)의 고역 성분의 인덱스를 이용하여 복호화를 실행한다. 제 1 저역 성분의 역양자화부(701)로부터의 출력 IND21'과, 제 2 역양자화부(704)로부터의 출력 IND3'과, 제 1 중역 성분의 역양자화부(702)로부터의 출력 IND22'과, 제 3 역양자화부(705)로부터의 출력 IND4'과, 제 1 고역 성분의 역양자화부(703)로부터의 출력 IND23'의 가산값이, 역양자화부(106)의 출력으로서 출력되게 된다. 단, 여기서의 가산은, 양자화시에 각각의 소양자화부가 양자화한 대역과 동일한 대역으로 가산하여 간다.
또, 본 실시예 4에서는, 복호화부(106)가, 도 5의 구성을 갖는 양자화부(105)에 의해서 양자화된 정보를, 역양자화하는 경우를 예로 들어 설명하였지만, 양자화부(105)의 구성은, 도 4나 도 6에 도시한 구성이어도 마찬가지로 실행할 수 있다.
또한, 양자화부로서, 상기 도 5에 도시된 것과 같은 구성의 양자화부를 이용하여 부호화를 실행하고, 그 역양자화부에서, 도 11에 도시하는 것과 같은 구성을 갖는 역양자화부를 이용하여 복호화하는 경우에는, 도 15에 도시하는 바와 같이 제 1 소양자화부의 저역의 인덱스를 역양자화한 후, 다음 단의 제 2 소양자화부(502)의 인덱스를 역양자화하며, 재차 제 1 소양자화부의 중역의 인덱스를 역양자화한다고 하는 것과 같이, 대역을 확대하기 위한 역양자화와, 양자화 오차를 저감하기 위한 역양자화를 교대로 반복하여 실행하지만, 도 4에 도시한 것과 같은 구성의 양자화부에 의해서 부호화된 신호를, 도 11에 도시하는 것과 같은 구성을 갖는 역양자화부를 이용하여 복호화하는 경우에는, 도 4의 구성에 있어서는, 분할된 대역이 없기 때문에, 순차적으로 다음 단의 역양자화부에서 양자화된 계수를, 복호화하는 처리를 실행하게 된다.
다음에 도 1 및 도 14를 이용하여, 상기 복호화 장치(2)를 구성하는 역양자화부(106)의 상세한 동작에 대하여 설명한다. 역양자화부(106)는, 예를 들어, 도 7에 도시한 역양자화부를 갖는 경우에는, 제 1 저역의 역양자화부(701)로 구성되며, 도 8에 도시한 역양자화부를 갖는 경우에는, 제 1 저역의 역양자화부(701)와, 제 2 역양자화부(704)의 2개의 역양자화부로 구성된다.
벡터 역양자화기(1501)는, 부호화 장치(1)에 있어서의 벡터 양자화부(105)로부터의 인덱스 IND2를 이용하여 MDCT 계수의 재생을 실행한다. 소양자화부가 도 7에 도시한 구성을 갖는 것인 경우의 역양자화는, 인덱스 IND21로부터 인덱스 번호를 복호화하여, 그 번호의 코드 벡터를, 코드북(1502)으로부터 선출한다. 코드북(1502)은, 부호화 장치(1)에 있어서의 코드북과 마찬가지의 내용의 것으로 한다. 이 선출된 코드 벡터로부터, 재생 서브 벡터(1503)를 얻을 수 있으며, 이것은 수학식 14의 역과정에 의해 역양자화된 MDCT 계수(i, j)(1504)로 된다.
또한, 소양자화부가 도 8에 도시한 구성을 갖는 것인 경우의 역양자화는, 인덱스 IND21 및 인덱스 IND3으로부터 인덱스 번호 k를 복호하고, 수학식 19에서 산출되는 번호 u의 코드 벡터를, 코드북(1502)으로부터 선출한다.
재생 서브 벡터는, 수학식 20을 이용하여 생성한다.
여기서 i 번째의 재생 서브 벡터의 j 번째의 요소는 resi(j)로 한다.
다음에 도 1 및 도 12를 이용하여, 오디오 신호 복호화 장치(2)를 구성하는 역정규화부(107)의 상세한 구성에 대하여 설명한다. 도 12에 있어서, (1201)은 주파수 개형 역정규화부, (1202)는 대역 진폭 역정규화부, (1203)은 대역 테이블이다. 주파수 개형 역정규화부(1201)는, 주파수 개형 정규화부(201)로부터의 인덱스IND11을 입력으로 하여, 주파수 개형을 재생해서, 역양자화부(106)로부터의 출력에 대하여, 상기 주파수 개형을 승산하여 출력한다. 대역 진폭 역정규화부(1202)에서는, 대역 진폭 정규화부(202)로부터의 인덱스 IND12를 입력으로 하여, 대역 테이블(1203)에 표시된 각 대역마다의 진폭값을, 승산에 의해 복원한다. 대역 진폭 정규화부(202)로부터의 인덱스 IND12를 이용하여 복원된 각 대역마다의 값을, qavej로 하면, 대역 진폭 역정규화부(1202)의 연산은, 수학식 12에서 부여된다.
여기서, 주파수 개형 역정규화부(1201)의 출력을 n_dct(i), 대역 진폭 역정규화부(1202)의 출력을 dct(i)로 하였다. 또한, 대역 테이블(1203)과 도 2의 대역 테이블(203)은 마찬가지이다.
다음에 도 16은 복호화 장치(2)를 구성하는 주파수 개형 역정규화부(1201)의 상세한 구성에 대하여 설명한다. 도 16에 있어서, (1301)은 개형 역양자화부, (1302)는 포락 특성 역정규화부이다. 개형 역양자화부(1301)에서는, 부호화 장치(1)에 있어서의 개형 양자화부(301)로부터의 인덱스 IND13을 이용하여, 주파수 개형을 나타내는 파라미터, 예를 들어, 선형 예측 계수 등을 복원한다. 복원된 계수가 선형 예측 계수이면, 예를 들어, 수학식 8과 마찬가지로 산출함으로써, 양자화된 포락 특성 E13을 복원한다. 복원된 계수가 선형 예측 계수가 아닌 경우, 예를 들어, LSP 계수 등의 경우도, 이것을 주파수 특성으로 변환하여, 포락 특성 E13을 복원한다. 포락 특성 역양자화부(1302)에서는, 수학식 13으로 표시되도록, 복원된 포락 특성 E13과, 역양자화부(106)로부터의 출력 IND16을 승산하여 출력으로 하고, 대역 진폭 역정규화부(1201)에 입력한다.
이러한 본 실시예 4에 의하면, 양자화 수단으로 양자화하기 전에, 정규화 수단을 마련하여, 입력 오디오 신호의 정규화를 실행한 후에 양자화를 실행하도록 하였기 때문에, 정규화 수단과 양자화 수단이 각각의 능력을 풀(full)로 발휘한 부호화를 실행하고, 원(元) 오디오 신호가 갖는 정보량을 손실시키는 일 없이, 양자화 오차가 적은, 양자화 효율이 좋은 양자화를 실행할 수 있다. 또한, 수신측에서의 정보량이 한정되어 있을 때에는, 대역이 좁고 얕은 영역에서밖에 역양자화를 실행할 수 없지만, 이 역양자화를 순차적으로, 대역을 넓히는 방향과 역양자화의 깊이를 깊게 하는 방향으로 교대로 확장하고, 수신측에서의 정보량을 증대하여 가는 것에 의해, 부호화 장치(1)로부터 송신되어 오는 정보량에 관계없이, 부호화된 오디오 신호의 소망하는 정보량분을 복호화할 수 있다. 따라서, 수신자측에서의 통신 환경 등에 따라 복호하는 정보량을 변화시키도록 함으로써, 예를 들어, 통상의 공중 전화망을 이용하고 있는 것과 같은 경우에 있어서도, 안정하게 고품위한 음질을 얻을 수 있게 되는 효과를 얻을 수 있다.
(실시예 5)
다음에 도 18을 이용하여, 본 발명의 실시예 5에 의한 오디오 신호 부호화 장치에 대하여 설명한다. 본 실시예 5에서는, 부호화 장치(1)에 있어서의 양자화부(105)의 구성만이 상기 실시예와 상이하기 때문에, 여기서는 양자화부의 구성에 대해서만 설명하고, 다른 구성에 대해서는 설명을 할애한다.
도 18에 있어서, (1801)은 제 1 정규화부, (1802)는 제 1 소양자화부, (1803)은 제 1 양자화 대역 선택부, (1804)는 제 2 정규화부, (1805)는 제 2 소양자화부, (1806)은 제 2 양자화 대역 선택부, (1807)은 제 3 정규화부, (1808)은 제 3 소양자화부, (1809)는 제 3 양자화 대역 선택부이다.
실시예 3과의 구성상의 차이는, 제 2 및 제 3 정규화부(1804, 1807)가 부가된 점이다.
다음에 본 실시예 5의 각 구성 요소를 설명한다. 제 1, 제 2, 제 3 정규화부(1801, 1804, 1807)는, 실시예 1의 정규화부(104)과 동일한 구성에 의해 실현된다. 또한, 제 1, 제 2, 제 3 소양자화부(1802, 1805, 1808)는, 실시예 3의 제 1 소양자화부(601)와 동일한 구성에 의해 실현된다. 또한, 제 1, 제 2, 제 3 양자화 대역 선택부(1803, 1806, 1809)는, 실시예 3의 제 1 양자화 대역 선택부(602)와 동일한 구성에 의해 실현된다. 본 실시예 5에서는, 정규화부, 소양자화부, 양자화 대역 선택부의 3가지로 이루어지는 조합을 3 세트 갖는 경우에 대하여 설명하지만, 이 조합은 3 세트가 아니어도 무방하며, 4 세트 이상이어도, 2 세트이어도 무방하다. 또한, 최종단의 세트의 양자화 대역 선택부는, 반드시 필요가 없는 경우도 있어, 생략하는 것도 가능하다.
다음에, 도 18의 본 실시예 5에 의한 부호화 장치의 동작에 대하여 설명한다.
도 18에 있어서, 본 실시예 5에 입력되는 입력 오디오 신호의 MDCT 계수는, 우선 제 1 정규화부(1801)에서 정규화 처리를 실시하여, 정규화된 MDCT 계수를 출력한다. 제 1 소양자화부(1802)에서는, 제 1 정규화부(1801)로부터의 출력 신호인 정규화된 MDCT 계수를 양자화한다. 제 1 소양자화부(1802)에서는, 양자화에 이용한 파라미터를 인덱스로서, 또한, 이 때의 양자화에 있어서 발생한 양자화 오차를 다음 단의 양자화 대역 선택부(1803)에 출력한다. 제 1 양자화 대역 선택부(1803)에서는, 제 1 소양자화부(1802)의 출력을 이용하여, 제 2 소양자화부(1805)에 있어서 임의의 대역의 MDCT 계수를 양자화할 것인가를 산출한다.
제 2 정규화부(1804)에서는, 제 1 소양자화부(1802)의 출력인 MDCT 계수를, 제 1 양자화 대역 선택부(1803)가 대역 선택한 결과에 근거하여, 그 선택한 대역에 관해서 정규화한다. 제 2 소양자화부(1805)에서는, 제 2 정규화부(1804)의 출력을 양자화하여, 이 때의 양자화에 이용한 파라미터를 인덱스로서 출력함과 동시에, 이 때의 양자화에 있어서 발생한 양자화 오차도 출력한다. 제 2 양자화 대역 선택부(1806)에서는, 제 2 소양자화부(1805)의 출력을 이용하여, 제 3 소양자화부(1808)에 있어서 임의의 대역의 MDCT 계수를 양자화할 것인가를 산출한다.
제 3 정규화부(1807)에서는, 제 2 소양자화부(1805)의 출력인 MDCT 계수를, 제 2 양자화 대역 선택부(1806)가 대역 선택한 결과에 근거하여, 그 선택한 대역에 관해서 정규화한다. 제 3 소양자화부(1808)에서는, 제 3 정규화부(1807)의 출력을 양자화하여, 이 때의 양자화에 이용한 파라미터를 인덱스로서 출력함과 동시에, 이때의 양자화에 있어서 발생한 양자화 오차도 출력한다.
도시하는 제 3 양자화 대역 선택부(1809)는, 이 다음 단에 또한 제 4 소양자화부(도시하지 않음)가 존재하는 경우에 필요한 것이다. 만일 제 4 소양자화부가 존재하면, 이 제 3 양자화 대역 선택부(1809)는, 제 3 소양자화부(1808)의 출력을 이용하여, 제 4 소양자화부에서 임의의 대역의 MDCT 계수를 양자화할 것인가를 산출한다. 또, 제 1, 제 2, 제 3 정규화부(1801, 1804, 1807)는, 모두 실시예 1의 정규화부(105)와 같이, 정규화에 이용한 파라미터를 인덱스로서 출력한다.
이하, 본 실시예 5의 부호화 장치의 동작, 작용의 특징에 대하여, 상기 실시예 1∼3의 부호화 장치와 비교하면서 설명한다.
상기 실시예 1∼3에 의한 오디오 신호 부호화 장치에 있어서의 정규화 수단을 갖는 구성에 있어서는, 도 19a에 도시하는 바와 같이 시간축상의 음성 신호 파형을, MDCT, FFT에 의해 주파수축상의 파형으로 변환하여, 정규화 수단에 의해 그 정규화 A, 즉, 개형 추출과, 해당 추출한 개형의 진폭값에 의한 제산을, 도 20a에 도시하는 바와 같이 해당 주파수축상 파형의 전(全) 주파수 범위에 대하여 실행하고, 그 후, 그 정규화 출력에 대하여, 상기 전 주파수 범위를 분할한, 예를 들어, 3가지의 주파수 영역, 즉 저역, 중역, 고역의 각각에 관하여, 양자화 x, y, z를 실행하도록 한 것으로, 이에 따라, 양자화 출력=A(x+y+z)을 얻는다.
이에 대하여, 본 실시예 5는, 도 20b에 도시하는 바와 같이 상기 분할화한 각 양자화 수단의 전단에, 각각 정규화 수단 α, β, γ를 구비하고, 우선 도 19d에 도시하는 바와 같이 주파수축상의 파형을 복수의 주파수 대역으로 분할한 후에,각 분할한 주파수 대역의 각각마다 정규화 및 양자화를 실행하도록 한 것으로, 그 결과, 양자화 출력=αX+βy+γZ를 얻는 것이다. 그 전체의 상태를, 또한 도 21에 도시하고 있다.
일반적으로, 오디오 신호의 주파수 특성에 대단히 편향이 있는 경우, 예를 들어, 음성 정보와 같이 저역에 집중하고 있는 것과 같은 신호인 경우에는, 이것을 전체적으로 대략 정규화해 버리면, 상기 저역의 특징 중 어느 점을 중점적으로 정규화, 양자화할 수가 없다. 즉, 전체적이고 대략적인 정규화는, 신호 변화가 상세한 곳까지 신호의 포락선을 취하지 않게 되어, 해당 신호 변화가 상세한 곳의 정보를 손실해 버리게 된다. 따라서, 이러한 정규화를 실행한 후, 양자화를 실행하며, 여기서 양자화기는 그 자기의 능력을 풀로 발휘하였다고 해도, 신호 변화가 상세한 곳의 정보를 습득하고 있지 않은 신호에 대하여 양자화를 실행하고 있게 되어, 너무 의미가 없는 양자화를 실행하고 있는, 바꿔 말하면, 정규화, 양자화를 합친 효과가 발휘하기 어려운 양자화를 실행하고 있게 된다. 즉, 정규화 수단을 마련하는 것이면, 정규화 수단, 양자화 수단의 양쪽이 각각의 능력을 풀로 발휘할 수 있는 것이 바람직하지만, 반대로 대단히 대략적인 신호일 때에는, 단지 전체를 대략적으로 정규화하여도, 결과는 그 정도로 변하지 않은 것이다.
여기서, 도 20은, 도 1에 도시되는 정규화부(104)를 갖는, 상기 실시예 1∼3의 오디오 신호 부호화 장치에 있어서의, 정규화 수단과, 각 양자화 수단의 관계를 나타내는 것이지만, 이 구성과 같이, 정규화 수단 A가 입력 오디오 신호의 주파수 특성 신호 계열의 전체를 정규화하는 구성에는, 상술한 바와 같이, 입력 오디오 신호가, 예를 들어 저역에 집중하고 있는 것과 같은, 주파수적으로 편향이 있는 신호의 경우에는, 정규화 수단, 양자화 수단의 양쪽이 각각의 능력을 풀로 발휘할 수 있는 구성이 아니라고 생각된다.
이에 대하여, 도 20b에 도시하는 바와 같이 각 양자화 수단 x, y, z가, 그 전단에 각각 정규화 수단 α, β, γ를 구비하고 있는, 본 실시예 5에 의한 구성으에서는, 각 양자화 수단이 양자화하고자 하는 그 대상의 신호마다, 정규화를 실행하도록 하고 있기 때문에, 각 정규화 수단은, 양자화를 실행하고자 하는 각 양자화 수단의 부하를 고려한 최적의 정규화, 즉 각 양자화되어야 할 신호의 레벨을, 각 양자화 수단이 풀로 그 능력을 발휘할 수 있는 레벨에 갖고 오는 정규화를 실행할 수 있어, 정규화 수단과 양자화 수단을 합친 최대의 효과를 내도록 할 수 있는 것이다.
즉, 본 실시예 5에 의한 부호화 장치에 있어서의 정규화부, 양자화부의 구성은, 도 20b에 도시하는 바와 같이 입력 오디오 신호를 주파수 변환하여 얻은 주파수 특성 신호 계열, 혹은 해당 주파수 특성 신호 계열의 주파수 대역을 분할한 소정의 주파수 대역 A의 계수열에 대하여, 우선, 제 1 단째의 정규화 수단 α, 양자화 수단 x에 의해, 정규화, 양자화를 실행하고, 또한, 2 단째의 정규화 수단 β, 양자화 수단 y에 의해, 상기 1 단째의 주파수 대역 A의 계수열에 대하여 인접하는 주파수 대역 B의 계수열에 대하여, 정규화, 양자화를 실행하며, 또한, 제 3 단째의 정규화 수단 γ, 양자화 수단 z에 의해, 상기 2 단째의 주파수 대역 B의 계수열에 대하여 인접하는 주파수 대역 C의 계수열에 대하여, 정규화, 양자화를 실행하는 구성으로 한 것이다.
또는, 도 20c에 도시하는 바와 같이 제 2 단째의 정규화 수단 β, 양자화 수단 y는, 상기 1 단째의 주파수 대역 A에 대하여 일부 중첩을 갖고 인접하는 주파수 대역 B에서, 그 중첩 부분에서는 1 단째의 출력인 양자화 오차에 대하여, 그 밖의 부분에서는 상기 주파수 특성 신호 계열의 해당 주파수 대역 B의 계수열에 대하여, 정규화, 양자화를 실행하는, 제 3 단째의 정규화 수단 γ, 양자화 수단 z에 의해, 상기 2 단째의 주파수 대역 B의 계수열에 대하여 일부 중첩을 갖고 인접하는 주파수 대역 C에서, 그 중첩 부분에서는 2 단째의 출력인 양자화 오차에 대하여, 그 밖의 부분에서는 상기 주파수 특성 신호 계열의 해당 주파수 대역 C의 계수열에 대하여, 정규화, 양자화를 실행하는 구성으로 한 것이다.
이상의 도 20b, c에 도시한 구성에서는, 각 양자화 수단에 의한 양자화마다 정규화를 실행함으로써, 각 정규화 수단이, 각 양자화 수단의 부하를 고려한 정규화를 실행하여, 각 정규화 수단, 양자화 수단이 그들의 능력을 풀로 발휘한 양자화를 실행할 수 있어, 양자화 효율을 크게 향상시킬 수 있다.
또, 도 20b, c에 있어서의 각 단의 정규화, 양자화 수단이 처리하는 주파수 대역 및 양자화의 깊이는, 이들의 예의 것에 한정되는 것이 아니고, 더욱 임의로 조정할 수 있다.
다음에, 제 1 단째 내지 제 3 단째의 정규화, 양자화 수단에 의한, 정규화, 양자화의 방법의 일례에 대하여, 도 18, 도 22를 이용하여 설명한다.
본 실시예 5에서는, 각각의 제 1, 제 2, 제 3 정규화부(1801, 1804, 1807)에서, 상기 실시예 1의 정규화부(104)와 마찬가지의 구성이어도 실현 가능하지만, 정규화의 파라미터 산출 방법으로서는, 다른 방법을 이용하여 실현하여도 무방하며, 예를 들어, 각각의 정규화부에 입력되는 MDCT 계수로부터 직접, LPC 계수나 LSP 계수 등을 산출하여, 이들을 정규화의 파라미터로서 정규화부를 구성할 수 있다. 도 22에 있어서, T1, T2, T3은 각 단째의 정규화 수단 α, β, γ가 각각 이용하는 정규화를 위한 테이블로서, 이들은 이하 방법으로 구한다.
즉, 입력 오디오 신호로서 입력될 가능성이 있는 여러가지 음원 신호의 MDCT 계수에 대하여, LPC(Linear Predictive Coding) 분석을 실행하여, LSP(Line Spectrum Pair) 계수를 구한다. 그리고, 이 동작을 음원마다 반복하여, 모든 프레임마다 LSP 계수를 구하는 처리를 실행하고, 이들을 전부 모은 뒤에, 클러스터 분석을 실행하여, 대표적인 복수의 포락선 패턴을 구하며, 이들을 제 1 단째의 정규화 수단 α의 정규화 테이블 T1로 한다.
이렇게 해서 얻어진 복수의 포락선 패턴을 이용하여, 1 단째의 정규화, 양자화의 처리를 실행하고, 그 출력에 대하여 상기와 같은 LPC 분석으로부터의 처리를 실행하며, 상기와 마찬가지로 하여, 복수의 포락선 패턴을 구하고, 이들을 제 2 단째의 정규화 수단 β의 정규화 테이블 T2로 한다.
이하, 마찬가지로 해서, 제 3 단째의 정규화 수단 γ의 정규화 테이블 T3을 구한다.
이렇게 하여, 제 1 단째 내지 제 3 단째의 각 양자화 수단에 의한 양자화로서, 각 양자화 수단의 부하를 고려하여, 정규화와 양자화의 각각의 능력을 풀로 발휘한 최적의 양자화를 실행할 수 있도록 하기 위한, 정규화 수단의 정규화 테이블 T1, T2, T3을 얻을 수 있다.
이러한 구성의 오디오 신호 부호화 장치에서는, 복수 종류의 여러가지 음원 신호로 이루어지는 것으로 생각할 수 있는 입력 오디오 신호가, 본 장치에 입력되면, 해당 입력 오디오 신호는, 도 19a∼b에 도시되는 바와 같이, 시간축상의 데이터로부터 MDCT FFT에 의해 주파수축상의 데이터로 변환된다. 그리고, 해당 주파수축상의 데이터에 변환된 신호는, 도 19b∼c에 도시되는 바와 같이, 그 개형 추출이 행해진다. 이 때의 개형 추출은, 제 1 단째의 정규화 수단 α의 정규화 테이블 T1을 이용하여 실행한 결과 얻어지는 개형은, 예를 들면 20개 정도의 LSP의 다항식으로 만들어지는 것이다. 그리고, 얻어진 개형으로 상기 해당 주파수축상의 데이터로 변환된 신호를 제산함에 의해, 정규화 α가 행해진다. 그리고, 해당 정규화가 실행된 후에는, 이것을 양자화 수단 x에 의해 양자화하여, 제 1 단의 정규화, 양자화를 완료한다. 이에 의해, 상기 복수 종류의 여러가지 음원 신호의 특징을 고려한 효율이 좋은 양자화를 실행하는 것이 가능해지고 있다.
다음에, 제 2 단째의 정규화, 양자화 수단에 의해, 제 1 단째에서 정규화, 양자화의 대상으로 한, 주파수 특성 신호 계열이 분할한 임의의 주파수 영역 A의 계수열과 서로 다른 주파수 영역 B의 계수열에 대하여, 혹은 상기 제 1 단째의 정규화, 양자화의 결과인 양자화 오차의 출력에 대하여, 상기 제 2 단째의 정규화 테이블 T2를 이용하여, 제 2 단째의 정규화, 양자화를 실행한다. 이에 의해, 역시 상기 복수 종류의 여러가지 음원 신호의 특징을 고려한, 소요의 주파수 대역에 중점을 둔, 혹은 소요의 주파수 대역 부분의 양자화의 깊이에 중점을 둔, 효율이 좋은 양자화를 실행할 수 있다.
또한, 제 2 단째의 정규화, 양자화 수단에 의해, 제 1 단째, 제 2 단째에서 정규화, 양자화의 대상으로 한, 주파수 특성 신호 계열이 분할한 각 주파수 영역의 계수열과 서로 다른 주파수 영역의 계수열에 대하여, 혹은 상기 제 2 단째의 정규화, 양자화의 결과인 양자화 오차의 출력에 대하여, 제 3 단째의 정규화 테이블 T3을 이용하여, 제 3 단째의 정규화, 양자화를 실행한다. 이에 따라서도, 역시 상기 복수 종류의 여러가지 음원 신호의 특징을 고려한, 소요의 주파수 대역에 중점을 둔, 혹은 소요의 주파수 대역 부분의 양자화의 깊이에 중점을 둔, 효율이 좋은 양자화를 실행할 수 있다.
이와 같이, 상기에서 설명한 것과 같은 방법으로 작성한, 정규화 테이블 T1, T2, T3을 이용하여, 각 단의 정규화 α, 양자화 x, 정규화 β, 양자화 y, 정규화 γ, 양자화 z를 실행함으로써, 양자화되어야 할 대상인 신호의 성질 등에 따라서, 양자화에의 과도의 부담을 경감하는 것과 같은 정규화를 실행할 수 있고, 양자화 효율을 크게 개선할 수 있어, 재생측에서의 품질을 크게 향상시킬 수 있는 것이다.
또한, 본 실시예 5에 의한 부호화 장치에 대한, 복호화 장치의 구성은, 도 23b, c에 도시하는 바와 같이, 도 20b, c에 도시한 부호화 장치측의 구성에 대응하여, 상기 오디오 신호 부호화 장치의 양자화부의 각 양자화기로부터의 신호를 수신하고, 상기 주파수 특성 신호 계열의 복수의 주파수 대역으로 분할한 각 주파수 대역의 계수열에 상당하는 신호를, 재생하는 역양자화부 x', y', z'과, 해당 복수의역양자화부의 각각마다 마련되고, 그 출력인 주파수 특성 신호 계열의 계수열과, 상기 오디오 신호 부호화 장치의 출력인 정규화에 관한 부호를 바탕으로 재생한 정규화 성분을 승산하여, 부호화전의 주파수 특성 신호 계열의 각 계수열에 상당하는 신호를 출력하는 복수의 역정규화부 α', β', γ'과, 해당 복수의 각 역정규화부의 출력을 수신하여, 원(元) 오디오 신호에 상당하는 신호로 출력하는 역주파수 변환부(도시하지 않음)를 구비하게 된다.
또한, 해당 복호화 장치에 있어서의 역정규화, 역양자화를, 양자화의 대역이 넓게 되는 방향과, 양자화의 깊이가 깊게 되는 방향을 교대로 실행하도록 하면, 상기 실시예 4에 있어서 설명한 것과 같이, 부호화 장치로부터 송신되어 오는 정보량에 관계없이, 부호화된 오디오 신호의 소망하는 정보량분을 복호화할 수 있다. 즉, 수신자측에서의 통신 환경 등에 따라서, 복호하는 정보량을 변화시킬 수 있어, 예를 들어, 통상의 공중 전화망을 이용하고 있는 것과 같은 경우에 있어서도, 안정하고 고품위한 음질을 얻을 수 있는 효과를 얻을 수 있다.
또, 상기 실시예 5에 있어서, 제 1, 제 2, 제 3 양자화 대역 선택부(1803, 1806, 1809)의 구성은, 각각 미리 설정해 놓은 양자화해야 할 주파수 대역을 출력하는 구성으로 하여도 실현 가능하다. 이 경우에는, 제 1, 제 2, 제 3 양자화 대역 선택부(1803, 1806, 1809)에서는, 양자화해야 할 대역을 산출하는 계산을 실행하는 일 없이, 각각 미리 설정해 놓은 양자화해야 할 주파수 대역을 출력하게 되어, 구성을 보다 간소화할 수 있다.
또한, 상기 실시예 5에 있어서의, 제 1, 제 2, 제 3 양자화 대역선택부(1803, 1806, 1809)의 구성은, 인간의 청각 특성에 근거하여 양자화해야 할 주파수 대역을 출력으로서 얻기 위해서, 정적시의 최소 가청 특성과, 임의의 입력 주파수 성분에 의해서 그 근방의 주파수 성분의 소리가 들리기 어렵게 되는 마스킹 특성의 2개의 특성을 이용하여, 대역의 선택을 실행하도록 구성하는 것도 가능하다.
이러한 본 실시예 5의 오디오 신호 부호화 장치에 의하면, 다단 양자화를 실행하는 양자화 수단의 전단에 각각 정규화 수단을 마련하여, 분할한 각 주파수마다, 또한 각 단의 양자화마다 정규화를 실행한 후 양자화를 실행하도록 하였기 때문에, 주파수 영역마다의 정규화에 의해 각 주파수 영역의 오디오 신호가 갖는 정보량에 따른 적절한 부호화를 실행하여, 즉, 정규화 수단과 양자화 수단이 각각의 능력을 풀로 발휘한 부호화를 실행하여, 원 오디오 신호가 갖는 정보량을 손실시키는 일이 없고, 따라서 양자화 오차가 적으며, 양자화 효율이 좋은 양자화를 실행할 수 있어, 안정하고 고품위한 음질을 얻을 수 있다.
또, 상기 실시예 1∼5에서는, 상기 다단 양자화 수단은, 상기 주파수 특성 신호 계열, 또는 그 일부를 벡터 양자화하는 제 1 단째의 벡터 양자화기와, 상기 제 1 단째의 벡터 양자화기에 의한 양자화 오차 성분을 벡터 양자화하는 제 2 단째의 벡터 양자화기를 적어도 가짐과 동시에, 해당 다단 양자화 수단의 각 단의 양자화 수단은, 상기 주파수 특성 신호 계열을, 적어도 2개 이상의 복수의 단 사이에서 중복하는 부분을 가질 수 있는 주파수 대역으로 각 단마다의 분할의 방법으로 분할한, 복수의 주파수 대역 중 어느 하나의 대역의 계수열을 벡터 양자화한, 적어도하나 이상의 분할화 벡터 양자화기를 구비한 것으로 하였지만, 이 다단 양자화 수단의 각 단의 양자화 수단은, 상기 주파수 특성 신호 계열, 또는 전단의 양자화 수단에 의한 양자화 오차 성분을 전부 벡터 양자화하는 전 대역 벡터 양자화기로 이루어지는 것이어도 좋고, 이에 따라, 양자화를 다단으로 행하여, 상기와 같이, 저 비트 레이트, 즉 높은 압축율로 오디오 신호를 부호화한 경우에서도, 또한, 고정된 정보량으로 부호화 및 복호화를 실행하지 않아도, 수신측에 있어서, 고품위한 음성의 재생을 실행하도록 할 수 있는 효과를 얻을 수 있는 것이다.
이상과 같이, 본 발명에 관한 오디오 신호 부호화 장치 및 복호화 장치, 혹은 부호화·복호화 방법에 의하면, 양자화에는 벡터 양자화의 방법을 이용하는 등을 하여 높은 정보 압축율에 있어서도 양자화 가능한 구성을 가짐과 동시에, 양자화시의 정보량의 배분을, 재생 대역의 확장에 기여하는 정보량과 품질 향상에 기여하는 정보량의 양자를 교대로 배분하여 간다고 하는 구성을 채용하여, 우선 부호화 장치에 있어서는, 제 1 단계에서, 입력의 오디오 신호를 주파수 영역의 신호로 변환하여, 변환된 주파수 신호의 일부를 부호화하고, 제 2 단계에서는, 부호화되어 있지 않은 주파수 신호의 일부와, 제 1 단계의 양자화 오차 신호를 부호화하여, 제 1 단계의 부호에 부가하며, 제 3 단계에서는, 또한 부호화되어 있지 않은 주파수 신호의 일부와, 제 1 단계 및 제 2 단계의 양자화 오차 신호의 부호화를 실행하고, 제 1 단계, 제 2 단계의 부호에 부가하며, 마찬가지로 더욱 단계를 반복하여 부호화를 실행하는 한편, 복호화 장치에서는, 제 1 단계의 부호화된 부호만을 이용하여 복호를 실행하는 것도, 제 1 단계와 제 2 단계의 복호화된 부호를 이용하여 복호를실행하는 것도, 제 1 단계로부터 제 3 단계 이상의 단계의 복호화된 부호를 이용하여 복호를 실행하는 것도 가능하게 하고, 복호화의 순은, 대역 확장에 기여하는 것과, 품질 향상에 기여하는 것을 교대로 복호하는 구성으로 하였기 때문에, 고정된 정보량으로 부호화 및 복호화를 실행하지 않아도, 양호한 음질을 얻을 수 있고, 또한, 높은 압축율로써 고품질의 소리를 얻을 수 있게 되는 효과를 얻을 수 있다.
또한, 본 발명에 관한 오디오 신호 부호화 장치 및 복호화 장치, 혹은 부호화·복호화 방법에 의하면, 양자화 수단으로 양자화하기 전에, 정규화 수단을 마련하여, 입력 오디오 신호의 정규화를 실행한 후에 양자화를 실행하도록 하였기 때문에, 정규화 수단과 양자화 수단이 각각의 능력을 풀로 발휘한 부호화를 실행하고, 원 오디오 신호가 갖는 정보량을 손실시키는 일 없이, 양자화 오차가 적은, 양자화 효율이 좋은 양자화를 실행할 수 있어, 오디오 신호의 종류에 의해서는 그 효과를 보다 크게 발휘할 수 있는 것이다. 또한, 상기에서 설명한 바와 같이, 양자화시의 정보량의 배분을, 재생 대역의 확장에 기여하는 정보량과 품질 향상에 기여하는 정보량의 양자를 교대로 배분하여 간다고 하는 구성을 채용함으로써, 수신측에서의 정보량이 한정되어 있을 때에는, 대역이 좁고 얕은 영역에서밖에 역양자화를 실행할 수 없지만, 이 역양자화를 순차적으로, 대역을 넓히는 방향과 역양자화의 깊이를 깊게 하는 방향으로 교대로 확장하여, 수신측에서의 정보량을 증대하여 가는 것에 의해, 부호화 장치로부터 송신되어 오는 정보량에 관계없이, 부호화된 오디오 신호의 소망하는 정보량분을 복호화할 수 있어, 이와 같이, 수신자측에서의 통신 환경등에 따라 복호하는 정보량을 변화시키도록 함으로써, 예를 들어, 통상의 공중전화망을 이용하고 있는 것과 같은 경우에 있어서도, 안정하고 고품위한 음질을 얻을 수 있게 되는 효과를 얻을 수 있다.
또한, 본 발명에 관한 오디오 신호 부호화 장치 및 복호화 장치, 혹은 부호화·복호화 방법에 의하면, 다단 양자화를 실행하는 양자화 수단의 전단에 각각 정규화 수단을 마련하여, 분할한 각 주파수마다, 또한 각 단의 양자화마다 정규화를 실행한 후 양자화를 실행하도록 하였기 때문에, 주파수 영역마다의 정규화에 의해 각 주파수 영역의 오디오 신호가 갖는 정보량에 따른 적절한 부호화, 즉, 정규화 수단과 양자화 수단이 각각의 능력을 풀로 발휘한 부호화를 실행하여, 원 오디오 신호가 갖는 정보량을 손실시키는 일이 없어, 따라서 양자화 오차가 적고, 양자화 효율이 좋은 양자화를 실행하는 수 있으며, 오디오 신호의 종류에 따라서는 그 효과를 보다 크게 발휘할 수 있는 것이다. 또한, 복호화측의 역정규화, 역양자화를, 양자화의 대역이 넓게 되는 방향과, 양자화의 깊이가 깊게 되는 방향을 교대로 실행하도록 하면, 상기와 같이, 부호화 장치로부터 송신되어 오는 정보량에 관계없이, 부호화된 오디오 신호의 소망하는 정보량분을 복호화할 수 있어, 즉, 수신자측에서의 통신 환경 등에 따라서, 복호하는 정보량을 변화시킬 수 있어, 예를 들어, 통상의 공중 전화망을 이용하고 있는 것과 같은 경우에 있어서도, 안정하고 고품위한 음질을 얻을 수 있는 효과를 얻을 수 있다.
이상과 같이, 본 발명에 관한 오디오 신호 부호화 장치 및 복호화 장치, 혹은 부호화·복호화 방법에 의하면, 고정된 정보량으로 부호화 및 복호화를 실행하지 않아도, 양호한 음질을 얻을 수 있어, 더욱 높은 압축율로써 고품질인 소리를 얻을 수 있게 되는 효과를 얻을 수 있다.
또한, 주파수 영역마다의 정규화에 의해 각 주파수 영역의 오디오 신호가 갖는 정보량에 따른 적절한 부호화를 실행함으로써, 정규화 수단과 양자화 수단이 각각의 능력을 풀로 발휘한 부호화를 실행하여, 원 오디오 신호가 갖는 정보량을 손실시키는 일이 없이, 양자화 오차가 적은, 양자화 효율이 좋은 양자화를 실행할 수 있어, 오디오 신호의 종류에 따라서는 그 효과를 크게 발휘할 수 있어, 따라서, 수신자측에서의 통신 환경 등에 따라 복호하는 정보량을 변화시키도록 하는 것에 의해, 예를 들어, 통상의 공중 전화망을 이용하고 있는 것과 같은 경우에 있어서도, 안정하고 고품위한 음질을 얻을 수 있게 되는 효과를 얻을 수 있다.

Claims (44)

  1. 입력 오디오 신호를 주파수 변환하여 얻어진 주파수 특성 신호 계열에 대하여, 벡터 양자화를 실행하고, 오디오 신호의 부호화를 실행하는 오디오 신호 부호화 장치에 있어서,
    상기 주파수 특성 신호 계열 또는 그 일부를 벡터 양자화하는 제 1 단째의 벡터 양자화기와,
    상기 제 1 단째의 벡터 양자화기에 의한 양자화 오차 성분을 벡터 양자화하는 제 2 단째의 벡터 양자화기를 적어도 갖는 다단 양자화 수단을 포함하고,
    상기 다단 양자화 수단의 각 단의 양자화 수단은, 상기 주파수 특성 신호 계열을, 적어도 2개 이상의, 복수의 단 사이에서 중복하는 부분을 가질 수 있는 주파수 대역에, 각 단마다의 분할 방법에 의해 분할한, 복수의 주파수 대역 중 어느 하나의 대역의 계수열을 벡터 양자화하는, 적어도 하나 이상의 분할화 벡터 양자화기를 포함한 것을 특징으로 하는 오디오 신호 부호화 장치.
  2. 제 1 항에 있어서,
    상기 주파수 특성 신호 계열을 정규화하여, 그 출력을 상기 다단 양자화 수단에 부가하는 정규화 수단을 포함한 것을 특징으로 하는 오디오 신호 부호화 장치.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 각 단의 양자화 수단은, 양자화해야 할 상기 주파수 특성 신호 계열의 분할한 주파수 대역으로서, 양자화 오차의 에너지 가산합이 큰 대역을 적절히 선택하여, 양자화를 실행하는 것을 특징으로 하는 오디오 신호 부호화 장치.
  4. 제 1 항 또는 제 2 항에 있어서,
    상기 각 단의 양자화 수단은, 양자화해야 할 상기 주파수 특성 신호 계열의 분할한 주파수 대역으로서, 인간의 청각적인 성질인 청각 감도 특성에 근거하여, 그 중요도가 높은 대역에 큰 값을 가중한 양자화 오차의 에너지 가산합이 큰 대역을 적절히 선택해서, 양자화를 실행하는 것을 특징으로 하는 오디오 신호 부호화 장치.
  5. 제 1 항에 있어서,
    상기 다단 양자화 수단을 구성하는, 제 1 단째의 벡터 양자화기와, 제 2 단째의 벡터 양자화기 사이에, 제 1 양자화 대역 선택부를 포함하고,
    상기 제 2 단째의 벡터 양자화기와, 상기 제 3 단째의 벡터 양자화기 사이에, 제 2 양자화 대역 선택부를 포함하며,
    상기 제 1 양자화 대역 선택부는, 상기 제 1 단째의 벡터 양자화기의 양자화 오차의 출력을 그 입력으로 하여, 상기 제 2 단째의 벡터 양자화기가 양자화해야 할 대역을 선택하는 것이며,
    상기 제 2 양자화 대역 선택부는, 상기 제 2 단째의 벡터 양자화기의 양자화 오차의 출력을 그 입력으로 하여, 상기 제 3 단째의 벡터 양자화기가 양자화해야 할 대역을 선택하는 것을 특징으로 하는 오디오 신호 부호화 장치.
  6. 제 5 항에 있어서,
    상기 다단 양자화 수단은,
    상기 주파수 특성 신호 계열의 상기 분할한 각 주파수 대역마다의 각 계수열을, 제 i 단째의 분할화된 벡터 양자화기에 의해서 독립적으로 양자화하는 복수의 제 i 단째의 분할화 벡터 양자화기와,
    양자화해야 할 입력 신호의 각 주파수 대역을, 적어도 한번은 전부 양자화하는 전 대역 양자화부로 되는 제 j 단째의 벡터 양자화기를 포함하는 것을 특징으로 하는 오디오 신호 부호화 장치.
  7. 제 1 항에 있어서,
    상기 다단 양자화 수단은, 전단 벡터 양자화기가 코드북을 이용하는 벡터 양자화 방법을 이용하여 벡터 양자화에 있어서의 양자화 오차를 산출하고, 후단의 벡터 양자화기가, 상기 산출한 양자화 오차에 대하여 벡터 양자화를 더 실행하는 것을 특징으로 하는 오디오 신호 부호화 장치.
  8. 제 2 항에 있어서,
    상기 다단 양자화 수단은, 전단 벡터 양자화기가 코드북을 이용하는 벡터 양자화 방법을 이용하여 벡터 양자화에 있어서의 양자화 오차를 산출하고, 후단의 벡터 양자화기가, 상기 산출한 양자화 오차에 대하여 벡터 양자화를 더 실행하는 것을 특징으로 하는 오디오 신호 부호화 장치.
  9. 제 8 항에 있어서,
    상기 다단 양자화 수단의 벡터 양자화기는, 벡터 양자화에 있어서의 상기 코드북내의 최적의 코드를 검색할 때에 이용하는 코드간의 거리 계산에 있어서, 상기 정규화 수단으로부터 출력되는 입력 신호의 정규화 성분을 가중치로서 이용하여 상기 거리를 계산해서, 최소 거리를 부여하는 코드를 추출하는 것을 특징으로 하는 오디오 신호 부호화 장치.
  10. 제 9 항에 있어서,
    상기 다단 양자화 수단의 벡터 양자화기는, 상기 정규화 수단에 의해 출력된 주파수 특성 신호 계열의 정규화 성분과, 인간의 청각적인 성질인 청각 감도 특성을 고려한 값의 양자를 가중치로서, 상기 거리를 계산하여, 최소 거리를 부여하는 코드를 추출하는 것을 특징으로 하는 오디오 신호 부호화 장치.
  11. 제 2 항 및 제 8 항 내지 제 10 항 중 어느 한 항에 있어서,
    상기 정규화 수단은, 상기 주파수 특성 신호 계열의 개형을 대략 정규화하는 주파수 개형 정규화부를 포함한 것을 특징으로 하는 오디오 신호 부호화 장치.
  12. 제 2 항 및 제 8 항 내지 제 10 항 중 어느 한 항에 있어서,
    상기 정규화 수단은, 상기 주파수 특성 신호 계열을, 복수의 연속한 단위 주파수 대역의 각 성분으로 분할하여, 각 단위 대역의 계수열을 1개의 값으로 제산함에 의해 정규화하는 대역 진폭 정규화부를 포함한 것을 특징으로 하는 오디오 신호 부호화 장치.
  13. 제 1 항에 있어서,
    상기 다단 양자화 수단은,
    상기 주파수 특성 신호 계열의 상기 분할한 각 주파수 대역마다의 각 계수열을, 분할화 벡터 양자화기에 의해서 독립적으로 양자화하는 벡터 양자화기와,
    양자화해야 할 입력 신호의 각 주파수 대역을, 적어도 한번은 전부 양자화하는 전 대역 양자화부로 되는 벡터 양자화기를 포함하는 것을 특징으로 하는 오디오 신호 부호화 장치.
  14. 제 13 항에 있어서,
    상기 다단 양자화 수단은,
    저역의 분할화 벡터 양자화기와, 중역의 분할화 벡터 양자화기와, 고역의 분할화 벡터 양자화기로 이루어지는 제 1 벡터 양자화기와,
    이것의 후단에 접속되는 제 2 벡터 양자화기와,
    이것의 후단에 접속되는 제 3 벡터 양자화기를 포함하고,
    상기 다단 양자화 수단에 입력된 주파수 특성 신호 계열을 3가지의 대역으로 분할하며, 상기 3가지의 대역 중의 낮은 대역 성분의 주파수 특성 신호 계열을 상기 저역의 분할화 벡터 양자화기로 양자화하고, 상기 3가지의 대역 중의 중간 대역 성분의 주파수 특성 신호 계열을 상기 중역의 분할화 벡터 양자화기로 양자화하며, 상기 3가지의 대역 중의 높은 대역 성분의 주파수 특성 신호 계열을 상기 고역의 분할화 벡터 양자화기로 각각 독립적으로 양자화를 실행하고,
    상기 제 1 벡터 양자화기를 구성하는 각각의 분할화 벡터 양자화기로 주파수 특성 신호 계열에 대한 양자화 오차를 산출하여, 이것을 후단의 상기 제 2 벡터 양자화기로의 입력으로 하고,
    상기 제 2 벡터 양자화기에서는, 상기 제 2 벡터 양자화기가 양자화하는 대역폭분의 양자화를 실행하여, 상기 제 2 벡터 양자화기로의 입력에 대한 양자화 오차를 산출하여 이것을 상기 제 3 벡터 양자화기로의 입력으로 하며,
    상기 제 3 벡터 양자화기에서는, 상기 제 3 벡터 양자화기가 양자화하는 대역폭분의 양자화를 실행하는 것을 특징으로 하는 오디오 신호 부호화 장치.
  15. 제 14 항에 있어서,
    상기 다단 양자화 수단을 구성하는 제 1 벡터 양자화기와 제 2 벡터 양자화기 사이에 제 1 양자화 대역 선택부를 마련함과 동시에, 상기 제 2 벡터 양자화기와 상기 제 3 벡터 양자화기 사이에 제 2 양자화 대역 선택부를 마련하고,
    상기 제 1 양자화 대역 선택부는, 상기 제 1 벡터 양자화기의 출력을 그 입력으로 하여, 상기 제 2 벡터 양자화기가 양자화해야 할 대역을 선택하며,
    상기 제 2 벡터 양자화기는, 상기 제 1 양자화 대역 선택부에서 선택된 대역의 상기 3가지의 벡터 양자화기로 이루어지는 제 1 벡터 양자화기의 양자화 오차에 대하여, 상기 제 2 벡터 양자화기가 양자화하는 대역폭분의 양자화를 실행하여, 상기 제 2 벡터 양자화기로의 입력에 대한 양자화 오차를 산출하고, 이것을 상기 제 2 양자화 대역 선택부로의 입력으로 하며,
    상기 제 2 양자화 대역 선택부는, 상기 제 2 벡터 양자화기로부터의 양자화 오차를 입력으로 하여, 상기 제 3 벡터 양자화기가 양자화해야 할 대역을 선택하고,
    상기 제 3 벡터 양자화기는, 상기 제 2 양자화 대역 선택부가 선택한 대역의 상기 제 2 벡터 양자화기로부터의 양자화 오차에 대하여, 상기 제 2 벡터 양자화기가 양자화하는 대역폭분의 양자화를 실행하는 것을 특징으로 하는 오디오 신호 부호화 장치.
  16. 제 14 항에 있어서,
    상기 제 1 벡터 양자화기 대신에, 상기 저역의 분할화 벡터 양자화기와, 중역의 분할화 벡터 양자화기와, 고역의 분할화 벡터 양자화기를 이용하여 상기 제 2 벡터 양자화기 또는 제 3 벡터 양자화기를 구성하는 것을 특징으로 하는 오디오 신호 부호화 장치.
  17. 청구항 1에 기재된 오디오 신호 부호화 장치로부터의 출력인 부호를 그 입력으로 하여, 이것을 복호화하여 원 입력 오디오 신호에 상당하는 신호를 출력하는 오디오 신호 복호화 장치에 있어서,
    상기 오디오 신호 부호화 장치의 양자화 수단이 출력한 부호의 적어도 일부를 이용하여 역양자화를 실행하는 역양자화부와,
    상기 역양자화부의 출력인 주파수 특성 신호 계열을 이용하여, 주파수 특성 신호 계열을 원 오디오 입력 신호에 상당하는 신호로 변환하는 역주파수 변환부를 포함한 것을 특징으로 하는 오디오 신호 복호화 장치.
  18. 청구항 2에 기재된 오디오 신호 부호화 장치로부터의 출력인 부호를 그 입력으로 하여, 이것을 복호화하여 원 입력 오디오 신호에 상당하는 신호를 출력하는 오디오 신호 복호화 장치에 있어서,
    주파수 특성 신호 계열을 재생하는 역양자화부와,
    상기 역양자화부의 출력인 주파수 특성 신호 계열을 이용하여, 상기 오디오 신호 부호화 장치의 출력인 부호를 바탕으로 정규화 성분을 재생하고, 상기 주파수 특성 신호 계열과 정규화 성분을 승산하여 출력하는 역정규화부와,
    상기 역정규화부의 출력을 수신하여, 주파수 특성 신호 계열을 원 오디오 신호에 상당하는 신호로 변환하는 역주파수 변환부를 포함한 것을 특징으로 하는 오디오 신호 복호화 장치.
  19. 청구항 13에 기재된 오디오 신호 부호화 장치로부터의 출력인 부호를 그 입력으로 하여, 이것을 복호화하여 원 오디오 신호에 상당하는 신호를 출력하는 오디오 신호 복호화 장치에 있어서,
    상기 오디오 신호 부호화 장치에 있어서의 양자화 수단을 구성하는 벡터 양자화기의 전부 또는 일부가 부호를 출력한 경우에도, 출력된 부호를 이용하여 역양자화를 실행하는 역양자화부를 포함한 것을 특징으로 하는 오디오 신호 복호화 장치.
  20. 제 19 항에 있어서,
    상기 역양자화부는, 임의의 단의 소정 대역의 양자화 부호의 역양자화에 계속해서, 상기 소정 대역의 다음 단의 양자화 부호의 역양자화와, 상기 임의의 단의 상기 소정의 대역과는 서로 다른 대역의 양자화 부호의 역양자화를 교대로 실행하는 것이고,
    상기 소정 대역의 다음 단의 양자화 부호가 존재하지 않는 경우에는, 또 다른 대역의 양자화 부호의 역양자화를 계속하여 실행하며,
    상기 소정 대역과는 서로 다른 대역의 양자화 부호가 존재하지 않는 경우에는, 또한 다음 단의 양자화 부호의 역양자화를, 계속하여 실행하는 것을 특징으로 하는 오디오 신호 복호화 장치.
  21. 청구항 14에 기재된 오디오 신호 부호화 장치로부터의 출력인 부호를 그 입력으로 하여, 이것을 복호화하여 원 오디오 신호에 상당하는 신호를 출력하는 오디오 신호 복호화 장치에 있어서,
    상기 오디오 신호 부호화 장치에 있어서의 제 1 벡터 양자화기를 구성하는 3가지의 분할화 벡터 양자화기로부터 전부 또는 일부가 부호를 출력한 경우에도, 상기 제 1 벡터 양자화기를 구성하는 저역의 분할화 벡터 양자화기로부터의 부호만을 이용하여 역양자화를 실행하는 역양자화부를 포함한 것을 특징으로 하는 오디오 신호 복호화 장치.
  22. 제 21 항에 있어서,
    상기 역양자화부가 상기 제 1 벡터 양자화기를 구성하는 저역의 분할화 벡터 양자화기로부터의 부호에 덧붙여, 상기 제 2 벡터 양자화기로부터의 부호를 이용하여 역양자화를 실행하는 것을 특징으로 하는 오디오 신호 복호화 장치.
  23. 제 22 항에 있어서,
    상기 역양자화부가, 상기 제 1 벡터 양자화부를 구성하는 저역의 분할화 벡터 양자화기로부터의 부호와, 상기 제 2 벡터 양자화기로부터의 부호에 덧붙여, 상기 제 1 벡터 양자화기를 구성하는 중역의 분할화 벡터 양자화기로부터의 부호를 이용하여 역양자화를 실행하는 것을 특징으로 하는 오디오 신호 복호화 장치.
  24. 제 23 항에 있어서,
    상기 역양자화부가, 상기 제 1 벡터 양자화기를 구성하는 저역의 분할화 벡터 양자화기로부터의 부호와, 상기 제 2 벡터 양자화기로부터의 부호와, 상기 제 1 벡터 양자화기를 구성하는 중역의 분할화 벡터 양자화기로부터의 부호에 덧붙여, 상기 제 3 벡터 양자화기로부터의 부호를 이용하여 역양자화를 실행하는 것을 특징으로 하는 오디오 신호 복호화 장치.
  25. 제 24 항에 있어서,
    상기 역양자화부가, 상기 제 1 벡터 양자화기를 구성하는 저역의 분할화 벡터 양자화기로부터의 부호와, 상기 제 2 벡터 양자화기로부터의 부호와, 상기 제 1 벡터 양자화기를 구성하는 중역의 분할화 벡터 양자화기로부터의 부호와, 상기 제 3 벡터 양자화기로부터의 부호에 덧붙여, 상기 제 1 벡터 양자화기를 구성하는 고역의 분할화 벡터 양자화기로부터의 부호를 이용하여 역양자화를 실행하는 것을 특징으로 하는 오디오 신호 복호화 장치.
  26. 입력 오디오 신호를 주파수 변환하여 얻어진 주파수 특성 신호 계열을 수신하여, 이것을 부호화해서 출력하고, 상기 출력된 부호 신호를 입력으로 하여, 이것을 복호화하여 원 입력 오디오 신호에 상당하는 신호를 재생하는 오디오 신호 부호화·복호화 방법에 있어서,
    상기 주파수 특성 신호 계열을, 적어도 2개 이상의 주파수 대역으로 분할한 대역에 상당하는 계수열로 분할하여, 각각 독립적으로 양자화하여 출력하고,
    수신한 양자화 완료의 신호로부터, 상기 분할된 대역에 상당하는 임의의 대역의 데이터를 역양자화함으로써, 원 오디오 입력 신호에 상당하는 신호를 재생하는 것을 특징으로 하는 오디오 신호 부호화·복호화 방법.
  27. 제 26 항에 있어서,
    상기 양자화는, 산출된 양자화 오차를 더욱 양자화하도록 단계적으로 실행되고,
    상기 역양자화는, 대역을 확장하는 방향의 역양자화와, 상기 양자화시의 양자화 단계가 깊게 되는 방향의 역양자화를 반복하여 교대로 실행하는 것을 특징으로 하는 오디오 신호 부호화·복호화 방법.
  28. 제 27 항에 있어서,
    상기 대역을 확장하는 방향의 역양자화는, 인간의 청각 심리 특성을 고려한 순서로 대역을 확장하여 실행하는 것을 특징으로 하는 오디오 신호 부호화·복호화 방법.
  29. 제 26 항 내지 제 28 항 중 어느 한 항에 있어서,
    부호화측에 있어서는, 상기 주파수 특성 신호 계열을 정규화한 후, 상기 주파수 특성 신호 계열을, 적어도 2개 이상의 주파수 대역으로 분할한 대역에 상당하는 계수열로 분할하여, 각각 독립적으로 양자화하여 출력하는 처리를 실행하고,
    복호화측에 있어서는, 상기 부호화측으로부터의 정규화에 관한 부호를 이용하여, 상기 부호화측으로부터의 부호를 역정규화한 후, 상기 역정규화한 부호에 대하여, 상기 분할된 대역에 상당하는 임의의 대역의 데이터를 역양자화함으로써, 원 오디오 입력 신호에 상당하는 신호를 재생하는 것을 특징으로 하는 오디오 신호 부호화·복호화 방법.
  30. 입력 오디오 신호를 주파수 변환하여 얻어진 주파수 특성 신호 계열에 대하여, 정규화 및 벡터 양자화를 실행하여, 오디오 신호의 부호화를 실행하는 오디오 신호 부호화 장치에 있어서,
    상기 주파수 특성 신호 계열 또는 그 일부를 정규화 및 벡터 양자화하는 제 1 단째의 정규화, 벡터 양자화기와,
    상기 제 1 단째의 벡터 양자화기에 의한 양자화 오차 성분을 정규화 및 벡터 양자화하는 제 2 단째의 정규화, 벡터 양자화기를 적어도 갖는 다단 양자화 수단을 포함하고,
    상기 다단 양자화 수단의 각 단의 양자화 수단은, 상기 주파수 특성 신호 계열을, 적어도 2개 이상의, 복수의 단 사이에서 중복하는 부분을 가질 수 있는 주파수 대역에, 각 단마다의 분할 방법에 의해 분할한, 복수의 주파수 대역 중 어느 하나의 대역의 계수열을 정규화 및 벡터 양자화하는 적어도 하나 이상의 분할화된 정규화, 벡터 양자화기를 포함한 것을 특징으로 하는 오디오 신호 부호화 장치.
  31. 제 30 항에 있어서,
    상기 다단 양자화 수단을 구성하는 제 1 단째의 정규화, 벡터 양자화기와, 제 2 단째의 정규화, 벡터 양자화기 사이에, 제 1 양자화 대역 선택부를 포함하고,
    상기 제 2 단째의 정규화, 벡터 양자화기와, 상기 제 3 단째의 정규화, 벡터 양자화기 사이에, 제 2 양자화 대역 선택부를 포함하며,
    상기 제 1 양자화 대역 선택부는, 상기 제 1 단째의 정규화, 벡터 양자화기의 양자화 오차의 출력을 그 입력으로 하여, 상기 제 2 단째의 정규화, 벡터 양자화기가 양자화해야 할 대역을 선택하여, 그 선택한 대역의 양자화 오차 출력을, 상기 제 2 단째의 정규화, 벡터 양자화기에 출력하는 것이며,
    상기 제 2 양자화 대역 선택부는, 상기 제 2 단째의 정규화, 벡터 양자화기의 양자화 오차의 출력을 그 입력으로 하여, 상기 제 3 단째의 정규화, 벡터 양자화기가 양자화해야 할 대역을 선택하며, 그 선택한 대역의 양자화 오차 출력을, 상기 제 3 단째의 정규화, 벡터 양자화기에 출력하는 것을 특징으로 하는 오디오 신호 부호화 장치.
  32. 제 31 항에 있어서,
    상기 다단 양자화 수단의 2 단째 이후의 각 단의 정규화, 벡터 양자화기는, 정규화, 양자화해야 할 상기 주파수 특성 신호 계열의 분할한 주파수 대역 중, 전단의 정규화, 벡터 양자화기의 출력인 양자화 오차의, 에너지 가산합이 큰 대역을, 적절히 선택하여, 정규화, 양자화를 실행하는 것을 특징으로 하는 오디오 신호 부호화 장치.
  33. 제 31 항에 있어서,
    상기 다단 양자화 수단의 2 단째 이후의 각 단의 정규화, 벡터 양자화기는, 정규화, 양자화해야 할 상기 주파수 특성 신호 계열의 분할한 주파수 대역 중, 인간의 청각적인 성질인 청각 감도 특성에 근거하여, 그 중요도가 높은 대역에 큰 값을 가중한, 전단의 정규화, 벡터 양자화기의 출력인 양자화 오차의, 에너지 가산합이 큰 대역을, 적절히 선택하여 정규화, 양자화를 실행하는 것을 특징으로 하는 오디오 신호 부호화 장치.
  34. 청구항 30 내지 청구항 33 중 어느 한 항에 기재된 오디오 신호 부호화 장치로부터의 출력인 부호를 그 입력으로 하여, 이것을 복호화하여 원 입력 오디오 신호에 상당하는 신호를 출력하는 오디오 신호 복호화 장치에 있어서,
    상기 오디오 신호 부호화 장치의 양자화부의 각 양자화기로부터의 신호를 수신하여, 상기 주파수 특성 신호 계열의 복수의 주파수 대역으로 분할한 각 주파수 대역의 계수열에 상당하는 신호를 재생하는 역양자화부와,
    상기 복수의 역양자화부의 각각마다 마련되고, 그 출력인 주파수 특성 신호 계열의 계수열과, 상기 오디오 신호 부호화 장치의 출력인 정규화에 관한 부호를 바탕으로 재생한 정규화 성분을 승산하여, 부호화 전의 주파수 특성 신호 계열의 각 계수열에 상당하는 신호를 출력하는 복수의 역정규화부와,
    상기 복수의 역정규화부의 출력을 수신하여, 이들을 원 오디오 신호에 상당하는 신호로 변환하는 역주파수 변환부를 포함한 것을 특징으로 하는 오디오 신호 복호화 장치.
  35. 입력 오디오 신호를 주파수 변환하여 얻어진 주파수 특성 신호 계열을 수신하여, 이것을 부호화해서 출력하며, 상기 출력된 부호 신호를 입력으로 하여, 이것을 복호화하여 원 입력 오디오 신호에 상당하는 신호를 재생하는 오디오 신호 부호화·복호화 방법에 있어서,
    상기 주파수 특성 신호 계열을, 적어도 2개 이상의 주파수 대역으로 분할한 대역에 상당하는 계수열로 분할하여, 각각 독립적으로 정규화, 양자화하여 출력하고,
    수신한 양자화 완료의 신호로부터, 부호화측으로부터의 정규화에 관한 부호를 이용하여, 상기 분할된 대역에 상당하는 임의의 대역의 데이터를 역정규화, 역양자화함으로써, 원 오디오 입력 신호에 상당하는 신호를 재생하는 것을 특징으로 하는 오디오 신호 부호화·복호화 방법.
  36. 제 35 항에 있어서,
    상기 정규화, 양자화는, 산출된 양자화 오차를 더욱 정규화, 양자화하도록 단계적으로 실행되고,
    상기 역정규화, 역양자화는, 대역을 확장하는 방향의 역정규화, 역양자화와, 상기 양자화시의 양자화 단계가 깊게 되는 방향의 역정규화, 역양자화를 반복하여 교대로 실행하는 것을 특징으로 하는 오디오 신호 부호화·복호화 방법.
  37. 제 36 항에 있어서,
    상기 대역을 확장하는 방향의 역정규화, 역양자화는, 인간의 청각 심리 특성을 고려한 순서로 대역을 확장하여 실행하는 것을 특징으로 하는 오디오 신호 부호화·복호화 방법.
  38. 입력 오디오 신호를 주파수 변환하여 얻어진 주파수 특성 신호 계열에 대하여, 벡터 양자화를 실행하며, 오디오 신호의 부호화를 실행하는 오디오 신호 부호화 장치에 있어서,
    상기 주파수 특성 신호 계열을 벡터 양자화하는 제 1 단째의 벡터 양자화기와,
    상기 제 1 단째의 벡터 양자화기에 의한 양자화 오차 성분을 벡터 양자화하는 제 2 단째의 벡터 양자화기를 적어도 갖는 다단 양자화 수단을 포함하고,
    상기 다단 양자화 수단의 각 단의 양자화 수단은, 상기 주파수 특성 신호 계열 또는 전단의 양자화 수단에 의한 양자화 오차 성분을 전부 벡터 양자화하는 전 대역 벡터 양자화기로 이루어지는 것을 특징으로 하는 오디오 신호 부호화 장치.
  39. 제 2 항에 있어서,
    상기 다단 양자화 수단을 구성하는, 제 1 단째의 벡터 양자화기와, 제 2 단째의 벡터 양자화기 사이에, 제 1 양자화 대역 선택부를 포함하고,
    상기 제 2 단째의 벡터 양자화기와, 상기 제 3 단째의 벡터 양자화기 사이에, 제 2 양자화 대역 선택부를 포함하며,
    상기 제 1 양자화 대역 선택부는, 상기 제 1 단째의 벡터 양자화기의 양자화 오차의 출력을 그 입력으로 하여, 상기 제 2 단째의 벡터 양자화기가 양자화해야 할 대역을 선택하는 것이며,
    상기 제 2 양자화 대역 선택부는, 상기 제 2 단째의 벡터 양자화기의 양자화 오차의 출력을 그 입력으로 하여, 상기 제 3 단째의 벡터 양자화기가 양자화해야 할 대역을 선택하는 것을 특징으로 하는 오디오 신호 부호화 장치.
  40. 제 3 항에 있어서,
    상기 다단 양자화 수단을 구성하는, 제 1 단째의 벡터 양자화기와, 제 2 단째의 벡터 양자화기 사이에, 제 1 양자화 대역 선택부를 포함하고,
    상기 제 2 단째의 벡터 양자화기와, 상기 제 3 단째의 벡터 양자화기 사이에, 제 2 양자화 대역 선택부를 포함하며,
    상기 제 1 양자화 대역 선택부는, 상기 제 1 단째의 벡터 양자화기의 양자화 오차의 출력을 그 입력으로 하여, 상기 제 2 단째의 벡터 양자화기가 양자화해야 할 대역을 선택하는 것이며,
    상기 제 2 양자화 대역 선택부는, 상기 제 2 단째의 벡터 양자화기의 양자화 오차의 출력을 그 입력으로 하여, 상기 제 3 단째의 벡터 양자화기가 양자화해야 할 대역을 선택하는 것을 특징으로 하는 오디오 신호 부호화 장치.
  41. 제 4 항에 있어서,
    상기 다단 양자화 수단을 구성하는, 제 1 단째의 벡터 양자화기와, 제 2 단째의 벡터 양자화기 사이에, 제 1 양자화 대역 선택부를 포함하고,
    상기 제 2 단째의 벡터 양자화기와, 상기 제 3 단째의 벡터 양자화기 사이에, 제 2 양자화 대역 선택부를 포함하며,
    상기 제 1 양자화 대역 선택부는, 상기 제 1 단째의 벡터 양자화기의 양자화 오차의 출력을 그 입력으로 하여, 상기 제 2 단째의 벡터 양자화기가 양자화해야 할 대역을 선택하는 것이며,
    상기 제 2 양자화 대역 선택부는, 상기 제 2 단째의 벡터 양자화기의 양자화 오차의 출력을 그 입력으로 하여, 상기 제 3 단째의 벡터 양자화기가 양자화해야 할 대역을 선택하는 것을 특징으로 하는 오디오 신호 부호화 장치.
  42. 제 39 항에 있어서,
    상기 다단 양자화 수단은,
    상기 주파수 특성 신호 계열의 상기 분할한 각 주파수 대역마다의 각 계수열을, 제 i 단째의 분할화된 벡터 양자화기에 의해서 독립적으로 양자화한, 복수의 제 i 단째의 분할화 벡터 양자화기와,
    양자화해야 할 입력 신호의 각 주파수 대역을, 적어도 한번은 전부 양자화하는 전 대역 양자화부로 되는 제 j 단째의 벡터 양자화기를 포함하는 것을 특징으로 하는 오디오 신호 부호화 장치.
  43. 제 40 항에 있어서,
    상기 다단 양자화 수단은,
    상기 주파수 특성 신호 계열의 상기 분할한 각 주파수 대역마다의 각 계수열을, 제 i 단째의 분할화된 벡터 양자화기에 의해서 독립적으로 양자화한, 복수의 제 i 단째의 분할화 벡터 양자화기와,
    양자화해야 할 입력 신호의 각 주파수 대역을, 적어도 한번은 전부 양자화하는 전 대역 양자화부로 되는 제 j 단째의 벡터 양자화기를 포함하는 것을 특징으로 하는 오디오 신호 부호화 장치.
  44. 제 41 항에 있어서,
    상기 다단 양자화 수단은,
    상기 주파수 특성 신호 계열의 상기 분할한 각 주파수 대역마다의 각 계수열을, 제 i 단째의 분할화된 벡터 양자화기에 의해서 독립적으로 양자화한, 복수의 제 i 단째의 분할화 벡터 양자화기와,
    양자화해야 할 입력 신호의 각 주파수 대역을, 적어도 한번은 전부 양자화하는 전 대역 양자화부로 되는 제 j 단째의 벡터 양자화기를 포함하는 것을 특징으로 하는 오디오 신호 부호화 장치.
KR1019997001099A 1997-05-15 1999-01-15 오디오 신호 부호화 장치 및 복호화 장치와 오디오 신호 부호화 및 복호화 방법 KR100309727B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP12584497 1997-05-15
JP97-125844 1997-05-15
JP06241398A JP3344944B2 (ja) 1997-05-15 1998-03-13 オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
JP98-062413 1998-03-13

Publications (2)

Publication Number Publication Date
KR20000023852A KR20000023852A (ko) 2000-04-25
KR100309727B1 true KR100309727B1 (ko) 2001-09-29

Family

ID=26403462

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019997001099A KR100309727B1 (ko) 1997-05-15 1999-01-15 오디오 신호 부호화 장치 및 복호화 장치와 오디오 신호 부호화 및 복호화 방법

Country Status (5)

Country Link
EP (1) EP0919989A4 (ko)
JP (1) JP3344944B2 (ko)
KR (1) KR100309727B1 (ko)
CN (1) CN1144178C (ko)
WO (1) WO1998052188A1 (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6446037B1 (en) 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
JP4300800B2 (ja) 2000-12-22 2009-07-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びに記録媒体
DE10102159C2 (de) * 2001-01-18 2002-12-12 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen bzw. Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkasse, Codierer und skalierbarer Codierer
DE60204038T2 (de) 2001-11-02 2006-01-19 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zum codieren bzw. decodieren eines audiosignals
WO2004042722A1 (en) * 2002-11-07 2004-05-21 Samsung Electronics Co., Ltd. Mpeg audio encoding method and apparatus
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
CN1839426A (zh) * 2003-09-17 2006-09-27 北京阜国数字技术有限公司 多分辨率矢量量化的音频编解码方法及装置
US8082156B2 (en) * 2005-01-11 2011-12-20 Nec Corporation Audio encoding device, audio encoding method, and audio encoding program for encoding a wide-band audio signal
WO2007114290A1 (ja) * 2006-03-31 2007-10-11 Matsushita Electric Industrial Co., Ltd. ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法
CN101325059B (zh) * 2007-06-15 2011-12-21 华为技术有限公司 语音编解码收发方法及装置
CN101350197B (zh) * 2007-07-16 2011-05-11 华为技术有限公司 立体声音频编/解码方法及编/解码器
KR101850724B1 (ko) * 2010-08-24 2018-04-23 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
KR102653849B1 (ko) * 2014-03-24 2024-04-02 삼성전자주식회사 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03228433A (ja) * 1990-02-02 1991-10-09 Fujitsu Ltd 多段ベクトル量子化方式
JP3114197B2 (ja) * 1990-11-02 2000-12-04 日本電気株式会社 音声パラメータ符号化方法
JP3088163B2 (ja) * 1991-12-18 2000-09-18 沖電気工業株式会社 Lsp係数の量子化方法
JPH0677840A (ja) * 1992-08-28 1994-03-18 Fujitsu Ltd ベクトル量子化装置
JP3239488B2 (ja) * 1992-11-30 2001-12-17 三菱電機株式会社 画像帯域分割符号化装置および画像帯域分割符号化方法
JP3537008B2 (ja) * 1995-07-17 2004-06-14 株式会社日立国際電気 音声符号化通信方式とその送受信装置
JP3159012B2 (ja) * 1995-10-26 2001-04-23 日本ビクター株式会社 音響信号の符号化装置及び復号化装置
JPH09127987A (ja) * 1995-10-26 1997-05-16 Sony Corp 信号符号化方法及び装置
JPH09281995A (ja) * 1996-04-12 1997-10-31 Nec Corp 信号符号化装置及び方法
JP3246715B2 (ja) * 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置

Also Published As

Publication number Publication date
CN1224523A (zh) 1999-07-28
KR20000023852A (ko) 2000-04-25
JPH1130998A (ja) 1999-02-02
CN1144178C (zh) 2004-03-31
EP0919989A4 (en) 2003-02-26
WO1998052188A1 (fr) 1998-11-19
JP3344944B2 (ja) 2002-11-18
EP0919989A1 (en) 1999-06-02

Similar Documents

Publication Publication Date Title
KR100283547B1 (ko) 오디오 신호 부호화 방법 및 복호화 방법, 오디오 신호 부호화장치 및 복호화 장치
US7243061B2 (en) Multistage inverse quantization having a plurality of frequency bands
US6871106B1 (en) Audio signal coding apparatus, audio signal decoding apparatus, and audio signal coding and decoding apparatus
JP4506039B2 (ja) 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
CN102411933B (zh) 解码装置和解码方法
US5371853A (en) Method and system for CELP speech coding and codebook for use therewith
EP1914724B1 (en) Dual-transform coding of audio signals
EP0772186A2 (en) Speech encoding method and apparatus
KR100309727B1 (ko) 오디오 신호 부호화 장치 및 복호화 장치와 오디오 신호 부호화 및 복호화 방법
JP3344962B2 (ja) オーディオ信号符号化装置、及びオーディオ信号復号化装置
JPH07261800A (ja) 変換符号化方法、復号化方法
JP3087814B2 (ja) 音響信号変換符号化装置および復号化装置
KR100952065B1 (ko) 부호화 방법 및 장치, 및 복호 방법 및 장치
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
KR100460354B1 (ko) 정보부호화장치및방법,정보복호화장치및방법
JP3237178B2 (ja) 符号化方法及び復号化方法
JP3698418B2 (ja) オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
JP3453116B2 (ja) 音声符号化方法及び装置
JP4618823B2 (ja) 信号符号化装置及び方法
JP2006119301A (ja) 音声符号化方法、広帯域音声符号化方法、音声符号化装置、広帯域音声符号化装置、音声符号化プログラム、広帯域音声符号化プログラム及びこれらのプログラムを記録した記録媒体
JP4534112B2 (ja) 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム
JPH08137498A (ja) 音声符号化装置
JPH11145846A (ja) 信号圧縮伸張装置及び方法
JP2001298367A (ja) オーディオ信号符号化方法、オーディオ信号復号化方法およびオーディオ信号符号化/復号化装置と前記方法を実施するプログラムを記録した記録媒体
US20010016810A1 (en) Signal reproduction apparatus and method therefor

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120821

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20130819

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20150730

Year of fee payment: 15

FPAY Annual fee payment

Payment date: 20160818

Year of fee payment: 16

FPAY Annual fee payment

Payment date: 20170823

Year of fee payment: 17

EXPY Expiration of term