KR20030076725A - 음성 부호화 장치와 방법, 및 음성 복호화 장치와 방법 - Google Patents

음성 부호화 장치와 방법, 및 음성 복호화 장치와 방법 Download PDF

Info

Publication number
KR20030076725A
KR20030076725A KR10-2003-7011702A KR20037011702A KR20030076725A KR 20030076725 A KR20030076725 A KR 20030076725A KR 20037011702 A KR20037011702 A KR 20037011702A KR 20030076725 A KR20030076725 A KR 20030076725A
Authority
KR
South Korea
Prior art keywords
code
code book
gain
sound source
signal
Prior art date
Application number
KR10-2003-7011702A
Other languages
English (en)
Other versions
KR100561018B1 (ko
Inventor
오자와가즈노리
Original Assignee
닛본 덴끼 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 닛본 덴끼 가부시끼가이샤 filed Critical 닛본 덴끼 가부시끼가이샤
Publication of KR20030076725A publication Critical patent/KR20030076725A/ko
Application granted granted Critical
Publication of KR100561018B1 publication Critical patent/KR100561018B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3082Vector coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

펄스의 위치를 표시하는 위치 코드 북을 복수 세트 위치 코드 북 저장 회로(450)에 복수 세트 보유한다. 적응 코드 북 회로(500)에서 구한 피치 예측 신호에 기초하여, 위치 코드 북 선택 회로(510)에서 복수의 위치 코드 북으로부터위치 코드 북을 1종류 선택한다. 이 선택한 위치 코드 북으로부터 음성 신호의 왜곡을 최소화하도록 하는 위치를 음원 양자화 회로(350)에서 선택한다. 적응 코드 북 회로(500)의 출력과 음원 양자화 회로(350)의 출력을 전송한다.
이것에 의해 부호화 비트 레이트가 낮은 경우에도, 적은 연산량으로 음질의 열화를 억제하면서 음성 신호를 부호화할 수 있다.

Description

음성 부호화 장치와 방법, 및 음성 복호화 장치와 방법{SOUND ENCODING APPARATUS AND METHOD, AND SOUND DECODING APPARATUS AND METHOD}
음성 신호를 고능률로 부호화하는 방식으로서는, 예를 들면, M. Schroeder and B. Atal에 의한 논문 "Code-excited linear prediction: High quality speech at very low bit rates" (Proc. ICASSP, pp.937-940, 1985년)(이하, 문헌 1이라 칭함)이나, Kleijn 등에 의한 논문 "Improved speech quality and efficient vector quantization in SELP" (Proc. ICASSP, pp.155-158, 1988년)(이하, 문헌 2라 칭함) 등에 기재되어 있는 CELP(Code Excited Linear Predictive Coding)가 알려져 있다.
상기 CELP에서는, 송신측에서, 우선 음성 신호의 각 프레임(예를 들면, 20ms)마다 LPC(Linear Predictive Coding) 분석을 이용해 음성 신호의 스펙트럼 특성을 나타내는 스펙트럼 파라미터를 추출한다.
다음에, 각 프레임을 서브프레임(예를 들면, 5ms)으로 더 분할한다. 각 서브프레임마다 과거의 음원 신호에 기초하여 적응 코드 북(code book)에서의 파라미터(피치 주기에 대응하는 지연 파라미터와 이득(gain) 파라미터)를 추출함으로써, 적응 코드 북에 의해 서브프레임의 음성 신호를 피치 예측한다.
다음에, 피치 예측에 의해 구한 음원 신호에 대해서, 미리 결정된 종류의 잡음 신호로 이루어진 음원 코드 북(벡터 양자화 코드 북)으로부터 최적의 음원 코드 벡터를 선택해서 최적의 이득을 계산함으로써 음원 신호를 양자화한다. 또한, 음원 코드 벡터의 선택에 있어서는, 선택한 잡음 신호에 의해 합성한 신호와 잔차(殘差) 신호간의 오차 전력을 최소화하도록 하는 음원 코드 벡터를 선택한다.
그 후, 선택된 음원 코드 벡터의 종류를 나타내는 인덱스와 이득 및 스펙트럼 파라미터와 적응 코드 북의 파라미터를 멀티플렉서에 의해 다중화하여 전송한다.
그런데, 상술한 바와 같은 음성 신호를 부호화하는 종래의 방식에 있어서는,음원 코드 북으로부터 최적인 음원 코드 벡터를 선택하는 경우, 각 코드 벡터 각각에 대해 일단 필터링 또는 컨벌루션(convolution) 연산을 행하지 않으면 안되기 때문에, 이 연산을 코드 북에 저장되어 있는 코드 벡터의 개수만큼 반복해서 행하여야 하므로, 큰 연산양이 필요하게 되는 문제점이 있다. 예를 들면, 음성 코드 북의 비트수가 B비트이고, 차원수가 N인 경우, 필터링 혹은 컨벌루션 연산시의 필터 혹은 임펄스 응답 길이를 K로 하면, 1초당 N×K×2B×8000/N의 연산양이 필요하게 된다. 일례로서, B=10, N=40, K=10으로 하면, 1초당 81,920,O00회라고 하는 매우 방대한 연산이 필요하게 된다.
그래서, 음원 코드 북으로부터 음원 코드 벡터를 탐색할 때에 필요하게 되는 연산양을 저감하는 방법으로서 각종의 것이 제안되고 있다. 그 중 하나로서, 예를 들면, C.Laf1amme 등에 의한 논문 "16 kbps wideband speech coding technique based on algebraic CELP" (Proc. ICASSP, pp.13-16, 1991) (이하, 문헌 3이라 칭함)에 기재되어 있는 ACELP(Argebraic Code Excited Linear Prediction) 방식이 있다.
이 ACELP 방식에 있어서는, 음원 신호가 복수개의 펄스로 나타나고, 각 펄스의 위치가 미리 결정된 비트수로 표시되어 전송된다. 각 펄스의 진폭이 +1.0 또는 -1.0으로 한정되어 있기 때문에, 펄스 탐색의 연산양을 크게 저감할 수 있다.
그렇지만, 상술한 바와 같은 음성 신호를 부호화하는 종래의 방식에 있어서는, 부호화 비트 레이트가 8kb/s 이상인 음성 신호에 대해서는 양호한 음질을 얻을 수 있지만, 부호화 비트 레이트가 8kb/s 미만이 되면, 서브프레임당의 펄스의 개수가 충분하게 되지 않기 때문에, 음원 신호를 충분한 정밀도로 나타내는 것이 곤란해져, 부호화된 음성의 음질이 열화하게 되는 문제점이 있다.
본 발명은 음성 신호를 낮은 비트 레이트로 고품질로 부호화하기 위한 음성 부호화 장치와 방법, 및 이 음성 부호화 장치 및 방법으로 부호화된 음성 신호를 고품질로 복호화하기 위한 음성 복호화 장치 및 방법에 관한 것이다.
도 1은 본 발명의 음성 부호화 장치의 제 1 실시예를 나타내는 블록도이다.
도 2는 본 발명의 음성 부호화 장치의 제 2 실시예를 나타내는 블록도이다.
도 3은 본 발명의 음성 부호화 장치의 제 3 실시예를 나타내는 블록도이다.
도 4는 본 발명의 음성 복호화 장치의 일 실시예를 나타내는 블록도이다.
도 5는 본 발명의 음성 복호화 장치의 다른 실시예를 나타내는 블록도이다.
본 발명은 상술한 바와 같은 종래의 기술이 갖는 문제점에 감안하여 이루어진 것으로서, 부호화 비트 레이트가 낮은 경우에도, 적은 연산량으로 음질의 열화를 억제하면서 음성 신호를 부호화할 수 있는 음성 부호화 장치와 방법, 및 이 음성 부호화 장치 및 방법으로 부호화된 음성 신호를 고품질로 복호화할 수 있는 음성 복호화 장치 및 방법을 제공하는 것을 목적으로 한다.
상기 목적을 달성하기 위해서 본 발명의 음성 부호화 장치는,
음성 신호가 수신되어 스펙트럼 파라미터를 계산하는 스펙트럼 파라미터 계산 수단과, 이 파라미터 계산 수단에 의해 계산된 스펙트럼 파라미터를 양자화하고 이 양자화된 스펙트럼 파라미터를 출력하는 스펙트럼 파라미터 양자화 수단과, 이 스펙트럼 파라미터 양자화 수단으로부터 출력된 스펙트럼 파라미터를 임펄스 응답으로 변환하는 임펄스 응답 계산 수단과, 과거의 양자화된 음원 신호로부터 적응 코드 북(code book)에 기초하여 지연과 이득(gain)을 구하여 음성 신호를 예측해서 잔차 신호를 구하고 상기 지연과 이득을 출력하는 적응 코드 북 수단 ―상기 음성 신호의 음원 신호는 진폭이 비-제로(non-zero)인 펄스의 조합으로 표시됨― , 및 상기 임펄스 응답을 사용하여 상기 음성 신호의 음원 신호와 이득을 양자화하고 이 양자화된 음원 신호와 이득을 출력하는 음원 양자화 수단을 구비한 음성 부호화 장치에 있어서,
상기 펄스의 위치 집합으로서 복수 세트의 위치 코드 북을 저장하는 위치 코드 북 저장 수단; 및
상기 적응 코드 북의 지연과 이득 중 적어도 하나에 기초하여 상기 복수 세트의 위치 코드 북으로부터 1종류의 코드 북을 선택하는 위치 코드 북 선택 수단
을 포함하고
상기 음원 양자화 수단은 상기 임펄스 펄스 응답을 사용하여 상기 음성 신호의 왜곡(distortion)을 계산하고, 상기 왜곡을 작게 하는 위치를 선택함으로써 펄스의 위치를 양자화하고;
상기 스펙트럼 파라미터 양자화 수단의 출력, 상기 적응 코드 북 수단의 출력 및 상기 음원 양자화 수단의 출력을 조합하여 출력하는 멀티플렉서 수단을 포함하는 음성 부호화 장치이다.
또한, 본 발명의 음성 부호화 장치는,
음성 신호가 수신되어 스펙트럼 파라미터를 계산하는 스펙트럼 파라미터 계산 수단과, 이 파라미터 계산 수단에 의해 계산된 스펙트럼 파라미터를 양자화하고 이 양자화된 스펙트럼 파라미터를 출력하는 스펙트럼 파라미터 양자화 수단과, 이 스펙트럼 파라미터 양자화 수단으로부터 출력된 스펙트럼 파라미터를 임펄스 응답으로 변환하는 임펄스 응답 계산 수단과, 과거의 양자화된 음원 신호로부터 적응 코드 북에 기초하여 지연과 이득을 구하여 음성 신호를 예측해서 잔차 신호를 구하고 상기 지연과 이득을 출력하는 적응 코드 북 수단 ―상기 음성 신호의 음원 신호는 진폭이 비-제로인 펄스의 조합으로 표시됨― , 및 상기 임펄스 응답을 사용하여 상기 음성 신호의 음원 신호와 이득을 양자화하고 이 양자화된 음원 신호와 이득을 출력하는 음원 양자화 수단을 구비한 음성 부호화 장치에 있어서,
상기 펄스의 위치 집합으로서 복수 세트의 위치 코드 북을 저장하는 위치 코드 북 저장 수단; 및
상기 적응 코드 북의 지연과 이득 중 적어도 하나에 기초하여 상기 복수 세트의 위치 코드 북으로부터 1종류의 코드 북을 선택하는 위치 코드 북 선택 수단
을 포함하고;
상기 음원 양자화 수단은 상기 위치 코드 북 선택 수단에 의해 선택된 위치코드 북에 저장된 위치의 각각에 대해 이득 코드 북에 저장된 이득 코드 벡터를 판독하고, 이득을 양자화하여 상기 음성 신호의 왜곡을 계산하고, 상기 왜곡을 작게 하는 위치와 이득 코드 벡터의 조합을 1종류 선택해서 출력하고;
상기 스펙트럼 파라미터 양자화 수단의 출력, 상기 적응 코드 북 수단의 출력 및 상기 음원 양자화 수단의 출력을 조합하여 출력하는 멀티플렉서 수단을 포함하는 음성 부호화 장치이다.
또한, 본 발명의 음성 부호화 장치는,
음성 신호가 수신되어 스펙트럼 파라미터를 계산하는 스펙트럼 파라미터 계산 수단과, 이 파라미터 계산 수단에 의해 계산된 스펙트럼 파라미터를 양자화하고 이 양자화된 스펙트럼 파라미터를 출력하는 스펙트럼 파라미터 양자화 수단과, 이 스펙트럼 파라미터 양자화 수단으로부터 출력된 스펙트럼 파라미터를 임펄스 응답으로 변환하는 임펄스 응답 계산 수단과, 과거의 양자화된 음원 신호로부터 적응 코드 북에 기초하여 지연과 이득을 구하여 음성 신호를 예측해서 잔차 신호를 구하고 상기 지연과 이득을 출력하는 적응 코드 북 수단 ―상기 음성 신호의 음원 신호는 진폭이 비-제로인 펄스의 조합으로 표시됨― , 및 상기 임펄스 응답을 사용하여 상기 음성 신호의 음원 신호와 이득을 양자화하고 이 양자화된 음원 신호와 이득을 출력하는 음원 양자화 수단을 구비한 음성 부호화 장치에 있어서,
상기 펄스의 위치 집합으로서 복수 세트의 위치 코드 북을 저장하는 위치 코드 북 저장 수단;
상기 음성 신호로부터 특징(feature)을 추출하고 모드를 판별해서 출력하는판별 수단; 및
상기 판별 수단의 출력이 미리 결정된 모드인 경우에, 상기 적응 코드 북의 지연과 이득 중 적어도 하나에 기초하여 상기 복수 세트의 위치 코드 북으로부터 1종류의 코드 북을 선택하는 위치 코드 북 선택 수단
을 포함하고;
상기 음원 양자화 수단은 상기 판별 수단의 출력이 미리 결정된 모드인 경우에, 상기 선택된 코드 북에 저장된 위치에 대해서 상기 임펄스 응답을 사용하여 상기 음성 신호의 왜곡을 계산하고, 상기 왜곡을 작게 하는 위치를 선택해서 출력함으로써 펄스의 위치를 양자화하고;
상기 스펙트럼 파라미터 양자화 수단의 출력, 상기 적응 코드 북 수단의 출력, 상기 음원 양자화 수단의 출력 및 상기 판별 수단의 출력을 조합하여 출력하는 멀티플렉서 수단을 포함하는 음성 부호화 장치이다.
또한, 본 발명의 음성 복호화 장치는,
스펙트럼 파라미터에 관한 부호, 적응 코드 북에 관한 부호, 음원 신호에 관한 부호 및 이득을 나타내는 부호가 입력되고, 상기 부호들을 디멀티플렉싱하는 디멀티플렉서 수단;
적응 코드 북에 관한 부호를 사용하여 적응 코드 벡터를 발생시키는 적응 코드 벡터 발생 수단;
펄스의 위치 집합으로서 복수 세트의 위치 코드 북을 저장하는 위치 코드 북 저장 수단;
상기 적응 코드 북의 지연과 이득 중 적어도 하나에 기초하여 상기 복수 세트의 위치 코드 북으로부터 1종류의 코드 북을 선택하는 위치 코드 북 선택 수단;
상기 코드 북과 음원 신호에 관한 부호를 사용하여 상기 코드 북 선택 수단에 의해 선택된 위치 코드 북에 대해서 진폭이 비-제로인 펄스를 발생시키고, 이득을 나타내는 부호를 사용하여 상기 펄스와 이득을 곱함으로써 음원 신호를 발생시키는 음원 신호 복원 수단; 및
스펙트럼 파라미터에 의해 구성되어 상기 음원 신호를 수신하고 재생 신호를 출력하는 합성 필터 수단
을 포함하는 음성 복호화 장치이다.
또한, 본 발명의 음성 복호화 장치는,
스펙트럼 파라미터에 관한 부호, 적응 코드 북에 관한 부호, 음원 신호에 관한 부호, 이득을 나타내는 부호 및 모드를 나타내는 부호가 입력되고, 상기 부호들을 디멀티플렉싱하는 디멀티플렉서 수단;
상기 모드를 나타내는 부호가 미리 결정된 모드인 경우에, 적응 코드 북에 관한 부호를 사용하여 적응 코드 벡터를 발생시키는 적응 코드 벡터 발생 수단;
펄스의 위치 집합으로서 복수 세트의 위치 코드 북을 저장하는 위치 코드 북 저장 수단;
상기 모드를 나타내는 부호가 미리 결정된 모드인 경우에, 상기 적응 코드 북의 지연과 이득 중 적어도 하나에 기초하여 상기 복수 세트의 위치 코드 북으로부터 1종류의 코드 북을 선택하는 위치 코드 북 선택 수단;
상기 모드를 나타내는 부호가 미리 결정된 모드인 경우에, 상기 코드 북과 음원 신호에 관한 부호를 사용하여 상기 코드 북 선택 수단에 의해 선택된 위치 코드 북에 대해서 진폭이 비-제로인 펄스를 발생시키고, 이득을 나타내는 부호를 사용하여 상기 펄스와 이득을 곱함으로써 음원 신호를 발생시키는 음원 신호 복원 수단; 및
스펙트럼 파라미터에 의해 구성되어 상기 음원 신호를 수신하고 재생 신호를 출력하는 합성 필터 수단
을 포함하는 음성 복호화 장치이다.
또한, 본 발명의 음성 부호화 방법은,
음성 신호가 수신되어 스펙트럼 파라미터를 계산하는 스펙트럼 파라미터 계산 공정과, 상기 스펙트럼 파라미터를 양자화해서 출력하는 스펙트럼 파라미터 양자화 공정과, 상기 양자화된 스펙트럼 파라미터를 임펄스 응답으로 변환하는 임펄스 응답 계산 공정과, 과거의 양자화된 음원 신호로부터 적응 코드 북에 기초하여 지연과 이득을 구하여 음성 신호를 예측해서 잔차 신호를 구하고 상기 지연과 이득을 출력하는 적응 코드 북 공정 ―상기 음성 신호의 음원 신호는 진폭이 비-제로인 펄스의 조합으로 표시됨― , 및 상기 임펄스 응답을 사용하여 상기 음성 신호의 음원 신호와 이득을 양자화하고 이 양자화된 음원 신호와 이득을 출력하는 음원 양자화 공정을 포함한 음성 부호화 방법에 있어서,
상기 펄스의 위치 집합으로서 복수 세트의 위치 코드 북을 저장하는 위치 코드 북 저장 수단을 준비하는 공정;
상기 적응 코드 북의 지연과 이득 중 적어도 하나에 기초하여 상기 복수 세트의 위치 코드 북으로부터 1종류의 코드 북을 선택하는 위치 코드 북 선택 공정;
상기 음원 양자화 공정에서 상기 임펄스 펄스 응답을 사용하여 상기 음성 신호의 왜곡을 계산하고, 상기 왜곡을 작게 하는 위치를 선택함으로써 펄스의 위치를 양자화하는 공정; 및
상기 스펙트럼 파라미터 양자화 공정의 출력, 상기 적응 코드 북 공정의 출력 및 상기 음원 양자화 공정의 출력을 조합하여 출력하는 멀티플렉싱 공정
을 포함하는 음성 부호화 방법이다.
또한, 본 발명의 음성 부호화 방법은,
음성 신호가 수신되어 스펙트럼 파라미터를 계산하는 스펙트럼 파라미터 계산 공정과, 상기 스펙트럼 파라미터를 양자화해서 출력하는 스펙트럼 파라미터 양자화 공정과, 상기 양자화된 스펙트럼 파라미터를 임펄스 응답으로 변환하는 임펄스 응답 계산 공정과, 과거의 양자화된 음원 신호로부터 적응 코드 북에 기초하여 지연과 이득을 구하여 음성 신호를 예측해서 잔차 신호를 구하고 상기 지연과 이득을 출력하는 적응 코드 북 공정 ―상기 음성 신호의 음원 신호는 진폭이 비-제로인 펄스의 조합으로 표시됨― , 및 상기 임펄스 응답을 사용하여 상기 음성 신호의 음원 신호와 이득을 양자화하고 이 양자화된 음원 신호와 이득을 출력하는 음원 양자화 공정을 포함한 음성 부호화 방법에 있어서,
상기 펄스의 위치 집합으로서 복수 세트의 위치 코드 북을 저장하는 위치 코드 북 저장 수단을 준비하는 공정;
상기 적응 코드 북의 지연과 이득 중 적어도 하나에 기초하여 상기 복수 세트의 위치 코드 북으로부터 1종류의 코드 북을 선택하는 위치 코드 북 선택 공정;
상기 음원 양자화 공정에서 상기 위치 코드 북 선택 공정에 의해 선택된 위치 코드 북에 저장된 위치의 각각에 대해 이득 코드 북에 저장된 이득 코드 벡터를 판독하고, 이득을 양자화하여 상기 음성 신호의 왜곡을 계산하고, 상기 왜곡을 작게 하는 위치와 이득 코드 벡터의 조합을 1종류 선택해서 출력하는 공정; 및
상기 스펙트럼 파라미터 양자화 공정의 출력, 상기 적응 코드 북 공정의 출력 및 상기 음원 양자화 공정의 출력을 조합하여 출력하는 멀티플렉싱 공정을 포함하는 음성 부호화 방법이다.
또한, 본 발명의 음성 부호화 방법은,
음성 신호가 수신되어 스펙트럼 파라미터를 계산하는 스펙트럼 파라미터 계산 공정과, 스펙트럼 파라미터를 양자화해서 출력하는 스펙트럼 파라미터 양자화 공정과, 상기 양자화된 스펙트럼 파라미터를 임펄스 응답으로 변환하는 임펄스 응답 계산 공정과, 과거의 양자화된 음원 신호로부터 적응 코드 북에 기초하여 지연과 이득을 구하여 음성 신호를 예측해서 잔차 신호를 구하고 상기 지연과 이득을 출력하는 적응 코드 북 공정 ―상기 음성 신호의 음원 신호는 진폭이 비-제로인 펄스의 조합으로 표시됨― , 및 상기 임펄스 응답을 사용하여 상기 음성 신호의 음원 신호와 이득을 양자화하고 이 양자화된 음원 신호와 이득을 출력하는 음원 양자화 공정을 포함한 음성 부호화 방법에 있어서,
상기 펄스의 위치 집합으로서 복수 세트의 위치 코드 북을 저장하는 위치 코드 북 저장 수단을 준비하는 공정;
상기 음성 신호로부터 특징을 추출하고 모드를 판별해서 출력하는 판별 공정;
상기 판별 공정의 출력이 미리 결정된 모드인 경우에, 상기 적응 코드 북의 지연과 이득 중 적어도 하나에 기초하여 상기 복수 세트의 위치 코드 북으로부터 1종류의 코드 북을 선택하는 위치 코드 북 선택 공정;
상기 음원 양자화 공정에서 상기 판별 공정의 출력이 미리 결정된 모드인 경우에, 상기 선택된 코드 북에 저장된 위치에 대해서 상기 임펄스 응답을 사용하여 상기 음성 신호의 왜곡을 계산하고, 상기 왜곡을 작게 하는 위치를 선택해서 출력함으로써 펄스의 위치를 양자화하는 공정; 및
상기 스펙트럼 파라미터 양자화 공정의 출력, 상기 적응 코드 북 공정의 출력, 상기 음원 양자화 공정의 출력 및 상기 판별 공정의 출력을 조합하여 출력하는 멀티플렉싱 공정을 포함하는 음성 부호화 방법이다.
또한, 본 발명의 음성 복호화 방법은,
스펙트럼 파라미터에 관한 부호, 적응 코드 북에 관한 부호, 음원 신호에 관한 부호 및 이득을 나타내는 부호가 입력되고, 상기 부호들을 디멀티플렉싱하는 공정;
적응 코드 북에 관한 부호를 사용하여 적응 코드 벡터를 발생시키는 적응 코드 벡터 발생 공정;
펄스의 위치 집합으로서 복수 세트의 위치 코드 북을 저장하는 위치 코드 북저장 수단을 준비하는 공정;
상기 적응 코드 북의 지연과 이득 중 적어도 하나에 기초하여 상기 복수 세트의 위치 코드 북으로부터 1종류의 코드 북을 선택하는 위치 코드 북 선택 공정;
상기 코드 북과 음원 신호에 관한 부호를 사용하여 상기 코드 북 선택 공정에 의해 선택된 위치 코드 북에 대해서 진폭이 비-제로인 펄스를 발생시키고, 이득을 나타내는 부호를 사용하여 상기 펄스와 이득을 곱함으로써 음원 신호를 발생시키는 음원 신호 복원 공정; 및
스펙트럼 파라미터에 의해 구성되어 상기 음원 신호를 수신하고 재생 신호를 출력하는 합성 필터링 공정
을 포함하는 음성 복호화 방법이다.
또한, 본 발명의 음성 복호화 방법은,
스펙트럼 파라미터에 관한 부호, 적응 코드 북에 관한 부호, 음원 신호에 관한 부호, 이득을 나타내는 부호 및 모드를 나타내는 부호가 입력되고, 상기 부호들을 디멀티플렉싱하는 디멀티플렉싱 공정;
상기 모드를 나타내는 부호가 미리 결정된 모드인 경우에, 적응 코드 북에 관한 부호를 사용하여 적응 코드 벡터를 발생시키는 적응 코드 벡터 발생 공정;
펄스의 위치 집합으로서 복수 세트의 위치 코드 북을 저장하는 위치 코드 북 저장 수단을 준비하는 공정;
상기 모드를 나타내는 부호가 미리 결정된 모드인 경우에, 상기 적응 코드 북의 지연과 이득 중 적어도 하나에 기초하여 상기 복수 세트의 위치 코드 북으로부터 1종류의 코드 북을 선택하는 위치 코드 북 선택 공정;
상기 모드를 나타내는 부호가 미리 결정된 모드인 경우에, 상기 코드 북과 음원 신호에 관한 부호를 사용하여 상기 코드 북 선택 공정에 의해 선택된 위치 코드 북에 대해서 진폭이 비-제로인 펄스를 발생시키고, 이득을 나타내는 부호를 사용하여 상기 펄스와 이득을 곱함으로써 음원 신호를 발생시키는 음원 신호 복원 공정; 및
스펙트럼 파라미터에 의해 구성되어 상기 음원 신호를 수신하고 재생 신호를 출력하는 합성 필터링 공정
을 포함하는 음성 복호화 방법이다.
이하, 본 발명의 실시예에 대해서 도면을 참조하여 설명한다.
(제 1 실시예)
도 1은 본 발명의 음성 부호화 장치의 제 1 실시예를 나타내는 블록도이다.
본 실시예는 도 1에 나타낸 바와 같이, 입력 단자(100), 프레임 분할회로(110), 스펙트럼 파라미터 계산 회로(200), 스펙트럼 파라미터 양자화 회로(210), LSP 코드 북(211), 서브프레임 분할 회로(120), 임펄스 응답 계산 회로(310), 청감 가중치 회로(230), 응답 신호 계산 회로(240), 가중치 신호 계산 회로(350), 감산기(235), 적응 코드 북 회로(500), 위치 코드 북 선택 회로(510), 복수 세트 위치 코드 북 저장 회로(450), 음원 양자화 회로(350), 음원 코드 북(351), 이득 양자화 회로(370), 이득 코드 북(380), 멀티플렉서(400)로 구성되어 있다.
상기와 같이 구성된 음성 복호화 장치에서는, 입력 단자(100)로부터 음성 신호를 입력하고, 프레임 분할 회로(110)에서는 음성 신호를 프레임(예를 들면, 20ms)마다 분할하고, 서브프레임 분할 회로(120)에서는 프레임의 음성 신호를 이 프레임보다도 짧은 서브프레임(예를 들면, 5ms)으로 분할한다.
스펙트럼 파라미터 계산 회로(200)에서는, 적어도 한개의 서브프레임의 음성 신호에 대해서 서브프레임 길이보다도 긴 창(예를 들면, 24ms)을 통해서 음성을 추출해서, 스펙트럼 파라미터를 미리 정해진 차수(예를 들면, P=10차)로 계산한다. 여기서, 스펙트럼 파라미터의 계산에는 주지의 LPC 분석이나, 버그(Burg) 분석 등을 사용할 수 있다. 본 실시예에서는, 버그 분석을 사용하는 것으로 한다. 버그 분석의 상세에 대해서는, 예를 들면 Nakamizo에 의한 "신호 해석과 시스템 동정(同定)"이라는 제목의 단행본(코로나사 1988년)의 pp.82~87(이하, 문헌 4로 칭함) 등에 개시되어 있다. 또한, 스펙트럼 파라미터 계산부에서는 버그 법에 의해 계산된 선형 예측 계수 αI(i=1, …, 10)를 양자화나 보간에 적합한 LSP 파라미터로 변환한다. 여기서, 선형 예측 계수로부터 LSP로의 변환은 Sugamura 등에 의한 "선스펙트럼쌍(LSP) 음성 분석 합성 방식에 의한 음성 정보 압축"이라는 제목의 논문(전자 통신 학회 논문잡지, J64-A, pp.599-606, 198l년)(이하, 문헌 5라 칭함)을 참조할 수 있다. 예를 들면, 제 2 및 제 4 서브프레임에서 버그법에 의해 계산된 선형 예측 계수를 LSP 파라미터로 변환한다. 제 1 및 제 3 서브프레임의 LSP를 직선 보간에 의해 계산하고, 역변환해서 선형 예측 계수로 되돌린다. 제 1 ~ 제 4 서브프레임의 선형 예측 계수 αil(i=1, …, 10, 1=1, …, 5)를 청감 가중치 회로(230)에 출력한다. 또한, 제 4 서브프레임의 LSP를 스펙트럼 파라미터 양자화 회로(210)에 출력한다.
스펙트럼 파라미터 양자화 회로(210)에서는 미리 정해진 서브프레임의 LSP 파라미터를 효율적으로 양자화하고, 하기 식의 왜곡을 최소화하는 양자화 값을 출력한다.
여기서, LSP(i), QLSP(i)j, W(i)는 각각 양자화 전의 i번째 LSP, 양자화 후의 j번째의 결과 및 가중치 계수이다.
이하에서는, 양자화법으로서 벡터 양자화를 사용하는 것으로 하고, 제 4 서브프레임의 LSP 파라미터를 양자화하는 것으로 한다. LSP 파라미터의 벡터 양자화 수법으로는 주지의 수법을 사용할 수 있다. 구체적인 방법은, 예를 들면 특개평 4-171500호 공보(이하, 문헌 6이라 칭함), 특개평 4-363000호 공보(이하, 문헌 7로칭함), 특개평 5-6199호 공보(이하, 문헌 8로 칭함)나, T.Nomura 등에 의한 "LSP Coding Using VQ-SVQ With Interpolation in 4.075kbps M-LCELP Speech Coder"라는 제목의 논문(Proc. Mobile Multimedia Communications, pp.B.2.5, 1993년)(이하, 문헌 9라 칭함) 등에 개시되어 있으므로, 여기에서는 설명은 생략한다.
그리고, 스펙트럼 파라미터 양자화 회로(210)에서는 제 4 서브프레임에서 양자화한 LSP 파라미터에 기초하여 제 1 ~ 제 4 서브프레임의 LSP 파라미터를 복원한다. 본 실시예에서는, 현재 프레임의 제 4 서브프레임의 양자화 LSP 파라미터와 직전 프레임의 제 4 서브프레임의 양자화 LSP를 직선 보간함으로써, 제 1 ~ 제 3 서브프레임의 LSP를 복원한다. 보다 구체적으로는, 양자화 전의 LSP와 양자화 후의 LSP간의 오차 전력을 최소화하는 코드 벡터를 1종류 선택한 후에, 직선 보간에 의해 제 1 ~ 제 4서브프레임의 LSP를 복원할 수 있다. 또한, 성능을 보다 향상시키기 위해서는, 상기 오차 전력을 최소화하는 코드 벡터를 복수 후보 선택한 후에, 각각의 후보에 대해서 누적 왜곡을 평가하고, 누적 왜곡을 최소화하는 후보와 보간 LSP의 조(pair)를 선택하도록 할 수 있다. 자세한 것은, 예를 들면, 특개평 6-222797호 공보(이하, 문헌 10이라 칭함)를 참조할 수 있다.
이상과 같이 복원한 제 1 ~ 제 3 서브프레임의 LSP와 제 4 서브프레임의 양자화 LSP를 각 서브프레임마다 선형 예측 계수 α'il(i=1, …, 10, l=1, …, 5)로 변환하여, 임펄스 응답 계산 회로(310)에 출력한다. 또한, 제 4 서브프레임의 양자화 LSP의 코드 벡터를 나타내는 인덱스를 멀티플렉서(400)에 출력한다.
청감 가중치 회로(230)는 스펙트럼 파라미터 계산 회로(200)로부터 각 서브프레임마다 선형 예측 계수 αil(i=1, …, 10, 1=1, …, 5)를 수신하고, 문헌 1에 기초하여 서브프레임의 음성 신호에 대해서 청감 가중치를 행하고, 이 청감 가중치 신호를 출력한다.
응답 신호 계산 회로(240)는 스펙트럼 파라미터 계산 회로(200)로부터 각 서브프레임마다 선형 예측 계수 αil를 수신하고, 스펙트럼 파라미터 양자화 회로(210)로부터 양자화 및 보간을 통해서 복원한 선형 예측 계수 α'i1를 각 서브프레임마다 입력받는다. 보존되어 있는 필터 메모리의 값을 사용하여, 입력 신호를 제로(zero), 즉 d(n)=O로 한 응답 신호를 1서브프레임분 계산하고, 이 응답 신호를 감산기(235)에 출력한다. 여기서, 응답 신호 xz(n)은 하기 식으로 나타난다.
여기서, n-i≤0일 때는, xz(n)=d(n).
y(n-i)=p(N+(n-i))···(3)
xz(n-i)=sw(N+(n-i))···(4)
여기서, N은 서브프레임 길이를 나타낸다. γ는 청감 가중치량을 제어하는 가중치 계수로서, 하기 식(7)과 동일한 값을 갖는다. sw(n)은 가중치 신호 계산 회로의 출력 신호를 나타내고, p(n)은 후술하는 식(7)에서의 우변 제 1 항으로서 필터의 분모 항의 출력 신호를 나타낸다.
감산기(235)는 하기 식에 의해 청감 가중치 신호로부터 응답 신호를 1서브프레임분 감산하고, x'w(n)을 적응 코드 북 회로(500)에 출력한다.
x'w(n)=xw(n)-xz(n)···(5)
임펄스 응답 계산 회로(310)는 z변환이 하기 식으로 나타나는 청감 가중치 필터의 임펄스 응답 Hw(n)을 미리 정해진 수 L만큼 계산하고, 적응 코드 북 회로(500) 및 음원 양자화 회로(350)에 출력한다.
적응 코드 북(500)에서는, 이득 양자화 회로(370)로부터 과거의 음원 신호 v(n)을, 감산기(235)로부터 출력 신호 x'w(n)을 임펄스 응답 계산 회로(310)로부터 청감 가중치 임펄스 응답 hw(n)을 입력받는다. 피치에 대응하는 지연 T를 하기 식에 의해 나타나는 왜곡을 최소화하도록 계산하여, 상기 지연을 나타내는 인덱스를 멀티플렉서(400)에 출력한다.
여기서,
Yw(n-T)=v(n-T)*hw(n)···(8)
식(8)에서, 기호 * 는 컨벌루션 연산을 표시한다.
다음에, 이득 β를 하기 식에 의해 구한다.
여기서, 여성의 소리나 아이의 소리에 대해서, 지연의 추출 정밀도를 향상시키기 위해서, 지연을 정수 샘플이 아니고 소수 샘플값으로 구해도 좋다. 구체적인 방법은, 예를 들면, P. Kroon 등에 의한 "Pitch pre-dictors with high temporal resolution"이라는 제목의 논문(Proc. ICASSP, pp.661-664, 1990년)(이하, 문헌 11이라 칭함) 등을 참조할 수 있다.
또한, 적응 코드 북 회로(500)에서는 식(10)에 따라 피치 예측을 행한다.
복수 세트 위치 코드 북 저장 회로(450)에서는 펄스 위치 코드 북을 복수 세트분 미리 축적해 둔다. 예를 들면, 4세트분의 위치 코드 북을 축적하고 있는 경우는, 각 세트의 위치 코드 북은 표 1 ~ 4에 나타낸 바와 같다.
[표 1]
펄스 번호 위치 집합
제 1 펄스제 2 펄스제 3 펄스제 4 펄스 0, 20, 40, 601, 21, 41, 612, 22, 42, 623, 23, 43, 634, 24, 44, 645, 25, 45, 656, 26, 46, 667, 27, 47, 678, 28, 48, 689, 29, 49, 6910, 30, 50, 7011, 31, 51, 71· · · ·19, 39, 59, 79
[표 2]
펄스 번호 위치 집합
제 1 펄스제 2 펄스제 3 펄스제 4 펄스 0, 20, 40, 601, 21, 41, 612, 22, 42, 623, 23, 43, 63· · · ·17, 37, 57, 7718, 38, 58, 7819, 39, 59, 79
[표 3]
펄스 번호 위치 집합
제 1 펄스제 2 펄스제 3 펄스제 4 펄스 0, 20, 40, 601, 21, 41, 612, 22, 42, 623, 23, 43, 634, 24, 44, 64· · · ·16, 36, 56, 7617, 37, 57, 7718, 38, 58, 7819, 39, 59, 79
[표 4]
펄스 번호 위치 집합
제 1 펄스제 2 펄스제 3 펄스제 4 펄스 0, 20, 40, 601, 21, 41, 61· · · ·15, 35, 55, 7516, 36, 56, 7617, 37, 57, 7718, 38, 58, 7819, 39, 59, 79
위치 코드 북 선택 회로(515)에서는 적응 코드 북 회로(500)로부터 피치 예측 신호를 수신하고, 시간적으로 평활화 처리를 행한다. 위치 코드 북 선택 회로(515)에서는 평활화 처리 후의 신호에 대해서 복수 세트의 위치 코드 북(450)을 입력받는다. 위치 코드 북 선택 회로(515)는 위치 코드 북 각각이 저장하고 있는 펄스 위치 모두에 대해서 상기 평활화 후 신호와의 상호 상관을 계산하고, 상기 상호 상관을 최대화하는 위치 코드 북을 선택하고, 선택된 위치 코드 북을 음원 양자화 회로(350)에 출력한다.
음원 양자화 회로(350)는 M개의 펄스에 의해 서브프레임의 음원 신호를 나타내는 것으로 한다.
또한, 음원 양자화 회로(350)는 펄스의 진폭을 M펄스분 양자화하기 위해 B비트의 진폭 코드 북 또는 극성 코드 북을 가지고 있는 것으로 한다. 이하에서는, 극성 코드 북을 사용하는 경우의 동작에 대해서 설명한다. 이 극성 코드 북은 음원 코드 북(351)에 저장되어 있다.
음원 양자화 회로(350)는 음원 코드 북(351)에 저장된 각 극성 코드 벡터를판독한다. 또한, 음원 양자화 회로(350)는 각 코드 벡터에 대해서 위치 코드 북 선택 회로(515)에서 선택된 위치 코드 북에 저장된 모든 위치를 적용시켜, 하기 식(11)을 최소화하는 코드 벡터와 위치의 조합을 선택한다.
여기서, hw(n)은 청감 가중치 임펄스 응답이다.
식(11)을 최소화 하기 위해서는, 하기 식(12)를 최대화하는 극성 코드 벡터 gik와 위치 mi의 조합을 구하면 좋다.
또는, 식(13)을 최대화하도록 상기 조합을 선택해도 좋다. 이쪽이 분자의 계산에 필요한 연산량이 더 저감화된다.
여기서,
극성 코드 벡터의 탐색 종료 후, 선택된 극성 코드 벡터와 위치 세트의 조합을 이득 양자화 회로(370)에 출력한다.
이득 양자화 회로(370)는 음원 양자화 회로(350)로부터 극성 코드 벡터와 펄스 위치 집합의 조합을 입력한다. 또한, 이득 코드 북(380)으로부터 이득 코드 벡터를 판독하고, 하기 식(15)를 최소화하도록 이득 코드 벡터를 탐색한다.
본 실시예에서는, 적응 코드 북의 이득과 펄스로 나타낸 음원 이득 모두를 동시에 벡터 양자화하는 예에 대해서 나타내었다. 선택된 극성 코드 벡터를 나타내는 인덱스, 위치를 나타내는 부호, 이득 코드 벡터를 나타내는 인덱스를 멀티플렉서(400)에 출력한다.
또한, 음원 코드 북을 음성 신호를 사용하여 미리 학습해 저장해 둘 수도 있다. 코드 북의 학습법은, 예를 들면, Linde 등에 의한 "An algorithm for vector quantization design, "이라는 제목의 논문(IEEE Trans. Commun. pp.84-95, 1980년 1월)(이하, 문헌 l2라 칭함) 등을 참조할 수 있다.
가중치 신호 계산 회로(360)는 상기 인덱스를 수신하고, 각 인덱스에 대응하는 코드 벡터를 판독한다. 하기 식(16)에 기초하여 구동 음원 신호 v(n)을 계산한다.
v(n)은 적응 코드 북 회로(500)에 출력된다.
다음에, 스펙트럼 파라미터 계산 회로(200)의 출력 파라미터, 스펙트럼 파라미터 양자화 회로(210)의 출력 파라미터를 사용하여, 하기 식(17)에 의해 응답 신호 sw(n)을 각 서브프레임마다 계산한다.
이 계산된 응답 신호 sw(n)은 응답 신호 계산 회로(240)에 출력된다.
멀티플렉서(400)는 스펙트럼 파라미터 양자화 회로(200), 적응 코드 북 회로(500), 음원 양자화 회로(350) 및 이득 양자화 회로(370)의 출력을 다중화하고, 이 다중화된 신호를 전송로에 출력한다.
(제 2 실시예)
도 2는 본 발명의 음성 부호화 장치의 제 2 실시예를 나타내는 블록도이다.
또한, 본 실시예에서 도 1에 나타낸 것과 동일한 구성 요소에 대해서는 동일한 부호를 붙이고, 이에 대한 설명은 생략한다.
음원 양자화 회로(357)는 음원 코드 북(351)에 저장된 각 극성 코드 벡터를 판독하고, 각 코드 벡터에 대해서 위치 코드 북 선택 회로(515)에서 1종류 선택된 위치 코드 북에 저장된 모든 위치를 적용시킨다. 음원 양자화 회로(357)는 식(11)을 최소화하는 코드 벡터와 위치 집합의 조합을 복수 세트분 선택하고, 이들 조합을 이득 양자화 회로(377)에 출력한다.
이득 양자화 회로(377)는 음원 양자화 회로(357)로부터 복수 세트의 극성 코드 벡터와 펄스 위치의 조합을 입력받는다. 또한, 이득 양자화 회로(377)는 이득 코드 북(380)으로부터 이득 코드 벡터를 판독하고, 식(15)를 최소화하도록 이득 코드 벡터와 극성 코드 벡터 및 펄스 위치의 조합을 1종류 선택해서 출력한다.
(제 3 실시예)
도 3은 본 발명의 음성 부호화 장치의 제 3 실시예를 나타내는 블록도이다.
또한, 본 실시예에서 도 1에 나타낸 것과 동일한 구성 요소에 대해서는 동일한 부호를 붙이고, 이에 대한 설명은 생략한다.
모드 판별 회로(800)는 프레임 분할 회로의 출력 신호를 사용하여 특징량(feature amount)을 추출하고, 각 프레임의 모드를 판별한다. 여기서, 특징으로서는 피치 예측 이득을 사용할 수 있다. 모드 판별 회로(800)는 각 서브프레임마다 구해진 피치 예측 이득을 프레임 전체로 평균하고, 이 평균값과 미리 정해진 복수의 임계값을 비교하고, 이 값을 미리 정해진 복수의 모드로 분류한다. 본 실시예에서는, 일례로서 모드의 종류를 2개로 한다. 이 경우, 모드 0, 1로 하고, 이들은 각각 무성(無聲) 구간과 유성(有聲) 구간에 각각 대응하는 것으로 한다. 모드 판별 회로(800)는 모드 판별 정보를 음원 양자화 회로(358)와 이득 양자화 회로(378) 및 멀티플렉서(400)에 출력한다.
음원 양자화 회로(358)는 모드 판별 회로(800)로부터 모드 판별 정보를 입력받는다. 모드 1에서는, 위치 코드 북 선택 회로(515)에 의해 선택된 위치 코드 북을 수신하고, 상기 코드 북에 저장된 모든 위치에 대해 극성 코드 북을 판독하고, 식(11)을 최소화하도록 펄스 위치 집합과 극성 코드 북을 선택해서 출력한다. 모드 0에서는, 1종류의 펄스 집합(예를 들면, 표 1 내지 표 4에 나타낸 펄스 세트 중 미리 결정된 하나의 펄스 세트)에 대해 극성 코드 북을 판독하고, 식(11)을 최소화하도록 펄스 위치 세트와 극성 코드 북을 선택해서 출력한다.
이득 양자화 회로(378)는 모드 판별 회로(800)로부터 모드 판별 정보를 입력받는다. 이득 양자화 회로(378)는 이득 코드 북(380)으로부터 이득 코드 벡터를 판독하고, 선택된 극성 코드 벡터와 위치의 조합에 대해서 식(15)를 최소화하도록 이득 코드 벡터를 탐색하고, 왜곡을 최소화하는 이득 코드 벡터, 극성 코드 벡터 및 위치의 조합을 1종류 선택한다.
(제 4 실시예)
도 4는 본 발명의 음성 복호화 장치의 일 실시예를 나타내는 블록도이다.
본 실시예는 도 4에 나타낸 바와 같이, 디멀티플렉서(505), 이득 복호화 회로(510), 이득 코드 북(380), 적응 코드 북(520), 음원 신호 복원 회로(540), 음원 코드 북(351), 위치 코드 북 선택 회로(595), 복수 세트 위치 코드 북 저장 회로(580), 가산기(550), 합성 필터(560), 스펙트럼 파라미터 복호화 회로(570)로 구성되어 있다.
디멀티플렉서(500)는 수신한 신호로부터 이득 코드 벡터를 나타내는 인덱스, 적응 코드 북의 지연을 나타내는 인덱스, 음원 신호의 정보, 음원 코드 벡터의 인덱스, 스펙트럼 파라미터의 인덱스를 입력받는다. 디멀티플렉서(500)는 상기 파라미터를 디멀티플렉스하여 출력한다.
이득 복호화 회로(510)는 이득 코드 벡터의 인덱스를 수신하고, 이득 코드 북(380)으로부터 인덱스에 따라 이득 코드 벡터를 판독하고, 이 판독된 이득 코드 벡터를 출력한다.
적응 코드 북 회로(520)는 적응 코드 북의 지연을 입력받아 적응 코드 벡터를 발생하고, 이득 코드 벡터에 의해 적응 코드 북의 이득을 곱해서, 그 결과를 출력한다.
위치 코드 북 선택 회로(595)는 적응 코드 북 회로(520)로부터 피치 예측 신호를 수신하고, 이 신호를 시간적으로 평활화 처리한다. 위치 코드 북 선택 회로(595)는 이 평활화 처리 후의 신호에 대해서 복수 세트의 위치 코드 북(580)을 입력받는다. 위치 코드 북 선택 회로(595)는 각 위치 코드 북 각각이 저장하고 있는 펄스 위치의 모든 것에 대해서 평활화 후의 신호와의 상호 상관을 계산하고, 상기 상호 상관을 최대화하는 위치 코드 북을 선택하고, 선택된 위치 코드 북을 음원 복원 회로(540)에 출력한다.
음원 신호 복원 회로(540)에서는 위치 코드 북 선택 회로(595)로부터 선택된 위치 코드 북을 판독한다.
또한, 음원 신호 복원 회로(540)는 음원 코드 북(351)으로부터 판독한 극성 코드 벡터와 이득 코드 벡터를 사용하여, 음원 펄스를 발생해서 가산기(550)에 출력한다.
가산기(550)는 적응 코드 북 회로(520)의 출력과 음원 신호 복원 회로(540)의 출력을 사용하여, 식(17)에 기초해서 구동 음원 신호 v(n)을 발생하고, 그 신호를 적응 코드 북 회로(520)와 합성 필터 회로(560)에 출력한다.
스펙트럼 파라미터 복호화 회로(570)는 스펙트럼 파라미터를 복호하고, 선형 예측 계수로 변환하고, 이 선형 예측 계수를 합성 필터 회로(560)에 출력한다.
합성 필터 회로(560)는 구동 음원 신호 v(n)과 선형 예측 계수를 수신하고, 재생 신호를 계산해서 출력한다.
(제 5 실시예)
도 5는 본 발명의 음성 복호화 장치의 다른 실시예를 나타내는 블록도이다.
또한, 본 실시예에서 도 4에 나타낸 것과 동일한 구성 요소에 대해서는 동일한 부호를 붙이고, 이에 대한 설명은 생략한다.
음원 신호 복원 회로(590)는 모드 판별 정보를 입력받는다. 이 모드 판별 정보가 모드 1일 때에, 음원 신호 복원 회로(590)는 위치 코드 북 선택 회로(595)로부터 선택된 위치 코드 북을 판독한다. 또한, 음원 신호 복원 회로(590)는 음원 코드 북(351)으로부터 판독된 극성 코드 벡터와 이득 코드 벡터를 사용하여, 음원 펄스를 발생하고, 이 발생된 음원 펄스를 가산기(550)에 출력한다. 모드 판별 정보가 모드 0인 경우에는, 미리 정해진 펄스의 위치 집합과 이득 코드 벡터를 사용하여 음원 펄스를 발생하고, 이 발생된 음원 펄스를 가산기(550)에 출력한다.
상술한 실시예에서는, 펄스의 위치를 나타내기 위한 위치 코드 북을 복수 세트 사용한다. 적응 코드 북에 의해 구한 피치 예측 신호에 기초하여 복수의 위치 코드 북으로부터 위치 코드 북을 1종류 선택한다. 이렇게 선택된 위치 코드 북에 기초하여 음성 신호의 왜곡을 최소로 하는 위치를 탐색한다. 따라서, 종래 방식에 비해서 펄스 위치 정보의 자유도가 높다. 이것은 특히 비트 레이트가 낮은 경우에 종래 방식에 비해서 음질을 개선한 음성 부호화 방식을 제공할 수 있다.
또한, 적응 코드 북에 의해 구한 피치 예측 신호에 기초하여 복수의 위치 코드 북으로부터 위치 코드 북을 1종류 선택하고, 상기 위치 코드 북에 저장된 위치 각각에 대해 이득 코드 북에 저장된 이득 코드 벡터를 탐색한다. 최종적인 재생 신호의 상태로 음성 신호의 왜곡을 계산하고, 이 왜곡을 작게 하는 위치와 이득 코드 벡터와의 조합을 선택한다. 따라서, 이득 코드 벡터를 포함한 최종적인 재생 음성 신호상에서의 왜곡을 작게 할 수 있다. 그러므로, 더 음질을 개선한 음성 부호화 방식을 제공할 수 있다.
또한, 수신한 판별 부호가 미리 정해진 모드를 표시하는 경우, 적응 코드 북에 의해 구한 피치 예측 신호에 기초하여 복수의 위치 코드 북으로부터 위치 코드 북을 1종류 선택한다. 상기 위치 코드 북에 저장된 위치를 나타내는 부호를 사용하여 펄스를 발생시키고, 이득을 곱함으로써, 합성 필터를 통하여 음성 신호를 재생할 수 있다. 따라서, 비트 레이트가 낮은 경우에 종래 방식과 비교해 음질을 개선한 음성 복호화 방식을 제공할 수 있다.
이상에 의해, 적은 연산량으로 음질의 열화를 억제하면서 음성 신호를 부호화할 수 있는 음성 부호화 장치와 방법, 및 이 음성 부호화 장치와 방법으로 부호화된 음성 신호를 고품질로 복호화할 수 있는 음성 복호화 장치 및 방법을 제공할 수 있다.

Claims (10)

  1. 음성 신호가 수신되어 스펙트럼 파라미터를 계산하는 스펙트럼 파라미터 계산 수단과, 이 파라미터 계산 수단에 의해 계산된 스펙트럼 파라미터를 양자화하고 이 양자화된 스펙트럼 파라미터를 출력하는 스펙트럼 파라미터 양자화 수단과, 이 스펙트럼 파라미터 양자화 수단으로부터 출력된 스펙트럼 파라미터를 임펄스 응답으로 변환하는 임펄스 응답 계산 수단과, 과거의 양자화된 음원 신호로부터 적응 코드 북(code book)에 기초하여 지연과 이득(gain)을 구하여 음성 신호를 예측해서 잔차 신호(residual signal)를 구하고 상기 지연과 이득을 출력하는 적응 코드 북 수단 ―상기 음성 신호의 음원 신호는 진폭이 비-제로(non-zero)인 펄스의 조합으로 표시됨― , 및 상기 임펄스 응답을 사용하여 상기 음성 신호의 음원 신호와 이득을 양자화하고 이 양자화된 음원 신호와 이득을 출력하는 음원 양자화 수단을 구비한 음성 부호화 장치에 있어서,
    상기 펄스의 위치 집합으로서 복수 세트의 위치 코드 북을 저장하는 위치 코드 북 저장 수단; 및
    상기 적응 코드 북의 지연과 이득 중 적어도 하나에 기초하여 상기 복수 세트의 위치 코드 북으로부터 1종류의 코드 북을 선택하는 위치 코드 북 선택 수단
    을 포함하고
    상기 음원 양자화 수단은 상기 임펄스 펄스 응답을 사용하여 상기 음성 신호의 왜곡(distortion)을 계산하고, 상기 왜곡을 작게 하는 위치를 선택함으로써 펄스의 위치를 양자화하고;
    상기 스펙트럼 파라미터 양자화 수단의 출력, 상기 적응 코드 북 수단의 출력 및 상기 음원 양자화 수단의 출력을 조합하여 출력하는 멀티플렉서 수단을 포함하는 것을 특징으로 하는 음성 부호화 장치.
  2. 음성 신호가 수신되어 스펙트럼 파라미터를 계산하는 스펙트럼 파라미터 계산 수단과, 이 파라미터 계산 수단에 의해 계산된 스펙트럼 파라미터를 양자화하고 이 양자화된 스펙트럼 파라미터를 출력하는 스펙트럼 파라미터 양자화 수단과, 이 스펙트럼 파라미터 양자화 수단으로부터 출력된 스펙트럼 파라미터를 임펄스 응답으로 변환하는 임펄스 응답 계산 수단과, 과거의 양자화된 음원 신호로부터 적응 코드 북에 기초하여 지연과 이득을 구하여 음성 신호를 예측해서 잔차 신호를 구하고 상기 지연과 이득을 출력하는 적응 코드 북 수단 ―상기 음성 신호의 음원 신호는 진폭이 비-제로인 펄스의 조합으로 표시됨― , 및 상기 임펄스 응답을 사용하여 상기 음성 신호의 음원 신호와 이득을 양자화하고 이 양자화된 음원 신호와 이득을 출력하는 음원 양자화 수단을 구비한 음성 부호화 장치에 있어서,
    상기 펄스의 위치 집합으로서 복수 세트의 위치 코드 북을 저장하는 위치 코드 북 저장 수단; 및
    상기 적응 코드 북의 지연과 이득 중 적어도 하나에 기초하여 상기 복수 세트의 위치 코드 북으로부터 1종류의 코드 북을 선택하는 위치 코드 북 선택 수단
    을 포함하고;
    상기 음원 양자화 수단은 상기 위치 코드 북 선택 수단에 의해 선택된 위치 코드 북에 저장된 위치의 각각에 대해 이득 코드 북에 저장된 이득 코드 벡터를 판독하고, 이득을 양자화하여 상기 음성 신호의 왜곡을 계산하고, 상기 왜곡을 작게 하는 위치와 이득 코드 벡터의 조합을 1종류 선택해서 출력하고;
    상기 스펙트럼 파라미터 양자화 수단의 출력, 상기 적응 코드 북 수단의 출력 및 상기 음원 양자화 수단의 출력을 조합하여 출력하는 멀티플렉서 수단을 포함하는 것을 특징으로 하는 음성 부호화 장치.
  3. 음성 신호가 수신되어 스펙트럼 파라미터를 계산하는 스펙트럼 파라미터 계산 수단과, 이 파라미터 계산 수단에 의해 계산된 스펙트럼 파라미터를 양자화하고 이 양자화된 스펙트럼 파라미터를 출력하는 스펙트럼 파라미터 양자화 수단과, 이 스펙트럼 파라미터 양자화 수단으로부터 출력된 스펙트럼 파라미터를 임펄스 응답으로 변환하는 임펄스 응답 계산 수단과, 과거의 양자화된 음원 신호로부터 적응 코드 북에 기초하여 지연과 이득을 구하여 음성 신호를 예측해서 잔차 신호를 구하고 상기 지연과 이득을 출력하는 적응 코드 북 수단 ―상기 음성 신호의 음원 신호는 진폭이 비-제로인 펄스의 조합으로 표시됨― , 및 상기 임펄스 응답을 사용하여 상기 음성 신호의 음원 신호와 이득을 양자화하고 이 양자화된 음원 신호와 이득을 출력하는 음원 양자화 수단을 구비한 음성 부호화 장치에 있어서,
    상기 펄스의 위치 집합으로서 복수 세트의 위치 코드 북을 저장하는 위치 코드 북 저장 수단;
    상기 음성 신호로부터 특징(feature)을 추출하고 모드를 판별해서 출력하는 판별 수단; 및
    상기 판별 수단의 출력이 미리 결정된 모드인 경우에, 상기 적응 코드 북의 지연과 이득 중 적어도 하나에 기초하여 상기 복수 세트의 위치 코드 북으로부터 1종류의 코드 북을 선택하는 위치 코드 북 선택 수단
    을 포함하고;
    상기 음원 양자화 수단은 상기 판별 수단의 출력이 미리 결정된 모드인 경우에, 상기 선택된 코드 북에 저장된 위치에 대해서 상기 임펄스 응답을 사용하여 상기 음성 신호의 왜곡을 계산하고, 상기 왜곡을 작게 하는 위치를 선택해서 출력함으로써 펄스의 위치를 양자화하고;
    상기 스펙트럼 파라미터 양자화 수단의 출력, 상기 적응 코드 북 수단의 출력, 상기 음원 양자화 수단의 출력 및 상기 판별 수단의 출력을 조합하여 출력하는 멀티플렉서 수단을 포함하는 것을 특징으로 하는 음성 부호화 장치.
  4. 스펙트럼 파라미터에 관한 부호, 적응 코드 북에 관한 부호, 음원 신호에 관한 부호 및 이득을 나타내는 부호가 입력되고, 상기 부호들을 디멀티플렉싱하는 디멀티플렉서(demultiplexer) 수단;
    적응 코드 북에 관한 부호를 사용하여 적응 코드 벡터를 발생시키는 적응 코드 벡터 발생 수단;
    펄스의 위치 집합으로서 복수 세트의 위치 코드 북을 저장하는 위치 코드 북저장 수단;
    상기 적응 코드 북의 지연과 이득 중 적어도 하나에 기초하여 상기 복수 세트의 위치 코드 북으로부터 1종류의 코드 북을 선택하는 위치 코드 북 선택 수단;
    상기 코드 북과 음원 신호에 관한 부호를 사용하여 상기 코드 북 선택 수단에 의해 선택된 위치 코드 북에 대해서 진폭이 비-제로인 펄스를 발생시키고, 이득을 나타내는 부호를 사용하여 상기 펄스와 이득을 곱함으로써 음원 신호를 발생시키는 음원 신호 복원 수단; 및
    스펙트럼 파라미터에 의해 구성되어 상기 음원 신호를 수신하고 재생 신호를 출력하는 합성 필터 수단
    을 포함하는 것을 특징으로 하는 음성 복호화 장치.
  5. 스펙트럼 파라미터에 관한 부호, 적응 코드 북에 관한 부호, 음원 신호에 관한 부호, 이득을 나타내는 부호 및 모드를 나타내는 부호가 입력되고, 상기 부호들을 디멀티플렉싱하는 디멀티플렉서 수단;
    상기 모드를 나타내는 부호가 미리 결정된 모드인 경우에, 적응 코드 북에 관한 부호를 사용하여 적응 코드 벡터를 발생시키는 적응 코드 벡터 발생 수단;
    펄스의 위치 집합으로서 복수 세트의 위치 코드 북을 저장하는 위치 코드 북 저장 수단;
    상기 모드를 나타내는 부호가 미리 결정된 모드인 경우에, 상기 적응 코드 북의 지연과 이득 중 적어도 하나에 기초하여 상기 복수 세트의 위치 코드 북으로부터 1종류의 코드 북을 선택하는 위치 코드 북 선택 수단;
    상기 모드를 나타내는 부호가 미리 결정된 모드인 경우에, 상기 코드 북과 음원 신호에 관한 부호를 사용하여 상기 코드 북 선택 수단에 의해 선택된 위치 코드 북에 대해서 진폭이 비-제로인 펄스를 발생시키고, 이득을 나타내는 부호를 사용하여 상기 펄스와 이득을 곱함으로써 음원 신호를 발생시키는 음원 신호 복원 수단; 및
    스펙트럼 파라미터에 의해 구성되어 상기 음원 신호를 수신하고 재생 신호를 출력하는 합성 필터 수단
    을 포함하는 것을 특징으로 하는 음성 복호화 장치.
  6. 음성 신호가 수신되어 스펙트럼 파라미터를 계산하는 스펙트럼 파라미터 계산 공정과, 상기 스펙트럼 파라미터를 양자화해서 출력하는 스펙트럼 파라미터 양자화 공정과, 상기 양자화된 스펙트럼 파라미터를 임펄스 응답으로 변환하는 임펄스 응답 계산 공정과, 과거의 양자화된 음원 신호로부터 적응 코드 북에 기초하여 지연과 이득을 구하여 음성 신호를 예측해서 잔차 신호를 구하고 상기 지연과 이득을 출력하는 적응 코드 북 공정 ―상기 음성 신호의 음원 신호는 진폭이 비-제로인 펄스의 조합으로 표시됨― , 및 상기 임펄스 응답을 사용하여 상기 음성 신호의 음원 신호와 이득을 양자화하고 이 양자화된 음원 신호와 이득을 출력하는 음원 양자화 공정을 포함한 음성 부호화 방법에 있어서,
    상기 펄스의 위치 집합으로서 복수 세트의 위치 코드 북을 저장하는 위치 코드 북 저장 수단을 준비하는 공정;
    상기 적응 코드 북의 지연과 이득 중 적어도 하나에 기초하여 상기 복수 세트의 위치 코드 북으로부터 1종류의 코드 북을 선택하는 위치 코드 북 선택 공정;
    상기 음원 양자화 공정에서 상기 임펄스 펄스 응답을 사용하여 상기 음성 신호의 왜곡을 계산하고, 상기 왜곡을 작게 하는 위치를 선택함으로써 펄스의 위치를 양자화하는 공정; 및
    상기 스펙트럼 파라미터 양자화 공정의 출력, 상기 적응 코드 북 공정의 출력 및 상기 음원 양자화 공정의 출력을 조합하여 출력하는 멀티플렉싱 공정
    을 포함하는 것을 특징으로 하는 음성 부호화 방법.
  7. 음성 신호가 수신되어 스펙트럼 파라미터를 계산하는 스펙트럼 파라미터 계산 공정과, 상기 스펙트럼 파라미터를 양자화해서 출력하는 스펙트럼 파라미터 양자화 공정과, 상기 양자화된 스펙트럼 파라미터를 임펄스 응답으로 변환하는 임펄스 응답 계산 공정과, 과거의 양자화된 음원 신호로부터 적응 코드 북에 기초하여 지연과 이득을 구하여 음성 신호를 예측해서 잔차 신호를 구하고 상기 지연과 이득을 출력하는 적응 코드 북 공정 ―상기 음성 신호의 음원 신호는 진폭이 비-제로인 펄스의 조합으로 표시됨― , 및 상기 임펄스 응답을 사용하여 상기 음성 신호의 음원 신호와 이득을 양자화하고 이 양자화된 음원 신호와 이득을 출력하는 음원 양자화 공정을 포함한 음성 부호화 방법에 있어서,
    상기 펄스의 위치 집합으로서 복수 세트의 위치 코드 북을 저장하는 위치 코드 북 저장 수단을 준비하는 공정;
    상기 적응 코드 북의 지연과 이득 중 적어도 하나에 기초하여 상기 복수 세트의 위치 코드 북으로부터 1종류의 코드 북을 선택하는 위치 코드 북 선택 공정;
    상기 음원 양자화 공정에서 상기 위치 코드 북 선택 공정에 의해 선택된 위치 코드 북에 저장된 위치의 각각에 대해 이득 코드 북에 저장된 이득 코드 벡터를 판독하고, 이득을 양자화하여 상기 음성 신호의 왜곡을 계산하고, 상기 왜곡을 작게 하는 위치와 이득 코드 벡터의 조합을 1종류 선택해서 출력하는 공정; 및
    상기 스펙트럼 파라미터 양자화 공정의 출력, 상기 적응 코드 북 공정의 출력 및 상기 음원 양자화 공정의 출력을 조합하여 출력하는 멀티플렉싱 공정을 포함하는 것을 특징으로 하는 음성 부호화 방법.
  8. 음성 신호가 수신되어 스펙트럼 파라미터를 계산하는 스펙트럼 파라미터 계산 공정과, 상기 스펙트럼 파라미터를 양자화해서 출력하는 스펙트럼 파라미터 양자화 공정과, 상기 양자화된 스펙트럼 파라미터를 임펄스 응답으로 변환하는 임펄스 응답 계산 공정과, 과거의 양자화된 음원 신호로부터 적응 코드 북에 기초하여 지연과 이득을 구하여 음성 신호를 예측해서 잔차 신호를 구하고 상기 지연과 이득을 출력하는 적응 코드 북 공정 ―상기 음성 신호의 음원 신호는 진폭이 비-제로인 펄스의 조합으로 표시됨― , 및 상기 임펄스 응답을 사용하여 상기 음성 신호의 음원 신호와 이득을 양자화하고 이 양자화된 음원 신호와 이득을 출력하는 음원 양자화 공정을 포함한 음성 부호화 방법에 있어서,
    상기 펄스의 위치 집합으로서 복수 세트의 위치 코드 북을 저장하는 위치 코드 북 저장 수단을 준비하는 공정;
    상기 음성 신호로부터 특징을 추출하고 모드를 판별해서 출력하는 판별 공정;
    상기 판별 공정의 출력이 미리 결정된 모드인 경우에, 상기 적응 코드 북의 지연과 이득 중 적어도 하나에 기초하여 상기 복수 세트의 위치 코드 북으로부터 1종류의 코드 북을 선택하는 위치 코드 북 선택 공정;
    상기 음원 양자화 공정에서 상기 판별 공정의 출력이 미리 결정된 모드인 경우에, 상기 선택된 코드 북에 저장된 위치에 대해서 상기 임펄스 응답을 사용하여 상기 음성 신호의 왜곡을 계산하고, 상기 왜곡을 작게 하는 위치를 선택해서 출력함으로써 펄스의 위치를 양자화하는 공정; 및
    상기 스펙트럼 파라미터 양자화 공정의 출력, 상기 적응 코드 북 공정의 출력, 상기 음원 양자화 공정의 출력 및 상기 판별 공정의 출력을 조합하여 출력하는 멀티플렉싱 공정을 포함하는 것을 특징으로 하는 음성 부호화 방법.
  9. 스펙트럼 파라미터에 관한 부호, 적응 코드 북에 관한 부호, 음원 신호에 관한 부호 및 이득을 나타내는 부호가 입력되고, 상기 부호들을 디멀티플렉싱하는 디멀티플렉싱 공정;
    적응 코드 북에 관한 부호를 사용하여 적응 코드 벡터를 발생시키는 적응 코드 벡터 발생 공정;
    펄스의 위치 집합으로서 복수 세트의 위치 코드 북을 저장하는 위치 코드 북 저장 수단을 준비하는 공정;
    상기 적응 코드 북의 지연과 이득 중 적어도 하나에 기초하여 상기 복수 세트의 위치 코드 북으로부터 1종류의 코드 북을 선택하는 위치 코드 북 선택 공정;
    상기 코드 북과 음원 신호에 관한 부호를 사용하여 상기 코드 북 선택 공정에 의해 선택된 위치 코드 북에 대해서 진폭이 비-제로인 펄스를 발생시키고, 이득을 나타내는 부호를 사용하여 상기 펄스와 이득을 곱함으로써 음원 신호를 발생시키는 음원 신호 복원 공정; 및
    스펙트럼 파라미터에 의해 구성되어 상기 음원 신호를 수신하고 재생 신호를 출력하는 합성 필터링 공정
    을 포함하는 것을 특징으로 하는 음성 복호화 방법.
  10. 스펙트럼 파라미터에 관한 부호, 적응 코드 북에 관한 부호, 음원 신호에 관한 부호, 이득을 나타내는 부호 및 모드를 나타내는 부호가 입력되고, 상기 부호들을 디멀티플렉싱하는 디멀티플렉싱 공정;
    상기 모드를 나타내는 부호가 미리 결정된 모드인 경우에, 적응 코드 북에 관한 부호를 사용하여 적응 코드 벡터를 발생시키는 적응 코드 벡터 발생 공정;
    펄스의 위치 집합으로서 복수 세트의 위치 코드 북을 저장하는 위치 코드 북 저장 수단을 준비하는 공정;
    상기 모드를 나타내는 부호가 미리 결정된 모드인 경우에, 상기 적응 코드북의 지연과 이득 중 적어도 하나에 기초하여 상기 복수 세트의 위치 코드 북으로부터 1종류의 코드 북을 선택하는 위치 코드 북 선택 공정;
    상기 모드를 나타내는 부호가 미리 결정된 모드인 경우에, 상기 코드 북과 음원 신호에 관한 부호를 사용하여 상기 코드 북 선택 공정에 의해 선택된 위치 코드 북에 대해서 진폭이 비-제로인 펄스를 발생시키고, 이득을 나타내는 부호를 사용하여 상기 펄스와 이득을 곱함으로써 음원 신호를 발생시키는 음원 신호 복원 공정; 및
    스펙트럼 파라미터에 의해 구성되어 상기 음원 신호를 수신하고 재생 신호를 출력하는 합성 필터링 공정
    을 포함하는 것을 특징으로 하는 음성 복호화 방법.
KR1020037011702A 2001-03-07 2002-03-07 음성 부호화 장치와 방법, 및 음성 복호화 장치와 방법 KR100561018B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001063687A JP3582589B2 (ja) 2001-03-07 2001-03-07 音声符号化装置及び音声復号化装置
JPJP-P-2001-00063687 2001-03-07
PCT/JP2002/002119 WO2002071394A1 (en) 2001-03-07 2002-03-07 Sound encoding apparatus and method, and sound decoding apparatus and method

Publications (2)

Publication Number Publication Date
KR20030076725A true KR20030076725A (ko) 2003-09-26
KR100561018B1 KR100561018B1 (ko) 2006-03-16

Family

ID=18922634

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020037011702A KR100561018B1 (ko) 2001-03-07 2002-03-07 음성 부호화 장치와 방법, 및 음성 복호화 장치와 방법

Country Status (8)

Country Link
US (1) US7680669B2 (ko)
EP (1) EP1367565A4 (ko)
JP (1) JP3582589B2 (ko)
KR (1) KR100561018B1 (ko)
CN (1) CN1293535C (ko)
CA (1) CA2440820A1 (ko)
HK (1) HK1067443A1 (ko)
WO (1) WO2002071394A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100755471B1 (ko) * 2005-07-19 2007-09-05 한국전자통신연구원 가상음원위치정보에 기반한 채널간 크기 차이 양자화 및역양자화 방법

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1831940B (zh) * 2006-04-07 2010-06-23 安凯(广州)微电子技术有限公司 基于音频解码器的音调和节奏调节方法
CN101140759B (zh) * 2006-09-08 2010-05-12 华为技术有限公司 语音或音频信号的带宽扩展方法及系统
EP2128858B1 (en) * 2007-03-02 2013-04-10 Panasonic Corporation Encoding device and encoding method
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器
US9020812B2 (en) * 2009-11-24 2015-04-28 Lg Electronics Inc. Audio signal processing method and device
EP2571170B1 (en) * 2010-07-05 2016-06-01 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoding device, decoding device, program, and recording medium
WO2012053150A1 (ja) * 2010-10-18 2012-04-26 パナソニック株式会社 音声符号化装置および音声復号化装置
JP6013646B2 (ja) * 2013-04-05 2016-10-25 ドルビー・インターナショナル・アーベー オーディオ処理システム
CN104751849B (zh) 2013-12-31 2017-04-19 华为技术有限公司 语音频码流的解码方法及装置
CN107369454B (zh) 2014-03-21 2020-10-27 华为技术有限公司 语音频码流的解码方法及装置
CN107431564B (zh) * 2016-03-04 2020-10-16 日本电信电话株式会社 通信系统、中继装置、接收装置、中继方法、接收方法、中继程序以及接收程序
US11270714B2 (en) * 2020-01-08 2022-03-08 Digital Voice Systems, Inc. Speech coding using time-varying interpolation
US11990144B2 (en) 2021-07-28 2024-05-21 Digital Voice Systems, Inc. Reducing perceived effects of non-voice data in digital speech

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2940005B2 (ja) * 1989-07-20 1999-08-25 日本電気株式会社 音声符号化装置
JP2928589B2 (ja) 1990-05-28 1999-08-03 鐘淵化学工業株式会社 変性ldlの吸着体およびそれを用いる変性ldlの除去装置
JP3114197B2 (ja) 1990-11-02 2000-12-04 日本電気株式会社 音声パラメータ符号化方法
JP3143956B2 (ja) 1991-06-27 2001-03-07 日本電気株式会社 音声パラメータ符号化方式
JP2746039B2 (ja) 1993-01-22 1998-04-28 日本電気株式会社 音声符号化方式
JP3196595B2 (ja) * 1995-09-27 2001-08-06 日本電気株式会社 音声符号化装置
TW317051B (ko) * 1996-02-15 1997-10-01 Philips Electronics Nv
JP3094908B2 (ja) * 1996-04-17 2000-10-03 日本電気株式会社 音声符号化装置
JPH1020889A (ja) * 1996-07-01 1998-01-23 Matsushita Electric Ind Co Ltd 音声符号化装置および記録媒体
DE19641619C1 (de) * 1996-10-09 1997-06-26 Nokia Mobile Phones Ltd Verfahren zur Synthese eines Rahmens eines Sprachsignals
DE69734837T2 (de) 1997-03-12 2006-08-24 Mitsubishi Denki K.K. Sprachkodierer, sprachdekodierer, sprachkodierungsmethode und sprachdekodierungsmethode
JP3263347B2 (ja) * 1997-09-20 2002-03-04 松下電送システム株式会社 音声符号化装置及び音声符号化におけるピッチ予測方法
US5999897A (en) * 1997-11-14 1999-12-07 Comsat Corporation Method and apparatus for pitch estimation using perception based analysis by synthesis
US5999048A (en) * 1998-01-13 1999-12-07 Lucent Technologies Inc. Method and apparatus for spread spectrum pilot extraction for RF amplifiers
JP2943983B1 (ja) 1998-04-13 1999-08-30 日本電信電話株式会社 音響信号の符号化方法、復号方法、そのプログラム記録媒体、およびこれに用いる符号帳
JP3180762B2 (ja) 1998-05-11 2001-06-25 日本電気株式会社 音声符号化装置及び音声復号化装置
US6141638A (en) * 1998-05-28 2000-10-31 Motorola, Inc. Method and apparatus for coding an information signal
CA2336360C (en) * 1998-06-30 2006-08-01 Nec Corporation Speech coder
US6188980B1 (en) * 1998-08-24 2001-02-13 Conexant Systems, Inc. Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients
US6173257B1 (en) * 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
JP4008607B2 (ja) * 1999-01-22 2007-11-14 株式会社東芝 音声符号化/復号化方法
JP2001318698A (ja) 2000-05-10 2001-11-16 Nec Corp 音声符号化装置及び音声復号化装置
US6529867B2 (en) * 2000-09-15 2003-03-04 Conexant Systems, Inc. Injecting high frequency noise into pulse excitation for low bit rate CELP
JP2002214900A (ja) 2001-01-16 2002-07-31 Ricoh Co Ltd 回転型現像装置を備えた画像形成装置の組み立て方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100755471B1 (ko) * 2005-07-19 2007-09-05 한국전자통신연구원 가상음원위치정보에 기반한 채널간 크기 차이 양자화 및역양자화 방법

Also Published As

Publication number Publication date
JP2002268686A (ja) 2002-09-20
US7680669B2 (en) 2010-03-16
CN1496556A (zh) 2004-05-12
CA2440820A1 (en) 2002-09-12
CN1293535C (zh) 2007-01-03
EP1367565A1 (en) 2003-12-03
US20040117178A1 (en) 2004-06-17
JP3582589B2 (ja) 2004-10-27
HK1067443A1 (en) 2005-04-08
WO2002071394A1 (en) 2002-09-12
KR100561018B1 (ko) 2006-03-16
EP1367565A4 (en) 2006-08-30

Similar Documents

Publication Publication Date Title
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
JP3196595B2 (ja) 音声符号化装置
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
US6385576B2 (en) Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch
JPH09281998A (ja) 音声符号化装置
KR100561018B1 (ko) 음성 부호화 장치와 방법, 및 음성 복호화 장치와 방법
JP3266178B2 (ja) 音声符号化装置
US6973424B1 (en) Voice coder
EP1154407A2 (en) Position information encoding in a multipulse speech coder
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3003531B2 (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JP3144284B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP3089967B2 (ja) 音声符号化装置
JPH1069297A (ja) 音声符号化装置
JP3471542B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP3144244B2 (ja) 音声符号化装置
JPH09319399A (ja) 音声符号化装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120223

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee