KR100508618B1 - 피치 주기 탐색 범위 설정 장치, 피치 주기 탐색 장치,적응 음원 벡터의 생성 장치, 음성 부호화 장치, 음성복호화 장치, 음성 신호 송신 장치, 음성 신호 수신 장치,이동국 장치 및 기지국 장치 - Google Patents

피치 주기 탐색 범위 설정 장치, 피치 주기 탐색 장치,적응 음원 벡터의 생성 장치, 음성 부호화 장치, 음성복호화 장치, 음성 신호 송신 장치, 음성 신호 수신 장치,이동국 장치 및 기지국 장치 Download PDF

Info

Publication number
KR100508618B1
KR100508618B1 KR10-2003-7004675A KR20037004675A KR100508618B1 KR 100508618 B1 KR100508618 B1 KR 100508618B1 KR 20037004675 A KR20037004675 A KR 20037004675A KR 100508618 B1 KR100508618 B1 KR 100508618B1
Authority
KR
South Korea
Prior art keywords
pitch period
sound source
precision
source vector
integer
Prior art date
Application number
KR10-2003-7004675A
Other languages
English (en)
Other versions
KR20030046480A (ko
Inventor
사토가오루
야스나가가즈토시
모리이도시유키
Original Assignee
마츠시타 덴끼 산교 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마츠시타 덴끼 산교 가부시키가이샤 filed Critical 마츠시타 덴끼 산교 가부시키가이샤
Publication of KR20030046480A publication Critical patent/KR20030046480A/ko
Application granted granted Critical
Publication of KR100508618B1 publication Critical patent/KR100508618B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/125Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0002Codebook adaptations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

적응 음원 벡터 생성기(ASSVG)(103)는, 이전 서브 프레임에 있어서 선택된 정수 정밀도의 피치 주기 T0을 중심으로 한 전후의 피치 주기를, 분수 정밀도의 피치 주파수를 탐색하는 범위로서 설정하고, 이 범위 내에 있는 분수 정밀도의 피치 주기 T·frac를 갖는 적응 음원 벡터 P(T·frac)를 적응 부호 리스트(ACB)(102)로부터 뽑아낸다. 이전 서브 프레임 정수 피치 주기 기억기(LSFIPCS)(108)는, 왜곡 비교기(DC)(107)가 선택한 최적의 피치 주기의 정수 성분 T0을 기억하고, 다음 서브 프레임의 피치 주기를 탐색할 때에, 이 최적의 피치 주기의 정수 성분 T0을 적응 음원 벡터 생성기(ASSVG)(103)에 출력한다. 최적 피치 주기 정밀도 판정기(OPCAJS)(109)는, 최적의 피치 주기가 정수 정밀도인지 분수 정밀도인지를 판정한다. 비교 판정기(CJS)(110)는, 최적의 피치 주기에 분수 정밀도의 피치 정보가 선택되는 회수를 제한한다.

Description

피치 주기 탐색 범위 설정 장치, 피치 주기 탐색 장치, 적응 음원 벡터의 생성 장치, 음성 부호화 장치, 음성 복호화 장치, 음성 신호 송신 장치, 음성 신호 수신 장치, 이동국 장치 및 기지국 장치{PITCH CYCLE SEARCH RANGE SETTING DEVICE AND PITCH CYCLE SEARCH DEVICE}
본 발명은, 피치 주기 탐색 범위 설정 장치 및 피치 주기 탐색 장치에 관한 것으로, 특히 CELP(Code Excited Linear Prediction)형 음성 부호화 장치에 이용하는 피치 주기 탐색 범위 설정 장치 및 피치 주기 탐색 장치에 관한 것이다.
디지털 통신이나, 인터넷 통신으로 대표되는 패킷 통신, 혹은 음성 축적 등의 분야에서는, 전파 등의 전송로 용량이나 기억 매체의 유효 이용을 도모하기 위해, 음성 신호의 부호화/복호화 기술이 불가결하며, 지금까지 다수의 음성 부호화/복호화 방식이 개발되어 왔다.
그 중에서도, 음성 신호를 중·저 비트 레이트로 부호화/복호화하는 경우에는, CELP(Code Excited Linear Prediction) 타입의 음성 부호화/복호화 방식이 주류 방식으로서 많이 실용화되고 있다. CELP 타입의 음성 부호화/복호화 방식으로서, 문헌 1(Proc. ICASSP'85, pp.937-pp.940, 1985)에 개시된 것이 있다.
CELP 타입의 음성 부호화/복호화 방식은, 디지탈화된 음성 신호를 20㎳ 정도의 프레임으로 구분되고, 프레임마다 음성 신호의 선형 예측 분석을 행하여, 선형 예측 계수와 선형 예측 잔차 벡터를 구하며, 이 선형 예측 계수와 선형 예측 잔차 벡터를 각각 개별로 부호화/복호화하는 방식이다. 또, 이 선형 예측 잔차 벡터는, 여진 신호 벡터라고도 불리는 벡터이다.
선형 예측 잔차 벡터는, 과거에 생성한 구동 음원 신호를 저장하고 있는 적응 부호 리스트와, 고정의 형상의 벡터(고정 코드 벡터)를 특정 수 저장한 고정 부호 리스트를 이용하여 부호화/복호화된다.
이 적응 부호 리스트는, 선형 예측 잔차 벡터가 갖는 주기적 성분을 표현하기 위해서 이용된다. 한편, 고정 부호 리스트는, 선형 예측 잔차 벡터 중에서, 적응 부호 리스트로는 표현할 수 없는 비주기적 성분을 표현하기 위해서 이용된다. 일반적으로, 선형 예측 잔차 벡터의 부호화/복호화 처리는, 프레임을 더 짧은 시간 단위(5㎳∼10㎳ 정도)로 분할한 서브 프레임 단위로 행해진다.
CELP에서는, 선형 예측 잔차 벡터로부터 피치 주기를 탐색하여, 부호화를 행한다. 이하, 종래의 선형 예측 잔차의 피치 주기 탐색 장치에 대해 설명한다. 도 1은 종래의 피치 주기 탐색 장치의 구성을 나타내는 블럭도이다.
도 1의 피치 주기 탐색 장치(1O)는, 피치 주기 지시기(PCI : Pitch Cycle Indicator)(11)와, 적응 부호 리스트(12)(ACB : Adaptive Code Book)와, 적응 음원 벡터 생성기(ASSVG : Adaptive Sound Source Vector Generator)(13)와, 정수 정밀도 피치 주기 탐색기(IPCS : Integral Pitch Cycle Searcher)(14)와, 분수 피치 주기 적응 음원 벡터 생성기(FPCASSVG : Fractional Pitch Cycle Adaptive Sound Source Vector Generator)(15)와, 분수 정밀도 피치 주기 탐색기(FPCS : Fractional Pitch Cycle Searcher)(16)와, 왜곡 비교기(DC : Distortion Comparator)(17)로 주로 구성된다.
피치 주기 지시기(PCI)(11)는, 미리 설정한 피치 주기 탐색 범위 내의 소망하는 피치 주기 T·int를 적응 음원 벡터 생성기(ASSVG)(13)에 순차적으로 지시한다. 예컨대, CELP 음성 부호화/복호화 장치가, 16kHz의 음성 신호를 부호화 및 복호화를 행하고, 또한 타겟 벡터의 피치 주기의 탐색 범위가 정수 정밀도로 32 내지 267의 사이, 또한 1/2 분수 정밀도로 32+1/2, 33+1/2,... 51+1/2의 사이에 미리 설정되어 있는 경우, 피치 주기 지시기(PCI)(11)는, 236 종류의 피치 주기 T·int(=32, 33,..., 267)를 적응 음원 벡터 생성기(ASSVG)(13)에 출력한다. 또, 적응 부호 리스트(12)(ACB)는, 과거에 생성한 구동 음원 신호를 저장한다.
다음에, 적응 음원 벡터 생성기(ASSVG)(13)는, 피치 주기 지시기(PCI)(11)로부터 수취한 정수 정밀도의 피치 주기 T·int를 갖는 적응 음원 벡터 p(t·int)를 적응 부호 리스트(12)(ACB)로부터 뽑아내어, 정수 정밀도 피치 주기 탐색기(IPCS)(14)에 출력한다.
정수 정밀도의 피치 주기 T·int를 갖는 적응 음원 벡터 p(t·int)를 적응 부호 리스트(12)(ACB)로부터 뽑아내는 처리에 대해 설명한다. 도 2는, 프레임의 구성의 일례를 도시하는 도면이다.
도 2에 있어서, 프레임(21)과 프레임(31)은, 적응 부호 리스트에 저장된 과거의 구동 음원 신호의 계열이다. 적응 음원 벡터 생성기(AGSVG)(13)는, 피치 주기 탐색 범위의 하한(32)으로부터 상한(267)의 사이에서 프레임의 피치 주기를 탐색한다.
여기서, 프레임(21)으로부터 탐색하는 피치 주기(22)는, 서브 프레임(23)의 길이보다 길기 때문에, 적응 음원 벡터 생성기(ASSVG)(13)는, 프레임(21)으로부터 서브 프레임의 프레임 길이만큼 뽑아낸 구간(23)을 적응 음원 벡터로 한다.
또한, 프레임(31)으로부터 탐색하는 피치 주기(32)는, 서브 프레임(33)의 길이보다 짧기 때문에, 적응 음원 벡터 생성기(ASSVG)(13)는, 적응 음원 벡터를 피치 주기(32)까지 뽑아내고, 뽑아낸 벡터 구간(33)을 서브 프레임 길이의 길이까지 반복하여 얻어지는 벡터 구간(34)을 적응 음원 벡터로 한다.
또한, 적응 음원 벡터 생성기(ASSVG)(13)는, 분수 정밀도의 피치 주기에 대응하는 적응 음원 벡터를 구할 때에 필요하게 되는 적응 음원 벡터를 적응 부호 리스트(12)(ACB)로부터 뽑아내어, 분수 피치 주기 적응 음원 벡터 생성기(FPCASSVG)(15)에 출력한다.
다음에, 정수 정밀도 피치 주기 탐색기(IPCS)(14)는, 정수 피치 주기 T·int를 갖는 적응 음원 벡터 p(T·int)와, 합성 필터의 임펄스 응답 행렬 H와, 타겟 벡터 x로부터 정수 피치 주기 선택 척도 DIST(T·int)를 산출한다. 수학식(1)은, 정수 피치 주기 선택 척도 DIST(T·int)를 산출하는 식이다.
또, 정수 피치 주기 선택 척도 DIST(T·int)를 산출할 때, 수학식(1)에 있어서, 합성 필터의 임펄스 응답 행렬 H에 청각 가중치 부여 필터의 임펄스 응답 행렬 W를 승산한 행렬 H'을 합성 필터의 임펄스 응답 행렬 H 대신에 이용하더라도 좋다.
여기서, 정수 정밀도 피치 주기 탐색기(IPCS)(14)는, 피치 주기 지시기(PCI)(11)가 지시하는 피치 주기 32로부터 267까지 236개의 정수 피치 주기 T·int에 대해, 수학식(1)을 이용한 정수 피치 주기 선택 척도 DIST(T·int)의 산출 처리를 반복 실행한다.
또한, 정수 정밀도 피치 주기 탐색기(IPCS)(14)는, 산출한 236개의 정수 피치 주기 선택 척도 DIST(T·int)로부터 값이 최대로 되는 DIST(T·int)를 선택하고, 선택한 DIST(T·int)를 왜곡 비교기(DC)(17)에 출력한다. 또한, 정수 정밀도 피치 주기 탐색기(IPCS)(14)는, DIST(Tint)을 산출할 때에 참조하는 적응 음원 벡터의 피치 주기 T·int에 대응하는 인덱스를 IDX (INT)로서 왜곡 비교기(DC)(17)에 출력한다.
다음에, 분수 피치 주기 적응 음원 벡터 생성기(FPCASSVG)(15)는, 적응 음원 벡터 생성기(ASSVG)(13)로부터 수취한 적응 음원 벡터와 SYNC 함수와의 적합 연산에 의해, 분수 정밀도의 피치 주기 T·frac(32+1/2, 33+1/2,..., 51+1/2)를 갖는 적응 음원 벡터 P(T·frac)를 구하고, 이 P(T·frac)를 분수 정밀도 피치 주기 탐색기(FPCS)(16)에 출력한다.
다음에, 분수 정밀도 피치 주기 탐색기(FPCS)(16)는, 분수 피치 주기 T·frac를 갖는 적응 음원 벡터 P(T·frac)와, 합성 필터의 임펄스 응답 행렬 H와, 타겟 벡터 x로부터 분수 피치 주기 선택 척도 DIST(T·frac)를 산출한다. 수학식(2)은, 분수 피치 주기 선택 척도 DIST(T·frac)를 산출하는 식이다.
또, 분수 피치 주기 선택 척도 DIST(T·frac)를 산출할 때, 수학식(2)에 있어서, 합성 필터의 임펄스 응답 행렬 H에 청각 가중치 부여 필터의 임펄스 응답 행렬 W를 승산한 행렬 H'을 합성 필터의 임펄스 응답 행렬 H 대신에 이용하더라도 좋다.
여기서, 분수 정밀도 피치 주기 탐색기(FPCS)(16)는, 피치 주기 32+1/2로부터 51+1/2까지 20개의 분수 피치 주기 T·frac에 대해, 수학식(2)을 이용한 분수 피치 주기 선택 척도 DIST(T·frac)의 산출 처리를 반복 실행한다.
또한, 분수 정밀도 피치 주기 탐색기(FPCS)(16)는, 산출한 20개의 분수 피치 주기 선택 척도 DIST(T·frac)로부터 값이 최대로 되는 DIST(T·frac)를 선택하고, 선택한 DIST(T·frac)를 왜곡 비교기(DC)(17)에 출력한다. 또한, 분수 정밀도 피치 주기 탐색기(FPCS)(16)는, DIST(T·frac)을 산출할 때에 참조하는 적응 음원 벡터의 피치 주기 T·frac에 대응하는 인덱스를 IDX(FRAC)로 하여 왜곡 비교기(DC)(17)에 출력한다.
다음에, 왜곡 비교기(DC)(17)는, 정수 정밀도 피치 주기 탐색기(IPCS)(14)로부터 수취한 DIST(INT)와, 분수 정밀도 피치 주기 탐색기(FPCS)(16)로부터 수취한 DIST(FRAC)와의 값을 비교한다. 그리고, 왜곡 비교기(DC)(17)는, DIST(INT)과 DIST(FRAC) 중, 값이 큰 피치 주기 선택 척도 DIST를 산출하였을 때의 피치 주기를 최적의 피치 주기로 결정하고, IDX(INT)와 IDX(FRAC) 중, 최적의 피치 주기에 상당하는 인덱스를 최적 인덱스 IDX로서 출력한다.
또, 상기 예와 같이, 32로부터 267까지의 정수 정밀도의 피치 주기 탐색 범위와, 32+1/2부터 51+1/2까지 분수 정밀도의 피치 주기 탐색 범위가 피치 주기 탐색 범위로서 선택된 경우, 정수 정밀도와 분수 정밀도의 피치 주기를 탐색 후보의 총 수가 256개(256=236+20) 준비되게 되어, 최적 인덱스 IDX는, 8 비트의 2진 데이터로 부호 표현하게 된다.
이상 설명한 "적응 부호 리스트를 이용한 선형 예측 잔차의 피치 주기 탐색 장치"는, 정수 정밀도로 피치 주기 탐색을 행함과 동시에, 정수 정밀도로 피치 주기 탐색 범위보다 짧은 피치 주기에 상당하는 구간에서 1/2분수 정밀도의 피치 주기 탐색을 행하고, 정수 정밀도로 탐색한 최적의 피치 주기와 분수 정밀도로 탐색한 최적의 피치 주기 중에서 최종적인 피치 주기의 선택을 행하는 것을 특징으로 하고 있다.
이와 같이, 종래의 피치 탐색 장치에서는, 비교적 짧은 피치 주기를 많이 포함한 여성 음성에 대해, 선형 예측 잔차의 피치 주기를 효율적으로 부호화/복호화할 수 있다. 상기 특징 및 효과는, 문헌 2(IEEE JOURNAL ON SELECTED AREAS IN COMMUNICATIONS, pp.31-pp.41, VOL.13, No.1, January 1995) 등에 개시되어 있다.
그러나, 종래의 피치 탐색 장치에서는, 분수 정밀도로 피치 주기를 탐색하는 범위가 짧은 피치 주기에 한정되어 있기 때문에, 비교적 길게 피치 주기를 많이 포함한 남성 음성에 대해, 분수 정밀도로 피치 주기를 탐색하는 범위 외의 피치 주기를 탐색하게 되어, 정수 정밀도만으로 피치 주기를 탐색하는 결과, 피치 주기의 분해능이 떨어져, 효율적으로 부호화/복호화를 행하는 것이 어렵다고 하는 문제가 있다.
발명의 개시
본 발명의 목적은, 음성 신호의 피치 주기를 효율적으로 부호화/복호화할 수 있는 피치 탐색 장치를 제공하는 것이다.
이 목적은, 분수 정밀도로 탐색하는 피치 주기의 범위를 고정하지 않고, 이전 서브 프레임에서 탐색된 피치 주기의 근방을 분수 정밀도로 탐색하는 것에 의해 달성된다.
도 1은 종래의 피치 주기 탐색 장치의 구성을 나타내는 블럭도,
도 2는 프레임의 구성의 일례를 나타내는 도면,
도 3은 본 발명의 실시예 1에 따른 피치 주기 탐색 장치의 구성을 나타내는 블럭도,
도 4는 본 실시예의 피치 주기 탐색 장치의 동작의 일례를 나타내는 흐름도,
도 5는 본 발명의 실시예 2에 따른 복호화 적응 음원 벡터 생성 장치의 구성을 나타내는 블럭도,
도 6은 도 4의 음성 복호화부(503)의 내부 구성을 나타내는 블럭도,
도 7은 음성 부호화 장치(403)의 구성을 나타내는 블럭도,
도 8은 도 6의 음성 복호화부(503)의 내부 구성을 나타내는 블럭도이다.
발명을 실시하기 위한 최선의 형태
이하, 본 발명의 실시예에 대해, 도면을 이용하여 설명한다.
(실시예 1)
도 3은 본 발명의 실시예 1에 따른 피치 주기 탐색 장치의 구성을 나타내는 블럭도이다. 도 3의 피치 주기 탐색 장치(100)는, 피치 주기 지시기(PCI : Pitch Cycle Indicator)(101)와, 적응 부호 리스트(ACB : Adaptive Code Book)(102)와, 적응 음원 벡터 생성기(AXSSVG : Adaptive Sound Source Vector Generator)(103)와, 정수 정밀도 피치 주기 탐색기(FPCS : Integral Pitch Cycle Searcher)(104)와, 분수 피치 주기 적응 음원 벡터 생성기(FPCASSVG : Fractional Pitch Cycle Adaptive Sound Source Vector Generator)(105)와, 분수 정밀도 피치 주기 탐색기(FPCS : Fractional Pitch Cyc1e Searcher)(106)와, 왜곡 비교기(DC : Distortion Comparator)(107)와, 이전 서브 프레임 정수 피치 주기 기억기(LSFIPCS : Last Sub Frame Integral Pitch Cycle Storage)(108)와, 최적 피치 주기 정밀도 판정기(OPCAJS : Optimal Pitch Cycle Accuracy Judge Section)(109)와, 비교 판정기(CJS : Comparison Judge Section)(110))로 주로 구성된다.
피치 주기 지시기(PCI)(101)는, 미리 설정한 피치 주기를 탐색하는 범위에서, 순차 적응 음원 벡터 생성기(ASSVG)(103)에 피치 주기 T·int를 지시한다. 적응 부호 리스트(ACB)(102)는, 과거에 생성한 구동 음원 신호를 저장한다.
적응 음원 벡터 생성기(ASSVG)(103)는, 피치 주기 지시기(PCI)(101)로부터 수취한 지시에 따라, 정수 정밀도의 피치 주기 T·int를 갖는 적응 음원 벡터 p(t·int)를 적응 부호 리스트(ACB)(102)로부터 뽑아내어, 이 적응 음원 벡터 p(t·int)를 정수 정밀도 피치 주기 탐색기 QPCS)(104)에 출력한다.
또한, 적응 음원 벡터 생성기(ASSVG)(103)는, 이전 서브 프레임 정수 피치 주기 기억기(LSFIPCS)(108)로부터, 이전 서브 프레임에 있어서 선택된 정수 정밀도의 피치 주기 T0을 판독하고, 이 피치 주기 T0을 중심으로 한 전후의 피치 주기를 분수 정밀도의 피치 주파수를 탐색하는 범위로서 설정하며, 이 범위 내에 있는 분수 정밀도의 피치 주기 T·frac를 갖는 적응 음원 벡터 P(T·frac)를 적응 부호 리스트(ACB)(102)로부터 뽑아내어, 뽑아낸 적응 음원 벡터를 분수 피치 주기 적응 음원 벡터 생성기(FPCASSVG)(105)에 출력한다.
정수 정밀도 피치 주기 탐색기(IPCS)(104)는, 적응 음원 벡터 생성기(AVSSVG)(103)로부터 수취한 적응 음원 벡터 P(T·int)와, 합성 필터의 임펄스 응답 행렬 H와, 타겟 벡터 x로부터 정수 피치 주기 선택 척도 DIST(T·int)를 산출한다. 그리고, 정수 정밀도 피치 주기 탐색기(IPCS)(104)는, 정수 피치 주기 선택 척도 DIST(T·int)로부터 값이 최대로 되는 DIST(Tint)를 선택하고, 선택한 DIST(T·int)를 왜곡 비교기(DC)(107)에 출력한다.
분수 피치 주기 적응 음원 벡터 생성기(FPCASSVG)(105)는, 적응 음원 벡터 생성기(ASSVG)(103)로부터 수취한 적응 음원 벡터와 SYNC 함수와의 적합 연산에 의해, 분수 정밀도의 피치 주기 T·frac(T·frac=T0·10+1/2, T0·9+1/2,..., T0+9+1/2)을 갖는 적응 음원 벡터 P(T·frac)를 구하고, 이 P(T·frac)를 분수 정밀도 피치 주기 탐색기(FPCS)(106)에 출력한다.
분수 정밀도 피치 주기 탐색기(FPCS)(106)는, 분수 피치 주기 적응 음원 벡터 생성기(FPCASSVG)(105)로부터 수취한 적응 음원 벡터 P(T·frac)와, 합성 필터의 임펄스 응답 행렬 H와, 타겟 벡터 x로부터 분수 피치 주기 선택 척도 DIST(T·frac)을 산출한다. 그리고, 분수 정밀도 피치 주기 탐색기(FPCS)(106)는, 분수 피치 주기 선택 척도 DIST(T·frac)로부터 값이 최대로 되는 DIST(T·frac)을 선택하고, 선택한 DIST(T·frac)를 왜곡 비교기(DC)(107)에 출력한다.
왜곡 비교기(DC)(107)는, 정수 정밀도 피치 주기 탐색기(IPCS)(104)로부터 수취한 DIST(INT)와, 분수 정밀도 피치 주기 탐색기(FPCS)(106)로부터 수취한 DIST(FRAC)와의 값을 비교한다. 그리고, 왜곡 비교기(DC)(107)는, DIST(INT)과 DIST(FRAC) 중, 값이 큰 피치 주기 선택 척도 DIST를 산출하였을 때의 피치 주기를 최적의 피치 주기로 결정하고, IDX(INT)와 IDX(FRAC) 중, 최적의 피치 주기에 상당하는 인덱스를 최적 인덱스 IDX로서 출력한다.
그리고, 왜곡 비교기(DC)(107)는, 최적의 피치 주기의 정수 성분 T0을 이전 서브 프레임 정수 피치 주기 기억기(LSFIPCS)(108)에 출력하고, 최적의 피치 주기를 최적 피치 주기 정밀도 판정기(OPCAJS)(109)에 출력한다.
이전 서브 프레임 정수 피치 주기 기억기(LSFIPCS)(108)는, 왜곡 비교기(DC)(107)가 선택한 최적의 피치 주기의 정수 성분 T0을 기억하고, 다음 서브 프레임의 피치 주기를 탐색할 때에, 이 최적의 피치 주기의 정수 성분 T0을 적응 음원 벡터 생성기(ASSVG)(103)에 출력한다.
최적 피치 주기 정밀도 판정기(OPCAJS)(109)는, 최적의 피치 주기가 정수 정밀도인지 분수 정밀도인지가 판정된다. 비교 판정기(CJS)(110)는, 최적의 피치 주기로 분수 정밀도의 피치 정보가 선택되는 회수를 제한한다.
다음에, 본 실시예에 따른 피치 주기 탐색 장치(100)의 동작에 대하여 설명한다. 도 4는 본 실시예의 피치 주기 탐색 장치의 동작의 일례를 나타내는 흐름도이다.
도 4에 있어서, 단계(이하「ST」라고 함)(201)에서는, 적응 음원 벡터 생성기(ASSVG)(103)에 있어서, 이전 서브 프레임에 있어서 선택된 정수 정밀도의 피치 주기 T0이, 이전 서브 프레임 정수 피치 주기 기억기(LSFIPCS)(108)로부터 판독된다.
ST(202)에서는, 적응 음원 벡터 생성기(ASSVG)(103)에 있어서, 적응 음원 벡터가 생성된다. ST(203)에서는, 정수 정밀도 피치 주기 탐색기(IPCS)(104)에 있어서, 최적의 정수 정밀도 피치 주기 T·int가 탐색된다.
ST(204)에서는, 비교 판정기(CJS)(110)에 있어서, 분수 정밀도 피치 주기의 탐색이 필요한지 여부가 판정된다. 분수 정밀도 피치 주기의 탐색이 필요한 경우, ST(205)로 진행한다. 또한, 분수 정밀도 피치 주기의 탐색이 필요하지 않은 경우, ST(207)로 진행한다.
ST(205)에서는, 분수 피치 주기 적응 음원 벡터 생성기(FPCASSVG)(105)에 있어서, 분수 정밀도의 피치 주기 T·frac를 갖는 적응 음원 벡터가 생성된다. ST(206)에서는, 분수 정밀도 피치 주기 탐색기(FPCS)(106)에 있어서, 최적의 분수 정밀도 피치 주기 T·frac가 탐색된다.
ST(207)에서는, 왜곡 비교기(DC)(107)에 있어서, 최적의 정수 정밀도 피치 주기 T·int와 최적의 분수 정밀도 피치 주기 T·frac로부터 최적의 피치 주기가 선택된다. ST(208)에서는, 왜곡 비교기(DC)(107)가 선택한 최적의 피치 주기의 정수 성분 T0이 이전 서브 프레임 정수 피치 주기 기억기(LSFIPCS)(108)에 기억된다.
ST(209)에서는, 최적 피치 주기 정밀도 판정기(OPCAJS)(109)에 있어서, 왜곡 비교기(DC)(107)가 선택한 최적의 피치 주기가 정수 정밀도의 피치 주기, 또는 분수 정밀도의 피치 주기 중 어느 하나인지가 판정된다.
ST(210)에서는, 비교 판정기(CJS)(110)에 있어서, 최적의 피치 주기로서 분수 정밀도의 피치 주기가 선택된 회수를 나타내는 카운터가「0」으로 리세트된다. ST(211)에서는, 비교 판정기(CJS)(110)에 있어서, 최적의 피치 주기로서 분수 정밀도의 피치 주기가 선택된 회수를 나타내는 카운터가 「1」가산된다.
ST(212)에서는, 피치 주기 탐색 장치(100)의 처리가 종료하지 않고 있는 경우, ST(201)로 되돌아간다.
이하, 상기 구성의 피치 주기 탐색 장치(100)가 16kHz의 음성 신호를 부호화/복호화하는 CELP 음성 부호화/복호화 장치에 있어서, 8 비트의 사이즈의 적응 부호 리스트를 갖고, 타겟의 피치 주기 탐색을 행하는 예에 대해 상세한 동작을 설명한다.
피치 주기 지시기(PCI)(101)는, 미리 설정한 피치 주기를 탐색하는 범위에서, 순차 적응 음원 벡터 생성기(ASSVG)(103)에 피치 주기 Lint를 지시한다. 예컨대, 샘플링 주파수가 16kHz인 음성 신호를 부호화/복호화하는 CELP 음성 부호화/복호화 장치에 있어서 타겟의 피치 주기를 탐색하는 범위가, 정수 정밀도로 32로부터 267까지의 사이이며, 또한 분수 정밀도로 32+1/2로부터 51+1/2의 사이인 경우, 피치 주기 지시기(PCI)(101)는, 피치 주기 T·int(T·int=32, 33,..., 267)를 순차 적응 음원 벡터 생성기(ASSVG)(103)에 지시한다.
다음에, 적응 음원 벡터 생성기(ASSVG)(103)는, 피치 주기 지시기(PCI)(1O1)로부터 수취한 지시에 따라, 정수 정밀도의 피치 주기 T·int를 갖는 적응 음원 벡터 p(t·int)를 적응 부호 리스트(ACB)(102)로부터 뽑아내어, 이 적응 음원 벡터 p(t·int)를 정수 정밀도 피치 주기 탐색기(IPCS) (104)에 출력한다.
또한, 적응 음원 벡터 생성기(ASSVG)(103)는, 이전 서브 프레임 정수 피치 주기 기억기(LSFIPCS)(108)로부터, 이전 서브 프레임에 있어서 선택된 정수 정밀도의 피치 주기 T0을 판독하고, 이 피치 주기 T0을 중심으로 한 전후의 피치 주기를 분수 정밀도의 피치 주파수를 탐색하는 범위로서 설정하고, 이 범위 내에 있는 분수 정밀도의 피치 주기 T·frac를 갖는 적응 음원 벡터 P(T·frac)를 적응 부호 리스트(ACB)(102)로부터 뽑아내고, 뽑아낸 적응 음원 벡터를 분수 피치 주기 적응 음원 벡터 생성기(FPCASSVG)(105)에 출력한다.
구체적으로는, 순차 적응 음원 벡터 생성기(ASSVG)(103)는, 피치 주기 T0을 중심으로 한 20의 피치 주기 T·frac(T·frac=T0·10+1/2, T0·9+1/2,..., T0+9+1/2)를 설정하고, 이 피치 주기를 갖는 적응 음원 벡터 P(T·frac)를 적응 부호 리스트(ACB)(102)로부터 뽑아낸다.
다음에, 정수 정밀도 피치 주기 탐색기 QPCS)(104)는, 하기에 나타내는 수학식(3)을 이용하여, 적응 음원 벡터 생성기(ASSVG)(103)로부터 수취한 적응 음원 벡터 P(T·int)와, 합성 필터의 임펄스 응답 행렬 H와, 타겟벡터 x로부터 정수 피치 주기 선택 척도 DIST(T·int)를 산출한다.
여기서, 정수 정밀도 피치 주기 탐색기(IPCS)(104)는, 피치 주기 지시기(PCI)(101)가 지시하는 피치 주기 32로부터 267까지 236개의 정수 피치 주기 T·int에 대해, 수학식(3)을 이용한 정수 피치 주기 선택 척도 DIST(T·int)의 산출 처리를 반복 실행한다.
또한, 정수 정밀도 피치 주기 탐색기(IPCS)(104)는, 산출한 236개의 정수 피치 주기 선택 척도 DIST(T·int)로부터 값이 최대로 되는 DIST(T·int)를 선택하고, 선택한 DIST(T·int)를 왜곡 비교기(DC)(107)에 출력한다. 또한, 정수 정밀도 피치 주기 탐색기(IPCS)(104)는, DIST(T·int)를 산출할 때에 참조하는 적응 음원 벡터의 피치 주기 T·int에 대응하는 인덱스를 IDX(INT)로서 왜곡 비교기(DC)(107)에 출력한다.
다음에, 분수 피치 주기 적응 음원 벡터 생성기(FPCASSVG)(105)는, 적응 음원 벡터 생성기(ASSVG)(103)로부터 수취한 적응 음원 벡터와 SYNC 함수와의 적합 연산에 의해, 분수 정밀도의 피치 주기 T·frac(T·frac=T0·0+1/2, T0·9+1/2,..., T0+9+1/2)을 갖는 적응 음원 벡터 P(T·frac)를 구하고, 이 P(T·frac)를 분수 정밀도 피치 주기 탐색기(FPCS)(106)에 출력한다.
다음에, 분수 정밀도 피치 주기 탐색기(FPCS)(106)는, 분수 피치 주기 T·frac를 갖는 적응 음원 벡터 P(T·frac)와, 합성 필터의 임펄스 응답 행렬 H와, 타겟 벡터 x로부터 분수 피치 주기 선택 척도 DIST(T·frac)를 산출한다. 수학식(4)은, 분수 피치 주기 선택 척도 DIST(T-frac)를 산출하는 식이다.
여기서, 분수 정밀도 피치 주기 탐색기(FPCS)(106)는, 피치 주기 T0·10+1/2로부터 T0+9+1/2까지 20개의 분수 피치 주기 T·frac에 대해, 수학식(4)을 이용한 분수 피치 주기 선택 척도 DIST(T·frac)의 산출 처리를 반복 실행한다.
그리고, 분수 정밀도 피치 주기 탐색기(FPCS)(106)는, 산출한 20개의 분수 피치 주기 선택 척도 DIST(T·frac)로부터 값이 최대로 되는 DIST(T·frac)을 선택하고, 선택한 DIST(T·frac)를 왜곡 비교기(DC)(107)에 출력한다. 또한, 분수 정밀도 피치 주기 탐색기(FPCS)(106)는, DIST(T·frac)을 산출할 때에 참조하는 적응 음원 벡터의 피치 주기 T·frac에 대응하는 인덱스를 IDX(FRAC)로서 왜곡 비교기(DC)(107)에 출력한다.
다음에, 왜곡 비교기(DC)(107)는, 정수 정밀도 피치 주기 탐색기(IPCS)(104)로부터 수취한 DIST(INT)와, 분수 정밀도 피치 주기 탐색기(FPCS)(106)로부터 수취한 DIST(FRAC)와의 값을 비교한다. 그리고, 왜곡 비교기(DC)(107)는, DIST(INT)와 DIST(FRAC) 중, 값이 큰 피치 주기 선택 척도 DIST를 산출하였을 때의 피치 주기를 최적의 피치 주기로 결정하고, IDX(INT)와 IDX(FRYC) 중, 최적의 피치 주기에 상당하는 인덱스를 최적 인덱스 IDX로서 출력한다.
그리고, 왜곡 비교기(DC)(107)는, 최적의 피치 주기의 정수 성분 T0을 이전 서브 프레임 정수 피치 주기 기억기(LSFIPCS)(108)에 출력하고, 최적의 피치 주기를 최적 피치 주기 정밀도 판정기(OPCAJS)(109)에 출력한다.
또, 상기 예와 같이, 32로부터 267까지의 정수 정밀도의 피치 주기 탐색 범위와, T0·10+1/2로부터 T0+9+1/2까지 분수 정밀도의 피치 주기 탐색 범위가 피치 주기 탐색 범위로서 선택된 경우, 정수 정밀도와 분수 정밀도의 피치 주기를 탐색 후보의 총 수가 256개(256=236+20) 준비되게 되어, 최적 인덱스 IDX는, 8 비트의 2진 데이터로 부호 표현하게 된다.
이전 서브 프레임 정수 피치 주기 기억기(LSFIPCS)(108)는, 왜곡 비교기(DC)(107)가 선택한 최적의 피치 주기의 정수 성분 T0을 기억하고, 다음 서브 프레임의 피치 주기를 탐색할 때에, 이 최적의 피치 주기의 정수 성분 T0을 적응 음원 벡터 생성기(ASSVG)(103)에 출력한다.
최적 피치 주기 정밀도 판정기(OPCAJS)(109)는, 최적의 피치 주기가 정수 정밀도인지 분수 정밀도인지가 판정된다. 최적의 피치 주기가 정수 정밀도인 경우, 최적 피치 주기 정밀도 판정기(OPCAJS)(109)는, 비교 판정기(CJS)(110)의 카운터를「0」으로 리세트한다. 또한, 최적의 피치 주기가 분수 정밀도인 경우, 최적 피치 주기 정밀도 판정기(OPCAJS)(109)는, 비교 판정기(CJS)(110)의 카운터에「1」을 가산한다.
구체적으로는, 비교 판정기(CJS)(110)는, 최적의 피치 주기로서 분수 정밀도의 피치 주기가 선택된 회수를 나타내는 카운터를 구비하고, 카운터의 값과 미리 설정한 부(負)가 아닌 정수 N을 비교한다. 그리고, 카운터의 값이 정수 N보다 큰 경우, 비교 판정기(CJS)(11O)는, 분수 정밀도의 피치 주기를 실행하지 않는 지시를 분수 피치 주기 적응 음원 벡터 생성기(FPCASSVG)(105)에 출력한다. 또한, 카운터의 값이 정수 N 이하인 경우, 비교 판정기(CJS)(110)는, 분수 정밀도의 피치 주기를 실행하는 지시를 분수 피치 주기 적응 음원 벡터 생성기(FPCASSVG)(105)에 출력한다.
이와 같이, 본 실시예의 피치 주기 탐색 장치에 의하면, 분수 정밀도로 탐색하는 피치 주기의 범위를 고정하지 않고, 이전 서브 프레임에서 탐색된 피치 주기의 근방을 분수 정밀도로 탐색하는 것에 의해, 피치 주기가 긴 음성 신호 또는 음성 신호의 선형 예측 잔차에 관해서도 높은 해상도로 피치 주기를 탐색할 수 있다.
또한, 본 실시예의 피치 주기 탐색 장치에 의하면, 이전 서브 프레임으로 탐색된 피치 주기의 근방을 분수 정밀도로 탐색하는 것에 의해, 음성 신호의 선형 예측 잔차에 대해, 피치 주기의 장단에 의하지 않고, 탐색의 정밀도를 향상시킬 수 있어, 고품질인 음성 부호화, 복호화를 행할 수 있다.
또, 상기 설명에서는, 적응 부호 리스트를 이용하여 선형 예측 잔차의 피치 주기를 탐색하는 예에 대해 설명하고 있지만, 피치 주기를 탐색하는 대상은, 선형 예측 잔차에 한정되지 않고, 피치 주기를 갖는 음성 신호의 정보이면 모두 적용할 수 있다.
또한, 상기 설명에서는, 피치 주기 선택 척도를 산출할 때에, 정수 정밀도의 피치 주기 탐색과, 분수 정밀도의 피치 주기 탐색을 폐루프로 탐색하는 순서로 설명하고 있지만 이것에 한하지 않고, 정수 정밀도의 피치 주기 탐색과, 분수 정밀도의 피치 주기 탐색을 실행하여, 정수 정밀도의 피치 주기와 분수 정밀도의 피치 주기를 비교하는 순서이면, 모두 마찬가지의 효과를 얻을 수 있다.
예컨대, 상기 구성을 이용하여 피치 주기를 개루프와 폐루프의 2 단계의 탐색으로 실행하는 경우, 정수 정밀도 피치 주기 탐색기(IPCS)(104)와, 분수 정밀도 피치 주기 탐색기(FPCS)(106)를 포함하는 왜곡 비교기(DC)(107)를 구성하고, 적응 음원 벡터 생성기(ASSVG)(103)로부터 수취한 정수 정밀도의 피치 주기를 갖는 적응 음원 벡터와, 분수 피치 주기 적응 음원 벡터 생성기(FPCASSVG)(105)로부터 수취한 분수 정밀도의 피치 주기를 갖는 적응 음원 벡터를 이용하여, 왜곡 비교기(DC)(107)에 있어서, 처리하는 서브 프레임의 최적 피치 주기에 대응하는 인덱스를 개루프 탐색 및 폐루프 탐색의 2 단계로 나눈 순서로 실행한다.
또한, 상기 설명에서는, 피치 주기의 탐색 범위를 32로부터 267로 하고 있지만, 피치 주기의 탐색 범위는 특히 한정되지 않고, 분수 정밀도의 피치 주기의 탐색 범위가 고정되어 있지 않으면 상기 설명과 마찬가지의 효과를 얻을 수 있다.
또한, 상기 설명에서는, 분수 정밀도의 피치 주기의 탐색 범위를, 정수 정밀도의 피치 주기 T0을 중심으로 한 20의 피치 주기 T·frac(T·frac=T0·10+1/2, T0·9+1/2,..., T0+9+D2)로 하고 있지만, 피치 주기의 범위는 특히 한정되지 않고, 정수 정밀도의 피치 주기로부터 설정되는 범위이면 좋다.
또한, 최적의 피치 주기가 분수 정밀도로 선택되는 상한의 회수를 고정한 값 N으로서 설명하고 있지만, 이 N은, 통신 환경에 따라 적응적으로 증감시켜도 좋다.
또, 상기 설명에서는, 분수 정밀도의 피치 주기가 선택되는 회수를 연속 N 회로 제한하고 있지만, N을 무한대로 설정하여, 분수 정밀도의 피치 주기가 선택되는 회수를 무제한으로 하는 것도 가능하다. 특히, 피치 주기의 인덱스를 전송할 때에 오류가 발생하는 것을 고려할 필요가 없는 경우, 예컨대, 이 피치 주기의 인덱스를 포함하는 부호화 정보를 기억 매체 등에 기입하는 경우, 분수 정밀도의 피치 주기가 선택되는 회수를 무제한하는 것에 의해, 분수 정밀도의 피치 주기 선택 회수의 제한이 없고, 높은 해상도로 피치 주기를 탐색한 결과를 부호화할 수 있다.
또한, 상기 설명에서는, 분수 정밀도의 피치 주기가 선택되는 회수가, 소정의 제한 회수를 초과한 경우, 분수 정밀도로 피치 주기를 탐색하지 않는 예에 대해 설명하고 있지만, 이것에 한하지 않고, 분수 정밀도의 피치 주기가 선택되는 회수가, 소정의 제한 회수를 초과한 경우, 소정의 범위, 예컨대(32+1/2로부터 51+1/2까지로) 분수 정밀도의 피치 주기 탐색을 행하더라도 좋다.
이와 같이, 분수 정밀도의 피치 주기가 선택되는 회수가, 소정의 제한 회수를 초과한 경우, 소정의 범위로 분수 정밀도의 피치 주기 탐색을 행하는 것에 의해, 피치 주기의 인덱스를 전송할 때에 오류가 발생하는 경우에도, 높은 해상도로 피치 주기를 탐색한 결과를 부호화할 수 있다.
또, 상기 설명에서 정수 피치 주기 선택 척도 DIST(T·int) 또는 DIST(T·frac)을 산출할 때, 합성 필터의 임펄스 응답 행렬 H에 청각 가중치 부여 필터의 임펄스 응답 행렬 W를 승산한 행렬 H'을 합성 필터의 임펄스 응답 행렬 H 대신에 이용하더라도 좋다.
(실시예 2)
도 5는 본 발명의 실시예 2에 따른 복호화 적응 음원 벡터 생성 장치의 구성을 나타내는 블럭도이다.
도 5의 복호화 적응 음원 벡터 생성 장치(300)는, 적응 부호 리스트(301)(ACB : Adaptive Code Book)와, 이전 서브 프레임 정수 피치 주기 기억부(LSFIPCS : Last Sub Frame Integral Pitch Cycle Storage)(302)와, 피치 주기 판정기(PCJS : Pitch Cycle Judge Section)(303)와, 적응 음원 벡터 생성기(ASSVG : Adaptive Sound Source Vector Generator)(304)와, 분수 피치 주기 적응 음원 벡터 생성기(FPCASSVG : Fractional Pitch Cycle Adaptive Sound Source Vector Generator)(305)로 주로 구성된다.
적응 부호 리스트(301)(ACB)는, 과거에 생성한 구동 음원 신호를 저장한다.
이전 서브 프레임 정수 피치 주기 기억부(LSFIPCS)(302)는, 피치 주 기 판정기(PCJS)(303)가 판정한 피치 주기의 정수 성분 T0을 수취하고, 이 T0을 기억하여, 다음 서브 프레임을 처리할 때, 이 T0을 피치 주기 판정기(PCJS)(303)에 출력한다.
피치 주기 판정기(PCJS)(303)는, 인덱스 IDX에 대응하는 피치 주기가 정수 정밀도인지 분수 정밀도인지가 판정된다. 그리고, 피치 주기 판정기(PCJS)(303)는, 부호화측으로부터 송신된 인덱스 IDX와, 이전 서브 프레임에서 선택된 피치 주기의 정수 성분 T0을 이용하여, 피치 주기를 설정한다.
예컨대, 수취한 인덱스 IDX가 정수 정밀도의 피치 주기를 나타내는 경우, 피치 주기 판정기(PCJS)(303)는, 인덱스 IDX에 대응하는 피치 주기를 적응 음원 벡터 생성기(ASSVG)(304)에 전한다.
또한, 수취한 인덱스 IDX가 분수 정밀도의 피치 주기를 나타내는 경우, 피치 주기 판정기(PCJS)(303)는, 인덱스 IDX에 대응하는 피치 주기의 정보와 이전 서브 프레임에서의 피치 주기의 정수 성분 T0으로부터 피치 주기를 구하고, 얻어진 피치 주기를 적응 음원 벡터 생성기(ASSVG)(304)에 전한다. 구체적으로는, 피치 주기 판정기(PCJS)(303)는, 분수 정밀도의 피치 주기의 범위(-10+1/2, -9+1/2,..., 9+1/2)로부터 인덱스 IDX에 대응하는 값을 찾아내고, 이 값에 T0을 가한 가산 결과를 분수 정밀도의 피치 주기로 한다.
또한, 피치 주기 판정기(PCJS)(303)는, 인덱스 IDX에 대응하는 피치 주기가 분수 정밀도인 회수를 계수하는 카운터를 구비한다.
예컨대, 인덱스 IDX에 대응하는 피치 주기가 분수 정밀도인 경우, 피치 주기 판정기(PCJS)(303)는, 카운터에 「1」을 가산한다. 또한, 인덱스 IDX에 대응하는 피치 주기가 정수 정밀도인 경우, 카운터를 「0」으로 리세트한다.
피치 주기가 정수 정밀도인 경우, 적응 음원 벡터 생성기(ASSVG)(304)는, 피치 주기 판정기(PCJS)(303)로부터 수취한 지시에 따라, 피치 주기 T·int를 갖는 적응 음원 벡터 p(T·int)를 적응 부호 리스트(301)로부터 뽑아내어, 적응 음원 벡터 p(T·int)를 출력한다.
또한, 피치 주기가 분수 정밀도인 경우, 적응 음원 벡터 생성기(ASSVG)(304)는, 피치 주기 판정기(PCJS)(303)로부터 수취한 지시에 따라, 피치 주기 T·frac를 갖는 적응 음원 벡터 P(T·frac)를 뽑아낼 때에 필요한 적응 음원 벡터를 적응 부호 리스트(301)로부터 취출하여 분수 피치 주기 적응 음원 벡터 생성기(FPCASSVG)(305)에 출력한다.
분수 피치 주기 적응 음원 벡터 생성기(FPCASSVG)(305)는, 적응 음원 벡터 생성기(ASSVG)(304)로부터 출력된 적응 음원 벡터와 SYNC 함수와의 적합 계산으로부터 분수 정밀도의 피치 주기 T·frac를 갖는 적응 음원 벡터 P(T·frac)를 구하여, 복호화 적응 음원 벡터로서 출력한다.
(실시예 3)
실시예 3에서는, 실시예 1에 기재된 피치 주기 탐색 장치 또는 실시예 2에 기재된 복호화 적응 음원 벡터 생성 장치를 송신 장치 및 수신 장치에 탑재하여 통신에 사용하는 예에 대해 설명한다.
도 6은 본 발명의 실시예 3에 따른 음성 신호 송신 장치 및 수신 장치의 구성을 나타내는 블럭도이다.
도 6의 음성 신호 송신 장치(400)는, 입력부(401)와, A/D 변환기(402)와, 음성 부호화 장치(403)와, RF 변조기(404)와, 송신 안테나(405)로 주로 구성된다. 또한, 도 6의 음성 신호 수신 장치(500)는, 수신 안테나(501)와, RF 복조기(502)와, 음성 복호화부(503)와, D/A 변환기(504)와, 출력부(505)로 주로 구성된다.
도 6에 있어서, 음성 신호는, 입력부(401)에 의해서 전기적 신호로 변환된 후, A/D 변환기(402)에 출력된다. A/D 변환기(402)는, 입력부(401)로부터 출력된 (아날로그) 신호를 디지털 신호로 변환하여 음성 부호화 장치(403)에 출력한다. 음성 부호화 장치(403)는, 상기 실시예 중 어느 하나에 기재된 신호 처리 장치를 구비하며, A/D 변환기(402)로부터 출력된 디지털 음성 신호를 후술하는 음성 부호화 방법을 이용하여 부호화해서 부호화 정보를 RF 변조기(404)에 출력한다. RF 변조기(404)는 음성 부호화 장치(403)로부터 출력된 음성 부호화 정보를 전파 등의 전파 매체에 실어 송출하기 위한 신호로 변환하여 송신 안테나(405)에 출력한다. 송신 안테나(405)는 RF 변조기(404)로부터 출력된 출력 신호를 전파(RF 신호)로서 송출한다.
RF 신호는, 수신 안테나(501)에 의해서 수신되어 RF 복조기(502)에 출력된다. 또, 도면 중의 RF 신호는, 수신측으로부터 본 RF 신호의 것이며, 전파로에서 신호의 감쇠나 잡음의 중첩이 없으면 RF 신호와 완전히 동일한 것으로 된다. RF 복조기(502)는, 수신 안테나(501)로부터 출력된 RF 신호로부터 음성 부호화 정보를 복조하여 음성 복호화부(503)에 출력한다. 음성 복호화부(503)는, 상기 실시예 중 어느 하나에 기재된 신호 처리 장치를 구비하며, RF 복조기(502)로부터 출력된 음성 부호화 정보로부터 후술하는 음성 복호화 방법을 이용하여 음성 신호를 복호해서 D/A 변환기(504)에 출력한다. D/A 변환기(504)는, 음성 복호화부(503)로부터 출력된 디지털 음성 신호를 아날로그의 전기적 신호로 변환하여 출력부(505)에 출력한다. 출력부(505)는, 전기적 신호를 공기의 진동으로 변환하여 음파로서 인간의 귀에 들리도록 출력한다.
상기한 바와 같은 음성 신호 송신 장치 및 수신 장치의 적어도 한쪽을 구비하는 것에 의해, 이동 통신 시스템에 있어서의 기지국 장치 및 이동 단말 장치를 구성할 수 있다.
상기 음성 신호 송신 장치(400)는, 음성 부호화 장치(403)에 그 특징을 갖는다. 도 7은 음성 부호화 장치(403)의 구성을 나타내는 블럭도이다.
도 7의 음성 부호화 장치(403)는, 전처리부(601)와, LPC 분석부(602)와, LPC 양자화부(603)와, 합성 필터(604)와, 가산기(605)와, 적응 음원 부호 리스트(606)와, 양자화 이득 생성기(607)와, 고정 음원 부호 리스트(608)와, 승산기(609)와, 승산기(610)와, 가산기(611)와, 청각 가중치 부여부(612)와, 파라미터 결정부(613)와, 다중화기(614)로 주로 구성된다.
도 7에 있어서, 도 6의 A/D 변환기(402)로부터 출력된 입력 음성 신호는, 전처리부(601)에 입력된다. 전처리부(601)는, 입력 음성 신호에 직류 성분을 제거하는 하이 패스 필터 처리 또는 후속하는 부호화 처리의 성능 개선에 이어지는 파형 정형 처리 및 프리엠퍼시스(pre-emphasis) 처리를 행하여, 처리 후의 음성 신호(Xin)를 LPC 분석부(602), 가산기(605) 및 파라미터 결정부(613)에 출력한다. 이 전처리를 이용한 CELP 부호화로서는, 일본 특허 공개 평성 제 6-214600 호 공보에 개시되어 있다.
LPC 분석부(602)는, Xin을 이용하여 선형 예측 분석을 행해서 분석 결과(선형 예측 계수)를 LPC 양자화부(603)에 출력한다.
LPC 양자화부(603)는, LPC 분석부(602)로부터 출력된 LPC 계수를 LSF 파라미터로 변환한다. 변환에 의해서 얻어진 LSF 파라미터는, 양자화 타겟 벡터로서 벡터 양자화되고, 벡터 양자화에 의해서 얻어진 LPC 부호(L)로서 다중화기(614)에 출력된다.
또한, LPC 양자화부(603)는, LSF 영역의 복호화 스펙트럼 포락 파라미터를 얻고, 얻어진 복호화 스펙트럼 포락 파라미터를 복호화 LPC 계수로 변환하여, 상기 변환에 의해서 얻어지는 복호화 LPC 계수를 합성 필터(604)에 출력한다.
합성 필터(604)는, 상기 복호화 LPC 계수와 가산기(611)로부터 출력되는 구동 음원을 이용하여 필터 합성을 행해서, 합성 신호를 가산기(605)에 출력한다.
가산기(605)는, 상기 Xin과 상기 합성 신호와의 오차 신호를 산출하여, 청각 가중치 부여부(612)에 출력한다. 청각 가중치 부여부(612)는, 가산기(605)로부터 출력된 오차 신호에 대해 청각적인 가중치 부여를 행하여, 청각 가중치 부여 영역에서의 상기 Xin과 상기 합성 신호와의 왜곡을 산출해서, 파라미터 결정부(613)에 출력한다.
파라미터 결정부(613)는, 청각 가중치 부여부(612)로부터 출력된 상기 부호화 왜곡이 최소로 되도록, 적응 음원 부호 리스트(606)와 고정 음원 부호 리스트(608)와 양자화 이득 생성기(607)에 있어서 생성하는 신호를 결정한다. 또, 청각 가중치 부여부(612)로부터 출력되는 부호화 왜곡의 최소화 뿐만 아니라, 상기 Xin을 이용한 다른 부호화 왜곡을 병용하여 상기 3개의 수단으로부터 생성되어야 할 신호를 결정하는 것에 의해, 부호화 성능을 더 개선할 수도 있다.
적응 음원 부호 리스트(606)는, 과거에 가산기(611)에 의해서 출력된 음원 신호를 버퍼링하고, 파라미터 결정부(613)로부터 출력된 신호(A)에 의해서 특정되는 위치로부터 적응 음원 벡터를 뽑아내어 승산기(609)에 출력한다.
고정 음원 부호 리스트(608)는, 파라미터 결정부(613)로부터 출력된 신호(F)에 의해서 특정되는 형상을 갖는 벡터를 승산기(610)에 출력한다.
양자화 이득 생성기(607)는, 파라미터 결정부(613)로부터 출력된 신호(G)에 의해서 특정되는 적응 음원 이득과 고정 음원 이득을 각각 승산기(609)와 승산기(610)에 출력한다.
승산기(609)는, 양자화 이득 생성기(607)로부터 출력된 양자화 적응 음원 이득을, 적응 음원 부호 리스트(606)로부터 출력된 적응 음원 벡터에 승산하여, 승산 결과를 가산기(611)에 출력한다. 승산기(610)는, 양자화 이득 생성기(607)로부터 출력된 양자화 고정 음원 이득을, 고정 음원 부호 리스트(608)로부터 출력된 고정 음원 벡터에 승산하여, 승산 결과를 가산기(611)에 출력한다.
가산기(611)는, 이득 승산 후의 적응 음원 벡터를 승산기(609)로부터 입력하고, 또한 고정 음원 벡터를 승산기(610)로부터 입력하여, 적응 음원 벡터와 고정 음원 벡터를 벡터 가산한다. 그리고, 가산기(611)는, 벡터 가산 결과를 합성 필터(604) 및 적응 음원 부호 리스트(606)에 출력한다.
마직막으로, 다중화기(614)는, LPC 양자화부(603)로부터 양자화 LPC를 나타내는 부호 L을, 파라미터 결정부(613)로부터 적응 음원 벡터를 나타내는 부호 A 및 고정 음원 벡터를 나타내는 부호 F 및 양자화 이득을 나타내는 부호 G를, 각각 입력하고, 이들 정보를 다중화하여 부호화 정보로서 전송로에 출력한다.
다음에, 음성 복호화부(503)의 상세에 대해 설명한다. 도 8은 도 6의 음성 복호화부(503)의 내부 구성을 나타내는 블럭도이다.
도 8에 있어서, RF 복조기(502)로부터 출력된 부호화 정보는, 다중화분리기(701)에 있어서 다중화된 부호화 정보를 개개의 부호 정보로 분리한다.
분리된 LPC 부호 L은 LPC 복호화기(702)에 출력되고, 분리된 적응 음원 벡터 부호 A는 적응 음원 부호 리스트(705)에 출력되며, 분리된 음원 이득 부호 G는 양자화 이득 생성기(706)에 출력되고, 분리된 고정 음원 벡터 부호 F는 고정 음원 부호 리스트(707)에 출력된다.
LPC 복호화기(702)는, 다중화 분리기(701)로부터 출력된 부호 L로부터, 실시예 1에 나타낸 벡터 양자화의 복호화 처리에 의해서 복호화 스펙트럼 포락 파라미터를 얻고, 얻어진 복호화 스펙트럼 포락 파라미터를 복호화 LPC 계수로 변환한다. 그리고, LPC 복호화기(702)는, 변환에 의해서 얻어지는 복호화 LPC 계수를 합성 필터(703)에 출력한다.
적응 음원 부호 리스트(705)는, 다중화 분리기(701)로부터 출력된 부호 A에서 지정되는 위치로부터 적응 음원 벡터를 취출하여 승산기(708)에 출력한다. 고정 음원 부호 리스트(707)는, 다중화 분리기(701)로부터 출력된 부호 F에서 지정되는 고정 음원 벡터를 생성하여, 승산기(709)에 출력한다.
양자화 이득 생성기(706)는, 다중화 분리기(701)로부터 출력된 음원 이득 부호 G에서 지정되는 적응 음원 벡터 이득과 고정 음원 벡터 이득을 복호하여 승산기(708) 및 승산기(709)에 각각 출력한다.
승산기(708)는, 상기 적응 부호 벡터에 상기 적응 부호 벡터 이득을 승산하여, 가산기(710)에 출력한다. 승산기(709)는, 상기 고정 부호 벡터에 상기 고정 부호 벡터 이득을 승산하여, 가산기(710)에 출력한다.
가산기(710)는, 승산기(708) 및 승산기(709)로부터 출력된 이득 승산 후의 적응 음원 벡터와 고정 음원 벡터의 가산을 행하여, 합성 필터(703)에 출력한다.
합성 필터(703)는, 가산기(710)로부터 출력된 음원 벡터를 구동 신호로 하여, LPC 복호화기(702)로부터 공급된 복호화 LPC 계수를 필터 계수에 갖는 합성 필터를 이용하여 필터 합성을 행하고, 합성한 신호를 후처리부(704)에 출력한다.
후처리부(704)는, 포먼트(formant) 강조나 피치 강조 등의 음성의 주관적인 품질을 개선하는 처리, 및 정상 잡음의 주관적 품질을 개선하는 처리 등을 실시한 후에, 최종적인 복호 음성 신호로서 출력한다.
또, 본 발명은 상기 실시예에 한정되지 않고, 여러 가지 변경하여 실시하는 것이 가능하다. 예컨대, 상기 실시예에서는, 신호 처리 장치로서 실행하는 경우에 대해 설명하고 있지만, 이것에 한정되는 것이 아니라, 이 신호 처리 방법을 소프트웨어로서 실행하는 것도 가능하다.
예컨대, 상기 신호 처리 방법을 실행하는 프로그램을 미리 ROM(Read Only Memory)에 저장해 두고, 그 프로그램을 CPU(Central Processor Unit)에 의해서 동작시키도록 하더라도 좋다.
또한, 상기 신호 처리 방법을 실행하는 프로그램을 컴퓨터로 판독 가능한 기억 매체에 저장하여, 기억 매체에 저장된 프로그램을 컴퓨터의 RAM(Random Access memory)에 기록하여, 컴퓨터를 그 프로그램에 따라서 동작시키도록 하더라도 좋다.
이상의 설명으로부터 명백한 바와 같이, 본 발명의 피치 주기 탐색 장치에 의하면, 분수 정밀도로 탐색하는 피치 주기의 범위를 고정하지 않고, 이전 서브 프레임에서 탐색된 피치 주기의 근방을 분수 정밀도로 탐색하는 것에 의해, 음성 신호의 선형 예측 잔차에 대해, 피치 주기의 장단에 의하지 않고, 탐색의 정밀도를 향상할 수 있어, 고품질의 음성 부호화, 복호화를 행할 수 있다.
본 명세서는, 2001년 8월 2일 출원의 특허 출원 평성 제 2001-234559 호에 근거하는 것이다. 이 내용을 여기에 포함시켜 놓는다.
본 발명은, 음성 신호를 부호화하여 전송하는 이동 통신 시스템에 이용하는데 바람직하다.

Claims (19)

  1. 선형 예측 잔차에 포함되는 피치 주기를 서브 프레임마다 탐색하는 피치 주기 탐색 처리에서,
    미리 설정된 피치 주기 탐색 범위내의 피치 주기 후보를 정수 정밀도로 적응 음원 벡터 생성부에 순차적으로 지시하는 피치 주기 지시부와,
    상기 피치 주기 지시부로부터 지시된 피치 주기를 갖는 적응 음원 벡터를, 과거의 구동 음원을 저장한 적응 부호 리스트로부터 뽑아내는 적응 음원 벡터 생성부와,
    이전 서브 프레임의 피치 주기 탐색 처리에 있어서 최종적으로 선택된 피치 주기의 정수 성분을 기억하는 이전 서브 프레임 정수 피치 주기 기억부를 구비하며,
    상기 피치 주기 지시부로부터 지시된 정수 정밀도의 피치 주기 후보와, 상기 이전 서브 프레임 정수 피치 주기 기억부로부터 판독한 정수 정밀도의 피치 주기 근방의 피치 주기를 분수 정밀도로 커버하는 분수 정밀도의 피치 주기 탐색 후보의 쌍방 또는 한쪽을 처리 서브 프레임 구간의 피치 주기 탐색 처리에 있어서의 피치 주기 탐색 대상으로서 설정하는 피치 주기 탐색 범위 설정 장치.
  2. 제 1 항에 있어서,
    내부에 구비한 카운터의 값과 음이 아닌 정수 N과의 대소 비교를 행하는 비교 판정 기능을 구비한 비교 판정부와,
    처리 서브 프레임의 피치 주기 탐색 처리에 있어서 최적의 피치 주기로서 선택된 피치 주기가 정수 정밀도인지 분수 정밀도인지를 판정하고, 당해 판정 결과에 따라 상기 비교 판정부가 구비하는 카운터의 값을 조작하는 기능을 갖는 최적 피치 주기 정밀도 판정부를 더 구비하며,
    상기 비교 판정부 내부의 카운터의 값이 상기 N보다 큰 경우에는, 상기 정수 정밀도의 피치 주기 탐색 후보에 대해서만 피치 주기 탐색 처리를 행하고, 상기 비교 판정부 내부의 카운터의 값이 상기 N 이하인 경우에는, 상기 정수 정밀도의 피치 주기 탐색 후보 및 상기 분수 정밀도의 피치 주기 탐색 후보의 쌍방에 대해 피치 주기 탐색을 행하는 것으로 하는 피치 주기 탐색 범위 설정 장치.
  3. 제 2 항에 있어서,
    상기 최적 피치 주기 정밀도 판정부가, 처리 서브 프레임 구간의 피치 주기 탐색 처리에 있어서 최종적으로 선택된 피치 주기의 정밀도가 정수 정밀도인 경우에는, 상기 비교 판정부 내부의 카운터의 값을 0으로 리세트하는 조작을 실시하고, 처리 서브 프레임 구간의 피치 주기 탐색 처리에 있어서 최종적으로 선택된 피치 주기의 정밀도가 분수 정밀도인 경우에는, 상기 비교 판정부 내부의 카운터를 증분하는 조작을 실시하는 피치 주기 탐색 범위 설정 장치.
  4. 피치 주기 지시부로부터 지시되는 정수 정밀도의 피치 주기를 갖는 적응 음원 벡터를 적응 부호 리스트로부터 뽑아내고, 당해 뽑아낸 적응 음원 벡터를 정수 정밀도 피치 주기 탐색부 및 분수 피치 주기 적응 음원 벡터 생성부에 출력하는 적응 음원 벡터 생성부와,
    적응 음원 벡터 생성부로부터 수취한 적응 음원 벡터를 이용하여 정수 정밀도의 피치 주기를 폐루프 탐색하고, 정수 정밀도에서의 최적 피치 주기의 인덱스 및 선택 척도를 왜곡 비교부에 출력하는 정수 정밀도 피치 주기 탐색부와,
    적응 음원 벡터 생성부로부터 수취한 정수 정밀도의 적응 음원 벡터를 보완하여 분수 정밀도의 피치 주기를 갖는 적응 음원 벡터를 생성하고, 당해 생성한 분수 정밀도의 피치 주기를 갖는 적응 음원 벡터를 분수 정밀도 피치 주기 탐색부에 출력하는 분수 피치 주기 적응 음원 벡터 생성부와,
    분수 피치 주기 적응 음원 벡터 생성부로부터 수취한 분수 정밀도의 피치 주기를 갖는 적응 음원 벡터를 이용하여 분수 정밀도의 피치 주기 탐색을 폐루프 탐색하고, 분수 정밀도에서의 최적 피치 주기의 인덱스 및 선택 척도를 왜곡 비교부에 출력하는 분수 정밀도 피치 주기 탐색부와,
    정수 정밀도 피치 주기 탐색부로부터 수취한 선택 척도와, 분수 정밀도 피치 주기 탐색부로부터 수취한 선택 척도를 비교하여 선택 척도가 큰 쪽의 인덱스를, 처리 서브 프레임 구간의 최적 피치 주기를 나타내는 인덱스로서 출력하는 기능, 및 선택 척도가 큰 쪽의 피치 주기의 정수 성분을 이전 서브 프레임 정수 피치 주기 기억부에 출력하는 기능을 갖는 왜곡 비교부를 구비하며,
    제 1 항에 기재된 피치 주기 탐색 범위 설정 장치에 의해서 설정된 범위 내의 피치 주기 후보 중에서 처리 서브 프레임 구간의 선형 예측 잔차가 갖는 피치 주기를 탐색하는 피치 주기 탐색 장치.
  5. 피치 주기 지시부로부터 지시되는 정수 정밀도의 피치 주기를 갖는 적응 음원 벡터를 적응 부호 리스트로부터 각각 뽑아내고, 당해 뽑아낸 적응 음원 벡터를 정수 정밀도 피치 주기 탐색부 및 분수 피치 주기 적응 음원 벡터 생성부에 출력하는 적응 음원 벡터 생성부와,
    적응 음원 벡터 생성부로부터 생성된 정수 정밀도의 피치 주기를 갖는 적응 음원 벡터, 및 적응 음원 벡터 생성부에서 생성된 정수 정밀도의 피치 주기를 갖는 적응 음원 벡터를 보간하여 얻어지는 분수 정밀도의 피치 주기를 갖는 적응 음원 벡터에 대해, 개루프 탐색 및 폐루프 탐색의 2 단계의 탐색에 의해서, 처리 서브 프레임 구간의 선형 예측 잔차 중의 최적 피치 주기를 나타내는 인덱스를 구하는 기능, 및 최적 피치 주기의 정수 성분을 이전 서브 프레임 정수 피치 주기 기억부에 출력하는 기능을 갖는 왜곡 비교부를 구비하며,
    제 1 항에 기재된 피치 주기 탐색 범위 설정 장치에 의해서 설정된 피치 주기 탐색 범위 중에서 최적의 피치 주기를 탐색하는 피치 주기 탐색 장치.
  6. 제 4 항에 있어서,
    내부에 구비한 카운터의 값과 음이 아닌 정수 N과의 대소 비교를 행하는 비교 판정 기능을 구비한 비교 판정부와,
    처리 서브 프레임의 피치 주기 탐색 처리에 있어서 최적의 피치 주기로서 선택된 피치 주기가 정수 정밀도인지 분수 정밀도인지를 판정하고, 당해 판정 결과에 따라 상기 비교 판정부가 구비하는 카운터의 값을 조작하는 기능을 갖는 최적 피치 주기 정밀도 판정부를 더 구비하며,
    상기 비교 판정부 내부의 카운터의 값이 상기 N보다 큰 경우에는, 상기 정수 정밀도의 피치 주기 탐색 후보에 대해서만 피치 주기 탐색 처리를 행하고, 상기 비교 판정부 내부의 카운터의 값이 상기 N 이하인 경우에는, 상기 정수 정밀도의 피치 주기 탐색 후보 및 상기 분수 정밀도의 피치 주기 탐색 후보의 쌍방에 대해 피치 주기 탐색을 행하는 피치 주기 탐색 범위 설정 장치를 구비하며, 서브 프레임 번호에 관계없이, 항상, 분수 정밀도의 피치 주기 후보와 정수 정밀도의 피치 주기 후보 쌍방의 후보에 대해 피치 주기 탐색 처리를 행하도록, 상기 음이 아닌 정수 N의 값이 미리 무한대로 설정되어 있는 피치 주기 탐색 장치.
  7. 제 4 항에 있어서,
    내부에 구비한 카운터의 값과 음이 아닌 정수 N과의 대소 비교를 행하는 비교 판정 기능을 구비한 비교 판정부와,
    처리 서브 프레임의 피치 주기 탐색 처리시에 있어서 최적의 피치 주기로서 선택된 피치 주기가 정수 정밀도인지 분수 정밀도인지를 판정하고, 당해 판정 결과에 따라 상기 비교 판정부가 구비하는 카운터의 값을 조작하는 기능을 갖는 최적 피치 주기 정밀도 판정부를 더 구비하며,
    상기 비교 판정부 내부의 카운터의 값이 상기 N보다 큰 경우에는, 상기 정수 정밀도의 피치 주기 탐색 후보에 대해서만 피치 주기 탐색 처리를 행하고, 상기 비교 판정부 내부의 카운터의 값이 상기 N 이하인 경우에는, 상기 정수 정밀도의 피치 주기 탐색 후보 및 상기 분수 정밀도의 피치 주기 탐색 후보의 쌍방에 대해 피치 주기 탐색을 행하는 피치 주기 탐색 범위 설정 장치를 구비하며, 최종적으로 선택되는 피치 주기의 정밀도가 분수 정밀도로 되는 연속 서브 프레임 수에 상한을 설정하도록 상기 음이 아닌 정수 N으로 임의의 자연수가 설정되어 있는 피치 주기 탐색 장치.
  8. 제 4 항에 있어서,
    내부에 구비한 카운터의 값과 음이 아닌 정수 N과의 대소 비교를 행하는 비교 판정 기능을 구비한 비교 판정부와,
    처리 서브 프레임의 피치 주기 탐색 처리에 있어서 최적의 피치 주기로서 선택된 피치 주기가 정수 정밀도인지 분수 정밀도인지를 판정하고, 당해 판정 결과에 따라 상기 비교 판정부가 구비하는 카운터의 값을 조작하는 기능을 갖는 최적 피치 주기 정밀도 판정부를 더 구비하며,
    상기 비교 판정부 내부의 카운터의 값이 상기 N보다 큰 경우에는, 상기 정수 정밀도의 피치 주기 탐색 후보에 대해서만 피치 주기 탐색 처리를 행하고, 상기 비교 판정부 내부의 카운터의 값이 상기 N 이하인 경우에는, 상기 정수 정밀도의 피치 주기 탐색 후보 및 상기 분수 정밀도의 피치 주기 탐색 후보의 쌍방에 대해 피치 주기 탐색을 행하는 피치 주기 탐색 범위 설정 장치를 구비하며, 인덱스의 전송 오류 발생 빈도의 높이(정도)에 따라 음이 아닌 정수 N의 값을 가변하는 피치 주기 탐색 장치.
  9. 제 7 항에 있어서,
    분수 정밀도의 피치 주기 탐색에 있어서, 카운터의 값이 비교 대상인 음이 아닌 정수 N보다 큰 경우에, 분수 정밀도의 피치 주기 탐색을 미리 정한 범위에서 행하고, 카운터의 값이 비교 대상인 음이 아닌 정수 N의 값보다 큰 경우에는, 최적의 피치 주기로서 선택된 피치 주기가 정수 정밀도이거나 분수 정밀도이더라도 카운터를 0으로 리세트하는 피치 주기 탐색 장치.
  10. 제 9 항에 있어서,
    분수 정밀도의 피치 주기 탐색부에 있어서, 카운터의 값이 비교 대상인 음이 아닌 정수 N의 값보다 큰 경우에, 상기 정수 정밀도의 피치 주기 탐색, 및 피치 주기가 짧은 구간에 있어서의 분수 정밀도의 피치 주기 탐색을 행하는 피치 주기 탐색 장치.
  11. 이전 서브 프레임 구간에서 선택된 피치 주기를 기억하는 기능을 갖는 이전 서브 프레임 정수 피치 주기 기억부와,
    이전 서브 프레임 정수 피치 주기 기억부로부터 수취한 이전 서브 프레임에서 선택된 피치 주기와 입력으로서 수취한 인덱스를 이용하여, 최적의 적응 음원 벡터의 피치 주기를 구해서 적응 음원 벡터 생성부에 넘겨 주는 기능을 갖는 피치 주기 판정부와,
    피치 주기 판정부로부터 수취한 피치 주기를 갖는 적응 음원 벡터를 적응 부호 리스트로부터 뽑아내고, 피치 주기가 정수 정밀도이면 뽑아낸 적응 음원 벡터를 출력하며, 피치 주기가 분수 정밀도이면 뽑아낸 적응 음원 벡터를 분수 피치 주기 적응 음원 벡터 생성부에 출력하는 기능을 갖는 적응 음원 벡터 생성부와,
    적응 음원 벡터 생성부로부터 수취한 적응 음원 벡터로부터 분수 정밀도의 피치 주기를 갖는 적응 음원 벡터를 생성하여 출력하는 기능을 갖는 분수 피치 주기 적응 음원 벡터 생성부
    를 구비하는 복호화 적응 음원 벡터의 생성 장치.
  12. 제 4 항에 기재된 피치 주기 탐색 장치와,
    고정 부호 리스트로부터 고정 음원 벡터를 생성하는 고정 음원 벡터 생성 수단과,
    입력 음성 신호의 스펙트럼 특성을 나타내는 파라미터를 양자화·부호화하는 수단과,
    상기 고정 음원 벡터 생성 수단과 상기 적응 음원 벡터의 피치 주기 탐색 장치로부터 생성되는 음원 벡터와 상기 파라미터를 이용하여 합성 음성 신호를 합성하는 수단과,
    입력 음성 신호와, 상기 합성 음성 신호와의 왜곡이 작게 되도록 상기 고정 음원 벡터 생성 수단과 상기 적응 음원 벡터의 피치 주기 탐색 장치로부터의 출력을 결정하는 수단
    을 구비하는 음성 부호화 장치.
  13. 제 11 항에 기재된 복호화 적응 음원 벡터의 생성 장치를 이용하여, 음성 부호화 장치에 의해서 부호화된 적응 음원 벡터의 피치 주기를 나타내는 인덱스를 복호화하는 수단과,
    고정 부호 리스트로부터 고정 음원 벡터를 생성하는 고정 음원 벡터 생성 수단과,
    음성 부호화 장치에 의해서 부호화된 스펙트럼 특성을 나타내는 파라미터를 복호화하는 수단과,
    상기 음성 부호화 장치에서 결정된 음원 벡터를 고정 음원 벡터 생성 수단과 복호화 적응 음원 벡터의 생성 장치로부터 복호하여, 복호된 음원 벡터와 상기 파라미터로부터 합성 음성 신호를 합성하는 수단
    을 구비하는 음성 복호화 장치.
  14. 음성 신호를 전기적 신호로 변환하는 음성 입력 장치와,
    이 음성 입력 신호 장치로부터 출력되는 신호를 디지털 신호로 변환하는 A/D 변환 장치와,
    이 A/D 변환 장치로부터 출력되는 디지털 신호의 부호화를 행하는 제 12 항에 기재된 음성 부호화 장치와,
    상기 음성 부호화 장치로부터 출력되는 부호화 정보에 대해 변조 처리 등을 실행하는 RF 변조 장치와,
    상기 RF 변조 장치로부터 출력된 신호를 전파로 변환하여 송신하는 송신 안테나
    를 구비하는 음성 신호 송신 장치.
  15. 수신 전파를 수신하는 수신 안테나와,
    상기 수신 안테나에서 수신한 신호의 복조 처리를 행하는 RF 복조 장치와,
    상기 RF 복조 장치에 의해서 얻어진 정보의 복호화 처리를 행하는 제 13 항에 기재된 음성 복호화 장치와,
    상기 음성 복호화 장치에 의해서 복호화된 디지털 음성 신호를 D/A 변환하는 D/A 변환 장치와,
    상기 D/A 변환 장치로부터 출력되는 전기적 신호를 음성 신호로 변환하는 음성 출력 장치
    를 구비하는 음성 신호 수신 장치.
  16. 음성 신호 송신 장치를 구비하며, 기지국 장치와의 사이에서 무선 통신을 행하는 이동국 장치로서,
    상기 음성 신호 송신 장치는,
    음성 신호를 전기적 신호로 변환하는 음성 입력 신호 장치와,
    이 음성 입력 신호 장치로부터 출력되는 신호를 디지털 신호로 변환하는 A/D 변환 장치와,
    이 A/D 변환 장치로부터 출력되는 디지털 신호의 부호화를 행하는 제 12 항에 기재된 음성 부호화 장치와,
    상기 음성 부호화 장치로부터 출력되는 부호화 정보에 대해 변조 처리 등을 실행하는 RF 변조 장치와,
    상기 RF 변조 장치로부터 출력된 신호를 전파로 변환하여 송신하는 송신 안테나
    를 구비하는 이동국 장치.
  17. 음성 신호 수신 장치를 구비하며, 기지국 장치와의 사이에서 무선 통신을 행하는 이동국 장치로서,
    수신 전파를 수신하는 수신 안테나와,
    상기 수신 안테나에서 수신한 신호의 복조 처리를 행하는 RF 복조 장치와,
    상기 RF 복조 장치에 의해서 얻어진 정보의 복호화 처리를 행하는 제 13 항에 기재된 음성 복호화 장치와,
    상기 음성 복호화 장치에 의해서 복호화된 디지털 음성 신호를 D/A 변환하는 D/A 변환 장치와,
    상기 D/A 변환 장치로부터 출력되는 전기적 신호를 음성 신호로 변환하는 음성 출력 장치
    를 구비하는 이동국 장치.
  18. 음성 신호 송신 장치를 구비하며, 이동국 장치와의 사이에서 무선 통신을 행하는 기지국 장치로서,
    상기 음성 신호 송신 장치는,
    음성 신호를 전기적 신호로 변환하는 음성 입력 신호 장치와,
    이 음성 입력 신호 장치로부터 출력되는 신호를 디지털 신호로 변환하는 A/D 변환 장치와,
    이 A/D 변환 장치로부터 출력되는 디지털 신호의 부호화를 행하는 제 12 항에 기재된 음성 부호화 장치와,
    상기 음성 부호화 장치로부터 출력되는 부호화 정보에 대해 변조 처리 등을 실행하는 RF 변조 장치와,
    상기 RF 변조 장치로부터 출력된 신호를 전파로 변환하여 송신하는 송신 안테나
    를 구비하는 기지국 장치.
  19. 음성 신호 수신 장치를 구비하며, 이동국 장치와의 사이에서 무선 통신을 행하는 기지국 장치로서,
    수신 전파를 수신하는 수신 안테나와,
    상기 수신 안테나에서 수신한 신호의 복조 처리를 행하는 RF 복조 장치와,
    상기 RF 복조 장치에 의해서 얻어진 정보의 복호화 처리를 행하는 제 13 항에 기재된 음성 복호화 장치와,
    상기 음성 복호화 장치에 의해서 복호화된 디지털 음성 신호를 D/A 변환하는 D/A 변환 장치와,
    상기 D/A 변환 장치로부터 출력되는 전기적 신호를 음성 신호로 변환하는 음성 출력 장치
    를 구비하는 기지국 장치.
KR10-2003-7004675A 2001-08-02 2002-08-01 피치 주기 탐색 범위 설정 장치, 피치 주기 탐색 장치,적응 음원 벡터의 생성 장치, 음성 부호화 장치, 음성복호화 장치, 음성 신호 송신 장치, 음성 신호 수신 장치,이동국 장치 및 기지국 장치 KR100508618B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001234559A JP3888097B2 (ja) 2001-08-02 2001-08-02 ピッチ周期探索範囲設定装置、ピッチ周期探索装置、復号化適応音源ベクトル生成装置、音声符号化装置、音声復号化装置、音声信号送信装置、音声信号受信装置、移動局装置、及び基地局装置
JPJP-P-2001-00234559 2001-08-02
PCT/JP2002/007850 WO2003015080A1 (en) 2001-08-02 2002-08-01 Pitch cycle search range setting device and pitch cycle search device

Publications (2)

Publication Number Publication Date
KR20030046480A KR20030046480A (ko) 2003-06-12
KR100508618B1 true KR100508618B1 (ko) 2005-08-17

Family

ID=19066154

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2003-7004675A KR100508618B1 (ko) 2001-08-02 2002-08-01 피치 주기 탐색 범위 설정 장치, 피치 주기 탐색 장치,적응 음원 벡터의 생성 장치, 음성 부호화 장치, 음성복호화 장치, 음성 신호 송신 장치, 음성 신호 수신 장치,이동국 장치 및 기지국 장치

Country Status (8)

Country Link
US (2) US7177802B2 (ko)
EP (1) EP1339043B1 (ko)
JP (1) JP3888097B2 (ko)
KR (1) KR100508618B1 (ko)
CN (4) CN1312661C (ko)
CA (1) CA2424558C (ko)
DE (1) DE60224498T2 (ko)
WO (1) WO2003015080A1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101548318B (zh) * 2006-12-15 2012-07-18 松下电器产业株式会社 编码装置、解码装置以及其方法
CN101622664B (zh) * 2007-03-02 2012-02-01 松下电器产业株式会社 自适应激励矢量量化装置和自适应激励矢量量化方法
WO2009090875A1 (ja) * 2008-01-16 2009-07-23 Panasonic Corporation ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
KR101115381B1 (ko) * 2008-11-04 2012-02-15 인천대학교 산학협력단 진보된 패스워드 선택기
KR20110132339A (ko) * 2009-02-27 2011-12-07 파나소닉 주식회사 톤 판정 장치 및 톤 판정 방법
CN104115220B (zh) 2011-12-21 2017-06-06 华为技术有限公司 非常短的基音周期检测和编码
CN104254886B (zh) 2011-12-21 2018-08-14 华为技术有限公司 自适应编码浊音语音的基音周期
CN103426441B (zh) 2012-05-18 2016-03-02 华为技术有限公司 检测基音周期的正确性的方法和装置
CN105323740B (zh) * 2014-07-30 2018-10-16 中国电信股份有限公司 电路域回落的实现方法和双模终端

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5371853A (en) * 1991-10-28 1994-12-06 University Of Maryland At College Park Method and system for CELP speech coding and codebook for use therewith
JPH066398A (ja) 1992-06-23 1994-01-14 Toshiba Corp 復調装置
JPH0651800A (ja) * 1992-07-30 1994-02-25 Sony Corp データ数変換方法
JP3101430B2 (ja) * 1992-08-06 2000-10-23 富士通株式会社 音声伝送方式
CA2102080C (en) 1992-12-14 1998-07-28 Willem Bastiaan Kleijn Time shifting for generalized analysis-by-synthesis coding
JP3353852B2 (ja) * 1994-02-15 2002-12-03 日本電信電話株式会社 音声の符号化方法
JP3321971B2 (ja) * 1994-03-10 2002-09-09 ソニー株式会社 音声信号処理方法
US5781880A (en) * 1994-11-21 1998-07-14 Rockwell International Corporation Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual
JP3390897B2 (ja) * 1995-06-22 2003-03-31 富士通株式会社 音声処理装置及びその方法
US5819213A (en) * 1996-01-31 1998-10-06 Kabushiki Kaisha Toshiba Speech encoding and decoding with pitch filter range unrestricted by codebook range and preselecting, then increasing, search candidates from linear overlap codebooks
CN1163870C (zh) * 1996-08-02 2004-08-25 松下电器产业株式会社 声音编码装置和方法,声音译码装置,以及声音译码方法
EP0883107B9 (en) * 1996-11-07 2005-01-26 Matsushita Electric Industrial Co., Ltd Sound source vector generator, voice encoder, and voice decoder
CN1256000A (zh) * 1998-01-26 2000-06-07 松下电器产业株式会社 增强音调的方法和装置
JP2000134105A (ja) * 1998-10-29 2000-05-12 Matsushita Electric Ind Co Ltd オーディオ変換符号化に用いられるブロックサイズを決定し適応させる方法
JP3180786B2 (ja) * 1998-11-27 2001-06-25 日本電気株式会社 音声符号化方法及び音声符号化装置
JP3365346B2 (ja) * 1999-05-18 2003-01-08 日本電気株式会社 音声符号化装置及び方法並びに音声符号化プログラムを記録した記憶媒体

Also Published As

Publication number Publication date
JP3888097B2 (ja) 2007-02-28
JP2003044099A (ja) 2003-02-14
US20070136051A1 (en) 2007-06-14
CN1664928A (zh) 2005-09-07
CN1471704A (zh) 2004-01-28
CN1312661C (zh) 2007-04-25
CN1664930A (zh) 2005-09-07
CN100354926C (zh) 2007-12-12
WO2003015080A1 (en) 2003-02-20
US20040030545A1 (en) 2004-02-12
EP1339043A1 (en) 2003-08-27
CN100354927C (zh) 2007-12-12
CN1218296C (zh) 2005-09-07
US7542898B2 (en) 2009-06-02
EP1339043B1 (en) 2008-01-09
EP1339043A4 (en) 2007-02-07
DE60224498D1 (de) 2008-02-21
US7177802B2 (en) 2007-02-13
CN1664929A (zh) 2005-09-07
DE60224498T2 (de) 2008-05-21
KR20030046480A (ko) 2003-06-12
CA2424558A1 (en) 2003-03-31
CA2424558C (en) 2008-10-14

Similar Documents

Publication Publication Date Title
KR100910282B1 (ko) Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, 기록 매체, 음성 부호화 장치, 음성 복호화장치, 음성 신호 송신 장치, 및 음성 신호 수신 장치
US20080033717A1 (en) Speech coding apparatus, speech decoding apparatus and methods thereof
US7542898B2 (en) Pitch cycle search range setting apparatus and pitch cycle search apparatus
KR20020093943A (ko) 보이스화된 음성을 예측적으로 양자화하는 방법 및 장치
JPH08263099A (ja) 符号化装置
JPH08272395A (ja) 音声符号化装置
JP4299676B2 (ja) 固定音源ベクトルの生成方法及び固定音源符号帳
JP2002366195A (ja) 音声符号化パラメータ符号化方法及び装置
CA2283202A1 (en) Method and apparatus for enhancing pitch
JP3576485B2 (ja) 固定音源ベクトル生成装置及び音声符号化/復号化装置
JPH0830299A (ja) 音声符号化装置
JPH10260698A (ja) 信号符号化装置
KR100341398B1 (ko) 씨이엘피형 보코더의 코드북 검색 방법
JPH113098A (ja) 音声符号化方法および装置
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法
JP3230380B2 (ja) 音声符号化装置
JP3350340B2 (ja) 音声符号化方法および音声復号化方法
EP0662682A2 (en) Speech signal coding
Casajus-Quiros et al. Analysis and quantization procedures for a real-time implementation of a 4.8 kb/s CELP coder
KR20010005669A (ko) 래그 파라미터의 부호화 방법 및 그 장치, 그리고 부호 리스트 작성 방법
GB2352949A (en) Speech coder for communications unit
JP2002229597A (ja) Lpcパラメータのベクトル量子化装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120724

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20130722

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20140722

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20150716

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20160701

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20170629

Year of fee payment: 13

LAPS Lapse due to unpaid annual fee