KR100338606B1 - 피치 강조 방법 및 그 장치 - Google Patents

피치 강조 방법 및 그 장치 Download PDF

Info

Publication number
KR100338606B1
KR100338606B1 KR1019997008620A KR19997008620A KR100338606B1 KR 100338606 B1 KR100338606 B1 KR 100338606B1 KR 1019997008620 A KR1019997008620 A KR 1019997008620A KR 19997008620 A KR19997008620 A KR 19997008620A KR 100338606 B1 KR100338606 B1 KR 100338606B1
Authority
KR
South Korea
Prior art keywords
lag
value
pitch
lag value
signal
Prior art date
Application number
KR1019997008620A
Other languages
English (en)
Other versions
KR20010005557A (ko
Inventor
요시다고지
Original Assignee
마츠시타 덴끼 산교 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마츠시타 덴끼 산교 가부시키가이샤 filed Critical 마츠시타 덴끼 산교 가부시키가이샤
Publication of KR20010005557A publication Critical patent/KR20010005557A/ko
Application granted granted Critical
Publication of KR100338606B1 publication Critical patent/KR100338606B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

우선, LPC 역필터(30l)에 의해 복호 음성으로부터 잔차 신호를 산출하고, 제 1 래그값 산출부(302)에 있어서 잔차 신호 r(n)를 이용하여 제 1 래그값 T1을 구한다. 다음에, 제 2 래그값 산출부(303)에 의해, 제 2 래그값 T2을 산출한다. 제 2 래그값 T2는, 제 1 래그값 T1 또는 그 정수 부분의 2배의 래그값을 중심으로, 그 전후의 소수 래그값을 포함하는 범위에서 잔차 신호의 상관값 또는 그것에 관련되는 값을 최대화하는 래그값으로서 산출한다. 제 l 및 제 2 래그값에서의 신호 파형에서 복호 음성에 대하여 피치 강조 필터를 실시한다.

Description

피치 강조 방법 및 그 장치{METHOD AND DEVICE FOR EMPHASIZING PITCH}
종래, 디지털 휴대 전화 등에서는, 음성 신호를 효율적으로 정보 압축하여 전송하기 위해서 음성 부호/복호화 장치를 탑재하고 있다. 음성 부호/복호화 장치의 음성 복호측에서, 부호화에 의해 발생하는 복호 음성의 품질 열화에 대하여 청감(聽感)상의 품질을 향상시키기 위해서 후치 필터에 의한 처리가 실행된다. 후치 필터에 의한 처리에는, 복호 신호가 갖는 피치 주기성을 강조하는 것에 의해 청감 품질의 향상을 도모하는 피치 강조가 포함된다. 종래의 피치 강조 방법의 하나로서, 국제 기관 lTU-T의 표준 권고 G. 729 (8kbps CS-ACELP 음성 부호화 방식)에 근거하는 기술이 있다. 이하, 그 종래의 피치 강조 방법에 대하여 도 1 및 도 2를 이용하여 설명한다.
도 1은, 음성 부호/복호화 장치의 음성 복호측에 배치된 후치 필터의 구성을 나타내는 블럭도이다. 이 후치 필터(1)는, 음성 복호 후의 복호 음성에 대하여,후술하는 피치 강조부(2)에서 피치 강조를 수행한 후, 포먼트 강조부(3)에서 음성 스펙트럼의 강조를 행한다. 고역 강조부(4)에서 포먼트 강조부(3)에 의해 발생한 스펙트럼의 경사 특성을 보정하여, 최후에 이득 제어부(5)에 의해 후치 필터 처리후의 신호 전원을 후치 필터 처리 전의 신호 전원에 맞추는 이득 보정을 한다.
도 2는 피치 강조부(2)의 구성을 나타내는 블럭도이다. 피치 강조부(2)는, 음성 복호시에 이용된 LPC 파라미터에 의해 구성된 LPC 역필터(21)에 의해 복호 음성으로부터 잔차 신호를 산출한다. 본 종래 예에서는, LPC 역필터는, 도 1의 포먼트 강조부(3)에 있어서의 포먼트 강조 필터의 분자(分子) 항에 상당하여, 포먼트 강조 처리의 일부를 겸하고 있다.
래그값 산출부(22)에서는, LPC 역필터(21)에서 얻어진 잔차 신호를 이용하여 래그값을 산출한다. 래그값의 산출에는, 음성 복호에 의해 이용된 래그 파라미터를 이용한다. 래그 파라미터가 나타내는 정수 래그값의 전후로부터, 잔차 신호의 상관값이 최대가 되는 정수 래그값을 결정하고, 또한 그 정수 래그값의 전후에서 정규 화 상관값이 최대가 되는 소수 래그값 T를 결정한다.
이득 계수 산출부(23)에서는, 피치 강조 필터(24)의 이득을 제어하는 계수 g를 산출한다. 이것은, 래그값 T에서의 피치 예측 이득(정규화 상관값)으로서 구한다.
최후에 피치 강조 필터(24)에 의해, 복호 음성의 LPC 역필터 후의 잔차 신호에 대하여 피치 강조 처리를 수행한다. 피치 강조 필터 Hp(z)는, 수학식 (1)에서 주어진다.
단, γ는 피치 강조의 정도를 제어하는 정수이다.
그런데, 상기 종래의 피치 강조 방법을 보다 효율적인 부호화를 하는 저 비트 레이트(예컨대, 4 kbps)에서의 음성 부/복호기에 적용하는 경우, 저 비트 레이트화에 따르는 복호 음성 품질의 열화를 보다 억제하기 위해서, 피치 강조의 정도를 강화할 필요가 있다. 종래의 피치 강조 방법은, 피치 강조의 정도를 강화하는 경우, 상기 (1) 식에 있어서의 피치 강조의 정도를 제어하는 정수 γ를 크게 할 필요가 있다.
그러나, 단지 정수 γ만을 크게 하였을 때에는, 음성의 자연성을 손상시키기 때문에 위화감이 있는 음질이 되어, 오히려 청감상의 품질을 열화시키게 된다고 하는 문제를 갖는다.
발명의 개시
본 발명의 목적은, 저 비트 레이트인 음성 부/복호기에 있어서, 복호 음성의 자연성을 손상하는 일없이 강조 정도가 높은 피치 강조를 수행할 수 있는 청감 품질을 보다 높일 수 있는 우수한 피치 강조 방법 및 그 장치를 제공하는 것이다
이 목적은, 복호 음성 또는 음성 복호로 이용되는 래그 파라미터의 적어도 하나로부터 피치 강조 대상의 신호 파형에 유사한 신호 파형까지의 제 1 래그값을산출하고, 상기 제 1 래그값을 기준으로 하여 상기 피치 강조 대상의 신호 파형에 유사한 다른 신호 파형까지의 다른 래그값을 하나 이상 산출하며, 상기 복수의 래그값에서의 신호 파형을 이용하여 복호 음성의 강조를 수행함으로써 달성된다.
이것에 의해, 저 비트 레이트인 음성 부/복호화기에 적용할 때에, 복호 음성의 자연성을 손상하는 일없이 강조 정도가 높은 피치 강조를 수행하여 청감 품질을 보다 향상시킬 수 있다.
본 발명은, 디지털 휴대 전화 등의 디지털 음성 통신 장치에 탑재되는 음성복호기에 있어서의 피치 강조 방법 및 그 장치에 관한 것이다.
도 1은, 종래의 피치 강조를 수행하는 후치 필터의 구성을 나타내는 블럭도,
도 2는, 종래의 후치 필터에 있어서의 피치 강조부의 구성을 나타내는 블럭도,
도 3은, 본 발명의 실시예 l에 관한 후치 필터를 구비한 무선 통신 장치의 구성을 나타내는 블럭도,
도 4는, 도 3에 나타내는 무선 통신 장치의 음성 복호화부의 구성을 나타내는 블럭도,
도 5는, 본 발명의 실시예 l에 관한 후치 필터의 피치 강조부의 구성을 나타내는 블럭도,
도 6은, 실시예 l에서의 피치 강조 동작의 동작 순서를 나타내는 흐름도,
도 7은, 본 발명의 실시예 2에 관한 후치 필터의 피치 강조부의 구성을 나타내는 블럭도이다.
발명을 실시하기 위한 최선의 형태
이하, 본 발명의 실시예에 대하여, 도면을 이용하여 구체적으로 설명한다.
(실시예 l)
도 3은, 본 발명의 실시예 1에 관한 후치 필터를 구비한 무선 통신 장치의 구성을 나타내는 블럭도이다.
이 무선 통신 장치에 있어서, 송신측에서 음성이 마이크 등의 음성 입력 장치(101)에 의해서 전기적 아날로그 신호로 변환되어, A/D 변환기(102)에 출력된다. 아날로그 음성 신호는, A/D 변환기(102)에 의해서 디지털 음성 신호로 변환되어, 음성 부호화부(103)에 출력된다. 음성 부호화부(103)는, 디지털 음성 신호에 대하여 음성 부호화 처리를 수행하여, 부호화한 정보를 변/복조부(104)에 출력한다. 변/복조부(104)는, 부호화된 음성 신호를 디지털 변조하여, 무선 송신부(105)에 보낸다. 무선 송신부(105)에서는, 변조후의 신호에 소정의 무선 송신 처리를 실시한다. 이 신호는, 안테나(106)를 거쳐서 송신된다.
한편, 무선 통신 장치의 수신측에서는, 안테나(107)에서 수신한 수신 신호는, 무선 수신부(l08)에서 소정의 무선 수신 처리가 실시되고, 변/복조부(104)에 보내진다. 변/복조부(l04)에서는, 수신 신호에 대하여 복조 처리를 수행하여, 복조 후의 신호를 음성 복호화부(109)에 출력한다. 음성 복호화부(109)는, 복조 후의 신호에 복호 처리를 수행하여 디지털 복호 음성 신호를 얻어, 그 디지털 복호 음성 신호를 D/A 변환기(l10)에 출력한다. D/A 변환기(110)는, 음성복호화부(109)로부터 출력된 디지털 복호 음성 신호를 아날로그 복호 음성 신호로 변환하여 스피커 등의 음성 출력 장치(111)에 출력한다. 마지막으로 음성 출력 장치(11l)가 전기적 아날로그 복호 음성 신호를 복호 음성으로 변환하여 출력한다.
상기 구성에 있어서, 음성 복호화부(109)는, 도 4에 나타내는 구성을 갖는다. 즉, 수신 데이터가 분리기(201)에 입력되면, 수신 데이터로부터 양자화 LPC를 표현하는 LPC 파라미터 부호 L, 고정 음원 부호 벡터를 표현하는 고정 음원 부호 S, 래그값을 표현하는 래그 파라미터 부호 P, 및 이득 정보를 표현하는 이득 부호 G가 추출되고, 각각의 부호가 LPC 복호기(201), 고정 음원 부호 리스트(205), 래그 파라미터 복호부(203), 및 이득 부호 리스트(206)에 입력된다.
LPC 복호기(207)는, LPC 파라미터 부호 L로부터 양자화 LPC를 복호하여, 합성 필터(208)에 출력한다. 고정 음원 부호 리스트(205)는, 미리 정해진 개수의 형상이 상이한 고정 음원 부호 벡터가 저장되어 있고, 입력한 고정 음원 부호 S를 복호하여 얻어지는 고정 음원 부호 리스트 인덱스에 의해서 지정되는 고정 음원 부호 벡터를 출력한다. 이 고정 음원 부호 벡터는, 승산기에 의해 후술하는 고정 음원 부호 리스트 이득이 승산된 후에 가산기에 출력된다.
적응 음원 부호 리스트(204)는, 과거에 생성한 구동 음원 신호를 차차 갱신하면서 버퍼링하고 있어, 래그 파라미터를 이용하여 적응 음원 부호 벡터를 생성한다. 이 래그 파라미터는, 입력한 래그 파라미터 부호 P를 래그 파라미터 복호부(203)에 의해 복호하여 얻어지는 래그 파라미터 부호 리스트 인덱스에 의해 지정된 래그 파라미터 부호 리스트상의 래그 파라미터이다. 적응 음원 부호 벡터는, 승산기에 의해 후술하는 적응 음원 부호 리스트 이득이 승산된 후에 가산기에 출력된다.
이득 부호 리스트(206)는, 적응 음원 부호 리스트 이득과 고정 음원 부호 리스트 이득의 세트(이득 벡터)를 미리 정해진 개수만큼 저장하고 있어, 입력한 이득 부호 G를 복호하여 얻어지는 이득 부호 리스트 인덱스에 의해서 지정되는 이득 벡터의 적응 음원 부호 리스트 이득 성분을 승산기에, 고정 음원 부호 리스트 이득 성분을 승산기에 각각 출력한다.
가산기는, 승산기로부터 입력되는 고정 음원 부호 벡터와 적응 음원 부호 벡터의 가산을 수행하여 구동 음원 신호를 생성하고, 합성 필터(208) 및 적응 음원 부호 리스트(204)에 출력한다.
합성 필터(207)는, 입력한 양자화 LPC를 이용하여 LPC 합성 필터를 구축한다. 이 합성 필터에 대하여 가산기로부터 출력되는 구동 음원 신호를 입력으로서 필터 처리를 수행하여 합성 신호를 후치 필터(209)에 출력한다.
후치 필터(209)는, 합성 필터(208)로부터 입력한 합성 신호에 대하여, 피치 강조, 포먼트 강조, 고역 강조, 및 이득 제어 등의 음성 신호의 주관적 품질을 개선시키기 위한 처리를 수행한다. 후치 필터(209)의 출력은, 소정의 후처리가 실시된 후에 디지털화된 복호 음성 신호 등의 출력 데이터로서 출력된다.
도 5는, 본 발명의 실시예 1에 관한 후치 필터의 피치 강조부의 기능 블럭도이다. 실시예 1에 관한 후치 필터의 피치 강조부는, 복호 음성에 대하여 LPC 역필터 처리를 수행하여 잔차 신호를 구하는 LPC 역필터(301), 음성 복호로 이용되는 래그 파라미터를 이용하여 복호 음성으로부터 제 1 래그값을 산출하는 제 1 래그값 산출부(302), 제 1 래그값 및 복호 음성으로부터 제 2 래그값을 산출하는 제 2 래그값 산출부(303), 제 1, 제 2 래그값 및 상기 복호 음성으로부터 제 1 및 제 2 래그값에 대한 제 l 및 제 2 이득 계수를 산출하는 제 l 및 제 2 이득 계수 산출부(304), 복호 음성, 제 1 및 제 2 래그값 및 제 1 및 제 2 이득 계수를 이용하여 피치 강조 필터 처리를 수행하는 피치 강조 필터(305)를 포함한다.
피치 강조 필터(305)의 필터 특성을 수학식 (2)에 나타낸다.
여기서, T1, T2는, 제 1 및 제 2 래그값, g1, g2는 Tl, T2의 피치 강조 필터의 이득 계수, γ1, γ2는 래그값 Tl, T2에 대한 피치 강조의 정도를 제어하는 정수이다. 피치 강조 필터(305)는, 수학식 (2)에 나타내는 바와 같이 제 1 래그값 T1의 신호에 부가하여, 제 2 래그값 T2의 신호를 이용하여 피치 강조한다.
이상과 같이 구성된 실시예 1에 대하여 그 피치 강조의 동작을 도 6에 나타내는 처리 순서(ST101-ST105)에 따라서 설명한다. 또한, 본 실시예 l에서 피치 강조 처리는 복호 음성의 일정 길이의 구간을 단위로 하여 실행된다. 이 구간 길이는, 피치 강조가 적용되는 음성 부/복호 처리의 부호화 단위(프레임 또는 서브프레임)에 대응하고 있다.
우선, LPC 역필터(301)에서는, 복호 음성 s(n)(n = 0, 1,..., N-1 ; N : 구간 길이)부터 잔차 신호 r(n)(n=0, 1,..., N-1)가 산출된다. LPC 역필터(301)를 구성하는 LPC 계수는, 음성 복호시에 이용하는 부호화측에서 송신된 LPC 파라미터를 이용하고 있다. 또한, LPC 계수에 대해서는, 복호 음성 s(n)을 직접 LPC 분석하여 구한 LPC 파라미터를 이용할 수 있다.
다음에, 제 1 래그값 산출부(302)에 있어서, 잔차 신호 r(n)으로부터 제 1 래그값 T1을 구한다. 제 1 래그값 Tl의 산출 방법은 임의적이지만, 예컨대, 수학식 (3)에 나타내는 잔차 신호의 상관값 R(k), 또는 수학식 (4)에 나타내는 정규화 상관값 Rn(k)가 최대로 되는 래그값을 제 1 래그값 T1로서 구할 수 있다.
여기서, 수학식 (3), 수학식 (4)에 있어서 rk(n)은 래그값 k(소수 래그값을 포함함)에 있어서의 잔차 신호이다.
또한, 처음으로 정수 래그값으로 래그값의 범위를 좁혀서, 그 정수 래그값의 전후의 특정 범위내에서 소수 래그값의 최적값을 구한다고 하는 방법을 채용할 수 있다. 또한, 음성 복호시에 부호화측에서 송신되는 래그 파라미터의 래그값을 그대로 제 1 래그값으로 하거나, 혹은 그 정수 부분을 중심으로 그 전후의 범위에서소수 래그값을 산출하더라도 좋다.
이와 같이 해서 얻어진 제 1 래그값 T1은, 피치 강조의 대상 신호 파형에 가장 유사한 신호 파형이 존재하는 위치까지의 지연량을 나타내게 된다. 전형적으로는, 복호 음성 신호 또는 잔차 신호가 주기적인 신호 파형인 경우, 대상 신호 파형으로부터 1 피치 주기 전의 신호 파형까지의 거리를 나타낸다.
다음에, 제 2 래그값 산출부(303)가, 제 1 래그값 T1과 잔차 신호를 이용하여 제 2 래그값 T2을 산출한다. 제 2 래그값 산출부(303)은, 제 1 래그값 Tl (또는 제 1 래그값 T1에 있어서의 정수 부분)을 2배한 래그값을 중심으로, 그 전후의 소수 래그값을 포함하는 범위에서 수학식 (4)가 최대로 되는 래그값을 제 2 래그값 T2로 하여 산출한다. 이와 같이 제 2 래그값을 구하는 것에 의해, 산출해야 할 제 2 래그값을 제 1 래그값으로부터 보다 적절한 범위에 한정함과 동시에, 적은 연산량으로 제 2 래그값을 산출할 수 있다.
이렇게 하여 얻어진 제 2 래그값 T2는, 전형적으로는, 복호 음성 신호 또는 잔차 신호가 주기적인 신호 파형인 경우, 대상 신호 파형으로부터 2 피치 주기 전의 신호 파형까지의 거리를 나타낸다.
또, 제 2 래그값 T2의 탐색 범위가, 잔차 신호의 버퍼 길이의 값을 초과하는 경우에는, 제 2 래그값 산출을 중지하여, 제 2 래그값 T2에 있어서의 복호 음성 신호를 피치 강조에 이용하지 않도록 한다. 이로서, 잔차 신호 및 복호 음성 신호의 버퍼 용량(메모리 용량)의 증가를 억제할 수 있다.
다음에, 제 1 및 제 2 이득 계수 산출부(304)에 의해, 제 1 및 제 2 래그값에 있어서의 피치 강조 필터의 이득 계수를 결정한다. 제 1 및 제 2 이득 계수 g1, g2는 수학식 (5), 수학식 (6)에 의해 산출할 수 있다.
또한, g1, g2에 관련되는 수학식 (7) 및 수학식 (8)의 값이 임의의 임계값 Thl, Th2 이하의 경우, 그 래그값에서의 피치 강조를 수행하지 않도록 한다. 이로서, 유사성이 높지 않은 복호 음성 신호를 피치 강조에 이용하는 것에 의해 청감 품질의 열화를 억제할 수 있다.
마지막으로, 피치 강조 필터(305)에 의해, 복호 음성에 대하여 수학식 (2)에 나타내는 피치 강조 필터를 실시함으로써 피치 강조를 수행하여, 피치 강조 후의 출력 신호를 얻는다.
피치 강조 후의 출력에 대해서는, 그 후 포먼트 강조, 고역 강조, 및 이득 제어의 각 처리가 실시되어, 후치 필터의 출력으로 된다. 이와 같은 처리를 수행하는 것에 의해, 청감 특성에 우수한 피치 강조를 가능하게 한 음성 복호를 수행할 수 있다.
이상과 같은 실시예 l에 의하면, 제 1 래그값 산출부(302)에 부가하여, 제 2 래그값 산출부(303)를 포함하고, 제 1 래그값 T1의 2배 근처에서 최적의 제 2 래그값 T2을 산출하며, 그 래그값 T2에서의 복호 음성 신호를 제 1 래그값에서의 복호 음성 신호에 부가하여 피치 강조에 이용함으로써, 피치 강조를 수행하는 신호 파형에 가장 유사한 제 1 래그값(1 피치 주기 전)의 신호에 부가하여, 파형의 유사성이 높은 제 2 래그값(2 피치 주기 전)에 있어서의 신호를 이용하게 되어, 과거의 복수의 유사 신호 파형을 이용한 보다 매끄러운 피치 강조를 실현할 수 있어, 복호 음성의 자연성을 손상하는 일없이 강조 정도가 높은 피치 강조를 수행할 수 있다.
(실시예 2)
도 7은, 본 발명의 실시예 2에 관한 후치 필터의 피치 강조부의 기능 블럭도이다. 실시예 2의 후치 필터는, 피치 강조 필터(405)의 입력으로서, 복호 음성 신호 대신에 LPC 역필터의 출력인 잔차 신호를 이용한다. 그 밖의 구성은 실시예 1과 동일하다.
실시예 2에서는, 제 1 및 제 2 래그값에 있어서의 잔차 신호 및 이득 계수를 이용하여 피치 강조 처리를 수행한다. 여기서, LPC 역필터(401)의 필터 특성으로서, 피치 강조 처리의 후단에서 실행되는 수학식 (9)으로 나타내는 포먼트 강조 필터의 분자 항에 상당하는 특성을 이용한다. ai(i = 1, ..., Np)는 LPC 계수, γn, γd는 포먼트 강조 정도를 제어하는 정수, l/gf는 이득 보정 항이다.
이상과 같이, 본 발명의 실시예 2에 의하면, 본 발명의 피치 강조 필터에서 이용하는 래그값 및 이득 계수 산출시에 이용하는 잔차 신호를 얻기 위한 LPC 역필터 처리가, 포먼트 강조 필터의 일부를 겸할 수 있어, 연산량의 삭감을 도모할 수 있다.
또한, 상기 실시예 1 및 2에서는, 피치 강조에 이용하는 래그값으로서 제 1 및 제 2의 2개의 래그값을 이용하는 경우에 대하여 설명하였지만, 2개 이상의 래그값을 이용하는 방법도 마찬가지로 실현할 수 있다.
또한, 그 경우에, 제 1 래그값의 1/2(혹은 1/n(n = 3, 4, ...)) 부근의 래그값을 이용하도록 하여, 제 1 래그값 산출시에 n배 피치 오류(래그값을 본래의 n배의 값으로서 잘못하여 산출함) 경우의 개선을 도모하는 것도 가능하다.
또한, 상기 실시예 l 및 2에 있어서는, 래그값 및 이득 계수 산출에 LPC 역필터 후의 잔차 신호를 이용하여 산출하는 방법에 대하여 설명하였지만, 복호 음성신호로부터 직접 구하더라도 좋다.
이상과 같이, 본 발명은, 피치 강조를 수행하는 신호 파형에 가장 유사한 제 1 래그값(1 피치 주기 전)의 신호에 부가하여, 파형의 유사성이 높은 제 2 래그값(2 피치 주기 전)에 있어서의 신호를 이용하는 것에 의해, 과거의 복수의 유사 신호 파형을 이용한 보다 매끄러운 피치 강조를 실현할 수 있어, 복호 음성의 자연성을 손상하는 일없이 강조 정도가 높은 피치 강조를 수행할 수 있다고 하는 효과를 얻을 수 있다.
또한, 본 발명은, 상술한 피치 강조 방법을 소프트웨어로 실현한 프로그램을 자기 디스크, 광자기 디스크, ROM 등의 기록 매체에 기록한 것을 이용하여 피치 강조 장치로서 동작하는 것을 포함한다.
상기 실시예에 있어서는, CELP 형식의 경우에 대하여 설명하고 있지만, 본 발명은 CELP 형식이 아닌 경우에도 적용할 수 있다.
본 출원은, 1998년 1월 26일에 출원된 일본국 특허 출원 평성 l0년 027710 호에 근거하고 있다. 그 내용은 모두 여기에 포함시켜 놓는다.
본 발명의 피치 강조 방법 및 그 장치는, 무선 통신 시스템에 있어서의 기지국 장치나 통신 단말 장치 등에 적용할 수 있다.

Claims (15)

  1. 복호 음성 또는 음성 복호로 이용되는 래그 파라미터의 적어도 하나로부터 피치 강조 대상의 신호 파형에 유사한 신호 파형까지의 제 1 래그값을 산출하고,
    상기 제 1 래그값을 기준으로 하여 상기 피치 강조 대상의 신호 파형에 유사한 다른 신호 파형까지의 다른 래그값을 하나 이상 산출하며,
    상기 복수의 래그값에서의 신호 파형을 이용하여 복호 음성의 강조를 수행하는
    피치 강조 방법.
  2. 제 1 항에 있어서,
    다른 래그값은, 제 1 래그값 또는 제 1 래그값의 정수 부분을 n 배한 값 또는 그 부근의 값인 피치 강조 방법.
  3. 복호 음성 또는 음성 복호로 이용되는 래그 파라미터의 적어도 하나로부터 피치 강조 대상의 신호 파형에 유사한 신호 파형까지의 제 1 래그값을 산출하고,
    상기 제 1 래그값을 기준으로 하여 상기 피치 강조 대상의 신호 파형에 유사한 다른 신호 파형까지의 제 2 래그값을 산출하며,
    상기 제 1, 제 2 래그값 및 상기 복호 음성으로부터 제 1 및 제 2 래그값에 대한 제 1 및 제 2 이득 계수를 산출하고,
    상기 복호 음성, 제 1 및 제 2 래그값 및 제 1 및 제 2 이득 계수를 이용하여 복호 음성의 피치 강조를 수행하는
    피치 강조 방법.
  4. 제 3 항에 있어서,
    제 2 래그값은, 제 1 래그값 또는 제 1 래그값의 정수 부분을 2배한 값을 중심으로, 소수값을 포함하는 그 전후의 래그값 후보중에서, 복호 음성 또는 그것에 관련되는 신호의 상관값 또는 그것에 관련되는 값을 최대로 하는 래그값인 피치 강조방법.
  5. 제 3 항에 있어서,
    제 2 래그값이, 래그값 산출에 이용하는 복호 음성 또는 그것에 관련되는 신호의 버퍼 길이의 값을 초과하는 경우에는, 상기 제 2 래그값에 있어서의 복호 음성 또는 그것에 관련되는 신호를 피치 강조에는 이용하지 않는 피치 강조 방법.
  6. 제 3 항에 있어서,
    복호 음성 또는 그것에 관련되는 신호의 제 1 또는 제 2 래그값에 있어서의 정규화 상관값이 임의의 임계값 이하인 경우에는, 그 래그값에 있어서의 복호 음성 또는 그것에 관련되는 신호를 피치 강조에는 이용하지 않는 피치 강조 방법.
  7. 제 3 항에 있어서,
    래그값 산출 및 상관값 산출에 이용하는 복호 음성 또는 그것에 관련되는 신호로서, 복호 음성에 대하여 LPC 역필터를 실시하여 얻어지는 잔차 신호를 이용하는 피치 강조 방법.
  8. 제 3 항에 있어서,
    복호 음성 대신에, 복호 음성에 대하여 LPC 역필터를 실시하여 얻어지는 잔차 신호를 피치 강조 필터 처리의 입력으로서 이용하는 피치 강조 방법.
  9. 청구항 1에 기재된 피치 강조 방법을 복호측의 후치 필터의 처리에 적용한 음성 복호화 방법.
  10. 복호 음성 또는 음성 복호로 이용되는 래그 파라미터의 적어도 하나로부터 피치 강조 대상의 신호 파형에 유사한 신호 파형까지의 제 1 래그값을 산출하는 제 1 래그값 산출기와,
    상기 제 1 래그값을 기준으로 하여 상기 피치 강조 대상의 신호 파형에 유사한 다른 신호 파형까지의 제 2 래그값을 산출하는 제 2 래그값 산출기와,
    상기 제 1, 제 2 래그값 및 상기 복호 음성으로부터 제 1 및 제 2 래그값에 대한 제 1 및 제 2 이득 계수를 산출하는 제 l 및 제 2 이득 계수 산출기와,
    상기 복호 음성, 제 1 및 제 2 래그값 및 제 1 및 제 2 이득 계수를 이용하여 피치 강조 필터 처리를 수행하는 피치 강조 필터
    를 포함하는 피치 강조 장치.
  11. 제 10 항에 있어서,
    복호 음성에 대하여 LPC 역필터 처리를 수행하여 잔차 신호를 구하는 LPC 역필터를 포함하며, 제 1 및 제 2 래그값 및 이득 계수의 산출에 상기 잔차 신호를 이용하는 피치 강조 장치.
  12. 복호 음성에 대하여 LPC 역필터 처리를 수행하여 잔차 신호를 구하는 LPC 역필터와,
    상기 잔차 신호 또는 음성 복호로 이용되는 래그 파라미터의 적어도 하나로부터 피치 강조 대상의 신호 파형에 유사한 신호 파형까지의 제 1 래그값을 산출하는 제 1 래그값 산출기와,
    상기 제 1 래그값 및 상기 잔차 신호로부터 상기 피치 강조 대상의 신호 파형에 유사한 다른 신호 파형까지의 제 2 래그값을 산출하는 제 2 래그값 산출기와,
    상기 제 1, 제 2 래그값 및 상기 잔차 신호로부터 제 1 및 제 2 래그값에 대한 제 1 및 제 2 이득 계수를 산출하는 제 1 및 제 2 이득 계수 산출기와,
    상기 잔차 신호, 제 1 및 제 2 래그값 및 제 1 및 제 2 이득 계수를 이용하여 피치 강조 필터 처리를 수행하는 피치 강조 필터
    를 포함하는 피치 강조 장치.
  13. 청구항 10에 기재된 피치 강조 장치를 복호측의 후치 필터의 일부에 적용한 음성 복호화 장치.
  14. 청구항 10에 기재된 피치 강조 장치를 복호측의 후치 필터의 일부에 적용한 디지털 음성 통신 장치.
  15. 컴퓨터에 의한 판독이 가능한 매체와,
    복호 음성 또는 음성 복호로 이용되는 래그 파라미터의 적어도 하나로부터 컴퓨터 프로세서에 피치 강조 대상의 신호 파형에 유사한 신호 파형까지의 제 1 래그값을 산출시키는 제 1 프로그램 명령 수단과,
    상기 제 1 래그값을 기준으로 하여 컴퓨터 프로세서에 상기 피치 강조 대상의 신호 파형에 유사한 다른 신호 파형까지의 다른 래그값을 하나 이상 산출시키는 제 2 프로그램 명령 수단과,
    컴퓨터 프로세서에 상기 복수의 래그값에서의 신호 파형을 이용하여 복호 음성의 피치를 강조시키는 제 3 프로그램 명령 수단을 포함하며,
    각 프로그램 명령 수단이 실행가능한 형식으로 상기 매체에 기억되어 있고, 관련된 프로세서에 의한 실행시에 컴퓨터 메모리에 로딩되어 컴퓨터를 움직이는 컴퓨터 프로그램 제품.
KR1019997008620A 1998-01-26 1999-01-26 피치 강조 방법 및 그 장치 KR100338606B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2771098 1998-01-26
JP98-27710 1998-01-26
PCT/JP1999/000293 WO1999038156A1 (fr) 1998-01-26 1999-01-26 Methode et dispositif d'accentuation de registre

Publications (2)

Publication Number Publication Date
KR20010005557A KR20010005557A (ko) 2001-01-15
KR100338606B1 true KR100338606B1 (ko) 2002-05-27

Family

ID=12228565

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019997008620A KR100338606B1 (ko) 1998-01-26 1999-01-26 피치 강조 방법 및 그 장치

Country Status (6)

Country Link
EP (1) EP0971337A4 (ko)
KR (1) KR100338606B1 (ko)
CN (1) CN1256000A (ko)
AU (1) AU2075099A (ko)
CA (1) CA2283202A1 (ko)
WO (1) WO1999038156A1 (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3888097B2 (ja) 2001-08-02 2007-02-28 松下電器産業株式会社 ピッチ周期探索範囲設定装置、ピッチ周期探索装置、復号化適応音源ベクトル生成装置、音声符号化装置、音声復号化装置、音声信号送信装置、音声信号受信装置、移動局装置、及び基地局装置
US7103539B2 (en) * 2001-11-08 2006-09-05 Global Ip Sound Europe Ab Enhanced coded speech
JPWO2008072701A1 (ja) * 2006-12-13 2010-04-02 パナソニック株式会社 ポストフィルタおよびフィルタリング方法
CN101266797B (zh) * 2007-03-16 2011-06-01 展讯通信(上海)有限公司 语音信号后处理滤波方法
EP2192578A1 (en) * 2007-09-21 2010-06-02 Panasonic Corporation Communication terminal device, communication system, and communication method
CN101587711B (zh) * 2008-05-23 2012-07-04 华为技术有限公司 基音后处理方法、滤波器以及基音后处理系统
CN103714824B (zh) * 2013-12-12 2017-06-16 小米科技有限责任公司 一种音频处理方法、装置及终端设备
EP2980799A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a harmonic post-filter

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60118898A (ja) * 1983-11-30 1985-06-26 富士通株式会社 音声分析方式
JP2774003B2 (ja) * 1991-12-24 1998-07-09 沖電気工業株式会社 コード励振線形予測符号化装置
US5544278A (en) * 1994-04-29 1996-08-06 Audio Codes Ltd. Pitch post-filter
JPH08211895A (ja) * 1994-11-21 1996-08-20 Rockwell Internatl Corp ピッチラグを評価するためのシステムおよび方法、ならびに音声符号化装置および方法
JPH08179795A (ja) * 1994-12-27 1996-07-12 Nec Corp 音声のピッチラグ符号化方法および装置
JPH09152897A (ja) * 1995-11-30 1997-06-10 Hitachi Ltd 音声符号化装置および音声符号化方法
JP3840684B2 (ja) * 1996-02-01 2006-11-01 ソニー株式会社 ピッチ抽出装置及びピッチ抽出方法
JP2974059B2 (ja) * 1996-07-18 1999-11-08 日本電気株式会社 ピッチポストフィルタ装置

Also Published As

Publication number Publication date
CA2283202A1 (en) 1999-07-29
WO1999038156A1 (fr) 1999-07-29
KR20010005557A (ko) 2001-01-15
AU2075099A (en) 1999-08-09
CN1256000A (zh) 2000-06-07
EP0971337A4 (en) 2001-01-17
EP0971337A1 (en) 2000-01-12

Similar Documents

Publication Publication Date Title
JP2964344B2 (ja) 符号化/復号化装置
US8214203B2 (en) Method and apparatus for recovering line spectrum pair parameter and speech decoding apparatus using same
KR100439652B1 (ko) 음성 복호화 장치, 부호 오류 보상 방법 및 기록 매체
US7606702B2 (en) Speech decoder, speech decoding method, program and storage media to improve voice clarity by emphasizing voice tract characteristics using estimated formants
US6910009B1 (en) Speech signal decoding method and apparatus, speech signal encoding/decoding method and apparatus, and program product therefor
JP2004138756A (ja) 音声符号化装置、音声復号化装置、音声信号伝送方法及びプログラム
JP3628268B2 (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
JPH07325594A (ja) 復号器において使用されるパラメータ信号アダプタの動作方法
KR100421648B1 (ko) 음성코딩을 위한 적응성 표준
JPH07129195A (ja) 音声復号化装置
US7050968B1 (en) Speech signal decoding method and apparatus using decoded information smoothed to produce reconstructed speech signal of enhanced quality
KR100338606B1 (ko) 피치 강조 방법 및 그 장치
JPH0946233A (ja) 音声符号化方法とその装置、音声復号方法とその装置
JP2000516356A (ja) 可変ビットレート音声送信システム
JPH11184498A (ja) 音声符号化/復号化方法
KR100508618B1 (ko) 피치 주기 탐색 범위 설정 장치, 피치 주기 탐색 장치,적응 음원 벡터의 생성 장치, 음성 부호화 장치, 음성복호화 장치, 음성 신호 송신 장치, 음성 신호 수신 장치,이동국 장치 및 기지국 장치
JP4343302B2 (ja) ピッチ強調方法及びその装置
JP3417362B2 (ja) 音声信号復号方法及び音声信号符号化復号方法
JP4295372B2 (ja) 音声符号化装置
JP3785363B2 (ja) 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法
JP3089967B2 (ja) 音声符号化装置
JP2002198870A (ja) エコー処理装置
JPH0786952A (ja) 音声の予測符号化方法
JP2002169595A (ja) 固定音源符号帳及び音声符号化/復号化装置
JP2001265390A (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130419

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20140421

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20150417

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20160418

Year of fee payment: 15

LAPS Lapse due to unpaid annual fee