KR970072718A

KR970072718A - 유성음/무성음을 판정하기 위한 방법과 장치 그리고 음성을 부호화하기 위한 방법

Info

Publication number: KR970072718A
Application number: KR1019970012912A
Authority: KR
Inventors: 가즈유끼 이이지마; 마사유끼 니시구찌; 준 마쯔모또; 시로 오모리
Original assignee: 이데이 노브유끼; 소니 가부시끼가이샤
Priority date: 1996-04-15
Filing date: 1997-04-08
Publication date: 1997-11-07
Also published as: JPH09281996A; CN1173690A; US6023671A; JP3687181B2

Abstract

입력음성신호가 유성음인지 무성음인지를 판정하기 위한 유성음/무성음 판별용 장치와 방법. 유성음/무성음(V/UV)을 판별하기 위한 파라미터가 단순화된 알고리즘에 의해 고정밀도가 V/UV 판별을 수행하기 위해서 광범위하게 판정된다. 입력음성신호에 대한 유성음/무성음(V/UV) 판별용 파라미터로서, 입력음성신호의 프레임평균에너지(lev), 정규화 자기상관 피크값(r0r), 스펙트럼 유사도(pos), 영교차수(nZero), 그리고 피치래그(pch)가 입력단자(11∼15)로 공급된다. 만약 이러한 파라미터들이 x로 나타내어진다면, 이러한 파라미터들은 다음의 식으로 표현되는 시그모이드함수 g(x)에 의해 함수계산회로(31∼35)들에 의해 변환된다.

g(x)=A/(1+exp(-(x-b)/a))

여기서, A, a, 그리고 b는 상수이다. 시그모이드함수 g(x)에 의해 변환된 파라미터들을 이용하여서, 유성음/무성음이 V/UV 판별회로(26)에 의해 판별된다.

Description

유성음/무성음을 판정하기 위한 방법과 장치 그리고 음성을 부호화하기 위한 방법

본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음

제2도는 본 발명에 근거해서 음성 부호화 방법을 수행하기 위한 음성신호 부호화 장치의 기본 구조를 나타내는 블록도이다.

Claims

입력음성신호가 유성음인지 무성음인지를 판정하기 위한 방법에 있어서, 입력음성신호에 대해 유성음/무성음 판정을 하기 위한 파라미터(x)를 다음의 식으로 표현되는 시그모이드함수 g(x)에 의해 변환한다

g(x)=A/(1+exp(-(x-b)/a))

여기서, A, a, 그리고 b는 상수이고, 이 시그모이드함수에 의해 변환된 파라미터를 이용하여 유성음/무성음 판별하는 것을 특징으로 하는 입력음성신호가 유성음인지 무성음인지를 판정하기 위한 방법.
제1항에 있어서, 복수개의 직선으로 시그모이드함수 g(x)를 근사화할 때 얻어지는 함수g'(x)에 의해 파라미터(x)가 변환되고, 변환된 파라미터를 이용하여 유성음/무성음이 판별되는 것을 특징으로 하는 입력음성 신호가 유성음인지 무성음인지를 판정하기 위한 방법.
제1항에 있어서, 입력음성신호의 프레임평균에너지, 정규화 자기상관 피크값, 스펙트럼 유사도, 영교차수, 그리고 피치주기 중 적어도 하나가 유성음/무성음 판별용 파라미터로 이용되는 것을 특징으로 하는 입력음성 신호가 유성음인지 무성음인지를 판정하기 위한 방법.
제1항에 있어서, 유성음/무성음 판별용 파라미터로서 입력음성신호(lev)의 프레임평균에너지, 정규화 자기상관 피크값(r0r), 스펙트럼 유사도(pos), 영교차수(nZero), 그리고 피치래그(pch)가 이용되고, 유성음에 대한 셈블런스를 나타내고 이러한 파라미터에 근거한 함수가 각각 pLev(lev), pR0r(r0r), pPos(pos, pNZero, nZero), 그리고 pPch(pch)로 표현된다면, 이러한 함수를 이용한 유성음에 대한 최종 셈블런스를 표현하는 함수f(lev,r0r,pos,nZero,pch)는 다음의 식으로 계산된다.

f(lev,r0r,pos,nZero,pch)=((αpRor(r0r)+βpLev(lev)/(α+β)

×pRos(pos)×pNZero(nZero)×pPch(pch))

여기서, α와 β는 상수인 것을 특징으로 하는 입력음성신호가 유성음인지 무성음인지를 판정하기 위한 방법.
입력음성신호가 유성음인지 무성음인지를 판정하기 위한 장치에 있어서, 다음의 식으로 표현되는 시그모이드함수 g(x)에 의해서, 입력음성신호에 대해 유성음/무성음 판정용 파라미터(x)를 변환하기 위한 함수 계산수단

g(x)=A/(1+exp(-(x-b)/a))

여기서 A,a, 그리고 b는 상수이며, 함수 출력값을 생성하기 위한 것이다. 그리고 상기 함수 계산 수단에 의해 시그모이드함수 g(x)에 근거하여 얻어진 값을 이용하여 유성음/무성음을 판별하기 위한 수단으로 구성되는 것을 특징으로 하는 입력음성신호가 유성음인지 무성음인지를 판정하기 위한 장치.
입력음성신호가 시간영역에서 프레임단위로 구분되고 프레임단위로 부호화되는 입력음성신호를 부호화하기 위한 방법에 있어서, 다음의 식으로 표현되는 시그모이드함수 g(x)에 의해서, 입력음성신호에 대한 유성음/무성음 판정용 파라미터(x)를 변환한다.

g(x)=a/(1+exp(-(x-b)/a))

여기서 A,a 그리고 b는 상수이고, 이 시그모이드함수에 의해 변환된 파라미터를 이용하여 유성음/무성음을 판별하고, 그리고 유성음이라고 구해진 입력음성신호부분에 대해 유성음/무성음 판별의 결과에 근거하여 사인파 분석 부호화를 행하는 것을 특징으로하는 입력음성신호가 시간영역의 단위로 프레임단위로 구분하고 프레임단위로 부호화되는 입력음성신호를 부호화하기 위한 방법.
제6항에 있어서, 복수개의 직선으로 시그모이드함수 g(x)를 근사화하여 얻어진 함수 g'(x)에 의해 파라미터(x)가 변환되고, 이 변환된 파라미터를 이용하여 유성음/무성음이 판별되는 것을 특징으로 하는 음성 부호화 방법.
제6항에 있어서, 무성음이라고 구해진 입력음성신호부분에 대해서는, 합성에 의한 분석법을 이용한 최적벡터의 폐루프 탐색에 의해서, 유성음/무성음 판별의 결과에 근거하여 시간영역 파형이 벡터-양자화되는 것을 특징으로 하는 음성 부호화방법.

※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.