KR940024660A

KR940024660A - 음성인식장치

Info

Publication number: KR940024660A
Application number: KR1019940007784A
Authority: KR
Inventors: 유미 다키자와
Original assignee: 모리시타 요이찌; 마쯔시다덴기산교 가부시기가이샤
Priority date: 1993-04-14
Filing date: 1994-04-14
Publication date: 1994-11-18
Also published as: US5526466A; KR0134158B1

Abstract

표준음성학습시에, 지속시간학습회로에 의해서 각각의 인식단위의 지속시간사이의 관계를 얻고, 음성인식시에, 우선 음성구간검출회로에 의해 입력음성의 시작과 종단을 검출하고, 다음에 상호관계의 입력음성구간 길이를 사용하여 입력음성에서 인식단위의 지속시간을 예측한다. 다음에, 정합수단에 의해서, 인식단위가 에측값부근의 지속시간을 가지도록, 산출된 예측값을 사용하여 표준음성과 입력음성을 정합한다.

Description

음성인식장치

본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음

제 1도는 본 발명의 실시예의 의한 음성인식장치를 도시한 블록도, 제 2도는 본 발명의 실시예에 의한 지속시간학습회로를 도시한 블록도.

Claims

음성을 인식할때에 입력음성보다 짧은 인식단위로 입력음성으로 인식하고, 이 인식단위의 각각의 인식 결과를 연속적으로 연결함으로써 얻은 최종인식결과를 출력하는 음성인식장치에 있어서, 입력음성의 시작과 종단을 검출함에 의해서 음성구간을 검출하는 음성구간검출수단과, 인식단위의 지속시간에 영햐을 주는 요인을 사용함에 의해 인식단위의 지속시간사이의 관계를 산출하는 지속시간학습수단과, 검출된 음성주기와 인식단위의 지속시간의 산출관계를 사용함에 의해, 입력음성에 대한 각각의 인식단위의 지속시간을 예측하는 지속시간예측수단과, 예측된 지속시간을 사용하여 인식결과를 정합하거나 결정하는 정합수단을 포함한것을 특징으로 하는 음성인식장치.
제 1항에 있어서,상기 지속시간학습수단은, 인식단위의 지속시간에 영향을 주는 각 요인마다 각 요인에 대한 동일범주에 속하는 인식단위의 평균지속시간을 얻음에 의해서 인식단위의 지속시간사이의 관계를 산출하는 것을 특징으로 하는 음성인식장치.
제 1항에 있어서,상기 지속시간학습수단은, 인식단위의 지속시간을 좌우하는 요인이 인식단위의 지속 시간에 영향을 주는 정도로 얻고 또한 각 요인에 대한 동일 범주에 속하는 인식단위의 평균지속시간을 얻음에 의해서 인식단위의 지속시간사이의 관계를 산출하는 것을 특징으로 하는 음성인식장치.
제 3항에 있어서, 상기 지속시간학습수단은, 각각의 요인에 대한 동일번주에 속하는 인식단위의 평균지속시간을 각각의 요인마다 구한 다음에 입력음성에 대한 음성구간길이 전체의 평균지속시간과 식(I)의 평균지속시간(f(j)(t))를 사용하여 각 인식단위의 평균지속시간사이의 비를 구하고 또한 각각의 요인마다 상기비와 함께 가증가산을 행함으로써, 음성구간의 전체길이를 1로 취하는 경우에 대해서 각각의 인식단위의 지속시간(식(1)의 S(n))을 산출하고, 지속시간예측수단은, 상기 S(n)와 음성구간의 전장(식(2)의 L)으로부터 입력음성에 대한 인식단위마다 지속시간의 예측값(식(2))을 산출하는 것을 특징으로 하는 음성인식장치.

[식(1)]

fj(n) : 요인(j)에 대한 n번째 음절로서 모든 음절의 평균지속시간.

N : 1개의 음성구간에 포함된 인식단위의 총수.

αj : 각 요인의 가중계수.

S(n) : 음성구간전장을 1로한 경우 각 인식단위에 대한 지속시간예측값.

[식(2)]

(n)=L×S(n)

(n) : n번째 인식단위에 대한 지속시간예측값.

L : 전음성구간길이
제 3항에 있어서, 상기 지속시간학습수단은, 각각의 요인에 대한 동일범주에 속하는 인식단위의 평균지속시간을 구한 다음에, 이 평균지속시간(식(3)의 fj(i))을 사용하여, 입력음력에 대한 각각의 인식단위의 지속시간을 예측하고 또한 이와같이 예측한 값과 음성구간의 전체길이사이의 비를 구함으로써, 음성구간의 전장을 1로 취하는 경우에 대해서 각 인식단위의 지속시간(식(3)의 S(n))을 산출하고, 지속시간예측수단은, 지속시간 (S(n))을 산출하고, 지속시간예측수단은, 지속시간 (S(n))과 음성구간(식(4)의 L)의 전장으로부터 입력음성에 대해서 각각의 인식단위의 지속기간의 예측값(식(4))을 산출하는 것을 특징으로 하는 음성인식장치.

[식(3)]

S(n) : 전음성구간장을 1로한 경우 각 인식단위에 대한 지속시간예측값

N : 1개의 음성구간에 포함된 인식단위의 총수

fj(n) : 요인(j)에 대한 n번째 음절로서 모든 음절의 평균지속시간.

αj : 각 요인에 대한 가중계수

[식(4)]

d(n)=L×S(n)

d(n) : n번째 인식단위에 대한 지속시간예측값

L : 전음성구간장
제 1항에 있어서, 상기 정합수단은, 각각의 음절에 대한 정합구간이 예측음절지속시간값 부근에 있도록, 인식단위에 대한 예측지속시간값을 사용하여 상기 정합이나 상기 인식결과결정을 행하는 것을 특징으로 하는 음성인식장치.
제 1항에 있어서, 인식단위에 대한 예측지속시간값을 사용하여 입력음성에서 각각의 인식단위에 대한 정합주기를 판정하는 정합구간결정수단을 부가하여 포함하고, 상기 정합수단은, 결정된 정합구간내에서 각각의 인식단위를 정합하도록, 상기 정합과 인식결과판정을 행하는 것을 특징으로 하는 음성인식장치.
제 1항에 있어서, 예측지속시간과 인식후보에 대한 정합결과사이의 차이를 산출하는 오차산출수단과, 상기 오차를 사용하여 확실성이 없는 인식후보를 제거하는 결과평가수단을 부가하여 포함한 것을 특징으로 하는 음성인식장치.

※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.