KR20100073161A

KR20100073161A - 고립어 엔베스트 인식결과를 위한 발화검증 방법 및 장치

Info

Publication number: KR20100073161A
Application number: KR1020080131755A
Authority: KR
Inventors: 강점자; 이윤근; 박전규; 정호영; 전형배; 정훈; 이성주; 정의석; 왕지현; 강병옥; 박기영; 김종진
Original assignee: 한국전자통신연구원
Priority date: 2008-12-22
Filing date: 2008-12-22
Publication date: 2010-07-01
Also published as: KR101217524B1; US20100161334A1; US8374869B2

Abstract

본 발명은 고립어 엔베스트 인식결과를 위한 발화검증 방법 및 장치에 있어서, 엔베스트 음성인식을 통해 단어수준에서 인식된 결과에 대해 엔베스트 발화검증을 통해서 신뢰도를 측정하고, 동적 시간 와핑에 의한 음소간 유사도를 측정하여 신뢰도와 유사도를 기반으로 음성인식의 수락/거절 또는 판단불가 등을 표시함으로써 보다 신뢰성 높은 음성인식이 가능하도록 한다.

엔베스트, 발화검증, 음성, 인식, 신뢰도, 유사도

Description

고립어 엔베스트 인식결과를 위한 발화검증 방법 및 장치{UTTERANCE VERIFICATION METHOD AND DEVICE FOR ISOLATED WORD NBEST RECOGNITION RESULT}

본 발명은 음성인식 시스템에 관한 것으로, 특히, 고립어 음성인식 시스템의 인식결과가 엔베스트(NBest) 출력 리스트를 제공하는 응용에서 엔베스트 출력 각각의 결과에 대해서 신뢰도와 유사도를 기반으로 보다 신뢰성 높은 음성인식이 가능하도록 하는 고립어 엔베스트 인식결과를 위한 발화검증 방법 및 장치에 관한 것이다.

본 연구는 지식경제부 및 정보통신연구진흥원의 IT 신성장동력핵심기술개발 사업의 일환으로 수행하였음.[2006-S-036-03, 신성장동력산업용 대용량 대화형 분산 처리 음성인터페이스 기술개발]

음성인식시스템은 응용 또는 인식 성능에 따라 음성인식 결과를 한 개 또는 여러 개의 결과를 출력한다. 일반적으로 음성인식시스템의 인식 성능이 우수한 경우, 입력 음성에 대한 유사도가 가장 높은 우도 값을 갖는 데이터를 한 개 출력하는 방식을 사용하나, 인식 성능이 떨어지는 경우, 여러 개의 출력 리스트를 제공함 으로써, 사용자가 정답을 선택하는 방식으로 서비스를 제공함으로써 음성 인식 성능 향상 효과를 갖는다.

이와 같이, 여러 개의 출력 가능한 리스트중, 몇 개의 출력 리스트를 제공하는 것을 엔베스트(Nbest)라고 하며, 출력 리스트의 갯수는 시스템의 사양과 응용에 따라 결정한다.

기존의 엔베스트 출력 리스트를 제공하는 음성인식시스템은 출력된 결과를 보고, 사용자가 정답 여부를 판단하는 방식으로 이루어져 있다. 즉, 엔베스트 출력 리스트를 제공하는 시스템은 발화 검증 기법을 제공하지 않고, 사용자에게 발화검증을 맡긴다는 의미이다.

그러나, 위와 같이 출력되는 엔베스트 리스트가 사용자가 발성한 데이터와 유사한 어휘셋으로 출력되지 않고, 단어 상호간에 서로 연관성이 전혀 없는 데이터가 출력되거나, 유사어휘들로 출력되는 경우가 있는데, 이와 같이 전혀 다른 어휘셋으로 출력되는 경우 시스템 신뢰도가 떨어지는 문제점이 있었다.

아래의 [예제 1]은 사용자 발성이 "풍민목욕탕" 인 경우에 대해 10-best 인식결과의 예를 도시한 것으로, 출력 결과들이 사용자 발성과 아주 유사하여 사용자가 판단하기에 음성인식시스템이 혼동 가능성이 있음을 인정할 수 있는 부분이다.

[예제 1]
정 답 : 풍민목욕탕
인식결과 : 풍민목욕탕, 문현목욕탕, 동문목욕탕, 광민목욕탕, 관문목욕탕
북문목욕탕, 탄현목욕탕, 양문목욕탕, 영현목욕탕, 영문목욕탕

그러나, 사용자 발성이 "청담빌라" 인 경우에 대해 10-best 인식결과의 예를 도시한 [예제 2]에서와 같이 인식결과들 간에 서로 연관성이 없는 결과가 출력되는 경우 사용자가 음성인식시스템의 신뢰도를 의심하게 된다.

[예제 2]
정 답 : 청담빌라
인식결과 : 한남클럽, 청담빌라, 용담클럽, 황금브라, 한담민박, 공간주방
동암드럼, 동아엠푸라, 한남칼라, 본컴퓨터

따라서 본 발명은 고립어 음성인식 시스템의 인식결과가 엔베스트(NBest) 출력 리스트를 제공하는 응용에서 엔베스트 출력 각각의 결과에 대해서 신뢰도와 유사도를 기반으로 보다 신뢰성 높은 음성인식이 가능하도록 하는 고립어 엔베스트 인식결과를 위한 발화검증 방법 및 장치를 제공하고자 한다.

상술한 본 발명은 고립어 엔베스트 인식결과를 위한 발화검증 방법으로서, 입력된 음성에 대해 엔베스트 음성 인식 결과를 기반으로 문맥종속 음소와 반음소 모델에 대한 우도값을 산출하는 단계와, 상기 우도값을 이용하여 엔베스트 음성 인식된 단어의 신뢰도를 측정하는 단계와, 상기 엔베스트 음성 인식된 단어에 대해 음소간 유사도를 산출하는 단계와, 상기 신뢰도를 임계치와 비교하고, 상기 유사도를 유사도 평균과 비교하는 단계와, 상기 신뢰도와 유사도 비교 결과가 모두 수락 인 경우 상기 엔베스트 음성 인식된 단어를 수락하는 단계를 포함한다.

또한, 본 발명은 고립어 엔베스트 인식결과를 위한 발화검증 장치로서, 입력된 음성의 특징벡터를 추출하고, 끝점검출을 수행하는 전처리부와, 상기 특징벡터로부터 추출되는 문맥종속 음소 모델을 참조하여 비터비 탐색을 통해 엔베스트 음성인식을 수행하는 엔베스트 음성인식부와, 상기 엔베스트 음성인식된 단어에 대해 문맥종속 음소와 음소별 혼동 확률값을 활용한 반음소 모델에 대한 우도값을 계산하며, 상기 단어에 대해 측정한 신뢰도를 임계치와 비교하고, 상기 단어에 대해 측정한 유사도를 유사도 평균과 비교한 후, 상기 신뢰도와 유사도 비교결과가 모두 수락인 경우 상기 엔베스트 음성 인식된 단어를 수락하는 엔베스트 발화검증부를 포함한다.

본 발명에서는 고립어 엔베스트 인식결과를 위한 발화검증 방법 및 장치에 있어서, 엔베스트 음성인식을 통해 단어수준에서 인식된 결과에 대해 엔베스트 발화검증을 통해서 신뢰도를 측정하고, 동적 시간 와핑에 의한 음소간 유사도를 측정하여 신뢰도와 유사도를 기반으로 음성인식의 수락/거절 또는 판단불가 등을 표시함으로써 보다 신뢰성 높은 음성인식이 가능하도록 하는 이점이 있다.

이하, 첨부된 도면을 참조하여 본 발명의 동작 원리를 상세히 설명한다. 하 기에서 본 발명을 설명함에 있어서 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.

도 1은 본 발명의 실시 예가 적용되는 음성인식시스템의 구성도를 나타낸 것으로, 본 발명의 음성인식 시스템은 시스템 제어부(102), 전처리부(104), 엔베스트 음성인식부(106), 엔베스트 발화검증부(108) 등을 포함한다.

이하, 도 1을 참조하여 음성인식 시스템 각 부에서의 동작을 상세히 설명하기로 한다.

먼저, 사용자(100)가 음성인식 기능이 탑재된 음성인식 시스템을 사용하여 음성을 입력하면 시스템 제어부(102)에서 이를 받아, 전처리부(104)에 전달한다. 전처리부(104)에서는 잡음 처리 및 음성구간 검출을 위한 끝점검출과 특징추출을 수행하여 엔베스트 음성인식부(106)에 전달하고, 엔베스트 음성인식부(106)는 문맥종속 음소 음향모델(26)을 참조하여 비터비 탐색을 통해 엔베스트 음성인식을 수행하고, 그 결과를 엔베스트 발화검증부(108)로 전달한다.

그러면, 엔베스트 발화검증부(108)는 음성인식된 결과에 대해 신뢰도 측정을 수행하게 되며, 이와 같은 신뢰도 측정을 위하여 반음소 모델(24)과 사전에 훈련 데이터로부터 구해진 음소별 혼동 확률값(28)을 이용한다. 즉, 엔베스트 발화검증부(108)는 LLR(Log Likelihood Ratio)기반의 신뢰도 측정을 수행하며, 이때 분류기로 SVM(Support Vector Machine)을 사용한다. 그리고, 인식된 결과의 유사도 측정을 위하여 동적 시간 와핑(DTW : Dynamic Time Warping)에 의한 유사도를 측정하여, 분류기의 결과와 유사도 결과를 비교한 후, 음성인식된 결과를 수락(110) 또는 거절(112) 할 것인지, 수락 또는 거절의 판단이 명확하지 않은 경우에는 사용자가 판단할 수 있도록 판단불가(114)를 표시하여 사용자가 판단할 수 있도록 한다.

도 2는 본 발명의 실시 예에 따른 엔베스트 발화검증의 신뢰도 측정을 위해 사용되는 모델 생성과정을 도시한 것으로, 입력으로 특징벡터(20)을 사용하여 문맥독립 음소 음향모델(22)을 생성하고, 문맥종속 음소 음향모델(26)이 생성된다. 훈련과정 중에 각각 생성되는 문맥독립 음소 음향모델(22)은 분류화 작업을 통해 반음소 모델(24)을 생성하여 신뢰도 측정에 사용한다. 문맥종속 음소 음향모델(26)은 도 1의 엔베스트 음성인식부(106)에서 사용한다. 반음소 모델(24)은 도 1의 엔베스트 발화검증부(108)에서 사용한다.

도 3a 내지 도 3b는 본 발명의 실시 예에 따른 엔베스트 발화검증을 위한 세부 처리 흐름도를 도시한 것이다. 이하, 도 1, 도 2 및 도 3a 내지 도 3b를 참조하여 본 발명의 실시 예를 상세히 설명하기로 한다.

먼저, 도 1의 엔베스트 음성인식부(106)에서 엔베스트 단어, 음소 수준 인식결과를 출력하면, 엔베스트 발화검증부(108)는 엔베스트 단어, 음소 인식 결과를 수신하고, 엔베스트 단어/음소 기반으로 발화검증을 시작한다(S300).

이어, 엔베스트 발화검증부(108)는 출력된 단어의 구간정보와 도 2의 과정에서 얻어진 문맥종속 음소 모델을 적용하여 단어를 구성하고 있는 음소별 우도값을 계산한다(S302).

이때, 문맥종속 음소에 대한 우도값은 아래의 [수학식 1]에서와 같이 산출된다.

문맥종속음소에 대한 우도값

즉, 위 [수학식 1]에서와 같이, 문맥종속 음소에 대한 우도값을 구하기 위해서는 현재 음소의 우도값에서 이 기저 음소가 갖는 평균값으로 뺀 후, 표준편차로 나누어 계산하게 된다.

이어, 엔베스트 발화검증부(108)는, 도 2과정에서 얻어진 반음소 모델(24)을 이용하여 반음소 모델에 대한 우도값을 계산한다(S304). 이때, 반음소 모델에 대한 우도값은 아래의 [수학식 2]에서와 같이 산출된다.

반음소 모델에 대한 우도값

즉, 위 [수학식 2]에서와 같이, 반음소 모델에 대한 우도값을 계산하기 위해서는 현재 음소에 대한 반음소 모델에 대한 우도값에서 현재 음소에 대한 반음소 모델에 대한 평균값을 뺀 후, 현재 음소에 대한 반음소 모델에 대한 표준편차로 나누어 계산하게 된다.

위와 같이, 문맥종속 음소에 대한 우도값과 반음소 모델에 대한 우도값 계산이 완료되면, 엔베스트 발화검증부(108)는 음소 수준 신뢰도 측정을 수행한다(S306).

영가설 모델에 대한

은 문맥종속 모델의 현재 음소의 확률값, 대립 가설 모델에 대한

의 확률값은 반음소 모델(24)을 사용한 확률값을 의미한다.

음소 i에 대해 프레임 길이로 정규화한 신뢰도 측정을 수식으로 표현하면 아래 [수학식 3]과 같고, 음소별 동적 확률값의 범위를 제한하기 위하여 [수학식 4]의 시그모이드 함수를 사용한다.

즉, 위 [수학식 3, 4]에서와 같이, 음소수준 신뢰도 측정은 문맥종속 음소에 대한 우도값에서 반음소 모델에 대한 우도값을 뺀 후, 해당 음소가 갖는 프레임수로 나누어 계산한 후, 시그모이드 함수를 취해 사용한다.

이와 같이, 음소 수준의 신뢰도 값이 구해지면, 엔베스트 발화검증부(108)는 단어수준 신뢰도 측정을 수행한다(S308).

이때, 단어수준 신뢰도 측정은 아래의 [수학식 5]에서와 같이 산출된다.

단어수준 신뢰도

즉, 위 [수학식 5]에서와 같이, 단어수준 신뢰도 측정은 반음소 모델에 대한 우도값을 단어가 갖는 음소의 수로 나누어 산출된 값을 문맥 종속에 대한 우도값에서 감산하여 산출하게 된다.

위, 단어수준 신뢰도 측정을 수식으로 표현하면 아래의 [수학식 6]과 같다. [수학식 6]에서 N은 단어를 구성하고 있는 음소의 수를 의미한다.

위와 같이, 단어수준 신뢰도 측정이 완료되면, 엔베스트 발화검증부(108)는 분류기를 사용하거나, 특정 신뢰도 값을 사용하여 임계치를 각각 설정하고, 구해진 신뢰도 값과 임계치 값을 비교한다(S310).

단어수준 신뢰도 값이 임계치 값보다 크면 해당 단어는 수락의 의미로 참값을 저장하고(S312), 임계치 값보다 작으면 거절의 의미로 거짓값을 저장한 다(S314). 이때, 분류기의 입력으로 사용되는 신뢰도 측정 파라미터는 다음의 [표 1]에 정리된 특징이 사용된다.

[표 1]

즉, 위와 같은 [표 1]의 신뢰도 측정 파라미터를 사용하여 SVM 훈련을 하고, 훈련된 모델을 사용하여 신뢰도 값과 임계치 값을 비교한다. 단어수준 신뢰도 값이 임계치보다 크면 수락의 의미로 참이란 정보를 저장하고(S312), 신뢰도 값이 임계치보다 작으면 거절의 의미로 거짓이란 정보를 저장한다(S314).

이어, 엔베스트 발화검증부(108)는 분류기를 통해 결정된 값을 저장하는 것과는 별도로, 엔베스트 인식결과에 대해 음소간 유사도를 계산하고(S316), 아래의 [수학식 6]에서와 같이 유사도 평균을 계산한다(S318).

유사도 평균

즉, 위 [수학식 7]에서와 같이 유사도 계산을 위해서는 [도 1]의 음소별 혼동확률값(20)을 비용(cost)으로 사용하여 엔베스트 인식결과 각각에 대한 유사도(distance)를 구하여, 유사도 합을 구한 후, 엔베스트 인식결과의 유사도 합을 엔베스트 수로 나누어 구한다.

이어, 엔베스트 발화검증부(108)는 해당 단어에 대한 유사도와 엔베스트 단어 유사도 평균값을 비교하여(S320), 해당 단어 유사도가 평균 유사도보다 작으면 수락 정보를 저장하고(S322), 해당 단어 유사도가 평균 유사도보다 크면 거절 정보를 저장한다(S324).

그런 후, 엔베스트 발화검증부(108)는 위와 같이 분류기를 사용하여 결정된 정보와 유사도에 의해 결정된 정보를 결합하여 비교판단을 수행한다(S326).

이때 만일, 신뢰도 값이 수락이고, 유사도 값도 수락이면 해당 음성 인식된 단어를 수락하고(S328), 신뢰도 값이 거절이고, 유사도도 거절이면 해당 음성 인식된 단어를 거절로 판단한다(S330). 그렇지 않고, 신뢰도 값이 거절이고, 유사도는 수락이거나, 신뢰도 값이 수락이고, 유사도가 거절이면 해당 음성 인식된 단어에 대해서는 판단불가로 판단하도록 하여(S332) 사용자 동작을 기다린다(S334).

상기한 바와 같이, 본 발명에서는 고립어 엔베스트 인식결과를 위한 발화검증 방법 및 장치에 있어서, 엔베스트 음성인식을 통해 단어수준에서 인식된 결과에 대해 엔베스트 발화검증을 통해서 신뢰도를 측정하고, 동적 시간 와핑에 의한 음소간 유사도를 측정하여 신뢰도와 유사도를 기반으로 음성인식의 수락/거절 또는 판단불가 등을 표시함으로써 보다 신뢰성 높은 음성인식이 가능하도록 한다.

한편 상술한 본 발명의 설명에서는 구체적인 실시 예에 관해 설명하였으나, 여러 가지 변형이 본 발명의 범위에서 벗어나지 않고 실시될 수 있다. 따라서 발명의 범위는 설명된 실시 예에 의하여 정할 것이 아니고 특허청구범위에 의해 정하여져야 한다.

도 1은 본 발명의 실시 예에 따른 고립어 엔베스트 인식결과를 위한 발화검증 장치의 블록 구성도,

도 2는 본 발명의 실시 예에 따른 모델생성 과정 예시도,

도 3a 내지 도 3b는 본 발명의 실시 예에 따른 고립어 엔베스트 인식결과를 위한 발화검증 처리 흐름도.

<도면의 주요 부호에 대한 간략한 설명>

102 : 시스템 제어부 104 : 전처리부

106 : 엔베스트 음성인식부 108 : 엔베스트 발화검증부

26 : 문맥종속 음소음향 모델 24 : 반음소 모델

28 : 음소별 혼동확률값

Claims

고립어 엔베스트 인식결과를 위한 발화검증 방법으로서,

입력된 음성에 대해 엔베스트 음성 인식 결과를 기반으로 문맥종속 음소와 반음소 모델에 대한 우도값을 산출하는 단계와,

상기 우도값을 이용하여 엔베스트 음성 인식된 단어의 신뢰도를 측정하는 단계와,

상기 엔베스트 음성 인식된 단어에 대해 음소간 유사도를 산출하는 단계와,

상기 신뢰도를 임계치와 비교하고, 상기 유사도를 유사도 평균과 비교하는 단계와,

상기 신뢰도와 유사도 비교 결과가 모두 수락인 경우 상기 엔베스트 음성 인식된 단어를 수락하는 단계

포함하는 고립어 엔베스트 인식결과를 위한 발화검증 방법.
제 1 항에 있어서,

상기 비교단계는, 상기 신뢰도가 상기 임계치보다 크면 상기 엔베스트 음성 인식된 단어를 결과로 수락하는 단계와,

상기 신뢰도가 상기 임계치보다 작으면 상기 엔베스트 음성 인식된 단어를 결과로 거절하는 단계와,

상기 유사도가 상기 유사도 평균보다 작으면 상기 엔베스트 음성 인식된 단어를 결과로 수락하는 단계와,

상기 유사도가 상기 유사도 평균보다 크면 상기 엔베스트 음성 인식된 단어를 결과로 거절하는 단계

를 포함하는 고립어 엔베스트 인식결과를 위한 발화검증 방법.
제 1 항에 있어서,

상기 방법은,

상기 신뢰도와 유사도 비교 결과가 모두 거절인 경우 상기 엔베스트 인식된 단어를 거절하는 단계

를 더 포함하는 고립어 엔베스트 인식결과를 위한 발화검증 방법.
제 1 항에 있어서,

상기 방법은,

상기 신뢰도와 유사도 비교 결과 중 어느 하나가 수락이고, 다른 하나가 거절인 경우 상기 엔베스트 음성 인식된 단어에 대한 판단 불가를 결정하는 단계

를 더 포함하는 고립어 엔베스트 인식결과를 위한 발화검증 방법.
제 1 항에 있어서,

상기 문맥종속 음소에 대한 우도값은,

아래의 [수학식]에서와 같이 계산되는 고립어 엔베스트 인식결과를 위한 발화검증 방법.

[수학식]

문맥종속 음소에 대한 우도값
제 1 항에 있어서,

상기 반음소 모델에 대한 우도값은,

아래의 [수학식]에서와 같이 계산되는 고립어 엔베스트 인식결과를 위한 발화검증 방법.

[수학식]

반음소 모델에 대한 우도값
제 1 항에 있어서,

상기 엔베스트 음성 인식된 단어의 신뢰도는,

아래의 [수학식]에서와 같이 계산되는 고립어 엔베스트 인식결과를 위한 발화검증 방법.

[수학식]

단어수준 신뢰도
제 1 항에 있어서,

상기 유사도 평균은,

아래의 [수학식]에서와 같이 계산되는 고립어 엔베스트 인식결과를 위한 발화검증 방법.

[수학식]

유사도 평균
제 1 항에 있어서,

상기 엔베스트 음성 인식은,

입력된 음성의 특징벡터로부터 추출된 문맥종속 음소 모델을 참조하여 비터비 탐색을 통해 수행되는 고립어 엔베스트 인식결과를 위한 발화검증 방법.
고립어 엔베스트 인식결과를 위한 발화검증 장치로서,

입력된 음성의 특징벡터를 추출하고, 끝점검출을 수행하는 전처리부와,

상기 특징벡터로부터 추출되는 문맥종속 음소 모델을 참조하여 비터비 탐색을 통해 엔베스트 음성인식을 수행하는 엔베스트 음성인식부와,

상기 엔베스트 음성인식된 단어에 대해 문맥종속 음소와 반음소 모델에 대한 우도값을 계산하며, 상기 단어에 대해 측정한 신뢰도를 임계치와 비교하고, 상기 단어에 대해 측정한 유사도를 유사도 평균과 비교한 후, 상기 신뢰도와 유사도 비교결과가 모두 수락인 경우 상기 엔베스트 음성 인식된 단어를 수락하는 엔베스트 발화검증부

를 포함하는 고립어 엔베스트 인식결과를 위한 발화검증 장치.
제 10 항에 있어서,

상기 엔베스트 발화검증부는,

상기 신뢰도가 상기 임계치보다 크면 상기 엔베스트 음성 인식된 단어를 결과로 수락하고, 상기 임계치보다 작으면 상기 엔베스트 음성 인식된 단어를 결과로 거절하는 고립어 엔베스트 인식결과를 위한 발화검증 장치.
제 10 항에 있어서,

상기 엔베스트 발화검증부는,

상기 유사도가 상기 유사도 평균보다 작으면 상기 엔베스트 음성 인식된 단어를 결과로 수락하고, 상기 유사도 평균보다 크면 상기 엔베스트 음성 인식된 단어를 결과로 거절하는 고립어 엔베스트 인식결과를 위한 발화검증 장치.
제 10 항에 있어서,

상기 엔베스트 발화검증부는,

상기 신뢰도와 유사도 비교 결과가 모두 거절인 경우 상기 엔베스트 인식된 단어를 거절하는 고립어 엔베스트 인식결과를 위한 발화검증 장치.
제 13 항에 있어서,

상기 엔베스트 발화검증부는,

상기 신뢰도와 유사도 비교 결과 중 어느 하나가 수락이고, 다른 하나가 거절인 경우 상기 엔베스트 음성 인식된 단어에 대한 판단 불가를 결정하는 고립어 엔베스트 인식결과를 위한 발화검증 장치.
제 10 항에 있어서,

상기 문맥종속 음소에 대한 우도값은,

아래의 [수학식]에서와 같이 계산되는 고립어 엔베스트 인식결과를 위한 발화검증 장치.

[수학식]

문맥종속 음소에 대한 우도값
제 10 항에 있어서,

상기 반음소 모델에 대한 우도값은,

아래의 [수학식]에서와 같이 계산되는 고립어 엔베스트 인식결과를 위한 발화검증 장치.

[수학식]

반음소 모델에 대한 우도값
제 10 항에 있어서,

상기 엔베스트 음성 인식된 단어의 신뢰도는,

아래의 [수학식]에서와 같이 계산되는 고립어 엔베스트 인식결과를 위한 발화검증 장치.

[수학식]

단어수준 신뢰도
상기 유사도 평균은,

아래의 [수학식]에서와 같이 계산되는 고립어 엔베스트 인식결과를 위한 발화검증 장치.

[수학식]

유사도 평균