Claims (7)
음성을 입력받아 특징을 추출하는 특정 추출 수단(301); 발음사전(305)의 정보에 따라서 서브워드 모델(304)을 이용하여 단어를 모델링하는 단어 모델링 수단(303); 상기 특징 추출 수단(301)의 음성 특징과 상기 단어 모델링수단(303)의 단어 모델 정보를 입력받아 비터비 계산을 수행하여 단어를 인식하는 단어 인식 수단(302); 상기 단어 인식수단(302)의 출력을 입력받아 언어 모델(309)의 정보에 따라서 문장을 인식하는 문장 인식 수단(306)을 구비하는 음성 인식 시스템에 적용되는 방법에 있어서, 초기화 후에 마지막 프레임인지를 판단하여 마지막 프레임이면 인식 결과를 출력하고, 마지막 프레임이 아니면 서브워드단위로 비터비(Viterbi) 일차 계산을 수행하는 제1단계(401 내지 404); 및 상기 제1단계(401 내지 404) 수행 후, 단어 단위로 비터비 이차 계산을 수행하여 비터비 값을 구한 후에 언어 처리 과정을 수행하고 상기 제1단계(401 내지 404)의 마지막 프레임 판단 과정을 반복수행하는 제2단계(405,406)를 포함하는 것을 특징으로 하는 히든 마르코프 모델링 방식(HMM)의 음성인식 시스템에서의 음성 인식 방법.Specific extraction means 301 for receiving a voice and extracting a feature; Word modeling means (303) for modeling words using the subword model (304) according to the information in the pronunciation dictionary (305); Word recognition means (302) for receiving a voice feature of the feature extraction means (301) and word model information of the word modeling means (303) to perform a Viterbi calculation to recognize a word; In the method applied to the speech recognition system having a sentence recognition means 306 for receiving the output of the word recognition means 302 to recognize a sentence according to the information of the language model 309, whether the last frame after initialization A first step (401 to 404) of determining and outputting a recognition result if the last frame, and performing the Viterbi first calculation in units of subwords if not the last frame; And after performing the first steps (401 to 404), perform a Viterbi secondary calculation on a word-by-word basis to obtain a Viterbi value, and then perform a language processing process and determine the last frame determination process of the first steps (401 to 404). And a second step (405, 406) of repeating the speech recognition method in the HMM speech recognition system.
제1항에 있어서, 상기 제1단계(401 내지 404)의 비터비 일차 계산은, 매 프레임 t의 음성특징 출력값(Ot)과 해당 서브워드(sub)에만 영향을 받도록 구성한 것임을 특징으로 하는 히든 마르코프 모델링 방식(HMM)의 음성인식 시스템에서의 음성 인식 방법.The method of claim 1, wherein the Viterbi first order calculations of the first steps 401 to 404 are configured such that only the voice feature output value Ot of each frame t and the corresponding subword sub are affected. Speech recognition method in speech recognition system of modeling method (HMM).
제1항 또는 제2항에 있어서, 상기 제1단계(401 내지 404)의 비터비 일차 계산은,The Viterbi first order calculation of claim 1, wherein the first step (401 to 404) is performed.
(서브워드 sub, 프레임 t, 상태변화 ji, 프레임 t에서의 음성특징 Ot가 상태 j에서 상태 i로 변경될 때 나올 수 있는 관찰 확율 :, 상태 j에서 상태 i로 이동될 천이 확율 :)인 것임을 특징으로 하는 히든 마르코프 모델링 방식(HMM)의 음성인식 시스템에서의 음성 인식 방법.(Observation probability that can come out when subword sub, frame t, state change ji, voice feature O t in frame t changes from state j to state i: , Probability of a transition from state j to state i: Speech recognition method in a Hidden Markov Modeling (HMM) speech recognition system, characterized in that
제1항에 있어서, 상기 제2단계(405, 406)의 비터비 이차 계산은, 상기 비터비 일차 계산의 결과에 이전 단계의 비터비 값을 합하여 구하는 것임을 특징으로 하는 히든 마르코프 모델링 방식(HMM)의 음성인식 시스템에서의 음성 인식 방법.2. The Hidden Markov Modeling Method (HMM) according to claim 1, wherein the Viterbi secondary calculation of the second steps 405 and 406 is obtained by adding the Viterbi first value to the result of the Viterbi first calculation. Speech Recognition Method in Speech Recognition System.
제1항 또는 제4항에 있어서, 상기 제2단계(405, 406)의 비터비 이차 계산은,5. The Viterbi secondary calculation of claim 1, wherein the second step 405, 406 is performed.
(서브워드 sub, 프레임 t, 상태 i에서 비터비 값 :, 상태변화 ji, 비터비 일차 계산의 결과 : First_)인 것임을 특징으로 하는 히든 마르코프 모델링 방식(HMM)의 음성인식 시스템에서의 음성 인식 방법.(Viterbi value in subword sub, frame t, state i: , State change ji, result of Viterbi first order calculation: First_ Speech recognition method in a Hidden Markov Modeling (HMM) speech recognition system, characterized in that
제1항에 있어서, 상기 제1단계(401 내지 404)의 비터비 일차 계산은, 현 프레임에 해당하는 후보 단어중 첫 후보 단어를 구하는 제3단계(501); 상기 제3단계(501) 수행 후, 현 후보 단어에서 가능한 모든 서브워드에 대하여 순차적으로 현 프레임의 출력값을 근거로 일차 계산을 수행하여 현 서브워드에 저장하고 비터비 일차 계산 완료 플래그를 세트하는 제4단계(502 내지 506);및 상기 제4단계(502 내지 506) 수행 후, 마지막 후보 단어까지 상기 제4단계(502 내지 506)를 반복 수행하는 제5단계(508,509)를 포함하는 것을 특징으로 하는 히든 마르코프 모델링 방식(HMM)의 음성인식 시스템에서의 음성 인식 방법.The Viterbi first calculation of the first step (401 to 404) comprises: a third step (501) of obtaining a first candidate word among candidate words corresponding to the current frame; After performing the third step 501, the first calculation is performed on all possible subwords of the current candidate word based on the output value of the current frame, stored in the current subword, and the Viterbi first calculation completion flag is set. Fourth step (502 to 506); and after performing the fourth step (502 to 506), the fifth step (508, 509) to repeat the fourth step (502 to 506) to the last candidate word, characterized in that it comprises Speech Recognition in Hidden Markov Modeling (HMM) Speech Recognition System.
제6항에 있어서, 상기 제4단계(502 내지 506)는, 현 후보 단어로 부터 첫 서브워드를 구한 후에 서브워드의 비터비일차 계산 수행 플래그(flag)를 체크하는 제6단계(502,503); 상기 제6단계(502, 503) 수행 후, 일차 계산이 이루어지지 않았으면 현 서브워드에 대하여 비터비 일차 계산을 수행하여 현 서브워드에 저장한 후에 현 서브워드의 비터비 일차 계산 수행 완료 플래그를 세트한 다음에 마지막 서브워드인지를 판단하는 제8단계(505 내지 507); 및 상기 제8단계(505 내지 507) 수행 후, 마지막 서브워드가 아니면 다음 서브워드를 구한 후에 상기 제6단계(502, 503)의 플래그 체크 과정을 반복 수행하는 제9단계(504)를 포함하는 것을 특징으로 하는 히든 마르코프 모델링 방식(HMM)의음성인식 시스템에서의 음성인식 방법.7. The method of claim 6, wherein the fourth steps (502 to 506) include: a sixth step (502, 503) of checking a subword Viterbi first calculation performing flag after obtaining the first subword from the current candidate word; After performing the sixth step (502, 503), if the first calculation has not been performed, the Viterbi first calculation is performed on the current subword and stored in the current subword, and then the Viterbi first calculation completion flag of the current subword is stored. An eighth step (505 to 507) of determining whether or not it is the last subword after setting; And a ninth step 504 of repeatedly performing the flag check process of the sixth steps 502 and 503 after obtaining the next sub word after performing the eighth step 505 to 507. A speech recognition method in a speech recognition system of the Hidden Markov Modeling Method (HMM).
※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.※ Note: The disclosure is based on the initial application.