KR940009929A

KR940009929A - 음성 정보 인식 장치 및 그 작동 방법

Info

Publication number: KR940009929A
Application number: KR1019930021765A
Authority: KR
Inventors: 프라사드 마이크킬리네니 라젠드라
Original assignee: 찰즈 엘. 워른; 아메리칸 텔리폰 앤드 텔레그라프 캄파니
Priority date: 1992-10-30
Filing date: 1993-10-20
Publication date: 1994-05-24
Also published as: FI934813A0; EP0595541A1; JPH06208390A; CA2107317A1; AU657064B2; FI934813A; AU5023393A

Abstract

구음의 스트링내에서 문자 및 숫자 겸용 정보를 인식하기 위한 장치 및 방법, 상기 장치는 기준 구, 단어, 문자 및 숫자의 음으로 이루어진 음소(1001)의 음소 스트링(1002)으로서 기록된 기준문자 및 숫자겸용 정보가 기억된 데이터 베이스 구조(10)를 갖는다. 동작에서, 상기 장치는 수신된 구음을 기억된 기준 구, 단어, 문자 및 숫자에 비교하고 전체 스코어(120)를 기준 구, 단어, 문자 및 숫자에 따른 구음의 근접을 나타내는 각 비교에 할당함에 의해서 구음의 수신에 응답한다. 상기 장치는 최고 전체 스코어를 선택해서 구음을 선택된 기준구, 단어, 문자 또는 숫자의 각 음소와 비교한다. 각 비교된 음소에 할당된 스코어는 선택된 기준 구, 단어, 문자 및 숫자로서 수신된 구음의 유효성을 결정하기 위해 요약된다.

Description

음성 정보 인식 장치 및 그 작동 방법.

본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음

제1도는 본 발명의 원리를 실현하는 음성 인식 시스템의 도시도,

제2도는 제1도에 도시된 음성 인식 시스템의 작동을 제어하기 위한 음성 인식 알고리즘의 도시도,

제3도는 제1도에 도시된 음성 인식 시스템의 소프트웨어 배치 신경 회로망.

Claims

사용자 구음(user spoken sounds)의 스트링에서 정보를 인식하기 위한 장치에 있어서, 수신된 구음을 음소스트링(a string of phonemes)으로 각각 표시된 기억된 기준 모델과 비교하고 전체 스코어를 각각의 기준 모델에 따른 구음의 근접을 나타내는 각 비교에 할당하는 수단(10,11,12)과, 최고 전체 스코어(120)에 할당된 기준 모델중 하나를 선택해서 구음을 선택된 기준 모델의 각 음소화 비교하며, 서브스코어(121,12n)를 선택된 모델의 각 비교된 음소에 할당하여 각 음소 비교 서브 스코어를 인가된 스코어를 요약하고 요약된 서브 스코어에 따라 선택된 모델과 같은 수신된 구음의 유효성을 결정하는 회로망(12000)에 인가하는 수단(10,11,12)을 포함하는 음성 정보 인식 장치.
제1항에 있어서, 상기 비교하고 할당하는 수단은, 음소화 같은 미리 규정된 기준 구(phrases), 단어(words), 문자(characters) 및 숫자로 이루어진 모델 및 기준 구, 단어, 문자 및 숫자의 음을 식별하는 음소스트링을 기억하는 데이터 베이스를 포함하는 음성 정보 인식 장치.
제1항에 있어서, 상기 비교하고 할당하는 수단은, 사용자 구음의 수신에 응다해서 수신된 구음을 각각 기억된 기준 구, 단어, 문자 및 숫자에 비교하고 전체 스코어를 비교된 기준 구, 단어, 문자 및 숫자로 이루어진 음소스트링에 따른 구음의 근접을 나타내는 각 비교에 할당하는 수단을 포함하는 음성 정보 인식 장치.
제3항에 있어서, 상기 선택해서 비교하고 할당하는 수단은, 상기 기준 구, 단어, 문자 및 숫자의 선택에 응답해서 구음을 선택된 기준 구, 단어, 문자 및 숫자로 이루어진 음소 스트링의 각 음소에 비교하고, 서브 스코어를 각 음소에 따른 구음의 근접을 나타내는 각 비교된 음소에 할당하는 수단을 포함하는 음성 정보 인식 장치.
제1항에 있어서, 상기 선택해서 비교하고 할당하는 수단은, 각각 상기 음소 서브 스코어 중 하나를 수신하며 상기 입력 서브 스코어를 요약해서 상기 요약된 서브 스코어의 등급으로 출력 데이터를 구동시키기 위한 다수의 입력을 가진 신경 회로망을 포함하는데, 상기 출력 데이터는 선택된 기준 구, 단어, 문자 및 숫자에 따른 구음의 근접을 나타내는 음성 정보 인식 장치.
사용자 구음의 스트링에서 정보를 인식하기 위해 실시간에서 음성 인식 자이를 작동시키는 방법에 있어서, 수신된 사용자 구음을 음소 스트링에 의해 표시된 기억된 기준 모델과 비교하고, 전체 스코어를 기준 모델에 따른 구음의 근접을 나타내는 각 비교에 할당하는 단계와, 최고 전체 스코어에 할당된 기준 모델 중 하나를 선택해서 서브 스코어를 선택된 모델의 각 비교된 음소에 할당함에 의해서 구음을 선택된 기준 모델의 각 음소와 비교하며, 음소 서브 스코어를 요약해서 요약된 스코어에 따라 선택된 기준 모델로서 수신된 구음의 유효성을 결정하는 단계로 이루어진 음성 인식 장치 작동방법.
제6항에 있어서, 상기 비교하고 할당하는 단계는, 수신된 구음을 각각 기억된 기준 구, 단어, 문자 및 숫자와 비교하고, 전체 스코어를 비교된 기준 구, 단어, 문자 및 숫자로 이루어진 음소에 따른 구음의 근접을 나타내는 각 비교에 할당하는 단계로 이루어진 음성 인식 장치 작동 방법.
제6항에 있어서, 상기 선택해서 비교하고 요약하는 단계는, 구음을 선택된 기준 구, 단어, 문자 및 숫자로 이루어진 음소 스트링의 각 음소와 비교하고 서브 스코어를 비교된 음소에 따른 구음의 근접을 나타내는 각 비교된 음소에 할당하는 단계로 이루어진 음성 인식 장치 작동 방법.
제6항에 있어서, 상기 선택해서 비교하고 요약하는 단계는, 음소 서브 스코어를 신경 회로망에 인가하고선택된 기준 구, 단어, 문자 및 숫자에 따른 구음의 근접을 나타내는 상기 음소 서브 스코어의 등급으로 출력데이타를 구동시키는 단계로 이루어진 음성 인식 장치 작동 방법.
제9항에 있어서, 상기 선택해서 비교하고 요약하는 단계는, 신경 회로망의 구동된 출력 데이터를 설정된 임계와 매칭시키고, 매칭자가 설정된 임계의 규정 범위내에 있을 때 선택된 기준 구, 단어, 문자 및 숫자 사용자 패스워드로서 사용자 구음을 식별하는 단계로 이루어진 음성 인식 장치 작동 방법.

※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.