KR19980070329A

KR19980070329A - 사용자 정의 문구의 화자 독립 인식을 위한 방법 및 시스템

Info

Publication number: KR19980070329A
Application number: KR1019980000030A
Authority: KR
Inventors: 라멜린감코임베토르에스.
Original assignee: 윌리엄비.켐플러; 텍사스인스트루먼츠인코포레이티드
Priority date: 1997-01-02
Filing date: 1998-01-03
Publication date: 1998-10-26
Also published as: JPH10198396A; EP0852374A3; JP2007233412A; EP0852374A2; US6058363A

Abstract

사용자 정의 문구의 화자 독립 인식을 위한 아웃 오브 보케뷸러리 스코어를 결정하는 방법 및 시스템은 인롤먼트 그래머(36)를 이용하여 화자 독립(SI) 인식 모델(34) 셋트를 갖는 사용자 정의 문구(38)를 포함한다. 인롤먼트 그래머(36)를 이용하여 구두 문구의 특징을 SI 인식 모델(34)에 비교함으로써 구두 문구의 인롤먼트 그래머 스코어를 결정할 수 있다(92). 인롤먼트 그래머 스코어는 아웃 오브 보케뷸러리 스코어를 생성하도록 페널라이즈될 수 있다(94).

Description

사용자 정의 문구의 화자 독립 인식을 위한 방법 및 시스템

본 발명은 일반적으로 음성 처리 분야에 관한 것으로, 특히 사용자 정의 문구(user-defined phrases)의 화자 독립 인식을 위한 방법 및 시스템에 관한 것이다.

음성 기반 신속 다이얼링과 같은 음성 작동 사용자 주문가능 응용에 대한 요구가 급증하고 있다. 인식을 위해 사용되는 템플레이트는 화자 독립 또는 화자 종속일 수 있다. 화자 종속 템플레이트는 화자의 발성으로부터 도출된 음향 모델이다. 전형적으로, 화자 종속 템플레이트는 사용자 정의 문구가 기록되어 아웃 오브 보케뷸러리 리젝션(out-of-vocabulary rejection)을 제공하는 가비지(garbage) 모델을 채용한다. 화자 종속 템플레이트는 통상적으로 각 문구와 추가된 사용자에 따라서 증가하는 대량의 메모리를 필요로 한다는 점에서 문제가 된다.

화자 독립 템플레이트는 고정 음향 모델을 이용하고 사용자 정의 문구들에 대해서 겨우 수백 바이트의 저장 장치를 필요로 할 수 있다. 그 결과, 화자 독립 템플레이트는 메모리 저장 장치를 아주 조금만 증가시켜도 많은 수의 사용자들과 사용자 정의 문구들을 수용할 수 있다. 그러나, 화자 독립 템플레이트가 가지고 있는 문제는 가비지 모델이 화자 독립 환경에서는 잘 기능을 하지 않는다는 것이다. 이는 부족한 아웃 오브 보케뷸러리 리젝션을 야기시키는데, 이는 잘못된 전화 번호를 다이얼링 하는 것과 같은 비용이 드는 에러를 야기시키는 원인이 될 수 있다.

따라서, 우수한 아웃 오브 보케뷸러리 리젝션 능력을 갖는 개선된 화자 독립 인식 시스템에 대한 기술이 요구되고 있다. 본 발명은 종래의 시스템과 관련된 문제들을 실제로 감소시키거나 제거하는 화자 독립 인식 시스템 및 방법을 제공한다.

본 발명에 따르면, 먼저 인롤먼트 그래머(enrollment grammar)를 이용하여 화자 독립(SI) 인식 모델 셋트를 갖는 사용자 정의 문구를 인롤함으로써 사용자 정의 문구의 화자 독립 인식을 위한 아웃 오브 보케뷸러리 스코어를 결정할 수 있다. 그런 다음, 인롤먼트 그래머를 이용하여 구두 문구(spoken phrase)의 특징을 SI 인식 모델에 비교함으로써 구두 문구의 인롤먼트 그래머 스코어를 결정할 수 있다. 인롤먼트 그래머 스코어는 아웃 오브 보케뷸러리 스코어를 생성하도록 페널라이즈(penalize)될 수 있다.

특히, 본 발명의 한 실시예에 따르면, 인롤먼트 그래머는 포노텍틱 그래머(phonotectic grammar)일 수 있고 SI 인식 모델은 서브 워드 유닛(sub-word units)을 포함할 수 있다. 인롤먼트 그래머 스코어는 아웃 오브 보케뷸러리 스코어가 비정의 문구들의 60% 내지 70%를 리젝트하는 경우 페널티를 가함으로써 페널라이즈될 수있다. 특정 실시예에서, 인롤먼트 스코어는 아웃 오브 보케뷸러리 스코어가 비정의 문구의 약 70%를 리젝트하는 경우 페널라이즈될 수 있다.

본 발명의 기술적 장점들은 아웃 오브 보케뷸러리 리젝션을 실질적으로 개선하는 화자 독립 인식 시스템 및 방법을 제공하는 것을 포함한다. 특히, 말한 문구는 사용자 정의 문구 외에도 페널라이즈 인롤먼트 그래머 스코어에 대해서도 기록될 수 있다. 페널라이즈 인롤먼트 그래머 스코어가 사용자 정의 문구보다 더 나은 일치를 제공하는 경우, 말한 문구는 아웃 오브 보케뷸러리로서 리젝트될 수 있다. 반대로, 말한 문구가 패널라이즈 인롤먼트 그래머 스코어보다 사용자 정의 문구에 더 잘 일치되는 경우에는 인 보케뷸러리(in-vocabulary)로서 허용될 수 있다. 따라서, 잘못된 번호를 다이얼링 하는 것과 같이 아웃 오브 보케뷸러리 문구를 인 보케뷸러리 문구로 인식하는 것이다.

본 발명의 추가적인 기술적 장점은 화자 독립 인식 시스템의 기존의 구성 요소들을 이용하여 아웃 오브 보케뷸러리 리젝션 시스템 및 방법을 제공하는 것을 포함한다. 특히, 인롤먼트 시스템의 구성 요소들은 아웃 오브 보케뷸러리 스코어를 결정하는데 사용될 수 있다. 따라서, 추가 인식 모델을 제공할 필요가 없다.

본 발명의 다른 기술적 장점들은 다음의 도면, 설명 및 청구 범위로부터 당 기술에 통상의 지식을 가진 자에게는 명백할 것이다.

도 1은 본 발명의 한 실시예에 따른 화자 독립 인식 시스템의 블럭도.

도 2는 본 발명의 한 실시예에 따른 도 1의 화자 독립 인식 시스템을 위한 인롤먼트 방법의 흐름도.

도 3은 본 발명의 한 실시예에 따른 도 1의 화자 독립 인식 시스템을 위한 인식 방법의 흐름도.

도면의 주요 부분에 대한 부호의 설명

14 : 마이크로 프로세서

18 : 입력/출력 아날로그-디지탈 변환기

20 : 입력/출력 디지탈-아날로그 변환기

30 : 특징 추출 모듈

32 : 인식 모듈

36 : 인롤먼트 그래머

38 : 사용자 정의 문구

본 발명 및 장점들의 보다 완전한 이해를 돕기 위해 첨부된 도면과 관련하여취해진 다음의 설명에 대해 언급하고, 여기서 동일한 참조 번호는 동일한 부분을 나타낸다.

본 발명의 양호한 실시예들 및 그 장점들이 도 1-3을 보다 상세하게 참조함으로써 가장 이해가 잘 될 것이고, 여기서 동일한 참조 번호는 동일한 부분들을 나타낸다. 도 1-3은 사용자 정의 문구의 화자 독립 인식을 위한 방법 및 시스템을 설명한다. 이하에서 보다 상세하게 설명하겠지만, 이 방법 및 시스템은 아웃 오브 보케뷸러리 리젝션을 위해 사용자 정의 문구에 대해 기록될 수 있는 페널라이즈 인롤먼트 그래머 스코어를 채택할 수 있다. 따라서, 화자 독립 인식 시스템 및 방법은 아웃 오브 보케뷸러리 리젝션을 실질적으로 개선시킨다.

도 1은 본 발명의 한 실시예에 따른 화자 독립 인식 시스템(10)의 블럭도를 나타낸다. 화자 독립 인식 시스템(10)은 입력/출력 시스템(12), 마이크로프로세서(14) 및 메모리(16)를 포함할 수 있다. 입력/출력 시스템(12)은 전화 회선망(도시되지 않음)에 접속되고 신속 디아얼링과 같은 음성 작동 서비스를 제공할 수 있다. 본 실시예에서, 입력/출력 시스템(12)은 아날로그 입력 신호를 변환시키기 위한 아날로그-디지탈 변환기(18)와 디지탈 출력 신호를 변환시키기 위한 디지탈-아날로그 변환기(20)를 포함한다. 입력/출력 시스템(12)은 음성 신호를 전송하거나 처리할 수 있는 다른 네트워크 또는 시스템에 접속될 수 있다는 것이 이해될 것이다.

본 발명은 마이크로 프로세서(14)에 의해 메모리(16)에 로드되어 실행될 수 있는 컴퓨터 소프트웨어를 포함한다. 컴퓨터 소프트웨어는 일반적으로 메모리(16) 내의 모듈 및 유사한 시스템으로 식별될 수 있다. 그렇지 않은 경우 컴퓨터 소프트웨어는 본 발명의 범주 내에서 처리를 하기 위해 결합되거나 분리된다. 따라서, 모듈 및 다른 소프트 웨어 시스템들의 라벨은 설명을 목적으로 한 것이고 본 발명의 범주 내에서 변경될 수 있다. 컴퓨터 소프트웨어는 디스크 저장 장치(도시되지 않음)로부터 메모리(16)로 로드될 수 있다. 디스크 저장장치는, 예를 들면, 플로피 디스크 드라이브, 하드 디스크 드라이브, CD-롬 드라이브 또는 자기 테이프 드라이브와 같은 각종 저장 매체를 포함할 수 있다.

메모리(16)는 특징 추출 모듈(30), 인식 모듈(32), 화자 독립(SI) 인식 모델 셋트(34), 인롤먼트 그래머(36), 및 사용자 정의 문구(38)를 포함할 수 있다. 모듈(30 및 32), 모델(34), 그래머(36), 및 사용자 정의 문구(38)가 판독자의 편리를 도모하기 위해 하나의 메모리(16) 내에 도시되어 있다. 메모리(16)는 RAM, ROM, 디스크 저장 장치 등과 같은 하나 이상의 메모리 장치들을 포함할 수 있다는 것이 이해될 것이다.

특징 추출 모듈(30)은 입력/출력 시스템(12)을 통해서 수신된 구두 문구로부터 특징들을 추출할 수 있다. 통상적으로, 특징들은 구두 문구의 신호 스펙트럼으로부터 얻어진다. 한 실시예에서는, 스펙트럼이 선형 예측 코딩(linear predictive coding; LPC) 방법을 이용하여 산출될 수 있다. 그렇지 않은 경우, 구두 문구의 특징들은 본 발명의 범주 내에서 추출될 수 있다는 것이 이해될 것이다.

이하에서 보다 상세히 설명하겠지만, 인롤먼트 중에, 인식 모듈(32)은 사용자 정의 문구(38)에 대한 일련의 SI 인식 모델을 출력하기 위해 SI 인식 모델(34)과 인롤먼트 그래머(36)와 연관하여 동작할 수 있다. 또한, 비인롤먼트 사용중에는, 인식 모듈(32)의 출력은 페널라이즈될 수 있고 아웃 오브 보케뷸러리 리젝션에 대한 사용자 정의 문구(38)와 비교될 수 있다.

SI 인식 모델(34)은 어떤 특정 보케뷸러리와도 무관한 서브 워드 유닛일 수 있다. 한 실시예에서, SI 인식 모델(34)은 문맥 종속 폰 모델(context-dependent phone models)일 수 있다. 본 실시예에서, 모델은 각 폰 모델이 잘 트레인(train)되도록 많은 수의 화자들과 보케뷸러리로부터의 입력 음성과 함께 트레인될 수 있다. 다른 종류의 SI 인식 모델(34)도 본 발명의 범주 내에서 사용될 수 있다는 것이 이해될 것이다.

인롤먼트 그래머(34)는 모델의 음향 시퀀스의 허용된 시퀀스를 특정할 수 있다. 간단한 실시예에서, 인롤먼트 그래머(36)는 널(null) 그래머일 수 있다. 본 실시예에서, 그래머는 임의의 수의 모델들이 임의의 순서로 발생되게 허용한다. 또 다른 실시예에서, 인롤먼트 그래머(36)는 n-그램 그래머일 수 있다. 이 그래머는 길이 n의 허용된 시퀀스를 특정할 수 있다. 인롤먼트 그래머(36)는 포노텍틱 그래머일 수도 있다. 포노텍틱 그래머는 가능한 음절 또는 반음절과 같은 언어의 가능한 사운드 시퀀스의 견지에서 허용된 시퀀스를 특정할 수 있다. 따라서, 인롤먼트 그래머(36)는 SI 인식 모델(34)에 대한 제한으로서 작용한다. 다른 인롤먼트 그래머(36)는 본 발명의 범주 내에서 사용될 수 있다는 것이 이해될 것이다.

도 2는 본 발명의 한 실시예에 따른 화자 독립 인식 시스템(10)을 위한 인롤먼트 방법을 설명한다. 이 방법은 문구가 화자 독립 인식 시스템(10)으로의 인롤먼트를 위하여 수신되는 단계(50)에서 시작된다. 앞서 설명한 바와 같이, 문구는 입력/출력 시스템(12)을 통해 수신되고 아날로그-디지탈 변환기(18)에 의해 디지탈화될 수 있다. 인롤먼트 문구는 어떠한 사운드 또는 연속된 사운드를 포함할 수 있다.

단계(52)로 나아가면, 특징 추출 모듈(30)은 인롤먼트 문구로부터 특징을 추출할 수 있다. 한 실시예에서, 특징 추출 모듈(30)은 인롤먼트 문구의 각 프레임으로부터 선형 예측 코딩(LPC) 파라미터를 이용하여 스펙트럼 특징을 추출할 수 있다. 다른 특징 추출 기술들이 본 발명의 범주 내에서 단계(52)에서 사용될 수 있다.

단계(54)에서, 인식 모듈(32)은 SI 인식 모듈(34)을 수신할 수 있다. 앞서 설명한 바와 같이, SI 인식 모델(34)은 어떤 특정 보케뷸러리와도 무관한 서브 워드 유닛을 포함할 수 있다. 특정 실시예에서, SI 인식 모델(34)은 많은 수의 화자들과 보케뷸러리로부터 입력 음성으로 트레인된 문맥 종속 폰 모델을 포함할 수 있다.

단계(56)로 나아가면, 인식 모듈(32)은 인롤먼트 그래머(36)를 수신할 수 있다. 앞서 설명한 바와 같이, 인롤먼트 그래머는 포노텍틱 그래머, n-그램 그래머, 또는 널 그래머를 포함할 수 있다. 인롤먼트 그래머는 본 발명의 범주 내에서 다른 종류의 그래머를 포함할 수 있다.

단계(58)에서, 인식 모듈(32)은 추출된 특징에 가장 근접하게 일치하는 SI 인식 모델의 시퀀스를 결정할 수 있다. 이는 인롤먼트 그래머(36)를 이용하여 추출된 특징을 SI 인식 모델(34)에 비교함으로써 행해질 수 있다. 다음으로, 단계(60)에서, 인식 모듈(32)은 인롤먼트 문구에 대하여 SI 인식 모델의 시퀀스를 사용자 정의 문구(38)로서 저장할 수 있다. 사용자 정의 문구용으로 저장된 SI 인식 모델의 시퀀스는 SI 인식 모델과 관련된 일련의 심볼들을 포함할 수 있다. 단계(60)는 과정의 종료에 이른다.

도 3은 본 발명의 한 실시예에 따른 화자 독립 인식 시스템(10)의 비인롤먼트 사용을 위한 인식 방법을 설명한다. 이 방법은 구두 문구가 수신되는 단계(80)에서 시작된다. 인롤먼트 문구와 관련하여 앞서 설명한 바와 같이, 구두 문구는 임의의 사운드 또는 연속된 사운드를 포함할 수 있고 입력/출력 시스템(12)을 통해 수신될 수 있다. 입력/출력 시스템(12)에서, 구두 문구는 아날로그-디지탈 변환기(18)에 의해서 디지탈 포맷으로 변환될 수 있다.

단계(82)로 나아가면, 특징 추출 모듈(30)이 구두 문구로부터 특징들을 추출할 수 있다. 앞서 설명한 바와 같이, 추출된 특징은 선형 예측 코딩(LPC) 파라미터들에 기초한 스펙트럼 특징을 포함할 수 있다. 단계(84)에서, 인식 모듈(32)은 사용자 정의 문구(38)를 수신할 수 있다. 계속해서 단계(86)로 나아가면, 인식 모듈(32)은 각 사용자 정의 문구(38)를 추출된 특징에 비교함으로서 구두 문구에 대한 인 보케뷸러리 문구(38)를 결정할 수 있다. 스코어는 사용자 정의 문구와 추출된 특징들 간의 차일 수 있다.

다음으로, 단계(88)에서, 임식 모듈(32)은 SI 인식 모델(34)을 수신할 수 있다. 단계(90)에서, 인식 모듈(32)은 인롤먼트 그래머(36)를 수신할 수 있다. SI 인식 모델(34)과 인롤먼트 그래머(36)는 도 1 및 도 2와 관련하여 앞서 설명하였다.

단계(92)로 나아가면, 인식 모듈(32)은 인롤먼트 그래머(36)를 이용하여 SI 인식 모델(34)을 추출된 특징들에 비교함으로서 구두 문구에 대한 인롤먼트 그래머 스코어를 결정할 수 있다. 인롤먼트 그래머 스코어는 그래머에 의해 허용된 SI 인식 모델(34)과 추출된 특징들 간의 차일 수 있다.

단계(94)에서, 인식 모듈(32)은 아웃 오브 보케뷸러리 스코어를 생성하도록 인롤먼트 그래머 스코어를 페널라이즈할 수 있다. 한 실시예에서, 인식 모듈(32)은 스코어에 페널티를 가함으로써 인롤먼트 그래머 스코어를 페널라이즈할 수 있다. 한 실시예에서, 인롤먼트 그래머 스코어는 아웃 오브 보케뷸러리 스코어가 비정의 문구의 60% 내지 80%를 리젝트하는 경우 페널라이즈될 수 있다. 특정 실시예에서, 인롤먼트 그래머 스코어는 아웃 오브 보케뷸러리 스코어가 비정의 문구의 약 70%를 리젝트하는 경우 페널라이즈될 수 있다. 페널티는 변할 수 있고 그렇지 않은 경우 본 발명의 범주 내에서 결정될 수 있다는 것이 이해될 것이다.

단계(96)에서, 스코어는 인식 모듈(32)에 의해 비교될 수 있다. 다음으로, 결정 단계(98)에서, 인식 모듈(32)은 아웃 오브 보케뷸러리 스코어가 구두 문구에 가장 근접하게 일치하는지의 여부를 판정할 수 있다. 아웃 오브 보케뷸러리 스코어가 구두 문구에 가장 근접하게 일치하면, 결정 단계(98)의 YES 브랜치는 구두 문구가 아웃 오브 보케뷸러리로서 리젝트되는 단계(100)로 이른다. 이 경우, 화자 독립 인식 시스템(10)은 화자로 하여금 재인식 목적을 위해 문구를 반복하도록 요구할 수 있다.

결정 단계(98)로 돌아가면, 아웃 오브 보케뷸러리 스코어가 구두 문구에 가장 근접하게 일치되지 않으면, 결정 단계(98)의 NO 브랜치는 단계(100)으로 유도된다. 단계(102)에서, 인식 모듈(32)은 구두 문구를 인 보케뷸러리 문구로서 허용한다. 따라서, 문구는 인식되고 작용될 수 있다. 단계(100 및 102)는 과정의 종료에 이른다.

전술한 것에 따르면, 본 발명의 화자 독립 인식 시스템 및 방법은 아웃 오브 보케뷸러리 리젝션을 실제로 개선시킨다. 특히, 구두 문구들은 사용자 정의 문구 외에도 페널라이즈 인롤먼트 그래머 스코어에 대해서 기록될 수 있다. 페널라이즈 인롤먼트 그래머 스코어가 사용자 정의 구문보다 더 나은 일치를 제공하는 경우, 구두 문구는 아웃 오브 보케뷸러리로서 리젝트될 수 있다. 반대로, 구두 문구는 페널라이즈 인롤먼트 그래머 스코어보다 사용자 정의 문구에 더 잘 일치되는 인 보케뷸러리로서 허용될 수 있다.

본 발명이 몇 개의 실시예들을 이용하여 설명하였지만, 당 기술에 통상의 지식을 가진 자에게는 다양한 변화 및 수정이 있을 수 있다. 본 발명은 첨부된 청구 범위의 범주 내에 속하는 이러한 변화 및 수정을 포함하고자 한다.

Claims

사용자 정의 문구의 화자 독립 인식을 위한 아웃 오브 보케뷸러리 스코어(out-of-vocabulary score)를 결정하는 방법에 있어서,

인롤먼트 그래머(enrollment grammar)를 이용하여 화자 독립(SI) 인식 모델의 셋트로 사용자 정의 문구를 인롤(enroll)하는 단계;

상기 인롤먼트 그래머를 이용하여 구두 문구(spoken phrase)의 특징들을 상기 SI 인식 모델에 비교함으로써 구두 문구의 인롤먼트 그래머 스코어를 결정하는 단계; 및

아웃 오브 보케뷸러리 스코어를 생성하기 위해 인롤먼트 그래머 스코어를 페널라이즈(penalize)하는 단계

를 포함하는 것을 특징으로 하는 사용자 정의 문구의 화자 독립 인식을 위한 아웃 오브 보케뷸러리 스코어를 결정하는 방법.
제1항에 있어서, 상기 인롤먼트 그래머 스코어를 페널라이즈 하는 단계는 상기 인롤먼트 그래머 스코어에 페널티를 가하는 단계를 포함하는 것을 특징으로 하는 방법.
제1항에 있어서, 상기 상기 인롤먼트 그래머는 포노텍틱 그래머(phonotatic grammar)인 것을 특징으로 하는 방법.
제1항에 있어서, 상기 인롤먼트 그래머는 널 그래머(null grammar)인 것을 특징으로 하는 방법.
제1항에 있어서, 상기 인롤먼트 그래머는 n-그램 그래머인 것을 특징으로 하는 방법.
제1항에 있어서, 상기 SI 인식 모델들은 서브 워드 유닛(sub-word units)을 포함하는 것을 특징으로 하는 방법.
제1항에 있어서, 상기 SI 인식 모델들은 문맥 종속 폰 모델(context-dependent phone model)을 포함하는 것을 특징으로 하는 방법.
제1항에 있어서, 상기 인롤먼트 그래머 스코어는 상기 아웃 오브 보케뷸러리 스코어가 비정의 문구들의 60% 내지 80%를 리젝트(reject)하는 경우 페널라이즈되는 것을 특징으로 하는 방법.
제1항에 있어서, 상기 인롤먼트 그래머 스코어는 아웃 오브 보케뷸러리 스코어 그래머가 비정의 문구들의 약 70%를 리젝트하는 경우 페널라이즈되는 것을 특징으로 하는 방법.
사용자 정의 문구들의 화자 독립 인식 방법에 있어서,

구두 문구를 수신하는 단계;

상기 구두 문구로부터 특징들(features)을 추출하는 단계;

상기 추출된 특징들을 사용자 정의 문구에 비교함으로써 구두 문구의 인 보케뷸러리 스코어(in-vocabulary score)를 결정하는 단계;

화자 독립(SI) 인식 모델들의 셋트를 수신하는 단계;

인롤먼트 그래머를 수신하는 단계;

상기 인롤먼트 그래머를 이용하여 상기 추출된 특징들을 상기 SI 인식 모델들에 비교함으로써 구두 문구의 인롤먼트 그래머 스코어를 결정하는 단계;

아웃 오브 보케뷸러리 스코어를 생성하기 위해 상기 인롤먼트 그래머 스코어를 페널라이즈하는 단계;

상기 스코어들을 비교하는 단계;

상기 아웃 오브 보케뷸러리 스코어가 일치 스코어에 근접하면, 구두 문구를 아웃 오브 보케뷸러리 문구로서 리젝트하는 단계;

상기 아웃 오브 보케뷸러리가 매칭 스코어에 근접하지 않으면, 구두 문구를 인 보케뷸러리 문구로서 허용하는 단계

를 포함하는 것을 특징으로 하는 방법.
제10항에 있어서, 상기 인롤먼트 그래머 스코어를 페널라이즈하는 단계는 상기 인롤먼트 그래머 스코어에 페널티를 가하는 단계를 포함하는 것을 특징으로 하는 방법.
제10항에 있어서, 상기 인롤먼트 그래머는 포노텍틱 그래머인 것을 특징으로 하는 방법.
제10항에 있어서, 상기 그래머는 널 그래머인 것을 특징으로 하는 방법.
제10항에 있어서, 상기 그래머는 n-그램 그래머인 것을 특징으로 하는 방법.
제10항에 있어서, 상기 SI 인식 모델들은 서브 워드 유닛을 포함하는 것을 특징으로 하는 방법.
제10항에 있어서, 상기 SI 인식 모델들은 문맥 종속 폰 모델을 포함하는 것을 특징으로 하는 방법.
제10항에 있어서, 상기 추출된 특징들은 LPC 특징들인 것을 특징으로 하는 방법.
제10항에 있어서, 상기 인롤먼트 그래머 스코어는 아웃 오브 보케뷸러리 스코어가 비정의 문구들의 60% 내지 80%를 리젝트하는 경우 페널라이즈되는 것을 특징으로 하는 방법.
제10항에 있어서, 상기 인롤먼트 그래머 스코어는 아웃 오브 보케뷸러리 스코어가 비정의 문구들의 약 70%를 리젝트하는 경우 페널라이즈되는 것을 특징으로 하는 방법.
화자 독립 인식 시스템에 있어서,

화자 독립(SI) 인식 모델 셋트;

인롤먼트 그래머;

인롤먼트 그래머를 이용하여 SI 인식 모델들로 인롤되는 사용자 정의 문구;

상기 SI 인식 모델들과 상기 인롤먼트 그래머를 이용하여 구두 문구의 인롤먼트 그래머 스코어를 결정하도록 동작가능한 인식 모듈; 및

아웃 오브 보케뷸러리 스코어를 생성하도록 상기 인롤먼트 그래머 스코어를 페널라이즈하도록 동작가능한 인식 모듈

을 포함하는 것을 특징으로 하는 화자 독립 인식 시스템.
제20항에 있어서,

구두 문구의 특징들을 상기 사용자 정의 문구에 비교함으로써 구두 문구의 인 보케뷸러리 스코어를 결정하도록 동작가능한 인식 모듈;

상기 스코어들을 비교하도록 동작가능한 인식 모듈;

상기 아웃 오브 보케뷸러이 스코어가 매칭 스코어에 근접하면 구두 문구를 아웃 오브 보케뷸러리 문구로서 리젝트하도록 동작가능한 인식 모듈; 및

상기 아웃 오브 보케뷸러리 스코어가 매칭 스코어에 근접하지 않으면 구두 문구를 인 보케뷸러리 문구로서 허용하도록 동작가능한 인식 모듈

을 더 포함하는 것을 특징으로 하는 시스템.
제20항에 있어서, 상기 SI 인식 모델들은 서브 워드 유닛을 더 포함하는 것을 특징으로 하는 시스템.