KR100574768B1

KR100574768B1 - 음성 인식을 사용하는 자동화된 호텔 안내 시스템

Info

Publication number: KR100574768B1
Application number: KR1019990015389A
Authority: KR
Inventors: 쥰쿼장-클로드; 콘토리니마테오
Original assignee: 마쯔시다덴기산교 가부시키가이샤
Priority date: 1998-04-30
Filing date: 1999-04-29
Publication date: 2006-04-28
Also published as: EP0953967A3; KR19990083596A; DE69922872D1; JP3135233B2; DE69922872T2; CN1116770C; EP0953967B1; CN1246023A; EP0953967A2; JP2000032140A; US6314165B1; TW424221B

Abstract

자동화된 호텔 안내는 복수개의 전화 내선을 지지하는 전화 절환 시스템에 대해 룸 대 룸 호출을 조정하기 위해 제공된다. 호텔 등록 시스템은 호텔 손님의 스펠형 이름을 수용 및 저장하며 각각의 손님에게 관련의 전화 내선을 할당한다. 목록-트레이닝 시스템은 이러한 이름들을 구성하는 문자를 단어-음소 데이터로 변환시킴으로써 각각의 스펠형 이름에 대한 발음을 생성하기 위해 호텔 등록 시스템에 연결된다. 이러한 단어-음소 데이터는 음성 인식 시스템에 의해 사용되는 목록에 저장된다. 특히, 모델 트레이너에 기초한 히든 마르코프 모델(HMM)과 함께 음성표시기는 목록 트레이닝 시스템을 위한 베이시스로 작용하므로, 각각의 손님 이름과 관련된 하나이상의 HMM 모델이 목록에 저장된다. 자동화된 안내부는 전화 내선 중 하나로부터 입력된 호텔 손님의 호출 이름을 설정된 호텔 손님이름으로 변환하기 위해 호텔 등록 시스템으로부터 할당된 전화 내선을 검색하는데 사용되는 음성 인식 시스템에 연결된다. 상기 자동화된 안내에 의해 전화 절환 시스템은 전화 내선 중 하나로부터 호출된 이름의 엔트리에 응답하여 요구된 전화 내선을 호출하게 된다.

Description

음성 인식을 사용하는 자동화된 호텔 안내 시스템{AN AUTOMATED HOTEL ATTENDANT USING SPEECH RECOGNITION}

도 1 은 본 발명의 양호한 실시예의 호텔 자동 안내의 시스템 블록 다이아그램.

도 2 는 본 발명의 호텔 자동 안내 시스템에 사용하기 위한 목록 트레이닝 시스템의 성분을 도시한 다이아그램.

도 3 은 본 발명의 호텔 자동 안내 시스템에 사용하기 위해 음성표시기의 성분을 도시한 블럭 다이아그램.

도 4 는 음성표시기에 의해 사용된 문자 전용 트리를 도시한 결정 트리 다이아그램.

도 5 는 음성표시기에 의해 사용된 혼합 트리를 도시하는 결정 트리 다이아그램.

[도면의 주요부분에 대한 부호의 설명]

12 : 컴퓨터 14 : 등록 시스템

22 : 음성 인식기 26 : 음성 메일 시스템

30 : 목록 트레이닝 시스템 32 : 목록

본 발명은 자동화된 호텔 안내 시스템에 관한 것으로서, 특히 호텔 손님 데이터베이스와 마찬가지로 음성 인식기를 자동으로 트레이닝하기 위해 목록(lexicon) 트레이닝 시스템을 사용하는 자동화된 호텔 안내 시스템에 관한 것이다.

사무실 환경에서는 일반적으로 자동안내가 실행되고 있다. 전형적으로, 이러한 자동 안내는 구내 교환전화(private branch exchange: PBX)와 함께 호출 루틴 기능을 수행하도록 음성에 기초한 인식기를 사용하고 있다.

음성 인식에 있어서, 사전에서의 각각의 단어에 대한 발음 표기는 사용전에 음성 인식기에 대한 모델을 설정할 필요가 있다. 전형적으로, 발음 표기는 특정의 관심 언어의 음성 발음 뉘앙스에 숙련된 사전편집자에 의해 수동으로 형성된다. 사전에서의 각각의 단어에 대해 양호한 발음 표시를 전개하는 것은 시간소모적인 작업이며, 상당한 숙련을 필요로 한다. 또한, 자동 안내에 사용하기 위한 사전은 성(姓)에 대해서는 아직 완성되지 않았다. 각각의 성(姓)에 대한 발음 표기가 정적인 사무실 환경인 사람을 위해 형성되었지만, 이러한 접근은 호텔 손님 데이터베이스에서의 성(姓)처럼 일정하게 변하는 곳에서는 자동 안내를 실행하는 것이 가능한 것은 아니다.

자동 안내의 음성 인식을 위해 모델을 자동으로 설정하기 위해 목록 트레이닝 시스템을 사용하므로써 발음 표기를 생성시키기 위한 상당한 노력과 특정의 전문지식이 면제될 수 있다.

본 발명의 목록 트레이닝 시스템은 현존의 사전에서는 발견되지 않은 지리적 위치와 성(姓)과 같은 단어를 인식하기 위해 현재의 인식 시스템을 연장시킨다. 기재된 형태의 이름으로부터 복합 발음을 생성하기 위한 강건하고 신뢰성이 양호한 음성표시기는 이와 같은 목록 트레이닝 시스템에서 중요한 특징사항중 하나에 속한다. 일단 성의 발음이 파악되었으며, 자동 안내에 사용하기 위한 음성 인식기를 자동으로 트레이닝하거나 업데이트하는데 사용될 수 있는 화자독립형 음성 인식 모델을 설정할 수 있다.

따라서, 본 발명의 자동 안내는 상술한 원리들을 채용하여 호텔 등록 및 전화 시스템에 양호하게 사용될 수 있다. 자동화된 호텔 안내는 호텔 오퍼레이터와 연결될 필요없이 호텔 손님에게 부가적인 서비스와 함께 호출 루틴 기능을 제공한다. 호텔 등록 시스템은 호텔 손님의 스펠형 이름을 접수하고 저장하며 각각의 손님에게 그 관련의 전화 내선을 할당한다. 목록 트레이닝 시스템은 이러한 이름들을 구성하는 문자를 단어-음소 데이터로 변환시키므로써 각각의 스펠형 이름에 대한 발음을 생성하기 위해 호텔 등록 시스템에 연결된다. 이와 같은 단어-음소 데이터는 음성 인식 시스템에 의해 사용되는 목록에 순차적으로 저장된다. 자동 안내는 전화 내선중 하나로부터 호출된 호텔 손님의 이름을 호텔 등록 시스템으로부터 할당된 전화 내선을 검색하는데 사용할 수 있는 이미 설정된 호텔 손님의 이름으로 변환하기 위해 음성 인식 시스템에 연결된다. 이어서, 자동화된 안내에 의해 전화 절환 시스템이 전화 내선 중 하나로부터 호출된 이름의 엔트리에 응답하여 요구된 전화 내선을 호출하게 된다.

본 발명에 따른 하기의 설명은 단순히 예시적인 것이며, 본 발명 및 본 발명의 용도는 이에 한정되지 않는다. 또한, 하기의 설명은 음성 인식기를 자동으로 트레이닝하기 위해 목록 트레이닝 시스템을 사용하는 자동 호텔 안내 시스템을 서술하였지만, 본 기술 분야의 숙련자라면 다양한 음성 처리 실시예에 사용될 수 있음을 인식해야 한다.

호텔 자동 안내 시스템(10)은 오퍼레이터와 연결될 필요없이 음성 인식에 의해 호텔 손님에게 부가 서비스를 제공하기 위한 것이다. 호텔 손님이 체크인할 때, 그 손님은 전형적으로 호텔 안내부에 그 이름, 주소, 체크아웃 날짜, 및 기타 등록 정보를 제공한다. 호텔 자동 안내 시스템(10)을 도와주기 위해, 손님의 국적이나 방언과 같은 부가적인 정보가 호텔 손님으로부터 수집된다. 이러한 정보는 할당된 호텔 추정 룸넘버와 마찬가지로 컴퓨터(12)나 기타 다른 인터페이스 장치를 통해 종래의 호텔 등록 시스템(14)에 의해 포획된 후 호텔 손님 데이터베이스(20)에 저장된다.

일단 손님의 정보가 포획되면, 목록 트레이닝 시스템(30)은 그 기재된 손님 이름의 형태를 하나이상의 발음 표기로 자동으로 전환할 것이다. 손님 이름에 대한 공지의 발음을 사용하여, 목록 트레이닝 시스템(30)은 음성 인식기(22)에 의해 사용되는 화자독립형 음성 인식 모델을 설정하는 것이 가능하게 된다. 이러한 음 성 인식 모델은 음성 인식기(22)에 의해 억세스되는 목록(32)에 저장된다. 각각의 호텔 손님의 특정 발음표기는 손님이 호텔을 체크인하거나 체크아웃할 때마다 목록(32)에 자동으로 업데이트된다.

음성 인식을 사용하여, 자동 안내(50)는 호텔의 다른 손님에게 그 룸 넘버를 확인할 필요없이 이름에 의한 음성 다이얼링을 제공한다. 호텔 전화 절환 시스템(즉, PBX)(18)을 통해 호텔 전화(16)로부터의 호출은 자동 안내(50)에 의해 수신되고, 이는 차례로 호출 루틴 기능을 제공한다. 호출된 호텔 손님의 이름은 업데이트된 목록(32)을 사용하는 음성 인식기(22)에 의해 인식된다. 자동 안내(50)는 호출된 이름을 호텔 손님 이름을 사용하여 그 할당된 전화 내선에 배치하여 호텔 손님 데이터베이스(20)로부터 그 전화 내선을 검색한다. 마지막으로, 자동 안내(50)에 의해 전화 절환 시스템(18)은 검색된 전화 내선을 호출하므로써 그 요구된 호출을 적절하게 루틴시키게 된다. 당업자라면 분명히 알 수 있는 바와 같이, 음성에 기초한 인식을 못할 경우, 본 발명의 자동 안내는 스펠형 이름 인식기나 종래의 사전-지원 모델과 함께 사용될 수 있다. 마지막으로, 자동 안내는 손님의 호출을 호텔 오퍼레이터에게 전송해야 한다. 또한, 자동 안내(50)는 음성 다이얼링을 다른 호텔 서비스 및 내선부(예를 들어, 프런트 데스크 룸 서비스나 호텔 레스토랑)에 제공한다.

호텔에서 손님의 나머지 체류에 있어서, 본 발명의 자동 안내 시스템(10)은 다른 호텔 서비스로의 억세스도 제공할 수 있다. 예를 들어, 호텔 손님의 음성 발음은 음성 합성기(24)를 통해 음성 메일 시스템(26)에서 메시지를 주문하는데 사용된다. 주문된 메시지는 손님이 룸에 없을 때 호출을 회수하는데 사용된다. 또한, 손님의 국적은 그 국적에 해당하는 언어로 기상 호출을 제공하는데도 사용된다. 본 발명의 자동 안내는 다른 호텔 시스템(28)과의 인터페이스도 고려될 수 있다.

도 2 에는 목록 트레이닝 시스템(30)이 상세히 도시되어 있다. 일반적으로 목록 트레이닝 시스템은 그 이름을 구성하는 문자를 단어-음소 데이터로 전환하고 음성 인식기(22)를 트레이닝하기 위해 이렇게 발생된 발음을 사용하므로써 스펠형 이름의 발음을 생성한다. 목록 트레이닝 시스템(30)을 작동시키는데는 튼튼하고 신뢰성이 양호한 음성표시기가 반드시 있어야 한다. 호텔 등록 시스템(14)에 의해 포획되었을 때, 손님 이름의 스펠링 형태는 음성표시기(34)로 입력된다.

음성표시기(34)의 예시적인 실시예가 도시된 도 3 에는 호텔 손님의 이름의 스펠링 형태에 기초하여 복수개의 발음을 생성하는 원리가 도시되어 있다. 지금까지의 스펠형 단어-발음 표기에 대한 최선의 시도는 오직 문자 그 자체에만 의존하였다. 이러한 기법은 상당히 바람직하다. 예를 들어, 문자 전용 발음 발생기는 단어 Bible 을 적절하게 발음하는데 상당한 어려움이 있다. 일련의 문자에 기초하여, 문자 전용 시스템은 단어 "Bib-l"을 상당한 등급의 학생들이 읽는 것처럼 발음할 것이다. 종래 시스템에서의 실패는 많은 언어의 발음 법칙에 의해 부여된 그 본래의 불명확함에 의존한다. 예를 들어, 영어는 수백가지의 상이한 발음 규칙을 갖고 있어, 문제를 단어 대 단어에 기초하여 접근하는것을 어렵게 하고 수치적으로 상당한 비용을 초래하게 한다.

그러나, 음성표시기(34)는 2가지 상태를 사용하는데, 제 1 상태는 문자 전용 결정트리 세트(72)를 사용하며, 제 2 상태는 혼합결정 트리 세트(74)를 사용한다. 일련의 문자 B-I-B-L-E 와 같은 입력 시컨스(76)는 다이나믹 프로그래밍 음소 시컨스 발생기(78)로 공급된다. 상기 시컨스 발생기는 스펠형 단어 입력 시컨스의 가능한 발음 후보를 제공하는 발음 리스트(80)를 발생시키기 위해 문자전용 트리(72)를 사용한다.

시컨스 발생기는 시컨스에서 각각의 문자를 연속적으로 검사하며, 문자전용 트리에 내장된 가능성 데이터에 기초하여 음소 발음을 선택하도록 그 문자와 관련된 결정 트리를 그 문자에 적용한다. 문자 전용 결정 트리 세트는 알파벳에서 각각의 문자에 대한 결정 트리를 포함한다. 도 4 는 문자 E 에 대한 문자 전용 결정 트리의 실시예를 나타내고 있다. 상기 결정 트리는 복수개의 내부 노드(도면에는 타원형으로 도시)와 복수개의 리프 노드(도면에는 사각형으로 도시)를 포함한다. 각각의 내부 노드는 예-아니오 질문에 거주한다. 상기 예-아니오 질문은 예 또는 아니오 로 답할 수 있는 질문이다. 문자 전용 트리에서, 이러한 질문은 입력 시컨스에서 주어진 문자(이 경우, 문자 E)와 그 인접한 문자를 향한 것이다. 도 4 에서, 각각의 내부 노드는 그 관련의 질문이 예 또는 아니오 인지의 여부에 따라 좌측 또는 우측으로 분기된다는 것을 숙지해야 한다.

도 4 에서는 약자가 사용되는데, +1 또는 -1 과 같은 질문의 숫자는 현재 문자에 대한 스펠링에서의 위치를 언급한다. 예를 들어, "+1L =='R'?" 는 "현재의 문자(이 경우, 문자 E 임) 다음에 있는 것은 문자 R 인가?" 를 의미한다. 약자 CONS 와 VOW 는 문자의 종류 즉, 자음과 모음을 나타낸다. 이웃한 문자나 무의미한 문자의 부재는 (이러한 문자를 대응의 음소 발음과 정렬하는 필러 또는 플레이스홀더로서 사용되는) 심볼 - 로 나타낸다. 심볼 # 은 단어 경계를 나타낸다.

리프 노드는 특정의 음소가 주어진 문자의 정확한 발음을 제공할 가능성을 나타내는 수치와 가능한 음소 발음을 연관시키는 가능성 데이터에 거주한다. 예를 들어, 표시 "iy=>0.51" 는 "이러한 리프에서 음소 'iy'의 가능성은 0.51 이다" 를 의미한다. 무의미한 음소 즉, 침묵은 심볼 "-" 로 표시한다.

시컨스 발생기(78)(도 3)는 리스트(80)에 저장된 하나이상의 발음 가설을 구성하기 위해 문자 전용 결정 트리(72)를 사용한다. 각각의 발음은 결정 트리(72)를 사용하여 선택된 각각의 음소의 가능성 스코어를 조합하여 도달된 수치 스코어와 관련되어 있다. 단어 발음은 가능한 조합의 매트릭스를 조합한 후 n-베스트 후보를 선택하도록 다이나믹 프로그래밍을 사용하므로써 기록된다. 선택적으로, 상기 n-베스트 후보는 먼저 최적의 가능성있는 단어 후보를 확인하고 하기와 같은 반복적인 치환을 통해 부가적인 후보를 발생시키는 대체 기법을 사용하여 선택된다.

최상의 스코어 음소들(리프 노드를 시험하여 확인된)의 각각의 스코어를 곱하고 이러한 선택을 가장 가능성있는 후보나 제 1 베스트 단어 후보로 사용하므로써 먼저 최상의 가능성 스코어를 가진 발음이 선택된다. 그후, 최초 선택된 음소와의 차이가 가장 작은 기선택되지않은 음소를 다시 확인하기 위해 리프 노드에서 음소 데이터를 시험하므로써 부가적인(n 베스트) 후보가 선택된다. 이와 같은 최소편차 음소는 최초 선택된 음소로 대체되므로써 제 2 베스트 단어 후보를 발생시킨다. 상술한 바와 같은 처리는 필요한 갯수의 n 베스트 후보가 선택될 때까지 반복적으로 실시된다. 리스트(80)는 하강 스코어 순서로 저장되므로, 문자 전용 분 석에 의해 베스트로 판정된 발음이 먼저 리스트에 나타난다.

상술한 바와 같이, 문자 전용 분석은 불량한 결과를 자주 생성할 것이다. 이것은 문자 전용 분석이 각각의 문자에서 일련의 문자에 의해 어떤 음소가 발생될 것인지를 결정할 방법이 없기 때문이다. 따라서, 문자 전용 분석은 실제 음성에서는 발생되지 않는 높은 스코어의 발음을 생성할 수 있다. 예를 들어, 적절한 이름인 아킬레스(Achilles)는 ll's: ah-k-ih-l-l-iy-z 음성대로 발음하는 발음으로 나타나게 된다. 자연스런 음성에서, 두번째 l 은 ah-k-ih-l-iy-z 로서 실제로는 발음되지 않는다. 문자 전용 트리를 사용하는 시컨스 발생기는 실제 음성에서는 발생되지 않는 단어 발음을 스크린할 메카니즘을 갖고 있지 않다.

음성표시기(34)의 제 2 상태는 상술한 문제점에 접근하고 있다. 혼합 트리 스코어 추정기(82)는 각각의 발음 리스트(80)의 생존능력에 접근하기 위해 혼합결정 트리세트(74)를 사용한다. 상기 스코어 추정기는 시컨스 발생기(78)에 의해 각각의 문자에 할당된 음소를 따라 입력 시컨스에서 각각의 문자를 연속적으로 시험하므로써 작동된다. 문자 전용 트리 세트와 마찬가지로, 혼합 트리 세트도 알파벳의 각각의 문자에 대해 혼합 트리를 갖는다. 예시적인 혼합 트리가 도 5 에 도시되어 있다. 문자 전용 트리와 마찬가지로, 혼합 트리는 내부 노드와 리프 노드를 갖는다. 도 5 에 도시된 바와 같이, 상기 내부 노드는 타원형으로 도시되었으며, 리프 노드는 사각형으로 도시되어 있다. 내부 노드는 예-아니오 질문에 거주하며, 리프 노드는 가능성 데이터에 거주한다. 혼합 트리의 구조가 문자 전용 트리와 유사하지만, 이들 사이에는 중요한 차이점이 있다. 혼합 트리의 내부 노드는 2개의 상이한 질문 등급을 포함할 수 있다. 내부 노드는 시컨스에서 주어진 문자와 그 인접한 문자에 대한 질문을 포함하거나, 상기 시컨스에 대응하는 문자에 관련된 음소와 그 인접한 음소에 대한 질문을 포함할 수 있다. 따라서, 결정 트리는 혼합되며, 이것은 혼합된 질문 등급을 포함한다.

도 5 에 사용된 약자는 일부 부가된 약자와 함께 도 4 에 사용된 것과 유사하다. L 은 문자와 그 인접한 문자에 대한 질문을 나타낸다. P 는 음소와 그 인접한 음소에 대한 질문을 나타낸다. 예를 들어, 질문 "+1L=='D'?" 은 +1 위치에 있는 것은 문자 'D'?" 를 의미한다. 약자 CONS 와 SYL 은 음소 분류 즉, 자음과 음절을 나타낸다. 예를 들어, "+1P==CONS?" 는 "+1 위치에 있는 음소는 자음인가"를 의미한다. 리프 노드에서의 숫자는 문자 전용 트리에서 실행될 때의 음소 가능성을 제공한다.

혼합 트리 스코어 추정기는 혼합 트리의 리드 노드에서 가능성 데이터를 사용하여 혼합 트리 질문에 기초한 리스트(80)에서 각각의 발음을 재기록한다. 필요할 경우, 발음 리스트는 리스트(84)로서 각각의 스코어와 관련되어 저장될 수도 있다. 필요할 경우, 상기 리스트(84)는 하강 순서로 기록될 수 있으므로, 첫번째 리스트의 발음은 가장 높은 스코어가 된다.

여러가지 경우에 있어서, 리스트(84)에서 가장 높은 스코어를 점유하고 있는 발음은 리스트(80)에서 가장 높은 스코어를 점유하고 있는 발음과는 다르다. 이것은 혼합 트리 스코어 추정기가 혼합 트리(74)를 사용하여 자체모순이 없는 음소 시컨스를 포함하지 않는 발음들을 스크린하거나 자연스런 음성에서 발생하지 않는 발음을 제공하기 때문이다. 상술한 바와 같이, 도 3 에 도시한 음성표시기(34)는 단지 하나의 가능한 실시예를 나타낸 것이다.

발음 리스트(84)는 음성 인식기와 음성 합성을 위한 발음 사전을 형성하는데 사용된다. 필요한 경우, 선택기 모듈(86)은 리스트에서 하나이상의 발음을 회수하기 위해 리스트(84)에 접근할 수 있다. 전형적으로, 선택기(86)는 가장 높은 스코어를 갖는 발음을 회수한 후 이를 출력 발음(88)으로 제공한다. 음성 인식에 관해서, 발음 사전은 인식기 목록에서 이미 발견되지 않은 호텔 손님 이름과 같은 단어에 대한 발음을 제공하기 위해 음성 인식기 트레이닝 상태중에도 사용될 수 있다.

목록 트레이닝 시스템(30)에 적용되었을 때, 각각의 스펠형 손님 이름에 대한 n 베스트 발음은 도 2 에서 모델 트레이너(46)에 입력값으로 작용한다. 본 발명의 양호한 실시예에서, 히든 마르코프 모델(Hidden Markov Model : HMM)은 모델 트레이너(46)를 위한 베이시스로 사용되었다. 각각의 손님 이름과 관련된 HMM 모델은 음성 인식기(22)에 의해 사용되기 위해 목록(32)에 저장된다. 모델 트레이너(46)는 하나이상의 발생된 발음에 대응하는 문맥 의존형 음소 모델을 쇠사슬형태로 연결하므로써 HMM 모델을 형성하는 모듈이다. 이러한 실시예의 자동 안내가 음소 레벨에서 음성 합성을 실행한다 하더라도, 본 기술분야의 숙련자라면 음성 인식기(22)는 다른 인식 레벨(즉, 단어 레벨)로 부여될 수 있음을 알 수 있을 것이다.

목록 트레이닝 시스템(30)은 모델 트레이너(46)에 입력값으로 작용하는 하나이상의 정렬된 수개의 발음을 출력값(44)으로서 생성할 수 있는 발음 추출기(40)를 선택적으로 작동시킨다. 등록시나 손님이 호텔에 머무르는 일련의 시간중, 호텔 손님의 호출된 이름은 전화(16)나 기타 다른 가청 수신 장치에 의해 포획된다. 호출된 이름은 손님 이름의 양호한 발음을 표시하므로, 모델 트레이너(46)로 사용될 수 있다. 예를 들어, 호출된 이름은 디지탈 형태로 전환되고, 이는 차례로 손님의 이름에 대응하는 n 베스트 발음(38)중에서 하나이상의 발음을 선택하도록 사용된다. 이를 위해, 모델 트레이너(46)는 n 베스트 발음(38)을 사용하여 다이나믹 그래머를 형성하며, 하나이상의 정렬된 발음(44)을 선택하기 위해 다이나믹 그래머를 사용하여 호출된 음성 입력값으로서의 인식을 실행한다.

음성 인식에 있어서, 각각의 손님 이름에 대한 n 베스트 발음(38)은 쇠사슬 형태의 녹화재생장치를 위한 음성 사운드를 발생시키는데 사용될 수 있다. 자동 호텔 안내 시스템(10)에 있어서, 음성 합성기(24)는 손님 이름의 적절한 발음을 손님과 접촉하는 호텔 종업원(예를 들어, 안내 데스크에서의 접수자)에게 제공된다. 상기 음성 합성기(24)는 E 메일 리더나 기타 문자-음성의 특징을 증대시키는데 사용될 수도 있다.

자동 안내 모듈과 목록 트레이닝 시스템(30)과 음성 인식기(22)와 음성 합성기(24)를 포함하는 자동 안내 시스템(10)은 각각 다른 호텔 시스템과의 사용을 위해 따로 따로 또는 함께 포장될 수 있다. 작동을 촉진시키고 비용을 절감하기 위해, 자동 안내 시스템(10)은 호텔 등록 시스템과 호텔 환전 및 경리 시스템과 호텔 전화 절환 시스템과 같은 기타 현존의 호텔 시스템과 인터페이스되도록 설계되었다. 이러한 형태의 인터페이스를 부여하기 위해 최소주문 형태도 필요할 것이다. 자동 안내 시스템(10)은 예를 들어, 발음, 국적 등을 현존의 데이터 구조에 합병하기 위해 현존의 호텔 손님 데이터베이스를 변경하는 것이 아니라, 등록시 스크린 캡쳐를 통해 작동 시스템 레벨시 설정된 인터페이스나 호텔 등록 시스템(14)에 의해 형성된 API 로부터 호텔 손님의 정보를 획득할 수 있다.

본 발명은 양호한 실시예를 참조로 서술되었기에 이에 한정되지 않으며, 본 기술분야의 숙련자라면 첨부된 청구범위로부터의 일탈없이 본 발명에 다양한 변형과 수정이 가해질 수 있음을 인식해야 한다.

Claims

복수개의 전화 연장부를 지지하는 전화 절환 시스템에 대해 룸 대 룸 호출을 조정하기 위한 자동화된 호텔 안내 시스템에 있어서,

호텔 손님의 이름을 구성하는 문자를 수납 및 저장하고 각각의 손님에게 그 관련의 전화 내선을 할당하는 호텔 손님 데이터베이스 시스템과,

단어 세트와 이러한 단어를 형성하는 음소를 연관시키는 단어-음소 데이터를 저장한 목록을 구비한 음성 인식 시스템과,

호텔 손님의 이름을 상기 목록에 단어로 추가하기 위해 상기 데이터베이스에 연결된 목록 트레이닝 시스템과,

상기 전화 내선중 하나로부터 호텔 손님의 호출된 이름을 이미 설정된 호텔 손님 이름으로 변환시키고 상기 데이터베이스 시스템으로 할당된 전화 내선을 검색하기 위해 상기 호텔 손님 이름을 사용하는 호출 루틴 시스템을 포함하며,

상기 트레이닝 시스템은 그 이름을 구성하는 문자를 단어-음소 데이터로 변환하므로써 스펠형 이름의 발음을 발생시키며, 상기 호출 루틴 시스템은 전화 절환 시스템이 상기 전화 내선중 하나로부터 호출된 이름의 엔트리에 응답하여 상기 전화 내선을 호출하도록 전화 절환 시스템과 인터페이스되는 것을 특징으로 하는 자동화된 호텔 안내 시스템.
제 1 항에 있어서, 상기 목록 트레이닝 시스템은 호텔 손님의 이름을 구성하는 문자를 상기 각각의 호텔 손님 이름에 대한 복수개의 발음으로 변환하기 위해 상기 데이터베이스 시스템에 연결된 음성표시기와, 상기 복수개의 대응 발음으로부터 각각의 호텔 손님 이름에 대한 히든 마르코프 모델(HMM)을 형성하고 음성 인식 시스템에 의해 사용하도록 상기 HMM 을 저장하기 위해 상기 음성표시기에 연결된 모델 트레이너를 부가로 포함하는 것을 특징으로 하는 자동화된 호텔 안내 시스템.
제 2 항에 있어서, 상기 모델 트레이너에 입력값으로 작용하는 적어도 하나의 발음을 발생시키기 위해 상기 음성표시기와 모델 트레이너 사이에 연결된 발음 추출기를 부가로 포함하며, 상기 발음 추출기는 호텔 손님 이름의 호출된 발음을 수신하며 호텔 손님 이름의 호출 발음에 기초하여 상기 음성표시기로부터의 복수개의 발음중 적어도 하나를 선택할 수 있도록 작동가능한 것을 특징으로 하는 자동화된 호텔 안내 시스템.
제 1 항에 있어서, 상기 호텔 손님 데이터베이스 시스템은 자동화된 호텔 안내 시스템이 상기 전화 내선 중 하나로부터 제 1 호텔 서비스의 호출 이름의 엔트리에 응답하여 제 1 전화 내선에 호출 루틴을 제공할 수 있도록 제 1 전화에 할당된 제 1 호텔 서비스의 이름을 구성하는 문자를 저장하는 것을 특징으로 하는 자동화된 호텔 안내 시스템.
제 1 항에 있어서, 상기 음성 인식기가 호텔 손님의 호출된 이름을 인식하지 못했을 때 룸 대 룸 호출을 조정하기 위해 상기 호출 루틴 시스템과 전화 절환 시스템에 연결된 스펠형 이름 분석기를 부가로 포함하는 것을 특징으로 하는 자동화된 호텔 안내 시스템.
복수개의 전화 내선을 지지하는 전화 절환 시스템에 대해 내선 대 내선 호출을 조정하기 위한 자동화된 호텔 안내 시스템에 있어서,

전화 시스템 사용자에 대한 식별자(indentifier) 구성 문자를 수용 및 저장하고 각각의 전화 시스템 사용자에게 그 관련의 전화 내선을 할당하는 전화 데이터 베이스 시스템과,

단어 세트를 이러한 단어를 구성하는 음소와 연관시키는 단어-음소 데이터를 저장하는 목록을 구비한 음성 인식 시스템과,

상기 인식자를 목록에 단어로 부가하기 위해 상기 전화 데이터베이스 시스템에 연결된 목록 트레이닝 시스템과,

상기 전화 내선중 하나로부터 입력된 시스템 사용자의 호출 인식자를 이미 설정된 시스템 사용자 인식자로 변환시키고 상기 전화 데이터베이스 시스템으로부터 할당된 전화 내선을 검색하기 위해 상기 시스템 사용자 식별자를 사용하는 호출 루틴 시스템을 포함하며,

상기 트레이닝 시스템은 상기 식별자 구성 문자를 단어-음소 데이터로 변화하므로써 상기 스펠형 단어의 발음을 생성하며, 상기 호출 루틴 시스템은 전화 절환 시스템이 상기 전화 내선중 하나로부터 식별자의 엔트리에 응답하여 상기 전화 내선을 호출하도록 전화 절환 시스템과 인터페이스되는 것을 특징으로 하는 자동화된 호텔 안내 시스템.
제 6 항에 있어서, 상기 목록 트레이닝 시스템은 식별자 구성 문자를 상기 각각의 식별자에 대한 복수개의 발음으로 변환하기 위해 상기 전화 데이터베이스 시스템에 연결된 음성표시기와, 상기 복수개의 대응 발음으로부터 상기 각각의 식별자에 대한 히든 마르코프 모델(HMM)을 형성하고 음성 인식 시스템에 의해 사용하기 위해 상기 HMM을 저장하기 위해 상기 음성표시기에 연결된 모델 트레이너를 부가로 포함하는 것을 특징으로 하는 자동화된 호텔 안내 시스템.
제 7 항에 있어서, 상기 모델 트레이너에 입력값으로 작용하는 적어도 하나의 발음을 발생시키기 위해 상기 음성표시기와 모델 트레이너 사이에 연결된 발음 추출기를 부가로 포함하며, 상기 발음 추출기는 시스템 사용자의 호출된 식별자를 수신하며 상기 식별자의 호출 발음에 기초하여 상기 음성표시기로부터의 복수개의 발음중 적어도 하나를 선택할 수 있도록 작동가능한 것을 특징으로 하는 자동화된 호텔 안내 시스템.
제 6 항에 있어서, 상기 식별자는 할당된 전화 내선에 관련된 위치와 적어도 하나의 이름으로 한정되는 것을 특징으로 하는 자동화된 호텔 안내 시스템.
제 6 항에 있어서, 상기 음성 인식기가 시스템 사용자의 호출된 식별자를 인식하지 못했을 때 룸 대 룸 호출을 조정하기 위해 상기 호출 루틴 시스템과 전화 절환 시스템에 연결된 스펠형 이름 인식기를 부가로 포함하는 것을 특징으로 하는 자동화된 호텔 안내 시스템.
복수개의 전화 내선을 지지하는 전화 절환 시스템에 대해 호텔 손님 이름의 합성 발음을 제공하기 위한 자동화된 안내 시스템에 있어서,

호텔 손님의 이름을 구성하는 문자를 수납 및 저장하고 각각의 손님에 관련된 정보를 저장하는 호텔 손님 데이터베이스 시스템과,

단어 세트와 이러한 단어를 형성하는 음소를 연관시키는 단어-음소 데이터를 저장한 목록을 구비한 음성 인식기 시스템과,

호텔 손님의 이름을 상기 목록에 단어로 추가하기 위해 상기 데이터베이스에 연결된 목록 트레이닝 시스템과,

상기 호텔 안내 데이터베이스 시스템의 시스템 사용자에 의해 입력된 호텔 손님의 스펠형 이름을 단어-음소 데이터를 사용하여 상기 스펠형 이름의 합성 발음으로 변환하기 위해 상기 호텔 손님 데이터베이스 시스템과 음성 합성기 시스템에 연결된 실제 안내부를 포함하며,

상기 트레이닝 시스템은 그 이름을 구성하는 문자를 단어-음소 데이터로 변환하므로써 스펠형 이름의 발음을 발생시키며, 상기 실제 안내부는 전화 내선 중 하나에 대해 시스템 사용자에게 합성된 발음을 제공하기 위해 상기 전화 절환 시스템과 인터페이스되는 것을 특징으로 하는 자동화된 안내 시스템.