KR100574768B1 - 음성 인식을 사용하는 자동화된 호텔 안내 시스템 - Google Patents

음성 인식을 사용하는 자동화된 호텔 안내 시스템 Download PDF

Info

Publication number
KR100574768B1
KR100574768B1 KR1019990015389A KR19990015389A KR100574768B1 KR 100574768 B1 KR100574768 B1 KR 100574768B1 KR 1019990015389 A KR1019990015389 A KR 1019990015389A KR 19990015389 A KR19990015389 A KR 19990015389A KR 100574768 B1 KR100574768 B1 KR 100574768B1
Authority
KR
South Korea
Prior art keywords
hotel
telephone
name
pronunciation
list
Prior art date
Application number
KR1019990015389A
Other languages
English (en)
Other versions
KR19990083596A (ko
Inventor
쥰쿼장-클로드
콘토리니마테오
Original Assignee
마쯔시다덴기산교 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마쯔시다덴기산교 가부시키가이샤 filed Critical 마쯔시다덴기산교 가부시키가이샤
Publication of KR19990083596A publication Critical patent/KR19990083596A/ko
Application granted granted Critical
Publication of KR100574768B1 publication Critical patent/KR100574768B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers

Abstract

자동화된 호텔 안내는 복수개의 전화 내선을 지지하는 전화 절환 시스템에 대해 룸 대 룸 호출을 조정하기 위해 제공된다. 호텔 등록 시스템은 호텔 손님의 스펠형 이름을 수용 및 저장하며 각각의 손님에게 관련의 전화 내선을 할당한다. 목록-트레이닝 시스템은 이러한 이름들을 구성하는 문자를 단어-음소 데이터로 변환시킴으로써 각각의 스펠형 이름에 대한 발음을 생성하기 위해 호텔 등록 시스템에 연결된다. 이러한 단어-음소 데이터는 음성 인식 시스템에 의해 사용되는 목록에 저장된다. 특히, 모델 트레이너에 기초한 히든 마르코프 모델(HMM)과 함께 음성표시기는 목록 트레이닝 시스템을 위한 베이시스로 작용하므로, 각각의 손님 이름과 관련된 하나이상의 HMM 모델이 목록에 저장된다. 자동화된 안내부는 전화 내선 중 하나로부터 입력된 호텔 손님의 호출 이름을 설정된 호텔 손님이름으로 변환하기 위해 호텔 등록 시스템으로부터 할당된 전화 내선을 검색하는데 사용되는 음성 인식 시스템에 연결된다. 상기 자동화된 안내에 의해 전화 절환 시스템은 전화 내선 중 하나로부터 호출된 이름의 엔트리에 응답하여 요구된 전화 내선을 호출하게 된다.

Description

음성 인식을 사용하는 자동화된 호텔 안내 시스템{AN AUTOMATED HOTEL ATTENDANT USING SPEECH RECOGNITION}
도 1 은 본 발명의 양호한 실시예의 호텔 자동 안내의 시스템 블록 다이아그램.
도 2 는 본 발명의 호텔 자동 안내 시스템에 사용하기 위한 목록 트레이닝 시스템의 성분을 도시한 다이아그램.
도 3 은 본 발명의 호텔 자동 안내 시스템에 사용하기 위해 음성표시기의 성분을 도시한 블럭 다이아그램.
도 4 는 음성표시기에 의해 사용된 문자 전용 트리를 도시한 결정 트리 다이아그램.
도 5 는 음성표시기에 의해 사용된 혼합 트리를 도시하는 결정 트리 다이아그램.
[도면의 주요부분에 대한 부호의 설명]
12 : 컴퓨터 14 : 등록 시스템
22 : 음성 인식기 26 : 음성 메일 시스템
30 : 목록 트레이닝 시스템 32 : 목록
본 발명은 자동화된 호텔 안내 시스템에 관한 것으로서, 특히 호텔 손님 데이터베이스와 마찬가지로 음성 인식기를 자동으로 트레이닝하기 위해 목록(lexicon) 트레이닝 시스템을 사용하는 자동화된 호텔 안내 시스템에 관한 것이다.
사무실 환경에서는 일반적으로 자동안내가 실행되고 있다. 전형적으로, 이러한 자동 안내는 구내 교환전화(private branch exchange: PBX)와 함께 호출 루틴 기능을 수행하도록 음성에 기초한 인식기를 사용하고 있다.
음성 인식에 있어서, 사전에서의 각각의 단어에 대한 발음 표기는 사용전에 음성 인식기에 대한 모델을 설정할 필요가 있다. 전형적으로, 발음 표기는 특정의 관심 언어의 음성 발음 뉘앙스에 숙련된 사전편집자에 의해 수동으로 형성된다. 사전에서의 각각의 단어에 대해 양호한 발음 표시를 전개하는 것은 시간소모적인 작업이며, 상당한 숙련을 필요로 한다. 또한, 자동 안내에 사용하기 위한 사전은 성(姓)에 대해서는 아직 완성되지 않았다. 각각의 성(姓)에 대한 발음 표기가 정적인 사무실 환경인 사람을 위해 형성되었지만, 이러한 접근은 호텔 손님 데이터베이스에서의 성(姓)처럼 일정하게 변하는 곳에서는 자동 안내를 실행하는 것이 가능한 것은 아니다.
자동 안내의 음성 인식을 위해 모델을 자동으로 설정하기 위해 목록 트레이닝 시스템을 사용하므로써 발음 표기를 생성시키기 위한 상당한 노력과 특정의 전문지식이 면제될 수 있다.
본 발명의 목록 트레이닝 시스템은 현존의 사전에서는 발견되지 않은 지리적 위치와 성(姓)과 같은 단어를 인식하기 위해 현재의 인식 시스템을 연장시킨다. 기재된 형태의 이름으로부터 복합 발음을 생성하기 위한 강건하고 신뢰성이 양호한 음성표시기는 이와 같은 목록 트레이닝 시스템에서 중요한 특징사항중 하나에 속한다. 일단 성의 발음이 파악되었으며, 자동 안내에 사용하기 위한 음성 인식기를 자동으로 트레이닝하거나 업데이트하는데 사용될 수 있는 화자독립형 음성 인식 모델을 설정할 수 있다.
따라서, 본 발명의 자동 안내는 상술한 원리들을 채용하여 호텔 등록 및 전화 시스템에 양호하게 사용될 수 있다. 자동화된 호텔 안내는 호텔 오퍼레이터와 연결될 필요없이 호텔 손님에게 부가적인 서비스와 함께 호출 루틴 기능을 제공한다. 호텔 등록 시스템은 호텔 손님의 스펠형 이름을 접수하고 저장하며 각각의 손님에게 그 관련의 전화 내선을 할당한다. 목록 트레이닝 시스템은 이러한 이름들을 구성하는 문자를 단어-음소 데이터로 변환시키므로써 각각의 스펠형 이름에 대한 발음을 생성하기 위해 호텔 등록 시스템에 연결된다. 이와 같은 단어-음소 데이터는 음성 인식 시스템에 의해 사용되는 목록에 순차적으로 저장된다. 자동 안내는 전화 내선중 하나로부터 호출된 호텔 손님의 이름을 호텔 등록 시스템으로부터 할당된 전화 내선을 검색하는데 사용할 수 있는 이미 설정된 호텔 손님의 이름으로 변환하기 위해 음성 인식 시스템에 연결된다. 이어서, 자동화된 안내에 의해 전화 절환 시스템이 전화 내선 중 하나로부터 호출된 이름의 엔트리에 응답하여 요구된 전화 내선을 호출하게 된다.
본 발명에 따른 하기의 설명은 단순히 예시적인 것이며, 본 발명 및 본 발명의 용도는 이에 한정되지 않는다. 또한, 하기의 설명은 음성 인식기를 자동으로 트레이닝하기 위해 목록 트레이닝 시스템을 사용하는 자동 호텔 안내 시스템을 서술하였지만, 본 기술 분야의 숙련자라면 다양한 음성 처리 실시예에 사용될 수 있음을 인식해야 한다.
호텔 자동 안내 시스템(10)은 오퍼레이터와 연결될 필요없이 음성 인식에 의해 호텔 손님에게 부가 서비스를 제공하기 위한 것이다. 호텔 손님이 체크인할 때, 그 손님은 전형적으로 호텔 안내부에 그 이름, 주소, 체크아웃 날짜, 및 기타 등록 정보를 제공한다. 호텔 자동 안내 시스템(10)을 도와주기 위해, 손님의 국적이나 방언과 같은 부가적인 정보가 호텔 손님으로부터 수집된다. 이러한 정보는 할당된 호텔 추정 룸넘버와 마찬가지로 컴퓨터(12)나 기타 다른 인터페이스 장치를 통해 종래의 호텔 등록 시스템(14)에 의해 포획된 후 호텔 손님 데이터베이스(20)에 저장된다.
일단 손님의 정보가 포획되면, 목록 트레이닝 시스템(30)은 그 기재된 손님 이름의 형태를 하나이상의 발음 표기로 자동으로 전환할 것이다. 손님 이름에 대한 공지의 발음을 사용하여, 목록 트레이닝 시스템(30)은 음성 인식기(22)에 의해 사용되는 화자독립형 음성 인식 모델을 설정하는 것이 가능하게 된다. 이러한 음 성 인식 모델은 음성 인식기(22)에 의해 억세스되는 목록(32)에 저장된다. 각각의 호텔 손님의 특정 발음표기는 손님이 호텔을 체크인하거나 체크아웃할 때마다 목록(32)에 자동으로 업데이트된다.
음성 인식을 사용하여, 자동 안내(50)는 호텔의 다른 손님에게 그 룸 넘버를 확인할 필요없이 이름에 의한 음성 다이얼링을 제공한다. 호텔 전화 절환 시스템(즉, PBX)(18)을 통해 호텔 전화(16)로부터의 호출은 자동 안내(50)에 의해 수신되고, 이는 차례로 호출 루틴 기능을 제공한다. 호출된 호텔 손님의 이름은 업데이트된 목록(32)을 사용하는 음성 인식기(22)에 의해 인식된다. 자동 안내(50)는 호출된 이름을 호텔 손님 이름을 사용하여 그 할당된 전화 내선에 배치하여 호텔 손님 데이터베이스(20)로부터 그 전화 내선을 검색한다. 마지막으로, 자동 안내(50)에 의해 전화 절환 시스템(18)은 검색된 전화 내선을 호출하므로써 그 요구된 호출을 적절하게 루틴시키게 된다. 당업자라면 분명히 알 수 있는 바와 같이, 음성에 기초한 인식을 못할 경우, 본 발명의 자동 안내는 스펠형 이름 인식기나 종래의 사전-지원 모델과 함께 사용될 수 있다. 마지막으로, 자동 안내는 손님의 호출을 호텔 오퍼레이터에게 전송해야 한다. 또한, 자동 안내(50)는 음성 다이얼링을 다른 호텔 서비스 및 내선부(예를 들어, 프런트 데스크 룸 서비스나 호텔 레스토랑)에 제공한다.
호텔에서 손님의 나머지 체류에 있어서, 본 발명의 자동 안내 시스템(10)은 다른 호텔 서비스로의 억세스도 제공할 수 있다. 예를 들어, 호텔 손님의 음성 발음은 음성 합성기(24)를 통해 음성 메일 시스템(26)에서 메시지를 주문하는데 사용된다. 주문된 메시지는 손님이 룸에 없을 때 호출을 회수하는데 사용된다. 또한, 손님의 국적은 그 국적에 해당하는 언어로 기상 호출을 제공하는데도 사용된다. 본 발명의 자동 안내는 다른 호텔 시스템(28)과의 인터페이스도 고려될 수 있다.
도 2 에는 목록 트레이닝 시스템(30)이 상세히 도시되어 있다. 일반적으로 목록 트레이닝 시스템은 그 이름을 구성하는 문자를 단어-음소 데이터로 전환하고 음성 인식기(22)를 트레이닝하기 위해 이렇게 발생된 발음을 사용하므로써 스펠형 이름의 발음을 생성한다. 목록 트레이닝 시스템(30)을 작동시키는데는 튼튼하고 신뢰성이 양호한 음성표시기가 반드시 있어야 한다. 호텔 등록 시스템(14)에 의해 포획되었을 때, 손님 이름의 스펠링 형태는 음성표시기(34)로 입력된다.
음성표시기(34)의 예시적인 실시예가 도시된 도 3 에는 호텔 손님의 이름의 스펠링 형태에 기초하여 복수개의 발음을 생성하는 원리가 도시되어 있다. 지금까지의 스펠형 단어-발음 표기에 대한 최선의 시도는 오직 문자 그 자체에만 의존하였다. 이러한 기법은 상당히 바람직하다. 예를 들어, 문자 전용 발음 발생기는 단어 Bible 을 적절하게 발음하는데 상당한 어려움이 있다. 일련의 문자에 기초하여, 문자 전용 시스템은 단어 "Bib-l"을 상당한 등급의 학생들이 읽는 것처럼 발음할 것이다. 종래 시스템에서의 실패는 많은 언어의 발음 법칙에 의해 부여된 그 본래의 불명확함에 의존한다. 예를 들어, 영어는 수백가지의 상이한 발음 규칙을 갖고 있어, 문제를 단어 대 단어에 기초하여 접근하는것을 어렵게 하고 수치적으로 상당한 비용을 초래하게 한다.
그러나, 음성표시기(34)는 2가지 상태를 사용하는데, 제 1 상태는 문자 전용 결정트리 세트(72)를 사용하며, 제 2 상태는 혼합결정 트리 세트(74)를 사용한다. 일련의 문자 B-I-B-L-E 와 같은 입력 시컨스(76)는 다이나믹 프로그래밍 음소 시컨스 발생기(78)로 공급된다. 상기 시컨스 발생기는 스펠형 단어 입력 시컨스의 가능한 발음 후보를 제공하는 발음 리스트(80)를 발생시키기 위해 문자전용 트리(72)를 사용한다.
시컨스 발생기는 시컨스에서 각각의 문자를 연속적으로 검사하며, 문자전용 트리에 내장된 가능성 데이터에 기초하여 음소 발음을 선택하도록 그 문자와 관련된 결정 트리를 그 문자에 적용한다. 문자 전용 결정 트리 세트는 알파벳에서 각각의 문자에 대한 결정 트리를 포함한다. 도 4 는 문자 E 에 대한 문자 전용 결정 트리의 실시예를 나타내고 있다. 상기 결정 트리는 복수개의 내부 노드(도면에는 타원형으로 도시)와 복수개의 리프 노드(도면에는 사각형으로 도시)를 포함한다. 각각의 내부 노드는 예-아니오 질문에 거주한다. 상기 예-아니오 질문은 예 또는 아니오 로 답할 수 있는 질문이다. 문자 전용 트리에서, 이러한 질문은 입력 시컨스에서 주어진 문자(이 경우, 문자 E)와 그 인접한 문자를 향한 것이다. 도 4 에서, 각각의 내부 노드는 그 관련의 질문이 예 또는 아니오 인지의 여부에 따라 좌측 또는 우측으로 분기된다는 것을 숙지해야 한다.
도 4 에서는 약자가 사용되는데, +1 또는 -1 과 같은 질문의 숫자는 현재 문자에 대한 스펠링에서의 위치를 언급한다. 예를 들어, "+1L =='R'?" 는 "현재의 문자(이 경우, 문자 E 임) 다음에 있는 것은 문자 R 인가?" 를 의미한다. 약자 CONS 와 VOW 는 문자의 종류 즉, 자음과 모음을 나타낸다. 이웃한 문자나 무의미한 문자의 부재는 (이러한 문자를 대응의 음소 발음과 정렬하는 필러 또는 플레이스홀더로서 사용되는) 심볼 - 로 나타낸다. 심볼 # 은 단어 경계를 나타낸다.
리프 노드는 특정의 음소가 주어진 문자의 정확한 발음을 제공할 가능성을 나타내는 수치와 가능한 음소 발음을 연관시키는 가능성 데이터에 거주한다. 예를 들어, 표시 "iy=>0.51" 는 "이러한 리프에서 음소 'iy'의 가능성은 0.51 이다" 를 의미한다. 무의미한 음소 즉, 침묵은 심볼 "-" 로 표시한다.
시컨스 발생기(78)(도 3)는 리스트(80)에 저장된 하나이상의 발음 가설을 구성하기 위해 문자 전용 결정 트리(72)를 사용한다. 각각의 발음은 결정 트리(72)를 사용하여 선택된 각각의 음소의 가능성 스코어를 조합하여 도달된 수치 스코어와 관련되어 있다. 단어 발음은 가능한 조합의 매트릭스를 조합한 후 n-베스트 후보를 선택하도록 다이나믹 프로그래밍을 사용하므로써 기록된다. 선택적으로, 상기 n-베스트 후보는 먼저 최적의 가능성있는 단어 후보를 확인하고 하기와 같은 반복적인 치환을 통해 부가적인 후보를 발생시키는 대체 기법을 사용하여 선택된다.
최상의 스코어 음소들(리프 노드를 시험하여 확인된)의 각각의 스코어를 곱하고 이러한 선택을 가장 가능성있는 후보나 제 1 베스트 단어 후보로 사용하므로써 먼저 최상의 가능성 스코어를 가진 발음이 선택된다. 그후, 최초 선택된 음소와의 차이가 가장 작은 기선택되지않은 음소를 다시 확인하기 위해 리프 노드에서 음소 데이터를 시험하므로써 부가적인(n 베스트) 후보가 선택된다. 이와 같은 최소편차 음소는 최초 선택된 음소로 대체되므로써 제 2 베스트 단어 후보를 발생시킨다. 상술한 바와 같은 처리는 필요한 갯수의 n 베스트 후보가 선택될 때까지 반복적으로 실시된다. 리스트(80)는 하강 스코어 순서로 저장되므로, 문자 전용 분 석에 의해 베스트로 판정된 발음이 먼저 리스트에 나타난다.
상술한 바와 같이, 문자 전용 분석은 불량한 결과를 자주 생성할 것이다. 이것은 문자 전용 분석이 각각의 문자에서 일련의 문자에 의해 어떤 음소가 발생될 것인지를 결정할 방법이 없기 때문이다. 따라서, 문자 전용 분석은 실제 음성에서는 발생되지 않는 높은 스코어의 발음을 생성할 수 있다. 예를 들어, 적절한 이름인 아킬레스(Achilles)는 ll's: ah-k-ih-l-l-iy-z 음성대로 발음하는 발음으로 나타나게 된다. 자연스런 음성에서, 두번째 l 은 ah-k-ih-l-iy-z 로서 실제로는 발음되지 않는다. 문자 전용 트리를 사용하는 시컨스 발생기는 실제 음성에서는 발생되지 않는 단어 발음을 스크린할 메카니즘을 갖고 있지 않다.
음성표시기(34)의 제 2 상태는 상술한 문제점에 접근하고 있다. 혼합 트리 스코어 추정기(82)는 각각의 발음 리스트(80)의 생존능력에 접근하기 위해 혼합결정 트리세트(74)를 사용한다. 상기 스코어 추정기는 시컨스 발생기(78)에 의해 각각의 문자에 할당된 음소를 따라 입력 시컨스에서 각각의 문자를 연속적으로 시험하므로써 작동된다. 문자 전용 트리 세트와 마찬가지로, 혼합 트리 세트도 알파벳의 각각의 문자에 대해 혼합 트리를 갖는다. 예시적인 혼합 트리가 도 5 에 도시되어 있다. 문자 전용 트리와 마찬가지로, 혼합 트리는 내부 노드와 리프 노드를 갖는다. 도 5 에 도시된 바와 같이, 상기 내부 노드는 타원형으로 도시되었으며, 리프 노드는 사각형으로 도시되어 있다. 내부 노드는 예-아니오 질문에 거주하며, 리프 노드는 가능성 데이터에 거주한다. 혼합 트리의 구조가 문자 전용 트리와 유사하지만, 이들 사이에는 중요한 차이점이 있다. 혼합 트리의 내부 노드는 2개의 상이한 질문 등급을 포함할 수 있다. 내부 노드는 시컨스에서 주어진 문자와 그 인접한 문자에 대한 질문을 포함하거나, 상기 시컨스에 대응하는 문자에 관련된 음소와 그 인접한 음소에 대한 질문을 포함할 수 있다. 따라서, 결정 트리는 혼합되며, 이것은 혼합된 질문 등급을 포함한다.
도 5 에 사용된 약자는 일부 부가된 약자와 함께 도 4 에 사용된 것과 유사하다. L 은 문자와 그 인접한 문자에 대한 질문을 나타낸다. P 는 음소와 그 인접한 음소에 대한 질문을 나타낸다. 예를 들어, 질문 "+1L=='D'?" 은 +1 위치에 있는 것은 문자 'D'?" 를 의미한다. 약자 CONS 와 SYL 은 음소 분류 즉, 자음과 음절을 나타낸다. 예를 들어, "+1P==CONS?" 는 "+1 위치에 있는 음소는 자음인가"를 의미한다. 리프 노드에서의 숫자는 문자 전용 트리에서 실행될 때의 음소 가능성을 제공한다.
혼합 트리 스코어 추정기는 혼합 트리의 리드 노드에서 가능성 데이터를 사용하여 혼합 트리 질문에 기초한 리스트(80)에서 각각의 발음을 재기록한다. 필요할 경우, 발음 리스트는 리스트(84)로서 각각의 스코어와 관련되어 저장될 수도 있다. 필요할 경우, 상기 리스트(84)는 하강 순서로 기록될 수 있으므로, 첫번째 리스트의 발음은 가장 높은 스코어가 된다.
여러가지 경우에 있어서, 리스트(84)에서 가장 높은 스코어를 점유하고 있는 발음은 리스트(80)에서 가장 높은 스코어를 점유하고 있는 발음과는 다르다. 이것은 혼합 트리 스코어 추정기가 혼합 트리(74)를 사용하여 자체모순이 없는 음소 시컨스를 포함하지 않는 발음들을 스크린하거나 자연스런 음성에서 발생하지 않는 발음을 제공하기 때문이다. 상술한 바와 같이, 도 3 에 도시한 음성표시기(34)는 단지 하나의 가능한 실시예를 나타낸 것이다.
발음 리스트(84)는 음성 인식기와 음성 합성을 위한 발음 사전을 형성하는데 사용된다. 필요한 경우, 선택기 모듈(86)은 리스트에서 하나이상의 발음을 회수하기 위해 리스트(84)에 접근할 수 있다. 전형적으로, 선택기(86)는 가장 높은 스코어를 갖는 발음을 회수한 후 이를 출력 발음(88)으로 제공한다. 음성 인식에 관해서, 발음 사전은 인식기 목록에서 이미 발견되지 않은 호텔 손님 이름과 같은 단어에 대한 발음을 제공하기 위해 음성 인식기 트레이닝 상태중에도 사용될 수 있다.
목록 트레이닝 시스템(30)에 적용되었을 때, 각각의 스펠형 손님 이름에 대한 n 베스트 발음은 도 2 에서 모델 트레이너(46)에 입력값으로 작용한다. 본 발명의 양호한 실시예에서, 히든 마르코프 모델(Hidden Markov Model : HMM)은 모델 트레이너(46)를 위한 베이시스로 사용되었다. 각각의 손님 이름과 관련된 HMM 모델은 음성 인식기(22)에 의해 사용되기 위해 목록(32)에 저장된다. 모델 트레이너(46)는 하나이상의 발생된 발음에 대응하는 문맥 의존형 음소 모델을 쇠사슬형태로 연결하므로써 HMM 모델을 형성하는 모듈이다. 이러한 실시예의 자동 안내가 음소 레벨에서 음성 합성을 실행한다 하더라도, 본 기술분야의 숙련자라면 음성 인식기(22)는 다른 인식 레벨(즉, 단어 레벨)로 부여될 수 있음을 알 수 있을 것이다.
목록 트레이닝 시스템(30)은 모델 트레이너(46)에 입력값으로 작용하는 하나이상의 정렬된 수개의 발음을 출력값(44)으로서 생성할 수 있는 발음 추출기(40)를 선택적으로 작동시킨다. 등록시나 손님이 호텔에 머무르는 일련의 시간중, 호텔 손님의 호출된 이름은 전화(16)나 기타 다른 가청 수신 장치에 의해 포획된다. 호출된 이름은 손님 이름의 양호한 발음을 표시하므로, 모델 트레이너(46)로 사용될 수 있다. 예를 들어, 호출된 이름은 디지탈 형태로 전환되고, 이는 차례로 손님의 이름에 대응하는 n 베스트 발음(38)중에서 하나이상의 발음을 선택하도록 사용된다. 이를 위해, 모델 트레이너(46)는 n 베스트 발음(38)을 사용하여 다이나믹 그래머를 형성하며, 하나이상의 정렬된 발음(44)을 선택하기 위해 다이나믹 그래머를 사용하여 호출된 음성 입력값으로서의 인식을 실행한다.
음성 인식에 있어서, 각각의 손님 이름에 대한 n 베스트 발음(38)은 쇠사슬 형태의 녹화재생장치를 위한 음성 사운드를 발생시키는데 사용될 수 있다. 자동 호텔 안내 시스템(10)에 있어서, 음성 합성기(24)는 손님 이름의 적절한 발음을 손님과 접촉하는 호텔 종업원(예를 들어, 안내 데스크에서의 접수자)에게 제공된다. 상기 음성 합성기(24)는 E 메일 리더나 기타 문자-음성의 특징을 증대시키는데 사용될 수도 있다.
자동 안내 모듈과 목록 트레이닝 시스템(30)과 음성 인식기(22)와 음성 합성기(24)를 포함하는 자동 안내 시스템(10)은 각각 다른 호텔 시스템과의 사용을 위해 따로 따로 또는 함께 포장될 수 있다. 작동을 촉진시키고 비용을 절감하기 위해, 자동 안내 시스템(10)은 호텔 등록 시스템과 호텔 환전 및 경리 시스템과 호텔 전화 절환 시스템과 같은 기타 현존의 호텔 시스템과 인터페이스되도록 설계되었다. 이러한 형태의 인터페이스를 부여하기 위해 최소주문 형태도 필요할 것이다. 자동 안내 시스템(10)은 예를 들어, 발음, 국적 등을 현존의 데이터 구조에 합병하기 위해 현존의 호텔 손님 데이터베이스를 변경하는 것이 아니라, 등록시 스크린 캡쳐를 통해 작동 시스템 레벨시 설정된 인터페이스나 호텔 등록 시스템(14)에 의해 형성된 API 로부터 호텔 손님의 정보를 획득할 수 있다.
본 발명은 양호한 실시예를 참조로 서술되었기에 이에 한정되지 않으며, 본 기술분야의 숙련자라면 첨부된 청구범위로부터의 일탈없이 본 발명에 다양한 변형과 수정이 가해질 수 있음을 인식해야 한다.

Claims (11)

  1. 복수개의 전화 연장부를 지지하는 전화 절환 시스템에 대해 룸 대 룸 호출을 조정하기 위한 자동화된 호텔 안내 시스템에 있어서,
    호텔 손님의 이름을 구성하는 문자를 수납 및 저장하고 각각의 손님에게 그 관련의 전화 내선을 할당하는 호텔 손님 데이터베이스 시스템과,
    단어 세트와 이러한 단어를 형성하는 음소를 연관시키는 단어-음소 데이터를 저장한 목록을 구비한 음성 인식 시스템과,
    호텔 손님의 이름을 상기 목록에 단어로 추가하기 위해 상기 데이터베이스에 연결된 목록 트레이닝 시스템과,
    상기 전화 내선중 하나로부터 호텔 손님의 호출된 이름을 이미 설정된 호텔 손님 이름으로 변환시키고 상기 데이터베이스 시스템으로 할당된 전화 내선을 검색하기 위해 상기 호텔 손님 이름을 사용하는 호출 루틴 시스템을 포함하며,
    상기 트레이닝 시스템은 그 이름을 구성하는 문자를 단어-음소 데이터로 변환하므로써 스펠형 이름의 발음을 발생시키며, 상기 호출 루틴 시스템은 전화 절환 시스템이 상기 전화 내선중 하나로부터 호출된 이름의 엔트리에 응답하여 상기 전화 내선을 호출하도록 전화 절환 시스템과 인터페이스되는 것을 특징으로 하는 자동화된 호텔 안내 시스템.
  2. 제 1 항에 있어서, 상기 목록 트레이닝 시스템은 호텔 손님의 이름을 구성하는 문자를 상기 각각의 호텔 손님 이름에 대한 복수개의 발음으로 변환하기 위해 상기 데이터베이스 시스템에 연결된 음성표시기와, 상기 복수개의 대응 발음으로부터 각각의 호텔 손님 이름에 대한 히든 마르코프 모델(HMM)을 형성하고 음성 인식 시스템에 의해 사용하도록 상기 HMM 을 저장하기 위해 상기 음성표시기에 연결된 모델 트레이너를 부가로 포함하는 것을 특징으로 하는 자동화된 호텔 안내 시스템.
  3. 제 2 항에 있어서, 상기 모델 트레이너에 입력값으로 작용하는 적어도 하나의 발음을 발생시키기 위해 상기 음성표시기와 모델 트레이너 사이에 연결된 발음 추출기를 부가로 포함하며, 상기 발음 추출기는 호텔 손님 이름의 호출된 발음을 수신하며 호텔 손님 이름의 호출 발음에 기초하여 상기 음성표시기로부터의 복수개의 발음중 적어도 하나를 선택할 수 있도록 작동가능한 것을 특징으로 하는 자동화된 호텔 안내 시스템.
  4. 제 1 항에 있어서, 상기 호텔 손님 데이터베이스 시스템은 자동화된 호텔 안내 시스템이 상기 전화 내선 중 하나로부터 제 1 호텔 서비스의 호출 이름의 엔트리에 응답하여 제 1 전화 내선에 호출 루틴을 제공할 수 있도록 제 1 전화에 할당된 제 1 호텔 서비스의 이름을 구성하는 문자를 저장하는 것을 특징으로 하는 자동화된 호텔 안내 시스템.
  5. 제 1 항에 있어서, 상기 음성 인식기가 호텔 손님의 호출된 이름을 인식하지 못했을 때 룸 대 룸 호출을 조정하기 위해 상기 호출 루틴 시스템과 전화 절환 시스템에 연결된 스펠형 이름 분석기를 부가로 포함하는 것을 특징으로 하는 자동화된 호텔 안내 시스템.
  6. 복수개의 전화 내선을 지지하는 전화 절환 시스템에 대해 내선 대 내선 호출을 조정하기 위한 자동화된 호텔 안내 시스템에 있어서,
    전화 시스템 사용자에 대한 식별자(indentifier) 구성 문자를 수용 및 저장하고 각각의 전화 시스템 사용자에게 그 관련의 전화 내선을 할당하는 전화 데이터 베이스 시스템과,
    단어 세트를 이러한 단어를 구성하는 음소와 연관시키는 단어-음소 데이터를 저장하는 목록을 구비한 음성 인식 시스템과,
    상기 인식자를 목록에 단어로 부가하기 위해 상기 전화 데이터베이스 시스템에 연결된 목록 트레이닝 시스템과,
    상기 전화 내선중 하나로부터 입력된 시스템 사용자의 호출 인식자를 이미 설정된 시스템 사용자 인식자로 변환시키고 상기 전화 데이터베이스 시스템으로부터 할당된 전화 내선을 검색하기 위해 상기 시스템 사용자 식별자를 사용하는 호출 루틴 시스템을 포함하며,
    상기 트레이닝 시스템은 상기 식별자 구성 문자를 단어-음소 데이터로 변화하므로써 상기 스펠형 단어의 발음을 생성하며, 상기 호출 루틴 시스템은 전화 절환 시스템이 상기 전화 내선중 하나로부터 식별자의 엔트리에 응답하여 상기 전화 내선을 호출하도록 전화 절환 시스템과 인터페이스되는 것을 특징으로 하는 자동화된 호텔 안내 시스템.
  7. 제 6 항에 있어서, 상기 목록 트레이닝 시스템은 식별자 구성 문자를 상기 각각의 식별자에 대한 복수개의 발음으로 변환하기 위해 상기 전화 데이터베이스 시스템에 연결된 음성표시기와, 상기 복수개의 대응 발음으로부터 상기 각각의 식별자에 대한 히든 마르코프 모델(HMM)을 형성하고 음성 인식 시스템에 의해 사용하기 위해 상기 HMM을 저장하기 위해 상기 음성표시기에 연결된 모델 트레이너를 부가로 포함하는 것을 특징으로 하는 자동화된 호텔 안내 시스템.
  8. 제 7 항에 있어서, 상기 모델 트레이너에 입력값으로 작용하는 적어도 하나의 발음을 발생시키기 위해 상기 음성표시기와 모델 트레이너 사이에 연결된 발음 추출기를 부가로 포함하며, 상기 발음 추출기는 시스템 사용자의 호출된 식별자를 수신하며 상기 식별자의 호출 발음에 기초하여 상기 음성표시기로부터의 복수개의 발음중 적어도 하나를 선택할 수 있도록 작동가능한 것을 특징으로 하는 자동화된 호텔 안내 시스템.
  9. 제 6 항에 있어서, 상기 식별자는 할당된 전화 내선에 관련된 위치와 적어도 하나의 이름으로 한정되는 것을 특징으로 하는 자동화된 호텔 안내 시스템.
  10. 제 6 항에 있어서, 상기 음성 인식기가 시스템 사용자의 호출된 식별자를 인식하지 못했을 때 룸 대 룸 호출을 조정하기 위해 상기 호출 루틴 시스템과 전화 절환 시스템에 연결된 스펠형 이름 인식기를 부가로 포함하는 것을 특징으로 하는 자동화된 호텔 안내 시스템.
  11. 복수개의 전화 내선을 지지하는 전화 절환 시스템에 대해 호텔 손님 이름의 합성 발음을 제공하기 위한 자동화된 안내 시스템에 있어서,
    호텔 손님의 이름을 구성하는 문자를 수납 및 저장하고 각각의 손님에 관련된 정보를 저장하는 호텔 손님 데이터베이스 시스템과,
    단어 세트와 이러한 단어를 형성하는 음소를 연관시키는 단어-음소 데이터를 저장한 목록을 구비한 음성 인식기 시스템과,
    호텔 손님의 이름을 상기 목록에 단어로 추가하기 위해 상기 데이터베이스에 연결된 목록 트레이닝 시스템과,
    상기 호텔 안내 데이터베이스 시스템의 시스템 사용자에 의해 입력된 호텔 손님의 스펠형 이름을 단어-음소 데이터를 사용하여 상기 스펠형 이름의 합성 발음으로 변환하기 위해 상기 호텔 손님 데이터베이스 시스템과 음성 합성기 시스템에 연결된 실제 안내부를 포함하며,
    상기 트레이닝 시스템은 그 이름을 구성하는 문자를 단어-음소 데이터로 변환하므로써 스펠형 이름의 발음을 발생시키며, 상기 실제 안내부는 전화 내선 중 하나에 대해 시스템 사용자에게 합성된 발음을 제공하기 위해 상기 전화 절환 시스템과 인터페이스되는 것을 특징으로 하는 자동화된 안내 시스템.
KR1019990015389A 1998-04-30 1999-04-29 음성 인식을 사용하는 자동화된 호텔 안내 시스템 KR100574768B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US9/070,399 1998-04-30
US09/070,399 US6314165B1 (en) 1998-04-30 1998-04-30 Automated hotel attendant using speech recognition
US09/070,399 1998-04-30

Publications (2)

Publication Number Publication Date
KR19990083596A KR19990083596A (ko) 1999-11-25
KR100574768B1 true KR100574768B1 (ko) 2006-04-28

Family

ID=22095067

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990015389A KR100574768B1 (ko) 1998-04-30 1999-04-29 음성 인식을 사용하는 자동화된 호텔 안내 시스템

Country Status (7)

Country Link
US (1) US6314165B1 (ko)
EP (1) EP0953967B1 (ko)
JP (1) JP3135233B2 (ko)
KR (1) KR100574768B1 (ko)
CN (1) CN1116770C (ko)
DE (1) DE69922872T2 (ko)
TW (1) TW424221B (ko)

Families Citing this family (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6411932B1 (en) * 1998-06-12 2002-06-25 Texas Instruments Incorporated Rule-based learning of word pronunciations from training corpora
US8250620B1 (en) 1998-12-30 2012-08-21 At&T Intellectual Property Ii, L.P. System and method for sharing information between a concierge and guest
US6425131B2 (en) * 1998-12-30 2002-07-23 At&T Corp. Method and apparatus for internet co-browsing over cable television and controlled through computer telephony
JP2002024412A (ja) * 2000-07-03 2002-01-25 Toshimitsu Kagawa 宿泊室の設備操作システム
JP2002032491A (ja) * 2000-07-19 2002-01-31 Toshimitsu Kagawa 宿泊客に対する情報提供システム
WO2002011121A1 (en) * 2000-07-31 2002-02-07 Eliza Corporation Method of and system for improving accuracy in a speech recognition system
TW472232B (en) * 2000-08-11 2002-01-11 Ind Tech Res Inst Probability-base fault-tolerance natural language understanding method
EP1215661A1 (en) * 2000-12-14 2002-06-19 TELEFONAKTIEBOLAGET L M ERICSSON (publ) Mobile terminal controllable by spoken utterances
EP1220200B1 (de) * 2000-12-18 2003-09-24 Siemens Aktiengesellschaft Verfahren und Anordnung zur sprecherunabhängigen Spracherkennung für ein Telekommunikations- bzw. Datenendgerät
US20020087317A1 (en) * 2000-12-29 2002-07-04 Lee Victor Wai Leung Computer-implemented dynamic pronunciation method and system
US6967947B1 (en) * 2001-03-29 2005-11-22 At&T Corp. Method and system for providing controllable enhanced call service features at mobile locations
US6763102B1 (en) * 2001-04-05 2004-07-13 At&T Corp. Method for handling incoming calls directed to a virtual communication service subscriber via a guest PBX
US6925154B2 (en) * 2001-05-04 2005-08-02 International Business Machines Corproation Methods and apparatus for conversational name dialing systems
US7533020B2 (en) * 2001-09-28 2009-05-12 Nuance Communications, Inc. Method and apparatus for performing relational speech recognition
US7308404B2 (en) * 2001-09-28 2007-12-11 Sri International Method and apparatus for speech recognition using a dynamic vocabulary
US6996519B2 (en) * 2001-09-28 2006-02-07 Sri International Method and apparatus for performing relational speech recognition
EP1302928A1 (de) * 2001-10-16 2003-04-16 Siemens Aktiengesellschaft Verfahren zur Spracherkennung, insbesondere von Namen, und Spracherkenner
MY141150A (en) * 2001-11-02 2010-03-15 Panasonic Corp Channel selecting apparatus utilizing speech recognition, and controling method thereof
US8285537B2 (en) * 2003-01-31 2012-10-09 Comverse, Inc. Recognition of proper nouns using native-language pronunciation
US20040156493A1 (en) * 2003-02-06 2004-08-12 Comverse, Ltd. Method and apparatus for providing a central telephony service for a calling party at the called party telephone
AU2004200809B2 (en) * 2003-03-07 2006-05-11 Samsung Electronics Co., Ltd. Method and system for providing data services to mobile communication terminals and mobile communication terminal therefor
US7756726B2 (en) * 2003-09-25 2010-07-13 International Business Machines Corporation Secured medical sign-in
US7660715B1 (en) * 2004-01-12 2010-02-09 Avaya Inc. Transparent monitoring and intervention to improve automatic adaptation of speech models
CN100592385C (zh) * 2004-08-06 2010-02-24 摩托罗拉公司 用于对多语言的姓名进行语音识别的方法和系统
US8923838B1 (en) 2004-08-19 2014-12-30 Nuance Communications, Inc. System, method and computer program product for activating a cellular phone account
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7653543B1 (en) 2006-03-24 2010-01-26 Avaya Inc. Automatic signal adjustment based on intelligibility
US7983401B1 (en) 2006-08-15 2011-07-19 At&T Mobility Ii Llc Customized provision of automated menu options
US7962342B1 (en) 2006-08-22 2011-06-14 Avaya Inc. Dynamic user interface for the temporarily impaired based on automatic analysis for speech patterns
US7925508B1 (en) 2006-08-22 2011-04-12 Avaya Inc. Detection of extreme hypoglycemia or hyperglycemia based on automatic analysis of speech patterns
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8041344B1 (en) 2007-06-26 2011-10-18 Avaya Inc. Cooling off period prior to sending dependent on user's state
US9386154B2 (en) * 2007-12-21 2016-07-05 Nuance Communications, Inc. System, method and software program for enabling communications between customer service agents and users of communication devices
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8391464B1 (en) 2010-06-24 2013-03-05 Nuance Communications, Inc. Customer service system, method, and software program product for responding to queries using natural language understanding
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
CN103474063B (zh) * 2013-08-06 2015-12-23 福建华映显示科技有限公司 语音辨识系统以及方法
DE102013216427B4 (de) * 2013-08-20 2023-02-02 Bayerische Motoren Werke Aktiengesellschaft Vorrichtung und Verfahren zur fortbewegungsmittelbasierten Sprachverarbeitung
GB201320334D0 (en) * 2013-11-18 2014-01-01 Microsoft Corp Identifying a contact
WO2015073766A1 (en) * 2013-11-18 2015-05-21 Microsoft Technology Licensing, Llc Identifying a contact
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9519827B2 (en) * 2014-12-24 2016-12-13 International Business Machines Corporation Personalized, automated receptionist
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
CA3049148A1 (en) 2017-01-24 2018-08-02 Tietronix Software, Inc. System and method for three-dimensional augmented reality guidance for use of medical equipment
US20210327304A1 (en) * 2017-01-24 2021-10-21 Tienovix, Llc System and method for augmented reality guidance for use of equpment systems
US20210327303A1 (en) * 2017-01-24 2021-10-21 Tienovix, Llc System and method for augmented reality guidance for use of equipment systems
US20210295048A1 (en) * 2017-01-24 2021-09-23 Tienovix, Llc System and method for augmented reality guidance for use of equipment systems
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10580098B2 (en) * 2017-05-29 2020-03-03 Virtual OnQ Systems, LLC Voice activated hotel room monitor
FR3066848B1 (fr) * 2017-05-29 2021-07-02 Virtual Onq Systems Llc Supervision de chambre d'hotel activee par la voix
CN108932946B (zh) * 2018-06-29 2020-03-13 百度在线网络技术(北京)有限公司 客需服务的语音交互方法和装置
US11844654B2 (en) 2019-08-19 2023-12-19 Caption Health, Inc. Mid-procedure view change for ultrasound diagnostics
CN110491374A (zh) * 2019-08-27 2019-11-22 北京明日汇科技管理有限公司 基于神经网络的酒店服务语音交互识别方法及装置
KR102222597B1 (ko) * 2020-02-03 2021-03-05 (주)라이언로켓 콜미 서비스를 위한 음성 합성 장치 및 방법

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62140593A (ja) * 1985-12-13 1987-06-24 Nec Corp 外線呼自動内線転送装置
JPS62166642A (ja) * 1986-01-20 1987-07-23 Fujitsu Ltd 電話転送方式
JPH0353649A (ja) * 1989-07-21 1991-03-07 Toshiba Corp 電話交換装置
JPH0420158A (ja) * 1990-05-15 1992-01-23 Mitsubishi Electric Corp 構内交換装置
EP0568979A1 (en) * 1992-05-08 1993-11-10 Sony Corporation Speech recognition adapter for telephone system
JPH0818670A (ja) * 1994-07-04 1996-01-19 Mitsubishi Denki Bill Techno Service Kk 構内交換機
US5752230A (en) * 1996-08-20 1998-05-12 Ncr Corporation Method and apparatus for identifying names with a speech recognition program
US5799065A (en) * 1996-05-06 1998-08-25 Matsushita Electric Industrial Co., Ltd. Call routing device employing continuous speech

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5212730A (en) 1991-07-01 1993-05-18 Texas Instruments Incorporated Voice recognition of proper names using text-derived recognition models
EP0562138A1 (en) 1992-03-25 1993-09-29 International Business Machines Corporation Method and apparatus for the automatic generation of Markov models of new words to be added to a speech recognition vocabulary
WO1997019545A1 (en) * 1995-11-17 1997-05-29 At & T Corp. Automatic vocabulary generation for telecommunications network-based voice-dialing
US5930336A (en) * 1996-09-30 1999-07-27 Matsushita Electric Industrial Co., Ltd. Voice dialing server for branch exchange telephone systems
US6092044A (en) * 1997-03-28 2000-07-18 Dragon Systems, Inc. Pronunciation generation in speech recognition
DE19751123C1 (de) * 1997-11-19 1999-06-17 Deutsche Telekom Ag Vorrichtung und Verfahren zur sprecherunabhängigen Sprachnamenwahl für Telekommunikations-Endeinrichtungen
US6029132A (en) * 1998-04-30 2000-02-22 Matsushita Electric Industrial Co. Method for letter-to-sound in text-to-speech synthesis
US6016471A (en) * 1998-04-29 2000-01-18 Matsushita Electric Industrial Co., Ltd. Method and apparatus using decision trees to generate and score multiple pronunciations for a spelled word
US6230131B1 (en) * 1998-04-29 2001-05-08 Matsushita Electric Industrial Co., Ltd. Method for generating spelling-to-pronunciation decision tree
US6233553B1 (en) * 1998-09-04 2001-05-15 Matsushita Electric Industrial Co., Ltd. Method and system for automatically determining phonetic transcriptions associated with spelled words

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62140593A (ja) * 1985-12-13 1987-06-24 Nec Corp 外線呼自動内線転送装置
JPS62166642A (ja) * 1986-01-20 1987-07-23 Fujitsu Ltd 電話転送方式
JPH0353649A (ja) * 1989-07-21 1991-03-07 Toshiba Corp 電話交換装置
JPH0420158A (ja) * 1990-05-15 1992-01-23 Mitsubishi Electric Corp 構内交換装置
EP0568979A1 (en) * 1992-05-08 1993-11-10 Sony Corporation Speech recognition adapter for telephone system
JPH0818670A (ja) * 1994-07-04 1996-01-19 Mitsubishi Denki Bill Techno Service Kk 構内交換機
US5799065A (en) * 1996-05-06 1998-08-25 Matsushita Electric Industrial Co., Ltd. Call routing device employing continuous speech
US5752230A (en) * 1996-08-20 1998-05-12 Ncr Corporation Method and apparatus for identifying names with a speech recognition program

Also Published As

Publication number Publication date
EP0953967A3 (en) 2000-06-28
KR19990083596A (ko) 1999-11-25
DE69922872D1 (de) 2005-02-03
JP3135233B2 (ja) 2001-02-13
DE69922872T2 (de) 2005-12-29
CN1116770C (zh) 2003-07-30
EP0953967B1 (en) 2004-12-29
CN1246023A (zh) 2000-03-01
EP0953967A2 (en) 1999-11-03
JP2000032140A (ja) 2000-01-28
US6314165B1 (en) 2001-11-06
TW424221B (en) 2001-03-01

Similar Documents

Publication Publication Date Title
KR100574768B1 (ko) 음성 인식을 사용하는 자동화된 호텔 안내 시스템
USRE42868E1 (en) Voice-operated services
US6016471A (en) Method and apparatus using decision trees to generate and score multiple pronunciations for a spelled word
US6937983B2 (en) Method and system for semantic speech recognition
US6233553B1 (en) Method and system for automatically determining phonetic transcriptions associated with spelled words
US8065144B1 (en) Multilingual speech recognition
US8285537B2 (en) Recognition of proper nouns using native-language pronunciation
US5283833A (en) Method and apparatus for speech processing using morphology and rhyming
US20070016421A1 (en) Correcting a pronunciation of a synthetically generated speech object
US6208965B1 (en) Method and apparatus for performing a name acquisition based on speech recognition
KR20000005278A (ko) 자동 음성인식 방법 및 장치_
US7970610B2 (en) Speech recognition
Lehtinen et al. IDAS: Interactive directory assistance service
WO2000036591A1 (en) Speech operated automatic inquiry system
Georgila et al. An integrated dialogue system for the automation of call centre services.
Georgila et al. Large Vocabulary Search Space Reduction Employing Directed Acyclic Word Graphs and Phonological Rules
JP2005534968A (ja) 漢字語の読みの決定
Tait et al. Regular paper section: Development of a spoken dialogue system operating in afrikaans, South African english and xhosa
Hunt An examination of three classes of ASR dialogue systems: PC-based dictation, in-car systems and automated directory assistance
Johnsen et al. Improving speech centric dialogue systems–The BRAGE project

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee