KR970706561A - 음성 대화형 서비스 (voice-operated services) - Google Patents
음성 대화형 서비스 (voice-operated services) Download PDFInfo
- Publication number
- KR970706561A KR970706561A KR1019970701907A KR19970701907A KR970706561A KR 970706561 A KR970706561 A KR 970706561A KR 1019970701907 A KR1019970701907 A KR 1019970701907A KR 19970701907 A KR19970701907 A KR 19970701907A KR 970706561 A KR970706561 A KR 970706561A
- Authority
- KR
- South Korea
- Prior art keywords
- words
- recognition
- speech
- signal
- list
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract 14
- 238000009825 accumulation Methods 0.000 claims 9
- 230000004308 accommodation Effects 0.000 claims 1
- 230000006870 function Effects 0.000 claims 1
- 230000000977 initiatory effect Effects 0.000 claims 1
- 230000008447 perception Effects 0.000 claims 1
- 230000001755 vocal effect Effects 0.000 claims 1
- 230000002452 interceptive effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/24—Speech recognition using non-acoustical features
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4931—Directory assistance systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4936—Speech interaction details
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0631—Creating reference templates; Clustering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/35—Aspects of automatic or semi-automatic exchanges related to information services provided via a voice call
- H04M2203/355—Interactive dialogue design tools, features or methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2242/00—Special services or facilities
- H04M2242/22—Automatic class or number identification arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42025—Calling or Called party identification service
- H04M3/42034—Calling party identification service
- H04M3/42059—Making use of the calling party identifier
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42025—Calling or Called party identification service
- H04M3/42085—Called party identification service
- H04M3/42093—Notifying the calling party of information on the called or connected party
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42025—Calling or Called party identification service
- H04M3/42085—Called party identification service
- H04M3/42102—Making use of the called party identifier
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Telephonic Communication Services (AREA)
- Machine Translation (AREA)
- Computer And Data Communications (AREA)
- Navigation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
본 발명은 음성 인식 장치 및 방법, 그리고 이를 이용하는 음성 대화형 서비스에 관한 것으로서, 인식 수단은 수신된 신호내에서 제1세트의 패턴중 하나 이상의 패턴을 인식하고, 인식된 패턴은 항목을 식별하는데 사용되고, 항목이 연관된 제2세트의 패턴에 패턴 목록을 컴파일하고, 이 목록은 수신된 제2신호를 인식하는데 사용되며, 수신된 신호를 예를 들면 음성 신호 또는 수신된 신호의 발샌 위치 또는 행선을 나타내는 신호인 것을 특징으로 한다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 전화번호 조회 시스템의 구조를 개략적으로 보여주고, 제2도는 제1도의 전화번호 조회 시스템의 동작을 나타낸 흐름도이고, 제2a도는 제1도의 전화번호 조회 시스템 동작의 제2실시예를 나타낸 흐름도이다.
Claims (33)
- 식별되는 항목과, 각각의 항목에 대하여 제1세트 단어중 한 단어와의 연관과제2세트 단어중 한 단어와의 연관을 규정하는 정보를 포함하는 데이터의 저장소; 음식 인식 수단; 및 (a) 제1음성 신호에 대한 유사성의 지정 기준을 만족하는 제1세트의 많은 단어들을 제1세트 단어들에 대한 인식 정보를 기준으로 하여 식별하도록 상기 음성 인식 수단을 제어하고; (b) 이렇게 식별한 후에 제1세트의 식별 단어와 연관된 것으로 규정된 항목과 연관된 것으로 규정되는 제2세트의 모든 단어에 대한 목록을 컴파일하며; (c) 제2음성 신호와 유상한 목록의 하나 이상의 단어를 제2세트의 단어들에 대한 인식 정보를 기준으로 하여 식별하도록 상기 음성 인식 수단을 제어할 수 있는 제어 수단을 포함하는 것을 특징으로 하는 음성 인식 장치.
- 제1항에 있어서, 상기 음성 인식 수단은 제1음성 신호를 수신하여 각각의 식별 단어에 대하여 상기 제1음성 신호와의 유사 정도를 발생하도록 동작가능하고, 상기 제어수단은 목록의 각 단어에 대하여 제1세트의 관련 단어에 대한 수치로부터 얻어진 수치를 발생하도록 동작가능하며, 상기 음성 인식 수단은 제2음성 신호를 수신하여 목록의 단어에 대하여 발생되는 수치에 따라 가중치가 부여된 인식 과정에 따라 목록의 하나 이상의 단어를 식별하도록 동작가능한 것을 특징으로 하는 음성 인식 장치.
- 제2항에 있어서, 상기 제어 수단은 그 목록의 각 단어에 대하여 제1세트의 관련 식별 단어와 또한 연관된 것으로 규정된 항목과 연관된 것으로 규정되는 제2세트의 단어수에 따르 지수로 가중치를 부여하도록 동작가능한 것을 특징으로 하는 음성 인식 장치.
- 제2항 또는 제3항에 있어서, 상기 제어 수단은 임계를 넘어서는 정도를 가지는 제2세트의 단어를 목록에서 제외하도록 동작가능한 것을 특징으로 하는 음성 인식 장치.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 음성 인식 장치는 제2세트의 모든 단어에 대한 인식 데이터를 포함하는 저장소를 포함하고, 상기 제어 수단은 목록에 있지 않은 단어에 대응하거나 목록에 있는 단어에 대응하는 목록내의 데이터 항을 인식 데이타 저장소내에 표시하기 위하여 그 목록의 단어를 인식하는 과정과 그 목록을 컴파일하는 과정 사이에 동작가능하고, 상기 인식 수단은 그렇게 표시되거나 또는 개별적으로 표시되지 않는 모든 단어들을 무시하는 것을 특징으로 하는 음성 인식 장치.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 제어 수단은 그 목록내의 각각의 단어에 대한 인식 데이터를 발생하기 위하여 그 목록을 컴파일하는 과정에 이어 동작가능한 것을 특징으로 하는 음성 인식 장치.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 제어 수단은 출력을 위해 제1세트의 식별 단어 및 제2세트의 식별단어와 역관된 것으로 규정된 항목 또는 항목들을 선택하도록 동작가능한 것을 특징으로 하는 음성 인식 장치.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 데이터 저장소는 또한 각각의 항목에 대하여 제3세트의 단어들중 한 단어와의 연관을 규정하는 정보를 포함하고, 상기 제어 수단은 (d) 제1세트의 식별 단어 및 제2세트의 식별 단어와 연관된 것으로 규정되는 각 항목과 연관된 것으로 규정되는 제3세트의 모든 단어의 목록을 컴파일하고; (e) 제3음성 신호와 유사한 하나 이상의 단어를 제3세트의 단어들에 대한 인식 정보를 기준으로 하여 그 목록에서 식별하도록 음성 인식 수단을 제어하도록 동작가능한 것을 특징으로 하는 음성 인식 장치.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 최소한 하나 이상의 음성 신호를 저장하기 위한 수단을 포함하고, 상기 음성 인식 장치는 상기 제어 수단이 (a) 각각의 음성 신호와의 유사 정도에 대한 지정 기준에 맞는 세트의 복수의 단어를 (제1세트보다는)한 세트의 단어들에 대한 인식 정보를 기준으로 하여 식별하도록 음성 인식 수단을 제어하고; (b) 상기 한 세트의 식별 단어와 또한 연관된 것으로 규정된 항목과 연관된 것으로 규정되는 다른 세트의 모든 단어에 대한 부가적인 목록을 컴파일하며; (c) 각각의 신호와 유사한 하나 이상의 단어들을 제1세트의 단어들에 대한 인식 정보를 기준으로 하여 상기 부가적인 목록에서 식별하도록 음성 인식 수단을 제어하도록 동작가능한 부가적인 인식과정을 실행하도록 구성되는 것을 특징으로 하는 음성 인식 장치.
- 제9항에 있어서, 장애 상태를 인식하고, 장애가 인식되는 경우에만 상기 부가적인 인식 과정을 개시하는 수단을 포함하는 것을 특징으로 하는 음성 인식 장치.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 전화 회선 접속; 및 상기 단어 세트중 최소한 하나의 서브세트를 식별하는 축적 정보에 접근하여 그 세트에 대한 음성 인식 수단의 동작을 그 서브세트로 제한하기 위하여 전화 호출의 발샌 위치 또는 행선을 나타내는 신호의 상기 전화 회선 접속을 통한 수신에 응답하는 수단을 포함하는 것을 특징으로 하는 음성 인식 장치.
- 전화 회선 접속; 한 세트의 가능한 발음을 나타내는 인식 데이터를 기준으로 하여 상기 전화 회선 접속을 통하여 수신된 구두로 표현된 단어를 인식하는 음성 인식기; 및 발음 세트의 한 서브세트를 식별하는 축정 정보에 접근하여 상기 인식기의 동작을 그 서브세트로 제한하기 위하여 전화 호출의 발신 위치 또는 행선을 나타내는 신호의 상기 전화 회선 접속을 통한 수신에 응답하는 수단을 포함하는 것을 특징으로 하는 음성 인식 장치.
- 제12항에 있어서, 상기 전화 정보 장치는 그 세트의 모든 단어에 대한 인식 데이터를 포함하는 저장소를 포함하고, 상기 제어 수단은 그 서브세트에 있는 않은 단어에 대응하거나 그 서브세트에 있는 단어에 대응하는 데이터 항목들을 인식 데이터 저장소에 표시하기 위해 동작가능하고, 상기 인식 수단은 그렇게 표시되거나 또는 개별적으로 표시되지 않는 모든 단어를 무시하는 것을 특징으로 하는 전화 정보 장치.
- 제12항에 있어서, 상기 제어 수단은 그 세브세트의 각각의 단어에 대한 인식 데이타를 발생하도록 동작 가능한 것을 특징으로 하는 전화 정보 장치.
- 전화 회선 접속; 일련의 화자에 대응하는 인식 데이터를 기준으로 하여 상기 전화 회선 접속을 통하여 수신된 단어를 구두로 표현한 화자들의 식별을 검사 또는 확인하는 음성 인식기; 및 일련의 화자에 대한 서브세트를 식별하는 축적 정보에 접근하여 상기 인식기의 동작을 그 서브세트로 제한하기 위하여 전화 호출의 발신 위치 또는 행선을 나타내는 신호의 상기 전화 회선 접속을 통한 수신에 응답하는 수단을 포함하는 것을 특징으로 하는 전화 장치.
- 전화 회선 접속; 복수의 축적 인식 데이터 세트중 하나를 기준으로 하여 상기 전화 회선 접속을 통하여 수신된 구두로 표현된 단어를 인식하는 음성 인식기; 및 일련의 화자에 대한 서브세트를 식별하는 축적 정보에 접근하여 상기 인식기의 동작을 그 서브세트로 제한하기 위하여 전화 호출의 발신 위치 또는 행선을 신호의 상기 전화 회선 접속을 통한 수신에 응답하는 수단을 포함하는 것을 특징으로 하는 전화 장치.
- 제16항에 있어서, 상기 축적 세트는 서로 다른 언어 또는 지역 사투리에 대응하는 것을 특징으로 하는 전화 정보 장치.
- 제16항에 있어서, 최소한 두개의 세트가 서로 다른 형태의 전화 장치의 특성에 대응하는 것을 특징으로 하는 전화 정보 장치.
- 제18항에 있어서, 상기 세트들중 하나가 이동 전화 채널의 특성에 대응하는 것을 특징으로 하는 전화 정보 장치.
- 제1세트의 단어를 규정하는 저장소; 제2세트의 단어를 규정하는 저장소; 식별되는 항목을 포함하는 저장소; 제1세트의 한 단어와 제2세트의 한 단어에 대한 각 항목에 관련한 정보를 포함하는 저장소; 지정 인식 기준에 맞는 제1세트의 많은 단어를 식별하기 위하여 제1음성 신호를 수신하여 동작가능한 음성 인식 수단; 제1세트의 식별 단어도 또한 관련된 항목에 관련되는 제2세트의 모든 단어에 대한 목록을 발생하는 수단; 및 그 목록의 하나 이상의 단어를 식별하기 위하여 제2음성 신호를 수신하여 동작가능한 음성 인식 수단을 포함하는 것을 특징으로 하는 음성 인식 장치.
- 제1세트의 패턴를 규정하는 저장소; 제2세트의 패턴을 규정하는 저장소; 식별되는 항목을 포함하는 저장소; 제1세트의 한 패턴와 제2세트의 한 패턴에 대한 각 항목에 관련한 정보를 포함하는 저장소; 지정 인식 기주에 맞는 제1세트의 많은 패턴를 식별하기 위하여 제1입력 패턴 신호의 수신하여 동작가능한 음성 인식 수단; 제1세트의 식별 패턴도 또한 관련된 항목에 관련되는 제2세트의 모든 패턴에 대한 목록을 발생하는 수단; 및 그 목록의 하나 이상의 패턴를 식별하기 위하여 제2입력 패턴 신호를 수신하여 동작가능한 음성 인식 수단을 포함하는 것을 특징으로 하는 음성 인식 장치.
- (i) 식별도는 항목과, 각각의 항목에 대하여 제1세트 신호들중 한 신호와의 연관 및 제2세트 단어들중 한 단어와의 연관을 규정하는 정보를 포함하는 데이터의 저장소; (ⅱ) 지정된 기주에 맞는 제1세트의 많은 신호에 대응하는 것으로 수신된 신호를 식별하는 수단; (ⅲ) 제1세트의 식별 신호와 또한 연관된 것으로 규정된 항목과 연관된 것으로 규정되는 제2세트의 모든 단어에 대한 목록을 컴파일하도록 동작가능한 제어 수단; 및 (ⅳ) 제2세트의 단어들에 대한 축적 인식 정보를 기준으로 하여 수신된 음성 신호와 유사한 하나 이상의 단어들을 그 목록에서 식별하도록 동작하는 음성 인식 수단을 포함하는 것을 특징으로 하는 음성 인식 장치.
- 제22항에 있어서, 상기 제1세트의 신호들은 제2세트 또는 그 일부분을 철자로 말한 음성 신호이고, 식별 수단은 상기 철자에 대한 음성 신호에 대한 인식 정보를 기준으로 하여 동작하는 음성 인식 수단에 의해 형성되는 것을 특징으로 하는 음성 인식 장치.
- 제22항에 있어서, 상기 제1세트의 신호들은 톤으로 구성되는 신호이고, 상기 식별 수단은 톤인식기인 것을 특징으로 하는 음성 인식 장치.
- 제22항에 있어서, 제1세트의 신호들은 수신된 신호의 발신 위치 또는 행선을 나타내는 신호인 것을 특징으로 하는 음성 인식 장치.
- 항목과 단어의 연관을 규정하는 축적 정보를 기준으로 하여 데이타 저장소의 항목들을 식별하는 방법에 있어서, (a) 상기 단어들중 신호의 존재하는 하나 이상의 단어를 식별하는 단계; (b) 상기 단어들중 식별된 단어와 연관된 것으로 규정된 항목과 연관된 것으로 규정된 상기 단어들의 목록을 컴파일하는 단계; (c) 상기 목록의 단어들중 음성 신호에 존재하는 하나 이상의 단어를 식별하는 단계를 포함하는 것을 특징으로 하는 데이터 저장소의 항목 식별 방법.
- a) 식별되는 항목과, 각각의 항목에 대하여 적어도 두 단어와의 연관을 규정하는 정보를 포함하는 데이터 저장소; b) 규정된 단어 세트에 대한 축적 인식 정보를 기준으로 하여 음성 신호와의 유사성을 판단하는 지정 기준에 맞는 적어도 한 단어 또는 단어 순서를 식별하는 음성 인식 수단; c) ⅰ) 상기 음성 인식 수단에 의해 이전에 식별된 단어와 연관된 것으로 규정된 항목과 연관된 것으로 규정되는 단어의 목록의 컴파일하고; ⅱ) 컴파일된 목록에 대한 축적 인식 정보를 기준으로 하여 다른 음성 신호와 유사한 하나 이상의 단어 또는 단어 순서를 식별하는 음성 수단을 제어하도록 동작하는 제어 수단을 포함하는 것을 특징으로 하는 음성 인식 장치.
- 인식되는 축적 단어 세트를 기준으로 하여 음성을 인식하는 방법에 있어서, (a) 음성 신호를 수신하는 단계; (b) 음성 신호를 저장하는 단계; (c) 제2신호를 수신하는 단계; (d) 단어 세트를 서브세트인 단어의 목록을 제2신호의 함수로서 컴파인하는 단계; (e) 그 목록을 기준으로 하여 서브세트의 하나 이상의 단어를 식별하는 음성 인식 과정을 축적 음성 신호에 적용하는 단계를 포함하는 것을 특징으로 하는 음성 인식 방법.
- 상기 제2신호는 또한 음성 신호인 것을 특징으로 하는 음성 인식 방법.
- 제29항에 있어서, 문자 또는 알파벳 문자의 순서를 나타내는 인식 데이터를 기준으로 하여 상기 제2신호를 인식하는 단계를 포함하는 것을 특징으로 하는 음성 인식 방법.
- 상기 제2신호는 키패드에 의해 발생된 톤으로 구성되는 신호인 것을 특징으로 하는 음성 인식 방법.
- 제28항에 있어서, 상기 제2신호는 상기 제2신호의 발신 위치 및 행선을 나타내는 것을 특징으로 하는 음성 인식 방법.
- (a) 음성 신호를 수신하는 단계; (b) 음성 신호를 저장하는 단계; (c) 이 음성 신호 또는 다른 신호에 대하여 인식 동작을 실행하는 단계; (d) 인식 동작이 장애 허용도에 대한 지정 기준에 맞지 않을 경우에 축적 음성 신호를 검색하고, 이 신호에 대하여 인식 동작을 실행하는 단계를 포함하는 것을 특징으로 하는 음성 인식 방법.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP94307843 | 1994-10-25 | ||
EP94307843.6 | 1994-10-25 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR970706561A true KR970706561A (ko) | 1997-11-03 |
KR100383352B1 KR100383352B1 (ko) | 2003-10-17 |
Family
ID=8217890
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019970701907A KR100383352B1 (ko) | 1994-10-25 | 1995-10-25 | 음성작동서비스 |
Country Status (14)
Country | Link |
---|---|
US (2) | US5940793A (ko) |
EP (2) | EP0800698B1 (ko) |
JP (1) | JPH10507535A (ko) |
KR (1) | KR100383352B1 (ko) |
CN (1) | CN1249667C (ko) |
AU (1) | AU707122B2 (ko) |
CA (3) | CA2372676C (ko) |
DE (2) | DE69525178T2 (ko) |
ES (1) | ES2171558T3 (ko) |
FI (2) | FI971748A (ko) |
MX (1) | MX9702759A (ko) |
NO (1) | NO971904D0 (ko) |
NZ (2) | NZ294296A (ko) |
WO (1) | WO1996013030A2 (ko) |
Families Citing this family (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6385312B1 (en) | 1993-02-22 | 2002-05-07 | Murex Securities, Ltd. | Automatic routing and information system for telephonic services |
MX9702759A (es) * | 1994-10-25 | 1997-07-31 | British Telecomm | Servicios operados por voz. |
US5903864A (en) * | 1995-08-30 | 1999-05-11 | Dragon Systems | Speech recognition |
US5896444A (en) * | 1996-06-03 | 1999-04-20 | Webtv Networks, Inc. | Method and apparatus for managing communications between a client and a server in a network |
US5901214A (en) | 1996-06-10 | 1999-05-04 | Murex Securities, Ltd. | One number intelligent call processing system |
US5987408A (en) * | 1996-12-16 | 1999-11-16 | Nortel Networks Corporation | Automated directory assistance system utilizing a heuristics model for predicting the most likely requested number |
DE19709518C5 (de) * | 1997-03-10 | 2006-05-04 | Harman Becker Automotive Systems Gmbh | Verfahren und Vorrichtung zur Spracheingabe einer Zieladresse in ein Zielführungssystem im Echtzeitbetrieb |
GR1003372B (el) * | 1997-09-23 | 2000-05-04 | Συσκευη καταχωρησης ψηφιοποιημενων φωνητικων πληροφοριων και ανακτησης τους μεσω τηλεφωνου με αναγνωριση φωνης | |
US6404876B1 (en) | 1997-09-25 | 2002-06-11 | Gte Intelligent Network Services Incorporated | System and method for voice activated dialing and routing under open access network control |
KR100238189B1 (ko) * | 1997-10-16 | 2000-01-15 | 윤종용 | 다중 언어 tts장치 및 다중 언어 tts 처리 방법 |
US6112172A (en) * | 1998-03-31 | 2000-08-29 | Dragon Systems, Inc. | Interactive searching |
EP1099214B1 (en) * | 1998-07-21 | 2004-09-29 | BRITISH TELECOMMUNICATIONS public limited company | Speech recognition |
US6778647B1 (en) * | 1998-11-13 | 2004-08-17 | Siemens Information And Communication Networks, Inc. | Redundant database storage of selected record information for an automated interrogation device |
US6502075B1 (en) * | 1999-03-26 | 2002-12-31 | Koninklijke Philips Electronics, N.V. | Auto attendant having natural names database library |
US6314402B1 (en) * | 1999-04-23 | 2001-11-06 | Nuance Communications | Method and apparatus for creating modifiable and combinable speech objects for acquiring information from a speaker in an interactive voice response system |
US6421672B1 (en) * | 1999-07-27 | 2002-07-16 | Verizon Services Corp. | Apparatus for and method of disambiguation of directory listing searches utilizing multiple selectable secondary search keys |
DE19944608A1 (de) * | 1999-09-17 | 2001-03-22 | Philips Corp Intellectual Pty | Erkennung einer in buchstabierter Form vorliegenden Sprachäußerungseingabe |
US6868385B1 (en) * | 1999-10-05 | 2005-03-15 | Yomobile, Inc. | Method and apparatus for the provision of information signals based upon speech recognition |
GB2362746A (en) * | 2000-05-23 | 2001-11-28 | Vocalis Ltd | Data recognition and retrieval |
US20020107918A1 (en) * | 2000-06-15 | 2002-08-08 | Shaffer James D. | System and method for capturing, matching and linking information in a global communications network |
US6748426B1 (en) * | 2000-06-15 | 2004-06-08 | Murex Securities, Ltd. | System and method for linking information in a global computer network |
DE10035523A1 (de) * | 2000-07-21 | 2002-01-31 | Deutsche Telekom Ag | Virtuelles Testbett |
JP4486235B2 (ja) * | 2000-08-31 | 2010-06-23 | パイオニア株式会社 | 音声認識装置 |
JP2002108389A (ja) * | 2000-09-29 | 2002-04-10 | Matsushita Electric Ind Co Ltd | 音声による個人名称検索、抽出方法およびその装置と車載ナビゲーション装置 |
DE10196793D2 (de) * | 2000-11-03 | 2004-10-07 | Voicecom Ag | Robuste Spracherkennung mit Datenbankorganisation |
DE10100725C1 (de) * | 2001-01-10 | 2002-01-24 | Philips Corp Intellectual Pty | Automatisches Dialogsystem mit Datenbanksprachmodell |
WO2002086863A1 (en) * | 2001-04-19 | 2002-10-31 | British Telecommunications Public Limited Company | Speech recognition |
DE10119677A1 (de) * | 2001-04-20 | 2002-10-24 | Philips Corp Intellectual Pty | Verfahren zum Ermitteln von Datenbankeinträgen |
US6671670B2 (en) * | 2001-06-27 | 2003-12-30 | Telelogue, Inc. | System and method for pre-processing information used by an automated attendant |
GB2376335B (en) * | 2001-06-28 | 2003-07-23 | Vox Generation Ltd | Address recognition using an automatic speech recogniser |
US7124085B2 (en) * | 2001-12-13 | 2006-10-17 | Matsushita Electric Industrial Co., Ltd. | Constraint-based speech recognition system and method |
US7177814B2 (en) | 2002-02-07 | 2007-02-13 | Sap Aktiengesellschaft | Dynamic grammar for voice-enabled applications |
DE10207895B4 (de) * | 2002-02-23 | 2005-11-03 | Harman Becker Automotive Systems Gmbh | Verfahren zur Spracherkennung und Spracherkennungssystem |
JP3799280B2 (ja) * | 2002-03-06 | 2006-07-19 | キヤノン株式会社 | 対話システムおよびその制御方法 |
US7242758B2 (en) * | 2002-03-19 | 2007-07-10 | Nuance Communications, Inc | System and method for automatically processing a user's request by an automated assistant |
AU2003264790A1 (en) | 2002-10-16 | 2004-05-04 | Koninklijke Philips Electronics N.V. | Directory assistant method and apparatus |
US7603291B2 (en) | 2003-03-14 | 2009-10-13 | Sap Aktiengesellschaft | Multi-modal sales applications |
CN100353417C (zh) * | 2003-09-23 | 2007-12-05 | 摩托罗拉公司 | 用于提供文本消息的方法和装置 |
US7865362B2 (en) | 2005-02-04 | 2011-01-04 | Vocollect, Inc. | Method and system for considering information about an expected response when performing speech recognition |
US8200495B2 (en) * | 2005-02-04 | 2012-06-12 | Vocollect, Inc. | Methods and systems for considering information about an expected response when performing speech recognition |
WO2006087040A1 (en) * | 2005-02-17 | 2006-08-24 | Loquendo S.P.A. | Method and system for automatically providing linguistic formulations that are outside a recognition domain of an automatic speech recognition system |
US8533485B1 (en) | 2005-10-13 | 2013-09-10 | At&T Intellectual Property Ii, L.P. | Digital communication biometric authentication |
KR101063607B1 (ko) * | 2005-10-14 | 2011-09-07 | 주식회사 현대오토넷 | 음성인식을 이용한 명칭 검색 기능을 가지는 네비게이션시스템 및 그 방법 |
US8458465B1 (en) | 2005-11-16 | 2013-06-04 | AT&T Intellectual Property II, L. P. | Biometric authentication |
US8060367B2 (en) * | 2007-06-26 | 2011-11-15 | Targus Information Corporation | Spatially indexed grammar and methods of use |
DE102007033472A1 (de) * | 2007-07-18 | 2009-01-29 | Siemens Ag | Verfahren zur Spracherkennung |
US20090210233A1 (en) * | 2008-02-15 | 2009-08-20 | Microsoft Corporation | Cognitive offloading: interface for storing and composing searches on and navigating unconstrained input patterns |
EP2096412A3 (de) * | 2008-02-29 | 2009-12-02 | Navigon AG | Verfahren zum Betrieb eines Navigationssystems |
JP5024154B2 (ja) * | 2008-03-27 | 2012-09-12 | 富士通株式会社 | 関連付け装置、関連付け方法及びコンピュータプログラム |
US8358747B2 (en) | 2009-11-10 | 2013-01-22 | International Business Machines Corporation | Real time automatic caller speech profiling |
US8738377B2 (en) | 2010-06-07 | 2014-05-27 | Google Inc. | Predicting and learning carrier phrases for speech input |
US8645136B2 (en) | 2010-07-20 | 2014-02-04 | Intellisist, Inc. | System and method for efficiently reducing transcription error using hybrid voice transcription |
US9412369B2 (en) * | 2011-06-17 | 2016-08-09 | Microsoft Technology Licensing, Llc | Automated adverse drug event alerts |
US9384731B2 (en) * | 2013-11-06 | 2016-07-05 | Microsoft Technology Licensing, Llc | Detecting speech input phrase confusion risk |
US9691384B1 (en) * | 2016-08-19 | 2017-06-27 | Google Inc. | Voice action biasing system |
US10395649B2 (en) * | 2017-12-15 | 2019-08-27 | International Business Machines Corporation | Pronunciation analysis and correction feedback |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4763278A (en) | 1983-04-13 | 1988-08-09 | Texas Instruments Incorporated | Speaker-independent word recognizer |
GB2161263B (en) | 1984-07-05 | 1988-03-30 | Stc Plc | Associative memory systems |
GB2165969B (en) * | 1984-10-19 | 1988-07-06 | British Telecomm | Dialogue system |
GB8625468D0 (en) * | 1986-10-24 | 1987-04-15 | Smiths Industries Plc | Speech recognition apparatus |
DE3723078A1 (de) * | 1987-07-11 | 1989-01-19 | Philips Patentverwaltung | Verfahren zur erkennung von zusammenhaengend gesprochenen woertern |
US5202952A (en) * | 1990-06-22 | 1993-04-13 | Dragon Systems, Inc. | Large-vocabulary continuous speech prefiltering and processing system |
US5165095A (en) * | 1990-09-28 | 1992-11-17 | Texas Instruments Incorporated | Voice telephone dialing |
JP2880592B2 (ja) | 1990-10-30 | 1999-04-12 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 複合音声情報の編集装置および方法 |
US5267304A (en) * | 1991-04-05 | 1993-11-30 | At&T Bell Laboratories | Directory assistance system |
CA2069599C (en) | 1991-08-16 | 1997-05-06 | Lawrence Richard Rabiner | Interface method and apparatus for information services |
US5170426A (en) | 1991-09-12 | 1992-12-08 | Bell Atlantic Network Services, Inc. | Method and system for home incarceration |
US5355474A (en) | 1991-09-27 | 1994-10-11 | Thuraisngham Bhavani M | System for multilevel secure database management using a knowledge base with release-based and other security constraints for query, response and update modification |
JP2524472B2 (ja) | 1992-09-21 | 1996-08-14 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 電話回線利用の音声認識システムを訓練する方法 |
US5392343A (en) | 1992-11-10 | 1995-02-21 | At&T Corp. | On demand language interpretation in a telecommunications system |
CA2091658A1 (en) * | 1993-03-15 | 1994-09-16 | Matthew Lennig | Method and apparatus for automation of directory assistance using speech recognition |
GB2277387A (en) * | 1993-04-21 | 1994-10-26 | Ibm | Natural language processing system |
US5488652A (en) * | 1994-04-14 | 1996-01-30 | Northern Telecom Limited | Method and apparatus for training speech recognition algorithms for directory assistance applications |
WO1996010795A1 (en) * | 1994-10-03 | 1996-04-11 | Helfgott & Karas, P.C. | A database accessing system |
MX9702759A (es) * | 1994-10-25 | 1997-07-31 | British Telecomm | Servicios operados por voz. |
-
1995
- 1995-10-25 MX MX9702759A patent/MX9702759A/es unknown
- 1995-10-25 CA CA002372676A patent/CA2372676C/en not_active Expired - Lifetime
- 1995-10-25 CA CA002202663A patent/CA2202663C/en not_active Expired - Lifetime
- 1995-10-25 US US08/817,673 patent/US5940793A/en not_active Ceased
- 1995-10-25 KR KR1019970701907A patent/KR100383352B1/ko not_active IP Right Cessation
- 1995-10-25 AU AU37057/95A patent/AU707122B2/en not_active Expired
- 1995-10-25 EP EP95934749A patent/EP0800698B1/en not_active Expired - Lifetime
- 1995-10-25 US US09/930,395 patent/USRE42868E1/en not_active Expired - Lifetime
- 1995-10-25 ES ES95934749T patent/ES2171558T3/es not_active Expired - Lifetime
- 1995-10-25 DE DE69525178T patent/DE69525178T2/de not_active Expired - Lifetime
- 1995-10-25 CA CA002372671A patent/CA2372671C/en not_active Expired - Lifetime
- 1995-10-25 EP EP01203574A patent/EP1172994B1/en not_active Expired - Lifetime
- 1995-10-25 CN CNB951958410A patent/CN1249667C/zh not_active Expired - Lifetime
- 1995-10-25 DE DE69535797T patent/DE69535797D1/de not_active Expired - Lifetime
- 1995-10-25 JP JP8513512A patent/JPH10507535A/ja active Pending
- 1995-10-25 NZ NZ294296A patent/NZ294296A/en unknown
- 1995-10-25 WO PCT/GB1995/002524 patent/WO1996013030A2/en active IP Right Grant
-
1997
- 1997-04-24 NO NO971904A patent/NO971904D0/no not_active Application Discontinuation
- 1997-04-24 FI FI971748A patent/FI971748A/fi unknown
-
1998
- 1998-05-12 FI FI981047A patent/FI981047A/fi unknown
-
1999
- 1999-02-05 NZ NZ334083A patent/NZ334083A/xx unknown
Also Published As
Publication number | Publication date |
---|---|
NZ334083A (en) | 2000-09-29 |
WO1996013030A3 (en) | 1996-08-08 |
NZ294296A (en) | 1999-04-29 |
USRE42868E1 (en) | 2011-10-25 |
EP0800698B1 (en) | 2002-01-23 |
DE69535797D1 (de) | 2008-09-11 |
JPH10507535A (ja) | 1998-07-21 |
EP1172994A3 (en) | 2002-07-03 |
ES2171558T3 (es) | 2002-09-16 |
MX9702759A (es) | 1997-07-31 |
CA2372676A1 (en) | 1996-05-02 |
FI971748A0 (fi) | 1997-04-24 |
FI971748A (fi) | 1997-04-24 |
FI981047A0 (fi) | 1995-10-25 |
AU707122B2 (en) | 1999-07-01 |
DE69525178D1 (de) | 2002-03-14 |
CN1164292A (zh) | 1997-11-05 |
EP0800698A2 (en) | 1997-10-15 |
DE69525178T2 (de) | 2002-08-29 |
EP1172994A2 (en) | 2002-01-16 |
US5940793A (en) | 1999-08-17 |
NO971904L (no) | 1997-04-24 |
CA2372671C (en) | 2007-01-02 |
CA2372676C (en) | 2006-01-03 |
NO971904D0 (no) | 1997-04-24 |
CA2202663C (en) | 2002-08-13 |
WO1996013030A2 (en) | 1996-05-02 |
CN1249667C (zh) | 2006-04-05 |
AU3705795A (en) | 1996-05-15 |
EP1172994B1 (en) | 2008-07-30 |
FI981047A (fi) | 1998-05-12 |
CA2372671A1 (en) | 1996-05-02 |
CA2202663A1 (en) | 1996-05-02 |
KR100383352B1 (ko) | 2003-10-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR970706561A (ko) | 음성 대화형 서비스 (voice-operated services) | |
US6208964B1 (en) | Method and apparatus for providing unsupervised adaptation of transcriptions | |
US6018708A (en) | Method and apparatus for performing speech recognition utilizing a supplementary lexicon of frequently used orthographies | |
US5917889A (en) | Capture of alphabetic or alphanumeric character strings in an automated call processing environment | |
US5983177A (en) | Method and apparatus for obtaining transcriptions from multiple training utterances | |
US6243680B1 (en) | Method and apparatus for obtaining a transcription of phrases through text and spoken utterances | |
US20030115289A1 (en) | Navigation in a voice recognition system | |
KR19990083596A (ko) | 음성인식을사용하는자동화된호텔안내시스템 | |
US5752230A (en) | Method and apparatus for identifying names with a speech recognition program | |
EP1240642A1 (en) | Learning of dialogue states and language model of spoken information system | |
KR940015969A (ko) | 음성 인식 시스템 어휘 목록으로의 혼동되는 유사 어구 (confusingly similar phrases) 입력 방지 방법 및 시스템 | |
KR970707529A (ko) | 음성 인식 장치 및 음성 인식 장치용 어휘 발생 방법(speech recognition) | |
KR20060014369A (ko) | 화자 종속 음성 인식 방법 및 음성 인식 시스템 | |
US7844459B2 (en) | Method for creating a speech database for a target vocabulary in order to train a speech recognition system | |
US7587322B2 (en) | Robust speech recognition with data bank accession organized by semantic attribute | |
US7430503B1 (en) | Method of combining corpora to achieve consistency in phonetic labeling | |
KR20000005278A (ko) | 자동 음성인식 방법 및 장치_ | |
JP3830124B2 (ja) | 音声認識装置 | |
US7970610B2 (en) | Speech recognition | |
JP2003177788A (ja) | 音声対話システムおよびその方法 | |
CA2597826C (en) | Method, software and device for uniquely identifying a desired contact in a contacts database based on a single utterance | |
Kitai et al. | ASR and TTS telecommunications applications in Japan | |
US20020032565A1 (en) | Automatic recognition of company names in speech utterances | |
JPH06133039A (ja) | 気象情報自動案内装置 | |
CA2256781A1 (en) | Method and apparatus for automatically dialling a desired telephone number using speech commands |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130409 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20140408 Year of fee payment: 12 |
|
EXPY | Expiration of term |