KR970706561A - 음성 대화형 서비스 (voice-operated services) - Google Patents

음성 대화형 서비스 (voice-operated services) Download PDF

Info

Publication number
KR970706561A
KR970706561A KR1019970701907A KR19970701907A KR970706561A KR 970706561 A KR970706561 A KR 970706561A KR 1019970701907 A KR1019970701907 A KR 1019970701907A KR 19970701907 A KR19970701907 A KR 19970701907A KR 970706561 A KR970706561 A KR 970706561A
Authority
KR
South Korea
Prior art keywords
words
recognition
speech
signal
list
Prior art date
Application number
KR1019970701907A
Other languages
English (en)
Other versions
KR100383352B1 (ko
Inventor
데이비드 존 아트워터
스티븐 존 휘태커
프랜시스 제임스 스카힐
앨리슨 다이안 시몬스
Original Assignee
히버트 줄리엣 제인 그레이스
브리티쉬 텔리커뮤니케이션즈 퍼블릭 리미티드 캄파니
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 히버트 줄리엣 제인 그레이스, 브리티쉬 텔리커뮤니케이션즈 퍼블릭 리미티드 캄파니 filed Critical 히버트 줄리엣 제인 그레이스
Publication of KR970706561A publication Critical patent/KR970706561A/ko
Application granted granted Critical
Publication of KR100383352B1 publication Critical patent/KR100383352B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/24Speech recognition using non-acoustical features
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4931Directory assistance systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4936Speech interaction details
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0631Creating reference templates; Clustering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/35Aspects of automatic or semi-automatic exchanges related to information services provided via a voice call
    • H04M2203/355Interactive dialogue design tools, features or methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2242/00Special services or facilities
    • H04M2242/22Automatic class or number identification arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42025Calling or Called party identification service
    • H04M3/42034Calling party identification service
    • H04M3/42059Making use of the calling party identifier
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42025Calling or Called party identification service
    • H04M3/42085Called party identification service
    • H04M3/42093Notifying the calling party of information on the called or connected party
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42025Calling or Called party identification service
    • H04M3/42085Called party identification service
    • H04M3/42102Making use of the called party identifier

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Telephonic Communication Services (AREA)
  • Machine Translation (AREA)
  • Computer And Data Communications (AREA)
  • Navigation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 음성 인식 장치 및 방법, 그리고 이를 이용하는 음성 대화형 서비스에 관한 것으로서, 인식 수단은 수신된 신호내에서 제1세트의 패턴중 하나 이상의 패턴을 인식하고, 인식된 패턴은 항목을 식별하는데 사용되고, 항목이 연관된 제2세트의 패턴에 패턴 목록을 컴파일하고, 이 목록은 수신된 제2신호를 인식하는데 사용되며, 수신된 신호를 예를 들면 음성 신호 또는 수신된 신호의 발샌 위치 또는 행선을 나타내는 신호인 것을 특징으로 한다.

Description

음성 대화형 서비스(VOICE-OPERATED SERVICES)
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 전화번호 조회 시스템의 구조를 개략적으로 보여주고, 제2도는 제1도의 전화번호 조회 시스템의 동작을 나타낸 흐름도이고, 제2a도는 제1도의 전화번호 조회 시스템 동작의 제2실시예를 나타낸 흐름도이다.

Claims (33)

  1. 식별되는 항목과, 각각의 항목에 대하여 제1세트 단어중 한 단어와의 연관과제2세트 단어중 한 단어와의 연관을 규정하는 정보를 포함하는 데이터의 저장소; 음식 인식 수단; 및 (a) 제1음성 신호에 대한 유사성의 지정 기준을 만족하는 제1세트의 많은 단어들을 제1세트 단어들에 대한 인식 정보를 기준으로 하여 식별하도록 상기 음성 인식 수단을 제어하고; (b) 이렇게 식별한 후에 제1세트의 식별 단어와 연관된 것으로 규정된 항목과 연관된 것으로 규정되는 제2세트의 모든 단어에 대한 목록을 컴파일하며; (c) 제2음성 신호와 유상한 목록의 하나 이상의 단어를 제2세트의 단어들에 대한 인식 정보를 기준으로 하여 식별하도록 상기 음성 인식 수단을 제어할 수 있는 제어 수단을 포함하는 것을 특징으로 하는 음성 인식 장치.
  2. 제1항에 있어서, 상기 음성 인식 수단은 제1음성 신호를 수신하여 각각의 식별 단어에 대하여 상기 제1음성 신호와의 유사 정도를 발생하도록 동작가능하고, 상기 제어수단은 목록의 각 단어에 대하여 제1세트의 관련 단어에 대한 수치로부터 얻어진 수치를 발생하도록 동작가능하며, 상기 음성 인식 수단은 제2음성 신호를 수신하여 목록의 단어에 대하여 발생되는 수치에 따라 가중치가 부여된 인식 과정에 따라 목록의 하나 이상의 단어를 식별하도록 동작가능한 것을 특징으로 하는 음성 인식 장치.
  3. 제2항에 있어서, 상기 제어 수단은 그 목록의 각 단어에 대하여 제1세트의 관련 식별 단어와 또한 연관된 것으로 규정된 항목과 연관된 것으로 규정되는 제2세트의 단어수에 따르 지수로 가중치를 부여하도록 동작가능한 것을 특징으로 하는 음성 인식 장치.
  4. 제2항 또는 제3항에 있어서, 상기 제어 수단은 임계를 넘어서는 정도를 가지는 제2세트의 단어를 목록에서 제외하도록 동작가능한 것을 특징으로 하는 음성 인식 장치.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 음성 인식 장치는 제2세트의 모든 단어에 대한 인식 데이터를 포함하는 저장소를 포함하고, 상기 제어 수단은 목록에 있지 않은 단어에 대응하거나 목록에 있는 단어에 대응하는 목록내의 데이터 항을 인식 데이타 저장소내에 표시하기 위하여 그 목록의 단어를 인식하는 과정과 그 목록을 컴파일하는 과정 사이에 동작가능하고, 상기 인식 수단은 그렇게 표시되거나 또는 개별적으로 표시되지 않는 모든 단어들을 무시하는 것을 특징으로 하는 음성 인식 장치.
  6. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 제어 수단은 그 목록내의 각각의 단어에 대한 인식 데이터를 발생하기 위하여 그 목록을 컴파일하는 과정에 이어 동작가능한 것을 특징으로 하는 음성 인식 장치.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 제어 수단은 출력을 위해 제1세트의 식별 단어 및 제2세트의 식별단어와 역관된 것으로 규정된 항목 또는 항목들을 선택하도록 동작가능한 것을 특징으로 하는 음성 인식 장치.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 데이터 저장소는 또한 각각의 항목에 대하여 제3세트의 단어들중 한 단어와의 연관을 규정하는 정보를 포함하고, 상기 제어 수단은 (d) 제1세트의 식별 단어 및 제2세트의 식별 단어와 연관된 것으로 규정되는 각 항목과 연관된 것으로 규정되는 제3세트의 모든 단어의 목록을 컴파일하고; (e) 제3음성 신호와 유사한 하나 이상의 단어를 제3세트의 단어들에 대한 인식 정보를 기준으로 하여 그 목록에서 식별하도록 음성 인식 수단을 제어하도록 동작가능한 것을 특징으로 하는 음성 인식 장치.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 최소한 하나 이상의 음성 신호를 저장하기 위한 수단을 포함하고, 상기 음성 인식 장치는 상기 제어 수단이 (a) 각각의 음성 신호와의 유사 정도에 대한 지정 기준에 맞는 세트의 복수의 단어를 (제1세트보다는)한 세트의 단어들에 대한 인식 정보를 기준으로 하여 식별하도록 음성 인식 수단을 제어하고; (b) 상기 한 세트의 식별 단어와 또한 연관된 것으로 규정된 항목과 연관된 것으로 규정되는 다른 세트의 모든 단어에 대한 부가적인 목록을 컴파일하며; (c) 각각의 신호와 유사한 하나 이상의 단어들을 제1세트의 단어들에 대한 인식 정보를 기준으로 하여 상기 부가적인 목록에서 식별하도록 음성 인식 수단을 제어하도록 동작가능한 부가적인 인식과정을 실행하도록 구성되는 것을 특징으로 하는 음성 인식 장치.
  10. 제9항에 있어서, 장애 상태를 인식하고, 장애가 인식되는 경우에만 상기 부가적인 인식 과정을 개시하는 수단을 포함하는 것을 특징으로 하는 음성 인식 장치.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 전화 회선 접속; 및 상기 단어 세트중 최소한 하나의 서브세트를 식별하는 축적 정보에 접근하여 그 세트에 대한 음성 인식 수단의 동작을 그 서브세트로 제한하기 위하여 전화 호출의 발샌 위치 또는 행선을 나타내는 신호의 상기 전화 회선 접속을 통한 수신에 응답하는 수단을 포함하는 것을 특징으로 하는 음성 인식 장치.
  12. 전화 회선 접속; 한 세트의 가능한 발음을 나타내는 인식 데이터를 기준으로 하여 상기 전화 회선 접속을 통하여 수신된 구두로 표현된 단어를 인식하는 음성 인식기; 및 발음 세트의 한 서브세트를 식별하는 축정 정보에 접근하여 상기 인식기의 동작을 그 서브세트로 제한하기 위하여 전화 호출의 발신 위치 또는 행선을 나타내는 신호의 상기 전화 회선 접속을 통한 수신에 응답하는 수단을 포함하는 것을 특징으로 하는 음성 인식 장치.
  13. 제12항에 있어서, 상기 전화 정보 장치는 그 세트의 모든 단어에 대한 인식 데이터를 포함하는 저장소를 포함하고, 상기 제어 수단은 그 서브세트에 있는 않은 단어에 대응하거나 그 서브세트에 있는 단어에 대응하는 데이터 항목들을 인식 데이터 저장소에 표시하기 위해 동작가능하고, 상기 인식 수단은 그렇게 표시되거나 또는 개별적으로 표시되지 않는 모든 단어를 무시하는 것을 특징으로 하는 전화 정보 장치.
  14. 제12항에 있어서, 상기 제어 수단은 그 세브세트의 각각의 단어에 대한 인식 데이타를 발생하도록 동작 가능한 것을 특징으로 하는 전화 정보 장치.
  15. 전화 회선 접속; 일련의 화자에 대응하는 인식 데이터를 기준으로 하여 상기 전화 회선 접속을 통하여 수신된 단어를 구두로 표현한 화자들의 식별을 검사 또는 확인하는 음성 인식기; 및 일련의 화자에 대한 서브세트를 식별하는 축적 정보에 접근하여 상기 인식기의 동작을 그 서브세트로 제한하기 위하여 전화 호출의 발신 위치 또는 행선을 나타내는 신호의 상기 전화 회선 접속을 통한 수신에 응답하는 수단을 포함하는 것을 특징으로 하는 전화 장치.
  16. 전화 회선 접속; 복수의 축적 인식 데이터 세트중 하나를 기준으로 하여 상기 전화 회선 접속을 통하여 수신된 구두로 표현된 단어를 인식하는 음성 인식기; 및 일련의 화자에 대한 서브세트를 식별하는 축적 정보에 접근하여 상기 인식기의 동작을 그 서브세트로 제한하기 위하여 전화 호출의 발신 위치 또는 행선을 신호의 상기 전화 회선 접속을 통한 수신에 응답하는 수단을 포함하는 것을 특징으로 하는 전화 장치.
  17. 제16항에 있어서, 상기 축적 세트는 서로 다른 언어 또는 지역 사투리에 대응하는 것을 특징으로 하는 전화 정보 장치.
  18. 제16항에 있어서, 최소한 두개의 세트가 서로 다른 형태의 전화 장치의 특성에 대응하는 것을 특징으로 하는 전화 정보 장치.
  19. 제18항에 있어서, 상기 세트들중 하나가 이동 전화 채널의 특성에 대응하는 것을 특징으로 하는 전화 정보 장치.
  20. 제1세트의 단어를 규정하는 저장소; 제2세트의 단어를 규정하는 저장소; 식별되는 항목을 포함하는 저장소; 제1세트의 한 단어와 제2세트의 한 단어에 대한 각 항목에 관련한 정보를 포함하는 저장소; 지정 인식 기준에 맞는 제1세트의 많은 단어를 식별하기 위하여 제1음성 신호를 수신하여 동작가능한 음성 인식 수단; 제1세트의 식별 단어도 또한 관련된 항목에 관련되는 제2세트의 모든 단어에 대한 목록을 발생하는 수단; 및 그 목록의 하나 이상의 단어를 식별하기 위하여 제2음성 신호를 수신하여 동작가능한 음성 인식 수단을 포함하는 것을 특징으로 하는 음성 인식 장치.
  21. 제1세트의 패턴를 규정하는 저장소; 제2세트의 패턴을 규정하는 저장소; 식별되는 항목을 포함하는 저장소; 제1세트의 한 패턴와 제2세트의 한 패턴에 대한 각 항목에 관련한 정보를 포함하는 저장소; 지정 인식 기주에 맞는 제1세트의 많은 패턴를 식별하기 위하여 제1입력 패턴 신호의 수신하여 동작가능한 음성 인식 수단; 제1세트의 식별 패턴도 또한 관련된 항목에 관련되는 제2세트의 모든 패턴에 대한 목록을 발생하는 수단; 및 그 목록의 하나 이상의 패턴를 식별하기 위하여 제2입력 패턴 신호를 수신하여 동작가능한 음성 인식 수단을 포함하는 것을 특징으로 하는 음성 인식 장치.
  22. (i) 식별도는 항목과, 각각의 항목에 대하여 제1세트 신호들중 한 신호와의 연관 및 제2세트 단어들중 한 단어와의 연관을 규정하는 정보를 포함하는 데이터의 저장소; (ⅱ) 지정된 기주에 맞는 제1세트의 많은 신호에 대응하는 것으로 수신된 신호를 식별하는 수단; (ⅲ) 제1세트의 식별 신호와 또한 연관된 것으로 규정된 항목과 연관된 것으로 규정되는 제2세트의 모든 단어에 대한 목록을 컴파일하도록 동작가능한 제어 수단; 및 (ⅳ) 제2세트의 단어들에 대한 축적 인식 정보를 기준으로 하여 수신된 음성 신호와 유사한 하나 이상의 단어들을 그 목록에서 식별하도록 동작하는 음성 인식 수단을 포함하는 것을 특징으로 하는 음성 인식 장치.
  23. 제22항에 있어서, 상기 제1세트의 신호들은 제2세트 또는 그 일부분을 철자로 말한 음성 신호이고, 식별 수단은 상기 철자에 대한 음성 신호에 대한 인식 정보를 기준으로 하여 동작하는 음성 인식 수단에 의해 형성되는 것을 특징으로 하는 음성 인식 장치.
  24. 제22항에 있어서, 상기 제1세트의 신호들은 톤으로 구성되는 신호이고, 상기 식별 수단은 톤인식기인 것을 특징으로 하는 음성 인식 장치.
  25. 제22항에 있어서, 제1세트의 신호들은 수신된 신호의 발신 위치 또는 행선을 나타내는 신호인 것을 특징으로 하는 음성 인식 장치.
  26. 항목과 단어의 연관을 규정하는 축적 정보를 기준으로 하여 데이타 저장소의 항목들을 식별하는 방법에 있어서, (a) 상기 단어들중 신호의 존재하는 하나 이상의 단어를 식별하는 단계; (b) 상기 단어들중 식별된 단어와 연관된 것으로 규정된 항목과 연관된 것으로 규정된 상기 단어들의 목록을 컴파일하는 단계; (c) 상기 목록의 단어들중 음성 신호에 존재하는 하나 이상의 단어를 식별하는 단계를 포함하는 것을 특징으로 하는 데이터 저장소의 항목 식별 방법.
  27. a) 식별되는 항목과, 각각의 항목에 대하여 적어도 두 단어와의 연관을 규정하는 정보를 포함하는 데이터 저장소; b) 규정된 단어 세트에 대한 축적 인식 정보를 기준으로 하여 음성 신호와의 유사성을 판단하는 지정 기준에 맞는 적어도 한 단어 또는 단어 순서를 식별하는 음성 인식 수단; c) ⅰ) 상기 음성 인식 수단에 의해 이전에 식별된 단어와 연관된 것으로 규정된 항목과 연관된 것으로 규정되는 단어의 목록의 컴파일하고; ⅱ) 컴파일된 목록에 대한 축적 인식 정보를 기준으로 하여 다른 음성 신호와 유사한 하나 이상의 단어 또는 단어 순서를 식별하는 음성 수단을 제어하도록 동작하는 제어 수단을 포함하는 것을 특징으로 하는 음성 인식 장치.
  28. 인식되는 축적 단어 세트를 기준으로 하여 음성을 인식하는 방법에 있어서, (a) 음성 신호를 수신하는 단계; (b) 음성 신호를 저장하는 단계; (c) 제2신호를 수신하는 단계; (d) 단어 세트를 서브세트인 단어의 목록을 제2신호의 함수로서 컴파인하는 단계; (e) 그 목록을 기준으로 하여 서브세트의 하나 이상의 단어를 식별하는 음성 인식 과정을 축적 음성 신호에 적용하는 단계를 포함하는 것을 특징으로 하는 음성 인식 방법.
  29. 상기 제2신호는 또한 음성 신호인 것을 특징으로 하는 음성 인식 방법.
  30. 제29항에 있어서, 문자 또는 알파벳 문자의 순서를 나타내는 인식 데이터를 기준으로 하여 상기 제2신호를 인식하는 단계를 포함하는 것을 특징으로 하는 음성 인식 방법.
  31. 상기 제2신호는 키패드에 의해 발생된 톤으로 구성되는 신호인 것을 특징으로 하는 음성 인식 방법.
  32. 제28항에 있어서, 상기 제2신호는 상기 제2신호의 발신 위치 및 행선을 나타내는 것을 특징으로 하는 음성 인식 방법.
  33. (a) 음성 신호를 수신하는 단계; (b) 음성 신호를 저장하는 단계; (c) 이 음성 신호 또는 다른 신호에 대하여 인식 동작을 실행하는 단계; (d) 인식 동작이 장애 허용도에 대한 지정 기준에 맞지 않을 경우에 축적 음성 신호를 검색하고, 이 신호에 대하여 인식 동작을 실행하는 단계를 포함하는 것을 특징으로 하는 음성 인식 방법.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019970701907A 1994-10-25 1995-10-25 음성작동서비스 KR100383352B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP94307843 1994-10-25
EP94307843.6 1994-10-25

Publications (2)

Publication Number Publication Date
KR970706561A true KR970706561A (ko) 1997-11-03
KR100383352B1 KR100383352B1 (ko) 2003-10-17

Family

ID=8217890

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970701907A KR100383352B1 (ko) 1994-10-25 1995-10-25 음성작동서비스

Country Status (14)

Country Link
US (2) US5940793A (ko)
EP (2) EP0800698B1 (ko)
JP (1) JPH10507535A (ko)
KR (1) KR100383352B1 (ko)
CN (1) CN1249667C (ko)
AU (1) AU707122B2 (ko)
CA (3) CA2372676C (ko)
DE (2) DE69525178T2 (ko)
ES (1) ES2171558T3 (ko)
FI (2) FI971748A (ko)
MX (1) MX9702759A (ko)
NO (1) NO971904D0 (ko)
NZ (2) NZ294296A (ko)
WO (1) WO1996013030A2 (ko)

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6385312B1 (en) 1993-02-22 2002-05-07 Murex Securities, Ltd. Automatic routing and information system for telephonic services
MX9702759A (es) * 1994-10-25 1997-07-31 British Telecomm Servicios operados por voz.
US5903864A (en) * 1995-08-30 1999-05-11 Dragon Systems Speech recognition
US5896444A (en) * 1996-06-03 1999-04-20 Webtv Networks, Inc. Method and apparatus for managing communications between a client and a server in a network
US5901214A (en) 1996-06-10 1999-05-04 Murex Securities, Ltd. One number intelligent call processing system
US5987408A (en) * 1996-12-16 1999-11-16 Nortel Networks Corporation Automated directory assistance system utilizing a heuristics model for predicting the most likely requested number
DE19709518C5 (de) * 1997-03-10 2006-05-04 Harman Becker Automotive Systems Gmbh Verfahren und Vorrichtung zur Spracheingabe einer Zieladresse in ein Zielführungssystem im Echtzeitbetrieb
GR1003372B (el) * 1997-09-23 2000-05-04 Συσκευη καταχωρησης ψηφιοποιημενων φωνητικων πληροφοριων και ανακτησης τους μεσω τηλεφωνου με αναγνωριση φωνης
US6404876B1 (en) 1997-09-25 2002-06-11 Gte Intelligent Network Services Incorporated System and method for voice activated dialing and routing under open access network control
KR100238189B1 (ko) * 1997-10-16 2000-01-15 윤종용 다중 언어 tts장치 및 다중 언어 tts 처리 방법
US6112172A (en) * 1998-03-31 2000-08-29 Dragon Systems, Inc. Interactive searching
EP1099214B1 (en) * 1998-07-21 2004-09-29 BRITISH TELECOMMUNICATIONS public limited company Speech recognition
US6778647B1 (en) * 1998-11-13 2004-08-17 Siemens Information And Communication Networks, Inc. Redundant database storage of selected record information for an automated interrogation device
US6502075B1 (en) * 1999-03-26 2002-12-31 Koninklijke Philips Electronics, N.V. Auto attendant having natural names database library
US6314402B1 (en) * 1999-04-23 2001-11-06 Nuance Communications Method and apparatus for creating modifiable and combinable speech objects for acquiring information from a speaker in an interactive voice response system
US6421672B1 (en) * 1999-07-27 2002-07-16 Verizon Services Corp. Apparatus for and method of disambiguation of directory listing searches utilizing multiple selectable secondary search keys
DE19944608A1 (de) * 1999-09-17 2001-03-22 Philips Corp Intellectual Pty Erkennung einer in buchstabierter Form vorliegenden Sprachäußerungseingabe
US6868385B1 (en) * 1999-10-05 2005-03-15 Yomobile, Inc. Method and apparatus for the provision of information signals based upon speech recognition
GB2362746A (en) * 2000-05-23 2001-11-28 Vocalis Ltd Data recognition and retrieval
US20020107918A1 (en) * 2000-06-15 2002-08-08 Shaffer James D. System and method for capturing, matching and linking information in a global communications network
US6748426B1 (en) * 2000-06-15 2004-06-08 Murex Securities, Ltd. System and method for linking information in a global computer network
DE10035523A1 (de) * 2000-07-21 2002-01-31 Deutsche Telekom Ag Virtuelles Testbett
JP4486235B2 (ja) * 2000-08-31 2010-06-23 パイオニア株式会社 音声認識装置
JP2002108389A (ja) * 2000-09-29 2002-04-10 Matsushita Electric Ind Co Ltd 音声による個人名称検索、抽出方法およびその装置と車載ナビゲーション装置
DE10196793D2 (de) * 2000-11-03 2004-10-07 Voicecom Ag Robuste Spracherkennung mit Datenbankorganisation
DE10100725C1 (de) * 2001-01-10 2002-01-24 Philips Corp Intellectual Pty Automatisches Dialogsystem mit Datenbanksprachmodell
WO2002086863A1 (en) * 2001-04-19 2002-10-31 British Telecommunications Public Limited Company Speech recognition
DE10119677A1 (de) * 2001-04-20 2002-10-24 Philips Corp Intellectual Pty Verfahren zum Ermitteln von Datenbankeinträgen
US6671670B2 (en) * 2001-06-27 2003-12-30 Telelogue, Inc. System and method for pre-processing information used by an automated attendant
GB2376335B (en) * 2001-06-28 2003-07-23 Vox Generation Ltd Address recognition using an automatic speech recogniser
US7124085B2 (en) * 2001-12-13 2006-10-17 Matsushita Electric Industrial Co., Ltd. Constraint-based speech recognition system and method
US7177814B2 (en) 2002-02-07 2007-02-13 Sap Aktiengesellschaft Dynamic grammar for voice-enabled applications
DE10207895B4 (de) * 2002-02-23 2005-11-03 Harman Becker Automotive Systems Gmbh Verfahren zur Spracherkennung und Spracherkennungssystem
JP3799280B2 (ja) * 2002-03-06 2006-07-19 キヤノン株式会社 対話システムおよびその制御方法
US7242758B2 (en) * 2002-03-19 2007-07-10 Nuance Communications, Inc System and method for automatically processing a user's request by an automated assistant
AU2003264790A1 (en) 2002-10-16 2004-05-04 Koninklijke Philips Electronics N.V. Directory assistant method and apparatus
US7603291B2 (en) 2003-03-14 2009-10-13 Sap Aktiengesellschaft Multi-modal sales applications
CN100353417C (zh) * 2003-09-23 2007-12-05 摩托罗拉公司 用于提供文本消息的方法和装置
US7865362B2 (en) 2005-02-04 2011-01-04 Vocollect, Inc. Method and system for considering information about an expected response when performing speech recognition
US8200495B2 (en) * 2005-02-04 2012-06-12 Vocollect, Inc. Methods and systems for considering information about an expected response when performing speech recognition
WO2006087040A1 (en) * 2005-02-17 2006-08-24 Loquendo S.P.A. Method and system for automatically providing linguistic formulations that are outside a recognition domain of an automatic speech recognition system
US8533485B1 (en) 2005-10-13 2013-09-10 At&T Intellectual Property Ii, L.P. Digital communication biometric authentication
KR101063607B1 (ko) * 2005-10-14 2011-09-07 주식회사 현대오토넷 음성인식을 이용한 명칭 검색 기능을 가지는 네비게이션시스템 및 그 방법
US8458465B1 (en) 2005-11-16 2013-06-04 AT&T Intellectual Property II, L. P. Biometric authentication
US8060367B2 (en) * 2007-06-26 2011-11-15 Targus Information Corporation Spatially indexed grammar and methods of use
DE102007033472A1 (de) * 2007-07-18 2009-01-29 Siemens Ag Verfahren zur Spracherkennung
US20090210233A1 (en) * 2008-02-15 2009-08-20 Microsoft Corporation Cognitive offloading: interface for storing and composing searches on and navigating unconstrained input patterns
EP2096412A3 (de) * 2008-02-29 2009-12-02 Navigon AG Verfahren zum Betrieb eines Navigationssystems
JP5024154B2 (ja) * 2008-03-27 2012-09-12 富士通株式会社 関連付け装置、関連付け方法及びコンピュータプログラム
US8358747B2 (en) 2009-11-10 2013-01-22 International Business Machines Corporation Real time automatic caller speech profiling
US8738377B2 (en) 2010-06-07 2014-05-27 Google Inc. Predicting and learning carrier phrases for speech input
US8645136B2 (en) 2010-07-20 2014-02-04 Intellisist, Inc. System and method for efficiently reducing transcription error using hybrid voice transcription
US9412369B2 (en) * 2011-06-17 2016-08-09 Microsoft Technology Licensing, Llc Automated adverse drug event alerts
US9384731B2 (en) * 2013-11-06 2016-07-05 Microsoft Technology Licensing, Llc Detecting speech input phrase confusion risk
US9691384B1 (en) * 2016-08-19 2017-06-27 Google Inc. Voice action biasing system
US10395649B2 (en) * 2017-12-15 2019-08-27 International Business Machines Corporation Pronunciation analysis and correction feedback

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4763278A (en) 1983-04-13 1988-08-09 Texas Instruments Incorporated Speaker-independent word recognizer
GB2161263B (en) 1984-07-05 1988-03-30 Stc Plc Associative memory systems
GB2165969B (en) * 1984-10-19 1988-07-06 British Telecomm Dialogue system
GB8625468D0 (en) * 1986-10-24 1987-04-15 Smiths Industries Plc Speech recognition apparatus
DE3723078A1 (de) * 1987-07-11 1989-01-19 Philips Patentverwaltung Verfahren zur erkennung von zusammenhaengend gesprochenen woertern
US5202952A (en) * 1990-06-22 1993-04-13 Dragon Systems, Inc. Large-vocabulary continuous speech prefiltering and processing system
US5165095A (en) * 1990-09-28 1992-11-17 Texas Instruments Incorporated Voice telephone dialing
JP2880592B2 (ja) 1990-10-30 1999-04-12 インターナショナル・ビジネス・マシーンズ・コーポレイション 複合音声情報の編集装置および方法
US5267304A (en) * 1991-04-05 1993-11-30 At&T Bell Laboratories Directory assistance system
CA2069599C (en) 1991-08-16 1997-05-06 Lawrence Richard Rabiner Interface method and apparatus for information services
US5170426A (en) 1991-09-12 1992-12-08 Bell Atlantic Network Services, Inc. Method and system for home incarceration
US5355474A (en) 1991-09-27 1994-10-11 Thuraisngham Bhavani M System for multilevel secure database management using a knowledge base with release-based and other security constraints for query, response and update modification
JP2524472B2 (ja) 1992-09-21 1996-08-14 インターナショナル・ビジネス・マシーンズ・コーポレイション 電話回線利用の音声認識システムを訓練する方法
US5392343A (en) 1992-11-10 1995-02-21 At&T Corp. On demand language interpretation in a telecommunications system
CA2091658A1 (en) * 1993-03-15 1994-09-16 Matthew Lennig Method and apparatus for automation of directory assistance using speech recognition
GB2277387A (en) * 1993-04-21 1994-10-26 Ibm Natural language processing system
US5488652A (en) * 1994-04-14 1996-01-30 Northern Telecom Limited Method and apparatus for training speech recognition algorithms for directory assistance applications
WO1996010795A1 (en) * 1994-10-03 1996-04-11 Helfgott & Karas, P.C. A database accessing system
MX9702759A (es) * 1994-10-25 1997-07-31 British Telecomm Servicios operados por voz.

Also Published As

Publication number Publication date
NZ334083A (en) 2000-09-29
WO1996013030A3 (en) 1996-08-08
NZ294296A (en) 1999-04-29
USRE42868E1 (en) 2011-10-25
EP0800698B1 (en) 2002-01-23
DE69535797D1 (de) 2008-09-11
JPH10507535A (ja) 1998-07-21
EP1172994A3 (en) 2002-07-03
ES2171558T3 (es) 2002-09-16
MX9702759A (es) 1997-07-31
CA2372676A1 (en) 1996-05-02
FI971748A0 (fi) 1997-04-24
FI971748A (fi) 1997-04-24
FI981047A0 (fi) 1995-10-25
AU707122B2 (en) 1999-07-01
DE69525178D1 (de) 2002-03-14
CN1164292A (zh) 1997-11-05
EP0800698A2 (en) 1997-10-15
DE69525178T2 (de) 2002-08-29
EP1172994A2 (en) 2002-01-16
US5940793A (en) 1999-08-17
NO971904L (no) 1997-04-24
CA2372671C (en) 2007-01-02
CA2372676C (en) 2006-01-03
NO971904D0 (no) 1997-04-24
CA2202663C (en) 2002-08-13
WO1996013030A2 (en) 1996-05-02
CN1249667C (zh) 2006-04-05
AU3705795A (en) 1996-05-15
EP1172994B1 (en) 2008-07-30
FI981047A (fi) 1998-05-12
CA2372671A1 (en) 1996-05-02
CA2202663A1 (en) 1996-05-02
KR100383352B1 (ko) 2003-10-17

Similar Documents

Publication Publication Date Title
KR970706561A (ko) 음성 대화형 서비스 (voice-operated services)
US6208964B1 (en) Method and apparatus for providing unsupervised adaptation of transcriptions
US6018708A (en) Method and apparatus for performing speech recognition utilizing a supplementary lexicon of frequently used orthographies
US5917889A (en) Capture of alphabetic or alphanumeric character strings in an automated call processing environment
US5983177A (en) Method and apparatus for obtaining transcriptions from multiple training utterances
US6243680B1 (en) Method and apparatus for obtaining a transcription of phrases through text and spoken utterances
US20030115289A1 (en) Navigation in a voice recognition system
KR19990083596A (ko) 음성인식을사용하는자동화된호텔안내시스템
US5752230A (en) Method and apparatus for identifying names with a speech recognition program
EP1240642A1 (en) Learning of dialogue states and language model of spoken information system
KR940015969A (ko) 음성 인식 시스템 어휘 목록으로의 혼동되는 유사 어구 (confusingly similar phrases) 입력 방지 방법 및 시스템
KR970707529A (ko) 음성 인식 장치 및 음성 인식 장치용 어휘 발생 방법(speech recognition)
KR20060014369A (ko) 화자 종속 음성 인식 방법 및 음성 인식 시스템
US7844459B2 (en) Method for creating a speech database for a target vocabulary in order to train a speech recognition system
US7587322B2 (en) Robust speech recognition with data bank accession organized by semantic attribute
US7430503B1 (en) Method of combining corpora to achieve consistency in phonetic labeling
KR20000005278A (ko) 자동 음성인식 방법 및 장치_
JP3830124B2 (ja) 音声認識装置
US7970610B2 (en) Speech recognition
JP2003177788A (ja) 音声対話システムおよびその方法
CA2597826C (en) Method, software and device for uniquely identifying a desired contact in a contacts database based on a single utterance
Kitai et al. ASR and TTS telecommunications applications in Japan
US20020032565A1 (en) Automatic recognition of company names in speech utterances
JPH06133039A (ja) 気象情報自動案内装置
CA2256781A1 (en) Method and apparatus for automatically dialling a desired telephone number using speech commands

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130409

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20140408

Year of fee payment: 12

EXPY Expiration of term