KR20010052414A - 식별 가능한 이름들의 라이브러리를 갖는 자동 어텐던트 - Google Patents

식별 가능한 이름들의 라이브러리를 갖는 자동 어텐던트 Download PDF

Info

Publication number
KR20010052414A
KR20010052414A KR1020007013351A KR20007013351A KR20010052414A KR 20010052414 A KR20010052414 A KR 20010052414A KR 1020007013351 A KR1020007013351 A KR 1020007013351A KR 20007013351 A KR20007013351 A KR 20007013351A KR 20010052414 A KR20010052414 A KR 20010052414A
Authority
KR
South Korea
Prior art keywords
library
name
objects
names
user
Prior art date
Application number
KR1020007013351A
Other languages
English (en)
Inventor
테리킴에스.
포스터피터제이.
Original Assignee
요트.게.아. 롤페즈
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 요트.게.아. 롤페즈, 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 요트.게.아. 롤페즈
Publication of KR20010052414A publication Critical patent/KR20010052414A/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/30Aspects of automatic or semi-automatic exchanges related to audio recordings in general
    • H04M2203/306Prerecordings to be used during a voice call
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/30Aspects of automatic or semi-automatic exchanges related to audio recordings in general
    • H04M2203/308Personal name recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4931Directory assistance systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/527Centralised call answering arrangements not requiring operator intervention
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/533Voice mail systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Sub-Exchange Stations And Push- Button Telephones (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

자동화된 전화 조작자 플렛 폼(예컨데, 자동 어텐던트)은 그것과 함께 결합된 자연 이름들의 라이브러리를 갖는다. 자연 이름들의 라이브러리는 플렛폼으로 구성되거나 플렛폼상에서 실행되는 전화-기반 ASR 어플리케이션에 의해 인식될것으로 예견되는 공통 오브젝트를 나타내는 오디오 파일의 대용량 데이터베이스를 갖는다. ASR 어플리케이션이 오브젝트 파일의 재상을 요구할 때 마다(예를 들면, 메일박스와 연관된 사용자의 이름), 상기 시스템은 처음으로 사용자가 그 또는 그녀의 음성으로 저장된 샘플을 가지고 있는지를 결정한다. 만약 그렇다면, 사용자의 실제 장되있지 않다면, 상기 ASR 어플리케이션은 그것으로부터 오브젝트 파일을 검색하기 위해 어플리 케이션을 엑세스 할 것이고, 적절한 출력 스트링을 만들 것이다.

Description

식별 가능한 이름들의 라이브러리를 갖는 자동 어텐던트{Auto attendant with library of recognisable names}
종래의 음성 메일 시스템은 재생 및 공고 목적을 위해 사용자의 음성을 기록할 수 있다. 그러므로, 예를 들면, 소정의 호출된 측이 이용 가능하지 않을 때, 시스템은 호출된 측(colled party)의 실제 음성으로 프럼프트(prompt)를 재생하도록 제어될 것이다. 이 조작은 전형적으로 사용자의 기록된(record) 오디오 파일을 저장하고 소정의 사건이 발생하면 파일을 검색함으로서 수행된다. 상술된 재생 기술이 바람직 하지만, 실제로 많은 사용자들은 그들의 음성 정보를 기록할 때 많은 시간을 쓸려고 하지 않는다. 병원이나 호텔에서 이러한 시스템을 사용하는 것과 같은 어떤 환경에서는, 사용자는 연장된 기간에 대해 시스템을 엑세스하기를 원하지 않으며, 그러므로, 시스템에 음성 정보를 기록할 동기를 갖지 않는다. 이러한 경우, 사용자 인식 정보의 재생은 두 가지 방법 중에 하나에서만 수행된다. 조작자가 각각의 사용자 이름들을 저장하는 노동 집약적인 업무를 처리하던가, 또는 시스템이 사용자의 이름들을 공지하는 어떤 다른 수단으로 디폴트되도록 하는 것이다. 전형적으로 디폴트 조작은 문자-음성 프로세서(text-to-speech processor)에 의해 수행되고, 그것은 받아들일 수 없는 결과를 낳는다. 특히, 문자-음성 프로세서는 특히 외국에서 기원된 이름들에 관련하여, 소정의 이름들의 적절한 발음을 제공하지 않는다. 본 발명은 이러한 문제를 해결한다.
본 발명은 일반적으로 자동 음성 인식(ASR)에 대한 어플레케이션에 관한 것으로서, 특히 정보 검색(information retrieval), 재생(playback) 및 네비게이션(navigation)을 위해 ASR을 이용하는 자동화된 전화 조작자 플렛폼에 대한 것이다.
도 1은 다중 전화선에서의 음성 음력을 인식히가 위한 다중처리 컴퓨터의 블록 다이어그램.
도 2는 자동 어텐던트 플렛폼에 관련된 본 발명의 양호한 실행의 간략화된 블록 다이어그램.
도 3은 자연 이름들의 라이브러리는 중앙에서 관리되고 어텐던트 플렛폼의 세트에 의해 엑세스 가능하게 되는, 대안적인 실행을 간략화한 블록 다이어그램.
도 4는 상기 라이브러리가 선택적으로 엑세스되는 음성 재생 절차의 간략화된 플로우챠트.
본 발명의 목적은 자연 이름들의 라이브러리(natural names library)를 갖는 전화 조작자 플렛폼(예컨데, 자동 어텐던트(auto attendant))을 제공하는 것이다. 자연 이름들의 라이브러리는, 플렛폼에 관련되거나 플렛폼 상에서 실행되는 전화-기반 ASR 어플레케이션에 의해 인식될 것으로 예상되는 공통 오브젝트(예컨데, 이름 재품 식별, 색상, 등등)를 나타내는 오디오 파일의 대용량 데이터베이스를 포함한다. 양호하게, 각각의 오디오 파일은 압축된 형식으로 저장된다. ASR 어플레케이션이 오브젝트 파일(예를 들면, 사용자의 이름)의 재생을 요구했을 때, 시스템은 먼저 사용자가 필수적인 음성 샘플을 저장했는지를 결정한다. 만약 그렇다면, 사용자의 실제 음성 샘플은 출력된다. 그러나, 만약 사용자의 실제 음성 샘플이 이용 가능하지 않거나 또는 기록되지 않았다면, 상기 ASR 어플리케이션은 오브젝트 파일을 검색하기 위해 데이터 베이스를 엑세스하고, 그로부터 적절한 출력 스트링(string)를 만든다.
그러므로, 예를 들면, 만약 호출측이(calling party)이 " Mary Smith"와 대화히기를 원하고, 상기 사람이 이용 가능하지 않다면, 음성 메일 시스템은 " 'Mary Smith'에 대한 당신의 호출을 수행할수 없습니다. 만약 메시지를 남기고 싶으시면 1을 누르십시오" 라고 응답할 수 있다. 이 메시지에서, 만일 '메리 스미스'프럼프트가 사용자 자신의 음성으로 존재하지 않는다면, 시스템은 'Mary' 와 'Smith'의 두 개의 분리된 오브젝트 엔트리들(object entries)을 공통 이름들의 라이브러리에서 검색하고, 상기 오브젝트를 연결하여 'Mary Smith'를 출력한다. 이용 가능한 라이브러리 오브젝트가 이용 가능하지 않거나 또는 충분치 않은 경우에는, 문자-음성 프로세서가 백업 공고 메카니즘(back-up announcement machinism)으로서 사용될 수 있다.
자연 이름들의 라이브러리는 중앙에 위치되어서 인터넷이나 인트라넷 또는 기타등등과 같은 데이터 네트워크를 통해서 어텐던트 플렛폼의 세트에 엑세스 될 수 있다. 라이브러리는 콜 바이 콜(call-by-call)에 기초하여 엑세스되고, 또는 라이브러리의 오브젝트의 서브셋이 소정의 어텐던트의 플렛폼으로 다운로드 될 수도 있다. 데이터베이스의 엔트리의수가 더욱 더 커질 때, 라이브러리의 중앙화된 관리 및 경영이 양호하다.
그러므로, 본 발명의 양호한 실시예에 따라, 원하는 출력의 개별 컴포넌트 오브젝트는 이름들의 라이브러리로부터 검색되고 출력으로 재결합된다(전형적으로 연결에 의해). 상기 이름들의 라이브러리는 전화번호 보조기, 음성 메일 라우팅 또는 기타 등등을 제공하기 위해 전용 브렌치 교환(private branch exchange)으로의 프론트 엔드 또는 백 엔드인 특별한 유용성을 갖는다.
상술된 것들은 본 발명의 보다 적절한 목적 및 특징을 약술하였다. 이러한 목적들은 본 발명의 몇몇의 더욱 뛰어난 특징 및 응용들을 단지 예시하기 위한 것으로 이해되어야 한다. 후술하는 바와 같이, 개시된 본 발명은 다른 방식으로 적용하거나 본 발명을 수행함으로서 많은 다른 유리한 결과들이 얻어질 수 있다. 따라서, 다른 목적 및 본 발명의 전체적인 이해는 후술된 상세한 설명 및 양호한 실시예를 참조로 얻어질 것이다.
본 발명의 더욱 완벽한 이해 및 이점은 첨부된 도면과 함께 후술된 상세한 설명에서 이해 될 것이다.
음성인식을 전화 기반 입력에 적용하는 것은 종래에 잘 알려져있다. 배경의 방법으로, 본 발명에서 실행되는 공지된 컴퓨터 아키텍쳐는 도 1에 도시되어있다. 컴퓨터(100)는 음성을 통해서 다중 전화선(110)을 넘어 호출자(caller)와 상호작용한다. 컴퓨터(100)는 자동적으로 호출자가 뭐라고 말했는지를 인식하고, 호출자와 상호작용하기 위해 프럼프트를 동작할 수 있다. 컴퓨터(100)는 단일 보드 컴퓨터와 같은 일반적 목적의 컴퓨터(120)와 데이터 버스(125)로 연결된, 하나 이상의 전화 인터페이스(130)를 갖는다. 일반적 목적의 컴퓨터(120)는 일반적 목적의 프로세서(122), DRAM과 같은 작업 메모리(working memory)(124) 및 자기 디스크와 같은 비-휘발성 프로그램 메모리를 포함한다. 대안적으로, 프로그램 메모리는 다른 컴퓨터 상에 존재하고, 데이터 네트워크를 통해 엑세스된다. 전화 인터페이스(130)는 어느 호출자가 컴퓨터와 상호작용 하느냐에 따라 인터페이스를 전화선(110)으로 제공한다. 데이터 버스(125)를 통해 연결된 일반적 목적의 컴퓨터(120)는 하나 이상의 DSP 플렛폼(140)을 갖는다. DSP 플렛폼(140)은 , TDM 버스가 선호되는, 제 2 버스(150)를 지나 전화 인터페이스에 연결되있다. TDM(150) 버스는 DSP 플렛폼(140)과 전화 인터페이스(130)사이에서 디자탈화된 음성을 전한다. 각각의 DSP 플렛폼(140)은 다중 DSP 프로세서(142), 작업 메모리(144), 데이터 버스(125)로 연결된 데이터 버스 인터페이스(146), 및 데이터 버스(150)로의 음성 인터페이스(148)를 포함한다. 일반 목적 프로세서는 122는 인텔 펜티엄이고, 데이터(125)는 ISA 버스, DSP 플렛폼은 다이아로그 코오포레이션에서 제작된 안타레스 DSP 플렛폼(model 2000/30,2000/50 또는 6000)이고, TDM 버스(150)는 8kHz에서 샘플링된 8 bit 샘플로 인코딩된 전화 신호를 전하는 SCSI 버스이다. 각각의 안타레스 DSP 플렛폼은 4개의 DSP프로세서(142)를 포함하고, TNS320C31 프로세서는 텍사스 인스트루먼트에 의해 제작되었다. 작업 메모리(144)는 DSP마다 512KB의 정전 RAM을, 4개의 DSP 프로세서(142)에게 나누어진 4MB의 다이나믹 RAM을 갖는다. 전화 인터페이스(130)는 몇몇의 다른 타입이 되고, 예컨데,디지아로직 코오포레이션에 의해 제작된 인터페이스(Model Nos. D41ESC, D160SC, 및 D112SC)와 같다. A D112SC 인테페이스는, 예를 들면, 12개의 아날로그 전화선(110)을 공급한다. DSP플렛폼상의 각각의 DSP 프로세서는 소정의 전화 체널과 양호하게 결합된다.
많은 음성-기반 전화 어플레케이션에서, 호출자는 전화 콜의 시간 중 비교적 작은 부분에서만 말한다. 시간의 나머지는 프럼프트 또는 호출자의 다른 정보의 수행에 또는 호출자에 대해 정보가 검색(retrieve) 기간과 같은 무소음 간격(interval)의해 낭비된다. 그러므로, 만약 원한다면, 어떤 호출자가 말하는지 또는 어떤 정보 또는 어떤 프럼프트가 수행되는지에 관계없이, DSP는 각각의 전와 상호 작용마다 할당된다.
도 2는 본 발명의 양호한 수행의 간략화된 블록 다이어그램이다. 이 실시예에서, 자동 어텐던트 플렛폼(10)은 PBX(private branch exchange)안에 위치한다. 플렛폼(10)은 스위치(12), 제어기(14) 및 Voice Contral Systems, Inc.of Dallas, Texas 로부터 가능한,Vpro/Continuous 음성 인식, VR/Continuous음성 인식 및 Speech Wave Standard 음성 인식과 같은 ASR 어플리케이션(16)을 포함하는 다양한 어플레케이션을 구비한다. 물론, 어떤 소정의 음성 인식 어플레케이션도 사용될 것이다. 상기 플렛폼은 또한, 저장, 검색, 전송을 위한 음성메일 어플레케이션(18)을 포함한다.
어텐던트는 다양한 조작자 서비스 기능을 제공한다. 그러므로, 예를 들면, 어텐던트는 입력 호출에 응답하고, 시작 인사(open greeting)를 수행하고, 이름/확장자를 구하고, 확장자로의 호출을 전송한다. 어텐던트가 호출에 응답했을 때, 외부의 호출자는 전형적으로 이름에 대해 프럼프트 된다. 이름을 확인하기 위해, 소정의 외부 호출자는 대응하는 확장자로 전송된다. 공지된 기술에서, 어텐던트는 전형적으로 " 라고 말하셨습니까?" 라는 프럼프트를 이름 확인을 돕기 위해 출력한다. 시스템의 사용자는 일반적으로 기록의 목적에 대한 보이스 메일 시스템을 엑세스하고 그들의 " 라고 말하셨습니까?" 프럼프트를 재기록한다.
본 발명에 따라서, 자동 어텐던트 플렛폼은 자연 이름들의 라이브러리(25)를 포함한다. 라이브러리(25)는 ASR에 의해 인식되는 오브젝트에 양호하게 대응하는 각각의 파일을 갖는 압축된 오디오 파일(27)의 데이터베이스이다. 그러므로, 단순하게 표시되는, 음성 메일의 예에서, 파일(27)은 일반 이름의 거대한 집합이다. 양호하게, 집합은 컴퓨터 입력(type-in), 음성 입력(say-in) 또는 그 둘의 조합에 의해 오프-라인의 방법으로 발생된다. 라이브러리가 어텐던트에게 사용 가능하게 만들어 질 때, 양호하게 일반 이름은 ASR 어플리케이션에 의한 획득을 위해 이미 기록되고, 저장, 압축 및 인덱스 된다. 이름 데이터 베이스의 예에서, 소정의 이름은 이름의 음성 스펠링인 하나 이상의 복사의 세트를 갖는다. 이것은 특히 소정의 이름이 방언. 지방 언어 특색, 화자의 고향 및 등등의 차이에 의한 발음차를 갖을 때, 유효하다. 그러므로, 본 발명에 따라, 소정의 일반 이름, 예컨대 "Smith"는 각각이 이름의 다른 발음을 나타내는 오브젝트의 실예의 세트에 의해 인식될 것이다.
라이브러리(25)의 일반 이름의 저장소 및 오프라인 생성은, " 라고 말했습니까" 프럼프트 및 시스템에 의해 사용되는 다른 프럼프트에 대해 그 또는 그녀의 이름의 사용자 엔트리(entry)를 제거한다. 만약 소정의 사용자가 그의 또는 그녀의 관련된 메일박스에 대해 그 또는 그녀의 이름을 기록하지 않았다면, 상기 시스템은 계속 자연 소리의 말해진 응답을 돌려줄 것이다.
또 다른 실시예에서, 이름 오브젝트를 구비하는 오디오 파일은 압축된 파일로서 저장된다(예컨대, 웨이브 파일). 그러나, 개개의 압죽 기술은 본 발명의 제한이 아니다. 그러므로, 압축은 adcpm, pcm, μlaw, alaw, 또는 다른 알려진 또는 최근에 발전된 압축 절차를 기본으로 한다. 부가적으로 개개의 파일은 예를 들면, 어레이로서, 링크된 리스트 또는 유사한 것을 포함한 종래의 포맷에서 배열된다. 양호하게, 라이브러리가 크기를 확장함에 따라, RDBMS(relational database management system)은 저장, 검색 및 라이브러리를 구비한 파일의 서빙(serving)을 관리하는데 이용된다. 실시예에서, 오디오 파일은 프론트 엔드와 같은 디렉토리 서비스(예컨데, LDAP)를 포함한 관계 데이터베이스에 저장된다. 이것은 라이브러리를 인터넷 또는 인트라넷과 같은 컴퓨터 네트워크를 통해 엑세스되는 것을 가능하게 한다. 관계 데이터 베이스는 오라클, 사이베이스, 또는 제 3 벤더에 의해서 제공된다.
본 발명이 폭넓게 분포된 어플리케이션은 도 3에서 도시되어 있다. 이 실시예에서, 자동화된 어텐던트 플렛폼(31a-31n)은 디렉토리 서버를 통해 선택적으로 라이브러리를 엑세스한다. 플렛폼(30)은 컴퓨터 네트워크(32)를 통해 디렉토리 서버를 엑세스한다. 매니저(34)(서버 컴퓨터 일 것이다)는 라이브러리로의 엑세스를 제어하고 관리한다.
도 4는 이름들의 라이브러리가 선택적으로 엑세스되는 음성 녹음 절차의 간략화된 플로우차트 이다. 절차는" 라 말했습니까" 프럼프트의 발부가 요구됐을 때, 단계(40)에서 시작한다. 일반적인 기술 중 어느 것은 적절하지만, 이 예는 폭넓은 실예가 되고 라이브러리는 본 발명의 영역 안에서, 몇몇의 다른 프럼프트 또는 의도에 대해 엑세스 될 것이다. 단계(42)에서, 사용자 자신의 목소리에서 오디오 파일로 프럼프트가 채워질 수 있는지를 결정하기 위해, 테스트가 수행된다. 만약 그렇다면, 절차는 사용자의 미리 녹음된 이름으로서 프럼프트가 발부되게 하기 위해 단계(44)로 이어진다. 그러나, 만약, 단계(42)의 출력이 부정이라면, 절차는 원하는 이름이 구비된 오브젝트가 라이브러리 안에서 이용 가능한지를 테스트하기 위해 단계(45)로 간다. 만약 그렇다면, 절차는 이름들의 라이브러리로부터 하나 이상이 오브젝트의 세트를 검색하기 위해 단계(46)로 간다. 상술되었듯이, 이름들의 라이브러리는 플렛폼으로 구성되어 있거나 또는 플렛폼에 의해서(예컨데, 컴퓨터 네트워크를 통해서) 원격적으로 엑세스 가능하다. 검색 단계 동안, 사용된 이름에 대해 소정의 발음을 확인하기 위해, 절차는 또한 오브젝트 녹음의 세트를 구문 해석한다. 단계(48)에서, 오브젝트는 필수적으로 결합된다. 전형적으로, 이 단계는 제 1 이름 및 마지막 이름의 압축에 관여한다(음성 메일의 경우). 단계(50)에서, 결합된 성분은 프럼프트에서 출력된다.
만약 단계(45)의 테스트 출력이, 하나 이상의 필수 이름 오브젝트가 이름들의 라이브러리로부터 이용 가능하지 않다는 것을 나타내는, 부정이라면, 절차는 이름의 문자-음성 버전을 생성하기 위해 단계(52)로 이어진다. 단계(54)에서, 절차는 문자-음성 프로세서를 이용하여 " 라고 말했습니까?" 프럼프트를 줄력한다. 그러나 보여지듯, 문자-음성 프로세스는 오직 사용자 또는 이름들의 라이브러리가 프럼프트를 완성하기 위한 필수 오디오 파일을 제공하지 못할 때 최후의 방법으로서만 사용된다.
본 발명에 따라, 이름들의 라이브러리 또는 그것의 서브 셋은 필수적으로 자동 참가자를 가능하게 한다. 그러므로, 제 2 세트의 오브젝트(상품 이름의 세트와 대응하는)는 음성-기준 순서 엔트리 및 시스템 확인을 가능하게 하는 동안, 오브젝트의 세트(정확한 이름의 세트에 대응하는)는 보이스(25) 메일 기능을 제공하는 소정의 제 1 참가자를 가능하게 한다. 당업자에 의해 명확해 지듯이, 본 발명의 개개의 어플리케이션은 음성 메일, 엔트리의 배열 또는 유사한 것에 한정되지 않는다. 이름들의 라이브러리의 크기가 늘어날수록, 자연 이름들의 라이브러리로부터 유리한 많은 다른 어플리케이션이 있을 것이다.
도 4의 기능을 제공하는 제어 절차는 컴퓨터 소프트웨어에서 양호하게 수행된다. 그러므로, 본 발명의 양호한 수단은 일반 목적의 컴퓨터의 RAM에 존재하는 코드 모듈에서 지시의 세트(프로그램 코드)로서 있다. 컴퓨터에 의해 요구될 때까지, 지시의 세트는 하드 디스크 드라이브 또는 광학 디스크(CD ROM에서의 궁국적 사용을 위해) 또는 플로피 디스크(플로피 디스크 드라이브에서 궁극적인 사용을 위해) 다른 컴퓨터 메모리에 저장되어 있거나, 인터넷이나 또는 다른 컴퓨터 네트워크를 통해서 다운 로드 된다. 부가적으로, 상술된 다양한 방법은 소프트웨어에 의해 선택적으로 활성화되고 형을바꾸는 컴퓨터 안에서 편리하게 실행되고, 일반적인 당업자는 하드웨어에서, 펌웨어에서 또는 다른 특성화된 장치 및 요구된 방법 단계를 수행하기 위해 구성된 디바이스에서 수행되는 이러한 방법을 또한 인식한다.
이와 같이 본 발명을 설명했지만, 새로운 것으로서 청구하고 특례로서 보호받고자 하는 것은 청구의 범위에 설명되어 있다.

Claims (18)

  1. 프로세서와 전화에 응답하고, 인사를 행하고, 이름을 요청하고, 말해진 입력을 확인하고, 주어진 연장선으로 호출자를 전송하는 수단을 갖는 자동화된 어텐던트에서,
    개선된 점은,
    많은 수의 오브젝트 오디오 파일이 저장되고 , 각각의 오브젝트 오디오 파일은 이름을 나타내는 자연 이름들의 라이브러리(natural name library); 및
    (a) 말해진 입력이, 사용자의 이름을 기록한 사용자를 인식하는지 결정하고 (b) 만약 결정의 상기 출력이 부정일 경우, 자연 이름들의 라이브러리로부터 하나 이상의 오브젝트 세트의 선택적인 검색하고 (c) 하나 이상의 오브젝트의 상기 세트의 줄력하기 위하여, 말해진 입력의 확인의 요구에 응답하고 프로세서에 의해 작용하는 제어 수단을 구비한 개선점.
  2. 제 1 항에 있어서,
    하나 이상의 오브젝트의 세트를 출력하는 단계는 스트링(string)으로 적어도 제 1 및 제 2 오브젝트를 조합하는 단계를 포함하는 개선점.
  3. 제 2 항에 있어서,
    상기 제 1 및 제 2 오브젝트는 연결에 의해 조합되는 개선점
  4. 제 3 항에 있어서,
    상기 제 1 및 제 2 오브젝트는 호출된 측은 제 1 이름 및 마지막 이름인 개선점.
  5. 제 1 항에 있어서,
    상기 제어 수단은 만약 소정의 오브젝트가 자연 이름들의 라이브러리로부터 이용 가능하지 않을 경우, 말해진 입력의 문자-음성 버전을 생성하는 수단을 더 포함하는 개선점.
  6. 제 1 항에 있어서,
    상기 오디오 파일은 상기 자연 이름들의 라이브러리에 압축된 포맷으로 저장되는 개선점.
  7. 시스템에 있어서,
    프로세서와 전화에 응답하고, 인사를 행하고, 이름을 요청하고, 말해진 입력을 확인하고, 주어진 연장선으로 호출자를 전송하는 수단을 갖는 자동화된 어텐던트에서,
    많은 수의 오브젝트 오디오 파일이 저장되고 , 각각의 오브젝트 오디오 파일은 이름을 나타내는 자연 이름들의 라이브러리(natural name library); 및
    (a) 말해진 입력이, 사용자의 이름을 기록한 사용자를 인식하는지 결정하고 (b) 만약 결정의 상기 출력이 부정일 경우, 자연 이름들의 라이브러리로부터 하나 이상의 오브젝트 세트의 선택적인 검색하고 (c) 하나 이상의 오브젝트의 세트의 출력하기 위해, 말해진 입력의 확인의 요구에 응답하는 10 제어수단을 구비하는 시스템.
  8. 제 7 항에 있어서,
    하나 이상의 오브젝트의 상기 세트를 출력하는 단계는 스트링(string)으로 적어도 제 1 및 제 2 오브젝트를 조합하는 단계를 포함하는 시스템.
  9. 제 8 항에 있어서,
    상기 제 1 및 제 2 오브젝트는 연결(concatenation)에 의해 조합되는 시스템.
  10. 제 7 항에 있어서,
    상기 자연 이름들의 라이브러리는 자동 어텐던트에 접하게 위치하는 시스템.
  11. 제 7 항에 있어서,
    상기 자연 이름들의 라이브러리는 자동 어텐던트로부터 원격적으로 위치하고 컴퓨터 네트워크를 통해 엑세스되는 시스템.
  12. 제 7 항에 있어서,
    10은 적어도 제 2 자동 어텐던트를 포함하고, 상기 자연 이름들의 라이브러리는 상기 제 1 및 제 2 자동 어턴던트에 의해 나누어지는 시스템.
  13. 제 7 항에 있어서,
    상기 오디오 파일은 상기 자연 이름들의 라이브러리에 압축 형태로 저장되는 시스템.
  14. 말해진 입력을 확인하는 방법에 있어서,
    말해진 입력의 확인 요구에 응답하여, 사용자가 사전 기록된 사용자의 이름을 가지고 있는지를 결정하는 단계;
    만약 상기 사용자가 미리 기록된 사용자의 이름을 가지고 있다면, 상기 사용자의 미리 저장된 이름을 이용하여 상기 말해진 입력을 확인하는 단계;
    만약 상기 사용자가 미리 저장된 사용자의 이름을 사전 기록하지 않았다면, 일반 이름 오브젝트의 자연 이름들의 라이브러리로부터 이용 가능한 정보를 이용하여 말해진 입력이 확인될 수 있는지를 결정하는 단계;
    만일 상기 말해진 입력이 상기 정보를 이용하여 확인됐다면, 상기 자연 이름들의 라이브러리로부터 하나 이상의 오브젝트의 세트를 검색하는 단계; 및
    상기 오브젝트의 세트로부터 추론된 소정의 이름을 출력하는 단계를 구비하는 입력 확인 방법.
  15. 제 14 항에 있어서,
    상기 소정의 이름을 출력하는 단계는 적어도 제 1 및 제 2 오브젝트로부터 소정의 이름을 조합하는 단계를 더 포함하는 입력 확인 방법.
  16. 제 15 항에 있어서,
    상기 제 1 및 제 2 오브젝트는 연결에 의해 조합된 입력 확인 방법.
  17. 제 14 항에 있어서,
    만일 상기 말해진 입력이 일반 이름 오브젝트의 자연 이름들의 라이브러리로부터 가능한 5 정보를 이용하여 확인될 수 없다면, 말해진 입력의 문자-음성 버전을 생성하는 단계를 포함하는 입력 확인 방법.
  18. 제 14 항에 있어서,
    적어도 하나의 오브젝트는 이름의 소정의 발음을 각각 표시할 때 관련된 오브젝트 예의 세트를 갖는 입력 확인 방법.
KR1020007013351A 1999-03-26 2000-03-23 식별 가능한 이름들의 라이브러리를 갖는 자동 어텐던트 KR20010052414A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/276,928 US6502075B1 (en) 1999-03-26 1999-03-26 Auto attendant having natural names database library
US09/276,928 1999-03-26
PCT/EP2000/002754 WO2000059193A1 (en) 1999-03-26 2000-03-23 Auto attendant with library of recognisable names

Publications (1)

Publication Number Publication Date
KR20010052414A true KR20010052414A (ko) 2001-06-25

Family

ID=23058677

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020007013351A KR20010052414A (ko) 1999-03-26 2000-03-23 식별 가능한 이름들의 라이브러리를 갖는 자동 어텐던트

Country Status (6)

Country Link
US (1) US6502075B1 (ko)
EP (1) EP1084563A1 (ko)
JP (1) JP2003529229A (ko)
KR (1) KR20010052414A (ko)
CN (1) CN1336069A (ko)
WO (1) WO2000059193A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7013280B2 (en) * 2001-02-27 2006-03-14 International Business Machines Corporation Disambiguation method and system for a voice activated directory assistance system
WO2005029370A1 (en) * 2003-09-17 2005-03-31 Language Analysis Systems, Inc. Identifying related names
CN100592385C (zh) * 2004-08-06 2010-02-24 摩托罗拉公司 用于对多语言的姓名进行语音识别的方法和系统
US8005849B2 (en) * 2006-08-31 2011-08-23 Red Hat, Inc. Database access server with reformatting
US8401157B2 (en) 2008-01-24 2013-03-19 Alcatel Lucent System and method for providing audible spoken name pronunciations
WO2011127242A2 (en) * 2010-04-07 2011-10-13 Max Value Solutions INTL, LLC Method and system for name pronunciation guide services

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5210520A (en) * 1987-07-15 1993-05-11 Housley Todd B Programmable doorbell control
WO1993013518A1 (en) * 1991-12-31 1993-07-08 Digital Sound Corporation Voice controlled messaging system and processing method
US5483579A (en) * 1993-02-25 1996-01-09 Digital Acoustics, Inc. Voice recognition dialing system
KR100383352B1 (ko) * 1994-10-25 2003-10-17 브리티쉬 텔리커뮤니케이션즈 파블릭 리미티드 캄퍼니 음성작동서비스
US5651055A (en) * 1995-06-29 1997-07-22 Lucent Technologies Inc. Digital secretary
US5794249A (en) * 1995-12-21 1998-08-11 Hewlett-Packard Company Audio/video retrieval system that uses keyword indexing of digital recordings to display a list of the recorded text files, keywords and time stamps associated with the system
US5892814A (en) * 1995-12-29 1999-04-06 Northern Telecom Limited Flexible, tapeless, personalized auto-attendant telephone
JPH09292255A (ja) * 1996-04-26 1997-11-11 Pioneer Electron Corp ナビゲーション方法及び装置
FI101333B1 (fi) * 1996-09-02 1998-05-29 Nokia Mobile Phones Ltd Puhekomennoilla ohjattava telepäätelaite
US5875448A (en) * 1996-10-08 1999-02-23 Boys; Donald R. Data stream editing system including a hand-held voice-editing apparatus having a position-finding enunciator
US6021181A (en) * 1997-02-24 2000-02-01 Wildfire Communications, Inc. Electronic voice mail message handling system
US6041300A (en) 1997-03-21 2000-03-21 International Business Machines Corporation System and method of using pre-enrolled speech sub-units for efficient speech synthesis
US6173266B1 (en) * 1997-05-06 2001-01-09 Speechworks International, Inc. System and method for developing interactive speech applications
US6075844A (en) * 1997-11-18 2000-06-13 At&T Corp. Messaging system with remote messaging recording device where the message is routed based on the spoken name of the recipient

Also Published As

Publication number Publication date
JP2003529229A (ja) 2003-09-30
US6502075B1 (en) 2002-12-31
EP1084563A1 (en) 2001-03-21
WO2000059193A1 (en) 2000-10-05
CN1336069A (zh) 2002-02-13

Similar Documents

Publication Publication Date Title
US5822727A (en) Method for automatic speech recognition in telephony
US5797124A (en) Voice-controlled voice mail having random-order message retrieval based on played spoken identifier list
US5651055A (en) Digital secretary
JP3873131B2 (ja) 電話メッセージの転記のために使用される編集システム及び方法
US7443960B2 (en) Method and system for an automated departure strategy
US5912949A (en) Voice-dialing system using both spoken names and initials in recognition
US6940951B2 (en) Telephone application programming interface-based, speech enabled automatic telephone dialer using names
US6507643B1 (en) Speech recognition system and method for converting voice mail messages to electronic mail messages
US6873951B1 (en) Speech recognition system and method permitting user customization
US7146383B2 (en) Method and system for an automated disambiguation
US6018568A (en) Voice dialing system
US6370237B1 (en) Voice activated dialing with reduced storage requirements
JPH08320696A (ja) 任意に話された単語の自動通話認識方法
US6563911B2 (en) Speech enabled, automatic telephone dialer using names, including seamless interface with computer-based address book programs
US6148285A (en) Allophonic text-to-speech generator
US8145495B2 (en) Integrated voice navigation system and method
US6671354B2 (en) Speech enabled, automatic telephone dialer using names, including seamless interface with computer-based address book programs, for telephones without private branch exchanges
WO2005011242A1 (en) Annotations addition to documents rendered via text-to-speech conversion over a voice connection
KR20010052414A (ko) 식별 가능한 이름들의 라이브러리를 갖는 자동 어텐던트
CA2058644C (en) Voice activated telephone set
US20020091530A1 (en) Interactive voice response system and method having voice prompts with multiple voices for user guidance
US7470850B2 (en) Interactive voice response method and apparatus
JPH0477044A (ja) オペレータ支援型音声対話装置

Legal Events

Date Code Title Description
N231 Notification of change of applicant
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid