KR19990067916A - 자동 호출 및 데이터 전송 프로세싱 시스템 및 방법 - Google Patents

자동 호출 및 데이터 전송 프로세싱 시스템 및 방법 Download PDF

Info

Publication number
KR19990067916A
KR19990067916A KR1019990000960A KR19990000960A KR19990067916A KR 19990067916 A KR19990067916 A KR 19990067916A KR 1019990000960 A KR1019990000960 A KR 1019990000960A KR 19990000960 A KR19990000960 A KR 19990000960A KR 19990067916 A KR19990067916 A KR 19990067916A
Authority
KR
South Korea
Prior art keywords
call
caller
message
identity
subject
Prior art date
Application number
KR1019990000960A
Other languages
English (en)
Other versions
KR100369696B1 (ko
Inventor
엡스테인마크에드워드
카네브스키디미트리
마에스스테판허만
Original Assignee
포만 제프리 엘
인터내셔널 비지네스 머신즈 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 포만 제프리 엘, 인터내셔널 비지네스 머신즈 코포레이션 filed Critical 포만 제프리 엘
Publication of KR19990067916A publication Critical patent/KR19990067916A/ko
Application granted granted Critical
Publication of KR100369696B1 publication Critical patent/KR100369696B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/436Arrangements for screening incoming calls, i.e. evaluating the characteristics of a call before deciding whether to answer it
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/40Applications of speech amplifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/66Substation equipment, e.g. for use by subscribers with means for preventing unauthorised or fraudulent calling
    • H04M1/663Preventing unauthorised calls to a telephone set
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/527Centralised call answering arrangements not requiring operator intervention
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/5307Centralised arrangements for recording incoming messages, i.e. mailbox systems for recording messages comprising any combination of audio and non-audio components

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Telephonic Communication Services (AREA)
  • Facsimile Transmission Control (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)
  • Exchange Systems With Centralized Control (AREA)

Abstract

호출자 또는 발신자의 신원, 메시지 또는 요구의 주제, 및/또는 일일 시각에 근거하여 인입 전화 호출, 팩시밀리, e-메일을 자동적으로 프로세스하는 프로그램가능한 자동 호출 및 데이터 전송 프로세싱 시스템이 제공되며, 이 시스템은 인입 호출을 자동 응답하고 호출자의 음성 데이터를 수집하는 중앙 서버와, 서버에 접속되어 호출자 또는 발신자를 식별하는 화자 인식 모듈과, 화자 인식 모듈에 응답하여 호출자 또는 발신자의 식별에 근거한 사전프로그래밍된 프로시쥬어에 따라 호출 또는 메시지를 프로세스하는 스위칭 모듈과, 서버, 화자 인식 모듈, 스위칭 모듈을 프로그래밍하는 프로그래밍 인터페이스를 포함한다. 시스템은 호출자 또는 발신자의 신원, 메시지의 주제 및 내용, 일일 시각에 근거하여 인입 전화 호출 또는 e-메일 및 팩시밀리 메시지를 프로세스하도록 사용자에 의해 프로그래밍된다. 이러한 프로세싱은 호출을 다른 시스템으로 스위칭하고, 그 호출을 다른 전화 터미널에 전송하며, 호출을 대기 상태에 두거나, 호출을 접속 해제하는 프로세싱을 포함하나, 이것에 한정되지는 않는다. 본 발명의 다른 관점에서, 시스템은 음성 메일, 팩시밀리/모뎀 또는 e-메일과 같은 다른 원격 통신 디바이스로부터 불러온 정보를 프로세스하는데 사용될 수도 있다. 시스템은 원격 회의에 대한 호출자 또는 가입자의 신원을 태그하고, 이러한 호출자 또는 가입자의 원격 회의(teleconference), 전화 통화, 메시지를 전사(轉寫)(transcribe)할 수 있다. 시스템은 호출자 식별, 또는 통화나 메시지의 주제에 따라 수신된 호출, 메시지, e-메일, 팩시밀리를 자동으로 인덱싱하거나 또는 우선 순위를 부여할 수 있으며, 사용자로 하여금 특정의 소스 또는 호출자로부터 개시된 메시지를 불러오거나, 유사한 또는 특정의 주제를 취급하는 호출을 불러오도록 할 수 있다.

Description

자동 호출 및 데이터 전송 프로세싱 시스템 및 방법{SYSTEM AND METHODS FOR AUTOMATIC CALL AND DATA TRANSFER PROCESSING}
본 발명은 자동 호출 및 데이터 전송 프로세싱을 제공하는 시스템 및 방법에 관한 것으로, 보다 상세하게는 호출자 또는 발신자의 신원, 메시지 또는 요구의 주제 및 내용, 및/또는 이러한 호출 또는 메시지의 일일 시각(time of day)에 근거하여 사전프로그래밍된 프로시쥬어에 따라 자동 호출 및 데이터 전송 프로세싱을 제공하는 시스템 및 방법에 관한 것이다.
통상 과거에는, 호출 프로세싱은 사업주, 비서 또는 지역의 중앙 전화국 서비스에 의해 수동으로 수행되어 왔다. 몇몇 호출 프로세싱 기능을 부분적으로 수행하는 특정의 통상적인 디바이스가 있다. 예를 들면, 통상적인 응답기 및 음성 메일 서비스는 인입 전화 메시지를 기록하며, 이후에 이들은 이러한 디바이스 또는 서비스의 사용자에 의해 재생된다. 또한, 데스크탑 전화 소프트웨어 또는 지역 PBX(구내 교환기)는 전화망 교환 기능을 제공한다. 그러나, 이러한 통상적인 응답기, 음성 메일 서비스 및 스위칭 시스템은 호출자의 신원에 응답하여 개별적인 프로세싱 프로시쥬어를 자동으로 수행하거나 호출 또는 메시지의 내용이나 주제를 평가하고 그에 따라 이러한 호출 또는 메시지를 처리할 수가 없다. 대신에, 사용자는 먼저 사용자 자신의 전화 호출에 수동으로 응답하거나, 또는 응답기나 음성 메일로부터 이러한 호출을 불러내어, 그 다음에 매 호출 마다 하나씩 어떻게 진행해야 할지 결정해야 한다. 본 발명은 이러한 번거로운 수동 프로세싱을 제거하거나 경감시킨다.
또한, 듀얼 톤 다주파(Dual Tone Multi-Frequency:DTMF) 키잉(keying)에 의해 응답기 및 음성 메일 서비스가 보호된다고는 하지만, DTMF 키에 의해 입력되는 유효한 개인 식별 번호(personal identification number:PIN)를 갖는 호출자에 의해 원격으로 액세스되거나 또는 재프로그래밍될 때 호출자를 식별하거나 확인할 수 없다. 또한, 통상적인 원격 회의 센터는 또한 액세스 기능을 위해 DTMF PIN에 의존하지만, 원격 회의 동안 화자의 신원을 확인하고 꼬리표를 붙일(tag) 수 없다. 따라서 이러한 응답기, 음성 메일, 원격 회의 센터는 그렇지 않았으면 유효하였을 PIN에 액세스할 수 있는 허가받지 않은 사람에 의해 침해당할 수도 있다.
따라서 본 발명의 목적은 호출자나 발신자의 신원, 호출이나 메시지의 주제, 및/또는 일일 시각에 근거하여 사전결정된 방식에 따르는 자동 호출 및 데이터 전송 프로세싱을 위한 시스템 및 방법을 제공하는 것이다.
본 발명의 다른 목적은 전화, 팩시밀리, e-메일에 의해 수신된 메시지 뿐만 아니라, 호출 프로세싱 시스템에 의해 전자적으로 수신된 다른 데이터를 먼저 전사(轉寫)(transcribe)하고 나서, 이러한 e-메일 또는 팩시밀리 메시지의 호출자(또는 원격 회의에 대한 가입자) 또는 발신자의 신원을 태그한 다음에, 이들의 기점 및 주제에 따라 이러한 호출, 통화, 메시지를 인덱싱하여, 허가된 사용자가 지역적으로, 또는 원격으로, 시스템을 액세스하여 이러한 전화 통화 또는 메시지를 재생하거나, 합성된 음성 형태의 이러한 e-메일 또는 팩시밀리 메시지를 불러오도록 할 수 있는 호출 프로세싱 시스템을 제공하는 것이다.
본 발명의 또다른 목적은 허가된 사용자에 의해 음성으로 활성화된 커맨드에 응답하며(즉, 액세스가능하고 프로그램가능하며), 사용자가 호출 또는 메시지를 액세스하거나 또는 시스템을 프로그래밍하기 전에 사용자를 식별하고 확인할 수 있는 시스템을 제공하는 것이다.
본 발명의 한 측면에 있어서, 프로그램가능한 자동 호출 및 메시지 프로세싱 시스템은 인입 호출을 수신하는 서버 수단과, 서버 수단에 동작가능하게 접속되어 호출자를 식별하는 화자 인식 수단과, 서버 수단에 동작가능하게 접속되어 호출의 주제 및 내용을 판단하는 음성 인식 수단과, 화자 인식 수단 및 음성 인식 수단에 응답하여, 호출자의 신원 및/또는 호출의 주제에 따라 호출을 프로세싱하는 스위칭 수단과, 서버 수단, 화자 인식 수단, 음성 인식 수단, 스위칭 수단에 동작가능하게 접속되어 시스템이 프로세싱을 수행하도록 프로그래밍하는 프로그래밍 수단을 포함한다.
시스템은 바람직하게 호출자의 신원에 근거하여 사전결정된 방식으로 인입 전화 호출을 프로세스하도록 사용자에 의해 프로그래밍된다. 이러한 프로세싱은 호출을 다른 시스템으로 스위칭하고, 호출을 다른 원격 통신 터미널에 전송하며, 호출을 전사될 응답기로 방향설정하고, 호출을 대기 상태에 두거나, 호출을 접속 해제하는 프로세싱을 포함하나, 이것에 한정되지는 않는다.
본 발명의 다른 측면에서, 시스템은 그 내용이나, 주제에 따라, 또는 수신되는 일일 시각에 따라, 인입 전화 호출, 팩시밀리 또는 e-메일 메시지를 프로세스하도록 사전프로그래밍될 수 있다. 또한, 본 시스템은 바람직하게 이러한 인자의 조합, 즉, 호출자의 신원, 호출의 주제 및 내용, 일일 시각에 따라 인입 전화 호출, 팩시밀리 또는 e-메일을 프로세스하도록 프로그래밍될 수도 있다. 또한, e-메일 메시지(및LOTUS NOTES와 같은 애플리케이션 특정의 소프트웨어에 의해 생성된 다른 메시지)는 무드 스탬프(mood stamps), 즉, 전송자가 메시지의 기밀성 또는 긴급성과 같은 메시지 속성을 표시할 수 있게 하는LOTUS NOTES와 같은 특정의 메일 프로그램에 의해 제공된 정보 필드에 따라 프로세스될 수 있다. 차후의 e-메일 또는 데이터 교환 기법에 대해, 이러한 정보는 e-메일 또는 팩시밀리의 헤더에 포함될 수 있다. 또한, 시스템은 호출자를 프롬프트하여 메시지 속성의 시스템을 명시적으로 전달하도록 프로그래밍될 수 있다. 또한, 본 시스템은 음성 메일 시스템 또는 응답기와 같은 다른 원격 통신 디바이스로부터 데이터를 불러오고 프로세스하도록 구성될 수도 있다.
본 발명의 또다른 측면에서, 본 발명의 호출 프로세싱 시스템은 원격 회의에 대한 호출자 또는 가입자의 신원을 태그하면서, 이러한 호출자나 가입자의 메시지 또는 통화를 전사할 수 있다. 따라서, 본 시스템은 주제, 또는 호출자나 발신자, 또는 이들 모두의 신원에 따라 이러한 호출 또는 메시지를 전송함으로써, 음성 메일, e-메일, 팩시밀리 메시지 뿐만 아니라, 전화 메시지 및 통화를 자동으로 관리할 수 있다. 구체적으로, 본 발명은 이러한 식별 및 트랜스크립션과 조합하여, 기점 및/또는 주제에 따라 수신된 전화 호출 및 e-메일 및 팩시밀리 메시지를 자동으로 인덱싱하거나 또는 우선 순위를 부여하여 허가된 사용자가 특정의 메시지, 예를 들면 유사하거나 또는 특정의 주제를 취급하는 특정의 소스 등으로부터 개시된 메시지를 불러오게 한다.
본 발명의 다른 측면에서, 본 시스템은 시스템이 사용자 또는 호출자를 합성된 음성 형태로 프롬프트(즉, 질의)하게 하여, 사용자 또는 호출자에 의한 합성된 음성으로 질의 또는 요구에 대한 응답을 제공하고 합성된 음성의 e-메일 및 팩시밀리 메시지를 재생하게 하는 텍스트-음성 성능을 포함한다. 본 시스템은 기록된 전화 메시지 및 다른 기록된 오디오 데이터를 재생하기 위한 재생 성능을 또한 포함한다.
도 1은 본 발명에 따른 자동 호출 및 데이터 전송 프로세싱 시스템의 전반적인 기능을 예시하는 블록도.
도 2는 본 발명의 실시예에 따른 호출 및 데이터 전송 프로세싱 시스템용 모듈간의 기능적 상호접속을 예시하는 블록 흐름도.
도 3 및 4는 본 발명에 따른 호출 또는 데이터 전송 프로세싱 방법을 예시하는 흐름도.
도면의 주요 부분에 대한 부호의 설명
10 : 자동 호출 및 데이터 전송 프로세싱 시스템
12 : 사용자14 : 호출자
16 : 접속, 접속 해제, 대기18 : 원격 통신 시스템
20 : 서버22 : 화자 인식기 모듈
24 : ASR/NLU 모듈26 : 언어 식별기/번역기
28 : 스위칭 모듈30 : 식별 태거 모듈
32 : 전사 모듈34 : 인덱서/우선 순위 부여기 모듈
36 : 음성 합성기 모듈38 : 프로그래밍 인터페이스
40 : 레코더42 : 압축/압축 해제 모듈
본 발명의 다른 목적, 특징, 장점은 첨부되는 도면과 함께, 다음의 본 발명의 예시적인 실시예의 상세한 설명으로부터 명배해질 것이다.
도 1을 참조하면, 본 발명의 자동 호출 및 데이터 전송 프로세싱 시스템의 전반적인 기능을 예시하는 블록도가 도시되어 있다. 본 발명은 사용자에 의해 사전결정된 방식으로 인입 전화 호출을 프로세스하도록 허가된 사용자(블록(12))에 의해 프로그래밍될 수 있는 자동 호출 및 데이터 전송 프로세싱 머신에 관한 것이다. 본 발명은 디지탈 또는 아날로그 채널을 통해 수신될 수 있는 임의의 음성 데이터 뿐만 아니라, 전자적으로 수신되고 판독가능한 텍스트로 다른 방식으로 변환가능한 데이터를 프로세스하도록 사용될 수도 있으나, 본 발명의 일 실시예는 전화 통신 프로세싱을 수반한다. 특히, 본 시스템(10)은 호출자(블록(14))로부터의 인입 전화 호출에 자동으로 응답하고, 사용자(블록(12))에 의해 시스템(10)이 프로그래밍된 방식에 따라, 시스템((10)은, 예를 들면 다른 원격 통신 시스템 또는 응답기(블록(18))로 호출을 스위칭하거나, 또는 호출을 직접 처리함으로써, 예를 들면 호출자를 접속하고, 접속 해제하거나 대기 상태에 둠으로써(블록(16)) 프로그래밍된다. 또한, 시스템(10)은 인입 전화 호출을 특정의 순서로 각종 원격 통신 시스템에 라우팅시키거나(예를 들면, 이러한 호출이 응답될 때까지 호출을 몇몇 사전결정된 전화 번호에 보내는 식으로) 또는 이러한 모든 시스템에 동시에 경로지정하도록 프로그래밍될 수 있다. 도 1의 블록(16)에 도시한 옵션 뿐만 아니라, 블록(18)에 리스트된 원격 통신 시스템은 시스템(10)의 수행을 위해 프로그래밍될 수 있는 프로세싱 프로시쥬어의 예에 불과할 뿐 여기에 한정되는 것은 아님에 주의해야 한다.
본 발명의 다른 실시예에서, 시스템(10)은 인입 팩시밀리 및 e-메일 메시지를 프로세스하거나, 또는 e-메일이나 음성 메일 시스템으로부터의 메시지를 자동으로 불러오도록 프로그래밍될 수도 있다. 따라서, 시스템(10)을 블록(18)의 원격 통신(예를 들면, e-메일, 음성 메일, 팩시밀리/모뎀 및 응답기)에 접속하는 도 1의 양방향성 라인은 시스템(10)이 데이터(예를 들면, 호출 또는 메시지)를 이러한 시스템에 전송하고, 이러한 시스템에 저장되거나 기록된 데이터를 불러오여 프로세스하도록 설계되어 있음을 나타낸다는 것을 알아야 한다. 예를 들면, 시스템(10)은 기록될 응답기(블록(18))에 호출을 보냄으로써 특정의 호출을 프로세스하도록 프로그래밍될 수 있다. 이후 시스템(10)은 기록된 메시지를 응답기로부터 불러내며, 기록된 메시지는 그 시스템(10)에 의해 특정의 방식으로 디코딩되고 프로세스된다. 또한, 시스템(10)은 인입 전화 호출 또는 메시지를, 사용자의 페이저, 셀룰라폰 또는 e-메일로 전송될 수 있는 페이지로 변환하도록 프로그래밍될 수 있다.
본 발명의 실시예에 따른 시스템(10)의 기능 모듈 및 이들의 특정한 상호작용은 이하 도 2를 참조하여 설명될 것이다. 도면에서 동일하거나 유사한 구성요소는 동일한 참조 부호로 지정되어 있음에 유의해야 한다. 또한 본 발명에 따라 본 명세서에서 기술된 기능적인 모듈은 하드웨어, 소프트웨어, 또는 그의 조합으로 구현될 수 있음에 유의해야 한다. 바람직하게, 본 발명의 주요한 음성 및 화자 인식, 언어 식별 모듈, 인덱싱 모듈은, 예를 들어 본 발명의 구성요소를 실행하는 프로세서, 연관 메모리, 입/출력 인터페이스를 각각 갖는 하나 이상의 적절하게 프로그래밍된 범용 디지탈 컴퓨터 또는 컴퓨터들상에서 소프트웨어로 구현된다. 본 발명은 적절하게 프로그래밍된 범용 컴퓨터 또는 컴퓨터들상에서 구현되는 한편, 도 2의 기능적 요소는 본 발명을 실행하는 적절하고 바람직한 프로세서 아키텍처를 포함하는 것으로 간주될 수 있으며 이러한 컴퓨터 또는 컴퓨터들내에서 프로그래밍을 통해 구현될 수 있는 예시적인 기능적 구성요소임에 유의해야 한다. 또한, 도 2의 기능적인 구성요소는 하나 이상의 범용 마이크로프로세서를 프로그래밍함으로써 구현될 수 있다. 물론, 본 발명을 구현하기 위해 특수용 마이크로프로세서가 사용될 수도 있다. 본 명세서에 제공된 본 발명의 개시에 따라, 당업자라면 본 발명의 구성요소의 구현 및 이와 유사한 구현을 생각할 수 있을 것이다.
도 2를 참조하면, 시스템(10)은 바람직하게 각종 원격 통신 시스템에 접속된 서버(20)를 포함하며, 이 원격 통신 시스템은 전화 호출 및 메시지 데이터를 각각 수신하고 송신하는 하나 이상의 전화선(블록(14)), 하나 이상의 팩시밀리 및 모뎀선(도 1 및 도 2에서 블록(18))을 포함하나, 이들에만 한정되지는 않는다. 서버(20)는 인입 전화 호출에 자동 응답하고 인입 팩시밀리 통신을 수신하도록 프로그래밍된다. 시스템(10)은 국부적 네트워크 메일 서버를 액세스하는 영구적인 인터넷/인트라넷 접속을 또한 포함하며, 이에 의해 서버(20)는 이러한 국부적 네트워크 메일 서버에 (TCP/IP를 통해) 주기적으로 접속하여 인입 e-메일을 수신하고 프로세스하며, e-메일 메시지를 송신하도록 프로그래밍될 수 있다. 이와 달리, 시스템(10)이 국부적 네트워크 서버에 영구적으로 접속되지 않으면, 시스템 서버(20)는 e-메일 메시지를 불러오거나 전송하기 위해 인터넷 제공자에 대해 액세스 번호를 주기적으로 다이얼링하도록 프로그래밍될 수 있다. 이러한 프로시쥬어는 사용자가 시스템(10)을 액세스할 때 (이러한 e-메일 계정을 자동으로 모니터링하는 것과는 달리) 사용자의 옵션으로 또한 수행될 수도 있다.
또한, 도 1 및 도 2(블록(18))에 도시한 바와 같이, 서버(20)는 사용자가 이러한 음성 메일 및 응답기 시스템상에 기록된 메시지를 불러와서 프로세스하도록 음성 메일 시스템 및 응답기에 직접 접속될 수 있다. 국부적 네트워크 시스템에 시스템(10)이 접속되는 경우, 서버(20)는 그 서버(20)에 직접 접속되지는 않으나, 국부적 네트워크를 통해 다른 방식으로 액세스가능한 다른 음성 메일 시스템 또는 응답기로부터의 메시지를 주기적으로 불러오도록 프로그래밍될 수 있으며, 이에 따라 시스템(10)은 이러한 음성 메일 시스템 또는 응답기로부터의 메시지를 자동으로 모니터링하고 불러올 수 있다.
서버(20)는 바람직하게 디지탈 형태인 오디오 데이터(예를 들면, 음성 메일 또는 응답기로부터 불러온 인입 전화 호출 또는 메시지)를 기록하고 저장하는 레코더(40)를 포함한다. 또한, 서버(20)는 바람직하게 시스템(10) 메모리(도시되지 않음)의 데이터 저장 기능을 증대시키기 위해, 디지탈화된 오디오 데이터 뿐만 아니라, e-메일 및 팩시밀리를 통해 수신된 메시지 데이터를 압축하고, 이러한 데이터가 메모리로부터 불러올 때 재구성 전에 이러한 데이터를 압축 해제하는 압축/압축 해제 모듈(42)을 포함한다.
서버(20)에는 화자 인식기 모듈(22) 및 자동 음성 인식/자연어 이해(ASR/NLU) 모듈(24)이 동작가능하게 접속된다. 화자 인식기 모듈(22)은 서버(20)에 의해 수신된 음성 데이터로부터의 원격 회의 호출에 대한 호출자(14) 및 가입자의 신원 뿐만 아니라, 수신된 팩시밀리 또는 e-메일 메시지의 발신자의 신원을 판단한다. ASR/NLU 모듈(24)은 서버(20)로부터 수신된 음성 데이터 및 다른 메시지 데이터를 판독가능한 텍스트로 변환하여 이러한 호출, 통화 또는 메시지의 내용 및 주제를 판단한다. 또한, 이하 더 설명되는 바와 같이, ASR/NLU 모듈(24)은 허가된 사용자로부터 구두(verbal) 커맨드를 프로세스하여, 시스템(10)을 원격으로 프로그래밍할 뿐만 아니라, 메시지를 생성하거나 불러온다. ASR/NLU 모듈(24)은 호출자 및 허가된 사용자로부터의 음성 데이터를 또한 프로세스하여 대화형 음성 응답(interactive voice response:IVR) 기능을 수행한다. 언어 식별자/해석기 모듈(26)은 ASR/NLU 모듈(24)에 동작가능하게 접속되어 있으며, 시스템(10)이 예를 들어 캐나다와 같은 다언어 국가에서 사용될 때 외국어 메시지를 이해하고 적절하게 응답할 수 있도록 한다.
스위칭 모듈(28)은 화자 인식기 모듈(22) 및 ASR/NLU 모듈(24)에 동작가능하게 접속되어 있으며, 화자 인식기 모듈(22) 및/또는 ASR/NLU 모듈(24)에 의해 수신된 데이터를 프로세스한다. 스위칭 모듈은 사전프로그래밍된 프로시쥬어에 따라 인입 전화 호출 또는 팩시밀리나 e-메일 메시지에 대한 프로세싱 프로시쥬어를 수행(예를 들어, 음성 메일이나 응답기로 호출을 보내는 등)한다.
식별(ID) 태거(tagger) 모듈(30)은 화자 인식기 모듈(22)에 동작가능하게 접속되어 있으며, 호출자의 메시지 또는 통화에 대해 호출자의 신원을 전자적으로 태그하거나 또는 e-메일이나 팩시밀리 메시지의 발신자의 신원을 태그한다. 또한, 원격 회의의 배경으로 동작하는 경우, ID 태거(30)는 현재 말하고 있는 사람의 신원을 태그할 것이다. 전사 모듈(32)은 ASR/NLU 모듈(24)에 동작가능하게 접속되어 있으며, 전화 메시지 또는 통화, 원격 회의 및/또는 팩시밀리 메시지를 전사한다. 또한, 전사 모듈(32)은 사용자에 의해 다이얼링된 구두 메시지를 전사할 수 있으며, 이는 계속해서 시스템(10)에 의해 전화, 팩시밀리 또는 e-메일을 통해 전송될 수 있다.
오디오 인덱서/우선 순위 부여기(indexer/prioritizer) 모듈(34)은 ID 태거 모듈(30) 및 전사 모듈(32)에 동작가능하게 접속된다. 오디오 인덱서/우선 순위 부여기 모듈(34)은 전사 모듈(32) 및 ID 태거 모듈(30)에 의해 각각 프로세스되는 트랜스크립션 데이터 및 호출자 식별 데이터 뿐만 아니라, 호출 시간, (이용가능하다면 자동 번호 식별(antomatic number identification: ANI)을 통한) 개시 전화 번호, e-메일 어드레스를 사전프로그래밍된 방식으로 저장하여, 사용자가 특정 당사자로부터의 특정의 호출이나 메시지, 또는 특정 주제에 관한 호출이나 메시지를 불러오게 한다. 또한, 오디오 인덱서/우선 순위 부여기는 특정의 호출 또는 메시지에 우선 순위를 부여하고 사용자에게 이러한 호출 또는 메시지를 통지하도록 프로그래밍될 수 있다.
음성 합성기 모듈(36)은 오디오 인덱서/우선 순위 부여기 모듈(34)에 동작가능하게 접속되어 있으며, 사용자가 오디오 형태(즉, 합성된 음성)의 메시지(e-메일 또는 팩시밀리)를 불러올 수 있도록 한다. 음성 합성기는 또한 ASR/NLU 모듈에 동작가능하게 접속되어 (예를 들면, 컴퓨터 모니터상에 디스플레이되는 것과는 달리) 합성된 음성 형태의 시스템 프롬프트(즉, 질의)를 제공한다.
프로그래밍 인터페이스(38)는 서버(20), 화자 인식기 모듈(22), 언어 식별기/번역기 모듈(26), ASR/NLU 모듈(24), 오디오 인덱서/우선 순위 부여기 모듈(34), 스위칭 모듈(28)에 동작가능하게 접속되어, 사전결정된 프로시쥬어에 따라 시스템(10)이 호출 및 메시지를 프로세스하도록 프로그래밍한다. 이하 보다 상세하게 설명되는 바와 같이, 사용자는 음성 커맨드나 GUI(그래픽 사용자 인터페이스), 또는 두 가지 모두를 통해 프로그래밍 인터페이스(38)를 이용하여 시스템(10)을 프로그래밍할 수 있다. 바람직한 실시예에서, 시스템(10)은 사용자(즉, 음성 커맨드 모드)로부터의 구두 커맨드에 의해 프로그래밍된다. 구체적으로, 사용자는 시스템(10)내로 호출함으로써 원격으로, 또는 마이크로폰에 의해 국부적으로, 구두 커맨드에 의해 시스템(10)을 프로그래밍할 수 있다. 프로그래밍 인터페이스(38)는 서버(20)에 접속되며, 서버(20)는 화자 인식기 모듈(22) 및 ASR/NLU 모듈(24)과 함께 사용자의 구두 프로그래밍 커맨드를 프로세스하기 전에 사용자의 신원을 확인한다. 시스템(10)은 구두 프로그래밍 커맨드에 관한 정보 뿐만 아니라, 시스템(10)의 현재의 프로그래밍 구조를 (GUI를 통해) 디스플레이하거나 또는 (음성 합성기(36)를 통해) 재생할 수 있다.
다른 실시예에서, 시스템(10)은 PC 및 GUI 스크린을 통해 국부적으로 프로그래밍되거나, 또는 원격 위치로부터 컴퓨터 네트워크를 통해 시스템(10)을 액세스함으로써 원격으로 프로그래밍될 수 있다. 통상적인 윈도우 인터페이스와 유사하게, 사용자는 GUI상에 디스플레이될 수 있는 특정의 필드를 선택함으로써 시스템(10)을 프로그래밍할 수 있다. 음성 커맨드 및 GUI의 조합을 통해 시스템(10)이 프로그래밍될 수도 있음이 이해될 것이다. 이러한 상황에서, GUI는, 예를 들면 시스템(10)을 프로그래밍하기 위해 필수적인 음성 커맨드를 제공함에 있어 사용자에 도움을 제공할 수 있다. 또한, 시스템(10)은 도 2의 기능적 모듈을 제어하는 대응하는 프로그래밍 구성 화일을 편집함으로서 프로그래밍될 수 있다.
이제 도 2, 3, 4를 참조하여 본 발명의 동작이 기술될 것이다. 도 2에서 본 발명의 설명은 본 발명의 동작을 예시하는 흐름도 뿐만 아니라, 본 발명의 실시예를 도시하는 블록도로서 간주될 수 있음이 이해될 것이다. 서버(20)는 인입 전화 호출, e-메일, 팩시밀리/모뎀, 또는 다른 전자 음성 또는 메시지 데이터에 자동으로 응답하도록 프로그래밍된다(단계 100). 서버(20)는 소스를 표시하는 각 메시지의 앞 부분에 있는 특수 코드, 즉 프로토콜에 의해 인입 전화 호출, e-메일 메시지, 팩시밀리 메시지 등을 구별한다. 특히, 서버(20)는 먼저 인입 호출이 전화 통신인 것으로 가정한다. 따라서 서버(20)가 예를 들어 모뎀 핸드쉐이크(handshake) 신호를 수신함에 의해 시스템(10)이 호출을 컴퓨터 접속 프로토콜로서 처리하지 않을 경우에는, 서버는 이에 따라 그대로 진행할 것이다(단계 110). 시스템(10)은 다른 계정으로부터 음성 메일 및 e-메일 메시지를 주기적으로 호출하고 불러옴으로써 이러한 음성 메일 및 e-메일 계정을 모니터링하도록 프로그래밍될 수 있음을 이해해야 한다.
서버(20)에 의해 수신된 인입 호출이 전화 호출인 것으로 판단되면, 레코더(40)에 의해 오디오 데이터(예를 들면, 인입 호출 뿐만 아니라 음성 메일 또는 응답기로부터 불러온 호출)가 기록된다(단계 112). 레코더(40)는 아날로그 레코더 또는 디지탈 오디오 테이프("DAT")와 같은 임의의 통상적인 디바이스일 수 있다. 바람직하게, 레코더(40)는 디지탈 레코더, 즉 오디오 데이터를 디지탈 데이터로 변환하는 아날로그-디지탈 변환기이다. 디지탈화된 오디오 데이터는 메모리(도 2에 도시되지 않음)에 저장(단계 116)되기 전에 압축/압축 해제 모듈(42)에 위해 압축될 수 있다(단계 114). 1989년 에스. 푸루이 데커(S. Furui, Dekker)에 의한 "Digital Signal Processing, Synthesis and Recognition"에 개시된 알고리즘과 같은 임의의 통상적인 알고리즘이 사용되어 압축/압축 해제 모듈(42)에 의해 메시지 데이터를 프로세스 할 수 있음이 이해될 것이다.
다음에, 오디오 데이터를 기록하고 저장함과 동시에, 시스템(10)에 의한 질의에 대한 호출자의 오디오 통신 및/또는 오디오 응답을 프로세스함으로써 호출자의 신원이 판단된다. 구체적으로, 서버(20)에 이해 호출자의 구두 명령문 및 응답이 수신되고 화자 인식기 모듈(22)로 송신되며, 이러한 구두 명령문 및 응답이 프로세스되어 이전에 저장된 화자 모델과 비교된다(단계 120). 이러한 화자의 이전에 저장된 음성 모델과 수신된 음성 데이터를 매칭(match)시킴으로써 화자가 식별된(단계 130) 경우, 또한 시스템(10)이 호출자의 신원에 근거하여 호출을 프로세스하도록 사전프로그래밍되는 경우, 시스템(10)은 이러한 사전프로그래밍된 프로시쥬어에 따라 전화 호출을 프로세스할 것이다(단계 152).
한편, 화자(예를 들어, 제 1 시간 호출자)가 이전에 저장된 음성 모델을 통해 식별될 수 없는 경우, 화자 식별은 화자 인식기 모듈(22) 및 ASR/NLU 모듈(26)에 의해 수행될 수 있으며, 이에 의해 ASR/NLU 모듈(26)에 의해 전화 메시지의 내용이 호출자의 이름을 추출하도록 프로세스되며, 호출자의 이름은 호출자의 신원을 판단하기 위해 이전에 저장된 명칭과 비교된다(단계 140). 호출자의 신원이 판단되면, 시스템(10)은 호출자의 신원에 따라 전화 호출을 프로세스할 것이다(단계 152).
시스템(10)이 저장된 음성 모델 전화 메시지의 또는 내용으로부터 호출자를 식별할 수 없는 경우, 화자 인식기 모듈(22)은 서버(20)에 신호를 전송하고, 이어서 서버는 호출자를 프롬프트(prompt)하여 예를 들면, "당신은 누구입니까"와 같은 질의를 통해 자기 자신의 신원을 밝히도록 하고(단계 150), 상기 식별 프로세스가 반복된다(단계 120). 서버(20)는 음성 합성기 모듈(36)로부터 합성된 음성으로 질의를 획득한다. 상기한 바와 같이, 시스템(10)은 먼저 호출자를 프롬프트하여 자기 자신의 신원을 밝히도록 하거나 또는 호출 이유에 관한 세부 사항을 질의하도록 프로그래밍될 수 있다.
일단 화자 인식기 모듈(22)에 의해 호출자 또는 발신자의 신원이 확인되었으면, 화자 인식기 모듈(22)에 의해 스위칭 모듈(28)로 신호가 전송된다. 이에 의해 스위칭 모듈(28)은 사전프로그래밍된 프로시쥬어에 따라 호출자 또는 발신자의 신원에 근거하여 호출 또는 메시지를 프로세스한다(단계 152). 한편, 호출자의 신원이 끝까지 확인되지 않는 경우, 시스템(10)은 미지 호출자에 근거하여 호출을 프로세스하도록(단계 154), 예를 들면 호출을 음성 메일에 전송하도록 프로그래밍될 수 있다. 이러한 프로그래밍은 이하 좀 더 설명할 것이지만, 프로그래밍 인터페이스 모듈(38)을 통해 사용자(12)에 의해 수행된다. 상기한 바와 같이, 시스템이 수행되도록 프로그래밍될 수 있는 프로세싱 옵션은 호출을 다른 시스템으로 스위칭하고, 호출을 다른 원격 통신 터미널(도 1 및 도 2의 블록(18))로 보내거나, 또는 호출을 특정의 당사자에게 접속시키거나, 접속 해제하거나, 호출을 대기 상태(도 1 및 도 2의 블록(16))에 둠으로써 호출을 직접 처리하는 것 등을 포함할 수 있으나, 이들에만 한정되지는 않는다.
사용자 옵션으로부터 제거되지 않은 경우에는, 새로운 호출자가 처음으로 시스템(10)과 상호작용할 때마다, 화자 모델이 구축되어 화자 인식기 모듈(22)에 저장된다. 이 모델은 호출자가 차후에 시스템(10)과 상호작용할 때, 식별 및 확인의 목적으로 화자 인식기 모듈(22)에 의해 사용된다.
필요한 음성 모델이 존재하지 않을 때 시스템(10)은 음향 특성 이외의 방법을 이용함으로써 화자 식별을 수행할 수 있음에 유의해야 한다. 예를 들어, 전화 호출에 대해, 시스템(10)은 시스템(10)의 정확도를 증대시키고/시키거나 초면(初面) 호출자의 신원을 확인하는데 추가적 정보(예를 들어, 호출자 ID)를 이용할 수 있다.
이하 더 설명되는 바와 같이, 시스템(10)은 모든 호출자(또는 지정된 호출자)의 이름 및 발신 전화 번호를 저장하도록 프로그래밍될 수 있다. 이러한 기능으로 인해 사용자는 응답 메시지를 호출자에게 자동으로 전송할 뿐만 아니라, 메시지를 특정인에게 전송하기 위해 사용자에 의해 이후 액세스될 수 있는 어드레스 북(address book)(시스템(10)에 저장됨)을 동적으로 생성한다.
애플리케이션에 따라, 시스템(10)이 모든 경우에 실시간으로(즉, 기록과 동시에 또한 실제 전화 호출의 시간 주기 동안) 화자 인식 및 자연어 이해를 수행해야 할 필요가 없음에 유의해야 한다. 예를 들어, 시스템(10)은 호출 개시시에 (IVR 프로그래밍을 통해) 호출자에게 질의하여 관련 정보(즉, 이름 및 호출 이유)를 획득하고 이러한 정보를 저장하도록 프로그래밍될 수 있다. 메모리로부터 저장된 오디오 데이터를 불러옴으로써 호출 이후에 신원 확인 프로세스가 (도 3에서 점선으로 도시한 바와 같이) 화자 인식기 모듈(22) 또는 ASR/NLU 모듈(24)에 의해 수행될 수 있다(단계 118).
호출자의 신원을 확인하기 위해 화자 인식기 모듈(22)에 의해 어떠한 유형의 화자 인식 시스템이라도 사용될 수 있음은 물론이다. 바람직하게, 본 발명에 따라 사용된 화자 인식 시스템은 이하 전 범위에서 참조 자료로 인용되는 "Apparatus And Methods For Speaker Verification / Identification / Classification Employing Non-Acoustic And/Or Acoustic Models and Databases,"이란 명칭으로 1997년 6월 11일에 출원된 미국 특허 출원 제 08/871,784 호에 개시된 바와 같은 시스템이다. 이 시스템은 텍스트 독립형 화자 확인을 수행하고 임의의 질의, 즉 음성 인식, 텍스트 독립형 화자 인식, 자연어 이해를 조합하여 질의하는 시스템이다. 보다 상세하게는, 텍스트 독립형 화자 확인 시스템은 바람직하게 이하 전 범위에서 참조 자료로 인용되는 "Text Independent Speaker Recognition for Transparent Command Ambiguity Resolution And Continuous Access Control,"이란 명칭으로 1997년 1월 28일에 출원된 미국 특허 출원 제 08/788,471 호에 상세하게 개시된 바와 같이 매 프레임별 특성 분류에 근거한다.
앞서 참조 인용된 미국 특허 제 08/871,784 호에 설명된 바와 같이, 텍스트 독립형 화자 인식은 텍스트 의존형 또는 텍스트 프롬프트형(text-prompted) 화자 인식에 비해 바람직한데, 그 이유는 텍스트 독립성에 의하면 새로운 호출자가 나타날 때마다 새로운 커맨드 또는 새로운 호출자의 신원을 확인하느라 중단될 필요없이 호출자에 대해 투명한 방식으로 화자 인식 기능이 다른 음성 인식 기반 기능과 병렬적으로 수행할 수 있기 때문이다.
다음에, 도 4를 참조하면, (또한 시스템(10)이 호출자 또는 발신자의 신원에 근거하여 호출을 프로세스하도록 프로그래밍된다고 가정하면), 인입 호출이 팩시밀리 또는 e-메일 메시지라고 판단되는 경우, 메시지 데이터(예를 들면, e-메일 계정으로부터 불러온 인입 e-메일 또는 메시지)는 ASR/NLU 모듈(24)에 의해 프로세스되고(단계 190), 압축되며(단계 192), 메모리(도시되지 않음)에 저장된다(단계 194). e-메일 메시지에 대해, (이러한 데이터는 이미 텍스트 포맷이므로) 데이터가 직접 프로세스된다. 팩시밀리 메시지에 대해, ASR/NLU 모듈(24)은 알려진 기법을 이용하여 광학적 문자 인식(OCR)을 사용하여 수신 팩시밀리 메시지를 판독가능한 텍스트로 변환한다(즉, 팩시밀리 메시지를 ASCII 화일로 전사한다).
다음에, 인입 메시지 데이터를 전사하고 저장함과 동시에, 이러한 메시지의 발신자의 신원이 ASR/NLU 모듈(24)을 통해 판단될 수 있다. 이에 의해 인입 메시지의 내용이 분석되어(단계 200) 메시지의 발신자의 이름 및 소스가 추출되며, 이것이 이후 미리 저장된 이름과 비교되어 발신자의 신원을 판단한다(단계 210). 발신자의 신원이 확인되면(단계 210), 메시지가 발신자의 신원에 근거하여 사전프로그래밍된 프로시쥬어에 따라 프로세스될 수 있다(단계 222). 한편, 발신자의 신원이 식별될 수 없으면, 미확인 발신자에 대한 사전프로그래밍된 프로시쥬어에 따라 메시지가 프로세스될 수 있다(단계 224).
상술한 바와 같이, 시스템(10)은 인입 또는 불러온 메시지를 모든 경우 실시간으로(즉, 실질적인 메시지를 전사함과 동시에) 프로세스할 필요는 없음은 물론이다. 프로세싱은 (도 4에 점선으로 도시된 바와 같이) 메모리로부터 전사된 메시지 데이터를 불러옴으로써(단계 196), e-메일 또는 팩시밀리 메시지 데이터를 수신한 이후에 ASR/NLU 모듈(24)에 의해 수행될 수 있다.
호출자 또는 발신자의 신원 이외에, 시스템(10)은 호출이나 메시지의 내용과 주제 및/또는 이러한 호출 또는 메시지가 수신된 일일 시각에 근거하여 인입 전화 호출 또는 팩시밀리나 e-메일 메시지를 프로세스하도록 사용자(12)에 의해 또한 프로그래밍될 수 있다. 도 2, 3, 4를 다시 참조하면, 인입 전화 호출 또는 e-메일이나 팩시밀리 메시지를 수신한 후에, 또는 응답기 또는 음성 메일로부터 기록된 메시지를 불러온 후에, 서버(20)는 호출 또는 메시지 데이터를 ASR/NLU 모듈(24)로 전송한다. 음성 데이터(예를 들면, 음성 메일 또는 응답기로부터 불러온 전화 호출 또는 메시지)의 경우, ASR/NLU 모듈(24)은 이러한 데이터를 기호 언어 또는 판독가능한 텍스트로 변환한다. 상술한 바와 같이, (e-메일 메시지는 판독가능한 텍스트 포맷으로 되어 있으므로) e-메일 메시지는 직접 프로세스되고 팩시밀리 메시지는 알려진 광학적 문자 인식(OCR) 방법을 이용하여 ASR/NLU 모듈(24)을 통해 판독가능한 텍스트(즉, ASCII 화일)로 변환된다. ASR/NLU 모듈(24)은 특정 키워드나 토픽을 추출하기 위한 음성 인식과 자연어 이해의 조합을 이용함으로써 호출 또는 메시지 데이터를 분석하여 호출(도 3에서 전화 호출에 대한 단계 160)이나 메시지(도 4에서 e-메일 및 팩시밀리에 대한 단계 200)의 주제 및 내용을 판단한다.
일단 ASR/NLU 모듈이 호출(도 3의 단계 170) 또는 메시지(도 4의 단계 220)의 주제를 판단하면, 신호는 ASR/NLU 모듈(24)로부터 스위칭 모듈(28)로 전송되며, 호출이나 메시지는 호출의 주제 및 내용(도 3의 단계 158) 및 메시지의 내용(도 4의 단계 228)에 근거한 사전결정된 방식으로 프로세스된다. 예를 들어, 메시지나 호출이 비상 사태나 사고에 관한 것인 경우, 스위칭 모듈(28)은 호출을 특정의 개인에게 전송하도록 프로그래밍될 수 있다.
ASR/NLU 모듈(24)이 전화 호출의 주제나 내용을 판단할 수 업슨 경우, ASR/NLU 모듈(24)은 음성 합성기(36)에 신호를 전송하고, 이어서 서버(20)에 메시지를 전송하여, 호출자를 프롬프트하여 호출의 이유를 몇 개의 워드로, 예를 들면 "당신의 호출 이유가 무엇입니까?"와 같이 명확히 발음하게 한다. 또한, 시스템(10)은 초기에 호출자를 프롬프트하여 호출 이유를 말하도록 프로그래밍될 수 있음에 유의해야 한다. 시스템(10)이 이러한 호출의 주제를 여전히 판단할 수 없는 경우, 미지의 주제에 근거한 사전프로그래밍된 프로시쥬어에 따라 프로세스될 수 있다. 마찬가지로, e-메일 또는 팩시밀리 메시지의 주제가 판단될 수 없는 경우(단계 220), 메시지는 미지의 주제에 근거한 사전프로그래밍된 프로시쥬어에 따라 프로세스될 수 있다(단계 226).
또한, 인입 호출 또는 e-메일 메시지가 시스템(10)에 생소한(즉, 사용자에게 생소한) 언어로 되어 있는 경우, ASR/NLU 모듈(24)은 언어 식별기/번역기 모듈(26)을 시그널링하여 호출이나 메시지의 특정의 언어를 식별하고 나서, 필요로 하는 번역을 ASR/NLU 모듈(24)에 제공함에 따라 시스템(10)이 호출을 이해하고 호출자를 적절한 언어로 응답하게 한다. 시스템(10)은 특정의 방식으로 미지의 언어에 의해 호출이나 메시지를 프로세스하도록 또한 사전프로그래밍될 수 있음에 유의해야 한다.
본 발명에서는, 히에로니머스 제이.(Hieronymus J.) 및 카담베 에스.(Kadambe S.)에 의한 논문 "Robust Spoken Language Identification-using Large Vocabulary Speech Recognition," Proceeding of ICASSP 97, Vol. 2 pp. 1111,에 개시된 바와 같은 잘 알려진 기계어 식별 기법, 및 허친스(Hutchins) 및 소머즈(Somers)(1992)에 의한 "An Introduction to Machine Translation," Academic Press, London; (encyclopedic overview)에 개시된 언어 번역 기법과 같은 언어 식별 및 번역을 위한 임의의 통상적인 기법이 사용될 수 있음에 유의해야 한다.
상기한 참조 문헌 이외에, 몇가지 통계적인 방법을 이용하여 언어 식별이 수행될 수 있다. 먼저, 시스템(10)이 소수의 상이한 언어(예를 들어, 본질적으로 영어 또는 불어만이 통용되는 캐나다에서)를 프로세스하도록 구성되는 경우, 시스템(10)은 (상이한 ASR 시스템을 이용하여) 입력 텍스트를 각각의 상이한 언어로 디코딩할 수 있다. 통계적인 패턴(즉, 각각의 스크립트가 분석되는 디코딩된 워드의 통계적인 분포)을 찾기 위해 몇몇 디코딩된 스크립트가 분석된다. 디코딩이 잘못된 언어로 수행되는 경우, 디코딩된 스크립트의 혼란이 매우 커질 수 있고, 그 특정의 언어는 고려 범위로부터 배제될 수 있다.
다음에, 음성(phonetic) 레벨에 대해 언어 식별이 수행될 수 있으며 시스템은 (보편적인 음성 시스템이나 상이한 언어용의 몇몇 시스템을 이용하여) 음소 세트를 인식한다. 그 다음에 시스템은 각각의 언어에 대해 디코딩된 음성 시퀀스의 빈도를 측정한다. 특정의 디코딩된 시퀀스가 통상적이지 않은 경우, 시스템은 이러한 언어를 고려 범위로부터 배제할 수 있다. 특정의 언어에 전형적인 몇가지 시퀀스가 또한 존재할 수 있다. 이러한 인수를 이용하여, 시스템은 가장 유력한 언어를 식별할 것이다.
본 발명은 언어 식별을 수행하기 위해 호출자의 신원을 이용할 수 있음에 유의해야 한다. 구체적으로, 특정의 호출자의 화자 프로파일(시스템(10)에 저장됨)이, 호출자가 특정의 언어로 말하는 것을 표시하면, 이러한 정보는 언어를 식별하는데 있어서의 인자가 될 수 있다. 반대로, 시스템(10)이 상기한 임의의 방법을 이용하여 특정의 언어를 식별하는 경우, 시스템(10)은 화자가 이러한 식별된 언어를 사용하는지를 판단하도록 화자 프로파일을 탐색함으로써 호출자의 신원을 판단할 수 있다.
서버(20)로부터 수신된 데이터를 프로세스하기 위해 ASR/NLU 모듈(24)에 의해 음성 인식 및 자연어 이해가 이용될 수 있음에 유의해야 한다. 본 발명은 바람직하게 1997년 5월 20일에 출원된 "A Statistical Translation System with Features Based on Phrases or Groups of Words,"이란 명칭의 미국 특허 제 08/859,586 호 및 1996년 1월 29일에 출원된 "Statistical Natural Language Understanding Using Hidden Clumpings,"이란 명칭의 미국 특허 제 08/593,032 호에 개시된 자연어 이해 기법을 사용하며, 이들 특허들은 이하 전 범위에서 참조 자료로 인용된다. 앞서 인용된 발명은 (특정의 알고리즘을 이용하여) 텍스트 입력을 시스템(10)에 의해 이해되고 프로세스될 수 있는 언어로 변수화(즉, 변환)하는 자연어 이해 기법에 관한 것이다. 예를 들어, 본 발명의 문맥에서, ASR/NLU 모듈(24)의 ASR 성분은 이러한 모듈의 NLU 성분에 "Bob으로부터의 첫번째 메시지를 재생하시오."와 같은 비제한 텍스트 입력을 제공한다. 이러한 텍스트는 ASR/NLU 모듈(24)의 NLU 성분에 의해 "검색-메시지(전송자=Bob, 메시지-번호=1)"로 변환될 수 있다. 이러한 변수화된 동작은 시스템(10)에 의해 이해되고 작용될 수 있다.
본 발명에서는, 제펜필드 등(Zeppenfield et al.)에 의한 "Recognition of Conversational Telephone Speech Using The Janus Speech Engine,", Proceedings of ICASSP 97, Vol. 3, pp. 1815 1997;이란 명칭의 논문에 개시된 공지된 자동 음성 인식 기능 및 케이. 쉬라이(K. Shirai) 및 에스. 푸루이(S. Furui)의 "Special Issue on Spoken Dialog," 15, (3-4) Speech Communication, 1994이란 명칭의 논문에 개시된 공지된 자연어 이해 기능이 또한 사용될 수 있다. 또한, ASR/NLU 모듈(24)의 프로그래밍을 간략화하기 위해, 친-후이 리(Chin-Hui Lee), 프랭크 케이. 숭(Frank K. Soong), 쿨딥 케이. 파이와이(Kuldip K. Paiwai)(후워 아카데믹(Huwer Academic) 발행자)에 의해 편집된 "Word Spotting from Continuous Speech Utterances,", 리차드 씨. 크로스(Richard C. Cross), Automatic Speech and Speaker Recognition, Advanced Topics, pp. 303-327, 1996에 개시된 바와 같은 키워드 스포팅(keyword spotting) 기반 인식 방법이 이용되어 특정의 중요한 메시지가 충분히 처리될 수 있음을 보장할 수 있다.
상술한 바와 같이, 자연어 이해를 이용함으로써, 시스템(10)은 사용자 또는 호출자와의 다이얼로그를 설정하도록 대화형 음성 응답(IVR) 기능을 수행하여 다이얼로그 관리 및 요구 이해를 제공할 수 있음이 이해될 것이다. 이로 인해 시스템(10)이 순서 취입(order taking) 및 다이얼로그 기반 폼 필링(dialog-based form filling)을 위해 이용될 수 있게 된다. 또한, 이러한 기능은 호출자가 호출을 프로세스하는 방법, 즉 e-메일 또는 음성 메일 메시지를 남기거나, 페이지를 전송하거나, 또는 호출을 다른 전화 번호에 전송하는 등의 방법을 결정하게 한다. 또한, 이하 설명되는 바와 같이, 이것은 시스템(10)이 음성 커맨드를 통해 사용자에 의해 원격으로 프로그래밍되게 한다.
시스템(10)은 그 시스템(10)에 허가가 부여되지 않은 액세스에 대한 보안성을 제공함이 또한 이해될 것이다. 특히, 사용자가 시스템(10)에 대해 액세스하고 관여하기 위해, 사용자는 시스템의 등록(enrollment) 프로세스를 진행해야 한다. 이러한 프로세스는 다양한 방식으로 실행될 수 있다. 예를 들어, 등록은 새로운 사용자를 호출하거나 또는 이전에 송출된 개인 식별 번호(PIN)를 입력함으로써 원격으로 수행될 수 있으며, 이에 의해 서버(20)는 새로운 사용자의 전화상에서 DTMF 키를 통해 시스템(10)내로 입력되는 PIN에 응답하도록 프로그래밍될 수 있다. 시스템(10)은 차후에 사용자 자신이 시스템(10)을 액세스하거나 프로그래밍하고자 할 때 새로운 사용자를 확인하고 식별하도록 새로운 사용자의 음성 모델을 구축할 수 있다. 이와 달리, 새로운 사용자의 기록된 전화 통화 또는 현재의 전화 통화가 또다른 식별 및 확인을 위한 필수적인 화자 모델을 구축하도록 이용될 수도 있다.
본 발명의 서버(20)는 이하 전 범위에서 참조 자료로 인용되는 "Apparatus and Methods For Providing Repetitive Enrollment in a Plurality of Biometric Recognition Systems Based on an Initial Enrollment,"이란 명칭의 특허 출원서(IBM Docket Number YO997-313)에 따라 구성될 수 있으며, 이에 따라, 다른 생물 속성의(biometric) 인식 기반형 시스템에 이용가능한 허가된 사용자(서버(20)에 저장되어 있음)의 화자 모델(즉, 생물 속성의 데이터)로 하여금 이러한 시스템을 등록하기 위해서, 사용자가 새로운 생물 속성의 모델을 체계적으로 제공할 필요없이 사용자를 자동으로 등록하게 할 수 있음이 이해될 것이다.
시스템(10)을 프로그래밍하는 목적은 GUI 인터페이스 또는 음성 커맨드를 통해 국부적으로, 또는 전화선(음성 커맨드)상에서 또는 시스템에 접속된 네트워크 시스템을 통해 원격으로, 사용자에 의해 원격으로 수행될 수 있다. 두 경우에서, 이것은 프로그래밍 인터페이스(38)를 통해 성취된다. 상술한 바와 같이, 시스템(10)을 프로그래밍하는 것은, 예를 들어, 특정의 번호, 음성 메일, 또는 응답기로 전송되어야 할 사람의 명칭을 선택하거나, 시스템(10)에 의해 인식될 특정의 키워드 또는 주제를 필요로 하는 특정의 프로세싱 프로시쥬어로서 입력하고/입력하거나, 오전 8시 및 오후 12시 사이의 비상 사태 호출 또는 사업 호출에 즉시 접속하도록 시스템(10)을 프로그래밍함으로써 성취된다. 도 2에 도시한 바와 같이, 프로그래밍 인터페이스(38)는 이러한 정보를 서버(20), 화자 인식기 모듈(22), ASR/NLU 모듈(24), 언어 식별기/번역기 모듈(26), 오디오 인덱서/우선 순위 부여기 모듈(34), 스위칭 모듈(28)에 전송하며, 이 스위칭 모듈(28)은 시스템(10)을 지시하여 사용자의 프로그래밍된 인스트럭션에 따라 호출을 프로세스한다.
프로그래밍 인터페이스는 허가된 사용자에 의해 DTMF 키 신호 또는 음성 커맨드에 응답한다. 시스템(10)을 프로그래밍하는 바람직한 방법은 DTMF 키잉 또는 GUI 인터페이스를 통하는 것과는 달리, 음성 인식 및 자연어 이해의 프로세스에 의해 음성 활성화된 커맨드를 통해 행해진다. 이러한 프로세스는 시스템(10)이, 사용자가 시스템(10)에 액세스하기 전에 사용자를 확인하고 식별하게 한다. 이것은 다른 유효한 PIN을 인지할 수 있는 허가가 부여되지 않은 사용자에 대해 보안성을 제공한다. 구체적으로, 사용자가 음성 커맨드를 통해 시스템(10)을 프로그래밍할 수 있기 전에, 서버(20)에 의해 사용자의 음성이 먼저 수신되고, 그 다음에 화자 인식기 모듈(22)에 의해 식별되고 확인된다. 일단 사용자의 식별이 확인되면, 서버(20)는 프로그래밍 인터페이스(38)를 시그널링하여 사용자가 시스템(10)을 프로그래밍하는 것으로 진행하게 된다.
시스템(10)을 프로그래밍하는 음성 커맨드는 ASR/NLU 모듈(24)에서 프로세스된다. 특히, 이러한 프로그래밍 동안, ASR/NLU 모듈(24)은 커맨드 및 제어 모드이며, 이에 의해 프로그래밍 인터페이스(38)에 의해 수신된 모든 음성 인스트럭션 또는 커맨드가 ASR/NLU 모듈(24)로 전송되고, 기호 언어로 변환되어 커맨드로서 해석된다. 예를 들어, 사용자가 시스템(10)으로 하여금 그의 부인으로부터의 모든 호출을 자신의 전화선으로 향하게 하고자 한다면, 사용자는, 예를 들어 "나의 부인 제인으로부터의 모든 호출을 즉시 접속하라."라고 말할 수 있으며, 이에 따라 시스템(10)은 이러한 프로그래밍 커맨드를 인식하고 프로세스할 것이다.
또한, 사용자는 ASR/NLU 모듈(24) 및 음성 합성기 모듈(35)을 통해 시스템(10)과의 다이얼로그를 설정할 수 있다. 사용자는 프로그래밍 인터페이스(38)를 질의함으로써, 예를 들어 "나의 응답기에 어떤 호출이 전송되고 있는가"와 같이 질의함으로써 현재의 프로그램을 체크할 수 있다. 이러한 질의는 (사용자가 외부선으로부터 시스템(10)내로 호출하고 있는 경우) 서버(20)로부터 또는 (사용자가 사무실내에 있는 경우) 프로그래밍 인터페이스(28)로부터 서버(20)를 통해 ASR/NLU 모듈(24)로 전송되며, 이 때 질의가 프로세스된다. ASR/NLU 모듈(24)은 질의에 대한 응답을 생성할 것이고, 이 질의는 음성 합성기(36)로 전송되어, 사용자에게 재생되는 합성된 메시지, 에를 들면. "모든 개인적인 호출이 당신의 응답기로 전송되고 있습니다"와 같은 메시지를 생성한다.
마찬가지로, 시스템(10)이 허가된 사용자로부터의 구두 프로그래밍 요구를 이해할 수 없는 경우, ASR/NLU 모듈(24)은 사용자에 대한 프롬프트, 예를 들면, "당신의 요구를 다시 기록하여 주십시오."와 같은 프롬프트를 생성하고 음성 합성기(36)에 의해 프로세스할 수 있다. 구체적으로, 이러한 프로그래밍 동안, 서버(20)는 프로그래밍 요구를 프로그래밍 인터페이스(38)로 전송한다. 시스템(10)이 요구를 해독할 수 없는 경우, 프로그래밍 인터페이스(38)는 실패 메시지를 서버(20)로 다시 전송하고, 이 서버(20)는 이러한 메시지를 ASR/NLU 모듈(24)에 중개한다. ASR/NLU 모듈(24)은 잠재적인 각종 의미에 대한 질의를 재프로세스하거나, 또는 사용자를 프롬프트하여 (음성 합성기(36)를 통해) 새로운 프로그래밍 요구를 송출할 수 있다.
시스템(10)은 오디오 인덱서/우선 순위 부여기 모듈(34)의 동작을 통해 시스템(10)에 접속되는 음성 메일, 전화선, 팩시밀리/모뎀, e-메일, 다른 원격 통신 디바이스를 통해 수신된 각종 메시지 및 호출을 관리하도록 프로그래밍될 수 있음이 이해될 것이다. 특히, 오디오 인덱서/우선 순위 부여기 모듈(34)은 그 주제 및 내용, 기점, 또는 둘 모두에 따라 이러한 메시지 및 전화 통화를 자동으로 정렬하고 인덱싱하도록 프로그래밍될 수 있다. 시스템(10)은 바람직하게 특정 개인으로부터 특정의 호출 및 메시지에 우선 순위를 부여하도록 또한 프로그래밍될 수 있다.
도 2를 참조하면, 시스템(10)의 오디오 인덱싱 특성은 다음과 같이 동작된다. 일단 화자 인식기 모듈(22)에 의해 호출자가 식별되고 확인되면, 화자 인식기 모듈(22)은 원격 회의에 대한 가입자 그룹중 호출자의 신원 또는 현재 화자의 신원을 자동으로 태그하는 ID 태거 모듈(30)을 시그널링한다. ID 태깅 프로세스와 동시에, 전사 모듈(32)은 전화 통화 또는 메시지를 전사한다. 태깅 프로세스는 전사된 메시지를 호출자 또는 화자의 신원과 연관시키는 것을 수반한다. 예를 들어, 원격 회의 동안, 현재의 화자에 대응하는 전사된 통화의 각 세그먼트는 이러한 각 세그먼트에 대해 개시 시간 및 종료 시간과 함께 이러한 화자의 신원으로 태그된다.
ID 태거 모듈(30) 및 전사 모듈(32)에서 프로세스된 정보는 오디오 인덱서/우선 순위 부여기 모듈(34)에 전송되며, 수신된 정보는 사전프로그래밍된 프로시쥬어에 따라 프로세스되고 저장된다. 오디오 인덱서/우선 순위 부여기 모듈(34)는 사용자가 원하는 임의의 방식으로 메시지 및 통화를 인덱싱하도록 프로그래밍될 수 있다. 예를 들어, 사용자는 특정의 호출자로부터의 메시지를 불러오하거나, 긴급한 모든 메시지를 불러오거나, 또는 특정의 주제에 관한 메시지를 불러올 수 있다. 또한, 오디오 인덱서/우선 순위 부여기 모듈(34)은 다수의 메시지를 남기거나 또는 긴급한 메시지를 남긴 호출자로부터의 호출에 우선 순위를 부여하도록 프로그래밍될 수 있다.
오디오 인덱서/우선 순위 부여기 모듈(34)에 저장된 정보는 국부적으로 또는 원격적으로 사용자에 의해 액세스되고 불러올 수 있다. 이러한 정보가 사용자에 의해 액세스되는 경우, 오디오 인덱서/우선 순위 부여기 모듈(34)은 요구된 정보를 음성 인식기 모듈(38)에 전송하며, 텍스트-음성 변환이 수행되어 사용자가 합성된 음성 형태의 메시지를 청취하게 한다. 본 발명에서는 상업적으로 입수가능한 IBMVIAVOICEGOLD소프트웨어가 제공된 엘로퀀트(Eloquent) 엔진과 같은 임의의 통상적인 음성 합성 기법이 이용될 수 있음에 유의해야 한다.
GUI 인터페이스, PIN 및 DTMF 키잉과 같은 각종 방법을 통해 오디오 인덱서/우선 순위 부여기 모듈(34)로부터 정보가 불러올 수 있음에 유의해야 한다. 그러나, 이러한 정보를 불러오는 본 발명의 바람직한 방법은 음성 활성화된 커맨드를 통해서 이루어진다. 이러한 방법은 시스템(10)으로 하여금 오디오 인덱서/우선 순위 부여기 모듈(34)에 저장되고 인덱싱된 메시지 또는 통화에 대한 액세스를 제공하기 이전에 사용자를 식별하고 확인하게 한다. 오디오 인덱서/우선 순위 부여기 모듈(34)은 사용자의 특정 음성 커맨드를 인식하고 응답하도록 프로그래밍될 수 있고, 이 음성 커맨드는 ASR/NLU 모듈(24)에 의해 프로세스되고 오디오 인덱서/우선 순위 부여기 모듈(34)로 전송되어, 특정의 메시지 및 통화를 불러온다. 예를 들어, 사용자는 음성 커맨드, 예를 들어 "Mr. Smith로부터의 모든 메시지를 재생하시오."와 같은 음성 커맨드를 통해 오디오 인덱서/우선 순위 부여기 모듈(34)에 저장되어 있는 Mr. Smith로부터의 모든 메시지를 불러올 수 있다. 이러한 커맨드는 서버(20)에 의해 수신되고 프로세싱을 위한 ASR/NLU 모듈(24)에 전송된다. ASR/NLU 모듈(24)가 질의를 이해하는 경우, ASR/NLU 모듈(24)은 서버(20)에 응답을 다시 전송하여 질의를 프로세스한다. 서버(20)는 오디오 인덱서/우선 순위 부여기 모듈(34)을 시그널링하여 합성된 e-메일 또는 팩시밀리 메시지를 생성하기 위한 음성 합성기로, 또는 간단히 재생되는 기록된 전화나 음성 메일 메시지를 위한 서버(20)로 직접, 요구된 메시지를 전송한다.
본 발명에서는 당 분야에서 통상의 지식을 가진 자에 의해 호출을 프로세스하는 각종 다른 프로그래밍 전략이 사용될 수 있음이 이해될 것이다. 예를 들어, 시스템(10)은 중요하거나 긴급한 인입 전화 호출의 경우 사용자에게 경고하도록 프로그래밍될 수 있다. 구체적으로, 시스템(10)은 디스플레이상에 사용자를 통지하도록 프로그래밍될 수 있으며, 이에 의해 사용자가 상술한 바와 같이, 사전프로그래밍된 프로시쥬어에 따라 이러한 호출을 처리하거나, 또는 호출을 단순히 프로세스하는 방법에 대해 결정하게 한다. 또한, 시스템(10)은 사용자가 집에 있지 않거나 사무실 외부에 있을 때 긴급하거나 중요한 호출을 사용자의 비퍼(beeper)에 전송하도록 프로그래밍될 수 있다. 사용자는 하루 동안 사용자가 찾을 수 있는 특정의 위치에서 (인입 전화 호출에 응답한 후에) 일련의 전화 번호를 다이얼링하도록 시스템을 또한 프로그래밍할 수 있다. 또한, 사전프로그래밍된 전화 번호의 시퀀스(즉, 리스트)는 사용자가 찾은 가장 최근의 알려진 위치에 따라 시스템(10)에 의해 자동으로 갱신될 수 있다. 사용자가 원한다면, 시스템(10)내로 호출하는 개인에 의해 또한 액세스가능하게 되어 이러한 호출자는 그 편리한 대로 다양한 위치중 하나에서 사용자와 접촉하도록 시도할 수 있다.
또한, 시스템(10)은 그 시스템(10)을 호출하는 모든 사람의 명칭과 함께, (ANI를 이용하는) 그들의 전화 번호, 뿐만 아니라 e-메일을 전송하는 사람의 e-메일 어드레스를 저장하도록 프로그래밍될 수 있음이 이해될 것이다. 이로 인해 시스템(10)의 사용자는 그 사용자가 응답중인 사람의 전화 번호 또는 e-메일 어드레스를 먼저 판단할 필요없이 계류중인 호출 또는 메시지에 자동으로 응답한다. 또한, 이러한 프로그래밍은 메시지를 전송하거나 호출하기 위해 허가된 사용자에 대해 액세스가능한 연속적인 최신 어드레스 북을 동적으로 생성하도록 제공한다. 구체적으로, 사용자는 시스템(10)을 액세스하고, 호출에 대한 특정 사람의 명칭을 선택하며, 그 다음에 시스템(10)을 지시하여 해당 사람에게 특정의 메시지(예를 들면, e-메일 또는 팩시밀리)를 전송하게 할 수 있다.
또한, 시스템(10)은 호출자가 시스템(10)의 특정 기능을 액세스하고 이용할 수 있도록 프로그래밍될 수 있다. 예를 들면, 시스템(10)은 사용자와의 임시적인 약속을 스케줄링하는 옵션을 호출자에게 제공할 수 있으며, 이것은 시스템(10)에 저장되고 그 이후에 사용자에 의해 허용되거나 거부될 수 있다. 호출자는 사용자가 이러한 약속(예를 들어, 전화 호출, 팩시밀리 또는 e-메일)을 확인하거나, 거부하거나 또는 보류할 수 있는 방법을 선택할 기회를 제공할 수도 있다. 부가적으로, 시스템(10)은 특정의 허가된 호출자에게 사용자의 약속 캘린더에 대한 액세스를 제공하여 이러한 약속이 용이하게 스케줄링될 수 있도록 프로그래밍될 수 있다.
본 발명은 개인 가정용의 작은 규모의 애플리케이션이나, 큰 규모의 사무실 또는 회사 애플리케이션에서 사용될 수 있음이 또한 이해될 것이다. 당업자라면 시스템(10)은 다른 애플리케이션에서 이용돌 수 있음이 또한 이해될 것이다. 예를 들어, 시스템(10)의 NLU 특성을 이용함으로써, 시스템(10)은 테이프 레코더, 라디오, 텔레비전과 같은 디바이스에 접속되어 몇몇 채널상에 특정의 주제가 커버될 때마다 또는 특정 사람이 인터뷰되는 경우 사용자에게 경고할 수 있다. 시스템(10)은 전화 통신에 한정되지는 않음에 유의해야 한다. 디지털 또는 아날로그 채널을 통해 음성 전송을 수반하는 전화망(web phone), 통화망(net conversation), 원격 회의 및 다른 각종 음성 통신용의 시스템(10)을 이용할 수 있다. ASCII 문자, 팩시밀리 메시지, 웹 페이지 및 데이터베이스 탐색의 내용과 같은 부가적인 전자 정보가 동일한 방식으로 또한 프로세스될 수 있다. 예를 들어, 팩시밀리 수신 성능에 광학적 문자 인식(OCR)을 부가함으로써, 시스템(10)은 오디오 인덱서/우선 순위 부여기 모듈(34)에 저장될 팩시밀리 또는 e-메일에 의해 수신된 메시지의 내용을 전사할 수 있다. 상술한 바와 같이, 사용자는 이러한 메시지의 내용을 청취하도록 음성 합성기(36)를 통해 이들 메시지를 불러올 수 있다.
결국, 본 발명은 사용자가 먼저 수동으로 전화 호출에 응답하거나 또는 e-메일이나 팩시밀리 메시지를 불러오고, 메시지의 호출자나 발신자를 식별하고, 그 다음에 이러한 호출을 전송하거나 이러한 메시지에 응답하는 방법을 결정할 필요없이, 사전결정된 방식으로 인입 전화 호출, e-메일 메시지, 팩시밀리 메시지, 다른 전자 정보 데이터를 프로세스하도록 사용자에 의해 프로그래밍될 수 있는 프로그램가능한 호출 및 메시지 프로세싱 시스템을 제공한다. 본 발명은 전화 통화나 원격 회의를 전사하고, 원격 회의에 대한 호출자 또는 가입자의 신원을 태그하며, 호출자나 발신자의 신원 및/또는 호출이나 메시지의 주제 및 내용에 따라 이러한 메시지 및 통화를 저장하도록 프로그래밍될 수 있다. 사용자는 호출자의 신원에 근거한 임의의 저장된 메시지나 통화 또는 그 주제에 근거한 관련 메시지 그룹을 불러올 수 있다.
본 발명의 예시적인 실시예는 첨부되는 도면을 참조하여 기술되었으나, 본 발명이 이러한 실시예에만 한정되지는 않으며, 당업자라면 본 발명의 진정한 정신 및 범주로부터 벗어나지 않고 각종 다른 변경 및 수정이 실시될 수 있음이 이해될 것이다.
상기한 바와 같은 본 발명에 따르면, 호출자나 발신자의 신원, 호출 또는 메시지의 주제, 및/또는 이러한 호출 또는 메시지의 일일 시각에 근거한 사전결정된 방식에 따라 자동 호출 및 데이터 전송 프로세싱을 위한 시스템 및 방법을 제공하는 것으로, 허가된 사용자에 의해 음성 활성화된 커맨드에 응답하여, 사용자가 호출 또는 메시지를 액세스하거나 또는 시스템을 프로그래밍하기 전에 사용자를 식별하고 확인할 수 있게 된다.

Claims (41)

  1. 자동 호출 및 데이터 전송 프로세싱 시스템에 있어서,
    인입 호출을 수신하는 서버 수단과,
    상기 서버 수단에 동작가능하게 접속되어, 상기 호출의 호출자를 식별하는 화자 인식 수단과,
    상기 서버 수단에 동작가능하게 접속되어, 상기 호출의 주제 및 내용을 판단하는 음성 인식 수단과,
    상기 화자 인식 수단 및 상기 음성 인식 수단에 응답하여, 상기 호출자의 상기 식별 및 판단된 주제중 하나에 따라 상기 호출을 프로세싱하는 스위칭 수단과,
    상기 서버 수단, 상기 화자 인식 수단, 상기 음성 인식 수단, 상기 스위칭 수단에 동작가능하게 접속되어, 시스템이 상기 프로세싱을 수행하도록 프로그래밍하는 프로그래밍 수단
    을 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
  2. 제 1 항에 있어서,
    상기 서버 수단은 상기 인입 호출을 기록하는 수단을 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
  3. 제 2 항에 있어서,
    상기 서버 수단은 상기 기록된 데이터를 압축하여 저장하는 수단 및 상기 압축된 데이터를 압축 해제하는 수단을 더 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
  4. 제 1 항에 있어서,
    상기 서버 수단은 인입 팩시밀리 메시지, e-메일 메시지, 음성 데이터, 텍스트로 변환가능한 데이터, 그의 조합중 하나를 또한 수신하고, 그에 응답하는 자동 호출 및 데이터 전송 프로세싱 시스템.
  5. 제 1 항에 있어서,
    상기 화자 인식 수단은 텍스트 독립형 화자 인식에 근거하는 자동 호출 및 데이터 전송 프로세싱 시스템.
  6. 제 1 항에 있어서,
    상기 음성 인식 수단은 음성 인식 및 자연어 이해를 이용하여 상기 호출의 상기 주제 및 내용을 판단하는 자동 호출 및 데이터 전송 프로세싱 시스템.
  7. 제 1 항에 있어서,
    상기 음성 인식 수단에 동작가능하게 접속되어, 상기 인입 호출의 언어를 식별하고 이해하는 언어 식별 수단을 더 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
  8. 제 7 항에 있어서,
    상기 식별 수단은 언어 번역을 수행하는 자동 호출 및 데이터 전송 프로세싱 시스템.
  9. 제 7 항에 있어서,
    상기 호출자의 신원은 상기 호출의 상기 식별된 언어로부터 판단되는 자동 호출 및 데이터 전송 프로세싱 시스템.
  10. 제 7 항에 있어서,
    상기 언어 식별 수단은 상기 호출자의 신원을 이용하여 상기 호출의 언어를 식별하는 자동 호출 및 데이터 전송 프로세싱 시스템.
  11. 제 1 항에 있어서,
    상기 시스템을 액세스하기 위해 새로운 사용자를 등록시키는 등록 수단을 더 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
  12. 제 11 항에 있어서,
    상기 새로운 사용자는 자체 등록될 수 있는 자동 호출 및 데이터 전송 프로세싱 시스템.
  13. 제 1 항에 있어서,
    상기 호출의 시간을 판단하는 수단을 더 포함하며, 상기 시스템은 상기 호출의 상기 시간에 따라 상기 호출을 프로세스하도록 또한 프로그래밍될 수 있는 자동 호출 및 데이터 전송 프로세싱 시스템.
  14. 제 1 항에 있어서,
    상기 프로그래밍 수단은 GUI 인터페이스, 음성 인터페이스, 프로그래밍 구성 화일, 그의 조합중 하나를 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
  15. 제 14 항에 있어서,
    상기 프로그래밍은 국부적으로, 또는 원격적으로 및 그의 조합적인 방식중 하나를 수행할 수 있는 자동 호출 및 데이터 전송 프로세싱 시스템.
  16. 제 1 항에 있어서,
    상기 인입 호출에 응답하여, 어드레스 북(address book)을 동적으로 생성하는 수단을 더 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
  17. 제 16 항에 있어서,
    상기 어드레스 북을 액세스하여 소정의 메시지를 선택된 사람에게 전송하는 수단을 더 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
  18. 제 1 항에 있어서,
    상기 호출의 상기 프로세싱은 순차적인 방식 및 동시적인 방식중 하나의 방식으로 인입 전화 호출을 다수의 상이한 전화 구성원에 전송하는 것을 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
  19. 제 1 항에 있어서,
    호출자를 프롬프트(prompt)하여 호출자 자신 및 상기 호출의 주제를 식별하는 수단을 더 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
  20. 제 19 항에 있어서,
    상기 프롬프팅은 상기 시스템이 상기 신원 또는 상기 호출의 주제를 판단할 수 없는 자동 호출 및 데이터 전송 프로세싱 시스템.
  21. 제 19 항에 있어서,
    상기 프롬프팅은 상기 호출이 수신될 때 상기 호출자의 신원 및 상기 호출의 주제를 판단하도록 수행되는 자동 호출 및 데이터 전송 프로세싱 시스템.
  22. 제 1 항에 있어서,
    상기 화자 인식 수단에 응답하여, 상기 호출자의 상기 신원을 자동으로 태그하는 식별 태깅 수단과,
    상기 음성 인식 수단에 응답하여, 상기 호출자의 전화 통화 또는 메시지를 전사하는 전사 수단과,
    상기 식별 태깅 수단 및 상기 전사 수단에 동작가능하게 접속되어, 상기 통화 및 상기 메시지의 주제와, 상기 호출자의 신원에 따라 상기 호출자의 상기 메시지 및 상기 통화를 인덱싱하는 오디오 인덱싱 수단
    을 더 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
  23. 제 22 항에 있어서,
    상기 오디오 인덱싱 수단으로부터 상기 인덱싱된 메시지를 불러오는 수단을 더 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
  24. 제 22 항에 있어서,
    상기 서버 수단, 상기 음성 인식 수단, 상기 오디오 인덱싱 수단에 동작가능하게 접속되어, 상기 오디오 인덱싱 수단에 저장된 정보를 합성된 음성으로 변환하는 음성 합성기 수단을 더 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
  25. 제 22 항에 있어서,
    상기 전사 수단에 동작가능하게 접속되어, 상기 시스템의 사용자로부터의 메시지를 지시하여 상기 메시지를 선택된 사람에게 전송하는 수단을 더 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
  26. 제 25 항에 있어서,
    상기 메시지는 팩시밀리, e-메일 또는 전화 호출, 그의 조합중 하나에 의해 상기 선택된 사람에게 전송될 수 있는 자동 호출 및 데이터 전송 프로세싱 시스템.
  27. 제 26 항에 있어서,
    헤더내의 무드 스탬프(mood stamps) 또는 긴급성/기밀성 스탬프를 상기 팩시밀리 및 e-메일중 하나에 부가하는 수단을 더 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
  28. 자동 호출 및 데이터 전송 프로세싱을 제공하는 방법에 있어서,
    인입 호출을 수신하는 단계와,
    상기 호출자의 신원을 판단하는 단계와,
    상기 호출의 주제를 판단하는 단계와,
    상기 호출자의 상기 신원 및 상기 호출의 주제중 하나에 따라 상기 호출을 프로세스하는 단계
    를 포함하는 자동 호출 및 데이터 전송 프로세싱 방법.
  29. 제 28 항에 있어서,
    상기 호출자의 상기 신원을 판단하는 단계는 텍스트 독립형 화자 인식에 의해 수행되는 자동 호출 및 데이터 전송 프로세싱 방법.
  30. 제 28 항에 있어서,
    상기 호출의 상기 주제를 판단하는 단계는 음성 인식 및 자연어 이해에 의해 수행되는 자동 호출 및 데이터 전송 프로세싱 방법.
  31. 제 28 항에 있어서,
    상기 호출을, 상기 호출 언어 이외의 언어로 번역하는 단계를 더 포함하는 자동 호출 및 데이터 전송 프로세싱 방법.
  32. 제 28 항에 있어서,
    상기 인입 호출을 기록하는 단계를 더 포함하는 자동 호출 및 데이터 전송 프로세싱 방법.
  33. 제 32 항에 있어서,
    상기 기록 단계는 상기 호출자의 신원을 판단하는 단계와 동시에 수행되는 자동 호출 및 데이터 전송 프로세싱 방법.
  34. 제 32 항에 있어서,
    상기 기록 단계는 상기 호출자의 신원을 판단하는 단계 이전에 수행되는 자동 호출 및 데이터 전송 프로세싱 방법.
  35. 제 28 항에 있어서,
    상기 호출의 시간을 판단하는 단계와,
    상기 호출의 상기 판단된 시간에 근거하여 상기 호출을 프로세스하는 단계
    를 더 포함하는 자동 호출 및 데이터 전송 프로세싱 방법.
  36. 자동 호출 및 데이터 전송 프로세싱을 제공하는 방법에 있어서,
    인입 호출 및 메시지 데이터중 하나를 수신하는 단계와,
    인입 호출이 수신되는 경우 상기 호출의 호출자를 식별하고, 상기 호출의 주제를 판단하는 단계와,
    메시지 데이터가 수신되는 경우 상기 메시지의 발신자를 식별하고, 상기 메시지의 주제를 판단하는 단계와,
    상기 호출자 및 발신자의 상기 신원과, 상기 호출 및 메시지의 상기 주제중 하나에 따라 상기 호출 및 메시지중 하나를 프로세스하는 단계
    를 포함하는 자동 호출 및 데이터 전송 프로세싱 방법.
  37. 제 36 항에 있어서,
    상기 호출자 및 상기 발신자중 하나의 상기 판단된 신원을 태그하는 단계와,
    상기 호출 및 상기 메시지중 하나의 상기 판단된 주제를 전사하는 단계와,
    상기 판단된 주제, 상기 판단된 신원, 그의 조합중 하나에 따라 상기 태깅 및 상기 전사에 의해 발생되는 정보를 인덱싱하는 단계
    를 더 포함하는 자동 호출 및 데이터 전송 프로세싱 방법.
  38. 제 37 항에 있어서,
    상기 인덱싱된 정보를 불러오는 단계를 더 포함하는 자동 호출 및 데이터 전송 프로세싱 방법.
  39. 제 38 항에 있어서,
    상기 인덱싱된 정보를 불러오는 단계는 음성 커맨드에 의해 수행되는 자동 호출 및 데이터 전송 프로세싱 방법.
  40. 제 38 항에 있어서,
    상기 검색 단계는 상기 인덱싱된 정보를 합성된 음성으로 변환하는 것을 포함하는 자동 호출 및 데이터 전송 프로세싱 방법.
  41. 제 36 항에 있어서,
    상기 호출 및 메시지중 하나의 시간을 판단하는 단계와,
    상기 판단된 시간에 따라 상기 호출 및 메시지중 하나를 프로세스하는 단계
    를 더 포함하는 자동 호출 및 데이터 전송 프로세싱 방법.
KR10-1999-0000960A 1998-01-16 1999-01-15 자동 호출 및 데이터 전송 프로세싱 시스템 및 방법 KR100369696B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/008,124 1998-01-16
US09/008,124 US6327343B1 (en) 1998-01-16 1998-01-16 System and methods for automatic call and data transfer processing
US9/008,124 1998-01-16

Publications (2)

Publication Number Publication Date
KR19990067916A true KR19990067916A (ko) 1999-08-25
KR100369696B1 KR100369696B1 (ko) 2003-01-30

Family

ID=21729917

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-1999-0000960A KR100369696B1 (ko) 1998-01-16 1999-01-15 자동 호출 및 데이터 전송 프로세싱 시스템 및 방법

Country Status (6)

Country Link
US (1) US6327343B1 (ko)
EP (1) EP0935378B1 (ko)
JP (1) JP2000013510A (ko)
KR (1) KR100369696B1 (ko)
DE (1) DE69839068T2 (ko)
TW (1) TW401673B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100487533B1 (ko) * 2002-09-16 2005-05-03 엘지전자 주식회사 디지털 사설 교환기에서의 가입자 데이터 자동송수신방법

Families Citing this family (207)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6567778B1 (en) 1995-12-21 2003-05-20 Nuance Communications Natural language speech recognition using slot semantic confidence scores related to their word recognition confidence scores
US6775264B1 (en) * 1997-03-03 2004-08-10 Webley Systems, Inc. Computer, internet and telecommunications based network
US7630895B2 (en) 2000-01-21 2009-12-08 At&T Intellectual Property I, L.P. Speaker verification method
US5897616A (en) * 1997-06-11 1999-04-27 International Business Machines Corporation Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases
US6636733B1 (en) 1997-09-19 2003-10-21 Thompson Trust Wireless messaging method
US6850609B1 (en) * 1997-10-28 2005-02-01 Verizon Services Corp. Methods and apparatus for providing speech recording and speech transcription services
JP3445737B2 (ja) * 1998-03-20 2003-09-08 シャープ株式会社 通信装置
US7027566B2 (en) * 1998-04-16 2006-04-11 Sbc Knowledg Ventures, L.P Home gateway system with telephony functions and method
US9294629B2 (en) * 1998-04-16 2016-03-22 At&T Intellectual Property I, L.P. Home gateway system with telephony functions and method
US6647099B1 (en) * 1998-06-08 2003-11-11 Hewlett-Packard Development Company, L.P. Administrative control and security of modems
JP2000176168A (ja) * 1998-12-18 2000-06-27 Konami Co Ltd メッセージ作成ゲーム装置及びメッセージ作成方法
US7961853B2 (en) * 1998-12-31 2011-06-14 S.F. Ip Properties 30 Llc System and method for prioritizing communications messages
US8321411B2 (en) 1999-03-23 2012-11-27 Microstrategy, Incorporated System and method for management of an automatic OLAP report broadcast system
US6570964B1 (en) * 1999-04-16 2003-05-27 Nuance Communications Technique for recognizing telephone numbers and other spoken information embedded in voice messages stored in a voice messaging system
US7058573B1 (en) 1999-04-20 2006-06-06 Nuance Communications Inc. Speech recognition system to selectively utilize different speech recognition techniques over multiple speech recognition passes
US6449345B1 (en) * 1999-04-28 2002-09-10 Avaya Technology Corp. Selective remote access of an audio messaging system
US6766295B1 (en) 1999-05-10 2004-07-20 Nuance Communications Adaptation of a speech recognition system across multiple remote sessions with a speaker
US7260187B1 (en) 1999-05-11 2007-08-21 Verizon Services Corp. Voice response apparatus and method of providing automated voice responses with silent prompting
US9208213B2 (en) 1999-05-28 2015-12-08 Microstrategy, Incorporated System and method for network user interface OLAP report formatting
US8607138B2 (en) 1999-05-28 2013-12-10 Microstrategy, Incorporated System and method for OLAP report generation with spreadsheet report within the network user interface
US6760428B2 (en) * 1999-07-30 2004-07-06 Avaya Technology Corp. Modification of voice prompting based on prior communication in a call center
US6721059B1 (en) * 1999-07-30 2004-04-13 Hewlett-Packard Develpoment Company, L.P. Method and apparatus for automatically handling faxes
WO2001013362A1 (de) * 1999-08-18 2001-02-22 Siemens Aktiengesellschaft Verfahren zur unterstützung eines dialogs
US6829334B1 (en) 1999-09-13 2004-12-07 Microstrategy, Incorporated System and method for the creation and automatic deployment of personalized, dynamic and interactive voice services, with telephone-based service utilization and control
US6850603B1 (en) * 1999-09-13 2005-02-01 Microstrategy, Incorporated System and method for the creation and automatic deployment of personalized dynamic and interactive voice services
US8130918B1 (en) 1999-09-13 2012-03-06 Microstrategy, Incorporated System and method for the creation and automatic deployment of personalized, dynamic and interactive voice services, with closed loop transaction processing
US6964012B1 (en) 1999-09-13 2005-11-08 Microstrategy, Incorporated System and method for the creation and automatic deployment of personalized, dynamic and interactive voice services, including deployment through personalized broadcasts
US6885734B1 (en) * 1999-09-13 2005-04-26 Microstrategy, Incorporated System and method for the creation and automatic deployment of personalized, dynamic and interactive inbound and outbound voice services, with real-time interactive voice database queries
US6836537B1 (en) 1999-09-13 2004-12-28 Microstrategy Incorporated System and method for real-time, personalized, dynamic, interactive voice services for information related to existing travel schedule
US6263051B1 (en) 1999-09-13 2001-07-17 Microstrategy, Inc. System and method for voice service bureau
US20030125954A1 (en) * 1999-09-28 2003-07-03 Bradley James Frederick System and method at a conference call bridge server for identifying speakers in a conference call
US7689416B1 (en) 1999-09-29 2010-03-30 Poirier Darrell A System for transferring personalize matter from one computer to another
US7308462B1 (en) 1999-10-29 2007-12-11 Nortel Networks Limited Methods and systems for building and distributing audio packages
US7376710B1 (en) * 1999-10-29 2008-05-20 Nortel Networks Limited Methods and systems for providing access to stored audio data over a network
US7725307B2 (en) 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
US9076448B2 (en) 1999-11-12 2015-07-07 Nuance Communications, Inc. Distributed real time speech recognition system
US7392185B2 (en) 1999-11-12 2008-06-24 Phoenix Solutions, Inc. Speech based learning/training system using semantic decoding
US7050977B1 (en) 1999-11-12 2006-05-23 Phoenix Solutions, Inc. Speech-enabled server for internet website and method
DE19956852A1 (de) * 1999-11-25 2001-05-31 Michael Mende Verfahren und Vorrichtung zur E-Mail-Kommunikation
US7453991B1 (en) * 1999-12-08 2008-11-18 At&T Corp. Method and apparatus for voice mail notes
CA2323538A1 (en) * 1999-12-08 2001-06-08 At&T Corp. System and method for gisting, browsing and searching voicemail using automatic speech recognition
US8108218B1 (en) * 1999-12-13 2012-01-31 Avaya Inc. Methods and apparatus for voice recognition for call treatment modification on messaging
US6687362B1 (en) * 2000-02-11 2004-02-03 Hallmark Cards, Incorporated Automatic address book update system
GB2360166A (en) * 2000-03-07 2001-09-12 Mitel Corp Telephone call blocking using voice recognition
US6784899B1 (en) * 2000-03-31 2004-08-31 Ricoh Company, Ltd. Systems and methods for providing rich multimedia messages to remote users using telephones and facsimile machines
US7664636B1 (en) * 2000-04-17 2010-02-16 At&T Intellectual Property Ii, L.P. System and method for indexing voice mail messages by speaker
JP2001306564A (ja) * 2000-04-21 2001-11-02 Nec Corp 自動翻訳機能付き携帯端末
US6775651B1 (en) * 2000-05-26 2004-08-10 International Business Machines Corporation Method of transcribing text from computer voice mail
GB2364850B (en) * 2000-06-02 2004-12-29 Ibm System and method for automatic voice message processing
US7958214B1 (en) * 2000-06-09 2011-06-07 Schwab Barry H Method for secure transactions utilizing physically separated computers
FR2810487B1 (fr) * 2000-06-19 2002-10-25 France Telecom Systeme d'accueil telephonique de correspondants en cas d'indisponibilite d'un souscripteur
US6810116B1 (en) * 2000-09-12 2004-10-26 International Business Machines Corporation Multi-channel telephone data collection, collaboration and conferencing system and method of using the same
US6988128B1 (en) * 2000-09-27 2006-01-17 International Business Machines Corporation Calendar events and calendar-driven application technique
US6640230B1 (en) * 2000-09-27 2003-10-28 International Business Machines Corporation Calendar-driven application technique for preparing responses to incoming events
EP1332605A4 (en) * 2000-10-16 2004-10-06 Eliza Corp METHOD AND SYSTEM FOR PROVIDING ADAPTIVE RESPONDENT TRAINING IN A VOICE RECOGNITION APPLICATION
US6772123B2 (en) * 2000-11-30 2004-08-03 3Com Corporation Method and system for performing speech recognition for an internet appliance using a remotely located speech recognition application
US20020076024A1 (en) * 2000-12-20 2002-06-20 Nortel Networks Limited Method, device and software for assessing urgency of incoming communications
US7581230B2 (en) * 2001-02-06 2009-08-25 Siebel Systems, Inc. Adaptive communication application programming interface
US7099439B2 (en) 2001-02-26 2006-08-29 Classco Inc. Loop test apparatus and method
US6999989B2 (en) * 2001-03-29 2006-02-14 At&T Corp. Methods for providing video enhanced electronic mail return receipts
US20030033294A1 (en) * 2001-04-13 2003-02-13 Walker Jay S. Method and apparatus for marketing supplemental information
DE10122192B4 (de) * 2001-05-08 2008-10-09 Harman Becker Automotive Systems Gmbh Kommunikationseinrichtung
US7225126B2 (en) 2001-06-12 2007-05-29 At&T Corp. System and method for processing speech files
US7953219B2 (en) 2001-07-19 2011-05-31 Nice Systems, Ltd. Method apparatus and system for capturing and analyzing interaction based content
US7133899B2 (en) * 2001-07-31 2006-11-07 Cingular Wireless Ii, Llc Method and apparatus for providing interactive text messages during a voice call
DE10139866A1 (de) * 2001-08-14 2003-03-13 Siemens Ag Verfahren und Vorrichtung zum Übertragen von Nachrichten in einem intelligenten Netz
AU2002334356A1 (en) * 2001-09-06 2003-03-18 Nice Systems Ltd. Recording of interactions between a customer and a sales person at a point of sales
US7728870B2 (en) 2001-09-06 2010-06-01 Nice Systems Ltd Advanced quality management and recording solutions for walk-in environments
WO2003028358A2 (en) * 2001-09-24 2003-04-03 Nice Systems Ltd. System and method for the automatic control of video frame rate
US7184536B2 (en) * 2001-09-28 2007-02-27 Intel Corporation Intelligent forwarded telephone call handling with a call answering system
DE10154053A1 (de) * 2001-11-02 2003-05-15 Deutsche Telekom Ag Rücksetzen von versendeten Informationen
US9088645B2 (en) * 2001-12-12 2015-07-21 International Business Machines Corporation Intermediary device initiated caller identification
US7245716B2 (en) 2001-12-12 2007-07-17 International Business Machines Corporation Controlling hold queue position adjustment
US7167551B2 (en) 2001-12-12 2007-01-23 International Business Machines Corporation Intermediary device based callee identification
US6768792B2 (en) * 2001-12-17 2004-07-27 International Business Machines Corporation Identifying call parties to a call to an incoming calling party
US7443970B2 (en) 2001-12-17 2008-10-28 International Business Machines Corporation Logging calls according to call context
US7418087B2 (en) 2002-01-04 2008-08-26 Classco Inc. Telephone network messaging
US20050128304A1 (en) * 2002-02-06 2005-06-16 Manasseh Frederick M. System and method for traveler interactions management
AU2002361483A1 (en) * 2002-02-06 2003-09-02 Nice Systems Ltd. System and method for video content analysis-based detection, surveillance and alarm management
US7436887B2 (en) 2002-02-06 2008-10-14 Playtex Products, Inc. Method and apparatus for video frame sequence-based object tracking
US6724866B2 (en) * 2002-02-08 2004-04-20 Matsushita Electric Industrial Co., Ltd. Dialogue device for call screening and classification
US7761544B2 (en) 2002-03-07 2010-07-20 Nice Systems, Ltd. Method and apparatus for internal and external monitoring of a transportation vehicle
US7016849B2 (en) * 2002-03-25 2006-03-21 Sri International Method and apparatus for providing speech-driven routing between spoken language applications
DE10220524B4 (de) * 2002-05-08 2006-08-10 Sap Ag Verfahren und System zur Verarbeitung von Sprachdaten und zur Erkennung einer Sprache
EP1363271A1 (de) * 2002-05-08 2003-11-19 Sap Ag Verfahren und System zur Verarbeitung und Speicherung von Sprachinformationen eines Dialogs
FR2841160B1 (fr) * 2002-06-19 2004-07-23 Solystic Procede de traitement d'objets postaux utilisant la synthese vocale
US20040006628A1 (en) * 2002-07-03 2004-01-08 Scott Shepard Systems and methods for providing real-time alerting
US20040024598A1 (en) 2002-07-03 2004-02-05 Amit Srivastava Thematic segmentation of speech
US8254548B2 (en) 2002-07-10 2012-08-28 Blake Bookstaff Method and system for providing directory assistance to erroneous telephone calls
US8472607B2 (en) 2002-07-10 2013-06-25 Blake Bookstaff Method and system for providing directory assistance to erroneous telephone calls
US8693664B2 (en) 2002-07-10 2014-04-08 Blake Bookstaff Method and system for providing directory assistance to erroneous telephone calls
US7227936B2 (en) 2002-07-10 2007-06-05 Blake Bookstaff Method and system for providing directory assistance to erroneous telephone calls
US8913732B2 (en) 2002-07-10 2014-12-16 Blake Bookstaff Method and system for providing directory assistance to erroneous telephone calls via wearable devices
US8472608B2 (en) 2002-07-10 2013-06-25 Blake Bookstaff Method and system for providing directory assistance to erroneous telephone calls
US8254547B2 (en) 2002-07-10 2012-08-28 Blake Bookstaff Method and system for providing directory assistance to erroneous telephone calls
JP3979209B2 (ja) * 2002-07-23 2007-09-19 オムロン株式会社 データ入力方法およびデータ入力装置
US20040163034A1 (en) 2002-10-17 2004-08-19 Sean Colbath Systems and methods for labeling clusters of documents
US8913728B2 (en) 2002-11-07 2014-12-16 Blake Bookstaff Method and system for automated intellegent advertising on wearable devices
US8611517B2 (en) 2002-11-07 2013-12-17 Blake Bookstaff Method and system for alphanumeric indexing for advertising with cloud computing
US8542809B2 (en) 2002-11-07 2013-09-24 Blake Bookstaff Method and system for alphanumeric indexing for advertising with cloud computing
US8363806B2 (en) 2002-11-07 2013-01-29 Blake Bookstaff Method and system for alphanumeric indexing for advertising via cloud computing
US8130928B2 (en) 2002-11-07 2012-03-06 Blake Bookstaff Method and system for number indexing for advertising
US8495047B2 (en) 2004-06-29 2013-07-23 Blake Bookstaff Method and system for automated intelligent electronic advertising
US6931113B2 (en) * 2002-11-08 2005-08-16 Verizon Services Corp. Facilitation of a conference call
WO2004090770A1 (en) 2003-04-09 2004-10-21 Nice Systems Ltd. Apparatus, system and method for dispute resolution, regulation compliance and quality management in financial institutions
US20040252349A1 (en) * 2003-05-29 2004-12-16 Green Brett A. Fax routing based on caller-ID
SG140445A1 (en) * 2003-07-28 2008-03-28 Sony Corp Method and apparatus for automatically recognizing audio data
US7852993B2 (en) * 2003-08-11 2010-12-14 Microsoft Corporation Speech recognition enhanced caller identification
WO2005018097A2 (en) * 2003-08-18 2005-02-24 Nice Systems Ltd. Apparatus and method for audio content analysis, marking and summing
US7725098B1 (en) 2003-09-04 2010-05-25 Emc Corporation Data message processing
EP1661380A4 (en) 2003-09-04 2007-06-13 Emc Corp DATA MESSAGE MIRRORS AND DISPLACEMENT
US8103873B2 (en) * 2003-09-05 2012-01-24 Emc Corporation Method and system for processing auditory communications
US7457396B2 (en) * 2003-09-05 2008-11-25 Emc Corporation Automated call management
US7499531B2 (en) * 2003-09-05 2009-03-03 Emc Corporation Method and system for information lifecycle management
US7330536B2 (en) * 2003-09-05 2008-02-12 Emc Corporation Message indexing and archiving
US7916848B2 (en) * 2003-10-01 2011-03-29 Microsoft Corporation Methods and systems for participant sourcing indication in multi-party conferencing and for audio source discrimination
EP1632083A4 (en) * 2003-11-05 2007-05-02 Nice Systems Ltd DEVICE AND METHOD FOR PERFORMING EVENT DIRECTED CONTENT ANALYSIS
EP1634225A4 (en) * 2004-03-10 2008-01-16 Nice Systems Ltd DEVICE AND METHOD FOR GENERATING CONTENT-BASED FOLLOW-UP
US20050201533A1 (en) * 2004-03-10 2005-09-15 Emam Sean A. Dynamic call processing system and method
US20050243975A1 (en) * 2004-04-28 2005-11-03 International Business Machines Corporation Method and system of determining unsolicited callers
US7086139B2 (en) * 2004-04-30 2006-08-08 Hitachi Global Storage Technologies Netherlands B.V. Methods of making magnetic write heads using electron beam lithography
JP2005348240A (ja) * 2004-06-04 2005-12-15 Matsushita Electric Ind Co Ltd 電話装置
US7275049B2 (en) * 2004-06-16 2007-09-25 The Boeing Company Method for speech-based data retrieval on portable devices
US8078977B2 (en) * 2004-06-29 2011-12-13 Blake Bookstaff Method and system for intelligent processing of electronic information
US9792633B2 (en) 2004-06-29 2017-10-17 Blake Bookstaff Method and system for intelligent processing of electronic information with cloud computing
WO2006005001A2 (en) * 2004-06-29 2006-01-12 Blake Bookstaff Method and system for automated intelligent electronic advertising
US7631042B2 (en) * 2004-06-30 2009-12-08 International Business Machines Corporation Method to update status on multiple voice and text systems from a single device
US20060004579A1 (en) * 2004-07-01 2006-01-05 Claudatos Christopher H Flexible video surveillance
US8244542B2 (en) * 2004-07-01 2012-08-14 Emc Corporation Video surveillance
US8180742B2 (en) * 2004-07-01 2012-05-15 Emc Corporation Policy-based information management
US7707037B2 (en) * 2004-07-01 2010-04-27 Emc Corporation Archiving of surveillance data
US8229904B2 (en) * 2004-07-01 2012-07-24 Emc Corporation Storage pools for information management
US8180743B2 (en) 2004-07-01 2012-05-15 Emc Corporation Information management
US9268780B2 (en) * 2004-07-01 2016-02-23 Emc Corporation Content-driven information lifecycle management
US7444287B2 (en) * 2004-07-01 2008-10-28 Emc Corporation Efficient monitoring system and method
US8204884B2 (en) * 2004-07-14 2012-06-19 Nice Systems Ltd. Method, apparatus and system for capturing and analyzing interaction based content
WO2006021943A1 (en) * 2004-08-09 2006-03-02 Nice Systems Ltd. Apparatus and method for multimedia content based
US7580837B2 (en) 2004-08-12 2009-08-25 At&T Intellectual Property I, L.P. System and method for targeted tuning module of a speech recognition system
US8724891B2 (en) * 2004-08-31 2014-05-13 Ramot At Tel-Aviv University Ltd. Apparatus and methods for the detection of abnormal motion in a video stream
US8078463B2 (en) * 2004-11-23 2011-12-13 Nice Systems, Ltd. Method and apparatus for speaker spotting
US7242751B2 (en) 2004-12-06 2007-07-10 Sbc Knowledge Ventures, L.P. System and method for speech recognition-enabled automatic call routing
US7751551B2 (en) 2005-01-10 2010-07-06 At&T Intellectual Property I, L.P. System and method for speech-enabled call routing
US7627096B2 (en) * 2005-01-14 2009-12-01 At&T Intellectual Property I, L.P. System and method for independently recognizing and selecting actions and objects in a speech recognition system
AU2006211111A1 (en) * 2005-02-07 2006-08-10 Nice Systems Ltd. Upgrading performance using aggregated information shared between management systems
US8005675B2 (en) * 2005-03-17 2011-08-23 Nice Systems, Ltd. Apparatus and method for audio analysis
EP1867167A4 (en) * 2005-04-03 2009-05-06 Nice Systems Ltd DEVICE AND METHOD FOR SEMI-AUTOMATIC TRACKING AND INVESTIGATION OF AN OBJECT OR EVENT AT A MONITORED LOCATION
US20060242104A1 (en) * 2005-04-21 2006-10-26 Microsoft Corporation Systems and methods for manipulating data in a data storage system
US20060253272A1 (en) * 2005-05-06 2006-11-09 International Business Machines Corporation Voice prompts for use in speech-to-speech translation system
US7386105B2 (en) * 2005-05-27 2008-06-10 Nice Systems Ltd Method and apparatus for fraud detection
US8605878B2 (en) * 2005-06-30 2013-12-10 Emc Corporation Redirecting and mirroring of telephonic communications
US8831194B2 (en) * 2005-06-30 2014-09-09 Emc Corporation Telephonic communication redirection and compliance processing
US8059805B2 (en) * 2005-06-30 2011-11-15 Emc Corporation Enhanced services provided using communication redirection and processing
US7616751B2 (en) * 2005-07-12 2009-11-10 Avaya Inc. Managing held telephone calls by using a messaging resource
US8880047B2 (en) 2005-08-03 2014-11-04 Jeffrey C. Konicek Realtime, location-based cell phone enhancements, uses, and applications
US8295851B2 (en) 2005-08-03 2012-10-23 Michael Edward Finnegan Realtime, interactive and geographically defined computerized personal matching systems and methods
WO2007017853A1 (en) * 2005-08-08 2007-02-15 Nice Systems Ltd. Apparatus and methods for the detection of emotions in audio interactions
US7978844B1 (en) 2005-12-16 2011-07-12 Union Beach L.P. Selective telephone ringing-signal interruption
US7489772B2 (en) 2005-12-30 2009-02-10 Nokia Corporation Network entity, method and computer program product for effectuating a conference session
JP4466572B2 (ja) * 2006-01-16 2010-05-26 コニカミノルタビジネステクノロジーズ株式会社 画像形成装置、音声コマンド実行プログラムおよび音声コマンド実行方法
WO2007086042A2 (en) * 2006-01-25 2007-08-02 Nice Systems Ltd. Method and apparatus for segmentation of audio interactions
US8625749B2 (en) * 2006-03-23 2014-01-07 Cisco Technology, Inc. Content sensitive do-not-disturb (DND) option for a communication system
US8725518B2 (en) * 2006-04-25 2014-05-13 Nice Systems Ltd. Automatic speech analysis
US7770221B2 (en) * 2006-05-18 2010-08-03 Nice Systems, Ltd. Method and apparatus for combining traffic analysis and monitoring center in lawful interception
US20070269025A1 (en) * 2006-05-19 2007-11-22 Shieh Johnny M Managing Customer Access to a Communication Recorded by A Provider in Association with a Transaction
US20070297581A1 (en) * 2006-06-26 2007-12-27 Microsoft Corporation Voice-based phone system user interface
US8019051B1 (en) 2006-08-16 2011-09-13 Avaya Inc. Method and apparatus for ordering communications
US20080065378A1 (en) * 2006-09-08 2008-03-13 James Wyatt Siminoff System and method for automatic caller transcription (ACT)
US8054961B2 (en) * 2006-09-29 2011-11-08 Siemens Enterprise Communications, Inc. MeetMe assistant
US7822605B2 (en) * 2006-10-19 2010-10-26 Nice Systems Ltd. Method and apparatus for large population speaker identification in telephone interactions
US7631046B2 (en) * 2006-10-26 2009-12-08 Nice Systems, Ltd. Method and apparatus for lawful interception of web based messaging communication
US7577246B2 (en) * 2006-12-20 2009-08-18 Nice Systems Ltd. Method and system for automatic quality evaluation
US7865556B2 (en) * 2006-12-20 2011-01-04 International Business Machines Corporation Failover processing for automatic responder in mixed server environment
US20080189171A1 (en) * 2007-02-01 2008-08-07 Nice Systems Ltd. Method and apparatus for call categorization
US8571853B2 (en) * 2007-02-11 2013-10-29 Nice Systems Ltd. Method and system for laughter detection
US7599475B2 (en) * 2007-03-12 2009-10-06 Nice Systems, Ltd. Method and apparatus for generic analytics
US20080259918A1 (en) 2007-04-19 2008-10-23 Craig Elliott Walker Method and apparatus for managing telephone calls
US20100185668A1 (en) * 2007-04-20 2010-07-22 Stephen Murphy Apparatuses, Methods and Systems for a Multi-Modal Data Interfacing Platform
US8086461B2 (en) * 2007-06-13 2011-12-27 At&T Intellectual Property Ii, L.P. System and method for tracking persons of interest via voiceprint
US20090012826A1 (en) * 2007-07-02 2009-01-08 Nice Systems Ltd. Method and apparatus for adaptive interaction analytics
US20090171973A1 (en) * 2007-07-09 2009-07-02 Rpm Communications, Inc. User-generated multimedia content from mobile and non-mobile devices
US9088660B2 (en) * 2007-09-14 2015-07-21 Bt Americas Inc. Messaging and application system integration
US20090228282A1 (en) * 2008-03-07 2009-09-10 Aruze Gaming America, Inc. Gaming Machine and Gaming System with Interactive Feature, Playing Method of Gaming Machine, and Control Method of Gaming System
US9209975B2 (en) * 2008-10-15 2015-12-08 Ricoh Company, Ltd. Secure access of electronic documents and data from client terminal
US8095541B2 (en) * 2008-04-30 2012-01-10 Ricoh Company, Ltd. Managing electronic data with index data corresponding to said electronic data
EP2113850A3 (en) * 2008-04-30 2009-11-11 Ricoh Company, Limited Managing electronic data with index data corresponding to said electronic data and secure access of electronic documents and data from client terminal
DE102008046431A1 (de) * 2008-09-09 2010-03-11 Deutsche Telekom Ag Sprachdialogsystem mit Reject-Vermeidungsverfahren
JP5284745B2 (ja) * 2008-10-10 2013-09-11 インターナショナル・ビジネス・マシーンズ・コーポレーション 電子メッセージに対するアクセスを管理する装置及び方法
US8290126B2 (en) * 2008-12-19 2012-10-16 CenturyLing Intellectual Property LLC System and method for a visual voicemail interface
US8351581B2 (en) 2008-12-19 2013-01-08 At&T Mobility Ii Llc Systems and methods for intelligent call transcription
CN101883060A (zh) * 2009-05-08 2010-11-10 中兴通讯股份有限公司 业务流程切换方法及媒体服务器
JP5502787B2 (ja) * 2011-03-15 2014-05-28 株式会社東芝 音声変換支援装置、プログラムおよび音声変換支援方法
WO2013009296A1 (en) * 2011-07-12 2013-01-17 Hewlett-Packard Development Company, L.P. Audio sample
US8819012B2 (en) * 2011-08-30 2014-08-26 International Business Machines Corporation Accessing anchors in voice site content
CN102571793A (zh) * 2012-01-09 2012-07-11 中国人民解放军信息工程大学 电信网垃圾呼叫捕获装置
US9691377B2 (en) 2013-07-23 2017-06-27 Google Technology Holdings LLC Method and device for voice recognition training
US9275638B2 (en) 2013-03-12 2016-03-01 Google Technology Holdings LLC Method and apparatus for training a voice recognition model database
US20140376541A1 (en) * 2013-06-19 2014-12-25 Microsoft Corporation Dual-tone multi-frequency (dtmf) programming of an auto-dialer
US9548047B2 (en) 2013-07-31 2017-01-17 Google Technology Holdings LLC Method and apparatus for evaluating trigger phrase enrollment
US9189742B2 (en) * 2013-11-20 2015-11-17 Justin London Adaptive virtual intelligent agent
WO2016126819A1 (en) 2015-02-03 2016-08-11 Dolby Laboratories Licensing Corporation Optimized virtual scene layout for spatial meeting playback
CN111866022B (zh) 2015-02-03 2022-08-30 杜比实验室特许公司 感知质量比会议中原始听到的更高的后会议回放系统
US10134386B2 (en) * 2015-07-21 2018-11-20 Rovi Guides, Inc. Systems and methods for identifying content corresponding to a language spoken in a household
US11178277B2 (en) * 2015-10-26 2021-11-16 Brandon Donnell Lee Circuit ID lookup
TWI608359B (zh) * 2017-01-17 2017-12-11 關貿網路股份有限公司 資料傳輸系統及其方法
US11032423B2 (en) 2017-12-29 2021-06-08 Trysit Nitidharmatut Simultaneous voice and data content driven commercial data platform
US10764428B2 (en) * 2017-12-29 2020-09-01 Trysit Nitidharmatut Simultaneous voice and data content driven commercial data platform
US11553082B2 (en) 2017-12-29 2023-01-10 Trysit Nitidharmatut Simultaneous voice and data content driven commercial data platform

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62139491A (ja) 1985-12-13 1987-06-23 Nec Corp 外線呼自動内線転送装置
US5199062A (en) * 1988-01-20 1993-03-30 Phone Base Systems Inc. Telephone communications system including a digital telephone switch, a voice response unit and a stored program sequence for controlling both the switch and the voice response unit
JPH0362800A (ja) 1989-07-31 1991-03-18 Toshiba Corp 音声リモートコントロール装置
JPH03203794A (ja) 1989-12-29 1991-09-05 Pioneer Electron Corp 音声リモートコントロール装置
JP3066920B2 (ja) 1991-06-11 2000-07-17 キヤノン株式会社 音声認識方法及び装置
WO1993013518A1 (en) * 1991-12-31 1993-07-08 Digital Sound Corporation Voice controlled messaging system and processing method
US5327486A (en) * 1993-03-22 1994-07-05 Bell Communications Research, Inc. Method and system for managing telecommunications such as telephone calls
US5594784A (en) * 1993-04-27 1997-01-14 Southwestern Bell Technology Resources, Inc. Apparatus and method for transparent telephony utilizing speech-based signaling for initiating and handling calls
US5511111A (en) * 1993-11-01 1996-04-23 Engineering And Business Systems, Inc. Caller name and identification communication system with caller screening option
US5608784A (en) 1994-01-24 1997-03-04 Miller; Joel F. Method of personnel verification using voice recognition
US5604790A (en) 1994-08-31 1997-02-18 Lucent Technologies Inc. Voice processing call announcement and answering system
US5594789A (en) 1994-10-13 1997-01-14 Bell Atlantic Network Services, Inc. Transaction implementation in video dial tone network
JP3591052B2 (ja) 1995-06-06 2004-11-17 松下電器産業株式会社 構内電話システムおよびその情報処理方法
US5752186A (en) * 1995-06-07 1998-05-12 Jeman Technologies, Inc. Access free wireless telephony fulfillment service system
US5999611A (en) * 1996-11-19 1999-12-07 Stentor Resource Centre Inc. Subscriber interface for accessing and operating personal communication services
US6064963A (en) * 1997-12-17 2000-05-16 Opus Telecom, L.L.C. Automatic key word or phrase speech recognition for the corrections industry
US6052439A (en) * 1997-12-31 2000-04-18 At&T Corp Network server platform telephone directory white-yellow page services

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100487533B1 (ko) * 2002-09-16 2005-05-03 엘지전자 주식회사 디지털 사설 교환기에서의 가입자 데이터 자동송수신방법

Also Published As

Publication number Publication date
EP0935378B1 (en) 2008-01-30
DE69839068D1 (de) 2008-03-20
KR100369696B1 (ko) 2003-01-30
DE69839068T2 (de) 2009-01-22
TW401673B (en) 2000-08-11
EP0935378A2 (en) 1999-08-11
EP0935378A3 (en) 2003-06-11
JP2000013510A (ja) 2000-01-14
US6327343B1 (en) 2001-12-04

Similar Documents

Publication Publication Date Title
KR100369696B1 (ko) 자동 호출 및 데이터 전송 프로세싱 시스템 및 방법
US6651042B1 (en) System and method for automatic voice message processing
US5651055A (en) Digital secretary
US6891932B2 (en) System and methodology for voice activated access to multiple data sources and voice repositories in a single session
JP4247929B2 (ja) 電話における自動音声認識のための方法
US6775360B2 (en) Method and system for providing textual content along with voice messages
RU2303332C2 (ru) Система отправки текстовых сообщений, преобразованных в речь, через соединение интернет с телефоном и способ ее работы
US6370238B1 (en) System and method for improved user interface in prompting systems
US6584181B1 (en) System and method for organizing multi-media messages folders from a displayless interface and selectively retrieving information using voice labels
US20020069060A1 (en) Method and system for automatically managing a voice-based communications systems
US7274776B1 (en) Methods and systems for routing a call
US20130294590A1 (en) Voice Response Apparatus and Method of Providing Automated Voice Responses with Silent Prompting
JP2000078296A (ja) 対話的音声応答システムにおける指示方法および対話的音声応答システム
JP2008015439A (ja) 音声認識システム
US20030233231A1 (en) Apparatus and method for managing privacy using voice recognition and caller identification
JP2004503183A (ja) 電気通信セッションの進行中に電話番号を自動的に記録する方法と装置
KR100443498B1 (ko) 음성 홈페이지 시스템을 이용한 부재중 자동응답시스템
JP2004173124A (ja) 顧客データの管理方法
US20040037399A1 (en) System and method for transferring phone numbers during a voice call
EP1111891A2 (en) Method for addressing a message from a telephone
WO2004105369A1 (en) Vocal assistant to provide predefined text messages to a call using text-to-speech converter
KR980013219A (ko) 통신망을 통한 음성사서함 서비스에 있어서의 음성수첩 서비스 방법 및 그 장치
Holdsworth Voice processing
KR20020072359A (ko) 음성인식을 이용한 무인 자동 전화교환 및 웹메일링시스템 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee