KR19990067916A

KR19990067916A - 자동 호출 및 데이터 전송 프로세싱 시스템 및 방법

Info

Publication number: KR19990067916A
Application number: KR1019990000960A
Authority: KR
Inventors: 엡스테인마크에드워드; 카네브스키디미트리; 마에스스테판허만
Original assignee: 포만 제프리 엘; 인터내셔널 비지네스 머신즈 코포레이션
Priority date: 1998-01-16
Filing date: 1999-01-15
Publication date: 1999-08-25
Also published as: EP0935378B1; DE69839068D1; KR100369696B1; DE69839068T2; TW401673B; EP0935378A2; EP0935378A3; JP2000013510A; US6327343B1

Abstract

호출자 또는 발신자의 신원, 메시지 또는 요구의 주제, 및/또는 일일 시각에 근거하여 인입 전화 호출, 팩시밀리, e-메일을 자동적으로 프로세스하는 프로그램가능한 자동 호출 및 데이터 전송 프로세싱 시스템이 제공되며, 이 시스템은 인입 호출을 자동 응답하고 호출자의 음성 데이터를 수집하는 중앙 서버와, 서버에 접속되어 호출자 또는 발신자를 식별하는 화자 인식 모듈과, 화자 인식 모듈에 응답하여 호출자 또는 발신자의 식별에 근거한 사전프로그래밍된 프로시쥬어에 따라 호출 또는 메시지를 프로세스하는 스위칭 모듈과, 서버, 화자 인식 모듈, 스위칭 모듈을 프로그래밍하는 프로그래밍 인터페이스를 포함한다. 시스템은 호출자 또는 발신자의 신원, 메시지의 주제 및 내용, 일일 시각에 근거하여 인입 전화 호출 또는 e-메일 및 팩시밀리 메시지를 프로세스하도록 사용자에 의해 프로그래밍된다. 이러한 프로세싱은 호출을 다른 시스템으로 스위칭하고, 그 호출을 다른 전화 터미널에 전송하며, 호출을 대기 상태에 두거나, 호출을 접속 해제하는 프로세싱을 포함하나, 이것에 한정되지는 않는다. 본 발명의 다른 관점에서, 시스템은 음성 메일, 팩시밀리/모뎀 또는 e-메일과 같은 다른 원격 통신 디바이스로부터 불러온 정보를 프로세스하는데 사용될 수도 있다. 시스템은 원격 회의에 대한 호출자 또는 가입자의 신원을 태그하고, 이러한 호출자 또는 가입자의 원격 회의(teleconference), 전화 통화, 메시지를 전사(轉寫)(transcribe)할 수 있다. 시스템은 호출자 식별, 또는 통화나 메시지의 주제에 따라 수신된 호출, 메시지, e-메일, 팩시밀리를 자동으로 인덱싱하거나 또는 우선 순위를 부여할 수 있으며, 사용자로 하여금 특정의 소스 또는 호출자로부터 개시된 메시지를 불러오거나, 유사한 또는 특정의 주제를 취급하는 호출을 불러오도록 할 수 있다.

Description

자동 호출 및 데이터 전송 프로세싱 시스템 및 방법{SYSTEM AND METHODS FOR AUTOMATIC CALL AND DATA TRANSFER PROCESSING}

본 발명은 자동 호출 및 데이터 전송 프로세싱을 제공하는 시스템 및 방법에 관한 것으로, 보다 상세하게는 호출자 또는 발신자의 신원, 메시지 또는 요구의 주제 및 내용, 및/또는 이러한 호출 또는 메시지의 일일 시각(time of day)에 근거하여 사전프로그래밍된 프로시쥬어에 따라 자동 호출 및 데이터 전송 프로세싱을 제공하는 시스템 및 방법에 관한 것이다.

통상 과거에는, 호출 프로세싱은 사업주, 비서 또는 지역의 중앙 전화국 서비스에 의해 수동으로 수행되어 왔다. 몇몇 호출 프로세싱 기능을 부분적으로 수행하는 특정의 통상적인 디바이스가 있다. 예를 들면, 통상적인 응답기 및 음성 메일 서비스는 인입 전화 메시지를 기록하며, 이후에 이들은 이러한 디바이스 또는 서비스의 사용자에 의해 재생된다. 또한, 데스크탑 전화 소프트웨어 또는 지역 PBX(구내 교환기)는 전화망 교환 기능을 제공한다. 그러나, 이러한 통상적인 응답기, 음성 메일 서비스 및 스위칭 시스템은 호출자의 신원에 응답하여 개별적인 프로세싱 프로시쥬어를 자동으로 수행하거나 호출 또는 메시지의 내용이나 주제를 평가하고 그에 따라 이러한 호출 또는 메시지를 처리할 수가 없다. 대신에, 사용자는 먼저 사용자 자신의 전화 호출에 수동으로 응답하거나, 또는 응답기나 음성 메일로부터 이러한 호출을 불러내어, 그 다음에 매 호출 마다 하나씩 어떻게 진행해야 할지 결정해야 한다. 본 발명은 이러한 번거로운 수동 프로세싱을 제거하거나 경감시킨다.

또한, 듀얼 톤 다주파(Dual Tone Multi-Frequency:DTMF) 키잉(keying)에 의해 응답기 및 음성 메일 서비스가 보호된다고는 하지만, DTMF 키에 의해 입력되는 유효한 개인 식별 번호(personal identification number:PIN)를 갖는 호출자에 의해 원격으로 액세스되거나 또는 재프로그래밍될 때 호출자를 식별하거나 확인할 수 없다. 또한, 통상적인 원격 회의 센터는 또한 액세스 기능을 위해 DTMF PIN에 의존하지만, 원격 회의 동안 화자의 신원을 확인하고 꼬리표를 붙일(tag) 수 없다. 따라서 이러한 응답기, 음성 메일, 원격 회의 센터는 그렇지 않았으면 유효하였을 PIN에 액세스할 수 있는 허가받지 않은 사람에 의해 침해당할 수도 있다.

따라서 본 발명의 목적은 호출자나 발신자의 신원, 호출이나 메시지의 주제, 및/또는 일일 시각에 근거하여 사전결정된 방식에 따르는 자동 호출 및 데이터 전송 프로세싱을 위한 시스템 및 방법을 제공하는 것이다.

본 발명의 다른 목적은 전화, 팩시밀리, e-메일에 의해 수신된 메시지 뿐만 아니라, 호출 프로세싱 시스템에 의해 전자적으로 수신된 다른 데이터를 먼저 전사(轉寫)(transcribe)하고 나서, 이러한 e-메일 또는 팩시밀리 메시지의 호출자(또는 원격 회의에 대한 가입자) 또는 발신자의 신원을 태그한 다음에, 이들의 기점 및 주제에 따라 이러한 호출, 통화, 메시지를 인덱싱하여, 허가된 사용자가 지역적으로, 또는 원격으로, 시스템을 액세스하여 이러한 전화 통화 또는 메시지를 재생하거나, 합성된 음성 형태의 이러한 e-메일 또는 팩시밀리 메시지를 불러오도록 할 수 있는 호출 프로세싱 시스템을 제공하는 것이다.

본 발명의 또다른 목적은 허가된 사용자에 의해 음성으로 활성화된 커맨드에 응답하며(즉, 액세스가능하고 프로그램가능하며), 사용자가 호출 또는 메시지를 액세스하거나 또는 시스템을 프로그래밍하기 전에 사용자를 식별하고 확인할 수 있는 시스템을 제공하는 것이다.

본 발명의 한 측면에 있어서, 프로그램가능한 자동 호출 및 메시지 프로세싱 시스템은 인입 호출을 수신하는 서버 수단과, 서버 수단에 동작가능하게 접속되어 호출자를 식별하는 화자 인식 수단과, 서버 수단에 동작가능하게 접속되어 호출의 주제 및 내용을 판단하는 음성 인식 수단과, 화자 인식 수단 및 음성 인식 수단에 응답하여, 호출자의 신원 및/또는 호출의 주제에 따라 호출을 프로세싱하는 스위칭 수단과, 서버 수단, 화자 인식 수단, 음성 인식 수단, 스위칭 수단에 동작가능하게 접속되어 시스템이 프로세싱을 수행하도록 프로그래밍하는 프로그래밍 수단을 포함한다.

시스템은 바람직하게 호출자의 신원에 근거하여 사전결정된 방식으로 인입 전화 호출을 프로세스하도록 사용자에 의해 프로그래밍된다. 이러한 프로세싱은 호출을 다른 시스템으로 스위칭하고, 호출을 다른 원격 통신 터미널에 전송하며, 호출을 전사될 응답기로 방향설정하고, 호출을 대기 상태에 두거나, 호출을 접속 해제하는 프로세싱을 포함하나, 이것에 한정되지는 않는다.

본 발명의 다른 측면에서, 시스템은 그 내용이나, 주제에 따라, 또는 수신되는 일일 시각에 따라, 인입 전화 호출, 팩시밀리 또는 e-메일 메시지를 프로세스하도록 사전프로그래밍될 수 있다. 또한, 본 시스템은 바람직하게 이러한 인자의 조합, 즉, 호출자의 신원, 호출의 주제 및 내용, 일일 시각에 따라 인입 전화 호출, 팩시밀리 또는 e-메일을 프로세스하도록 프로그래밍될 수도 있다. 또한, e-메일 메시지(및LOTUS NOTES와 같은 애플리케이션 특정의 소프트웨어에 의해 생성된 다른 메시지)는 무드 스탬프(mood stamps), 즉, 전송자가 메시지의 기밀성 또는 긴급성과 같은 메시지 속성을 표시할 수 있게 하는LOTUS NOTES와 같은 특정의 메일 프로그램에 의해 제공된 정보 필드에 따라 프로세스될 수 있다. 차후의 e-메일 또는 데이터 교환 기법에 대해, 이러한 정보는 e-메일 또는 팩시밀리의 헤더에 포함될 수 있다. 또한, 시스템은 호출자를 프롬프트하여 메시지 속성의 시스템을 명시적으로 전달하도록 프로그래밍될 수 있다. 또한, 본 시스템은 음성 메일 시스템 또는 응답기와 같은 다른 원격 통신 디바이스로부터 데이터를 불러오고 프로세스하도록 구성될 수도 있다.

본 발명의 또다른 측면에서, 본 발명의 호출 프로세싱 시스템은 원격 회의에 대한 호출자 또는 가입자의 신원을 태그하면서, 이러한 호출자나 가입자의 메시지 또는 통화를 전사할 수 있다. 따라서, 본 시스템은 주제, 또는 호출자나 발신자, 또는 이들 모두의 신원에 따라 이러한 호출 또는 메시지를 전송함으로써, 음성 메일, e-메일, 팩시밀리 메시지 뿐만 아니라, 전화 메시지 및 통화를 자동으로 관리할 수 있다. 구체적으로, 본 발명은 이러한 식별 및 트랜스크립션과 조합하여, 기점 및/또는 주제에 따라 수신된 전화 호출 및 e-메일 및 팩시밀리 메시지를 자동으로 인덱싱하거나 또는 우선 순위를 부여하여 허가된 사용자가 특정의 메시지, 예를 들면 유사하거나 또는 특정의 주제를 취급하는 특정의 소스 등으로부터 개시된 메시지를 불러오게 한다.

본 발명의 다른 측면에서, 본 시스템은 시스템이 사용자 또는 호출자를 합성된 음성 형태로 프롬프트(즉, 질의)하게 하여, 사용자 또는 호출자에 의한 합성된 음성으로 질의 또는 요구에 대한 응답을 제공하고 합성된 음성의 e-메일 및 팩시밀리 메시지를 재생하게 하는 텍스트-음성 성능을 포함한다. 본 시스템은 기록된 전화 메시지 및 다른 기록된 오디오 데이터를 재생하기 위한 재생 성능을 또한 포함한다.

도 1은 본 발명에 따른 자동 호출 및 데이터 전송 프로세싱 시스템의 전반적인 기능을 예시하는 블록도.

도 2는 본 발명의 실시예에 따른 호출 및 데이터 전송 프로세싱 시스템용 모듈간의 기능적 상호접속을 예시하는 블록 흐름도.

도 3 및 4는 본 발명에 따른 호출 또는 데이터 전송 프로세싱 방법을 예시하는 흐름도.

도면의 주요 부분에 대한 부호의 설명

10 : 자동 호출 및 데이터 전송 프로세싱 시스템

12 : 사용자14 : 호출자

16 : 접속, 접속 해제, 대기18 : 원격 통신 시스템

20 : 서버22 : 화자 인식기 모듈

24 : ASR/NLU 모듈26 : 언어 식별기/번역기

28 : 스위칭 모듈30 : 식별 태거 모듈

32 : 전사 모듈34 : 인덱서/우선 순위 부여기 모듈

36 : 음성 합성기 모듈38 : 프로그래밍 인터페이스

40 : 레코더42 : 압축/압축 해제 모듈

본 발명의 다른 목적, 특징, 장점은 첨부되는 도면과 함께, 다음의 본 발명의 예시적인 실시예의 상세한 설명으로부터 명배해질 것이다.

도 1을 참조하면, 본 발명의 자동 호출 및 데이터 전송 프로세싱 시스템의 전반적인 기능을 예시하는 블록도가 도시되어 있다. 본 발명은 사용자에 의해 사전결정된 방식으로 인입 전화 호출을 프로세스하도록 허가된 사용자(블록(12))에 의해 프로그래밍될 수 있는 자동 호출 및 데이터 전송 프로세싱 머신에 관한 것이다. 본 발명은 디지탈 또는 아날로그 채널을 통해 수신될 수 있는 임의의 음성 데이터 뿐만 아니라, 전자적으로 수신되고 판독가능한 텍스트로 다른 방식으로 변환가능한 데이터를 프로세스하도록 사용될 수도 있으나, 본 발명의 일 실시예는 전화 통신 프로세싱을 수반한다. 특히, 본 시스템(10)은 호출자(블록(14))로부터의 인입 전화 호출에 자동으로 응답하고, 사용자(블록(12))에 의해 시스템(10)이 프로그래밍된 방식에 따라, 시스템((10)은, 예를 들면 다른 원격 통신 시스템 또는 응답기(블록(18))로 호출을 스위칭하거나, 또는 호출을 직접 처리함으로써, 예를 들면 호출자를 접속하고, 접속 해제하거나 대기 상태에 둠으로써(블록(16)) 프로그래밍된다. 또한, 시스템(10)은 인입 전화 호출을 특정의 순서로 각종 원격 통신 시스템에 라우팅시키거나(예를 들면, 이러한 호출이 응답될 때까지 호출을 몇몇 사전결정된 전화 번호에 보내는 식으로) 또는 이러한 모든 시스템에 동시에 경로지정하도록 프로그래밍될 수 있다. 도 1의 블록(16)에 도시한 옵션 뿐만 아니라, 블록(18)에 리스트된 원격 통신 시스템은 시스템(10)의 수행을 위해 프로그래밍될 수 있는 프로세싱 프로시쥬어의 예에 불과할 뿐 여기에 한정되는 것은 아님에 주의해야 한다.

본 발명의 다른 실시예에서, 시스템(10)은 인입 팩시밀리 및 e-메일 메시지를 프로세스하거나, 또는 e-메일이나 음성 메일 시스템으로부터의 메시지를 자동으로 불러오도록 프로그래밍될 수도 있다. 따라서, 시스템(10)을 블록(18)의 원격 통신(예를 들면, e-메일, 음성 메일, 팩시밀리/모뎀 및 응답기)에 접속하는 도 1의 양방향성 라인은 시스템(10)이 데이터(예를 들면, 호출 또는 메시지)를 이러한 시스템에 전송하고, 이러한 시스템에 저장되거나 기록된 데이터를 불러오여 프로세스하도록 설계되어 있음을 나타낸다는 것을 알아야 한다. 예를 들면, 시스템(10)은 기록될 응답기(블록(18))에 호출을 보냄으로써 특정의 호출을 프로세스하도록 프로그래밍될 수 있다. 이후 시스템(10)은 기록된 메시지를 응답기로부터 불러내며, 기록된 메시지는 그 시스템(10)에 의해 특정의 방식으로 디코딩되고 프로세스된다. 또한, 시스템(10)은 인입 전화 호출 또는 메시지를, 사용자의 페이저, 셀룰라폰 또는 e-메일로 전송될 수 있는 페이지로 변환하도록 프로그래밍될 수 있다.

본 발명의 실시예에 따른 시스템(10)의 기능 모듈 및 이들의 특정한 상호작용은 이하 도 2를 참조하여 설명될 것이다. 도면에서 동일하거나 유사한 구성요소는 동일한 참조 부호로 지정되어 있음에 유의해야 한다. 또한 본 발명에 따라 본 명세서에서 기술된 기능적인 모듈은 하드웨어, 소프트웨어, 또는 그의 조합으로 구현될 수 있음에 유의해야 한다. 바람직하게, 본 발명의 주요한 음성 및 화자 인식, 언어 식별 모듈, 인덱싱 모듈은, 예를 들어 본 발명의 구성요소를 실행하는 프로세서, 연관 메모리, 입/출력 인터페이스를 각각 갖는 하나 이상의 적절하게 프로그래밍된 범용 디지탈 컴퓨터 또는 컴퓨터들상에서 소프트웨어로 구현된다. 본 발명은 적절하게 프로그래밍된 범용 컴퓨터 또는 컴퓨터들상에서 구현되는 한편, 도 2의 기능적 요소는 본 발명을 실행하는 적절하고 바람직한 프로세서 아키텍처를 포함하는 것으로 간주될 수 있으며 이러한 컴퓨터 또는 컴퓨터들내에서 프로그래밍을 통해 구현될 수 있는 예시적인 기능적 구성요소임에 유의해야 한다. 또한, 도 2의 기능적인 구성요소는 하나 이상의 범용 마이크로프로세서를 프로그래밍함으로써 구현될 수 있다. 물론, 본 발명을 구현하기 위해 특수용 마이크로프로세서가 사용될 수도 있다. 본 명세서에 제공된 본 발명의 개시에 따라, 당업자라면 본 발명의 구성요소의 구현 및 이와 유사한 구현을 생각할 수 있을 것이다.

도 2를 참조하면, 시스템(10)은 바람직하게 각종 원격 통신 시스템에 접속된 서버(20)를 포함하며, 이 원격 통신 시스템은 전화 호출 및 메시지 데이터를 각각 수신하고 송신하는 하나 이상의 전화선(블록(14)), 하나 이상의 팩시밀리 및 모뎀선(도 1 및 도 2에서 블록(18))을 포함하나, 이들에만 한정되지는 않는다. 서버(20)는 인입 전화 호출에 자동 응답하고 인입 팩시밀리 통신을 수신하도록 프로그래밍된다. 시스템(10)은 국부적 네트워크 메일 서버를 액세스하는 영구적인 인터넷/인트라넷 접속을 또한 포함하며, 이에 의해 서버(20)는 이러한 국부적 네트워크 메일 서버에 (TCP/IP를 통해) 주기적으로 접속하여 인입 e-메일을 수신하고 프로세스하며, e-메일 메시지를 송신하도록 프로그래밍될 수 있다. 이와 달리, 시스템(10)이 국부적 네트워크 서버에 영구적으로 접속되지 않으면, 시스템 서버(20)는 e-메일 메시지를 불러오거나 전송하기 위해 인터넷 제공자에 대해 액세스 번호를 주기적으로 다이얼링하도록 프로그래밍될 수 있다. 이러한 프로시쥬어는 사용자가 시스템(10)을 액세스할 때 (이러한 e-메일 계정을 자동으로 모니터링하는 것과는 달리) 사용자의 옵션으로 또한 수행될 수도 있다.

또한, 도 1 및 도 2(블록(18))에 도시한 바와 같이, 서버(20)는 사용자가 이러한 음성 메일 및 응답기 시스템상에 기록된 메시지를 불러와서 프로세스하도록 음성 메일 시스템 및 응답기에 직접 접속될 수 있다. 국부적 네트워크 시스템에 시스템(10)이 접속되는 경우, 서버(20)는 그 서버(20)에 직접 접속되지는 않으나, 국부적 네트워크를 통해 다른 방식으로 액세스가능한 다른 음성 메일 시스템 또는 응답기로부터의 메시지를 주기적으로 불러오도록 프로그래밍될 수 있으며, 이에 따라 시스템(10)은 이러한 음성 메일 시스템 또는 응답기로부터의 메시지를 자동으로 모니터링하고 불러올 수 있다.

서버(20)는 바람직하게 디지탈 형태인 오디오 데이터(예를 들면, 음성 메일 또는 응답기로부터 불러온 인입 전화 호출 또는 메시지)를 기록하고 저장하는 레코더(40)를 포함한다. 또한, 서버(20)는 바람직하게 시스템(10) 메모리(도시되지 않음)의 데이터 저장 기능을 증대시키기 위해, 디지탈화된 오디오 데이터 뿐만 아니라, e-메일 및 팩시밀리를 통해 수신된 메시지 데이터를 압축하고, 이러한 데이터가 메모리로부터 불러올 때 재구성 전에 이러한 데이터를 압축 해제하는 압축/압축 해제 모듈(42)을 포함한다.

서버(20)에는 화자 인식기 모듈(22) 및 자동 음성 인식/자연어 이해(ASR/NLU) 모듈(24)이 동작가능하게 접속된다. 화자 인식기 모듈(22)은 서버(20)에 의해 수신된 음성 데이터로부터의 원격 회의 호출에 대한 호출자(14) 및 가입자의 신원 뿐만 아니라, 수신된 팩시밀리 또는 e-메일 메시지의 발신자의 신원을 판단한다. ASR/NLU 모듈(24)은 서버(20)로부터 수신된 음성 데이터 및 다른 메시지 데이터를 판독가능한 텍스트로 변환하여 이러한 호출, 통화 또는 메시지의 내용 및 주제를 판단한다. 또한, 이하 더 설명되는 바와 같이, ASR/NLU 모듈(24)은 허가된 사용자로부터 구두(verbal) 커맨드를 프로세스하여, 시스템(10)을 원격으로 프로그래밍할 뿐만 아니라, 메시지를 생성하거나 불러온다. ASR/NLU 모듈(24)은 호출자 및 허가된 사용자로부터의 음성 데이터를 또한 프로세스하여 대화형 음성 응답(interactive voice response:IVR) 기능을 수행한다. 언어 식별자/해석기 모듈(26)은 ASR/NLU 모듈(24)에 동작가능하게 접속되어 있으며, 시스템(10)이 예를 들어 캐나다와 같은 다언어 국가에서 사용될 때 외국어 메시지를 이해하고 적절하게 응답할 수 있도록 한다.

스위칭 모듈(28)은 화자 인식기 모듈(22) 및 ASR/NLU 모듈(24)에 동작가능하게 접속되어 있으며, 화자 인식기 모듈(22) 및/또는 ASR/NLU 모듈(24)에 의해 수신된 데이터를 프로세스한다. 스위칭 모듈은 사전프로그래밍된 프로시쥬어에 따라 인입 전화 호출 또는 팩시밀리나 e-메일 메시지에 대한 프로세싱 프로시쥬어를 수행(예를 들어, 음성 메일이나 응답기로 호출을 보내는 등)한다.

식별(ID) 태거(tagger) 모듈(30)은 화자 인식기 모듈(22)에 동작가능하게 접속되어 있으며, 호출자의 메시지 또는 통화에 대해 호출자의 신원을 전자적으로 태그하거나 또는 e-메일이나 팩시밀리 메시지의 발신자의 신원을 태그한다. 또한, 원격 회의의 배경으로 동작하는 경우, ID 태거(30)는 현재 말하고 있는 사람의 신원을 태그할 것이다. 전사 모듈(32)은 ASR/NLU 모듈(24)에 동작가능하게 접속되어 있으며, 전화 메시지 또는 통화, 원격 회의 및/또는 팩시밀리 메시지를 전사한다. 또한, 전사 모듈(32)은 사용자에 의해 다이얼링된 구두 메시지를 전사할 수 있으며, 이는 계속해서 시스템(10)에 의해 전화, 팩시밀리 또는 e-메일을 통해 전송될 수 있다.

오디오 인덱서/우선 순위 부여기(indexer/prioritizer) 모듈(34)은 ID 태거 모듈(30) 및 전사 모듈(32)에 동작가능하게 접속된다. 오디오 인덱서/우선 순위 부여기 모듈(34)은 전사 모듈(32) 및 ID 태거 모듈(30)에 의해 각각 프로세스되는 트랜스크립션 데이터 및 호출자 식별 데이터 뿐만 아니라, 호출 시간, (이용가능하다면 자동 번호 식별(antomatic number identification: ANI)을 통한) 개시 전화 번호, e-메일 어드레스를 사전프로그래밍된 방식으로 저장하여, 사용자가 특정 당사자로부터의 특정의 호출이나 메시지, 또는 특정 주제에 관한 호출이나 메시지를 불러오게 한다. 또한, 오디오 인덱서/우선 순위 부여기는 특정의 호출 또는 메시지에 우선 순위를 부여하고 사용자에게 이러한 호출 또는 메시지를 통지하도록 프로그래밍될 수 있다.

음성 합성기 모듈(36)은 오디오 인덱서/우선 순위 부여기 모듈(34)에 동작가능하게 접속되어 있으며, 사용자가 오디오 형태(즉, 합성된 음성)의 메시지(e-메일 또는 팩시밀리)를 불러올 수 있도록 한다. 음성 합성기는 또한 ASR/NLU 모듈에 동작가능하게 접속되어 (예를 들면, 컴퓨터 모니터상에 디스플레이되는 것과는 달리) 합성된 음성 형태의 시스템 프롬프트(즉, 질의)를 제공한다.

프로그래밍 인터페이스(38)는 서버(20), 화자 인식기 모듈(22), 언어 식별기/번역기 모듈(26), ASR/NLU 모듈(24), 오디오 인덱서/우선 순위 부여기 모듈(34), 스위칭 모듈(28)에 동작가능하게 접속되어, 사전결정된 프로시쥬어에 따라 시스템(10)이 호출 및 메시지를 프로세스하도록 프로그래밍한다. 이하 보다 상세하게 설명되는 바와 같이, 사용자는 음성 커맨드나 GUI(그래픽 사용자 인터페이스), 또는 두 가지 모두를 통해 프로그래밍 인터페이스(38)를 이용하여 시스템(10)을 프로그래밍할 수 있다. 바람직한 실시예에서, 시스템(10)은 사용자(즉, 음성 커맨드 모드)로부터의 구두 커맨드에 의해 프로그래밍된다. 구체적으로, 사용자는 시스템(10)내로 호출함으로써 원격으로, 또는 마이크로폰에 의해 국부적으로, 구두 커맨드에 의해 시스템(10)을 프로그래밍할 수 있다. 프로그래밍 인터페이스(38)는 서버(20)에 접속되며, 서버(20)는 화자 인식기 모듈(22) 및 ASR/NLU 모듈(24)과 함께 사용자의 구두 프로그래밍 커맨드를 프로세스하기 전에 사용자의 신원을 확인한다. 시스템(10)은 구두 프로그래밍 커맨드에 관한 정보 뿐만 아니라, 시스템(10)의 현재의 프로그래밍 구조를 (GUI를 통해) 디스플레이하거나 또는 (음성 합성기(36)를 통해) 재생할 수 있다.

다른 실시예에서, 시스템(10)은 PC 및 GUI 스크린을 통해 국부적으로 프로그래밍되거나, 또는 원격 위치로부터 컴퓨터 네트워크를 통해 시스템(10)을 액세스함으로써 원격으로 프로그래밍될 수 있다. 통상적인 윈도우 인터페이스와 유사하게, 사용자는 GUI상에 디스플레이될 수 있는 특정의 필드를 선택함으로써 시스템(10)을 프로그래밍할 수 있다. 음성 커맨드 및 GUI의 조합을 통해 시스템(10)이 프로그래밍될 수도 있음이 이해될 것이다. 이러한 상황에서, GUI는, 예를 들면 시스템(10)을 프로그래밍하기 위해 필수적인 음성 커맨드를 제공함에 있어 사용자에 도움을 제공할 수 있다. 또한, 시스템(10)은 도 2의 기능적 모듈을 제어하는 대응하는 프로그래밍 구성 화일을 편집함으로서 프로그래밍될 수 있다.

이제 도 2, 3, 4를 참조하여 본 발명의 동작이 기술될 것이다. 도 2에서 본 발명의 설명은 본 발명의 동작을 예시하는 흐름도 뿐만 아니라, 본 발명의 실시예를 도시하는 블록도로서 간주될 수 있음이 이해될 것이다. 서버(20)는 인입 전화 호출, e-메일, 팩시밀리/모뎀, 또는 다른 전자 음성 또는 메시지 데이터에 자동으로 응답하도록 프로그래밍된다(단계 100). 서버(20)는 소스를 표시하는 각 메시지의 앞 부분에 있는 특수 코드, 즉 프로토콜에 의해 인입 전화 호출, e-메일 메시지, 팩시밀리 메시지 등을 구별한다. 특히, 서버(20)는 먼저 인입 호출이 전화 통신인 것으로 가정한다. 따라서 서버(20)가 예를 들어 모뎀 핸드쉐이크(handshake) 신호를 수신함에 의해 시스템(10)이 호출을 컴퓨터 접속 프로토콜로서 처리하지 않을 경우에는, 서버는 이에 따라 그대로 진행할 것이다(단계 110). 시스템(10)은 다른 계정으로부터 음성 메일 및 e-메일 메시지를 주기적으로 호출하고 불러옴으로써 이러한 음성 메일 및 e-메일 계정을 모니터링하도록 프로그래밍될 수 있음을 이해해야 한다.

서버(20)에 의해 수신된 인입 호출이 전화 호출인 것으로 판단되면, 레코더(40)에 의해 오디오 데이터(예를 들면, 인입 호출 뿐만 아니라 음성 메일 또는 응답기로부터 불러온 호출)가 기록된다(단계 112). 레코더(40)는 아날로그 레코더 또는 디지탈 오디오 테이프("DAT")와 같은 임의의 통상적인 디바이스일 수 있다. 바람직하게, 레코더(40)는 디지탈 레코더, 즉 오디오 데이터를 디지탈 데이터로 변환하는 아날로그-디지탈 변환기이다. 디지탈화된 오디오 데이터는 메모리(도 2에 도시되지 않음)에 저장(단계 116)되기 전에 압축/압축 해제 모듈(42)에 위해 압축될 수 있다(단계 114). 1989년 에스. 푸루이 데커(S. Furui, Dekker)에 의한 "Digital Signal Processing, Synthesis and Recognition"에 개시된 알고리즘과 같은 임의의 통상적인 알고리즘이 사용되어 압축/압축 해제 모듈(42)에 의해 메시지 데이터를 프로세스 할 수 있음이 이해될 것이다.

다음에, 오디오 데이터를 기록하고 저장함과 동시에, 시스템(10)에 의한 질의에 대한 호출자의 오디오 통신 및/또는 오디오 응답을 프로세스함으로써 호출자의 신원이 판단된다. 구체적으로, 서버(20)에 이해 호출자의 구두 명령문 및 응답이 수신되고 화자 인식기 모듈(22)로 송신되며, 이러한 구두 명령문 및 응답이 프로세스되어 이전에 저장된 화자 모델과 비교된다(단계 120). 이러한 화자의 이전에 저장된 음성 모델과 수신된 음성 데이터를 매칭(match)시킴으로써 화자가 식별된(단계 130) 경우, 또한 시스템(10)이 호출자의 신원에 근거하여 호출을 프로세스하도록 사전프로그래밍되는 경우, 시스템(10)은 이러한 사전프로그래밍된 프로시쥬어에 따라 전화 호출을 프로세스할 것이다(단계 152).

한편, 화자(예를 들어, 제 1 시간 호출자)가 이전에 저장된 음성 모델을 통해 식별될 수 없는 경우, 화자 식별은 화자 인식기 모듈(22) 및 ASR/NLU 모듈(26)에 의해 수행될 수 있으며, 이에 의해 ASR/NLU 모듈(26)에 의해 전화 메시지의 내용이 호출자의 이름을 추출하도록 프로세스되며, 호출자의 이름은 호출자의 신원을 판단하기 위해 이전에 저장된 명칭과 비교된다(단계 140). 호출자의 신원이 판단되면, 시스템(10)은 호출자의 신원에 따라 전화 호출을 프로세스할 것이다(단계 152).

시스템(10)이 저장된 음성 모델 전화 메시지의 또는 내용으로부터 호출자를 식별할 수 없는 경우, 화자 인식기 모듈(22)은 서버(20)에 신호를 전송하고, 이어서 서버는 호출자를 프롬프트(prompt)하여 예를 들면, "당신은 누구입니까"와 같은 질의를 통해 자기 자신의 신원을 밝히도록 하고(단계 150), 상기 식별 프로세스가 반복된다(단계 120). 서버(20)는 음성 합성기 모듈(36)로부터 합성된 음성으로 질의를 획득한다. 상기한 바와 같이, 시스템(10)은 먼저 호출자를 프롬프트하여 자기 자신의 신원을 밝히도록 하거나 또는 호출 이유에 관한 세부 사항을 질의하도록 프로그래밍될 수 있다.

일단 화자 인식기 모듈(22)에 의해 호출자 또는 발신자의 신원이 확인되었으면, 화자 인식기 모듈(22)에 의해 스위칭 모듈(28)로 신호가 전송된다. 이에 의해 스위칭 모듈(28)은 사전프로그래밍된 프로시쥬어에 따라 호출자 또는 발신자의 신원에 근거하여 호출 또는 메시지를 프로세스한다(단계 152). 한편, 호출자의 신원이 끝까지 확인되지 않는 경우, 시스템(10)은 미지 호출자에 근거하여 호출을 프로세스하도록(단계 154), 예를 들면 호출을 음성 메일에 전송하도록 프로그래밍될 수 있다. 이러한 프로그래밍은 이하 좀 더 설명할 것이지만, 프로그래밍 인터페이스 모듈(38)을 통해 사용자(12)에 의해 수행된다. 상기한 바와 같이, 시스템이 수행되도록 프로그래밍될 수 있는 프로세싱 옵션은 호출을 다른 시스템으로 스위칭하고, 호출을 다른 원격 통신 터미널(도 1 및 도 2의 블록(18))로 보내거나, 또는 호출을 특정의 당사자에게 접속시키거나, 접속 해제하거나, 호출을 대기 상태(도 1 및 도 2의 블록(16))에 둠으로써 호출을 직접 처리하는 것 등을 포함할 수 있으나, 이들에만 한정되지는 않는다.

사용자 옵션으로부터 제거되지 않은 경우에는, 새로운 호출자가 처음으로 시스템(10)과 상호작용할 때마다, 화자 모델이 구축되어 화자 인식기 모듈(22)에 저장된다. 이 모델은 호출자가 차후에 시스템(10)과 상호작용할 때, 식별 및 확인의 목적으로 화자 인식기 모듈(22)에 의해 사용된다.

필요한 음성 모델이 존재하지 않을 때 시스템(10)은 음향 특성 이외의 방법을 이용함으로써 화자 식별을 수행할 수 있음에 유의해야 한다. 예를 들어, 전화 호출에 대해, 시스템(10)은 시스템(10)의 정확도를 증대시키고/시키거나 초면(初面) 호출자의 신원을 확인하는데 추가적 정보(예를 들어, 호출자 ID)를 이용할 수 있다.

이하 더 설명되는 바와 같이, 시스템(10)은 모든 호출자(또는 지정된 호출자)의 이름 및 발신 전화 번호를 저장하도록 프로그래밍될 수 있다. 이러한 기능으로 인해 사용자는 응답 메시지를 호출자에게 자동으로 전송할 뿐만 아니라, 메시지를 특정인에게 전송하기 위해 사용자에 의해 이후 액세스될 수 있는 어드레스 북(address book)(시스템(10)에 저장됨)을 동적으로 생성한다.

애플리케이션에 따라, 시스템(10)이 모든 경우에 실시간으로(즉, 기록과 동시에 또한 실제 전화 호출의 시간 주기 동안) 화자 인식 및 자연어 이해를 수행해야 할 필요가 없음에 유의해야 한다. 예를 들어, 시스템(10)은 호출 개시시에 (IVR 프로그래밍을 통해) 호출자에게 질의하여 관련 정보(즉, 이름 및 호출 이유)를 획득하고 이러한 정보를 저장하도록 프로그래밍될 수 있다. 메모리로부터 저장된 오디오 데이터를 불러옴으로써 호출 이후에 신원 확인 프로세스가 (도 3에서 점선으로 도시한 바와 같이) 화자 인식기 모듈(22) 또는 ASR/NLU 모듈(24)에 의해 수행될 수 있다(단계 118).

호출자의 신원을 확인하기 위해 화자 인식기 모듈(22)에 의해 어떠한 유형의 화자 인식 시스템이라도 사용될 수 있음은 물론이다. 바람직하게, 본 발명에 따라 사용된 화자 인식 시스템은 이하 전 범위에서 참조 자료로 인용되는 "Apparatus And Methods For Speaker Verification / Identification / Classification Employing Non-Acoustic And/Or Acoustic Models and Databases,"이란 명칭으로 1997년 6월 11일에 출원된 미국 특허 출원 제 08/871,784 호에 개시된 바와 같은 시스템이다. 이 시스템은 텍스트 독립형 화자 확인을 수행하고 임의의 질의, 즉 음성 인식, 텍스트 독립형 화자 인식, 자연어 이해를 조합하여 질의하는 시스템이다. 보다 상세하게는, 텍스트 독립형 화자 확인 시스템은 바람직하게 이하 전 범위에서 참조 자료로 인용되는 "Text Independent Speaker Recognition for Transparent Command Ambiguity Resolution And Continuous Access Control,"이란 명칭으로 1997년 1월 28일에 출원된 미국 특허 출원 제 08/788,471 호에 상세하게 개시된 바와 같이 매 프레임별 특성 분류에 근거한다.

앞서 참조 인용된 미국 특허 제 08/871,784 호에 설명된 바와 같이, 텍스트 독립형 화자 인식은 텍스트 의존형 또는 텍스트 프롬프트형(text-prompted) 화자 인식에 비해 바람직한데, 그 이유는 텍스트 독립성에 의하면 새로운 호출자가 나타날 때마다 새로운 커맨드 또는 새로운 호출자의 신원을 확인하느라 중단될 필요없이 호출자에 대해 투명한 방식으로 화자 인식 기능이 다른 음성 인식 기반 기능과 병렬적으로 수행할 수 있기 때문이다.

다음에, 도 4를 참조하면, (또한 시스템(10)이 호출자 또는 발신자의 신원에 근거하여 호출을 프로세스하도록 프로그래밍된다고 가정하면), 인입 호출이 팩시밀리 또는 e-메일 메시지라고 판단되는 경우, 메시지 데이터(예를 들면, e-메일 계정으로부터 불러온 인입 e-메일 또는 메시지)는 ASR/NLU 모듈(24)에 의해 프로세스되고(단계 190), 압축되며(단계 192), 메모리(도시되지 않음)에 저장된다(단계 194). e-메일 메시지에 대해, (이러한 데이터는 이미 텍스트 포맷이므로) 데이터가 직접 프로세스된다. 팩시밀리 메시지에 대해, ASR/NLU 모듈(24)은 알려진 기법을 이용하여 광학적 문자 인식(OCR)을 사용하여 수신 팩시밀리 메시지를 판독가능한 텍스트로 변환한다(즉, 팩시밀리 메시지를 ASCII 화일로 전사한다).

다음에, 인입 메시지 데이터를 전사하고 저장함과 동시에, 이러한 메시지의 발신자의 신원이 ASR/NLU 모듈(24)을 통해 판단될 수 있다. 이에 의해 인입 메시지의 내용이 분석되어(단계 200) 메시지의 발신자의 이름 및 소스가 추출되며, 이것이 이후 미리 저장된 이름과 비교되어 발신자의 신원을 판단한다(단계 210). 발신자의 신원이 확인되면(단계 210), 메시지가 발신자의 신원에 근거하여 사전프로그래밍된 프로시쥬어에 따라 프로세스될 수 있다(단계 222). 한편, 발신자의 신원이 식별될 수 없으면, 미확인 발신자에 대한 사전프로그래밍된 프로시쥬어에 따라 메시지가 프로세스될 수 있다(단계 224).

상술한 바와 같이, 시스템(10)은 인입 또는 불러온 메시지를 모든 경우 실시간으로(즉, 실질적인 메시지를 전사함과 동시에) 프로세스할 필요는 없음은 물론이다. 프로세싱은 (도 4에 점선으로 도시된 바와 같이) 메모리로부터 전사된 메시지 데이터를 불러옴으로써(단계 196), e-메일 또는 팩시밀리 메시지 데이터를 수신한 이후에 ASR/NLU 모듈(24)에 의해 수행될 수 있다.

호출자 또는 발신자의 신원 이외에, 시스템(10)은 호출이나 메시지의 내용과 주제 및/또는 이러한 호출 또는 메시지가 수신된 일일 시각에 근거하여 인입 전화 호출 또는 팩시밀리나 e-메일 메시지를 프로세스하도록 사용자(12)에 의해 또한 프로그래밍될 수 있다. 도 2, 3, 4를 다시 참조하면, 인입 전화 호출 또는 e-메일이나 팩시밀리 메시지를 수신한 후에, 또는 응답기 또는 음성 메일로부터 기록된 메시지를 불러온 후에, 서버(20)는 호출 또는 메시지 데이터를 ASR/NLU 모듈(24)로 전송한다. 음성 데이터(예를 들면, 음성 메일 또는 응답기로부터 불러온 전화 호출 또는 메시지)의 경우, ASR/NLU 모듈(24)은 이러한 데이터를 기호 언어 또는 판독가능한 텍스트로 변환한다. 상술한 바와 같이, (e-메일 메시지는 판독가능한 텍스트 포맷으로 되어 있으므로) e-메일 메시지는 직접 프로세스되고 팩시밀리 메시지는 알려진 광학적 문자 인식(OCR) 방법을 이용하여 ASR/NLU 모듈(24)을 통해 판독가능한 텍스트(즉, ASCII 화일)로 변환된다. ASR/NLU 모듈(24)은 특정 키워드나 토픽을 추출하기 위한 음성 인식과 자연어 이해의 조합을 이용함으로써 호출 또는 메시지 데이터를 분석하여 호출(도 3에서 전화 호출에 대한 단계 160)이나 메시지(도 4에서 e-메일 및 팩시밀리에 대한 단계 200)의 주제 및 내용을 판단한다.

일단 ASR/NLU 모듈이 호출(도 3의 단계 170) 또는 메시지(도 4의 단계 220)의 주제를 판단하면, 신호는 ASR/NLU 모듈(24)로부터 스위칭 모듈(28)로 전송되며, 호출이나 메시지는 호출의 주제 및 내용(도 3의 단계 158) 및 메시지의 내용(도 4의 단계 228)에 근거한 사전결정된 방식으로 프로세스된다. 예를 들어, 메시지나 호출이 비상 사태나 사고에 관한 것인 경우, 스위칭 모듈(28)은 호출을 특정의 개인에게 전송하도록 프로그래밍될 수 있다.

ASR/NLU 모듈(24)이 전화 호출의 주제나 내용을 판단할 수 업슨 경우, ASR/NLU 모듈(24)은 음성 합성기(36)에 신호를 전송하고, 이어서 서버(20)에 메시지를 전송하여, 호출자를 프롬프트하여 호출의 이유를 몇 개의 워드로, 예를 들면 "당신의 호출 이유가 무엇입니까?"와 같이 명확히 발음하게 한다. 또한, 시스템(10)은 초기에 호출자를 프롬프트하여 호출 이유를 말하도록 프로그래밍될 수 있음에 유의해야 한다. 시스템(10)이 이러한 호출의 주제를 여전히 판단할 수 없는 경우, 미지의 주제에 근거한 사전프로그래밍된 프로시쥬어에 따라 프로세스될 수 있다. 마찬가지로, e-메일 또는 팩시밀리 메시지의 주제가 판단될 수 없는 경우(단계 220), 메시지는 미지의 주제에 근거한 사전프로그래밍된 프로시쥬어에 따라 프로세스될 수 있다(단계 226).

또한, 인입 호출 또는 e-메일 메시지가 시스템(10)에 생소한(즉, 사용자에게 생소한) 언어로 되어 있는 경우, ASR/NLU 모듈(24)은 언어 식별기/번역기 모듈(26)을 시그널링하여 호출이나 메시지의 특정의 언어를 식별하고 나서, 필요로 하는 번역을 ASR/NLU 모듈(24)에 제공함에 따라 시스템(10)이 호출을 이해하고 호출자를 적절한 언어로 응답하게 한다. 시스템(10)은 특정의 방식으로 미지의 언어에 의해 호출이나 메시지를 프로세스하도록 또한 사전프로그래밍될 수 있음에 유의해야 한다.

본 발명에서는, 히에로니머스 제이.(Hieronymus J.) 및 카담베 에스.(Kadambe S.)에 의한 논문 "Robust Spoken Language Identification-using Large Vocabulary Speech Recognition," Proceeding of ICASSP 97, Vol. 2 pp. 1111,에 개시된 바와 같은 잘 알려진 기계어 식별 기법, 및 허친스(Hutchins) 및 소머즈(Somers)(1992)에 의한 "An Introduction to Machine Translation," Academic Press, London; (encyclopedic overview)에 개시된 언어 번역 기법과 같은 언어 식별 및 번역을 위한 임의의 통상적인 기법이 사용될 수 있음에 유의해야 한다.

상기한 참조 문헌 이외에, 몇가지 통계적인 방법을 이용하여 언어 식별이 수행될 수 있다. 먼저, 시스템(10)이 소수의 상이한 언어(예를 들어, 본질적으로 영어 또는 불어만이 통용되는 캐나다에서)를 프로세스하도록 구성되는 경우, 시스템(10)은 (상이한 ASR 시스템을 이용하여) 입력 텍스트를 각각의 상이한 언어로 디코딩할 수 있다. 통계적인 패턴(즉, 각각의 스크립트가 분석되는 디코딩된 워드의 통계적인 분포)을 찾기 위해 몇몇 디코딩된 스크립트가 분석된다. 디코딩이 잘못된 언어로 수행되는 경우, 디코딩된 스크립트의 혼란이 매우 커질 수 있고, 그 특정의 언어는 고려 범위로부터 배제될 수 있다.

다음에, 음성(phonetic) 레벨에 대해 언어 식별이 수행될 수 있으며 시스템은 (보편적인 음성 시스템이나 상이한 언어용의 몇몇 시스템을 이용하여) 음소 세트를 인식한다. 그 다음에 시스템은 각각의 언어에 대해 디코딩된 음성 시퀀스의 빈도를 측정한다. 특정의 디코딩된 시퀀스가 통상적이지 않은 경우, 시스템은 이러한 언어를 고려 범위로부터 배제할 수 있다. 특정의 언어에 전형적인 몇가지 시퀀스가 또한 존재할 수 있다. 이러한 인수를 이용하여, 시스템은 가장 유력한 언어를 식별할 것이다.

본 발명은 언어 식별을 수행하기 위해 호출자의 신원을 이용할 수 있음에 유의해야 한다. 구체적으로, 특정의 호출자의 화자 프로파일(시스템(10)에 저장됨)이, 호출자가 특정의 언어로 말하는 것을 표시하면, 이러한 정보는 언어를 식별하는데 있어서의 인자가 될 수 있다. 반대로, 시스템(10)이 상기한 임의의 방법을 이용하여 특정의 언어를 식별하는 경우, 시스템(10)은 화자가 이러한 식별된 언어를 사용하는지를 판단하도록 화자 프로파일을 탐색함으로써 호출자의 신원을 판단할 수 있다.

서버(20)로부터 수신된 데이터를 프로세스하기 위해 ASR/NLU 모듈(24)에 의해 음성 인식 및 자연어 이해가 이용될 수 있음에 유의해야 한다. 본 발명은 바람직하게 1997년 5월 20일에 출원된 "A Statistical Translation System with Features Based on Phrases or Groups of Words,"이란 명칭의 미국 특허 제 08/859,586 호 및 1996년 1월 29일에 출원된 "Statistical Natural Language Understanding Using Hidden Clumpings,"이란 명칭의 미국 특허 제 08/593,032 호에 개시된 자연어 이해 기법을 사용하며, 이들 특허들은 이하 전 범위에서 참조 자료로 인용된다. 앞서 인용된 발명은 (특정의 알고리즘을 이용하여) 텍스트 입력을 시스템(10)에 의해 이해되고 프로세스될 수 있는 언어로 변수화(즉, 변환)하는 자연어 이해 기법에 관한 것이다. 예를 들어, 본 발명의 문맥에서, ASR/NLU 모듈(24)의 ASR 성분은 이러한 모듈의 NLU 성분에 "Bob으로부터의 첫번째 메시지를 재생하시오."와 같은 비제한 텍스트 입력을 제공한다. 이러한 텍스트는 ASR/NLU 모듈(24)의 NLU 성분에 의해 "검색-메시지(전송자=Bob, 메시지-번호=1)"로 변환될 수 있다. 이러한 변수화된 동작은 시스템(10)에 의해 이해되고 작용될 수 있다.

본 발명에서는, 제펜필드 등(Zeppenfield et al.)에 의한 "Recognition of Conversational Telephone Speech Using The Janus Speech Engine,", Proceedings of ICASSP 97, Vol. 3, pp. 1815 1997;이란 명칭의 논문에 개시된 공지된 자동 음성 인식 기능 및 케이. 쉬라이(K. Shirai) 및 에스. 푸루이(S. Furui)의 "Special Issue on Spoken Dialog," 15, (3-4) Speech Communication, 1994이란 명칭의 논문에 개시된 공지된 자연어 이해 기능이 또한 사용될 수 있다. 또한, ASR/NLU 모듈(24)의 프로그래밍을 간략화하기 위해, 친-후이 리(Chin-Hui Lee), 프랭크 케이. 숭(Frank K. Soong), 쿨딥 케이. 파이와이(Kuldip K. Paiwai)(후워 아카데믹(Huwer Academic) 발행자)에 의해 편집된 "Word Spotting from Continuous Speech Utterances,", 리차드 씨. 크로스(Richard C. Cross), Automatic Speech and Speaker Recognition, Advanced Topics, pp. 303-327, 1996에 개시된 바와 같은 키워드 스포팅(keyword spotting) 기반 인식 방법이 이용되어 특정의 중요한 메시지가 충분히 처리될 수 있음을 보장할 수 있다.

상술한 바와 같이, 자연어 이해를 이용함으로써, 시스템(10)은 사용자 또는 호출자와의 다이얼로그를 설정하도록 대화형 음성 응답(IVR) 기능을 수행하여 다이얼로그 관리 및 요구 이해를 제공할 수 있음이 이해될 것이다. 이로 인해 시스템(10)이 순서 취입(order taking) 및 다이얼로그 기반 폼 필링(dialog-based form filling)을 위해 이용될 수 있게 된다. 또한, 이러한 기능은 호출자가 호출을 프로세스하는 방법, 즉 e-메일 또는 음성 메일 메시지를 남기거나, 페이지를 전송하거나, 또는 호출을 다른 전화 번호에 전송하는 등의 방법을 결정하게 한다. 또한, 이하 설명되는 바와 같이, 이것은 시스템(10)이 음성 커맨드를 통해 사용자에 의해 원격으로 프로그래밍되게 한다.

시스템(10)은 그 시스템(10)에 허가가 부여되지 않은 액세스에 대한 보안성을 제공함이 또한 이해될 것이다. 특히, 사용자가 시스템(10)에 대해 액세스하고 관여하기 위해, 사용자는 시스템의 등록(enrollment) 프로세스를 진행해야 한다. 이러한 프로세스는 다양한 방식으로 실행될 수 있다. 예를 들어, 등록은 새로운 사용자를 호출하거나 또는 이전에 송출된 개인 식별 번호(PIN)를 입력함으로써 원격으로 수행될 수 있으며, 이에 의해 서버(20)는 새로운 사용자의 전화상에서 DTMF 키를 통해 시스템(10)내로 입력되는 PIN에 응답하도록 프로그래밍될 수 있다. 시스템(10)은 차후에 사용자 자신이 시스템(10)을 액세스하거나 프로그래밍하고자 할 때 새로운 사용자를 확인하고 식별하도록 새로운 사용자의 음성 모델을 구축할 수 있다. 이와 달리, 새로운 사용자의 기록된 전화 통화 또는 현재의 전화 통화가 또다른 식별 및 확인을 위한 필수적인 화자 모델을 구축하도록 이용될 수도 있다.

본 발명의 서버(20)는 이하 전 범위에서 참조 자료로 인용되는 "Apparatus and Methods For Providing Repetitive Enrollment in a Plurality of Biometric Recognition Systems Based on an Initial Enrollment,"이란 명칭의 특허 출원서(IBM Docket Number YO997-313)에 따라 구성될 수 있으며, 이에 따라, 다른 생물 속성의(biometric) 인식 기반형 시스템에 이용가능한 허가된 사용자(서버(20)에 저장되어 있음)의 화자 모델(즉, 생물 속성의 데이터)로 하여금 이러한 시스템을 등록하기 위해서, 사용자가 새로운 생물 속성의 모델을 체계적으로 제공할 필요없이 사용자를 자동으로 등록하게 할 수 있음이 이해될 것이다.

시스템(10)을 프로그래밍하는 목적은 GUI 인터페이스 또는 음성 커맨드를 통해 국부적으로, 또는 전화선(음성 커맨드)상에서 또는 시스템에 접속된 네트워크 시스템을 통해 원격으로, 사용자에 의해 원격으로 수행될 수 있다. 두 경우에서, 이것은 프로그래밍 인터페이스(38)를 통해 성취된다. 상술한 바와 같이, 시스템(10)을 프로그래밍하는 것은, 예를 들어, 특정의 번호, 음성 메일, 또는 응답기로 전송되어야 할 사람의 명칭을 선택하거나, 시스템(10)에 의해 인식될 특정의 키워드 또는 주제를 필요로 하는 특정의 프로세싱 프로시쥬어로서 입력하고/입력하거나, 오전 8시 및 오후 12시 사이의 비상 사태 호출 또는 사업 호출에 즉시 접속하도록 시스템(10)을 프로그래밍함으로써 성취된다. 도 2에 도시한 바와 같이, 프로그래밍 인터페이스(38)는 이러한 정보를 서버(20), 화자 인식기 모듈(22), ASR/NLU 모듈(24), 언어 식별기/번역기 모듈(26), 오디오 인덱서/우선 순위 부여기 모듈(34), 스위칭 모듈(28)에 전송하며, 이 스위칭 모듈(28)은 시스템(10)을 지시하여 사용자의 프로그래밍된 인스트럭션에 따라 호출을 프로세스한다.

프로그래밍 인터페이스는 허가된 사용자에 의해 DTMF 키 신호 또는 음성 커맨드에 응답한다. 시스템(10)을 프로그래밍하는 바람직한 방법은 DTMF 키잉 또는 GUI 인터페이스를 통하는 것과는 달리, 음성 인식 및 자연어 이해의 프로세스에 의해 음성 활성화된 커맨드를 통해 행해진다. 이러한 프로세스는 시스템(10)이, 사용자가 시스템(10)에 액세스하기 전에 사용자를 확인하고 식별하게 한다. 이것은 다른 유효한 PIN을 인지할 수 있는 허가가 부여되지 않은 사용자에 대해 보안성을 제공한다. 구체적으로, 사용자가 음성 커맨드를 통해 시스템(10)을 프로그래밍할 수 있기 전에, 서버(20)에 의해 사용자의 음성이 먼저 수신되고, 그 다음에 화자 인식기 모듈(22)에 의해 식별되고 확인된다. 일단 사용자의 식별이 확인되면, 서버(20)는 프로그래밍 인터페이스(38)를 시그널링하여 사용자가 시스템(10)을 프로그래밍하는 것으로 진행하게 된다.

시스템(10)을 프로그래밍하는 음성 커맨드는 ASR/NLU 모듈(24)에서 프로세스된다. 특히, 이러한 프로그래밍 동안, ASR/NLU 모듈(24)은 커맨드 및 제어 모드이며, 이에 의해 프로그래밍 인터페이스(38)에 의해 수신된 모든 음성 인스트럭션 또는 커맨드가 ASR/NLU 모듈(24)로 전송되고, 기호 언어로 변환되어 커맨드로서 해석된다. 예를 들어, 사용자가 시스템(10)으로 하여금 그의 부인으로부터의 모든 호출을 자신의 전화선으로 향하게 하고자 한다면, 사용자는, 예를 들어 "나의 부인 제인으로부터의 모든 호출을 즉시 접속하라."라고 말할 수 있으며, 이에 따라 시스템(10)은 이러한 프로그래밍 커맨드를 인식하고 프로세스할 것이다.

또한, 사용자는 ASR/NLU 모듈(24) 및 음성 합성기 모듈(35)을 통해 시스템(10)과의 다이얼로그를 설정할 수 있다. 사용자는 프로그래밍 인터페이스(38)를 질의함으로써, 예를 들어 "나의 응답기에 어떤 호출이 전송되고 있는가"와 같이 질의함으로써 현재의 프로그램을 체크할 수 있다. 이러한 질의는 (사용자가 외부선으로부터 시스템(10)내로 호출하고 있는 경우) 서버(20)로부터 또는 (사용자가 사무실내에 있는 경우) 프로그래밍 인터페이스(28)로부터 서버(20)를 통해 ASR/NLU 모듈(24)로 전송되며, 이 때 질의가 프로세스된다. ASR/NLU 모듈(24)은 질의에 대한 응답을 생성할 것이고, 이 질의는 음성 합성기(36)로 전송되어, 사용자에게 재생되는 합성된 메시지, 에를 들면. "모든 개인적인 호출이 당신의 응답기로 전송되고 있습니다"와 같은 메시지를 생성한다.

마찬가지로, 시스템(10)이 허가된 사용자로부터의 구두 프로그래밍 요구를 이해할 수 없는 경우, ASR/NLU 모듈(24)은 사용자에 대한 프롬프트, 예를 들면, "당신의 요구를 다시 기록하여 주십시오."와 같은 프롬프트를 생성하고 음성 합성기(36)에 의해 프로세스할 수 있다. 구체적으로, 이러한 프로그래밍 동안, 서버(20)는 프로그래밍 요구를 프로그래밍 인터페이스(38)로 전송한다. 시스템(10)이 요구를 해독할 수 없는 경우, 프로그래밍 인터페이스(38)는 실패 메시지를 서버(20)로 다시 전송하고, 이 서버(20)는 이러한 메시지를 ASR/NLU 모듈(24)에 중개한다. ASR/NLU 모듈(24)은 잠재적인 각종 의미에 대한 질의를 재프로세스하거나, 또는 사용자를 프롬프트하여 (음성 합성기(36)를 통해) 새로운 프로그래밍 요구를 송출할 수 있다.

시스템(10)은 오디오 인덱서/우선 순위 부여기 모듈(34)의 동작을 통해 시스템(10)에 접속되는 음성 메일, 전화선, 팩시밀리/모뎀, e-메일, 다른 원격 통신 디바이스를 통해 수신된 각종 메시지 및 호출을 관리하도록 프로그래밍될 수 있음이 이해될 것이다. 특히, 오디오 인덱서/우선 순위 부여기 모듈(34)은 그 주제 및 내용, 기점, 또는 둘 모두에 따라 이러한 메시지 및 전화 통화를 자동으로 정렬하고 인덱싱하도록 프로그래밍될 수 있다. 시스템(10)은 바람직하게 특정 개인으로부터 특정의 호출 및 메시지에 우선 순위를 부여하도록 또한 프로그래밍될 수 있다.

도 2를 참조하면, 시스템(10)의 오디오 인덱싱 특성은 다음과 같이 동작된다. 일단 화자 인식기 모듈(22)에 의해 호출자가 식별되고 확인되면, 화자 인식기 모듈(22)은 원격 회의에 대한 가입자 그룹중 호출자의 신원 또는 현재 화자의 신원을 자동으로 태그하는 ID 태거 모듈(30)을 시그널링한다. ID 태깅 프로세스와 동시에, 전사 모듈(32)은 전화 통화 또는 메시지를 전사한다. 태깅 프로세스는 전사된 메시지를 호출자 또는 화자의 신원과 연관시키는 것을 수반한다. 예를 들어, 원격 회의 동안, 현재의 화자에 대응하는 전사된 통화의 각 세그먼트는 이러한 각 세그먼트에 대해 개시 시간 및 종료 시간과 함께 이러한 화자의 신원으로 태그된다.

ID 태거 모듈(30) 및 전사 모듈(32)에서 프로세스된 정보는 오디오 인덱서/우선 순위 부여기 모듈(34)에 전송되며, 수신된 정보는 사전프로그래밍된 프로시쥬어에 따라 프로세스되고 저장된다. 오디오 인덱서/우선 순위 부여기 모듈(34)는 사용자가 원하는 임의의 방식으로 메시지 및 통화를 인덱싱하도록 프로그래밍될 수 있다. 예를 들어, 사용자는 특정의 호출자로부터의 메시지를 불러오하거나, 긴급한 모든 메시지를 불러오거나, 또는 특정의 주제에 관한 메시지를 불러올 수 있다. 또한, 오디오 인덱서/우선 순위 부여기 모듈(34)은 다수의 메시지를 남기거나 또는 긴급한 메시지를 남긴 호출자로부터의 호출에 우선 순위를 부여하도록 프로그래밍될 수 있다.

오디오 인덱서/우선 순위 부여기 모듈(34)에 저장된 정보는 국부적으로 또는 원격적으로 사용자에 의해 액세스되고 불러올 수 있다. 이러한 정보가 사용자에 의해 액세스되는 경우, 오디오 인덱서/우선 순위 부여기 모듈(34)은 요구된 정보를 음성 인식기 모듈(38)에 전송하며, 텍스트-음성 변환이 수행되어 사용자가 합성된 음성 형태의 메시지를 청취하게 한다. 본 발명에서는 상업적으로 입수가능한 IBMVIAVOICEGOLD소프트웨어가 제공된 엘로퀀트(Eloquent) 엔진과 같은 임의의 통상적인 음성 합성 기법이 이용될 수 있음에 유의해야 한다.

GUI 인터페이스, PIN 및 DTMF 키잉과 같은 각종 방법을 통해 오디오 인덱서/우선 순위 부여기 모듈(34)로부터 정보가 불러올 수 있음에 유의해야 한다. 그러나, 이러한 정보를 불러오는 본 발명의 바람직한 방법은 음성 활성화된 커맨드를 통해서 이루어진다. 이러한 방법은 시스템(10)으로 하여금 오디오 인덱서/우선 순위 부여기 모듈(34)에 저장되고 인덱싱된 메시지 또는 통화에 대한 액세스를 제공하기 이전에 사용자를 식별하고 확인하게 한다. 오디오 인덱서/우선 순위 부여기 모듈(34)은 사용자의 특정 음성 커맨드를 인식하고 응답하도록 프로그래밍될 수 있고, 이 음성 커맨드는 ASR/NLU 모듈(24)에 의해 프로세스되고 오디오 인덱서/우선 순위 부여기 모듈(34)로 전송되어, 특정의 메시지 및 통화를 불러온다. 예를 들어, 사용자는 음성 커맨드, 예를 들어 "Mr. Smith로부터의 모든 메시지를 재생하시오."와 같은 음성 커맨드를 통해 오디오 인덱서/우선 순위 부여기 모듈(34)에 저장되어 있는 Mr. Smith로부터의 모든 메시지를 불러올 수 있다. 이러한 커맨드는 서버(20)에 의해 수신되고 프로세싱을 위한 ASR/NLU 모듈(24)에 전송된다. ASR/NLU 모듈(24)가 질의를 이해하는 경우, ASR/NLU 모듈(24)은 서버(20)에 응답을 다시 전송하여 질의를 프로세스한다. 서버(20)는 오디오 인덱서/우선 순위 부여기 모듈(34)을 시그널링하여 합성된 e-메일 또는 팩시밀리 메시지를 생성하기 위한 음성 합성기로, 또는 간단히 재생되는 기록된 전화나 음성 메일 메시지를 위한 서버(20)로 직접, 요구된 메시지를 전송한다.

본 발명에서는 당 분야에서 통상의 지식을 가진 자에 의해 호출을 프로세스하는 각종 다른 프로그래밍 전략이 사용될 수 있음이 이해될 것이다. 예를 들어, 시스템(10)은 중요하거나 긴급한 인입 전화 호출의 경우 사용자에게 경고하도록 프로그래밍될 수 있다. 구체적으로, 시스템(10)은 디스플레이상에 사용자를 통지하도록 프로그래밍될 수 있으며, 이에 의해 사용자가 상술한 바와 같이, 사전프로그래밍된 프로시쥬어에 따라 이러한 호출을 처리하거나, 또는 호출을 단순히 프로세스하는 방법에 대해 결정하게 한다. 또한, 시스템(10)은 사용자가 집에 있지 않거나 사무실 외부에 있을 때 긴급하거나 중요한 호출을 사용자의 비퍼(beeper)에 전송하도록 프로그래밍될 수 있다. 사용자는 하루 동안 사용자가 찾을 수 있는 특정의 위치에서 (인입 전화 호출에 응답한 후에) 일련의 전화 번호를 다이얼링하도록 시스템을 또한 프로그래밍할 수 있다. 또한, 사전프로그래밍된 전화 번호의 시퀀스(즉, 리스트)는 사용자가 찾은 가장 최근의 알려진 위치에 따라 시스템(10)에 의해 자동으로 갱신될 수 있다. 사용자가 원한다면, 시스템(10)내로 호출하는 개인에 의해 또한 액세스가능하게 되어 이러한 호출자는 그 편리한 대로 다양한 위치중 하나에서 사용자와 접촉하도록 시도할 수 있다.

또한, 시스템(10)은 그 시스템(10)을 호출하는 모든 사람의 명칭과 함께, (ANI를 이용하는) 그들의 전화 번호, 뿐만 아니라 e-메일을 전송하는 사람의 e-메일 어드레스를 저장하도록 프로그래밍될 수 있음이 이해될 것이다. 이로 인해 시스템(10)의 사용자는 그 사용자가 응답중인 사람의 전화 번호 또는 e-메일 어드레스를 먼저 판단할 필요없이 계류중인 호출 또는 메시지에 자동으로 응답한다. 또한, 이러한 프로그래밍은 메시지를 전송하거나 호출하기 위해 허가된 사용자에 대해 액세스가능한 연속적인 최신 어드레스 북을 동적으로 생성하도록 제공한다. 구체적으로, 사용자는 시스템(10)을 액세스하고, 호출에 대한 특정 사람의 명칭을 선택하며, 그 다음에 시스템(10)을 지시하여 해당 사람에게 특정의 메시지(예를 들면, e-메일 또는 팩시밀리)를 전송하게 할 수 있다.

또한, 시스템(10)은 호출자가 시스템(10)의 특정 기능을 액세스하고 이용할 수 있도록 프로그래밍될 수 있다. 예를 들면, 시스템(10)은 사용자와의 임시적인 약속을 스케줄링하는 옵션을 호출자에게 제공할 수 있으며, 이것은 시스템(10)에 저장되고 그 이후에 사용자에 의해 허용되거나 거부될 수 있다. 호출자는 사용자가 이러한 약속(예를 들어, 전화 호출, 팩시밀리 또는 e-메일)을 확인하거나, 거부하거나 또는 보류할 수 있는 방법을 선택할 기회를 제공할 수도 있다. 부가적으로, 시스템(10)은 특정의 허가된 호출자에게 사용자의 약속 캘린더에 대한 액세스를 제공하여 이러한 약속이 용이하게 스케줄링될 수 있도록 프로그래밍될 수 있다.

본 발명은 개인 가정용의 작은 규모의 애플리케이션이나, 큰 규모의 사무실 또는 회사 애플리케이션에서 사용될 수 있음이 또한 이해될 것이다. 당업자라면 시스템(10)은 다른 애플리케이션에서 이용돌 수 있음이 또한 이해될 것이다. 예를 들어, 시스템(10)의 NLU 특성을 이용함으로써, 시스템(10)은 테이프 레코더, 라디오, 텔레비전과 같은 디바이스에 접속되어 몇몇 채널상에 특정의 주제가 커버될 때마다 또는 특정 사람이 인터뷰되는 경우 사용자에게 경고할 수 있다. 시스템(10)은 전화 통신에 한정되지는 않음에 유의해야 한다. 디지털 또는 아날로그 채널을 통해 음성 전송을 수반하는 전화망(web phone), 통화망(net conversation), 원격 회의 및 다른 각종 음성 통신용의 시스템(10)을 이용할 수 있다. ASCII 문자, 팩시밀리 메시지, 웹 페이지 및 데이터베이스 탐색의 내용과 같은 부가적인 전자 정보가 동일한 방식으로 또한 프로세스될 수 있다. 예를 들어, 팩시밀리 수신 성능에 광학적 문자 인식(OCR)을 부가함으로써, 시스템(10)은 오디오 인덱서/우선 순위 부여기 모듈(34)에 저장될 팩시밀리 또는 e-메일에 의해 수신된 메시지의 내용을 전사할 수 있다. 상술한 바와 같이, 사용자는 이러한 메시지의 내용을 청취하도록 음성 합성기(36)를 통해 이들 메시지를 불러올 수 있다.

결국, 본 발명은 사용자가 먼저 수동으로 전화 호출에 응답하거나 또는 e-메일이나 팩시밀리 메시지를 불러오고, 메시지의 호출자나 발신자를 식별하고, 그 다음에 이러한 호출을 전송하거나 이러한 메시지에 응답하는 방법을 결정할 필요없이, 사전결정된 방식으로 인입 전화 호출, e-메일 메시지, 팩시밀리 메시지, 다른 전자 정보 데이터를 프로세스하도록 사용자에 의해 프로그래밍될 수 있는 프로그램가능한 호출 및 메시지 프로세싱 시스템을 제공한다. 본 발명은 전화 통화나 원격 회의를 전사하고, 원격 회의에 대한 호출자 또는 가입자의 신원을 태그하며, 호출자나 발신자의 신원 및/또는 호출이나 메시지의 주제 및 내용에 따라 이러한 메시지 및 통화를 저장하도록 프로그래밍될 수 있다. 사용자는 호출자의 신원에 근거한 임의의 저장된 메시지나 통화 또는 그 주제에 근거한 관련 메시지 그룹을 불러올 수 있다.

본 발명의 예시적인 실시예는 첨부되는 도면을 참조하여 기술되었으나, 본 발명이 이러한 실시예에만 한정되지는 않으며, 당업자라면 본 발명의 진정한 정신 및 범주로부터 벗어나지 않고 각종 다른 변경 및 수정이 실시될 수 있음이 이해될 것이다.

상기한 바와 같은 본 발명에 따르면, 호출자나 발신자의 신원, 호출 또는 메시지의 주제, 및/또는 이러한 호출 또는 메시지의 일일 시각에 근거한 사전결정된 방식에 따라 자동 호출 및 데이터 전송 프로세싱을 위한 시스템 및 방법을 제공하는 것으로, 허가된 사용자에 의해 음성 활성화된 커맨드에 응답하여, 사용자가 호출 또는 메시지를 액세스하거나 또는 시스템을 프로그래밍하기 전에 사용자를 식별하고 확인할 수 있게 된다.

Claims

자동 호출 및 데이터 전송 프로세싱 시스템에 있어서,

인입 호출을 수신하는 서버 수단과,

상기 서버 수단에 동작가능하게 접속되어, 상기 호출의 호출자를 식별하는 화자 인식 수단과,

상기 서버 수단에 동작가능하게 접속되어, 상기 호출의 주제 및 내용을 판단하는 음성 인식 수단과,

상기 화자 인식 수단 및 상기 음성 인식 수단에 응답하여, 상기 호출자의 상기 식별 및 판단된 주제중 하나에 따라 상기 호출을 프로세싱하는 스위칭 수단과,

상기 서버 수단, 상기 화자 인식 수단, 상기 음성 인식 수단, 상기 스위칭 수단에 동작가능하게 접속되어, 시스템이 상기 프로세싱을 수행하도록 프로그래밍하는 프로그래밍 수단

을 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 1 항에 있어서,

상기 서버 수단은 상기 인입 호출을 기록하는 수단을 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 2 항에 있어서,

상기 서버 수단은 상기 기록된 데이터를 압축하여 저장하는 수단 및 상기 압축된 데이터를 압축 해제하는 수단을 더 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 1 항에 있어서,

상기 서버 수단은 인입 팩시밀리 메시지, e-메일 메시지, 음성 데이터, 텍스트로 변환가능한 데이터, 그의 조합중 하나를 또한 수신하고, 그에 응답하는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 1 항에 있어서,

상기 화자 인식 수단은 텍스트 독립형 화자 인식에 근거하는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 1 항에 있어서,

상기 음성 인식 수단은 음성 인식 및 자연어 이해를 이용하여 상기 호출의 상기 주제 및 내용을 판단하는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 1 항에 있어서,

상기 음성 인식 수단에 동작가능하게 접속되어, 상기 인입 호출의 언어를 식별하고 이해하는 언어 식별 수단을 더 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 7 항에 있어서,

상기 식별 수단은 언어 번역을 수행하는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 7 항에 있어서,

상기 호출자의 신원은 상기 호출의 상기 식별된 언어로부터 판단되는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 7 항에 있어서,

상기 언어 식별 수단은 상기 호출자의 신원을 이용하여 상기 호출의 언어를 식별하는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 1 항에 있어서,

상기 시스템을 액세스하기 위해 새로운 사용자를 등록시키는 등록 수단을 더 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 11 항에 있어서,

상기 새로운 사용자는 자체 등록될 수 있는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 1 항에 있어서,

상기 호출의 시간을 판단하는 수단을 더 포함하며, 상기 시스템은 상기 호출의 상기 시간에 따라 상기 호출을 프로세스하도록 또한 프로그래밍될 수 있는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 1 항에 있어서,

상기 프로그래밍 수단은 GUI 인터페이스, 음성 인터페이스, 프로그래밍 구성 화일, 그의 조합중 하나를 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 14 항에 있어서,

상기 프로그래밍은 국부적으로, 또는 원격적으로 및 그의 조합적인 방식중 하나를 수행할 수 있는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 1 항에 있어서,

상기 인입 호출에 응답하여, 어드레스 북(address book)을 동적으로 생성하는 수단을 더 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 16 항에 있어서,

상기 어드레스 북을 액세스하여 소정의 메시지를 선택된 사람에게 전송하는 수단을 더 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 1 항에 있어서,

상기 호출의 상기 프로세싱은 순차적인 방식 및 동시적인 방식중 하나의 방식으로 인입 전화 호출을 다수의 상이한 전화 구성원에 전송하는 것을 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 1 항에 있어서,

호출자를 프롬프트(prompt)하여 호출자 자신 및 상기 호출의 주제를 식별하는 수단을 더 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 19 항에 있어서,

상기 프롬프팅은 상기 시스템이 상기 신원 또는 상기 호출의 주제를 판단할 수 없는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 19 항에 있어서,

상기 프롬프팅은 상기 호출이 수신될 때 상기 호출자의 신원 및 상기 호출의 주제를 판단하도록 수행되는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 1 항에 있어서,

상기 화자 인식 수단에 응답하여, 상기 호출자의 상기 신원을 자동으로 태그하는 식별 태깅 수단과,

상기 음성 인식 수단에 응답하여, 상기 호출자의 전화 통화 또는 메시지를 전사하는 전사 수단과,

상기 식별 태깅 수단 및 상기 전사 수단에 동작가능하게 접속되어, 상기 통화 및 상기 메시지의 주제와, 상기 호출자의 신원에 따라 상기 호출자의 상기 메시지 및 상기 통화를 인덱싱하는 오디오 인덱싱 수단

을 더 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 22 항에 있어서,

상기 오디오 인덱싱 수단으로부터 상기 인덱싱된 메시지를 불러오는 수단을 더 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 22 항에 있어서,

상기 서버 수단, 상기 음성 인식 수단, 상기 오디오 인덱싱 수단에 동작가능하게 접속되어, 상기 오디오 인덱싱 수단에 저장된 정보를 합성된 음성으로 변환하는 음성 합성기 수단을 더 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 22 항에 있어서,

상기 전사 수단에 동작가능하게 접속되어, 상기 시스템의 사용자로부터의 메시지를 지시하여 상기 메시지를 선택된 사람에게 전송하는 수단을 더 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 25 항에 있어서,

상기 메시지는 팩시밀리, e-메일 또는 전화 호출, 그의 조합중 하나에 의해 상기 선택된 사람에게 전송될 수 있는 자동 호출 및 데이터 전송 프로세싱 시스템.
제 26 항에 있어서,

헤더내의 무드 스탬프(mood stamps) 또는 긴급성/기밀성 스탬프를 상기 팩시밀리 및 e-메일중 하나에 부가하는 수단을 더 포함하는 자동 호출 및 데이터 전송 프로세싱 시스템.
자동 호출 및 데이터 전송 프로세싱을 제공하는 방법에 있어서,

인입 호출을 수신하는 단계와,

상기 호출자의 신원을 판단하는 단계와,

상기 호출의 주제를 판단하는 단계와,

상기 호출자의 상기 신원 및 상기 호출의 주제중 하나에 따라 상기 호출을 프로세스하는 단계

를 포함하는 자동 호출 및 데이터 전송 프로세싱 방법.
제 28 항에 있어서,

상기 호출자의 상기 신원을 판단하는 단계는 텍스트 독립형 화자 인식에 의해 수행되는 자동 호출 및 데이터 전송 프로세싱 방법.
제 28 항에 있어서,

상기 호출의 상기 주제를 판단하는 단계는 음성 인식 및 자연어 이해에 의해 수행되는 자동 호출 및 데이터 전송 프로세싱 방법.
제 28 항에 있어서,

상기 호출을, 상기 호출 언어 이외의 언어로 번역하는 단계를 더 포함하는 자동 호출 및 데이터 전송 프로세싱 방법.
제 28 항에 있어서,

상기 인입 호출을 기록하는 단계를 더 포함하는 자동 호출 및 데이터 전송 프로세싱 방법.
제 32 항에 있어서,

상기 기록 단계는 상기 호출자의 신원을 판단하는 단계와 동시에 수행되는 자동 호출 및 데이터 전송 프로세싱 방법.
제 32 항에 있어서,

상기 기록 단계는 상기 호출자의 신원을 판단하는 단계 이전에 수행되는 자동 호출 및 데이터 전송 프로세싱 방법.
제 28 항에 있어서,

상기 호출의 시간을 판단하는 단계와,

상기 호출의 상기 판단된 시간에 근거하여 상기 호출을 프로세스하는 단계

를 더 포함하는 자동 호출 및 데이터 전송 프로세싱 방법.
자동 호출 및 데이터 전송 프로세싱을 제공하는 방법에 있어서,

인입 호출 및 메시지 데이터중 하나를 수신하는 단계와,

인입 호출이 수신되는 경우 상기 호출의 호출자를 식별하고, 상기 호출의 주제를 판단하는 단계와,

메시지 데이터가 수신되는 경우 상기 메시지의 발신자를 식별하고, 상기 메시지의 주제를 판단하는 단계와,

상기 호출자 및 발신자의 상기 신원과, 상기 호출 및 메시지의 상기 주제중 하나에 따라 상기 호출 및 메시지중 하나를 프로세스하는 단계

를 포함하는 자동 호출 및 데이터 전송 프로세싱 방법.
제 36 항에 있어서,

상기 호출자 및 상기 발신자중 하나의 상기 판단된 신원을 태그하는 단계와,

상기 호출 및 상기 메시지중 하나의 상기 판단된 주제를 전사하는 단계와,

상기 판단된 주제, 상기 판단된 신원, 그의 조합중 하나에 따라 상기 태깅 및 상기 전사에 의해 발생되는 정보를 인덱싱하는 단계

를 더 포함하는 자동 호출 및 데이터 전송 프로세싱 방법.
제 37 항에 있어서,

상기 인덱싱된 정보를 불러오는 단계를 더 포함하는 자동 호출 및 데이터 전송 프로세싱 방법.
제 38 항에 있어서,

상기 인덱싱된 정보를 불러오는 단계는 음성 커맨드에 의해 수행되는 자동 호출 및 데이터 전송 프로세싱 방법.
제 38 항에 있어서,

상기 검색 단계는 상기 인덱싱된 정보를 합성된 음성으로 변환하는 것을 포함하는 자동 호출 및 데이터 전송 프로세싱 방법.
제 36 항에 있어서,

상기 호출 및 메시지중 하나의 시간을 판단하는 단계와,

상기 판단된 시간에 따라 상기 호출 및 메시지중 하나를 프로세스하는 단계

를 더 포함하는 자동 호출 및 데이터 전송 프로세싱 방법.