KR100856358B1 - 음성 인에이블 장치용 구두 사용자 인터페이스 - Google Patents

음성 인에이블 장치용 구두 사용자 인터페이스 Download PDF

Info

Publication number
KR100856358B1
KR100856358B1 KR1020017011009A KR20017011009A KR100856358B1 KR 100856358 B1 KR100856358 B1 KR 100856358B1 KR 1020017011009 A KR1020017011009 A KR 1020017011009A KR 20017011009 A KR20017011009 A KR 20017011009A KR 100856358 B1 KR100856358 B1 KR 100856358B1
Authority
KR
South Korea
Prior art keywords
user
phone
agent
telephone
email
Prior art date
Application number
KR1020017011009A
Other languages
English (en)
Other versions
KR20020004954A (ko
Inventor
가루대드리하리나쓰
데자코앤드류피
Original Assignee
퀄컴 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퀄컴 인코포레이티드 filed Critical 퀄컴 인코포레이티드
Publication of KR20020004954A publication Critical patent/KR20020004954A/ko
Application granted granted Critical
Publication of KR100856358B1 publication Critical patent/KR100856358B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/56Arrangements for indicating or recording the called number at the calling subscriber's set
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/57Arrangements for indicating or recording the number of the calling subscriber at the called subscriber's set
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0638Interactive procedures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4938Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML

Abstract

음성 인에이블 장치용 구두 사용자 인터페이스는 프로세서 및 상기 프로세서에 의해 실행가능하고, 비휘발성 메모리에 기억된 일련의 소프트웨어 명령을 포함한다. 음성 인에이블 장치의 사용자는 음성 인에이블 장치의 통화 내역 내의 엔트리와 연결된 보이스 태그를 입력하도록 프롬프트된다. 상기 통화 내역은 인커밍과 아웃고잉 이메일 어드레스 및 인커밍과 아웃고잉 전화통화의 리스트를 포함한다. 음성 인에이블 장치로부터 전화번호로 사용자가 선택한 번호의 전화통화가 있거나, 상기 전화번호의 전화로부터 상기 음성 인에이블 장치로 전화통화가 있은 후 또는 음성 인에이블 장치로부터 이메일 어드레스로 사용자가 선택한 번호의 이메일 메시지가 있거나, 상기 이메일 어드레스로부터 상기 음성 인에이블 장치로 이메일 메시지가 있은 후, 사용자는 통화 내역 내의 전화번호 또는 이메일 어드레스와 연결된 보이스 태그를 입력하도록 프롬프트된다.
사용자는 이메일 메시지를 컴퓨터에서 음성 인에이블 장치로 전송하고 이메일 메시지의 To: 필드 및/또는 CC: 필드 내에 추가 이메일 어드레스를 포함하여, 이메일 어드레스로 음성 인에이블 장치의 전화번호부를 만들 수 있다.
구두 사용자 인터페이스, 음성 인에이블 장치

Description

음성 인에이블 장치용 구두 사용자 인터페이스{SPOKEN USER INTERFACE FOR SPEECH-ENABLED DEVICES}
본 발명은 일반적으로는 통신 분야, 특히 음성 인에이블 장치용 사용자 인터페이스에 관한 것이다.
보이스 인식 (voice recognition: VR) 은 기계장치에 인공지능 (simulated intelligence) 을 부여하여, 사용자 또는 사용자 음성의 명령을 인식하고 기계장치와의 휴먼 인터페이스를 용이하게 하는 가장 중요한 기술 중의 하나를 나타낸다. VR 은 또한 인간의 음성 이해를 위한 핵심 기술을 나타낸다. 음향 음성 신호로부터 언어 메시지를 회복하는 기술들을 사용하는 시스템을 보이스 인식기라 부른다. " 보이스 인식기 (voice recognizer)" 라는 용어는 여기서 일반적으로 임의의 구두 사용자 인터페이스 인에이블 장치를 의미한다. 보이스 인식기는, 통상, 인커밍 로 음성 (incoming raw speech) 의 VR 을 달성하는데 필요한 정보베어링 (information-bearing) 특징 또는 벡터의 시퀀스를 추출하는 음향 프로세서, 및 특징 또는 벡터의 시퀀스를 디코드하여 입력 소리에 대응하는 언어 단어의 시퀀스와 같은 의미있는 소정의 출력 포맷을 산출하는 워드 디코더를 포함한다. 소정 시스템의 성능을 향상시키기 위해서는, 트레이닝이 요구되어서 유효한 파라미터를 가진 시스템을 구비한다. 즉, 시스템이 최적으로 기능할 수 있기 전에, 시스템을 연구할 필요가 있다.
음향 프로세서는, 보이스 인식기 내의 프론트-엔드 (front-end) 음성 분석 서브시스템을 나타낸다. 입력 음성 신호에 응답하여, 음향 프로세서는 시변 (time-varying) 의 음성 신호를 특성화하는 적절한 표현을 제공한다. 음향 프로세서는 배경 노이즈, 채널 왜곡, 스피커 특성들, 대화 방식 등의 관련없는 정보를 폐기해야 한다. 효율적인 음향 프로세싱은 보이스 인식기에 강화된 음향 식별력을 제공한다. 이러한 목적을 위해, 분석된 유용한 특성은 단시간 스펙트럼 엔벌로프 (short time spectral envelope) 이다. 단시간 스펙트럼 엔벌로프를 특성화하는, 주로 사용되는 두 스펙트럼 분석 기술은 선형 예측 코딩 (linear predictive coding :LPC) 및 필터-뱅크-베이스 스펙트럼 모델링 (filter-bank-based spectral modeling) 이다. 예시적인 LPC 기술들이 본 발명의 양수인에게 양도되고 참조로 여기에 완전히 병합된 미국 특허번호 제 5,414,796 호 및 여기에 참조로 완전히 병합된 L.B.Rabiner & R.W.Schafer 저 "음성 신호의 디지털 프로세싱" (396-453)(1978) 에 설명되어 있다.
VR (통상 음성 인식이라 칭함) 의 사용은 보안상 이유로 인해 점차 중요해지고 있다. 예를 들어, VR 은 무선 전화 키패드 상의 버튼을 누르는 수작업을 대체하는데 사용될 수 있다. 이는 사용자가 차를 운전하는 동안 전화 통화를 시작하는 경우 특히 중요하다. VR 없이 전화를 사용하는 경우, 전화를 걸기 위해 버튼을 누르는 동안 운전자는 한손을 운전대에서 떼고, 전화 키패드를 주시하여야 한다. 이러한 행동은 차 사고의 가능성을 증가시킨다. 음성 인에이블된 전화 (예를 들어, 음성 인식을 위해 설계된 전화) 는, 운전자가 지속적으로 도로를 주시하면서 전화 통화를 할 수 있게 한다. 그리고, 핸즈프리 카키트 시스템 (hands-free car-kit system) 은, 또한 운전자가 통화를 시작하는 동안 운전대에 양손을 유지할 수 있게 한다.
음성 인식 장치는 스피커 의존 (speaker-dependent) 장치 또는 스피커 독립 (speaker-independent) 장치로 분류된다. 스피커 독립 장치는 임의의 사용자의 보이스 명령을 인식할 수 있다. 더 보편적인 스피커 의존 장치는 특정 사용자의 명령을 인식하도록 트레인되어 있다. 스피커 의존 VR 장치는 통상 두 단계인 트레이닝 단계 및 인식 단계로 동작한다. 트레이닝 단계에서, VR 시스템은 사용자가 시스템의 어휘 내의 각 단어들을 한번 또는 두번 말하게 하여 시스템이 이들 특정 단어 또는 구에 대한 사용자 음성의 특성을 학습하게 한다. 핸즈프리 카 키트의 예시적인 어휘는 키패드 상의 숫자; 키워드인 "통화 (call)", "전송 (send)", "다이얼 (dial)", "취소 (cancel)", "클리어 (clear)", "추가 (add)", "삭제 (delete)", "내역 (history)", "프로그램 (program)", "예 (yes)", 및 "아니요 (no)" ; 및 보통 통화하는 소정 수의 동업자들, 친구들, 또는 가족들의 이름을 포함할 수 있다. 트레이닝이 완료되면, 사용자는 트레인된 키워드를 말하여 인식 단계에서 통화를 시작할 수 있다. 예를 들어, "존" 이란 이름이 트레인된 이름 중의 하나인 경우, 사용자는 "통화 존 (call John)" 이란 구를 말하여 존에 대한 통화를 시작할 수 있다. VR 시스템은 단어 "통화" 및 "존" 을 인식하여, 사용자가 미리 존의 전화번호로 입력한 번호를 다이얼한다.
종래의 VR 장치는, 키보드 및 모니터와 같은 그래픽 사용자 인터페이스와 반대로, 구두 사용자 인터페이스에 의존하여, 사용자가 VR 장치와 상호작용하게 한다. 사용자는, 예를 들어 전화를 걸거나, 전화를 받거나, 또는 구두 명령을 사용한 음성 메모, 음성 메일, 이메일등의 특징에 억세스하여 VR 장치와 상호작용한다. 시용자의 입력은 공지된 VR 기술을 사용하여 포착되고, 사용자로의 피드백은 텍스트 대 음성 (text-to-speech, TTS) 또는 기록된 프롬프트를 통해 제공된다.
사용자가 VR 장치의 메모리 내에 기억된 통화할 이름 등의 분리된 단어, 또는 전화번호부를 만들거나 음성 메모를 기록 및 플레이하거나 또는 보이스 어태치먼트 (voice attachment) 로서 사용자 음성으로 이메일을 전송하는 명령 등의 실행될 명령을 말하는 경우, VR 장치는 분리된 단어 인식을 한다. 종래의 VR 기술은 약 40 또는 50 단어까지 분리된 단어 인식을 할 정도로 충분히 발달했다. 따라서, 셀룰러 전화상의 프로세서 및 메모리원은 구두 사용자 입력의 극히 정확한 메카니즘을 만드는데 사용될 수 있다.
그러나, 사용자가 전화번호를 말하고 VR 장치가 그 번호를 통화하도록 하기 위해서는, 통상 사람들이 전화번호를 말할 때 각각의 번호들 사이에 쉬지 않기 때문에, VR 장치는 연속적인 음성 인식 (continuous speech recognition; CSR) 능력을 가져야만 할 것이다. VR 장치는 포착된 소리 (발음된 전화번호) 를 10 내지 기억된 패턴 (10 개의 숫자, 스피커독립 어휘) 의 N 조합의 파워와 비교하고, 여기서 N 은 전화번호에서 숫자의 수이다. CSR 기술은 또한 음성 입력을 사용한 VR 장치에 사용자가 이메일 어드레스를 입력하도록 요구된다. 이는, 26 내지 N 조합의 파워가 포착된 소리와 비교되어야 할 때, 더 많은 프로세싱 및 메모리 능력이 요구된다. CSR 기술은 분리된 단어 인식 기술보다 통상 더 많은 프로세서 및 메모리원을 요구하여, VR 장치 (예를 들어, 셀룰러 전화) 의 제조비용을 증가시킨다. 또한, CSR 기술은 셀룰러 전화가 통상 사용되는 소음이 많은 환경에서는 특히, 음성 입력에 대한 만족스럽게 정확한 메카니즘을 제공하지 못한다.
따라서, 숫자 엔트리 (digit entry) 에 대한 구두 사용자 인터페이스를 구비한 대부분의 종래의 VR 제품이 스피커독립 CSR 기술을 사용하지만, 프로세서, 메모리 및/또는 배터리 전력 상태가 CSR 기술의 사용을 방해하는 경우, 구두 사용자 인터페이스의 숫자 엔트리 특징은 통상 종래의 키패드 엔트리로 대체된다. 예를 들어 셀룰러 전화 제조는 통상 이러한 접근을 사용하여, 사용자가 키패드를 사용하여 전화번호를 입력하도록 프롬프트한다. 그러나, 대부분의 사용자는 수작업으로 전화번호의 개인 전화번호부 전체를 입력하는 시간 및 수고를 들이려고 하지 않아서, 각 번호에 대한 각각의 보이스 태그 (tag) 를 만든다. 따라서, VR 장치 내의 보이스 태그로 사용자 전화번호부를 만들기 위해 기존의 정보를 사용하는 메카니즘이 필요하다.
발명의 요약
본 발명은 VR 장치 내의 보이스 태그로 사용자 전호번호부를 만들기 위해 기존의 정보를 사용하는 메카니즘에 관한 것이다. 따라서, 본 발명의 일 태양에서, 음성 인에이블 장치는 바람직하게는, 음성 인에이블 장치와 정보를 양방향으로 교환할 수 있도록 구성된 하나 이상의 메카니즘; 및 하나 이상의 메카니즘에 연결되고, 사용자 정의 이벤트 (user-defined event) 의 발생에 응답하여 하나 이상의 메카니즘을 통하여 음성 인에이블 장치의 통화 내역 내의 엔트리와 연결된 보이스 태그를 말하도록 사용자에게 프롬프트하도록 구성된 로직을 포함한다.
본 발명의 다른 태양에서, 음성 인에이블 장치는 바람직하게는, 음성 인에이블 장치와 정보를 양방향으로 교환할 수 있도록 하는 수단; 및 사용자 정의 이벤트의 발생에 응답하여 사용자가 음성 인에이블 장치의 통화 내역 내의 엔트리와 연결된 보이스 태그를 말하도록 사용자에게 프롬프트하는 수단을 포함한다.
본 발명의 또 다른 태양에서, 전화 내로 보이스 태그를 입력하도록 사용자에게 프롬프트하는 방법은 바람직하게는, 특정 소스로부터 전화상 메시지의 사용자가 정의한 번호를 수신하는 단계; 및 상기 수신 단계 후에 전화 내에 특정 소스와 연결된 보이스 태그를 사용자가 입력하도록 프롬프트하는 단계를 포함한다.
본 발명의 또 다른 태양에서, 전화 내로 보이스 태그를 입력하도록 사용자에게 프롬프트하는 방법은 바람직하게는, 특정 목적지로의 전화상 메시지의 사용자가 정의한 번호를 전송하는 단계; 및 상기 전송 단계 후에 전화 내에 특정 목적지와 연결된 보이스 태그를 입력하도록 사용자에게 프롬프트하는 단계를 포함한다.
본 발명의 실시예에서, 이메일 메시지를 원격지로부터 전화로 전송할 수 있고, 이메일 메시지는 전화의 전화번호부를 이메일 어드레스로 만들기 (poplulate) 위하여 하나 이상의 다른 이메일 어드레스로 동시에 전송될 수 있다.
본 발명의 다른 실시예에서, 이메일 메시지를 원격지로부터 전화로 전송할 수 있고, 이메일 메시지는 전화의 전화번호부를 이메일 어드레스로 만들기 위하여 하나 이상의 다른 이메일 어드레스로 동시에 복사될 수 있다.
본 발명의 또 다른 태양에서, 전화 내로 보이스 태그를 입력하도록 사용자에게 프롬프트하는 사용자 인터페이스는 바람직하게는, 특정 소스로부터의 전화상 메시지의 사용자가 정의한 번호를 수신하는 수단; 및 특정 소스로부터 메시지의 사용자가 정의한 번호가 수신된 후에 전화 내에 특정 소스와 연결된 보이스 태그를 입력하도록 사용자에게 프롬프트하는 수단을 포함한다.
본 발명의 또 다른 태양에서, 전화 내로 보이스 태그를 입력하도록 사용자에게 프롬프트하는 사용자 인터페이스는 바람직하게는, 특정 목적지로의 전화상 메시지의 사용자가 정의한 번호를 전송하는 수단; 및 특정 목적지로 메시지의 사용자가 정의한 번호가 전송된 후에 전화 내에 특정 목적지와 연결된 보이스 태그를 입력하도록 사용자에게 프롬프트하는 수단을 포함한다.
도 1 은 보이스 인식 시스템의 블록도.
도 2 는 도 1 의 시스템과 같은 보이스 인식 시스템에서 사용되는 프로세서 및 관련 기억매체의 블록도.
도 3 은 사용자 인터페이스 메시지를 프로세스하기 위해 도 1 의 시스템과 같은 보이스 인식 시스템이 수행하는 방법 단계들을 도시하는 흐름도.
도 4 는 에이전트 액션 (agent action) 을 수행하기 위해 도 1 의 시스템과 같은 보이스 인식 시스템이 수행하는 방법 단계들을 도시하는 흐름도.
도 5 는 caller ID 를 프로세스하기 위해 도 1 의 시스템과 같은 보이스 인식 시스템이 수행하는 방법 단계들을 도시하는 흐름도.
도 6 은 이메일 어드레스를 프로세스하기 위해 도 1 의 시스템과 같은 보이스 인식 시스템이 수행하는 방법 단계들을 도시하는 흐름도.
도 7a 은 사용자 프로세스를 프롬프트하기 위해 도 1 의 시스템과 같은 보이스 인식 시스템이 수행하는 방법 단계들을 도시하는 흐름도이고, 도 7b 는 도 7a 의 흐름도 내의 트레이닝 서브루틴을 도시하는 흐름도.
도 8 은 에이전트 옵션 (agent option) 을 설정하기 위해 도 1 의 시스템과 같은 보이스 인식 시스템이 수행하는 방법 단계들을 도시하는 흐름도.
일 실시예에 따르면, 도 1 에 도시된 바와 같이, 보이스 인식 시스템 (10) 은 아날로그 대 디지털 변환기 (A/D) (12), 음향 프로세서 (14), VR 템플릿 데이터베이스 (16), 패턴 비교 로직 (18) 및 결정 로직 (20) 를 포함한다. 음향 프로세서 (14) 는 종료점 검출기 (22) 를 포함한다. VR 시스템 (10) 은 예를 들어 무선 전화 또는 핸즈프리 카키트에 내장될 수 있다.
VR 시스템 (10) 이 음성 인식 단계에 있을때, 사람 (도시하지 않음) 이 한 단어 또는 구를 말하여, 음성 신호를 발생시킨다. 음성 신호는 종래의 트랜스듀서 (도시하지 않음) 에 의해 전기 음성 신호 (s(t)) 로 변환된다. 음성 신호 (s(t)) 는 A/D (12) 에 공급되고, A/D (12) 는 음성 신호 (s(t)) 를 펄스 부호 변 조 (PCM) 등의 공지된 샘플링 방법에 의해 디지털화된 음성 샘플 (s(n)) 로 변환한다.
음성 샘플 (s(n)) 은 파라미터 판정 (determination) 을 위해 음향 프로세서 (14) 에 공급된다. 음향 프로세서 (14) 는 입력 음성 신호 (s(t)) 의 특성을 모델링하는 일련의 파라미터를 생산한다. 상기한 미국특허번호 제 5,414,796 호에서 설명된 바와 같이, 예를 들어 음성 부호기 인코딩을 포함하고 패스트 푸리에 변환 (FFT) 기준 셉스트럼 (cepstrum) 계수를 사용하는 수많은 공지된 음성 파라미터 판정 기술중의 임의의 것에 의해 파라미터는 판정될 수 있다. 음향 프로세서 (14) 는 디지털 신호 프로세서 (DSP) 로서 실시될 수 있다. DSP 는 음성 부호기를 포함할 수 있다. 대안으로, 음향 프로세서 (14) 가 음성 부호기로서 실시될 수도 있다.
파라미터 판정은 VR 시스템 (10) 의 트레이닝 동안 함께 수행될 수 있고, 여기서 VR 시스템 (10) 의 모든 어휘 단어에 대한 일련의 템플릿 (template) 은 그 영구 기억을 위해 VR 템플릿 데이터베이스 (16) 로 경로지정된다. VR 템플릿 데이터베이스 (16) 는 바람직하게는, 예를 들어 플래시 메모리 등의 비휘발성 기억 매체의 임의의 종래 형태로서 실시된다. 이것은 VR 시스템 (10) 에 대한 전력이 턴오프될 때, 템플릿이 VR 템플릿 데이터베이스 (16) 에 남아있도록 한다.
파라미터들의 세트가 패턴 비교 로직 (18) 에 공급된다. 패턴 비교 로직 (18) 은 바람직하게는, 소리의 시작점과 종료점을 검출하고, 동적 음향 특징 (feature)(예를 들어, 시간 미분 계수, 제 2 시간 미분 계수등) 을 계산하고, 관련 프레임을 선택하여 그 음향 특징을 압축하고, 정적 및 동적 음향 특징을 양자화한다. 종료점 검출, 동적 음향 특징 도출, 패턴 압축, 및 패턴 양자화하는 다양한 공지된 방법들은, Lawrence Rabiner & Biing-Hwang Juang 저 "Fundamentals of Speech Recognition" (1993) 등에 개시되어 있고, 이는 참조로 여기에 병합되어 있다. 패턴 비교 로직 (18) 은 파라미터들의 세트를 VR 템플릿 데이터베이스 (16) 내에 기억된 모든 템플릿과 비교한다. 파라미터들의 세트 및 VR 템플릿 데이터베이스 (16) 내에 기억된 모든 템플릿간의 비교 결과 또는 거리 (distance) 는 결정 로직 (20) 에 공급된다. 결정 로직 (20) 은 파라미터들의 세트와 가장 가깝게 매치되는 템플릿을 VR 템플릿 데이터베이스 (16) 에서 선택한다. 대안으로, 결정 로직 (20) 은, 소정 매칭 임계 내에서 N 개의 가장 가까운 매치를 선택하는 종래의 "N-best" 선택 알고리즘을 사용할 수 있다. 그후, 어떤 선태그를 할 것인지를 사람에게 문의한다. 결정 로직 (20) 의 출력은 어휘 내의 어느 단어가 말하여졌는지에 대한 결정이다.
패턴 비교 로직 (18) 및 결정 로직 (20) 은, 도 2 를 참조로 아래에 설명되는 것과 같이, 바람직하게는 마이크로프로세서로서 실시될 수 있다. VR 시스템 (10) 은, 예를 들어 응용 주문형 집적 회로 (ASIC) 일 수 있다. VR 시스템 (10) 의 인식 정확도는, VR 시스템 (10) 이 얼마나 정확히 어휘내에서 말해진 단어 또는 구를 인식하는가의 기준이다. 예를 들어, 95% 의 인식 정확도는 VR 시스템 (10) 이 100번 중에서 95번 어휘내의 단어들을 정확히 인식한 것을 나타낸다.
일 실시예에 따르면, 도 2 에 도시된 바와 같이, VR 장치 (도시하지 않음) 는 프로세서 (100), 제 1 및 제 2 기억 매체 (102, 104) 를 포함한다. 프로세서 (100) 는 마이크로프로세서인 것이 바람직하지만, 프로세서, 전용 프로세서, 디지털 신호 프로세서 (DSP), 제어기, 또는 상태 기계 (state machine) 중의 임의의 종래 형태일 수 있다. 프로세서 (100) 는 제 1 기억 매체 (102) 에 연결되고, 제 1 기억 매체는 플래시 메모리, EEPROM 메모리 또는 RAM 메모리로서 실시되는 것이 바람직하다. 제 1 기억 매체 (102) 는 온보드 (on-board) RAM 메모리이거나, 또는 프로세서 (100) 및 제 1 기억 매체 (102) 는 ASIC 내에 존재할 수 있다. 제 2 기억 매체 (104) 는 프로세서 (100) 에 연결되고, 프로세서 (100) 상에서 실행되는 펌웨어 명령 또는 소프트웨어 모듈을 유지하도록 구성된 ROM 메모리로서 실시되는 것이 바람직하다. 대안으로, 제 2 기억 매체 (104) 는 종래의 비휘발성 메모리의 임의의 형태로서 실시될 수도 있다.
일 실시예에서, VR 장치는 무선 전화이다. 다른 실시예에서, VR 장치는 핸즈프리 카키트이다. VR 장치는, VR 장치 내에 기억된 통화 내역을 포함한다. 통화 내역은 전화를 걸거나 받거나 실패한 통화의 리스트이다. 도 3 내지 도 8 을 참조하여 아래에 설명되는 것과 같이, 지시받은 경우, 구두 사용자 인터페이스는 사용자에게 문의하고, 이러한 번호들을 사용자의 전화번호부에 추가한다. 따라서, 음성 입력 (전화번호들의 디지털 엔트리) 의 가장 어려운 작업은 기존 정보를 사용하여 수행된다.
일 실시예에서, 사용자는 특징을 온 또는 오프할 수 있는 옵션을 가진다. 특징이 턴온된 경우, 도 3 내지 도 8 을 참조하여 아래에 설명된 인텔리전트 에이전트 (intelligent agent) 는 사용자의 통화 패턴을 모니터한다. VR 장치가 대기 모드에 있는 경우, 에이전트는 "웨이크 업 (wakes up)" 되고, 전화번호부와 연결된 북키핑 (bookkeeping) 작업을 수행한다. 사용자가 VR 장치를 사용한 후, 사용자는 전화번호부 내의 엔트리 중 하나로 통화한 이름을 말할 수 있다.
다른 실시예에서, 도 3 내지 도 8 을 참조로 아래에 설명되는 것과 같이, 이메일 어드레스는 인텔리전트 에이전트에 의해 전화번호부에 입력될 수 있다. VR 장치는 인커밍 알파숫자 페이지 (page) 의 내역을 유지한다. caller ID 가 이메일 어드레스인 경우, 인텔리전트 에이전트는 그 사실의 노트를 만든다. 에이전트가 사용자의 주의 (attention) 을 끄는 경우, 에이전트는 보이스 태그 또는 이름 태그를 이메일 어드레스에 첨부한다. 이메일 어드레스가 전화번호부에 등록된 후에, 사용자는 음성 메모를 기록할 수 있으며, 음성 명령을 사용하여 인터넷을 통해 이메일에 첨부된 음성 메모를 전송할 수 있다. 사용자는 이메일 또는 알파숫자 페이지를 컴퓨터에서 자신의 VR 장치로 전송할 수 있고, 이메일 어드레스를 자신의 전화번호부에 저장하기 위하여 다른 이메일 어드레스를 To: 필드 또는 CC: 필드 내에 추가할 수 있다.
도 2 의 제 2 기억 매체는 ROM 메모리인 것이 바람직하고, 도 3 내지 도 8 을 참조하여 아래에 설명된 바와 같이 일련의 명령을 포함하는 소프트웨어 모듈 또는 펌웨어 모듈을 유지하도록 하며, 범용의 마이크로프로세서 또는 DSP 와 같은 특정 목적의 프로세서일 수 있는 프로세서 (100) 에 의해 실행가능하다. 명령 또는 코드는 C++ 언어로 기록되는 것이 바람직하지만, 대안으로, 당업자에게 공지된 임의의 프로그래밍 언어로 기록될 수도 있다. 제 1 기억 매체 (102) 는 플래시 메모리인 것이 바람직하고, 도 3 내지 도 8 을 참조하여 아래에 설명된 바와 같이 다양한 리스트를 유지하도록 한다. 당업자는 프로세서 (100), 제 1 및 제 2 기억 매체 (102, 104) 가 예를 들어 레지스터 및 FIFO 또는 이산형 트랜지스터 등의 논리적으로 등가인 하드웨어 소자로 대체될 수 있다는 것을 알 수 있을 것이다.
일 실시예에 따르면, VR 장치 (도시하지 않음) 는 인텔리전트 에이전트 소프트웨어 모듈 (도시하지 않음) 을 사용하여 도 3 내지 도 8 의 흐름도에 도시된 알고리즘 단계를 수행하고 기존의 정보를 사용하여 전화번호 및 이메일 어드레스를 사용자가 입력할 필요를 없앤다. 도 3 에서, 단계 200 에서 VR 장치는 사용자 인터페이스 메시지를 수신한다. 그후 인텔리전트 에이전트는 단계 202 로 진행한다. 단계 202 에서, 에이전트는 사용자 인터페이스 메시지가 에이전트를 위한 메시지인지 여부를 판정한다. 사용자는 메시지를, 예를 들어 VR 장치 상의 키패드를 눌러 수동적으로 또는 VR 장치 상의 마이크로폰에 말하여 음성으로 입력할 수 있다. 메시지가 에이전트를 위한 메시지인 경우, 에이전트는 단계 204 로 진행한다. 반대로 메시지가 에이전트를 위한 메시지가 아닌 경우, 에이전트는 단계 206 으로 진행한다. 단계 206 에서 에이전트는 알고리즘을 종료한다.
단계 204 에서, 에이전트는 에이전트가 액티브 또는 "어웨이크 (awake)" 모드 (대기 또는 "어슬립(asleep)" 모드에 반대 의미) 에 있는지 여부를 판정한다. 에이전트가 어웨이크 모드에 있는 경우, 에이전트는 단계 208 로 진행한다. 반 대로 에이전트가 어웨이크 모드에 있지 않은 경우, 에이전트는 단계 210 으로 진행한다.
단계 210 에서, 에이전트는 메시지가 웨이크 업되기 위한 (즉 어웨이크 모드로 진행하기 위한) 에이전트를 위한 메시지인지 여부를 판정한다. 메시지가 웨이크업 메시지인 경우, 에이전트는 단계 212 로 진행한다. 반대로 메시지가 웨이크업 메시지가 아닌 경우, 에이전트는 단계 214 로 진행한다. 단계 212 에서, 에이전트는 어웨이크 모드로 진입한다. 그후, 에이전트는 단계 216 으로 진행한다. 단계 216 에서, 에이전트는 알고리즘을 종료한다. 단계 214 에서, 에이전트는 메시지 "에이전트 어슬립 (AGENT ASLEEP)" 을 에이전트가 어슬립 모드에 있는 다른 사용자 인터페이스 소자 (도시하지 않음) 에 포스트 (post) 한다. 그후, 에이전트는 단계 218 로 진행한다. 단계 218 에서, 에이전트는 알고리즘을 종료한다.
단계 208 에서, 에이전트는 메시지가 사용자가 에이전트 옵션 또는 우선권 (preference) 을 설정하는 명령인지 여부를 판정한다. 우선권은 예를 들어 사용자가 키패드를 누르면 특정 키패드를 인에이블시켜 에이전트를 웨이크 업하거나, 또는 에이전트가 사용자에게 사용자가 보이스 태그를 그 번호에 대하여 추가할 것인지를 문의하기 전에 특정 번호에 대해 사용자가 한 전화 통화의 최소 수를 설정하는 것을 포함한다. 메시지가 사용자가 에이전트 옵션을 설정하는 명령인 경우, 에이전트는 단계 220 으로 진행한다. 반대로 메시지가 사용자가 에이전트 옵션을 설정하는 명령이 아닌 경우에는, 에이전트는 단계 222 로 진행한다. 단계 220 에서, 사용자로부터의 명령에 따라 에이전트 옵션을 설정하기 위해, 에이전트는 도 8 을 참조하여 아래에 설명될 서브루틴으로 진입한다.
단계 222 에서, 에이전트는 메시지가 에이전트에게 특정 액션을 취할 것을 요구할 것인지 여부를 판정한다. 메시지가 에이전트에게 액션을 할 것을 요구하면, 에이전트는 단계 224 로 진행한다. 반대로 메시지가 에이전트에게 액션을 수행할 것을 요구하지 않으면, 에이전트는 단계 226 로 진행한다. 단계 226 에서, 에이전트는 메시지 "인밸리드 에이전트 메시지 (INVALID AGENT MESSAGE)" 를 메시지가 에이전트를 위한 인밸리드 메시지인 다른 사용자 인터페이스 소자에 포스트한다. 그후, 에이전트는 단계 228 로 진행한다. 단계 228 에서, 에이전트는 알고리즘을 종료한다. 단계 224 에서, 사용자가 요구한 특정 액션을 수행하기 위하여, 에이전트는 도 4 를 참조하여 아래에 설명된 서브루틴에 진입한다.
일 실시예에서, 에이전트는 도 4 의 흐름도에 도시된 알고리즘 단계에 따라서 에이전트 액션을 수행한다. 단계 300 에서, 에이전트는 에이전트 액션을 수행하기 위한 서브루틴에 진입한다. 그후, 에이전트는 단계 302 로 진행한다. 단계 302 에서, 에이전트는 VR 장치에 인커밍 전화통화가 있는지 여부를 판정한다. 인커밍 전화통화가 있는 경우, 에이전트는 단계 304 로 진행한다. 반대로 인커밍 전화 통화가 없는 경우, 에이전트는 단계 306 으로 진행한다. 단계 304 에서, 에이전트는 caller ID 를 프로세스하기 위해 도 5 를 참조하여 아래에 설명된 서브루틴으로 진입한다.
단계 306 에서, 에이전트는 VR 장치에 인커밍 페이지가 있는지 여부를 판정 한다. 인커밍 페이지가 있는 경우, 에이전트는 단계 308 로 진행한다. 반대로 인커밍 페이지가 없는 경우, 에이전트는 단계 310 으로 진행한다. 단계 308 에서, 에이전트는 이메일 어드레스를 프로세스하기 위해 도 6 를 참조하여 아래에 설명된 서브루틴으로 진입한다.
단계 310 에서, 에이전트는 VR 장치로부터 아웃고잉 전화통화가 있는지 여부를 판정한다. 아웃고잉 전화통화가 있는 경우, 에이전트는 단계 312 로 진행한다. 반대로 아웃고잉 전화 통화가 없는 경우, 에이전트는 단계 314 로 진행한다. 단계 312 에서, 에이전트는 caller ID 를 프로세스하기 위해 도 5 를 참조하여 아래에 설명된 서브루틴으로 진입한다.
단계 314 에서, 에이전트는 VR 장치로부터 아웃고잉 페이지가 있는지 여부를 판정한다. 아웃고잉 페이지가 있는 경우, 에이전트는 단계 316 로 진행한다. 반대로 아웃고잉 페이지가 없는 경우, 에이전트는 단계 318 으로 진행한다. 단계 316 에서, 에이전트는 이메일 어드레스를 프로세스하기 위해 도 6 를 참조하여 아래에 설명된 서브루틴으로 진입한다. 단계 318 에서, 에이전트는 사용자 프로세스를 프롬프트하기 위해 도 7a 내지 7b 를 참조로 아래에 설명된 서브루틴으로 진입한다. 예를 들어, 사용자에게 프롬프트하도록 에이전트가 타이머를 예를 들어 매시간마다 설정한 경우, 사용자는 프롬프트될 필요가 있다. 또는, 예를 들어, 사용자는 에이전트가 VR 장치의 파워업 및/또는 파워다운에서 사용자에게 프롬프트하도록 특정할 수 있다. 또는, 예를 들어, 사용자는 사용자 프롬프트 프로세스를 초기화할 수 있다.
일 실시예에서, 에이전트는 도 5 의 흐름도에 도시된 알고리즘 단계에 따라서 인커밍 또는 아웃고잉 전화 통화를 위한 caller ID 를 프로세스한다. 단계 400 에서, 에이전트는 caller ID 를 프로세스하는 서브루틴으로 진입한다. 그후, 에이전트는 단계 402 로 진행한다. 단계 402 에서, 에이전트는 에이전트가 어웨이크 모드에 있는지 여부를 판정한다. 에이전트가 어웨이크 모드에 있는 경우, 에이전트는 단계 404 로 진행한다. 반대로 에이전트가 어웨이크 모드에 있지 않은 경우, 에이전트는 단계 406 으로 진행한다. 단계 406 에서, 에이전트는 메시지 "에이전트 어슬립 (AGENT_ASLEEP)" 를 에이전트가 어슬립 모드에 있는 다른 사용자 인터페이스 소자에 포스트한다. 그후, 에이전트는 단계 408 로 진행한다. 단계 408 에서, 에이전트는 알고리즘을 종료한다.
단계 404 에서, 에이전트는 인커밍 또는 아웃고잉 전화 통화를 위한 caller ID 가 VR 장치의 전화번호부 내에 존재하는지 여부를 판정한다. caller ID 가 전화번호부 내에 존재하는 경우, 에이전트는 단계 410 으로 진행한다. 반대로 caller ID 가 전화번호부 내에 존재하지 않는 경우, 에이전트는 단계 412 으로 진행한다. 단계 410 에서, 에이전트는 알고리즘을 종료한다.
단계 412 에서, 에이전트는 caller ID 가 VR 장치의 플래시 메모리 내의 보존된 업데이트 리스트 (Update_List) 내에 존재하는지 여부를 판정, 즉 에이전트는 caller ID 번호가 VR 장치에 전에 한번 이상 통화를 했는지 또는 VR 장치가 caller ID 번호에 전에 한번이상 통화를 했는지 여부를 판정한다. caller ID 가 업데이트 리스트 내에 존재하는 경우, 에이전트는 단계 414 로 진행한다. 반대로 caller ID 가 업데이트 리스트 내에 있지 않은 경우, 에이전트는 단계 416 으로 진행한다. 단계 416 에서, 에이전트는 caller ID 를 업데이트 리스트에 추가한다. 그후, 에이전트는 단계 418 로 진행한다. 단계 418 에서, 에이전트는 알고리즘을 종료한다.
단계 414 에서, 에이전트는 caller ID 의 합계가 최소 임계 수를 초과하는지 여부, 즉 소정 최소 임계 회수로 caller ID 번호가 VR 장치에 통화를 했는지 또는 VR 장치가 caller ID 번호에 통화를 했는지 여부를 판정한다. 최소 임계 수는 에이전트 옵션 또는 우선권으로서 사용자가 설정하는 것이 바람직하다. caller ID의 합계가 최소 임계 수를 초과하는 경우, 에이전트는 단계 420 으로 진행한다. 반대로 caller ID의 합계가 최소 임계 수를 초과하지 않는 경우, 에이전트는 단계 422 로 진행한다.
단계 422 에서, 에이전트는 caller ID의 합계를 하나씩 증가시켜 caller ID의 합계를 증가시킨다. 그후, 에이전트는 단계 424 로 진행한다. 단계 424 에서, 에이전트는 알고리즘을 종료한다. 단계 420 에서 에이전트는 프롬프트 리스트에 caller ID를 추가하여, 사용자에게 프롬프트하여 caller ID의 번호를 전화번호부에 추가하고, 보이스 태그를 caller ID 번호에 결합시킨다. 그후, 에이전트는 단계 426 으로 진행한다. 단계 426 에서, 에이전트는 caller ID 를 업데이트 리스트에서 삭제한다. 그후, 에이전트는 단계 428 로 진행한다. 단계 428 에서, 에이전트는 알고리즘을 종료한다.
일 실시예에서, 에이전트는 도 6 의 흐름도에 도시된 알고리즘 단계에 따라서 인커밍 또는 아웃고잉 페이지에 대한 이메일 어드레스를 프로세스한다. 단계 500 에서, 에이전트는 이메일 어드레스를 프로세스하는 서브루틴으로 진입한다. 그후, 에이전트는 단계 502 로 진행한다. 단계 502 에서, 에이전트는 에이전트가 어웨이크 모드에 있는지 여부를 판정한다. 에이전트가 어웨이크 모드에 있는 경우, 에이전트는 단계 504 로 진행한다. 반대로 에이전트가 어웨이크 모드에 있지 않은 경우, 에이전트는 단계 506 로 진행한다. 단계 506 에서, 에이전트는 메시지 "에이전트 어슬립 (AGENT_ASLEEP)" 를 에이전트가 어슬립 모드에 있는 다른 사용자 인터페이스 소자에 포스트한다. 그후, 에이전트는 단계 508 로 진행한다. 단계 508 에서, 에이전트는 알고리즘을 종료한다.
단계 504 에서, 에이전트는 인커밍 또는 아웃고잉 페이지를 위한 이메일 어드레스가 VR 장치의 전화번호부 내에 존재하는지 여부를 판정한다. 이메일 어드레스가 전화번호부 내에 존재하는 경우, 에이전트는 단계 510 으로 진행한다. 반대로 이메일 어드레스가 전화번호부 내에 존재하지 않는 경우, 에이전트는 단계 512 으로 진행한다. 단계 510 에서, 에이전트는 알고리즘을 종료한다.
단계 512 에서, 에이전트는 이메일 어드레스가 VR 장치의 플래시 메모리 내의 보존된 업데이트 리스트 내에 존재하는지 여부를 판정, 즉 에이전트는 이메일 어드레스가 이전에 한번 이상 VR 장치에 대한 페이지의 소스였는지 또는 VR 장치가 이메일 어드레스에 이전에 한번이상 이메일을 전송했는지 여부를 판정한다. 이메일 어드레스가 업데이트 리스트 내에 존재하는 경우, 에이전트는 단계 514 로 진행한다. 반대로 이메일 어드레스가 업데이트 리스트 내에 있지 않은 경우, 에 이전트는 단계 516 으로 진행한다. 단계 516 에서, 에이전트는 이메일 어드레스를 업데이트 리스트에 추가한다. 그후, 에이전트는 단계 518 로 진행한다. 단계 518 에서, 에이전트는 알고리즘을 종료한다.
단계 514 에서, 에이전트는 이메일 어드레스의 합계가 최소 임계 수를 초과하는지 여부, 즉 소정 최소 임계 회수로 이메일 어드레스가 VR 장치에 대한 페이지의 소스였는지 또는 VR 장치가 이메일 어드레스에 이메일을 전송했는지 여부를 판정한다. 최소 임계 수는 에이전트 옵션 또는 우선권으로서 사용자가 설정하는 것이 바람직하다. 이메일 어드레스의 합계가 최소 임계 수를 초과하는 경우, 에이전트는 단계 520 으로 진행한다. 반대로 이메일 어드레스의 합계가 최소 임계 수를 초과하지 않는 경우, 에이전트는 단계 522 로 진행한다.
단계 522 에서, 에이전트는 이메일 어드레스의 합계 (Email_Addr[count])를 하나씩 증가시켜 이메일 어드레스의 합계를 증가시킨다. 그후, 에이전트는 단계 524 로 진행한다. 단계 524 에서, 에이전트는 알고리즘을 종료한다. 단계 520 에서 에이전트는 프롬프트 리스트에 이메일 어드레스를 추가함으로써, 사용자에게 프롬프트하여 이메일 어드레스를 전화번호부에 추가하고, 보이스 태그를 이메일 어드레스에 결합시킨다. 그후, 에이전트는 단계 526 으로 진행한다. 단계 526 에서, 에이전트는 이메일 어드레스를 업데이트 리스트에서 삭제한다. 그후, 에이전트는 단계 528 로 진행한다. 단계 528 에서, 에이전트는 알고리즘을 종료한다.
일 실시예에서, 에이전트는 도 7a 의 흐름도에 도시된 알고리즘 단계에 따라서 사용자 프로세스를 프롬프트한다. 단계 600 에서, 에이전트는 사용자 프로세스를 프롬프트하는 서브루틴으로 진입한다. 사용자 프롬프트 프로세스는 사용자에 의해 또는 VR 장치의 파워업 및/또는 파워다운 (사용자가 설정하는 경우) 또는 사용자설정한 타이머에 응답하여 개시될 수 있다. 그후, 에이전트는 단계 602 로 진행한다. 단계 602 에서, 에이전트는 프롬프트 리스트 내의 엔트리의 수, 즉 프롬프트 리스트의 크기 (PROMPT_LIST SIZE) 를 N 과 동일하게 설정한다. 그후, 에이전트는 단계 604 로 진행한다.
단계 604 에서, 에이전트는 N 이 0 인지 여부를 판정한다. N 이 0 인 경우, 프롬프트 리스트 내에는 엔트리가 존재하지 않고, 에이전트는 단계 606 으로 진행한다. 단계 606 에서, 에이전트는 서브루틴을 종료한다. 반대로 단계 604 에서 N 이 0 이 아닌 경우, 에이전트는 단계 608 로 진행한다. 단계 608 에서, 에이전트는 프롬프트 리스트 내의 다음 엔트리를 트레이닝하기 위해 도 7b 를 참조로 아래에 설명된 서브루틴으로 진입한다.
도 7b 의 트레이닝 서브루틴에서, 에이전트는 단계 610 의 프롬프트 리스트 내의 엔트리를 트레이닝하는 서브루틴에 진입한다. 그후, 에이전트는 단계 612 로 진행한다. 단계 612 에서, 에이전트는 엔트리를 위해 네임 태그, 또는 보이스 태그를 트레이닝한다. 일 실시예에서, 에이전트는 VR 장치 상의 스피커로부터 "네임 플리즈 (NAME PLEASE)" 단어를 음성으로 발생시켜 네임 태그를 트레이닝한다. 사용자는, 본 어구를 듣자마자, 이름을 말한다. 그후, 에이전트는 VR 장치 상의 스피커로부터 "어게인 (AGAIN)" 단어를 음성으로 발생시킨다. 사용자는, 본 단어를 듣자마자, 그 이름을 반복한다. 그후, 에이전트는 단계 614 로 진행한다. 단계 614 에서, 에이전트는 VR 장치의 스크린 상에 "플리즈 타이프 네임 (PLEASE TYPE NAME)" 메시지를 사용자에 대해 발생시켜 사용자로부터 이름을 얻는다. 사용자는, 본 메시지를 보자마자, VR 장치의 키패드를 사용하여 이름을 타이핑한다. 그후, 에이전트는 단계 616 으로 진행한다. 이름이 VR 장치의 통화 내역 내에 이미 존재하는 경우, IS-41, GSM-MAP 등 내의 "Calling Name Presentation" 프로토콜내에 특정된 바와 같이, 에이전트는 단계 614 를 건너뛸 수 있으며, 직접 단계 612 에서 단계 616 으로 진행한다. 단계 616 에서, 에이전트는 도 7a 의 서브루틴으로 복귀한다.
도 7b 의 트레이닝 서브루틴이 종료하면, 에이전트는 도 7a 의 단계 618 로 진행한다. 단계 618 에서, 에이전트는 N 을 하나씩 감소시켜 N 을 감소시킨다. 그후, 에이전트는 단계 620 로 진행한다. 단계 620 에서, 사용자에 의한 또는 사용자 인터페이스의 다른 소자에 의한 프로세스 내의 인터럽트의 경우, 에이전트는 가장 최근에 추가된 엔트리를 프롬프트 리스트에서 삭제한다. 그후, 에이전트는 단계 604 로 복귀한다.
다른 실시예에서, 프롬프트 리스트는 조작되거나 프로세스되어, 통화를 수신하거나 다이얼하는 경우 또는 이메일을 수신하거나 전송하는 경우에 의해 더이상 오더 (order) 되지 않는다. 예를 들어, 프롬프트 리스트는 가장 잦은 빈도로 전화를 걸거나/받은 전화번호 및 가장 잦은 빈도로 전송한/수신한 이메일 어드레스의 순서로 정렬될 수 있다. 이것은 사용자의 지각 (perception) 에 더 잘 부합 하도록 한다.
일 실시예에서, 에이전트는 도 8 의 흐름도에 도시된 알고리즘 단계에 따라서 에이전트 옵션을 설정한다. 단계 700 에서, 에이전트는 사용자 프로세스를 프롬프트하는 서브루틴으로 진입한다. 그후, 에이전트는 단계 702 로 진행한다. 단계 702 에서, 에이전트는 VR 장치의 파워업 동안 사용자가 전화번호부에 프롬프트 리스트를 추가하고자 하는지 여부를 판정한다. 에이전트는 VR 장치의 스크린 상에 사용자에 대한 메시지를 발생시켜 이러한 판정을 행한다. 대안으로, 에이전트는 VR 장치의 스피커를 통해 사용자에게 음성으로 문의할 수 있다. VR 장치의 파워업 동안 사용자가 전화번호부에 프롬프트 리스트를 추가하고자 하는 경우, 사용자는 VR 장치상의 제 1 소정 키패드를 누른다. VR 장치의 파워업 동안 사용자가 전화번호부에 프롬프트 리스트를 추가하고자 하지 않는 경우, 사용자는 VR 장치상의 제 2 소정 키패드를 누른다.
단계 702 에서, VR 장치의 파워업 동안 전화번호부에 프롬프트 리스트가 추가된 경우, 에이전트는 단계 704 로 진행한다. 반대로 VR 장치의 파워업 동안 전화번호부에 프롬프트 리스트가 추가되지 않은 경우, 에이전트는 단계 706 로 진행한다. 단계 704 에서, 에이전트는 UPDATE_POWERUP 파라미터를 1 로 설정한다. 그후, 에이전트는 단계 708 로 진행한다. 단계 706 에서, 에이전트는 UPDATE_POWERUP 파라미터를 0 로 설정한다. 그후, 에이전트는 단계 708 로 진행한다.
단계 708 에서, 에이전트는 VR 장치의 파워다운 동안 사용자가 전화번호부에 프롬프트 리스트를 추가하고자 하는지 여부를 판정한다. 에이전트는 VR 장치의 스크린 상에 사용자에 대한 메시지를 발생시켜 이러한 판정을 행한다. 대안으로, 에이전트는 VR 장치의 스피커를 통해 사용자에게 음성으로 문의할 수 있다. VR 장치의 파워다운 동안 사용자가 전화번호부에 프롬프트 리스트를 추가하고자 하는 경우, 사용자는 VR 장치상의 제 1 소정 키패드를 누른다. VR 장치의 파워다운 동안 사용자가 전화번호부에 프롬프트 리스트를 추가하고자 하지 않는 경우, 사용자는 VR 장치상의 제 2 소정 키패드를 누른다.
단계 708 에서, VR 장치의 파워다운 동안 전화번호부에 프롬프트 리스트가 추가된 경우, 에이전트는 단계 710 로 진행한다. 반대로 VR 장치의 파워다운 동안 전화번호부에 프롬프트 리스트가 추가되지 않은 경우, 에이전트는 단계 712 로 진행한다. 단계 710 에서, 에이전트는 UPDATE_POWERDOWN 파라미터를 1 로 설정한다. 그후, 에이전트는 단계 714 로 진행한다. 단계 712 에서, 에이전트는 UPDATE_POWERDOWN 파라미터를 0 로 설정한다. 그후, 에이전트는 단계 714 로 진행한다.
단계 714 에서, 에이전트는 소정 시간간격으로 사용자가 전화번호부에 프롬프트 리스트를 추가하고자 하는지 여부를 판정한다. 에이전트는 VR 장치의 스크린 상에 사용자에 대한 메시지를 발생시켜 이러한 판정을 행한다. 대안으로, 에이전트는 VR 장치의 스피커를 통해 사용자에게 음성으로 문의할 수 있다. 소정 시간간격으로 사용자가 전화번호부에 프롬프트 리스트를 추가하고자 하는 경우, 사용자는 VR 장치상의 제 1 소정 키패드를 누른다. 소정 시간 간격으로 사용자 가 전화번호부에 프롬프트 리스트를 추가하고자 하지 않는 경우, 사용자는 VR 장치상의 제 2 소정 키패드를 누른다.
단계 714 에서, 소정 시간 간격으로 전화번호부에 프롬프트 리스트가 추가된 경우, 에이전트는 단계 716 로 진행한다. 반대로 소정 시간 간격으로 전화번호부에 프롬프트 리스트가 추가되지 않은 경우, 에이전트는 단계 718 로 진행한다. 단계 716 에서, 에이전트는 UPDATE_TIMER 파라미터를 1 로 설정한다. 그후, 에이전트는 단계 720 로 진행한다. 단계 718 에서, 에이전트는 UPDATE_TIMER 파라미터를 0 로 설정한다. 그후, 에이전트는 단계 722 로 진행한다. 단계 720 에서, 에이전트는 사용자가 입력한 시간 간격을 판독하고, UPDATE_TIMER_VALUE 파라미터와 동일하게 사용자입력 시간 간격을 설정한다. 사용자입력 시간 간격을 판독하기 위해서, 에이전트는 먼저 VR 장치의 스크린상에 사용자에 대한 "시간 간격 입력 (ENTER TIME INTERVAL)" 메시지를 발생시킨다. 사용자는 에이전트에 대해 소정 시간 간격을 특정하기 위해 VR 장치상의 적절한 키패드를 눌러서 응답한다. 그후, 에이전트는 단계 722 로 진행한다.
단계 722 에서, 에이전트는 사용자가 입력한 걸거나/받은 통화의 최소 수 또는 전송하거나/수신한 이메일 어드레스의 최소 수를 판독하고, 사용자가 입력한 최소 수를 도 5 내지 도 6 을 참조로 상술한 최소 임계 수, MIN_THRS 파라미터, 와 동일하게 설정한다. 사용자가 입력한 최소 수를 판독하기 위해서, 에이전트는 먼저 VR 장치의 스크린 상에 사용자에 대해 "통화의 최소 수 입력 (ENTER MINIMUM NUMBER OF CALLS)" 메시지를 발생시킨다. 사용자는 에이전트에 대해 소정 송신 하거나 수신한 이메일 또는 통화의 소정 최소 수를 특정하기 위해 VR 장치상의 적절한 키패드를 눌러서 응답한다. 그후, 에이전트는 단계 724 로 진행한다. 단계 724 에서, 에이전트는 알고리즘을 종료한다.
따라서, 새롭고 진보된 음성 인에이블 장치용 구두 사용자 인터페이스를 설명하였다. 당업자는 여기서 개시된 실시예와 관련하여 설명된 다양한 설명된 논리적인 블록 및 알고리즘 단계가 디지털 신호 프로세서 (DSP), 응용 주문형 집적회로 (ASIC), 개별 게이트 또는 트랜지스터 로직, 예를 들어 레지스터 및 FIFO 등과 같은 개별 하드웨어 소자, 일련의 펌웨어 명령을 실행하는 프로세서 또는 임의의 종래 프로그램가능한 소프트웨어 모듈 및 프로세서로 실시되거나 실행될 수 있다는 것을 이해할 것이다. 프로세서는 마이크로프로세서인 것이 바람직하지만, 대안으로 임의의 종래 프로세서, 제어기, 마이크로제어기 또는 상태 기계일 수 있다. 소프트웨어 모듈은 RAM 메모리, 플래시 메모리, 레지스터, 또는 업계에 알려진 임의의 다른 형태의 기록가능 기억 매체 내에 보유될 수 있다. 또한, 당업자는 상술한 것을 통해 참조될 수 있는 데이터, 지시, 명령, 정보, 신호, 비트, 심볼 및 칩이 바람직하게는 전압, 전류, 전자기파, 자계 또는 자기 입자, 광학 필드 또는 광학 입자, 또는 그 임의의 조합에 의해 표현될 수 있다는 것을 이해할 수 있다.
따라서, 본 발명의 바람직한 실시예를 도시하고 설명하였다. 그러나, 본 발명의 사상 및 범위를 벗어남이 없이 여기서 개시된 실시예에 많은 변화가 행해질 수 있음은 통상의 당업자에게 명백하다. 따라서, 본 발명은 청구범위에 의해서만 제한된다.

Claims (30)

  1. 음성 인에이블 장치에 있어서,
    사용자가 상기 음성 인에이블 장치와 정보를 양방향으로 교환할 수 있도록 구성된 하나 이상의 메카니즘;
    프로세서;
    상기 프로세서와 전자적으로 통신하는 메모리; 및
    상기 메모리에 저장된 명령어들을 포함하고,
    상기 명령어들은, 상기 음성 인에이블 장치의 자동적으로 발생된 통화내역 내의 엔트리와 연결될 보이스 태그를 말하도록 하기 위해, 사용자 정의 이벤트의 발생에 응답하여 상기 하나 이상의 메커니즘을 통하여 상기 사용자에게 자동적으로 프롬프트하도록 실행되고,
    상기 자동적이란, 수동 (manual) 사용자 조정 (intervention) 이 없음을 의미하고,
    상기 사용자 정의 이벤트는 임계치를 넘는 상기 장치로부터의 아웃고잉(outgoing) 엔트리의 수 또는 상기 장치로의 인고잉(ingoing) 엔트리의 수를 포함하는, 음성 인에이블 장치.
  2. 삭제
  3. 제 1 항에 있어서,
    상기 통화 내역은 상기 장치로의 인커밍 페이지, 상기 장치로부터의 아웃고잉 이메일 메시지, 상기 장치로의 인커밍 전화통화 및 상기 장치로부터의 아웃고잉 전화통화의 리스트들 중에서 하나 이상을 포함하는, 음성 인에이블 장치.
  4. 제 1 항에 있어서,
    사용자 전화번호부를 기억하도록 구성된 기억 매체를 더 포함하고,
    상기 장치는 전화 통화를 수신하도록 구성된 무선 전화를 포함하고,
    상기 사용자 정의 이벤트는 특정 전화 번호로부터 상기 장치로의 전화 통화의 사용자가 정의한 번호의 발생을 포함하며,
    상기 사용자 전화번호부에 기억된 상기 엔트리는 상기 특정 전화 번호를 포함하는, 음성 인에이블 장치.
  5. 제 1 항에 있어서,
    사용자 전화번호부를 기억하도록 구성된 기억 매체를 더 포함하고,
    상기 장치는 이메일 메시지를 수신하도록 구성되고,
    상기 사용자 정의 이벤트는 특정 이메일 어드레스로부터 상기 장치로의 페이지의 사용자가 정의한 번호의 발생을 포함하며,
    상기 사용자 전화번호부에 기억된 상기 엔트리는 상기 특정 이메일 어드레스를 포함하는, 음성 인에이블 장치.
  6. 제 1 항에 있어서,
    사용자 전화번호부를 기억하도록 구성된 기억 매체를 더 포함하고,
    상기 장치는 전화 통화를 송신하도록 구성된 무선 전화를 포함하고,
    상기 사용자 정의 이벤트는 상기 장치로부터 특정 전화 번호로의 전화 통화의 사용자가 정의한 번호의 발생을 포함하며,
    상기 사용자 전화번호부에 기억된 상기 엔트리는 상기 특정 전화 번호를 포함하는, 음성 인에이블 장치.
  7. 제 1 항에 있어서,
    사용자 전화번호부를 기억하도록 구성된 기억 매체를 더 포함하고,
    상기 장치는 이메일 메시지를 전송하도록 구성되고,
    상기 사용자 정의 이벤트는 상기 장치로부터 특정 이메일 어드레스로의 이메일 메시지의 사용자가 정의한 번호의 발생을 포함하며,
    상기 사용자 전화번호부에 기억된 상기 엔트리는 상기 특정 이메일 어드레스를 포함하는, 음성 인에이블 장치.
  8. 음성 인에이블 장치에 있어서,
    사용자가 음성 인에이블 장치와 정보를 양방향으로 교환할 수 있도록 하는 수단; 및
    상기 음성 인에이블 장치의 자동적으로 발생된 통화 내역 내의 엔트리와 연결될 보이스 태그를 말하도록 하기 위해, 사용자 정의 이벤트의 발생에 응답하여 상기 사용자에게 소프트웨어 에이전트를 통해 자동적으로 프롬프트하는 수단을 포함하며,
    상기 자동적이란, 수동 (manual) 사용자 조정 (intervention) 이 없음을 의미하고,
    상기 사용자 정의 이벤트는 임계치를 넘는 상기 장치로부터의 아웃고잉(outgoing) 엔트리의 수 또는 상기 장치로의 인고잉(ingoing) 엔트리의 수를 포함하는, 음성 인에이블 장치.
  9. 제 8 항에 있어서,
    상기 프롬프트하는 수단은 프로세서 및 상기 프로세서에 의해 실행가능한 일련의 소프트웨어 명령을 포함하는 비휘발성 메모리를 포함하는, 음성 인에이블 장치.
  10. 제 8 항에 있어서,
    상기 통화 내역은 상기 장치로의 인커밍 페이지, 상기 장치로부터의 아웃고잉 이메일 메시지, 상기 장치로의 인커밍 전화통화 및 상기 장치로부터의 아웃고잉 전화통화의 리스트들 중에서 하나 이상을 포함하는, 음성 인에이블 장치.
  11. 제 8 항에 있어서,
    사용자 전화번호부를 기억하는 수단을 더 포함하고,
    상기 장치는 전화 통화를 수신하도록 구성된 무선 전화를 포함하고,
    상기 사용자 정의 이벤트는 특정 전화 번호로부터 상기 장치로의 전화 통화의 사용자가 정의한 번호의 발생을 포함하며,
    상기 기억하는 수단 내에 기억된 상기 엔트리는 상기 특정 전화 번호를 포함하는, 음성 인에이블 장치.
  12. 제 8 항에 있어서,
    사용자 전화번호부를 기억하는 수단을 더 포함하고,
    상기 장치는 이메일 메시지를 수신하도록 구성되고,
    상기 사용자 정의 이벤트는 특정 이메일 어드레스로부터 상기 장치로의 페이지의 사용자가 정의한 번호의 발생을 포함하며,
    상기 기억하는 수단 내에 기억된 상기 엔트리는 상기 특정 이메일 어드레스를 포함하는, 음성 인에이블 장치.
  13. 제 8 항에 있어서,
    사용자 전화번호부를 기억하는 수단을 더 포함하고,
    상기 장치는 전화 통화를 송신하도록 구성된 무선 전화를 포함하고,
    상기 사용자 정의 이벤트는 상기 장치로부터 특정 전화 번호로의 전화 통화의 사용자가 정의한 번호의 발생을 포함하며,
    상기 기억하는 수단 내에 기억된 상기 엔트리는 상기 특정 전화 번호를 포함하는, 음성 인에이블 장치.
  14. 제 8 항에 있어서,
    사용자 전화번호부를 기억하는 수단을 더 포함하고,
    상기 장치는 이메일 메시지를 전송하도록 구성되고,
    상기 사용자 정의 이벤트는 상기 장치로부터 특정 이메일 어드레스로의 이메일 메시지의 사용자가 정의한 번호의 발생을 포함하며,
    상기 기억하는 수단 내에 기억된 상기 엔트리는 상기 특정 이메일 어드레스를 포함하는, 음성 인에이블 장치.
  15. 전화 내로 보이스 태그를 입력하도록 사용자에게 자동으로 프롬프트하는 방법에 있어서,
    특정 소스로부터의 전화상 메시지의 사용자가 정의한 번호를 수신하는 단계; 및
    상기 수신 단계가 발생한 후에 상기 전화 내로 상기 특정 소스와 연결된 보이스 태그를 입력하기 위해 소프트웨어 에이전트를 통해 자동적으로 상기 사용자에게 프롬프트하는 단계를 포함하며,
    상기 자동적이란, 수동 (manual) 사용자 조정 (intervention) 이 없음을 의미하는, 사용자에게 자동으로 프롬프트하는 방법.
  16. 제 15 항에 있어서,
    상기 메시지는 전화 통화를 포함하고, 상기 특정 소스는 전화번호를 포함하는, 사용자에게 자동으로 프롬프트하는 방법.
  17. 제 15 항에 있어서,
    상기 메시지는 페이지를 포함하고, 상기 특정 소스는 이메일 어드레스를 포함하는, 사용자에게 자동으로 프롬프트하는 방법.
  18. 제 15 항에 있어서,
    원격지로부터 상기 전화로 이메일 메시지를 전송하는 단계를 더 포함하고, 상기 이메일 메시지는 하나 이상의 다른 이메일 어드레스로 동시에 전송되는, 사용자에게 자동으로 프롬프트하는 방법.
  19. 제 15 항에 있어서,
    원격지로부터 상기 전화로 이메일 메시지를 전송하는 단계를 더 포함하고, 상기 이메일 메시지는 하나 이상의 다른 이메일 어드레스로 동시에 복사되는, 사용자에게 자동으로 프롬프트하는 방법.
  20. 전화 내로 보이스 태그를 입력하도록 사용자에게 자동으로 프롬프트하는 방법에 있어서,
    특정 목적지로 전화상 메시지의 사용자가 정의한 번호를 전송하는 단계; 및
    상기 전송 단계가 발생한 후에 상기 전화 내로 상기 특정 목적지와 연결된 보이스 태그를 입력하기 위해 소프트웨어 에이전트를 통해 자동적으로 상기 사용자에게 프롬프트하는 단계를 포함하며,
    상기 자동적이란, 수동 (manual) 사용자 조정 (intervention) 이 없음을 의미하는, 사용자에게 자동으로 프롬프트하는 방법.
  21. 제 20 항에 있어서,
    상기 메시지는 전화 통화를 포함하고, 상기 특정 목적지는 전화번호를 포함하는, 사용자에게 자동으로 프롬프트하는 방법.
  22. 제 20 항에 있어서,
    상기 메시지는 페이지를 포함하고, 상기 특정 목적지는 이메일 어드레스를 포함하는, 사용자에게 자동으로 프롬프트하는 방법.
  23. 제 20 항에 있어서,
    원격지로부터 상기 전화로 이메일 메시지를 전송하는 단계를 더 포함하고,
    상기 이메일 메시지는 하나 이상의 다른 이메일 어드레스로 동시에 전송되는, 사용자에게 자동으로 프롬프트하는 방법.
  24. 제 20 항에 있어서,
    원격지로부터 상기 전화로 이메일 메시지를 전송하는 단계를 더 포함하고,
    상기 이메일 메시지는 하나 이상의 다른 이메일 어드레스로 동시에 복사되는, 사용자에게 자동으로 프롬프트하는 방법.
  25. 전화기 내로 보이스 태그를 입력하도록 사용자에게 자동적으로 프롬프트하는 전화기에 있어서,
    특정 소스 번호로부터 메시지의 사용자가 정의한 번호를 수신하도록 구성된 수신기; 및
    상기 특정 소스 번호로부터 메시지의 상기 사용자가 정의한 번호가 수신된 후에 상기 전화 내로 상기 특정 소스와 연결된 보이스 태그를 입력하기 위해 소프트웨어 에이전트를 통해 자동적으로 상기 사용자에게 프롬프트하도록 구성된 프롬프터를 포함하며,
    상기 자동적이란, 수동 (manual) 사용자 조정 (intervention) 이 없음을 의미하는, 전화기.
  26. 제 25 항에 있어서,
    상기 메시지는 전화 통화를 포함하고, 상기 특정 소스는 전화번호를 포함하는, 전화기.
  27. 제 25 항에 있어서,
    상기 메시지는 페이지를 포함하고, 상기 특정 소스는 이메일 어드레스를 포함하는, 전화기.
  28. 전화기 내로 보이스 태그를 입력하도록 사용자에게 자동적으로 프롬프트하는 전화기에 있어서,
    특정 목적지로 메시지의 사용자가 정의한 번호를 전송하도록 구성된 전송기; 및
    상기 특정 목적지로의 메시지의 상기 사용자가 정의한 번호가 전송된 후에 상기 전화 내로 상기 특정 목적지와 연결된 보이스 태그를 입력하기 위해 소프트웨어 에이전트를 통해 자동적으로 상기 사용자에게 프롬프트하도록 구성된 프롬프터를 포함하며,
    상기 자동적이란, 수동 (manual) 사용자 조정 (intervention) 이 없음을 의미하는, 전화기.
  29. 제 28 항에 있어서,
    상기 메시지는 전화 통화를 포함하고, 상기 특정 목적지는 전화번호를 포함하는, 전화기.
  30. 제 28 항에 있어서,
    상기 메시지는 페이지를 포함하고, 상기 특정 목적지는 이메일 어드레스를 포함하는, 전화기.
KR1020017011009A 1999-03-31 2000-03-30 음성 인에이블 장치용 구두 사용자 인터페이스 KR100856358B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/283,340 1999-03-31
US09/283,340 US6519479B1 (en) 1999-03-31 1999-03-31 Spoken user interface for speech-enabled devices

Publications (2)

Publication Number Publication Date
KR20020004954A KR20020004954A (ko) 2002-01-16
KR100856358B1 true KR100856358B1 (ko) 2008-09-04

Family

ID=23085572

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020017011009A KR100856358B1 (ko) 1999-03-31 2000-03-30 음성 인에이블 장치용 구두 사용자 인터페이스

Country Status (11)

Country Link
US (1) US6519479B1 (ko)
EP (2) EP1876584A3 (ko)
JP (1) JP2002540703A (ko)
KR (1) KR100856358B1 (ko)
CN (1) CN1292574C (ko)
AT (1) ATE377242T1 (ko)
AU (1) AU4372400A (ko)
DE (1) DE60036931T2 (ko)
ES (1) ES2295025T3 (ko)
HK (1) HK1043424B (ko)
WO (1) WO2000058944A1 (ko)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4200607B2 (ja) * 1999-09-03 2008-12-24 ソニー株式会社 情報処理装置および方法、並びにプログラム格納媒体
US6765996B2 (en) * 2000-03-02 2004-07-20 John Francis Baxter, Jr. Audio file transmission method
US20010024951A1 (en) * 2000-03-22 2001-09-27 Marten Rignell Apparatus and a method for providing operational status information between subscribers in a telecommunications network
JP2002171332A (ja) * 2000-11-30 2002-06-14 Toshiba Corp 通信端末装置
US7400712B2 (en) * 2001-01-18 2008-07-15 Lucent Technologies Inc. Network provided information using text-to-speech and speech recognition and text or speech activated network control sequences for complimentary feature access
DE60113644T2 (de) * 2001-03-27 2006-07-06 Nokia Corp. Methode und System zur Verwaltung einer Datenbank in einem Kommunikationsnetz
US6957259B1 (en) 2001-06-25 2005-10-18 Bellsouth Intellectual Property Corporation System and method for regulating emails by maintaining, updating and comparing the profile information for the email source to the target email statistics
US7418381B2 (en) * 2001-09-07 2008-08-26 Hewlett-Packard Development Company, L.P. Device for automatically translating and presenting voice messages as text messages
US20060069567A1 (en) * 2001-12-10 2006-03-30 Tischer Steven N Methods, systems, and products for translating text to speech
US7483832B2 (en) * 2001-12-10 2009-01-27 At&T Intellectual Property I, L.P. Method and system for customizing voice translation of text to speech
JP3943949B2 (ja) * 2002-02-12 2007-07-11 キヤノン株式会社 電子メール処理システム、方法、プログラム及び記憶媒体
AU2003256004A1 (en) * 2002-09-16 2004-04-30 Koninklijke Philips Electronics N.V. Communication apparatus and software
US20040121812A1 (en) * 2002-12-20 2004-06-24 Doran Patrick J. Method of performing speech recognition in a mobile title line communication device
JP2004227468A (ja) * 2003-01-27 2004-08-12 Canon Inc 情報提供装置、情報提供方法
US8571584B1 (en) 2003-04-03 2013-10-29 Smith Micro Software, Inc. Delivery of voice data from multimedia messaging service messages
DE10322706A1 (de) * 2003-05-20 2004-12-16 Web.De Ag Verfahren und Kommunikationsumgebung zum Aufbau einer Telefonverbindung
US20090286515A1 (en) * 2003-09-12 2009-11-19 Core Mobility, Inc. Messaging systems and methods
US20050064835A1 (en) * 2003-09-18 2005-03-24 International Business Machines Corporation Audio system responsive to incoming phone calls
US7664639B2 (en) * 2004-01-14 2010-02-16 Art Advanced Recognition Technologies, Inc. Apparatus and methods for speech recognition
US7672436B1 (en) * 2004-01-23 2010-03-02 Sprint Spectrum L.P. Voice rendering of E-mail with tags for improved user experience
US7010099B2 (en) * 2004-03-11 2006-03-07 Bellsouth Intellectual Property Corporation Methods and systems for updating a voice activated dialing directory
US7283622B2 (en) * 2004-04-28 2007-10-16 At&T Bls Intellectual Property, Inc. Process integrated messaging
US20060026248A1 (en) * 2004-07-29 2006-02-02 International Business Machines Corporation System and method for preparing electronic mails
US7627638B1 (en) 2004-12-20 2009-12-01 Google Inc. Verbal labels for electronic messages
ATE415048T1 (de) * 2005-07-28 2008-12-15 Harman Becker Automotive Sys Verbesserte kommunikation für innenräume von kraftfahrzeugen
US20070088549A1 (en) * 2005-10-14 2007-04-19 Microsoft Corporation Natural input of arbitrary text
WO2007079359A2 (en) * 2005-12-21 2007-07-12 Sandisk Corporation Voice controlled portable memory storage device
US20070143117A1 (en) * 2005-12-21 2007-06-21 Conley Kevin M Voice controlled portable memory storage device
US7917949B2 (en) * 2005-12-21 2011-03-29 Sandisk Corporation Voice controlled portable memory storage device
US20070143111A1 (en) * 2005-12-21 2007-06-21 Conley Kevin M Voice controlled portable memory storage device
US8161289B2 (en) * 2005-12-21 2012-04-17 SanDisk Technologies, Inc. Voice controlled portable memory storage device
US20080091719A1 (en) * 2006-10-13 2008-04-17 Robert Thomas Arenburg Audio tags
KR100897553B1 (ko) 2007-01-04 2009-05-15 삼성전자주식회사 사용자의 기기 사용 패턴을 이용한 음성 인식 방법 및 장치
US20080208594A1 (en) * 2007-02-27 2008-08-28 Cross Charles W Effecting Functions On A Multimodal Telephony Device
JP2008263543A (ja) * 2007-04-13 2008-10-30 Funai Electric Co Ltd 記録再生装置
US8548433B1 (en) 2007-06-27 2013-10-01 Smith Micro Software, Inc. Voice messaging service for network-based instant connect systems
TWI360109B (en) 2008-02-05 2012-03-11 Htc Corp Method for setting voice tag
KR20090107365A (ko) * 2008-04-08 2009-10-13 엘지전자 주식회사 이동 단말기 및 그 메뉴 제어방법
CN101399888B (zh) * 2008-09-26 2010-10-06 深圳市众方信息科技有限公司 处理VoIP业务的网络系统及其信息同步方法
US8600763B2 (en) 2010-06-04 2013-12-03 Microsoft Corporation System-initiated speech interaction
KR101718027B1 (ko) * 2010-09-09 2017-03-20 엘지전자 주식회사 이동 단말기 및 그의 메모 관리방법
US8300777B1 (en) 2011-09-25 2012-10-30 Google Inc. Divided call history user interface
US9148499B2 (en) 2013-01-22 2015-09-29 Blackberry Limited Method and system for automatically identifying voice tags through user operation
EP2757556A1 (en) * 2013-01-22 2014-07-23 BlackBerry Limited Method and system for automatically identifying voice tags through user operation
CN104656897A (zh) * 2015-02-11 2015-05-27 夏大庆 昵称唤醒技术
US10506088B1 (en) * 2017-09-25 2019-12-10 Amazon Technologies, Inc. Phone number verification
CN108133708B (zh) * 2017-12-04 2021-01-08 维沃移动通信有限公司 一种语音助手的控制方法、装置及移动终端

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5586171A (en) * 1994-07-07 1996-12-17 Bell Atlantic Network Services, Inc. Selection of a voice recognition data base responsive to video data
WO1997019545A1 (en) * 1995-11-17 1997-05-29 At & T Corp. Automatic vocabulary generation for telecommunications network-based voice-dialing
EP0800304A2 (en) * 1996-04-05 1997-10-08 Lucent Technologies Inc. On-line training of an automated-dialing directory
US5835570A (en) * 1996-06-26 1998-11-10 At&T Corp Voice-directed telephone directory with voice access to directory assistance

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0293259A3 (en) * 1987-05-29 1990-03-07 Kabushiki Kaisha Toshiba Voice recognition system used in telephone apparatus
ES2240252T3 (es) 1991-06-11 2005-10-16 Qualcomm Incorporated Vocodificador de velocidad variable.
JP3725566B2 (ja) * 1992-12-28 2005-12-14 株式会社東芝 音声認識インターフェース
CA2136796C (en) * 1993-11-29 1998-11-24 Shinichi Urasaka Cordless telephone apparatus
US5481595A (en) * 1994-03-08 1996-01-02 Uniden America Corp. Voice tag in a telephone auto-dialer
US6208713B1 (en) * 1996-12-05 2001-03-27 Nortel Networks Limited Method and apparatus for locating a desired record in a plurality of records in an input recognizing telephone directory
US6005927A (en) * 1996-12-16 1999-12-21 Northern Telecom Limited Telephone directory apparatus and method
GB2327554B (en) * 1997-07-16 2002-02-13 Nokia Mobile Phones Ltd Radio telephone headset
GB2327555B (en) * 1997-07-16 2002-07-17 Nokia Mobile Phones Ltd Radio telephone
US6169799B1 (en) * 1998-02-02 2001-01-02 Home Wireless Networks, Inc. Method and apparatus for automatic telephone area-code dialing
US20020069064A1 (en) * 1999-02-08 2002-06-06 Dejaco Andrew P. Method and apparatus for testing user interface integrity of speech-enabled devices

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5586171A (en) * 1994-07-07 1996-12-17 Bell Atlantic Network Services, Inc. Selection of a voice recognition data base responsive to video data
WO1997019545A1 (en) * 1995-11-17 1997-05-29 At & T Corp. Automatic vocabulary generation for telecommunications network-based voice-dialing
EP0800304A2 (en) * 1996-04-05 1997-10-08 Lucent Technologies Inc. On-line training of an automated-dialing directory
US5835570A (en) * 1996-06-26 1998-11-10 At&T Corp Voice-directed telephone directory with voice access to directory assistance

Also Published As

Publication number Publication date
EP1171870B1 (en) 2007-10-31
ATE377242T1 (de) 2007-11-15
DE60036931T2 (de) 2008-08-07
US6519479B1 (en) 2003-02-11
EP1876584A2 (en) 2008-01-09
WO2000058944A1 (en) 2000-10-05
EP1171870A1 (en) 2002-01-16
ES2295025T3 (es) 2008-04-16
JP2002540703A (ja) 2002-11-26
CN1346486A (zh) 2002-04-24
KR20020004954A (ko) 2002-01-16
DE60036931D1 (de) 2007-12-13
CN1292574C (zh) 2006-12-27
EP1876584A3 (en) 2012-10-24
HK1043424B (zh) 2007-06-08
HK1043424A1 (en) 2002-09-13
AU4372400A (en) 2000-10-16

Similar Documents

Publication Publication Date Title
KR100856358B1 (ko) 음성 인에이블 장치용 구두 사용자 인터페이스
EP1159736B1 (en) Distributed voice recognition system
US6839670B1 (en) Process for automatic control of one or more devices by voice commands or by real-time voice dialog and apparatus for carrying out this process
JP4558074B2 (ja) 電話通信端末
US6836758B2 (en) System and method for hybrid voice recognition
US20030061036A1 (en) System and method for transmitting speech activity in a distributed voice recognition system
US20020091515A1 (en) System and method for voice recognition in a distributed voice recognition system
EP1352389B1 (en) System and method for storage of speech recognition models
US6185537B1 (en) Hands-free audio memo system and method
JPH09106296A (ja) 音声認識装置及び方法
JP4643011B2 (ja) 音声認識除去方式
EP1151431B1 (en) Method and apparatus for testing user interface integrity of speech-enabled devices
CA2427339C (en) System and method for improving voice recognition in noisy environments and frequency mismatch conditions
US20070129945A1 (en) Voice quality control for high quality speech reconstruction

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120727

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20130729

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140730

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20160629

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20180628

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20190624

Year of fee payment: 12