KR20030086614A - 터미널 장치로부터의 음성 명령에 의해 태스크프로세서에서의 태스크 프로세싱을 원격적으로 시동하는방법 및 시스템 - Google Patents

터미널 장치로부터의 음성 명령에 의해 태스크프로세서에서의 태스크 프로세싱을 원격적으로 시동하는방법 및 시스템 Download PDF

Info

Publication number
KR20030086614A
KR20030086614A KR10-2003-7012579A KR20037012579A KR20030086614A KR 20030086614 A KR20030086614 A KR 20030086614A KR 20037012579 A KR20037012579 A KR 20037012579A KR 20030086614 A KR20030086614 A KR 20030086614A
Authority
KR
South Korea
Prior art keywords
terminal device
task processor
voice
task
application specific
Prior art date
Application number
KR10-2003-7012579A
Other languages
English (en)
Inventor
버티노제프리에스
Original Assignee
퀄컴 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퀄컴 인코포레이티드 filed Critical 퀄컴 인코포레이티드
Publication of KR20030086614A publication Critical patent/KR20030086614A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Abstract

데이터 접속을 통해, 터미널 장치로부터의 음성 명령에 의해 태스크 프로세서에서의 태스크 프로세싱을 원격적으로 시동하는 방법 및 시스템. 데이터 접속을 통해 태스크 프로세서와의 음성 명령 세션이 개시된다. 그 다음, 터미널 장치는, 세션이 확립된 태스크 프로세서로부터 확인을 수신한다. 태스크 프로세서가 세션을 확인한 후에는, 애플리케이션 특정 명령이 태스크 프로세서로 송신된다. 그 다음, 터미널 장치는 애플리케이션 특정 명령에 대한 응답을 수신한다. 원한다면, 사용자에 의해, 명령을 송신하고 응답을 수신하는 단계가 반복될 수 있다.

Description

터미널 장치로부터의 음성 명령에 의해 태스크 프로세서에서의 태스크 프로세싱을 원격적으로 시동하는 방법 및 시스템 {METHOD OF AND SYSTEM FOR REMOTELY INVOKING PROCESSING TASKS AT A TASK PROCESSOR THROUGH VOICE COMMANDS FROM A TERMINAL DEVICE}
발명의 배경
발명의 분야
본 발명은 일반적으로 통신 시스템에 관한 것이다. 보다 구체적으로, 본 발명은 터미널 장치로부터의 음성 명령에 의해 태스크 프로세서에서의 태스크 프로세싱을 원격적으로 시동하는 방법 및 시스템에 관한 것이다.
관련 기술
이메일, 컴퓨터 파일, 스프레드 시트 및 데이터베이스 기록과 같은 정보에 연산을 수행하고 액세스를 제공하기 위해, 프로세싱 플랫폼 (processing platforms) 에 대한 기업체와 기관의 의존도가 점진적으로 증가하고 있다.
이동 전화, PDA (personal digital assistants) 및 호출기와 같은 휴대용 통신 장치의 도래로 인해, 사람들은 사실상 전세계 어디에서든 원격적으로 정보에 액세스할 수 있고 태스크 프로세싱을 개시할 수 있다. 정보 및 프로세싱에 대한 액세스 가능성 (accessibility) 의 증가에도 불구하고, 많은 경우, 이러한 휴대용 통신 장치들은 사용자에게 원격 프로세싱 플랫폼으로부터의 정보를 편리하게 액세스하고 검색할 수 있는 인터페이스를 제공하지 못한다.
전문가들은 종종, 다른 태스크를 수행하는 동시에 정보에 원격적으로 액세스하기를 원한다. 예를 들어, 부동산 에이전트, 배달원, 및 트럭 기사들은 종종, 차량을 운행하면서 거리 주소, 이메일 및 재고 정보와 같은 정보를 얻어야 한다.
유감스럽게도, 휴대용 통신 장치들은 통상적으로, 디스플레이, 키패드 및/또는 터치 스크린에 의해 정보에 대한 액세스를 제공하는 사용자 인터페이스를 갖는다. 이러한 인터페이스들은 사용자의 주의를 집중시키기 때문에 불편할 수 있다. 따라서, 운전이나 기계의 조작과 같은 태스크를 수행할 경우, 사용자는 장치의 조작 및 수행 중인 태스크 모두에 그들의 주의를 기울이기가 어렵다. 이러한 어려움으로 인해, 자동차 사고 및 부상과 같은 위험한 결과가 초래될 수 있다.
현재의 음성 프로세싱 기술을 이용하면, 정보를 테스트로부터 음성으로 그리고 음성으로부터 텍스트로 변환할 수 있다. 이러한 기술은, 다른 태스크로부터 사용자의 주의를 흐트리지 않는 인터페이스의 발달을 가능하게 한다. 따라서, 필요한 것은 음성 명령에 의해 태스크 프로세싱을 원격적으로 시동하는 방법 및 시스템이다.
발명의 요약
본 발명은, 데이터 접속을 호출기 터미널 장치로부터의 음성 명령에 의해 태스크 프로세서에서의 태스크 프로세싱을 원격적으로 시동하는 방법 및 시스템을 제공한다. 일 실시형태에서, 터미널 장치는 무선 전화기 또는 PDA 와 같은 휴대용 핸드셋이고, 데이터 접속은 무선 CDMA 링크 (wireless Code Division Multiple Access) 를 포함한다.
본 발명에 따르면, 데이터 접속을 호출기 태스크 프로세서와의 음성 명령 세션이 개시된다. 그 다음, 터미널 장치는, 세션이 확립되었다는 확인을 태스크 프로세서로부터 수신한다. 태스크 프로세서가 세션을 확인한 후에는, 애플리케이션 특정 명령 (application specific command) 이 태스크 프로세서로 송신된다. 그 다음, 터미널 장치는 애플리케이션 특정 명령에 대한 응답을 수신한다. 필요하다면, 명령을 송신하고 응답을 수신하는 단계들은 사용자에 의해 반복될 수 있다.
애플리케이션 특정 명령을 송신하는 단계는, 사용자가 터미널 장치상의 PTT (push to talk) 버튼을 활성화하는 단계 및, PTT 버튼이 활성화되어 있는 동안, 터미널 장치상의 마이크로폰으로 음성 명령을 발화하는 단계를 포함할 수 있다.
본 발명의 이점은, 사용자의 관심을 독점하지 않으면서, 태스크 프로세싱을 원격적으로 시동하고/시동하거나 정보를 수신할 수 있는 기능을 사용자에게 제공할 수 있다는 것이다.
도면의 간단한 설명
첨부된 도면을 참조하여 본 발명을 설명한다. 도면에서, 유사한 참조 번호는 일반적으로, 동일한 요소 (elements), 기능적으로 유사한 요소, 및/또는 구조적으로 유사한 요소를 나타낸다. 참조 번호의 가장 왼편 숫자(들)로써, 하나의 요소가 처음으로 등장하는 도면을 나타낸다.
도 1 은 본 발명의 일 실시형태에 따른, 예시적인 통신 시스템을 나타낸다.
도 2A 및 도 2B 는 통신 시스템의 제 1 및 제 2 구현의 블록도이다.
도 3 은 터미널 장치의 블록도이다.
도 4 는 태스크 프로세서의 블록도이다.
도 5 는 터미널 장치와 태스크 프로세서 사이의 상호작용을 나타내는 흐름도이다.
도 6 및 도 7 은 터미널 장치 및 태스크 프로세서의 상태도이다.
바람직한 실시형태의 상세한 설명
도 1 은 예시적인 통신 시스템 (100) 을 나타낸다. 통신 시스템 (100) 은 터미널 장치 (102), 데이터 접속 (104) 및 태스크 프로세서 (106) 를 포함한다.
터미널 장치 (102) 는 데이터 접속 (104) 을 호출기 태스크 프로세서 (106) 와 통신한다. 터미널 장치 (102) 는 태스크 프로세서 (106) 에 의해 수행될 태스크를 프로세싱하기 위한 (여기에서 명령이라고도 하는) 요청을 전송한다. 이들 요청은 터미널 장치 (102) 상의 (나타내지 않은) 사용자 인터페이스를 호출기 사용자에 의해 입력된다. 이들 요청은 음성 명령의 형태일 수 있다. 또한, 터미널 장치 (102) 는 태스크 프로세서 (106) 에 의해 생성된 정보를 수신한다. 터미널 장치 (102) 는 사용자 인터페이스에 의해 사용자에게 이 정보를 출력할 수 있다.
터미널 장치 (102) 는 (여기에서 휴대용 핸드셋이라고도 하는) 휴대용 통신 장치일 수 있다. 휴대용 통신 장치의 예로는 셀룰러 및 위성 전화기를 들 수있다. 휴대용 통신 장치의 추가적인 예로는 개인용 컴퓨터, 호출기, PDA 및 무선 개인용 컴퓨터를 들 수 있다.
태스크 프로세서 (106) 는 터미널 장치 (102) 에 의해 생성된 요청에 응답하여 태스크를 프로세싱한다. 이러한 태스크에는 정보의 생성 및/또는 검색이 포함된다. 그 다음, 이 정보는 데이터 접속 (104) 을 통해 터미널 장치 (102) 로 전송될 수 있다.
데이터 접속 (104) 은 터미널 장치 (102) 와 태스크 프로세서 (106) 사이에서 정보의 양방향 교환을 가능하게 한다. 데이터 접속 (104) 은 회로-스위치드 접속 (circuit-switched connection), 패킷-스위치드 접속 또는, 당업자에게 공지되어 있는 임의의 다른 접속 타입일 수 있다. 데이터 접속 (104) 은 하나 이상의 통신 링크를 포함할 수 있다. 예를 들어, 데이터 접속 (104) 은 무선 통신 링크, 유선 통신 링크 및/또는 데이터 네트워크의 임의 조합으로 구현될 수 있다.
도 2A 및 도 2B 는 통신 시스템 (100) 의 제 1 및 제 2 구현 (100a 및 100b) 의 블록도이다. 이들 구현 (100a 및 100b) 은 각각의 데이터 접속 (104) 에서 차이가 있다. 이들 구현은 단지 일례로써 제시된 것이다. 당업자라면 알 수 있는 바와 같이, 다른 통신 토폴로지 및 아키텍처 (communications topologies and architectures) 가 이용될 수 있다.
도 2A 는 구현 (100a) 의 블록도인데, 이 경우, 데이터 접속 (104) 은 무선 링크 (202), 네트워크 액세스 포인트 (204) 및 유선 링크 (206) 를 포함한다. 무선 링크 (202) 는 터미널 장치 (102) 와 네트워크 액세스 포인트 (204) 사이에서정보의 교환을 가능하게 한다. 유선 링크 (206) 는 네트워크 액세스 포인트 (204) 와 태스크 프로세서 (106) 사이에서 정보의 교환을 가능하게 한다.
무선 링크 (202) 는, IS-707 하에서 구체화된 CDMA 데이터 링크일 수 있다. IS-707 은, RF (radio frequency) 매질을 통한 양방향 비동기 회로-스위치드 및 양방향 패킷 데이터 통신을 가능하게 한다. TIA (Telecommunications Industry Association) 에 의해 1999년 5월 25일에 간행되었으며 (여기에서 그 전부를 참조하고 있는), "Data Service Options for Wideband Spread Spectrum Communications Systems"이라는 명칭의 문서번호 TIA/EIA/IS-707A 에, IS-707 통신이 상세히 개시되어 있다. IS-707 링크를 대신하여, 무선 링크 (202) 는 다른 타입의 패킷-스위치드 또는 회로-스위치드 통신 링크일 수 있다. 예를 들어, 무선 링크 (202) 는 무선 IP (Internet Protocol) 패킷-스위치드 통신 링크, 셀룰러 회로-스위치드 통신 링크, 또는 당업자에게 공지되어 있는 다른 타입의 통신 링크일 수 있다.
네트워크 액세스 포인트 (204) 는 무선 링크 (202) 와 유선 링크 (206) 사이에 인터페이스를 제공한다. 네트워크 액세스 포인트 (204) 는, 기지국 또는 위성과 같은, 휴대용 무선 통신 장치에 대한 종결 포인트 (termination point) 일 수 있다. 네트워크 액세스 포인트 (204) 는 데이터 접속 (104) 을 통해 전달된 정보를, 무선 링크 (202) 에 의해 지원되는 포맷 및/또는 프로토콜과 유선 링크 (206) 에 의해 지원되는 포맷 및/또는 프로토콜 사이에서 변환한다.
상술한 바와 같이, 무선 링크 (206) 는 네트워크 액세스 포인트 (204) 와 태스크 프로세서 (106) 사이에서 정보의 교환을 가능하게 한다. 무선 링크 (206)는 양방향 정보 교환을 제공하는 전화통신 회로 (telephony circuit) 일 수 있다. 이러한 회로의 예로는 LLD (local loop data) 접속, ISDN 접속, 광섬유 접속을 들 수 있다.
도 2B 는 구현 (100b) 의 블록도이다. 구현 (100a) 과 마찬가지로, 구현 (100b) 의 데이터 접속 (104) 은 무선 링크 (202), 네트워크 액세스 포인트 (204) 및 유선 링크 (206) 를 포함한다. 그러나, 구현 (100b) 의 데이터 접속 (104) 은 태스크 프로세서 (106) 를 유선 링크 (206) 에 접속하는 데이터 네트워크 (208) 를 더 포함한다. 데이터 네트워크 (208) 는, 글로벌 인터넷 또는 인트라넷과 같은 IP 패킷-스위치드 네트워크일 수 있다. 그러나, 데이터 네트워크 (208) 는, ATM (asynchronous transfer mode) 네트워크, X.25 네트워크, 무선 패킷-스위치드 네트워크, 또는 여기에서의 설명으로부터 당업자에게 명백한 임의의 다른 네트워크와 같은, 다른 타입의 패킷-스위치드 네트워크일 수 있다.
도 3 은 터미널 장치 (102) 의 블록도이다. 터미널 장치 (102) 는 통신 인터페이스 (302), 음성 포매터 (voice formatter ; 304), 오디오 프론트 엔트 (audio front end ; 306), 사용자 인터페이스 (308), 애플리케이션 (310), 데이터베이스 (312) 및 데이터 포매터 (314) 를 포함한다. 터미널 장치 (102) 는 하나 이상의 태스크 프로세서 (106) 를 가진 단-대-단 통신 (end-to-end communication) 과 관련이 있다. 이러한 단-대-단 통신은 터미널 장치 (102) 에 의한 프로세싱 요청의 전송 및 이들 태스크에 대한 태스크 프로세서 (106) 에 의한 응답의 전송을 포함한다.
통신 인터페이스 (302) 로 인해, 터미널 장치 (102) 는 해당하는 데이터 접속 (104) 을 통해 하나 이상의 태스크 프로세서 (106) 와 통신할 수 있다. 예를 들어, 상술한 구현 (100a 및 100b) 을 참조하면, 통신 인터페이스 (302) 로 인해, 터미널 장치 (102) 의 요소들은 무선 링크 (202) 를 통해 정보를 교환할 수 있다. 특히, 통신 인터페이스 (302) 는 음성 포매터 (304) 에 의한 음성 신호의 교환 및 데이터 포매터 (314) 에 의한 데이터 신호의 교환을 가능하게 한다.
애플리케이션 (310) 은 터미널 장치 (102) 에 상주하는 프로세싱 플랫폼에 의해 실행되는 하나 이상의 소프트웨어 애플리케이션이다. 소프트웨어 애플리케이션의 예로는, 브라우징, 워드 프로세싱, 파일 액세스, 스케쥴링, 이메일 및 어드레스북 애플리케이션을 들 수 있지만, 이들에 한정되는 것은 아니다. 이들 애플리케이션의 실행은, 데이터 포매터 (314) 및 통신 인터페이스 (302) 에 의한 하나 이상의 태스크 프로세서 (106) 로부터의 데이터 전송 및 수신 뿐만 아니라 사용자 인터페이스 (308) 에 의한 사용자 입출력을 지원하는 프로세싱을 포함한다.
사용자 인터페이스 (308) 로 인해, 사용자는 터미널 장치 (102) 와 상호작용할 수 있다. 예를 들어, 사용자 인터페이스 (308) 로 인해, 사용자는 음성 명령을 발행하고 음성 응답을 수신할 수 있다. 따라서, 사용자 인터페이스 (308) 는 마이크로폰 및 스피커를 포함한다. 또한, 사용자 인터페이스 (308) 로 인해, 사용자는 비음성 수단 (non-voice means) 에 의해 데이터를 입력하고 정보를 수신할 수도 있다. 따라서, 사용자 인터페이스 (308) 는 키보드, 키패드, 터치 스크린 및 디스플레이와 같은 입출력 컴포넌트를 포함할 수 있다.
사용자 인터페이스 (308) 는 오디오 프론트 엔드 (306) 에 결합된다. 오디오 프론트 엔드 (306) 는 사용자 인터페이스 (308) 와 음성 명령 및 응답을 교환하며, 사용자 인터페이스 (308) 에 의해 이용되는 아날로그 음성 신호 포맷과 디지털 신호 포맷 사이에서 변환한다. 이러한 디지털 신호 포맷은 PCM (pulse code modulation) 이다. 그러나, 당업자에게 명백한 바와 같이, PAM (pulse amplitude modulation), DPCM (differential pulse code modulation), ADPCM (adaptive pulse code modulation) 및 다른 디지털 신호 포맷과 같은, 다른 신호 포맷이 이용될 수 있다.
일 실시형태에서, 사용자 인터페이스 (308) 는 PTT 버튼을 포함한다. PTT 버튼이 사용자에 의해 활성화될 경우, 사용자 인터페이스 (308) 는 음성 신호를 오디오 프론트 엔드 (306) 로 송신한다. 그러나, PTT 버튼이 사용자에 의해 활성화되지 않을 경우, 사용자 인터페이스 (308) 는 음성 신호를 오디오 프론트 엔드 (306) 로 송신하지 않는다. 따라서, PTT 피처 (feature) 로 인해, 사용자는 음성 신호가 터미널 장치 (102) 로부터 태스크 프로세서 (106) 로 전송되는 시기를 제어할 수 있다. 이러한 PTT 피처는, 사용자 인터페이스 (308) 로부터 오디오 프론트 엔드 (306) 로의 아날로그 음성 신호 전달을 중단시키는 스위치로 구현될 수 있다. 그러나, 당업자에게 명백한 바와 같이, 다른 기술을 이용하여 이러한 피처를 구현할 수도 있다. 이러한 PTT 피처의 이점은, 데이터 접속을 통한, 백그라운드 잡음 및 원치 않는 음성 신호의 전송을 방지할 수 있다는 것이다.
오디오 프론트 엔드 (306) 는 음성 포매터 (304) 에 결합된다. 일 실시형태에서, 음성 포매터 (304) 는 오디오 프론트 엔드 (306) 에 의해 핸들링되는 포맷(들)과 데이터 접속 (104) 을 통해 전송하는데 이용되는 포맷(들) 사이에서 디지털 음성 신호를 변환한다. 상술한 바와 같이, 터미널 장치 (102) 는 무선 링크 (202) 에 결합될 수 있다. 무선 링크는 IS-707 CDMA 데이터 링크 또는, 무선 IP 패킷-스위치드 통신 링크 및 셀룰러 회로-스위치드 접속과 같은, 다른 형태의 데이터 링크일 수 있다. 음성 포매터 (304) 에 의해 수행되는 변환은, 당업자에게 명백한 바와 같이, 정보의 프로세싱 및 버퍼링을 포함할 수 있다.
데이터베이스 (312) 는, 터미널 장치 (102) 의 애플리케이션 (310), 사용자 인터페이스 (308) 및 다른 컴포넌트에 의한 정보의 저장 및 액세스를 가능하게 한다. 데이터베이스 (312) 는 (저장 매체라고도 하는) 메모리로 구현될 수 있다. 메모리의 예로는, 단기 메모리 (short term memory), 장기 메모리 (long term memory), 비휘발성 메모리, 플로피 디스크와 같이 이동가능한 메모리, 또는 정보를 저장하는데 이용될 수 있는 임의의 다른 메모리를 들 수 있다. 데이터베이스 (312) 를 구현하는데 이용되는 메모리는 하나 이상의 하드웨어 저장매체 컴포넌트들간에 분산될 수 있다. 데이터베이스 (312) 는, 터미널 장치 (312) 의 전원이 차단된 경우에도, 저장된 데이터를 보유할 수 있다.
데이터 포매터 (314) 는 애플리케이션 (310) 에 결합된다. 데이터 포매터 (314) 는, 애플리케이션 (310) 과 태스크 프로세서 (106) 사이에서 단-대-단 통신을 가능하게 한다. 일 실시형태에서, 데이터 포매터 (314) 는 애플리케이션 (310) 에 의해 핸들링되는 포맷(들)과 데이터 접속 (104) 을 통해 전송하는데 이용되는 포맷(들) 사이에서 디지털 신호를 변환한다. 상술한 바와 같이, 터미널 장치 (102) 는 무선 링크 (202) 에 결합될 수 있다. 무선 링크는 IS-707 CDMA 데이터 링크 또는, 무선 IP 패킷-스위치드 통신 링크 및 셀룰러 회로-스위치드 통신 링크와 같은, 다른 형태의 데이터 링크일 수 있다. 음성 포매터 (304) 에 의해 수행되는 이러한 변환은, 당업자에게 명백한 바와 같이, 정보의 프로세싱 및 버퍼링을 포함할 수 있다.
도 4 는 태스크 프로세서 (106) 의 블록도이다. 태스크 프로세서 (106) 는 통신 인터페이스 (402), 음성 포매터 (404), 음성 인식 및 합성 모듈 (406), 애플리케이션 (408), 데이터 포매터 (410) 및 데이터베이스 (412) 를 포함한다. 태스크 프로세서 (106) 는 하나 이상의 터미널 장치 (102) 를 갖는 단-대-단 통신과 관련이 있다. 이러한 단-대-단 통신은, 터미널 장치 (102) 에 의한 프로세싱 요청의 전송 및 태스크 프로세서 (106) 에 의한 이러한 태스크 요청에 대한 응답의 전송을 포함한다.
통신 인터페이스 (402) 로 인해, 태스크 프로세서 (106) 는 해당하는 데이터 접속 (104) 을 통해 하나 이상의 터미널 장치 (102) 와 통신할 수 있다. 예를 들어, 상술한 구현 (100a 및 100b) 를 참조하면, 통신 인터페이스 (402) 로 인해, 태스크 프로세서 (106) 의 요소들은 무선 링크 (206) 또는 데이터 네트워크 (208) 를 통해 정보를 교환할 수 있다. 특히, 통신 인터페이스 (402) 는 음성 포매터 (404) 에 의한 음성 신호의 교환 및 데이터 포매터 (410) 에 의한 데이터 신호의 교환을 가능하게 한다.
애플리케이션 (408) 은 태스크 프로세서 (106) 에 상주하는 프로세싱 플랫폼(들)에 의해 실행되는 하나 이상의 소프트웨어 애플리케이션이다. 이러한 소프트웨어 애플리케이션의 예로는, 당업자에게 명백한 바와 같이, 파일 서버 애플리케이션, 이메일 서버 애플리케이션, 프로세스 서버 애플리케이션, 데이터베이스 서버 애플리케이션 및 다른 프로세싱 애플리케이션을 들 수 있지만, 이들에 한정되는 것은 아니다. 이들 애플리케이션의 실행은, 터미널 장치 (102) 의 사용자(들)에 의해 발생된 요청을 만족시키기 위한 프로세싱을 포함한다. 이들 요청은 디지털 음성 신호로서 데이터 접속 (104) 을 통해 전송되는 음성 명령의 형태이다. 애플리케이션 (408) 은 이들 요청을 음성 인식 및 합성 모듈 (406) 에 의해 텍스트 명령의 형태로 수신한다.
애플리케이션 (408) 은 터미널 장치(들) (102) 로부터 수신된 요청을 만족시키기 위한 정보를 생성하고/생성하거나 검색한다. 또한, 애플리케이션 (408) 은 이러한 정보를 포함하는 응답을 터미널 장치(들) (102) 로 전송할 수 있다. 이들 응답은 음성 포매터 (404) 및 통신 인터페이스 (402) 에 의해 디지털 음성 신호의 형태로 전송될 수 있다. 다른 방법으로, 이들 응답이 데이터 포매터 (410) 및 통신 인터페이스 (402) 에 의해 데이터 신호의 형태로 전송될 수 있다.
음성 포매터 (404) 는 통신 인터페이스 (402) 에 의해 데이터 접속 (104) 과 음성 신호를 교환한다. 음성 포매터 (404) 는, 음성 인식 및 합성 모듈 (406) 에 의해 핸들링되는 포맷(들)과 데이터 접속 (104) 을 통해 전송하는데 이용되는 포맷(들) 사이에서 디지털 음성 신호를 변환한다. 상술한 바와 같이, 태스크프로세서 (106) 는 무선 링크 (206) 또는 데이터 네트워크 (208) 에 결합될 수 있다. 음성 포매터 (404) 에 의해 수행되는 변환은, 당업자에게 명백한 바와 같이, 정보의 프로세싱 및 버퍼링을 포함할 수 있다.
음성 인식 및 합성 모듈 (406) 은 음성 포매터 (404) 와 음성 신호를 교환한다. 일 실시형태에서, 이들 음성 신호의 포맷은 PCM 이다. 그러나, 당업자에게 명백한 바와 같이, PAM, DPCM, ADPCM 및 다른 디지털 신호 포맷과 같은, 다른 신호 포맷이 이용될 수 있다. 또한, 음성 인식 및 합성 모듈 (406) 은, 터미널 장치 (102) 에 의해 발생되어 음성 포매터 (404) 에 의해 수신되는 음성 신호를 텍스트 명령으로 변환한다. 그 다음, 이러한 텍스트 명령은 애플리케이션 (408) 으로 전달되어 프로세싱을 시동한다. 또한, 음성 인식 및 합성 모듈 (406) 은 애플리케이션 (408) 으로부터 수신된 텍스트 응답을, 요청하는 터미널 장치 (102) 로 전송하기 위한 음성 신호로 변환한다. 음성 인식 및 합성 모듈 (406) 은, 당업자에게 공지된 기술 및/또는 알고리즘에 따라, 음성 신호와 텍스트 사이의 변환을 수행한다.
데이터 포매터 (410) 는 애플리케이션 (408) 에 결합된다. 데이터 포매터 (410) 는, 애플리케이션 (408) 과 터미널 장치 (102) 사이에서 단-대-단 통신을 가능하게 한다. 데이터 포매터 (410) 는 애플리케이션 (408) 에 의해 핸들링되는 포맷(들)과 데이터 접속 (104) 을 통해 전송하는데 이용되는 포맷(들) 사이에서 디지털 데이터 신호를 변환한다. 데이터 포매터 (408) 에 의해 수행되는 이러한 변환은, 당업자에게 명백한 바와 같이, 정보의 프로세싱 및 버퍼링을 포함할 수있다.
데이터베이스 (412) 는, 태스크 프로세서 (104) 의 애플리케이션 (408) 및 다른 컴포넌트에 의한 정보의 저장 및 액세스를 가능하게 한다. 데이터베이스 (412) 는 (저장 매체라고도 하는) 메모리로 구현될 수 있다. 메모리의 예로는, 단기 메모리, 장기 메모리, 비휘발성 메모리, 플로피 디스크와 같이 이동가능한 메모리, 또는 정보를 저장하는데 이용될 수 있는 임의의 다른 메모리를 들 수 있다. 데이터베이스 (412) 를 구현하는데 이용되는 메모리는 하나 이상의 하드웨어 저장매체 컴포넌트들간에 분산될 수 있다. 데이터베이스 (412) 는, 태스크 프로세서 (106) 의 전원이 차단된 경우에도, 저장된 데이터를 보유할 수 있다.
도 5 는 터미널 장치 (102) 와 태스크 프로세서 (106) 사이의 상호작용을 나타내는 흐름도이다. 이 상호작용은 단계 502 로 시작한다. 단계 502 에서, 터미널 장치 (102) 는 태스크 프로세서 (106) 와의 음성 명령 세션을 개시한다. 이 단계는, 태스크 프로세서 (106) 와 관련되는 전화 번호 또는 어드레스를 다이얼링하는 단계 또는 터미널 장치 (102) 가 태스크 프로세서 (106) 와의 음성 명령 세션을 확립하고자 한다는 것을 나타내는 시그널링 메시지를 송신하는 단계를 포함할 수 있다.
단계 504 에서, 태스크 프로세서 (106) 는 인증 요청 (authentification request) 을 터미널 장치 (102) 로 송신한다. 이 단계는, 사용자가 터미널 장치 (102) 의 사용자 인터페이스 (308) 에 의해 패스워드를 입력할 것을 요청하는 단계를 포함한다.
단계 504 에는 단계 505 가 수반된다. 단계 505 에서, 사용자는 터미널 장치 (102) 의 사용자 인터페이스 (308) 와 상호작용하여 세션을 인증한다. 일 실시형태에서, 이 단계는, 사용자가 키패드를 통해 패스워드를 입력하는 단계를 포함한다.
다음으로, 단계 506 에서, 태스크 프로세서 (106) 는 프로세싱 요청을 수신할 준비가 되었음을 터미널 장치 (102) 에 지시한다. 즉, 터미널 장치 (102) 는 태스크 프로세서 (106) 로부터 세션이 확립되었다는 확인을 수신한다. 일 실시형태에서, 이 단계는, 사용자 인터페이스 (308) 에 의해 사용자에게 디스플레이하기 위한 데이터 신호를 송신하는 단계를 포함한다. 다른 실시형태에서, 이 단계는, 사용자 인터페이스 (308) 에 의한 오디오 출력을 위해 "세션 확립 (session established)"과 같은 음성 신호를 송신하는 단계를 포함한다.
단계 506 다음에는 단계 508 이 수행된다. 단계 508 에서, 터미널 장치 (102) 는 태스크 프로세서 (106) 로 하나의 요청을 송신한다. 이 요청은 애플리케이션 특정 명령이다. 즉, 이것은 태스크 프로세서 (106) 의 애플리케이션 (408) 이 특정 태스크를 수행하라는 요청이다. 이 단계는, 사용자가 터미널 장치 (102) 의 사용자 인터페이스 (308) 상의 PTT 버튼을 누르는 단계 및, PTT 버튼이 눌러져 있는 동안, 사용자 인터페이스 (308) 상의 마이크로폰으로 음성 명령을 발화하는 단계를 포함한다. 음성 명령의 예시적인 세트가 아래의 표 1 에 제공된다.
다음으로, 단계 509 에서, 터미널 장치 (102) 는 태스크 프로세서 (106) 에의해 전송된 확인을 수신한다. 이러한 확인은, 태스크 프로세서 (106) 가 단계 508 에서 터미널 장치 (102) 에 의해 송신된 요청 또는 명령을 프로세싱하고 있음을 나타낸다. 이러한 확인은 사용자 인터페이스 (308) 상에 디스플레이될 데이터 또는 사용자 인터페이스 (308) 상의 스피커를 통해 출력될 음성 신호의 형태일 수 있다. 이 단계로 인해, 사용자는 태스크 프로세서 (106) 에 의해 요청이 수신되었음을 확인할 수 있다.
다음으로, 단계 510 에서, 터미널 장치 (102) 는 태스크 프로세서 (106) 로부터의 응답을 대기한다. 이 단계는, "요청 계류 (request pending)" 과 같은, 사용자 인터페이스 (308) 에 의해 출력되는 메시지를 포함할 수 있다. 또한, 이러한 출력은 계류중인 요청의 수를 나타낼 수 있다. 이들 메시지는, 디스플레이되는 텍스트 또는 오디오 음성 신호로서 출력될 수 있다.
단계 510 에는 단계 512 가 수반된다. 단계 512 에서, 사용자는 터미널 장치 (102) 와 상호작용하여 부가적인 요청을 태스크 프로세서 (106) 로 송신할 수 있다. 사용자가 그렇게 할 것을 선택하면, 단계 508 내지 510 이 반복 수행된다. 그렇지 않으면, 단계 514 가 수행된다.
단계 514 에서, 터미널 장치 (102) 는 단계 508 에서 태스크 프로세서 (106) 로부터 전송된 애플리케이션 특정 명령에 대한 응답을 수신한다. 이 응답은 데이터 및/또는 음성 신호를 포함할 수 있다. 데이터 형태의 응답은 데이터 포매터 (314) 를 통해 애플리케이션 (310) 에 의해 수신된다. 일단 수신되면, 이 데이터는 사용자 인터페이스 (308) 에 의해 사용자에게 디스플레이되고/디스플레이되거나 데이터베이스 (312) 에 저장될 수 있다. 음성 신호 형태의 응답은 음성 포매터 (304) 및 오디오 프론트 엔드 (306) 에 의해 수신될 수 있다. 일단 수신되면, 이들 음성 신호는 사용자 인터페이스 (308) 의 스피커에 의해 사용자에게 출력된다.
단계 514 가 수행되는 동안 수신된 응답들은, 단계 508 에서 터미널 장치 (102) 에 의해 송신된 해당 요청을 만족시키기 위한 정보를 전달한다. 이 정보는 당업자에게 명백한 임의의 포맷일 수 있다. 예를 들어, 응답은 HTML (hypertext markup languages) 로 기록된 파일 또는 문서, 스프레드 시트, 데이터베이스 기록, 및 이메일의 형태일 수 있다. 또한, 응답은 캘린더, 약속 및 스케쥴링 정보의 형태일 수 있다. 또한, 응답은 거리의 주소, 전화 번호, URLs 및 이메일 어드레스와 같은 접촉 정보 (contact information) 의 형태일 수 있다. 이들 응답은 데이터 신호 및/또는 음성 신호로서 데이터 접속 (104) 을 통해 전달될 수 있다. 이러한 데이터 신호는 데이터 포매터 (314) 및 통신 인터페이스 (302) 를 통해 애플리케이션 (310) 에 의해 수신된다. 이들 데이터 신호에 포함된 정보는 사용자 인터페이스 (308) 에 의해 디스플레이될 수 있다. 이러한 음성 신호는 오디오 프론트 엔드 (306), 음성 포매터 (304) 및 통신 인터페이스 (302) 를 통해 사용자 인터페이스 (308) 에 의해 수신된다. 상술한 바와 같이, 사용자 인터페이스 (308) 는 이들 음성 신호를 출력할 수 있는 스피커를 포함한다.
다음으로, 단계 516 에서, 사용자는 사용자 인터페이스 (308) 와 상호작용하여 부가적인 요청의 송신 여부를 결정한다. 사용자가 그렇게 하기로 선택하면, 단계 508 내지 514 가 반복 수행된다.
표 1 은 본 발명에 따른 음성 명령의 예시적인 세트를 제공한다. 당업자에게 명백한 바와 같이, 다른 음성 명령이 본 발명에 포함될 수도 있다.
음성 명령 설명
"다운로드 <리소스명>" 태스크 프로세서 (106) 가 <리소스명 (resource name)> 에 의해 지시된 리소스를 데이터의 형태로 터미널 장치 (102) 로 송신하는 명령. 리소스에는 파일, 이메일, 데이터베이스 기록, 마크업 언어로 기록된 페이지, 스케쥴, 접촉 리스트, 및 당업자에게 명백한 다른 리소스가 포함될 수 있다. 이러한 명령에 의해 송신된 리소스는 데이터베이스 (312) 에 저장될 수 있다.
"리사이트 (recite) <리소스명>" 태스크 프로세서 (106) 가 <리소스명> 에 의해 지시된 리소스를 디지털 음성 신호의 형태로 터미널 장치 (102) 로 송신하는 명령. 리소스에는 파일, 이메일, 데이터베이스 기록, 마크업 언어로 기록된 페이지, 스케쥴, 접촉 리스트, 및 당업자에게 명백한 다른 리소스가 포함될 수 있다.
"딕테이트 (dictate) <사용자 음성>" 태스크 프로세서 (106) 가 터미널 장치 (102) 의 사용자에 의해 발화된 음성 <사용자 음성> 을 기록하고, 그것을 음성 인식 및 합성 모듈 (406) 을 이용해 텍스트로 변환하는 명령. 이 텍스트는 데이터베이스 (412) 에 저장될 수 있다.
도 5 를 참조하여 상술한 동작 시퀀스에 부가하여, 이하에서는, 도 6 및 도 7 을 참조하여 터미널 장치 (102) 및 태스크 프로세서 (106) 의 성능을 설명한다.
도 6 은 터미널 장치 (102) 의 다양한 동작 상태 (operational states) 를 나타내는 상태도이다. 도 6 에 나타낸 바와 같이, 터미널 장치 (102) 는 휴지 상태 (602), 접속 상태 (604) 및 인증 상태 (606) 에서 동작할 수 있다. 전이 이벤트 (608, 610, 612 및 614) 로 인해 이들 상태 사이의 전이가 발생한다.
터미널 장치 (102) 가 휴지 상태 (602) 에서 동작할 경우, 태스크 프로세서 (106) 와 확립된 접속 또는 세션은 없다. 따라서, 이 상태 동안, 태스크 프로세서 (106) 로 음성 명령이 송신되지 않는다.
전이 이벤트 (608) 의 발생시에, 터미널 장치 (102) 동작은 휴지 상태 (602) 로부터 접속 상태 (604) 로 전이한다. 사용자가 태스크 프로세서 (106) 와의 접속 (또는 세션) 확립을 시도할 경우에, 전이 이벤트 (608) 가 발생한다. 사용자는 터미널 장치 (102) 의 사용자 인터페이스 (308) 와의 상호 작용에 의해 이러한 접속을 확립한다. 이러한 상호 작용은 전화 번호를 다이얼링하는 단계 또는 데이터 네트워크 (208) 와 같은 패킷 스위치드 네트워크와의 세션을 확립하는 입력 명령을 입력하는 단계를 포함할 수 있다.
터미널 장치 (102) 가 접속 상태 (604) 에서 동작하는 동안, 사용자는 패스워드와 같은 인증 정보를 태스크 프로세서 (106) 로 송신할 수 있다. 이러한 인증 정보는 키보드 입력 또는 음성 명령과 같은 기술에 의해 사용자 인터페이스 (308) 를 통해 입력된다. 음성 명령에 의해 인증 정보가 입력될 경우, 사용자는 음성 명령을 발화하는 동안 사용자 인터페이스 (308) 상의 PTT 버튼을 누른다. 이러한 인증 정보는, 사용자가 태스크 프로세서 (106) 로 태스크 요청을 송신하도록 인증되었음을 태스크 프로세서 (106) 에 지시한다.
전이 이벤트 (610) 가 발생할 경우, 터미널 장치 (102) 동작은 접속 상태 (604) 로부터 휴지 상태 (602) 로 복귀한다. 이벤트 (610) 는 2 가지 이상의 방식으로 발생할 수 있다. 제 1 방식은, 인증 정보의 전송으로부터 소정량의 시간이 경과한 후에도 인증 확인을 수신하는데 실패하는 것이다. 제 2 방식은 태스크 프로세서 (106) 로부터 인증 거부 메시지를 수신하는 것이다.
전이 이벤트 (612) 는 터미널 장치 (102) 동작을 접속 상태 (604) 로부터 인증 상태 (606) 로 이동시킨다. 터미널 장치 (102) 가 태스크 프로세서 (106) 로부터 인증 승인 메시지를 수신할 경우, 이 이벤트가 발생한다. 이 응답은 사용자가 인증되었음을 나타낸다.
인증 상태 (606) 로 진입하면, 자신이 인증되었음을 사용자에게 알리기 위한 지시가 사용자 인터페이스 (308) 상으로 출력된다. 이 지시는 디스플레이에 의해 출력될 수 있다. 또한, "세션 확립"을 선언하는 오디오 음성 신호의 형태로 스피커에 의해 이 지시가 출력될 수도 있다.
터미널 장치 (102) 가 인증 상태 (606) 에서 동작하는 동안, 사용자는 확립된 데이터 접속을 통해 하나 이상의 음성 명령을 태스크 프로세서 (106) 로 송신할 수 있다. 이들 명령 각각은 애플리케이션 특정이다. 즉, 이들 명령 각각은 특정 태스크를 수행하라는 태스크 프로세서 (106) 에 대한 요청이다. 음성 명령을 태스크 프로세서 (106) 로 송신하는 단계는 사용자가 사용자 인터페이스 (308) 상의 PTT 버튼을 활성화하는 단계 및, PTT 버튼이 활성화되어 있는 동안, 사용자 인터페이스 (308) 상의 마이크로폰으로 음성 명령을 발화하는 단계를 포함한다.
상태 (606) 에서, 터미널 장치 (102) 는 태스크 프로세서 (106) 로부터, 특정한 음성 명령에 대응하며, 애플리케이션 (408) 에 의해 프로세싱될 해당 명령을 태스크 프로세서 (106) 가 수신했음을 나타내는 확인도 수신한다. 이들 확인은 사용자 인터페이스 (308) 에 의해 디스플레이될 데이터 또는 사용자 인터페이스(308) 상의 스피커에 의해 출력될 음성 신호의 형태일 수 있다. 바람직하게도, 이들 확인으로 인해, 사용자는 태스크 프로세서 (106) 에 의해 명령이 수신되었음을 확인할 수 있다.
인증 상태 (606) 동안 확인을 수신하는 것에 부가하여, 터미널 장치 (102) 는 이 상태에서 사용자에 의해 송신된 음성 명령에 대한 하나 이상의 응답을 수신할 수 있다. 이들 응답은 데이터 포매터 (314) 에 의해 데이터의 형태로 수신될 수 있다. 일단 수신되면, 이 데이터는 사용자 인터페이스 (308) 에 의해 사용자에게 디스플레이되고/디스플레이되거나 데이터베이스 (132) 에 저장될 수 있다. 다른 방법으로, 이들 응답은 음성 포매터 (304), 음성 프론트 엔드 (306) 및 사용자 인터페이스 (308) 의 스피커에 의해 음성 신호의 형태로 수신될 수 있다.
이벤트 (614) 의 발생시에, 터미널 장치 (102) 동작은 인증 상태 (606) 를 벗어나 휴지 상태 (602) 로 복귀한다. 접속 상태 (604) 로의 진입시에 확립된 세션이 종결될 경우, 이 이벤트가 발생한다.
도 7 은 태스크 프로세서 (106) 의 다양한 동작 상태를 나타내는 상태도이다. 도 7 에 나타낸 바와 같이, 태스크 프로세서 (106) 는 휴지 상태 (702), 접속 상태 (704) 및 인증 상태 (706) 에서 동작할 수 있다. 전이 이벤트 (708, 710, 712 및 714) 로 인해 이들 상태 사이의 전이가 발생한다.
태스크 프로세서 (106) 가 휴지 상태 (602) 에 있을 경우, 터미널 장치 (102) 와 확립된 접속은 없다. 그러나, 이 상태에서, 태스크 프로세서 (106)는 터미널 장치 (102) 와 이전에 확립된 세션에서 수신된 명령의 프로세싱을 수행할 수 있다. 또한, 휴지 상태 (702) 동작 동안, 태스크 프로세서 (106) 는 후속 세션에서 터미널 장치 (102) 로 전송하기 위한 명령에 대한 응답을 생성하여 저장할 수 있다.
전이 이벤트 (708) 의 발생시에, 태스크 프로세서 (106) 동작은 휴지 상태 (702) 로부터 접속 상태 (704) 로 전이한다. 터미널 장치 (102) 의 사용자가 태스크 프로세서 (106) 와의 접속 확립을 시도할 경우에, 전이 이벤트 (708) 가 발생한다. 사용자는 터미널 장치 (102) 의 사용자 인터페이스 (308) 와의 상호 작용을 통해 이러한 접속을 확립한다. 이러한 상호 작용은 전화 번호를 다이얼링하는 단계 또는 데이터 네트워크 (208) 와 같은 패킷 스위치드 네트워크와의 세션을 확립하는 입력 명령을 입력하는 단계를 포함할 수 있다.
접속 상태 (704) 에서, 태스크 프로세서 (106) 는 터미널 장치 (102) 로부터 인증 정보를 수신할 수 있다. 이러한 인증 정보는 인코딩된 음성 정보 또는 디지털 포맷의 데이터일 수 있다. 태스크 프로세서 (106) 는 이 정보를 프로세싱하여 사용자가 태스크 프로세서 (106) 로 음성 명령을 송신하도록 인증되었는지를 확인한다. 또한, 접속 상태 (704) 에 있는 동안, 태스크 프로세서 (106) 는, 사용자가 액세스에 대해 인증되었는지 또는 거부되었는지를 나타내는 응답을 터미널 장치 (102) 로 송신한다.
이벤트 (710) 또는 이벤트 (712) 가 발생할 때, 태스크 프로세서 (106) 동작은 접속 상태 (704) 를 벗어난다. 터미널 장치 (102) 와 태스크 프로세서(106) 사이에서 데이터 접속 또는 세션이 종결될 경우, 이벤트 (710) 가 발생한다. 이벤트 (710) 로 인해 태스크 프로세서 (106) 동작은 휴지 상태 (702) 로 복귀한다. 사용자가 인증되었고 사용자가 태스크 프로세서 (106) 동작을 인증 상태 (706) 로 진행시키고자 할 경우, 이벤트 (712) 가 발생한다.
인증 상태 (706) 에서 동작하는 동안, 태스크 프로세서 (106) 는 터미널 장치 (102) 로부터 송신된 음성 명령을 수신하여 프로세싱할 수 있다. 또한, 상태 (706) 에서, 태스크 프로세서 (106) 는 데이터 접속 (104) 을 통해 수신한 각각의 명령에 대한 확인을 터미널 장치 (102) 로 송신한다.
확인을 송신하는 것에 부가하여, 태스크 프로세서 (106) 가 상태 (706) 에서 동작하는 동안, 애플리케이션 (408) 은 하나 이상의 응답을 터미널 장치 (102) 로 송신할 수 있다. 이들 응답은 애플리케이션 특정이며, 터미널 장치 (102) 와 태스크 프로세서 (106) 사이에서의 양방향 음성 및 데이터 전달을 포함할 수 있다. 이들 응답 중 몇몇은, 인증 상태 (706) 에서의 이전 동작 구간 동안에 수신된 명령에 대한 것일 수 있다.
이벤트 (714) 의 발생시에, 태스크 프로세서 (106) 동작은 인증 상태 (706) 를 벗어나 휴지 상태 (702) 로 복귀한다. 접속 상태 (704) 로의 진입시에 확립된 세션이 종결될 때, 이 이벤트가 발생한다.
태스크 프로세서 (106) 의 모든 동작 상태를 통해, 애플리케이션 (408) 은 다수의 명령을 동시에 프로세싱할 수 있다. 예를 들어, 애플리케이션 (408) 은, 애플리케이션 (408) 이 프로세싱을 끝내지 않은, 이전에 수신된 명령에 관한상태 문의 명령 (status inquiry command) 을 수신하여 프로세싱할 수 있다. 동시에 실행되는 명령에 대한 응답의 순서 및 타이밍은 애플리케이션 특정이며 여기에서 설명한 예들에 한정되지 않는다.
본 발명의 다양한 실시형태를 상술하였지만, 이들은 단지 예로써 제시된 것이며 이에 한정되는 것은 아님을 알 수 있다. 따라서, 본 발명의 폭과 범위가 상술한 예시적 실시형태에 의해 한정되지 않으며, 이하의 청구항 및 그 등가물에 따라서만 규정되어야 한다.

Claims (14)

  1. 데이터 접속을 통해, 터미널 장치로부터의 음성 명령에 의해 태스크 프로세서에서의 태스크 프로세싱을 원격적으로 시동하는 방법으로서,
    (a) 상기 데이터 접속을 통해 상기 태스크 프로세서와의 음성 명령 세션을 개시하는 단계;
    (b) 상기 터미널 장치에서, 세션이 확립되었다는 확인 (acknowledgement) 을 상기 태스크 프로세서로부터 수신하는 단계;
    (c) 상기 태스크 프로세서가 세션을 확인한 후, 상기 태스크 프로세서로 애플리케이션 특정 명령을 송신하는 단계;
    (d) 상기 터미널 장치에서, 상기 애플리케이션 특정 명령에 대한 응답을 수신하는 단계; 및
    (e) 필요하다면, 단계 (c) 내지 (d) 를 반복하는 단계를 포함하는 것을 특징으로 하는 태스크 프로세싱의 원격 시동 방법.
  2. 제 1 항에 있어서,
    상기 애플리케이션 특정 명령을 송신하는 단계는,
    PTT (push to talk) 버튼을 활성화하는 단계; 및
    PTT 버튼이 활성화되어 있는 동안, 마이크로폰으로 음성 명령을 발화하는 단계를 포함하는 것을 특징으로 하는 태스크 프로세싱의 원격 시동 방법.
  3. 제 1 항에 있어서,
    상기 데이터 접속은 무선 CDMA (Code Division Multiple Access) 데이터 링크를 포함하는 것을 특징으로 하는 태스크 프로세싱의 원격 시동 방법.
  4. 제 1 항에 있어서,
    상기 터미널 장치는 휴대용 핸드셋인 것을 특징으로 하는 태스크 프로세싱의 원격 시동 방법.
  5. 제 1 항에 있어서,
    (f) 상기 터미널 장치에서, 상기 태스크 프로세서에 의해 전송된 확인을 수신하는 단계를 더 포함하며,
    상기 확인은, 상기 태스크 프로세서가 상기 단계 (c) 에서 송신된 애플리케이션 특정 명령을 프로세싱 중인 것을 나타내는 것을 특징으로 하는 태스크 프로세싱의 원격 시동 방법.
  6. 제 1 항에 있어서,
    상기 애플리케이션 특정 명령에 대한 응답은 데이터를 포함하는 것을 특징으로 하는 태스크 프로세싱의 원격 시동 방법.
  7. 제 1 항에 있어서,
    상기 애플리케이션 특정 명령에 대한 응답은 음성 신호를 포함하는 것을 특징으로 하는 태스크 프로세싱의 원격 시동 방법.
  8. 데이터 접속을 통해, 터미널 장치로부터의 음성 명령에 의해 태스크 프로세서에서의 태스크 프로세싱을 원격적으로 시동하는 시스템으로서,
    상기 데이터 접속을 통해 상기 태스크 프로세서와의 음성 명령 세션을 개시하는 수단;
    상기 터미널 장치에서, 세션이 확립되었다는 확인을 상기 태스크 프로세서로부터 수신하는 수단;
    상기 태스크 프로세서가 세션을 확인한 후, 상기 태스크 프로세서로 애플리케이션 특정 명령을 송신하는 수단; 및
    상기 터미널 장치에서, 상기 애플리케이션 특정 명령에 대한 응답을 수신하는 수단을 구비하는 것을 특징으로 하는 태스크 프로세싱의 원격 시동 시스템.
  9. 제 8 항에 있어서,
    상기 애플리케이션 특정 명령을 송신하는 수단은,
    PTT 버튼; 및
    PTT 버튼이 활성화되어 있는 동안, 마이크로폰으로 음성 명령을 수신하는 수단을 구비하는 것을 특징으로 하는 태스크 프로세싱의 원격 시동 시스템.
  10. 제 8 항에 있어서,
    상기 데이터 접속은 무선 CDMA 데이터 회로를 구비하는 것을 특징으로 하는 태스크 프로세싱의 원격 시동 시스템.
  11. 제 8 항에 있어서,
    상기 터미널 장치는 휴대용 핸드셋인 것을 특징으로 하는 태스크 프로세싱의 원격 시동 시스템.
  12. 제 8 항에 있어서,
    상기 태스크 프로세서에 의해 전송된 확인을 상기 터미널 장치에서 수신하는 수단을 더 구비하며,
    상기 확인은, 상기 태스크 프로세서가 상기 송신 수단에 의해 송신된 애플리케이션 특정 명령을 프로세싱 중인 것을 나타내는 것을 특징으로 하는 태스크 프로세싱의 원격 시동 시스템.
  13. 제 8 항에 있어서,
    상기 애플리케이션 특정 명령에 대한 응답은 데이터를 포함하는 것을 특징으로 하는 태스크 프로세싱의 원격 시동 시스템.
  14. 제 8 항에 있어서,
    상기 애플리케이션 특정 명령에 대한 응답은 음성 신호를 포함하는 것을 특징으로 하는 태스크 프로세싱의 원격 시동 시스템.
KR10-2003-7012579A 2001-03-26 2002-03-22 터미널 장치로부터의 음성 명령에 의해 태스크프로세서에서의 태스크 프로세싱을 원격적으로 시동하는방법 및 시스템 KR20030086614A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/818,333 2001-03-26
US09/818,333 US20020176376A1 (en) 2001-03-26 2001-03-26 Method of and system for remotely invoking processing tasks at a task processor through voice commands from a terminal device
PCT/US2002/008728 WO2002077791A2 (en) 2001-03-26 2002-03-22 Method of and system for remotely invoking processing tasks at a task processor through voice commands from a terminal device

Publications (1)

Publication Number Publication Date
KR20030086614A true KR20030086614A (ko) 2003-11-10

Family

ID=25225281

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2003-7012579A KR20030086614A (ko) 2001-03-26 2002-03-22 터미널 장치로부터의 음성 명령에 의해 태스크프로세서에서의 태스크 프로세싱을 원격적으로 시동하는방법 및 시스템

Country Status (7)

Country Link
US (1) US20020176376A1 (ko)
EP (1) EP1382186A2 (ko)
KR (1) KR20030086614A (ko)
AR (1) AR033204A1 (ko)
AU (1) AU2002252446A1 (ko)
MX (1) MXPA03008787A (ko)
WO (1) WO2002077791A2 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102005001351A1 (de) * 2005-01-11 2006-07-20 Teles Ag Informationstechnologien Verfahren zur Übertragung von Daten an mindestens ein Kommunikations-Endsystem und Kommunikations-Einrichtung zur Durchführung des Verfahrens
CN101377797A (zh) * 2008-09-28 2009-03-04 腾讯科技(深圳)有限公司 一种应用语音控制游戏系统的方法和游戏系统
US20140351315A1 (en) * 2013-05-22 2014-11-27 Nvidia Corporation Idle processing resource allocation in a computing system across a network to boost processing capability of a data processing device thereof

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1993001664A1 (en) * 1991-07-08 1993-01-21 Motorola, Inc. Remote voice control system
US5950167A (en) * 1998-01-26 1999-09-07 Lucent Technologies Inc. Screen-less remote voice or tone-controlled computer program operations via telephone set
US6505159B1 (en) * 1998-03-03 2003-01-07 Microsoft Corporation Apparatus and method for providing speech input to a speech recognition system

Also Published As

Publication number Publication date
US20020176376A1 (en) 2002-11-28
MXPA03008787A (es) 2004-04-21
AU2002252446A1 (en) 2002-10-08
WO2002077791A3 (en) 2003-11-13
WO2002077791A2 (en) 2002-10-03
EP1382186A2 (en) 2004-01-21
AR033204A1 (es) 2003-12-10

Similar Documents

Publication Publication Date Title
US6553240B1 (en) Print option for WAP browsers
KR100538198B1 (ko) 무선 모뎀과 통신 장치간의 무선 링크를 자동으로설정하는 방법
US6842622B2 (en) User interface using speech generation to answer cellular phones
CN101297541B (zh) 在具有不同通信模式的设备之间的通信
US7151763B2 (en) Retrieving voice-based content in conjunction with wireless application protocol browsing
US7630330B2 (en) System and process using simplex and duplex communication protocols
EP1784962B1 (en) System, method, and computer program product for content delivery in a push-to-talk communication system
US20020065944A1 (en) Enhancement of communication capabilities
US20050180464A1 (en) Audio communication with a computer
WO2003063137A1 (en) Multi-modal information delivery system
KR20020079788A (ko) 통신망에서 정보를 교환하는 방법 및 장치
KR20010051903A (ko) 음성인식에 기초한 무선장치용 사용자 인터페이스
US7295984B2 (en) Systems and methods for providing voice and data interfaces to web services-based applications
EP1225754A2 (en) Voice message system
EP1410660B8 (en) Multimodal session support on distinct multichannel protocol
US20030046575A1 (en) Digital identity information cards
US20040174981A1 (en) Interactive system, interaction control method, and interaction control program
US20030043975A1 (en) Voicemail/memo service
US6975886B2 (en) Telecommunication terminal and a method for communicating with a server by means of a telecommunication terminal
KR20030086614A (ko) 터미널 장치로부터의 음성 명령에 의해 태스크프로세서에서의 태스크 프로세싱을 원격적으로 시동하는방법 및 시스템
KR100688292B1 (ko) 문자 메시지 내용에 포함된 전화 번호로 자동 연결하는이동 통신 단말기 및 방법
GB2427500A (en) Mobile telephone text entry employing remote speech to text conversion
KR100424508B1 (ko) 음성인식을 통한 무선인터넷 사이트 접속 방법
KR20030022123A (ko) 데이터 및 음성 서비스가 통합된 무선 단말 통신 세션을제공하는 방법 및 시스템
US20030233480A1 (en) Apparatus for integrating voice and data communications

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid