KR101213514B1 - 전화 대화를 텍스트로 변환하기 위한 방법 및 시스템 - Google Patents

전화 대화를 텍스트로 변환하기 위한 방법 및 시스템 Download PDF

Info

Publication number
KR101213514B1
KR101213514B1 KR1020107029203A KR20107029203A KR101213514B1 KR 101213514 B1 KR101213514 B1 KR 101213514B1 KR 1020107029203 A KR1020107029203 A KR 1020107029203A KR 20107029203 A KR20107029203 A KR 20107029203A KR 101213514 B1 KR101213514 B1 KR 101213514B1
Authority
KR
South Korea
Prior art keywords
server
audio data
mobile device
processor
text
Prior art date
Application number
KR1020107029203A
Other languages
English (en)
Other versions
KR20110021963A (ko
Inventor
션 스코트 로저스
Original Assignee
퀄컴 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퀄컴 인코포레이티드 filed Critical 퀄컴 인코포레이티드
Publication of KR20110021963A publication Critical patent/KR20110021963A/ko
Application granted granted Critical
Publication of KR101213514B1 publication Critical patent/KR101213514B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/274Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc
    • H04M1/2745Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips
    • H04M1/2753Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips providing data content
    • H04M1/2757Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips providing data content by data transmission, e.g. downloading
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42221Conversation recording systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72436User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for text messaging, e.g. SMS or e-mail
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/60Medium conversion

Abstract

전화 대화의 일부를 텍스트로 변환하기 위한 방법들 및 시스템들은 사용자로 하여금, 예를 들어, 이동 디바이스 상의 버튼을 누름으로써 변환을 요청할 수 있게 하며, 그 요청은 변환 소프트웨어를 포함하는 서버에 송신된다. 서버는 전화 대화의 일부 또는 전부를 텍스트로 변환하고, 그 텍스트를 이동 디바이스에 송신한다. 텍스트 데이터는 선택된 정보에 대해 스캐닝될 수도 있으며, 선택된 정보만이 이동 디바이스에 송신될 수도 있다. 선택된 정보는 주소록과 같은 이동 디바이스의 메모리에 자동적으로 저장될 수도 있다.

Description

전화 대화를 텍스트로 변환하기 위한 방법 및 시스템{METHOD AND SYSTEM FOR TRANSCRIBING TELEPHONE CONVERSATION TO TEXT}
본 발명은 일반적으로 원격통신 기술들에 관한 것으로, 더 상세하게는, 전화기 네트워크 상에서 텍스트 데이터로 오디오 데이터를 변환하기 위한 방법들 및 시스템들과 관한 것이다.
오늘날의 통상적인 무선 이동 통신 디바이스 (예를 들어, 셀 전화기) 의 메모리 및 프로세싱 용량은 비교적 큰 양의 데이터를 저장하는 능력을 사용자에게 제공한다. 통상적으로, 이동 디바이스의 메모리 용량은, 전화번호, 이메일 주소 및 메일링 주소와 같은 연락 정보의 저장을 위해 사용된다. 통상적인 이동 디바이스 사용자는 수십 또는 심지어 수백의 저장된 전화번호들 및 주소들을 가질 수도 있다.
연락 정보의 엔트리는, 특히 연락 정보가 전화 대화 동안 구술된 단어에 의해 사용자에 관련되는 상황에서 손상되고 느려질 수 있다. 이러한 방식으로 수신된 정보를 입력 및 저장하는 것은, 먼저 정보가 몇몇 수동 저장 방법 (예를 들어, 일 조각의 페이퍼 상에 기입됨) 에 전달되고, 그 후 이동 디바이스에 수동으로 입력되어야 하기 때문에, 사용자에 대해 문제가 있을 수 있다. 특히, 이는, 사용자가 자동차를 운전중이거나 사용자가 이용가능한 기입 도구를 갖고 있지 않다면 문제가 있다.
다양한 실시형태들은, 대화의 일부를 표현하는 텍스트 데이터를 사용자의 이동 디바이스에 제공하기 위한 방법들 및 시스템들을 포함한다. 실시형태들은 텍스트 데이터에서 전화 번호들을 스캐닝하고 식별할 수도 있으므로, 이러한 정보는 텍스트 데이터로부터 추출되고, 전화번호부 또는 다른 메모리 위치와 같은 이동 디바이스 내에 저장될 수 있다. 실시형태들은, 버퍼링된 대화를 텍스트 데이터로 변환하기 전에 몇몇 또는 모든 대화를 버퍼링할 수 있다.
다양한 실시형태들은, 대화를 텍스트 데이터로 변환하도록 서버에 이동 디바이스가 요청할 수 있으며, 서버가 그 변환을 수행하고 저장을 위해 사용자의 전화기에 텍스트 데이터를 송신하도록 촉진한다. 또한, 서버는 텍스트 데이터에서 전화 번호들을 스캐닝, 식별 및 추출할 수도 있고, 데이터를 사용자의 이동 디바이스에 송신할 수도 있다.
여기에 포함되고 본 명세서의 일부를 구성하는 첨부한 도면은 본 발명의 예시적인 실시형태들을 도시한다. 상기 제공된 일반적인 설명 및 아래에 제공되는 상세한 설명과 함께, 도면들은 본 발명의 특성들을 설명하도록 기능한다.
도 1은, 음성 오디오 데이터를 텍스트 데이터로 변환할 수 있는 예시적인 통신 디바이스의 컴포넌트 블록도이다.
도 2는 통신 디바이스 내에서 음성 오디오 데이터를 텍스트 데이터로 변환하기 위한 일 실시형태 방법의 프로세스 흐름도이다.
도 3은 변환 요청 버튼 활성화에 응답하여 변환 프로세스를 개시하고 종료하기 위한 일 실시형태 방법의 프로세스 흐름도이다.
도 4는 변환이 서버에 의해 달성되는 일 실시형태의 시스템 블록도이다.
도 5는 일 실시형태에서의 사용에 적합한 예시적인 서버의 컴포넌트 블록도이다.
도 6은 서버에서 음성 오디오 데이터를 텍스트 데이터로 변환하기 위한 일 실시형태 방법의 프로세스 흐름도이다.
도 7은 서버에서 음성 오디오 데이터를 텍스트 데이터로 변환하기 위한 일 실시형태 방법의 대안적인 프로세스 흐름도이다.
도 8은 서버에서 음성 오디오 데이터를 텍스트 데이터로 변환하기 위한 일 실시형태 방법의 또 다른 대안적인 프로세스 흐름도이다.
상세한 설명
다양한 실시형태들은 첨부한 도면들을 참조하여 상세히 설명될 것이다. 가능한 임의의 도면에서, 동일한 참조부호는 동일 또는 유사한 부분들을 지칭하기 위해 도면 전반에 걸쳐 사용될 것이다. 특정한 예들 및 구현들에 행해진 참조들은 예시의 목적을 위한 것이며, 본 발명 또는 청구항의 범위를 제한하도록 의도되지 않는다.
"전화기" 라는 용어는, 유선의 지상선 전화기들, 무선 셀룰러 전화기들, VOIP (voice-over-Internet protocol) 전화기, 음성 통신 능력을 갖는 랩탑 컴퓨터들, 및 인터넷 전화 서비스들 (예를 들어, Skype) 을 지원할 수 있는 디바이스들을 포함하는 임의의 전화 통신 디바이스 또는 시스템을 포함한다.
여기에 사용된 바와 같이, "이동 핸드셋", "핸드셋", "이동 디바이스" 및 "핸드헬드 디바이스" 는 셀룰러 전화기, 개인 휴대 정보 단말기 (PDA), 팜-탑 컴퓨터들, 무선 전자 메일 수신기들 및 셀룰러 전화 수신기들 (예를 들어, 블랙베리
Figure 112010085882095-pct00001
및 트레오
Figure 112010085882095-pct00002
디바이스들), 멀티미디어 인터넷 인에이블된 셀룰러 전화기들 (예를 들어, 아이폰
Figure 112010085882095-pct00003
), 및 프로그래밍가능한 프로세서 및 메모리 및 셀룰러 또는 다른 무선 네트워크에 접속하기 위한 능력을 포함하는 유사한 개인용 전자 디바이스들 중 임의의 하나 또는 모두를 지칭한다.
"음성-텍스트 컨버터 (converter)" 또는 "스피치-텍스트 컨버터" 또는 "컨버터" 또는 "음성-텍스트 변환기 (transcriber)" 또는 "변환기" 는, 사람의 음성 대화를 인식하고 그것을 텍스트 데이터로 컨버팅 (즉, 변환) 할 수 있는 임의의 타입의 소프트웨어 또는 하드웨어 시스템을 포함한다. 컨버터는 단일 텍스트 전환을 제공할 수 있거나 복수의 가장 가능한 텍스트 전환들을 제공할 수 있다. 실시형태들은, 임의의 특정한 타입의 음성-텍스트 컨버터로 제한되지는 않는다.
"서버" 라는 용어는, 사용자의 전화 디바이스에 대한 전화 접속을 제공하는 임의의 컴퓨터, 인터넷 서버 또는 셀룰러 기지국을 포함한다. 서버는, 유선 또는 무선 접속에 의해 사용자의 전화 디바이스에 직접적으로 또는 간접적으로 접속될 수 있다.
다양한 실시형태들은, 이동 디바이스 또는 전화기 사용자가 이동 디바이스 상의 저장을 위해 텍스트 데이터에 자동적으로 변환되는 대화의 모두 또는 일부를 갖게 할 수 있기 위한 방법들 및 시스템들을 제공한다. 일 실시형태에서, 버튼을 누르거나 커맨드를 입력함으로써, 사용자는 변환될 전화 대화의 일부를 선택할 수 있다. 일 실시형태에서, 대화의 선택된 부분은, 셀룰러 또는 통상의 전화기 네트워크에 커플링된 서버에서 변환되며, 그 후, 그 서버는 텍스트 데이터를 이동 디바이스에 송신한다. 대안적으로, 서버는, 이동 디바이스, 셀룰러 네트워크 또는 통상의 전화기 네트워크 중 임의의 것에 의하여 네트워크를 통해 액세스가능할 수도 있다. 일 실시형태에서, 텍스트는 전화 번호들 및/또는 주소 데이터 (즉, 연락 정보) 에 대해 스캐닝될 수 있다. 그러한 스캐닝은 (텍스트가 송신되기 전과 같이) 서버에서 수행될 수도 있거나 (텍스트가 수신된 이후와 같이) 이동 디바이스 내에서 수행될 수도 있다. 텍스트 데이터 또는 추출된 연락 정보는, 단문 메시지 서비스 (SMS) 메시지, 이메일과 같은 텍스트 메시지의 형태로 또는 셀룰러 데이터 송신을 통해 이동 디바이스에 송신될 수도 있다. 텍스트 데이터는, 그것이 자동적으로 이동 디바이스에 의해 인식되고 주소록 메모리에 저장되도록 특수하게 포맷팅되어 송신될 수도 있다.
실시형태 방법들은 다양한 이동 디바이스들 중 임의의 이동 디바이스, 및 데스크탑 및 랩탑 컴퓨터들을 포함하지만 이에 제한되지 않는 다양한 컴퓨팅 디바이스들 중 임의의 컴퓨팅 디바이스 상에서 구현될 수도 있다. 도 1은 다양한 실시형태들을 지원할 수 있는 이동 디바이스 (20) 의 다양한 컴포넌트들을 도시한다. 이동 디바이스 (20) 의 컴포넌트들이 도시되어 있지만, 당업자는 동일 또는 유사한 컴포넌트들이 다양한 실시형태에 대한 사용에 적합한 컴퓨터 (휴대용 등) 에서 또한 구현될 수도 있음을 인식할 것이다. 셀룰러 전화기로서의 이동 디바이스 (20) 의 도시는 단지 예시의 목적을 위한 것이다. 또한, 상술된 실시형태들은 도 1에 도시된 컴포넌트들을 포함하는 음성 대화를 지원할 수 있는 임의의 디바이스 상에서 구현될 수도 있다.
통상적인 이동 디바이스 (20) 는, 내부 메모리 (22) 및 사용자 인터페이스 디스플레이 (23) 에 커플링된 프로세서 (21) 를 포함한다. 또한, 이동 디바이스 (20) 는, 프로세서 (21) 에 커플링된 셀룰러 전화기 트랜시버 (25) 및/또는 무선 데이터 링크에 접속된 전자기 방사를 전송 및 수신하기 위한 안테나 (24) 를 가질 수도 있다. 몇몇 구현에서, 트랜시버 (25), 및 셀룰러 전화 통신에 사용되는 프로세서 (21) 및 메모리 (22) 의 일부들은, 그들이 무선 데이터 링크를 통해 데이터 인터페이스를 제공하므로 공중 인터페이스로서 지칭된다. 또한, 이동 디바이스 (20) 는 사용자로의 가청 오디오 신호들을 생성하기 위한 스피커 (28), 및 사용자의 오디오 스피치를 수신하기 위한 마이크로폰 (29) 을 포함한다. 마이크로폰 (29) 및 스피커 (28) 양자는, 전기 신호들을 사운드 웨이브로 컨버팅하고 사운드 웨이브를 전기 신호들로 컨버팅하는 보코더 (30) 를 통해 프로세서 (21) 에 접속될 수도 있다. 몇몇 구현에서, 보코더 (30) 는 프로세서 (21) 의 프로그래밍 및 회로의 일부로서 포함될 수도 있다.
프로세서 (21) 는, 여기에 설명된 다양한 실시형태들의 기능들을 포함하는 다양한 기능들을 수행하도록 소프트웨어 명령들 (애플리케이션들) 에 의해 구성될 수 있는, 임의의 프로그래밍가능한 마이크로프로세서, 마이크로컴퓨터 또는 다수의 프로세서 칩 또는 칩들일 수도 있다. 몇몇 이동 디바이스에서, 무선 통신 기능에 전용된 하나의 프로세서 및 다른 애플리케이션들을 구동하는데 전용된 하나의 프로세서와 같이, 다수의 프로세서들 (191) 이 제공될 수도 있다.
통상적으로, 소프트웨어 애플리케이션들은, 그들이 액세스되고 프로세서 (21) 내에 로딩되기 전에 내부 메모리 (22) 에 저장될 수도 있다. 몇몇 이동 디바이스에서, 프로세서 (21) 는 애플리케이션 소프트웨어 명령들을 저장하는데 충분한 내부 메모리를 포함할 수도 있다. 이러한 설명의 목적을 위해, 메모리라는 용어는, 내부 메모리 (22) 및 프로세서 (21) 그 자체 내의 메모리를 포함하는 프로세서 (21) 에 의해 액세스가능한 모든 메모리를 지칭한다. 메모리 (22) 는, 플래시 메모리와 같은 휘발성 또는 비휘발성 메모리, 또는 그 양자의 혼합물일 수도 있다. 다양한 실시형태에서, 메모리 (22) 는 버퍼 (39) 로 구성될 수도 있으며, 음성-텍스트 컨버터 소프트웨어 (44), 연락 정보 추출 소프트웨어 (46) 및/또는 주소록 (52) 을 그 내에 저장한다.
통상적으로, 이동 디바이스들 (20) 은 사용자 입력들을 수신하기 위해, 키패드 (36) 또는 소형 키보드 및 메뉴 선택 버튼들 또는 로커 (rocker) 스위치들 (37) 을 포함한다. 또한, 이동 디바이스 (20) 는 변환 요청 버튼 (32) 을 포함할 수도 있다. 일 실시형태에서, 변환 요청 버튼 (32) 의 활성화는 음성-텍스트 변환 프로세스를 개시한다. 버튼 (32) 가 옵션적이며, 즉, 오디오-텍스트 컨버젼의 활성화가 임의의 다른 종류의 컴퓨터 인터페이스 입력을 통해 개시될 수도 있음을 유의한다. 당업자는, 음성-텍스트 소프트웨어 (44) 가, 디스플레이 (23) 상에 도시된 사용자 인터페이스 메뉴, 및 메뉴 선택 버튼들 또는 로커 스위치들 (37) 과 결합한 키 패드 (36) 를 통한 것과 같이 다양한 다른 수단들에 의해 활성화될 수도 있음을 인식할 것이다. 다른 예에서, 음성-텍스트 컨버젼 요청은, 키패드 (36) 상의 일련의 키들을 누름으로써, 음성 활성화에 의해 (즉, 특정한 미리 레코딩된 단어 또는 문장을 구술함으로써), (특정한 방식으로 이동 디바이스를 위치시키거나 흔드는 것과 같이) 이동 디바이스 (20) 상의 가속도계들을 활성화시킴으로써, 터치 스크린 디스플레이를 터치함으로써 등에 의해, 이동 디바이스 (20) 에 제공될 수 있다. 간략화를 위해, 예를 들어 다양한 실시형태들은, 사용자가 변환 요청 버튼 (32) 을 누름으로써 활성화되는 것으로 여기에 설명될 것이지만, 그러한 설명들은 변환 요청 버튼 (32) 의 사용에 제한되는 것으로 의도되지는 않는다.
변환 요청 버튼 (32) 을 포함하는 실시형태들에서, 변환 요청 버튼 (32) 은, 이동 디바이스 (20) 를 봐야하지 않으면서 전화 대화하는 동안 사용자가 변환 프로세스를 활성화시킬 수 있기 위해 인간공학적으로 편리한 위치의 이동 디바이스 (20) 상에 위치될 수도 있다. 예를 들어, 변환 요청 버튼 (32) 은, 사용자의 손가락이 이동 디바이스 (20) 를 귀에 유지시키면서 일반적으로 위치되는 장소 부근의 이동 디바이스 (20) 의 측면 상에 배치된다. 몇몇 이동 디바이스들은 음성-활성화된 다이얼링을 개시하기 위해 사용되는 측면 상의 버튼을 포함한다. 일반적으로, 그러한 버튼은 변환 활성화에 또한 인간공학적으로 적합할 위치에 위치된다. 변환 요청 버튼 (32) 이 이동 디바이스 (20) 상의 임의의 장소에 위치될 수도 있지만, 일 실시형태에서, 변환 요청 버튼 (32) 은 도 1에 도시된 바와 같이 이동 디바이스 (20) 의 측면 상에 위치된다. 예를 들어, 변환 요청 버튼 (32) 은, 사용자가 활성으로 대화하고 있는 동안 사용자의 새끼 손가락에 의해 동작될 수 있도록 인간공학적으로 위치되는 것으로 도 1에 도시되어 있다. 대안적인 실시형태에서, 제 2 변환 요청 버튼 (미도시) 은 이동 디바이스 (20) 의 다른 측면 상에 위치될 수도 있다 (즉, 변환 요청 버튼 (32) 은 디바이스의 양 측면 상에서 포함된다). 이동 디바이스 (20) 의 대향측 벽들 상에 2개의 별개의 변환 요청 버튼들을 위치시킴으로써, 변환 요청은 어느 한 손의 손가락에 의해 개시될 수도 있으므로, 사용자는 특정한 귀 상에서 대화를 청취할 필요가 없다. 일 실시형태에서, 변환 요청 버튼 (32) 은 변환 프로세스를 개시할 뿐만 아니라, 동일한 음성 콜 동안 제 2 시간에서 변환 요청 버튼 (32) 이 디프레스 (depress) 될 경우 변환 프로세스를 종료한다. 일 대안적인 실시형태에서, 제 2 버튼 (미도시) 은 활성 변환 요청을 종료하는데 사용되도록 이동 디바이스 상에 포함될 수도 있다.
도 2는, 사용자가 오디오 음성 콜의 일부 또는 전부를 텍스트 데이터로 변환할 수 있게 하기 위한 일 예시의 실시형태 방법의 프로세스 흐름도이다. 사용자가 오디오 데이터를 텍스트 데이터로 변환하기를 원할 경우, 사용자는, 예를 들어, 변환 요청 버튼 (32) 을 디프레스함으로써 메모리 (22) 에 저장된 음성-텍스트 컨버젼 소프트웨어 (44) 를 활성화시킨다 (단계 301). 통상적으로, 사용자는, 예를 들어, 중요한 세부사항들 (예를 들어, 연락 정보) 을 캡쳐하기 위해 전화 대화 동안 변환 요청 버튼 (32) 을 누를 것이다. 그러나, 음성-텍스트 컨버젼 소프트웨어 (44) 는, 사용자가 시작부로부터 음성 대화를 변환하기를 원한다면, 대화가 시작하기 전에 활성화될 수도 있다. 일단 음성-텍스트 소프트웨어 (44) 가 활성화되면, 소프트웨어는 대화가 발생함에 따라 그 대화를 변환하기 시작할 수 있다 (단계 308). 대안적으로, 음성-텍스트 컨버젼 소프트웨어 (44) 는 메모리 버퍼 (39) 에 저장된 대화를 변환할 수 있다. 전화 대화의 원하는 부분들이 텍스트로 변환된 이후, 그 텍스트는 전화 번호, 주소 등을 식별하기 위해 연락 정보 추출 소프트웨어 (46) 에 의해 스캐닝될 수 있다 (단계 310). 그 후, 추출된 연락 정보는 이동 디바이스 (20) 의 메모리 (22) 내의 주소록 (52) 에 저장될 수 있다 (단계 312). 주소록 (52) 에 연락 정보를 저장하는 단계는, 수동으로 또는 자동으로 수행될 수 있다.
사용자가 음성 콜 동안 오디오 데이터를 텍스트 데이터로 컨버팅하기를 원하는 실시형태들에서, 버퍼 (39) 는, 선택된 부분의 대화가 텍스트로 컨버팅될 수 있도록 전화 대화의 일부 또는 전부를 저장하도록 사용될 수도 있다. 이러한 실시형태를 사용하여, 사용자는 그것이 구술된 이후 오디오 데이터를 리캡쳐 (recapture) 하고 오디오 데이터를 텍스트 데이터로 컨버팅할 수 있다. 예를 들어, 버퍼 (39) 는, 5, 10, 30, 60 또는 300초와 같이 사용자에 의해 선택가능한 지속기간 동안 레코딩되도록 사이징되고 구성될 수도 있다.
변환 프로세스가 진행중인 대화 동안에만 활성화되는 실시형태에서, 변환 요청 버튼 (32) 은, 이동 디바이스 (20) 가 대기 모드에 있는 경우 (즉, 활성 음성 대화에 있지 않은 경우) 상이한 기능을 또한 갖는 버튼일 수도 있다. 도 3은, 다양한 실시형태로의 사용에 적합한 콜 상태에 의존하여 변환 요청 버튼 (32) 의 기능을 제어하기 위한 예시적인 방법을 도시한 프로세스 흐름도이다. 도 3에서, 변환 요청 버튼 (32) 은, 음성-활성화된 다이얼링을 개시하는 것과 같이 또 다른 소프트웨어 애플리케이션 또는 루틴에 의해 제어되는 대기 기능을 갖는다. 이동 디바이스 (20) 상에 구현된 관련 루틴 또는 대기 소프트웨어 애플리케이션에 의존하여, 버튼 (32) 은 음성 대화 동안 활성화되지 않은 임의의 기능과 관련될 수도 있다. 메인 루프 (201) 를 동작할 시에, 프로세서 (21) 는 예를 들어, 버튼 누름과 관련된 인터럽트 플래그를 검출함으로써 버튼 누름 이벤트를 검출할 것이다 (단계 202). 응답하여, 프로세서 (21) 는 콜이 활성인지를 결정하기 위해 플래그를 테스트할 수도 있다 (단계 203). 콜이 활성이 아니라면 (즉, 테스트 203="아니오"), 메인 루프 (201) 로 리턴하기 전에, 버튼 (32) 의 대기 기능을 제공하는 소프트웨어 루틴이 활성화된다 (단계 204). 예를 들어, 프로세서 (21) 는 음성-활성화 다이얼링 루틴 또는 애플리케이션을 개시할 수도 있다. 그러나, 콜이 활성화되면 (즉, 테스트 203="예"), 프로세서 (21) 는 변환 요청 메시지가 이미 전송되었는지를 결정하기 위해 변환-요청된 플래그를 테스트할 수도 있으며 (단계 205), 전송되지 않았다면 (즉, 테스트 205="아니오"), 여기에 설명된 하나 이상의 실시형태들에 따라 오디오-텍스트 컨버젼 요청 메시지를 서버 (50) 에 송신한다 (단계 206). 또한, 컨버젼 요청 메시지를 전송할 시에 (단계 206), 프로세서 (21) 는 변환 프로세스가 개시되었다는 것을 나타내기 위해 변환-요청된 플래그를 셋팅할 수도 있다 (단계 207). 이러한 플래그를 셋팅하는 것은, 소프트웨어가 또 다른 컴퓨터 상에서 구동하고 있고 따라서 프로세서 (21) 에 직접 액세스가능하지 않으므로, 프로세서 (21) 로 하여금 서버 (50) 가 변환하고 있는 중인지를 결정하게 할 수 있다. 컨버젼 요청 메시지를 전송할 시에 (단계 206), 프로세서 (21) 는 또 다른 변환 요청 버튼 (32) 누름 인터럽트가 검출될 때까지 메인 루프 (201) 에 리턴한다. 변환 요청 버튼 (32) 이 활성 콜 동안의 제 2 시간에서 눌러질 경우, 변환-요청된 플래그를 테스트하는 프로세서 (21) 는, 변환 요청이 이미 행해졌다고 결정할 것이므로 (즉, 테스트 205="예"), 프로세서 (21) 는 변환 종료 요청 메시지를 서버 (50) 에 송신할 것이고 (단계 208), 메인 루프 (201) 로 리턴하기 전에 변환-요청된 플래그를 클리어할 것이다 (단계 209).
대안적인 실시형태에서, 오디오를 텍스트 데이터로 컨버팅하는 프로세스는, 전화 대화에 대해 네트워크에 커플링된 서버 (50) 에서 수행된다. 변환 프로세스를 서버 (50) 에 오프로딩 (offloading) 하는 것은 이동 디바이스 (20) 의 배터리 및 프로세스 전력을 보존한다. 도 4는, 서버 (50) 에서 이동 디바이스 (20) 상에서 발생하는 음성 대화 중 일부 또는 전부를 변환할 수 있는 예시적인 실시형태 시스템을 도시한다. 시스템은, 셀룰러 네트워크 (52) 에 접속된 셀룰러 기지국 안테나 (51) 를 통해 또 다른 이동 디바이스 (55) 또는 전화기 (57) 와 통신하는 이동 디바이스 (20) 를 포함한다. 다른 이동 디바이스 (55) 와의 통신은 또 다른 기지국 (56) 을 통해 진행할 수도 있지만, 종래의 전화기 (57) 와의 통신은 종래의 전화 통신 네트워크 (54) 를 통해 진행할 수도 있다. 서버 (50) 는 셀룰러 통신 네트워크 (52), 종래의 전화 네트워크 (54) 또는 인터넷 (24) 과 같은 또 다른 통신 네트워크에 접속된다. 다양한 실시형태에서, 서버 (50) 는, 셀룰러 기지국 (51) 에, 셀룰러 통신 네트워크 (52) 의 스위칭 센터 내에, 종래의 전화 네트워크 (54) 의 스위칭 센터 내에, 또는 전화 대화 오디오 데이터가 제공될 수 있는 네트워크로의 액세스를 갖는 임의의 다른 장소에 위치될 수도 있다. 서버 (50) 가 인터넷에 커플링되는 구현에서, 또 다른 인터넷-접속된 서버 (미도시) 는 변환을 위해 오디오 데이터를 서버 (50) 에 라우팅하도록 셀룰러 통신 네트워크 (52) 또는 전화 통신 네트워크 (54) 내에 포함될 수도 있다. 일단 음성 콜이 확립되면, 이동 디바이스 (20) (또는 실제로는 도면부호 (55)) 의 사용자는 임의의 시간에 음성-텍스트 컨버젼 프로세스를 활성화시킬 수도 있다. 활성화될 경우, 전화 대화로부터의 오디오 데이터는, 여기에 설명된 바와 같이 그것이 저장 및 변환될 수 있는 서버 (50) 에 또한 전송된다.
도 5는 도 4에 도시된 실시형태 시스템에서의 사용을 위한 예시적인 서버 (50) 의 컴포넌트 블록도이다. 서버 (50) 는, 네트워크 (예를 들어, 인터넷 (53) 또는 통신 네트워크들 (52, 54)) 에 접속하기 위한 모뎀 또는 유사한 네트워크 인터페이스와 같은, 서버로 그리고 서버로부터 데이터를 통신하기 위한 입력/출력 포트 (52) 를 포함한다. 서버 (50) 는, 입력/출력 포트 (52) 와 통신하는, 그리고 컴퓨터 판독가능 메모리 (56) 와 통신하는 프로세서 (55) (예를 들어, 마이크로프로세서) 를 포함한다. 메모리 (56) 내에 저장된 것은 전화 신호 암호해독 소프트웨어 (42) 및 음성-텍스트 컨버젼 소프트웨어 (44) 일 수도 있다. 일 실시형태에서, 메모리 (56) 는 연락 정보 추출 소프트웨어 (46) 를 더 포함할 수도 있다. 또한, 메모리 (56) 는, 전화 대화의 일부 또는 전부를 임시적으로 저장하도록 구성된 버퍼 (49) 세그먼트 또는 파티션을 포함할 수도 있다. 전화 대화는 암호화 또는 암호화되지 않은 형태로 버퍼링될 수도 있다.
암호해독 소프트웨어 (42) 는, 음성-텍스트 컨버젼 소프트웨어 (44) 에 의해 프로세싱될 수 있는 오디오 데이터의 형태로 전화기 데이터를 컨버팅하는데 필요할 수도 있다. 통상적으로, 전화기 신호들은, 데이터 패킷들로 조직화된 디지털 데이터로서 셀룰러 및 전화 네트워크 (52, 54) 를 통해 송신된다 (POTS (plain ordinary telephone) 신호들이 거주자들로의/로부터의 아날로그 신호들로서 송신되지만, 그러한 신호들은, 멀티플렉싱된 광섬유 및 구리 트렁크 라인들을 통해 송신되는 디지털 데이터로 신속히 컨버팅된다). 디지털 데이터는 코드-분할 다중 액세스 (CDMA) 데이터 패킷들로 압축되고 패킷화될 수도 있다. 그러한 디지털 데이터는 많은 음성-텍스트 컨버젼 소프트웨어 (44) 애플리케이션들에 판독가능하지 않을 수도 있으며, 따라서, 변환이 시작하기 전에 인식가능한 오디오 데이터 포맷으로 컨버팅되어야 한다.
음성-텍스트 컨버터 소프트웨어 (44) 는 사람의 스피치를 텍스트로 컨버팅하기 위한 임의의 종류 또는 브랜드의 소프트웨어 또는 시스템일 수 있다. 많은 상이한 종류들 및 브랜드들의 그러한 소프트웨어가 상업적으로 이용가능하다. 암호해독 소프트웨어 (42) 및 음성-텍스트 컨버터 (44) 가 단일 소프트웨어 패키지 또는 애플리케이션으로 결합될 수 있음을 유의한다.
데이터 포맷들을 컨버팅하는 것 이외에, 서버 (50) 는 변환이 인가되었음을 확인할 필요가 있을 수도 있다. 몇몇 상황 및 정치 영역에서, 사생활 법률들이 전화 대화의 미인가된 암호해독을 방지한다. 이들 경우, 음성-텍스트 컨버젼 소프트웨어 (44) 가 특정한 사용자에 대해 활성화될 수 있기 전에, 사용자로부터의 사전 인가가 요구될 수도 있다. 몇몇 상황에서, 사용자의 이동 디바이스 (20) 상의 컨버젼 요청 버튼 (39) 을 누름으로써 텍스트 컨버젼 요청을 요청하는 사용자는, 사용자의 전화 대화를 암호해독하기 위한 특정한 인가로서 추론될 수도 있다. 다른 상황에서, 서버 (50) 는 (예를 들어, 다른 사용자의 이동 디바이스 (55) 상의 컨버젼 요청 버튼 (32) 의 누름에 의해) 전화 대화의 다른 멤버로부터 인가를 또한 획득할 필요가 있을 수도 있다.
일 실시형태에서, 암호해독 소프트웨어 (42) 및/또는 음성-텍스트 컨버터 (44) 는 서버 메모리 (56) 에 저장된 소프트웨어 대신에, 하드웨어 또는 하드웨어/소프트웨어 조합으로서 구현될 수 있다. 암호해독 소프트웨어 (42) 및 컨버터 (44) 의 하드웨어 및 소프트웨어 구현 양자는 청구항의 범위내에 있다.
연락 정보 추출 소프트웨어 (46) 는, 컨버팅된 텍스트를 전화 번호들, 주소들, 이메일 주소들 등에 대해 스캐닝하기 위해 서버 (50) 상에서 구현될 수 있다. 예를 들어, 전화 번호들은 알려진 영역의 코드 번호들, 또는 7 또는 10 디지트의 시퀀스들에 대해 텍스트를 스캐닝함으로써 인식되고 추출될 수 있다. 주소 정보는, "거리", "애비뉴 (avenue)", "도로", "PO 박스", 알려진 도시 또는 주 등과 같은 주소 정보와 일반적으로 관련된 단어들에 대해 텍스트를 스캐닝함으로써 인식될 수 있다. 이메일 주소들은, 알려진 이메일 서비스 제공자들 (예를 들어, Gmail.com, yahoo.com, hotmail.com), "이메일" 이라는 단어, 또는 물론 텍스트에서 "at" 라는 단어로 나타날 "@" 라는 단어에 대해 텍스트를 스캐닝함으로써 인식될 수 있다. 일단 번호 주소, 이메일 주소 또는 다른 연락 정보가 인식되면, 소프트웨어는 그 정보를 서술 (즉, 인식된 데이터가 텍스트 내에서 시작 및 종료하는 장소를 결정) 하기 위한 간단한 규칙을 사용할 수 있으며, 그 후, 그 서술된 정보를 메모리에 카피할 수 있다. 연락 정보가 성공적으로 추출되면, 그 정보는 이동 디바이스 (20) 사용자에 대해 식별되거나 그 사용자에 송신될 수 있으며, 옵션적으로, 사용자의 이동 디바이스 (20) 상의 주소록의 정확한 필드에 자동적으로 입력될 수 있다. 적절한 메모리 필드들로의 추출된 데이터의 입력은, 수신된 추출 연락 데이터를 사용하여 이동 디바이스 (20) 에 의해 수행될 수도 있다. 서버-백업된 시스템을 갖는 큰 조직에서의 경우일 수도 있는, 사용자의 주소록들이 서버 (50) 상에서 유지되는 구현들에서, 추출된 텍스트는 서버 (50) 상에서 유지되는 주소록의 적절한 필드들에 저장될 수 있다. 그 후, 사용자의 이동 디바이스 (20) 는, 그 이동 디바이스 (20) 가 서버 (50) 와 "동기화" 된 이후, 추출된 연락 정보를 포함하는 주소록의 최신 버전으로 업데이트될 수 있다. 그 후, 연락 정보와 관련되지 않은 텍스트 데이터는 폐기될 수도 있다.
일 실시형태에서, 서버 버퍼 (49) 는, 대화가 종료된 경우 (또는 대화가 중지된 경우) 전화 대화를 임시적으로 저장 (즉, 버퍼링) 하는데 사용될 수도 있다. 이러한 실시형태는 사용자로 하여금, 대화가 종료된 이후 텍스트로의 컨버팅을 위해 전화 대화의 일부를 선택할 수 있게 한다. 이러한 방식으로, 실시형태 방법은 사용자로 하여금, 오디오 데이터가 구술된 이후 그 오디오 데이터를 리캡쳐하게 하고, 그 오디오 데이터를 텍스트 데이터로 컨버팅하게 한다. 버퍼 지속기간은 사용자 또는 서버 오퍼레이터에 의해 선택가능할 수도 있으며, 임의의 길이를 가질 수도 있다.
도 6은, 서버 (50) 상에서 전화 대화의 오디오 데이터의 일부 또는 전부를 텍스트로 컨버팅하기 위한 일 실시형태 방법을 도시한 프로세스 흐름도이다. 도 2를 참조하여 상술된 바와 같이, 사용자가 오디오 데이터를 텍스트 데이터로 컨버팅하기를 원할 경우, 사용자는 변환 요청 버튼 (32) (또는 상술된 프로세스를 활성화시키는 다른 방법) 을 누를 수도 있다 (단계 301). 일단 텍스트 컨버젼 요청이 사용자에 의해 행해지면, 그 요청은 이동 디바이스 (20) 에 의해 서버 (50) 에 송신된다 (단계 302). 텍스트 컨버젼 요청은 전화 대화 동안 데이터 패킷으로서 전송될 수 있거나, 요청 커맨드를 구성하는 것으로서 인식될 수 있는 특수한 톤 또는 일련의 톤들로서 전송될 수도 있다. 서버 (50) 는 입력/출력 포트 (52) 를 통해 이동 디바이스 (20) 로부터 텍스트 컨버젼 요청을 수신한다 (단계 303). 몇몇 실시형태에서, 텍스트 컨버젼 요청은, 셀룰러 전화 통신 네트워크 (52) 또는 종래의 전화 통신 네트워크 (54) 내의 프로세서 또는 서버에 의해 인식될 수도 있으며, 프로세서 또는 서버가 그 요청 및 전화 대화 데이터를 서버 (50) 에, 예를 들어, 인터넷 (53) 을 통해 포워딩하게 한다. 이동 디바이스 (20) 가 무선 통신 디바이스인 예시에서, 텍스트 컨버젼 요청의 송신은 먼저 기지국 안테나 (51) 에 의해 수신되고, 서버 (50) 에 통신된다. 수신된 텍스트 컨버젼 요청에 응답하여, 서버 (50) 는, 수신된 통신 데이터를 변환될 수 있는 데이터 포맷으로 컨버팅하기를 시작하기 위해 암호해독 소프트웨어 (42) 를 활성화시킬 수도 있다 (단계 304). 본래의 또는 암호해독된 데이터 포맷 중 어느 하나의 음성 대화의 일부는 버퍼 (49) 에 임시적으로 저장될 수도 있다 (단계 307). 일단 오디오 데이터가 암호해독되면, 서버 프로세서 (55) 는 음성-텍스트 컨버젼 소프트웨어 (44) 를 활성화시킬 수도 있고, 대화를 변환하기를 시작할 수도 있다 (단계 308). 음성-텍스트 컨버젼은, 컨버젼 요청이 서버에 수신되는 때에 시작할 수 있다. 예를 들어, 사용자로부터의 커맨드에 응답하여, 대화의 모두 또는 일부가 서버 버퍼 (49) 에 저장되면, 예를 들어, 시작 포인트를 지정하기 위한 시간을 사용하거나 사용자가 레코딩된 대화를 청취하고 변환이 시작해야 하는 때를 지정함으로써, 대화는 저장된 대화의 임의의 포인트에서 시작할 수 있다.
일 실시형태에서, 사용자가 변환을 요청하지 않아도, 전화 대화는 대화가 진행함에 따라 서버 버퍼 (49) 에 저장될 수 있으며, 그에 의해 사용자가 필요성을 인식할 경우 변환이 개시되게 한다. 이러한 실시형태에서, 서버 (50) 는, 지금 막 발생한 전화 대화의 일부에 대해 텍스트 컨버젼 서비스를 사용자가 개시할 수 있도록, 전화 대화의 일부를 버퍼 (49) 에 저장할 수도 있다. 예를 들어, 서버 (50) 및 버퍼 (49) 는, 예를 들어, 30 내지 60초와 같은 제한된 주기의 시간을 확장하는 선입-선출 (FIFO) 버퍼에 오디오 데이터를 저장하도록 구성될 수 있다. 그 후, 다른 파티가 주소 또는 전화 번호를 말하는 것으로부터 당첨 복권 번호를 판독하는 것과 같이, 사용자가 변환되기를 원할 어떤 것을 청취하면, 사용자는 버퍼 (49) 에 저장된 대화 데이터의 변환을 (예를 들어, 이동 디바이스 (20) 상의 버튼 (32) 을 누름으로써) 즉시 요청할 수 있다. 이러한 실시형태에서, 사용자들은, 그들이 전화 대화의 일부를 변환할 것임을 미리 결정할 필요는 없으며, 다른 파티에게 그들이 반복하도록 요청하지 않아도 된다. 사생활을 보호하고 원격통신 법률에 부합하기 위해, 대화의 멤버들 양자는 부분적인 레코딩을 통지받을 필요가 있을 수도 있으며, 사용자가 변환을 요청하지 않으면 버퍼 (49) 가 즉시 제거될 필요가 있을 수도 있다.
일단 활성화되면, 음성-텍스트 컨버젼 소프트웨어 (44) 는, 전화 콜이 종료하거나 대화 종료 신호가 서버 (50) 에 의해 수신될 때까지 오디오 데이터를 텍스트 데이터로 계속 컨버팅할 수도 있다. 사용자는, 다양한 이유로 음성 대화를 종료하기 전에 음성-텍스트 컨버젼 프로세스를 종료할 수도 있다. 예를 들어, 사용자는, 대화의 연장된 부분보다는 대화 동안 구술된 전화 번호 또는 주소만을 컨버팅하기를 원할 수도 있다. 일 실시형태에서, 사용자는, 음성 대화 동안의 제 2 시간에서 버튼 (39) 을 디프레스함으로써 음성-텍스트 컨버젼 종료 신호를 송신할 수도 있다. 대안적으로, 음성-텍스트 소프트웨어 (44) 는, 디스플레이 (23) 상에 나타낸 사용자 인터페이스 메뉴, 메뉴 선택 버튼들 또는 로커 스위치들 (37) 과 결합한 키패드 (36), 다수의 버튼 푸쉬들, (예를 들어, "변환 종료" 를 구술함으로써) 음성 활성화 커맨드 등과 같은 다양한 다른 수단에 의해 종료될 수도 있다.
일단 음성-텍스트 컨버젼 소프트웨어 (44) 가 종료되면, 새로이 컨버팅된 텍스트 데이터는, 음성-텍스트 컨버젼을 개시하였던 사용자와 관련된 서버 메모리 (55) 위치에 저장될 수 있다 (단계 309). 일단 메모리 (55) 에 저장되면, 컨버팅된 텍스트 데이터는, 잘 알려진 데이터 액세스 기술들을 사용하는 인터넷 (53) 과 같은 네트워크를 통해 임의의 시간에서 사용자에 의해 검색가능하게 될 수 있을 수도 있다.
또한, 컨버팅된 텍스트는 유선 또는 무선 데이터 통신 링크를 통해 사용자의 이동 디바이스 (20) 또는 다른 통신 디바이스에 송신될 수도 있다 (단계 313). 텍스트 데이터는 텍스트 메시지 (예를 들어, SMS 또는 이메일 메시지) 또는 텍스트를 포함하는 임의의 다른 타입의 데이터 송신 파일로서 송신될 수 있다. 대안적으로, 컨버팅된 텍스트 데이터는 이동 디바이스 (20) 에 실시간으로 다시 송신될 수도 있으며, 그에 의해, 서버 (50) 에 텍스트 데이터를 저장할 필요성 (단계 309) 을 제거한다. 그러한 대안적인 실시형태에서, 음성-데이터 컨버젼 소프트웨어 (44) 는, 음성 오디오 데이터가 텍스트로 컨버팅됨에 따라 이동 디바이스 (20) 로의 되송신을 위해 데이터 패킷들을 생성할 수도 있다.
일단 음성-텍스트 컨버젼 방법이 종료하면, 사용자는 연락 정보를 포함하는 텍스트의 그 부분들과 같은 선택된 부분들을 수동으로 추출할 수도 있으며, 주소록 (52) 에 그 선택된 정보를 수동으로 입력하거나 이동 디바이스의 메모리 (22) 에 텍스트를 저장할 수도 있다. 예를 들어, 사용자는, 선택된 문구들 또는 번호들을 카피하고 그 후 그들을 주소록 레코드의 적절한 필드들에 페이스트 (paste) 하기 위해, 이동 디바이스 (20) 상에 제공된 카피 및 페이스트 애플리케이션 툴들을 사용할 수도 있다. 예를 들어, 인터넷 (53) 을 통해 사용자가 서버 (50) 상에 저장된 텍스트 데이터에 액세스하는 실시형태에서, 사용자는, 잘 알려진 애플리케이션 툴들을 사용하여, 텍스트의 선택된 부분들을 카피하고 그 후 이동 디바이스의 메모리 (22) 에 선택부들을 "페이스트" 하거나 로딩하도록 브라우저 툴들을 사용할 수도 있다.
대안적인 실시형태에서, 서버 (50) 는, 소프트웨어를 이용하여, 연락 정보를 추출하고 사용자의 이동 디바이스 (20) 에 선택부들을 자동적으로 통신하도록 구성될 수도 있으며, 그 일 예가 도 7에 도시되어 있다. 도 7에 도시된 실시형태는 도 6을 참조하여 상술된 단계 (301 내지 304 및 307 내지 309) 를 포함한다. 또한, 서버 (50) 는, 소프트웨어를 이용하여, 컨버팅된 텍스트 데이터로부터 연락 정보를 인식 및 추출하고 (단계 310), 메모리 (22) 로의 저장을 위해 이동 디바이스 (20) 에 그 추출된 연락 정보를 자동적으로 송신 (단계 311) 하도록 구성된다. 상술된 바와 같이, 서버 (50) 는, 컨버팅된 텍스트를 전화 번호들, 주소들, 이메일 주소들 등에 대해 스캐닝하도록 지정된 연락 정보 추출 소프트웨어 (46) 를 서버의 메모리 (55) 에 저장할 수도 있다. 상술된 바와 같이, 전화 번호들은 알려진 영역 코드 넘버들, 또는 7 또는 10 디지트의 시퀀스들에 대해 스캐닝함으로써 인식될 수 있고, 주소 정보는 주소 정보 (예를 들어, "거리", "애비뉴", "도로", "PO 박스", 알려진 도시 또는 주 등) 와 관련된 문구들에 대해 텍스트를 스캐닝함으로써 인식될 수 있으며, 이메일 주소들은, 알려진 이메일 서비스 제공자들 (예를 들어, Gmail.com, yahoo.com, hotmail.com), "이메일" 이라는 문구, 표준 주소 확장자 (예를 들어, ".com", ".org", ".net", ".gov", ".uk", ".ca", ".jp" 등) 또는 진행 주기 "at" 또는 "dot" 에 대해 텍스트를 스캐닝함으로써 인식될 수 있다. 연락 정보에 관련되지 않은 텍스트 데이터는, 사용자가 지정하거나 선택할 수도 있는 바와 같이, 폐기되거나 메모리에 유지될 수도 있다. 따라서, 컨버팅된 텍스트 데이터가 메모리 (56) 에 저장된 (단계 309) 이후, 서버 (50) 프로세서 (55) 는 연락 정보 추출 소프트웨어 (46) 를 활성화시켜, 컨버팅된 텍스트 데이터로부터 모든 연락 정보를 추출할 수도 있다 (단계 310). 추출된 연락 정보는 사용자의 이동 디바이스 (20) 에 송신될 수도 있다 (단계 311). 또한, 이동 디바이스 (20) 는, 소프트웨어를 이용하여, 송신된 연락 정보를 수신하고 그 후 메모리 (22) 에 저장된 주소록으로 그 정보를 자동적으로 입력하도록 구성될 수도 있다 (단계 312).
대안적인 실시형태에서, 서버 (50) 는, 사용자가 변환 서비스를 활성화시키는 이동 디바이스 (20) (즉, 텍스트 컨버젼 요청을 송신하였던 이동 디바이스 (20)) 를 향해 안내되는 오디오의 일부만을 텍스트 데이터로 컨버팅한다. 즉, 이동 디바이스 (20) 로 구술되고 마이크로폰 (29) 에 의해 입수되는 음성 오디오 데이터는 텍스트로 컨버팅되지 않는다. 많은 경우, 이동 디바이스 (20) 사용자는 사용자 자신의 단어들을 변환할 필요가 없거나 원치 않는다. 이러한 실시형태는 변환 프로세싱 및 이동 디바이스 (20) 에 의해 수신된 텍스트의 양을 감소시키는데 사용될 수도 있다. 이러한 실시형태는, 서버에 라우팅된 각각의 데이터 패킷의 일부로서 발신 디바이스를 서버 (50) 에 통지함으로써 달성될 수도 있다. 대안적으로, 예를 들어, 다른 부분 (예를 들어, 도 4에 도시된 이동 디바이스 (55) 또는 전화기 (57)) 으로부터 수신된 오디오 데이터만을 송신하는 셀룰러 통신 네트워크 (52) 에 의해, 대화의 일 측만이 변환을 위해 서버 (50) 에 라우팅될 수도 있다.
도 8에 도시된 추가적인 실시형태에서, 서버 (50) 는, 소프트웨어를 이용하여, 사용자의 음성 및 스피치 패턴을 인식하고 그에 의해 다른 파티의 스피치만을 변환하도록 구성될 수도 있다. 대안적인 실시형태에서, 다른 파티에 의해 (즉, 변환을 요청하였던 이동 디바이스 (20) 의 소유자에 의한 것이 아님) 구술된 단어들만이 텍스트로 컨버팅된다. 이러한 실시형태는 도 6 및 7을 참조하여 상술한 방법 단계들 (301 내지 304) 을 구현할 수도 있다. 또한, 서버 (50) 는, 소프트웨어를 이용하여, 음성 오디오 데이터의 출처를 결정하기 위해 음성 대화를 모니터링하도록 구성된다. 서버 (50) 는, 컨버젼 요청을 행했던 디바이스의 주소와 오디오 데이터 패킷내의 발신 주소 정보를 비교함으로써 (예를 들어, 데이터 패킷 헤더 내의 발신 주소들을 사용함으로써) 오디오 데이터 패킷의 출처를 결정할 수도 있다 (단계 301). 대안적으로, 사용자는 사용자의 음성을 인식하도록 서버 (50) 를 훈련시킬 수도 있으므로, 서버 (50) 는 대화에서 사용자의 음성을 식별할 수 있다 (단계 305). 사용자는, 예를 들어, 음성 콜을 서버 (50) 에 배치하고 사용자의 이동 디바이스 (20) 로의 텍스트의 특정한 부분을 판독함으로써 스피치-텍스트 컨버젼 소프트웨어 프로그램들이 훈련될 수 있는 방법과 유사한 방식으로 서버 (50) 를 훈련시킬 수도 있다. 그렇게 훈련되어, 서버 (50) 는, 서버의 메모리 (22) 에 저장된 사용자의 음성 패턴들과 오디오 데이터를 비교함으로써 음성 대화 동안 구술된 단어들을 모니터링할 수 있다 (단계 305). 음성 오디오 데이터 패킷들이 사용자의 이동 디바이스 (20) 로부터 발신하면 (즉, 테스트 305="예"), 서버 (50) 는 다음의 음성 오디오 데이터 패킷을 대기한다. 그러나, 음성 데이터 패킷들이 사용자의 이동 디바이스 (20) 로부터 발신하지 않으면 (즉, 테스트 305="아니오"), 서버 (50) 는 음성 데이터 패킷들을 암호해독하고 변환하고 음성 오디오 데이터를 완료하며 (단계 306), 도 6 및 7을 참조하여 상술된 바와 같이 단계들 (306 내지 312) 을 수행한다. 이러한 방식으로, 다른 파티의 단어들만이 변환될 것이고 사용자의 이동 디바이스 (20) 에 전달될 것이다.
몇몇 실시형태에서, 사용자들이 변환 프로세스를 수행하는 서버 (50) 에 그들의 이동 디바이스들을 등록할 필요가 있을 수도 있다. 그러한 서버 (50) 는, 셀룰러 전화 캐리어, 종래의 전화 시스템 제공자 또는 독립적인 서비스 제공자에 의해 동작되고 마케팅되는 변환 서비스의 일부일 수도 있다. 그들의 이동 디바이스들을 서버 (50) 에 등록함으로써, 사용자들은, 그들의 이동 디바이스들에 텍스트 데이터를 송신하기 위해 사용될 메시징 기술의 타입 뿐만 아니라 그러한 메시징을 위해 사용하기 위한 주소를 서버에 통지할 수 있다. 또한, 사용자들은 서버 (50) 에 확인할 수 있고 그 후, 그들은 기술될 그들의 대화를 변환하고 서비스에 대한 요건들 또는 제한들을 지정하기를 원한다. 예를 들어, 사용자는, 사용자가 변환 서비스를 개시하기 위해 패스워드를 구술하거나 입력하는 것을 요구할 수도 있다. 변환이 시작하기 전에 그들 자신의 고유한 패스워드의 입력을 요구하는 것은, 사용자들로 하여금 미인가된 또는 부주의한 변환들을 회피하게 할 것이다. 또한, 사용자는, 상술된 바와 같이 변환이 양방향 (즉, 양자의 파티들을 변환함) 또는 일방향 (즉, 하나의 파티만을 변환함) 이어야 하는지를 지정할 수도 있다. 또한, 사용자들은 예를 들어, 그들의 이동 디바이스 (20) 를 사용하여 서버 (50) 로의 텍스트의 일부를 판독함으로써 등록 프로세스의 일부로서 그들의 음성을 인식하기 위해 서버 (50) 를 훈련시킬 수도 있다. 또한, 사용자들은, 서버로 하여금 2개 이상의 이동 디바이스에 텍스트 데이터를 송신하거나 인터넷 (53) 과 같은 네트워크를 통해 사용자들에 의해 액세스가능한 위치의 서버 메모리에 텍스트 데이터를 저장할 수 있도록 정보를 서버 (50) 에 제공할 수도 있다.
몇몇 예시에서, 사용자들은 2개 이상의 이동 디바이스를 소유할 수도 있거나 이동 디바이스를 차용할 수도 있으며, 따라서, 그들의 전화 대화의 일부를 변환하기를 원한다. 그러한 상황을 수용하기 위해, 텍스트 데이터로의 대화의 컨버젼은 하나의 이동 디바이스 상에서 개시될 수도 있으며, 변환된 텍스트는 메모리로의 저장을 위해 제 2 이동 디바이스에 송신된다. 일 실시형태에서, 변환된 텍스트는, SMS 및 이메일 메시징과 같은 임의의 알려진 메시징 애플리케이션에 의해 하나의 이동 디바이스로부터 다른 디바이스로 송신될 수도 있다. 또 다른 실시형태에서, 제 2 이동 디바이스가 서버 (50) 에 등록되어 있으면 (즉, 서버 (50) 가 그 이동 디바이스의 주소를 알면), 서버 (50) 는 그 제 2 이동 디바이스에 텍스트를 직접 송신할 수도 있다. 일 실시형태에서, 텍스트 데이터는 서버 (50) 에 등록된 사용자에 의해 소유되는 모든 이동 디바이스들에 전송될 수도 있다.
예를 들어, 사용자가 사용자의 차량에 통합된 셀룰러 전화기 및 이동 디바이스 (20) 를 소유하면, 사용자는 예를 들어, 전화 대화의 상대방의 이메일 주소를 획득하기 위해 운전 동안 변환 프로세스를 구현할 수도 있다. 변환 소프트웨어는 자동차의 통합된 셀 전화기 또는 또 다른 프로세서 상에서 구동할 수도 있거나, 그 소프트웨어는 상술된 바와 같이 서버 (50) 에서 실행될 수도 있다. 변환 소프트웨어가 서버 (50) 상에서 수행되면, 서버 (50) 는 컨버팅된 텍스트 데이터를 자동차의 통합된 셀 전화기로 송신할 수 있으며, 여기서, 그 컨버팅된 텍스트 데이터는 자동차의 빌트-인 셀 전화기의 메모리에 저장된 사용자의 주소에 부가될 수도 있다. 대안적으로 또는 부가적으로, 서버 (50) 는 등록 동안 서버 (50) 에 제공된 주소를 사용하여 사용자의 이동 디바이스 (20) 에 텍스트 데이터를 송신할 수도 있다. 또한, 자동차의 빌트-인 셀 전화기는 수신된 텍스트 데이터를 사용자의 이동 디바이스 (20) 에 자동적으로 포워딩하도록 구성될 수도 있다.
제 2 예로서, 사용자는 또 다른 사용자의 이동 디바이스 (55) 를 차용할 수도 있고, 연락 정보를 캡쳐하는 것과 같이 대화의 일부를 변환하기를 원할 수도 있다. 이러한 예에서, 서버 (50) 는, 등록 동안 서버 (50) 에 제공된 주소 및 메시징 기술을 사용하여, 사용자의 이동 디바이스 (20) 에 컨버팅된 텍스트 데이터를 자동적으로 송신하도록 구성될 수도 있다. 이들 예들이 도시하는 바와 같이, 변환 소프트웨어를 서버 (50) 상에 위치시키는 것은, 2개 이상의 이동 디바이스 (24) 를 가질 수도 있거나 상이한 전화 디바이스로부터 변환 서비스를 구현할 필요가 있을 수도 있는 사용자에 대해 더 큰 유연성을 제공한다.
다양한 실시형태들은, 전화 대화로부터 정보를 캡쳐할 필요가 있는 이동 디바이스 사용자들에 대해 특히 유용하다. 다양한 실시형태들은, 이동 디바이스를 사용하는 동안 전화 번호들 및 주소들을 레코딩하기 위한 펜 및 종이에 대한 필요성을 제거한다.
다양한 실시형태들은 그들의 이동 디바이스 (20) 상에 저장된 주소록들을 축어적으로 (verbally) 프로그래밍하도록 사용될 수 있다. 예를 들어, 사용자가 주소록에 전화 번호 또는 주소를 저장하려고 하면, 사용자는 (텍스트 컨버터를 활성화시킬) 오디오-텍스트 컨버터 요청 버튼을 누르고, 그 후, 이동 디바이스에 구술할 수 있다. 상술된 바와 같이, 음성 신호들은 서버에 송신되고 텍스트 데이터로 컨버팅될 것이며, 텍스트 데이터는 사용자의 이동 디바이스 (20) 에 다시 송신될 수 있다. 이러한 방법은, 사용자들이 수동의 텍스트 입력없이 전화 번호 등을 입력하기를 원할 경우 유용할 수도 있다.
전술한 실시형태들을 구현하는데 사용되는 하드웨어는 명령들의 세트를 실행하도록 구성된 프로세싱 엘리먼트들 및 메모리 엘리먼트들일 수도 있으며, 여기서, 그 명령들의 세트는 상기 방법들에 대응하는 방법 단계들을 수행하기 위한 것이다. 대안적으로, 몇몇 단계들 또는 방법들은 소정의 기능에 특정된 회로에 의해 수행될 수도 있다.
당업자는, 실시형태들과 관련하여 설명된 다양한 예시적인 논리 블록들, 모듈들, 회로들, 및 알고리즘 단계들이 전자 하드웨어, 컴퓨터 소프트웨어, 또는 이들의 조합들로서 구현될 수도 있음을 인식할 것이다. 하드웨어와 소프트웨어의 이러한 상호교환성을 명확히 설명하기 위해, 다양한 예시적인 컴포넌트들, 블록들, 모듈들, 회로들 및 단계들이 그들의 기능의 관점에서 일반적으로 상술되었다. 그러한 기능이 하드웨어, 펌웨어, 또는 소프트웨어로서 구현될지는, 전체 시스템에 부과된 설계 제한들 및 특정한 애플리케이션에 의존한다. 당업자는 각각의 특정한 애플리케이션에 대해 다양한 방식들로 설명된 기능을 구현할 수도 있지만, 그러한 구현 결정이 본 발명의 범위를 벗어나는 것으로서 해석되지는 않아야 한다.
여기에 개시된 실시형태들과 관련하여 설명된 방법 또는 알고리즘의 단계들은 하드웨어로 직접, 프로세서에 의해 실행되는 소프트웨어 모듈로, 또는 이들의 조합으로 구현될 수도 있다. 소프트웨어 모듈은 프로세서 판독가능 저장 매체 및/또는 프로세서 판독가능 메모리에 상주할 수도 있으며, 이들은 RAM 메모리, 플래시 메모리, ROM 메모리, EPROM 메모리, EEPROM 메모리, 레지스터, 하드 디스크, 착탈형 디스크, CD-ROM, 또는 당업계에 알려진 임의의 다른 유형의 형태의 데이터 저장 매체 중 임의의 것일 수도 있다. 또한, 프로세서 판독가능 메모리는, 2개 이상의 메모리 칩, 프로세서 칩 내부의 메모리, 별개의 메모리 칩, 및 플래시 메모리 및 RAM 메모리와 같은 상이한 타입의 메모리의 조합들을 포함할 수도 있다. 이동 디바이스의 메모리에 대한 여기에서의 참조는, 특정한 구성, 타입, 또는 패키징에 대한 제한없이 이동 디바이스 내의 임의의 하나 또는 모든 메모리 모듈들을 포함하도록 의도된다. 예시적인 저장 매체는 이동 디바이스 내의 프로세서에 커플링되어, 그 프로세서가 저장 매체로부터 정보를 판독할 수 있고 저장 매체로 정보를 기입할 수 있게 한다. 대안적으로, 저장 매체는 프로세서에 통합될 수도 있다. 프로세서 및 저장 매체는 ASIC에 상주할 수도 있다.
다양한 실시형태들의 상기 설명은 당업자가 본 발명을 수행 또는 이용할 수 있도록 제공된다. 이들 실시형태들에 대한 다양한 변형들은 당업자에게는 용이하게 명백할 것이며, 여기에 정의된 일반적인 원리들은 본 발명의 사상 또는 범위를 벗어나지 않고도 다른 실시형태들에 적용될 수도 있다. 따라서, 본 발명은 여기에 설명된 실시형태들로 제한되도록 의도되지는 않으며, 대신, 청구항들은 여기에 개시된 원리들 및 신규한 특성들에 부합하는 최광의 범위를 허여해야 한다.

Claims (37)

  1. 전화 대화를 변환 (transcribe) 하기 위한 방법으로서,
    이동 디바이스에 접속된 서버에서 상기 이동 디바이스로부터의 변환 요청을 수신하는 단계;
    상기 서버에서 상기 전화 대화로부터의 오디오 데이터를 수신하는 단계;
    상기 서버에서 상기 오디오 데이터의 적어도 일부를 암호해독하는 단계;
    상기 서버에서 상기 오디오 데이터의 일부를 버퍼링하는 단계;
    상기 서버에서 상기 버퍼링된 오디오 데이터를 텍스트 데이터로 변환하는 단계; 및
    상기 서버로부터 상기 이동 디바이스로 상기 텍스트 데이터의 적어도 일부를 송신하는 단계를 포함하는, 전화 대화 변환 방법.
  2. 삭제
  3. 제 1 항에 있어서,
    상기 이동 디바이스에서 상기 송신된 텍스트 데이터의 적어도 일부를 수신하는 단계; 및
    상기 이동 디바이스의 메모리에 상기 수신된 텍스트 데이터를 저장하는 단계를 더 포함하는, 전화 대화 변환 방법.
  4. 제 3 항에 있어서,
    상기 텍스트 데이터는 상기 이동 디바이스 내의 주소록에 저장되는, 전화 대화 변환 방법.
  5. 제 1 항에 있어서,
    상기 변환된 텍스트 데이터로부터 연락 정보를 추출하는 단계를 더 포함하며,
    상기 추출된 연락 정보만이 상기 서버로부터 상기 이동 디바이스로 송신되는, 전화 대화 변환 방법.
  6. 제 1 항에 있어서,
    상기 오디오 데이터의 패킷들을 모니터링하여 상기 오디오 데이터의 패킷들의 출처를 결정하는 단계; 및
    상기 오디오 데이터의 출처를 식별하는 단계를 더 포함하며,
    상기 암호해독된 오디오 데이터의 일부는, 상기 이동 디바이스 이외의 파티로부터 발신하는 오디오 데이터로 제한되는, 전화 대화 변환 방법.
  7. 제 1 항에 있어서,
    상기 서버의 메모리 내에 저장된 사용자 음성 프로파일과 상기 오디오 데이터를 비교하는 단계; 및
    상기 사용자 음성 프로파일과 매칭하는 오디오 데이터를 식별하는 단계를 더 포함하며,
    상기 암호해독된 오디오 데이터의 일부는, 상기 사용자 음성 프로파일과 매칭하지 않는 오디오 데이터로 제한되는, 전화 대화 변환 방법.
  8. 프로세서;
    상기 프로세서에 커플링된 트랜시버;
    상기 프로세서에 커플링된 메모리; 및
    상기 프로세서에 커플링된 변환 요청 버튼을 포함하고,
    상기 프로세서는, 소프트웨어 명령들을 이용하여,
    오디오 데이터를 텍스트 데이터로 변환하기를 시작하기 위한 요청을 서버에 송신하는 단계;
    상기 서버로부터 상기 텍스트 데이터를 수신하는 단계; 및
    상기 텍스트 데이터를 상기 메모리에 자동적으로 저장하는 단계를 포함하는 단계들을 수행하도록 구성되며,
    상기 프로세서는 또한 소프트웨어 명령들을 이용하여, 상기 변환 요청 버튼의 제 1 누름에 응답하여 상기 변환을 시작하기 위한 요청을 상기 서버에 송신하도록 구성되는, 이동 디바이스.
  9. 제 8 항에 있어서,
    상기 프로세서는 소프트웨어 명령들을 이용하여, 상기 메모리에 저장된 주소록에 상기 텍스트 데이터를 자동적으로 저장하도록 구성되는, 이동 디바이스.
  10. 삭제
  11. 제 8 항에 있어서,
    상기 프로세서는 또한 소프트웨어 명령들을 이용하여, 음성 콜이 활성이지 않을 경우 상기 변환 요청 버튼이 눌러질 때 상이한 기능을 수행하도록 구성되는, 이동 디바이스.
  12. 제 8 항에 있어서,
    상기 프로세서는 또한 소프트웨어 명령들을 이용하여, 상기 변환 요청 버튼의 제 2 누름에 응답하여 오디오 데이터를 텍스트 데이터로 변환하는 것을 종료하기 위한 요청을 상기 서버에 송신하도록 구성되는, 이동 디바이스.
  13. 오디오 데이터를 텍스트 데이터로 변환하기를 시작하기 위한 요청을 서버에 송신하는 수단;
    상기 서버로부터 상기 텍스트 데이터를 수신하는 수단;
    상기 텍스트 데이터를 메모리에 자동적으로 저장하는 수단; 및
    상기 오디오 데이터를 텍스트 데이터로 변환하기를 시작하기 위한 요청이 상기 서버에 송신되어야 한다는 것을 나타내는 사용자 입력을 수신하는 수단을 포함하는, 이동 디바이스.
  14. 제 13 항에 있어서,
    상기 텍스트 데이터를 메모리에 자동적으로 저장하는 수단은, 상기 메모리에 저장된 주소록에 상기 텍스트 데이터를 자동적으로 저장하는 수단을 포함하는, 이동 디바이스.
  15. 삭제
  16. 제 13 항에 있어서,
    상기 사용자 입력을 수신하는 수단은, 음성 콜이 활성이지 않은 경우 상이한 기능을 수행해야 한다는 것을 나타내는, 이동 디바이스.
  17. 제 13 항에 있어서,
    상기 사용자 입력을 수신하는 수단의 제 2 활성화에 응답하여 오디오 데이터를 텍스트 데이터로 변환하는 것을 종료하기 위한 요청을 상기 서버에 송신하는 수단을 더 포함하는, 이동 디바이스.
  18. 이동 디바이스의 프로세서로 하여금,
    오디오 데이터를 텍스트 데이터로 변환하기를 시작하기 위한 요청을 서버에 송신하는 단계;
    상기 서버로부터 상기 텍스트 데이터를 수신하는 단계; 및
    상기 텍스트 데이터를 유형의 프로세서-판독가능 메모리에 자동적으로 저장하는 단계;
    를 포함하는 단계들을 수행하게 하도록 구성되는 프로세서 실행가능 소프트웨어 명령들이 저장되고,
    상기 프로세서 실행가능 소프트웨어 명령들은 또한, 상기 이동 디바이스의 프로세서로 하여금, 변환 요청 버튼의 제 1 누름에 응답하여 변환을 시작하기 위한 상기 요청을 상기 서버에 송신하게 하도록 구성되는, 유형의 프로세서-판독가능 메모리.
  19. 제 18 항에 있어서,
    상기 프로세서 실행가능 소프트웨어 명령들은 또한, 상기 이동 디바이스의 프로세서로 하여금, 상기 이동 디바이스의 메모리에 저장된 주소록에 상기 텍스트 데이터를 자동적으로 저장하게 하도록 구성되는, 유형의 프로세서-판독가능 메모리.
  20. 삭제
  21. 제 18 항에 있어서,
    상기 프로세서 실행가능 소프트웨어 명령들은 또한, 상기 이동 디바이스의 프로세서로 하여금, 음성 콜이 활성이지 않은 경우 상기 변환 요청 버튼이 눌러질 때 상이한 기능을 수행하게 하도록 구성되는, 유형의 프로세서-판독가능 메모리.
  22. 제 18 항에 있어서,
    상기 프로세서 실행가능 소프트웨어 명령들은 또한, 상기 이동 디바이스의 프로세서로 하여금, 상기 변환 요청 버튼의 제 2 누름에 응답하여 오디오 데이터를 텍스트 데이터로 변환하는 것을 종료하기 위한 요청을 상기 서버에 송신하게 하도록 구성되는, 유형의 프로세서-판독가능 메모리.
  23. 서버 프로세서;
    상기 서버 프로세서에 커플링된 네트워크 인터페이스; 및
    상기 서버 프로세서에 커플링된 메모리를 포함하며,
    상기 서버 프로세서는 소프트웨어 명령들을 이용하여,
    네트워크를 통해 이동 디바이스에 접속된 서버에서 상기 이동 디바이스로부터의 변환 요청을 상기 네트워크 인터페이스를 통해 수신하는 단계;
    전화 대화로부터의 오디오 데이터를 상기 네트워크 인터페이스를 통해 수신하는 단계;
    상기 오디오 데이터의 적어도 일부를 암호해독하는 단계;
    상기 오디오 데이터의 일부를 버퍼링하는 단계;
    상기 버퍼링된 오디오 데이터를 텍스트 데이터로 컨버팅하는 단계; 및
    상기 텍스트 데이터의 적어도 일부를 상기 이동 디바이스에 상기 네트워크 인터페이스를 통해 송신하는 단계를 포함하는 단계들을 수행하도록 구성되는, 서버.
  24. 삭제
  25. 제 23 항에 있어서,
    상기 서버 프로세서는 또한 소프트웨어 명령들을 이용하여, 컨버팅된 텍스트 데이터로부터 연락 정보를 추출하는 단계를 포함하는 단계들을 수행하도록 구성되며,
    상기 추출된 연락 정보만이 상기 이동 디바이스에 송신되는, 서버.
  26. 제 23 항에 있어서,
    상기 서버 프로세서는 또한 소프트웨어 명령들을 이용하여,
    상기 오디오 데이터의 패킷들을 모니터링하여 상기 오디오 데이터의 패킷들의 출처를 결정하는 단계; 및
    상기 오디오 데이터의 출처를 식별하는 단계를 포함하는 단계들을 수행하도록 구성되며,
    상기 암호해독된 오디오 데이터의 일부는, 상기 이동 디바이스 이외의 파티로부터 발신하는 오디오 데이터로 제한되는, 서버.
  27. 제 23 항에 있어서,
    상기 서버 프로세서는 또한 소프트웨어 명령들을 이용하여,
    상기 서버의 메모리 내에 저장된 사용자 음성 프로파일과 상기 오디오 데이터를 비교하는 단계; 및
    상기 사용자 음성 프로파일과 매칭하는 오디오 데이터를 식별하는 단계를 포함하는 단계들을 수행하도록 구성되며,
    상기 암호해독된 오디오 데이터의 일부는, 상기 사용자 음성 프로파일과 매칭하지 않는 오디오 데이터로 제한되는, 서버.
  28. 네트워크를 통해 이동 디바이스에 접속된 서버에서 상기 이동 디바이스로부터의 변환 요청을 수신하는 수단;
    상기 서버에서 전화 대화로부터의 오디오 데이터를 수신하는 수단;
    상기 서버에서 상기 오디오 데이터의 적어도 일부를 암호해독하는 수단;
    상기 서버에서 텍스트 데이터로 상기 암호해독된 오디오 데이터를 변환하는 수단;
    상기 서버로부터 상기 이동 디바이스에 상기 텍스트 데이터의 적어도 일부를 송신하는 수단;
    상기 서버에서 상기 오디오 데이터의 일부를 버퍼링하는 수단; 및
    상기 서버에서 상기 버퍼링된 오디오 데이터를 텍스트 데이터로 컨버팅하는 수단을 포함하는, 서버.
  29. 삭제
  30. 제 28 항에 있어서,
    상기 변환된 텍스트 데이터로부터 연락 정보를 추출하는 수단을 더 포함하며,
    상기 추출된 연락 정보만이 상기 서버로부터 상기 이동 디바이스로 송신되는, 서버.
  31. 제 28 항에 있어서,
    상기 오디오 데이터의 패킷들을 모니터링하여 상기 오디오 데이터의 패킷들의 출처를 결정하는 수단; 및
    상기 오디오 데이터의 출처를 식별하는 수단을 더 포함하며,
    상기 암호해독된 오디오 데이터의 일부는, 상기 이동 디바이스 이외의 파티로부터 발신하는 오디오 데이터로 제한되는, 서버.
  32. 제 28 항에 있어서,
    상기 서버의 메모리 내에 저장된 사용자 음성 프로파일과 상기 오디오 데이터를 비교하는 수단; 및
    상기 사용자 음성 프로파일과 매칭하는 오디오 데이터를 식별하는 수단을 더 포함하며,
    상기 암호해독된 오디오 데이터의 일부는, 상기 사용자 음성 프로파일과 매칭하지 않는 오디오 데이터로 제한되는, 서버.
  33. 서버 프로세서로 하여금,
    이동 디바이스로부터 변환 요청을 수신하는 단계;
    전화 대화로부터 오디오 데이터를 수신하는 단계;
    상기 오디오 데이터의 적어도 일부를 암호해독하는 단계;
    상기 오디오 데이터의 일부를 버퍼링하는 단계;
    상기 버퍼링된 오디오 데이터를 텍스트 데이터로 컨버팅하는 단계; 및
    상기 텍스트 데이터의 적어도 일부를 상기 이동 디바이스로 송신하는 단계
    를 포함하는 단계들을 수행하게 하도록 구성되는 서버-실행가능 소프트웨어 명령들이 저장된, 유형의 저장 매체.
  34. 삭제
  35. 제 33 항에 있어서,
    상기 저장된 서버-실행가능 소프트웨어 명령들은 상기 서버 프로세서로 하여금, 컨버팅된 텍스트 데이터로부터 연락 정보를 추출하는 단계를 포함하는 추가적인 단계들을 수행하게 하도록 구성되며,
    상기 추출된 연락 정보만이 상기 이동 디바이스에 송신되는, 유형의 저장 매체.
  36. 제 33 항에 있어서,
    상기 저장된 서버-실행가능 소프트웨어 명령들은 상기 서버 프로세서로 하여금,
    상기 오디오 데이터의 패킷들을 모니터링하여 상기 오디오 데이터의 패킷들의 출처를 결정하는 단계; 및
    상기 오디오 데이터의 출처를 식별하는 단계를 포함하는 추가적인 단계들을 수행하게 하도록 구성되며,
    상기 암호해독된 오디오 데이터의 일부는 상기 이동 디바이스 이외의 파티로부터 발신하는 오디오 데이터로 제한되는, 유형의 저장 매체.
  37. 제 33 항에 있어서,
    상기 저장된 서버-실행가능 소프트웨어 명령들은 상기 서버 프로세서로 하여금,
    상기 서버의 메모리 내에 저장된 사용자 음성 프로파일과 상기 오디오 데이터를 비교하는 단계; 및
    상기 사용자 음성 프로파일과 매칭하는 오디오 데이터를 식별하는 단계를 포함하는 추가적인 단계들을 수행하게 하도록 구성되며,
    상기 암호해독된 오디오 데이터의 일부는, 상기 사용자 음성 프로파일과 매칭하지 않는 오디오 데이터로 제한되는, 유형의 저장 매체.
KR1020107029203A 2008-05-27 2009-05-12 전화 대화를 텍스트로 변환하기 위한 방법 및 시스템 KR101213514B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/127,562 US8407048B2 (en) 2008-05-27 2008-05-27 Method and system for transcribing telephone conversation to text
US12/127,562 2008-05-27

Publications (2)

Publication Number Publication Date
KR20110021963A KR20110021963A (ko) 2011-03-04
KR101213514B1 true KR101213514B1 (ko) 2012-12-18

Family

ID=40897400

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020107029203A KR101213514B1 (ko) 2008-05-27 2009-05-12 전화 대화를 텍스트로 변환하기 위한 방법 및 시스템

Country Status (6)

Country Link
US (1) US8407048B2 (ko)
EP (1) EP2294800B1 (ko)
JP (3) JP2011522486A (ko)
KR (1) KR101213514B1 (ko)
CN (1) CN102047647B (ko)
WO (1) WO2009146249A1 (ko)

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8483679B2 (en) 2008-09-09 2013-07-09 Avaya Inc. Sharing of electromagnetic-signal measurements for providing feedback about transmit-path signal quality
US8265671B2 (en) * 2009-06-17 2012-09-11 Mobile Captions Company Llc Methods and systems for providing near real time messaging to hearing impaired user during telephone calls
US20110054912A1 (en) * 2009-09-01 2011-03-03 Christopher Anthony Silva System and method of storing telephone conversations
US8503635B2 (en) * 2009-09-10 2013-08-06 Felix Calls, Llc Media optimization using transcription analysis
US8428559B2 (en) 2009-09-29 2013-04-23 Christopher Anthony Silva Method for recording mobile phone calls
US20110076990A1 (en) * 2009-09-29 2011-03-31 Christopher Anthony Silva Method for recording mobile phone calls
JP5621993B2 (ja) * 2009-10-28 2014-11-12 日本電気株式会社 音声認識システム、音声認識要求装置、音声認識方法、及び音声認識用プログラム
US8340640B2 (en) * 2009-11-23 2012-12-25 Speechink, Inc. Transcription systems and methods
US8553859B1 (en) * 2010-02-03 2013-10-08 Tal Lavian Device and method for providing enhanced telephony
US20110195739A1 (en) * 2010-02-10 2011-08-11 Harris Corporation Communication device with a speech-to-text conversion function
US20110228913A1 (en) * 2010-03-16 2011-09-22 Telcordia Technologies, Inc. Automatic extraction of information from ongoing voice communication system and methods
US8548449B2 (en) 2010-05-20 2013-10-01 Microsoft Corporation Mobile contact notes
US20120059655A1 (en) * 2010-09-08 2012-03-08 Nuance Communications, Inc. Methods and apparatus for providing input to a speech-enabled application program
US8805330B1 (en) * 2010-11-03 2014-08-12 Sprint Communications Company L.P. Audio phone number capture, conversion, and use
CN102905004A (zh) * 2011-07-25 2013-01-30 三星电子(中国)研发中心 移动终端中的通话记录系统和通话记录方法
US8886169B2 (en) * 2011-10-25 2014-11-11 At&T Intellectual Property I, Lp Apparatus and method for providing enhanced telephonic communications
CN102447483B (zh) * 2011-11-25 2013-10-23 北京天地网行科技发展有限公司 一种基于有线电话网络的应急通信系统的语音终端
US8571528B1 (en) * 2012-01-25 2013-10-29 Intuit Inc. Method and system to automatically create a contact with contact details captured during voice calls
US9380146B1 (en) 2012-03-14 2016-06-28 Amazon Technologies, Inc. System and method to facilitate conversion between voice calls and text calls
CN103533143A (zh) * 2012-07-03 2014-01-22 联想(北京)有限公司 一种信息处理方法及电子设备
US20140088971A1 (en) * 2012-08-20 2014-03-27 Michael D. Metcalf System And Method For Voice Operated Communication Assistance
US9210110B2 (en) * 2012-08-28 2015-12-08 At&T Mobility Ii Llc Predictive messaging service for active voice calls
CN102857612A (zh) * 2012-08-30 2013-01-02 广东欧珀移动通信有限公司 一种通话时自动录音的方法及手机
US8965759B2 (en) * 2012-09-01 2015-02-24 Sarah Hershenhorn Digital voice memo transfer and processing
WO2014085985A1 (zh) * 2012-12-04 2014-06-12 Itp创新科技有限公司 一种通话转录系统和方法
US10482216B2 (en) * 2013-03-28 2019-11-19 Iconic Data Inc. Protected health information image capture, processing and submission from a client device
CN104158945A (zh) * 2013-05-13 2014-11-19 中兴通讯股份有限公司 通话信息获取方法、装置及系统
US10389876B2 (en) 2014-02-28 2019-08-20 Ultratec, Inc. Semiautomated relay method and apparatus
US20180034961A1 (en) 2014-02-28 2018-02-01 Ultratec, Inc. Semiautomated Relay Method and Apparatus
US20180270350A1 (en) 2014-02-28 2018-09-20 Ultratec, Inc. Semiautomated relay method and apparatus
US10878721B2 (en) 2014-02-28 2020-12-29 Ultratec, Inc. Semiautomated relay method and apparatus
US10748523B2 (en) 2014-02-28 2020-08-18 Ultratec, Inc. Semiautomated relay method and apparatus
CN103929524A (zh) * 2014-04-30 2014-07-16 深圳市中兴移动通信有限公司 通话过程中记录信息的方法及应用该方法的移动终端
CN104125340B (zh) * 2014-07-25 2017-10-17 广东欧珀移动通信有限公司 一种通话录音文件的生成及管理的方法及其系统
CN104184870A (zh) * 2014-07-29 2014-12-03 小米科技有限责任公司 通话记录标记方法、装置及电子设备
US9936068B2 (en) * 2014-08-04 2018-04-03 International Business Machines Corporation Computer-based streaming voice data contact information extraction
US10345967B2 (en) * 2014-09-17 2019-07-09 Red Hat, Inc. User interface for a device
CN105530351B (zh) * 2014-10-23 2019-09-10 中兴通讯股份有限公司 通话处理方法及装置
CN104869210B (zh) * 2015-05-26 2017-05-31 努比亚技术有限公司 一种通信信息提取方法及信息提取终端
CN105100421A (zh) * 2015-05-29 2015-11-25 努比亚技术有限公司 通话控制方法及装置
CN105049612A (zh) * 2015-06-29 2015-11-11 努比亚技术有限公司 一种实现录音的方法和装置
US9837074B2 (en) 2015-10-27 2017-12-05 International Business Machines Corporation Information exchange during audio conversations
KR102390713B1 (ko) * 2015-11-25 2022-04-27 삼성전자 주식회사 전자 장치 및 전자 장치의 통화 서비스 제공 방법
CN107094199A (zh) 2016-02-17 2017-08-25 纬创资通(中山)有限公司 在通话中分享连串数字的方法与通信装置
US9905248B2 (en) 2016-02-29 2018-02-27 International Business Machines Corporation Inferring user intentions based on user conversation data and spatio-temporal data
US9978396B2 (en) 2016-03-16 2018-05-22 International Business Machines Corporation Graphical display of phone conversations
US9497315B1 (en) 2016-07-27 2016-11-15 Captioncall, Llc Transcribing audio communication sessions
US10187512B2 (en) * 2016-09-27 2019-01-22 Apple Inc. Voice-to text mode based on ambient noise measurement
US20190156834A1 (en) * 2017-11-22 2019-05-23 Toyota Motor Engineering & Manufacturing North America, Inc. Vehicle virtual assistance systems for taking notes during calls
US11089446B2 (en) * 2018-01-11 2021-08-10 Htc Corporation Portable electronic device, operating method for the same, and non-transitory computer readable recording medium
US20190251961A1 (en) * 2018-02-15 2019-08-15 Lenovo (Singapore) Pte. Ltd. Transcription of audio communication to identify command to device
US10789954B2 (en) * 2018-08-29 2020-09-29 Sorenson Ip Holdings, Llc Transcription presentation
CN109308893A (zh) * 2018-10-25 2019-02-05 珠海格力电器股份有限公司 信息发送方法及装置、存储介质、电子装置
US20210295851A1 (en) * 2018-11-14 2021-09-23 Hewlett-Packard Development Company, L.P. Contents based on policy permissions
US11170761B2 (en) 2018-12-04 2021-11-09 Sorenson Ip Holdings, Llc Training of speech recognition systems
US11017778B1 (en) 2018-12-04 2021-05-25 Sorenson Ip Holdings, Llc Switching between speech recognition systems
US10388272B1 (en) 2018-12-04 2019-08-20 Sorenson Ip Holdings, Llc Training speech recognition systems using word sequences
US10573312B1 (en) 2018-12-04 2020-02-25 Sorenson Ip Holdings, Llc Transcription generation from multiple speech recognition systems
US11539900B2 (en) 2020-02-21 2022-12-27 Ultratec, Inc. Caption modification and augmentation systems and methods for use by hearing assisted user
US11488604B2 (en) 2020-08-19 2022-11-01 Sorenson Ip Holdings, Llc Transcription of audio
US11637923B1 (en) 2020-09-17 2023-04-25 Intrado Corporation Insight determination from aggregated call content
US11805189B1 (en) * 2020-09-17 2023-10-31 Intrado Life & Safety, Inc. Publish and subscribe call center architecture

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6222909B1 (en) 1997-11-14 2001-04-24 Lucent Technologies Inc. Audio note taking system and method for communication devices
US20030063717A1 (en) * 2001-10-03 2003-04-03 Holmes David William James System and method for recognition of and automatic connection using spoken address information received in voice mails and live telephone conversations
US20050195798A1 (en) 2004-03-04 2005-09-08 International Business Machines Corporation Facilitating navigation of voice data

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5127003A (en) * 1991-02-11 1992-06-30 Simpact Associates, Inc. Digital/audio interactive communication network
US5732216A (en) * 1996-10-02 1998-03-24 Internet Angles, Inc. Audio message exchange system
US5953700A (en) * 1997-06-11 1999-09-14 International Business Machines Corporation Portable acoustic interface for remote access to automatic speech/speaker recognition server
US6512828B1 (en) * 1998-02-03 2003-01-28 Mark Styron Wall mounted telephone
US6081780A (en) * 1998-04-28 2000-06-27 International Business Machines Corporation TTS and prosody based authoring system
JP2000196730A (ja) 1998-12-25 2000-07-14 Nec Saitama Ltd 無線通信機
US7359492B2 (en) * 1999-09-08 2008-04-15 Ameritech Corporation Method and apparatus for converting a voice signal received from a remote telephone to a text signal
US7606706B1 (en) * 2000-04-20 2009-10-20 Rubin Aviel D System and method for storage and retrieval of personal communications in a broadband network
EP1299990A2 (en) * 2000-07-07 2003-04-09 Telefonaktiebolaget L M Ericsson (publ) Automated recording of telephone numbers during ongoing telecommunication sessions
US6980953B1 (en) * 2000-10-31 2005-12-27 International Business Machines Corp. Real-time remote transcription or translation service
JP2002290536A (ja) 2001-03-28 2002-10-04 Tsubasa System Co Ltd 携帯端末での電話番号登録方法
US6820055B2 (en) * 2001-04-26 2004-11-16 Speche Communications Systems and methods for automated audio transcription, translation, and transfer with text display software for manipulating the text
JP2004173124A (ja) 2002-11-22 2004-06-17 Crossever Kk 顧客データの管理方法
JP4197271B2 (ja) 2003-06-17 2008-12-17 シャープ株式会社 通信端末、通信端末の制御方法、音声認識処理装置、音声認識処理装置の制御方法、通信端末制御プログラム、通信端末制御プログラムを記録した記録媒体、音声認識処理装置制御プログラム、および、音声認識処理装置制御プログラムを記録した記録媒体
JP3927155B2 (ja) * 2003-07-28 2007-06-06 株式会社東芝 対話記録装置および対話記録プログラム
US20050137867A1 (en) * 2003-12-17 2005-06-23 Miller Mark R. Method for electronically generating a synchronized textual transcript of an audio recording
US7133513B1 (en) * 2004-07-21 2006-11-07 Sprint Spectrum L.P. Method and system for transcribing voice content of an on-going teleconference into human-readable notation
US20060062371A1 (en) * 2004-09-23 2006-03-23 Vanderheiden Gregg C Method and apparatus for associating an alternate access device with a telephone
JP4125708B2 (ja) 2004-10-08 2008-07-30 埼玉日本電気株式会社 携帯電話端末およびメール送受信方法
JP2006174111A (ja) 2004-12-16 2006-06-29 Matsushita Electric Ind Co Ltd 電話装置
US8065079B2 (en) * 2005-03-31 2011-11-22 Qualcomm Incorporated System and method for indicating reminders via a portable computing device
US20070024721A1 (en) * 2005-07-29 2007-02-01 Rogers Sean S Compensating for improperly exposed areas in digital images
US20070112571A1 (en) * 2005-11-11 2007-05-17 Murugappan Thirugnana Speech recognition at a mobile terminal
JP2007180828A (ja) 2005-12-27 2007-07-12 Canon Marketing Japan Inc ネットワーク会議システム、ネットワーク会議方法、及び該方法を実行させるためのプログラム
US7865400B2 (en) * 2006-02-23 2011-01-04 Qualcomm Incorporated Apparatus and methods for community based purchasing by mobile buyers
US20080059177A1 (en) * 2006-05-19 2008-03-06 Jamey Poirier Enhancement of simultaneous multi-user real-time speech recognition system
US7937270B2 (en) * 2007-01-16 2011-05-03 Mitsubishi Electric Research Laboratories, Inc. System and method for recognizing speech securely using a secure multi-party computation protocol
US8107598B2 (en) * 2007-02-21 2012-01-31 Avaya Inc. Voicemail filtering and transcription
US20080300873A1 (en) * 2007-05-30 2008-12-04 James Siminoff Systems And Methods For Securely Transcribing Voicemail Messages
US20090119100A1 (en) * 2007-11-07 2009-05-07 Raji L Akella Associating annotation recording with a cell phone number
US8615397B2 (en) * 2008-04-04 2013-12-24 Intuit Inc. Identifying audio content using distorted target patterns
US8683582B2 (en) * 2008-06-16 2014-03-25 Qualcomm Incorporated Method and system for graphical passcode security

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6222909B1 (en) 1997-11-14 2001-04-24 Lucent Technologies Inc. Audio note taking system and method for communication devices
US20030063717A1 (en) * 2001-10-03 2003-04-03 Holmes David William James System and method for recognition of and automatic connection using spoken address information received in voice mails and live telephone conversations
US20050195798A1 (en) 2004-03-04 2005-09-08 International Business Machines Corporation Facilitating navigation of voice data

Also Published As

Publication number Publication date
JP2013146085A (ja) 2013-07-25
WO2009146249A1 (en) 2009-12-03
JP5701916B2 (ja) 2015-04-15
CN102047647B (zh) 2015-11-25
JP2011522486A (ja) 2011-07-28
US20090299743A1 (en) 2009-12-03
CN102047647A (zh) 2011-05-04
KR20110021963A (ko) 2011-03-04
EP2294800B1 (en) 2018-06-13
US8407048B2 (en) 2013-03-26
EP2294800A1 (en) 2011-03-16
JP2015084544A (ja) 2015-04-30

Similar Documents

Publication Publication Date Title
KR101213514B1 (ko) 전화 대화를 텍스트로 변환하기 위한 방법 및 시스템
US9491298B2 (en) System and method for processing a voice mail
KR102223017B1 (ko) 공유된 음성 작동 디바이스상의 호출 핸들링
US6775360B2 (en) Method and system for providing textual content along with voice messages
KR101149135B1 (ko) 음성 대화형 메시징을 위한 방법 및 장치
US8428655B2 (en) Mobile communication terminal and a method for placing a call
US8805330B1 (en) Audio phone number capture, conversion, and use
US20080096587A1 (en) Telephone for Sending Voice and Text Messages
JP2002535688A (ja) ハンドセットとハンドフリーキットの共用音声認識装置の音声登録エントリ管理方法及び装置
KR101367722B1 (ko) 휴대단말기의 통화 서비스 방법
JP2004503183A (ja) 電気通信セッションの進行中に電話番号を自動的に記録する方法と装置
US20080045256A1 (en) Eyes-free push-to-talk communication
KR100467593B1 (ko) 음성인식 키 입력 무선 단말장치, 무선 단말장치에서키입력 대신 음성을 이용하는 방법 및 그 기록매체
KR100688292B1 (ko) 문자 메시지 내용에 포함된 전화 번호로 자동 연결하는이동 통신 단말기 및 방법
KR100380829B1 (ko) 에이전트를 이용한 대화 방식 인터페이스 운영 시스템 및방법과 그 프로그램 소스를 기록한 기록 매체
JP5175231B2 (ja) 通話システム、通話方法、通話プログラム、電話端末及び交換機
KR101358081B1 (ko) 통화 내용 녹취를 이용한 공인 인증 서비스 방법 및 그 시스템
KR20160097406A (ko) 실시간 통번역 통화서비스 시스템 및 그 제공방법
KR100376409B1 (ko) 통화내용 녹음 서비스 방법 및 그 시스템
JP5007209B2 (ja) ユーザデータ管理システム、情報提供システム、およびユーザデータ管理方法
US7929671B2 (en) System and method for voice activated signaling
KR20030026089A (ko) 전화번호 검색 방법
KR20080011540A (ko) 이동통신 단말기의 음성안내 장치 및 방법
JPH11127243A (ja) 電子メール送信装置
JP2004023393A (ja) 電話番号登録システム、電話機、および電話番号登録方法

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20161125

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170929

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20180928

Year of fee payment: 7