KR20060054469A - 텍스트 메시지를 제공하는 방법 및 장치 - Google Patents

텍스트 메시지를 제공하는 방법 및 장치 Download PDF

Info

Publication number
KR20060054469A
KR20060054469A KR1020067005735A KR20067005735A KR20060054469A KR 20060054469 A KR20060054469 A KR 20060054469A KR 1020067005735 A KR1020067005735 A KR 1020067005735A KR 20067005735 A KR20067005735 A KR 20067005735A KR 20060054469 A KR20060054469 A KR 20060054469A
Authority
KR
South Korea
Prior art keywords
message
templates
text message
utterance
electronic device
Prior art date
Application number
KR1020067005735A
Other languages
English (en)
Other versions
KR100759728B1 (ko
Inventor
야신 장
신 헤
시아오-린 렌
팡 선
Original Assignee
모토로라 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 모토로라 인코포레이티드 filed Critical 모토로라 인코포레이티드
Publication of KR20060054469A publication Critical patent/KR20060054469A/ko
Application granted granted Critical
Publication of KR100759728B1 publication Critical patent/KR100759728B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72436User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for text messaging, e.g. SMS or e-mail
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Abstract

텍스트 메시지를 제공하는 방법 및 장치는 전자 장치(100)의 입력에서 발화를 생성하는 것(단계 210)을 포함한다. 그 다음, 전자 장치(100)와 연관된 메모리(155)에 저장된 사용자 정의된 메시지 템플릿들에 의해 안내되는 발화에 대하여 음성 인식이 수행된다(단계 230). 음성 인식은 매칭 템플릿을 생성하기 위해 발화를 템플릿들 중 하나와 매칭시킴으로써 정의된다. 그 다음, 텍스트 메시지가 매칭 템플릿들로부터 제공된다(단계 235).
텍스트 메시지, 전자 장치, 메모리, 템플릿, 음성 인식.

Description

텍스트 메시지를 제공하는 방법 및 장치{Method and apparatus for providing a text message}
본 발명은 음성을 사용하여 텍스트 메시지를 제공하는 방법 및 장치에 관한 것이다. 본 발명은 특히 제한된 메모리 및 계산 능력을 갖는 휴대용 전자 장치에서 처리되는 음성 입력들을 사용하여 텍스트 메시지를 제공하는데 유용하지만, 그것 만에 제한되는 것은 아니다.
종종 단문 메시징 서비스(Short Messaging Service;SMS) 포맷을 사용하는 단문 메시징은 무선 통신들에서 매우 대중적인 애플리케이션이다. 통상적으로 하나의 모바일 전화에서 또 다른 모바일 전화로 매달 수십억 개의 단문 메시지들이 송신된다. 이와 같은 텍스트 메시지들은 많은 이유들 때문에 대중적이다. 메시지들은 일반적으로 1-분 모바일 전화 호출 비용의 일부이고, 송신하거나 수신하기 위한 통화중 신호음(engaged tone)을 필요로 하지 않는다. 따라서, 메시지들은 송신자가 편리한 시간에 생성되어 송신되고, 수신자가 편리한 시간에 수신하여 판독할 수 있다.
텍스트 메시지는 일반적으로 모바일 전화의 키패드로 문자들을 타이핑함으로써 생성된다. 그러나, 메시지를 작성하기 위해 이와 같이 작고 쿼티가 아닌 키패드 들(non-querty keypads)을 사용하는 것은 불편할 수 있고, 일반적으로 충분한-크기의 쿼티 키보드(full-size querty keyboard)를 사용할 때 필요한 시간보다 많은 시간을 필요로 한다. 그러나, 물론, 모바일 전화에 충분한 크기의 키보드를 부착하는 것은 비실용적이다. 따라서, 단문 메시지들을 작성하는 더 효율적인 방법이 필요하다.
또한, 다양한 유형의 음성 인식 시스템들이 널리 알려져 있을지라도, 대부분은 모바일 전화들과 같은 휴대용 전자 장치들에서 사용하는데 적합하지 않다. 이것은 종래의 음성 인식 시스템들이 일반적으로 휴대용 전자 장치들에서 이용 가능한 것보다 더 많은 처리 전력 및 메모리를 필요로 하기 때문이다.
종래의 폐쇄 어휘 음성 인식 시스템들 및 방법들(closed vocabulary speech recognition systems and method)은 미리-정의되고 고정된 어휘 리스트를 채용한다. 사용시, 고정된 어휘 리스트는 클 수 있지만, 철저하지 않을 수 있으므로, 예를 들어, 사람의 성 및 많은 위치들의 이름들이 포함되지 않을 것이다. 반대로, 개방 어휘 음성 시스템들 및 방법들(open vocabulary speech recognition systems and method)은 새로운 단어들 및 어구들이 사용자 또는 다른 사용자에 의해 부가될 수 있는 가변 어휘 리스트를 갖는다. 그러나, 현재의 개방 어휘 음성 인식 시스템 및 방법들은 개인용 휴대정보 단말기들(personal digital assistants), 무선-전화들과 같은 휴대용 전자 장치들 및 다른 휴대용 장치들에 수용 가능하지 않을 수 있는 비교적 높은 계산적 오버헤드들(computational overheads)을 필요로 한다.
청구항들을 포함하는 본 명세서에서, '포함하다(comprise)', '포함하는 (comprising)'이라는 용어들 및 유사한 용어들은 요소들의 리스트를 포함하는 방법 및 장치가 단지 이러한 요소들만을 포함하는 것이 아니라, 나열되지 않은 다른 요소들을 포함할 수 있도록 배타적이지 않는 포함을 의미하도록 의도된다.
본 발명의 한 양상에 따르면, 텍스트 메시지를 제공하는 방법이 제공된다. 상기 방법은 전자 장치의 입력에서 발화(utterance)를 수신하는 단계들을 포함한다. 그 다음, 전자 장치와 연관된 메모리에 저장된 사용자 정의된 메시지 템플릿들에 의하여 안내된 발화에 대한 음성 인식이 수행되며, 여기서 음성 인식은 매칭 템플릿을 생성하기 위해 발화와 템플릿들 중 하나를 매칭시킴으로써 정의된다. 그 다음, 텍스트 메시지가 매칭 템플릿으로부터 제공된다.
메시지 템플릿들 중 적어도 하나는 고정 언어 성분을 포함할 수 있다.
메시지 템플릿들 중 적어도 하나는 가변 언어 성분을 포함할 수 있다.
메시지 템플릿들 중 적어도 하나는 고정 및 가변 언어 성분 둘 다를 포함할 수 있다.
텍스트 메시지는 SMS 메시지일 수 있다.
상기 방법은 또한 전자 장치의 키패드로부터 타이핑된 문자들을 수신함으로써 사용자 정의된 메시지 템플릿을 편집하는 단계를 포함할 수 있다.
텍스트 메시지의 성분은 상기 발화의 트랜스크립션(transcription)일 수 있다.
텍스트 메시지 전체는 발화의 트랜스크립션일 수 있다.
본 발명의 다른 양상에 따르면, 텍스트 메시지를 제공하는 전자 장치가 제공된다. 상기 장치는 발화를 수신하도록 동작하는 마이크로폰; 메시지 템플릿들을 저장하는 비휘발성 메모리; 및 메시지 템플릿들에 의해 안내된 발화의 음성 인식을 수행하도록 동작하는 프로세서를 포함하며, 여기서 프로세서는 매칭 템플릿을 생성하기 위해 발화를 템플릿들 중 하나와 매칭시키고, 매칭 템플릿으로부터 텍스트 메시지를 제공하도록 동작한다.
상기 전자 장치와 관련하여, 메시지 템플릿은 또한 고정 또는 가변 언어 성분들이거나, 고정 및 가변 언어 성분 둘 다를 포함할 수 있다.
상기 전자 장치와 관련하여, 텍스트 메시지는 SMS 메시지일 수 있다.
상기 전자 장치는 메시지 템플릿을 편집하도록 동작하는 키패드를 포함할 수 있다.
상기 전자 장치는 상기 발화를 다수의 템플릿들과 매칭시키고, 템플릿들 각각에 대한 가능성 스코어(likelihood score)를 계산하도록 동작할 수 있다.
본 발명이 용이하게 이해되고 실용적인 효과를 제공하기 위하여, 첨부 도면들과 관련하여 서술된 바와 같은 바람직한 실시예들이 이제 참조될 것이다.
도1은 본 발명에 따른 무선 전화의 개략적인 블록도.
도2는 본 발명에 따른 텍스트 메시지를 제공하고, 편집하고 송신하는 방법을 도시한 흐름도.
도3은 본 발명에 따른 후보 메시지 템플릿들의 리스트를 사용자에게 제공하 는 방법을 도시한 흐름도.
도4는 본 발명에 따른 사용자가 기존 메시지 템플릿들을 편집하고 새로운 템플릿들 정적 프로그래밍 가능한 메모리 내에 저장하는 것을 가능하게 하는 방법을 도시한 흐름도.
도1을 참조하면, 프로세서(110)와 통신하기 위해 연결된 무선 주파수 통신 유닛(105)을 포함하는 무선 전화(100)가 도시되어 있다. 디스플레이(115), 키패드(120), 마이크로폰(190), 및 스피커(195) 형태의 입/출력(I/O) 인터페이스들이 또한 프로세서(110)와 통신하기 위하여 연결된다.
프로세서(110)는 무선 전화(100))에 의해 송신되거나 수신될 수 있는 음성 또는 다른 신호들을 인코딩 및 디코딩하기 위하여 데이터를 저장하는 연관된 판독 전용 메모리(ROM)(130)를 갖는 인코더/디코더(125)를 포함한다. 프로세서(110)는 또한 공통 데이터 및 어드레스 버스(140)에 의하여, 인코더/디코더(125) 및 연관된 문자 판독 전용 메모리(ROM)(145), 랜덤 액세스 메모리(RAM)(150), 정적 프로그래밍 가능한 메모리(155) 및 제거 가능한 SIM 모듈(160)에 연결된다. 정적 프로그래밍 가능한 메모리(155) 및 SIM 모듈(160) 각각은 특히 선택된 인커밍 텍스트 메시지들(incoming text messages), 전화번호부 데이터베이스, 및 아래에 더 상세히 서술되는 바와 같이, 아웃고잉 텍스트 메시지들(outgoing text messages)의 템플릿들을 저장할 수 있다. 마이크로프로세서(135)는 키패드(120), 디스플레이(115) 및 전형적으로 스피커, 진동기 모터 및 연관된 드라이버들에 연결하기 위한 포트들을 갖 는다. 문자 판독 전용 메모리(145)는 통신 유닛(105)에 의해 수신될 수 있는 텍스트 메시지들, 즉 키패드(120)에서의 입력을 디코딩하거나 인코딩하기 위한 코드를 저장한다.
무선 주파수 통신 유닛(105)은 공통 안테나(170)를 갖는 결합된 수신기 및 송신기이다. 통신 유닛(105)은 무선 주파수 증폭기(180)를 통하여 안테나(170)에 연결된 송수신기(175)를 갖는다. 송수신기(175)는 또한 통신 유닛(2)을 프로세서(110)로 연결하는 결합된 변조기/복조기(185)에 연결된다.
도2를 참조하면, 무선 전화(100)를 사용하여 텍스트 메시지를 제공하고, 편집하고 송신하는 방법 200을 포함하는 본 발명의 일 실시예를 도시한 흐름도가 도시되어 있다. 상기 방법 200은 시작 단계 205에서 시작된다. 단계 210에서, 전화(100)의 마이크로폰(190)과 같은 입력에서 발화가 수신된다. 그 후, 단계 215에서, 프로세서(100)가 발화 파형의 샘플링 및 디지털화를 수행하고 나서, 단계 225에서 파형을 나타내는 특징 벡터들 제공하기 위하여 프로세싱하기 이전에, 단계 220에서 세그먼팅한다. 단계 215, 220 및 225는 당업자에게 널리 알려져 있으므로, 상세한 설명이 필요로 되지 않는다는 것을 유의해야 한다.
다음으로, 단계 230에서, 단계 225로부터 발생된 특징 벡터들에 대한 음성 인식이 수행된다. 상기 음성 인식은 장치(100)의 정적 프로그래밍 가능한 메모리(155)에 저장된 사용자 정의된 메시지 템플릿들에 의해 안내된다. 상기 메시지 템플릿들은 본 명세서의 이후 부분에서 더 상세히 서술된다. 그 다음, 상기 방법 200은 단계 235에서 텍스트 메시지를 사용자에게 제공한다. 상기 메시지는 장치(100) 의 디스플레이(115) 또는 스피커(195)와 같은 I/O 인터페이스들 중 하나를 사용하여 사용자에게 제공될 수 있다.
메시지가 사용자에게 제공된 이후에, 사용자는 단계 240에서 메시지를 편집할지의 여부를 결정할 수 있다. 사용자가 메시지를 편집하지 않는다고 결정하면, 메시지는 단계 245에서 SMS와 같은 메시지 포맷으로 송신된다. 그러나, 단계 240에서 사용자가 메시지를 편집한다고 결정하면, 메시지는 단계 245에서 송신되기 이전에 단계 250에서 편집된다. 본 발명의 다수의 실시예들에서, 사용자는 스피커(195) 로의 스피킹 편집들(speaking edits) 또는 키패드(120)로의 타이핑 편집들(typing edits)을 포함하는 몇 가지 상이한 방식들로 메시지를 편집할 수 있다. 그 다음, 상기 방법 200은 단계 255에서 종료된다.
본 발명의 대안적인 실시예에서, 상술된 음성 인식 단계 230 이후에, 텍스트 메시지 제공 단계 235는 전화(100)의 사용자에게 후보 메시지 템플릿들의 리스트를 제공하는 단계를 포함하며, 사용자는 상기 리스트로부터 의도된 텍스트 메시지에 가장 적절한 템플릿을 선택할 수 있다.
도3은 이와 같은 후보 템플릿들의 리스트를 사용자에게 제공하는 방법 300을 도시한 흐름도이다. 상기 방법 300은 사용자가 키패드(120) 또는 마이크로폰(190)으로 명령을 입력할 때, 시작 단계 305에서 시작된다. 상기 방법 300은 우선 단계 310에서 프로세서(110)가 이용 가능한 메시지 템플릿들의 리스트로부터 메시지 템플릿을 선택하는 단계를 포함한다. 그 다음, 단계 315에서, 선택된 템플릿은 방법 200의 단계 225에서 제공된 특징 벡터들과 비교된다. 그 다음, 상기 프로세서(110) 는 단계 320에서 입력 발화의 특징 벡터들 및 선택된 템플릿의 양상들 사이의 매칭 품질을 추정하는 가능성 스코어를 계산한다.
그 다음, 단계 325에서, 프로세서(110)는 상기 가능성 스코어가 설정된 임계값보다 큰지를 결정한다. 임계값은 프로세서(110)에 의해 자동으로 계산되거나, 전화(100)의 사용자에 의해 미리 설정될 수 있다. 선택된 템플릿의 가능성 스코어가 설정된 임계값보다 작으면, 단계 330에서 그 템플릿은 거절된다. 그러나, 선택된 템플릿의 가능성 스코어가 설정된 임계값보다 크면, 단계 335에서 그 템플릿은 입력 발화와의 적당한 매칭인 것으로 간주되고, 그 템플릿이 후보 템플릿들의 리스트에 부가된다. 그 다음, 선택된 템플릿이 거절되는지 아니면 후보 템플릿들의 리스트에 부가되는지의 여부에 관계없이, 상기 방법 300은 단계 340로 진행하는데, 여기서 프로세서(220)는 모든 이용 가능한 템플릿들이 평가되었는지를 결정한다. 모든 이용 가능한 템플릿들이 평가되지 않았다면, 단계 345에서 상기 방법 300은 다음 메시지 템플릿을 선택하여 단계 315로 리턴하는데, 여기서 상기 다음 템플릿이 입력 발화의 특징 벡터들과 비교된다. 단계 340에서 모든 템플릿들이 평가되었다면, 상기 방법 300은 단계 350에서 계속되어, 모든 후보 템플릿들의 리스트를 사용자에게 제공한다. 후보 템플릿들은 장치(100)의 디스플레이(115) 또는 스피커(195)와 같은 I/O 인터페이스들 중 하나를 사용하여 사용자에게 제공될 수 있다. 그 다음, 상기 방법은 단계 355에서 종료된다.
본 발명의 실시예에 따르면, 전화(100)의 사용자들은 장치(100)의 제조자에 의해 공급되는 템플릿들의 사용으로 제한되지 않는다. 오히려, 장치(100)의 사용자 들은 정적 프로그래밍 가능한 메모리(155)에 저장된 기존 템플릿들을 편집하여 자신들의 개인화된 메시지 템플릿들을 생성한다.
도4를 참조하면, 사용자가 기존 템플릿들을 편집하여 새로운 템플릿들을 정적 프로그래밍 가능한 메모리(155)에 세이브할 수 있게 하는 방법 400이 도시되어 있다. 이 방법 400은 사용자가 키패드(120)로 명령을 입력하거나 마이크로폰(190)으로 입력할 때 시작 단계 405에서 호출(invoke)된다. 단계 410에서, 기존 템플릿들의 리스트는 디스플레이(115) 또는 스피커(195)와 같은 I/O 인터페이스를 통해서 장치(100)의 사용자에게 제공된다. 그 후, 사용자는 마이크로폰(190) 또는 키패드(120)와 같은 I/O 인터페이스를 사용하여 단계 415에서 원하는 메시지 템플릿을 선택한다. 다음에, 사용자는 또다시 마이크로폰(190) 또는 키패드(120)와 같은 I/O 인터페이스를 사용하여 단계 420에서 템플릿을 편집한다. 최종적으로, 단계 425에서, 사용자는 정적 프로그래밍 가능한 메모리(155)에서 편집된 템플릿을 세이브한다. 그 후, 이 방법 400은 단계 430에서 종료된다.
USB 케이블과 같은 통신 채널을 사용하여 전화(100)를 호스트 컴퓨터에 접속시키고 나서 편집된 템플릿들을 정적 프로그래밍 가능한 메모리(155)로 다운로딩하거나 플래싱하는 단계를 포함한 메시지 템플릿들을 편집하는 다른 방법들은 또한 본 발명의 범위 내에 있다.
본 발명의 방법은 고정 및 가변 언어 성분들을 포함하는 메시지 템플릿들을 더 포함한다. 고정 언어 성분들은 사용자가 템플릿을 선택하여 메시지를 전송할 때 변경되지 않는다. 그러나, 가변 언어 성분들은 메시지 전체에 걸쳐서 사용자로부터 변경될 수 있다. 고정된 가변 언어 성분들의 사용은 전화(100)의 제한된 처리 전력 및 메모리에 크게 영향을 줄 수 있다.
예를 들어, 미팅 요청에 관한 단문 메시지의 특정 템플릿은 다음 "Meet me at $PLACE at $TIME을 포함할 수 있다. 여기서 고정 언어 성분들은 밑줄을 치고, 가변 언어 성분들은 대문자로 그리고 $로 시작된다. 그 후, 템플릿의 여러 사용자들은 $PLACE와 같은 변수를 편집하여 자신들의 특정 환경들에 적합하게 한다. 예를 들어, 대학생은 변수 $PLACE를 다음과 같이 정의할 수 있다:
$PLACE=sp|library|dormitory|cafeteria 등
반면에, 변호사는 변수 $PLACE를 다름과 같이 정의할 수 있다.
$PLACE=sp|office|courthouse|home 등
상기에서, "sp"는 휴지(pause) 또는 음성 이벤트 없음을 의미하고 "|"은 논리 연산자 "OR"을 의미한다.
본 발명에서 사용될 수 있는 메시지 템플릿의 또 다른 예는 "Happy $FESTIVAL"이다. 여기서 가변 언어 성분 $FESTIVAL은 사용자에 의해 다음을 포함하도록 편집될 수 있다:
$FESTIVAL= sp|birthday|new year|thanksgiving 등.
개방 어휘 음성 인식을 사용하면, 전화(100)는 사용자에 의해 입력된 편집된 가변 언어 성분들을 인식할 수 있다. 가변 언어 성분들이 이산 변수들의 세트로 이루어지기 때문에, 음성 인식 처리 오버헤드 및 메모리 요구들은 최소화된다. 따라서, 상기 방법은 특히 모바일 전화들과 같은 제한된 처리 및 메모리 자원들을 갖는 장치들에 적합하다.
고정 및 가변 언어 성분들을 포함한 템플릿들의 사용은 여러 가지 이유들로 음성 인식 시스템의 효율을 증가시킨다. 우선, 특정 템플릿의 고정 언어 성분들은 일반적으로 신속하고 효율적으로 인식되는데, 그 이유는 자연 언어 문자 구조들과 연관된 거의 무제한의 문장 순열들의 수와 비교하여 매우 적절한 수의 템플릿들이 존재하기 때문이다. 두 번째, 가변 언어 성분들은 또한 효율적으로 인식될 수 있는데, 그 이유는 메시지 템플릿 내의 가변 언어 성분의 문장 내 위치가 가능한 응답들의 이산 세트를 자동으로 식별하기 때문이다. 예를 들어, 상기 제공된 "Happy $FESTIVAL" 메시지 템플릿을 참조하면, 고정 언어 성분 "Happy"은 신호로서 작용하여 프로세서(110)가 마이크로폰(190)에서 수신되는 다음 음성 입력이 가변 언어 성분 "$FESTIVAL"일 것이라는 것을 인지한다.
본 발명의 상술된 실시예들이 무선 전화(100)와 관련하여 서술되었지만, 본 발명의 이 방법 및 장치는 또한 개인용 휴대정보 단말기들(PDAs)과 같은 텍스트 메시지들을 제공하는 다른 전자 장치들을 포함한다.
따라서, 본 발명은 휴대용 전자 장치로부터 텍스트 메시지를 제공하고 전송하는데 필요한 단계들을 간단화한다. 텍스트 메시지는 작은 키패드로 입력되는 타이핑된 문자들을 통하기보다 오히려 음성 입력들을 통해서 제공될 수 있다. 게다가, 본 발명은 개방 어휘 음성 인식을 포함하여 종래 폐쇄된 어휘 음성 인식의 메모리 집중 요구들을 피하게 한다. 개방 어휘 음성 인식은 언어의 음향 발생들 또는 음소들 모두를 커버하도록 설계된 스피커-독립 서브-워드 음향 모델들(speaker- independent sub-word acoustic models)을 사용한다. 따라서, 사용자는 사전 정의된 어휘로 제한되는 것이 아니라, 상술된 바와 같이 가변 언어 성분들을 편집하여 이름들 및 위치들과 같이 사전에서 찾아지지 않는 단어들을 포함하도록 한다. 그 결과, 본 발명에 의해 제공되는 텍스트 메시지들은 고도로 개인화될 수 있다.
상기 상세한 설명은 단지 바람직한 전형적인 실시예를 제공하기 위한 것이지 본 발명의 범위, 응용 또는 구성을 제한하는 것이 아니다. 오히려, 바람직한 전형적인 실시예들의 상세한 설명은 당업자가 본 발명의 바람직한 실시예들을 구현하도록 한다. 첨부된 청구범위에 정의된 본 발명의 원리 및 범위를 벗어남이 없이 소자들의 기능 및 배열에 대해서 각종 변경들을 행할 수 있다는 것을 이해하여야 한다.

Claims (15)

  1. 텍스트 메시지를 제공하는 방법에 있어서,
    전자 장치의 입력에서 발화(utterance)를 수신하는 단계;
    상기 전자 장치와 연관된 메모리에 저장된 사용자-정의된 메시지 템플릿들(user-defined message templates)에 의해 안내되는 상기 발화의 음성 인식을 수행하는 단계로서, 음성 인식은 매칭 템플릿(matching template)을 생성하기 위해 상기 발화를 상기 템플릿들 중 하나와 매칭시킴으로써 정의되는, 상기 음성 인식 수행 단계; 및
    상기 매칭 템플릿으로부터 텍스트 메시지를 제공하는 단계를 포함하는, 텍스트 메시지 제공 방법.
  2. 제1항에 있어서,
    상기 메시지 템플릿들 중 적어도 하나는 고정 언어 성분을 포함하는, 텍스트 메시지 제공 방법.
  3. 제1항에 있어서,
    상기 메시지 템플릿들 중 적어도 하나는 가변 언어 성분을 포함하는, 텍스트 메시지 제공 방법.
  4. 제1항에 있어서,
    상기 메시지 템플릿들 중 적어도 하나는 고정 및 가변 언어 성분 둘 다를 포함하는, 텍스트 메시지 제공 방법.
  5. 제1항에 있어서,
    상기 텍스트 메시지는 SMS 메시지인, 텍스트 메시지 제공 방법.
  6. 제1항에 있어서,
    상기 전자 장치의 키패드로부터 타이핑된 문자들을 수신함으로써 상기 사용자-정의된 메시지 템플릿을 편집하는 단계를 더 포함하는, 텍스트 메시지 제공 방법.
  7. 제1항에 있어서,
    상기 텍스트 메시지의 성분은 상기 발화의 트랜스크립션(transcription)인, 텍스트 메시지 제공 방법.
  8. 제1항에 있어서,
    상기 텍스트 메시지 전체는 상기 발화의 트랜스크립션인, 텍스트 메시지 제공 방법.
  9. 텍스트 메시지를 제공하는 전자 장치에 있어서,
    발화를 수신하도록 동작하는 마이크로폰(microphone);
    메시지 템플릿들을 저장하는 비휘발성 메모리; 및
    상기 메시지 템플릿들에 의해 안내된 상기 발화의 음성 인식을 수행하도록 동작하는 프로세서를 포함하고, 상기 프로세서는 매칭 템플릿을 생성하기 위해 상기 발화를 상기 템플릿들 중 하나와 매칭시키고, 상기 매칭 템플릿으로부터 텍스트 메시지를 제공하도록 동작하는, 텍스트 메시지 제공 전자 장치.
  10. 제9항에 있어서, 상기 메시지 템플릿들 중 적어도 하나는 고정 언어 성분을 포함하는, 텍스트 메시지 제공 전자 장치.
  11. 제9항에 있어서, 상기 메시지 템플릿들 중 적어도 하나는 가변 언어 성분을 포함하는, 텍스트 메시지 제공 전자 장치.
  12. 제9항에 있어서,
    상기 메시지 템플릿들 중 적어도 하나는 고정 및 가변 언어 성분 둘 다를 포함하는, 텍스트 메시지 제공 전자 장치.
  13. 제9항에 있어서,
    상기 텍스트 메시지는 SMS 메시지인, 텍스트 메시지 제공 전자 장치.
  14. 제9항에 있어서,
    상기 메시지 템플릿을 편집하도록 동작하는 키패드를 더 포함하는, 텍스트 메시지 제공 전자 장치.
  15. 제9항에 있어서,
    상기 프로세서는 상기 발화를 다수의 상기 템플릿들과 매칭시키고, 상기 템플릿들 각각에 대한 가능성 스코어(likelihood score)를 계산하도록 동작하는, 텍스트 메시지 제공 전자 장치.
KR1020067005735A 2003-09-23 2004-09-17 텍스트 메시지를 제공하는 방법 및 장치 KR100759728B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CNB031249639A CN100353417C (zh) 2003-09-23 2003-09-23 用于提供文本消息的方法和装置
CN03124963.9 2003-09-23

Publications (2)

Publication Number Publication Date
KR20060054469A true KR20060054469A (ko) 2006-05-22
KR100759728B1 KR100759728B1 (ko) 2007-09-20

Family

ID=34383973

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067005735A KR100759728B1 (ko) 2003-09-23 2004-09-17 텍스트 메시지를 제공하는 방법 및 장치

Country Status (5)

Country Link
EP (1) EP1665561A4 (ko)
KR (1) KR100759728B1 (ko)
CN (1) CN100353417C (ko)
RU (1) RU2320082C2 (ko)
WO (1) WO2005031995A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11244679B2 (en) 2017-02-14 2022-02-08 Samsung Electronics Co., Ltd. Electronic device, and message data output method of electronic device

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1488410B1 (en) * 2002-03-27 2010-06-02 Nokia Corporation Distortion measure determination in speech recognition
KR100805252B1 (ko) 2005-06-27 2008-02-21 서울통신기술 주식회사 Ip 단말의 통화 처리 방법 및 그 장치
DE102007061156A1 (de) * 2007-12-17 2009-08-06 Vodafone Holding Gmbh Nachrichtenübertragung in Telekommunikationsnetzen
KR101597286B1 (ko) 2009-05-07 2016-02-25 삼성전자주식회사 아바타 영상 메시지를 생성하는 장치 및 방법
CN102263851A (zh) * 2010-05-31 2011-11-30 北京迅捷英翔网络科技有限公司 消息转换方法
CN103366741B (zh) * 2012-03-31 2019-05-17 上海果壳电子有限公司 语音输入纠错方法及系统
RU2637874C2 (ru) 2013-06-27 2017-12-07 Гугл Инк. Генерирование диалоговых рекомендаций для чатовых информационных систем
US9473627B2 (en) 2013-11-08 2016-10-18 Sorenson Communications, Inc. Video endpoints and related methods for transmitting stored text to other video endpoints
US9185211B2 (en) 2013-11-08 2015-11-10 Sorenson Communications, Inc. Apparatuses and methods for operating a communication system in one of a tone mode and a text mode
US11924149B2 (en) * 2020-10-15 2024-03-05 Google Llc Composition of complex content via user interaction with an automated assistant

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2372671C (en) * 1994-10-25 2007-01-02 British Telecommunications Public Limited Company Voice-operated services
US6173316B1 (en) * 1998-04-08 2001-01-09 Geoworks Corporation Wireless communication device with markup language based man-machine interface
US6526292B1 (en) * 1999-03-26 2003-02-25 Ericsson Inc. System and method for creating a digit string for use by a portable phone
DE19959903A1 (de) * 1999-12-07 2001-06-13 Bruno Jentner Modul zur Unterstützung der Text-Mitteilungs-Kommunikation in Mobilfunknetzen
KR20020028501A (ko) * 2000-10-10 2002-04-17 김철권 통신망에서의 음성 데이터와 문자 데이터간의 변환 방법및 그 장치
US6795808B1 (en) * 2000-10-30 2004-09-21 Koninklijke Philips Electronics N.V. User interface/entertainment device that simulates personal interaction and charges external database with relevant data
WO2002077975A1 (en) * 2001-03-27 2002-10-03 Koninklijke Philips Electronics N.V. Method to select and send text messages with a mobile
DE50104036D1 (de) * 2001-12-12 2004-11-11 Siemens Ag Spracherkennungssystem und Verfahren zum Betrieb eines solchen
US6895257B2 (en) * 2002-02-18 2005-05-17 Matsushita Electric Industrial Co., Ltd. Personalized agent for portable devices and cellular phone
US7072684B2 (en) * 2002-09-27 2006-07-04 International Business Machines Corporation Method, apparatus and computer program product for transcribing a telephone communication
US20040176139A1 (en) * 2003-02-19 2004-09-09 Motorola, Inc. Method and wireless communication device using voice recognition for entering text characters

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11244679B2 (en) 2017-02-14 2022-02-08 Samsung Electronics Co., Ltd. Electronic device, and message data output method of electronic device

Also Published As

Publication number Publication date
EP1665561A4 (en) 2011-03-23
WO2005031995A1 (en) 2005-04-07
RU2320082C2 (ru) 2008-03-20
EP1665561A1 (en) 2006-06-07
KR100759728B1 (ko) 2007-09-20
RU2006113581A (ru) 2007-10-27
CN100353417C (zh) 2007-12-05
CN1601548A (zh) 2005-03-30

Similar Documents

Publication Publication Date Title
US6424945B1 (en) Voice packet data network browsing for mobile terminals system and method using a dual-mode wireless connection
CN100403828C (zh) 一种便携式数字移动通讯设备及其语音控制方法和系统
US6694295B2 (en) Method and a device for recognizing speech
US8244540B2 (en) System and method for providing a textual representation of an audio message to a mobile device
KR100769029B1 (ko) 다언어의 이름들의 음성 인식을 위한 방법 및 시스템
US20030104839A1 (en) Communication terminal having a text editor application with a word completion feature
KR20050094830A (ko) 문자 메시지에 포함되어 있는 단어들을 통해 업데이트될 수있는 사전을 지니는 통신 장치
WO2005027093A1 (en) Generation of an alternative pronunciation
US7392184B2 (en) Arrangement of speaker-independent speech recognition
KR100759728B1 (ko) 텍스트 메시지를 제공하는 방법 및 장치
JP2002540731A (ja) 携帯電話機による使用のための数字列を生成するシステムおよび方法
WO2007067880A2 (en) System and method for assisted speech recognition
CN111325039B (zh) 基于实时通话的语言翻译方法、系统、程序和手持终端
WO2006090222A1 (en) Selecting an order of elements for a speech synthesis
KR100367579B1 (ko) 음성을 이용한 인터넷사용시스템
WO2008118038A1 (fr) Procédé d'échange de messages et dispositif permettant sa mise en oeuvre
JP4070963B2 (ja) 移動体通信機器
KR100724848B1 (ko) 휴대 단말에서 입력 문자 실시간 낭독방법
JP2005520194A (ja) テキストメッセージの生成
CN111274828B (zh) 基于留言的语言翻译方法、系统、计算机程序和手持终端
JP2002140086A (ja) 携帯電話機用のショートメッセージから音声出力への変換装置
GB2406471A (en) Mobile phone with speech-to-text conversion system
KR19990043026A (ko) 음성인식 한글입력장치
KR20050051239A (ko) 이동통신 단말기에서의 음성에 의한 키명령어 입력 방법
JP2005286886A (ja) サーバ

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
G170 Re-publication after modification of scope of protection [patent]
FPAY Annual fee payment

Payment date: 20120830

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20130830

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140828

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee