KR100790700B1 - 문자 규정 방법 및 문자 선택 장치 - Google Patents

문자 규정 방법 및 문자 선택 장치 Download PDF

Info

Publication number
KR100790700B1
KR100790700B1 KR1020060058958A KR20060058958A KR100790700B1 KR 100790700 B1 KR100790700 B1 KR 100790700B1 KR 1020060058958 A KR1020060058958 A KR 1020060058958A KR 20060058958 A KR20060058958 A KR 20060058958A KR 100790700 B1 KR100790700 B1 KR 100790700B1
Authority
KR
South Korea
Prior art keywords
character
user
list
candidate
input
Prior art date
Application number
KR1020060058958A
Other languages
English (en)
Other versions
KR20070001020A (ko
Inventor
콜린 블래어
케빈 찬
크리스토퍼 알 젠틀
네일 헵워스
앤드류 더블유 랭
Original Assignee
아바야 테크놀러지 코퍼레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아바야 테크놀러지 코퍼레이션 filed Critical 아바야 테크놀러지 코퍼레이션
Publication of KR20070001020A publication Critical patent/KR20070001020A/ko
Application granted granted Critical
Publication of KR100790700B1 publication Critical patent/KR100790700B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0236Character input methods using selection techniques to select from displayed items
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/24Speech recognition using non-acoustical features
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2203/00Indexing scheme relating to G06F3/00 - G06F3/048
    • G06F2203/038Indexing scheme relating to G06F3/038
    • G06F2203/0381Multimodal input, i.e. interface arrangements enabling the user to issue commands by simultaneous use of input devices of different nature, e.g. voice plus gesture on digitizer

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)
  • Character Discrimination (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

문자 합성 단어 또는 문자(즉, 소정의 구성 요소를 포함하는 단어 또는 문자)의 자동완성과 관련된 음성 인식이 제공된다. 단어 또는 문자의 구성 요소를 규정하는 사용자 입력에 응답하여, 후보 단어 또는 문자 리스트가 생성된다. 원하는 단어 또는 문자를 발음하는 사용자에 응답하여, 원하는 단어 또는 문자가 선택되거나 후보 단어 또는 문자 리스트가 축소될 수 있다. 그 결과로서, 소정의 글자, 획 또는 단어 형태로 형성되는 단어 또는 문자의 입력은 원하는 단어 또는 문자의 구성 요소의 규정과 원하는 단어 또는 문자의 발음에 해당하는 음성의 결합을 포함하는 사용자 입력에 의해 용이해진다.

Description

문자 규정 방법 및 문자 선택 장치{SPEECH RECOGNITION ASSISTED AUTOCOMPLETION OF COMPOSITE CHARACTERS}
도 1은 본 발명의 실시예에 따른 통신 또는 연산 장치의 구성 요소에 대한 블록도이다.
도 2는 본 발명의 실시예에 따른 통신 장치를 도시한다.
도 3은 본 발명의 실시예에 따른 음성 인식 지원형 자동완성 처리 동작의 측면을 도시하는 흐름도이다.
도 4a 내지 도 4d는 본 발명의 실시예에 따른 예시적인 디스플레이 출력을 도시한다.
도면의 주요 부분에 대한 부호의 설명
104 : 프로세서 108 : 메모리
112 : 사용자 입력 116 : 사용자 출력
120 : 데이터 저장 장치 124 : 동작 시스템 소프트웨어(OS)
128 : 음성 인식 애플리케이션 132 : 문자 선택 애플리케이션
134 : 후보 문자표 136: 통신 네트워크 인터페이스
본 발명은 합성 문자의 입력에 관한 것이다. 특히, 본 발명은 후보 단어 또는 문자 리스트를 한정적으로 제공하도록 수동 사용자 입력과 음성 인식을 결합함으로써 통신 또는 연산 장치로의 단어 또는 문자 입력을 용이하게 한다.
여러 가지 다양한 기능을 수행할 수 있는 이동 통신 및 연산 장치가 사용되고 있다. 점점, 이러한 기능은 문자의 입력을 필요로 하거나 이용할 수 있다. 예컨대, 셀룰러 전화기와 관련하여 사용되는 문자 메시징 서비스는 현재 보편적으로 사용되고 있다. 다른 예로서, 휴대용 장치는 전자 우편 애플리케이션과 관련하여 점점 사용되고 있다. 그러나, 휴대용 장치에서 키보드용으로 이용가능한 공간은 상당히 제한된다. 그러므로, 이러한 장치에 문자를 입력하는 것은 어려울 수 있다. 또한, 대형 데스크톱 통신 또는 연산 장치와 관련하여, 특정 언어로 사용되는 기호는 입력하기가 어려울 수 있다.
특히 휴대 전화기 또는 다른 장치의 제한된 키패드를 사용하여 단어 또는 문자의 입력을 용이하게 하기 위해, 자동완성 특성을 이용할 수 있다. 이러한 특성은 사용자로부터의 초기 입력 세트 수신에 응답하여 후보 단어 또는 문자 리스트를 사용자에게 디스플레이할 수 있다. 이들 입력은 한자처럼, 단어의 처음 몇 글자 또는 문자의 처음 몇 획의 사양을 포함할 수 있다. 그러나, 결과적인 리스트가 상당히 길기 때문에, 사용자가 원하는 단어 또는 문자를 신속하게 찾는 것은 어려울 수 있다.
긴 자동완성 후보 리스트로 인해 발생하는 문제점을 해결하기 위해, 후보 단어 또는 문자가 사용 빈도에 따라 배열되는 리스트를 제공하는 시스템을 이용할 수 있다. 이들의 사용 빈도에 따라 후보를 배치하는 것은 사용자가 전체 후보 리스트를 스크롤링할 필요성을 감소시킬 수 있다. 그러나, 후보 단어 또는 문자 리스트를 상식적인 방법으로 배치하는 것은 어렵다. 또한, 사용자가 특이한 단어 또는 문자를 찾는 중일 경우에, 시간이 절약되거나 단축되지 않을 수 있다.
사용자로부터 수동 입력을 요구하는 것의 대안으로서, 음성 또는 목소리 인식 시스템은 문자를 입력하거나 명령을 내리는 데 이용가능하다. 그러나, 이러한 시스템의 정확성은 흔히 사용자 연습 및 교정 후에도 미흡한 점이 많다. 더욱이, 완전한 형태의 음성 인식 시스템은 흔히 셀룰러 전화기와 같은, 이동 통신 또는 연산 장치에서는 일반적으로 가질 수 없는 처리 및 메모리 리소스를 필요로 한다. 이에 따라, 이동 장치와 관련하여 이용가능한 음성 인식 기능은 흔히 초보적이고, 일반적으로 언어에서 구두 문자의 제한된 서브셋을 인식하는 방향으로 조정된다. 또한, 이동 장치에서의 음성 인식은 주소록을 액세스하여 선택된 번호로 전화를 거는 것과 같은 정해진 명령을 내리는 것으로 흔히 제한된다.
본 발명은 종래 기술의 이들 및 다른 문제점과 단점 해결에 관한 것이다. 본 발명의 실시예에 따라서, 음성 인식은 단어(예컨대 영어 문자와 관련됨) 또는 문자(예컨대 중국어 문자와 관련됨)와 같은 후보 구성 요소 문자 리스트를 제한하거나 필터링 하는 데 사용된다. 특히, 사용자가 글자, 단어의 획 또는 형태, 또는 문자를 수동으로 입력한 후에, 사용자는 그 문자를 발음할 수 있다. 이어서 음성 인식 소프트웨어는 음성이 발음된 단어 또는 문자와 다르게 들리는 단어 또는 문자를 후보 리스트로부터 삭제하도록 시도한다. 이에 따라, 상대적으로 기초적인 음성 인식 애플리케이션도 후보 리스트로부터 적어도 소정의 단어 또는 문자를 적어도 삭제하는 데 효과적일 수 있다. 또한, 구성 요소의 입력 또는 선택을 통해 단어 또는 문자의 글자, 획 또는 다른 구성 요소를 우선 제공함으로써, 이용가능하거나 후보인 단어 또는 문자의 범위는 상당히 좁게 정의되어, 범위를 더 좁히거나(즉, 후보 리스트를 좁힘) 사용자가 입력하고자 하는 단어 또는 문자를 명확하게 식별하기 위해 음성 인식 애플리케이션에 필요한 정확성을 감소시킬 수 있다.
본 발명의 실시예에 따라서, 단어 또는 문자는 원하는 문자에 포함된 글자(예컨대 영어 단어의 경우)나 획 또는 단어 형태(예컨대 한자의 경우)와 같은 단어 또는 문자의 특정 구성 요소를 나타내는 사용자 입력에 응답하여, 사용자에 의해 선택가능한 단어 또는 문자 리스트(본 명세서에서 "문자"로 총괄하여 지칭)에 포함될 수 있다. 또한, 사용자 음성 입력에 응답하여 문자 리스트는 제한될 수 있다. 특히 수신된 음성과 관련된(또는 관련이 없는) 후보 리스트 내의 문자를 식별하는 데 사용될 수 있는 사용자로부터의 음성 입력의 수신에 응답하여, 후보 리스트의 내용이 달라진다. 이에 따라, 줄어든 후보 단어 또는 문자 리스트를 제공하거나, 사용자에 의해 입력된 원하는 문자의 구성 요소와 사용자가 원하는 문자를 발음하는 것을 입력으로서 수신하는 음성 인식을 결합하여 사용함으로써 정확한 문자 식별에 의해 문자의 입력이 용이해진다.
도 1에 있어서, 본 발명에 따른 통신 또는 연산 장치(100)의 구성 요소가 블록도 형태로 도시된다. 이 구성 요소는 프로그램 인스트럭션을 실행할 수 있는 프로세서(104)를 포함할 수 있다. 이에 따라, 프로세서(104)는 임의의 범용 프로그램가능한 프로세서 또는 애플리케이션 프로그래밍을 실행하는 제어기를 포함할 수 있다. 또한, 프로세서(104)는 특별히 구성되는 ASIC(application specific integrated circuit)를 포함할 수 있다. 프로세서(104)는 일반적으로 통신 또는 연산 장치(100)에 의해 실행되는 다양한 기능을 구현하는 프로그래밍 코드를 실행하는 기능을 하되, 본 명세서에 설명된 단어 또는 문자 선택 동작을 포함한다.
통신 또는 연산 장치(100)는 프로세서에 의한 프로그래밍 실행과 관련하여 사용하며, 데이터 또는 프로그램 인스트럭션을 임시 또는 장기간 저장하는 메모리(108)를 더 포함할 수 있다. 메모리(108)는 DRAM 및 SDRAM처럼, 본질적으로 상주하거나 제거할 수 있거나 원격인 고체 상태 메모리를 포함할 수 있다. 프로세서(104)가 제어기를 포함하는 경우에, 메모리(108)는 프로세서(104)에 집적될 수 있다.
또한, 통신 또는 연산 장치(100)는 하나 이상의 사용자 입력(112) 및 하나 이상의 사용자 출력(116)을 포함할 수 있다. 사용자 입력(112)의 예는 키보드, 키 패드, 터치 스크린 입력 및 마이크로폰을 포함한다. 사용자 출력(116)의 예는 스피커, 디스플레이 스크린(터치 스크린 디스플레이 포함) 및 표시등을 포함한다. 또한, 당업자는 사용자 입력(112)이 사용자 출력(116)과 함께 결합하거나 동작할 수 있음을 알 것이다. 이러한 집적형 사용자 입력(112) 및 사용자 출력(116)의 예는 사용자에게 영상 정보를 나타내고 사용자로부터 입력 선택을 모두 수신할 수 있는 터치 스크린 디스플레이이다.
통신 또는 연산 장치(100)는 애플리케이션 프로그래밍 및/또는 데이터를 저장하는 데이터 저장 장치(120)도 포함할 수 있다. 또한, 동작 시스템 소프트웨어(124)는 데이터 저장 장치(120)에 저장될 수 있다. 예컨대, 데이터 저장 장치(120)는 자성 저장 장치, 고체 상태 저장 장치, 광학 저장 장치, 논리 회로 또는 이러한 장치의 임의의 결합을 포함할 수 있다. 데이터 저장 장치(120)에서 보존될 수 있는 프로그램 및 데이터는 데이터 저장 장치(120)의 특정 구현에 따라 소프트웨어, 펌웨어 또는 하드웨어 로직을 포함함을 알 수 있다.
데이터 저장 장치(120)에 저장될 수 있는 애플리케이션의 예는 음성 인식 애플리케이션(128) 및 단어 또는 문자 선택 애플리케이션(132)을 포함한다. 또한, 데이터 저장 장치(120)는 후보 단어 또는 문자의 표 또는 데이터베이스(134)를 포함할 수 있다. 본 명세서에 설명한 것처럼, 음성 인식 애플리케이션(128), 문자 선택 애플리케이션(132) 및/또는 후보 단어 또는 문자의 표(134)는 서로 통합될 수 있고/있거나, 서로 협력하여 동작할 수 있다. 데이터 저장 장치(120)는 통신 및 연산 장치(100)의 다른 기능의 수행과 관련하여 사용되는 애플리케이션 프로그래밍 및 데이터도 포함할 수 있다. 예컨대, 셀룰러 전화기와 같은 통신 및 연산 장치(100)와 관련하여, 데이터 저장 장치는 통신 애플리케이션 소프트웨어를 포함할 수 있다. 다른 예로서, PDA 또는 범용 컴퓨터와 같은 통신 및 연산 장치(100)는 문서 작성 애플리케이션 및 데이터 저장 장치(120)를 포함할 수 있다. 또한, 본 발명의 실시예에 따라서, 음성 인식 애플리케이션(128) 및/또는 문자 선택 애플리케이션(132)은 사용자에 의해 입력되거나 선택된 단어 또는 문자를 입력으로 수신할 수 있는 통신 애플리케이션 소프트웨어, 문서 작성 소프트웨어 또는 다른 애플리케이션과 협력하여 동작할 수 있다.
통신 또는 연산 장치(100)는 하나 이상의 통신 네트워크 인터페이스(136)도 포함할 수 있다. 통신 네트워크 인터페이스의 예는 셀룰러 전화 송수신기, 네트워크 인터페이스 카드, 모뎀, 유선 전화 포트, 직렬 또는 병렬 데이터 포트, 또는 다른 유선 또는 무선 통신 네트워크 인터페이스를 포함한다.
도 2에 있어서, 셀룰러 전화기(200)를 포함하는 통신 또는 연산 장치(100)가 도시된다. 셀룰러 전화기(200)는 일반적으로 숫자 키패드(204), 커서 제어 버튼(208), 엔터 버튼(212) 및 마이크로폰(214)을 포함하는 사용자 입력(112)을 포함한다. 또한, 셀룰러 전화기(200)는 컬러 또는 흑백 LCD와 같은 영상 디스플레이(216)와 스피커(220)를 포함하는 사용자 출력을 포함한다.
본 발명의 실시예에 따라서, 문자 입력 또는 선택 모드시에, 키패드(204)를 통해 사용자에 의해 입력되는 특정 글자, 획 또는 단어 형태를 포함하는 입력에 응답하여, 사용자는 하나 이상의 단어 또는 문자를 포함하는 불완전한 또는 완전한 리스트가 디스플레이 스크린(216)에 표시되게 할 수 있다. 당업자에 의해 알 수 있는 것처럼, 키패드에 포함된 각 키는 소정의 글자 또는 문자 형태뿐만 아니라 다른 기호와도 관련될 수 있다. 이를 테면, 도 2의 예에서 키패드(204)는 3개(간혹 4개)의 글자(224)와 키(2 내지 9)를 연관시킨다. 또한, 도 2의 예에서 키패드(204)는 3개(어떤 경우에는 4개)의 한자 부수 범주(228)를 키(2 내지 9)와 연관시킨다. 당업자에 의해 알 수 있는 것처럼, 예컨대 이러한 부수는 한자 입력을 위해 wubizixing 형태를 기반으로 하는 방법을 사용하여, 완전한 한자를 포함하는 형태를 규정하는 것과 관련하여 선택될 수 있다. 또한, 부수 중 하나의 선택은 연관된 부수를 사용할 수 있게 하여, 사용자가 원하는 특별한 단어 형태를 규정할 수 있게 한다. 이에 따라, 사용자는 원하는 글자 또는 단어와 관련된 키를 여러 번 누르거나 두드림으로써 키패드(204)에 포함된 특정 키와 관련된 글자 또는 문자 형태를 선택할 수 있다.
글자 또는 단어 형태를 선택함으로써 생성된 후보 문자 리스트는 영상 디스플레이(216)에 의해 적어도 일부분 디스플레이된다. 이 리스트가 디스플레이(216)에 전부 알맞게 나타낼 수 없을 만큼 길면, 커서 버튼(208) 또는 기타 입력(112)은 완전한 리스트를 모두 스크롤링하는 데 사용될 수 있다. 커서 버튼(208) 또는 기타 입력(112)은 예컨대 커서 버튼(208) 또는 다른 입력(112)을 사용하여 디스플레이된 리스트 내의 원하는 문자를 하이라이팅하고, 이어서 예컨대 엔터 버튼(212)을 눌러 이 문자를 선택함으로써, 원하는 문자의 선택과 관련하여 사용될 수도 있다. 또한, 본 명세서에 설명되는 것처럼, 후보 문자 리스트는 사용자에 의해 마이크로 폰(214)을 통해 장치(100)에 제공되고 이어서 예컨대, 음성 인식 애플리케이션(128)을 통해 장치(100)에 의해 처리된 음성에 기반하여 축소될 수 있다. 또한, 음성 인식 애플리케이션(128)이 음성 인식 애플리케이션(128) 어휘에 포함될 수 있는 모든 단어를 식별하도록 시도하는 것보다는, 문자 선택 애플리케이션(132)에 의해 생성되는 리스트 내에 포함된 문자를 식별하려고 시도하도록, 음성 인식 애플리케이션(128)은 원하는 문자의 구성 요소를 규정하는 수동 또는 다른 사용자 입력에 응답하여 문자 선택 애플리케이션(132)과 협력하여 기능을 한다.
도 3에 있어서, 본 발명의 실시예에 따른 영어 단어 또는 중국어 문자와 같은 문자에 대해 음성 인식 지원형 자동완성을 제공하는 통신 또는 연산 장치(100)의 동작 측면이 도시된다. 먼저, 단계(300)에서 사용자는 문자 입력 모드에 들어가거나 문자 입력 모드를 선택한다. 예컨대, 장치(100)가 셀룰러 전화기(200)를 포함하면, 문자 입력 모드는 문자 메시징 애플리케이션 또는 모드를 시작하는 것을 포함할 수 있다. 단계(304)에서, 사용자 입력이 단어 또는 문자의 구성 요소(예컨대, 글자, 획 또는 단어 형태)를 수동으로 선택하는 형태로 수신되었는지의 여부를 판단한다. 일반적으로, 본 발명의 실시예는 이러한 사용자로부터의 입력 수신과 관련하여 동작하여, 후보 문자의 초기 리스트를 생성한다. 문자의 구성 요소의 선택을 수신한 후에, 선택된 구성 요소를 포함하는 후보 문자 리스트가 생성된다(단계 308). 이어서 후보 리스트 중 적어도 일부분은 사용자에게 디스플레이된다(단계 312). 당업자에 의해 알 수 있는 것처럼, 후보 문자 리스트는 특히 단일 구성 요소가 지정될 때 상당히 길 수 있다. 이에 따라, 셀룰러 전화기(200)의 LCD(216)와 같은 디스플레이는 후보 리스트의 일부분만 표시할 수도 있다. 항상 후보 리스트의 일부만 표시될 수 있다면, 사용자는 원하는 문자를 검색하기 위해 리스트를 완전히 스크롤링할 수 있다.
이어서 사용자는 음성 입력을 제공함으로써 후보 문자 리스트를 축소하도록 선택할 수 있다. 이에 따라, 이어서 사용자로부터의 음성 입력이 수신되고 후보 문자의 발음과 연관시키거나 나타냄에 따라 인식되었는지의 여부를 판단할 수 있다(단계 320). 특히, 예컨대 마이크로폰(214)을 통해 수신된 음성은 음성 인식 애플리케이션(128)에 의해 분석되어, 후보 문자와 일치할 수 있는 지의 여부를 판단한다. 만일 일치할 수 있으면, 수정된 후보 문자 리스트가 생성된다(단계 324). 당업자에 의해 알 수 있는 것처럼, 기초적인 음성 인식 애플리케이션(128)이라도 특히, 사용자가 입력하기를 원하는 문자에 포함된 하나 이상의 구성 요소의 수신을 통해 리스트가 정해지는 경우, 리스트로부터 단일 문자를 명확하게 식별할 수 있다. 당업자에 의해 역시 알 수 있는 것처럼, 음성 인식 애플리케이션(128)은 특정 문자가 리스트로부터 식별될 수 없을지라도 후보 문자 리스트의 크기를 감소시킬 수 있다. 예컨대, 음성 인식 애플리케이션(128)이 사용자에 의해 입력된 음성을 후보 문자 리스트의 서브셋과 연관시킬 수 있다면, 수정된 리스트는 이 문자의 서브셋을 포함할 수 있다. 이에 따라, 음성 인식 애플리케이션(128)은 구두 음성이 원하는 단어 또는 문자의 구두 음성과 상이한 이들 단어 또는 문자를 후보 리스트로부터 삭제하도록 제공될 수 있다. 이에 따라, 단어 또는 문자를 (적어도 지금 시점에서) 찾기 위해 사용자가 검색해야만 하는 후보 개수가 감소한다. 이어서 수 정된 리스트 중 적어도 일부가 사용자에게 표시된다(단계 328). 수정된 리스트가 LCD(216)와 같은 사용자 출력(116)에 의해 동시에 표시하기에 너무 많은 후보를 포함한다면, 사용자는 이 리스트를 모두 다시 스크롤링할 수 있다.
단계(332)에서, 사용자가 후보 문자 중 하나를 선택하였는지의 여부를 다시 판단할 수 있다. 이 판단은 사용자가 후보 문자 리스트를 생성하기 위해 음성을 제공하지 않았음을 결정한 후 또는 문자의 후보 리스트에 대해 수정된 리스트를 생성한(단계 328) 후에 이루어진다. 만일 사용자가 규정된 문자를 선택하였다면, 과정은 종료한다. 이어서 사용자는 문자 모드를 나갈 수 있거나, 다음 문자를 선택하는 과정을 시작할 수 있다.
만일 사용자가 기록된 문자를 아직 선택하지 않았다면, 과정은 사용자가 추가 글자, 획 또는 단어 형태와 같은 추가 구성 요소를 입력할 수 있는 단계(304)로 돌아갈 수 있다. 이어서 단계(308)에서 생성될 수 있는 문자 리스트는 현재 사용자에 의해 규정된 추가 구성 요소를 반영하는 수정된 문자 리스트를 포함한다. 예컨대, 사용자가 2개의 글자 또는 단어 형태를 규정하였다면, 각 후보 문자에 이들 글자 또는 단어 형태가 요구될 수 있다. 이어서 결과 리스트가 적어도 일부분 표시된다(단계 312). 단계(312)에서 사용자에게 수정된 리스트를 표시한 후에, 사용자는 리스트 내의 후보 문자의 수를 더 감소시키기 위해 음성 입력을 제공하는 다른 시도를 할 수 있다(단계 320). 이와 달리, 단계(332)에서 사용자에 의해 나열된 문자가 선택되지 않으면, 단계(312)에서 사용자는 추가 입력을 원하는 합성 문자의 추가 구성 요소의 형태로 제공하지 않도록 결정할 수 있고, 대신 단계(320)로 진행하여 음성 입력을 제공함으로써 후보 리스트를 축소하는 다른 시도를 할 수 있다. 만일 추가 음성 입력이 제공되면, 그 입력은 후보 문자 리스트를 생성(단계 324)하는 데 사용되고, 그 수정된 리스트는 사용자에게 적어도 일부분 표시될 수 있다(단계 328). 이에 따라, 단어 또는 문자의 구성 요소를 지정하고/지정하거나 음성을 제공하여 원하는 단어 또는 문자를 식별하거나 후보 리스트의 크기를 적어도 감소시키는 다수의 반복이 실행될 수 있음을 알 수 있다.
도 4a 내지 도 4c에 있어서, 본 발명의 실시예의 동작과 관련하여 사용자에게 제공될 수 있는 영상 출력의 예가 도시된다. 특히, 중국어 문자 입력 모드의 셀룰러 전화기(200)를 포함하는 장치(100)의 디스플레이 스크린(216)이 도시된다. 도 4a에 도시된 것처럼, 사용자는 원하는 문자의 하나 이상의 획(404)을 선택할 수 있다. 획(404)의 선택은 사용자가 규정하기를 원하는 문자를 형성하는 제 1 획과 관련된, 키보드(204)에 포함된 키를 누름으로써 실행될 수 있다.
한자가 8개의 기본 획으로 형성되고, 수천 개의 한자가 사용되므로, 원하는 문자의 두 획을 지정하는 것은 전형적으로 긴 후보 문자 리스트를 생성한다. 본 예에 명시된 획(404)으로 시작되는 후보 문자(408a 내지 408d)의 불완전한 리스트(406a)는 도 4b에 도시된다. 제 1 문자(408a)는 대략 "니앤"으로 발음되고, 제 2 문자(408b)는 대략 "허"로 발음되며, 제 3 문자(408c)는 대략 "워"로 발음되고, 제 4 문자(408d)는 대략 "성"으로 발음된다. 이 리스트로부터, 사용자는 제 3 문자(408c)를 원할 수 있다. 본 발명의 실시예에 따라서, 사용자는 원하는 문자를 발음함으로써 후보 리스트로부터 이를 선택할 수 있다. 이에 따라, 도 4c에 도시 된 것처럼, 사용자는 제 3 문자(408c)를 발음하여 리스트가 이 문자(408c)만 포함하도록 변경되게 한다. 이어서 사용자는 엔터키(212)를 누르거나 이와 다른 방법으로 이 문자의 선택을 입력함으로써, 셀룰러 전화기(200)와 관련하거나 셀룰러 전화기에서 작동하는 음성 인식 애플리케이션(128)이 이 문자에 맞춰 리스트를 정확히 축소하였는지를 확인한다. 그러므로, 본 발명의 실시예에 따라서 문자의 구성 요소의 수동 입력과 음성 인식 동작은 사용자가 다수의 획으로 이루어진 문자를 쉽게 선택하도록 결합하여 동작한다. 또한, 이것은 이들 획 중 적어도 하나를 입력하고, 이어서 원하는 문자를 발음함으로써 간단히 달성될 수 있다. 이 결합은 음성 인식 애플리케이션(128)이 이 문자의 구두 음성으로부터 오로지 원하는 문자만 식별할 정도로 정확하지 않을지라도, 유사하게 보이는 문자의 상당히 상이한 음성은 구별할 수 있을 것이라는 점에서 유리하다.
또한, 음성 인식 소프트웨어(128)가 수동으로 입력된 하나 이상의 획에 응답하여 생성된 후보 문자 리스트를 참조하여, 구두 음성으로부터 원하는 문자를 식별할 수 없을지라도, 후보 문자 리스트를 축소시킬 수 있을 것이다. 예컨대, 음성 인식 소프트웨어(128)는 도 4b에 도시된 후보 문자 리스트가 활성인 동안 사용자의 음성 입력에 기반하여 제 2 문자(408b)("허")와 제 3 문자(408c)("워")를 구별하지 못할 수 있다. 그러나, 이 음성 입력은 음성 인식 소프트웨어(128)가 제 1 문자(408a)("니앤")와 제 4 문자(408d)("성")를 삭제하게 할 수 있다. 이에 따라, 도 4d에 도시된 것처럼, 본 발명의 실시예의 수동 입력과 음성 인식의 결합을 통해, 후보 리스트는 리스트(406b)와 같이 제 2 문자(408b)와 제 3 문자(408c)로 축 소될 수 있다. 이어서 사용자는 예컨대, 커서 제어 버튼(208)을 사용하여 문자를 하이라이팅하고, 엔터키(212)를 누름으로써 축소된 리스트(406)로부터 원하는 문자를 선택할 수 있다.
본 명세서에 설명된 본 발명의 실시예에 대한 특정 예는 하나 이상의 원하는 단어 또는 문자의 구성 요소를 키패드 내의 키를 통해 수동으로 입력 및/또는 원하는 단어 또는 문자의 선택을 이용하여 설명되었지만, 본 발명의 실시예는 이것으로 제한되지 않는다. 예컨대, 수동 입력은 터치 스크린 디스플레이로부터 선택하거나, 터치 스트린 디스플레이의 쓰기 영역에 원하는 구성 요소를 씀으로써 실행될 수 있다. 다른 예로서, 단어 또는 문자의 구성 요소 또는 구성 요소들의 초기(또는 후기) 선택은 수동 입력을 통해 실행될 필요는 없다. 이를 테면, 사용자는 원하는 구성 요소의 이름을 발음하여 단어 또는 문자 리스트를 생성하고 이 리스트는 다시 원하는 단어 또는 문자를 발음함으로써 축소될 수 있다. 또한, 본 발명의 실시예는 단어 또는 기호의 "알파벳" 또는 구성 요소가 통상적인 통신 또는 연산 장치 키보드에 쉽게 나타낼 수 없는 임의의 언어로 문자를 입력하고/입력하거나 선택하는 것과 관련된 애플리케이션을 갖는다.
본 발명에 대해 상술한 내용은 도시 및 설명을 위해 기술되었다. 또한, 이 설명은 본 발명을 본 명세서에 개시된 형태로 제한하지는 않는다. 결과적으로, 이상의 설명에 적합한 종래 기술의 변경 및 수정은 본 발명의 범위 내에 존재한다. 이상에 설명된 실시예는 현재 알려진, 본 발명을 실행하는 최상의 모드를 더 설명하고, 당업자가 이러한 또는 다른 실시예에서 본 발명의 특정 애플리케이션 또는 이용에 의해 요구되는 다양한 변경과 함께 본 발명을 이용할 수 있게 한다. 첨부되는 특허 청구 범위는 종래 기술에 의해 허용되는 범위와는 다른 실시예를 포함하는 것으로 해석된다.
본 발명에 따르면, 문자 규정 방법 및 문자 선택 장치를 제공할 수 있다.

Claims (12)

  1. 제 1 문자 구성 요소의 선택을 수신하는 단계와,
    상기 선택된 제 1 구성 요소를 포함하는 제 1 후보 문자 리스트를 생성하는 단계와,
    사용자로부터 제 1 음성 입력을 수신하는 단계와,
    상기 사용자로부터의 상기 제 1 음성 입력을 사용하여 상기 제 1 후보 문자 리스트를 변경하는 단계를 포함하되,
    상기 제 1 후보 문자 리스트를 변경함으로써 제 2 후보 문자 리스트를 생성하는
    문자 규정 방법.
  2. 제 1 항에 있어서,
    상기 제 1 음성 입력은 원하는 문자의 발음에 상응하는 음성을 포함하는
    문자 규정 방법.
  3. 제 2 항에 있어서,
    상기 제 1 후보 문자 리스트 변경 단계는 상기 원하는 문자의 상기 발음에 상응하지 않는 문자를 삭제하는 단계를 포함하는
    문자 규정 방법.
  4. 제 1 항에 있어서,
    사용자로부터 제 2 음성 입력을 수신하는 단계를 더 포함하되,
    상기 제 2 후보 문자 리스트를 변경하고,
    상기 제 2 후보 문자 리스트를 변경함으로써 제 3 후보 문자 리스트를 생성하는
    문자 규정 방법.
  5. 제 1 항에 있어서,
    제 2 문자 구성 요소의 선택을 수신하는 단계와,
    상기 선택된 제 2 구성 요소를 사용하여 상기 제 2 후보 문자 리스트를 변경하는 단계를 더 포함하되,
    상기 제 2 후보 문자 리스트를 변경함으로써 제 3 후보 문자 리스트를 생성하는
    문자 규정 방법.
  6. 제 1 항에 있어서,
    상기 제 2 후보 문자 리스트로부터 상기 문자 중 하나의 선택을 수신하는 단계를 더 포함하는
    문자 규정 방법.
  7. 제 1 항에 있어서,
    상기 제 1 문자 구성 요소는 영어 단어의 제 1 글자 및 중국어 문자의 제 1 획 중 하나를 포함하는
    문자 규정 방법.
  8. 제 7 항에 있어서,
    중국어 문자의 제 2 획의 선택을 수신하는 단계를 더 포함하되,
    상기 제 1 후보 문자 리스트 생성 단계는 상기 선택된 제 1 및 제 2 획을 포함하는 제 1 중국어 문자 리스트를 생성하는 단계를 포함하는
    문자 규정 방법.
  9. 사용자로부터 입력을 수신하는 수단과,
    복수의 문자와 하나 이상의 문자 구성 요소의 연관성을 저장하는 수단과,
    상기 복수의 문자에 포함된 소정의 문자에 대해 임의의 문자와 그 문자의 발음 간의 연관성을 저장하는 수단과,
    제 1 문자 구성 요소를 포함하는 사용자 입력에 응답하여 상기 복수의 문자로부터 선택된 제 1 후보 문자 리스트를 생성하는 수단과,
    원하는 문자의 발음을 포함하는 사용자 입력에 응답하여 상기 제 1 후보 문자 리스트를 변경함으로써 제 2 후보 문자 리스트를 형성하도록 하는 수단을 포함하는
    문자 선택 장치.
  10. 제 9 항에 있어서,
    상기 사용자로부터의 입력 수신 수단은 사용자로부터 수동 입력을 수신하는 수단을 포함하는
    문자 선택 장치.
  11. 제 9 항에 있어서,
    상기 사용자로부터의 입력 수신 수단은 사용자로부터 음성 입력을 수신하는 수단을 포함하는
    문자 선택 장치.
  12. 제 9 항에 있어서,
    사용자에게 영상 출력을 제공하는 수단을 더 포함하되,
    상기 제 1 후보 문자 리스트의 적어도 일부가 표시되는
    문자 선택 장치.
KR1020060058958A 2005-06-28 2006-06-28 문자 규정 방법 및 문자 선택 장치 KR100790700B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/170,302 US20060293890A1 (en) 2005-06-28 2005-06-28 Speech recognition assisted autocompletion of composite characters
US11/170,302 2005-06-28

Publications (2)

Publication Number Publication Date
KR20070001020A KR20070001020A (ko) 2007-01-03
KR100790700B1 true KR100790700B1 (ko) 2008-01-02

Family

ID=37568664

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060058958A KR100790700B1 (ko) 2005-06-28 2006-06-28 문자 규정 방법 및 문자 선택 장치

Country Status (6)

Country Link
US (1) US20060293890A1 (ko)
JP (1) JP2007011358A (ko)
KR (1) KR100790700B1 (ko)
CN (1) CN1892817A (ko)
SG (1) SG128545A1 (ko)
TW (1) TWI296793B (ko)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060143007A1 (en) * 2000-07-24 2006-06-29 Koh V E User interaction with voice information services
US8413069B2 (en) * 2005-06-28 2013-04-02 Avaya Inc. Method and apparatus for the automatic completion of composite characters
US8249873B2 (en) 2005-08-12 2012-08-21 Avaya Inc. Tonal correction of speech
KR100654183B1 (ko) * 2005-11-07 2006-12-08 한국전자통신연구원 음성 인식을 이용한 문자 입력 시스템 및 그 방법
US7991613B2 (en) * 2006-09-29 2011-08-02 Verint Americas Inc. Analyzing audio components and generating text with integrated additional session information
US8457946B2 (en) * 2007-04-26 2013-06-04 Microsoft Corporation Recognition architecture for generating Asian characters
US8504349B2 (en) * 2007-06-18 2013-08-06 Microsoft Corporation Text prediction with partial selection in a variety of domains
US20090287680A1 (en) * 2008-05-14 2009-11-19 Microsoft Corporation Multi-modal query refinement
US20090287064A1 (en) * 2008-05-15 2009-11-19 Medical Interactive Education, Llc Computer implemented cognitive self test
US9542438B2 (en) * 2008-06-17 2017-01-10 Microsoft Technology Licensing, Llc Term complete
US8356041B2 (en) * 2008-06-17 2013-01-15 Microsoft Corporation Phrase builder
JP4645708B2 (ja) * 2008-09-10 2011-03-09 株式会社デンソー コード認識装置および経路探索装置
US8316296B2 (en) * 2008-10-01 2012-11-20 Microsoft Corporation Phrase generation using part(s) of a suggested phrase
US20100149190A1 (en) * 2008-12-11 2010-06-17 Nokia Corporation Method, apparatus and computer program product for providing an input order independent character input mechanism
JP5033843B2 (ja) * 2009-06-30 2012-09-26 クラリオン株式会社 名称検索装置
US8494852B2 (en) 2010-01-05 2013-07-23 Google Inc. Word-level correction of speech input
US20110184736A1 (en) * 2010-01-26 2011-07-28 Benjamin Slotznick Automated method of recognizing inputted information items and selecting information items
WO2011126715A2 (en) * 2010-03-30 2011-10-13 Nvoq Incorporated Hierarchical quick note to allow dictated code phrases to be transcribed to standard clauses
JP5587119B2 (ja) * 2010-09-30 2014-09-10 キヤノン株式会社 文字入力装置、その制御方法、及びプログラム
EP2581816A1 (en) * 2011-10-12 2013-04-17 Research In Motion Limited Apparatus and associated method for modifying media data entered pursuant to a media function
KR101400073B1 (ko) * 2012-07-20 2014-05-28 주식회사 제이엠산업 후보 단어 또는 후보 한자가 제시되는 터치스크린을 이용한 중국어 입력 방법
CN103903618B (zh) * 2012-12-28 2017-08-29 联想(北京)有限公司 一种语音输入方法及电子设备
CN104346052A (zh) * 2013-07-25 2015-02-11 诺基亚公司 用于输入汉字的方法和装置
KR20160056548A (ko) 2014-11-12 2016-05-20 삼성전자주식회사 질의 응답을 위한 디스플레이 장치 및 방법
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
EP3089159B1 (en) 2015-04-28 2019-08-28 Google LLC Correcting voice recognition using selective re-speak
CN104850335B (zh) * 2015-05-28 2018-01-23 瞬联软件科技(北京)有限公司 基于语音输入的表情曲线生成方法
CN104834750B (zh) * 2015-05-28 2018-03-02 瞬联软件科技(北京)有限公司 一种文字曲线生成方法
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US9886433B2 (en) * 2015-10-13 2018-02-06 Lenovo (Singapore) Pte. Ltd. Detecting logograms using multiple inputs
US10049655B1 (en) * 2016-01-05 2018-08-14 Google Llc Biasing voice correction suggestions
US9971758B1 (en) * 2016-01-06 2018-05-15 Google Llc Allowing spelling of arbitrary words
US10446143B2 (en) * 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
WO2017160487A1 (en) * 2016-03-14 2017-09-21 Apple Inc. lDENTIFICATION OF VOICE INPUTS PROVIDING CREDENTIALS
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
CN106873798B (zh) * 2017-02-16 2021-03-19 北京百度网讯科技有限公司 用于输出信息的方法和装置
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
KR20210041007A (ko) 2018-08-29 2021-04-14 유장현 특허 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템
US11810578B2 (en) 2020-05-11 2023-11-07 Apple Inc. Device arbitration for digital assistant-based intercom systems

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050009569A1 (en) 2003-07-07 2005-01-13 Samsung Electronics Co., Ltd. Mobile communication terminal and method for inputting characters by speech recognition

Family Cites Families (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5589198A (en) * 1985-07-31 1996-12-31 943038 Ontario, Inc. Treatment of iodine deficiency diseases
US5258909A (en) * 1989-08-31 1993-11-02 International Business Machines Corporation Method and apparatus for "wrong word" spelling error detection and correction
US5224040A (en) * 1991-03-12 1993-06-29 Tou Julius T Method for translating chinese sentences
EP0607615B1 (en) * 1992-12-28 1999-09-15 Kabushiki Kaisha Toshiba Speech recognition interface system suitable for window systems and speech mail systems
US5561736A (en) * 1993-06-04 1996-10-01 International Business Machines Corporation Three dimensional speech synthesis
US5586198A (en) * 1993-08-24 1996-12-17 Lakritz; David Method and apparatus for identifying characters in ideographic alphabet
JPH0793328A (ja) * 1993-09-24 1995-04-07 Matsushita Electric Ind Co Ltd 綴り不適切訂正装置
JPH0883092A (ja) * 1994-09-14 1996-03-26 Nippon Telegr & Teleph Corp <Ntt> 情報入力装置及び情報入力方法
US5602960A (en) * 1994-09-30 1997-02-11 Apple Computer, Inc. Continuous mandarin chinese speech recognition system having an integrated tone classifier
IL126331A (en) * 1996-03-27 2003-02-12 Michael Hersh Application of multi-media technology to psychological and educational assessment tools
JPH1083195A (ja) * 1996-09-09 1998-03-31 Oki Electric Ind Co Ltd 入力言語認識装置及び入力言語認識方法
US5911129A (en) * 1996-12-13 1999-06-08 Intel Corporation Audio font used for capture and rendering
US6148024A (en) * 1997-03-04 2000-11-14 At&T Corporation FFT-based multitone DPSK modem
US6005498A (en) * 1997-10-29 1999-12-21 Motorola, Inc. Reduced keypad entry apparatus and method
US5995932A (en) * 1997-12-31 1999-11-30 Scientific Learning Corporation Feedback modification for accent reduction
JP3884851B2 (ja) * 1998-01-28 2007-02-21 ユニデン株式会社 通信システムおよびこれに用いられる無線通信端末装置
US7257528B1 (en) * 1998-02-13 2007-08-14 Zi Corporation Of Canada, Inc. Method and apparatus for Chinese character text input
US6081780A (en) * 1998-04-28 2000-06-27 International Business Machines Corporation TTS and prosody based authoring system
US6188983B1 (en) * 1998-09-02 2001-02-13 International Business Machines Corp. Method for dynamically altering text-to-speech (TTS) attributes of a TTS engine not inherently capable of dynamic attribute alteration
US6260015B1 (en) * 1998-09-03 2001-07-10 International Business Machines Corp. Method and interface for correcting speech recognition errors for character languages
US7003463B1 (en) * 1998-10-02 2006-02-21 International Business Machines Corporation System and method for providing network coordinated conversational services
US6801659B1 (en) * 1999-01-04 2004-10-05 Zi Technology Corporation Ltd. Text input system for ideographic and nonideographic languages
JP2000305582A (ja) * 1999-04-23 2000-11-02 Oki Electric Ind Co Ltd 音声合成装置
US20020069058A1 (en) * 1999-07-06 2002-06-06 Guo Jin Multimodal data input device
KR20010019786A (ko) * 1999-08-30 2001-03-15 윤종용 이동통신 시스템에서 음성인식 및 문자표시 장치 및 방법
US6697457B2 (en) * 1999-08-31 2004-02-24 Accenture Llp Voice messaging system that organizes voice messages based on detected emotion
US7165019B1 (en) * 1999-11-05 2007-01-16 Microsoft Corporation Language input architecture for converting one text form to another text form with modeless entry
US6553342B1 (en) * 2000-02-02 2003-04-22 Motorola, Inc. Tone based speech recognition
DE10018134A1 (de) * 2000-04-12 2001-10-18 Siemens Ag Verfahren und Vorrichtung zum Bestimmen prosodischer Markierungen
US6564213B1 (en) * 2000-04-18 2003-05-13 Amazon.Com, Inc. Search query autocompletion
US7280964B2 (en) * 2000-04-21 2007-10-09 Lessac Technologies, Inc. Method of recognizing spoken language with recognition of language color
US6963841B2 (en) * 2000-04-21 2005-11-08 Lessac Technology, Inc. Speech training method with alternative proper pronunciation database
US6775651B1 (en) * 2000-05-26 2004-08-10 International Business Machines Corporation Method of transcribing text from computer voice mail
US7149970B1 (en) * 2000-06-23 2006-12-12 Microsoft Corporation Method and system for filtering and selecting from a candidate list generated by a stochastic input method
US6598021B1 (en) * 2000-07-13 2003-07-22 Craig R. Shambaugh Method of modifying speech to provide a user selectable dialect
TW521266B (en) * 2000-07-13 2003-02-21 Verbaltek Inc Perceptual phonetic feature speech recognition system and method
US6424935B1 (en) * 2000-07-31 2002-07-23 Micron Technology, Inc. Two-way speech recognition and dialect system
CN1187693C (zh) * 2000-09-30 2005-02-02 英特尔公司 以自底向上方式将声调集成到汉语连续语音识别系统中的方法和系统
JP4089148B2 (ja) * 2000-10-17 2008-05-28 株式会社日立製作所 通訳サービス方法および通訳サービス装置
US7478047B2 (en) * 2000-11-03 2009-01-13 Zoesis, Inc. Interactive character system
JP2002189490A (ja) * 2000-12-01 2002-07-05 Leadtek Research Inc ピンイン音声入力の方法
CN1121004C (zh) * 2000-12-21 2003-09-10 国际商业机器公司 用于小键盘的汉字输入方法
US7010490B2 (en) * 2001-01-26 2006-03-07 International Business Machines Corporation Method, system, and apparatus for limiting available selections in a speech recognition system
US7062437B2 (en) * 2001-02-13 2006-06-13 International Business Machines Corporation Audio renderings for expressing non-audio nuances
JP2002244688A (ja) * 2001-02-15 2002-08-30 Sony Computer Entertainment Inc 情報処理方法及び装置、情報伝送システム、情報処理プログラムを情報処理装置に実行させる媒体、情報処理プログラム
US20020133523A1 (en) * 2001-03-16 2002-09-19 Anthony Ambler Multilingual graphic user interface system and method
US6850934B2 (en) * 2001-03-26 2005-02-01 International Business Machines Corporation Adaptive search engine query
US20020152075A1 (en) * 2001-04-16 2002-10-17 Shao-Tsu Kung Composite input method
US20030023426A1 (en) * 2001-06-22 2003-01-30 Zi Technology Corporation Ltd. Japanese language entry mechanism for small keypads
US20030054830A1 (en) * 2001-09-04 2003-03-20 Zi Corporation Navigation system for mobile communication devices
US7075520B2 (en) * 2001-12-12 2006-07-11 Zi Technology Corporation Ltd Key press disambiguation using a keypad of multidirectional keys
US7949513B2 (en) * 2002-01-22 2011-05-24 Zi Corporation Of Canada, Inc. Language module and method for use with text processing devices
JP3762327B2 (ja) * 2002-04-24 2006-04-05 株式会社東芝 音声認識方法および音声認識装置および音声認識プログラム
US7380203B2 (en) * 2002-05-14 2008-05-27 Microsoft Corporation Natural input recognition tool
US7353173B2 (en) * 2002-07-11 2008-04-01 Sony Corporation System and method for Mandarin Chinese speech recognition using an optimized phone set
US7124082B2 (en) * 2002-10-11 2006-10-17 Twisted Innovations Phonetic speech-to-text-to-speech system and method
US7533023B2 (en) * 2003-02-12 2009-05-12 Panasonic Corporation Intermediary speech processor in network environments transforming customized speech parameters
JP2006524856A (ja) * 2003-04-14 2006-11-02 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 自動ダビングをオーディオ・ビジュアル・ストリームに対して行うシステム及び方法
TWI229844B (en) * 2003-05-08 2005-03-21 Acer Inc Recognition method to integrate speech input and handwritten input, and system thereof
US8826137B2 (en) * 2003-08-14 2014-09-02 Freedom Scientific, Inc. Screen reader having concurrent communication of non-textual information
US7088861B2 (en) * 2003-09-16 2006-08-08 America Online, Inc. System and method for chinese input using a joystick
US7398215B2 (en) * 2003-12-24 2008-07-08 Inter-Tel, Inc. Prompt language translation for a telecommunications system
US7363224B2 (en) * 2003-12-30 2008-04-22 Microsoft Corporation Method for entering text
US20050144010A1 (en) * 2003-12-31 2005-06-30 Peng Wen F. Interactive language learning method capable of speech recognition
US7376648B2 (en) * 2004-10-20 2008-05-20 Oracle International Corporation Computer-implemented methods and systems for entering and searching for non-Roman-alphabet characters and related search systems
US7549119B2 (en) * 2004-11-18 2009-06-16 Neopets, Inc. Method and system for filtering website content
US20060122840A1 (en) * 2004-12-07 2006-06-08 David Anderson Tailoring communication from interactive speech enabled and multimodal services
US7466859B2 (en) * 2004-12-30 2008-12-16 Motorola, Inc. Candidate list enhancement for predictive text input in electronic devices
US20060256139A1 (en) * 2005-05-11 2006-11-16 Gikandi David C Predictive text computer simplified keyboard with word and phrase auto-completion (plus text-to-speech and a foreign language translation option)
US8413069B2 (en) * 2005-06-28 2013-04-02 Avaya Inc. Method and apparatus for the automatic completion of composite characters
US20070005363A1 (en) * 2005-06-29 2007-01-04 Microsoft Corporation Location aware multi-modal multi-lingual device
US8249873B2 (en) * 2005-08-12 2012-08-21 Avaya Inc. Tonal correction of speech
US20070050188A1 (en) * 2005-08-26 2007-03-01 Avaya Technology Corp. Tone contour transformation of speech

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050009569A1 (en) 2003-07-07 2005-01-13 Samsung Electronics Co., Ltd. Mobile communication terminal and method for inputting characters by speech recognition

Also Published As

Publication number Publication date
TW200707404A (en) 2007-02-16
CN1892817A (zh) 2007-01-10
TWI296793B (en) 2008-05-11
KR20070001020A (ko) 2007-01-03
JP2007011358A (ja) 2007-01-18
US20060293890A1 (en) 2006-12-28
SG128545A1 (en) 2007-01-30

Similar Documents

Publication Publication Date Title
KR100790700B1 (ko) 문자 규정 방법 및 문자 선택 장치
US8413069B2 (en) Method and apparatus for the automatic completion of composite characters
US20070100619A1 (en) Key usage and text marking in the context of a combined predictive text and speech recognition system
JP5048174B2 (ja) ユーザの発話を認識するための方法及び装置
JP2011254553A (ja) 小型キーパッド用日本語入力メカニズム
JP2006031092A (ja) 音声文字入力プログラム及び携帯端末装置
WO2008010432A1 (fr) dispositif d&#39;interface utilisateur, programme informatique et son support d&#39;enregistrement
KR101819458B1 (ko) 음성 인식 장치 및 시스템
US20090313571A1 (en) Method for customizing data entry for individual text fields
MX2007010947A (es) Metodo y dispositivo para editar textos predictivos.
US20070038456A1 (en) Text inputting device and method employing combination of associated character input method and automatic speech recognition method
US20040176139A1 (en) Method and wireless communication device using voice recognition for entering text characters
US9928084B2 (en) Electronic device and method for activating application
KR100919227B1 (ko) 네비게이션 시스템에 이용되는 음성 인식 방법 및 장치
KR101645674B1 (ko) 자동완성 후보 단어 제공 방법 및 장치
US20090055181A1 (en) Mobile terminal and method of inputting message thereto
US20140081622A1 (en) Information display control apparatus, information display control method, information display control system, and recording medium on which information display control program is recorded
KR100631666B1 (ko) 이동 통신 단말기의 데이터 검색 방법
KR100664144B1 (ko) 이동통신 단말기의 상용구 입력 방법
KR100665820B1 (ko) 이동통신단말기 및 문자입력방법
KR101373206B1 (ko) 음성인식과 영상인식을 이용한 휴대단말기에서의 문서작성방법
KR100608786B1 (ko) 이동 통신 단말기에서의 만능 문자를 이용한 전화번호부검색 방법
KR101424255B1 (ko) 이동통신 단말기 및 이를 위한 문자입력방법
KR20080029144A (ko) 패턴인식을 이용한 메시지 입력방법
KR20060068472A (ko) 이동단말기에서 영문자를 입력하기 위한 방법 및 그 단말기

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee