KR100790700B1

KR100790700B1 - 문자 규정 방법 및 문자 선택 장치

Info

Publication number: KR100790700B1
Application number: KR1020060058958A
Authority: KR
Inventors: 콜린 블래어; 케빈 찬; 크리스토퍼 알 젠틀; 네일 헵워스; 앤드류 더블유 랭
Original assignee: 아바야 테크놀러지 코퍼레이션
Priority date: 2005-06-28
Filing date: 2006-06-28
Publication date: 2008-01-02
Also published as: KR20070001020A; US20060293890A1; TWI296793B; TW200707404A; CN1892817A; SG128545A1; JP2007011358A

Abstract

문자 합성 단어 또는 문자(즉, 소정의 구성 요소를 포함하는 단어 또는 문자)의 자동완성과 관련된 음성 인식이 제공된다. 단어 또는 문자의 구성 요소를 규정하는 사용자 입력에 응답하여, 후보 단어 또는 문자 리스트가 생성된다. 원하는 단어 또는 문자를 발음하는 사용자에 응답하여, 원하는 단어 또는 문자가 선택되거나 후보 단어 또는 문자 리스트가 축소될 수 있다. 그 결과로서, 소정의 글자, 획 또는 단어 형태로 형성되는 단어 또는 문자의 입력은 원하는 단어 또는 문자의 구성 요소의 규정과 원하는 단어 또는 문자의 발음에 해당하는 음성의 결합을 포함하는 사용자 입력에 의해 용이해진다.

Description

문자 규정 방법 및 문자 선택 장치{SPEECH RECOGNITION ASSISTED AUTOCOMPLETION OF COMPOSITE CHARACTERS}

도 1은 본 발명의 실시예에 따른 통신 또는 연산 장치의 구성 요소에 대한 블록도이다.

도 2는 본 발명의 실시예에 따른 통신 장치를 도시한다.

도 3은 본 발명의 실시예에 따른 음성 인식 지원형 자동완성 처리 동작의 측면을 도시하는 흐름도이다.

도 4a 내지 도 4d는 본 발명의 실시예에 따른 예시적인 디스플레이 출력을 도시한다.

도면의 주요 부분에 대한 부호의 설명

104 : 프로세서 108 : 메모리

112 : 사용자 입력 116 : 사용자 출력

120 : 데이터 저장 장치 124 : 동작 시스템 소프트웨어(OS)

128 : 음성 인식 애플리케이션 132 : 문자 선택 애플리케이션

134 : 후보 문자표 136: 통신 네트워크 인터페이스

본 발명은 합성 문자의 입력에 관한 것이다. 특히, 본 발명은 후보 단어 또는 문자 리스트를 한정적으로 제공하도록 수동 사용자 입력과 음성 인식을 결합함으로써 통신 또는 연산 장치로의 단어 또는 문자 입력을 용이하게 한다.

여러 가지 다양한 기능을 수행할 수 있는 이동 통신 및 연산 장치가 사용되고 있다. 점점, 이러한 기능은 문자의 입력을 필요로 하거나 이용할 수 있다. 예컨대, 셀룰러 전화기와 관련하여 사용되는 문자 메시징 서비스는 현재 보편적으로 사용되고 있다. 다른 예로서, 휴대용 장치는 전자 우편 애플리케이션과 관련하여 점점 사용되고 있다. 그러나, 휴대용 장치에서 키보드용으로 이용가능한 공간은 상당히 제한된다. 그러므로, 이러한 장치에 문자를 입력하는 것은 어려울 수 있다. 또한, 대형 데스크톱 통신 또는 연산 장치와 관련하여, 특정 언어로 사용되는 기호는 입력하기가 어려울 수 있다.

특히 휴대 전화기 또는 다른 장치의 제한된 키패드를 사용하여 단어 또는 문자의 입력을 용이하게 하기 위해, 자동완성 특성을 이용할 수 있다. 이러한 특성은 사용자로부터의 초기 입력 세트 수신에 응답하여 후보 단어 또는 문자 리스트를 사용자에게 디스플레이할 수 있다. 이들 입력은 한자처럼, 단어의 처음 몇 글자 또는 문자의 처음 몇 획의 사양을 포함할 수 있다. 그러나, 결과적인 리스트가 상당히 길기 때문에, 사용자가 원하는 단어 또는 문자를 신속하게 찾는 것은 어려울 수 있다.

긴 자동완성 후보 리스트로 인해 발생하는 문제점을 해결하기 위해, 후보 단어 또는 문자가 사용 빈도에 따라 배열되는 리스트를 제공하는 시스템을 이용할 수 있다. 이들의 사용 빈도에 따라 후보를 배치하는 것은 사용자가 전체 후보 리스트를 스크롤링할 필요성을 감소시킬 수 있다. 그러나, 후보 단어 또는 문자 리스트를 상식적인 방법으로 배치하는 것은 어렵다. 또한, 사용자가 특이한 단어 또는 문자를 찾는 중일 경우에, 시간이 절약되거나 단축되지 않을 수 있다.

사용자로부터 수동 입력을 요구하는 것의 대안으로서, 음성 또는 목소리 인식 시스템은 문자를 입력하거나 명령을 내리는 데 이용가능하다. 그러나, 이러한 시스템의 정확성은 흔히 사용자 연습 및 교정 후에도 미흡한 점이 많다. 더욱이, 완전한 형태의 음성 인식 시스템은 흔히 셀룰러 전화기와 같은, 이동 통신 또는 연산 장치에서는 일반적으로 가질 수 없는 처리 및 메모리 리소스를 필요로 한다. 이에 따라, 이동 장치와 관련하여 이용가능한 음성 인식 기능은 흔히 초보적이고, 일반적으로 언어에서 구두 문자의 제한된 서브셋을 인식하는 방향으로 조정된다. 또한, 이동 장치에서의 음성 인식은 주소록을 액세스하여 선택된 번호로 전화를 거는 것과 같은 정해진 명령을 내리는 것으로 흔히 제한된다.

본 발명은 종래 기술의 이들 및 다른 문제점과 단점 해결에 관한 것이다. 본 발명의 실시예에 따라서, 음성 인식은 단어(예컨대 영어 문자와 관련됨) 또는 문자(예컨대 중국어 문자와 관련됨)와 같은 후보 구성 요소 문자 리스트를 제한하거나 필터링 하는 데 사용된다. 특히, 사용자가 글자, 단어의 획 또는 형태, 또는 문자를 수동으로 입력한 후에, 사용자는 그 문자를 발음할 수 있다. 이어서 음성 인식 소프트웨어는 음성이 발음된 단어 또는 문자와 다르게 들리는 단어 또는 문자를 후보 리스트로부터 삭제하도록 시도한다. 이에 따라, 상대적으로 기초적인 음성 인식 애플리케이션도 후보 리스트로부터 적어도 소정의 단어 또는 문자를 적어도 삭제하는 데 효과적일 수 있다. 또한, 구성 요소의 입력 또는 선택을 통해 단어 또는 문자의 글자, 획 또는 다른 구성 요소를 우선 제공함으로써, 이용가능하거나 후보인 단어 또는 문자의 범위는 상당히 좁게 정의되어, 범위를 더 좁히거나(즉, 후보 리스트를 좁힘) 사용자가 입력하고자 하는 단어 또는 문자를 명확하게 식별하기 위해 음성 인식 애플리케이션에 필요한 정확성을 감소시킬 수 있다.

본 발명의 실시예에 따라서, 단어 또는 문자는 원하는 문자에 포함된 글자(예컨대 영어 단어의 경우)나 획 또는 단어 형태(예컨대 한자의 경우)와 같은 단어 또는 문자의 특정 구성 요소를 나타내는 사용자 입력에 응답하여, 사용자에 의해 선택가능한 단어 또는 문자 리스트(본 명세서에서 "문자"로 총괄하여 지칭)에 포함될 수 있다. 또한, 사용자 음성 입력에 응답하여 문자 리스트는 제한될 수 있다. 특히 수신된 음성과 관련된(또는 관련이 없는) 후보 리스트 내의 문자를 식별하는 데 사용될 수 있는 사용자로부터의 음성 입력의 수신에 응답하여, 후보 리스트의 내용이 달라진다. 이에 따라, 줄어든 후보 단어 또는 문자 리스트를 제공하거나, 사용자에 의해 입력된 원하는 문자의 구성 요소와 사용자가 원하는 문자를 발음하는 것을 입력으로서 수신하는 음성 인식을 결합하여 사용함으로써 정확한 문자 식별에 의해 문자의 입력이 용이해진다.

도 1에 있어서, 본 발명에 따른 통신 또는 연산 장치(100)의 구성 요소가 블록도 형태로 도시된다. 이 구성 요소는 프로그램 인스트럭션을 실행할 수 있는 프로세서(104)를 포함할 수 있다. 이에 따라, 프로세서(104)는 임의의 범용 프로그램가능한 프로세서 또는 애플리케이션 프로그래밍을 실행하는 제어기를 포함할 수 있다. 또한, 프로세서(104)는 특별히 구성되는 ASIC(application specific integrated circuit)를 포함할 수 있다. 프로세서(104)는 일반적으로 통신 또는 연산 장치(100)에 의해 실행되는 다양한 기능을 구현하는 프로그래밍 코드를 실행하는 기능을 하되, 본 명세서에 설명된 단어 또는 문자 선택 동작을 포함한다.

통신 또는 연산 장치(100)는 프로세서에 의한 프로그래밍 실행과 관련하여 사용하며, 데이터 또는 프로그램 인스트럭션을 임시 또는 장기간 저장하는 메모리(108)를 더 포함할 수 있다. 메모리(108)는 DRAM 및 SDRAM처럼, 본질적으로 상주하거나 제거할 수 있거나 원격인 고체 상태 메모리를 포함할 수 있다. 프로세서(104)가 제어기를 포함하는 경우에, 메모리(108)는 프로세서(104)에 집적될 수 있다.

또한, 통신 또는 연산 장치(100)는 하나 이상의 사용자 입력(112) 및 하나 이상의 사용자 출력(116)을 포함할 수 있다. 사용자 입력(112)의 예는 키보드, 키 패드, 터치 스크린 입력 및 마이크로폰을 포함한다. 사용자 출력(116)의 예는 스피커, 디스플레이 스크린(터치 스크린 디스플레이 포함) 및 표시등을 포함한다. 또한, 당업자는 사용자 입력(112)이 사용자 출력(116)과 함께 결합하거나 동작할 수 있음을 알 것이다. 이러한 집적형 사용자 입력(112) 및 사용자 출력(116)의 예는 사용자에게 영상 정보를 나타내고 사용자로부터 입력 선택을 모두 수신할 수 있는 터치 스크린 디스플레이이다.

통신 또는 연산 장치(100)는 애플리케이션 프로그래밍 및/또는 데이터를 저장하는 데이터 저장 장치(120)도 포함할 수 있다. 또한, 동작 시스템 소프트웨어(124)는 데이터 저장 장치(120)에 저장될 수 있다. 예컨대, 데이터 저장 장치(120)는 자성 저장 장치, 고체 상태 저장 장치, 광학 저장 장치, 논리 회로 또는 이러한 장치의 임의의 결합을 포함할 수 있다. 데이터 저장 장치(120)에서 보존될 수 있는 프로그램 및 데이터는 데이터 저장 장치(120)의 특정 구현에 따라 소프트웨어, 펌웨어 또는 하드웨어 로직을 포함함을 알 수 있다.

데이터 저장 장치(120)에 저장될 수 있는 애플리케이션의 예는 음성 인식 애플리케이션(128) 및 단어 또는 문자 선택 애플리케이션(132)을 포함한다. 또한, 데이터 저장 장치(120)는 후보 단어 또는 문자의 표 또는 데이터베이스(134)를 포함할 수 있다. 본 명세서에 설명한 것처럼, 음성 인식 애플리케이션(128), 문자 선택 애플리케이션(132) 및/또는 후보 단어 또는 문자의 표(134)는 서로 통합될 수 있고/있거나, 서로 협력하여 동작할 수 있다. 데이터 저장 장치(120)는 통신 및 연산 장치(100)의 다른 기능의 수행과 관련하여 사용되는 애플리케이션 프로그래밍 및 데이터도 포함할 수 있다. 예컨대, 셀룰러 전화기와 같은 통신 및 연산 장치(100)와 관련하여, 데이터 저장 장치는 통신 애플리케이션 소프트웨어를 포함할 수 있다. 다른 예로서, PDA 또는 범용 컴퓨터와 같은 통신 및 연산 장치(100)는 문서 작성 애플리케이션 및 데이터 저장 장치(120)를 포함할 수 있다. 또한, 본 발명의 실시예에 따라서, 음성 인식 애플리케이션(128) 및/또는 문자 선택 애플리케이션(132)은 사용자에 의해 입력되거나 선택된 단어 또는 문자를 입력으로 수신할 수 있는 통신 애플리케이션 소프트웨어, 문서 작성 소프트웨어 또는 다른 애플리케이션과 협력하여 동작할 수 있다.

통신 또는 연산 장치(100)는 하나 이상의 통신 네트워크 인터페이스(136)도 포함할 수 있다. 통신 네트워크 인터페이스의 예는 셀룰러 전화 송수신기, 네트워크 인터페이스 카드, 모뎀, 유선 전화 포트, 직렬 또는 병렬 데이터 포트, 또는 다른 유선 또는 무선 통신 네트워크 인터페이스를 포함한다.

도 2에 있어서, 셀룰러 전화기(200)를 포함하는 통신 또는 연산 장치(100)가 도시된다. 셀룰러 전화기(200)는 일반적으로 숫자 키패드(204), 커서 제어 버튼(208), 엔터 버튼(212) 및 마이크로폰(214)을 포함하는 사용자 입력(112)을 포함한다. 또한, 셀룰러 전화기(200)는 컬러 또는 흑백 LCD와 같은 영상 디스플레이(216)와 스피커(220)를 포함하는 사용자 출력을 포함한다.

본 발명의 실시예에 따라서, 문자 입력 또는 선택 모드시에, 키패드(204)를 통해 사용자에 의해 입력되는 특정 글자, 획 또는 단어 형태를 포함하는 입력에 응답하여, 사용자는 하나 이상의 단어 또는 문자를 포함하는 불완전한 또는 완전한 리스트가 디스플레이 스크린(216)에 표시되게 할 수 있다. 당업자에 의해 알 수 있는 것처럼, 키패드에 포함된 각 키는 소정의 글자 또는 문자 형태뿐만 아니라 다른 기호와도 관련될 수 있다. 이를 테면, 도 2의 예에서 키패드(204)는 3개(간혹 4개)의 글자(224)와 키(2 내지 9)를 연관시킨다. 또한, 도 2의 예에서 키패드(204)는 3개(어떤 경우에는 4개)의 한자 부수 범주(228)를 키(2 내지 9)와 연관시킨다. 당업자에 의해 알 수 있는 것처럼, 예컨대 이러한 부수는 한자 입력을 위해 wubizixing 형태를 기반으로 하는 방법을 사용하여, 완전한 한자를 포함하는 형태를 규정하는 것과 관련하여 선택될 수 있다. 또한, 부수 중 하나의 선택은 연관된 부수를 사용할 수 있게 하여, 사용자가 원하는 특별한 단어 형태를 규정할 수 있게 한다. 이에 따라, 사용자는 원하는 글자 또는 단어와 관련된 키를 여러 번 누르거나 두드림으로써 키패드(204)에 포함된 특정 키와 관련된 글자 또는 문자 형태를 선택할 수 있다.

글자 또는 단어 형태를 선택함으로써 생성된 후보 문자 리스트는 영상 디스플레이(216)에 의해 적어도 일부분 디스플레이된다. 이 리스트가 디스플레이(216)에 전부 알맞게 나타낼 수 없을 만큼 길면, 커서 버튼(208) 또는 기타 입력(112)은 완전한 리스트를 모두 스크롤링하는 데 사용될 수 있다. 커서 버튼(208) 또는 기타 입력(112)은 예컨대 커서 버튼(208) 또는 다른 입력(112)을 사용하여 디스플레이된 리스트 내의 원하는 문자를 하이라이팅하고, 이어서 예컨대 엔터 버튼(212)을 눌러 이 문자를 선택함으로써, 원하는 문자의 선택과 관련하여 사용될 수도 있다. 또한, 본 명세서에 설명되는 것처럼, 후보 문자 리스트는 사용자에 의해 마이크로 폰(214)을 통해 장치(100)에 제공되고 이어서 예컨대, 음성 인식 애플리케이션(128)을 통해 장치(100)에 의해 처리된 음성에 기반하여 축소될 수 있다. 또한, 음성 인식 애플리케이션(128)이 음성 인식 애플리케이션(128) 어휘에 포함될 수 있는 모든 단어를 식별하도록 시도하는 것보다는, 문자 선택 애플리케이션(132)에 의해 생성되는 리스트 내에 포함된 문자를 식별하려고 시도하도록, 음성 인식 애플리케이션(128)은 원하는 문자의 구성 요소를 규정하는 수동 또는 다른 사용자 입력에 응답하여 문자 선택 애플리케이션(132)과 협력하여 기능을 한다.

도 3에 있어서, 본 발명의 실시예에 따른 영어 단어 또는 중국어 문자와 같은 문자에 대해 음성 인식 지원형 자동완성을 제공하는 통신 또는 연산 장치(100)의 동작 측면이 도시된다. 먼저, 단계(300)에서 사용자는 문자 입력 모드에 들어가거나 문자 입력 모드를 선택한다. 예컨대, 장치(100)가 셀룰러 전화기(200)를 포함하면, 문자 입력 모드는 문자 메시징 애플리케이션 또는 모드를 시작하는 것을 포함할 수 있다. 단계(304)에서, 사용자 입력이 단어 또는 문자의 구성 요소(예컨대, 글자, 획 또는 단어 형태)를 수동으로 선택하는 형태로 수신되었는지의 여부를 판단한다. 일반적으로, 본 발명의 실시예는 이러한 사용자로부터의 입력 수신과 관련하여 동작하여, 후보 문자의 초기 리스트를 생성한다. 문자의 구성 요소의 선택을 수신한 후에, 선택된 구성 요소를 포함하는 후보 문자 리스트가 생성된다(단계 308). 이어서 후보 리스트 중 적어도 일부분은 사용자에게 디스플레이된다(단계 312). 당업자에 의해 알 수 있는 것처럼, 후보 문자 리스트는 특히 단일 구성 요소가 지정될 때 상당히 길 수 있다. 이에 따라, 셀룰러 전화기(200)의 LCD(216)와 같은 디스플레이는 후보 리스트의 일부분만 표시할 수도 있다. 항상 후보 리스트의 일부만 표시될 수 있다면, 사용자는 원하는 문자를 검색하기 위해 리스트를 완전히 스크롤링할 수 있다.

이어서 사용자는 음성 입력을 제공함으로써 후보 문자 리스트를 축소하도록 선택할 수 있다. 이에 따라, 이어서 사용자로부터의 음성 입력이 수신되고 후보 문자의 발음과 연관시키거나 나타냄에 따라 인식되었는지의 여부를 판단할 수 있다(단계 320). 특히, 예컨대 마이크로폰(214)을 통해 수신된 음성은 음성 인식 애플리케이션(128)에 의해 분석되어, 후보 문자와 일치할 수 있는 지의 여부를 판단한다. 만일 일치할 수 있으면, 수정된 후보 문자 리스트가 생성된다(단계 324). 당업자에 의해 알 수 있는 것처럼, 기초적인 음성 인식 애플리케이션(128)이라도 특히, 사용자가 입력하기를 원하는 문자에 포함된 하나 이상의 구성 요소의 수신을 통해 리스트가 정해지는 경우, 리스트로부터 단일 문자를 명확하게 식별할 수 있다. 당업자에 의해 역시 알 수 있는 것처럼, 음성 인식 애플리케이션(128)은 특정 문자가 리스트로부터 식별될 수 없을지라도 후보 문자 리스트의 크기를 감소시킬 수 있다. 예컨대, 음성 인식 애플리케이션(128)이 사용자에 의해 입력된 음성을 후보 문자 리스트의 서브셋과 연관시킬 수 있다면, 수정된 리스트는 이 문자의 서브셋을 포함할 수 있다. 이에 따라, 음성 인식 애플리케이션(128)은 구두 음성이 원하는 단어 또는 문자의 구두 음성과 상이한 이들 단어 또는 문자를 후보 리스트로부터 삭제하도록 제공될 수 있다. 이에 따라, 단어 또는 문자를 (적어도 지금 시점에서) 찾기 위해 사용자가 검색해야만 하는 후보 개수가 감소한다. 이어서 수 정된 리스트 중 적어도 일부가 사용자에게 표시된다(단계 328). 수정된 리스트가 LCD(216)와 같은 사용자 출력(116)에 의해 동시에 표시하기에 너무 많은 후보를 포함한다면, 사용자는 이 리스트를 모두 다시 스크롤링할 수 있다.

단계(332)에서, 사용자가 후보 문자 중 하나를 선택하였는지의 여부를 다시 판단할 수 있다. 이 판단은 사용자가 후보 문자 리스트를 생성하기 위해 음성을 제공하지 않았음을 결정한 후 또는 문자의 후보 리스트에 대해 수정된 리스트를 생성한(단계 328) 후에 이루어진다. 만일 사용자가 규정된 문자를 선택하였다면, 과정은 종료한다. 이어서 사용자는 문자 모드를 나갈 수 있거나, 다음 문자를 선택하는 과정을 시작할 수 있다.

만일 사용자가 기록된 문자를 아직 선택하지 않았다면, 과정은 사용자가 추가 글자, 획 또는 단어 형태와 같은 추가 구성 요소를 입력할 수 있는 단계(304)로 돌아갈 수 있다. 이어서 단계(308)에서 생성될 수 있는 문자 리스트는 현재 사용자에 의해 규정된 추가 구성 요소를 반영하는 수정된 문자 리스트를 포함한다. 예컨대, 사용자가 2개의 글자 또는 단어 형태를 규정하였다면, 각 후보 문자에 이들 글자 또는 단어 형태가 요구될 수 있다. 이어서 결과 리스트가 적어도 일부분 표시된다(단계 312). 단계(312)에서 사용자에게 수정된 리스트를 표시한 후에, 사용자는 리스트 내의 후보 문자의 수를 더 감소시키기 위해 음성 입력을 제공하는 다른 시도를 할 수 있다(단계 320). 이와 달리, 단계(332)에서 사용자에 의해 나열된 문자가 선택되지 않으면, 단계(312)에서 사용자는 추가 입력을 원하는 합성 문자의 추가 구성 요소의 형태로 제공하지 않도록 결정할 수 있고, 대신 단계(320)로 진행하여 음성 입력을 제공함으로써 후보 리스트를 축소하는 다른 시도를 할 수 있다. 만일 추가 음성 입력이 제공되면, 그 입력은 후보 문자 리스트를 생성(단계 324)하는 데 사용되고, 그 수정된 리스트는 사용자에게 적어도 일부분 표시될 수 있다(단계 328). 이에 따라, 단어 또는 문자의 구성 요소를 지정하고/지정하거나 음성을 제공하여 원하는 단어 또는 문자를 식별하거나 후보 리스트의 크기를 적어도 감소시키는 다수의 반복이 실행될 수 있음을 알 수 있다.

도 4a 내지 도 4c에 있어서, 본 발명의 실시예의 동작과 관련하여 사용자에게 제공될 수 있는 영상 출력의 예가 도시된다. 특히, 중국어 문자 입력 모드의 셀룰러 전화기(200)를 포함하는 장치(100)의 디스플레이 스크린(216)이 도시된다. 도 4a에 도시된 것처럼, 사용자는 원하는 문자의 하나 이상의 획(404)을 선택할 수 있다. 획(404)의 선택은 사용자가 규정하기를 원하는 문자를 형성하는 제 1 획과 관련된, 키보드(204)에 포함된 키를 누름으로써 실행될 수 있다.

한자가 8개의 기본 획으로 형성되고, 수천 개의 한자가 사용되므로, 원하는 문자의 두 획을 지정하는 것은 전형적으로 긴 후보 문자 리스트를 생성한다. 본 예에 명시된 획(404)으로 시작되는 후보 문자(408a 내지 408d)의 불완전한 리스트(406a)는 도 4b에 도시된다. 제 1 문자(408a)는 대략 "니앤"으로 발음되고, 제 2 문자(408b)는 대략 "허"로 발음되며, 제 3 문자(408c)는 대략 "워"로 발음되고, 제 4 문자(408d)는 대략 "성"으로 발음된다. 이 리스트로부터, 사용자는 제 3 문자(408c)를 원할 수 있다. 본 발명의 실시예에 따라서, 사용자는 원하는 문자를 발음함으로써 후보 리스트로부터 이를 선택할 수 있다. 이에 따라, 도 4c에 도시 된 것처럼, 사용자는 제 3 문자(408c)를 발음하여 리스트가 이 문자(408c)만 포함하도록 변경되게 한다. 이어서 사용자는 엔터키(212)를 누르거나 이와 다른 방법으로 이 문자의 선택을 입력함으로써, 셀룰러 전화기(200)와 관련하거나 셀룰러 전화기에서 작동하는 음성 인식 애플리케이션(128)이 이 문자에 맞춰 리스트를 정확히 축소하였는지를 확인한다. 그러므로, 본 발명의 실시예에 따라서 문자의 구성 요소의 수동 입력과 음성 인식 동작은 사용자가 다수의 획으로 이루어진 문자를 쉽게 선택하도록 결합하여 동작한다. 또한, 이것은 이들 획 중 적어도 하나를 입력하고, 이어서 원하는 문자를 발음함으로써 간단히 달성될 수 있다. 이 결합은 음성 인식 애플리케이션(128)이 이 문자의 구두 음성으로부터 오로지 원하는 문자만 식별할 정도로 정확하지 않을지라도, 유사하게 보이는 문자의 상당히 상이한 음성은 구별할 수 있을 것이라는 점에서 유리하다.

또한, 음성 인식 소프트웨어(128)가 수동으로 입력된 하나 이상의 획에 응답하여 생성된 후보 문자 리스트를 참조하여, 구두 음성으로부터 원하는 문자를 식별할 수 없을지라도, 후보 문자 리스트를 축소시킬 수 있을 것이다. 예컨대, 음성 인식 소프트웨어(128)는 도 4b에 도시된 후보 문자 리스트가 활성인 동안 사용자의 음성 입력에 기반하여 제 2 문자(408b)("허")와 제 3 문자(408c)("워")를 구별하지 못할 수 있다. 그러나, 이 음성 입력은 음성 인식 소프트웨어(128)가 제 1 문자(408a)("니앤")와 제 4 문자(408d)("성")를 삭제하게 할 수 있다. 이에 따라, 도 4d에 도시된 것처럼, 본 발명의 실시예의 수동 입력과 음성 인식의 결합을 통해, 후보 리스트는 리스트(406b)와 같이 제 2 문자(408b)와 제 3 문자(408c)로 축 소될 수 있다. 이어서 사용자는 예컨대, 커서 제어 버튼(208)을 사용하여 문자를 하이라이팅하고, 엔터키(212)를 누름으로써 축소된 리스트(406)로부터 원하는 문자를 선택할 수 있다.

본 명세서에 설명된 본 발명의 실시예에 대한 특정 예는 하나 이상의 원하는 단어 또는 문자의 구성 요소를 키패드 내의 키를 통해 수동으로 입력 및/또는 원하는 단어 또는 문자의 선택을 이용하여 설명되었지만, 본 발명의 실시예는 이것으로 제한되지 않는다. 예컨대, 수동 입력은 터치 스크린 디스플레이로부터 선택하거나, 터치 스트린 디스플레이의 쓰기 영역에 원하는 구성 요소를 씀으로써 실행될 수 있다. 다른 예로서, 단어 또는 문자의 구성 요소 또는 구성 요소들의 초기(또는 후기) 선택은 수동 입력을 통해 실행될 필요는 없다. 이를 테면, 사용자는 원하는 구성 요소의 이름을 발음하여 단어 또는 문자 리스트를 생성하고 이 리스트는 다시 원하는 단어 또는 문자를 발음함으로써 축소될 수 있다. 또한, 본 발명의 실시예는 단어 또는 기호의 "알파벳" 또는 구성 요소가 통상적인 통신 또는 연산 장치 키보드에 쉽게 나타낼 수 없는 임의의 언어로 문자를 입력하고/입력하거나 선택하는 것과 관련된 애플리케이션을 갖는다.

본 발명에 대해 상술한 내용은 도시 및 설명을 위해 기술되었다. 또한, 이 설명은 본 발명을 본 명세서에 개시된 형태로 제한하지는 않는다. 결과적으로, 이상의 설명에 적합한 종래 기술의 변경 및 수정은 본 발명의 범위 내에 존재한다. 이상에 설명된 실시예는 현재 알려진, 본 발명을 실행하는 최상의 모드를 더 설명하고, 당업자가 이러한 또는 다른 실시예에서 본 발명의 특정 애플리케이션 또는 이용에 의해 요구되는 다양한 변경과 함께 본 발명을 이용할 수 있게 한다. 첨부되는 특허 청구 범위는 종래 기술에 의해 허용되는 범위와는 다른 실시예를 포함하는 것으로 해석된다.

본 발명에 따르면, 문자 규정 방법 및 문자 선택 장치를 제공할 수 있다.

Claims

제 1 문자 구성 요소의 선택을 수신하는 단계와,

상기 선택된 제 1 구성 요소를 포함하는 제 1 후보 문자 리스트를 생성하는 단계와,

사용자로부터 제 1 음성 입력을 수신하는 단계와,

상기 사용자로부터의 상기 제 1 음성 입력을 사용하여 상기 제 1 후보 문자 리스트를 변경하는 단계를 포함하되,

상기 제 1 후보 문자 리스트를 변경함으로써 제 2 후보 문자 리스트를 생성하는

문자 규정 방법.
제 1 항에 있어서,

상기 제 1 음성 입력은 원하는 문자의 발음에 상응하는 음성을 포함하는

문자 규정 방법.
제 2 항에 있어서,

상기 제 1 후보 문자 리스트 변경 단계는 상기 원하는 문자의 상기 발음에 상응하지 않는 문자를 삭제하는 단계를 포함하는

문자 규정 방법.
제 1 항에 있어서,

사용자로부터 제 2 음성 입력을 수신하는 단계를 더 포함하되,

상기 제 2 후보 문자 리스트를 변경하고,

상기 제 2 후보 문자 리스트를 변경함으로써 제 3 후보 문자 리스트를 생성하는

문자 규정 방법.
제 1 항에 있어서,

제 2 문자 구성 요소의 선택을 수신하는 단계와,

상기 선택된 제 2 구성 요소를 사용하여 상기 제 2 후보 문자 리스트를 변경하는 단계를 더 포함하되,

상기 제 2 후보 문자 리스트를 변경함으로써 제 3 후보 문자 리스트를 생성하는

문자 규정 방법.
제 1 항에 있어서,

상기 제 2 후보 문자 리스트로부터 상기 문자 중 하나의 선택을 수신하는 단계를 더 포함하는

문자 규정 방법.
제 1 항에 있어서,

상기 제 1 문자 구성 요소는 영어 단어의 제 1 글자 및 중국어 문자의 제 1 획 중 하나를 포함하는

문자 규정 방법.
제 7 항에 있어서,

중국어 문자의 제 2 획의 선택을 수신하는 단계를 더 포함하되,

상기 제 1 후보 문자 리스트 생성 단계는 상기 선택된 제 1 및 제 2 획을 포함하는 제 1 중국어 문자 리스트를 생성하는 단계를 포함하는

문자 규정 방법.
사용자로부터 입력을 수신하는 수단과,

복수의 문자와 하나 이상의 문자 구성 요소의 연관성을 저장하는 수단과,

상기 복수의 문자에 포함된 소정의 문자에 대해 임의의 문자와 그 문자의 발음 간의 연관성을 저장하는 수단과,

제 1 문자 구성 요소를 포함하는 사용자 입력에 응답하여 상기 복수의 문자로부터 선택된 제 1 후보 문자 리스트를 생성하는 수단과,

원하는 문자의 발음을 포함하는 사용자 입력에 응답하여 상기 제 1 후보 문자 리스트를 변경함으로써 제 2 후보 문자 리스트를 형성하도록 하는 수단을 포함하는

문자 선택 장치.
제 9 항에 있어서,

상기 사용자로부터의 입력 수신 수단은 사용자로부터 수동 입력을 수신하는 수단을 포함하는

문자 선택 장치.
제 9 항에 있어서,

상기 사용자로부터의 입력 수신 수단은 사용자로부터 음성 입력을 수신하는 수단을 포함하는

문자 선택 장치.
제 9 항에 있어서,

사용자에게 영상 출력을 제공하는 수단을 더 포함하되,

상기 제 1 후보 문자 리스트의 적어도 일부가 표시되는

문자 선택 장치.