KR100656736B1 - 표음 입력 모호성 제거 시스템 및 방법 - Google Patents

표음 입력 모호성 제거 시스템 및 방법 Download PDF

Info

Publication number
KR100656736B1
KR100656736B1 KR1020040060068A KR20040060068A KR100656736B1 KR 100656736 B1 KR100656736 B1 KR 100656736B1 KR 1020040060068 A KR1020040060068 A KR 1020040060068A KR 20040060068 A KR20040060068 A KR 20040060068A KR 100656736 B1 KR100656736 B1 KR 100656736B1
Authority
KR
South Korea
Prior art keywords
sequence
phonetic
input
sequences
character
Prior art date
Application number
KR1020040060068A
Other languages
English (en)
Other versions
KR20050014738A (ko
Inventor
지안차오 유
제니휴앙-유 라이
리안 헤
핌 반메우르스
경청 웅
루 짱
Original Assignee
에이오엘 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/631,543 external-priority patent/US7395203B2/en
Application filed by 에이오엘 엘엘씨 filed Critical 에이오엘 엘엘씨
Publication of KR20050014738A publication Critical patent/KR20050014738A/ko
Application granted granted Critical
Publication of KR100656736B1 publication Critical patent/KR100656736B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/187Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/268Lexical context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

본 발명은 축소형 키보드에서 표음 기반 또는 스트로크 기반의 입력 방법을 이용하여 중국어 문자를 입력하기 위한 시스템 및 방법에 관한 것이다. 표의 문자에 공통 인덱스를 도입함으로써, 상기 시스템은 표의 문자가 표음 기반의 입력 방법 및 스트로크 기반의 입력 방법과 같은 상이한 유형의 입력 방법들 중에서 공유되도록 허용한다. 상기 시스템은 입력 시퀀스를 표음 또는 스트로크 인덱스와 같은 입력 방법 특정 인덱스에 매칭시킨다. 이들 입력 방법 특정 인덱스는 그 다음에 표의 문자에 대한 인덱스로 변환되고, 이것은 그 다음에 표의 문자를 검색하는데 사용된다.

Description

표음 입력 모호성 제거 시스템 및 방법{SYSTEM AND METHOD FOR DISAMBIGUATING PHONETIC INPUT}
도 1은 종래 기술에 따른 병음 음절들(Pinyin syllables) 간의 구획 문자(delimiters)를 이용하여 중국어 문자를 입력하기 위한 키보드 배치를 도시한 개략도.
도 2는 본 발명에 따른, 축소형 키보드(reduced keyboard) 모호성 제거(disambiguating) 시스템을 내장하는 셀룰러 전화기, 또는 보다 구체적으로는 표음(phonetic) 입력 방법의 예시적인 실시예의 개략도.
도 3은 중국어 구(phrase)를 입력하는 동안 음조(tones)가 병음 철자로 사용되는 예시적인 디스플레이를 도시한 개략도.
도 4는 도 2의 축소형 키보드 모호성 제거 시스템을 도시한 블록도.
도 5는 중국어 단어 모듈의 바람직한 트리 구조를 도시한 개략도.
도 6은 키 프레스(key press)의 리스트가 주어진 단어 모듈로부터 병음 철자를 검색하기 위한 소프트웨어 프로세스의 바람직한 실시예를 도시한 흐름도.
도 7은 단일 키 프레스가 주어진 단어 모듈의 트리 구조를 고찰하기 위한 소프트웨어 프로세스의 일실시예를 도시한 흐름도.
도 8은 사전에 구축되어 있는 노드 경로에 대해 병음 철자를 구축하기 위한 소프트웨어 프로세스의 일실시예를 도시한 흐름도.
도 9는 선택된 병음 철자에 대한 중국어 구 리스트를 구축하기 위한 소프트웨어 프로세스의 일실시예를 도시한 흐름도.
도 10은 병음 철자를 대응하는 중국어 구 리스트로 변환시키기 위한 소프트웨어 프로세스의 일실시예를 도시한 흐름도.
도 11은 본 발명의 바람직한 일실시예에 따른, 사용자에 의해 입력된 모호한 입력 시퀀스를 모호하지 않게 하고 원문 출력을 중국어로 발생시키는 시스템을 도시한 블록도.
도 12는 본 발명의 바람직한 일실시예에 따른, 사용자 입력 장치에 내장된 표의 문자 언어 텍스트 입력 시스템을 도시한 블록도.
도 13은 본 발명의 바람직한 일실시예에 따른, 사용자에 의해 입력된 모호한 입력 시퀀스를 모호하지 않게 하고 중국어로 원문 출력을 발생시키는 방법을 도시한 흐름도.
도 14는 본 발명의 바람직한 일실시예에 따른, 중국어로 원문 출력을 발생시키기 위한 표음 기반(phonetic-based) 및 스트로크 기반(stroke-based)의 입력 방법을 지원하는 시스템을 도시한 블록도.
도 15는 도 14의 시스템을 이용하여 중국어로 원문 출력을 발생시키는 방법을 도시한 흐름도.
도 16은 본 발명의 바람직한 일실시예에 따른 중국어로 원문 출력을 발생시 키는 표음 입력 방법을 도시한 흐름도.
도면의 주요 부분에 대한 부호의 설명
53 : 디스플레이
54 : 키보드
102 : 스피커
104 : 메모리
106 : 운영 체제
108 : 모호성 제거 소프트웨어
110 : 중국어 어휘 모듈
112, 114 : 애플리케이션 프로그램
1110 : 사용자 입력 장치
1120 : 표음 시퀀스 DB
1130 : 표의 문자 DB
1140 : 표음 매칭 수단
1150 : 표의 문자 매칭 수단
1160 : 출력 장치
1205 : 사용자 입력 장치
1210 : 입력부
1220 : 선택 입력부
1240 : 디스플레이
1250 : 프로세서
1252 : 식별 수단
1254 : 출력 수단
1256 : 선택 수단
본 발명은 일반적으로 중국어 입력 기법에 관한 것이다. 보다 구체적으로는, 본 발명은 표음 입력을 모호하지 않게 하고 중국어 문자들 및 구들을 입력하는 시스템 및 방법에 관한 것이다.
수년간 키보드 사이즈는 소형의 휴대용 컴퓨터를 설계하고 제조하고자 하는데 있어서 주요한 사이즈 제한 요인이었는데, 그 이유는 표준 타자기 사이즈의 키가 사용되면, 휴대용 컴퓨터는 적어도 키보드만큼은 커야되기 때문이었다. 비록 다양한 소형의 키보드가 휴대용 컴퓨터에 사용되었지만, 이들은 너무 작아서 통상의 사용자가 쉽고 신속하게 조작할 수 없는 것으로 확인되었다.
휴대용 컴퓨터에 풀사이즈의 키보드를 내장하면, 또한 컴퓨터의 진정한 휴대용 사용이 방해받는다. 대부분의 휴대용 컴퓨터는 사용자가 양손으로 타이핑하도록 컴퓨터를 실질적으로 평탄한 작업면 상에 두지 않으면 동작할 수가 없다. 사용자는 서 있거나 또는 이동 중에 휴대용 컴퓨터를 쉽게 사용할 수 없다. 최근 개인 용 디지털 보조 장치(PDA)라고 하는 소형의 휴대용 컴퓨터 또는 팜 사이즈의(palm-sized) 컴퓨터의 발생으로, 제조업체들은 장치 내에 수기(handwriting) 인식 소프트웨어를 내장함으로써 이 문제를 해결하고자 시도하였다. 사용자들은 처치 감지(touch-sensitive) 패널 또는 스크린 상에 기록에 의해 텍스트를 직접 입력할 수도 있다. 손으로 쓴 이 텍스트는 그 다음에 인식 소프트웨어에 의해 디지털 데이터로 변환된다. 불행히도, 펜으로 기록하거나 또는 인쇄하는 것은 일반적으로 타이핑보다 느리다는 사실 외에도 수기 인식 소프트웨어의 정확도 및 속도는 지금까지 만족스럽지 못하였다. 중국어의 경우에, 많은 수의 복잡한 문자들로 인해 이 문제는 특히 어렵게 된다. 설상가상으로, 오늘날 텍스트 입력을 요구하는 핸드헬드(handheld) 컴퓨팅 장치는 더 작아지고 있다. 양방향 페이징, 셀룰러 전화기 및 기타 휴대용 무선 기술에서의 최근의 진보로 인해, 소형의 휴대용 양방향 메시징 시스템, 특히 전자 메일(e-mail)을 송신 및 수신할 수 있는 시스템에 대한 요구가 발생했다.
병음 입력 방법은, 1958년 중화 인민 공화국에 의해 도입된 중국어에 대한 음절을 형성하는 사운드의 공식 체계(official system)인 병음(Pinyin)에 기초하여 가장 최근에 사용된 중국어 문자 입력 방법 중 하나이다. 이것은 5000년 전통의 중국어 기록 체계에 추가적인 것이다. 병음은 많은 다른 방식으로 사용된다. 예를 들면, 언어 학습자에 대해서는 발음 도구로서 사용되고, 색인 시스템에 사용되며, 중국어 문자들을 컴퓨터에 입력하는데 사용된다. 병음 시스템은 표준 라틴 알파벳을 채택하며, 중국어 음절의 머리글자(initial), 끝 문자(final)(ending sound) 및 음조(tones)로의 전통적인 중국어 분석을 취한다.
만다린(mandarin) 중국어는 대부분의 언어들 내에 발견되는 자음을 갖는다. 예를 들면, b, p, m, f, d, t, n, l, g, k, h는 영어에 상당히 가깝다. 반전음(retroflex sounds) zh, ch, sh 및 r과, 구개음(palatal sounds) j, q 및 x와, 치음(dental sounds) z, c 및 s와 같은 다른 시작음들(initial sounds)은 영어 또는 라틴어 발음과 다르다. 표 1은 병음 체계에 따른 모든 시작음을 나열하고 있다.
표 1. 시작음
시작음 발음 샘플
그룹I: 영어에서와 동일한 발음
M Man
N No
L Letter
F From
S Sun
W Woman
Y Yes
그룹 Ⅱ: 영어 발음과 약간 다름
P Pun 숨을 강하게 훅 분다
K Cola 숨을 강하게 훅 분다
T Tongue 숨을 강하게 훅 분다
B Bum 숨을 불지 않는다
D Dung 숨을 불지 않는다
G Good 숨을 불지 않는다
H Hot 영어에서보다 약간 더 많은 기식음을 사용한다
그룹 Ⅲ: 영어 발음과 다름
ZH Jeweler
CH ZH에서와 같이 하되 숨을 강하게 훅분다
SH Shoe
R Run
C "it's high"에서 "ts"와 유사하게, 그러나 숨을 강하게 훅 분다
J Jeff
Q "Cheese"에서의 "ch"에 가깝다
X "sheep"에서의 "sh"에 가깝다
끝 문자(final)는 시작음과 연결되어 중국어 문자(zi: 字)에 대응하는 병음 음절을 생성한다. 중국어 구(chinese phrase)(ci: 口)는 항상 둘 이상의 중국어 문자로 이루어진다. 표 2는 병음 체계에 따른 모든 최종음(final)을 나열하며, 표 3은 첫 문자와 끝 문자의 결합을 도시한 일부 예를 나타낸다.
표 2. 최종(종료)음
최종음 발음 샘플
a father
an "Anne"의 음과 유사
ang "g"를 추가한 "an"음과 유사
ai "high"
ao "how"
ar "bar"
o "aw"와 유사
ou "low"의 "ow"와 유사
ong "oo"음을 약간 갖는 "jungle"의 "ung"와 유사
e "uh"와 유사한 음
en "under"의 "un"과 유사
eng "lung"의 "ung"와 유사
ei "eight"의 "ei"와 유사
er "herd"의 "er"과 유사
i "machine"의 "i"와 유사
in "bin"
ing "sing"
u "loop"의 "oo"와 유사
un "fun"
표 3. 처음 문자와 끝 문자(ending)의 결합
병음 발음 샘플
Ni "knee"와 유사
Hao 약간의 기식음을 갖는 "how"와 유사
Dong "doong"와 유사
Qi "Chee"와 유사
Gong "Gung"와 유사
Tai "Tie"와 유사
Ji "Gee"와 유사
Quan "Chwan"와 유사
각각의 병음 발음은 5 개의 음조(네 개의 조정된 음조와 "음조가 없는(toneless)" 음조) 중 하나를 갖는다. 음조는 단어의 의미에 중요하다. 이들 음조를 갖는 이유는 아마도 중국어가 음절(약 400 개)을 아주 적게 갖기 때문이다(한편 영어는 약 12,000 개를 갖는다). 이러한 이유로, 중국어에는 대부분의 다른 언어들보다 보다 많은 동음 이의어(homophonic words), 즉, 음이 동일하고 상이한 의미를 나타내는 단어가 존재한다. 분명히 음조들은 비교적 적은 수의 음절이 배가되도록 하여 상기 문제를 경감되도록 하지만 이를 완전히 해결하지는 못한다. 영어에는 이러한 음조들의 개념에 대응하는 개념이 없다. 영어에는, 문장의 부정확한 억양(inflection)이 문장을 이해하기 어렵게 할 수 있다. 그러나, 중국어에서는 하나의 단어의 어조(intonation)가 그 의미를 완전히 변화시킬 수 있다. 예를 들면, 음절 "da"는 "무엇인가를 태운다"는 것을 의미하는 제 1 음조(da1)의 搭와, "답하다"는 의미의 제 2 음조(da2)의 答과, "때린다"는 의미의 제 3 음조(da3)의 打와, "크다"는 의미의 제 4 음조(da4)의 大와 같은 여러 가지 문자들을 나타낼 수도 있다. 각각의 음절 다음의 번호는 음조를 나타낸다. 음조들은 또한
Figure 112004050589476-pat00017
·
Figure 112004050589476-pat00018
·
Figure 112004050589476-pat00019
·
Figure 112004050589476-pat00020
와 같은 마크로 표시된다. 표 4는 음절 "da"에 대한 다섯 개의 음조의 설명을 나타낸다.
표 4. 5 개의 음조
음조 마크 설명
첫째
Figure 112004050589476-pat00021
고 레벨
둘째
Figure 112004050589476-pat00022
중간 음조에서 시작하여 최고음으로 상승
세째
Figure 112004050589476-pat00023
저음에서 시작하여 최저음까지 내려갔다가 최고음으로 상승
네째
Figure 112004050589476-pat00024
최고음에서 시작하여 바닥으로 급강하
중성(neutral) da 강세 없는 단조음
병음 체계를 이용하여 중국어 문자를 입력하기 위해서, 사용자는 문자의 병음 철자에 대응하는 영문자를 선택한다. 예를 들면, 표준 QWERTY 키보드 상에서, 사용자가 "ni"의 병음을 갖는 중국어 문자를 원하는 경우, 사용자는 "N" 키와 그 다음에 "I" 키를 누를 필요가 있다. "N" 키와 "I" 키가 눌러진 후, 병음 철자 "NI"와 관련된 중국어 문자 리스트가 표시된다. 그러면, 사용자는 그 리스트로부터 원하는 문자를 선택한다. 본 명세서에서 이 방법은 기본 병음 입력 방법이라 지칭된다.
도 1에 도시된 바와 같은 축소형 키보드 시스템에서, 각각의 키는 표 1 및 표 2에 도시된 바와 같은 각각의 병음 음절에 대응하는 라틴어 알파벳의 하나 이상의 문자와 관련된다. 따라서, 입력 키스트로크 순서에 대응하는 올바른 병음 철자를 결정하기 위해 모호성 제거 방법이 필요하다.
모호한 키스트로크 순서에 대응하는 올바른 문자 시퀀스를 결정하기 위한 많은 제안된 방법이, Journal of the International Society for Augmentative and Alternative Communication에서 출판된 John L. Arnott 및 Muhammad Y. Javad의 논문 "Probabilistic Character Disambiguation for Reduced Keyboards Using Small Text Samples"(이하에서는 Arnott라고 함)에 요약되어 있다. Arnott는 대부분의 모호성 제거 방법이 관련 언어 내의 문자 시퀀스에 대한 기지의 통계를 이용하여 주어진 문맥 내의 모호성을 해결한다는 점에 주목한다. 즉, 기존의 모호성 제거 시스템은, 사용자에 의해 키스트로크가 입력되어 키스트로크의 적절한 해석을 결정할 때 모호한 키스트로크 그룹핑을 통계적으로 분석한다. Arnott는 또한 여러 개의 모호성 제거 시스템이 축소형 키보드로부터 텍스트를 디코딩하기 위해 단어 레벨의 모호성 제거를 이용하려고 시도했다는 사실에 주목한다. 단어 레벨의 모호성 제거 프로세스는 단어의 끝을 나타내는 모호하지 않은 문자의 수신 후에 수신된 키스트로크의 전체 순서를 사전 내의 가능한 매칭들과 비교함으로써 단어를 완성한다. Arnott는 단어 레벨의 모호성 제거의 여러 가지 문제점을 지적한다. 예를 들면, 단어 레벨의 모호성 제거는 흔히, 드문 단어들을 식별하는데 있어서의 한계와 사전에 포함되어 있지 않는 단어들을 디코딩할 수 없다는 점으로 인해 단어를 정확하게 디코딩하는데 실패한다. 디코딩의 한계로 인해, 단어 레벨의 모호성 제거는 문자당 하나의 키스트로크의 효율을 갖는 자유로운 영문의 디코딩을 오류없이 제공하지 못한다. 따라서, Arnott는 단어 레벨의 모호성 제거보다는 문자 레벨의 모호성 제거에 전렴하여, 문자 레벨의 모호성 제거가 가장 유망한 모호성 제거 기법임을 보여준다.
또 다른 제안된 방법은 1982년 Academic Press에서 출판된 I. El. Witten의 Principles of Computer Speech(이하에서는 Witten이라 함)에 개시되어 있다. Witten은 전화기의 터치 패드를 이용하여 입력된 텍스트로부터 모호성을 감소시키는 시스템을 논의한다. Witten은 24,500 단어의 영어 사전에서 단어의 약 92%에 대해서, 키스트로크 순서를 사전과 비교할 때 아무런 모호성이 발생하지 않는다는 사실을 인식하였다. 그러나, 모호성이 발생하는 경우, Witten은 이들이 사용자에게 모호성을 제공하고 사용자에게 모호한 입력 리스트 중에서 선택을 하도록 요구하는 시스템에 의해 대화식으로 해결되어야 한다는 것을 지적한다. 따라서 사용자 는 각 단어의 끝에서 시스템의 예측에 응답해야 한다. 이러한 응답은 시스템의 효율을 떨어뜨리고 주어진 텍스트의 일부분을 입력하는데 요구된 키스트로크의 수를 증가시킨다.
모호한 키스트로크 순서를 모호하지 않게 하는 것은 여전히 힘든 문제이다. 위에서 논의한 간행물들에서 알 수 있듯이, 텍스트의 일부를 입력하는데 요구된 키스트로크의 수를 최소화하는 기존의 해법은 휴대용 컴퓨터에 사용하기에 적합하도록 필요한 효율성을 획득하는데 실패하였다. 따라서, 사용자 인터페이스를 이해하기 쉽고 간단한 환경에서, 필요한 키스트로크의 총 수를 최소화하면서 입력된 키스트로크의 모호성을 해결하는 모호성 제거 시스템을 개발하는 것이 바람직하다. 따라서 그러한 시스템은 텍스트 입력의 효율을 최대화할 것이다.
파이브 스트로크(five-stroke) 입력 방법은 중국어 문자를 입력하는데 사용되는 다른 가장 일반적인 방법이다. 파이브 스트로크는 발음 외에 다른 문자들의 구조 또는 형상에 기초하는 형상 기반형 입력 방법이다. 파이브 스트로크 입력 방법 뒤의 주 개념은, 문자들이 어근들을 결합시킴으로써 구축될 수 있다는 것이다. 파이브 스트로크 방법은 200개의 어근(radical or root)을 중국어 기록 체계 내의 5 개 유형의 문자 스트로크, 즉 (lateral, vertical, left sweep, dot/right sweep and bend)에 대응하는 다섯 부분에 할당한다.
즉, 파이브 스트로크 입력 방법은 어근 집합 및 키보드를 각각의 문자를 기록하는데 사용된 첫 번째 스트로크의 형상에 따라서 다섯 개의 주 카테고리로 분할한다. 각각의 다섯 어근은 다섯 개의 레벨로 더 분할된다. 그 결과의 25 개의 어 근 카테고리는 키보드 상의 25 개의 키(A-Y)에 할당된다.
사용자는 코드표에서 임의의 문자를 입력하기 위해 기껏해야 네 개의 키스트로크를 필요로 하며, 가장 빈번하게 사용된 600개의 문자는 단지 하나 또는 두 개의 키스트로크만 요구한다. 사용자는 어느 어근이 각각의 키에 할당되는지 알아야 하지만, 일단 그 배열을 기억하면, 사용자는 신속하고 정확하게 타이핑할 수 있다.
병음 입력 방법 및 파이브 스트로크 입력 방법은 모두 중국어 문자 및 구들을 입력하는 널리 사용된 입력 방법이므로, 시스템이 두 입력 방법을 모두 지원하는 것이 일반적인 시장 요구이다. 그러나, 표음 기반의 입력 방법과 스트로크 기반의 입력 방법의 선천적인 차이로 인해, 각각의 입력 방법에 상이한 데이터 세트가 요구될 것이다. 데이터의 사이즈는 일반적으로 매우 크며, 때론 특정 입력 방법인 하나 이상의 데이터 세트를 지원하는 것이 어렵다. 이것은 축소형 키보드 시스템과 같은 용량이 제한된 장치에서는 특히 그러하다.
중국어에 대한 효과적인 축소형 키보드 입력 시스템은 다음 기준을 모두 만족시켜야 한다. 첫째, 입력 방법이 원어민이 이해하고 사용하기 위해 학습하는데 쉬워야 한다. 둘째, 시스템이 축소형 키보드 시스템의 효율을 향상시키기 위해 텍스트를 입력하는데 요구되는 키스트로크의 수를 최소화해야 한다. 셋째, 시스템이 입력 프로세스 동안 요구되는 결정(decision-making) 및 주의(attention) 양을 줄임으로써 사용자의 인식 부담(cognitive load)을 감소시켜야 한다. 넷째, 실제 시스템을 구현하는데 필요한 프로세싱 자원 및 메모리의 양을 최소화시켜야 한다.
또한, 상기 시스템은 축소형 키보드 시스템 상에서 표음 기반형 및 스트로크 기반형 입력 방법을 모두 지원해야 한다. 상기 시스템은 표음 및 스트로크 데이터를 공유하여 데이터 사이즈의 증가를 최소화해야 하며, 따라서 시스템이 저장 용량의 증가를 거의 요구하지 않아야 한다.
기본적인 병음 방법은 멀티탭 방법과 같은 입력 라틴어 알파벳의 비모호(non-ambiguous) 방법과 결합될 때 축소형 키보드 입력 시스템에 적용될 수 있다. 그러나, 모든 비모호 방법은 많은 키스트로크를 필요로 하며, 이것은 기본적인 병음 방법과 결합될 때 특히 부담이 된다. 따라서 기본적인 병음 방법과 모호성 제거 시스템을 결합하는 것이 바람직하다. 일반적으로 알려진 중국어 구(즉, 하나 이상의 문자를 갖는 단어)에서 복수의 중국어 문자들에 대응하는 병음 철자들 사이에 키 1 또는 키 0과 같은 구획 문자 키를 사용자가 선택할 것을 요구함으로써 한 번에 단 하나의 병음 음절만 모호성 제거하도록 하는 하나의 방법이 개발된다. 구획 문자 키의 선택은 프로세서로 하여금 입력 순서와 매칭하는 병음 음절 및 디폴트에 의해 선택될 수도 있는 첫 번째 병음 음절과 관련된 중국어 문자들을 탐색하도록 명령한다. 도 1에 도시된 바와 같이, 사용자는 병음 철자들 NI 및 Y와 관련된 중국어 문자들의 입력을 시도한다. 이를 위해, 사용자는 우선 '6' 키(16)를 선택하고, 그 다음에 '4' 키(14)를 선택할 것이다. 프로세서가 입력된 키와 매칭하는 음절을 탐색하도록 명령하기 위해, 사용자는 그 다음에 구획 문자 키(10)를 선택하고 마지막으로 '9' 키(19)를 선택한다. 이 프로세스는 일반적으로 링크된 복수의 중국어 문자 단어들 사이의 구획 문자 키 누름을 요구하기 때문에, 시간이 낭비된다.
단어 레벨의 모호성 제거의 애플리케이션이 직면하는 다른 중요한 과제는 양방향 페이저, 셀룰러 전화기 및 기타 핸드헬드 무선 통신 장치와 같은, 그 사용이 가장 유리한 하드웨어 플랫폼의 유형에서 그것이 얼마나 성공적으로 수행되는가 하는 것이다. 이들 시스템은 배터리로 전력을 공급받으며, 따라서 하드웨어 설계 및 자원 이용에 있어서 가능한 한 절약형으로 설계된다. 이러한 시스템 상에서 실행하도록 설계된 애플리케이션은 프로세서 대역폭 이용 및 메모리 요구를 모두 최소화해야 한다. 이들 두 요소는 일반적으로 역으로 관련되는 경향이 있다. 단어 레벨의 모호성 제거 시스템은 기능을 위해 대형의 단어 데이터베이스를 요구하며, 만족스러운 사용자 인터페이스를 제공하기 위해 입력 스트로크에 신속하게 응답해야 하기 때문에, 그것을 활용하는데 요구되는 처리 시간에 큰 영향을 주지않고 요구된 데이터베이스를 압축할 수 있는 큰 이점이 있다. 중국어의 경우, 병음 음절의 시퀀스를 사용자가 의도하는 중국어 구로 변환하는 것을 지원하기 위해 부가적인 정보가 데이터베이스에 포함되어야 한다.
단어 레벨의 모호성 제거의 어떠한 애플리케이션이 직면하는 다른 과제는 입력 키스트로크에 대하여 어떻게 충분한 피드백이 사용자에게 제공되는가 하는 것이다. 통상의 타이프라이터 또는 워드 프로세서에 의해, 각각의 키스트로크는 입력시 신속하게 사용자에게 디스플레이될 수 있는 고유 문자를 나타낸다. 그러나, 단어 레벨의 모호성 제거에 의하면, 각각의 키스트로크가 병음 철자로 복수의 문자를 나타내고 키스트로크의 임의의 시퀀스가 복수의 철자들 또는 일부 철자들과 매칭될 수도 있기 때문에, 이것은 때론 가능하지 않다. 따라서, 입력된 키스트로크의 모호성을 최소화하고, 또한 텍스트 입력 동안 발생하는 임의의 모호성을 사용자가 해결할 수 있는 효율성을 최대화하는 모호성 제거 시스템을 개발하는 것이 바람직하다. 사용자의 효율성을 증가시키는 한 가지 방법은 각각의 키스트로크를 따르는 적절한 피드백을 제공하는 것으로, 이것은 각각의 키스트로크를 따르는 가장 유망한 단어 철자를 디스플레이하는 것과, 현재의 키스트로크 시퀀스가 완전한 단어와 대응하지 않는 경우, 아직 완성되지 않은 단어의 가장 유망한 어간(stem)을 디스플레이하는 것을 포함한다.
축소형 키보드에서 표음 기반 또는 스트로크 기반의 방법을 이용하여 중국어를 입력하는 새로운 기술이 요구된다.
본 발명에 따른 시스템은 축소형 키보드 내의 병음(Pinyin)과 같은 표음 엔트리들 간에 구획 문자(delimiter)를 입력할 필요를 제거한다. 이 시스템은 구획 문자의 엔트리를 요구하지 않고 입력된 키 시퀀스에 기초하여 모든 가능한 단일 또는 복수의 병음 철자를 탐색한다. 사용자가 관련 병음 단어의 엔트리를 통해 원하는 중국어 구 또는 중국어 문자 그룹을 완성하였다면, 사용자는 원하는 중국어 문자들의 디스플레이 편성을 선택하거나 또는 화면 크기로 인해 화면에 안 나오는 곳에 저장되어 있는 중국어 문자들의 리스트를 스크롤한다.
바람직한 일실시예에서, 사용자에 의해 입력된 모호한 입력 시퀀스의 모호성을 제거하여 중국어로 텍스트 출력을 발생하는 시스템이 개시된다. 상기 시스템은 (1) 복수의 입력 수단을 갖는 사용자 입력 장치로서, 각각의 상기 입력 수단이 복수의 표음 문자와 관련되고, 상기 사용자 입력 장치에 의해 입력 수단이 선택될 때마다 입력 시퀀스가 발생되고, 상기 입력 수단과 관련된 상기 복수의 표음 문자로 인해 모호한 상기 발생된 입력 시퀀스가 텍스트 해석을 갖는 상기 사용자 입력 장치와, (2) 복수의 입력 시퀀스와, 각각의 입력 시퀀스와 관련되며 철자들이 상기 입력 시퀀스와 대응하는 표음 시퀀스 세트를 포함하는 데이터베이스와, (3) 복수의 표음 시퀀스와, 각각의 표음 시퀀스와 관련되며 상기 표음 시퀀스에 대응하는 표의 문자(ideographic character) 시퀀스 세트를 포함하는 데이터베이스와, (4) 상기 입력 시퀀스를 상기 표음 시퀀스 데이터베이스와 비교하여 매칭하는 표음 엔트리를 찾아내는 수단과, (5) 상기 표음 엔트리를 상기 표의 문자 데이터베이스(ideographic database)와 매칭시키는 수단과, (6) 하나 이상의 매칭된 표음 엔트리 및 매칭된 표의 문자를 디스플레이하는 출력 장치를 포함한다.
다른 바람직한 실시예에서, 사용자 입력 장치에 통합된 표의 문자 언어 텍스트 입력 시스템이 개시된다. 이 시스템은 (1) 복수의 입력부로서, 상기 복수의 입력부 각각은 복수의 문자와 관련되고, 상기 사용자 입력 장치를 조작하여 입력 수단이 선택될 때마다 입력 시퀀스가 발생되고, 발생된 입력 시퀀스가 선택된 입력 수단들의 시퀀스에 대응하는 상기 복수의 입력부와, (2) 객체 출력을 발생하는 적어도 하나의 선택 입력부로서, 사용자가 선택 입력을 위해 상기 사용자 입력 장치를 조작할 때 입력 시퀀스가 종결되는 상기 적어도 하나의 선택 입력부와, (3) 복수의 객체를 포함하는 메모리로서, 상기 복수의 객체 각각이 입력 시퀀스와 관련되는 상기 메모리와, (4) 상기 사용자에게 시스템을 표시하는 디스플레이와, (5) 상기 사용자 입력 장치, 메모리 및 디스플레이에 결합된 프로세서를 포함한다. 상기 프로세서는 상기 메모리 내의 상기 복수의 객체로부터 각각의 발생된 입력 시퀀스와 관련된 임의의 객체를 식별하기 위한 식별 수단과, 각각의 발생된 입력 시퀀스와 관련된 임의의 식별된 객체의 문자 해석을 상기 디스플레이 상에 표시하기 위한 출력 수단과, 선택 입력을 위한 상기 사용자 입력 장치의 조작 검출 시에 텍스트 엔트리 디스플레이 위치에 엔트리에 대한 원하는 문자를 선택하기 위한 선택 수단을 더 포함한다.
본 발명의 다른 바람직한 실시예에서는, 모호성 제거 시스템은 사용자에 의해 입력된 모호한 입력 시퀀스의 모호성을 제거하여 중국어로 텍스트 출력을 발생하는 시스템이 개시된다. 이 모호성 제거 시스템은 복수의 입력 수단, 메모리, 디스플레이 및 프로세서를 갖는 사용자 입력 장치를 포함한다. 사용자 입력 장치의 각각의 입력 수단은 복수의 라틴 알파벳과 관련된다. 입력 시퀀스는 입력 수단이 사용자 입력 장치에 의해 선택될 때마다 발생되고, 상기 입력 수단과 관련된 복수의 라틴 알파벳으로 인해 모호한 발생된 입력 시퀀스는 텍스트 해석을 갖는다. 메모리는 언어 모델(FUBLM)에 기초한 사용 빈도 및 입력 시퀀스와 관련되는, 병음과 같은 복수의 표음 철자를 구성하는데 사용된다. FUBLM은 통상적으로 문법적 모델 또는 심지어 의미론적 모델에 기초한 예측 및 실제 구의 사용 빈도를 포함한다. 복수의 병음 철자 각각은 사용자에게 출력되는 표음 판독에 대응하며 어떠한 데이터 구조 로 메모리에 저장된 데이터로부터 구성되는 병음 음절의 시퀀스를 포함한다. 바람직한 실시예에서, 데이터는 복수의 노드와 선택적으로는 트리 구조에서 찾아낸 하나 이상의 구를 조합하는 문법적 모델 또는 의미론적 언어 모델로 이루어지는 트리 구조 내에 저장된다. 각각의 노드는 입력 시퀀스와 관련된다. 디스플레이는 사용자에게 시스템 출력을 나타낸다. 프로세서는 사용자 입력 장치, 메모리 및 디스플레이에 결합된다. 프로세서는 각각의 입력 시퀀스와 관련된 메모리 내의 데이터로부터 병음 철자를 구성하고 최고 FUBLM로 적어도 하나의 후보 병음 철자를 식별한다. 그 다음에 프로세서는 디스플레이로 하여금 발생된 시퀀스의 텍스트 해석으로서 각각의 발생된 입력 시퀀스와 관련된 상기 식별된 후보 병음 철자를 디스플레이하게 하는 출력 신호를 발생한다.
메모리 내의 트리 구조 내의 병음 철자 객체는 하나 이상의 중국어 구와 관련되며, 이것은 관련된 병음 철자 객체의 텍스트 해석이다. 각각의 중국어 구 객체는 FUBLM과 관련된다.
상기 프로세서는 또한 선택된 병음 철자에 대해 적어도 하나의 식별된 후보 중국어 구를 구성하며, 출력 신호를 발생하여 디스플레이가 발생된 시퀀스의 텍스트 해석으로서 각각의 발생된 입력 시퀀스와 관련된 선택된 병음 철자와 관련된 상기 식별된 후보 중국어 구를 디스플레이하게 한다.
본 발명의 다른 바람직한 실시예에서는, 사용자 입력 장치로 사용자에 의해 입력된 모호한 입력 시퀀스의 모호성을 제거하여 중국어로 텍스트 출력을 발생하는 방법이 개시된다. 사용자 입력 장치는 (1) 복수의 입력 수단으로서, 각각의 상기 입력 수단은 복수의 표음 문자(phonetic character)와 관련되고, 상기 사용자 입력 장치에 의해 입력 수단이 선택될 때마다 입력 시퀀스가 발생되고, 상기 입력 수단과 관련된 상기 복수의 표음 문자로 인해 모호한 상기 발생된 입력 시퀀스가 텍스트 해석을 갖는 상기 복수의 입력 수단과, (2) 복수의 입력 시퀀스와, 각각의 입력 시퀀스와 관련되며 철자가 상기 입력 시퀀스와 대응하는 표음 시퀀스 세트로 이루어진 데이터와, (3) 복수의 표음 시퀀스와, 각각의 표음 시퀀스와 관련되며 상기 표음 시퀀스에 대응하는 표의 문자(ideographic character) 시퀀스 세트를 포함하는 데이터베이스를 포함한다.
상기 방법은 입력 시퀀스를 사용자 입력 장치에 입력하는 단계와, 상기 입력 시퀀스를 상기 표음 시퀀스 데이터베이스와 비교하여 매칭하는 표음 엔트리를 찾아내는 단계와, 하나 이상의 매칭하는 표음 엔트리를 선택적으로 디스플레이하는 단계와, 표음 엔트리를 표의 문자 데이터베이스와 매칭시키는 단계와, 하나 이상의 매칭된 표의 문자를 선택적으로 디스플레이 하는 단계를 포함한다.
본 발명의 또 다른 바람직한 실시예에서는 복수의 입력 수단을 포함하는 축소형 키보드를 사용하여 사용자에 의해 발생된 입력 시퀀스의 모호성 제거 방법이 개시된다. 축소형 키보드는 입력 수단에 대응하는 트리 노드를 포함하는 어휘 모듈 트리 를 포함하는 메모리와 결합된다. 트리 노드는 적어도 유효한 병음 철자에 대응하는 입력 시퀀스에 의해 링크된다. 모호성 제거 방법은 트리 어휘 데이터베이스로부터 하나 이상의 노드 객체를 유지하기 위해 노드 경로를 소거하는 단계와, 루트 노드에서 어휘 노드 트리의 진행을 초기화하는 단계와, 입력 시퀀스에 대응하는 노드 객체로 이루어지는 노드 경로를 구축하는 단계와, 노드 경로를 이용하여 입력 시퀀스에 대응하는 유효 철자 리스트를 구성하는 단계와, 현재 선택된 철자에 대응하는 중국어 구의 리스트를 구성하는 단계를 포함한다.
본 발명은 많은 이점을 갖는다. 첫째, 상기 방법은 오피셜 병음 체계(official Pinyin system)와 같은 표음 체계에 기초하고 있기 때문에, 원어민이 이해하기 쉽고 사용을 배우기 쉽다. 사용자는 사용자의 선호에 따라서 전술한 바와 같은 공통 혼동 세트에 따른 변형을 질의할 수도 있다. 둘째, 상기 시스템은 텍스트 입력에 필요한 키스트로크의 수를 최소화하는 경향이 있다. 셋째, 상기 시스템은 입력 프로세스 동안에 요구되는 주의량(the amount of attention) 및 판정을 감소시키고 적절한 피드백을 제공함으로써 사용자에게 인식 부담을 감소시킨다. 넷째, 본원 명세서에 개시된 방법은 실제 시스템을 구현하는데 필요한 메모리 및 처리 자원의 양을 최소화하는 경향이 있다.
축소형 키보드에서 표음 기반 또는 스트로크 기반의 입력 방법을 이용하여 중국어 문자를 입력하는 시스템 및 방법이 개시되어 있다. 표의 문자에 공통 인덱스를 도입함으로써, 상기 시스템은 표의 문자가 표음 기반의 입력 방법 및 스트로크 기반의 입력 방법과 같은 상이한 유형의 입력 방법들 간에 공유되도록 허용한다. 이 시스템은 입력 시퀀스를 표음 또는 스트로크 인덱스와 같은 입력 방법 특정 인덱스에 매칭시킨다. 이들 입력 방법 특정 인덱스는 그 다음에 표의 문자에 대한 인덱스로 변환되며, 이것은 표의 문자를 검색하는데 사용된다.
바람직한 일실시예에서, 사용자 입력 장치로 표의 문자를 입력하기 위한 방법이 개시된다. 사용자 입력 장치는 (1) 복수의 입력 수단으로서, 각각의 상기 입력 수단이 복수의 스트로크 또는 표음 문자(phonetic character)와 관련되며, 상기 사용자 입력 장치에 의해 입력 수단이 선택될 때마다 입력 시퀀스가 발생되는 상기 복수의 입력 수단과, (2) 복수의 입력 시퀀스와, 각각의 입력 시퀀스와 관련된, 복수의 입력 시퀀스를 포함하는 입력 방법 특정 데이터베이스와, 각각의 입력 시퀀스와 관련된, 철자가 상기 입력 시퀀스에 대응하는 스트로크 시퀀스 세트 또는 상기 입력 시퀀스와 대응하는 표음 시퀀스 세트로 이루어지는 데이터와, (3) 표의 문자 시퀀스 세트를 포함하는 표의 문자 데이터베이스로서, 각각의 표의 문자는 표의 문자 인덱스와, 대응하는 스트로크 시퀀스에 대한 복수의 스트로크 인덱스와, 대응하는 표음 시퀀스에 대한 복수의 표음 인덱스를 포함하는 상기 표의 문자 시퀀스 세트를 포함한다.
상기 방법은 입력 시퀀스를 사용자 입력 장치에 입력하는 단계와, 상기 입력 시퀀스를 상기 입력 방법 특정 데이터베이스와 비교하여 매칭하는 스트로크 엔트리 또는 표음 엔트리에 대한 인덱스 및 상기 매칭하는 스트로크 엔트리 또는 표음 엔트리를 찾아내는 단계와, 스트로크 엔트리 또는 표음 엔트리에 대한 상기 매칭하는 인덱스를 매칭하는 표의 문자 인덱스로 변환하는 단계와, 상기 매칭하는 표의 문자 인덱스에 의해 상기 표의 문자 데이터베이스로부터 매칭하는 표의 문자 시퀀스를 검색하는 단계와, 하나 이상의 상기 매칭된 표의 문자 시퀀스를 선택적으로 디스플레이 하는 단계를 포함한다.
다른 바람직한 실시예에서, 사용자에 의해 입력된 입력 시퀀스를 수신하여 중국어로 텍스트 출력을 발생시키는 시스템이 개시된다. 이 시스템은 (1) 복수의 입력 수단을 갖는 사용자 입력 장치로서, 각각의 상기 입력 수단은 복수의 스트로크 또는 표음 문자와 관련되고, 상기 사용자 입력 장치에 의해 입력 수단이 선택될 때마다 입력 시퀀스가 발생되는 상기 사용자 입력 장치와, (2) 복수의 입력 시퀀스와, 각각의 입력 시퀀스와 관련된, 철자들이 상기 입력 시퀀스에 대응하는 스트로크 시퀀스 세트 또는 상기 입력 시퀀스에 대응하는 표음 시퀀스 세트를 포함하는 입력 방법 특정 데이터베이스와, (3) 표의 문자 시퀀스 세트를 포함하는 표의 문자 데이터베이스로서, 각각의 표의 문자는 표의 문자 인덱스, 대응하는 스트로크 시퀀스에 대한 복수의 스트로크 인덱스 및 대응하는 표음 시퀀스에 대한 복수의 표음 인덱스를 포함하는 상기 표의 문자 데이터베이스와, (4) 상기 입력 시퀀스를 상기 입력 방법 특정 데이터베이스와 비교하여 매칭하는 스트로크 엔트리 또는 표음 엔트리에 대한 인덱스 및 상기 매칭하는 스트로크 엔트리 또는 표음 엔트리를 찾아내는 수단과, (5) 상기 스트로크 엔트리 또는 표음 엔트리에 대한 상기 매칭하는 인덱스를 매칭하는 표의 문자 인덱스로 변환시키는 수단과, (6) 상기 매칭하는 표의 문자 인덱스에 의해 상기 표의 문자 데이터베이스로부터 매칭하는 표의 문자 시퀀스를 검색하는 수단과, (7) 하나 이상의 매칭된 스트로크 또는 표음 엔트리 및 매칭된 표의 문자들을 디스플레이하는 출력 장치를 포함한다.
도 2에는 본 발명에 따라 형성된 축소형 키보드 모호성 제거 시스템이 디스플레이(53)를 갖는 휴대용 셀룰러 전화기(52)에 통합된 것으로 도시되어 있다. 휴대용 셀룰러 전화기(52)는 표준 전화기 키 상에 구현된 축소형 키보드(54)를 포함한다. 이 애플리케이션의 목적을 위해, 용어 "키보드"는 키를 위해 정의된 영역과 분리된 기계적인 키와, 멤브레인 키(membrane key) 등을 갖는 터치 스크린을 포함하는 임의의 입력 디바이스를 포함하도록 광범위하게 정의된다. 키보드(54) 내의 각각의 키 상의 라틴 알파벳의 배열은 미국 전화기용의 디팩토 표준(de facto standard)이 된 것과 대응한다. 따라서 키보드(54)는 표준 QWERTY 키보드에 비해 감소된 수의 데이터 입력 키를 가지며, 여기서 하나의 키는 각각의 라틴어 알파벳을 위해 할당된다. 보다 구체적으로는, 이 실시예에 도시된 바람직한 키보드는 3×4 어레이 내에 배열된 '1' 내지 '0'의 번호가 붙은 10 개의 데이터 키와, 좌향 화살표(61)와 우향 화살표(62), 상향 화살표(63)와 하향 화살표(64)로 이루어진 네 개의 네비게이션 키를 포함한다.
사용자는 축소형 키보드(54) 상의 키스트로크를 통해 데이터를 입력한다. 제 1의 바람직한 실시예에서, 사용자가 키보드를 이용하여 키스트로크 시퀀스를 입력하면, 전화기의 디스플레이(53) 상에 텍스트가 표시된다. 사용자에게 정보를 디스플레이하기 위해 디스플레이(53) 상에는 세 영역이 규정되어 있다. 텍스트 영역(71)은 사용자에 의해 입력된 텍스트를 디스플레이하며, 텍스트 입력 및 편집을 위한 버퍼 역할을 한다. 텍스트 영역(71) 아래에 통상 위치해 있는 예컨대 병음과 같은 표음 철자 선택 리스트(72)는 사용자에 의해 입력된 키스트로크 시퀀스에 대응하는 병음 해석 리스트를 나타낸다. 통상적으로 철자 선택 리스트(72) 아래에 위치하는, 중국어 구와 같은 구 선택 리스트 영역(73)은 사용자에 의해 입력된 순서에 대응하는, 선택된 병음 철자에 대응하는 단어 리스트를 나타낸다. 병음 선택 리스트 영역(72)은 입력된 키스트로크 내의 모호성을 해결하는데 있어서, 입력 키스트로크 순서의 가장 빈번하게 발생하는 병음 해석과 기타 덜 빈번하게 발생하는 FUBLM의 내림차순으로 디스플레이된 다른 병음 해석을 모두 동시에 보여줌으로써 사용자를 돕는다. 중국어 구 선택 리스트 영역(73)은 선택된 병음 철자를 해결하는데 있어서, 선택된 철자의 가장 빈번하게 발생하는 구의 텍스트와 기타 덜 빈번하게 발생하는 언어 모델(FUBLM)에 따라서 사용자의 빈도의 내림차순으로 디스플레이된 구의 텍스트를 모두 동시에 보여줌으로써 사용자를 돕는다. 본원 명세서에서 병음은 표음 입력을 포함하는 것으로 나타나지만, 이 표음 입력은 라틴 알파벳, Zhuyin로 알려진 보포모포(Bopomofo) 알파벳, 숫자 및 구두점을 포함할 수도 있음에 유의하라.
사용자에게 가능한 구를 제공하기 위해, 시스템은 알파벳 순으로 또는 어근들 내의 총 키스트로크 수, 표의 문자의 어근 또는 이 둘의 조합에 따라서 정렬된 데이터베이스 내에서 정확히 발견된 단어들로 제한될 수 있는 언어 모델(linguistic model)에 의존한다. 형식적인 또는 대화식으로 기록되거나 또는 대화식으로 말해지는 텍스트에서와 같이 일반적인 용법의 어떠한 고정된 빈도에 따라서 언어 객체를 정렬하도록 상기 모델은 확장될 수 있다. 또한, 언어 모델은 N-gram 데이터를 사용하여 특정 문자들을 정렬하도록 확장될 수 있다. 언어 모델은 심지어 문법 객체들 간의 변화 빈도 및 문법 정보를 이용하여 데이터베이스 내에 포함된 구들 외의 구들을 발생하도록 확장될 수도 있다. 따라서, 언어 모델은 고정된 사용 빈도 및 고정된 수의 구들만큼 단순하거나, 적응적 사용 빈도, 적응적 단어 또는 심지어 데이터베이스에 포함된 구들 이외의 구를 발생할 수 있는 문법적/의미론적(grammatical/semantic) 모델을 포함할 수도 있다.
축소된 키보드 모호성 제거 시스템의 하드웨어의 블록도가 도 4에 제공된다. 키보드(54) 및 디스플레이(53)는 적절한 인터페이싱 회로를 통해 프로세서(100)에 결합된다. 선택적으로, 스피커(102)는 또한 프로세서(100)에 결합된다. 프로세서(100)는 키보드(54)로부터 입력을 수신하고, 디스플레이(53) 및 스피커(102)로의 모든 출력을 관리한다. 프로세서(100)는 메모리(104)에 결합된다. 메모리(104)는 RAM(random access memory)과 같은 일시적 기억 매체 및 ROM, 플로피 디스크, 하드디스크 또는 CD-ROM과 같은 영구 기억 매체의 조합을 포함한다. 메모리(104)는 시스템 동작을 관리하는 모든 소프트웨어 루틴을 포함한다. 바람직하게는, 메모리(104)는 운영체제(106), 모호성 제거 소프트웨어(108), 및 이하에 추가적으로 상세하게 논의될 관련 어휘 모듈(110)을 포함한다. 선택적으로는, 메모리(104)는 하나 이상의 애플리케이션 프로그램(112, 114)을 포함할 수도 있다. 애플리케이션 프로그램의 예로는 워드 프로세서, 소프트웨어 사전 및 외국어 번역기가 있다. 축소형 키보드 모호성 제거 시스템이 통신 보조 기능을 하도록 허용하는 애플리케이션 프로그램으로서 음성 합성 소프트웨어가 제공될 수도 있다.
도 2를 참조하면, 축소형 키보드 모호성 제거 시스템은 사용자로 하여금 한 손만 사용하여 텍스트 또는 기타 데이터를 신속하게 입력하도록 허용한다. 사용자는 축소형 키보드(54)를 사용하여 데이터를 입력한다. 각각의 데이터 키(2-9)는 라틴어 알파벳, 번호 및 기타 심벌에 의해 키의 상부에 나타나는 복수의 의미를 갖는다. 개개의 키는 복수의 의미를 갖기 때문에, 키스트로크 순서는 그 의미에 대해 여러 가지로 해석된다. 따라서 사용자가 데이터를 입력하는 경우, 다양한 키스트로크 해석이 디스플레이(53) 상의 복수의 영역에 디스플레이되어 사용자가 어떠한 모호성을 해결하는 것을 돕는다. 큰 화면의 장치 상에서, 입력된 키스트로크의 가능한 해석들의 병음 선택 리스트 및 선택된 병음 철자의 중국어 구 선택 리스트가 선택 리스트 영역 내에서 사용자에게 디스플레이된다. 병음 선택 리스트 내의 첫 번째 엔트리는 디폴트 해석으로서 선택되며 선택 리스트 내의 다른 병음 엔트리들로부터 자신을 어떻게든 구분하기 위해 강조된다. 바람직한 실시예에서, 선택 병음 엔트리는 어두운 배경을 갖는 화이트 폰트와 같이 반전 컬러 이미지로 디스플레이된다.
입력된 키스트로크의 가능한 해석의 병음 선택 리스트는 다수의 방법으로 정렬될 수도 있다. 정상 동작 모드에서, 키스트로크는 처음에 원하는 중국어 구에 대응하는 완전한 병음 음절로 이루어진 병음 철자로서 해석된다(이하에서는 완전한 병음 해석이라 함). 키가 입력될 때, 입력 키 시퀀스에 대응하는 유효 병음 철자를 알아내기 위해 어휘 모듈 룩업이 동시에 행해진다. 병음 철자는 FUBLM에 대응하는 어휘 모듈로부터 리턴되며, 가장 일반적으로 사용된 병음 철자가 첫째로 리스트되어 디폴트로 선택된다. 선택된 병음 철자와 매칭하는 중국어 구가 또한 FUBLM에 따라서 어휘 모듈로부터 리턴된다. 보통은 사용자가 중국어 선택 리스트에서 입력하고자 하는 중국어 구를 찾아내어 그 중국어 구를 선택하고 텍스트 입력 영역(71)에서 그 중국어 구를 입력할 수 있다. 만약 디폴트로 선택된 병음 철자가 사용자가 입력하고자 하는 것이지만, 입력하고자 하는 중국어 구가 디스플레이되지 않으면, 사용자는 상향 화살표(63) 및 하향 화살표(64) 키를 사용하여 어휘 데이터베이스로부터 다른 매칭하는 확장된 중국어 구 세트를 디스플레이한다. 몇몇 경우에, 병음 선택 리스트 영역(72)은 모든 매칭된 병음 철자를 유지할 수 없으며, 따라서 사전에 오프 스크린(off-screen) 병음 철자를 병음 선택 리스트 영역(72)으로 스크롤하기 위해 좌향 화살표(61) 및 우향 화살표(62)가 사용된다. 예를 들면, 디폴트로 선택된 병음 철자가 사용자가 입력하기를 원하는 것이 아니라면, 사용자는 좌향 화살표(61) 및 우향 화살표(62) 키를 사용하여 다른 매칭된 병음 철자를 선택할 수 있다.
대부분의 텍스트 엔트리에서, 키스트로크 시퀀스는 사용자에 의해 완전한 병음 음절을 철자하도록 의도된다. 그러나, 각각의 키와 관련된 복수의 문자들은 개별 키스트로크 및 키스트로크 순서가 다수의 해석을 갖는 것을 허용하는 것으로 인식된다. 바람직한 축소형 키보드 모호성 제거 시스템에서, 다양한 상이한 해석이 자동으로 결정되어 사용자에게 병음 철자 리스트 및 선택된 병음 철자에 대응하는 중국어 구로서 디스플레이된다.
예를 들어, 키스트로크 순서는 사용자가 입력할 수도 있는 가능한 중국어에 대응하는 부분 병음 철자로서 해석된다(이하에서는 부분 병음 해석이라 함). 완전한 병음 해석과는 달리, 부분 병음 철자는 마지막 병음 음절이 불완전한 것을 허용한다. 마지막 문자의 병음 음절이 부분적으로 완성된 음절로 시작한다하더라도, 마지막 문자 전의 문자들에 대한 병음이 마지막 부분 병음 음절 전의 모든 음절과 매칭되면, 중국어 구는, 어휘 데이터베이스로부터 리턴된다. 마지막 병음 음절의 완성으로 원래의 부분적인 구의 병음을 확장한 병음 철자와 매칭하는 중국어 구들을 리턴함으로써, 부분 병음 해석은 사용자로 하여금 올바른 키스트로크가 입력되었음을 쉽게 확인할 수 있도록 하거나 또는 사용자의 주의(attention)가 구의 중간에 벗어났을 때 타이핑을 다시 시작하도록 할 수 있다. 따라서, 부분 병음 해석은 병음 철자 리스트 내의 엔트리들로서 제공된다. 바람직하게는, 부분 병음 해석은 마지막 병음 음절의 가능한 완성으로 부분 병음 입력을 확장한 병음 철자와 매칭될 수 있는 모든 가능한 중국어 구 세트의 복합 FUBLM에 따라서 분류된다. 부분 병음 해석은 정확한 키 스트로크가 입력되었다는 것을 확인함으로써 사용자에게 피드백을 제공하여 원하는 단어의 엔트리를 이끌어낸다.
표시된 가능한 매칭의 수를 감소시키기 위해, 사용자는 또한 완성된 병음 음절 뒤에 구획 문자를 입력할 수도 있다. 바람직한 실시예에서, '0' 키가 음절 구획 문자로서 사용된다. 음절 구획 문자가 입력되면, 음절 끝부분이 음절 구획 문자의 위치와 매칭하는 병음 철자만이 리턴되어 병음 선택 리스트 영역(72)에 디스플레이된다.
다른 바람직한 실시예에서, 사용자는 각각의 완성된 병음 음절 뒤에 음조를 입력할 수도 있다. 각각의 완성된 병음 음절 뒤에, 사용자는 음절의 음조에 대응하는 번호가 뒤따르는 음조 키를 누른다. 이 실시예에서는, '1' 키가 음조 키로서 사용된다. 음조가 입력되면, 음조와 매칭하는 중국어 구 변환을 갖는 병음 철자들만이 리턴되어 병음 선택 리스트 영역(72)에 디스플레이된다. 디스플레이된 병음 철자는 또한 입력된 음조를 포함한다. 도 3에 도시된 바와 같이, 병음 철자 "Bei3Jing1"가 병음 철자 리스트 영역(72)에 나타난다. 음조를 갖는 병음 철자가 선택되면, 병음 철자 및 대응하는 음조 모두와 매칭하는 중국어 구들만이 리턴되어 디스플레이된다. 완전한 병음 음절 또는 부분 병음 철자 다음에 필터링이 음조에 적용될 수도 있다.
마지막 음절이 완성될 때까지 부분 병음 완성이 예견된다. 가장 긴 음절이 "Chuang" 또는 "Shuang" 또는 "Zhuang"이기 때문에, 경로의 제 2 부분 내에 최대 다섯 개의 노드가 있다. 이 세 경우에서만, 프로세스는 다섯 개의 더 많은 노드를 예견한다.
예를 들면, 키 입력이 "2345"이면, 유효 철자 중 하나는 "BeiJ"이다. 첫 번째 완전한 음절은 "Bei"이다. 두 번째는 완전한 음절이 아닌 "J"이다. 따라서, 이 경우에 대한 경로의 제 1 부분은 철자 "BeiJ"를 구성하는 것이다. 프로세스는 어휘 모듈 트리에서 예견하여 마지막 음절을 완성할 것이다. 그러면, 부분적인 철자가 "BeiJ"와 매칭하는 단어(BeiJing)를 찾아낸다. 경로의 제 2 부분은 "ing"를 구성하는데 사용된다. 만약 단어 "BeiJingShi"가 어휘 모듈 트리에 있다면, 그것은 두 개의 더 많은 음절의 예견을 요구하기 때문에 프로세스는 키 입력 "2345"에 대해 이 단어를 찾아내지 않을 것이다.
임의의 음조가 입력되면, 두 번째 명령어가 실행될 때 문자의 음조들이 그들의 유 니코드와 함께 검색되기 때문에 프로세스는 문자들을 필터링할 수 있다. 문자가 하나 이상의 발음을 가지면, 가장 일반적인 발음이 우선 검색된다.
각각의 철자에 대한 변환(문자 및 단어)이 FUBLM에 의해 우선순위화된다. 철자-문자/단어 변환 동안에 가장 빈번하게 사용된 문자 또는 단어가 우선 검색된다. 정확히 매칭된 철자로부터 변환된 단어들은 부분 매칭된 철자로부터 변환된 단어 앞에 위치한다. 상이한 부분 매칭된 철자로부터 변환된 단어는 키 순서(즉, 키 2,3,4,5...) 및 그 키 상의 문자(키 인덱스 상의 문자)의 빈도 순서로 분류된다. 예를 들면, 활성 철자가 "Sha"라고 가정하면, 이전 문자가 'a'인 경우 'n'이 'o'에 앞서므로, "Sha"로부터 변환된 문자가 우선 리턴되고, "Shai", "Shan", "Shang" 및 "Shao"로부터 변환된 이들이 후속한다.
전술한 바람직한 실시예는 병음 체계 외에 보포모포(Bopomofo) 알파벳을 사용하는 Zhuyin 체계와 같은 다른 어떠한 병음 체계에도 적용 가능하다.
도 11은 본 발명의 바람직한 실시예에 따른, 사용자에 의해 입력된 모호한 입력 시퀀스를 모호하지 않게 하고 중국어로 텍스트 출력을 발생하는 시스템을 도시한 블록도이다. 이 시스템은 다음 사항을 포함한다.
· 각각의 입력 수단이 복수의 표음 문자와 관련되고, 입력 수단이 사용자 입력 장치에 의해 선택될 때마다 입력 시퀀스가 발생하며, 입력 수단과 관련된 복수의 표음 문자로 인해 모호한 발생된 입력 시퀀스가 텍스트 해석을 갖는, 복수의 입력 수단을 갖는 사용자 입력 장치(1110)
· 복수의 입력 시퀀스와, 각각의 입력 시퀀스와 관련된, 철자들이 그 입력 시퀀스 와 대응하는 표음 시퀀스 세트를 포함하는 데이터베이스(1120)
· 복수의 표음 시퀀스와, 각각의 표음 시퀀스와 관련된, 표음 시퀀스에 대응하는 표의 문자 시퀀스 세트를 포함하는 데이터베이스(1130)
· 입력 시퀀스를 표음 시퀀스 데이터베이스와 비교하여 매칭 표음 엔트리를 찾아내는 수단(1140)
· 표음 엔트리를 표의 문자 데이터베이스와 매칭시키는 수단(1150)
· 하나 이상의 매칭된 표음 엔트리와 매칭된 표의 문자를 디스플레이하는 출력 장치(1160)
텍스트 출력을 발생하기 위해, 사용자는 입력 장치(1110)의 입력 수단을 이용하여 입력 시퀀스를 먼저 발생한다. 시스템은 비교 및 매칭 수단(1140)을 사용하여 데이터베이스(1120)로부터 하나 이상의 표음 시퀀스를 찾아낸다. 최고의 FUBLM 값을 갖는 표음 시퀀스와 같은 매칭된 표음 시퀀스들 중 하나는 디폴트로 선택되거나 또는 사용자가 매칭 리스트로부터 다른 하나를 선택할 수도 있다. 그 다음에 시스템은 매칭 수단(1150)을 사용하여 선택된 표음 시퀀스와 매칭하는 표의 문자를 찾아낸다. 매칭된 표음 시퀀스와 표의 문자가 모두 출력 장치(1160)에 디스플레이될 수도 있다. 최고의 FUBLM 값을 갖는 표의 문자와 같은 매칭된 표의 문자들 중 하나는 디폴트로 선택된다. 사용자는 디폴트를 수락하거나 다른 매칭된 표의 문자 시퀀스 또는 표음 시퀀스를 선택한다.
도 12는 본 발명의 바람직한 실시예에 따른 사용자 입력 장치에 통합된 표의 문자 언어 텍스트 입력 시스템을 도시한 블록도이다. 이 시스템은 다음 요소를 포함한다.
· 복수의 입력부가 각각 복수의 문자와 관련되고, 사용자 입력 장치(1205)를 조작함으로써 입력부가 선택될 때마다 입력 시퀀스가 발생되는 복수의 입력부(1210)로서, 여기서 발생된 입력 시퀀스는 선택된 입력 시퀀스에 대응한다.
· 객체 출력을 발생하는 적어도 하나의 선택 입력부(1220)로서, 여기서 사용자가 선택 입력을 위해 사용자 입력 장치를 조작할 때 입력 시퀀스가 종료된다.
· 복수의 객체를 포함하는 메모리(1230)로서, 여기서 복수의 객체는 각각 입력 시퀀스와 관련된다.
· 사용자에게 시스템 출력을 표시하는 디스플레이(1240)
· 사용자 입력 장치(1205), 메모리(1230) 및 디스플레이(1240)에 결합된 프로세서(1250)
프로세서(1250)는 메모리 내의 복수의 객체로부터 각각의 발생된 입력 시퀀스와 관련된 임의의 객체를 식별하기 위한 식별 수단(1252)과, 각각의 발생된 입력 시퀀스와 관련된 식별된 객체의 문자 해석을 디스플레이 상에 표시하는 출력 수단(1254)과, 선택 입력을 위한 사용자 입력 장치의 조작 검출 시에 텍스트 엔트리 디스플레이 위치에 엔트리에 대한 원하는 문자를 선택하는 선택 수단(1256)을 더 포함한다.
사용자가 사용자 입력 장치(1205)를 조작하고 입력부(1210)를 선택하면, 입력 시퀀스가 발생된다. 프로세서(1250)는 식별 수단(1252)을 사용하여 메모리(1230)로부터 하나 이상의 언어 객체를 발생된 입력 시퀀스와 매칭시킨다. 매칭된 객체의 문자 해석은 출력 수단(1254)을 사용하여 프로세서(1250)에 의해 디스플레이(1240)로 출력된다. 그 다음에 사용자는 선택 입력부(1220)로 문자 해석을 선택하고 프로세서(1250)는 선택 수단(1256)을 호출하여 텍스트 입력 디스플레이 위치에 선택된 문자를 출력한다.
모호성 제거 표음 입력 방법(Disambiguating Phonetic Input Method)
입력 시퀀스의 모호성 제거에 사용되는 단어 및 구의 데이터베이스는 하나 이상의 트리 데이터 구조를 사용하여 어휘 모듈에 저장된다. 특정 키스트로크 시퀀스에 대응하는 단어는 바로 앞의 키스트로크 시퀀스와 관련된 단어 및 단어 어근의 세트를 변경하는 명령어의 형태로 트리 구조에 저장된 데이터로부터 구성된다. 따라서, 시퀀스 내의 각각의 새로운 키스트로크가 처리되므로, 첨부된 새로운 키스트로크를 갖는 키스트로크 시퀀스와 관련된 새로운 병음 철자 및 중국어 구 세트를 생성하기 위해 그 키스트로크와 관련된 명령어 세트가 사용된다. 이 방법에서, 병음 철자 및 중국어 구가 데이터베이스 내에 분명히 저장되지 않는다. 대신에, 이들은 이들을 액세스하는데 사용된 키 시퀀스에 기초하여 구성된다.
중국어의 경우, 트리 데이터 구조는 주 및 부의 명령어(primary and secondary instruction)를 포함한다. 주 명령어는 중국어 구의 병음 철자에 대응하는 라틴어 알파벳의 시퀀스들로 이루어지는 어휘 모듈에 저장된 병음 철자를 생성한다. 주 명령어는 병음 철자를 생성할 때 음절 경계가 어디에 있는 지와 음절이 임의의 컨버전(conversion)을 갖는지의 여부를 지정하는 지시자를 포함한다. 각각의 병음 철자는 바로 앞의 키스트로크 시퀀스와 관련된 병음 철자 중 하나를 수정하는 주 명령어에 의해 생성된다.
음절이 컨버전을 갖는 경우, 그 음절은 병음 음절과 관련된 중국어 문자를 생성하는 부 명령어 리스트를 갖는다. 부 명령어는 각각의 중국어 문자의 음조를 포함할 수도 있다. 하나 이상의 음절을 갖는 병음 철자에 있어서, 각각의 부 명령어는 이전의 부 명령어로 다시 링크하는 포인터를 갖는다. 따라서, 복수의 음절을 갖는 중국어 구는 마지막 문자로부터 첫번째 문자로 구성될 수 있다.
단어 객체 어휘 모듈(1010) 내의 트리의 대표적인 도표가 도 5에 도시되어 있다. 트리 데이터 구조는 대응하는 키스트로크 시퀀스에 기초하여 어휘 모듈 내의 객체들을 조직하는데 사용된다. 도 5에 도시된 바와 같이, 어휘 모듈 트리 내의 각각의 노드(N001, N002, N008)는 특정 키스트로크 시퀀스를 나타낸다. 트리 내의 노드는 경로(P001, P002, P008)에 의해 접속된다. 모호성 제거 시스템의 바람직한 실시예에는 8 개의 모호한 데이터 키(ambiguous data key)가 있기 때문에, 어휘 모듈 트리 내의 각각의 부모 노드(parent node)가 8 개의 자녀 노드(children)와 접속될 수 있다. 경로들에 의해 접속된 노드는 분명한 키스트로크 시퀀스를 나타내는 반면에, 노드로부터의 경로의 결여는 불명확한 키스트로크 시퀀스를 나타낸다. 불명확한 키스트로크 시퀀스는 저장된 중국어 구와 매칭하는 어떠한 병음 철자와도 대응하지 않으며, 저장된 중국어 구와 매칭하는 완전한 병음 철자로 확장될 수 있는 어떠한 부분 병음과도 매칭되지 않는다. 불명확한 입력 키스트로크 시퀀스의 경우에, 바람직한 실시예의 시스템은 비프 음으로 사용자에게 경고한다는 것에 유의하라.
어휘 모듈 트리는 수신된 키스트로크 시퀀스에 기초하여 진행된다(travesed). 예를 들면, 어근 노드(1011)로부터 제 2 데이터 키를 누르면, 제 1 키와 관련된 데이터가 어근 노드(1011) 내부로부터 페치(fetch)되어 평가되고, 그 다음에 노드(N002)로의 경로(P002)가 진행된다. 두 번째로 제 2 데이터 키를 누르면, 제 2 키와 관련된 데이터가 노드(N002)로부터 페치되어 평가되고, 그 다음에 노드(N102)로의 경로(P102)를 진행한다. 각각의 노드는 키스트로크 시퀀스에 대응하는 다수의 객체와 관련된다. 각각의 키스트로크가 수신되고 대응하는 노드가 처리되면, 키스트로크 시퀀스에 대응하는 노드 객체의 노드 경로가 발생된다. 각각의 어휘 모듈로부터의 노드 경로는 모호성 제거 시스템의 주 루틴에 의해 사용되어 병음 철자가 선택되는 경우에 병음 철자 리스트 및 중국어 구 리스트를 발생한다.
도 6은 특정 중국어 어휘 모듈 트리 내의 대응하는 객체를 식별하기 위해 수신된 키스트로크 시퀀스를 분석하는 프로세스(600)를 도시한 흐름도이다. 프로세스(600)는 특정 키스트로크 시퀀스에 대한 병음 철자 리스트를 구성한다. 시작시에, 블록(602)은 새로운 노드 경로를 소거한다. 블록(604)은 그 루트 노드(1011)에서 도 5의 트리의 진행을 개시한다. 블록(606)은 첫 번째 키 누름을 획득한다. 블록(608 내지 612)은 이용가능한 모든 키 누름을 처리하기 위한 루프를 형성한다. 블록(608)은 도 7의 서브 프로세스(620)를 호출하여 노드 경로를 구축한다. 판정 블록(610)은 모든 이용가능한 키 누름이 처리되었는지의 여부를 판정한다. 만약 임의의 키 누름이 처리되지 않고 있으면, 블록(612)이 다음 이용가능한 키 누름으로 진행시킨다. 모든 키 누름이 처리되었다면, 블록(614)이 서브 프로세스(700)를 호출하여 구축된 새로운 노드 경로를 이용하여 병음 철자 리스트를 구축한다.
도 7은 도 6에 따른 프로세스로부터 호출된 서브 프로세스(620)를 도시하는 흐름도이다. 서브 프로세스(620)는 한 노드에 의해 새로운 노드 경로를 확장하도록 시도한다. 우선, 판정 블록(622)에서, 키 누름이 유효한지, 즉, 어휘 모듈 트리 내의 키스트로크에 대응하는 노드를 링크하는 경로가 있는지의 여부를 판정하기 위한 테스트가 이루어진다. 만약 키 누름이 유효하지 않으면, 시스템은 통상적으로 사용자에게 사용자가 유효하지 않은 키스트로크를 입력했음을 경고하지만, 시스템이 부가적인 언어 모델에 기초하여 사용자에게 적절한 제안을 제공할 수도 있다. 블록(622)에서 수신된 키스트로크가 유효하다고 판정되면, 서브 프로세스는 블록(626)으로 진행하여 현재의 키스트로크에 대응하는 트리 노드를 검색한다. 블록(628)은 검색된 트리 노드를 새로운 노드 경로에 부가한다. 블록(630)은 서브 프로세스(620)를 종료한다.
어휘 모듈 트리 내의 노드가 주어진 키 입력에 대해 위치되면, 모호성 제거 모듈이 노드 내의 명령어 리스트를 스캔하고 디코딩하여 유효한 병음 철자를 구성한다. 도 8은 도 6에 따른 프로세스로부터 호출된 서브 프로세서(700)를 나타내는 흐름도이다. 서브 프로세스(700)는, 모든 키스트로크가 성공적으로 처리된 후에 도 7에 따른 서브 프로세스(620)에 의해 구축된 새로운 노드로부터 병음 철자 리스트를 구성하기 시작한다. 블록(702)은 새로운 병음 철자 리스트를 소거한다. 블록(704 내지 710)은 새로운 노드 경로와 매칭하는 모든 병음 철자를 부가하기 위한 루프를 형성한다. 블록(704)은 노드 경로 내의 각 노드 내의 현재의 객체의 주 명령어를 사용하여 병음 철자를 구성한다. 블록(706)은 병음 철자를 새로운 병음 철자 리스트에 부가한다. 판정 블록(708)은 모든 노드 경로 내의 모든 노드내에 있는 모든 객체가 처리되었는지를 판정한다. 임의의 객체가 처리되지 않고 있으면, 블록(710)이 그 객체 인덱스의 다음 세트로 진행된다. 노드 경로 내의 모든 노드의 모든 객체가 처리되었다면, 블록(712)은 서브 프로세스(700)를 종료하고 새로운 병음 철자 리스트를 리턴한다.
주 명령어는 병음 음절 경계의 지시자(indicator)를 포함하기 때문에, 입력 시퀀스로부터 구성된 병음 철자는 병음 철자들 간의 구획 문자를 입력할 필요없이 자동으로 개개의 음절로 구문 분석(parse)된다. 사용자에게 리턴되는 병음 철자는 병음 철자에 포함된 개개의 병음 음절을 식별하기 위해 지시자를 갖는다. 바람직한 일실시예에서, 리턴되거나 또는 예상된 철자의 포맷은 다음과 같다. 즉, (1) 각각의 음절이 대문자(upper case letter)로 시작하고, (2) 음절에 대해 음조가 입력되면, 그 음절 다음에 숫자(1-5)가 뒤따른다.
예를 들면, 음조가 입력되지 않으면, 두 개의 음절 "bei" 및 "jing"로 이루어지는 병음 철자가 "BeiJing"으로서 리턴된다. "bei"에 대해서만 음조가 입력되면, "Bei3Jing"가 리턴된다. 두 음절 모두에 대해 음조가 입력되면, "Bei3Jing1"이 리턴된다.
도 6에 따른 프로세스(600)로부터 리턴된 병음 철자 리스트는 도 2 및 도 3에 도시된 바와 같은 병음 철자 리스트 영역(72)에 디스플레이된다. 유효 철자는 어휘 모듈 트리 내의 FUBLM에 의해 분류된다. FUBLM의 최고 등급을 갖는 첫 번째 철자가우선 검색된다. 이것은 또한 디폴트 병음 철자 선택이다.
병음 철자가 디폴트에 의해 선택되거나 또는 사용자에 의해 네비게이션 키인 좌향 화살표(61)와 우향 화살표(62)에 의해 선택되면, 대응하는 중국어 구가 구성되어 리턴된다.
도 9는 특정 중국어 어휘 모듈 트리 내의 병음 철자에 대응하는 중국어 구를 구성하는 서브 프로세스(720)를 도시한 흐름도이다. 서브 프로세스(720)는 노드 경로로부터 구성되는 병음 철자에 대한 중국어 구 리스트를 구성한다. 블록(722)은 중국어 구 리스트를 소거한다. 판정 블록(724)은 선택된 병음 철자의 마지막 음절이 일부분인지를 검사한다. 선택된 병음 철자의 음절이 일부분이 아니라면, 블록(726)은 도 10에 도시된 변환 서브 프로세스(740)를 호출하여 현재의 병음 철자를 중국어 구로 변환시키고, 중국어 구를 중국어 구 리스트에 부가한다. 블록(734)은 중국어 구 리스트를 리턴한다.
이제 선택된 병음 철자를 구성하는 새로운 노드 경로가 메모리 내에 더 저장된다. 노드 경로의 이 부분은 키 시퀀스에 기초하여 생성된다. 경로의 이 부분 내의 노드는 키 시퀀스와 매칭된다. 유효 철자는 경로의 이 부분으로부터만 구성된다. 정확하게 매칭된 단어들 또한 경로의 이 부분으로부터만 구성된다.
선택된 병음 철자의 마지막 음절이 일부분이면, 블록(728 내지 732)은 마지막 모든 가능한 음절의 완성(possible completions of the last syllable)을 처리하기 위한 루프를 형성한다. 블록(728)은 어휘 모듈 트리 내에서 매칭하는 중국어 구를 갖는 다음 병음 완성어를 찾아낸다. 새로운 노드 경로는 부분 병음 완성을 지원하기 위해 부분적으로 매칭하는 단어를 예견하여 탐색하도록 그 경로의 제 2 부분에 의해 확장된다. 마지막 병음이 일부분이면(즉, 완전한 음절이 아니면), 모호성 제거 모듈은 어휘 모듈 트리를 탐색하여, 철자가 키 시퀀스와 부분적으로 매칭하는 단어를 찾아내고, 그 다음에 이들 단어를 중국어 구 리스트 내에 정확하게 일치된 단어 다음에 제공한다. 부분 병음 완성은 마지막 음절이 완성될 때까지 예견된다. 가장 긴 음절은 "Chuang" 또는 "Shuang" 또는 "Zhuang"이므로, 경로의 제 2 부분 내에는 최대 5개의 노드가 존재한다. 이들 세 경우에서만, 프로세스는 5 개의 더 많은 노드를 예견한다.
예를 들면, 키 입력이 "2345"이면, 유효 철자 중 하나는 "BeiJ"이다. 첫 번째 완전한 음절은 "Bei"이다. 두 번째는 완전한 음절이 아닌 "J"이다. 따라서, 이 경우에 대한 경로의 제 1 부분은 철자 "BeiJ"를 구성한다. 프로세스는 어휘 모듈 트리에서 예견하여 마지막 음절을 완성할 것이다. 그러면, 부분 철자가 "BeiJ"와 매칭하는 단어(BeiJing)를 찾아낸다. 경로의 제 2 부분은 "ing"를 구성하는데 사용된다. 만약 단어 "BeiJingShi"가 어휘 모듈 트리에 있다면, 그것은 두 개의 더 많은 음절의 예견을 요구하기 때문에 프로세스는 키 입력 "2345"에 대해 이 단어를 찾아내지 않을 것이다.
판정 블록(730)은 다음 병음 철자 완성이 발견되는 지의 여부를 판정한다. 다음 병음 철자 완성이 발견되면, 블록(732)은 도 10의 서브 프로세스(740)를 호출하여 현재의 병음 철자 완성을 중국어 구로 변환하고 중국어 구를 중국어 구 리스트에 추가한다. 더 이상의 병음 철자 완성이 발견되지 않으면, 블록(734)은 중국어 구 리스트를 리턴한다.
도 10은 도 7에 따른 프로세스(620)로부터 호출된 서브 프로세스(740)를 도시한다. 서브 프로세스(740)는 서브 프로세스(620)에 의해 구축된 새로운 노드 경로로부터 주어진 병음 철자에 대한 중국어 구를 구성하려고 하며, 이것은 마지막 음절을 완성하도록 제 2 부분에 의해 확장된다. 블록(742 내지 748)은 새로운 노드 경로를 선택적인 확장부와 매칭시키는 모든 중국어 구를 부가하기 위한 루프를 형성한다. 블록(742)는 노드 경로 내의 각각의 노드 내의 현재의 객체의 2차 명령어를 사용하여 중국어 구를 구성한다. 블록(744)은 중국어 구를 중국어 구 리스트에 부가한다. 판정 블록(746)은 노드 경로 내의 모든 노드들 내의 모든 객체들이 처리되었는지의 여부를 판정한다. 임의의 객체가 처리되지 않은 채로 남아 있으면, 블록(748)은 객체 인덱스의 다음 세트로 진행된다. 노드 경로 내의 모든 노드의 모든 객체가 처리되었다면, 블록(750)은 서브 프로세스(740)를 종료하고 중국어 구 리스트를 리턴한다.
임의의 음조가 입력되면, 2차 명령어가 실행될 때 문자의 음조들이 그들의 유니코드와 함께 검색되기 때문에 프로세스는 문자들을 필터링할 수 있다. 문자가 하나 이상의 발음을 가지면, 가장 일반적인 발음이 우선 검색된다.
각각의 철자에 대한 변환(문자 및 단어)이 FUBLM에 의해 우선순위화된다. 철자-문자/단어 변환 동안에 가장 빈번하게 사용된 문자 또는 단어가 우선 검색된다. 정확히 매칭된 철자로부터 변환된 단어들은 부분 매칭된 철자로부터 변환된 단어 앞에 위치한다. 상이한 부분 매칭된 철자로부터 변환된 단어는 키 순서(즉, 키 2,3,4,5...) 및 그 키 상의 문자(키 인덱스 상의 문자)의 빈도 순서로 분류된다.
예를 들어, 활성 철자가 "Sha"라고 가정한다. 이전 문자가 'a'인 경우 'n'이 'o'에 앞서므로, "Sha"로부터 변환된 문자가 우선 리턴되고, "Shai", "Shan", "Shang" 및 "Shao"로부터 변환된 문자들이 후속한다.
전술한 모호성 제거 방법은 병음 체계 외에 보포모포(Bopomofo) 알파벳을 사용하는 Zhuyin 체계와 같은 다른 어떠한 병음 체계에도 적용 가능하다.
도 13은 본 발명의 바람직한 실시예에 따른, 사용자에 의해 입력된 모호한 입력 시퀀스를 모호하지 않게 하고 중국어로 텍스트 출력을 발생하는 방법을 도시한 블록도이다. 이 방법은 다음 단계를 포함한다.
단계 1310 : 입력 시퀀스를 사용자 입력 장치에 입력하는 단계
단계 1320 : 입력 시퀀스를 표음 시퀀스 데이터베이스와 비교하여 매칭하는 표음 엔트리를 찾아내는 단계
단계 1330 : 하나 이상의 매칭된 표음 엔트리를 선택적으로 디스플레이하는 단계
단계 1340 : 표음 엔트리를 표의 문자 데이터베이스와 매칭시키는 단계
단계 1350 : 하나 이상의 매칭된 표의 문자를 선택적으로 표시하는 단계
다른 바람직한 실시예에서, 모호성 제거 병음 시스템은 통상적으로 지역적 억양(regional accent)에 의해 비롯되는 철자 변화를 허용한다. 지역적 억양은 다양한 음절에 대한 발음에 변화를 일으킬 수 있다. 이것은 예컨대 "zh-"와 "□z-", "-n"과 "-ng"에 대해 혼동을 가져올 수 있다. 이들 변화를 수용하기 위해, 어떠한 철자에 대한 변화가 고려될 수 있다. 변화들은, 예를 들어 사용자가 "zan"을 입력하 면 선택 리스트는 "zhan" 및 "zhang"을 가능한 변형체로서 포함할 수도 있듯이 특정 병음에 대해 선택 리스트의 일부로서 디스플레이되거나 또는 특정 문자를 찾아내는데 실패할 때 사용자에게 철자의 가능한 변화를 제공하는 "변형체 표시(show variants)" 옵션을 사용자가 선택할 수도 있다. 또한 사용자는 "z <-> zh", "an<->ang" 등과 같은 특정 "혼동 세트(confusion set)"를 턴 오프 및 온할 수도 있다.
표 5. 일반적인 혼동 세트의 예(Examples of Common Confusion Sets)
A Ia
E IE
O Ou, uo
An Ang, ian, iang
En Eng
In Ing
Ong Iong
Uan Uang
On Ong, iong
Ao Iao
Z Zh
C Ch
S Sh
L N
다른 바람직한 실시예에서, 모호성 제거 시스템은 커스텀 단어 사전(custom word dictionary)을 포함한다. 구 사전은 이용가능한 메모리에 의해 제한되기 때문에, 커스텀 단어 사전은 사용자가 병음/문자 조합을 수동으로 추가하여 그 후 입력 방법을 통해 액세스될 수 있는 필수물이다.
다른 바람직한 실시예에서, 모호성 제거 병음 시스템은 최신 사용에 기초하여 적응적으로 FUBLM을 갱신할 수도 있다. 최초의 구는 사용자의 예상과 매칭되지 않을 수도 있는 특정 언어 모델(예를 들어 코르푸스(corpus)에서의 사용 빈도)에 따라서 정렬된다. 사용자의 패턴을 추적함으로써, 시스템은 언어 모델을 학습하고 적절히 갱신한다.
다른 바람직한 실시예에서, 상기 시스템은 지금까지 입력된 단어 음절 및 언어 모델에 기초하여 사용자에게 단어 예측을 제공할 수도 있다. 언어 모델은 어떤 순서로 예측이 사용자에게 제공되어야 하는 지를 판정하는데 사용될 수도 있다. 사실상 언어 모델은 사용자가 어떠한 문자를 타이핑하기 전에도 사용자에게 단어들의 예측을 제공할 수 있다. 이러한 언어 모델은 단일 문자의 단순한 사용 빈도 또는 둘 이상의 문자 조합(N-gram)의 사용 빈도 또는 문법적인 모델 또는 심지어 의미론적 모델(semantic model)에 기초할 수도 있다. 다른 실시예에서는, 표의 문자 내의 총 키스트로크의 수, 표의 문자의 어근, 어근 및 어근의 수, 알파벳 순서, 형식적인(formal) 텍스트, 대화형으로 기록된 텍스트 또는 대화형으로 말해진 텍스트 내의 표의 문자 시퀀스 또는 표음 문자 시퀀스의 발생 빈도, 선행 문자 또는 문자들에 후속할 때 표의 문자 시퀀스 또는 표음 문자 시퀀스의 발생 빈도, 주위 문장의 적절하거나 일반적인 문법, 현재의 입력 시퀀스의 애플리케이션 문맥, 사용자에 의한 또는 애플리케이션 프로그램 내에서의 표음 또는 표의 문자 시퀀스의 사용의 최근성 또는 반복적인 사용에 기초할 수도 있다.
바람직한 입력 방법은 사용자로 하여금 단어의 완전한 철자를 입력할 것을 요구하지만, 사용자는 각 음절의 첫 번째 문자만 입력하도록 선택될 수도 있다. 따라서, BeiJing을 타이핑하는 대신에, 사용자는 BJ를 타이핑하고 이 두문자어와 매칭하는 구를 제공받는다. 또한, 사용자는 그들 자신의 두문자어를 정의할 수도 있으며 이들을 커스텀 단어 사전에 추가할 수도 있다.
병음 및 구를 결합하는 단일 트리 외에, 키 누름을 유효한 단일 음절 병음에 맵핑시키는 하나의 트리와 병음 단어 및 이들의 표의 문자 표현을 포함하는 다른 하나의 트리의 두 개의 트리가 존재하는 다른 실시예를 생각할 수 있다. 두 번째 트리는 편집하기가 더 쉽고 따라서 삽입 및 삭제가 트리 내에서 이루어질 수 있어, 구 및 변환이 제공되는 순서의 '온더 플라이(on the fly)' 재정리를 가능하게 한다. 또한, 사용자로 하여금 구를 기존의 트리 또는 전술한 커스텀 단어 사전 데이터를 포함하는 병렬 트리 구조에 추가할 수 있도록 한다.
모호한 문자 입력 외에, 상기 시스템은 또한 사용자가 문자를 분명히 선택하도록 비 모호 방법을 제공할 수도 있다.
입력 프로세스 동안, 사용자는 복수의 음절 단어 각각에 대해 부분 음절을 입력할 수도 있다. 바람직하게는, 각 음절에 대한 부분 키스트로크의 수는 하나로서, 예를 들면 각 음절의 제 1 키스트로크이다.
시스템은 사용자가 최초 음을 식별한 후에 유효 최종 음을 디스플레이할 수도 있다. 예를 들면, 사용자가 입력 병음 음절 "Zhang"을 입력하려고 하면, 사용자는 먼저 최초 음 "zh"를 식별하고, 그 다음에 머리 글자에 대한 유효 최종 음을 제공받으며, 사용자는 이를 위해 "ang"를 선택할 수도 있다.
입력 프로세스 동안에, 사용자는 특정 와일드카드 입력 수단과 관련되는 복수의 입력 수단 중 하나를 선택할 수도 있다. 특정 와일드카드 입력 수단은 표음 문자 중 0 또는 1을 매칭시킬 수도 있다.
시스템은 또한 영어 또는 기타 알파벳 언어에 매칭하는 엔트리를 포함하는 표음 시퀀스를 디스플레이할 수도 있으며, 영어와 같은 2차 언어 내의 음절 및 단어로서 키 누름의 동시 해석을 허용한다.
위의 상세한 설명에 나타나 있는 바와 같이, 시스템은 중국어에 대한 효과적인 축소형 키보드 입력 시스템을 생성하도록 설계되었다. 첫째, 상기 방법은 오피셜 병음 체계(official Pinyin system)에 기초하고 있기 때문에, 원어민이 이해하기 쉽고 사용을 배우기 쉽다. 둘째, 상기 시스템은 텍스트 입력에 필요한 키스트로크의 수를 최소화하는 경향이 있다. 셋째, 상기 시스템은 입력 프로세스 동안에 요구되는 주의량(the amount of attention) 및 판정을 감소시키고 적절한 피드백을 제공함으로써 사용자에게 인식 부담을 감소시킨다. 넷째, 본원 명세서에 개시된 방법은 실제 시스템을 구현하는데 필요한 메모리 및 처리 자원의 양을 최소화하는 경향이 있다.
먼저, 도 14는 본 발명의 바람직한 일실시예에 따른, 사용자에 의해 입력된 입력 시퀀스를 수신하고 중국어로 텍스트 출력을 발생하는, 표음 기반 및 스트로크 기반형 입력 방법 모두를 지원하는 시스템을 도시하고 있다. 상기 시스템은 다음 요소들을 포함한다.
· 사용자 입력 장치에 의해 입력이 선택될 때마다 입력 시퀀스가 발생되는, 복수의 입력 수단을 갖는 사용자 입력 장치(1410)
· 복수의 입력 시퀀스, 각각의 입력 시퀀스와 관련된, 철자가 입력 시퀀스에 대응하는 스트로크 시퀀스 세트 또는 입력 시퀀스와 대응하는, 표음 시퀀스 세트를 포함하는 데이터베이스(1420)
스트로크 인덱스는 통상적으로 스트로크 입력 시스템 내의 스트로크 시퀀스에 의해 분류된 스트로크의 인덱스임에 주의하라. 스트로크 입력 시스템은 5-스트로크 또는 8-스트로크 시스템일 수 있다. 표음 인덱스는 통상적으로 표음 입력 시스템 내의 실제 철자에 의해 분류된 표음 문자의 인덱스일 수 있다. 표음 입력 시스템은 병음 체계 또는 Zhuyin 체계일 수 있다. 한편, 병음 인덱스는 표음 입력 시스템에서 입력 수단의 인덱스일 수 있다.
· 표의 문자 시퀀스 세트를 포함하는 데이터베이스(1430), 여기서 각각의 표의 문자는 표의 문자 인덱스, 대응하는 스트로크 시퀀스에 대한 복수의 스트로크 인덱스 및 대응하는 표음 시퀀스에 대한 복수의 표음 인덱스를 포함한다.
인덱스를 표의문자에 도입함으로써, 시스템은 표의 문자가 표음 기반형 입력 방법 및 스트로크 기반형 입력 방법과 같은 상이한 유형의 입력 방법 사이에서 공유되도록 허용한다. 데이터베이스(1430)는 또한 표의 문자에 대한 인덱스와 스트로크 인덱스 사이, 표의 문자에 대한 인덱스와 표음 인덱스 사이에서, 그리고 표의 문자에 대한 인덱스로부터 표의 문자로 변환하는데 필요한 정보를 포함한다. 이들 표의 문자들은 GB 코드의 유니코드일 수 있다.
· 입력 시퀀스를 입력 방법 특정 데이터베이스와 비교하고, 매칭 스트로크 엔트리 또는 표음 엔트리에 대한 인덱스와 매칭 스트로크 엔트리 또는 표음 엔트리를 찾아내는 수단(1440).
· 스트로크 엔트리 또는 표음 엔트리에 대한 매칭 인덱스를 매칭 표의 문자 인덱스로 변환시키는 수단(1450).
· 매칭 표의 문자 인덱스에 의해 표의 문자 데이터베이스로부터 매칭 표의 문자 시퀀스를 검색하는 수단(1460).
· 하나 이상의 매칭된 표음 엔트리 및 매칭된 표의 문자를 디스플레이하는 출력 장치(1470)
도 15는 본 발명의 바람직한 일실시예에 따른 도 14의 시스템을 이용하여 중국어로 텍스트 출력을 발생하는 방법을 도시한 것이다. 이 방법은 다음 단계들을 포함한다.
단계 1510: 입력 시퀀스를 사용자 입력 장치(1410)에 입력한다.
이 단계에서, 사용자는 우선 입력 장치(1410)의 입력 수단을 이용하여 입력 시퀀스를 발생한다.
단계 1520: 입력 시퀀스를 입력 방법 특정 데이터베이스(1420)와 비교하고 매칭 스트로크 엔트리 또는 표음 엔트리에 대한 인덱스 및 상기 매칭하는 스트로크 엔트리 또는 표음 엔트리를 찾아낸다.
이 단계에서, 선택된 입력 방법에 기초하여, 시스템은 비교 및 매칭 수단(1440)을 사용하여 데이터베이스(1420)로부터 표음 엔트리에 대한 하나 이상의 인덱스 또는 스트로크 엔트리에 대한 하나 이상의 인덱스를 찾아낸다.
단계 1530: 스트로크 엔트리 또는 표음 엔트리에 대한 매칭 인덱스를 매칭 표의 문자 인덱스로 변환시킨다.
이 단계에서, 시스템은 변환 수단(1450)을 사용하여 매칭된 표음 엔트리 또는 스트로크 엔트리를 매칭 표의 문자에 대한 인덱스로 변환시킨다.
단계 1540: 매칭 표의 문자 인덱스에 의해 표의 문자 데이터베이스로부터 매칭 표의 문자 시퀀스를 검색한다.
이 단계에서, 매칭 표의 문자에 대한 인덱스는 검색 수단(1460)으로 진행하여 매칭 표의 문자를 검색한다.
단계 1550: 하나 이상의 매칭된 표의 문자 시퀀스를 선택적으로 디스플레이한다.
이 단계에서, 매칭된 표의 문자는 출력 장치(1470) 상에 디스플레될 수도 있다. 최고 FUBLM 값을 갖는 표의 문자와 같은 매칭된 표의 문자들 중 하나는 디폴트로 선택된다. 사용자는 디폴트를 수락하거나 다른 매칭된 표의 문자 시퀀스를 선택할 수도 있다.
도 16은 본 발명의 바람직한 일실시예에 따른 중국어로 텍스트 출력을 발생하는 표음 입력 방법을 도시한 것이다. 이 방법은 다음 단계들을 포함한다.
단계 1610: 사용자 입력 장치에 입력 시퀀스를 입력한다.
단계 1620: 입력 시퀀스를 표음 시퀀스 데이터베이스와 비교하고 매칭 표음 엔트리 및 그들의 인덱스를 찾아낸다.
단계 1630: 하나 이상의 매칭된 표음 엔트리를 선택적으로 디스플레이한다.
단계 1640: "표음 엔트리에 대한 인덱스"를 "표의 문자에 대한 인덱스"로 변환하고, 표의 문자에 대한 인덱스에 의해 표의 문자 데이터베이스로부터 매칭 표의 문자를 검색한다.
단계 1650: 하나 이상의 매칭된 표의 문자를 선택적으로 디스플레이한다.
다른 바람직한 실시예에서, 모호성 제거 병음 시스템은 통상적으로 지역 사투리에 의한 철자 변형을 허용한다. 지역 사투리는 다양한 음절에 대한 발음에 변형을 유발한다. 이 때문에 예를 들어 "zh-"와 "□z-", "-n"과 "-ng"에 대해 혼동을 가져올 수도 있다. 이들 변형을 수용하기 위해, 어떠한 철자 상의 변형이 고려될 수 있다. 변형들은 특정 병음에 대한 선택 리스트의 일부로서 디스플레이될 수 있으며, 예를 들어 사용자가 "zan"을 타이핑하면 선택 리스트는 가능한 변형으로서 "zhan" 및 "zhang"를 포함할 수도 있으며, 또는 사용자가 특정 문자를 찾는데 실패하는 경우에 사용자에게 철자의 가능한 변형을 제공하는 "변형체 표시(show variants)" 옵션을 선택할 수도 있다. 또한 사용자가 "z <-> zh", "an <-> ang" 등과 같이 특정 "혼동 세트(confusion sets)"를 턴 오프 및 온할 수도 있다.
표 5. 일반적인 혼동세트의 예
A Ia
E IE
O Ou, uo
An Ang, ian, iang
En Eng
In Ing
Ong Iong
Uan Uang
On Ong, iong
Ao Iao
Z Zh
C Ch
S Sh
L N
다른 바람직한 실시예에서, 모호성 제거 시스템은 커스텀 단어 사전을 포함 한다. 구의 사전은 이용가능한 메모리에 의해 한정되므로, 사용자가 병음/문자 조합을 수동으로 추가할 수 있고 나중에 입력 방법을 통해 액세스될 수 있는 커스텀 단어 사전이 필수적이다.
다른 바람직한 실시예에서, 모호성 제거 병음 시스템은 사용의 최근성에 기초하여 적응적으로 FUBLM을 갱신할 수도 있다. 사용자의 예상과 일치하지 않을 수도 있는 특정 언어 모델(예를 들어 코르푸스(corpus)에서의 사용 빈도)에 따라서 최초 구들이 정렬된다. 사용자의 패턴을 추적함으로써, 시스템은 언어 모델을 학습하고 적절히 갱신한다.
다른 바람직한 실시예에서, 시스템은 사용자에게 지금까지 입력된 단어 음절 및 언어 모델에 기초하여 단어 예측을 제공할 수도 있다. 언어 모델은 예측이 어떤 순서로 사용자에게 제공되는 지를 결정하는데 사용될 수도 있다. 사실 언어 모델은 사용자가 어떠한 문자를 타이핑하기도 전에 사용자에게 단어의 예측을 제공할 수 있다. 그러한 언어 모델은 단일 문자의 단순한 사용 빈도 또는 둘 이상의 문자 조합(N-grams)의 사용 빈도 또는 문법 모델 또는 심지어 의미론적 모델에 기초할 수도 있다. 다른 실시예에서는, 표의 문자 내의 총 키스트로크의 수, 표의 문자의 어근, 어근 및 어근의 수, 알파벳 순서, 형식적인(formal) 텍스트, 대화형으로 기록된 텍스트 또는 대화형으로 말해진 텍스트 내의 표의 문자 시퀀스 또는 표음 문자 시퀀스의 발생 빈도, 선행 문자 또는 문자들에 후속할 때 표의 문자 시퀀스 또는 표음 문자 시퀀스의 발생 빈도, 주위 문장의 적절하거나 일반적인 문법, 현재의 입력 시퀀스의 애플리케이션 문맥, 사용자에 의한 또는 애플리케이션 프로그램 내에서의 표음 또는 표의 문자 시퀀스의 사용의 최근성 또는 반복적인 사용에 기초할 수도 있다.
바람직한 입력 방법은 사용자로 하여금 단어의 완전한 철자를 입력할 것을 요구하지만, 사용자는 각 음절의 첫 번째 문자만 입력하도록 선택될 수도 있다. 따라서, BeiJing을 타이핑하는 대신에, 사용자는 BJ를 타이핑하고 이 두문자어와 매칭하는 구를 제공받는다. 또한, 사용자는 그들 자신의 두문자어를 정의할 수도 있으며 이들을 커스텀 단어 사전에 추가할 수도 있다
문자들의 모호한 입력 외에, 시스템은 또한 사용자로 하여금 문자를 명시적으로 선택하게 하는 모호성 제거 방법을 제공할 수도 있다.
입력 프로세스 동안, 사용자는 복수의 음절 단어들 각각에 대한 부분적인 음절을 입력할 수도 있다. 바람직하게는, 각각의 음절에 대한 부분 키스트로크의 수는 하나로서, 예를 들면 각 음절의 첫번째 키스트로크이다.
시스템은 또한 사용자가 최초 음을 식별한 후에 유효한 최종 음을 디스플레이할 수도 있다. 예를 들면, 사용자가 병음 음절 "Zhang"를 입력하려고 하는 경우, 사용자는 우선 최초 음 "zh"를 식별하고 그 다음에 머리 글자에 대한 유효 최종 음을 제공받으며, 사용자는 이를 위해 "ang"를 선택할 수도 있다.
입력 프로세스 동안에, 사용자는 특정 와일드카드 입력 수단과 관련되는 복수의 입력 수단 중 하나를 선택할 수도 있다. 특정 와일드카드 입력 수단은 표음 문자 중 0 또는 1을 매칭시킬 수도 있다.
시스템은 또한 영어 또는 기타 알파벳 언어로 매칭 엔트리를 포함하는 표음 시퀀스를 디스플레이할 수도 있으며, 영어와 같은 2차 언어 내의 음절 및 단어로서 키 누름의 동시 해석을 허용한다.
위의 상세한 설명에 나타나 있는 바와 같이, 시스템은 중국어에 대한 효과적인 축소형 키보드 입력 시스템을 생성하도록 설계되었다. 첫째, 상기 방법은 오피셜 병음 체계(official Pinyin system)에 기초하고 있기 때문에, 원어민이 이해하기 쉽고 사용을 배우기 쉽다. 둘째, 상기 시스템은 텍스트 입력에 필요한 키스트로크의 수를 최소화하는 경향이 있다. 셋째, 상기 시스템은 입력 프로세스 동안에 요구되는 주의량(the amount of attention) 및 판정을 감소시키고 적절한 피드백을 제공함으로써 사용자에게 인식 부담을 감소시킨다. 넷째, 본원 명세서에 개시된 방법은 실제 시스템을 실시하는데 필요한 메모리 및 처리 자원의 양을 최소화하는 경향이 있다.
당업자들은 또한 본 발명의 기본 원리로부터 크게 벗어나지 않고, 키보드 배치의 설계 및 기본 데이터베이스 설계에 변경이 이루어질 수도 있음을 알 수 있을 것이다.
따라서, 본 발명은 이하에 포함된 청구범위에 의해서만 한정된다.
본 발명에 따른 방법은 오피셜 병음 체계(official Pinyin system)와 같은 표음 체계에 기초하고 있기 때문에, 원어민이 이해하기 쉽고 사용을 배우기 쉽다. 사용자는 사용자의 선호에 따라서 전술한 바와 같은 공통 혼동 세트에 따른 변형을 질의할 수도 있다. 본 발명에 따른 시스템은 텍스트 입력에 필요한 키스트로크의 수를 최소화하는 경향이 있다. 상기 시스템은 입력 프로세스 동안에 요구되는 주의량(the amount of attention) 및 판정을 감소시키고 적절한 피드백을 제공함으로써 사용자에게 인식 부담을 감소시킨다. 본원 명세서에 개시된 방법은 실제 시스템을 구현하는데 필요한 메모리 및 처리 자원의 양을 최소화하는 경향이 있다.

Claims (188)

  1. 삭제
  2. 청구항 2은(는) 설정등록료 납부시 포기되었습니다.
    사용자에 의해 입력된 모호한 입력 시퀀스의 모호성을 제거하여 중국어로 텍스트 출력을 발생하는 방법에 있어서,
    (a) 입력 시퀀스를 사용자 입력 장치에 입력하는 단계로서,
    상기 사용자 입력 장치는
    복수의 입력 수단으로서, 각각의 상기 입력 수단이 복수의 표음 문자(phonetic character)와 관련되고, 상기 사용자 입력 장치에 의해 입력 수단이 선택될 때마다 입력 시퀀스가 발생되고, 상기 입력 수단과 관련된 상기 복수의 표음 문자로 인해 모호한 상기 발생된 입력 시퀀스가 텍스트 해석을 갖는, 상기 복수의 입력 수단과,
    복수의 입력 시퀀스와, 각각의 입력 시퀀스와 관련되고 철자가 상기 입력 시퀀스와 대응하는 표음 시퀀스 세트로 이루어진 데이터베이스와,
    복수의 표음 시퀀스와, 각각의 표음 시퀀스와 관련되고 상기 표음 시퀀스에 대응하는 표의 문자(ideographic character) 시퀀스 세트를 포함하는 데이터베이스를 포함하는
    상기 입력 단계와;
    (b) 상기 입력 시퀀스를 상기 표음 시퀀스 데이터베이스와 비교하여 매칭하는 표음 엔트리를 찾아내는 단계와;
    (c) 언어 모델(linguistic model)에 따라서 입력 시퀀스와 매칭하는 표음 시퀀스를 우선순위화하는 단계와;
    (d) 하나 이상의 매칭된 표음 엔트리를 선택가능하게 디스플레이하는 단계와;
    (e) 상기 표음 엔트리를 상기 표의 문자 데이터베이스(ideographic database)와 매칭시키는 단계와;
    (f) 언어 모델에 따라서 표음 시퀀스와 매칭하는 표의 문자 시퀀스를 우선순위화하는 단계와;
    (g) 하나 이상의 매칭된 표의 문자를 선택가능하게 디스플레이하는 단계
    를 포함하는 방법.
  3. 제 2 항에 있어서,
    상기 언어 모델은
    표의 문자 내의 총 키스트로크의 수와,
    표의 문자의 어근(radical of an ideograph)과,
    어근 및 어근의 스트로크의 수와,
    알파벳 순서와,
    형식적인(formal) 텍스트, 대화형으로 기록된 텍스트 또는 대화형의 말해진 텍스트 내의 표의 문자 시퀀스 또는 표음 시퀀스의 발생 빈도와,
    선행 문자 또는 문자들에 후속할 때 표의 문자 시퀀스 또는 표음 시퀀스의 발생 빈도와,
    주위 문장의 적절하거나 일반적인 문법과,
    현재의 입력 시퀀스 엔트리의 애플리케이션 문맥과,
    사용자에 의한 또는 애플리케이션 프로그램 내에서의 표음 또는 표의 문자 시퀀스의 사용의 최근성 또는 반복적인 사용
    중 적어도 하나를 포함하는 방법.
  4. 제 2 항에 있어서,
    상기 복수의 표음 문자는
    라틴 알파벳과,
    Zhuyin으로도 알려져 있는 보포모포(Bopomofo) 알파벳과,
    숫자와,
    구두점(punctuation)
    중 적어도 하나를 포함하는 방법.
  5. 청구항 5은(는) 설정등록료 납부시 포기되었습니다.
    제 2 항에 있어서,
    상기 표음 시퀀스는 단일 음절을 포함하는 방법.
  6. 제 2 항에 있어서,
    상기 표음 시퀀스는 단일 및 복수 음절을 포함하는 방법.
  7. 청구항 7은(는) 설정등록료 납부시 포기되었습니다.
    제 2 항에 있어서,
    상기 표음 시퀀스는 사용자가 발생한 시퀀스를 포함하는 방법.
  8. 청구항 8은(는) 설정등록료 납부시 포기되었습니다.
    제 6 항에 있어서,
    상기 표음 음절 및 상기 대응하는 표의 문자는 적어도 하나의 데이터 구조 내에 저장되는 방법.
  9. 제 6 항에 있어서,
    상기 단일 음절의 표음 음절은 모두 단일 데이터 구조 내에 저장되고, 단어 또는 구를 형성하는 표음 음절 및 상기 단어 또는 구와 매칭하는 하나 이상의 표의 문자는 하나 이상의 데이터 구조 내에 저장되는 방법.
  10. 제 8 항에 있어서,
    상기 데이터 구조는 문법 카테고리에 의해 정렬되는 방법.
  11. 제 2 항에 있어서,
    상기 입력 시퀀스에 대응하는 표음 시퀀스가 상기 데이터베이스에 존재하지 않는 경우, 새로운 표음 시퀀스로서 상기 데이터베이스에 추가되는 방법.
  12. 제 11 항에 있어서,
    상기 데이터베이스 내에 매칭하는 표음 시퀀스가 존재하지 않는 경우, 단일 및 선택적으로 복수 음절 표음 시퀀스에 기초하여 매칭하는 표음 시퀀스들의 시퀀스가 자동으로 발생되는 방법.
  13. 제 12 항에 있어서,
    상기 매칭하는 표음 시퀀스들의 시퀀스는 사용자 상호작용(user interaction)을 통해 좁혀지는 방법.
  14. 제 12 항에 있어서,
    상기 자동으로 발생된 표음 시퀀스에 매칭하는 표의 문자 시퀀스들의 시퀀스는 표의 문자 시퀀스들과 매칭하는 표음 시퀀스들에 기초하여 자동으로 발생되는 방법.
  15. 제 14 항에 있어서,
    상기 매칭하는 표의 문자 시퀀스들의 시퀀스는 사용자 상호작용을 통해 좁혀지는 방법.
  16. 제 15 항에 있어서,
    상기 디스플레이된 표의 문자 시퀀스 중 하나가 선택되면, 이에 대응하는 상기 매칭하는 입력 시퀀스, 상기 매칭하는 표음 시퀀스 및 상기 매칭하는 표의 문자 시퀀스가 데이터 구조에 추가되는 방법.
  17. 제 2 항에 있어서,
    표의 문자 시퀀스가 선택되면, 상기 매칭하는 표음 시퀀스 및 표의 문자의 시퀀스의 상기 관련된 우선순위를 변경시키는 단계를 더 포함하는 방법.
  18. 제 2 항에 있어서,
    상기 디스플레이된 표음 시퀀스 및 대응하는 표의 문자 시퀀스로부터 원하는 표음 시퀀스 및 대응하는 표의 문자 시퀀스는 제 2 입력 메커니즘을 통해 지정되는 방법.
  19. 청구항 19은(는) 설정등록료 납부시 포기되었습니다.
    제 2 항에 있어서,
    상기 사용자는 상기 표음 음절에 대한 특정 음조(tone)를 지정할 수 있는 방법.
  20. 청구항 20은(는) 설정등록료 납부시 포기되었습니다.
    제 19 항에 있어서,
    상기 복수의 입력 수단 중 하나는 임의의 한 음조 또는 모든 음조와 관련되는 특정 와일드카드 입력 수단과 관련되는 방법.
  21. 제 2 항에 있어서,
    상기 사용자는 명시적인 음절 분리기호(explicit syllable separator)를 지정할 수 있는 방법.
  22. 제 2 항에 있어서,
    상기 사용자가 표음 문자의 시퀀스를 입력할 때, 정확히 매칭하는 표음 시퀀스들의 시퀀스 및 부분적으로 매칭하는 예측 시퀀스를 리턴하는 단계를 더 포함하는 방법.
  23. 제 22 항에 있어서,
    상기 표음 시퀀스들의 시퀀스는 언어 모델에 따라서 정렬되는 방법.
  24. 제 23 항에 있어서,
    상기 언어 모델은
    표의 문자 내의 총 키스트로크의 수와,
    표의 문자의 어근(radical of an ideograph)과,
    어근 및 어근의 스트로크의 수와,
    알파벳 순서와,
    형식적인(formal) 텍스트 또는 대화형으로 기록된 텍스트 내의 표의 문자 시퀀스 또는 표음 시퀀스의 발생 빈도와,
    선행 문자 또는 문자들에 후속할 때 표의 문자 시퀀스 또는 표음 시퀀스의 발생 빈도와,
    주위 문장의 적절하거나 일반적인 문법과,
    현재의 문자 시퀀스 엔트리의 애플리케이션 문맥과,
    사용자에 의한 또는 애플리케이션 프로그램 내에서의 표음 시퀀스의 사용의 최근성 또는 반복적인 사용
    중 적어도 하나를 포함하는 방법.
  25. 제 2 항에 있어서,
    상기 사용자가 표의 문자 시퀀스를 선택하면, 상기 사용자에게 하나 이상의 표의 문자 시퀀스들의 리스트를 제공하는 단계를 더 포함하는 방법.
  26. 제 25 항에 있어서,
    상기 시퀀스들의 리스트는 언어 모델에 따라서 정렬되는 방법.
  27. 제 26 항에 있어서,
    상기 언어 모델은
    표의 문자 내의 총 키스트로크의 수와,
    표의 문자의 어근(radical of an ideograph)과,
    어근 및 어근의 스트로크의 수와,
    알파벳 순서와,
    형식적인(formal) 텍스트 또는 대화형으로 기록된 텍스트 내의 표의 문자의 발생 빈도와,
    선행 문자 또는 문자들에 후속할 때 표의 문자의 발생 빈도와,
    주위 문장의 적절하거나 일반적인 문법과,
    현재의 문자 엔트리의 애플리케이션 문맥과,
    사용자에 의한 또는 애플리케이션 프로그램 내에서의 표의 문자 시퀀스의 사용의 최근성 또는 반복적인 사용
    중 적어도 하나를 포함하는 방법.
  28. 제 2 항에 있어서,
    상기 입력 시퀀스와 상기 표음 시퀀스들 간의 매칭은 혼동 세트(confusion set)의 일부인 방법.
  29. 제 28 항에 있어서,
    상기 사용자는 어느 혼동 세트가 활성인 지를 선택할 수 있는 방법.
  30. 제 28 항에 있어서,
    상기 복수의 입력 수단 중 하나는 혼동 세트 또는 잘못된 표기(misspellings)에 기초하여 상기 입력 시퀀스의 다른 표음 시퀀스 해석을 제공하는 것과 관련되는 방법.
  31. 제 28 항에 있어서,
    상기 복수의 입력 수단 중 하나는 혼동 세트 또는 잘못된 표기에 기초하여 입력 시퀀스의 다른 표의 문자 해석을 제공하는 것과 관련되는 방법.
  32. 청구항 32은(는) 설정등록료 납부시 포기되었습니다.
    제 28 항에 있어서,
    상기 방법이 수행되는 시스템은 사용자의 혼동 세트 또는 일반적인 잘못된 표기에 적응하는 방법.
  33. 제 2 항에 있어서,
    상기 사용자는 복수의 음절 단어들 각각에 대해 부분 음절을 입력할 수 있는 방법.
  34. 청구항 34은(는) 설정등록료 납부시 포기되었습니다.
    제 33 항에 있어서,
    각 음절에 대한 부분 키스트로크의 수는 하나인 방법.
  35. 청구항 35은(는) 설정등록료 납부시 포기되었습니다.
    제 2 항에 있어서,
    상기 사용자는 최초 음과 최종 음을 식별하는 방법.
  36. 청구항 36은(는) 설정등록료 납부시 포기되었습니다.
    제 2 항에 있어서,
    상기 복수의 입력 수단들 중 하나는 상기 표음 문자들 중 0 또는 1과 관련되는 특정 와일드 카드 입력 수단과 관련되는 방법.
  37. 제 2 항에 있어서,
    상기 표음 시퀀스는 영어 및 기타 알파벳 언어들 중 어느 하나에 매칭하는 엔트리를 포함하는 방법.
  38. 청구항 38은(는) 설정등록료 납부시 포기되었습니다.
    삭제
  39. 청구항 39은(는) 설정등록료 납부시 포기되었습니다.
    사용자에 의해 입력된 모호한 입력 시퀀스의 모호성을 제거하여 중국어로 텍스트 출력을 발생하는 시스템에 있어서,
    복수의 입력 수단을 갖는 사용자 입력 장치로서, 각각의 상기 입력 수단이 복수의 표음 문자와 관련되고, 상기 사용자 입력 장치에 의해 입력이 선택될 때마다 입력 시퀀스가 발생되고, 상기 입력과 관련된 상기 복수의 표음 문자로 인해 모호한 상기 발생된 입력 시퀀스가 텍스트 해석을 갖는, 상기 사용자 입력 장치와;
    복수의 입력 시퀀스와, 각각의 입력 시퀀스와 관련되고 철자들이 상기 입력 시퀀스와 대응하는 표음 시퀀스 세트를 포함하는 데이터베이스와;
    복수의 표음 시퀀스와, 각각의 표음 시퀀스와 관련되고 상기 표음 시퀀스에 대응하는 표의 문자(ideographic character) 시퀀스 세트를 포함하는 데이터베이스와;
    상기 입력 시퀀스를 상기 표음 시퀀스 데이터베이스와 비교하여 매칭하는 표음 엔트리를 찾아내는 수단과;
    언어 모델에 따라서 입력 시퀀스와 매칭하는 표음 시퀀스를 우선순위화하는 수단과;
    상기 표음 엔트리를 상기 표의 문자 데이터베이스(ideographic database)와 매칭시키는 수단과;
    언어 모델에 따라서 매칭하는 표음 시퀀스와 매칭하는 표의 문자 시퀀스를 우선순위화하는 수단과;
    하나 이상의 매칭된 표음 엔트리 및 매칭된 표의 문자를 디스플레이하는 출력 장치
    를 포함하는 시스템.
  40. 청구항 40은(는) 설정등록료 납부시 포기되었습니다.
    제 39 항에 있어서,
    상기 언어 모델은
    표의 문자 내의 총 키스트로크의 수와,
    표의 문자의 어근(radical of an ideograph)과,
    어근 및 어근의 스트로크의 수와,
    알파벳 순서와,
    형식적인 텍스트 또는 대화형으로 기록된 텍스트 내의 표의 문자 시퀀스 또는 표음 시퀀스의 발생 빈도와,
    선행 문자 또는 문자들에 후속할 때 표의 문자 시퀀스 또는 표음 시퀀스의 발생 빈도와,
    주위 문장의 적절하거나 일반적인 문법과,
    현재의 입력 시퀀스 엔트리의 애플리케이션 문맥과,
    사용자에 의한 또는 애플리케이션 프로그램 내에서의 표음 또는 표의 문자 시퀀스의 사용의 최근성 또는 반복적인 사용
    중 적어도 하나를 포함하는 시스템.
  41. 청구항 41은(는) 설정등록료 납부시 포기되었습니다.
    제 39 항에 있어서,
    상기 복수의 표음 문자는 라틴 알파벳을 포함하는 시스템.
  42. 청구항 42은(는) 설정등록료 납부시 포기되었습니다.
    제 39 항에 있어서,
    상기 복수의 표음 문자는 Zhuyin으로도 알려져 있는 보포모포(Bopomofo) 알파벳을 포함하는 시스템.
  43. 청구항 43은(는) 설정등록료 납부시 포기되었습니다.
    제 39 항에 있어서,
    상기 표음 시퀀스는 단일 음절을 포함하는 시스템.
  44. 청구항 44은(는) 설정등록료 납부시 포기되었습니다.
    제 39 항에 있어서,
    상기 표음 시퀀스는 단일 및 복수 음절을 모두 포함하는 시스템.
  45. 청구항 45은(는) 설정등록료 납부시 포기되었습니다.
    제 39 항에 있어서,
    상기 표음 시퀀스는 사용자가 발생한 시퀀스를 포함하는 시스템.
  46. 청구항 46은(는) 설정등록료 납부시 포기되었습니다.
    제 44 항에 있어서,
    상기 표음 음절 및 상기 대응하는 표의 문자는 단일 트리 내에 저장되는 시스템.
  47. 청구항 47은(는) 설정등록료 납부시 포기되었습니다.
    제 44 항에 있어서,
    상기 단일 음절의 표음 음절 모두 단일 트리 내에 저장되고, 단어 또는 구를 형성하는 표음 음절 및 상기 단어 또는 구와 매칭하는 하나 이상의 표의 문자는 단일 트리 내에 저장되는 시스템.
  48. 청구항 48은(는) 설정등록료 납부시 포기되었습니다.
    제 39 항에 있어서,
    상기 입력 시퀀스에 대응하는 표음 시퀀스가 상기 데이터베이스에 존재하지 않는 경우, 새로운 표음 시퀀스로서 커스텀 데이터베이스(custom database)에 추가되는 방법.
  49. 청구항 49은(는) 설정등록료 납부시 포기되었습니다.
    제 48 항에 있어서,
    상기 데이터베이스 내에 매칭하는 표음 시퀀스가 존재하지 않는 경우, 단일 및 선택적으로 복수 음절 표음 시퀀스에 기초하여 매칭하는 표음 시퀀스들의 시퀀스가 자동으로 발생되는 시스템.
  50. 청구항 50은(는) 설정등록료 납부시 포기되었습니다.
    제 49 항에 있어서,
    상기 매칭하는 표음 시퀀스들의 시퀀스는 사용자 상호작용(user interaction)을 통해 좁혀지는 시스템.
  51. 청구항 51은(는) 설정등록료 납부시 포기되었습니다.
    제 49 항에 있어서,
    상기 자동으로 발생된 표음 시퀀스에 매칭하는 표의 문자 시퀀스들의 시퀀스가 표의 문자 시퀀스들에 대해 매칭하는 표음 시퀀스들에 기초하여 자동으로 발생되는 시스템.
  52. 청구항 52은(는) 설정등록료 납부시 포기되었습니다.
    제 51 항에 있어서,
    상기 매칭하는 표의 문자 시퀀스들의 시퀀스는 사용자 상호작용을 통해 좁혀지는 시스템.
  53. 청구항 53은(는) 설정등록료 납부시 포기되었습니다.
    제 42 항에 있어서,
    상기 디스플레이된 표의 문자 시퀀스 중 하나가 선택되면, 이에 대응하는 상기 매칭하는 입력 시퀀스, 상기 매칭하는 표음 시퀀스 및 상기 매칭하는 표의 문자 시퀀스가 메모리에 추가되는 시스템.
  54. 청구항 54은(는) 설정등록료 납부시 포기되었습니다.
    제 39 항에 있어서,
    표의 문자 시퀀스가 선택되면, 상기 매칭하는 표음 시퀀스 및 표의 문자의 시퀀스의 상기 관련된 우선순위를 변경시키는 수단을 더 포함하는 시스템.
  55. 청구항 55은(는) 설정등록료 납부시 포기되었습니다.
    제 48 항에 있어서,
    상기 디스플레이된 표음 시퀀스 및 대응하는 표의 문자 시퀀스로부터 원하는 표음 시퀀스 및 대응하는 표의 문자 시퀀스는 제 2 선택 메커니즘을 통해 지정되는 시스템.
  56. 청구항 56은(는) 설정등록료 납부시 포기되었습니다.
    제 39 항에 있어서,
    상기 사용자는 표음 음절에 대해 특정 음조(tone)를 지정할 수 있는 시스템.
  57. 청구항 57은(는) 설정등록료 납부시 포기되었습니다.
    제 56 항에 있어서,
    상기 복수의 입력 수단 중 하나는 임의의 한 음조 또는 모든 음조와 관련되는 특정 와일드카드 입력 수단과 관련되는 시스템.
  58. 청구항 58은(는) 설정등록료 납부시 포기되었습니다.
    제 39 항에 있어서,
    상기 사용자는 명시적인 음절 분리기호(explicit syllable separator)를 지정할 수 있는 시스템.
  59. 청구항 59은(는) 설정등록료 납부시 포기되었습니다.
    제 39 항에 있어서,
    상기 사용자가 표음 문자의 시퀀스를 입력하면, 사용자는 정확히 매칭하는 표음 시퀀스들의 시퀀스 및 부분적으로 매칭하는 예측 시퀀스를 리턴받는 시스템.
  60. 청구항 60은(는) 설정등록료 납부시 포기되었습니다.
    제 59 항에 있어서,
    상기 시퀀스는 언어 모델에 기초하여 사용 빈도에 따라서 정렬되는 시스템.
  61. 청구항 61은(는) 설정등록료 납부시 포기되었습니다.
    제 60 항에 있어서,
    상기 언어 모델은
    표의 문자 내의 총 키스트로크의 수와,
    표의 문자의 어근(radical of an ideograph)과,
    어근 및 어근의 스트로크의 수와,
    알파벳 순서와,
    형식적인 텍스트 또는 대화형으로 기록된 텍스트 내의 표의 문자 시퀀스 또는 표음 시퀀스의 발생 빈도와,
    선행 문자 또는 문자들에 후속할 때 표의 문자 시퀀스 또는 표음 시퀀스의 발생 빈도와,
    주위 문장의 적절하거나 일반적인 문법과,
    현재의 문자 시퀀스 엔트리의 애플리케이션 문맥과,
    사용자에 의한 또는 애플리케이션 프로그램 내에서의 표음 시퀀스의 사용의 최근성 또는 반복적인 사용
    중 적어도 하나를 포함하는 시스템.
  62. 청구항 62은(는) 설정등록료 납부시 포기되었습니다.
    제 39 항에 있어서,
    상기 사용자가 표의 문자 시퀀스를 선택하면, 상기 사용자는 하나 이상의 표의 문자 시퀀스들의 리스트를 제공받는 시스템.
  63. 청구항 63은(는) 설정등록료 납부시 포기되었습니다.
    제 62 항에 있어서,
    상기 시퀀스들의 리스트는 언어 모델에 기초하여 상기 사용 빈도에 따라서 정렬되는 시스템.
  64. 청구항 64은(는) 설정등록료 납부시 포기되었습니다.
    제 63 항에 있어서,
    상기 언어 모델은
    표의 문자 내의 총 키스트로크의 수와,
    표의 문자의 어근(radical of an ideograph)과,
    어근 및 어근의 스트로크의 수와,
    알파벳 순서와,
    형식적인(formal) 텍스트 또는 대화형으로 기록된 텍스트 내의 표의 문자의 발생 빈도와,
    선행 문자 또는 문자들에 후속할 때 표의 문자의 발생 빈도와,
    주위 문장의 적절하거나 일반적인 문법과,
    현재의 문자 엔트리의 애플리케이션 문맥과,
    사용자에 의한 또는 애플리케이션 프로그램 내에서의 표의 문자들의 사용의 최근성 또는 반복적인 사용
    중 적어도 하나를 포함하는 시스템.
  65. 청구항 65은(는) 설정등록료 납부시 포기되었습니다.
    제 39 항에 있어서,
    상기 입력 시퀀스와 상기 표음 시퀀스들 간의 매칭은 혼동 세트(confusion set)의 일부인 시스템.
  66. 청구항 66은(는) 설정등록료 납부시 포기되었습니다.
    제 65 항에 있어서,
    상기 사용자는 어느 혼동 세트가 활성인 지를 선택할 수 있는 시스템.
  67. 청구항 67은(는) 설정등록료 납부시 포기되었습니다.
    제 66 항에 있어서,
    상기 복수의 입력 수단 중 하나는 혼동 세트 또는 잘못된 표기(misspellings)에 기초하여 상기 입력 시퀀스의 다른 표음 시퀀스 해석을 제공하는 것과 관련되는 시스템.
  68. 청구항 68은(는) 설정등록료 납부시 포기되었습니다.
    제 65 항에 있어서,
    상기 시스템은 사용자의 혼동 세트 또는 일반적인 잘못된 표기에 적응하는 시스템.
  69. 사용자 입력 장치에 통합된 표의 문자 언어 텍스트 입력 시스템에 있어서,
    복수의 입력부로서, 상기 복수의 입력부 각각이 복수의 문자와 관련되고, 상기 사용자 입력 장치를 조작하여 입력부가 선택될 때마다 입력 시퀀스가 발생되고, 발생된 입력 시퀀스가 선택된 입력부들의 시퀀스에 대응하는, 상기 복수의 입력부와;
    객체 출력을 발생하는 적어도 하나의 선택 입력부로서, 사용자가 선택 입력을 위해 상기 사용자 입력 장치를 조작할 때 입력 시퀀스가 종결되는 상기 적어도 하나의 선택 입력부와;
    복수의 객체를 포함하는 메모리로서, 상기 복수의 객체 각각이 입력 시퀀스와 관련되는 상기 메모리와;
    상기 사용자에게 시스템을 표시하는 디스플레이와;
    상기 사용자 입력 장치, 메모리 및 디스플레이에 결합된 프로세서를 포함하며,
    상기 프로세서는
    상기 메모리 내의 상기 복수의 객체로부터 각각의 발생된 입력 시퀀스와 관련된 임의의 객체를 식별하기 위한 식별 수단과;
    각각의 발생된 입력 시퀀스와 관련된 임의의 식별된 객체의 문자 해석을 상기 디스플레이 상에 표시하기 위한 출력 수단과;
    선택 입력을 위한 상기 사용자 입력 장치의 조작 검출 시에 텍스트 엔트리 디스플레이 위치에 엔트리에 대한 원하는 문자를 선택하기 위한 선택 수단을 포함하는
    시스템.
  70. 제 69 항에 있어서,
    상기 선택 수단은 언어 모델에 기초하여 최고 우선순위를 갖는 객체의 식별에 따라서 원하는 문자를 선택하는 시스템.
  71. 제 69 항에 있어서,
    구 또는 표의 문자 시퀀스가 선택될 때마다, 구 및 표의 문자 시퀀스에 대한 입력 시퀀스는 재우선순위화되는(reprioritized) 시스템.
  72. 청구항 72은(는) 설정등록료 납부시 포기되었습니다.
    제 69 항에 있어서,
    객체가 입력 시퀀스에 대해 존재하지 않으면 메모리에 객체가 추가되는 시스 템.
  73. 청구항 73은(는) 설정등록료 납부시 포기되었습니다.
    제 69 항에 있어서,
    상기 복수의 입력부 중 하나는 임의의 하나의 음조 또는 모든 음조 및 구획 문자(delimiter)와 관련되는 특정 와일드카드 입력부와 관련되는 시스템.
  74. 사용자에 의해 입력된 모호한 입력 시퀀스의 모호성을 제거하여 중국어로 텍스트 출력을 발생시키는 시스템에 있어서,
    복수의 입력 수단을 갖는 사용자 입력 장치로서, 각각의 상기 입력 수단이 복수의 라틴 알파벳과 관련되고, 상기 사용자 입력 장치에 의해 입력 수단이 선택될 때마다 입력 시퀀스가 발생되고, 상기 입력과 관련된 상기 복수의 라틴 알파벳으로 인해 모호한 상기 발생된 입력 시퀀스가 텍스트 해석을 갖는, 상기 사용자 입력 장치와,
    복수의 병음(Pinyin) 철자를 구성하기 위해 사용되는 데이터를 포함하는 메모리로서, 각각의 상기 병음 철자는 입력 시퀀스 및 언어 모델에 기초한 사용 빈도와 관련되고, 각각의 상기 병음 철자는 상기 사용자에게 출력되는 표음 판독에 대응하는 병음 음절의 시퀀스를 포함하고, 상기 병음 철자는 복수의 노드로 이루어진 트리 구조로 상기 메모리에 저장된 데이터로부터 구성되고, 각각의 상기 노드는 입력 시퀀스와 관련되는, 상기 메모리와;
    시스템 출력을 사용자에게 표시하는 디스플레이와;
    상기 사용자 입력 장치, 상기 메모리 및 상기 디스플레이에 결합된 프로세서로서, 상기 프로세서는 각각의 입력 시퀀스와 관련된 상기 메모리 내의 상기 데이터로부터 병음 철자를 구성하고, 언어 모델에 기초하여 최고의 사용 빈도를 갖는 적어도 하나의 후보 병음 철자를 식별하고, 상기 발생된 시퀀스의 텍스트 해석으로서 각각의 발생된 입력 시퀀스와 관련된 상기 적어도 하나의 식별된 후보 병음 철자를 상기 디스플레이가 디스플레이하도록 출력 신호를 발생하는, 상기 프로세서를 포함하는
    시스템.
  75. 제 74 항에 있어서,
    상기 메모리 내의 트리 구조 내의 하나 이상의 병음 철자 객체가 하나 이상의 중국어 구와 관련되고, 각각의 중국어 구는 상기 관련된 병음 철자 객체의 텍스트 해석이고, 각각의 중국어 구 객체는 언어 모델에 기초하여 사용 빈도와 관련되는 시스템.
  76. 제 75 항에 있어서,
    상기 프로세서는 선택된 병음 철자에 대해 적어도 하나의 식별된 후보 중국어 구를 구성하고, 상기 발생된 시퀀스의 텍스트 해석으로서 각각의 발생된 입력 시퀀스와 관련된 상기 선택된 병음 철자와 관련된 상기 적어도 하나의 식별된 후보 중국어 구를 상기 디스플레이가 디스플레이하도록 하는 출력 신호를 발생하는 시스템.
  77. 제 76 항에 있어서,
    상기 적어도 하나의 식별된 중국어 구는 상기 선택된 병음 철자와 정확히 매칭하는 병음 철자를 갖는 시스템.
  78. 제 76 항에 있어서,
    상기 적어도 하나의 식별된 중국어 구는 상기 선택된 병음 철자의 마지막 음절을 제외한 모든 음절과 정확히 매칭하는 병음 철자를 가지며, 상기 식별된 중국어 구의 병음의 상기 마지막 음절은 상기 선택된 병음 철자의 상기 마지막 음절로부터 확장될 수 있는 완전한 음절인 시스템.
  79. 제 76 항에 있어서,
    각각의 병음 철자 객체와 관련된 언어 모델에 기초한 상기 사용 빈도는 상기 병음 철자 객체와 관련된 모든 중국어 구 객체의 사용 빈도의 합에 대응하는 시스템.
  80. 제 79 항에 있어서,
    상기 언어 모델에 기초한 최고의 사용 빈도를 갖는 상기 병음 철자는 디폴트 병음 철자 선택인 시스템.
  81. 제 74 항에 있어서,
    상기 복수의 입력 수단 중 적어도 하나 이상은 모호하지 않은 네비게이션 입력 수단이고,
    상기 사용자는 상기 네비게이션 입력 수단의 추가적인 선택에 의해 입력 시퀀스의 해석으로서 다른 병음 철자를 선택할 수도 있고, 상기 모호하지 않은 네비게이션 입력 수단의 각각의 선택은 상기 발생된 입력 시퀀스와 관련된 상기 메모리 내의 상기 식별된 하나 이상의 병음 철자 객체로부터 병음 철자 객체를 선택하는 시스템.
  82. 제 75 항에 있어서,
    언어 모델에 기초한 상기 최고의 사용 빈도를 갖는 중국어 구는 디폴트 중국어 구 선택인 시스템.
  83. 제 75 항에 있어서,
    상기 복수의 입력 수단 중 적어도 하나 이상은 모호하지 않은 네비게이션 입력 수단이고,
    상기 사용자는 상기 네비게이션 입력 수단의 추가적인 선택에 의해 입력 시퀀스의 해석으로서 선택된 병음 철자에 대응하는 중국어 구의 다음 세트를 탐색할 수도 있고, 상기 모호하지 않은 네비게이션 입력 수단 각각의 선택은 상기 발생된 입력 시퀀스와 관련된 상기 메모리 내의 상기 선택된 병음 철자에 대응하는 중국어 구의 다른 리스트를 디스플레이하는 시스템.
  84. 제 74 항에 있어서,
    상기 사용자 입력 장치는 병음 음절에 대한 음조를 입력하도록 활성화될 수 있는 추가적인 입력 수단을 포함하는 시스템.
  85. 제 84 항에 있어서,
    음조를 포함하는 하나 이상의 병음 음절은 상기 대응하는 병음 음절이 음조 없이 입력되는 동일한 입력과 관련되는 시스템.
  86. 청구항 86은(는) 설정등록료 납부시 포기되었습니다.
    제 85 항에 있어서,
    각각의 상기 중국어 문자의 음조는 또한 메모리에 저장되고,
    대응하는 입력 음조와 매칭된 음조를 갖는 문자들을 갖는 중국어 구만 상기 사용자에게 출력되는 시스템.
  87. 청구항 87은(는) 설정등록료 납부시 포기되었습니다.
    제 74 항에 있어서,
    상기 입력 시퀀스에 대응하는 병음 철자 객체가 존재하지 않으면 새로운 객체로서 커스텀 데이터베이스에 추가되는 시스템.
  88. 청구항 88은(는) 설정등록료 납부시 포기되었습니다.
    제 87 항에 있어서,
    상기 메모리 내에 매칭하는 병음 음절 시퀀스가 존재하지 않는 경우에, 단일 및 선택적으로 복수 음절 병음 시퀀스에 기초하여 매칭하는 병음 철자가 자동으로 발생되는 시스템.
  89. 청구항 89은(는) 설정등록료 납부시 포기되었습니다.
    제 88 항에 있어서,
    상기 매칭하는 병음 철자는 사용자 상호작용(user interaction)을 통해 좁혀지는 시스템.
  90. 청구항 90은(는) 설정등록료 납부시 포기되었습니다.
    제 89 항에 있어서,
    상기 자동으로 발생된 병음 철자에 매칭하는 중국어 구는 중국어 구에 대해 매칭하는 병음 철자에 기초하여 자동으로 발생되는 시스템.
  91. 제 90 항에 있어서,
    상기 매칭하는 중국어 구는 사용자 상호작용을 통해 좁혀지는 시스템.
  92. 제 91 항에 있어서,
    상기 매칭하는 중국어 구 중 하나가 선택되면, 상기 입력 시퀀스, 상기 병음 철자 및 상기 매칭하는 중국어 구가 메모리에 추가되는 시스템.
  93. 제 76 항에 있어서,
    상기 중국어 구가 선택되면, 상기 매칭하는 병음 철자 및 중국어 구의 관련된 우선순위를 변경시키는 수단을 더 포함하는 시스템.
  94. 제 74 항에 있어서,
    상기 디스플레이된 병음 철자 및 대응하는 중국어 구로부터 원하는 병음 철자 및 대응하는 중국어 구는 제 2 선택 메커니즘을 통해 지정되는 시스템.
  95. 청구항 95은(는) 설정등록료 납부시 포기되었습니다.
    제 74 항에 있어서,
    상기 복수의 입력 수단 중 하나는 임의의 한 음조 또는 모든 음조와 관련되는 특정 와일드카드 입력 수단과 관련되는 시스템.
  96. 제 74 항에 있어서,
    상기 사용자는 명시적인 음절 분리기호(explicit syllable separator)를 지정할 수 있는 시스템.
  97. 제 74 항에 있어서,
    상기 사용자가 라틴 알파벳의 시퀀스를 입력하면, 상기 사용자는 정확히 매칭하는 병음 철자 및 부분적으로 매칭하는 예측 병음 철자를 리턴받는 시스템.
  98. 제 97 항에 있어서,
    상기 병음 철자는 언어 모델에 기초하여 사용 빈도에 따라서 정렬되는 시스템.
  99. 제 98 항에 있어서,
    상기 언어 모델은
    표의 문자 내의 총 키스트로크의 수와,
    표의 문자의 어근(radical of an ideograph)과,
    어근 및 어근의 스트로크의 수와,
    알파벳 순서와,
    형식적인 텍스트 또는 대화형으로 기록된 텍스트 내의 표의 문자 시퀀스 또는 표음 시퀀스의 발생 빈도와,
    선행 문자 또는 문자들에 후속할 때 표의 문자 시퀀스 또는 표음 시퀀스의 발생 빈도와,
    주위 문장의 적절하거나 일반적인 문법과,
    현재의 문자 시퀀스 엔트리의 애플리케이션 문맥과,
    사용자에 의한 또는 애플리케이션 프로그램 내에서의 표음 시퀀스의 사용의 최근성 또는 반복적인 사용
    중 적어도 하나를 포함하는 시스템.
  100. 제 74 항에 있어서,
    상기 사용자가 병음 철자를 선택하면, 상기 사용자는 하나 이상의 병음 철자 의 리스트를 제공받는 시스템.
  101. 제 100 항에 있어서,
    상기 병음 철자의 리스트는 언어 모델에 기초하여 상기 사용 빈도에 따라서 정렬되는 시스템.
  102. 제 101 항에 있어서,
    상기 언어 모델은
    표의 문자 내의 총 키스트로크의 수와,
    표의 문자의 어근(radical of an ideograph)과,
    어근 및 어근의 스트로크의 수와,
    알파벳 순서와,
    형식적인(formal) 텍스트 또는 대화형으로 기록된 텍스트 내의 표의 문자의 발생 빈도와,
    선행 문자 또는 문자들에 후속할 때 표의 문자의 발생 빈도와,
    주위 문장의 적절하거나 일반적인 문법과,
    현재의 문자 엔트리의 애플리케이션 문맥과,
    사용자에 의한 또는 애플리케이션 프로그램 내에서의 표의 문자들의 사용의최근성 또는 반복적인 사용
    중 적어도 하나를 포함하는 시스템.
  103. 제 74 항에 있어서,
    상기 입력 시퀀스와 상기 병음 철자 간의 매칭은 하나 이상의 혼동 세트(confusion set)의 일부인 시스템.
  104. 제 103 항에 있어서,
    상기 사용자는 어느 혼동 세트가 활성인 지를 선택할 수 있는 시스템.
  105. 제 104 항에 있어서,
    상기 복수의 입력 수단 중 하나는 혼동 세트 또는 잘못된 표기(misspellings)에 기초하여 상기 입력 시퀀스의 다른 병음 철자 해석을 제공하는 것과 관련되는 시스템.
  106. 제 103 항에 있어서,
    상기 시스템은 사용자의 혼동 세트 또는 일반적인 잘못된 표기에 적응하는 시스템.
  107. 표의 문자 입력 방법에 있어서,
    (a) 입력 시퀀스를 사용자 입력 장치에 입력하는 단계로서,
    상기 사용자 입력 장치는
    복수의 입력 수단으로서, 각각의 상기 입력 수단이 복수의 스트로크 또는 표음 문자(phonetic character)와 관련되고, 상기 사용자 입력 장치에 의해 입력 수단이 선택될 때마다 입력 시퀀스가 발생되는, 상기 복수의 입력 수단과,
    복수의 입력 시퀀스와, 각각의 입력 시퀀스와 관련된, 복수의 입력 시퀀스를 포함하는 입력 방법 특정 데이터베이스와, 각각의 입력 시퀀스와 관련된, 철자가 상기 입력 시퀀스에 대응하는 스트로크 시퀀스 세트 또는 상기 입력 시퀀스와 대응하는 표음 시퀀스 세트로 이루어지는 데이터와,
    표의 문자 시퀀스 세트를 포함하는 표의 문자 데이터베이스로서, 각각의 표의 문자는 표의 문자 인덱스와, 대응하는 스트로크 시퀀스에 대한 복수의 스트로크 인덱스와, 대응 표음 시퀀스에 대한 복수의 표음 인덱스를 포함하는, 상기 표의 문자 데이터 베이스를 포함하는
    상기 입력 단계와;
    (b) 상기 입력 시퀀스를 상기 입력 방법 특정 데이터베이스와 비교하여 매칭하는 스트로크 엔트리 또는 표음 엔트리에 대한 인덱스 및 상기 매칭하는 스트로크 엔트리 또는 표음 엔트리를 찾아내는 단계와;
    (C) 스트로크 엔트리 또는 표음 엔트리에 대한 상기 매칭하는 인덱스를 매칭하는 표의 문자 인덱스로 변환하는 단계와;
    (d) 상기 매칭하는 표의 문자 인덱스에 의해 상기 표의 문자 데이터베이스로부터 매칭하는 표의 문자 시퀀스를 검색하는 단계와;
    (e) 하나 이상의 상기 매칭된 표의 문자 시퀀스를 선택적으로 디스플레이 하는 단계
    를 포함하는 방법.
  108. 제 107 항에 있어서,
    상기 스트로크 인덱스는 스트로크 입력 시스템 내의 스트로크 시퀀스에 의해 분류된 스트로크의 인덱스인 방법.
  109. 제 108 항에 있어서,
    상기 스트로크 입력 시스템은 5 스트로크(5-stroke) 또는 8 스트로크(8-stroke) 시스템인 방법.
  110. 제 107 항에 있어서,
    상기 표음 인덱스는 표음 입력 시스템 내의 실제 철자에 의해 분류된 표음 문자의 인덱스인 방법.
  111. 제 110 항에 있어서,
    상기 표음 입력 시스템은 병음 체계 또는 Zhuyin 체계인 방법.
  112. 청구항 112은(는) 설정등록료 납부시 포기되었습니다.
    제 107 항에 있어서,
    상기 표음 인덱스는 표음 입력 시스템 내의 입력 수단의 인덱스인 방법.
  113. 제 107 항에 있어서,
    언어 모델(linguistic model)에 따라서 입력 시퀀스와 매칭하는 스트로크 또는 표음 시퀀스를 우선순위화하고 스트로크 또는 표음 시퀀스와 매칭하는 표의 문자 시퀀스를 우선순위화하는 단계를 더 포함하는 방법.
  114. 제 113 항에 있어서,
    상기 언어 모델은
    표의 문자 내의 총 키스트로크의 수와,
    표의 문자의 어근(radical of an ideograph)과,
    어근 및 어근의 스트로크의 수와,
    알파벳 순서와,
    형식적인(formal) 텍스트, 대화형으로 기록된 텍스트 또는 대화형의 말해진 텍스트 내의 표의 문자 시퀀스, 스트로크 시퀀스 또는 표음 시퀀스의 발생 빈도와,
    선행 문자 또는 문자들에 후속할 때 표의 문자 시퀀스, 스트로크 시퀀스 또는 표음 시퀀스의 발생 빈도와,
    주위 문장의 문법과,
    현재의 입력 시퀀스 엔트리의 애플리케이션 문맥과,
    사용자에 의한 또는 애플리케이션 프로그램 내에서의 스트로크, 표음 또는 표의 문자 시퀀스의 사용의 최근성 또는 반복적인 사용
    중 적어도 하나를 포함하는 방법.
  115. 청구항 115은(는) 설정등록료 납부시 포기되었습니다.
    제 107 항에 있어서,
    상기 표음 시퀀스는 단일 음절을 포함하는 방법.
  116. 제 107 항에 있어서,
    상기 표음 시퀀스는 단일 및 복수 음절을 포함하는 방법.
  117. 제 107 항에 있어서,
    상기 표음 시퀀스는 사용자가 발생한 시퀀스를 포함하는 방법.
  118. 제 117 항에 있어서,
    상기 데이터베이스 내에 매칭하는 표음 시퀀스가 존재하지 않는 경우, 단일 및 선택적으로 복수 음절 표음 시퀀스에 기초하여 매칭하는 표음 시퀀스들의 시퀀스가 자동으로 발생되는 방법.
  119. 청구항 119은(는) 설정등록료 납부시 포기되었습니다.
    제 118 항에 있어서,
    상기 매칭하는 표음 시퀀스들의 시퀀스는 사용자 상호작용(user interaction)을 통해 좁혀지는 방법.
  120. 제 118 항에 있어서,
    상기 자동으로 발생된 표음 시퀀스에 매칭하는 표의문자 시퀀스들의 시퀀스는 표의 문자 시퀀스들에 대해 매칭하는 표음 시퀀스들에 기초하여 자동으로 발생되는 방법.
  121. 청구항 121은(는) 설정등록료 납부시 포기되었습니다.
    제 120 항에 있어서,
    상기 매칭하는 표의 문자 시퀀스들의 시퀀스는 사용자 상호작용을 통해 좁혀지는 방법.
  122. 제 113 항에 있어서,
    표의 문자 시퀀스가 선택되면, 상기 매칭하는 표음 시퀀스 및 표의 문자의 시퀀스의 상기 관련된 우선순위를 변경시키는 단계를 더 포함하는 방법.
  123. 제 107 항에 있어서,
    상기 사용자는 명시적인 표의 문자 분리기호(explicit ideographic character separator)를 지정할 수 있는 방법.
  124. 제 107 항에 있어서,
    상기 사용자가 표음 문자의 시퀀스를 입력할 때, 정확히 매칭하는 표음 시퀀스들의 시퀀스 및 부분적으로 매칭하는 예측 시퀀스를 리턴하는 단계를 더 포함하는 방법.
  125. 제 124 항에 있어서,
    상기 표음 시퀀스들의 시퀀스는 언어 모델에 따라서 정렬되는 방법.
  126. 제 125 항에 있어서,
    상기 언어 모델은
    알파벳 순서와,
    형식적인(formal) 텍스트 또는 대화형으로 기록된 텍스트 내의 표의 문자 시퀀스 또는 표음 시퀀스의 발생 빈도와,
    선행 문자 또는 문자들에 후속할 때 표의 문자 시퀀스 또는 표음 시퀀스의 발생 빈도와,
    주위 문장의 문법과,
    현재의 문자 시퀀스 엔트리의 애플리케이션 문맥과,
    사용자에 의한 또는 애플리케이션 프로그램 내에서의 표음 시퀀스의 사용의 최근성 또는 반복적인 사용
    중 적어도 하나를 포함하는 방법.
  127. 제 107 항에 있어서,
    상기 사용자가 표의 문자 시퀀스를 선택하면, 상기 사용자에게 하나 이상의 표의 문자 시퀀스들의 리스트를 제공하는 단계를 더 포함하는 방법.
  128. 제 127 항에 있어서,
    상기 시퀀스들의 리스트는 언어 모델에 따라서 정렬되는 방법.
  129. 제 128 항에 있어서,
    상기 언어 모델은
    표의 문자 내의 총 키스트로크의 수와,
    표의 문자의 어근(radical of an ideograph)과,
    어근 및 어근의 스트로크의 수와,
    알파벳 순서와,
    형식적인(formal) 텍스트 또는 대화형으로 기록된 텍스트 내의 표의 문자의 발생 빈도와,
    선행 문자 또는 문자들에 후속할 때 표의 문자의 발생 빈도와,
    주위 문장의 문법과,
    현재의 문자 엔트리의 애플리케이션 문맥과,
    사용자에 의한 또는 애플리케이션 프로그램 내에서의 표의 문자의 사용의 최근성 또는 반복적인 사용
    중 적어도 하나를 포함하는 방법.
  130. 제 107 항에 있어서,
    상기 사용자는 상기 복수의 음절 단어들 각각에 대해 부분 음절을 입력할 수 있는 방법.
  131. 청구항 131은(는) 설정등록료 납부시 포기되었습니다.
    제 130 항에 있어서,
    상기 각 음절에 대한 부분 키스트로크의 수는 하나인 방법.
  132. 청구항 132은(는) 설정등록료 납부시 포기되었습니다.
    제 107 항에 있어서,
    상기 복수의 입력 수단들 중 하나는 상기 스트로크들 중 0 또는 1과 관련되는 특정 와일드 카드 입력 수단과 관련되는 방법.
  133. 청구항 133은(는) 설정등록료 납부시 포기되었습니다.
    제 107 항에 있어서,
    상기 복수의 입력 수단들 중 하나는 상기 표음 문자들 중 0 또는 1과 관련되는 특정 와일드 카드 입력 수단과 관련되는 방법.
  134. 청구항 134은(는) 설정등록료 납부시 포기되었습니다.
    삭제
  135. 사용자에 의해 입력된 입력 시퀀스를 수신하여 중국어로 텍스트 출력을 발생시키는 시스템에 있어서,
    복수의 입력 수단을 갖는 사용자 입력 장치로서, 각각의 상기 입력 수단은 복수의 스트로크 또는 표음 문자와 관련되고, 상기 사용자 입력 장치에 의해 입력 수단이 선택될 때마다 입력 시퀀스가 발생되는, 상기 사용자 입력 장치와;
    복수의 입력 시퀀스와, 각각의 입력 시퀀스와 관련된, 철자들이 상기 입력 시퀀스에 대응하는 스트로크 시퀀스 세트 또는 상기 입력 시퀀스와 대응하는 표음 시퀀스 세트를 포함하는 입력 방법 특정 데이터베이스와;
    표의 문자 시퀀스 세트를 포함하는 표의 문자 데이터베이스로서, 각각의 표의 문자는 표의 문자 인덱스, 대응하는 스트로크 시퀀스에 대한 복수의 스트로크 인덱스 및 대응하는 표음 시퀀스에 대한 복수의 표음 인덱스를 포함하는, 상기 표의 문자 데이터베이스와;
    상기 입력 시퀀스를 상기 입력 방법 특정 데이터베이스와 비교하여 매칭하는 스트로크 엔트리 또는 표음 엔트리에 대한 인덱스 및 상기 매칭하는 스트로크 엔트리 또는 표음 엔트리를 찾아내는 수단과;
    상기 스트로크 엔트리 또는 표음 엔트리에 대한 상기 매칭하는 인덱스를 매칭하는 표의 문자 인덱스로 변환시키는 수단과;
    상기 매칭하는 표의 문자 인덱스에 의해 상기 표의 문자 데이터베이스로부터 매칭하는 표의 문자 시퀀스를 검색하는 수단과;
    하나 이상의 매칭된 스트로크 또는 표음 엔트리 및 매칭된 표의 문자들을 디스플레이하는 출력 장치
    를 포함하는 시스템.
  136. 청구항 136은(는) 설정등록료 납부시 포기되었습니다.
    제 135 항에 있어서,
    상기 스트로크 인덱스는 스트로크 입력 시스템 내의 스트로크 시퀀스에 의해 분류된 스트로크의 인덱스인 시스템.
  137. 청구항 137은(는) 설정등록료 납부시 포기되었습니다.
    제 136 항에 있어서,
    상기 스트로크 입력 시스템은 5 스트로크(5-stroke) 또는 8 스트로크(8-stroke) 시스템인 시스템.
  138. 청구항 138은(는) 설정등록료 납부시 포기되었습니다.
    제 135 항에 있어서,
    상기 표음 인덱스는 표음 입력 시스템 내의 실제 철자에 의해 분류된 표음 문자의 인덱스인 시스템.
  139. 청구항 139은(는) 설정등록료 납부시 포기되었습니다.
    제 138 항에 있어서,
    상기 표음 입력 시스템은 병음 체계 또는 Zhuyin 체계인 시스템.
  140. 청구항 140은(는) 설정등록료 납부시 포기되었습니다.
    제 135 항에 있어서,
    상기 표음 인덱스는 표음 입력 시스템 내의 입력 수단의 인덱스인 시스템.
  141. 제 135 항에 있어서,
    언어 모델(linguistic model)에 따라서 입력 시퀀스와 매칭하는 스트로크 또는 표음 시퀀스를 우선순위화하고 매칭하는 스트로크 또는 표음 시퀀스와 매칭하는하는 표의 문자 시퀀스를 우선순위화하는 수단을 더 포함하는 시스템.
  142. 제 141 항에 있어서,
    상기 언어 모델은
    표의 문자 내의 총 키스트로크의 수와,
    표의 문자의 어근(radical of an ideograph)과,
    어근 및 어근의 스트로크의 수와,
    알파벳 순서와,
    형식적인(formal) 텍스트, 대화형으로 기록된 텍스트 내의 표의 문자 시퀀스, 스트로크 시퀀스 또는 표음 시퀀스의 발생 빈도와,
    선행 문자 또는 문자들에 후속할 때 표의 문자 시퀀스, 스트로크 시퀀스 또는 표음 시퀀스의 발생 빈도와,
    주위 문장의 문법과,
    현재의 입력 시퀀스 엔트리의 애플리케이션 문맥과,
    사용자에 의한 또는 애플리케이션 프로그램 내에서의 스트로크, 표음 또는 표의 문자 시퀀스의 사용의 최근성 또는 반복적인 사용
    중 적어도 하나를 포함하는 시스템.
  143. 청구항 143은(는) 설정등록료 납부시 포기되었습니다.
    제 135 항에 있어서,
    상기 표음 시퀀스는 단일 음절을 포함하는 시스템.
  144. 제 135 항에 있어서,
    상기 표음 시퀀스는 단일 및 복수 음절을 모두 포함하는 시스템.
  145. 제 135 항에 있어서,
    상기 표음 시퀀스는 사용자가 발생한 시퀀스를 포함하는 시스템.
  146. 제 145 항에 있어서,
    상기 데이터베이스 내에 매칭하는 표음 시퀀스가 존재하지 않는 경우, 단일 및 선택적으로 복수 음절 표음 시퀀스에 기초하여 매칭하는 표음 시퀀스들의 시퀀스가 자동으로 발생되는 시스템.
  147. 청구항 147은(는) 설정등록료 납부시 포기되었습니다.
    제 146 항에 있어서,
    상기 매칭하는 표음 시퀀스들의 시퀀스는 사용자 상호작용(user interaction)을 통해 좁혀지는 시스템.
  148. 제 146 항에 있어서,
    매칭하는 표의 문자 시퀀스들의 시퀀스는 표의 문자 시퀀스들에 대해 매칭하는 표음 시퀀스들에 기초하여 자동으로 발생되는 시스템.
  149. 청구항 149은(는) 설정등록료 납부시 포기되었습니다.
    제 148 항에 있어서,
    상기 매칭하는 표의 문자 시퀀스들의 시퀀스는 사용자 대화를 통해 좁혀지는 시스템.
  150. 제 141 항에 있어서,
    표의 문자 시퀀스가 선택되면, 상기 매칭하는 표음 시퀀스 및 표의 문자의 시퀀스의 상기 관련된 우선순위를 변경시키는 수단을 더 포함하는 시스템.
  151. 제 135 항에 있어서,
    상기 사용자는 상기 표음 음절에 대한 특정 음조(tone)를 지정할 수 있는 시스템.
  152. 제 135 항에 있어서,
    상기 복수의 입력 수단 중 하나는 임의의 한 음조 또는 모든 음조와 관련되는 특정 와일드카드 입력 수단과 관련되는 시스템.
  153. 제 135 항에 있어서,
    상기 사용자는 명시적인 표의 문자 분리기호(explicit ideographic character separator)를 지정할 수 있는 시스템.
  154. 제 135 항에 있어서,
    상기 사용자가 표음 문자의 시퀀스를 입력하면, 사용자는 정확히 매칭하는 표음 시퀀스들의 시퀀스 및 부분적으로 매칭하는 예측 시퀀스를 리턴받는 시스템.
  155. 제 154 항에 있어서,
    상기 시퀀스는 언어 모델에 기초하여 사용 빈도에 따라서 정렬되는 시스템.
  156. 청구항 156은(는) 설정등록료 납부시 포기되었습니다.
    제 155 항에 있어서,
    상기 언어 모델은
    표의 문자 내의 총 키스트로크의 수와,
    표의 문자의 어근(radical of an ideograph)과,
    어근 및 어근의 스트로크의 수와,
    알파벳 순서와,
    형식적인 텍스트 또는 대화형으로 기록된 텍스트 내의 표의 문자 시퀀스 또는 표음 시퀀스의 발생 빈도와,
    선행 문자 또는 문자들에 후속할 때 표의 문자 시퀀스 또는 표음 시퀀스의 발생 빈도와,
    주위 문장의 문법과,
    현재의 문자 시퀀스 엔트리의 애플리케이션 문맥과,
    사용자에 의한 또는 애플리케이션 프로그램 내에서의 표음 시퀀스의 사용의 최근성 또는 반복적인 사용
    중 적어도 하나를 포함하는 시스템.
  157. 제 135 항에 있어서,
    상기 사용자가 표의 문자 시퀀스를 선택하면, 상기 사용자는 하나 이상의 표의 문자 시퀀스들의 리스트를 제공받는 시스템.
  158. 제 157 항에 있어서,
    상기 시퀀스들의 리스트는 언어 모델에 기초하여 상기 사용 빈도에 따라서 정렬되는 시스템.
  159. 청구항 159은(는) 설정등록료 납부시 포기되었습니다.
    제 158 항에 있어서,
    상기 언어 모델은
    표의 문자 내의 총 키스트로크의 수와,
    표의 문자의 어근(radical of an ideograph)과,
    어근 및 어근의 스트로크의 수와,
    알파벳 순서와,
    형식적인(formal) 텍스트 또는 대화형으로 기록된 텍스트 내의 표의 문자의 발생 빈도와,
    선행 문자 또는 문자들에 후속할 때 표의 문자의 발생 빈도와,
    주위 문장의 문법과,
    현재의 문자 엔트리의 애플리케이션 문맥과,
    사용자에 의한 또는 애플리케이션 프로그램 내에서의 표의 문자들의 사용의 최근성 또는 반복적인 사용
    중 적어도 하나를 포함하는 시스템.
  160. 제 135 항에 있어서,
    상기 복수의 입력 수단 중 하나는 스트로크 중 0 또는 1과 관련되는 특정 와일드카드 입력 수단과 관련되는 시스템.
  161. 청구항 161은(는) 설정등록료 납부시 포기되었습니다.
    제 135 항에 있어서,
    상기 복수의 입력 수단 중 하나는 상기 표음 문자들 중 0 또는 1과 관련되는 특정 와일드카드 입력 수단과 관련되는 시스템.
  162. 중국어 텍스트 엔트리에 대한 프로세스를 수행하기 위한 컴퓨터 판독 가능한 형태의 명령어를 포함하는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 있어서,
    상기 프로세스는
    (a) 입력 시퀀스를 사용자 입력 장치에 입력하는 단계로서,
    상기 사용자 입력 장치는
    복수의 입력 수단으로서, 각각의 상기 입력 수단이 복수의 스트로크 또는 표음 문자(phonetic character)와 관련되고, 상기 사용자 입력 장치에 의해 입력 수단이 선택될 때마다 입력 시퀀스가 발생되는, 상기 복수의 입력 수단과,
    복수의 입력 시퀀스와, 각각의 입력 시퀀스와 관련된, 복수의 입력 시퀀스를 포함하는 입력 방법 특정 데이터베이스와, 각각의 입력 시퀀스와 관련된, 철자가 상기 입력 시퀀스에 대응하는 스트로크 시퀀스 세트 또는 상기 입력 시퀀스와 대응하는 표음 시퀀스 세트로 이루어지는 데이터와,
    표의 문자 시퀀스 세트를 포함하는 표의 문자 데이터베이스로서, 각각의 표의 문자는 표의 문자 인덱스와, 대응하는 스트로크 시퀀스에 대한 복수의 스트로크 인덱스와, 대응하는 표음 시퀀스에 대한 복수의 표음 인덱스를 포함하는, 상기 표의 문자 시퀀스 세트를 포함하는
    상기 입력 단계와;
    (b) 상기 입력 시퀀스를 상기 입력 방법 특정 데이터베이스와 비교하여 매칭하는 스트로크 엔트리 또는 표음 엔트리에 대한 인덱스 및 상기 매칭하는 스트로크 엔트리 또는 표음 엔트리를 찾아내는 단계와;
    (C) 스트로크 엔트리 또는 표음 엔트리에 대한 상기 매칭하는 인덱스를 매칭하는 표의 문자 인덱스로 변환하는 단계와;
    (d) 상기 매칭하는 표의 문자 인덱스에 의해 상기 표의 문자 데이터베이스로부터 매칭하는 표의 문자 시퀀스를 검색하는 단계와;
    (e) 하나 이상의 상기 매칭된 표의 문자 시퀀스를 선택적으로 디스플레이 하는 단계
    를 포함하는, 기록매체.
  163. 제 162 항에 있어서,
    상기 스트로크 인덱스는 스트로크 입력 시스템 내의 스트로크 시퀀스에 의해 분류된 스트로크의 인덱스인, 기록매체.
  164. 제 163 항에 있어서,
    상기 스트로크 입력 시스템은 5 스트로크(5-stroke) 또는 8 스트로크(8-stroke) 시스템인, 기록매체.
  165. 제 162 항에 있어서,
    상기 표음 인덱스는 표음 입력 시스템 내의 실제 철자에 의해 분류된 표음 문자의 인덱스인, 기록매체.
  166. 제 165 항에 있어서,
    상기 표음 입력 시스템은 병음 체계 또는 Zhuyin 체계인, 기록매체.
  167. 제 162 항에 있어서,
    상기 표음 인덱스는 표음 입력 시스템 내의 입력 수단의 인덱스인, 기록매체.
  168. 제 162 항에 있어서,
    상기 프로세스는 언어 모델(linguistic model)에 따라서 입력 시퀀스와 매칭하는 스트로크 또는 표음 시퀀스를 우선순위화하고 스트로크 또는 표음 시퀀스와 매칭하는 표의 문자 시퀀스를 우선순위화하는 단계를 더 포함하는, 기록매체.
  169. 제 168 항에 있어서,
    상기 언어 모델은
    표의 문자 내의 총 키스트로크의 수와,
    표의 문자의 어근(radical of an ideograph)과,
    어근 및 어근의 스트로크의 수와,
    알파벳 순서와,
    형식적인(formal) 텍스트, 대화형으로 기록된 텍스트 또는 대화형의 말해진 텍스트 내의 표의 문자 시퀀스, 스트로크 시퀀스 또는 표음 시퀀스의 발생 빈도와,
    선행 문자 또는 문자들에 후속할 때 표의 문자 시퀀스, 스트로크 시퀀스 또는 표음 시퀀스의 발생 빈도와,
    주위 문장의 문법과,
    현재의 입력 시퀀스 엔트리의 애플리케이션 문맥과,
    사용자에 의한 또는 애플리케이션 프로그램 내에서의 스트로크, 표음 또는 표의 문자 시퀀스의 사용의 최근성 또는 반복적인 사용
    중 적어도 하나를 포함하는, 기록매체.
  170. 청구항 170은(는) 설정등록료 납부시 포기되었습니다.
    제 162 항에 있어서,
    상기 표음 시퀀스는 단일 음절을 포함하는, 기록매체.
  171. 제 162 항에 있어서,
    상기 표음 시퀀스는 단일 및 복수 음절을 포함하는, 기록매체.
  172. 제 162 항에 있어서,
    상기 표음 시퀀스는 사용자가 발생한 시퀀스를 포함하는, 기록매체.
  173. 제 172 항에 있어서,
    상기 데이터베이스 내에 매칭하는 표음 시퀀스가 존재하지 않는 경우, 단일 및 선택적으로 복수 음절 표음 시퀀스에 기초하여 매칭하는 표음 시퀀스들의 시퀀스가 자동으로 발생되는, 기록매체.
  174. 제 173 항에 있어서,
    상기 매칭하는 표음 시퀀스들의 시퀀스는 사용자 상호작용(user interaction)을 통해 좁혀지는, 기록매체.
  175. 제 173 항에 있어서,
    상기 자동으로 발생된 표음 시퀀스에 매칭하는 표의문자 시퀀스들의 시퀀스는 표의 문자 시퀀스들에 대해 매칭하는 표음 시퀀스들에 기초하여 자동으로 발생되는, 기록매체.
  176. 청구항 176은(는) 설정등록료 납부시 포기되었습니다.
    제 175 항에 있어서,
    상기 매칭하는 표의 문자 시퀀스들의 시퀀스는 사용자 상호작용을 통해 좁혀지는, 기록매체.
  177. 제 168 항에 있어서,
    상기 프로세스는 표의 문자 시퀀스가 선택되면, 상기 매칭하는 표음 시퀀스 및 표의 문자의 시퀀스의 상기 관련된 우선순위를 변경시키는 단계를 더 포함하는, 기록매체.
  178. 제 162 항에 있어서,
    상기 사용자는 명시적인 표의 문자 분리기호(explicit ideographic character separator)를 지정할 수 있는, 기록매체.
  179. 제 162 항에 있어서,
    상기 사용자가 표음 문자의 시퀀스를 입력할 때, 정확히 매칭하는 표음 시퀀스들의 시퀀스 및 부분적으로 매칭하는 예측 시퀀스를 리턴하는 단계를 더 포함하는, 기록매체.
  180. 제 179 항에 있어서,
    상기 표음 시퀀스들의 시퀀스는 언어 모델에 따라서 정렬되는, 기록매체.
  181. 제 180 항에 있어서,
    상기 언어 모델은
    표의 문자 내의 총 키스트로크의 수와,
    표의 문자의 어근(radical of an ideograph)과,
    어근 및 어근의 스트로크의 수와,
    알파벳 순서와,
    형식적인(formal) 텍스트 또는 대화형으로 기록된 텍스트 내의 표의 문자 시퀀스 또는 표음 시퀀스의 발생 빈도와,
    선행 문자 또는 문자들에 후속할 때 표의 문자 시퀀스 또는 표음 시퀀스의 발생 빈도와,
    주위 문장의 문법과,
    현재의 문자 시퀀스 엔트리의 애플리케이션 문맥과,
    사용자에 의한 또는 애플리케이션 프로그램 내에서의 표음 시퀀스의 사용의 최근성 또는 반복적인 사용
    중 적어도 하나를 포함하는, 기록매체.
  182. 제 162 항에 있어서,
    상기 프로세스는 상기 사용자가 표의 문자 시퀀스를 선택하면, 상기 사용자에게 하나 이상의 표의 문자 시퀀스들의 리스트를 제공하는 단계를 더 포함하는, 기록매체.
  183. 제 182 항에 있어서,
    상기 시퀀스들의 리스트는 언어 모델에 따라서 정렬되는, 기록매체.
  184. 제 183 항에 있어서,
    상기 언어 모델은
    표의 문자 내의 총 키스트로크의 수와,
    표의 문자의 어근(radical of an ideograph)과,
    어근 및 어근의 스트로크의 수와,
    알파벳 순서와,
    형식적인(formal) 텍스트 또는 대화형으로 기록된 텍스트 내의 표의 문자의 발생 빈도와,
    선행 문자 또는 문자들에 후속할 때 표의 문자의 발생 빈도와,
    주위 문장의 문법과,
    현재의 문자 엔트리의 애플리케이션 문맥과,
    사용자에 의한 또는 애플리케이션 프로그램 내에서의 표의 문자의 사용의 최근성 또는 반복적인 사용
    중 적어도 하나를 포함하는, 기록매체.
  185. 제 162 항에 있어서,
    상기 사용자는 상기 복수의 음절 단어들 각각에 대해 부분 음절을 입력할 수 있는, 기록매체.
  186. 청구항 186은(는) 설정등록료 납부시 포기되었습니다.
    제 185 항에 있어서,
    상기 각 음절에 대한 부분 키스트로크의 수는 하나인, 기록매체.
  187. 청구항 187은(는) 설정등록료 납부시 포기되었습니다.
    제 162 항에 있어서,
    상기 복수의 입력 수단들 중 하나는 상기 스트로크들 중 0 또는 1과 관련되는 특정 와일드 카드 입력 수단과 관련되는, 기록매체.
  188. 청구항 188은(는) 설정등록료 납부시 포기되었습니다.
    제 162 항에 있어서,
    상기 복수의 입력 수단들 중 하나는 상기 표음 문자들 중 0 또는 1과 관련되는 특정 와일드 카드 입력 수단과 관련되는, 기록매체.
KR1020040060068A 2003-07-30 2004-07-30 표음 입력 모호성 제거 시스템 및 방법 KR100656736B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US10/631,543 US7395203B2 (en) 2003-07-30 2003-07-30 System and method for disambiguating phonetic input
US10/631,543 2003-07-30
US10/803,255 US20050027534A1 (en) 2003-07-30 2004-03-17 Phonetic and stroke input methods of Chinese characters and phrases
US10/803,255 2004-03-17

Publications (2)

Publication Number Publication Date
KR20050014738A KR20050014738A (ko) 2005-02-07
KR100656736B1 true KR100656736B1 (ko) 2006-12-12

Family

ID=34119219

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040060068A KR100656736B1 (ko) 2003-07-30 2004-07-30 표음 입력 모호성 제거 시스템 및 방법

Country Status (6)

Country Link
US (1) US20050027534A1 (ko)
JP (1) JP2005202917A (ko)
KR (1) KR100656736B1 (ko)
CN (1) CN100549915C (ko)
TW (1) TWI293455B (ko)
WO (1) WO2005013054A2 (ko)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8200475B2 (en) 2004-02-13 2012-06-12 Microsoft Corporation Phonetic-based text input method
CN1704882A (zh) * 2004-05-26 2005-12-07 微软公司 使用键盘的亚洲语言输入
CN100437441C (zh) * 2004-05-31 2008-11-26 诺基亚(中国)投资有限公司 用于输入中文汉字短语的方法和设备
US7197184B2 (en) * 2004-09-30 2007-03-27 Nokia Corporation ZhuYin symbol and tone mark input method, and electronic device
US7599830B2 (en) 2005-03-16 2009-10-06 Research In Motion Limited Handheld electronic device with reduced keyboard and associated method of providing quick text entry in a message
CN1834865B (zh) * 2005-03-18 2010-04-28 马贤亮 一种小键盘上数字编码的汉语拼音和注音多字连续输入法
US7573404B2 (en) * 2005-07-28 2009-08-11 Research In Motion Limited Handheld electronic device with disambiguation of compound word text input employing separating input
US20070277118A1 (en) * 2006-05-23 2007-11-29 Microsoft Corporation Microsoft Patent Group Providing suggestion lists for phonetic input
US7565624B2 (en) 2006-06-30 2009-07-21 Research In Motion Limited Method of learning character segments during text input, and associated handheld electronic device
US7665037B2 (en) * 2006-06-30 2010-02-16 Research In Motion Limited Method of learning character segments from received text, and associated handheld electronic device
US8395586B2 (en) 2006-06-30 2013-03-12 Research In Motion Limited Method of learning a context of a segment of text, and associated handheld electronic device
US7664632B2 (en) * 2006-11-10 2010-02-16 Research In Motion Limited Method of using visual separators to indicate additional character combination choices on a handheld electronic device and associated apparatus
US20080154576A1 (en) * 2006-12-21 2008-06-26 Jianchao Wu Processing of reduced-set user input text with selected one of multiple vocabularies and resolution modalities
US8316295B2 (en) * 2007-03-01 2012-11-20 Microsoft Corporation Shared language model
US8677237B2 (en) * 2007-03-01 2014-03-18 Microsoft Corporation Integrated pinyin and stroke input
US20080211777A1 (en) * 2007-03-01 2008-09-04 Microsoft Corporation Stroke number input
US8103499B2 (en) * 2007-03-22 2012-01-24 Tegic Communications, Inc. Disambiguation of telephone style key presses to yield Chinese text using segmentation and selective shifting
CN105204617B (zh) * 2007-04-11 2018-12-14 谷歌有限责任公司 用于输入法编辑器集成的方法和系统
US8365071B2 (en) * 2007-08-31 2013-01-29 Research In Motion Limited Handheld electronic device and associated method enabling phonetic text input in a text disambiguation environment and outputting an improved lookup window
US8413049B2 (en) * 2007-08-31 2013-04-02 Research In Motion Limited Handheld electronic device and associated method enabling the generation of a proposed character interpretation of a phonetic text input in a text disambiguation environment
US20090060339A1 (en) * 2007-09-04 2009-03-05 Sutoyo Lim Method of organizing chinese characters
US9733724B2 (en) * 2008-01-13 2017-08-15 Aberra Molla Phonetic keyboards
CN101266520B (zh) * 2008-04-18 2013-03-27 上海触乐信息科技有限公司 一种可实现灵活键盘布局的系统
US20100149190A1 (en) * 2008-12-11 2010-06-17 Nokia Corporation Method, apparatus and computer program product for providing an input order independent character input mechanism
US8798983B2 (en) * 2009-03-30 2014-08-05 Microsoft Corporation Adaptation for statistical language model
US9104244B2 (en) * 2009-06-05 2015-08-11 Yahoo! Inc. All-in-one Chinese character input method
TWI468986B (zh) * 2010-05-17 2015-01-11 Htc Corp 電子裝置、其輸入方法與電腦程式產品
CN102314334A (zh) * 2010-06-30 2012-01-11 百度在线网络技术(北京)有限公司 一种用于缓存用户对应用程序输入的内容的方法和设备
US10664454B2 (en) * 2010-07-30 2020-05-26 Wai-Lin Maw Fill in the blanks word completion system
US9465798B2 (en) * 2010-10-08 2016-10-11 Iq Technology Inc. Single word and multi-word term integrating system and a method thereof
SG184583A1 (en) * 2011-03-07 2012-10-30 Creative Tech Ltd A device for facilitating efficient learning and a processing method in association thereto
US8725497B2 (en) * 2011-10-05 2014-05-13 Daniel M. Wang System and method for detecting and correcting mismatched Chinese character
CN103106214B (zh) * 2011-11-14 2016-02-24 索尼爱立信移动通讯有限公司 一种候选词组输出方法和电子设备
CN103096154A (zh) * 2012-12-20 2013-05-08 四川长虹电器股份有限公司 基于传统遥控器的拼音输入方法
CN103744535B (zh) * 2014-01-10 2017-01-18 李正才 同音五笔输入法
CN104808806B (zh) * 2014-01-28 2019-10-25 北京三星通信技术研究有限公司 根据不确定性信息实现汉字输入的方法和装置
EP2958010A1 (en) 2014-06-20 2015-12-23 Thomson Licensing Apparatus and method for controlling the apparatus by a user
CN104317851A (zh) * 2014-10-14 2015-01-28 小米科技有限责任公司 词汇提示方法和装置
CN104809102B (zh) * 2015-04-01 2018-10-16 北京奇虎科技有限公司 一种基于输入的显示候选词的方法和装置
CN105225546A (zh) * 2015-11-12 2016-01-06 顾珺 一种采集课堂教学过程数据的装置及系统
CN106991184A (zh) * 2017-03-29 2017-07-28 赵现隆 基于字型及笔划的汉字检索方法
CN107329585A (zh) * 2017-06-28 2017-11-07 北京百度网讯科技有限公司 用于输入文字的方法和装置
CN112598768B (zh) * 2021-03-04 2021-05-25 中国科学院自动化研究所 常用字体汉字笔画拆解方法、系统、装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030005546A (ko) * 2001-07-09 2003-01-23 엘지전자 주식회사 휴대용 단말기의 한자 입력방법

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4096934A (en) * 1975-10-15 1978-06-27 Philip George Kirmser Method and apparatus for reproducing desired ideographs
US4679951A (en) * 1979-11-06 1987-07-14 Cornell Research Foundation, Inc. Electronic keyboard system and method for reproducing selected symbolic language characters
US4379288A (en) * 1980-03-11 1983-04-05 Leung Daniel L Means for encoding ideographic characters
US4544276A (en) * 1983-03-21 1985-10-01 Cornell Research Foundation, Inc. Method and apparatus for typing Japanese text using multiple systems
US5212638A (en) * 1983-11-14 1993-05-18 Colman Bernath Alphabetic keyboard arrangement for typing Mandarin Chinese phonetic data
US5164900A (en) * 1983-11-14 1992-11-17 Colman Bernath Method and device for phonetically encoding Chinese textual data for data processing entry
CN1003890B (zh) * 1985-04-01 1989-04-12 安子介 安子介式汉字笔形电脑编码法及其键盘
US5175803A (en) * 1985-06-14 1992-12-29 Yeh Victor C Method and apparatus for data processing and word processing in Chinese using a phonetic Chinese language
US4951202A (en) * 1986-05-19 1990-08-21 Yan Miin J Oriental language processing system
CN1023916C (zh) * 1989-06-19 1994-03-02 张道政 简繁五笔字根汉字输入系统
CN1015218B (zh) * 1989-11-27 1991-12-25 郑易里 字根编码输入法及其设备
US5270927A (en) * 1990-09-10 1993-12-14 At&T Bell Laboratories Method for conversion of phonetic Chinese to character Chinese
CN1026525C (zh) * 1992-01-15 1994-11-09 汤建民 智能五笔双拼码计算机汉字输入方法
US5319386A (en) * 1992-08-04 1994-06-07 Gunn Gary J Ideographic character selection method and apparatus
US5410306A (en) * 1993-10-27 1995-04-25 Ye; Liana X. Chinese phrasal stepcode
US6014615A (en) * 1994-08-16 2000-01-11 International Business Machines Corporaiton System and method for processing morphological and syntactical analyses of inputted Chinese language phrases
SG42314A1 (en) * 1995-01-30 1997-08-15 Mitsubishi Electric Corp Language processing apparatus and method
US5999895A (en) * 1995-07-24 1999-12-07 Forest; Donald K. Sound operated menu method and apparatus
US5893133A (en) * 1995-08-16 1999-04-06 International Business Machines Corporation Keyboard for a system and method for processing Chinese language text
US5903861A (en) * 1995-12-12 1999-05-11 Chan; Kun C. Method for specifically converting non-phonetic characters representing vocabulary in languages into surrogate words for inputting into a computer
US5952942A (en) * 1996-11-21 1999-09-14 Motorola, Inc. Method and device for input of text messages from a keypad
US6292768B1 (en) * 1996-12-10 2001-09-18 Kun Chun Chan Method for converting non-phonetic characters into surrogate words for inputting into a computer
US6009444A (en) * 1997-02-24 1999-12-28 Motorola, Inc. Text input device and method
US6094634A (en) * 1997-03-26 2000-07-25 Fujitsu Limited Data compressing apparatus, data decompressing apparatus, data compressing method, data decompressing method, and program recording medium
CA2292959A1 (en) * 1997-05-06 1998-11-12 Speechworks International, Inc. System and method for developing interactive speech applications
US6054941A (en) * 1997-05-27 2000-04-25 Motorola, Inc. Apparatus and method for inputting ideographic characters
US6005498A (en) * 1997-10-29 1999-12-21 Motorola, Inc. Reduced keypad entry apparatus and method
GB2333386B (en) * 1998-01-14 2002-06-12 Nokia Mobile Phones Ltd Method and apparatus for inputting information
AUPP665398A0 (en) * 1998-10-22 1998-11-12 Charactech Pty. Limited Chinese keyboard, input devices, methods and systems
US6362752B1 (en) * 1998-12-23 2002-03-26 Motorola, Inc. Keypad with strokes assigned to key for ideographic text input
US6801659B1 (en) * 1999-01-04 2004-10-05 Zi Technology Corporation Ltd. Text input system for ideographic and nonideographic languages
FI112978B (fi) * 1999-09-17 2004-02-13 Nokia Corp Symbolien syöttö
US6848080B1 (en) * 1999-11-05 2005-01-25 Microsoft Corporation Language input architecture for converting one text form to another text form with tolerance to spelling, typographical, and conversion errors
JP2001166868A (ja) * 1999-12-08 2001-06-22 Matsushita Electric Ind Co Ltd 数字キーパッドによる中国語ピンイン入力方法及び装置
US7277732B2 (en) * 2000-10-13 2007-10-02 Microsoft Corporation Language input system for mobile devices
US6982658B2 (en) * 2001-03-22 2006-01-03 Motorola, Inc. Keypad layout for alphabetic symbol input
EP1417824A4 (en) * 2001-07-18 2006-09-13 Min-Kyum Kim DEVICE AND METHOD FOR ENTERING ALPHABETIC CHARACTERS
US7949513B2 (en) * 2002-01-22 2011-05-24 Zi Corporation Of Canada, Inc. Language module and method for use with text processing devices
US6864809B2 (en) * 2002-02-28 2005-03-08 Zi Technology Corporation Ltd Korean language predictive mechanism for text entry by a user
US7020849B1 (en) * 2002-05-31 2006-03-28 Openwave Systems Inc. Dynamic display for communication devices
US8276066B2 (en) * 2002-06-05 2012-09-25 Rongbin Su Input method for optimizing digitize operation code for the world characters information and information processing system thereof
US20040163032A1 (en) * 2002-12-17 2004-08-19 Jin Guo Ambiguity resolution for predictive text entry

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030005546A (ko) * 2001-07-09 2003-01-23 엘지전자 주식회사 휴대용 단말기의 한자 입력방법

Also Published As

Publication number Publication date
CN1648828A (zh) 2005-08-03
CN100549915C (zh) 2009-10-14
WO2005013054A2 (en) 2005-02-10
WO2005013054A3 (en) 2007-11-01
TW200511208A (en) 2005-03-16
TWI293455B (en) 2008-02-11
JP2005202917A (ja) 2005-07-28
KR20050014738A (ko) 2005-02-07
US20050027534A1 (en) 2005-02-03

Similar Documents

Publication Publication Date Title
KR100656736B1 (ko) 표음 입력 모호성 제거 시스템 및 방법
US7395203B2 (en) System and method for disambiguating phonetic input
US7174288B2 (en) Multi-modal entry of ideogrammatic languages
JP5501625B2 (ja) 不確定なテキスト入力から明確な文字をフィルタリングする装置及び方法
JP4829901B2 (ja) マニュアルでエントリされた不確定なテキスト入力を音声入力を使用して確定する方法および装置
US8606582B2 (en) Multimodal disambiguation of speech recognition
US6636162B1 (en) Reduced keyboard text input system for the Japanese language
US7636083B2 (en) Method and apparatus for text input in various languages
US7881936B2 (en) Multimodal disambiguation of speech recognition
US6646573B1 (en) Reduced keyboard text input system for the Japanese language
KR100912753B1 (ko) 언어 입력 인식 방법, 기계 판독 가능 매체, 데이터 처리시스템, 사용자 언어 입력 처리 방법 및 언어 입력 예측방법
CA2496872C (en) Phonetic and stroke input methods of chinese characters and phrases
EP1214707A1 (en) Multimodal data input device
JPH11312046A (ja) 音声仮名文字の入力順序を生成するための入力システム
JP3492981B2 (ja) 音声仮名文字の入力順序を生成するための入力システム
JP2798931B2 (ja) 中国語の語音区切方式および語音漢字変換方式
JPH0991278A (ja) 文書作成装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121123

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20131119

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20141124

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20151118

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20161123

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20171207

Year of fee payment: 12

LAPS Lapse due to unpaid annual fee