CN1808349A - 中文短语笔画以及语音化文字输入的使用者界面和数据库结构 - Google Patents

中文短语笔画以及语音化文字输入的使用者界面和数据库结构 Download PDF

Info

Publication number
CN1808349A
CN1808349A CN 200510088201 CN200510088201A CN1808349A CN 1808349 A CN1808349 A CN 1808349A CN 200510088201 CN200510088201 CN 200510088201 CN 200510088201 A CN200510088201 A CN 200510088201A CN 1808349 A CN1808349 A CN 1808349A
Authority
CN
China
Prior art keywords
stroke
input
voice
character
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200510088201
Other languages
English (en)
Other versions
CN100501648C (zh
Inventor
张路
范·梅尤尔斯·皮姆
何炼
布拉德·福特·伊桑
吴剑超
赖皇瑜
黄劲钟
梁兆明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AMERICAN ON-LINE
Original Assignee
AMERICAN ON-LINE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AMERICAN ON-LINE filed Critical AMERICAN ON-LINE
Publication of CN1808349A publication Critical patent/CN1808349A/zh
Application granted granted Critical
Publication of CN100501648C publication Critical patent/CN100501648C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

一种笔画及语音化文字输入系统及使用者界面,其具有与T9中的笔画匹配的相同定义,该输入是短语输入;借由对于短语中各字符输入任意数目的笔画而解决中文短语笔画的问题,各字符由一定界符分隔。本发明让使用者能输入多个字符同时保持其单字输入的习惯。使用者无须针对单字输入完整顺序,而是可在任何点停止且输入表示先前字符结束及下一字符开始的定界符。由使用者输入的全部笔画顺序可接着分成由零或多个定界符分隔的复数组。短语接着能借由使用者输入成组的字符而辨识出。较佳的短语匹配准则如下:第一、第二笔画组分别与该短语的第一、第二字符的前导笔画顺序匹配;与已输入笔画顺序匹配的短语将呈现给使用者供选择。

Description

中文短语笔画以及语音化文字输入的使用者界面和数据库结构
技术领域
本发明关于数据输入。本发明尤其是关于一种中文短语笔画以及语音化文字输入的使用者界面及数据库结构。
背景技术
用于目前在市场上可获得的手持装置的中文笔画文字输入办法主要是以字符为基础。在此办法中,用于字符输入的使用者笔画顺序通常是借由终端机的使用者输入所限定的。
单字输入系统是众所周知。请参见(例如)由AOL/Tegic通信公司提供的T9产品(T9)(参见http://www.tegic.com/)。
短语笔画输入系统是由北京d-Ear技术公司所供应(参见http://www.d-ear.com/Frameset.htm)。在d-Ear产品提供短语输入时,其大幅度改变使用者输入单字的方式。因此,若该字符是多于四笔画,使用者将被迫正好输入四笔画。此方法显现至少下列问题:
其不允许捷径,例如若该短语经常被用到,则针对该短语中各字符输入一笔画;及
使用者可能希望针对某些字符输入较多笔画,而针对其他字符输入较少笔画,但d-Ear输入系统不支援此特点。
有利的是提供一种克服已知装置限制的中文短语笔画以及语音化文字输入的使用者界面及数据库结构。
发明内容
本发明提供一种笔画及语音化文字输入输入系统,其实质上具有与T9中使用的笔画匹配的相同定义,其中该输入是短语输入而非字符输入。与字符笔画输入相比,短语笔画输入能让使用者的文字输入更快速且更准确。本发明借由允许使用者针对短语中的各字符输入任意数目的笔画而解决中文短语笔画的问题,其中各字符是由一定界符所分隔。本发明也允许笔画及语音化短语输入方法共享相同的短语数据。依此方式,本发明提供易于学习及有效应用的系统。因此,本发明让使用者能输入多个字符,同时保持其单字输入的习惯。
各中文字符在大陆的国标码(Guo Biao;GB)中均具有标准笔画顺序,其是用于中国大陆的标准(尽管一些使用者可能使用非标准笔画顺序),或用于传统(繁体)字符的BIG5中文字符编码的多种顺序,其在台湾是实质的标准,但未用在中国大陆中。以本发明,使用者无须针对单字输入完整顺序,而是可在任何点停止且输入一表示先前字符结束及下一字符开始的定界符。由使用者输入全部笔画顺序可接着被分成由零或多个定界符分隔的复数组。短语接着能借由成组字符的使用者输入而辨识出。
目前较佳的短语匹配准则如下:
第一笔画组与该短语的第一字符的前导笔画顺序匹配;
第二笔画组与该短语的第二字符等的前导笔画顺序匹配;
与已输入笔画顺序匹配的短语会呈现给使用者供选择。
本发明也提供中文短语笔画的使用者界面设计。
附图说明
图1显示根据本发明用于输入中文短语的装置,其显示一文字区域、一笔画区域及一选择区域;及
图2显示根据本发明用于短语笔画及语音化文字输入的系统的方块图。
具体实施方式
定义、字首语及缩写
以下表1所列的项目在此说明书中具有以下属于其等的意义。
               表1.定义、字首语及缩写
  项目   说明
  PTI   短语的文字输入,即输入中文字词/短语而不用字符接着字符的方式。
  LDB   语言数据库,即储存字符、字词及短语信息之处。
  SID   笔画ID,即由笔画分类的中文字符的索引。
  PID   语音ID,即由语音拼字分类的中文字符的索引。
  万用字符(Wild card)   使用者输入以与任何笔画输入匹配的按键
  笔画   中文字符的最基本建构块。5笔画及8笔画系统是最流行。
  部件   定义为前导笔画位置中的中文字符的一部分。
  Fuzzy(模糊)语音化拼字   对某些群组的使用者是难以区分的一对或多对的语音开始(拼音中的声母)或最后(拼音中的韵母)。
  短语   一或更多字词。
本发明提供一种笔画及语音化文字输入项目系统,其实质上具有与T9中使用的笔画匹配的相同定义,其中该输入是短语输入而非字符输入。本发明借由允许使用者针对短语中的各字符输入笔画万用字符或一部件的任意数目的笔画而解决中文短语笔画的问题,其中各字符是由一定界符所分隔。依此方式,本发明提供易于学习及有效应用的系统。因此,本发明让使用者能输入多个字符,同时保持其单字输入的习惯。
各中文字符在大陆的国家标准(GB)中均具有标准笔画顺序,其是用于中国大陆的标准,或用于传统(繁体)字符的BIG5中文字符编码的多种顺序,其在台湾是实质的标准,但未用在中国大陆。以本发明,使用者无须针对单字输入完整顺序,而是可在任何点停止且输入一表示先前字符结束及下一字符开始的定界符。由使用者输入全部笔画顺序接着可被分成由零或多个定界符分隔的一些组。短语接着能借由使用者输入成组的字符而辨识出。
目前较佳的短语匹配准则是如下:
第一笔画组与该短语的第一字符的前导笔画顺序匹配;
第二笔画组与该短语的第二字符等的前导笔画顺序匹配;
与已输入笔画顺序匹配的短语会呈现给使用者供选择。
中文短语笔画以及语音化文字输入的使用者界面设计显示于图1中,图1例示根据本发明用于输入中文短语的装置,其显示一文字区域10、一笔画区域14及一选择区域12。该装置至少包含一数据输入键盘18,其中1-5按键载有压下该按键时输入的笔画的指示。按键8载有定界符符号;按键8在短语输入及选择期间被压下以指示一字符的结束及下一字符的开始。在图1中,字词11已被输入该文字区域。笔画区域14显示已由使用者输入的笔画顺序,其中该钻石符号指示使用者已输入一定界符。在选择区域(1-4)中有四字词。下一字词13是选择区域中的第三选择(3)。在本发明一T9具体实施例中,使用者压下保持一按键(图1所示实例中的1至4)以选择对应的短语。定界符将使用者输入分成一些笔画顺序。选择区域(1至4)中的所有字词应分别具有与笔画顺序匹配的字符。在此实例中,使用者输入了按键1、按键5、按键8(作为定界符)、按键3及按键4。选择区域(1至4)中的所有短语的第一字符均具有以「15」开始的笔画顺序,且第二字符具有「34…」的笔画顺序。熟悉本技术人士应了解图1中所示的装置仅供示范及范例目的,且可使用许多不同输入装置以实施在此揭露的本发明。
数据结构
图2显示根据本发明用于短语笔画及语音化文字输入的设备的方块图。本发明的数据结构20至少包含二类用于中文字符集的内部ID:笔画ID 21及语音ID 22。
笔画ID被定义为以笔画分类的中文字符的索引。
语音ID被定义为以语音化分类的中文字符,或以按键分类接着语音化分类的中文字符的索引。语音化分类可进一步借由字符的音调分类,以支援短语中的音调选项。
数据结构也包括一字词列表结构25及二用于中文字符集的ID范围查找结构:其一用于笔画23而一用于语音24。数据结构也包括查找表,其可在在语音ID及笔画ID28之间翻译,且从语音ID或笔画ID翻译成中文字符29,例如依统一码(Unicode)编码。
一种中文输入系统可针对单字输入具有一语音或笔画ID范围或二者的查找结构。由于字词列表的供应,该输入系统支援短语文字输入。若系统只支援笔画或语音输入,则在PID及SID间翻译的查找表将不需要。
该核心根据ID范围结构针对给定的笔画寻找笔画或者语音ID范围。字词列表被扫描以找出字符ID落入该等范围中的字词。该等字词接着被送到由频率或其他准则分类的字词缓冲器26,例如借由一按键输入是否确实或部分匹配该字词。
查找表
由于一中文字符可能具有不同语音化发音及多种笔画顺序,查找表必须支援一对多映射。该数据库可包含有关不同发音及不同笔画顺序的频率信息。在本发明较佳具体实施例中的查找表至少包含:笔画ID对语音ID 31、语音ID对笔画ID 28、及语音ID(或笔画ID)对对统一码29、30。
笔画ID对语音ID及语音ID对笔画ID表具有相同格式。共有二表:主表及多值表。
主表是:
0xxx xxxx xxxx xxxx:若无多查找值。X是查找值。
1nnn xxxx xxxx xxxx:若有多值。X指向多值表中的地址,且N+2是多值数。多值(n+2字词)可从该地址读出。假如全部多值的数目超过4k时,各多值表均具有一调整表。
统一码表32可自语音ID或笔画ID表存取。
语音化结构
就使用者的观点而言,语音化系统是设计以先将按键顺序转换成拼字,然后成为中文字符。在内部,第二步骤含有二部分:先从拼字转成语音ID,然后成为中文字符。
从按键至拼字的直译
一语音树是针对使用T9 alpha技术的字词的所有可能语音拼字建立,其是由美国专利第5,818,437号、美国专利第5,953,541号、美国专利第6,011,554号、美国专利第6,307,548号、美国专利第6,286,064号、美国专利第6,307,549号、美国专利第5,945,928号、美国专利第5,187,480号、美国专利第6,646,573号及美国专利第6,636,162号及其他审理中的美国及外国专利所涵盖。该输入按键顺序被馈T9 alpha核心,以产生有效拼字。该等拼字被呈现给使用者作为拼字选择。
从拼字至语音ID的直译
所有可能字节(syllable)的列表是按字母顺序储存、分类。一拼字会与所有可能拼字比较,且若匹配,该等拼字的索引是用以查找语音ID范围。语音ID范围表是用于各拼字的开始语音ID的列表。
字节的拼字是为查找目的而储存。各字节至多可具有六个字母。对于一给定字节,本发明首先搜寻字节表以尝试与该等拼字匹配。如果发现匹配,本发明则用该索引以找到PID范围表中的开始PID。PID范围表中的下一输入是结束PID。所有在该范围内的PID均具有相同拼字。
在短语输入情况中,可把拼字分成一些字节。各字节都可具有对应的PID范围。字词数据被搜寻以匹配一短语中的PID与PID范围且寻找该匹配短语。
音调
若语音ID未含音调信息或PID未依音调分类,需要音调信息表33以支援音调输入。
各PID均应具有依以下格式的本身的音调信息:
pppx xxxx
其中p指用于该拼字的字符的主音调,且x是指用于该拼字的字符的可用音调的位遮罩。
模糊(Mohu)语音化拼字考虑
有关模糊语音化拼字的现象中,一些语音使用者无法分辨一对或多对的语音开始或结束。例如,[hu」及「w」、「z」及「zh」、或「an」及「ang」。这些使用者无法分辨「zan」、「zhan」、「zang」及「zhang」中的差别。
模糊语音化拼字是基于字节树而执行。该核心(在此也称为引擎;参见图2)扫描输入按键顺序。对于各具有作用模糊对的各可能按键结合,核心应用该模糊对且针对语音树检查新按键顺序是否有效。若是,会进一步检查该等指令以确定显现模糊对。若显现该模糊对,则找到拼字匹配。可递回地重复该过程,以得到所有可能的模糊语音化拼字。
字词数据
与输入方法独立的字词信息是分开储存。其应含有依语音ID编码的经常使用字词集的信息。该数据结构是借由前导字符的语音ID分类。
笔画设计
该数据库包括一单字笔画树。在该树中的各节点是一按键,且到该节点的路径可形成按键顺序。如果按键顺序与一字符的笔画顺序匹配,该字符是与该按键顺序或节点是确实匹配。确实匹配及部分匹配的数目被储存在节点中。笔画ID是定义为由笔画分类的字符集内的索引。一些中文字符(尤其在繁体中文中)可用一种以上的笔画顺序写出。不是最常使用或不标准的笔画顺序称为字符的替代笔画顺序。具替代笔画顺序的字符被视为一不同SID输入。
从此结构中,可跟随该树中使用者输入的按键顺序以找到对应的节点。接着可能计算确实匹配笔画ID范围及部分匹配笔画ID范围。
在单字输入中,在SID对PID查找表及PID对统一码查找表或SID对统一码查找表的协助下,笔画ID范围可转换成中文字符的列表。
在短语输入系统中,若使用者输入一可分成多个子顺序的按键顺序,则可针对各子顺序寻找笔画ID范围。笔画ID范围可用作匹配准则,以在字词数据结构中搜寻匹配短语。
虽然本文此是参考较佳具体实施例说明本发明,但熟悉此项技术人士将易于了解其他应用可取代在此提及者,只要不脱离本发明的精神及范畴。因此,本发明只受以下包括的本申请权利要求范围所限制。

Claims (57)

1.一种短语笔画输入的输入设备,至少包含:
一使用者输入装置;
一输入组件,其用于从该笔画输入装置接收使用者笔画输入信息,该组件允许使用者对于一短语中的各字符输入任意数目的笔画,其中二相邻字符是由一使用者输入的定界符分隔;
一区分组件,其用于从该笔画输入装置接收使用者笔画输入信息,该组件将一使用者输入的一全部笔画顺序区分成复数组笔画顺序,该等组是借由零或多种该分界符分隔;
一辨识组件,其是用于从该笔画输入装置接收使用者笔画输入信息,该组件借由使用者输入成组的字符而辨识短语。
2.如权利要求1所述的设备,其特征在于使用者无须对于一单字输入完整的顺序,而是可在任何点停止及输入一定界符,该定界符指示一先前字符的结束及下一字符的开始。
3.如权利要求1所述的设备,其特征在于该文字输入至少包含中文短语笔画文字输入。
4.如权利要求1所述的设备,其特征在于还包含:
一短语匹配组件,其是用于将短语匹配准则应用至输入笔画,以辨识短语输入。
5.如权利要求4所述的设备,其特征在于该短语匹配准则包含:
决定一第一笔画组是否与一短语的第一字符的一前导笔画顺序匹配;及
决定一第二及后续笔画组是否与该短语的个别第二及后续字符的一前导笔画顺序匹配;
其中与该已输入笔画顺序匹配的短语呈现给该使用者以供选择。
6.一种中文短语笔画文字输入设备的使用者界面,至少包含:
一数据输入键盘,其用于接收使用者笔画输入,该键盘包含至少复数笔画输入按键,及至少一定界符输入按键,在短语输入及选择时,该定界符按键指示一字符的结束及下一字符的开始;
一显示器,其用于呈现一中文短语给该使用者,该显示器至少包含一文字区域、一笔画区域及一选择区域;及
一数据结构,其用于:
从该键盘接收使用者笔画输入信息,该键盘允许使用者对于一短语中的各字符输入任意数目的笔画,其中各字符是由一使用者输入的定界符分隔;
从该键盘接收使用者笔画输入信息,且将由一使用者输入的一全部笔画顺序分成复数组,该等组是借由零或多种该分界符分隔;及
从该键盘接收使用者笔画输入信息,且借由使用者输入成组的字符而辨识短语。
7.一种中文短语笔画及语音化文字输入的设备,至少包含:
至少二用于一中文字符集的内部ID,该等内部ID至少包含一笔画ID及一语音ID,其中一笔画ID至少包含一以笔画分类的中文字符的索引;及其中一语音ID至少包含一以语音化分类的中文字符的索引,或一以按键分类接着以语音化分类的中文字符的索引;
一字词列表,其用于支援短语文字输入;及
至少二用于该中文字符集的ID范围查找结构,其中一ID范围查找提供用于笔画输入且一ID范围查找提供用于语音化输入。
8.如权利要求7所述的设备,其特征在于还包含以下任一:
一查找表,其用于在语音ID及笔画ID之间翻译;
一查找表,其用于在笔画ID及语音ID之间翻译;及
一用于从语音ID翻译成该中文字符集中的中文字符的查找表,及一用于从笔画ID翻译成该中文字符集中的中文字符的查找表,上述二查找表中任一查找表。
9.如权利要求7所述的设备,其特征在于还包含:
一音调信息表,其中该语音化分类是借由一字符的音调进一步分类,以支援短语中的音调选项。
10.如权利要求7所述的设备,其特征在于还包含:
一以频率分类的字词缓冲器,其用于从该字词列表接收候选字词及/或短语。
11.如权利要求7所述的设备,其特征在于该查找表支援一对多映射。
12.如权利要求7所述的设备,其特征在于还包含:
一语音化数据库,其至少包含按键顺序信息、拼字及该语音ID。
13.如权利要求7所述的设备,其特征在于该字词列表还包含:
一所有可能拼字的列表,其是按字母顺序分类;
其中一拼字是与所有可能拼字比较,且若匹配,则该拼字的一索引用于查找一语音ID范围;
其中该语音ID范围表至少包含一用于各拼字的结束语音ID的列表。
14.如权利要求13所述的设备,其特征在于还包含:
一拼字表,其中该表内的该等拼字是由语音的开始及最后组成。
15.一种短语笔画输入的方法,其至少包含以下步骤:
提供一使用者笔画输入装置;
从该笔画输入装置接收使用者笔画输入信息,该组件允许使用者对于一短语中的各字符输入任意数目的笔画,其中各字符是由一使用者输入的定界符分隔;
从该笔画输入装置接收使用者笔画输入信息,该组件将由一使用者输入的一全部笔画顺序分成复数组笔画顺序,该等组是借由零或多种该分界符分隔;及
从该笔画输入装置接收使用者笔画输入信息,该组件借由使用者输入成组的字符而辨识短语。
16.如权利要求15所述的方法,其特征在于使用者无须对于一单字输入完整的顺序,而是可在任何点停止及输入一定界符,该定界符指示一先前字符的结束及下一字符的开始。
17.如权利要求15所述的方法,其特征在于该文字输入至少包含中文短语笔画文字输入。
18.如权利要求15所述的方法,其特征在于还包含以下步骤:
将短语匹配准则应用至输入笔画,以辨识短语输入。
19.如权利要求18所述的方法,其特征在于应用短语匹配准则的该步骤至少包含以下步骤:
决定一第一笔画组是否与一短语的第一字符的一前导笔画顺序匹配;及
决定一第二及后续笔画组是否分别与该短语的第二及后续字符的一前导笔画顺序匹配;
其中与该已输入笔画顺序匹配的短语呈现给该使用者供选择。
20.一种用于中文短语笔画文字输入设备的使用者界面方法,其至少包含:
提供一用于接收使用者笔画输入的数据输入键盘,该键盘至少包含至少复数笔画按键及至少一定界符输入按键,在短语输入及选择时,该定界符按键指示一字符的结束及下一字符的开始;
提供一显示器,其用于呈现一中文短语给该使用者,该显示器至少包含一文字区域、一笔画区域及一选择区域;及
从该键盘接收使用者笔画输入信息,该组件允许使用者对于一短语中的各字符输入任意数目的笔画,其中各字符是由一使用者输入定界符分隔;
从该键盘接收使用者笔画输入信息,且将由一使用者输入的一全部笔画顺序分成复数组,该等组是借由零或多种该分界符分隔;及
从该键盘接收使用者笔画输入信息,且借由使用者输入成组的字符以辨识短语。
21.一种中文短语笔画及语音化文字输入的方法,至少包含以下步骤:
提供至少二用于中文字符集的内部ID,该等内部ID至少包含一笔画ID及一语音ID,其中一笔画ID至少包含一以笔画分类的中文字符的索引;及其中一语音ID至少包含一以语音化分类的中文字符的索引,或一以按键分类接着以语音化分类的中文字符的索引;
提供一字词列表,其用于支援短语文字输入;及
提供至少二用于该中文字符集的ID范围查找结构,其中一ID范围查找提供用于笔画输入,且一ID范围查找提供用于语音化输入。
22.如权利要求21所述的方法,其特征在于还包含提供以下任一者的步骤:
一查找表,其用于在语音ID及笔画ID之间翻译;
一查找表,其用于在笔画ID及语音ID之间翻译;及
一用于从语音ID翻译成该中文字符集中的中文字符的查找表,及一用于从笔画ID翻译成该中文字符集中的中文字符的查找表,上述二查找表中任一查找表。
23.如权利要求21所述的方法,其特征在于还包含以下步骤:
提供一音调信息表,其中该语音化分类是借由一字符的音调进一步分类,以支援短语中的音调选项。
24.如权利要求21所述的方法,其特征在于还包含以下步骤:
提供一以频率分类的字词缓冲器,其是用于从该字词列表接收候选字词及/或短语。
25.如权利要求21所述的方法,其特征在于若一字符可具有多种发音及多种笔画顺序,则该等查找表支援一对多映射。
26.如权利要求21所述的方法,其特征在于还包含以下步骤:
提供一语音化数据库,其至少包含按键顺序信息、拼字及该语音ID。
27.如权利要求21所述的方法,其特征在于该字词列表还包含以下步骤:
提供一所有可能拼字的列表,其是按字母顺序分类;
其中一拼字是与所有可能拼字比较,且若匹配,则该拼字的一索引用于查找一语音ID范围;
其中该语音ID范围表至少包含一用于各拼字的结束语音ID的列表。
28.如权利要求27所述的方法,其特征在于还包含以下步骤:
提供一拼字表,其中该表内的该等拼字是由语音开始及最后组成。
29.一种中文语音化文字输入的设备,至少包含:
一语音树,其用于从一按键顺序翻译成拼字;
一语音ID(PID)范围查找表;
语音ID字词数据;及
一查找表,其用于从一PID翻译成中文字符。
30.一种中文短语笔画文字输入的设备,至少包含:
一单字笔画树,其用于笔画ID(SID)范围查找;
笔画ID字词数据;及
一查找表,其用于从一SID翻译成中文字符。
31.一种中文语音化文字输入的设备,其至少包含:
一用于中文字符集的内部ID,该内部ID至少包含一语音ID,该语音ID包含下列之一者:一以语音化分类的中文字符的索引或一以按键分类接着以语音化分类的中文字符的索引;
一字词列表,其用于支援语音化文字输入;及
一用于该中文字符集的ID范围查找结构,其中一ID范围查找提供用于语音化输入。
32.如权利要求31所述的设备,其特征在于还包含:
一查找表,其用于自语音ID翻译成在该中文字符集内的中文字符。
33.如权利要求31所述的设备,其特征在于还包含:
一音调信息表,其中一语音化分类是借由一字符的音调进一步分类,以支援短语中的音调选项。
34.如权利要求31所述的设备,其特征在于还包含:
一以频率分类的字词缓冲器,其用于从该字词列表接收候选字词及/或短语。
35.如权利要求3 1所述的设备,其特征在于该查找表支援一对多映射。
36.如权利要求31所述的设备,其特征在于还包含:
一语音化数据库,其至少包含按键顺序信息、拼字及该语音ID。
37.如权利要求31所述的设备,其特征在于该字词列表还包含:
一所有可能拼字的列表,其是按字母顺序分类;
其中一拼字是与所有可能拼字比较,且若匹配,则该拼字的一索引用于查找一语音ID范围;
其中该语音ID范围表至少包含一用于各拼字的结束语音ID的列表。
38.如权利要求37所述的设备,其特征在于还包含:
一拼字表,其中该表内的该等拼字是由语音开始及最后组成。
39.一种中文语音化文字输入的方法,至少包含以下步骤:
提供一用于中文字符集的内部ID,该内部ID至少包含一语音ID,其中该语音ID至少包含一以语音化分类的中文字符的索引,或一以按键分类接着以语音化分类的中文字符的索引;
提供一字词列表,其用于支援语音化文字输入;及
提供一用于该中文字符集的ID范围查找结构,其中一ID范围查找提供用于语音化输入。
40.如权利要求39所述的方法,其特征在于还包含以下步骤:
提供一查找表,其用于自语音ID翻译成该中文字符集内的中文字符。
41.如权利要求39所述的方法,其特征在于还包含以下步骤:
提供一音调信息表,其中该语音化分类是借由一字符的音调进一步分类,以支援短语中的音调选项。
42.如权利要求39所述的方法,其特征在于还包含以下步骤:
提供一以频率分类的字词缓冲器,其用于从该字词列表接收候选字词及/或短语。
43.如权利要求39所述的方法,其特征在于当一字符可具有多种发音时,该查找表支援一对多映射。
44.如权利要求39所述的方法,其特征在于还包含以下步骤:
提供一语音化数据库,其至少包含按键顺序信息、拼字及该语音ID。
45.如权利要求39所述的方法,其特征在于该字词列表还包含以下步骤:
提供一所有可能拼字的列表,其是按字母顺序分类;
其中一拼字是与所有可能拼字比较,且若匹配,则该拼字的一索引用于查找一语音ID范围;
其中该语音ID范围表至少包含一用于各拼字的结束语音ID的列表。
46.如权利要求45所述的方法,其特征在于还包含以下步骤:
提供一拼字表,其中该表内的该等拼字是由语音的开始及最后组成。
47.如权利要求1所述的设备,其特征在于还包含一用于接收匹配任何笔画输入的使用者笔画输入信息的组件。
48.如权利要求1所述的设备,其特征在于还包含一用于从该笔画输入装置接收使用者笔画输入信息的组件,该组件允许使用者对于一字符输入该字符的一部件。
49.如权利要求1所述的设备,其特征在于由使用者输入的该全部笔画顺序及由该组件分成以零或多种该分界符分隔的该复数组笔画顺序,可被翻译成复数包括中文字符及任何语言的标点数、字母与字词及其组合的符号,该组件用以将使用者输入的该全部笔画顺序分成复数组由零或多种该分界符分隔的笔画顺序。
50.如权利要求1所述的设备,其特征在于还包含一用于从该笔画输入装置接收使用者笔画输入信息的组件,该组件允许使用者依据替代笔画顺序输入一字符。
51.如权利要求1所述的设备,其特征在于用于从该笔画输入装置接收使用者笔画输入信息的该组件支援复数输入系统,该输入系统包括五笔画系统及八笔画系统。
52.如权利要求6所述的使用者界面,其特征在于用于接收使用者笔画输入的该数据输入键盘,还包含一匹配任何笔画输入的一按键。
53.如权利要求29所述的设备,其特征在于还包含一字母按键映射,其支援复数按键映射,包括非标准拼音及BPMF按键映射。
54.如权利要求15所述的方法,其特征在于还包含依据替代笔画顺序输入一字符。
55.如权利要求15所述的方法,其特征在于还包含对于一字符输入该字符的一部件。
56.如权利要求1 5所述的方法,其特征在于还包含将由使用者输入的该全部笔画顺序及由该组件分成以零或多种该分界符分隔的该复数组笔画顺序,翻译成复数包括中文字符及任何语言的标点数、字母与字词及其组合的符号,该组件用以将使用者输入的该全部笔画顺序分成该复数组由零或多种该分界符分隔的笔画顺序。
57.如权利要求7所述的设备,其特征在于用于该中文字符集的该至少二ID范围查找结构,在含有复数位的各ID栏中使用固定长度,其中一位被保留为一指标,用于指示该至少二ID查找结构中的一查找值是一单值或多值,而该栏的该复数位的其余位指示何处可发现多值。
CNB2005100882012A 2004-07-23 2005-07-22 中文短语笔画以及语音化文字输入的使用者界面和数据库结构 Active CN100501648C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US59071304P 2004-07-23 2004-07-23
US60/590,713 2004-07-23
US60/591,465 2004-07-26
US11/040,911 2005-01-21

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CNA2008101743148A Division CN101408804A (zh) 2004-07-23 2005-07-22 中文短语笔画以及语音化文字输入的使用者界面和数据库结构

Publications (2)

Publication Number Publication Date
CN1808349A true CN1808349A (zh) 2006-07-26
CN100501648C CN100501648C (zh) 2009-06-17

Family

ID=36840272

Family Applications (2)

Application Number Title Priority Date Filing Date
CNA2008101743148A Pending CN101408804A (zh) 2004-07-23 2005-07-22 中文短语笔画以及语音化文字输入的使用者界面和数据库结构
CNB2005100882012A Active CN100501648C (zh) 2004-07-23 2005-07-22 中文短语笔画以及语音化文字输入的使用者界面和数据库结构

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CNA2008101743148A Pending CN101408804A (zh) 2004-07-23 2005-07-22 中文短语笔画以及语音化文字输入的使用者界面和数据库结构

Country Status (1)

Country Link
CN (2) CN101408804A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104503597A (zh) * 2014-12-19 2015-04-08 北京奇虎科技有限公司 笔画输入方法、装置和系统

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10289664B2 (en) * 2015-11-12 2019-05-14 Lenovo (Singapore) Pte. Ltd. Text input method for completing a phrase by inputting a first stroke of each logogram in a plurality of logograms

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104503597A (zh) * 2014-12-19 2015-04-08 北京奇虎科技有限公司 笔画输入方法、装置和系统
CN104503597B (zh) * 2014-12-19 2017-12-12 北京奇虎科技有限公司 笔画输入方法、装置和系统

Also Published As

Publication number Publication date
CN101408804A (zh) 2009-04-15
CN100501648C (zh) 2009-06-17

Similar Documents

Publication Publication Date Title
TWI284816B (en) User interface and database structure for Chinese phrasal stroke and phonetic text input
CN1135485C (zh) 利用计算机系统的日文文本字的识别
CN1008016B (zh) 输入处理系统
CN1159661C (zh) 用于中文的标记和命名实体识别的系统
CN1030114C (zh) 汉语发音符号/汉字变换装置及方法
KR20070072723A (ko) 발음 기호를 이용한 문자열 매칭 방법 및 시스템과 그방법을 기록한 컴퓨터 판독 가능한 기록매체
CN1193779A (zh) 中文语句分词方法及其在中文查错系统中的应用
CN103970798A (zh) 数据的搜索和匹配
CN1910573A (zh) 用来识别并分类命名实体的系统
CN1871607A (zh) 标识相关名称
CN1601520A (zh) 识别文本文档中的有机化学名称的系统和方法
CN101751430A (zh) 电子词典模糊检索方法
CN1949211A (zh) 一种新的汉语口语解析方法及装置
US7072880B2 (en) Information retrieval and encoding via substring-number mapping
CN1256688C (zh) 用于中文文本处理系统的中文分词方法
CN1102779C (zh) 中文简繁体字文件转换装置
CN101739142B (zh) 五笔输入系统及方法
CN1737739A (zh) 基于英文键盘的藏文输入法
CN1808349A (zh) 中文短语笔画以及语音化文字输入的使用者界面和数据库结构
CN1114165C (zh) 中文文本中的字词分割方法
CN1694092A (zh) 对含四字节字符的文本进行全文检索的方法
CN1679023A (zh) 创建和使用中文语言数据和用户自纠正数据的方法和系统
CN108595584B (zh) 一种基于数字标记的汉字输出方法和系统
CN1021259C (zh) 英文快速键入的缩码法及键盘
CN102103610A (zh) 一种检索信息、信息处理的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1094053

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1094053

Country of ref document: HK