CN100362455C - 以词为单位的数字化汉字计算机输入方法 - Google Patents

以词为单位的数字化汉字计算机输入方法 Download PDF

Info

Publication number
CN100362455C
CN100362455C CNB031537553A CN03153755A CN100362455C CN 100362455 C CN100362455 C CN 100362455C CN B031537553 A CNB031537553 A CN B031537553A CN 03153755 A CN03153755 A CN 03153755A CN 100362455 C CN100362455 C CN 100362455C
Authority
CN
China
Prior art keywords
sign indicating
indicating number
chinese
code
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB031537553A
Other languages
English (en)
Other versions
CN1485722A (zh
Inventor
刘向东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CNB031537553A priority Critical patent/CN100362455C/zh
Publication of CN1485722A publication Critical patent/CN1485722A/zh
Priority to PCT/CN2004/000967 priority patent/WO2005043369A1/zh
Priority to CN2004800234193A priority patent/CN1836199B/zh
Application granted granted Critical
Publication of CN100362455C publication Critical patent/CN100362455C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明属于中文信息处理在计算机及通讯领域方面的应用,是在中国发明专利ZL 95102608.9基础上进行再创造所产生的发明。针对目前数字键盘上汉字输入速度慢、效率低的问题,根据汉语拼音归纳出音码及声调码,以词为单位,对单字词、双字词、3字词、4字词、5字词、5字以上词分别按不同规则输入,且单字词可兼容标准汉语拼音输入。任何词编码长度不超过6码,巧妙地解决了使用十个数字键以词为单位输入汉字的难题。本发明码长短,重码率低,输入效率高;附和汉字和汉语的传统知识,科学、系统、合理,学习起点低,易学易用,编码自然流畅;通用性强,可对所有汉字编码输入,有助于普通话的推行与传播,有助于汉语文化的传播。

Description

以词为单位的数字化汉字计算机输入方法
技术领域
本发明是一种以词为单位的数字化汉字计算机输入方法,根据汉语拼音归纳出音码及声调码,以词为单位,用音码和声调码按规则依次击键输入汉字。本发明属于中文信息处理在计算机及通讯领域方面的应用,是在中国发明专利ZL95102608.9基础上进行再创造所产生的发明。
背景技术
目前,计算机出现了膝上型、掌上型、微型化的趋势,手机逐渐出现了具备计算机各项功能的趋势,PDA、机顶盒、电子书、手持终端、家用电器以及固定电话等也都迫切需要用十个数字键方便、快捷地输入中文信息,这就要求我们将现有的主要使用英文字母编码的汉字输入方法转变为主要使用十个数字键编码的数字化汉字输入方法。发明人于1995年根据《汉语拼音方案》、《汉语拼音正词法基本规则》等规范的汉语知识,发明了拼音混合输入技术(中国专利ZL 95102608.9),使主要使用汉语拼音编码的计算机汉字输入变得更为快捷和便利。在该发明中,提出了音码I和音码II的概念。将不带声调符号的汉字拼音中的zh、ch、sh、ng、ü分别变换为
Figure C0315375500041
_、η、v,构成压缩拼音码;当压缩拼音码的码长为1时,重复该压缩拼音码构成拼音码,当压缩拼音码的码长大于1时,取压缩拼音码构成拼音码;将拼音码的第一码定为音码I,将除第一码之外的拼音码定为音码II。
但是,在掌上型、微型化电脑以及手机、PDA、机顶盒、电子书、手持终端、家用电器、固定电话等领域,汉字输入的效率还比较低。在手机领域输入汉字方面应用较多的是美国特捷通讯(TegicCommunications)公司的T9、摩托罗拉(Motorola)公司的iTAP和加拿大字源(Zi)公司的字能(eZiText)中文输入法,其拼音输入法主要使用2、3、4、5、6、7、8、9这八个数字键,以先输入单字再附加联想功能的方式输入,效率远低于PC机上以词为单位的汉字输入方法。
在这些领域,目前主要的拼音输入方法都是以字为单位输入汉字的主要原因是:如果使用全码(不使用声调),任何一个单字词的汉语拼音码长为1-6码,双字词为2-12码,三字词则为3-18码……编码长,歧义多,不便于输入。如果使用简码,则会增加音节的重码数,反过来也会影响输入效率。
本发明对拼音混合输入技术加以改造,利用其音码I和音码II的定义,并增加了声调码的概念,对单字词、双字词、3字词、4字词、5字词、5字以上的词分别按照不同规则输入,并在单字词输入过程中兼容标准汉语拼音输入。任何一个词的编码长度都不超过6码,巧妙地解决了使用1、2、3、4、5、6、7、8、9、0十个数字键输入汉字,特别是如何以词为单位输入汉字的难题。
发明内容
取中国发明专利ZL95102608.9定义的30个音码,即a、b、c、d、e、f、g、h、i、j、k、l、m、n、o、p、q、r、s、t、u、v、w、x、y、z、
Figure C0315375500042
_、η,并将其分别定义在1、2、3、4、5、6、7、8、9、0十个数字键上,将阴平1、阳平2、上声3、去声4、轻声5这五个声调码分别定义在1、2、3、4、5五个数字键上,使用任何包含1、2、3、4、5、6、7、8、9、0这十个键的数字化键盘,用音码和声调码对词进行编码,且任何一个词的编码长度都短于或等于6码。
本发明所述的汉字计算机输入方法包括:
(1)取中国发明专利ZL95102608.9所述的音码I+音码II,构成汉字音码(编码长度为2-4码)。
(2)单字词由构成该词的汉字的音码输入。
(3)双字词由构成该词的首字音码+次字音码(总长度长于6码的取其前6码)输入。
(4)三字词由构成该词首字的音码I+后两个汉字的音码(总长度长于6码的取其前6码)输入。
(5)四字词由构成该词除最后一个汉字外所有汉字的音码I+最后一个汉字的音码(总长度长于6码的取其前6码)输入。
(6)五字词由构成该词除最后一个汉字外所有汉字的音码I+最后一个汉字音码的前两码输入。
(7)五字以上的词由构成该词的前五个汉字和最后一个汉字的音码I输入。
(8)上述(3)-(5),当编码长度短于6码时,可在该词的编码后加最后一个汉字的声调码。
为兼容标准汉语拼音,上述方法可改进:任何单字词,可用构成该词的汉字的标准汉语拼音输入。
为进一步提高汉字输入的效率,还可采用简码进行输入:任何一个词的编码可省去其除第一码外的最后一码,或最后两码,或最后三码,或最后四码,或最后五码,构成词的简码。
本发明中,音码与十个数字键的对应关系定义方法有两种:
一是
Figure C0315375500051
_、η4个音码分别定义在0、1两个键位上(一般每个键位上定义其中任意两个),或者分别定义在0、1、8三个键位上(例如1、
Figure C0315375500053
8、_:0、η:1或0),剩余的26个音码按照一般手机的定义确定,即:
键位     对应音码
  23456789     adgjmptw     behknqux     cfilorvy sz
这种方法适应了目前手机生产商的定义,仅对键位定义略加扩展。任何一个汉字的编码码长由标准汉语拼音的1-6码,变为音码的2-4码,不但有利于单字词的输入,同时也为实现最长6个数字键以词为单位输入汉字创造了条件。从定义可知,如果不使用声调符号,单字词全码码长为2-4码(如果兼容标准汉语拼音则为1-6码),双字词全码码长为4-6码,三字词、四字词全码码长均为5-6码,五字词及五字以上词全码码长均为6码。如果除单字词外使用声调符号,则单字词全码码长不变,双字词全码码长为5-6码,其他词全码码长均为6码,单字词与非单字词全码不发生重码。与传统的8个数字键对应26个拼音字母的方法相比,这种方法在输入效率方面有十分明显的改善。
但是,这一方法单字词音节重码多(最多6个),主要原因有二:一是n和o、h和i、u和v分别位于同一键位,如226对应ban、can、bao、cao,94对应zh、xi、yi、zi,68对应mu、nu、ou、nv,等;二是p、q、r、s以及w、x、y、z分别位于同一键位,如98对应wu、xu、yu、zu,726对应pan、ran、san、pao、rao、sao,等。
如果单字词兼容标准汉语拼音输入,则该方法优势更明显。用户在学习本方法前,可直接按传统的手机输入方式使用本方法输入,如“帮忙”:用2264(bang)输入“帮”,然后通过联想功能输入“忙”;学习本方法后,可以词为单位输入,如“帮忙”可直接用2206或者22062(简码)或者220620(全码)输入,大大提高了输入效率,实现了平滑切换。
二是重新加以定义:1、2、3、4、5、6、7、8、9、0每个键位分别对应30个音码中的3个音码,且音码a、e、i、o、u、v、n、r、η、h中任何两个都不位于同一键位。
通过分析中国发明专利ZL 95102608.9,可将30个音码分为两类:一是只能用于汉字的音码或汉字的标准汉语拼音第一码的音码,这类音码共19个,即b、p、m、f、d、t、l、k、j、q、x、
Figure C0315375500061
_、z、c、s、y、w,这些音码如果能够尽可能比较均匀地分布在十个数字键上,将有效减少音节重码的发生;二是其他音码,共11个,即a、e、g、h、i、n、o、r、u、v、η(其中a、e、i、n、o、r、u、v、η可用于音码第一码之外),这些音码如果尽可能不在同一个键位上,也可减少音节重码的发生。
这一方法在保留第一种方法优点的同时,有效地解决了单字词音节重码多的问题,音节重码在任何情况下都不超过3个,与第一种方法(最多6个)相比有十分显著的改善,对减少词的重码效果也较为明显,且便于采取变通方法快速选择重码,使输入速度大大提高。
鉴于该方法任何情况下音节重码都不超过3个,在手机等具备*(左)、#(右)、↑(上)、↓(下)和确定键等5个键位的键盘上(或以其他键位代替),可用以下方法对单字词音节的重码进行选择:
(1)在输入过程中音节重码数为1时,不需对音节选择重码,直接用*(左)、#(右)、↑(上)、↓(下)和确定键对词选择重码。具体方法为:如果当前位置显示的就是所输入的词,直接按确定键输入;否则,用*(左)、#(右)、↑(上)、↓(下)四个键进行重码选择,当所需词出现在当前位置时,继续输入下一个词即可,或用确定键选择(以下单字词音节重码选定后,词的重码选择方法与此相同)。
(2)在输入过程中音节重码数为2时,如果当前位置显示的就是所要输入的词,直接按确定键输入;否则,用#(右)或者↑(上)、↓(下)可直接开始对全部音节对应所有汉字的重码进行选择;又可用*(左)屏蔽掉第一个重码音节对应的全部重码单字词。
(3)在输入过程中音节重码数为3时,如果当前位置显示的就是所要输入的词,直接按确定键输入;否则,用#(右)或者↑(上)、↓(下)可直接开始对全部音节对应所有汉字的重码进行选择;又可用*(左)屏蔽掉第一个重码音节对应的全部重码单字词;还可用**(左左)屏蔽掉第一、第二个重码音节对应的全部重码单字词。
采用这种新型的音节重码选择方法,可大大提高单字词输入的效率。
为进一步提高单字词输入的效率,本发明还可再对上述方法进行改进:单字词可由构成该词的汉字的音码+声调码输入,编码长度为3-5码。
具体实施方式
实施方法一:选定键盘定义为:
键位      音码
1    b    d    a
2    g    j    e
3    z    
Figure C0315375500062
   i
4    p    t    o
5    k    q    u
6    c    
Figure C0315375500063
   η
7    m    n    y
8    h    x    w
9    s    _   v
0    f    l    r
编码规则:单字词不使用声调码,2-4字词如果编码长度不足6码则在该词编码后加最后一个汉字的声调码;单字词兼容标准汉语拼音输入;可使用简码输入汉字。
则生成了一种以词为单位的数字化汉字计算机输入方法。如:“法”编码为“01”(fa);“方”编码为“016”(faη),或“0172”(fang);“方法”编码为“016013”(faηfa+“法”的声调码3);“计算机”编码为“295172”(jsuanj);“不进则退”编码为“123455”(bjztui);“印度尼西亚”编码为“717871”(ydnxya);“中华人民共和国”编码为“380722”
Figure C0315375500071
等。
当然,以上编码具有简码形式。例如:“法”的简码为“0”(f);“方法”的简码可为“0160”(faηf);“计算机”的简码可为“29517”(jsuan);“不进则退”的简码可为“1234”(bjzt);“印度尼西亚”的简码可为“71787”(ydnxy);“中华人民共和国”的简码可为“3807”
Figure C0315375500072
等。
本实施方法中对单字词音节重码进行选择的方法为:79对应nv,直接选择重码即可;55对应ku或者qu,可用#(右)或者↑(上)、↓(下)或确定键直接开始选择全部重码,或者用*(左)直接屏蔽掉第一个重码音节ku对应的全部重码单字词;05对应fu、lu或者ru,可用#(右)或者↑(上)、↓(下)或确定键直接开始选择全部重码,或者用*(左)直接屏蔽掉第一个重码音节fu对应的全部重码单字词,或者用**(左左)直接屏蔽掉第一、第二个重码音节fu、lu对应的全部重码单字词。
实施方法二:选定键盘定义为:
键位    音码
1    
2    a    b    c
3    d    e    f
4    g    h    i
5    j    k    l
6    m    n    o
7    p    q    r    s
8    t    u    v
9    w    x    y    z
0    _   η
编码规则为:不使用声调码,单字词兼容标准汉语拼音输入,允许使用简码输入汉字。
则又生成了一种以词为单位的数字化汉字计算机输入方法。如:“法”的编码为“32”(fa);“方”的编码为“320”(faη),或者“3264”(fang);“方法”的编码为“32032”(faηfa);“计算机”的编码为“578265”(jsuanj),“不进则退”编码为“259884”(bjztui);“印度尼西亚”编码为“936992”(ydnxya);“中华人民共和国”的编码为“147644”
Figure C0315375500074
等。
当然,以上编码具有简码形式。例如:“法”的简码为“3”(f),“方法”的简码可为“3203”(faηf),“计算机”的简码可为“57826”(jsuan),“不进则退”的简码可为“2598”(bjzt);“印度尼西亚”的简码可为“93699”(ydnxy);“中华人民共和国”的简码可为“1476”
Figure C0315375500075
等。
如果所有词使用声调,则“土”的音码+声调码为tu3,可以用883输入;“土地”的音码+“地”的声调码为tudi4,可以用88344输入,等。
本发明与现有技术相比,具有以下显著优点:
1、以词为单位输入,任何词码长最多6码,平均码长短,重码率低,输入效率高;
2、附和汉字和汉语的传统知识,科学、系统、合理,学习的起点低,编码自然流畅,易学易用;
3、通用性强,可对所有汉字编码输入,有助于普通话的推行与传播,有助于汉语文化的传播。

Claims (10)

1.一种以词为单位的数字化汉字计算机输入方法,根据汉语拼音归纳出音码和声调码,将不带声调符号的汉字拼音中的zh、ch、sh、ng、ü分别变换为
Figure C031537550002C2
_、η、v,构成压缩拼音码;当压缩拼音码的码长为1时,重复该压缩拼音码构成拼音码,当压缩拼音码的码长大于1时,取压缩拼音码构成拼音码;将拼音码的第一码定为音码I,将除第一码之外的拼音码定为音码II,以词为单位,用音码按规则输入,其特征在于:
1-1取30个音码,即a、b、c、d、e、f、g、h、i、j、k、l、m、n、o、p、q、r、s、t、u、v、w、x、y、z、
Figure C031537550002C4
_、η,并将其排列在十个数字键上,每个数字键上排列其中3个,且a、e、i、n、o、r、u、v、η、h中任何两个音码不在同一个数字键上;
1-2所述的声调码包括1、2、3、4、5,与声调以及键位的对应关系是:
声调码     声调     键位     12345     阴平阳平上声去声轻声     12345
1-3所述的数字化汉字计算机输入方法包括:
(1)汉字的音码=汉字的音码I+汉字的音码II;
(2)用构成单字词的汉字的音码,顺序击键输入单字词;
(3)用组成双字词的两个汉字的音码,长于6码的取前6码,顺序击键输入双字词;
(4)用首字的音码I+后两个汉字的音码,长于6码的取前6码,,顺序击键输入三字词;
(5)用所有汉字的音码I+最后一个汉字的音码II的前两码,顺序击键输入四字词;
(6)用所有汉字的音码I+最后一个汉字音码II的第一码,顺序击键输入五字词;
(7)用第一、二、三、四、五字和最后一个汉字的音码I,顺序击键输入五字以上的词。
2.根据权利要求1所述的一种以词为单位的数字化汉字计算机输入方法,其特征在于:当2-4字词的编码长度不足6码时,在该词的编码后加最后一个汉字的声调码,顺序击键输入2-4字词。
3.根据权利要求1、2之中任一项所述的一种以词为单位的数字化汉字计算机输入方法,其特征在于:单字词也可以用构成该词的汉字的标准汉语拼音顺序击键输入。
4.根据权利要求3所述的一种以词为单位的数字化汉字计算机输入方法,其特征在于:任何一个词的编码可省去其除第一码外的最后一码,或最后两码,或最后三码,或最后四码,或最后五码,构成词的简码。
5.根据权利要求4所述的一种以词为单位的数字化汉字计算机输入方法,其特征在于十个数字键与30个音码的对应关系如下:
  键位     音  码     234567     a    b    cd    e    fg    h    ij    k    lm    n    op    q    r    s
    89     t    u    vw    x    y    z
其他4个音码分别定义在0、1两个键位上,每个键位上定义其中任意两个;或者音码
Figure C031537550003C2
_分别定义在1、8、0三个键位上,每个键位上定义其中任何一个,η定义在0或1键上。
6.根据权利要求4所述的一种以词为单位的数字化汉字计算机输入方法,其特征在于:z与c与
Figure C031537550003C4
s与_分别被安排在同一键位上。
7.根据权利要求6所述的一种以词为单位的数字化汉字计算机输入方法,其特征在于十个数字键与30个音码的对应关系如下:
Figure C031537550003C5
8.根据权利要求6所述的一种以词为单位的数字化汉字计算机输入方法,其特征在于十个数字键与30个音码的对应关系如下:
Figure C031537550003C6
9.根据权利要求4所述的一种以词为单位的数字化汉字计算机输入方法,其特征在于:单字词可由构成该词的汉字的音码+该汉字的声调码顺序击键输入。
10.根据权利要求4所述的一种以词为单位的数字化汉字计算机输入方法,其特征在于可用以下方法对单字词音节重码多于1个的情况进行单字词音节重码的选择:当单字词音节重码数为2时,用#、↑、↓或者确定键可直接开始对全部音节对应所有汉字的重码进行选择,用*可直接屏蔽掉第一个重码音节对应的全部重码单字词;当单字词音节重码数为3时,用#、↑、↓或者确定键可直接开始对全部音节对应所有汉字的重码进行选择,用*可直接屏蔽掉第一个重码音节对应的全部重码单字词,用**可直接屏蔽掉第一、第二个重码音节对应的全部重码单字词。
CNB031537553A 2003-08-20 2003-08-20 以词为单位的数字化汉字计算机输入方法 Expired - Fee Related CN100362455C (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CNB031537553A CN100362455C (zh) 2003-08-20 2003-08-20 以词为单位的数字化汉字计算机输入方法
PCT/CN2004/000967 WO2005043369A1 (en) 2003-08-20 2004-08-19 Character input method based on “phrase” as unit
CN2004800234193A CN1836199B (zh) 2003-08-20 2004-08-19 以词为单位的字符输入方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB031537553A CN100362455C (zh) 2003-08-20 2003-08-20 以词为单位的数字化汉字计算机输入方法

Publications (2)

Publication Number Publication Date
CN1485722A CN1485722A (zh) 2004-03-31
CN100362455C true CN100362455C (zh) 2008-01-16

Family

ID=34156752

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB031537553A Expired - Fee Related CN100362455C (zh) 2003-08-20 2003-08-20 以词为单位的数字化汉字计算机输入方法

Country Status (1)

Country Link
CN (1) CN100362455C (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1052200A (zh) * 1990-12-06 1991-06-12 李一新 音形义字词兼容编码系列及键盘
CN1015751B (zh) * 1988-04-19 1992-03-04 田文 计算机汉字十笔字拼写输入方法
CN1075896C (zh) * 1994-03-14 2001-12-05 刘向东 以词为单位的音形意汉字计算机输入法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1015751B (zh) * 1988-04-19 1992-03-04 田文 计算机汉字十笔字拼写输入方法
CN1052200A (zh) * 1990-12-06 1991-06-12 李一新 音形义字词兼容编码系列及键盘
CN1075896C (zh) * 1994-03-14 2001-12-05 刘向东 以词为单位的音形意汉字计算机输入法

Also Published As

Publication number Publication date
CN1485722A (zh) 2004-03-31

Similar Documents

Publication Publication Date Title
CN102298449B (zh) 一种快速选字的拼音输入法
CN101751144A (zh) 计算机键盘及数字键盘汉字“声形”输入法
CN108614640A (zh) 李氏三拼汉字输入方案
CN100432903C (zh) 半方盲文数字编码汉字输入法
CN100362455C (zh) 以词为单位的数字化汉字计算机输入方法
CN1195265C (zh) 一种汉语拼音简捷全拼输入法
CN100489746C (zh) 音形汉字输入法
CN101710263A (zh) 计算机键盘及数字键盘汉字输入法
CN1147779C (zh) 一种利用数字码输入汉字的拼音输入方法及其键盘
CN102368177A (zh) 新汉字声韵输入方法及输入键盘
CN1203391C (zh) 左右音形数码汉字电脑输入法及其键盘
CN1290881A (zh) 一种汉字音形数字编码输入方法
CN1042784A (zh) 超级智能联想汉字系统及其输入键盘
CN1836199B (zh) 以词为单位的字符输入方法
CN101976118B (zh) 一种基于音码的数字键盘汉字输入方法
CN104793757B (zh) 汉字输入方法和装置
CN101320295A (zh) 多维文字输入方法及使用该方法的电子产品
CN102279653A (zh) 一种用于输入中文的键盘
CN1121007C (zh) 汉字五音数码输入法
CN107145478B (zh) 一种将汉字语句转换为盲文的方法
CN1079562A (zh) 多种文字数字编码法及其键盘
CN101561712B (zh) 一种应用十二键朝鲜文字键盘输入朝鲜文字的方法
CN100389375C (zh) 一种数字码输入法
CN101017406B (zh) 闪电快速输入法
CN102073384A (zh) 形音一体码

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
DD01 Delivery of document by public notice

Addressee: Liu Xiangdong

Document name: Notification to Pay the Fees

DD01 Delivery of document by public notice

Addressee: Liu Xiangdong

Document name: Notification of Termination of Patent Right

C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080116

Termination date: 20100820