CN1024227C - 汉字电脑手写模拟输入法 - Google Patents
汉字电脑手写模拟输入法 Download PDFInfo
- Publication number
- CN1024227C CN1024227C CN 92103844 CN92103844A CN1024227C CN 1024227 C CN1024227 C CN 1024227C CN 92103844 CN92103844 CN 92103844 CN 92103844 A CN92103844 A CN 92103844A CN 1024227 C CN1024227 C CN 1024227C
- Authority
- CN
- China
- Prior art keywords
- code
- stroke
- chinese character
- squeeze
- chinese
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明,汉字电脑手写模拟输入法,属于电脑输入设备的领域,其目的是为输入设备创造一种条件,让人们利用键盘像写字一样方便地输入汉字,特别是输入那些不认识的生字。本发明的主要特征是,用依次打入首笔代码、次笔代码,对应中间笔画逐笔敲空格,再打入末笔代码的方法输入汉字。输入操作模拟手写汉字的过程。本发明目前可输入国标GB2312的全部汉字,将来可输入统一编码的大字符集汉字。
Description
本发明属于汉字电脑输入设备的领域。
在电脑系统中,现在普遍采用计算机通用键盘,利用汉字编码,经换码程序转换并输入汉字。
汉字编码可分为两大类。一类是按汉字的形体结构,根据汉字的笔划、部首或字根对汉字进行编码。另一类是按汉字的发音对汉字进行编码。自然还有许多处于这两类之间的以形为主或以音为主的形音或音形结合的编码。
按笔画输入汉字的方法很多,一般的做法是对全部或部分笔画进行编码,没有人直接利用笔画总数这个重要因素,更没有人利用空格键打入中间笔画,由输入控制程序来累计笔画总数。本发明的主要特征就在于利用首笔代码、次笔代码、笔画总数和末笔代码这几项内容输入汉字。采用这种方法输入汉字时,如果中间笔画用空格键打入,由控制程序累计笔画总数,操作过程模拟了一笔一下的写字过程,故称这种输入方法为“手写模拟”法。如果事先数出一个字汉的笔画总数,用数字键直接打入,先后打入的是首笔、次笔、笔画总数和末笔这些代码的字母和数字键,这好象查字典一样。不管输入操作如何,按其技术特征,可把这种方法称为“首次数尾”法。在实际操作过程中,次笔画可以省略并归入中间笔画,打入最为关心的首笔、笔画总数和末笔这三部分内容。因此还可以把这种方法称为“首数尾”法。在本发明的文件中,如果提到“手写模拟”、“首次数尾”或者“首数尾”,所指的都是同一种汉字输入法。
下面是“手写模拟”(“首次数尾”)法的详细说明。
一.“手写模拟”法的设计思想和编码规则
在国家标准GB2312规定的6763个汉字的集合内,双音编码已经非常方便地解决了既易学又快速的汉字输入问题。双音编码不仅适合专业录入员使用,更重要的是为各类工作人员,特别是为文字语言工作者提供了一种以键代笔电脑写作的好工具。但是,如果使用者的汉语拼音基础不佳,对某些汉字拼音不准确,或者遇到一些不认识的生字,这时“手写模拟”法就有了用武之地。
在将来采用的新的大字符集标准中,汉字数增加到两万多以后,各种拼音输入法只能用来输入其中人们认识的三五千字。现在流行的,已经使一般人却步的各种字形笔画类型的输入法更难解决大字符集的问题。到那时,简便易学的“手写模拟”法将会大显身手。特别是在它与双音编码联合使用的情况下,其作用是别的输入方法无法比拟的。
“手写模拟”法是人人会用的计算机汉字输入方法。只要知道一个汉字的第一笔画、第二笔画、笔画总数和最后笔画,打入它们的代码就可以输入这个汉字。必要时再辅以提示行查找选择的方法。利用“手写模拟”法输入汉字时有两种打入代码的方法。一种是打入编码字符,好象查字典一样;另一种是,首、次、末笔打代码,中间笔画敲空格,好象手写汉字一样。后一种方法更加常用。
“首次数尾”法的编码规则非常简单。汉字的首、次、末笔代码取用笔画名称的汉语
拼音的第一个字母,或者声母的双拼代码。至于笔画总数,可直接打入一、两个数字键,或者用空格键逐笔打入中间笔画,由控制程序自动累计得到。
汉字的笔画分为横(包括提)、竖、撇、点(包括捺)、折(包括拐)五类。各种笔画的代码如下:
笔画名称及其拼音 代 码
横heng h(声母)
提ti t(声母)
竖shu s(声母)或u(声母双拼代码)
撇pie p(声母)
点dian d(声母)
捺na n(声母)
折zhe z(声母)或v(声母双拼代码)
拐guai g(声母)
例如输入“中”字,第一笔为竖,打入字母s或u。第二笔为折,打入字母z或v。“中”字共有4笔,打入数字4。最后打入末笔竖的代码s或u。因此,输入“中”字,应打入sz4s或uv4u等。如果省略第二笔代码,这时只要打入s4s或u4u即可输入“中”字。
在上述输入操作中,打入第一笔和第二笔的代码以后必须数清这个汉字的笔画总数,然后才能打入数字键。这里把统计笔画数和打入笔画数分为两步操作,显得麻烦。为了把这两步合为一步,还可以在打入首笔和次笔代码以后,从第3笔开始,也可以在打入首笔代码以后,从第2笔开始,利用敲击空格键的方法把笔画数的统计和打入合为一个步骤,与写字一样,“写”一个笔画,敲一下空格键,一直到末前笔为止,最后再打入末笔代码。
对几种特例需要做特殊安排。仅有一个笔画的单字和部首,例如“一丨丿乙”,首、次、末三个笔画相同,不能利用空格键。仅有两个笔画的单字和部首,例如“二七亻乜”,次笔与末笔相同,也不能利用空格键。仅有三个笔画的单字和部首,如果打入了次笔代码,就不能再打空格键。
二.“首次数尾”编码对照表的数据结构
要在汉字系统中实现“首次数尾”编码方案,必须配置相应的换码程序,执行这个程序可将键入的代码正确无误地转换为相应的汉字。“首次数尾”编码对照表是输入换码程序运行的基础,根据提高检索转换速度和节省存储空间的不同要求,可以有不同的数据结构。这里给出一种兼顾这两种要求的普通结构,但不是最节省存储空间的结构。
“首次数尾”编码的普通对照表分为汉字表和索引表两个部分。汉字表包括系统的全部汉字。汉字表中存放汉字的机内码,每个汉字占两个字节,按笔画数的升序排列。汉字表中的汉字最多允许有32个笔画。如果有多于32笔的汉字,则归入32笔中处理。汉字表按
笔画数分为32个段,编号为0至31。
汉字有5类笔画,其名称和顺序为横、竖、撇、点和折。汉字表的每个笔画段中的汉字按首笔画的顺序排列;首笔画相同的按末笔画的顺序排列;末笔相同的再按次笔画顺序排列;次笔再相同的按相应的国家标准,例如按GB2312的顺序排列。在汉字表的每个笔画段中,汉字按首末两笔的组合分为25个组,编号从0至24。
汉字表结构 笔画段结构
1笔段 第0段 横、横组 第0组
2笔段 第1段 横、竖组 第1组
横、撇组 第2组
横、点组 第3组
32笔段 第31段 横、折组 第4组
竖、横组 第5组
折、点组 第23组
折、折组 第24组
对照表的索引表用来描述汉字表中的上述结构,以利于换码程序的快速检索。索引表分为32项,编号从0至31与32个笔画段对应,每项127个字节,总长度为4064字节。每一项的结构如下:
索引项结构
笔画段 第0组 第1组 …… 第24组
始址 5字节各次笔字数 5字节各次笔字数 …… 5字节各次笔字数
“首次数尾”编码对照表的整体结构如下:
“首次数尾”编码对照表整体结构
0000 0000H
索 引 表
4064 0FE0H
汉
字
表
三.“首次数尾”法对照表的生成
在汉字系统中实现“首次数尾”输入法,其主要工作量是对照表的生成。“首次数尾”法的设计意图能否全部实现,在很大程度上决定于对照表本身的精确性,即表中的笔画统计和数据排列是否准确无误。
对照表生成过程的各个环节应当尽量利用已有的软件成果,由计算机进行处理。但是还有大量工作离不开手工操作。
1.借助现有的通用软件工具和专用软件工具,根据北京图书馆编辑的《汉字属性字典》,经过手工上机操作,得到下列格式的数据文件SCSW.LST:
啊 1601 10 2 5 5
阿 1602 7 5 2 5
埃 1603 10 1 2 4
挨 1604 10 1 5 4
……
鼷 8791 23 3 2 4
鼽 8792 16 3 2 5
鼾 8793 17 3 2 2
齄 8794 23 3 2 1
文件中每个汉字为一个记录,占用一行。每一记录分为6个字段,相临字段用空格分
开,依次为:汉字内码、区位码、笔画总数、首笔序号、次笔序号和末笔序号。笔画序号1至5分别表示横、竖、撇、点、折这5类笔画。
2.在手工处理过程中,如果遇到笔画数大于32的汉字,则人为置成32笔。
3.运行多关键字递归排序程序SORTG.EXE对SCSW.LST进行排序,要求提供的参数如下:
文件长度=16
第1关键字 笔画数加首笔代号 始址=9 长度=4
第2关键字 末笔代号 始址=16 长度=1
第3关键字 次笔代号 始址=14 长度=1
第4关键字 汉字 始址=1 长度=2
4.将排序后的有序文件SCSW.SSS改名为SCSW.LST,或者拷贝到SCSW.LST中。
5.运行对照表生成程序SCSW.EXE,对文件SCSW.LST进行处理,得到对照表数据文件SCSWDZB.DAT。
6.运行对照表的测试程序SCSW1.EXE,检查数据文件SCSWDZB.DAT的正确性。
四.“首次数尾”法在汉字系统中的实现
在汉字系统中实现一种编码方案的工作可分为三部分:编码字符键入过程中的字符检查、显示、删改和存储;对编码字符进行换码运算,得到一个或一组汉字;如果有重码的话再进行重码处理,包括显示、翻页和选择。
只要对照表的结构描述是清晰的,数据是正确无误的,对于有经验的软件工程师,编制一个处理编码字符的换码程序是不难做到的。
七.“手写模拟”法使用说明
这里以双音编码输入系统中实施的“手写模拟”法为例简要说明它的使用方法。
这是一种按照汉字笔画输入、人人会用的计算机汉字输入法,只要知道一个汉字的首笔画、次笔画、笔画总数和末笔画,打入它们的代码,就可以输入这个汉字。使用这种方法既像查字典,也像手写汉字。
1.“首次数尾”法处理模块的装入
首次数尾法处理模块SCSWINT.COM应在使用之前装入内存。如果没有装入,则在打入一个汉字的输入码以后,会在提示行中显示“SCSWINT.COM模块未装入!”。这时应回到命令处理状态,打入命令:
C>SCSWINT
2.编码选择键
编码选择键在不同的系统中有不同的安排。双音编码系统有一个重要的特点,即一组选择键可以轮流选择几种输入方法,有的两种,有的三种,甚至更多。“手写模拟”法和“多字词汇”共用一组选择键,在IBM-PC机上使用[Alt]/[F3]。
3.代码的键入
先打入首笔代码和次笔代码,再打入笔画总数,最后打入末笔代码。次笔代码可以省
略。笔画总数有两种打入方法:
(1).数字法
在打入首笔代码和次笔代码以后,或者在打入首笔代码以后,数清楚这个汉字的全部笔画数,包括首、次、末笔画在内,再打入笔画总数的数字键,最后打入末笔代码。例如输入“国”字,首笔为竖,打入s或u;次笔为折,打入z或v;共8笔,打入数字8;末笔为横,打入h。故“国”字可按sz8h或uv8h输入。由此看出,用数字法输入汉字和查字典类似。
(2).统计法
在打入首笔代码和次笔代码(如果有的话)以后,或者在首笔代码以后,一边数笔画,一边打空格,一个笔画敲一下,直到末前笔为止。最后打入末笔代码。在敲击空格键的过程中,控制程序自动统计打入的笔画数,并累计显示在提示行中。最后给出汉字的笔画总数。例如输入“沛”字,先打入首笔代码d和次笔代码d,再从第三笔开始数到末前共4个笔画,连击4次空格,在提示行中笔画总数的位置上先后显示3至6的数字。最后打入末笔代码s或u,显示笔画总数为7。值得注意的是,“沛”字的右方并非“市”字,中间从上到下应是一个竖笔画。此外,笔画总数只有一笔和两笔的汉字不能用统计法输入。用统计法输入汉字是对手写汉字的模拟。
4.键入字符的限制
在首笔位置上,键入的小写字母,属于笔画代码的按输入编码处理,其它小写字母为非法字符,并报警按无效处理;键入的大写字母、数字和其它符号按有效字符直接输入。
在次笔位置上,对于小写字母的处理与首笔位置上相同,键入数字和空格转笔画总数处理;其它为非法字符。
在笔画总数的位置上,只能打入数字键和空格键,其它字符均属非法。当第一键是数字时,还可以再打入一个数字键,其它字符,包括空格在内都是非法的。当第一键是空格时,接着只能打入空格键,其它字符,包括数字键在内都是非法的。
在末笔代码的位置上只能打入小写的笔画代码,其它字符都是非法字符。
5.重码选择
“首次数尾”法的首、次、数、尾四部分信息在一般情况下是不能唯一决定一个汉字的。满足这组条件的所有重码汉字将显示在提示行中供进一步选择。打入相应的数字键可选取所需的汉字。
如果重码汉字多于10个,可用[<]和[>]键进行翻页,找到以后再选择。有重码还可以重复选择,即选取了一个汉字以后还可以选取其它汉字。
6.错误处理
编码键入难免有错。打入代码以后如果已经有对应的汉字输入到了正文行中,而这个汉字是不对的,只能用删改正文行的方法补救。
如果没有一个汉字与打入的代码对应,则报警。这时可以重新输入正确的代码;也可以先打入回车键使已经输入的代码作废,再输入新的代码;还可以用退格键对输入的代码进行删改,直到正确时为止。
如果打入的代码对应一组重码汉字,但代码有错,找不到所需的汉字,这时可以用退格键对打入的代码进行删改,也可以打入回车键,使代码作废以后再打入正确的代码。
利用退格键删改笔画总数时,对于用数字法和统计法两种方法打入的代码处理方法是不同的。用数字法打入的,一个退格键删除一位数字。用统计法打入的,一个退格键减去一个笔画数。如果需要在余留的基础上继续打入笔数代码,只能按照原来的方法打入新的内容。但当笔数代码已经全部清除,就可以用任何一种方法重新打入正确的内容。
7.关于笔画和笔顺的说明:
每个汉字的笔画、笔顺、字形与拼音一样都有明确的规定。但另一方面在社会生活中汉字的误写和误读现象还相当多。这就要求文化教育、宣传出版机构不断开展正字和正音工作,维护我国民族文化的健康发展。对于误写和误读,虽然许多情况下也能看得明白听得懂,但毕竟是需要纠正的不正常现象。
汉字系统的设计有两种处理误写和误读的设计思想。一种主张容错,允许某些情况下错了也能输入;另一种主张正字和正音,只能按照正确的笔画字形或者读音才能输入。双音编码和“首次数尾”法是按后一种主张设计的,可以做为文化教育的辅助工具。
对某些汉字的笔画和笔顺还有不同的划分方法。我们以1988年北京图书馆编辑的《汉字属性字典》为准。
Claims (4)
1、一种由通用西文键盘、编码码表压缩数据、换码程序等硬件和软件构成的,笔画类型的汉字电脑手写模拟输入方法,其特征包括如下步骤:
(1)采用横(提)、竖、撇、点(捺)、折(拐)的笔画分类方法;
(2)取笔画名称汉语拼音的第一个字母做为笔画代码,横的代码为H,提的代码为T,竖的代码为S,撇的代码为P,点的代码为D,捺的代码为N,折的代码为Z,拐的代码为G;
(3)对于3个笔画以上的汉字,首先打入第一个笔画的代码;
(4)再打入第二个笔画的代码;
(5)接着模拟手写汉字的过程,“写”一个笔画,打一下空格键,直到末前笔为止;
(6)最后打入末笔代码,如果没有重码则完成一个汉字的输入;
(7)如果出现重码,再辅以重码选择方法,完成一个汉字的输入。
2、根据权利要求1所述的手写模拟输入方法,其特征在于,对于只有一个笔画的汉字和偏旁部首,按如下规定特殊处理:重复两次打入笔画代码;再打入数字1;最后再重复一次笔画代码;遇到重码时再辅以重码选择方法输入汉字。
3、根据权利要求1所述的手写模拟输入方法,其特征在于,对于只有两个笔画的汉字和偏旁部首,按如下规定特殊处理:打入第一笔画和第二笔画的代码;再打入数字2;最后再重复打入第二笔画的代码;遇到重码时再辅以重码选择方法输入汉字。
4、根据权利要求1所述的手写模拟输入方法,其特征在于,对于只有三个笔画的汉字和偏旁部首,按如下规定特殊处理:打入第一笔画和第二笔画的代码;再打入数字3;最后打入第三笔画的代码;遇到重码时再辅以重码选择方法输入汉字。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 92103844 CN1024227C (zh) | 1992-06-01 | 1992-06-01 | 汉字电脑手写模拟输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 92103844 CN1024227C (zh) | 1992-06-01 | 1992-06-01 | 汉字电脑手写模拟输入法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1065941A CN1065941A (zh) | 1992-11-04 |
CN1024227C true CN1024227C (zh) | 1994-04-13 |
Family
ID=4940494
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 92103844 Expired - Fee Related CN1024227C (zh) | 1992-06-01 | 1992-06-01 | 汉字电脑手写模拟输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1024227C (zh) |
-
1992
- 1992-06-01 CN CN 92103844 patent/CN1024227C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1065941A (zh) | 1992-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1024050C (zh) | 对汉字进行编码和译码的方法和装置 | |
US5197810A (en) | Method and system for inputting simplified form and/or original complex form of Chinese character | |
US5475767A (en) | Method of inputting Chinese characters using the holo-information code for Chinese characters and keyboard therefor | |
CN100476826C (zh) | 中文字型排序检索方法和装置以及一种信息系统 | |
CN1024227C (zh) | 汉字电脑手写模拟输入法 | |
CN1136496C (zh) | 简化拼音-触摸屏鼠标式汉字输入方法 | |
CN105912139A (zh) | 一种模块化笔画编码汉字对应识别的方法 | |
CN1018205B (zh) | 计算机中文声数编码输入技术 | |
CN1028457C (zh) | 一种笔画数码加声码的汉字计算机输入系统 | |
CN1035083C (zh) | 面向词的中文文字处理输入装置 | |
CN1196057C (zh) | 一码二形数字编码汉字输入方法 | |
CN1027839C (zh) | 中华双拼汉字编入的计算机键盘 | |
CN104793757B (zh) | 汉字输入方法和装置 | |
CN102750002A (zh) | 数码汉字输入法 | |
CN113253853B (zh) | 一种计算机和手机的汉字输入方法 | |
CN105278697B (zh) | 组合式双拼类主副码汉字、词语编码输入法及其键盘 | |
CN1106146A (zh) | 电脑汉字声韵调编码输入法及其键盘 | |
CN207457986U (zh) | 手机三笔数码汉字输入法及键盘 | |
CN1116336A (zh) | 替调式汉语拼音汉字、词输入编码法及键盘 | |
CN1744015A (zh) | 拼码速录输入法 | |
CN102637077A (zh) | 用于计算机汉字输入的音、形、调混合编码方法 | |
CN104133556B (zh) | 双笔类主副码字母型部首字典、声系字典汉字编码输入法及其键盘 | |
CN1043381C (zh) | 汉字四笔画数码输入法 | |
CN1081773A (zh) | “多声递推联想”汉语词字编码 | |
CN1095502A (zh) | 字元谱汉字编码法(炎黄码)及其键盘 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |