CN1050914C - 计算机汉字分区录入方法 - Google Patents
计算机汉字分区录入方法 Download PDFInfo
- Publication number
- CN1050914C CN1050914C CN94117506A CN94117506A CN1050914C CN 1050914 C CN1050914 C CN 1050914C CN 94117506 A CN94117506 A CN 94117506A CN 94117506 A CN94117506 A CN 94117506A CN 1050914 C CN1050914 C CN 1050914C
- Authority
- CN
- China
- Prior art keywords
- stroke
- radical
- input
- subregion
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/018—Input/output arrangements for oriental characters
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
- Input From Keyboards Or The Like (AREA)
Abstract
计算机汉字分区输入方法是通过对纸、键盘、汉字等事物的结构和属性进行深入全面的类比研究,提出的针对汉字键盘输入和联机手写输入的发明。发明把纸上的字格应用到键盘和手写输入板上,对输入设备的人工操作区域进行划分,与汉字的拆分呼应,并归纳出它们之间在时空属性上的对应关系,由此形成的编码体系缩小了手写与敲键的差异,具备易学性和高效性,可以解决计算机汉字输入的难题。
Description
本发明涉及计算机中文信息处理领域的计算机汉字编码输入技术。
计算机在人类当今的社会生活中发挥着巨大的作用。计算机在中国的普及利用很大程度上取决于计算机对汉字信息的处理水平。其中包括汉字的输入,输出,汉字信息检索,汉语的理解等等方面。汉字输入是目前比较热门的领域。计算机汉字输入有三个主要方面,即计算机汉字键盘输入,汉语语音输入,联机手写汉字识别输入和光学汉字识别输入。其中汉字键盘输入技术现阶段占主导地位。
汉字是表意文字,不同于西方拼音文字,汉字形体复杂,数量庞大,输入计算机有很大难度。经过多年的努力,已经有了汉字编码方案和输入系统。汉字键盘输入已经成为可能。但是完全令人满意的输入方案还没有研究出来,要真正达到易学,易用和高效的目标,还需要进一步努力研究。
汉字具有音,形,义三个方面的属性。所有输入方案都是基于这些属性的,根据所使用的特征,输入方案可以分为音码,形码,以及音形码等。各种方案都有长处和短处。
目前汉字输入技术向着横向和纵向两方面发展。横向就是单字输入,目标要达到易学,高效,规范;纵向是字,词,句输入,通过智能化处理,解决易学与高效的矛盾。
汉字的发音特征比较简单,字多,但音不多,所以音码的单字重码很多。
汉字的字形特征很复杂,从不同角度可以有不同理解,导致了众多的形码方案,字形多,特征多,码多,重码少,难学,难记。
下面,以几种常见的汉字编码方案为例,比较具体地进行性能分析和比较。
音码输入方法,使用汉字的发音特征来进行编码;易于掌握,但重码高,虽然可以通过智能手段使重码率有所降低,但系统开销较大,效果有限,很难盲打,速度较慢;对汉语拼音的要求较高,有地域和年龄层的限制;在大字符集内的使用有限制。
笔画编码法,将笔画按不同的形态分为若干类,依笔画书写顺序,把汉字一笔一画地编码输入;易于掌握,会写汉字就会输入,但是编码效率很低,重码多,码长长。
五笔字型编码方案,是字根类编码,按照汉字字根的使用频度,将字根挑选归类,分配键位,以″字根拼形″完成整字输入;特点是字根键位熟记以后,输入速度较快,存在的问题是:
1.字根较多,记忆负担大;
2.200多个一级字根的选取以统计为基础,字根键位的分配依据″相容性原理″确定,所谓相容性有一定统计范围,在字符集GB2312-80和ISO10646中的统计结果肯定不同,也就是说,在GB中相容的字根,在ISO中可能就不相容了,其结果会导致重码率的变化;
3.二级字根和非字根单体字的输入要拆分成一级字根,拆分过程的规律性和规范性不强,拆分二义性大;
4.末笔字型识别码难于掌握和使用。
郑码汉字编码方案,是字根类编码,引入主根和副根的设计思想,对大字符集有一定的适应性,字根熟记后输入速度较快,存在的问题是:
1.引入主根和副根在于解决大范围内字根的相容性问题,但是副根的编码和键位设计难于记忆;
2.字根键位安排不易定位,不能结合人机工程学的理论;
3.非选定字根和单体字的输入需要拆分成为主根或副根,其拆分二义性较大,不易掌握。
总之,汉字编码难的的症结是:汉字的字形复杂,变化多样,本质规律难于发现。各类编码方案从不同的层次,不同的侧面提取汉字的特征,并依此对汉字进行编码,目前的局面是:
1.不少方案是同一层次的重复性劳动,没有本质区别;
2.不同方案对汉字的特征抽取和利用不全面,不科学。
针对这种局面,本发明的任务是:
1.解决汉字编码中普遍存在的易学,易用与高效之间的矛盾,找到一种同时具备笔画码和拼音码的易学性,又具备字根码的高效性的编码方案;
2.缩小手写与敲键之间的差异;
3.使编码过程符合人的思维习惯;
4.使编码符合文字规范;
5.使编码符合人机工程的研究结果;
6.建立一套统一,完备的文字特征描述体系,以适应大字符集中各种的文字符号的需要。
为了实现这个任务,本发明对纸,笔,键,字诸事物各自内在的特征属性,以及各事物相互之间的关系做了深入全面的类比性研究,由此总结出了它们之间在组成结构,时间属性,空间属性等方面存在的微妙而客观的对应关系。利用这种对应关系便形成了一个新的汉字编码体系。
为了写好汉字,前人总结了很多方法,其中之一是在学写汉字的初期使用字格。使用字格可以帮助初学者更好地掌握汉字的间架结构,合理调整汉字部件的布局。字格的种类不少,常见的有田字格,井字格,米字格等。字格在其它领域的应用也比较广泛,如英文书法使用的四线格;音乐曲谱使用的五线谱,六线谱;等等。
汉字是二维平面上的图形,每个字根,每个笔画都不是完全独立的,而是相互关联的,这体现在它们之间的相对位置关系上。使用字格的目的就是为了确定这种位置关系。举一个简单的例子,可以说明字根之间,笔画之间的位置关系及其重要性。″王″,″木″,″林″三个字的第一笔画都是横,孤立地看它们是相同的,但是从字的整体来看,它们之间存在差别。如果在字格中书写三字之一,只需写完第一笔,旁人就可以判断出要写的字是哪一个,其中的道理不言自明。
现有的各种方案对汉字内字根,笔画间的二维特征应用得都不充分,五笔字型的末笔字型识别码是针对汉字二维特征设计的,但是效果不理想,不易掌握。
在上面的例子中,为什么根据一笔能够做出判断?除了汉字结构的背景知识,字格在其中发挥了很大作用,它对一个笔画的空间位置做了一种限定,任意的一笔都与其上下左右的其它笔画相互配合,共同组合成一个整字。如果没有字格,在白纸上就很难判断。同样的道理,一个圆圈只有在五线格中才能代表一个确定的音高。
写字过程是在纸面上一笔一笔,一根一根地书写;敲字过程是在键盘盘面上一键一键地敲击。纸面上可以画出字格,键盘盘面上是否也能画出″字格″,使得″写字″能够在键盘上进行?
本发明的思路就是把纸面上的字格搬到键盘盘面上来。
纸面上的字格把一个写字空间分为若干个小的区域,每个区域和区域之间有特定的空间位置以及位置关系,这种位置关系可以和汉字的组件及组件之间存在的空间位置关系相互对应。
键盘上也应该有″字格″和汉字建立类似的对应关系。
通过研究,本发明对汉字和键盘在三方面做了类比:
1.在结构上,根据客观事物可分割原理,汉字和键盘都可以划分成更低一级的组成单位;
2.在空间上,汉字是平面图形,具有平面特征;键盘是在平面上排列布局的,也具有平面特征;
3.在时间上,汉字的组成部件书写时有时间顺序,键盘的键位在操作时也有时间上的次序。
综上所述,本发明的总体构思是:既然汉字是可以拆分的,而且纸面上的书写区域也可以划分成字格,那么键盘的盘面也应该加以划分;汉字可以多级拆分,字格可以多级划分,键盘也可以多级划分;汉字组成单位在时间和空间上的特征属性可以由键盘组成分区在时间和空间上的特征属性来反映,从而达到汉字键盘编码输入的目的。
键盘分区以后,汉字部件的间隔就非常简单自然,这同时也为汉字特征码表提供了更大的自由度。对于单体字,码表中可以存储该字的笔画特征或者其它特征;对于合体字,就可以只存储字根序列信息和字根位置信息,合体字输入时可以是所有组成部件的全特征之和,也可以是部分部件的部分特征之和。动态组合式编码使汉字编码的灵活性很大。
字格的概念同样可以引入手写输入设备中。将手写面板上一个整字的手写输入区域划分成若干个子区域,每个区域对应一种汉字组件的空间位置,书写时根据笔画的位置写入相应的子区域中。字格的引入可以简化书写过程,不必严格一笔不缺,可以允许笔画的取舍。
本发明经过研究认为纸张,普通键盘和手写输入板,以及屏幕键盘,软键盘,触摸屏,数字化仪等计算机外设有一个共性,它们都是一种记录或感知空间位置的工具,通过不同的位置或位置的变化表现信息或转化信息。其区别是对位置感知的精度不同,以适应不同应用场合的需要。键盘的精度较低,但易于定位;手写输入板精度较高,书写时不易精确定位。纸张上的字格可以直接应用到手写输入板上,应用到键盘上时要做一些变通,下文将有详述。输入时,键盘上表示相同位置但不同笔向的一组键位在手写输入板上缩为一个区域;这个区域内可以表现不同的笔画方向。在其它方面,比如计算机内部的码表查找转换处理都是类似的。所以本发明从本质上统一了汉字手写和击键的操作。本发明也可以用来输入其它文字符号,比如日文假名;英文字母也可以拆分成笔画段,使用本发明输入。
本方案的优点和效果:
1.使用键盘字格自然区分各字根的编码,并反映字根之间的位置关系,既全面使用了字根特征又不增加编码难度,也保留字根了类编码的高效性;
2.可以使用键盘字格描述汉字笔画,充分利用笔画之间的平面特征,克服传统笔画类编码低效的缺点,保留笔画类编码的易学性;
3.使用键盘字格缩小了手写和敲键的差异,符合人的思维习惯,符合文字规范,也符合人机工程学的研究结果;
4.手写输入板使用字格可以减少笔画书写个数,提高输入效率和识别率;
5.使用动态组合码表,使编码灵活性大,冗余性大,码长组合变化多;
6.特征描述和分类能力强,可以用于大字符集中各种文字符号的编码输入。
附图说明
图1.输入设备人工操作区域
图2.上下分区
图3.左右分区
图4.两次分区
图5.单向笔画分类
图6.复向笔画分类
图7.笔画位置分类
图8.键盘分区与上下笔画位置
图9.键盘分区与左右笔画位置
图10.笔画1型键位
图11.笔画2型键位(有折笔画形态)
图12.笔画3型键位(有折笔画形态)
图13.笔画2型键位
图14.笔画3型键位 字根1型
图15.笔画4型键位,字根2型
图16.二体字字形结构
图17.三体字字形结构
图18.汉字局部结构:首根与次根的关系
图19.键区操作序列与字形结构
图20.字根位置分类
图21.字根、根位与键区
下面结合附图和实施例对本发明做详细介绍。
图1为输入设备人工操作区域,可以是键盘盘面,手写输入板等;
图2为对人工操作区域上下分区;
图3为对人工操作区域左右分区;
图4为对人工操作区域上下左右两次分区;
可以认为图1至图4对操作区域的划分就是将纸面上的字格概念移植到计算机输入设备上来。下面描述三个实施例,说明它的用法。实施例1:
方案名称:笔画型
技术特点:直接利用汉字的笔画特征,对汉字编码输入,会写字就会
使用,易于掌握。
方案细类:本方案有三个小类,即:
笔画1型;笔画2型;笔画3型;笔画4型
编码方法:
编码使用的特征:
笔画1型:笔向+折笔画形态+键位;
笔画2型:笔向+(折笔画形态)+上下笔位+键位;
笔画3型:笔向+(折笔画形态)+左右笔位+键位;
笔画4型:笔向+(折笔画形态)+纵横笔位+键位;
特征使用:
笔向,图5:单向笔画的笔向归纳为四类,即:横,竖,
撇,捺。每类包含若干形态,即:横提,捺点。
折笔画形态,图6:复向笔画就是折,折的不同形态根据笔
画方向变化的次数和起始笔段的笔向确定,可以归为:
一折,二折,三折;以及横折,竖折,撇折,捺折。
本方案将一折分为横折,竖折,撇折,捺折四类,对
二折,三折不再细分,其中三折也包括方向变化超过
三次的折笔画。这样将笔画分为10类。
需要时,也可选择将折笔画归类为一种。
笔位,图7:笔画在平面上的相对位置关系选取垂直方向上
的位置关系,归为三个层次:上中下。笔画分类为:
上位笔画:笔画的起始点相对位置最高;
中位笔画:笔画的起始点相对位置低于上位笔画;
位笔画:笔画的起始点相对位置低于中位笔画;
同位笔画:若干笔画的位置相同。
笔画在平面上的相对位置关系选取水平方向上的位置
关系,归为两种类型:左右。笔画分类为:
左位笔画:笔画的起始点相对位置最左;
右位笔画:笔画的起始点相对位置非最左;
同位笔画:若干笔画的位置相同。
笔位有两种,1.字根内的笔位;2.整字内的笔位,
本方案选择前者。
键区,图8,图9:用键盘分区的平面位置关系反映笔画之间
的平面位置关系,每类笔画位置安排一个键区。
根顺:取码时,按照汉字规范书写的顺序确定字根次序:首
根,次根,末根。
键位安排:
笔画1型,图10:10种笔画安排于中排键位;笔画按方向
分类,折笔画有多种形态;
笔画2型,图11,图13:增加上下笔位特征,将笔画方向码
安排于上中下三排键位,折笔画形态可供选择;
笔画3型,图12,图14:增加左右笔位特征,将笔画方向码
安排于左右两侧键位,折笔画形态可供选择;
笔画4型,图15:使用上下左右笔位特征,将笔画方向码安
排于左右两侧的上中下三排区域。
取码方式:
方式1.一笔一画顺次提取,编码,输入
方式2.选择部分笔画,减少码长,提高效率:
单体字:单字前两笔+末笔画重复一次
二体字:首根首笔+首根末笔+次根首笔+次根末笔
三体字:首根首笔+首根末笔+次根末笔+末根末笔
多体字:首根首笔+次根末笔+三根末笔+末根末笔
如果字根不足两笔,则重复;
词汇输入法:二字词取每字前两码;三字词首字取前两
码,余字取首码;四字以上词汇取前三字和末字的首码。输入提示:在输入过程中,计算机屏幕提示行将随时显示相关候选汉
字,当欲输入的汉字显示时。可以选择确认,如果编码未
结束,可以继续进行编码输入。编码示例:
取码方式1:
笔画1型:
中:丨,一折,一,丨
国:丨,一折,一,一,丨,丶,一,一
笔画2型:
中:中丨,中一折,下一,上丨
国:上丨,上一折,上一,中一,上丨,下丶,下一,中一
编码中折笔画可以选择归为一类;
笔画3型:
中:左丨,左一折,左一,右丨
国:左丨,左一折,左一,左一,右丨,右丶,左一,左一
编码中折笔画可以选择归为一类;
笔画4型:
中:左中丨,左中乙,左下一,右上丨
国:左上丨,左上乙,左上一,左中一,右上丨,
右下丶,左下一,左中一
取码方式2:
笔画1型:
中:丨,一折,丨,丨
国:丨,一,一,一
汉:丶,一,一折,丶
字:丶,一折,一折,一
笔画2型:
中:中丨,中一折,上丨,上丨
国:上丨,中一,上一,下一
汉:上丶,下一,上一折,上丶
字:上丶,中一折,上一折,下一
编码中折笔画可以选择归为一类;
笔画3型:
中:左丨,左一折,右丨,右丨
国:左丨,左一,左一,左一
汉:左丶,左一,右一折,右丶
字:右丶,左一折,右一折,左一
编码中折笔画可以选择归为一类;
笔画4型:
中:左中丨,左中乙,右上丨,右上丨
国:左上丨,左中一,左上一,左下一
汉:左上丶,左下一,左上乙,左上丶
字:右上丶,左中乙,右上乙,左下一实施例2:
方案名称:字根型
技术特点:特征提取部分与笔画型基本相同,其区别在于对汉字键盘
进行分区,汉字字根在不同键区内输入,字根分区输入,
使得在不增加编码难度的情况下,提高了编码效率。
方案细类:
字根1型;字根2型;
编码方法:
编码使用的特征:
字根1型:笔向+根位+键位;
字根2型:笔向+笔位+根位+键位+(根频);
特征使用:
笔向,笔位,根顺等特征与实施例1基本相同。
根位:汉字字根之间在平面上的相对位置关系,形成汉字的
字型结构。字根间的位置关系与字根个数有关。
单体字:包含一个字根部件;
二体字:包含两个字根部件。两个字根的关系归为左
右,上下,包围三种,即图16。其中包围结
构包括若干形态,可以归为左右和上下两大
类;
三体字:包含三个字根部件。三个字根的位置关系是
在上述二体字结构之上的延伸,也可以归为
左右,上下,包围三种,即图17。其中包围
结构包括若干形态,可以归为左右和上下两
大类;
多体字:包含四个以上字根部件,字根之间的位置关
系变化很多,但都可以做与上相似的归类;
以上所述为汉字的整体字形结构,本方案将使用一种
汉字的局部结构关系,这就是汉字首根与次根的位置
关系,即图18。归纳为左右关系和上下关系。
键区:将键盘划分成若干级子区域,与汉字的拆分呼应。
一级键区:对应于汉字字根级,字根变化则一级键区随着变
换,键区的变化是字根编码之间的自然间隔。
二级键区:对应于汉字笔画级,笔位变化,则二级键区随着
变换。
键区操作序列,图19:一次输入涉及的键区变化组合,字根
个数决定键区的变化次数;首根和次根的位置关系决
定键区的操作顺序。
根频:根据使用频度将字根分级,安排简码键位,一级,二
级,三级字根分别可以指定一键,二键,三键等,以
提高输入效率;
根频,根位,键区的关系:最常用的字根一般有固定的相对
位置,可以归纳为:
左字根:右侧一般有字根部件存在,如:氵,亻;
右字根:左侧一般有字根部件存在,如:刂,攵;
上字根:下侧一般有字根部件存在,如:艹,宀;
下字根:上侧一般有字根部件存在,如:灬,辶;
图20;所以,常用字根的简码安排可以和键区结合考
虑,图21。使用高频字根的键位会使键区操作序列稍
有变化,例如:″荣″,标准操作序列为右左右,使用
高频字根键位就变成右右左。键位安排:
字根1型:如图14所示。键盘盘面分为左右两个区域,横
竖撇捺折5类笔画安排在各区的中排键位上;
字根2型:如图15所示。键盘盘面分为左右两个区域,横
竖撇捺折5类笔画安排在各区的上中下三排键位上。取码方式:
方式1.
单体字:单字前两笔+末笔画重复一次
二体字:首根首笔+首根末笔+次根首笔+次根末笔
三体字:首根首笔+首根末笔+次根末笔+末根末笔
多体字:首根首笔+次根末笔+三根末笔+末根末笔
如果字根不足两笔,则重复;
单体字在左右键区之一输入;
多体字的输入涉及多次键区之间的变换,图15。
词汇输入法:二字词取每字前两码;三字词首字取前两
码,余字取首码;四字以上词汇取前三字和末字的首码。
方式2.采用动态组合编码方式。在码表中存储单体字和字
根的完全特征,合体字的字根序列和根位信息。当输入
时可以灵活组态。比如输入″林″字,可以在左区输入
左字根的前一二三四笔的任意一种,然后在右区输入右
字根的前一二三四笔的任意一种。为了减少重码可以按
字根的使用频率分配简码。
编码示例:
取码方式1:
字根1型:
中:丨,乙,丨,丨
国:右区:丨,一;左区:一,一
汉:左区:丶,一;右区:乙,丶
字:右区:丶,乙;左区:乙,一
字根2型:
中:中丨,中乙,上丨,上丨
国:右区:上丨,中一;左区:上一,下一
汉:左区:上丶,下一;右区:上乙,上丶
字:右区:上丶,中乙;左区:上乙,下一
取码方式2:
字根1型:
中:左区或右区:丨,乙,一,丨
国:右区:丨,乙,一;左区:一,一,丨
汉:左区:丶,丶,一;右区:乙,丶
字:右区:丶,丶,乙;左区:乙,丨,一
字根2型:
中:左区或右区:中丨,中乙,下一,上丨
国:右区:上丨,上乙,中一;或口
左区:上一,中一,上丨
汉:左区:上丶,中丶,下一;或氵
右区:上乙,上丶
字:右区:上丶,中丶,中乙;或宀
左区:上乙,中丨,下一实施例3:
方案名称:音形码
技术特点:将汉字发音特征加入实施方案1,2中,通过使用简单的
笔画特征减少音码的重码率。
方案细类:
音形1型;音形2型;
编码方法:
编码使用的特征:
音形1型:声母+前述实施例中的特征;
音形2型:声母+韵母(双拼)+前述实施例中的特征;特征使用:与前述实施方案相同。键位安排:声母直接与汉字键盘对应,其中zh,ch,sh可以由i,
u,v代替。
双拼方案是目前比较成熟,使用较为普遍的技术,可
以通过自定义方式,让用户使用自己熟悉的双拼方案。取码方式:
音形1型:第一码为声母,其它与前述方案相同;
音形2型:前两码为声韵双拼,其它与前述方案相同。
Claims (12)
1.计算机汉字字根分区录入方法,把汉字字根之间的二维信息归纳为左右、上下、包围三种基本结构关系,汉字按照字根个数分为:单体字、二体字、三体字、四体字、多体字;
二体字的字根结构关系分为:左右、上下、包围;
其中包围关系分为:
四面包围;
三面包围:上围、下围、左围、右围;
两面包围:左上围、左下围、右上围、右下围;
三体字可以首先划分成两个部分,分别包含单个字根和两个字根,两个部分之间的结构关系与二体字的结构关系等同,然后拆分包含两个字根的部分,其结构与二体字相同;
多体字首先拆分为两个部分,确定这两个部分之间的的结构关系,然后每个部分继续拆分并确定结构关系,直至划分到单个字根,
其特征是:把输入设备的操作区域单元划分为多个拓扑阵列分区,字根输入在分区内进行,将分区称为字根分区,使用坐标系标注分区位置,左上角规定为坐标原点,水平方向是X轴,垂直方向是Y轴,分区的绝对位置是分区与坐标原点分区在XY轴方向上的差值偏移量,分区间的相对位置是任意两个分区在XY轴方向上的差值或偏移量,字根分区的相邻关系分为:左右相邻、上下相邻、对角相邻,对角相邻包括左下相邻和右下相邻,两个字根分区X1Y1和X2Y2之间的相邻关系定义为:左右相邻:X2=X1+1,Y2=Y1;上下相邻:X2=X1,Y2=Y1+1;左下相邻:X2=X1-1,Y2=Y1+1;右下相邻:X2=X1+1,Y2=Y1+1;字根按照如下方式确定分区:单体字:在任意一个字根分区输入;二体字:
左右结构:在左右相邻的两个字根分区输入;
上下结构:在上下相邻的两个字根分区输入;
包围结构:
四面围、上围、左上围、右下围:
在右下相邻的两个字根分区输入;
下围、左下围、右上围:在左下相邻的两个字根分区输入;
左围、右围:在左右相邻的两个字根分区输入;多体字:
一分为二逐级划分,并且确定在字根分区中的位置关系,直至划分为单个字根并且确定分区输入,存储在计算机存储设备中的汉字代码数据库中合体字的代码同时包含组成字根和字根位置偏移量,合体字字根及位置序列:字根1、字根2偏移量、字根2、字根3偏
移量、字根3、...、字根n偏移量、字根n;输入过程涉及如下处理步骤:
1)首次在多个分区中任意一个分区中有输入操作,即进入汉字
输入状态,记录首次操作分区位置坐标;
2)每次基本操作按照笔顺输入一个笔画,输入设备采集游标轨
迹,分析笔画轨迹确定笔画类型,顺序相邻且在同一分区内
的笔画组成一个字根;
3)输入分区变化标志上一个字根输入结束,开始输入新一个字
根,计算并记录相邻字根分区位置的差值偏移量;
4)输入过程得到字根和偏移量序列;
5)在汉字代码数据库中查找,将与输入序列匹配的汉字作为候
选结果;
6)在限定时间内没有操作或操作超出多个分区范围,则本字输
入结束,输出结果;
在上述过程中,系统每接收到一个输入操作时,可以把当前信息作为检索条件,查询代码库,动态给出当前匹配结果,以供选择。
2.按照权利要求1所述的方法,把汉字笔画分为横、竖、撇、捺、折5种,其特征是:把每个字根分区划分为5个子分区,5个子分区分别对应于横、竖、撇、捺、折5种笔画的一种,点击某个子分区即完成相应笔画类型的输入。
3.按照权利要求1所述的方法,其特征是所说的多个拓扑阵列分区是5×5或者3×3拓扑阵列分区,原字根分区定位超出3×3范围的归入3×3阵列,并且遵循:输入次序相邻的字根在两个不同分区输入。
4.按照权利要求1所述的方法,其特征是所说的多个拓扑阵列分区是1×3拓扑阵列分区,汉字首字根和次字根的位置关系分为:左右、上下、包围三种,三种结构的首字根在三个不同的分区中输入,并且遵循:输入次序相邻的字根在两个不同分区输入。
5.按照权利要求1所述的方法,其特征是所说的多个拓扑阵列分区是1×2拓扑阵列分区,汉字首字根和次字根的位置关系分为:左右、上下、包围三种,包围结构中的左围和右围按左右结构处理,其余按上下结构处理,左右和上下两种结构的首字根在两个不同的分区中输入,并且遵循:输入次序相邻的字根在两个不同分区输入。
6.计算机汉字笔画分区录入方法,按照垂直方向上的位置关系,把笔画分为:
上位笔画:笔画起点相对位置最高;
纵向中位笔画:笔画起点相对位置次高;
下位笔画:笔画起点相对位置低于中位;
纵向同位笔画:笔画起点纵向相对位置相同;按照水平方向上的位置关系,把笔画分为:
左位笔画:笔画起点相对位置最左;
横向中位笔画:笔画起点相对位置次左;
右位笔画:笔画起点相对位置右于中位;
横向同位笔画:笔画起点横向相对位置相同;
其特征是:把输入设备的操作单元区域划分为多个拓扑阵列分区,根据笔画的位置确定其输入分区,将分区称为笔画位置分区,把笔画位置分区之间存在的高中低、左中右位置关系和笔画之间存在的上中下、左中右进行对应,笔画输入时,首先确定行,然后确定列,将笔画起点定位于特定分区,存储在计算机存储设备中的汉字代码数据库中单体字和字根的代码同时包含笔画类型和笔画位置信息,合体字代码包含组成字根序列,字根和单体字笔画组成序列:笔画1类型和位置、笔画2类型和位置、
...、笔画n类型和位置,输入过程涉及如下处理步骤:
1)首次在多个笔画分区中有输入操作,即进入汉字输入状态,
记录笔画位置坐标和笔画类型;
2)每次基本操作按照笔顺输入一个笔画,输入设备采集游标轨
迹,笔画起点所在的分区作为该笔画的位置坐标,分析笔画
轨迹确定笔画类型;
3)游标移出笔画分区阵列范围表示一个字根输入结束,把笔画
位置和笔画类型序列在代码库中查找,得到与之匹配的字根
集合;
4)游标移动到整字输入结束标记区域或者在限定时间内没有输
入操作表示整字输入结束,把字根序列在汉字代码库中查找,
得到匹配的汉字集合作为结果输出;
在上述过程中,系统每接收到一个输入操作时,可以把当前信息作为检索条件,查询代码库,动态给出当前匹配结果,以供选择。
7.按照权利要求6所述的方法,把汉字笔画分为横、竖、撇、捺、折5种,其特征是:把每个笔画位置分区划分为5个子分区,5个子分区分别对应于横、竖、撇、捺、折5种笔画的一种,点击某个子分区即完成相应笔画类型的输入。
8.按照权利要求6所述的方法,其特征是:所说的多个笔画拓扑阵列分区是3×3拓或者3×1拓扑阵列,在3×3拓扑阵列中,上中下笔画位置关系对应于上中下三行,左中右三种笔画位置关系对应于左中右三列;在3×1拓扑阵列中,笔画位置仅按纵向划分,并建立上中下对应关系。
9.按照权利要求8所述的方法,其特征是:使用笔画位置分区输入日文假名、英文字母以及其它文字符号。
10.计算机汉字字根笔画分区录入方法,其特征是:首先把输入设备操作区域划分为多个字根分区,然后在字根分区内划分多个笔画位置分区,字根输入在字根分区内完成,笔画根据位置确定相应的笔画位置分区进行输入。
11.按照权利要求10所述的方法,把标准键盘输入设备的3×10字母、标点键区进行如下划分:
1×2字根分区:将3×10键位分为左右两个3×5分区;
3×1笔画位置分区:将3×5键位分为上中下三个1×5分区;
1×5笔画键位:1×5个键位表示横竖撇捺折五种笔画。
12.一种动态组合码表方法,其特征是:该方法包括两种码表:
码表A:单体字和字根特征描述表,包含笔画位置,笔画类型序列;
码表B:合体字字根组成表,包含字型结构,字根序列;
并且涉及如下步骤:
1)从输入设备获取输入信息流,形成字根特征描述序列码;
2)在码表A中查找字根描述序列码,得到候选字根集合;
3)合体字由多个字根组成,相应得到多个候选字根集合,排列
组合成为字根序列集合;
4)将字根序列依次在码表B中查找,得到匹配的合体汉字,作
为候选结果输出;
5)按照字根频度,可以确定字根简码,输入一个首笔画,列出
一级字根,输入两个笔画,列出二级字根。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN94117506A CN1050914C (zh) | 1994-10-24 | 1994-10-24 | 计算机汉字分区录入方法 |
AU37400/95A AU3740095A (en) | 1994-10-24 | 1995-10-24 | Lin code chinese character input method |
JP8513566A JPH10507556A (ja) | 1994-10-24 | 1995-10-24 | 漢字入力方法 |
PCT/CN1995/000081 WO1996013000A1 (fr) | 1994-10-24 | 1995-10-24 | Procede de saisie de caracteres chinois en code lin |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN94117506A CN1050914C (zh) | 1994-10-24 | 1994-10-24 | 计算机汉字分区录入方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1116334A CN1116334A (zh) | 1996-02-07 |
CN1050914C true CN1050914C (zh) | 2000-03-29 |
Family
ID=5038394
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN94117506A Expired - Fee Related CN1050914C (zh) | 1994-10-24 | 1994-10-24 | 计算机汉字分区录入方法 |
Country Status (4)
Country | Link |
---|---|
JP (1) | JPH10507556A (zh) |
CN (1) | CN1050914C (zh) |
AU (1) | AU3740095A (zh) |
WO (1) | WO1996013000A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105068674A (zh) * | 2015-08-04 | 2015-11-18 | 桂有恒 | 汉字形定数输入法 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102411431A (zh) * | 2005-10-21 | 2012-04-11 | 钟巨航 | 输入法 |
CN102193647B (zh) * | 2010-03-20 | 2015-06-10 | 赵现隆 | 形状码及触摸屏的区位汉字输入法 |
CN109992127B (zh) * | 2019-04-11 | 2022-06-28 | 王嘉琦 | 采用整分体式结构分类汉字的汉字输入方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN87103761A (zh) * | 1987-05-22 | 1988-01-13 | 熊正才 | 汉字笔序形码编码输入法 |
CN1037410A (zh) * | 1988-02-13 | 1989-11-22 | 姚鸿滨 | 写字式汉字输入法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1036422C (zh) * | 1992-02-26 | 1997-11-12 | 中国人民解放军89001部队 | 汉字笔形关联编码计算机输入方法及其键盘 |
-
1994
- 1994-10-24 CN CN94117506A patent/CN1050914C/zh not_active Expired - Fee Related
-
1995
- 1995-10-24 WO PCT/CN1995/000081 patent/WO1996013000A1/zh active Application Filing
- 1995-10-24 JP JP8513566A patent/JPH10507556A/ja not_active Ceased
- 1995-10-24 AU AU37400/95A patent/AU3740095A/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN87103761A (zh) * | 1987-05-22 | 1988-01-13 | 熊正才 | 汉字笔序形码编码输入法 |
CN1037410A (zh) * | 1988-02-13 | 1989-11-22 | 姚鸿滨 | 写字式汉字输入法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105068674A (zh) * | 2015-08-04 | 2015-11-18 | 桂有恒 | 汉字形定数输入法 |
CN105068674B (zh) * | 2015-08-04 | 2019-02-05 | 桂有恒 | 汉字形定数输入法 |
Also Published As
Publication number | Publication date |
---|---|
JPH10507556A (ja) | 1998-07-21 |
AU3740095A (en) | 1996-05-15 |
WO1996013000A1 (fr) | 1996-05-02 |
CN1116334A (zh) | 1996-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1171162C (zh) | 基于字符分类检索字符串的装置和方法 | |
CN1161687C (zh) | 手写体匹配技术 | |
CN1276336C (zh) | 实现快速书写系统的方法和快速书写机 | |
CN1331449A (zh) | 用于将粘着法构成的文本或文档分段成词的字符串划分或区分的方法及相关系统 | |
CN1577229A (zh) | 输入音符串进入计算机及文句生产方法及其计算机与媒体 | |
CN1678975A (zh) | 仿效qwerty型布局和键入的缩减键盘系统 | |
CN1452083A (zh) | 字符信息的转换处理系统 | |
CN1694049A (zh) | 一种基于五键的汉字输入系统 | |
CN1280748C (zh) | 使用计算机键入字母表中字母的方法 | |
CN1266633C (zh) | 语音查询中的辨音方法 | |
CN1050914C (zh) | 计算机汉字分区录入方法 | |
CN1296231A (zh) | 地名表示词典生成方法和地名表示词典生成装置 | |
CN1154502A (zh) | 教育规范五笔字型汉字输入法及其装置 | |
CN1241101C (zh) | 一种基于汉语音节双读方案的信息输入方法 | |
CN1235122C (zh) | 计算机汉字活码输入法及其键盘 | |
CN1109608A (zh) | 自由组合码汉字输入方法及键盘 | |
CN1026924C (zh) | 汉字析音编码计算机汉字输入方法 | |
CN1025896C (zh) | 新概念编码计算机汉字输入键盘 | |
CN1019527B (zh) | 字符的图元输入方法及其键盘 | |
CN1259615C (zh) | 字母键盘和数字键盘通用汉字输入法及其左半字形识别法 | |
CN1068127C (zh) | 文字信息处理方法和装置 | |
CN1845053A (zh) | 手写拼式移动虚拟键盘认别拼音汉字英文输入技术 | |
CN1043209A (zh) | 计算机汉字处理方法 | |
CN1489024A (zh) | 多键并击式汉字输入键盘及其输入方法 | |
CN1110806A (zh) | 智能五笔双拼码字—词链环式定位联想输入方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |