CN102902370A - 一种计算机类形码汉字键盘技术 - Google Patents
一种计算机类形码汉字键盘技术 Download PDFInfo
- Publication number
- CN102902370A CN102902370A CN2012104407732A CN201210440773A CN102902370A CN 102902370 A CN102902370 A CN 102902370A CN 2012104407732 A CN2012104407732 A CN 2012104407732A CN 201210440773 A CN201210440773 A CN 201210440773A CN 102902370 A CN102902370 A CN 102902370A
- Authority
- CN
- China
- Prior art keywords
- stroke
- word
- key
- code
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
一种汉字输入方法,计算机类形码汉字键盘技术,主要特点是码元少、码串短、无重码,实现了一字一码,打字不找字,且易记难忘,规律性强;设计原理是以组成汉字的基本单位笔画为唯一编码元素,以其本质属性为依据,把笔画分为横、竖、斜三类;以其结构属性为依据,把笔画分为单、复、交三形;以其向度与耦合属性为依据,把笔画分为主、辅、体三位;依笔画在字中的自然状态进行编码,用一套编码可以在各种键位的键盘上完成汉字输入,是真正的汉字通用编码。
Description
技术领域
本发明涉及一种汉字输入方法,特别是指一种计算机类形码汉字键盘技术,属于中文信息领域。
背景技术
在用的汉字输入方法主要有拼音、拆字、笔画三类,拼音法因为采用现成的汉语拼音作为编码元素且因其与电脑键盘上的英文字母正好契合,以所谓的零记忆,不用专门学习的优势而拥有大量的使用者,其致命弱点是单字析出率太低,不能直接打出所需的字,只能找,随着电子设备容量的不断增大,程序编制技术的日益进步,强大的搜索和定位功能,加之大企业、大资金的投入,使得打词、打句的设想变为现实,拼音打字变得简单容易,但严格讲它不是真正的汉字编码,打的是“音”不是“字”,而音是为口腔设计的,笔画才是掌手的用武之地,写字才是掌手的功能之重,它既没有在打字的过程中锻练发音,也没有提高手写的能力,长期使用,必然“音”、“画”皆失,目前社会上(尤其是在中小学生中)日益严重的书写无能与书写失忆的通病,与此不无关系。
拆字(字根)法提高了编码的聚合度,缩减了码串的长度,大量的编码方案属此类,使打字的速度得以加快,但其识别度并没有相应提高,也因此无法解决重码问题,只能依靠区别码、识别码、小码、尾码、加码之类的方式来提高识别度,使节约的击键次数和时间又还了回去,无形中还增加了记忆负担,而且打字的过程中还要不断地思考怎么拆?什么字根?在什么位置?出字后待屏又是什么编号?用不用翻页?等等,用这种方法打字,总让人觉得不从识字阶段的小学时期开始,实难全面掌握,是它的先天缺陷;另外从规范角度讲在用的字根表类几乎都存在不合规的问题,国标规范部件五百多个,如果没有自定规则实际上是没有什么使用价值的;再则拆字(字根)法的前提是把汉字分成两大块,能拆则拆,不能拆的则用其它的方法处理,事实上它是用两套方法在打字,必然是两种思维方式,再加上拆与不拆的分辨,使打字变成了复杂的脑力活动,且思维繁杂,长期坚持使用尚可,若有间断,则多半会遗忘,大都无法兼顾处理易学、高效、科学的矛盾。
笔画(首尾)法的好处在于依笔顺书写顺序,作为编码的序性依据,简单易学,这一点是值得肯定,但对汉字的结构特性稍有了解的人都清楚,在用的“首三尾一”方案有先天缺陷而难以提高效率,且无法去除众多的重码,在不改变规则的前提下,那怕是“首十二尾一”也无法彻底去除一码多义。
是坚持不厌其烦地去找字,还是寻求一种更完美的汉字编码,是一种选择,也是一种无奈,无论如何作为传承数千年不变、不断的符号体系,在面临信息时代的新局面,需要一套完整的以组成汉字的基本单位(笔画)为基本编码元素的编码体系,以适应机器辨识的需要,这是无疑的。
码元最小;码串最短;记量最少;规则最简。是汉字编码的最高追求,一码多义是任何编码的极忌,在汉字编码中表现的就是一码多字(重码),解决不了重码的方案不能说是好方案。汉字编码已经走过了三十多年,也已经混乱了三十多年,虽然方案数千,但终无扛鼎之作,政府缺位是主因,把文字这样涉及民族传承、文化血脉的要务轻易交给市场,是缺乏责任感的行为,记得多年前有专家曾预言随着信息化的到来,汉字的规范将得到加速,可惜现实正相反。
公认的现实趋向是重编程轻编码,编程和智能的确可以使“汉字进入计算机”这一过程有了很多便捷之法,但说到底这只是一种辅助之法,不能解决本质问题,好的输入方案应该在编码设计阶段就赐除掉与文字输入本身无关的任何附赘,一种能够在不同键位的键盘上,采用同一编码方案的输入方法亟待出现,也就是人们渴望已久的汉字“通用编码”,它所担负的责任和意义不仅是“把汉字弄进机器中”这样简单的操作技术层面,而是关乎汉字字符集(字库)的编建,中文信息化,网络传输等的提升,在期盼已久的中文操作系统无法短期出壳的情况下,也只能寄望于编码的提高来弥补之。
发明内容
本发明的设计思想是 让书写与录入融入一体、 使运笔与击键相辅相成。
本发明的实现路径是 一字一个编码、一字编码唯一。
本发明的最终目的是 实现汉字无字根、无编码、无字库输入,真正使人机高度融合,使中文识字教育符合现代信息化需求,让读、写、录三结合同步教学,音、形、码一次掌握,彻底改变无纸办公时代愈演愈烈的全民书写失忆,这一社会通病。
1、本发明的理论支撑,如权利要求1、2所述,一种计算机类形码汉字键盘技术,其特征在于:
本发明是建立在严谨的数字统计、严密的数据计算、严格的结构分析基础之上,选择当前正在使用的一万个汉字作为样本和数据来源,对笔画、笔画结构、笔画相邻、笔画相交、笔画重复、笔画连接、笔画位置、笔画变异、笔画演变等项进行深入探讨和精确的数据统计;对笔画进行分析可以发现一些带有普遍和规律性的现象:即由笔画组成汉字的过程,就是笔画的相邻、相交、重复、相连的不断组合。
笔画利用率:笔画的组字参与度,建立这个概念的目的在于重新认识笔画在编码中的作用。
笔画编码利用率:笔画作为编码元素进入码串的次数。
入字度:笔画在一字中出现的数量(入字度高的笔画其编码离散度低,反之入字度低的笔画编码离散度高)。
入字率:笔画在文字中出现的次数(入字率高的笔画其编码区别度低,反之则高)。
入码度:笔画在一字编码中出现的数量,即笔画被用来作为编码元素的次数(入码度高的笔画其编码离散度低,反之则高)。
入码率:笔画在编码中出现的次数(入码率高的笔画其编码区别度低,反之则高)。
重复率:笔画在组字时连续出现在同一位置的几率,双重、三重、四重的都有,重复结构对编码十分不利,如果两个字中出现相同的笔画重复结构,会使码串变的很长,如不采取措施,重码不可避免,重复结构在文字中出现的频率还是很高的,好在重复的范围不大,仅有6个笔画(横、竖、撇、点、撇折横、撇折点)有重复现象;还有一种重复现象也很普遍,就是笔画结构(部件)的重复,它也是编码的一个难题,也应引起重视;相同的笔画(撇与撇)首尾相连也以重复论之。
入字,是先天存在,是客观,是条件,不可变更,但有其内在的规律性。
入码,是后天人为,是主观,是设计,可发现和提高、用利避弊。
总之文字是既成事实,是我们无法改变的,笔画入字度平衡是编码均衡的前提,笔画入字率平衡是编码离散的前提,可惜这两个条件均不具备,这是汉字给我们出的一道难题,我们能做的就只有精确统计出笔画的入字度和入字率,并且从中找出一些可资利用的规律和可资借鉴的编码素材,我们可以大有作为的是在入码度和入码率的利用上,通过改变笔画的入码率来达到无重码、通过调整入码率使笔画的入码度趋于均衡,让入字度高的笔画尽量少入码串,让入字度低的笔画尽量多地进入码串,籍此提高码识别度,从而实现减少码元、压缩码长、杜绝重码的至尚至美的境界。
粗略的数字统计分析结果显示:
撇笔画的入字率高,横笔画的入字度高;横笔画的相交结构和重复结构都很多,撇笔画次之;这对于如何解决码离散和码聚合问题有重要的参考作用。
汉字从产生、发展、演变到逐渐完善,受到过无数的冲击和改造,与战争、灾害、权力、外域文化、外来干涉等进行过难以计数的磨砺和嬗变,以至于成为独特的完整的构造体系,都与机器无关,而信息化时代的网络传输、机器识别、存储、显示系统等,又不是专为汉字设计的,所以使得汉字的录入才显得先天不足,汉字不为电脑而生,电脑不为汉字而存(设计),问题的根源在此。
有了上述理论的支持,运用在编码中必定会有良效。
2、本发明是一种计算机类形码汉字键盘技术,可以在各种不同键位的键盘上用同一编码输入汉字,如权利要求3所述其特征是:
以笔画的本质属性为依据把笔画分为三类:
横类笔画:横、提、横钩、横起笔的折笔画共15个;
竖类笔画:竖、竖钩、竖起笔的折笔画共9个;
斜类笔画:撇、点、捺、撇钩、捺钩、撇起笔的折笔画共7个。
这是对笔画的归类整理,把笔画依本身特性进行分类,使为数众多(31个)的笔画类分为三,便于键位的分布和安排;斜类笔画概念的提出,是因为横、竖两笔画都有大量的折笔画可以很自然地填补其键位上的码素不足和平衡键位内容,而撇笔画虽然有大量的组字参与和很高的入字率,但撇起笔的折笔画却很少,只有两个,加之捺、点两笔画在组字过程中变异频繁,且捺笔画入字度和入字率都极低,把它们归为一类,放在一个键位上,更有利于键位布局和码素调整,是均衡键位字数分布和键位内容分布的有效措施,对于压缩码长和消灭重码也有积极意义。
3、本发明是一种计算机类形码汉字键盘技术,如权利要求4所述其特征是 :
以笔画的结构属性为依据把笔画分为三形:
单形笔画:独立存在于字中的笔画;
复形笔画:相同位置重复出现的笔画;
双:构重,表示相同的笔画结构在一字中重复出现两次以上(林、炎、品、叕等);
交形笔画:笔画穿过另外的笔画形成交叉点的笔画结构;
单交:笔画与笔画相交为单交;
连交:笔画与多个笔画连续相交为连交。
在笔画分类的基础上,对笔画进更进一步的分形,为下一步对笔画的精确编码打下基础。把复形和交形笔画结构看作为有机整体给予编码,以便于减短码串长度,是个有效办法。
4、如权利要求5所述的一种计算机类形码汉字键盘技术,其特征在于:
以笔画的向度与耦合属性为依据把笔画分为三个位价:
主笔画:基本笔画,不改变运笔方向的笔画(横、提、竖、撇、点、捺共6个);
辅笔画:折笔画,改变运笔方向的笔画(横钩、横起笔的折、竖钩、竖起笔的折、撇钩、捺钩、撇起笔的折共25个);
笔画体:笔顺相连、形状固定、无重复、不相交的笔画组合;经过严格筛选、 严密计算,与组字频度的比对,本发明选定10个;
笔画体变异:与笔画在不同的字中和在字中的不同位置上发生变化一样,笔画体中的笔画当处于不同位置时也在变化(止字下面的横,在作为部首时变为提,在足字中则变成了捺);
笔画体系列:笔画体增加或减少一笔画所形成的一组相近或相似的笔画体(高头、广字、病字头等)。
通过对笔画的分类和分形,已经足以应付编码所需,再加上笔画的主辅之分,便能满足和加深我们对笔画的解析,因为对笔画的分类和分形是我们对笔画的客观存在的认识,对笔画的主辅之分则是我们对笔画的主观认识,也是我们对笔画的理解由静态变为了动态,使击键操作与运笔操作有了一定的关联。
如果我们换一个角度来看的话,主笔画的入字度和入字率都要高于辅笔画,所以在实际使用中,主笔画所在的键的搡作频率远高于辅笔画所在的键,而辅笔画大多是以单笔画参与组字,所以其编码区别度相当高,也因此是解决重码问题的中坚力量。
对于笔画体的甄别与选择,严格按照组字参与度高(八字系列、高头系列)和笔顺不易辨认(万字、脊字)两项原则;需要特别说明的是笔画体是全新的概念,有着准确的定义范畴;它与部首(偏旁)不同,部首(偏旁)有准确的意函指向,笔画体只是笔画的顺序组合,无文字学意义上的任何意函;它与字根也有本质的区别,字根是对汉字的无理拆解,字根的数量越多,其无理性也越强,笔画体是对笔画顺序、结构的规律总结,选取与界定它是一件非常复杂繁缛且无任何借鉴参考的创新工作,选多了记忆量增大不说,也给键位布局带来麻烦,选少了则不能有效解决重码问题。
本发明首次提出了笔画体的概念,从表面上看好象只是把两笔(多笔)画合一取码而已,但实际上由于它们的组字参与度极高,也就是说在大多数字中都有它们的存在,所以说对于调整键位字数和码素位置的作用是巨大的,虽然粗看似乎感觉增添了记忆量,但它所带来的压缩码长的威力是意想不到的,综合多方面因素的考虑肯定是利大于弊,是值得的;另外就是重复和交叉结构分别作为整体取码以后,使码串的综合质量已趋完美,但仍有一些小的遗憾就是汉字中存在的大量的无重复、不交叉的笔画群体有些字甚至二十多画而无重复且不相交,它们仍然影响着相当一部分字的编码质量和码串长度,还有些笔画群的笔顺往往很难准确熟练地掌握,如竖心、万字、脊字头等,正是基于上述原因,经过无数次的考证筛选,才提出了建立笔画体这一全新的概念,有了它直接为一些三四十笔画的复杂汉字的编码找到了一条捷径,且与原有规则和汉字的传统认知习惯不发生大的冲突,整体检验不失为一种可行有效的尝试,实际结果令人满意,虽然最后只选择了十个(组)笔画组合,但对于编码效率的提高是具有倍数效应的。
5、如权利要求6所述的一种计算机类形码汉字键盘技术,其特征在于:
依笔画在字中的自然状态不同对其进行编码:
单笔画取一码;复笔画(含笔画结构重复)作为整体取一码;交笔画作为整体取一码(单交依笔顺取一码;连交取交叉点多的笔画一码);笔画体作为整体取一码。
主笔画为组字量大的笔画,辅笔画为组字量小的笔画;笔画体为组字量居中的笔画。这种笔画编排序列,是经过无数次试验、数千次计算分析的结果,每个笔画都逐一在所有位置上安排过,最后综合考虑最长码长、码位空置、高频字优先、重码拒绝、等诸项平衡并反复比较优化后的结果,因为在整体设计时有很多无法回避的多重矛盾,比如重码与码串长度、高频字前置与码串长度都存在着难以调合的冲突,它兼顾了笔画组字规律和有利记忆等多方面的需求,比如四个钩笔画与主笔画同键同码,由于它们组字量不大,既便于记忆,又不影响输入速度,常用(组字量大)笔画则集中放在居中(电脑键盘)位置,击键方便,大量的折笔画也作了精心排布,尽量做到易记易操作,显然它不是最佳的,但是可以说是最合适的。
编码表有一个显著的特点就是具有柔性设计安排,可以在不同位数的键盘上使用,而不改变其值,在数字键盘上,每键位三个(组)笔画;在字母键盘上,每键位一个(组)笔画;在中文键盘上直接标注笔画表示符。
键位利用率高,每个键上分布的字数差不多;码位占用率高,空闲的码位少;是本发明的又一个独特之处。
码元少(记忆量小)、码串短(击键次数少)、无重码(不找字),是衡量汉字编码方案的基本标准,码元数量最理想的应在五十至六十之间,多则不应超过八十为宜,现在有的少则一两百,多的达七八百,学录入几乎等于又系统地学了一遍汉字,国家规范的部件数量五百多个,实用性极差,所以很少被用及;码串长度在数字键盘上,应控制在五位为佳,字母键盘上应该更短,八码一字,甚至十码一字的方案,谈不上效率,虽然国家在码串长度上没有任何限制性规定,但越短越好已成共识和竞相追求的目标;重码问题,争论了多年,仍无定论,求简单者,不怕也不嫌找字的麻烦;嫌麻烦者则不惜增加码元数量和码串长度,兼而有之的方案和技术则难之又难,始终没有被发掘和利用。
一个科学、合理、简单、易识,既符合汉字传统认知习惯,又适应机器识别规则的码元体系,是一套严谨、高效的汉字编码方案的前提,每个键位上分布汉字数量的均衡(首码均衡)和每个键位上容纳码元数量的均衡(击键次数均衡),这两个均衡是检验一套编码体系优劣的根本,缺一不可,它也是中文录入实现高效、高速、高质的基础,几十年来之所以汉字编码方案层出不穷,而终不见实质性的突破,根本原因即在此,没有真正掌握人脑识别和机器识别的本质区别,辨不清脑思维和程序思维的不同点,始终在码长变短,则记忆量增大,复杂性增强;求简单易记,则马上出现码串长度增加,重码数量增大;在这个怪圈中钻不出来,既规范,又通用;既简单,又高效则成了一种奢望;码元、码长、码容,象是一个同构的三角支撑,互相限制,互为因果;码元即用来编码的素材(元素)、码长即码串的长度、码容即码串的容量;码元的数量多少是简单易记的关键、码串的长短是是击键次数的决定因素、码容即一码所代表的字数的多少、码容单一是一码一字(无重码)的基本要求;要在三者之间找到那个最佳的平衡点,既让三点间等距,是一项繁难之事。
笔画的编码就是笔画的计算机表示方式,是本发明的核心,通过各类笔画的编码,就可以把笔画输入到计算机中,并由它拼合成我们需要的汉字或词语后显示在屏幕上。
编 码 说 明
[0037] 经过千万次的试验比对、重复验证,结论是给单笔画直接编一码,可以有效增强编码的离散度,对笔画少的字可以提高码区别度,一般在三码后即可直指单字;而把复笔画、交笔画、笔画体作为整体编一码的措施,则有效地增强了编码的聚合度,对笔画较多的字,尤其是那些笔画在二十画以上的复杂字,可以压缩码长,增强码聚合度和凝聚性,也就是说在相对简单的同一规则下,可以使编码的区别度和聚合度同时增强,实现了码串短、无重码的要求,这就是本发明的独特之处。
6、一种汉字输入方法,把汉字的笔画按特定规律分配在不不同的键位上。
汉字的笔画是异常智慧的产物,由它所构成的汉字,更是一个庞杂无序的符号系统,人们习惯把它们归为一种的折笔画,不但有着二十多个的庞大数量,也是一个变化无常的笔画群体,它们长期被视为汉字编码的累赘,实际上折笔在组码时发挥的离散作用不可小觑。
汉字非常的无规,甚至让人感觉到“凌乱”,一画可为一字,四十画也是一字,其结构上下左右多少无常,笔画密者数十,疏者一二,要在这其中寻觅可循之规律,不下功夫是难有收益的;汉字的笔画也然,有的笔画百分之八十的字都需要,而有的笔画仅与三五字有涉,更有甚者,有一个笔画仅在一个字中出现,实在让人觉得无存在必要,所以把笔画作为编码依据同样有难以平衡数量的问题,本发明把一些组字度低的笔画适当归并,起笔相同的折笔画同编一码,由于涉及的字数极少,对码串质量无任何影响;汉字的同构现象非常普遍,相同的结构在不同的字中出现,必然给编码带来不便,使重码现象难以避免,我们只能深入挖掘相同中的不同,发现弊中隐利,从而弊中取利。
本发明力求让中文输入简单,如权利要求7、8所述,只要会写的字,记住了笔顺,仅此就可打字,与字形、字义、字音皆无任何关联,使打字变的简单、清爽,只与笔画有关,出错机率降低到只有笔顺一处,且极易纠正。另外还有关于笔顺的歧义,其实大多与个人书写习惯有关,真正有不同或者更高的见解,只能进行理论上的探讨或存疑,执行层面应该无异议,一切按国标规范办是本发明的依据。由于单字输入的效率极高,且全过程实现了纯符号化,不与音、形、义发生任何联系,故本发明尤其适合工商、税务、公安、统计、科研、医疗卫生、识字教学、对外汉语教学等行业使用,并可嵌入各种手持设备、游戏设备、自动控制设备以及各类操作系统中。
7、如权利要求6、7所述的一种计算机类形码汉字键盘技术,其特征在于:
在不同的键盘上把笔画有规律的进行分配,笔画所占据的键位即为该笔画(含笔画结构)的编码,在数字键盘上显示为1——0十个数字;在字母键盘上显示为Q——M二十六个字母;在中文专用键盘上则为笔画的表示符。
在数字键盘上1-2-3键为横类笔画区、4-5-6键为竖类笔画区、7-8-9键为斜类笔画区、*-0-#键为符号口框区;竖数1-4-7键为单笔画区、2-5-8键为复笔画区、3-6-9键为交笔画区;同时每个键位上都分配有三个位次的笔画:一个主笔画、一个(组)辅笔画、一个(组)笔画体;
1 横、横钩、笔画体四横一竖、辰字头;
2 提、同一位置重复出现的横含两横、三横和四横;横起笔的折(有交叉)笔画;高字头、厂字、广字、病字头和点横折撇;
3 横起笔的单交叉与横笔画的连交叉;横起笔的折交叉、横起笔的连折(无交叉)笔画;三撇撇钩、聚字底、衣字底、艮字底;
4 竖、竖钩、八字及变异(正八、倒八、竖八、撇横八与扩展撇双横);
5 竖重、竖起笔的折(有交叉) 笔画;止字及其变异结构;重复的笔画结构;
6 竖交、各种与竖笔画连续交叉的笔画结构、竖起笔的折交叉、竖起笔的连折(无交叉)笔画;心、竖心、三点水;
7 撇、撇钩、捺钩;登字头、祭字头、脊字头、留字头等;
8 点、捺、两撇、三撇、撇折横、撇折点、月字框、同字框、句外框、鱼字头、万字底;
9 撇起笔的单交叉与撇笔画的连交叉、点的交叉、撇折横的交叉、撇折点的交叉、火字与四点;
0 口、尸、左框、右框、上框(含变异秃宝盖)、下框;
* 标点符号;
# 数学符号。
在字母键盘上第一行Q——P为笔画体区、第二行A——L为主笔画区、第三行Z——M为辅笔画区;在主笔画区里A-S-D横类笔画区、F-G-H为竖类笔画区、J-K-L为斜类笔画区;A-F-J为单笔画键、S-G-K为复笔画键、D-H-L为交笔画键;在笔画体区里每个键上分配一个(组)笔画体;在辅笔画区里每个键上分配一个(组)辅笔画;
A 横;
S 提、横重(两横、三横、四横);
D 横交、横起笔的单交叉与横笔画的连交叉;
F 竖;
G 竖重(两竖、三竖);
H 竖交、各种与竖笔画连续交叉的笔画结构;
J 撇;
K 点、捺、撇重(两撇、三撇);
L 撇交、撇起笔的单交叉与撇笔画的连交叉;
Z 构重、重复的笔画结构;
X 横折、横起笔的折(有交叉)笔画、横钩;
C 横折交、横起笔的折交叉、横起笔的连折(无交叉)笔画;
V 竖折、竖起笔的折(有交叉) 笔画、竖钩、;
B 竖折交、竖起笔的折交叉、竖起笔的连折(无交叉)笔画;
N 撇折、撇钩、捺钩、撇折横、撇折点;
M 撇折交、撇折横的交叉、撇折点的交又;
Q 笔画体(四横一竖、三横一撇);
W 点横系列(高字头、厂字头、广字头、病字头);
E 撇撇钩系列(三撇撇钩、聚字底、衣字底、艮字底);
R 八及变异(正八、倒八、竖八、撇横八);
T 止及变异(止字、足字底、此字左半部);
Y 心与变异(心字底、竖心、三点水);
U 登头系列(登字头、祭字头、留字头等);
I 月框系列(月框、同框、句外框、鱼字头、万字底);
O 火与四点(火字旁、四点底);
P 口框系列(口字、尸字、上下左右三框、秃宝盖)。
在中文专用键盘上直接标出笔画表示符,直击码符即可输入,与英文输入相同,完全实现了中文输入的简单、轻松、自然。
8、如权利要求8所述的一种计算机类形码汉字键盘技术,其特征在于:
依据编码规则和笔画键位分布,其取码方法是按照。
编码+余码的顺序提取汉字的编码(单字编码在数字键盘上最长5码,在字母键盘上更短,一码字即[键名字]10个)。
余 码…重叠的笔画结构(部件)的首码和交、重结构剩余笔画的码。
余码只用在输完全部编码后仍出不来的少数字上,拆笔画时应先拆复形笔画结构,再拆交形笔画结构,最后拆笔画体;一字中同时有两个复形、交形结构和笔画体时,从后往前依笔顺拆;实际上这种情况很少出现。
实施方式。
1、打字:以汉字书写笔顺为序,依次输入汉字笔画(主笔画、辅笔画、笔画体)的编码,所需的字出现时按确认键即可;输入词组或短句时在第一字出现时,不按确认键,继续输入第二、三……字的码,后面的字不需输完全码即可见字,且越靠后所需的码越少,减少击键次数,节约时间。
例:输入“真”字,在9位数字键盘上它的全码是3024,实际输入302即可出字;
在26位字母键盘上它的全码是dpsr,实际输入dps即可出字;
在48位中文键盘上直接击相应的符号键即可;
其码元为四个,码素分别为:横单交十字、上三框、横四重、底八字。
2、功能键:在成型产品上不改变其功能键设置,在中文专用键盘上定义了新型系列功能键。
3、增位键:为提高整套编码的整体效率和键盘的操作效率,本发明设置了增位键,在数字键盘上为〇键、在字母键盘上为Z键,其作用有二。
一是在汉字中存在一些笔画很少的字(乜、乂、彳、亍),由于笔画少,所以占据了极好的键位和码位,关键是这些字平时很少用到,实际上让这些高效码位成了空闲,直接影响键盘的整体操作效率,所以对这些字的编码采取了增加增位键的措施,在有需要时可以顺利找到并检出它们,又让出了优质码位给常用字使用,从这个意义上说增位键实际上是增效键。
二是有一些笔画很多又不常用的字(齇、鼢),只有在一些古文献、文言文、古人名、古地名中才偶尔出现,使用频率不高,但笔画很多、结构繁复,藉此编码也长出普通字,对这部分字的处理方式是,当第四码仍不能单独显示时,第五码打一个〇(Z),以缩短码长,有效检出这些冷僻又复杂的字,从此意义上讲,增位键又成了减位键,无论增位还是减位,其提高码位利用率和输入效率的作用是巨大的,因为尽管它们的字数不多,但处理不好的话在操作层面是很麻烦的,试想不用的字总在眼前晃,而总用的字确在它们的后面,这是令人不悦的。
4、依该技术设计思路,该技术还可扩展,只要对多种文字的笔画定义作相应的映射改变,同样可以在日文、韩文、越文等文字中适用;若把笔画表示符作以数字化的技术处理,直接嵌入芯片中,配合相应的显示技术予以支持,人们期待已久的无字库汉字输入将有可能得以变为现实。
Claims (10)
1.一种计算机类形码汉字键盘技术,其特征在于:用一套编码在不同键位的键盘上输入汉字。
2. 如权利要求1所述的一种计算机类形码汉字键盘技术,其特征在于:
以汉字的笔画作为基本输入单元和编码元素;对笔画进行分析可以发现一些带有普遍和规律性的现象:即由笔画组成汉字的过程,就是笔画的相邻、相交、重复的不断变化与组合;
入字度:笔画在一字中出现的数量(入字度高的笔画其编码离散度低,反之入字度低的笔画编码离散度高);
入字率:笔画在文字中出现的次数(入字率高的笔画其编码区别度低,反之则高);
入码度:笔画在一字编码中出现的数量,即笔画被用来作为编码元素的次数(入码度高的笔画其编码离散度低,反之则高);
入码率:笔画在编码中出现的次数(入码率高的笔画其编码区别度低,反之则高)。
3. 如权利要求2所述的一种计算机类形码汉字键盘技术,其特征在于:
以笔画的本质属性为依据把笔画分为三类:
横类笔画:横、提、横钩、横起笔的折笔画共15个;
竖类笔画:竖、竖钩、竖起笔的折笔画共9个;
斜类笔画:撇、点、捺、撇钩、捺钩、撇起笔的折笔画共7个。
4. 如权利要求3所述的一种计算机类形码汉字键盘技术,其特征在于:
以笔画的结构属性为依据把笔画分为三形:
单形笔画:独立存在于字中的笔画;
复形笔画:相同位置重复出现的笔画;双:构重,笔画结构重复,表示相同的笔画结构在一字中重复出现两次以上(林、炎、品、叕等);
交形笔画:笔画穿过另外的笔画形成交叉点的笔画结构;
单交:笔画与笔画相交为单交;
连交:笔画与多个笔画连续相交为连交。
5. 如权利要求4所述的一种计算机类形码汉字键盘技术,其特征在于:
以笔画的向度与耦合属性把笔画分为三个位价:
主笔画:基本笔画,不改变运笔方向的笔画(横、提、竖、撇、点、捺共6个);
辅笔画:折笔画,改变运笔方向的笔画(横钩、横起笔的折、竖钩、竖起笔的折、撇钩、捺钩、撇起笔的折共25个);
笔画体:笔顺相连、形状固定、无重复、不相交的笔画组合;经过严格筛选、严密计算,与组字频度的比对,本发明选定10个;
笔画体变异:与笔画在不同的字中和在字中的不同位置上发生变化一样,笔画体中的笔画当处于不同位置时也在变化(止字下面的横,在作为部首时变为提,在足字中则变成了捺);
笔画体系列:笔画体增加或减少一笔画所形成的一组相近或相似的笔画体(高头、广字、病字头等)。
6. 如权利要求5所述的一种计算机类形码汉字键盘技术,其特征在于:
依笔画在字中的自然状态不同对其进行编码:
单笔画取一码;复笔画(含笔画结构重复)作为整体取一码;交笔画作为整体取一码(单交依笔顺取一码;连交取交叉点多的笔画一码);笔画体作为整体取一码。
7. 如权利要求6所述的一种计算机类形码汉字键盘技术,其特征在于:
把汉字的笔画按特定规律分配在不不同的键位上,在不同键位的键盘上把笔画有规律的进行分配,笔画所占据的键位即为该笔画(含笔画结构)的编码,在数字键盘上显示为1——0十个数字;在字母键盘上显示为Q——M二十六个字母;在中文专用键盘上则为笔画的表示符;
在数字键盘上1-2-3键为横类笔画区、4-5-6键为竖类笔画区、7-8-9键为斜类笔画区、*-0-#键为符号口框区;竖向数1-4-7键为单笔画区、2-5-8键为复笔画区、3-6-9键为交笔画区;同时每个键位上都分配有三个位次的笔画:一个主笔画、一个(组)辅笔画、一个(组)笔画体;
在字母键盘上第一行Q——P为笔画体区、第二行A——L为主笔画区、第三行Z——M为辅笔画区;在主笔画区里A-S-D横类笔画区、F-G-H为竖类笔画区、J-K-L为斜类笔画区;A-F-J为单笔画键、S-G-K为复笔画键、D-H-L为交笔画键;在笔画体区里每个键上分配一个(组)笔画体;在辅笔画区里每个键上分配一个(组)辅笔画;
在中文专用键盘上直接标出笔画表示符,直击码符即可输入,与英文输入相同,完全实现了中文输入的简单、轻松、自然。
8. 如权利要求6、7所述的一种计算机类形码汉字键盘技术,其特征在于:
依据编码规则和笔画键位分布,其取码方法是按照:
编码+余码的顺序提取汉字的编码(单字编码在数字键盘上最长5码,在字母键盘上更短,一码字即[键名字]10个);
余 码…重叠的笔画结构(部件)的首码和交、重结构剩余笔画的码;
余码只用在输完全部编码后仍出不来的少数字上,拆笔画时应先拆复形笔画结构,再拆交形笔画结构,最后拆笔画体;一字中同时有两个复形、交形结构和笔画体时,从后往前依笔顺拆;实际上这种情况很少出现。
9. 功能键:在成型产品上不改变其功能键设置,在中文专用键盘上定义了新型系列功能键; 增位键:在数字键盘上为〇键、在字母键盘上为Z键;是专为提高整套编码的操作效率而设置,其作用是把笔画少的冷僻字(乜、乂、彳、亍等)的编码加长,笔画多的冷僻字(齇、鼢)的编码减短,以让出优质码位给常用字,从而提高键盘操作效率。
10. 打字:以汉字书写笔顺为序,依次输入汉字的编码,所需的字出现时按确认键即可;输入词组或短句时在第一字出现时,不按确认键,继续输入第二、三……字的码,后面的字不需输完全码即可见字,且越靠后所需的码越少,减少击键次数,节约时间;依该技术设计思路,只要对多种文字的笔画定义作相应的映射改变,同样可以在日文、韩文、越文等文字中适用;若把笔画表示符作以数字化的技术处理,直接嵌入芯片中,配合相应的显示技术予以支持,人们期待已久的无字库汉字输入将有可能得以变为现实。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012104407732A CN102902370A (zh) | 2012-11-04 | 2012-11-04 | 一种计算机类形码汉字键盘技术 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012104407732A CN102902370A (zh) | 2012-11-04 | 2012-11-04 | 一种计算机类形码汉字键盘技术 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102902370A true CN102902370A (zh) | 2013-01-30 |
Family
ID=47574656
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012104407732A Pending CN102902370A (zh) | 2012-11-04 | 2012-11-04 | 一种计算机类形码汉字键盘技术 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102902370A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103744537A (zh) * | 2014-01-22 | 2014-04-23 | 高炳礼 | 一种三笔数码输入法及其输入键盘 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1123424A (zh) * | 1994-11-19 | 1996-05-29 | 袁恒祺 | 八卦码汉字输入方法及其键盘 |
DE20207999U1 (de) * | 2002-05-23 | 2002-10-24 | Straube Axel | Computerkeyboard mit Zahlentasten-Wechselmöglichkeit durch Steckerverbindung |
CN102023717A (zh) * | 2010-10-28 | 2011-04-20 | 王治阳 | 三五首次音码及其键盘 |
CN102253726A (zh) * | 2011-03-07 | 2011-11-23 | 狄铁超 | 一种计算机汉字数字笔画的输入方法及键盘技术 |
-
2012
- 2012-11-04 CN CN2012104407732A patent/CN102902370A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1123424A (zh) * | 1994-11-19 | 1996-05-29 | 袁恒祺 | 八卦码汉字输入方法及其键盘 |
DE20207999U1 (de) * | 2002-05-23 | 2002-10-24 | Straube Axel | Computerkeyboard mit Zahlentasten-Wechselmöglichkeit durch Steckerverbindung |
CN102023717A (zh) * | 2010-10-28 | 2011-04-20 | 王治阳 | 三五首次音码及其键盘 |
CN102253726A (zh) * | 2011-03-07 | 2011-11-23 | 狄铁超 | 一种计算机汉字数字笔画的输入方法及键盘技术 |
Non-Patent Citations (1)
Title |
---|
陈钦梧等: "汉字笔画编码输入法研究", 《汕头大学学报(自然科学版)》, vol. 22, no. 2, 31 May 2007 (2007-05-31), pages 71 - 75 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103744537A (zh) * | 2014-01-22 | 2014-04-23 | 高炳礼 | 一种三笔数码输入法及其输入键盘 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103257720B (zh) | 一种汉字输入法 | |
CN102253726B (zh) | 一种计算机汉字数字笔画的输入方法及键盘技术 | |
CN102750000A (zh) | 双拼王输入法 | |
CN102902370A (zh) | 一种计算机类形码汉字键盘技术 | |
CN100381985C (zh) | 一种新的以汉字笔画结构进行编码的中文输入法 | |
CN101930292B (zh) | 汉字的形音数的综合编码输入方法和应用 | |
CN104123011A (zh) | 汉字和汉语拼音的编码输入方法和应用 | |
JP2011522492A (ja) | 中国語教育に適した漢字の入力方法 | |
CN100381983C (zh) | 通俗五笔字根编码的汉字输入方法 | |
CN101192102A (zh) | 26键输入法 | |
CN101093421A (zh) | 汉字的四笔层次形码及形音的数字编码输入方法 | |
CN113253853B (zh) | 一种计算机和手机的汉字输入方法 | |
CN102375558A (zh) | 计算机汉字快码五笔输入法 | |
CN100511112C (zh) | 汉字拉丁式五笔输入法 | |
CN101086687A (zh) | 一种首末码汉字输入方法 | |
CN106970718A (zh) | 新型华字及华字键盘的华字两笔输入法 | |
CN101192103A (zh) | 双分输入法 | |
CN101251773A (zh) | 计算机汉字信息猎头码输入法 | |
JP6074332B2 (ja) | コンピュータ・電子辞書・スマートホンキーボードの日本語文字配列 | |
CN104133560B (zh) | 组合式双笔类主副码汉字、词语编码输入法及其键盘 | |
CN101458572A (zh) | 二十五字代码汉字输入法 | |
JP2019215928A (ja) | コンピュータ、スマートホンキーボードの日本語文字の構成とタイピング入力方法及び配列 | |
CN1306241A (zh) | 字形笔顺码汉字输入系统及其键盘 | |
CN110442246A (zh) | 一种汉字部件输入法 | |
CN105320290A (zh) | 音义类主副码字母型部首字典、声系字典汉字编码输入法及其键盘 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130130 |