CN103207685A - T形汉字码输入法 - Google Patents

T形汉字码输入法 Download PDF

Info

Publication number
CN103207685A
CN103207685A CN 201310161079 CN201310161079A CN103207685A CN 103207685 A CN103207685 A CN 103207685A CN 201310161079 CN201310161079 CN 201310161079 CN 201310161079 A CN201310161079 A CN 201310161079A CN 103207685 A CN103207685 A CN 103207685A
Authority
CN
China
Prior art keywords
character
coding
code
chinese character
basic element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201310161079
Other languages
English (en)
Inventor
王治阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 201310161079 priority Critical patent/CN103207685A/zh
Publication of CN103207685A publication Critical patent/CN103207685A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

一种计算机汉字编码输入方法即T形汉字码输入法,它由音码和形部编码两部分组成,主要编码原理是同音同偏旁部首的合体字除偏旁部首外的部分的第一笔为同类基本笔画的情况出乎意外的少,只需选用28个左右的多笔画部件和五种基本笔画就能做到既简单又快速地输入汉字。

Description

T形汉字码输入法
技术领域
本发明属于电脑汉字编码输入方法,也就是计算机汉字编码输入法。因为本输入法是在汉字码的基础上,在形部编码时,考虑到编码时不停地区分汉字是否为左右结构比较麻烦,而极具创造性地提出“一竖横向T形选取基本部件”的新方法进行编码,所以称为一竖横向T形汉字码输入法,简称T形汉字码输入法,还涉及了为实现这一输入法的键盘。
背景技术
键盘输入法是目前汉字输入法中技术最成熟,使用最广泛的输入法。键盘输入的特点是必须对输入的汉字进行编码,汉字编码是指用一组代码表示一个汉字,按汉字编码所在键,通常要按1~4键输入一个汉字。键盘输入按编码划分,可分为音码、形码、音形码三类。
音码以汉语拼音为基础,利用汉字的读音进行编码。音码的优点是使用方便,只要会懂汉字拼音,就可以进行输入,简单易学,所以使用最为广泛。缺点是同音字多,导致单字重码率高,汉字输入速度慢,采用智能拼音输入法也只能部分提高输入速度,无法完全避免同音字选择。还有对不认识的字无法用拼音直接输入,对发音不准的字和冷僻字也不能很快输入。
形码利用汉字的字形特征进行编码,克服了音码重码率高、输入速度慢等缺点,但往往汉字部件太多,记忆麻烦,有时拆分也麻烦。有的形码采用将汉字五种基本笔画二二组合的方法,汉字部件少,记忆方便,但却付出了不够直观,将汉字部件拆散了的代价。虽然形码虽然声称对不认识的汉字也能迅速输入,但对于一个文盲来说,他打字的速度是要受限制的,根本原因是汉字的字与词无明显间隔,不知道哪个是词组,无法利用词组输入,因此形码输入人员也要有文化。
音形码利用汉字的语音特征和汉字的字形特征编码。它利用了汉字的音码和形码各自的优点,兼顾了汉字的音和形,往往较为简单,容易学习和记忆,有的音形码还重码率低,输入速度足以与任何形码相比,利用整个拼音参与编码的音形码还有利于推广普通话,优点十分明显。音形码的缺点是打字时在音和形之间思维不断转换,容易疲劳。当然对熟练的打字者来说,往往已熟记汉字的编码,见字识码,根本不存在音和形之间思维转换问题。还要指出的是,只用汉字声母参与编码的音形码,由于必须舍弃韵母,与人们的习惯思维不符,才特别存在音形思维转换问题。如果完整地利用了汉字的声母和韵母,即利用了汉字的整个拼音,并且规定音码部分在先,形部编码部分在后的话,则思维不大需要在音和形之间不停转换,基本上不会影响思维。因为在一般的文章中,大多数都是词语,平常打字时,往往尽量采用词组输入的方式,因此大部分内容都可用拼音词组输入。还有一些常用的字也可用拼音输入,即便要用到形部编码,一般也只要输入形部编码的第一码,而形部编码的第一码多为汉字的偏旁部首,偏旁部首数量是有限的,且常见偏旁部首数量更少,一般都有固定编码代码,是很容易记住形部编码的第一码的。真正需要输入形部编码第二码的单字是很少的,只有这少部分汉字才不大容易记住形部编码,由于输入形部编码的第一码后,第二码会提示出来,实际上没有多大必要记住形部编码第二码,因此这种音形码基本上不会影响思维,思维甚至比形码更简单。所以如果想发明音形码,为避免音形转换麻烦,要尽量利用汉字的整个拼音输入,而不要只利用拼音的首字母或声母。受方言的影响,有些人读不准某些汉字的拼音,但这也可通过南方模糊音解决,而且多利用拼音输入汉字也有利于推广普通话。正因为如此,整个汉字拼音在先的音形码相对与其它音码、形码、只用汉字拼音首字母的音形码来说,越来越显示出其优越性。
可音码使用全拼的话,则存在着全拼的码长过长,输入不便的问题,使用双拼则能使码长大为缩短,可目前的大多数双拼的韵母排列都比较难记,要记什么口诀,所幸的是本人发明了几种新的双拼,由于发明人是王治阳,所以称为王治阳双拼,已申请专利,很简单易学,不要记口诀,几分钟就可学会,记忆双拼已不成问题。因此发明音形码的关键是发明出简单易学且能有效区分同音字的方法,这就要靠音形码的形部编码设计简单合理。有的输入法也称形部编码为辅助码。然而目前各种利用了整个拼音的音形码的形部编码往往存在汉字部件过多或部件不够直观规范或取码规则不合理或重码多等问题。如何解决这个问题是一个长期未能解决的大难题。
针对于此,本人发明了正左上方汉字码输入法,它在王治阳双拼后,再利用28个左右的多笔画部件和五种基本笔画输入形部编码,具有汉字部件简单、直观、规范的优点,稍微不足的是其编码规则为多笔画部件取首次二个基本部件编码,单笔画部件取首尾二个基本部件编码,由于多笔画部件位于汉字左上角时,为减少重码,仍要取该汉字的首尾二个基本部件编码,有些人对此略微不适应。
发明内容
这样,目前的汉字输入法要么汉字部件不规范或选取汉字部件过多;要么码长太长;要么重码过高,影响输入速度;要么只利用汉字的声母或拼音首字母;要么不够直观;要么取码规则不太合理,会影响头脑反应,都没能很好解决简单,快速,合理的问题,输入汉字不甚方便。
本发明的目的是提供一种汉字部件规范直观、简单易学、取码规则合理、部件分类合理、输入汉字简便快捷的计算机汉字编码输入方法,那就是T形汉字码输入法。
为达到T形汉字码输入法的目的,本发明规定T形汉字码输入法的编码由音码和形部编码这两个部分组成。音码部分建议采用王治阳双拼,占二码。形部编码部分也最多占二码。当然音码也可用全拼或其它双拼或注音字母拼音或不完整拼音,所说的全拼即国家规定的汉字的标准拼音。
音码部分很多人喜欢采用拼音,因为拼音根本不必学习,但为提高输入速度,建议采用双拼,它通过将汉语拼音中的声母或韵母各自映射到某个按键上,使得每个音都可以用最多两次按键打出,很大地提高了拼音输入法的打字速度。这种声母或韵母到按键的对应表通常称之为双拼方案,这种方案不是固定的,双拼种类很多,有微软、搜狗、自然等多种,用本发明也可采用这些双拼,但最好采用王治阳双拼。王治阳双拼对那些按汉语声韵互补规律中没被合并的多个字母组成的韵母按第一个字母分为a、o、e、i、u区,每区又按韵母个数多少以及a、o、e、i、u、n、g的顺序排列,极具规律性,当然也可不按韵母的个数,只按a、o、e、i、u、n、g的顺序将韵母分区排列。唯一需要记忆的是双拼韵母的合并规律。在记忆双拼韵母合并规律时,只要记住以a、ong结尾的多个字母的韵母合并,以ang结尾的4个字母的韵母合并排列就是,ia被ua合并,iang被uang合并,iong被ong合并,以ü开头的多个字母的韵母均被以u开头的多个字母的韵母合并,另外ui被v合并,uo被o合并,读音简记为“为余”,“我窝”。
台湾地区通行注音输入法,注音输入法的用法与拼音输入法基本相同,区别在于注音输入法是以声韵母双拼输入,而拼音输入法是以字母全拼输入,台湾地区在利用本发明时,音码部分也可采用注音输入法。
有时,输入某个汉字未必需要采用一个汉字的全部拼音字母,只要输入该汉字的前几个拼音字母就可,这种输入方法被称为不完整拼音。本发明必要时也可采用不完整拼音,不过会付出重码增加的代价。
形部编码也一般由两个代码组成,有时可能只有一个代码。本发明优选了五种基本笔画和28个左右的多笔画部件参与编码,这五种基本笔画和28个左右的多笔画部件被统称为基本部件,全部选自汉字的偏旁部首,既简单常见又直观,并且数量少,容易记忆。由于国家语委将五种基本笔画也称为汉字部件,因此在本发明中称五种基本笔画称为单笔画部件,而其它28个左右的优选的汉字部件由多个笔画组成,称为多笔画部件。在形部编码时要优先按笔画多的基本部件编码,否则由于多笔画部件可拆分成单笔画部件,而按单笔画部件编码的话,选取多笔画部件就无意义。
形部编码的取码规则是:独体字,按书写顺序取该汉字的第一个和最末一个基本部件的代码编码,当然也可规定取该汉字的前二个基本部件的代码编码,只有一个基本部件的汉字,就只取这个基本部件的代码编码,或者规定接连两次取这个基本部件的代码编码。合体字,按整体结构,将它一分为二,先写部分为首部,后写部分为剩部,按书写顺序取该汉字的首部的第一个和最末一个部件的代码进行编码,当然也可规定按书写顺序取该汉字的首部的前二个部件的代码进行编码,当首部只有一个部件时,按书写顺序取该汉字的剩部的第一个部件的代码进行编码。如果嫌这个编码规则烦,而不规定首部最多可取二码的话,也可以规定合体字的形部编码的取码规则为:分别按书写顺序取该汉字的首部和剩部的第一个基本部件的代码进行编码。
另外,形部编码的取码规则还可规定为:非左右结构的汉字,按书写顺序取该汉字的第一个和最末一个基本部件的代码编码,当然也可规定按书写顺序取该汉字的前二个基本部件编码,只有一个基本部件的汉字,就只取这个基本部件的代码编码,或者规定接连两次取这个基本部件的代码编码。左右结构的汉字,按整体结构分为二部分,左半部分简称左部,右半部分简称右部,按书写顺序取该汉字的左部的第一个和最末一个部件,当然也可规定按书写顺序取该汉字的左部的前二个部件编码,当左部只有一个部件时,按书写顺序取该汉字的右部的第一个部件编码。如果嫌这个取码规则烦,不规定左部可最多取二码的话,也可以规定左右结构汉字的形部编码的取码规则为:分别按书写顺序取该汉字的左部和右部的第一个基本部件的代码进行编码。
还要特别指出的是:之所以不规定所有的汉字都按书写顺序取前二个基本部件的代码或都取首个、末个基本部件的代码编码,是因为这样规定的话表面上会使形部编码的取码规则显得更简单易记,实际上却会造成大量的重码,或付出增加大量多笔画部件的代价。
需要指出的是,若在汉字输入中不停对汉字做是否为左右结构或独体字、合体字,这是比较麻烦的,会影响头脑反应,本人在经历长达二十年潜心研究后,并于深夜睡醒,突发灵感,终于设计出的其他任何输入法都没想到过的取码规则,那就是“一竖横向T形选取基本部件”的取码规则。具体讲,就是按书写顺序取该汉字的第一个基本部件后,从第一个基本部件的最右端起,用一根与该汉字齐长的竖线从左到右横向推移去分隔该汉字,若能将整个汉字一分为二,则该竖线就为分隔线,将该汉字分为左边和右边两个部分,简称左部、右部,再按书写顺序取右部的第一个基本部件的代码进行编码,或者规定再取该汉字右上角所在的基本部件的代码进行编码,若该竖线从左到右地横向推移到整个汉字的最右边,意味着不能用竖线将汉字一分为二,这时沿竖线找到汉字的最末端,即按书写顺序取该汉字的最末一个基本部件的代码编码。本人用英文大写字母“T”来形象地说明取码方法,“T”为一横下面接一竖,有三个端点(即横的左端点、右端点、竖的末端点)和一个接点(即横竖相接的点),这一竖就相当于分隔线,若能左右隔开某个汉字,则取左端点、紧临接点的端点的基本部件的代码进行编码,第二码或者取右端点所在位置的基本部件的代码编码。(左端点所在位置的基本部件即为按书写顺序该汉字的第一个基本部件,紧临接点的端点所在位置的基本部件即为书写顺序取分隔线右边部分的第一个基本部件,右端点所在位置的基本部件即为该汉字右上角所在位置的基本部件),这时的取码方向为从左到右,类似于走了个“一”字形,相当于走了“T”字形的横向。若不能将汉字分为左右二个部分,则按书写取左端点和末端点所在基本部件(即按书写顺序分别取该汉字地第一个和最末一个基本部件)的代码进行编码,这时取码方向为从左到右,由于到了汉字最右端,仍无法用分隔线将汉字分为左、右二个部分,就沿分隔线到汉字的末端点,对于大多数汉字来说,汉字的最后一个部件就在右下方,取码方向类似于“7”,相当于走了半个“T”字形。但也有少数汉字右上角有个点,最末笔在右上角的点,如“犬”等,或者最末笔在汉字的内部的右下角,如“冈”等字。总的编码方向是第一码,按书写顺序取第一个基本部件的代码作为第一码,再横向找右半部分的第一个汉字部件作为第二码,没法从横向找到编码,就找按书写顺序找最后一个基本部件的代码作为第二码。
下面再解说优选基本部件的方法。在国标6763个汉字中,合体字占了绝大多数,约为95%。同音又同偏旁部首的合体字数量较多,约有五、六百对。其中氵、艹、口、木、扌、钅、亻、女、讠、忄、月、虫、土、纟、火、疒、
Figure BSA00000888397600071
山、石、日、王、阝、鱼、禾、贝等偏旁部首产生的同音字较多,为降低重码,这些偏旁被选了出来,分别用一个字母或别的符号编码,当然个别偏旁如“贝”等也可弃而不选。礻包括衤产生的同音字也较多,考虑到礻与衤属于不同的部首,总共只能减少五对左右的重码,因此在T形汉字码输入法编码实例中就弃而不选。而有的偏旁部首如“田”、“目”等虽然常用,可只有一、二对同音字,甚至没有同音字,就弃而不选,当然要选的话也可选。本人研究后还发现,同音同偏旁部首的合体字除偏旁部首以外的部分的第一笔为同类基本笔画的情况出乎意外的少,只有100多对,这一发现是只选用5种基本笔画和二三十个基本部件参与编码的根据所在。其中部件“十”和“宀”出现得比较多,有四、五对重码,它们也可被选出,分别用别的字母或符号编码。为繁体简体字兼容,“贝”也被选,这样,26个多笔画部件和五种基本笔画被优选出来,排列到键盘上,将这26个惯常出现在汉字字首即汉字的开头的多笔画部件分别用一个相应的字母或标点符号编码,在编码实例中将这些多笔画部件尽量排在不同的字母键上。汉字部件辶、阝、鸟惯常出现在汉字的字尾,其中阝已被列为基本部件;汉字部件“鸟”也会产生几个的重码,就将汉字部件“鸟”列为多笔画部件;部件辶的首笔为点,由于点在独体字或合体字的第二部分的首尾位置出现得较多,将部件辶按点编码容易造成重码,就将它列为基本部件。为降低重码,可将辶与疒合并排列,用同一个字母或其它符号编码。这样共优选了28个多笔画部件。而五种基本笔画则可从减少重码角度出发,可选其中的几个笔画与28个多笔画部件合并排列在同一个键上,用同一个字母或其他符号编码。当然这28个多笔画部件不是固定的,可少于28个多笔画部件,也可多于28个多笔画部件,只要28个左右即可,例如也可将汉字部件“十”入选,用一个字母或标点符号编码。
为便于记忆,在正左上方汉字输入法中排列多笔画部件时不按笔画数和横、竖、撇、点、折的次序排列,而按拼音或象形排列,见附图3或附图4所示。附图3以按基本部件的拼音首字母排列为主,对少数几个拼音首字母或声母相同的基本部件改按象形的方式排列。这样由于按基本部件的读音编码几乎无需记忆,少数几个改按象形的方式排列的基本部件也能很快记住,记忆量很小,因此极为简单。附图4完全按象形排列,可汉字的方块笔画部件与西文字母毕竟有所区别,难以做到十分相像,需要按象形记忆的汉字基本部件就要多上几倍,记忆量也相应多上几倍,因此本发明也不太建议用这种方式排列经过反复优选的基本部件。当然有人可能更喜欢这种排列方式。还可按义分类编码,见附图5,有人可能更喜欢按义分类的排列方式。所有的形部编码的取码规则均可采用附图3或附图4或附图5编码。
五种基本笔画分别用一个字母或别的符号编码,由于多笔画部件已经排在字母键上,建议尽量将五种基本笔画分别用标点符号编码,避免将基本笔画与多笔画部件同用一个字母或标点符号编码,当然,个别频率低的基本笔画也可与多笔画部件用同一个字母或别的符号编码。横、竖、撇、点等基本笔画在形部编码中出现的频率较高,为降低重码,不宜与基本部件排在同一个键上,用同一个字母或别的符号编码。将这四个基本笔画排到标点符号键上,用标点符号编码的话比较合理。折因为组字频率低,与某些多笔画部件排在同一个键上,用同一个字母或别的符号编码的话,几乎不会导致重码,因此也可按拼音首字母排列。当然,也可将折按声母排列在v键上,用v编码,还可以将折细分为顺折、逆折,再用两个字母分别编码,还可以将折用标点“‘”编码,这些都是该领域普通专业技术人员对本发明的变形。当然硬要将横、竖、撇、点等基本笔画与某个多笔画部件排在同一个键上,也是可以的,只是将大大增加重码。
这样,通过优选28个左右的多笔画部件和五种基本笔画,创造性地规定取码规则,就做到了形部编码既简单易记,又能有效地区分同音字,重码率很低,输入速度足以与其他任何输入法相比。这就解决了其他任何输入法都未能解决的难题,真正做到了简单直观、重码率很低、输入速度高,是一种唯一的理想的标准的汉字输入法。
附图说明
附图1为王治阳双拼键盘排列图之一
附图2为王治阳双拼键盘排列图之二
附图3为形部编码键盘排列图之三
附图4为形部编码键盘排列图之四
附图5为形部编码键盘排列图之五
具体实施方式
T形汉字码输入法由两部分组成,一部分是音码,即拼音,或称拼音码,另一部分是形部编码。这两部分组成编码时可以是音码在先,形部编码在后;也可以是形部编码在先,音码在后。但一经选定,次序就不能改变。为便于想打,与思维一致,又能充分利用标点符号键,建议拼音在先,形部编码在后,在编码实例中就采用这种方法。拼音可采用全拼或双拼或简拼或不完整拼音,不想学习双拼的人可采用全拼,即采用一个汉字的标准拼音。为缩短码长,提高输入速度,建议采用双拼,最好采用几分钟可学会的王治阳双拼。当然也可采用全拼,它几乎不要记忆。现在汉字输入技术有了很大的进步,可做到全拼、双拼兼容,而不需要调整输入法状态。在实施例中音码选用王治阳发明的双拼,同时也可规定兼容全拼。
王治阳双拼是一种声母、韵母的键位配置合理,在键盘上排列规律性强的双拼计算机汉字输入法。可单独作为一种输入法使用,也可作为T形汉字码输入法的音码部分使用。
王治阳双拼的技术方案的特征在于:
(1)单个字母的声母与各字母键一致,而翘舌音ch、sh、zh按音序分别用i、u、v表示,以便于记忆,当然也可改而将ch用u表示,sh用i表示,zh仍用v作代码,单韵母ü用字母v表示。根据韵母的语音互补关系,单个字母的韵母除了可排按声韵合并规律,被它包含的韵母外,不能再排其它韵母。对按声韵互补规律没被合并的多个字母组成的其它的复韵母和鼻韵母也用单个字母表示,开口呼韵母配置在标准键盘中排,并按第一个字母分为a、o、e区;齐齿呼韵母配置在键盘上排,称为i区,合口呼和撮口呼韵母配置在标准键盘下排,称为u区,包括ü区;每区又按韵母字母个数从左到右排列,字母个数相同的韵母按a、o、e、i、u、n、g的次序从左到右排列。见附图1。当然也可将合口呼和撮口呼韵母配置在键盘上排,称为u区,齐齿呼韵母配置在键盘下排,称为i区。在编码实例中不这么排列。
(2)各韵母与字母映射关系设定为:
a——a    b——uai    c——un  ün    d——ai
e——e    f——an    g——ang   h——ou    i——i
j——ong  iong    k——ei    l——en    m——uang iang
n——uan üan    o——o uo   p——ing
q——ie  r——in er    s——ao   t——iao
u——u    v——üui    w——iu    x——ue üe
y——ian    z——ua ia    ;——eng
见附图1所示,这里翘舌音ch、sh、zh按英文音序分别用i、u、v表示,也符合指法规律。本人认为这种双拼键盘排列方式是比较理想的,因此在编码实例中采用这种双拼。
当然也可不考虑韵母的个数,对每区按韵母字母根据a、o、e、i、u、n、g从左到右排列;
这时各韵母与字母映射关系设定为:
a——a    b——uang iang    c——uan üan    d——ai
e——e    f——an    g——ang    h——ou
i——i    j——ong iong    k——ei    l——en
m——un ün    n——ue üe    o——o uo    p—ing
q——iao    r——ie er    s——ao   t——iu
u——u    v——üui    w——ian    x——uai
y——in    z——ua ia    ;——eng
在键盘上的排列如附图2所示,翘舌音ch、sh、zh仍按英文音序分别用i、u、v表示。当然也可将字母个数相同的韵母按英文音序从左到右排列。还可不考虑字母个数,将韵母按英文音序排列。
(3)只有韵母没有声母的,取e或o或a作声母,还可取韵母的第一个字母作零声母的代码,再补上韵母的代码,在编码实例中选用e作零声母的代码;选用e作零声母的代码有个优点,那就是er排在r上的话,就能做到全拼与双拼的拼写形式完全相同。
(4)T形汉字码输入法音码部分的输入步骤为:按双拼根据上述声母或韵母与字母键的映射关系依次输入单个汉字的声母和韵母。
下面再对形部编码作详细说明。
笔画是汉字书写时不间断地一次连续写成的一个线条。按国家语委的规定,将汉字的各种笔画归类为横、竖、撇、点、折五种基本笔画,其中,提并入横,竖钩并入竖,捺并入点,各类带转折的笔画并入折。汉字部件是由笔画组成的具有组配汉字功能的构字单位,汉字部件数量较多,为便于记忆,本发明只是选取了其中一部分参与编码。
汉字可分为独体字和合体字二类。合体字根据整体结构将其一分为二,含首笔画的部分为首部,剩余的部分为剩部。对左中右结构的汉字,可规定将其中间部分、右边部分划为剩部,当然也可规定将左边部分、中间部分划分为首部,右边部分划分剩部,为降低重码,在编码实例中规定将中间部分划分到剩部。对上中下结构的汉字,将其上面部分划分为首部,中间部分、下面部分划为剩部,当然也可规定将中间部分划分到首部,为降低重码,在编码实例中规定将中间部分划分到剩部。为降低重码,本发明还规定了成字优先的划分原则。当一个汉字为上中下结构或包围结构时,若两边都能成字的话,要按“两边都成字优先”的原则划分,若一边能成字的话,要按“一边成字优先”划分。如“营”字,是上中下结构,若把艹列为首部,则两边都不能成字,若把“吕”列为剩部的话,一边能成字,因此要把“吕”列为剩部。又如“案”字,若把“宀”列为首部,则两边都不能成字,若把“木”列为剩部的话,则两边都能成字,所以要将“安”列为首部,“木”列为剩部。
形部编码的一种取码规则是:独体字,按书写顺序分别取该汉字的第一个和最末一个基本部件的代码编码,当然也可规定按书写顺序取取该汉字的前二个基本部件的代码编码,只有一个基本部件的汉字,就只取这个基本部件的代码编码,或者规定接连两次取这个基本部件的代码编码。合体字,按整体结构,将它一分为二,先写部分为首部,后写部分为剩部,按书写顺序取首部的第一个和最末一个部件,当然也可规定按书写顺序取首部的前二个部件的代码编码,当首部只有一个部件时,按书写顺序取剩部的第一个部件编码。如果嫌这个编码规则烦,而不规定首部可最多取二码的话,也可以规定合体字的取码规则为:分别按书写顺序取首部和剩部的第一个基本部件的代码编码,这时的编码规则就相当简单明了,易学易记。形部编码的取码规则采用以下规则是比较简单的:左右结构汉字,按书写顺序分别取左部和右部的第一基本部件的代码编码;非左右结构汉字,按书写顺序取该汉字的第一个和最末一个基本部件的代码编码,只有一个基本部件的汉字就只取这个基本部件的代码编码。
本人在长期的编码研究中早就认识到一个汉字是否为左右结构是一目了然的,左右结构的汉字很容易在其产生空隙处将它一分为二,(空隙在左边部分和右边部分之间),而上下、包围结构的汉字有时不易一分为二,甚至有时难以分清一个字是独体字还是上下结构或包围结构。根据一个汉字是否为左右结构划分是最简单易学。因此也可将汉字分为左右结构的汉字和非左右结构的汉字,左右结构的汉字按整体结构一分为二,先写部分为左部,或称为左边部分,后写部分为右部,或称为右边部分,左中右结构的汉字,中间部分和右边部分一律划到右部。
这时,形部编码的取码规则还可规定为:非左右结构的汉字,按书写顺序取该汉字的第一个和最末一个基本部件的代码编码。当然也可规定按书写顺序取前二个基本部件编码,但规定取前二个基本部件的话,重码会增加不少,例如“相”和“想”就会发生重码,所以非左右结构的汉字,还是规定按书写顺序取该汉字的第一个和最末一个基本部件的代码编码为好,只有一个基本部件的非左右结构的汉字,就只取这个基本部件的代码编码,或者规定接连两次取这个基本部件的代码编码。左右结构的汉字,按书写顺序取左部的第一个和最末一个部件,当然也可规定按书写顺序取左部的前二个部件编码,当左部只有一个部件时,按书写顺序取右部的第一个部件编码。如果嫌这个取码规则繁琐,不规定左部最多可以取二码的话,也可以规定左右结构的汉字的取码规则为:分别按书写顺序取该汉字的左部和右部的第一个基本部件的代码编码,显然这样规定最简单、最方便。
如果在编码时,不停地区分某汉字是否为左右结构,再进行编码,这样显然会影响头脑反映,于是本人发明了“一竖横向T形选取基本部件”的形部编码规则,通过一竖向线试着去分隔某个汉字,再找该汉字中的几个点,来迅速找到基本部件进行编码。具体讲,就是按书写顺序取该汉字的第一个基本部件的代码作为形部编码第一码后,从第一个基本部件的最右端起,用一根与该汉字齐长的竖线(不一定要笔直)从左到右横向推移去分隔该汉字,若有间隙(左右结构的汉字,左边部分和右边部分往往有明显的间隙),可用竖线将该汉字分为左边和右边两个部分,则该竖线就为分隔线,再按书写顺序取右边部分的第一个基本部件的代码进行编码,作为形部编码第二码。形部编码第二码或者也可规定再取该汉字右上角所在的基本部件的代码进行编码。若该竖线从左到右地横向推移到整个汉字的最右边,意味着不能用竖线将汉字一分为二,这时沿竖线到汉字的最末端,按书写顺序取该汉字的最末一个基本部件的代码编码。举个例子:“可”字,用一竖线试着去将“可”字分为左右二个部分,必然会找不到左右二个部分的间隙处,免不了“可”字的书写顺序中的第一笔想交,所以无法分为左右二个部分。“想”字,用一竖线试着去将“想”字分为左右二个部分,必然会找不到左右二个部分的间隙处,免不了“想”字的书写顺序中的下部“心”相交,所以也无法分为左右二个部分。而“柯”字,可用竖线将“柯”字中“木”和“可”中间处分隔开来。
本人用英文大写字母“T”来形象地说明取码方法,“T”为一横下面接一竖,有三个端点(即横的左端点、右端点、竖的末端点)和一个接点(即横竖相接的点),这一竖就相当于分隔线,若能左右隔开某个汉字,则取左端点、紧临接点的端点或右端点所在位置的基本部件的代码进行编码,(左端点所在位置的基本部件即为按书写顺序该汉字的第一个基本部件,紧临接点的端点所在位置的基本部件即为书写顺序取分隔线的右边部分的第一个基本部件,右端点所在位置的基本部件即为该汉字右上角所在位置的基本部件),这时的取码方向为从左到右,类似于走了个“一”字形,相当于走了“T”字形的横向。若分隔线不能将汉字分为左边部分和右边部分,则取左端点和末端点所在基本部件(即按书写顺序分别取该汉字地第一个和最末一个基本部件)的代码进行编码,这时取码方向为从左到右,由于到了汉字最右端,仍无法用分隔线将汉字一分为二,就沿分隔线到汉字的末端点,对于大多数汉字来说,汉字的最后一个部件就在右下方,取码方向类似于“7”,相当于走了半个“T”字形。但也有少数汉字右上角有个点,最末笔在右上角的点,如“戈”等,或者最末笔在汉字的内部的右下角,如“同”等字,还有少数汉字如“达”等字,只是多笔画部件辶的部分笔画在右下方,不一一例举。
还可以在这种取码方法的基础上提出类似于四角号码的形部编码取码规则,只不过要用分隔线进行判断第二码是取右上角还是右下角。若能用分隔线分隔开某汉字,取该汉字的左上角和右上角所在的基本部件的代码,若不能隔开,则取该汉字的左上角和右下角所在的基本部件的代码。
不过,本人倾向于形部编码第二码按书写顺序而不是按角取码的方式,即规定若能用分隔线分隔开,就按书写顺序取右边部分的第一个基本部件的代码进行编码,而不是取右上角所在的基本部件的代码,若不能用分隔线分开,则按书写顺序取该汉字的最末一个基本部件的代码进行编码,而不是取右下角所在的基本部件的代码。
如果不习惯用分隔线的方法,也可按汉字是否左右结构找点进行编码,编码时,形部编码的第一码就找该汉字的第一个点,这第一个点很容易找,肯定是按书写顺序取该汉字的第一个基本部件,形部编码的第二码就找该汉字的第二个点,如为左右结构的汉字,就将该汉字分为左边部分和右边部分,右边部分的按书写顺序的第一个基本部件就是该汉字的第二个点,在打字时要用横向扫描很快找到这第二个点,形部编码的第二码取右边部分的按书写顺序的第一个基本部件的代码就可。如为非左右结构的汉字,显然不能用这种方法找到第二个点,这时,第二个点就在按书写顺序该汉字的最末一个基本部件,很容易很快扫描到这个第二点。形部编码的第二码按书写顺序取该汉字的最末一个基本部件的代码编码就可。在多数情况下,第二个点就在汉字的右下方或内包围的右下方,与第一个点构成对角关系,少数汉字的点在右上角,与第二个构成横向关系。
另外还要指出形部编码是,在取基本部件的代码进行编码时都要遵循取大优先的原则,即要优先取笔画多的基本部件编码。否则由于多笔画部件由几个单笔画部件组成,将多笔画部件拆成单笔画部件编码的话,就完全乱套了。
在汉字中,合体字占了绝大多数,约为95%。同音又同偏旁部首的合体字数量较多,约有五、六百对。其中氵、艹、口、木、扌、钅、亻等偏旁部首产生的同音字最多,氵约有六十余对同音字,其它的也有三、四十对同音字,为降低重码,这些偏旁部首必须被选出,分别用一个字母或别的符号编码。女、讠、忄、月、虫、土、纟、火、疒等偏旁部首就只有十来对同音字,为降低重码,这些偏旁部首也要被选出,分别用一个字母或别的符号编码。
Figure BSA00000888397600161
山、石、日、王、阝、鱼、禾等偏旁部首只有五对左右的同音字,为降低重码,这些偏旁部首也可被选了出来,分别用一个字母或别的符号编码,当然个别偏旁也可弃而不选。而有的偏旁部首如“田”、“目”、“贝”、“车”、“酉”、“犭”、“饣”等虽然常用,可重码只有几对,都是可选可不选。部件“贝”的重码略多点,为考虑到繁简体通用,在编码实例中选汉字部件“贝”作多笔画部件。本人研究发现,同音同偏旁部首的汉字的除偏旁部首外部分按书写顺序第一笔为同类基本笔画的情况更是出乎意外的少,只有一百多对,其中部件十、宀出现得比较多,宀还经常出现在汉字的字首,宀也可被选了出来,在编码实例中不选。接着将26个多笔画部件分别用一个字母或别的符号编码,建议将这26个多笔画部件分别用一个字母编码。辶、鸟这二个部件惯常出现在字尾,不将它们列为多笔画部件的话,按第一种形部编码的取码规则取码时,很多汉字要取它们的最后一个笔画点、横,由于点、横在字尾的组字频率很高,容易造成重码,因此也将它们列为基本部件。这样共优选了28个多笔画部件。“辶”惯常出现在汉字的字尾,而疒惯常出现在汉字的字首,两者位置不同,用同一个字母或别的符号编码,几乎不会造成重码,就将它们合并排列,用同一个字母或别的符号编码。多笔画部件“鸟”惯常出现在字尾,首笔为撇,而撇在汉字的字尾的组字频率很低,若与撇合并排列,用同一个字母或别的符号编码,也几乎不会发生重码,因此也可将“鸟”与“撇”合并排列,用同一个字母或别的符号编码。在编码实例中由于“撇”排在标点符号键上,而“鸟”是多笔画部件,也可以用字母编码,所以两者的编码并不一定要一致。
横、竖、撇等基本笔画的出现的频率较高,为降低重码,不宜与多笔画部件排在同一个键上,在编码实例中,将它们分别排到三个标点符号“,”、“.”、“/”键上,用三个标点符号“,”、“.”、“/”编码,比较有序合理。点、折等基本笔画的组字频率相对较低,可将它们与多笔画部件合并排列,分别用字母或别的符号编码。当然由于基本笔画点的组字频率与撇相差不大,而且出现在独体字以及合体字的第二部分的首位和末位的频率很高,也可将基本笔画点排在其它一个标点符号键上,用该标点符号编码,比如排在“;”上,用“;”编码,或者排在“’”上,用“’”编码。在编码实例中,点用“;”编码。还可将基本笔画折排到其它一个标点符号键上,用该标点符号编码,在编码实例中基本笔画折按其拼音首字母z编码。
为便于记忆,排列时主要以多笔画部件的读音的拼音首字母或声母为代码。为避免重码,还将若干声母相同的部件取了出来,改按象形或韵母的方式编码。
多笔画部件、单笔画部件与字母、标点符号的影射关系设定为:
a——钅    b——疒辶    c——艹    d——氵
e——禾    f——扌    g——贝鸟    h——火
i——虫    j——纟    k——口    l——鱼
m——木    n——女    o——月    p——阝
q——日    r——亻    s——石    t——土
u——山    
Figure BSA00000888397600181
    w——王    x——忄
y——讠    
Figure BSA00000888397600182
    ;——点
,——横    .——竖    /——撇
根据设定关系将部件分别用相应的字母和标点符号编码。
下面作具体解说:a的大写A与钅相似;b是疒的声母;c是艹的声母;d是氵的声母;e是禾的韵母;f似扌;g形似鸟、贝;h是火的声母;i因为ch排在其上,而ch是虫的声母;j是纟的声母;k是口的声母;L似鱼的左上角;m是木的声母;n是女的声母;o似月亮的外形;p似阝;Q似日,就作为日代码;r是亻的声母;s是石的拼音的首字母;t是土的声母;u因为sh排在u上,而sh是山的声母;v因为zh排在u上,而zh是
Figure BSA00000888397600183
的声母;w是王的声母;x是忄的声母;Y是讠的声母;z是
Figure BSA00000888397600184
和折的声母;这些字母就分别作为相应的基本部件的代码。“;”作为点的代码;“,”作为横的代码;“.”作为竖的代码;“/”作为撇的代码。这种排列方式基本上是按表音排列的,往往将基本部件按其拼音首字母或声母排列,对拼音首字母相同的少数多笔画部件,改按象形或韵母排列。
Figure BSA00000888397600191
山、石、日、王、阝、鱼、禾、贝”等汉字部件降低重码字的数量不多,所以也可以舍弃几个多笔画部件,使得单笔画部件不与多笔画部件合并排列,一种排列映射方法是:
a——钅    b——疒辶    c——艹    d——氵
e——点    f——扌    g——贝鸟    h——火
i——虫    j——纟    k——口    l——鱼
m——木    n——女    o——月    p——撇
q——日    r——亻    s——竖    t——土
u——山    
Figure BSA00000888397600192
    w——横    x——忄
y——讠    z——折
以上排列只是变形。撇、竖、折仍用拼音首字母表示,与横、点用同一个字母表示的多笔画部件由于频率太高,能降低不少重码,无法舍弃,所以将横、点分别排列到w、e键上,用相应的字母编码,原先“王”和“禾”这两个多笔画部件可舍弃。这些都是普通专业技术人员对本发明的变形,所以不在说明书附图中例举。
也可将多笔画部件用象形的方法排列,多笔画部件、单笔画部件与字母、标点符号的影射关系设定为:
a——亻    b——日    c——贝    d——石
e——山    f——扌    g——足鸟    h——艹
i——讠    j——疒辶        l——忄
m——木    n——月    o——口    p——阝
q——虫    r——女    s——氵    t——土
u——鱼    v——钅    w——纟    x——火
y——禾    z——王、折    ;——点
,——横    .——竖    /——撇
根据设定关系将基本部件分别用相应的字母和标点符号编码。
下面作具体解说:大写a似亻;大写b似日;c似贝的头;d似石,框在下部;大写e似山;f似扌,特别似反扌;g似足、鸟,框在上部;大写h似艹;i似讠;j似疒,又似辶的前二笔;k似
Figure BSA00000888397600201
似半个l似忄;m似木,似树林,木的声母也是m;n似月;o似口;p似阝;大写q似虫,都是框内有出笔;大写r似女;s似氵,似水流形,氵声母也是s;t似土,土的声母也是t;u似鱼,似鱼泡,读音也似;v似钅字头或字尾;w似纟;x似火;y似禾,禾苗的形状往往似y;z似王,也与折“乙”的外形相似。为便于记忆,就将横、竖、撇、点按键盘顺序分别排在“,”、“.”、“/”、“;”键上,用相应的标点符号编码。当然也可按别的方式分别排列,如将横排在“;”键上,将竖排在“/”键上,将撇排在“,”上,将点排在“.”键上。将多笔画部件完全按形似排在字母键上,有个好处,那就是不必象按读音排列那样,为避免重码而不得不将有些部件改按象形排列,编码原理具有一致性,有的人可能更喜欢这种方式。
多笔画部件、单笔画部件与字母、标点符号的还有一种影射关系设定为:
a——钅    b——鱼    c——艹    d——氵
e——王    f——火    g——土    h——女
i——忄    j——亻   k——讠    l——疒辶
m——虫    n——贝鸟    o——扌    
Figure BSA00000888397600203
q——日    r——石    s——木    t——山
u——口    v——禾    w——月    x——纟
y——阝        ;——点
,——横    .——竖    /——撇
根据设定关系将部件分别用相应的字母和标点符号编码。
下面作具体解说:五行钅、木、水、火、土分别排在键盘中间排左边键a、s、d、f、g上,土地类日、月、王、石、山分别排在键盘上排左边键q、w、e、r、t上,身体类阝、口、心、扌、分别排在键盘上排右边键y、u、i、o、p上,人生类女、亻、讠、疒分别排在键盘中间排左边键h、j、k、l上,辶惯常出现在汉字的末尾,而疒惯常出现在汉字的开头,合并排列几乎不会产生重码,所以将它们合并用同一个字母或别的符号编码。由于疒用l编码,相应地辶也用l编码。植物动物
Figure BSA00000888397600212
纟、艹、禾、鱼、贝、虫就分别排在键盘的下排z、x、c、v、b、n、m键上,贝与鸟合并排列,用同一个字母编码,基本不会产生重码,由于“贝”用n编码,相应地“鸟”也用n编码根据排列,这些字母就分别作为相应的基本部件的代码。当然,将五行类和土地类和身体类的排列位置互换也是可以的。“;”作为点的代码;“,”作为横的代码;“.”作为竖的代码;“/”作为撇的代码。
汉语拼音中各个声母的组字频率各不相同,其中y、j、l、x的组字频率很高,为减少字词重码,氵、艹、口、木、扌、钅等组字频率很高的多笔画部件不宜排到y、j、l、x上,而要尽量将这些高频的多笔画部件排到组字频率较低的a、o、e、r键上,实在无法排列的话,也要排到组字频率中等的字母键上,用相应的字母编码。附图3就充分注意到了这点。
由于逗号和句号的形状较小,也可分别用“<”和“>”代替,作为编码符号。将标点符号作为基本笔画的代号,有三个好处:一是扩大了编码空间,避免这四个基本笔画与多笔画部件排在同一个键上后,与多笔画部件编码相同,发生重码。二是由于拼音在先,形部编码在后,因而不会影响标点符号的输入。三是可与音码部分为拼音,形部编码将笔画用标点符号表示的输入法兼容,无须换档,实现混合输入。
有的基本部件在作为偏旁部首后,字形会有所改变,但必须视为同类基本部件,用同一字母编码,这类基本部件如和竹,足和
Figure BSA00000888397600222
亻和人,讠和言,钅和金,氵含水、氺,扌含手,忄含心,纟含糹等,特点是同源。基本部件也可包含个别与它十分形似的部件,用同一字母编码。如部件“土”可包含“士”,由于这两个部件仅有笔画长短之分,作为同一个部件编码可能更符合头脑反应习惯。纟与幺也十分形似,也可规定纟包含幺,为同一个部件编码也符合头脑反应习惯,当然也可不这么规定。
在编码实例中规定:音码部分采用拼音或王治阳双拼,在编码实例中采用附图1和附图3编码。形部编码的取码规则为:按书写顺序取该汉字的第一个基本部件的代码作为形部编码的第一码后,从第一个基本部件的最右端起,用一根与该汉字齐长的竖线(不一定要笔直)从左到右横向推移去分隔该汉字,若有间隙,可用竖线将该汉字分为左边部分和右边部分,则按书写顺序取右边部分的第一个基本部件的代码,作为形部编码第二码。若不能用竖线将汉字分为左边部分和右边部分,(硬分隔的话,必然将汉字的某个笔画或优选的多笔画部件割断),则按书写顺序取该汉字的最末一个基本部件的代码作为形部编码第二码。
编码实例:如“汉”的编码,声母是h,韵母为an,代码是f,音码部分就为hf,为左右结构汉字,按书写顺序取左部的第一个基本部件氵的代码编码,为d,再按书写顺序取右部的第一个基本部件“折”的代码编码,为z,于是“汉”的编码为“hfdz”,音码采用全拼的话,“汉”的编码为“handz”。又如“字”的编码,音码部分双拼和双拼一致,为zi,形部编码为非左右结构汉字,按书写顺序,取第一个基本部件为基本笔画点,代码为“;”,再按书写顺序最末一个基本部件为横,代码为“,”,于是“字”的编码为“zi;,”。又如“封”,全拼为feng,双拼就为“f;”,形部编码时,左右结构汉字,左部第一个基本部件为多笔画部件“土”,代码为“t”,右部的第一个基本部件的代码“横”编码,代码为“,”,“封”的编码就为“f;t,”,音码部分采用全拼的话,“封”的编码就为“fengt,”。注意在形部编码时取基本部件要遵循取大优先的编码原则,即要优先取笔画多的基本部件编码,例如“封”字编码时应取多笔画部件“土”,而不能取第一个单笔画部件横,因为“土”的笔画数多于“横”,要按“土”编码。如“这”字,全拼为zhe,双拼就为“ve”,形部编码时,为非左右结构汉字,按书写顺序第一个基本部件为“点”,代码为“;”,再按书写顺序取最末一个基本部件辶的代码b,“这”的形部编码就为“;b”,于是“这”的编码为“ve;b”,音码部分采用全拼的话,编码为“zhe;b”。如“事”字,拼音为shi,sh的双拼代码为u,“事”的双拼就为ui,按书写顺序第一个基本部件为单笔画部件横,代码为“,”,根据取码规则,形部编码的第二码要按书写顺序取该汉字的最末一个基本部件竖的代码“.”编码,“事”的形部编码就为“,.”,“事”的整个编码就为“ui,.”,音码部分采用全拼的话,编码为“shi,.”。又如“木”的编码,双拼为mu,该汉字只有一个基本部件“木”,代码为m,“木”的形部编码就为“m”,于是木的编码就为mum。为了追求码长整齐划一,也可规定只有一个基本部件的汉字也可取第一笔或者最末笔的代码或者重复该基本部件的代码作为形部编码的第二码。本编码实例不作这样的规定。
为提高输入速度,对于使用频繁的字,设计了简码。简码就是对常用的汉字只是取其完整编码的前编1个、2个或3个编码,再按1个空格键就能输入该汉字。由于规定音码在先,形部编码在后,许多汉字的形部编码并不需要全部输入,只要输入该汉字的简码,所以单字的编码实际上是音码为主,辅以形部编码,形部编码起到了辅助码的作用。
由于汉字的拼音只有四百来个,汉字的二级简码也就只有四百来个,而本发明的编码空间有729个,因此,对于其余三百来个编码空间,还可设立简码词,以进一步提高打字速度。如汉字的拼音无kian的形式,双拼编码也就无ky的形式,而“k”、“y”却分别为“可”、“以”的声母,因此ky可以作为“可以”的编码。由于本输入法设有三百多个简码词,从理论上说词组输入速度要比单字更快,因此这会明显提高汉字的输入速度。在计算机上敲击完某个汉字或词组的简码所在的键后,再敲击空格键,就可输入相应的汉字或词组。
词语输入是提高汉字输入速度的最常用方法,由于规定音码在先,形部编码在后,词语输入就全部利用音码输入,音码选用王治阳双拼,词语输入的步骤是:
a、二字词语,取每个字的声母、韵母的代码依次输入;如“编码”代码为byma。
b、三字词语,取每个字的声母的代码依次输入,再补空格输入;如“计算机”的代码为“jsj”。当然也可规定取第一字、第二字的前一码即声母的代码,再取第三字的前二码。还可规定再第一字的前二码,再取第二字、第三字的前一码即声母的代码。
c、四字及以上词语,取前三个字及最后一个字的声母的代码依次输入;如“科学技术”为四字词,取每个字的声母的代码为“kxju”,u为术的声母的代码。又如“新疆维吾尔自治区”,编码取前三个字及最后一个字“新疆维区”的声母的代码“xjwq”。
词组输入时也会遇到重码问题,总的来说按拼音输入汉字的有效重码率要低于拼形码,但也不是没有,遇到同音词时,一个非常简便的方法是根据上下文采用智能处理。有时无法智能处理时,有个技巧可基本避免同音字选择,那就是再输入词组中第一个字或最后一个字的形部编码的第一个代码,一般输入第一个字的形部编码的第一个代码。如输入“uiji”后,其中u为sh的压缩声母,会出现“实际、事迹、试剂、世纪、史记”等词供挑选,这时每个词的前面会有数字键供选择,后面会有一个字母或标点符号供选择,它为第一个字的形部编码的第一码,采用附图3的话,点、横、讠、卄、口的编码代号分别为“;”、“,”、“y”、“c”、“k”。敲击这几个基本部件的相应代码所在键后,就能直接上屏,而无需再用数字键选择重码。这一创新方法显然十分简便实用,实际上能做到几乎没什么重码词。
这样,本发明对拼音输入法遇到的重码字和重码词问题都作了成功处理,采用附图1和附图3的话,十来分钟就可学会,甚至几分钟就可基本学会,比如双拼只要记住a、o、e、i、u区,再按字母个数和a、o、e、i、u、n、g排列就可以了,还可结合双拼提示行进行输入,形部编码只有28个左右的多笔画部件和五个单笔画部件,且大部分基本部件都用拼音的声母作代码。采用附图2和附图4的话也只要二三十分钟就能学会,使本发明显示出极大的优越性,成为唯一理想的汉字输入法。
利用T形汉字码输入法软件,在计算机键盘上敲击某个汉字或词组的相应的编码所在的键,就可完成输入。一般规定无重码且达到规定码长的汉字或词组自动上屏,不足4码的要按空格键,有重码的单字或词组根据提示行选择。本发明字词兼容,最多码长都为4码。“~”键可设为万能学习键,当某个汉字的编码不知道时,可用“~”代替,帮助把正确的编码找出来,再利用提示行选择。本发明的形部编码可作为直接或间接辅助码,与拼音输入法配合使用,相兼容。
为了便于使用,还设置了容错码,对一些编码容易出错的汉字,在错误输入时也能出现所要输入的汉字。为尽可能与其他输入法兼容和便于记忆,还可规定将横、竖、撇、点按键盘顺序分别排在“,”、“.”、“/”、“;”、“’”键上,用相应的标点符号编码。这时还可与拼音加笔画输入法的形部编码规则兼容:即输入某个汉字的拼音后,可按书写顺序输入该汉字的前几个基本笔画的代码,以减少重码字。
需要指出的是在本说明书、权利要求书和说明书附图中的字母均不分大小写,字母的大小写是等效的。

Claims (8)

1.一种计算机汉字编码键盘输入法即T形汉字码输入法,将汉字的各种笔画归类为横、竖、撇、点、折五种基本笔画,将这五种基本笔画称为单笔画部件,由多个笔画组成的汉字部件,称为多笔画部件,单笔画部件和多笔画部件统称为基本部件,其特征是:
(1)编码由两部分组成,一部分是音码,即拼音,或称拼音码,另一部分是形部编码,这两部分组成编码时,可以是音码在先,形部编码在后;也可以是形部编码在先,音码在后,但一经选定,次序就不能改变;
(2)音码采用汉字的标准拼音或双拼或注音字母拼音;
(3)将汉字分为合体字、独体字时的形部编码的取码规则是:独体字,按书写顺序取第一个和最末一个基本部件的代码编码,或者规定取前二个基本部件的代码编码,只有一个基本部件的汉字,就只取这个基本部件的代码编码,或者规定接连两次取这个基本部件的代码编码;合体字,按书写顺序取首部的第一个和最末一个部件,或者规定按书写顺序取首部的前二个部件编码,当首部只有一个部件时,按书写顺序取剩部的第一个部件编码;合体字取码规则或者规定为:分别按书写顺序取首部和剩部的第一个基本部件的代码编码;
将汉字分为左右结构汉字,非左右结构汉字时,形部编码的取码规则是:非左右结构的汉字,按书写顺序取第一个和最末一个基本部件的代码编码,或者规定按书写顺序取前二个基本部件编码,只有一个基本部件的汉字,就只取这个基本部件的代码编码,或者规定接连两次取这个基本部件的代码编码;左右结构的汉字,按书写顺序取左部的第一个和最末一个部件,或者规定按书写顺序取左部的前二个部件的代码编码,当左部只有一个部件时,按书写顺序取右部的第一个部件编码;左右结构汉字的取码规则或者规定为,分别按书写顺序取左部和右部的第一个基本部件的代码编码;
形部编码的取码规则或者是:按书写顺序取该汉字的第一个基本部件的代码作为形部编码的第一码后,从第一个基本部件的最右端起,用一根与该汉字齐长的竖线从左到右横向推移去分隔该汉字,若有间隙,能用竖线将该汉字分为左边部分和右边部分,则按书写顺序取右边部分的第一个基本部件的代码,作为形部编码第二码;若不能用竖线将汉字分为左边部分和右边部分,则按书写顺序取该汉字的最末一个基本部件的代码作为形部编码第二码;
(4)形部编码时,多笔画部件的编码方法是:偏旁氵、艹、口、木、扌、钅、亻必须被选出,分别用一个字母或别的符号编码;偏旁女、讠、忄、月、虫、土、纟、火、疒、辶也要被选出,分别用一个字母或别的符号编码;偏旁
Figure FSA00000888397500021
山、石、日、王、阝、鱼、禾,也分别用一个字母或别的符号编码;基本笔画横、竖、撇、点、折分别用一个标点符号或字母编码。
2.根据权利要求1所述的T形汉字码输入法,其特征是:双拼采用王治阳双拼:
各韵母与字母的一种映射关系设定为:
a——a    b——uai    c——un ün    d——ai
e——e    f——an    g——ang    h——ou    i——i
j——ong iong    k——ei    l——en    m——uang iang
n——uan    üan    o——o uo    p——ing
q——ie    r——in er    s——ao    t——iao
u——u    v——ü ui    w——iu    x——ue üe
y——ian    z——ua ia    ;——eng
各韵母与字母的另一种映射关系设定为:
a——a    b——uang iang    c——uan üan    d——ai
e——e    f——an    g——ang    h——ou
i——i    j——ong iong    k——ei    l——en
m——un ün    n——ue üe    o——o uo    p——ing
q——iao    r——ie er    s——ao    t——iu
u——u    v——üui    w——ian    x——uai
y——in    z——ua ia    ;——eng
选择上述任意一种设定关系,对声母和韵母编码,只有韵母没有声母的,取e或o或a作声母,或取韵母的第一个字母作声母代码,再补上韵母代码。
3.根据权利要求1所述的T形汉字码输入法,其特征是:形部编码时,基本部件与字母、标点符号的一种映射关系设定为:
a——钅    b——疒辶    c——艹    d——氵
e——禾    f——扌    g——宀  鸟    h——火
i——虫    j——纟    k——口    l——鱼
m——木    n——女    o——月    p——阝
q——日    r——亻    s——石    t——土
u——山        w—王    x——忄
y——讠    
Figure FSA00000888397500042
    ;——点
,——横    .——竖    /——撇
基本部件与字母、标点符号的另一种映射关系设定为:
a——亻    b——日    c——宀    d——石
e——山    f——扌    g——足  鸟    h——艹
i——讠    j——疒  辶        l——忄
m——木    n——月    o——口    p——阝
q——虫    r——女    s——氵    t——土
u——鱼    v——钅    w——纟    x——火
y——禾    z——王、折    ;——点
,——横    .——竖    /——撇
根据上述任意一种设定关系,将基本部件分别用相应的字母和标点符号编码。
4.根据权利要求1所述的T形汉字码输入法,其特征是:同类基本部件,用同一字母编码,这类基本部件如:
Figure FSA00000888397500044
和竹,足和
Figure FSA00000888397500045
亻和人,讠和言,钅和金,氵和水、氺,扌和手,忄和心,纟和糹,土和士。
5.根据权利要求1所述的T形汉字码输入法,其特征是:组字频率很高的多笔画部件氵、艹、口、木、扌、钅、亻不宜映射到组字频率很高的y、j、l、x键上,而要尽量将这些高频的多笔画部件映射到组字频率较低的a、o、e、r键上。
6.根据权利要求3所述的T形汉字码输入法,其特征是:主要以多笔画部件的读音的拼音首字母或声母为代码,多笔画部件与字母的一种映射关系为:a的大写A与钅相似;b是疒的声母;c是艹的声母;d是氵的声母;e是禾的韵母;f似扌;g为宀的声母,形似鸟;h是火的声母;i因为ch排在其上,而ch是虫的声母;j是纟的声母;k是口的声母;L似鱼的左上角;m是木的声母;n是女的声母;o似月亮的外形;p似阝;Q似日,就作为日代码;r是亻的声母;s是石的拼音的首字母;t是土的声母;u因为sh排在u上,而sh是山的声母;v因为zh排在u上,而zh是
Figure FSA00000888397500051
的声母;w是王的声母;x是忄的声母;Y是讠的声母;z是
Figure FSA00000888397500052
和折的声母;这些字母就分别作为相应的基本部件的代码;
或者主要以多笔画部件与英文字母的相似程度编码,笔画部件与字母的另一种映射关系为:大写a似亻;大写b似日;c似宀;d似石;大写e似山;f似扌;g似足、鸟;大写h似艹;i似讠;j似疒;k似
Figure FSA00000888397500053
l似忄;m似木;n似月;o似口;p似阝;大写q似虫;大写r似女;s似氵;t似土;u似鱼;v似钅;w似纟;x似火;y似禾;z似王。
7.根据权利要求1所述的T形汉字码输入法,其特征是:基本笔画横、竖、撇、点与多笔画部件用不同的字母或其他符号编码。
8.根据权利要求1所述的T形汉字码输入法,其特征是:形部编码的取码规则是:若按书写顺序,某个汉字的第一个基本部件为多笔画部件,且该多笔画部件处于整个汉字的正左方或正上方或包围方时,按书写顺序取该汉字的前二个基本部件的相应代码编码;其他汉字则按书写顺序取第一个和最末一个基本部件的相应代码编码;只有一个基本部件的汉字就取这个基本部件的相应代码编码,或者规定接连二次取这个基本部件的相应代码编码。
CN 201310161079 2013-04-21 2013-04-21 T形汉字码输入法 Pending CN103207685A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201310161079 CN103207685A (zh) 2013-04-21 2013-04-21 T形汉字码输入法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201310161079 CN103207685A (zh) 2013-04-21 2013-04-21 T形汉字码输入法

Publications (1)

Publication Number Publication Date
CN103207685A true CN103207685A (zh) 2013-07-17

Family

ID=48754933

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201310161079 Pending CN103207685A (zh) 2013-04-21 2013-04-21 T形汉字码输入法

Country Status (1)

Country Link
CN (1) CN103207685A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105892703A (zh) * 2014-10-18 2016-08-24 王治阳 首笔音素字母三拼输入法
CN112328095A (zh) * 2020-11-12 2021-02-05 苑颐萍 基本不用数字键选字的四用音形码汉字输入法及输入平台

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105892703A (zh) * 2014-10-18 2016-08-24 王治阳 首笔音素字母三拼输入法
CN112328095A (zh) * 2020-11-12 2021-02-05 苑颐萍 基本不用数字键选字的四用音形码汉字输入法及输入平台
CN112328095B (zh) * 2020-11-12 2024-01-02 苑颐萍 基本不用数字键选字的四用音形码汉字输入法及输入平台

Similar Documents

Publication Publication Date Title
CN103616960A (zh) 六元音字母双拼输入法
CN111124146A (zh) 音素同声近位常用汉字码输入法
CN101751134B (zh) 正左上方汉字输入法
CN103207685A (zh) T形汉字码输入法
CN102073383A (zh) 字首部件拼音输入法
CN102368177B (zh) 新汉字声韵输入方法及输入键盘
CN102023717A (zh) 三五首次音码及其键盘
CN103207684A (zh) 音素字母双拼输入法
CN103941882A (zh) T形汉字码输入法
CN101470535A (zh) 优化汉字码输入法
CN101430604A (zh) 汉字码输入法
CN102023718A (zh) 声韵笔画主副部首输入法
CN100545790C (zh) 计算机汉字信息猎头码输入法
CN103616961A (zh) 音素t形汉字码输入法
CN101504572A (zh) 完善汉字码输入法
CN101571750A (zh) 标准汉字码输入法
CN101561713A (zh) 标准汉字码输入法
CN106708284A (zh) 二十部件汉字码输入法
CN103970286A (zh) T形二码输入法
CN102043469A (zh) 两笔型三维数码输入法及其键盘
CN103838389A (zh) 去末点汉字输入法
CN107066113A (zh) 二十部件单字二码输入法
CN103838391A (zh) 形声汉字码输入法
CN103425250A (zh) 一种方便中英文输入的数字化键盘
CN101901061B (zh) 汉字序码输入方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130717