CN103616961A - 音素t形汉字码输入法 - Google Patents

音素t形汉字码输入法 Download PDF

Info

Publication number
CN103616961A
CN103616961A CN201310659399.XA CN201310659399A CN103616961A CN 103616961 A CN103616961 A CN 103616961A CN 201310659399 A CN201310659399 A CN 201310659399A CN 103616961 A CN103616961 A CN 103616961A
Authority
CN
China
Prior art keywords
character
code
coding
chinese
basic element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310659399.XA
Other languages
English (en)
Inventor
王治阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201310659399.XA priority Critical patent/CN103616961A/zh
Publication of CN103616961A publication Critical patent/CN103616961A/zh
Pending legal-status Critical Current

Links

Images

Abstract

一种计算机汉字编码键盘输入法即音素T形字母双拼输入法,具有双拼键位排列规律性强,简单易学,击键当量低,舒适顺手,形部编码简单易记等优点,起到了统一各种编码的作用,便于在键盘上或显示在平板电脑或手机的屏幕上推广使用。

Description

音素T形汉字码输入法
技术领域
本发明属于电脑汉字编码输入方法,也就是计算机汉字编码输入法。因为本输入法为T形汉字码输入法和音素字母双拼输入法的组合发明,所以称为音素T形汉字码输入法,还涉及了为实现这一输入法的键盘。
背景技术
键盘输入法是目前汉字输入法中技术最成熟,使用最疒泛的输入法。键盘输入的特点是必须对输入的汉字进行编码,汉字编码是指用一组代码表示一个汉字,按汉字编码所在键,通常要按1~4键输入一个汉字。键盘输入按编码划分,可分为音码、形码、音形码三类。
音码以汉语拼音为基础,利用汉字的读音进行编码。形码利用汉字的字形特征进行编码。音形码利用汉字的语音特征和汉字的字形特征编码。音形码又有采用完整拼音和只采用拼音首字母之分。整个汉字拼音在先的音形码相对与其它音码、形码、只用汉字拼音首字母的音形码来说,越来越显示出其优越性。但目前其他音形码都存在简单的重码率较高,重码率较低的不简单的技术缺陷,而本人发明的T形汉字码输入法则做到了既简单又重码率低,该发明的音码部分可以为全拼或任何双拼,在发明T形汉字码输入法时,还没有发明音素字母双拼,音素字母双拼是最理想的双拼,韵母做到了既为一个字母,又由几个音素组合而成,可以与汉语拼音方案中韵母一一转换,韵母表达方式简短明了,还具有声母、韵母在键盘上排列有规律,简单易记,舒适顺手高效的优点,是目前击键当量最低的双拼。因此在新的发明中,音码部分就采用了音素字母双拼。
发明内容
这样,目前的汉字输入法要么不够简单,要么不够快速,要么韵母由一串冗长的字母构成,没字母化,输入汉字不甚方便。
本发明的目的是提供一种简单快速直观的计算机汉字编码输入方法,那就是音素T形汉字码输入法。
为达到音素T形汉字码输入法的目的,本发明规定音素T形汉字码输入法的编码由音码和形部编码这两个部分组成。音码部分采用新双拼,建议采用音素字母双拼,占二码。形部编码部分也最多占二码。
本人新发明的双拼输入法具有韵母排列有规律,简单易记,同时非常顺手舒适,避免了别扭的组合,击键当量非常低,输入速度快的优点。该双拼仍然是基于标准汉语拼音方案,而汉语拼音方案声母表达简短,一般用一个字母就能表示,个别翘舌音声母在略作处理后也很容易用一个字母表示,韵母的表达则不够简短,有时要用4个字母表达一个韵母,实在太多。为便于把韵母显示在手机屏幕上,本人发明了全新的用来表达汉语韵母的音素化字母,另外对声母也在拉丁字母的基础上也做了汉字化表达。该音素化字母可适用我新发明出的双拼,也可适用于其他双拼,还可构成新的语言文字或者用于造新的汉字。国家法定的《汉语拼音方案》各韵母的对应的音素化韵母为:
Figure BSA0000098671580000021
形部编码也一般由两个代码组成,有时可规定只有一个代码。本发明优选了五种基本笔画和28个左右的多笔画部件参与编码,这五种基本笔画和28个左右的多笔画部件被统称为基本部件,全部选自汉字的偏旁部首,既简单常见又直观,并且数量少,容易记忆。由于国家语委将五种基本笔画也称为汉字部件,因此在本发明中称五种基本笔画称为单笔画部件,而其它28个左右的优选的汉字部件由多个笔画组成,称为多笔画部件。在形部编码时要优先按笔画多的基本部件编码,否则由于多笔画部件可拆分成单笔画部件,而按单笔画部件编码的话,选取多笔画部件就无意义。
形部编码的取码规则是:独体字,按书写顺序取该汉字的第一个和最末一个基本部件的代码编码,还可规定取该汉字的前二个基本部件的代码编码——编码实例中不这么规定,只有一个基本部件的独体字,就只取这个基本部件的代码编码,或者规定接连两次取这个基本部件的代码编码。合体字,按整体结构,将它一分为二,先写部分为首部,后写部分为剩部,分别按书写顺序取该汉字的首部和剩部的第一个基本部件的代码进行编码。
另外,形部编码的取码规则还可规定为:非左右结构的汉字,按书写顺序取该汉字的第一个和最末一个基本部件的代码编码,当然也可规定按书写顺序取该汉字的前二个基本部件编码——编码实例中不这么规定,只有一个基本部件的汉字,就只取这个基本部件的代码编码,或者规定接连两次取这个基本部件的代码编码。左右结构的汉字,按整体结构分为两个部分,左半部分简称左部,右半部分简称右部,规定左右结构汉字的形部编码的取码规则为:分别按书写顺序取该汉字的左部和右部的第一个基本部件的代码进行编码。
还要特别指出的是:之所以不规定所有的汉字都按书写顺序取前二个基本部件的代码或都取首个、末个基本部件的代码编码,是因为这样规定的话表面上会使形部编码的取码规则显得更简单易记,实际上却会造成大量的重码,或付出增加大量多笔画部件的代价。
需要指出的是,若在汉字输入中不停对汉字做是否为左右结构或独体字、合体字,这是比较麻烦的,会影响头脑反应,本人在经历长达二十年潜心研究后,并于深夜睡醒,突发灵感,终于设计出的其他任何输入法都没想到过的取码规则,那就是“一竖横向T形选取基本部件”的取码规则。具体讲,就是按书写顺序取该汉字的第一个基本部件的代码后,从第一个基本部件的最右端起,用一根与该汉字齐长的竖线从左到右横向推移去分隔该汉字,若能将整个汉字一分为二,则该竖线就为分隔线,将该汉字分为左边和右边两个部分,简称左部、右部,再按书写顺序取右部的第一个基本部件的代码进行编码,或若该竖线从左到右地横向推移到整个汉字的最右边,意味着不能用竖线将汉字一分为二,则按书写顺序取该汉字的最末一个基本部件的代码编码。本人用英文大写字母“T”来形象地说明取码方法,“T”为一横下面接一竖,有三个端点(即横的左端点、右端点、竖的末端点)和一个接点(即横竖相接的点),这一竖就相当于分隔线,若能左右隔开某个汉字,则取左端点、紧临接点的端点的基本部件的代码进行编码,第二码或者取右端点所在位置的基本部件的代码编码。(左端点所在位置的基本部件即为该汉字按书写顺序的第一个基本部件,紧临接点的端点所在位置的基本部件即为书写顺序取分隔线右边部分的第一个基本部件,右端点所在位置的基本部件即为该汉字右上角所在位置的基本部件),这时的取码方向为从左到右,类似于走了个“一”字形,相当于走了“T”字形的横向。若不能将汉字分为左右二个部分,则按书写取左端点和末端点所在基本部件(即按书写顺序分别取该汉字地第一个和最末一个基本部件)的代码进行编码,这时取码方向为从左到右,由于到了汉字最右端,仍无法用分隔线将汉字分为左、右二个部分,就沿分隔线到汉字的末端点,对于大多数汉字来说,汉字的最后一个部件就在右下方,取码方向类似于“7”,相当于走了半个“T”字形。但也有少数汉字右上角有个点,最末笔在右上角的点,如“犬”等,或者最末笔在汉字的内部的右下角,如“冈”等字。总的编码方向是第一码,按书写顺序取第一个基本部件的代码作为第一码,再横向找右半部分的第一个基本部件作为第二码,没法从横向找到编码,就找按书写顺序找最后一个基本部件的代码作为第二码。
下面再解说优选基本部件的方法。在国标6763个汉字中,合体字占了绝大多数,约为95%。同音又同偏旁部首的合体字数量较多,约有五、六百对。其中氵、艹、口、木、扌、钅、亻、女、讠、忄、月、虫、土、纟、火、疒、、、山、石、日、王、阝、鱼、禾、贝等偏旁部首产生的同音字较多,为降低重码,这些偏旁被选了出来,分别用一个字母或别的符号编码,当然个别偏旁如“贝”等也可弃而不选。礻包括衤产生的同音字也较多,考虑到礻与衤属于不同的部首,总共只能减少五对左右的重码,因此在音素T形汉字码输入法编码实例中就弃而不选。而有的偏旁部首如“田”、“目”等虽然常用,可只有一、二对同音字,甚至没有同音字,就弃而不选,当然要选的话也可选。本人研究后还发现,同音同偏旁部首的合体字除偏旁部首以外的部分的第一笔为同类基本笔画的情况出乎意外的少,只有100多对,这一发现是只选用5种基本笔画和二三十个基本部件参与编码的根据所在。其中部件“十”和“宀”出现得比较多,有四、五对重码,它们也可被选出,分别用别的字母或符号编码。为繁体简体字兼容,“贝”也被选,这样,26个多笔画部件和五种基本笔画被优选出来,排列到键盘上,将这26个惯常出现在汉字字首即汉字的开头的多笔画部件分别用一个相应的字母或标点符号编码,在编码实例中将这些多笔画部件尽量排在不同的字母键上。汉字部件辶、阝、鸟惯常出现在汉字的字尾,其中阝已被列为基本部件;汉字部件“鸟”也会产生几个的重码,就将汉字部件“鸟”列为多笔画部件;部件辶的首笔为点,由于点在独体字或合体字的第二部分的首尾位置出现得较多,将部件辶按点编码容易造成重码,就将它列为基本部件。为降低重码,可将辶与疒合并排列,用同一个字母或其它符号编码。这样共优选了28个多笔画部件。而五种基本笔画则可从减少重码角度出发,可选其中的几个笔画与28个多笔画部件合并排列在同一个键上,用同一个字母或其他符号编码。当然这28个多笔画部件不是固定的,可少于28个多笔画部件,也可多于28个多笔画部件,只要28个左右即可,例如也可将汉字部件“十”入选,用一个字母或标点符号编码。
为便于记忆,排列多笔画部件时不按笔画数和横、竖、撇、点、折的次序排列,而按拼音或象形排列,见附图7或附图8所示。附图7以按基本部件的拼音首字母排列为主,对少数几个拼音首字母或声母相同的基本部件改按象形的方式排列。这样由于按基本部件的读音编码几乎无需记忆,少数几个改按象形的方式排列的基本部件也能很快记住,记忆量很小,因此极为简单。附图8完全按象形排列,可汉字的方块笔画部件与西文字母毕竟有所区别,难以做到十分相像,需要按象形记忆的汉字基本部件就要多上几倍,记忆量也相应多上几倍,因此本发明也不太建议用这种方式排列经过反复优选的基本部件。当然有人可能更喜欢这种排列方式。还可按义分类编码,见附图9,有人可能更喜欢按义分类的排列方式。所有的形部编码的取码规则均可采用附图7或附图8或附图9编码。
五种基本笔画分别用一个字母或别的符号编码,由于多笔画部件已经排在字母键上,建议尽量将五种基本笔画分别用标点符号编码,避免将基本笔画与多笔画部件同用一个字母或标点符号编码,当然,个别频率低的基本笔画也可与多笔画部件用同一个字母或别的符号编码。横、竖、撇、点等基本笔画在形部编码中出现的频率较高,为降低重码,不宜与大多数多笔画部件排在同一个键上,用同一个字母或别的符号编码。将这四个基本笔画排到标点符号键上,用标点符号编码的话比较合理。折因为组字频率低,与某些多笔画部件排在同一个键上,用同一个字母或别的符号编码的话,几乎不会导致重码,因此也可与某些汉字部件合并排列,可按拼音首字母排列。当然,也可将折排列在v键上,用v编码,还可以将折细分为顺折、逆折,再用两个字母分别编码,还可以将折用标点“‘”编码,这些都是该领域普通专业技术人员的变形。当然硬要将横、竖、撇、点等基本笔画与某个多笔画部件排在同一个键上,也可以的,只是将大大增加重码。
这样,通过优选28个左右的多笔画部件和五种基本笔画,创造性地规定取码规则,就做到了形部编码既简单易记,又能有效地区分同音字,重码率很低,输入速度足以与其他任何输入法相比。这就解决了其他任何输入法都未能解决的难题,真正做到了简单直观、重码率很低、输入速度高,是一种的理想的标准的汉字输入法。
附图说明
附图1为双拼键盘排列图之一
附图2为双拼键盘排列图之二
附图3为汉语拼音方案中的声母的笔画化表示
附图4为汉语拼音方案中的韵母的音素化字母化表示
附图5为韵母音素化字母化表示后的双拼键盘排列图之一
附图6为韵母音素化字母化表示后的双拼键盘排列图之二
附图7为形部编码键盘排列图之一
附图8为形部编码键盘排列图之二
附图9为形部编码键盘排列图之三
具体实施方式
音素T形汉字码输入法由两部分组成,一部分是音码,即拼音,或称拼音码,另一部分是形部编码。这两部分组成编码时可以是音码在先,形部编码在后;也可以是形部编码在先,音码在后。但一经选定,次序就不能改变。为便于想打,与思维一致,又能充分利用标点符号键,建议拼音在先,形部编码在后,在编码实例中就采用这种方法。拼音可采用全拼或双拼或简拼或不完整拼音,不想学习双拼的人可采用全拼,即采用一个汉字的标准拼音。为缩短码长,提高输入速度,建议采用双拼,最好采用音素字母双拼,同时也可规定兼容全拼。
音素字母双拼的技术方案的特征在于:
(1)单个字母的声母与各字母键上的字母一致,而翘舌音zh、ch、sh按分别用e、u、a表示,单韵母ü用字母v表示,其他多个字母组成的韵母也一律用单个字母表示,开口呼韵母以a开头的韵母ao、ai、an、ang为一区,配置映射在键盘中排的s、d、f、g键上,开口呼韵母以o开头的韵母ou为o区,配置映射在键盘上排的p键上,开口呼韵母以e开头的韵母eng、en、ei为e区,配置映射在键盘下排的n、m、“,”键上,齐齿呼韵母配置以i为开头的两个字母开头的韵母ie、iu、in,称为i1区,或称两个字母i区,配置映射在键盘下排的x、c、b键上,齐齿呼韵母配置以i为开头的三个或四个字母的韵母iao、ian、ing、iang、iong,称为i2区,或称三个或四个字母i区,配置映射在键盘中排的“;”、l、k、j、h键上,合口呼韵母以u开头的韵母ua、ue、un、uai、uan为u区,配置映射在键盘的q、w、r、t、y键上。
排列规律是:a、o、e、i、u、v等单个字母的韵母只能配置按双拼合并规律能合并的韵母,不能配置其他韵母,每区的排列又按韵母字母个数多少排列,组成韵母的字母的个数相同的按a、o、e、i、u、n、g的次序排列,排列时次序有从左到右和从右到左两种。具体讲,排在键盘左边的i1区、a区、u区按组成韵母的字母个数多少从左到右排列,字母个数相同的按a、o、e、i、u、n、g的次序从左到右排列。排在键盘右边的o区、i2区、e区按组成韵母的字母个数多少从右到左排列,字母个数相同的按a、o、e、i、u、n、g的次序从右到左排列。排在键盘左边的i1区、a区、u区和排在键盘右边的o区、i2区、e区的次序正好左右对向,记忆十分方便。将i区分为2个区,u区只有一个韵母,以及各区的键位的设置,都是出于降低击键当量和提高顺手舒适度的需要,同时又简单易记。
另外ui排在v键上,uo排在o键上,读音简记为“为余”(为我),“我窝”,分别用同一个字母编码,以ong、ang结尾的多个字母的韵母也就是iong与ong,iang与uang合并排列,ia与uai合并,也分别用同一个字母编码。由于ong被合并到iong,所以o区仅ou一个韵母。还有二个、三个字母组成的以ü开头的韵母都被以u开头的并且其余字母不变的韵母所合并,如un和ün、ue和üe、uah和üan等。韵母er是双拼布局中自由度最大的韵母,可排在或者说是映射在任何一个i或u开头的韵母中,在附图中是排在r键上的。比如er可排在j键上或者说映射到j键上。
上述排列方式见附图1所示,这时各韵母与字母映射关系设定为:
Figure BSA0000098671580000091
A、E、U键放置翘舌音声母,使于和上中下三排各键韵母配合;同时也解放了V键,用于特殊符号输入。经过击键当量计算,翘舌音ch、sh、zh分别用u、a、e编码,这样能大大降低目前市场上流行的各种双拼的击键当量,单字当量为13.10,连续当量为13.70,编码实例中就这么编码。但双拼全拼混合使用时,为防止ai既表示常用的全拼ai又表示常用的全拼chi,建议不用a参与编码,这时建议翘舌音zh、ch、sh分别用e、u、i编码,这样单字当量为13.2,连续当量为13.7,同样比较低。用o表示零声母。
附图1中的ia根据双拼合并规律,也可与ua合并,但击键当量会略微上升。根据双拼合并规律,其他个别韵母之间也可合并,但韵母合并多了,会记忆不便。
需要指出的是将ue排在w键上,虽然简单易记,但因为xue的组字频率比较高,造成跨排击键,会影响舒适性。因而可将ue和üe排在z键上,用z编码,这时将ua移到w键上,用w编码,只是这样一来,韵母的排列的次序要受到影响,u区要将z键也划入,排列的次序就为w、z、r、t、y键,不大符合分区规则,但这时击键当量很低,击键时很顺手舒服,键盘排列方式见附图2所示,这时各韵母与字母映射关系设定为:
Figure BSA0000098671580000101
在附图1和附图2中,将eng、en与iao、ian对调也可以,将ou与uan对调也可以,如果嫌韵母排列在键盘上时,用到了“,”键,也附图2中也可将eng映射到q键,en、ei映射到n、m键上,基本上对击键当量和击键的舒适性影响不大,但将付出不能按区排列、记忆不便的代价。与普通双拼不同,本双拼输入法使用了“,”键参与韵母编码,实践证明“,”键参与编码能降低击键当量,比较顺手舒适。而q、z往往击键不便,所以在附图1中z没有参与编码,在附图2中q没有参与编码。作为本发明的变形,附图1中的ie、iu、in、eng、en、ei也可左移一格,分别排在z、x、c、b、n、m键上,用相应的代码编码,只是这样一来,虽然舍弃了标点符号键“,”,但击键当量会略微增加。或者将ian、iao改排在n、m上,en、eng改排在l、“;”键上,用相应的字母编码,只是这样一来,区内字母的位置就会变化,会对记忆方便造成较大影响。
为便于韵母显示在手机等屏幕较小的电子设备中,本人经过二十多年的研究,终于发明了全新的音素化字母来表示汉语的韵母,其独一无二的发明在于力求用最简单的笔画来表示汉语韵母中的每个字母,用横、竖、撇、点、折五种基本笔画中优选出具有代表性的笔画一、丨、丿、丶、
Figure BSA0000098671580000112
来表示韵母中常见的a、o、e、i、u,根据概率论,用一、丨、丿、丶、
Figure BSA0000098671580000113
来表示韵母中常见的a、o、e、i、u,共有5!(5的阶乘)种表示方法,也就是120中方法可选择,考虑到汉字常见的笔画结构的书写习惯,汉语拼音中各个韵母中的拉丁字母的组合规律,韵母中各个字母进行上述组合后要符合汉字常见部件结构形态以及便于记忆等因素,避免出现诸如
Figure BSA0000098671580000111
之类的别扭的组合,就用一、丨、丿、丶、
Figure BSA0000098671580000114
(或改用
Figure BSA0000098671580000115
)来表示韵母a、i、e、o、u。一为a的最后一笔,丨与i的大小写都一致,用丿表示e是出于便于书写韵母中各个字母进行音素字母化改造后的常见结构考虑,o形似圆点,就用丶表示,
Figure BSA0000098671580000116
为u的第一个笔画。比如曾用可丿表示a过,用丶表示e过,用一表示过,感到不太理想,用o表示丶也可以。用フ、
Figure BSA0000098671580000117
来表示n、ng也可以,但建议用
Figure BSA0000098671580000118
、フ来分别表示n、ng,因为
Figure BSA0000098671580000119
似n的第二笔,用フ来表示ng也颇为方便,韩语用フ来表示g,而本发明则更进一步,用フ来表示ng。如果用
Figure BSA00000986715800001110
来表示g,用来表示n的话,就难以做到与这两个字母中的某个笔画类似。v来表示ü,这也是通用的表示方法,当然也可用∠来表示,或者用レ表示或者用乚表示,或者用く表示。r因为笔画比较简单,不常用,在本发明中只是形体略微汉字化,也就是一竖,再在竖的右上部连上一挑,甚至没有必要非拉丁化。用o表示零声母,也可像韩语那样用
Figure BSA00000986715800001114
表示,或者用日本语那样用ロ表示,甚至用△。其实用分别用
Figure BSA00000986715800001112
Figure BSA00000986715800001113
表示u、n也可以,但不是从u、n形体的原笔画抽出,记忆略微不方便。丿或者用/代替,“、”或者用\代替,用短捺表示比较好。韵母om是汉语极为罕见的韵母,建议m也可用
Figure BSA00000986715800001217
表示,或用コ表示,或者用ヒ表示,若用コ表示的话,om相应的音素化韵母为
在将国家法定《汉语拼音方案》中的韵母改写为音素化韵母时,要按汉字的书写顺序进行书写,分别用一、丨、丿、丶、
Figure BSA00000986715800001218
Figure BSA00000986715800001219
、フ、r来表示《汉语拼音方案》组成韵母的字母a、i、e、o、u、n、ng、r,由于要将多个字母的韵母书写为一个字母,所以要紧凑化,一般要从上到下书写,为避免一和丨组合后混淆成
Figure BSA00000986715800001220
Figure BSA00000986715800001224
,一和丿组合后混淆成フ,一般只能接在笔画的中部,或从上到下平行书写,而不能接在笔画的两端,也不要进行笔画相交,丶不适合被其他笔画剖中,因此个别情况下,书写时可从左到右排列书写,如
Figure BSA0000098671580000122
中的第二笔点,如果写在竖下方,则不大合适,所以写在竖的右方,个别还可书写成包围结构,如
Figure BSA0000098671580000123
因为写成比写成
Figure BSA0000098671580000125
更符合汉字的日常结构,而写成
Figure BSA0000098671580000126
也比写成
Figure BSA0000098671580000127
更紧凑,更符合汉字平常的结构。韵母er写成
Figure BSA0000098671580000128
它由丿和r拼写而成。
国家法定《汉语拼音方案》中的各韵母改写成音素化韵母见附图4所示,附图4中每个格里所在韵母都有其音素化韵母。韵母iou,uei,uen前面加声母的时候,写成:iu,ui,un,所以每个格有两种音素化韵母。若韵母ü用∠来表示,这时üe表示为
Figure BSA0000098671580000129
üan表示为
Figure BSA00000986715800001210
ün表示为国际音标的
Figure BSA00000986715800001221
在汉语方言和少数民族语以及外国语中很常见,形体上可看做a和e合并构成
Figure BSA00000986715800001212
因此可写成音素化字母
Figure BSA00000986715800001213
下面给出分别用一、丨、丿、丶、
Figure BSA00000986715800001222
Figure BSA00000986715800001223
、フ、
Figure BSA00000986715800001214
来表示韵母a、i、e、o、u、n、ng、
Figure BSA00000986715800001215
时,国家法定的《汉语拼音方案》各韵母的对应的音素化韵母为:
Figure BSA00000986715800001216
Figure BSA0000098671580000131
上述对应的韵母a、o、e、i、u在作为单韵母时,即作为单个字母的韵母时,为避免韵母形体显得过于单薄,也可将韵母用大写拉丁字母表示。如以下所示:
a……A    o……o    e……E    i……I    u……U。
但注意:o表示为o时,零声母就不能用o来表示,就要规定用
Figure BSA00000986715800001318
等字母表示。下面作具体解说:韵母ai由a、i两个字母组成,分别表示为一、丨,从上到下连接,不能连在“一”的两端,连接在“一”的中间,于是音素化韵母就为T;同理,韵母ei中的e、i分别表示为丿、丨,从上到下将丨连接在“丿”的中间,就为亻;韵母ao中的a、o分别表示为一、丶,从上到下将“丶”连接在“一”的中间,就表示为
Figure BSA0000098671580000132
韵母ou中的o、u分别表示为丶、
Figure BSA00000986715800001313
,如果从上到下连接的话,就表示为
Figure BSA0000098671580000133
显然不太符合汉字的平常结构,于是将丶放在
Figure BSA00000986715800001314
内,就表示为韵母an中的a、n分别表示为一、
Figure BSA00000986715800001315
,从上到下书写时,“一”和“
Figure BSA00000986715800001316
”没办法连接,就为平行书写,这样an表示为韵母en中的e、n分别表示为丿、
Figure BSA00000986715800001317
,若从上到下书写,就为
Figure BSA0000098671580000136
不太美观和符合汉字的习惯,就将en表示为
Figure BSA0000098671580000137
韵母ang中的a、ng分别表示为一、フ,从上到下表示为韵母eng中的e、ng分别表示为丿、フ,从上到下书写为
Figure BSA0000098671580000139
不太美观和符合汉字的习惯,就将eng表示为
Figure BSA00000986715800001310
韵母ong中的o、ng分别表示为丶、フ,从上到下表示为韵母ia中的i、a分别表示为丨、一,从上到下将“丨”连接在“一”的中间,表示为韵母ie中的i、e分别表示为丨、丿,从上到下将“丨”连接在“丿”的中间,就表示为
Figure BSA0000098671580000141
韵母iao中的i、a、o分别表示为丨、一、丶,从上到下书写,就表示为
Figure BSA0000098671580000142
韵母iu中的i、u分别表示为丨、
Figure BSA00000986715800001426
,无法从上到下书写,只能从左到右写,若写成
Figure BSA0000098671580000143
则不够紧凑,就将iu表示为
Figure BSA0000098671580000144
韵母iou为iu的缩写,iou中的i、o、u分别表示为丨、丶、
Figure BSA00000986715800001427
,参照iu的书写,就表示为
Figure BSA0000098671580000145
其中丶写在丨的右边而不是下边,是为了符合汉字的常见结构和书写美观;韵母ian中的i、a、n分别表示为丨、一、
Figure BSA00000986715800001446
,从上到下就表示为
Figure BSA0000098671580000146
韵母in中的i、n分别表示为丨、
Figure BSA00000986715800001428
,从上到下就表示为
Figure BSA0000098671580000147
韵母iang中的i、a、ng分别表示为丨、一、フ,从上到下就表示为
Figure BSA0000098671580000148
韵母ing中的i、ng分别表示为丨、フ,从上到下就表示为
Figure BSA0000098671580000149
韵母iong中的i、o、ng分别表示为丨、丶、フ,表示同样
Figure BSA00000986715800001411
中的丶书写在丨的右边而不是丨的下方;韵母ua中的u、a分别表示为
Figure BSA00000986715800001429
、一,从上到下书写成韵母uo中的u、o分别表示为
Figure BSA00000986715800001430
、丶,从上到下书写成
Figure BSA00000986715800001413
韵母uai中的u、a、i分别表示为
Figure BSA00000986715800001431
、一、丨,从上到下书写成
Figure BSA00000986715800001414
韵母uei中u、e、i分别表示为
Figure BSA00000986715800001432
、丿、丨,就表示成作为韵母uei缩写的ui中的u、i分别表示为
Figure BSA00000986715800001433
、丨,从上到下书写,表示成
Figure BSA00000986715800001416
韵母uan中的u、a、n分别表示为、一、
Figure BSA00000986715800001435
,从上到下书写,就表示成
Figure BSA00000986715800001417
韵母uen中u、e、n分别表示为、丿、,就表示成
Figure BSA00000986715800001418
韵母un中u、n分别表示为
Figure BSA00000986715800001438
Figure BSA00000986715800001439
,从上到下书写,就表示成
Figure BSA00000986715800001419
韵母uang中的u、a、ng分别表示为、一、フ,从上到下书写成
Figure BSA00000986715800001420
韵母ueng中的u、e、ng分别表示为
Figure BSA00000986715800001441
、丿、フ,就书写成
Figure BSA00000986715800001421
韵母üe中的ü、e分别表示成v、丿,为美观,书写成
Figure BSA00000986715800001422
韵母üan中的ü、a、n分别表示成v、一、
Figure BSA00000986715800001442
,从上到下就书写成
Figure BSA00000986715800001423
韵母ün中ü、n分别表示成v、
Figure BSA00000986715800001443
,从上到下书写成
Figure BSA00000986715800001424
韵母er中e、r分别表示成丿、r,就书写成
Figure BSA00000986715800001425
可以看出本音素化韵母可以与汉语拼音方案中的韵母方便地相互转换,只要记住一、丨、丿、丶、
Figure BSA00000986715800001444
、フ、r分别来表示《汉语拼音方案》组成韵母的字母a、i、e、o、u、n、ng、r即可,当然根据概率论,用一、丨、丿、丶、
Figure BSA0000098671580000151
フ、r来表示韵母中常见a、i、e、o、u、n、ng、r的共有8!(8的阶乘)种表示方法,需要指出的是也可无零声母。为便于显示这种音素化字母化的韵母,建议在字库中采用这种新的音素化韵母。
多个字母组成的韵母按上述方式表达成音素化韵母具有以下优点:避免韵母由多个字母组成而导致字符串化,形体简短,书写方便美观,键盘输入音素化韵母时只作为一个字母输入,因而能减少击键次数,比较合理。这套音素化韵母如能得到普及推广,将产生很大的社会效益经济效益。
如果将附图1中的韵母改为音素化韵母的话,见附图5,各音素化韵母与字母映射关系设定为:
如果将附图2中的韵母改为音素化韵母的话,见附图6,各音素化韵母与字母映射关系设定为:
Figure BSA0000098671580000153
Figure BSA0000098671580000161
附图5和附图6中的声母仍采用拉丁字母,zh、ch、sh分别用e、u、a表示。
单个字母的声母建议直接采用《汉语拼音方案》中的拉丁字母,规定一律采用大写字母或小写字母,为书写简便,建议用小写拉丁字母表示韵母。为迎合中国人的汉字习惯,也可将拉丁字母进行笔画化,即汉化拉丁字母。
韵母zh、ch、sh因为由两个字母组成,为表示成一个字母,可在z、c、s上头加一横,表示成
Figure BSA0000098671580000162
即将zh、ch、sh分别表示成
Figure BSA0000098671580000163
或者在z、c、s中间加一横,表示成
Figure BSA0000098671580000164
即将zh、ch、sh分别表示成
Figure BSA0000098671580000165
或者规定在z、c、s末尾加一竖,表示为
Figure BSA0000098671580000166
即将zh、ch、sh分别表示成
Figure BSA0000098671580000167
从书写方便的角度看,建议采用这种形式。下面给出拉丁字母的声母进行笔画化后的声母,见附图3所示,这种笔画化声母可能与本人发明的音素化韵母更搭配:
下面再对形部编码作详细说明。
笔画是汉字书写时不间断地一次连续写成的一个线条。按国家语委的规定,将汉字的各种笔画归类为横、竖、撇、点、折五种基本笔画,其中,提并入横,竖钩并入竖,捺并入点,各类带转折的笔画并入折。汉字部件是由笔画组成的具有组配汉字功能的构字单位,汉字部件数量较多,为便于记忆,本发明只是选取了其中一部分参与编码。
汉字可分为独体字和合体字二类。合体字根据整体结构将其一分为二,含首笔画的部分为首部,合体字中除了首部外的剩余的部分为剩部。对左中右结构的汉字,可规定将其中间部分、右边部分划为剩部,当然也可规定将左边部分、中间部分划分为首部,右边部分划分剩部,为降低重码,在编码实例中规定将中间部分划分到剩部。对上中下结构的汉字,将其上面部分划分为首部,中间部分、下面部分划为剩部,当然也可规定将中间部分划分到首部,为降低重码,在编码实例中规定将中间部分划分到剩部。为降低重码,本发明还规定了成字优先的划分原则。当一个汉字为上中下结构或包围结构时,若两边都能成字的话,要按“两边都成字优先”的原则划分,若一边能成字的话,要按“一边成字优先”划分。如“营”字,是上中下结构,若把艹列为首部,则两边都不能成字,若把“吕”列为剩部的话,一边能成字,因此要把“吕”列为剩部。又如“案”字,若把“宀”列为首部,则两边都不能成字,若把“木”列为剩部的话,则两边都能成字,所以要将“安”列为首部,“木”列为剩部。
形部编码的一种取码规则是:独体字,按书写顺序分别取该汉字的第一个和最末一个基本部件的代码编码,当然也可规定按书写顺序取取该汉字的前二个基本部件的代码编码。只有一个基本部件的汉字,就只取这个基本部件的代码编码,或者规定接连两次取这个基本部件的代码编码。合体字,按整体结构,将它一分为二,先写部分为首部,后写部分为剩部,规定合体字的取码规则为:分别按书写顺序取首部和剩部的第一个基本部件的代码编码,这样的编码规则就相当简单明了,易学易记。
本人在长期的编码研究中早就认识到一个汉字是否为左右结构是一目了然的,左右结构的汉字很容易在其产生空隙处将它一分为二,(空隙在左边部分和右边部分之间),而上下、包围结构的汉字有时不易一分为二,甚至有时难以分清一个字是独体字还是上下结构或包围结构。根据一个汉字是否为左右结构划分是最简单易学。因此也可将汉字分为左右结构的汉字和非左右结构的汉字,左右结构的汉字按整体结构一分为二,先写部分为左部,或称为左边部分,后写部分为右部,或称为右边部分,左中右结构的汉字,中间部分和右边部分一律划到右部。
这时,形部编码的取码规则还可规定为:非左右结构的汉字,按书写顺序取该汉字的第一个和最末一个基本部件的代码编码。当然也可规定按书写顺序取前二个基本部件编码,但规定取前二个基本部件的话,重码会增加不少,例如“相”和“想”就会发生重码,所以非左右结构的汉字,还是规定按书写顺序取该汉字的第一个和最末一个基本部件的代码编码为好,只有一个基本部件的非左右结构的汉字,就只取这个基本部件的代码编码,或者规定接连两次取这个基本部件的代码编码。左右结构的汉字,按书写顺序取左部的第一个和最末一个部件,当然也可规定按书写顺序取左部的前二个部件编码,当左部只有一个部件时,按书写顺序取右部的第一个部件编码。如果嫌这个取码规则繁琐,不规定左部最多可以取二码的话,也可以规定左右结构的汉字的取码规则为:分别按书写顺序取该汉字的左部和右部的第一个基本部件的代码编码,显然这样规定最简单、最方便。
如果在编码时,不停地区分某汉字是否为左右结构,再进行编码,这样显然会影响头脑反映,于是本人发明了“一竖横向T形选取基本部件”的形部编码规则,通过一竖向线试着去分隔某个汉字,再找该汉字中的几个点,来迅速找到基本部件进行编码。具体讲,就是按书写顺序取该汉字的第一个基本部件的代码作为形部编码的第一码后,从第一个基本部件的最右端起,用一根与该汉字齐长的竖线(不一定要笔直)从左到右横向推移去分隔该汉字,若有间隙(左右结构的汉字,左边部分和右边部分往往有明显的间隙),可用竖线将该汉字分为左边和右边两个部分,则该竖线就为分隔线,再按书写顺序取右边部分的第一个基本部件的代码进行编码,作为形部编码第二码。形部编码第二码或者也可规定再取该汉字右上角所在的基本部件的代码进行编码。若该竖线从左到右地横向推移到整个汉字的最右边,意味着不能用竖线将汉字一分为二,这时沿竖线到汉字的最末端,按书写顺序取该汉字的最末一个基本部件的代码编码。举个例子:“可”字,用一竖线试着去将“可”字分为左右二个部分,必然会找不到左右二个部分的间隙处,免不了“可”字的书写顺序中的第一笔相交,所以无法分为左右二个部分。“想”字,用一竖线试着去将“想”字分为左右二个部分,必然会找不到左右二个部分的间隙处,免不了“想”字的书写顺序中的下部“心”相交,所以也无法分为左右二个部分。而“柯”字,可用竖线将“柯”字中“木”和“可”中间处分隔开来。
本人用英文大写字母“T”来形象地说明取码方法,“T”为一横下面接一竖,有三个端点(即横的左端点、右端点、竖的末端点)和一个接点(即横竖相接的点),这一竖就相当于分隔线,若能左右隔开某个汉字,则取左端点、紧临接点的端点或右端点所在位置的基本部件的代码进行编码,(左端点所在位置的基本部件即为按书写顺序该汉字的第一个基本部件,紧临接点的端点所在位置的基本部件即为书写顺序取分隔线的右边部分的第一个基本部件,右端点所在位置的基本部件即为该汉字右上角所在位置的基本部件),这时的取码方向为从左到右,类似于走了个“一”字形,相当于走了“T”字形的横向。若分隔线不能将汉字分为左边部分和右边部分,则取左端点和末端点所在基本部件(即按书写顺序分别取该汉字地第一个和最末一个基本部件)的代码进行编码,这时取码方向为从左到右,由于到了汉字最右端,仍无法用分隔线将汉字一分为二,就沿分隔线到汉字的末端点,对于大多数汉字来说,汉字的最后一个部件就在右下方,取码方向类似于“7”,相当于走了半个“T”字形。但也有少数汉字右上角有个点,最末笔在右上角的点,如“戈”等,或者最末笔在汉字的内部的右下角,如“同”等字,还有少数汉字如“达”等字,只是多笔画部件辶的部分笔画在右下方,不一一例举。反正,第二码是按书写顺序取该汉字的最末一个基本部件的代码编码。
还可以在这种取码方法的基础上提出类似于四角号码的形部编码取码规则,只不过要用分隔线进行判断第二码是取右上角还是右下角。若能用分隔线分隔开某汉字,取该汉字的左上角和右上角所在的基本部件的代码,若不能隔开,则取该汉字的左上角和右下角所在的基本部件的代码。
不过,本人倾向于形部编码第二码按书写顺序而不是按角取码的方式,即规定若能用分隔线分隔开,就按书写顺序取右边部分的第一个基本部件的代码进行编码,而不是取右上角所在的基本部件的代码,若不能用分隔线分开,则按书写顺序取该汉字的最末一个基本部件的代码进行编码,而不是取右下角所在的基本部件的代码。
如果不习惯用分隔线的方法,也可按汉字是否左右结构找点进行编码,编码时,形部编码的第一码就找该汉字的第一个点,这第一个点很容易找,肯定是按书写顺序取该汉字的第一个基本部件,形部编码的第二码就找该汉字的第二个点,如为左右结构的汉字,就将该汉字分为左边部分和右边部分,右边部分的按书写顺序的第一个基本部件就是该汉字的第二个点,在打字时要用横向扫描很快找到这第二个点,形部编码的第二码取右边部分的按书写顺序的第一个基本部件的代码就可。如为非左右结构的汉字,显然不能用这种方法找到第二个点,这时,第二个点就在按书写顺序该汉字的最末一个基本部件,很容易扫描到这个第二点。形部编码的第二码按书写顺序取该汉字的最末一个基本部件的代码编码就可。多数情况下,第二个点就在汉字的右下方或内包围的右下方,与第一个点构成对角关系,少数汉字的点在右上角,与第二个构成横向关系。即先横扫,无左右分就取末。
另外还要指出形部编码是,在取基本部件的代码进行编码时都要遵循取大优先的原则,即要优先取笔画多的基本部件编码。否则由于多笔画部件由几个单笔画部件组成,将多笔画部件拆成单笔画部件编码的话,就完全乱套了。
在汉字中,合体字占了绝大多数,约为95%。同音又同偏旁部首的合体字数量较多,约有五、六百对。其中氵、艹、口、木、扌、钅、亻等偏旁部首产生的同音字最多,氵约有六十余对同音字,其它的也有三、四十对同音字,为降低重码,这些偏旁部首必须被选出,分别用一个字母或别的符号编码。女、讠、忄、月、虫、土、纟、火、疒等偏旁部首就只有十来对同音字,为降低重码,这些偏旁部首也要被选出,分别用一个字母或别的符号编码。、、山、石、日、王、阝、鱼、禾等偏旁部首只有五对左右的同音字,为降低重码,这些偏旁部首也可被选了出来,分别用一个字母或别的符号编码,当然个别偏旁也可弃而不选。而有的偏旁部首如“田”、“目”、“贝”、“车”、“酉”、“犭”、“饣”等虽然常用,可重码只有几对,都是可选可不选。部件“贝”的重码略多点,为考虑到繁简体通用,在编码实例中选汉字部件“贝”作多笔画部件。本人研究发现,同音同偏旁部首的汉字的除偏旁部首外部分按书写顺序第一笔为同类基本笔画的情况更是出乎意外的少,只有一百多对,其中部件十、宀出现得比较多,宀还经常出现在汉字的字首,宀也可被选了出来,在编码实例中不选。接着将26个多笔画部件分别用一个字母或别的符号编码,建议将这26个多笔画部件分别用一个字母编码。辶、鸟这二个部件惯常出现在字尾,不将它们列为多笔画部件的话,按第一种形部编码的取码规则取码时,很多汉字要取它们的最后一个笔画点、横,由于点、横在字尾的组字频率很高,容易造成重码,因此也将它们列为基本部件。这样共优选了28个多笔画部件。“辶”惯常出现在汉字的字尾,而疒惯常出现在汉字的字首,两者位置不同,用同一个字母或别的符号编码,几乎不会造成重码,就将它们合并排列,用同一个字母或别的符号编码。多笔画部件“鸟”惯常出现在字尾,首笔为撇,而撇在汉字的字尾的组字频率很低,若与撇合并排列,用同一个字母或别的符号编码,也几乎不会发生重码,因此也可将“鸟”与“撇”合并排列,用同一个字母或别的符号编码。在编码实例中由于“撇”排在标点符号键上,而“鸟”是多笔画部件,也可以用字母编码,所以两者的编码并不一定要一致。
横、竖、撇等基本笔画的出现的频率较高,为降低重码,不宜与多笔画部件排在同一个键上,在编码实例中,将它们分别排到三个标点符号“,”、“.”、“/”键上,用三个标点符号“,”、“.”、“/”编码,比较有序合理。点、折等基本笔画的组字频率相对较低,可将它们与多笔画部件合并排列,分别用字母或别的符号编码。当然由于基本笔画点的组字频率与撇相差不大,而且出现在独体字以及合体字的第二部分的首位和末位的频率很高,也可将基本笔画点排在其它一个标点符号键上,用该标点符号编码,比如排在“;”上,用“;”编码,或者排在“’”上,用“’”编码。在编码实例中,点用“;”编码。还可将基本笔画折排到其它一个标点符号键上,用该标点符号编码,在编码实例中基本笔画折按其拼音首字母z编码。
为便于记忆,排列时主要以多笔画部件的读音的拼音首字母或声母为代码。为避免重码,还将若干声母相同的部件取了出来,改按象形或韵母的方式编码。
多笔画部件、单笔画部件与字母、标点符号的影射关系设定为:
Figure BSA0000098671580000221
Figure BSA0000098671580000231
根据设定关系将部件分别用相应的字母和标点符号编码。
下面作具体解说:a的大写A与钅相似;b是疒的声母;c是艹的声母;d是氵的声母;e是禾的韵母;f似扌;g形似鸟、贝;h是火的声母;i因为ch排在其上,而ch是虫的声母;j是纟的声母;k是口的声母;L似鱼的左上角;m是木的声母;n是女的声母;o似月亮的外形;p似阝;Q似日,就作为日代码;r是亻的声母;s是石的拼音的首字母;t是土的声母;u因为sh排在u上,而sh是山的声母;v跟形似;w是王的声母;x是忄的声母;Y是讠的声母;z是和折的声母;这些字母就分别作为相应的基本部件的代码。“;”作为点的代码;“,”作为横的代码;“.”作为竖的代码;“/”作为撇的代码。这种排列方式基本上是按表音排列的,往往将基本部件按其拼音首字母或声母排列,对拼音首字母相同的少数多笔画部件,改按象形或韵母排列。
“、、山、石、日、王、阝、鱼、禾、贝”等汉字部件降低重码字的数量不多,所以也可以舍弃几个多笔画部件,使得单笔画部件不与多笔画部件合并排列,一种排列映射方法是:
Figure BSA0000098671580000232
以上排列只是变形。撇、竖、折仍用拼音首字母表示,与横、点用同一个字母表示的多笔画部件由于频率太高,能降低不少重码,无法舍弃,所以将横、点分别排列到w、e键上,用相应的字母编码,原先“王”和“禾”这两个多笔画部件可舍弃。这些都是普通专业技术人员对本发明的变形,所以不在说明书附图中例举。
也可将多笔画部件用象形的方法排列,多笔画部件、单笔画部件与字母、标点符号的影射关系设定为:
根据设定关系将基本部件分别用相应的字母和标点符号编码。
下面作具体解说:大写a似亻;大写b似日;c似贝的头;d似石,框在下部;大写e似山;f似扌,特别似反扌;g似足、鸟,框在上部;大写h似艹;i似讠;j似疒,又似辶的前二笔;k似,似半个;l似忄;m似木,似树林,木的声母也是m;n似月;o似口;p似阝;大写q似虫,都是框内有出笔;大写r似女;s似氵,似水流形,氵声母也是s;t似土,土的声母也是t;u似鱼,似鱼泡,读音也似;v似钅字头或字尾;w似纟;x似火;y似禾,禾苗的形状往往似y;z似王,也与折“乙”的外形相似。为便于记忆,就将横、竖、撇、点按键盘顺序分别排在“,”、“.”、“/”、“;”键上,用相应的标点符号编码。当然也可按别的方式分别排列,如将横排在“;”键上,将竖排在“/”键上,将撇排在“,”上,将点排在“.”键上。将多笔画部件完全按形似排在字母键上,有个好处,那就是不必象按读音排列那样,为避免重码而不得不将有些部件改按象形排列,编码原理具有一致性,有的人可能更喜欢这种方式。
多笔画部件、单笔画部件与字母、标点符号的还有一种影射关系设定为:
根据设定关系将部件分别用相应的字母和标点符号编码。
下面作具体解说:五行钅、木、水、火、土分别排在键盘中间排左边键a、s、d、f、g上,土地类日、月、王、石、山分别排在键盘上排左边键q、w、e、r、t上,身体类阝、口、心、扌、分别排在键盘上排右边键y、u、i、o、p上,人生类女、亻、讠、疒分别排在键盘中间排左边键h、j、k、l上,辶惯常出现在汉字的末尾,而疒惯常出现在汉字的开头,合并排列几乎不会产生重码,所以将它们合并用同一个字母或别的符号编码。由于疒用l编码,相应地辶也用l编码。植物动物类、纟、艹、禾、鱼、贝、虫就分别排在键盘的下排z、x、c、v、b、n、m键上,贝与鸟合并排列,用同一个字母编码,基本不会产生重码,由于“贝”用n编码,相应地“鸟”也用n编码根据排列,这些字母就分别作为相应的基本部件的代码。当然,将五行类和土地类和身体类的排列位置互换也是可以的。“;”作为点的代码;“,”作为横的代码;“.”作为竖的代码;“/”作为撇的代码。
汉语拼音中各个声母的组字频率各不相同,其中y、j、l、x的组字频率很高,为减少字词重码,氵、艹、口、木、扌、钅等组字频率很高的多笔画部件不宜排到y、j、l、x上,而要尽量将这些高频的多笔画部件排到组字频率较低的a、o、e、r键上,实在无法排列的话,也要排到组字频率中等的字母键上,用相应的字母编码。附图7就充分注意到了这点。
由于逗号和句号的形状较小,也可分别用“<”和“>”代替,作为编码符号。将标点符号作为基本笔画的代号,有三个好处:一是扩大了编码空间,避免这四个基本笔画与多笔画部件排在同一个键上后,与多笔画部件编码相同,发生重码。二是由于拼音在先,形部编码在后,因而不会影响标点符号的输入。三是可与音码部分为拼音,形部编码将笔画用标点符号表示的输入法兼容,无须换档,实现混合输入。
有的基本部件在作为偏旁部首后,字形会有所改变,但必须视为同类基本部件,用同一字母编码,这类基本部件如和竹,足和,亻和人,讠和言,钅和金,氵含水、氺,扌含手,忄含心,纟含糹等,特点是同源。基本部件也可包含个别与它十分形似的部件,用同一字母编码。如部件“土”可包含“士”,由于这两个部件仅有笔画长短之分,作为同一个部件编码可能更符合头脑反应习惯。纟与幺也十分形似,也可规定纟包含幺,为同一个部件编码也符合头脑反应习惯,当然也可不这么规定。
在编码实例中规定:音码部分采用拼音或音素双拼,在编码实例中采用附图1和附图7编码。形部编码的取码规则为:按书写顺序取该汉字的第一个基本部件的代码作为形部编码的第一码后,从第一个基本部件的最右端起,用一根与该汉字齐长的竖线(不一定要笔直)从左到右横向推移去分隔该汉字,若有间隙,可用竖线将该汉字分为左边部分和右边部分,则按书写顺序取右边部分的第一个基本部件的代码,作为形部编码第二码。若不能用竖线将汉字分为左边部分和右边部分,(硬分隔的话,必然将汉字的某个笔画或优选的多笔画部件割断),则按书写顺序取该汉字的最末一个基本部件的代码作为形部编码第二码。
编码实例:如“汉”的编码,声母是h,韵母为an,音素字母韵母是
Figure BSA0000098671580000271
代码是f,音码部分就为hf,为左右结构汉字,按书写顺序取左部的第一个基本部件氵的代码编码,为d,再按书写顺序取右部的第一个基本部件“折”的代码编码,为z,于是“汉”的编码为“hfdz”,音码采用全拼的话,“汉”的编码为“handz”。又如“字”的编码,音码部分双拼和双拼一致,为zi,形部编码为非左右结构汉字,按书写顺序,取第一个基本部件为基本笔画点,代码为“;”,再按书写顺序最末一个基本部件为横,代码为“,”,于是“字”的编码为“zi;,”。又如“封”,全拼为feng,双拼就为“fn”,形部编码时,左右结构汉字,左部第一个基本部件为多笔画部件“土”,代码为“t”,右部的第一个基本部件的代码“横”编码,代码为“,”,“封”的编码就为“fnt,”,音码部分采用全拼的话,“封”的编码就为“fengt,”。注意在形部编码时取基本部件要遵循取大优先的编码原则,即要优先取笔画多的基本部件编码,例如“封”字编码时应取多笔画部件“土”,而不能取第一个单笔画部件横,因为“土”的笔画数多于“横”,要按“土”编码。如“这”字,全拼为zhe,双拼就为“ee”,形部编码时,为非左右结构汉字,按书写顺序第一个基本部件为“点”,代码为“;”,再按书写顺序取最末一个基本部件辶的代码b,“这”的形部编码就为“;b”,于是“这”的编码为“ee;b”,音码部分采用全拼的话,编码为“zhe;b”。如“事”字,拼音为shi,sh的双拼代码为a,“事”的双拼就为ai,按书写顺序第一个基本部件为单笔画部件横,代码为“,”,根据取码规则,形部编码的第二码要按书写顺序取该汉字的最末一个基本部件竖的代码“.”编码,“事”的形部编码就为“,.”,“事”的整个编码就为“ai,.”,音码部分采用全拼的话,编码为“ai,.”。又如“木”的编码,双拼为mu,该汉字只有一个基本部件“木”,代码为m,“木”的形部编码就为“m”,于是木的编码就为mum。为了追求码长整齐划一,也可规定只有一个基本部件的汉字也可取第一笔或者最末笔的代码或者重复该基本部件的代码作为形部编码的第二码。本编码实例不作这样的规定。
为提高输入速度,对于使用频繁的字,设计了简码。简码就是对常用的汉字只是取其完整编码的前编1个、2个或3个编码,再按1个空格键就能输入该汉字。由于规定音码在先,形部编码在后,许多汉字的形部编码并不需要全部输入,只要输入该汉字的简码,所以单字的编码实际上是音码为主,辅以形部编码,形部编码起到了辅助码的作用。
由于汉字的拼音只有四百来个,汉字的二级简码也就只有四百来个,而本发明的编码空间有729个,因此,对于其余三百来个编码空间,还设立简码词提高打字速度。如汉字的拼音无kian的形式,双拼编码也就无ky的形式,而“k”、“y”却分别为“可”、“以”的声母,因此ky可以作为“可以”的编码。在计算机上敲击完某个汉字或词组的简码所在的键后,再敲击空格键,就可输入相应汉字或词组。
词语输入是提高汉字输入速度的最常用方法,由于规定音码在先,形部编码在后,词语输入就全部利用音码输入,音码选用王治阳双拼,词语输入的步骤是:
a、二字词语,取每个字的声母、韵母的代码依次输入;如“编码”代码为blma。
b、三字词语,取每个字的声母的代码依次输入,再补空格输入;如“计算机”的代码为“jsj”。当然也可规定取第一字、第二字的前一码即声母的代码,再取第三字的前二码。还可规定再第一字的前二码,再取第二字、第三字的前一码即声母的代码。
c、四字及以上词语,取前三个字及最后一个字的声母的代码依次输入;如“科学技术”为四字词,取每个字的声母的代码为“kxja”,a为术的声母的代码。又如“新疆维吾尔自治区”,编码取前三个字及最后一个字“新疆维区”的声母的代码“xjwq”。
这样采用附图1和附图7的话,十来分钟就可学会,甚至几分钟就可基本学会,比如双拼只要记住a、o、e、i、u区,再按字母个数和a、o、e、i、u、n、g排列就可以了,还可结合双拼提示行进行输入,形部编码只有28个左右的多笔画部件和五个单笔画部件,且大部分基本部件都用拼音的声母作代码。采用附图2和附图8的话也只要二三十分钟就能学会,使本发明显示出极大的优越性,成为唯一理想的汉字输入法。
利用音素T形汉字码输入法软件,在计算机键盘上敲击某个汉字或词组的相应的编码所在的键,就可完成输入。一般规定无重码且达到规定码长的汉字或词组自动上屏,不足规定码长的要按空格键,有重码的单字或词组根据提示行选择。本发明字词兼容,音码采用双拼时最多码长都为4码。“~”键可设为万能学习键,当某个汉字的编码不知道时,可用“~”代替,帮助把正确的编码找出来,再利用提示行选择。本发明的形部编码可作为直接或间接辅助码,与拼音输入法配合使用,相兼容。
为了便于使用,还设置了容错码,对一些编码容易出错的汉字,在错误输入时也能出现所要输入的汉字。为尽可能与其他输入法兼容和便于记忆,还可规定将横、竖、撇、点按键盘顺序分别排在“,”、“.”、“/”、“;”、“’”键上,用相应的标点符号编码。这时还可与拼音加笔画输入法的形部编码规则兼容:即输入某个汉字的拼音后,可按书写顺序输入该汉字的前几个基本笔画的代码,以减少重码字。
需要指出的是在本说明书、权利要求书和说明书附图中的字母均不分大小写,字母的大小写是等效的。

Claims (8)

1.一种计算机汉字编码键盘输入法即音素T形汉字码输入法,将汉字的各种笔画归类为横、竖、撇、点、折五种基本笔画,将这五种基本笔画称为单笔画部件,由多个笔画组成的汉字部件,称为多笔画部件,单笔画部件和多笔画部件统称为基本部件,其特征是:
(1)编码由两部分组成,一部分是音码,即拼音,或称拼音码,另一部分是形部编码,这两部分组成编码时,可以是音码在先,形部编码在后;也可以是形部编码在先,音码在后,但一经选定,次序就不能改变;
(2)音码采用新的双拼,单个字母的声母采用国家法定拼音字母,翘舌音ch、sh、zh分别用u、a、e编码,各韵母与字母映射关系设定为:
Figure FSA0000098671570000011
各韵母与字母的另一种映射关系设定为:
Figure FSA0000098671570000012
Figure FSA0000098671570000021
国家法定的《汉语拼音方案》各韵母的对应的音素化韵母为:
Figure FSA0000098671570000022
(3)将汉字分为合体字、独体字时的形部编码的取码规则是:独体字,按书写顺序取第一个和最末一个基本部件的代码编码,或者规定取前二个基本部件的代码编码,只有一个基本部件的汉字,就只取这个基本部件的代码编码,或者规定接连两次取这个基本部件的代码编码;合体字,按书写顺序取首部的第一个和最末一个部件,或者规定按书写顺序取首部的前二个部件编码,当首部只有一个部件时,按书写顺序取剩部的第一个部件编码;合体字取码规则或者规定为:分别按书写顺序取首部和剩部的第一个基本部件的代码编码;
将汉字分为左右结构汉字,非左右结构汉字时,形部编码的取码规则是:非左右结构的汉字,按书写顺序取第一个和最末一个基本部件的代码编码,或者规定按书写顺序取前二个基本部件编码,只有一个基本部件的汉字,就只取这个基本部件的代码编码,或者规定接连两次取这个基本部件的代码编码;左右结构的汉字,按书写顺序取左部的第一个和最末一个部件,或者规定按书写顺序取左部的前二个部件的代码编码,当左部只有一个部件时,按书写顺序取右部的第一个部件编码;左右结构汉字的取码规则或者规定为,分别按书写顺序取左部和右部的第一个基本部件的代码编码;
形部编码的取码规则或者是:按书写顺序取该汉字的第一个基本部件的代码作为形部编码的第一码后,从第一个基本部件的最右端起,用一根与该汉字齐长的竖线从左到右横向推移去分隔该汉字,若有间隙,能用竖线将该汉字分为左边部分和右边部分,则按书写顺序取右边部分的第一个基本部件的代码,作为形部编码第二码;若不能用竖线将汉字分为左边部分和右边部分,则按书写顺序取该汉字的最末一个基本部件的代码作为形部编码第二码;
(4)形部编码时,多笔画部件的编码方法是:偏旁氵、艹、口、木、扌、钅、亻必须被选出,分别用一个字母或别的符号编码;偏旁女、讠、忄、月、虫、土、纟、火、疒、辶也要被选出,分别用一个字母或别的符号编码;偏旁、、山、石、日、王、阝、鱼、禾,也分别用一个字母或别的符号编码;基本笔画横、竖、撇、点、折分别用一个标点符号或字母编码。
2.根据权利要求1所述的音素T形汉字码输入法,其特征是:双拼采用王治阳双拼:
各韵母与字母的一种映射关系设定为:
Figure FSA0000098671570000031
Figure FSA0000098671570000041
各韵母与字母的另一种映射关系设定为:
Figure FSA0000098671570000042
选择上述任意一种设定关系,对声母和韵母编码,只有韵母没有声母的,取e或o或a作声母,或取韵母的第一个字母作声母代码,再补上韵母代码。
3.根据权利要求1所述的音素T形汉字码输入法,其特征是:形部编码时,基本部件与字母、标点符号的一种映射关系设定为:
Figure FSA0000098671570000043
Figure FSA0000098671570000051
基本部件与字母、标点符号的另一种映射关系设定为:
根据上述任意一种设定关系,将基本部件分别用相应的字母和标点符号编码。
4.根据权利要求1所述的音素T形汉字码输入法,其特征是:同类基本部件,用同一字母编码,这类基本部件如:和竹,足和,亻和人,讠和言,钅和金,氵和水、氺,扌和手,忄和心,纟和糹,土和士。
5.根据权利要求1所述的音素T形汉字码输入法,其特征是:组字频率很高的多笔画部件氵、艹、口、木、扌、钅、亻不宜映射到组字频率很高的y、j、l、x键上,而要尽量将这些高频的多笔画部件映射到组字频率较低的a、o、e、r键上。
6.根据权利要求3所述的音素T形汉字码输入法,其特征是:主要以多笔画部件的读音的拼音首字母或声母为代码,多笔画部件与字母的一种映射关系为:a的大写A与钅相似;b是疒的声母;c是艹的声母;d是氵的声母;e是禾的韵母;f似扌;g为宀的声母,形似鸟;h是火的声母;i因为ch排在其上,而ch是虫的声母;j是纟的声母;k是口的声母;L似鱼的左上角;m是木的声母;n是女的声母;o似月亮的外形;p似阝;Q似日,就作为日代码;r是亻的声母;s是石的拼音的首字母;t是土的声母;u因为sh排在u上,而sh是山的声母;v因为zh排在u上,而zh是的声母;w是王的声母;x是忄的声母;Y是讠的声母;z是和折的声母;这些字母就分别作为相应的基本部件的代码;
或者主要以多笔画部件与英文字母的相似程度编码,笔画部件与字母的另一种映射关系为:大写a似亻;大写b似日;c似宀;d似石;大写e似山;f似扌;g似足、鸟;大写h似艹;i似讠;j似疒;k似;l似忄;m似木;n似月;o似口;p似阝;大写q似虫;大写r似女;s似氵;t似土;u似鱼;v似钅;w似纟;x似火;y似禾;z似王。
7.根据权利要求1所述的音素T形汉字码输入法,其特征是:基本笔画横、竖、撇、点与多笔画部件用不同的字母或其他符号编码。
8.根据权利要求1所述的音素T形汉字码输入法,其特征是:形部编码的取码规则是:若按书写顺序,某个汉字的第一个基本部件为多笔画部件,且该多笔画部件处于整个汉字的正左方或正上方或包围方时,按书写顺序取该汉字的前二个基本部件的相应代码编码;其他汉字则按书写顺序取第一个和最末一个基本部件的相应代码编码;只有一个基本部件的汉字就取这个基本部件的相应代码编码,或者规定接连二次取这个基本部件的相应代码编码。
CN201310659399.XA 2013-11-28 2013-11-28 音素t形汉字码输入法 Pending CN103616961A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310659399.XA CN103616961A (zh) 2013-11-28 2013-11-28 音素t形汉字码输入法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310659399.XA CN103616961A (zh) 2013-11-28 2013-11-28 音素t形汉字码输入法

Publications (1)

Publication Number Publication Date
CN103616961A true CN103616961A (zh) 2014-03-05

Family

ID=50167664

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310659399.XA Pending CN103616961A (zh) 2013-11-28 2013-11-28 音素t形汉字码输入法

Country Status (1)

Country Link
CN (1) CN103616961A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105892704A (zh) * 2014-11-11 2016-08-24 王治阳 首笔音素字母注音输入法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105892704A (zh) * 2014-11-11 2016-08-24 王治阳 首笔音素字母注音输入法
CN105892704B (zh) * 2014-11-11 2019-04-09 王治阳 首笔音素字母注音输入法

Similar Documents

Publication Publication Date Title
CN111880667A (zh) 音素同声近位常用汉字码输入法
CN103616960A (zh) 六元音字母双拼输入法
CN100498662C (zh) 一种元拼拼音汉字输入方法
CN101751134B (zh) 正左上方汉字输入法
CN106168858A (zh) 二十六部首字根和笔汉字输入法
CN103616961A (zh) 音素t形汉字码输入法
CN103207684A (zh) 音素字母双拼输入法
CN103207685A (zh) T形汉字码输入法
CN102023717A (zh) 三五首次音码及其键盘
CN103941882A (zh) T形汉字码输入法
CN102023718A (zh) 声韵笔画主副部首输入法
CN102073383A (zh) 字首部件拼音输入法
CN107066113A (zh) 二十部件单字二码输入法
CN103970286A (zh) T形二码输入法
CN106708284A (zh) 二十部件汉字码输入法
CN101470535A (zh) 优化汉字码输入法
CN101957662B (zh) 带有汉字元素的计算机和手机汉字输入键盘及输入方法
CN101430604A (zh) 汉字码输入法
CN1032939C (zh) 汉字阴阳双极声形码输入系统
CN101571750A (zh) 标准汉字码输入法
CN112783336A (zh) 新音素同声近位汉字码输入法
CN101504572A (zh) 完善汉字码输入法
CN101561713A (zh) 标准汉字码输入法
CN102073382A (zh) 笔画主副部首输入法
CN102693070A (zh) 以划线方式输入文字的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140305