CN1109184A - 二部拼形计算机中文输入法 - Google Patents

二部拼形计算机中文输入法 Download PDF

Info

Publication number
CN1109184A
CN1109184A CN 94111371 CN94111371A CN1109184A CN 1109184 A CN1109184 A CN 1109184A CN 94111371 CN94111371 CN 94111371 CN 94111371 A CN94111371 A CN 94111371A CN 1109184 A CN1109184 A CN 1109184A
Authority
CN
China
Prior art keywords
word
pen
parts
code
rear portion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 94111371
Other languages
English (en)
Other versions
CN1050680C (zh
Inventor
王广华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN94111371A priority Critical patent/CN1050680C/zh
Publication of CN1109184A publication Critical patent/CN1109184A/zh
Application granted granted Critical
Publication of CN1050680C publication Critical patent/CN1050680C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明涉及一种汉字编码的计算机输入方法。它利用普通英文小键盘的字母键,赋予特定的复笔码和部件码,构成以复笔为基本单元、以部件为主体单元、复笔与部件相结合的键盘结构。本发明的输入方法以汉字的笔画作为取码单元,而以汉字的结构确定取码部位,构成了以单字输入为基础、以词汇输入为主体的中文输入体系。

Description

二部拼形计算机中文输入法
本发明涉及一种汉字编码的计算机输入方法。
计算机中文输入是中文信息处理的基础,是在我国普及推广使用计算机的关键。目前国内外有近千种汉字输入编码方案,其中已有几十种得到推广使用,为我国计算机产业的发展起到了积极的推动作用。但是,包括五笔字型、双拼双音、自然码等优秀编码在内的现有各种方案,都还没有解决这样的一个矛盾:就是一种编码既要简单易学、适应广大华人的客观需要,又能高效实用、反映中文输入的客观规律。
例如:以王永明《五笔字型》为代表的纯拼形码,适应了大多数华人懂得拼形、不懂拼音的实际情况,因而应用比较广泛。但它有两个主要缺点:一是字根过多,规则复杂,记忆量大,难于掌握;二是输入以字为主、以词为辅,与一般中文以词为主、以字为辅的特征相脱节,不够高效实用。
又如:以刘卫民《双拼双音》为代表的纯拼音码,反映了中文输入以词为主的特点,但它的两个主要缺点:一是目前大多数华人难以正确掌握汉语拼音,因而普及性差;二是单字处理水平太低,词汇的重码率又很高,因而实用性也差。
再如:以周志农《自然码》为代表的各种音形、形音结合码,比较全面地描述了汉字的各种信息特征,因而理论意义相对较高。但它也有两个主要缺点:一是把音与形结合起来编码,就意味着输入者既要掌握音、又要掌握形,因此使汉字输入更加繁琐复杂化,实用价值也就相对较低;二是此类编码虽然使单字得到不同程度的处理,但词汇重码率太高的问题并不能因此解决,而只能依赖方案以外的系统功能来作联想或智能化处理,方案本身并不能很好反映中文输入的客观要求。
本发明的目的就是为了解决上述汉字编码存在的问题,提出这样一种兼具实用性、易学性、普及性与直观化、规范化、高速化的纯拼形汉字编码,为研制各种汉卡、汉字系统提供一个最佳输入方案。
本发明的技术解决方案:
一种二部拼形计算机中文输入键盘,其特征在于利用普通英文小键盘的26个字母键,分别赋予特定的复笔码和部件码,构成以复笔为基本单元、以部件为主体单元、复笔与部件相结合的键盘结构:
所谓复笔,即汉字有一丨丿_∠五种单笔,由两个单笔组成的复合笔画即为复笔,汉字的复笔理论上有5×5=25个,本键盘实际采用26个,其中丨_和丨∠合并为一个复笔(L键),而将丿一和丿∠,依据它们是否与其它笔画相交叉,各分为两个复笔(Z、X键和N、M键);
所谓部件,是考虑汉字分布的均衡合理性和汉字取码的直观、整体性,而把26个汉字常用构件定义为部件。
二部拼形的复笔码、部件码与键位的对应关系如图1。
由图看出,26个复笔码按顺序、有规律地在英文小键盘上排列,部件码则一般依照各自的使用频率来排列,以体现计算机输入的工效原则。
一种二部拼形计算机中文输入法,其特征在于以汉字,的笔画(复笔与部件)作为取码单元,而以汉字的结构(前部与后部)确定取码部位,构成了以单字输入为基础、以词汇输入为主体的中文输入体系:
汉字一般分为左右、上下、包围、连体四种基本结构,本发明将左右结构的左部、上下结构的上部、内起式包围结构的内部、外超式包围结构的外部称为前部,而将右部、下部、内起式的外部、外起式的内部称为后部,可分为前后二部的汉字结构统称为二部结构;连体结构的字根据有无成字来分类,成字是指一个字的前部始笔(全字第一个复笔或部件)或者后部末笔(全字最后一个复笔或部件)所在部分可以独立成字的笔划组合,有成字的连体字视为二部结构(成字为一部、其余为另一部),无成字的连体字视为一部结构;
按二部结构取码的基本形式是:
a、对于一般但单字:前部始笔+后部始笔+后部末尾,其中前部始笔为首码、后部始笔为中码、后部末尾为尾码,为三码输入;
b、对于一般词汇(二字词):依次取第一、二字的前部始笔与后部始笔,为四码输入。
本发明的特征;是以汉字笔划(复笔与部件)作为取码单元,而以汉字结构(前部与后部)确定取码部位。本发明不以单字为唯一研究对象,而是以中文为整体研究对象,出发点是以三码定义字、四码定义词的科学合成编码方式,来体现中文以单字为基础、词汇为主体的客观规律。因此,二部拼形不是一般的汉字输入法,而应准确地称之为中文输入法。与目前所有的编码方案相比,它具有六个主要特点:
一是构件最少。由于采用以笔形为基础、以构件为主导的输入方式,因此只用了26个构件。
二是分布最匀。反映汉字分布均衡程度的二码实位率高达99.41%,二级简码达到672个,比五笔字型多14.3%比自然码等各种音码、形音码多70%;单字全部以三码输入,非选择率达85%,是所有以三码制式输入汉字的各种方案中最高的。
三是词量最大。全部词汇均以四键编码共有2.4万个,是五笔字型的10倍,是自然码、双拼双音的2倍,而它的非选择率高达95%,是其它所有方案无法比拟的。
四是判读最快。它既不象拼音码、形音码那样有汉字识读的障碍,又不象五笔字型那样有汉字拆分的困难,规则简单、科学、规范,判读具有很高的一义性。
五是码长最短。在不借助自造词、联想方式的情况下,平均码长只有2.2键/字(包括空格键)
六是结构最巧。利用仅有的4个二码空位分别设计了中文数字、中文日期、常用序词、常用标点符号,并利用’键引导自造词,这样一般文章不需换挡,只需在30个左右的键位上即可完成输入。
图1是本发明的英文小键盘示意图;
图2是本发明一、二级简码表
图1中,对应同一英文字母的复笔与部件,其代码也相同,该图的英文字母是按标准英文键盘排列的,在计算机上按编码输入汉字时,则击该代码所对应的英文字母键。
图2是本发明由二部拼形产生的汉字集中使用频率较高的单字表,其中26个特高频字由一码确定,672个常用字由二码确定。
汉字笔画归纳起来有横(一)、竖(丨)、撇(丿)、点(_)、折(∠)五种基本笔划,也就是单笔。其中,横包括提,点包括捺,折包括各种钩。由两个单笔组成的复合笔画,本发明称之为复笔。如“经济”的“经”字的第一个复笔(简称为始笔)是∠∠,最后的复笔(简称为末笔)是丨一;“济”字的始笔是__,末笔是丿丨。
本发明将这些复笔分别安排在26个字母键上,其中丨_和丨∠合并为一个复笔(L键),而将丿一和丿∠,依据是否与以外笔画相交叉,各分为两个复笔(Z、X键和N、M键)。如“禾”字旁的始笔丿一,与其它笔画相交叉,因此定在Z键;而“钅”字旁的始笔同样为丿一,但不与其它笔画相交叉,因此定在X健。再如“攵”字头和“夕”字头,前者的始笔与其它笔画相交叉,因此定在N健;后者的始笔不与其它笔画相交叉,因此定在M健。始笔如此,其它复笔的定位也如此。
本发明共有26个复笔,成为取码的基本单元。考虑到汉字分布的均衡性和汉字的整体性,特别把26个汉字常用构件定义为部件,作为取码的主体单元。
在一个字取码时,有部件的要用部件取码,没有部件的则用复笔取码。要注意的是,部件与其它笔画之间可以是断开、连接或插入的关系,但不能是交叉关系,这一点与五笔字型的字根是不相同的。如“间接”二字,构件日、扌与其它笔画为断开关系;“占领”二字,构件口、贝与其它笔画为连接关系;“办”字的构件八,与其它笔画是插入关系;“其”字的构件艹、“平”字的构件十,与其它笔画是既连接、又插入的关系,这一规定使大量汉字无需拆分,不仅提高了汉字判读速度,而且保证了汉字编码的唯一性。这些构件,都是被认定的部件。如果一个构件独立使用时是一个部件,但一旦与其它笔画相交叉,便不再成为我们所说的部件。如“中”字,始笔不是部件“口”,而是丨∠;“里”字的始笔不是部件“日”而是复笔丨∠;末笔不是部件“土”而是复笔丨一。
再有一点,就是虽说认定了26个部件,但还有一些与部件形似的构件被同时认同,共有7个:士认同为土,曰认定为日
Figure 9411137100133
认同为小、木认同为木、
Figure 9411137100134
认同为月、七认为匕、卄认同为艹。除此以外,其它构件不予认同。
汉字结构一般分为左右、上下、包围、连体四种基本结构。可以看到,前三种结构都分别存在左与右、上与下、包围与被包围两个断开部分,因此本发明统称为二部结构。如“经济”二字均为左右结构,“希望”二字均为上下结构,“围困”、“趋向”皆为包围结构。其中包围结构依据起笔位置,分为内起式和外起式。“建”、“边”为内起式,“赵”、“裁”为外起式。
为了取码方法的统一,本发明将左右结构的左部、上下结构的上部、内起式包围结构的内部、外起式包围结构的外部,统称为前部;而将右部、下部、内起式的外部、外起式的内部,统称为后部。
连体字从整体上看没有断开部分,这样要根据有无成字来分析。所谓成字,就是始笔或末笔所在部分可以独立成字的笔画组合。可以单独成字的部件,也看作为成字。
独立成字必须具备五个要件:一是成字必须是国标字的标准字形;二是成字部分与非成字部分互不交叉;三是成字以外部分至少要有一个复笔;四是成字部分如只有一个复笔,必须在整个字的四边中,至少独立占有完整的一边:象“发”中的“又”、“本”中的“八”不占有完整的一边,因而不看作为成字;五是成字部分至多只能被非成字部分一次插入:象“来”中的“未”、“平”中的“干”均被“丷”二次插入,因而也不被看作为成字。凡不具备以上五个要件的连体字,均要依自然笔画顺序来取码。
根据有无成字,连体字分为两种:一是有成字连体字属于二部结构。在这种结构中,成字分为一部,其余部分为另一部。如“卓”的始笔丨一为前部,“早”为后部;“舌”  字中的“千”为前部,“口”为后部。二是无成字连体字属于一部结构,如“本”、“表”等字。
一要强调的一点,本发明讲的汉字结构是指现行汉字的静态结构,而不涉及汉字纷繁错乱的动态演变。因此,二部拼形的分部也好、取码也好,均是从国标简化字的字形与结构来作分析的。丶如
Figure 9411137100142
与“羊”、 与“牛”本来都一致,但现在各自的字形与笔画顺序不同,因而取码就不一样。当然少数汉字的笔画,也客观存在着书写顺序不统一的现实问题。为解决这一问题,提高输入的准确率。本发明主要根据中文工具书的通行规范和中小学语文教学规范,制定了以下疑难汉字构件笔画规范表,其中一至六画以数字表示(1-5分别代表一丨丿_∠),七画以上则以编码表示:二画   三画     四画     五画      六画     七画以上七15   万135    专1154
Figure 9411137100151
11534
Figure 9411137100152
121121 甚BYG九35   与151廿
Figure 9411137100153
1221  世12215   考121315 CAH阝52   犭353    车1512   北21135   亚122431  囱CNR力53   丸354    丹1514   出25252   再125121  虍HET乃53   忄424    比1535   生31121   臣152512  冒LLY
   义434    瓦1554   瓜33544   舟335144  里LYH
   氵441    长3154   主41121   兆413534  禺LY0
   也525    片3215   必45443   州434242  肃QDC
   女531    火4334   皮52354   聿515112  雨UWF
   及534    灬4444   母55144   羽541541  垂ZUH
本发明规定将二部结构的单字合理分部,其分部取码规则是:二部相断,一笔相连,部件整取,成字整算。
二部相断就是非连体二部结构的字,前后二部应处于可以断开的状态。就大多数汉字而言,左右结构多为一个纵断层、上下结构多为一个横断层、包围结构多为一个曲断层。这类只有一个断层的字,就是现成的二部结构。如果属于不止一个断层的多重结构,那就根据能否整合成字来区别处理。所谓整合,就是以一个字的始笔或末笔为基础,将靠近的几个笔画整理、合并成一个成字,目的是使全字可以分为二部。
(1)能够整合成字:一个字的第一个复笔与后续笔划可整合成字,或最后一个复笔与前接笔划可整合成字,这样成字部分为全字的一部,非成字部分为另外一部。整合成字有两项要求:一是能大不小,就是尽量整合为相对笔画较多的字,只要保证另外一部不少于一个复笔;二是能前不后,就是一个字的中间部分,既可以作前部整合、有可以作后部整合的,要作前部整合。
在一个多重结构的字中,有部件的,不管是可成字部件,还是非成字部件,均与成字一样看待,能与部件以外笔画整合的也要尽量整合。
(2)不能整合成字:一个字既不止一个断层、又无法整合的,就按其第一断层来分部取码。
一笔相连就是挂单的笔画,要依照就近挂靠的原则视作连笔。所谓就近挂靠,就是按照书写顺序,将一个单笔与前一单笔或后一单笔相连接,以构成一个复笔。一笔相连有两种情况:
(1)一个单笔占有一部位置,如“乏”、“旧”的前部单笔、“艺”“引”的后部单笔,要按此规则处理,即不再成为二部结构,而一般作为连体结构来取码。
(2)一个单笔不占有一部位置,如“副”字的最前一个单笔一,要就近挂靠到“口”上;“修”字的中间一个单笔丨,要就近挂靠到前部。如果一个单笔介于两个部件之间,则一般往前挂靠,如“共”、“合”两字中间的一。
部件整取就是一个字里带有部件的,不以其笔画来取码,而以部件为整体来取码。如“素材”的“素”的尾码,不是丿_,而是“小”; “材”的首码不是一丨,而是“木”。就部件与笔画的关系而言,部件整取分两类:
1、一个部件本身就是一个复笔,如“十”,这时不在复笔一丨所在键U上取码,而应在部件“十”所在键I上取码。
2、一个部件超过一个复笔,有两种情况:
(1)一个复笔的两个单笔都在一个部件上,就整取这个部件。如“日”、“大”等部件,要作为一个整体来取码。
(2)一个复笔的前一单笔在一个部件上,而后一单笔与部件以外笔画相连接,也整取这个部件。如“可”的末笔不按习惯取一∠,而是取“口”。如果后一单笔与其它笔画不相连接,就按一笔相连的规则处理。如“但”是末笔不是取“日”,而是取一一。
在特定情况下,部件整取意味着要先取后舍。就是有些字的部件不是连续笔画,此时除了部件整取外,部件上的笔画一般不予重复,除非部件以外只有一个单笔。如“成”字,先取“戈”并以此为始笔,末笔则是其余部分的一个复笔丿∠,而不是“成”字原来的末笔丿_。而“戊”字,在整取了“戈”以后,其余部分只有一个单笔丿,此时就要按照就近挂靠的原则,从“戈”上借取一个单笔一,以构成一个复笔。
成字整算就是一个字里有成字,分部时要作为一个整体算作一部,这一点已在二部相断的规则里作了说明。归纳起来,确定成字整算的规则有两点意义:一是可将多重结构整合成二部结构,二是可将有成字连体字分析成二部结构。
部件整取与成字整算这两项规则,虽然都是把部件和成字看作为整体,但有着三个方面的不同:
(1)部件可以在一个字的任何位置,成字则只能在前部始笔或后部末笔所在的位置;
(2)部件整取的目的是考虑部件的整体性,成字整算的目的则是考虑分部的需要;
(3)部件可以向部件以外的部分借出笔画,成字由于自成一部则不能做到这一点。
本发明的单字输入,由首码、中码、尾码三码构成。二部结构单字的一般取码形式为:
前部始笔+后部始笔+后部末笔
如“经济”的“经”,首码为前部始笔∠∠(T),中码为后部始笔∠_(R),尾码为后部末笔丨一(H),即以TRH输入;“济”的首码为__(F),中码为_一(A),尾码为丿丨(C),即以FAC输入。
上面是二部结构的一般取码形式。还有少数二部结构的单字,因后部笔画不足,而采取了特殊取码形式:
1、后部只有三个单笔的,中码和尾码作单笔重合取码,即中码的后一单笔同时是尾码的前一单笔。如“材”的首码取“木”,中码取一∠,尾码则取∠丿,即JPE。
2、有些字后部虽然不止三个单笔,但由于部件整取的需要,剩下一个单笔,这时中码和尾码也作单笔重合取码。如“汰”的中码取“大”,尾码则取__;而“沃”的中码取丿一,尾码取“大”;“柏”的中码取丿丨,尾码取“日”。
3、后部只有两个单笔(即一个复笔或部件)的,又分两种情况:
(1)一个字的前部不止一个复笔(部件),那么这个字的中码不在后部取,而向前部借位取码,就是把前部末笔作为中码。如“利”的首码取丿一,中码依此形式取部件“木”,尾码取丨∠;“春”的首码取一一,中码则取丿_,尾码取部件“日”。
(2)一个字不仅后部只有一个复笔(部件),而且前部也只有一个复笔(部件),这时中码不再向前部借位取码,而是中码与尾码作复笔重合取码,即取相同的码。如“机”的首码取“木”,中码、尾码均取丿∠,即J MM;“尖”的首码取“小”,中码、尾码均取“大”,即SXX。
一部结构单字的取码形式为:始笔+次笔+末笔,次笔就是始笔之后的第二个复笔或部件。如“本”的始笔为一丨,次笔为部件“八”,末笔为丿一,即UDA;“来”的始笔为一\,次笔为丿一,末笔为部件“八”,即OZD。
另外,不管属于什么结构,单笔只有1-3个的汉字,本发明称之为简笔字。其取码形式是,先将每个单笔都作复笔处理,再按一部结构形式取码。如“才”以YTV输入,“亿”以VJT输入,“儿”以VTT输入,“乙”以TTT输入。
26个部件无论是成字还是部首,取码形式都是连按三次所在键后再加空格键。如“土”以OOO输入,“虫”以QQQ输入。“士”、“曰”这两个形似部件,则以一般形式输入,即YJY、LYY。其它无读音、非部件的部首则以简笔字或一般单字的取码形式输入。
本发明少数单字的重码,依据各字的一般使用频率,高的以非选择形式用空格键(代码0)直接输入,低的则以选择形式用数字键输入(代码1等)。如“仓”与“仑”  均为WTT,“仓”以WTT输入,“仑”则以WTT0输入。
与不少汉字输入方案一样,本发明也用简码形式来输入单字。事实上,本发明的单字输入,就相当于一般汉字输入法的三级简码,即三个字母键加一个空格键。
本发明的一级简码有26个,全部为特高频字,输入形式是一个字母键加一个空格键。如“这”的输入,先按A键,再加空格;“是”的输入,先按P键,再加空格。
本发明的二级简码有672个,基本为国标一级字,输入形式为两个字母键加一个空格键。如“周”以MO加空格输入,“年”以XU加空格输入,如图2
本发明以单字输入为基础,而以词汇输入为主体。这一点,正好与汉语文章中词汇占绝大部分的特点相吻合。本发明的词汇输入形式有以下几种:
二字词  依次取第一、二字的前部始笔和后部始笔。如“经济”以TRFA输入,“希望”以AI AY输入。
三字词  取第一字的前部始笔、后部始笔和第二、三字的前部始笔。如“国务院”以LYNW输入,“办公室”以EDDE输入。
四字词  依次取第一、二、三、四字的前部始笔。如“取长补短”以UZGX输入,“特此通知”以ZHRX输入。
多字词  依次取第一、二、三字和最后一字的前部始笔。如“中华人民共和国”以LCWL输入,“乌兹别克斯坦”以MDKO输入。
本发明的词汇除两万条通用语汇外,还有一千条常用成语一千条常用专业术语、一千条中外地名、一千条中外组织与人名。
本发明的词汇输入,绝大多数不用选择,有重码的则以处理单字重码的同样方式输入,频率高的用空格键输入,频率低的用数字键输入。与单字重码不同的是,词汇重码需要蜂鸣器提示。
本发明的二码实位率很高,仅有的OJ、NF、VG、EV4个空位,也用来作特定输入。所谓特定输入,就是以一个空位二码作引导,将中文数字等项在英文字母键上有规律、按顺序地排列,而特别规定的输入形式。
中文数字以OJ为引导键,它在字母键上的排列情况如下:Q    W    E    R    T    Y    U    I    O    P一   二   三   四   五   六   七   八   九   ○A    S    D    F    G    H    J    K    L十  二十 三十 四十 五十 六十 七十 八十 九十
Z    X    C    V    B    N    M
百   千   万  十万 百万 千万  亿
中文数字的输入形式是:先按OJ二键,然后按一个特定的字母键。如“六”以OJY输入,“千万”以OJN输入。
两个中文数字之间可以进行各种可能的组合。如果输入OJKI,将得到两项数字的组合“八十八”;输入OJRB,则为“四百万”;输入OJII,则为“八八”。
中文日期以EV为引导键,它的排列情况如下:Q        W        E        R       T        Y        U        I        O        P一日    二日     三日     四日     五日     六日     七日     八日     九日     十日十一日  十二日   十三日   十四日   十五日   十六日   十七日   十八日   十九日   二十日
  A        S        D        F        G        H        J        K        L
 一月     二月     三月    四月      五月     六月     七月     八月     九月二十一日 二十二日 二十三日 二十四日  二十五日 二十六日 二十七日 二十八日 二十九日
       Z        X        C        V         B        N        M
     星期一   星期三  星期五    星期日    十二月   十一月    十月
     星期二   星期四  星期六    星期天            三十一日  三十日
中文日期的输入形式是,先按EV二键,然后按特定的字母键。如“六日”以EVY输入,“星期一”以EVZ输入。
在这一特定输入形式下,一次可以组合一年中的任何一个日期。它的组合形式分同键组合与异键组合两个类型(加号前为上行日期,加号后为下行日期):
(1)同键组合又分两种情况:
①日+日(或星期+星期),得到的是下行日期:如EVWW为“十二日”,EVCC为“星期六”;
②月+日,则得到同一键上的×月×日:如EVAA为“一月二十一日”,EVKK为“八月十八日”。
(2)异键组合则分为三种情况:
①月+日,得到×月×日:如EVGD为“五月二十三日”,EVHP为“六月二十日”;
②日+月,同样得到×月×日:如EVED为“三月三日”,EVQM为“十月一日”;
③月+B,作为一种特殊情况,得到的并不是×月,而是×月下面的×日:如EVFB为“二十四日”,EVMB为“三十日”。
常用序号以NF为引导键,它的排列情况如下:Q     W   E    R    T    Y    U    I    O    P第一 第二 第三 第四 第五 第六 第七 第八 第九 第十1.   2.   3.   4.   5.   6.   7.   8.   9.   10.A    S    D    F    G    H    J    K    L(1)  (2)  (3)  (4)  (5)  (6)  (7)  (8)  (9)①   ②   ③   ④   ⑤   ⑥   ⑦   ⑧   ⑨
 Z    X    C    V    B    N    M
 I    III  V    VII  IX   XI   (10)
 II   IV   VI   VIII X    XII  ⑩
常用标点符号以VG为引导键,它的排列情况如下:Q    W   E     R     T     Y     U     I    O    P…       ☆      <     ~    <   《    【    丿   .    -……   ★      >     ≈    >    》    】   _   ∶   ——A     S   D     F     G     H      J    K    L=   △  ≤     ;    ‘          “   ?   (    [≠   ▲  ≥     :    ‘          “   !   )    ]Z     X   C     V     B     N      M+     ×      ℃         ’           %    #     ¥-     ÷     *      ″    ‰    №    $
常用序号和常用标点符号的输入形式一样,上行字符按一次,下行字符按两次。这两种特定输入均不作任何组合。

Claims (8)

1.一种二部拼形计算机中文输入键盘,其特征在于利用普通英文小键盘的26个字母键,分别赋予特定的复笔码和部件码,构成以复笔为基本单元、以部件为主体单元、复笔与部件相结合的键盘结构:
所谓复笔,即汉字有一丨丿_∠五种单笔,由两个单笔组成的复合笔画即为复笔,汉字的复笔理论上有5×5=25个,本键盘实际采用26个,其中丨_和丨∠合并为一个复笔(L键),而将丿一和丿∠依据它们是否与其它笔画相交叉,各分为两个复笔(Z、X键和N、M键);
所谓部件,是考虑汉字分布的均衡合理性和汉字取码的直观、整体性,而把26个汉字常用构件定义为部件。
二部拼形的复笔码、部件码与键位的对应关系为:
Figure 9411137100029
由上看出,26个复笔码按顺序、有规律地在英文小键盘上排列,部件码则一般依照各自的使用频率来排列,以体现计算机输入的工效原则。
2、一种二部拼形计算机中文输入法,其特征在于以汉字的笔画(复笔与部件)作为取码单元,而以汉字的结构(前部与后部)确定取码部位,构成了以单字输入为基础、以词汇输入为主体的中文输入体系:
汉字一般分为左右、上下、包围、连体四种基本结构,本发明将左右结构的左部、上下结构的上部、内起式包围结构的内部、外超式包围结构的外部称为前部,而将右部、下部、内起式的外部、外起式的内部称为后部,可分为前后二部的汉字结构统称为二部结构;连体结构的字根据有无成字来分类,成字是指一个字的前部始笔(全字第一个复笔或部件)或者后部末笔(全字最后一个复笔或部件)所在部分可以独立成字的笔划组合,有成字的连体字视为二部结构(成字为一部、其余为另一部),无成字的连体字视为一部结构;
按二部结构取码的基本形式是:
a、对于一般但单字:前部始笔+后部始笔+后部末尾,其中前部始笔为首码、后部始笔为中码、后部末尾为尾码,为三码输入;
b、对于一般词汇(二字词);依次取第一、二字的前部始笔与后部始笔,为四码输入。
3、按权利要求2所述的中文输入法,其特征在于对复笔、部件、成字的相互关系、使用层次与范围作了规定:
a、在确定取码单元时,有部件的要用部件,无部件的则用复笔;
b、在确定取码部位时,前部始笔或后部末笔能与其它笔画整合成字的,应按能大不小、能前不后的规则进行整合;
c、成字、部件与其它笔画之间,可以是断开、连接、插入的关系,但不能是交叉关系;
d、部件可以出现在一个字的任意位置上,成字则只能出现在一个字的前部始笔或后部末笔所在位置上;
e、非连体的二部结构单字,必须按照二部相断、一笔相连、部件整取、成字整算的规则来整合、分部、取码。
4、按权利要求2所述的中文输入法,其特征在于对某些分部后笔画不足的单字,规定了特殊的取码形式:
a、在一般取码形式下,二部结构单字的满足条件:前部至少要有一个复笔或部件,后部至少要有两个复笔或部件;
b、后部只有一个复笔(部件)和一个单笔的,中码和尾码作单笔重合取码:
c、后部只有一个复笔(部件)的,而前部不止一个复笔(部件),中码由后部向前部借位取码;
d、前后二部均只有一个复笔(部件)的,中码和尾码作复笔重合取码;
e、前部或后部只有一个单笔的,依照一笔相连的规则处理,即一般作为一部结构单字来取码。
5、按权利要求2所述中文输入法,其特征在于对二部结构以外的国标字规定了简易的取码形式:
a、一部结构单字的取码形式为:始笔+次笔+末笔,次笔就是始笔之后的第二个复笔或部件;
b、只有1-3个单笔的简笔字,取码形式是先将每个单笔都作复笔处理,再按一部结构单字取码;
c、26个部件无论是成字或部首,取码形式都是按三次所在字母键;
d、国标二级字中非成字、非部件的部首,以简笔字或一般单字的取码形式输入。
6、按权利要求2所述的中文输入法,其特征在于使用了最为多数的简码:
a、对26个特高频字规定了一级简码,即省去了这些字的中码、尾码;
b、对672个常用字规定了二级简码,即省去了这些字的尾码。
7、按权利要求2所述的中码输入法,其特征在于绝大多数词汇不需提示性选择:
a、二字词已如前述;
b、对三字词:依次取第一字的前部始笔、后部始笔和第二、三字的前部始笔;
c、对四字词:依次取第一、二、三、四字的前部始笔;
d、对多字词:依次取第一、二、三字和最后一字的前部始笔。
8、按权利要求2所述的中文输入法,其特征在于利用4个二码空位,来作中文数字(及其各种组合)、中文日期(及其各种组合)、常用序号、常用标点符号的特定输入。
CN94111371A 1994-06-29 1994-06-29 汉字拼形计算机中文输入法及其键盘 Expired - Fee Related CN1050680C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN94111371A CN1050680C (zh) 1994-06-29 1994-06-29 汉字拼形计算机中文输入法及其键盘

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN94111371A CN1050680C (zh) 1994-06-29 1994-06-29 汉字拼形计算机中文输入法及其键盘

Publications (2)

Publication Number Publication Date
CN1109184A true CN1109184A (zh) 1995-09-27
CN1050680C CN1050680C (zh) 2000-03-22

Family

ID=5035250

Family Applications (1)

Application Number Title Priority Date Filing Date
CN94111371A Expired - Fee Related CN1050680C (zh) 1994-06-29 1994-06-29 汉字拼形计算机中文输入法及其键盘

Country Status (1)

Country Link
CN (1) CN1050680C (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN85103321B (zh) * 1985-04-25 1988-09-28 崔巍 汉字非编码字根输入法
CN87100555A (zh) * 1987-02-01 1988-08-24 霍象新 双笔顺计算机汉字输入方案及其键盘

Also Published As

Publication number Publication date
CN1050680C (zh) 2000-03-22

Similar Documents

Publication Publication Date Title
CN1027558C (zh) 五笔二维计算机汉字输入方法及其键盘
CN1141633C (zh) 计算机二十四部首汉字排序输入法
CN1109184A (zh) 二部拼形计算机中文输入法
CN110673746A (zh) 能合理输入常用数字〇的二十六部首字根中文汉字输入法
CN1052200A (zh) 音形义字词兼容编码系列及键盘
CN1184554C (zh) 计算机汉字汉易码输入方法及键盘
CN105278697B (zh) 组合式双拼类主副码汉字、词语编码输入法及其键盘
CN1088211C (zh) 汉字正负单数部首数码输入法
CN1243302C (zh) 汉字辅元音形码输入法
CN100495298C (zh) 简化拼音编码汉字输入法及其键盘
CN1068203A (zh) 音形义字词兼容编码系统与键盘
CN1244671A (zh) 数符汉字编码输入法及键盘
CN1026829C (zh) 中文头尾码输入法及其键盘装置
CN1058342C (zh) 汉字编码的计算机输入方法
CN1420422A (zh) 码元用笔划集合数表示法及用途
CN1125393C (zh) 利用计算机键盘汉字编码输入方法
CN105204657B (zh) 组合式拼音类主副码汉字、词语编码输入法及其键盘
CN1055167C (zh) 汉字部首笔顺码的输入方法
CN1086235C (zh) 声形笔顺四角码计算机汉字输入法及键盘
CN1204487C (zh) 根声码汉字输入法
CN1142479C (zh) 五双结构化笔型汉字的通用数字键盘输入方法
CN1038888A (zh) 音形义兼容与汉拼字联词编码系列及键盘
CN1269007C (zh) 笔删式触控键盘中文音象全功能输入装置
CN1109285C (zh) 字声部件计算机汉字输入法
CN1514362A (zh) 汉字编程方法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee