术语解释:
1、部件(即汉字“部件”):由五种单笔画构字单元和由单笔画组成的具有组配汉字功能的构字单元(过去叫“字元”、“字根”);国家语言文字工作委员会《信息处理用GB13000.1字符集汉字部件规范》(以下简称《部件规范》,1998年5月1日起实施)共计560个部件,实施后统一称为“部件”。所有汉字由1个部件或两个部件或多个部件构成。一个汉字的部件有多达18个部件的。
2、规范部件码(以下简称“部件码”):是指本发明符合下述标准和规范:①信息处理用GB13000.1字符集汉字部件规范;②ISO10646C.J.K.国际标准;③GBK中国标准;④国家语委《汉字笔顺规范》;⑤中国标准GB/T18031-2000《信息技术和数字键盘汉字输入通用要求》等标准和规范。规范部件码是指符合上述标准和规范的汉字编码,即本发明创造。
3、汉字积木部件:记载于积木上的一个汉字部件,是提供儿童、小学生学习部件码的教学工具。寓部件于积木实物模型,使其直观特征、独立特征固定化,既方便识别,又避免嵌套拆字的随意性所带来的混乱。
4、非字部件:不能独立成字的部件。但《部件规范》没有分类。
5、成字部件:可以独立成字的部件。但《部件规范》没有分类。
6、起笔:汉字楷书第一笔(依据国家语委《汉字笔顺规范》,1997年4月7日施行)。
7、首形:专指非字部件的起笔特征和与非字部件的起笔构成的“叉形”特征和“框形”特征;非字部件的首形特征有:一(横笔)、丨(竖笔)、丿(撇笔)、丶(点笔)、
(折笔)、乂(叉形)、(框形)七种首形特征。
8、首形部件码:与非字部件首形特征对应的输入编码,即是非字部件的输入键位。
9、首声:专指成字部件的汉语拼音第一字母,也称首声字母。
10、首声部件码:与成字部件首声字母对应的输入编码,即是成字部件的输入键位。
目前,国内外的计算机汉字编码输入方法近千种,但能够覆盖ISO10646C.J.K.国际标准(1993年)和GBK中国标准(1998年)的20902个汉字,同时又符合国家语委《汉字部件规范》(1998年)、《汉字笔顺规范》(1997年)和GB/T18031-2000《信息技术和数字键盘汉字输入通用要求》(2000年)的汉字编码键盘输入方法,尚未见到。现有同类汉字键盘输入技术中有“郑码”(郑易里,中国专利申请号89108851.2,中国专利局《发明专利公报》,1990年第25号公开)。九年前国家尚未颁布《汉字部件规范》,郑码的字根(《汉字部件规范》统称部件)还有一部分不符合《汉字部件规范》和《汉字笔顺规范》。郑码上市推广应用已有九年,至今还不够普及,广大用户仍然需要一种易学好用的新的汉字键盘输入方法。
本发明的目的是:为国内外提供一种符合国际、国内标准和国家汉字规范的新的汉字键盘输入技术,并要求简单、易学、速度快;适合三年级小学生以上用户。适合小学生、中学生、职高生、大学生、干部、教师、科技人员、老年人、中年人都可使用;达到能够输入20000多单字和各种词组,从而把汉字键盘输入技术提高和普及到一个新的水平。本发明是通过以下的汉字键盘输入技术及其通用键盘设计实现的。
1、一种依据汉字《部件规范》,以首形、首声部件码为基础的计算机汉字积木规范部件码输入方法,使用经过重新定义的计算机通用键盘的汉字键盘输入技术,其特征在于它是由有机联系,相互依存而又相互促进的汉字单字输入法、词组输入法组成,所述单字输入法包括:
从《部件规范》的560个部件中,经系列研究,获得277个非字部件和232个成字部件,并将所述277个非字部件和232个成字部件定义为部件码的特征元集;将所述非字部件按其首形特征分别为:一笔、丨笔、丿笔、丶笔、
笔、乂形、形七种首形特征,并将这七种首形部件码按照所述通用键盘定义到计算机键盘的H、I、P、D、V、X、U七个字母键上;
将所述成字部件按其首声部件码编码输入,并按照所述通用键盘定义到与其首声字母相同的B、C、D、E、F、G、H、J、K、L、M、N、P、Q、R、S、T、W、X、Y、Z、21个英文字母键上,从而构成部件码的成字部件特征元集;
利用通用键盘上的相应非字部件的首形部件码字母键输入汉字的首形部件码;
利用通用键盘上的相应成字部件的首声部件码字母键输入汉字的首声部件码;
借助于所输入的汉字首形部件码和首声部件码输入汉字中的任何一个汉字;
2、根据权利要求1所述的汉字积木规范部件码输入方法及其通用键盘,其特征在于所述词组输入法中,二字词分别各取两字的头、尾部件码;三字词取第1字头、尾部件码,取第2字的头部件码,取第3字的尾部件码;四字词及四字以上的词取前三字的头部件码和末字的尾部件码。
3、根据权利要求1所述汉字积木规范部件码输入方法及其通用键盘,其特征在于所述的汉字部件码的非字部件特征元集所对应的首形部件码、部件码的成字部件特征元集所对应的首声部件码与计算机通用键盘26个字母键的确切对应关系,从而构成部件码的首形、首声特征元集键盘键位布局总表。
4、根据权利要求1所述的汉字积木规范部件码输入方法及其通用键盘,其特征在于所述汉字部件码的277个非字部件特征元集与其首形特征输入键位七个字母键的确切对应关系,从而构成部件码的非字部件首形特征元集键盘健位布局表所示如表:
部件码非字部件首形特征元集键位布局表
下面结合部件码首形、首声特征元集键盘键位布局总表对本发明实施例的主要技术内容进一步详细说明。
本发明的基本思路是:①借鉴儿童汉字积木,直观拼字,一个部件码就是一个汉字积木,会玩汉字积木就会用部件码直观拼字输入汉字单字和词组(词组的数量无限制);②借鉴英文用英文字母输入英文单词。例如,英文用W、A、T、E、R五个英文字母输入“WATER”(水)。以此类比,部件码用“木”、又”、“寸”三个部件的首声部件码“M”、“Y”、“C”输入汉字“树”字;会英文打字就会用部件码首形、首声特征元集键盘键位布局总表上的部件码特征元集键盘键位布局、输入20902个单字及其无限量的词组,并打出文件、报告和报刊文章。
本发明是通过以下的汉字键盘输入技术及其通用键盘设计实现的。计算机汉字积木规范部件码输入方法(简称“部件码”)由:①汉字单字输入法为基础;②汉语词组输入法为主体;③结合最高频用字和最常用字输入法;④成字部件初学入门提示输入法;⑤非字部件提示输入法,⑥成字部件无重码快速输入法所构成的相互有机联系、与相互依存而又相互促进的汉字键盘输入技术系统实现的。
所述非字部件和成字部件,因《部件规范》对非字部件和成字部件只有定义,没有分类;所述非字部件是本发明人经系列研究分类;从《部件规范》的560个部件中经研究获得277个自定义的非字部件,经与1988年国家语委和国家教委联合发布的“常用字表”以及国家语委和国家新闻出版署联合发布的“通用字表”进行验证,在上述两个“字表”中均没有发现上述自定义的任何一个非字部件;而两个“字表”覆盖了各种出版物2100多万用字的99.99%,说明本发明所定义的277个非字部件符合汉字使用实际。
所述成字部件都是由一个部件构成的汉字单字。成字部件是本发明人经系列研究分类;从《部件规范》的560个部件中经研究获得232个自定义的成字部件,经与上述“常用字表”和“通用字表”进行验证,有218个成字部件属于“常用字表”,同时又是小学《语文》课本的用字;有14个成字部件属于“通用字表”;说明这232个自定义的成字部件符合汉字使用实际,而且是小学文化程度以上的八亿人都认识的字,这也是本发明面向广大用户的基础。
所述单字输入法包括:从《部件规范》中获得的自定义的277个非字部件特征元集及其键盘键位布局和自定义的232个成字部件特征元集及其键盘键位布局与其汉字键盘输入技术系统实现的;
将所述自定义的277个非字部件按其起笔特征和由非字部件的起笔构成的“叉形”及,其“框形”特征,分别用首形部件码编码输入;所述非字部件的首形特征分别:一(横笔)、丨(竖笔)、丿(撇笔)、丶(点笔)、
(折笔)、乂(叉形)、(框形)七种首形特征,并将这七种首形特征元集所对应的部件码,按照所述部件码首形、首声特征元集键盘键位布局总表定义到计算机通用键盘的H、I、P、D、V、X、U、七个字母键位上,同时赋于非字部件输入键的键元名称,并分别定名为:H(横笔键)、I(竖笔键)、P(撇笔键)、D(点、捺键)、V(折笔键)、X(叉形键)、U(框形键),并赋于所述于七个字母键为非字部件的输入键元;
将所述自定义的232个成字部件按其首声部件码编码输入,并按所述说明书附图定义到与其首声字母相同的B、C、D、E、F、G、H、J、K、L、M、N、P、Q、R、S、T、W、X、Y、Z21个英文字母键位上;
所述部件码的编码输入,是利用计算机通用键盘相对应的非字部件的首形部件码字母键输入汉字的首形部件码;利用计算机通用键盘相对应的成字部件的首声部件码的首声字母键输入汉字的首声部件码;这样,就实现了ISO10646C.J.K.国际标准和GBK中国标准的20902汉字中的任何一个汉字单字的输入技术。目前国际国内标准只有20902个汉字,部件码将紧跟上述标准而不断升级。
本发明部件码的编码规则是:
①码长:汉字的单字取1-4码(即4个部件),不足4码的单字其部件全取并加一个空格;多于4码的单字,取头三码(即头三个部件)和尾码(即末尾-个部件)。
②取码顺序:依据《汉字笔顺规范》的汉字楷书笔顺取码;
③词组取码规则是:二字词分别各取两字的头、尾部件码;三字词取第一字的头、尾部件码,取第二字取头部件码,取第三字尾部件码;四字及四字以上的词组,取前三字的头部件码和最末字的尾部件码;词组的取码,若单字只有一个部件就只取一个部件。汉字的非字部件的编码输入,按七种首形部件码及部件码非字部件首形特征元集键位布局表上相应的H(横笔键)、I(竖笔键)、P(撇笔键)、D(点、捺键)、V(折笔键)、X(叉形键)、U(框形键)七个字母键位输入;
在所采用的277个非字部件中,有26个非字部件同时又是非字部首,故未按首形部件码输入,占非字部件的9.3%,这是为了统一简体字和繁体字输入的需要而设计的,这属于例外。在26个属于例外的非字部件中,有17个常用非字部首为:犭(犬)、讠(言)、(月)、(雨)、氵(水)、饣(食)、礻(示)、钅(金)、亻、彳(人)、(竹)、(八)、牛(牛)、
(西)、孑(子)、
(足)、衤(衣)分别以其挂靠的成字部件(即上列括号内的成字部首)的首声部件码输入;有9个部首:阝、卩(耳旁)、宀、冖(宝盖)、艹(草头)、(
)、(
)、扌(提手)、疒(病旁)分别以其部首的汉语名称的第一字的首声部件码输入,这是为了合乎部首的传统使用习惯。
所采用的226个成字部件均按其首声部件码输入,首声部件码与键盘字母键位相同,不须背记;但另有6个成字部件为:“日、日、凸、凹、山、虫”未按首声部件码输入,约占成字部件的2.6%;这6个成字部件中,“日、日”两个成字部件定义于“O字母键”(“太阳键”与“O”字母像形)输入;“凸、凹、山”三个成字部件定义于“U字母键”(“框形键”的与“U”字母像形)输入:“虫”一个成字部件,挂靠于
”的首声字母输入,“
字键”的“
”字是发明人定义的,读作“áo”,与“A”字母键同键。上述32个部件码特征元集虽属例外,但经在封锁技术内容下,由内部的小学生试用,达到了一天学会输入方法,第二天独立输入了短文件的全文。
所述单个非字部件的输入方法,首形部件码加字母键“000”提示输入。单个非字部件在2100万用字频度中未见出现,属于极其罕用。
所述单个成字部件(即只有一个部件的汉字单字)的输入方法。①初学入门,首声部件码(即首声字母)加字母键“VV”提示输入,以方便自学;②提高盲打:首声部件码(首声字母)加“一、二笔及末笔笔画”输入。
所述最常用单字输入及其键位布局:最常用的26个单字采用“键名键”连击四次输入,有22个字母键均按最常用单字的首声字母输入,但因U、I、V三个字母键,汉语拼音没有汉字,而“O”字母键的汉字又极少,只好采用像形联想的单字来填补空缺,故UIVO四个字母键的单字是按首形输入的,其22个白体字母键用单字的首声输入,四个黑体字母键用单字的首形输入,其键盘键位布局如下所示:
Q W E R T Y U I O P
前 为 二 任 体 用 同 情 时 批
A S D F G H J K L
安 事 大 发 革 和 就 科 来
Z X C V B N M
在 现 产 结 部 农 命
所述最常用高频字输入及其键位布局:最常用的26个高频单字采用一键输入(加空格),有22个字母键均按最常用高频单字的首声字母输入,但因U、I、V三个字母键,汉语拼音没有汉字,而“O”字母键的汉字又极少,只好采用像形联想的单字来填补空缺,故U、I、V、O四个字母键的单字是按首形输入,其22个白体字母键用单字的首声输入,四个黑体字母键用单字的首形输入,其键盘键位布局如下所示:
Q W E R T Y U I O P
起 我 而 人 提 有 国 性 口 平
A S D F G H J K L
爱 是 的 分 工 一 进 开 了
Z X C V B N M
中 学 长 经 不 年 民
上列52个最常用单字的输入,约占文件总共字数四分之一,采用上述简化输入方法,大大提高了输入速度。
所述本发明部件码的汉字单字输入法、词组输入法(含词语、词汇),分别示例,如下表:
部件码 成字部件(即只有一个部件的汉字单字)提示输入法 实例
部件码 成字部件(即只有一个部件的汉字单字)无重码输入法 实例
部件码 词组输入法 实例
二字词 | |
贡献 |
头、尾 |
头、尾 | | | |
部件提取 |
工、贝 |
南、犬 | | | |
部件码特征 |
成字 成字 |
成字 成字 | | | |
部件码特征 |
首声 首声 |
首声 首声 | | | |
部件码 |
G B |
N Q | | | |
输入键位 |
G B |
N Q | | | |
输入结果 |
贡献出现在 |
显示屏上 | | | |
二字词 | |
忠心 | | | | | |
部件提取 |
中、心 |
心 | | | |
部件码特征 |
成字成字 |
成字 | | | |
部件码特征 |
首声首声 |
首声 | | | |
部件码 |
Z X |
X | | | |
输入键位 |
Z X |
X | | | |
输入结果 |
忠心出现在 |
显示屏上 | | | |
三字词 | |
爱劳动 | | | | | |
部件提取 |
爫、又 |
艹 |
力 | | |
部件码特征 |
非字成字 |
同草 |
成字 | | |
部件码特征 |
首形首声 |
首声 |
首声 | | |
部件码 |
P Y |
C |
L | | |
输入键位 |
P Y |
C |
L | | |
输入结果 |
爱劳动出现在 |
显示屏上 | | | |
部件码 词组输入法 实例
三字词 | |
大西南 | | | | | |
部件提取 |
大 |
西 |
南 | | |
部件码特征 |
成字 |
成字 |
成字 | | |
部件码特征 |
首声 |
首声 |
首声 | | |
部件码 |
D |
X |
N | | |
输入键位 |
D |
X |
N | | |
输入结果 |
大西南出现在 |
显示屏上 | | | |
四字词 | |
高新科技 | | | | | |
部件提取 |
亠 |
立 |
禾 |
又 | |
部件码特征 |
非字 |
成字 |
成字 |
成字 | |
部件码特征 |
首形 |
首声 |
首声 |
首声 | |
部件码 |
D |
L |
H |
Y | |
输入键位 |
D |
L |
H |
Y | |
输入结果 |
高新科技 |
出现在显示屏上 | | |
四字以上字词 | |
西部大开发 | | | | | |
部件提取 |
西 |
立 |
大 |
… |
发 |
部件码特征 |
成字 |
成字 |
成字 | |
成字 |
部件码特征 |
首声 |
首声 |
首声 | |
首声 |
部件码 |
X |
L |
D | |
F |
输入键位 |
X |
L |
D | |
F |
输入结果 |
西部大开发 |
出现在显示屏上 | | | |
四字以上的词 | |
市党政机构改革动员大会(《重庆日报》 标题) |
部件提取 |
亠 |
|
一 |
…… |
厶 |
部件码特征 |
非字 |
非字 |
非字 | |
非字 |
|
部件码特征 |
首形 |
首形 |
横笔键 | |
折笔键 |
部件码 |
D |
I |
H | |
V |
输入键位 |
D |
I |
H | |
V |
输入结果 |
市党政机构 |
改革动员大 |
会 出现在 |
显示屏上 |
| |
本发明汉字积木规范部件码能够覆盖ISO10646C.J.K.国际标准(1993年)和GBK中国标准(1998年)中的20902个汉字,该标准是全世界目前最完善的汉字字符集,汉字最多,符号最全;本发明汉字编码的设计能够覆盖现有91200多个单字,对汉字单字和词语容纳不受限制。部件码将紧跟国际国内标准升级而不断升级。
本发明“汉字积木规范部件码”领先符合中国汉字《部件规范》(1998年)、《汉字笔顺规范》(1997年)和GB/T18031-2000国家标准(2000年)等标准和规范;向广大用户提供了一种人人易学好用的速度快的能够覆盖20902个汉字的键盘输入技术及其通用的汉字键盘输入软件;
特别是为党政、公安、金融、邮政、科技、教育、户政、商贸、地理信息、人口普查系统等单位对20902个汉字输入的迫切需要,以及大、中、小学学生的需要,提供了一个覆盖20902个字的汉字键盘输入的实用软件。
本发明还为简体字用户(国内)和繁体字用户(包括国内港、澳、台用户和日、韩、菲、新加坡以及世界各国用户)可自选繁体字输入或简体字输入;按繁体字输入即得繁体字文件,按简体字输入即得简体字文件;或者按繁体字、简体字混合文本输入即得繁、简两种字体混合的文件。本”发明专利申请书”就是按“部件码”所述实施例输入打印的。本发明部件码在中文信息处理技术领域,首次突破小学生能够输入20000多个汉字单字(其中约有15000个单字是小学生、大学生都不认识的单字、生僻字和罕见字)。小学生都容易掌握使用,也就达到了广大用户易学好用的目的。