CN101446863A

CN101446863A - 层次解析法汉字基本部件及其码元设置和编码输入法

Info

Publication number: CN101446863A
Application number: CNA200910000644XA
Authority: CN
Inventors: 郑远泾
Original assignee: Individual
Current assignee: Individual
Priority date: 2009-01-13
Filing date: 2009-01-13
Publication date: 2009-06-03

Abstract

层次解析法汉字基本部件及其码元设置和编码输入法”的特征：用“层次解析法”解析GB13000.1字符集的汉字，解析出8种基本笔画和431个基本部件；全部基本部件由顺序连续书写的两笔画或两笔画以上的或接或交或连或包、具有构字能力的笔画集合，“囗、匚、”除外；对全部基本部件命名；无名称的非成字基本部件用“描述法”、“借代法”、“归纳法”命名；基本部件名称的首字为其简称；简称的拼音首字母为基本部件的字母码元；根据字母码元——a～z 26个字母排列在手机、座机、机顶盒数字键的位置(数字)和在该键上排列的顺序数字，两个数字的组合为基本部件的数字码元；设置了8种基本笔画和431个基本部件的字母键盘和数字键盘的输入方法。

Description

层次解析法汉字基本部件及其码元设置和编码输入法

技术领域：本发明属中文信息处理技术领域

背景技术：

汉字基本部件在构建汉字中的作用

汉字编码能否体现汉字的本质特征、能否符合中国人对汉字的认知理念、能否应用于汉字识字教学、实现汉字输入与汉字识字教学相统一，与汉字部件、尤其是基本部件的选取、命名、码元设置是否具有科学性、规范性和实用性密切相关。

虽然，汉字编码输入已有30多年的历史了，但是，迄今为止还没有一种汉字编码实现上述目标。其重要的原因就是，没有一个科学性、规范性和实用性相统一的汉字基本部件集。

一.汉字基本部件在构建汉字中的作用

汉字是集形、音、义为一体的形音字，汉字的基本部件在构建的汉字中具有表音或表义的作用。

统计表明，在7000个现代汉语通用字中有5544个汉字是形音字，其字音是通过汉字的部件、尤其是基本部件表征的。

1.汉字基本部件的表音作用

①成字基本部件具有表音作用，是所构建的汉字的表音部件。如：

常用字基本部件“乙、刀、刁、及、韦、巴、龙”构建“忆、亿、叨、叼、圾、岌、极、级、伟、违、讳、围、把、吧、笆、疤、聋、拢、笼、眬……”等字时，起表音作用。

非常用字基本部件“丂、丩、

、厃、、隺、堇”构建“亏、叫、纠、赳、贯、危、栽、载、哉、裁、戴、鹤、谨、馑、瑾”等字时，起表声或表韵的表音作用。

生僻字基本部件“七(huà)、

(mào)、

(zǐ)、

(yī)、

(yì)”是“化、冒、姊、秭、笫、殷、颐”等字的表音部件。

②多音字成字基本部件，在构建不同的汉字时起不同的表音作用。如：

“隹”有“cuī、zhuī、wéi”三个字音：

在“锥、准、椎”字中，表征了“zhuī”的字音；

在“唯、维，惟”字中，表征了“wēi”的字音；

在“崔”字中，表征了“cuī”的字音。

2.汉字基本部件的表义作用

①非成字基本部件在所构建的汉字中绝大多数起表义作用，是表义部件。如：

“扌”构建“打、抖、搞、搓、拆、捣、擦、插、推、担、提……”等字时，表征了这些字具有与“手”有关的动作属性；

“艹”构建“草、菜、萝、葵、蒿、花、苇、茄、莲、茅、莓……”等字时，表征了这些字具有草本植物属性；

“钅”表征了它所构建的汉字的金属属性；

“氵”表征了它所构建的汉字与“水”有关的属性。

②有许多成字基本部件在所构建的汉字中也起表义作用。如：

成字基本部件“心、目、鬼、鱼、”构建“想、思、愁、眼、睡、眠、督、魄、魂、傀、魔、鳌、鳖、渔、鲜、鳔、鳄、鲫……”等字时，起表义作用。

非常用字基本部件“口(wéi)”在“团、园、囚、围、国、圈、囤”等字中起“围起来”的表义作用；

“癶(bǒ)”表征了“登”的一高一低步履形态；

“巛(chuān)”表征了“巡”的乘船或沿江而行之义；

“豸(zhì)”表征了“豹、豺、貂……”等字的动物类属性。

3.有些汉字基本部件在所构建的汉字中既是表音部件、又是表义部件。如：

如，“丩(jiū)”的字义是“相互纠结”，它在“纠”字中，既是表音部件，又是表义部件；“鱼”在“渔”字中，既是表音部件，又是表义部件。

综上所述，汉字基本部件的选取、命名、码元设置是否科学、规范、实用，是汉字基本部件在所构建的汉字中能否起表音作用或表义作用，是汉字编码能否体现汉字的形音义结构特征，是否符合中国人对汉字的认知理念的关键所在。

二.已有的汉字基本部件集的概况

迄今为止，没有检索到应用“层次解析法”对GB18030字符集的汉字解析出的基本部件集，没有检索到对基本部件命名、设置简称、设置字母码元、数字码元以及基本部件的输入方法的专利申请。

1.已检索到的汉字基本部件集的概况

①检索到《信息处理用GB13000.1字符集汉字部件规范》，该部件集具有650个基本部件。但是，其基本部件没有名称，没有设置简称，没有设置基本部件的码元和输入方法；

②检索到《汉字识字教学用汉字部件规范(讨论稿)》，该部件集有560个基本部件。其基本部件虽然有建议名称，但是，建议名称是采用“借代法”命名的，名称的奇异性大。而且，基本部件没有设置简称，没有设置基本部件的码元和输入方法；

③各种字典和词典具有200个部首。因其部首是用于检索汉字的，所以，有很多合体字部首，如“支、殳、皮、示、玉、肉、羽、卤、谷、角、龟、辛、青、香、首、髟、音、鬲、高、黄、麻、鹿、鼎、鼓、鼠、鼻……”等。但是，合体字不属于汉字基本部件之列。

④以“五笔字型”为代表应用汉字部件的汉字编码方案，一般具有100个～200个或称字根或称部件或称字元的汉字部件集。

2.已有的汉字基本部件集的特征

包括《信息处理用GB13000.1字符集汉字部件规范》、《汉字识字教学用汉字部件规范(讨论稿)》在内的已有的汉字基本部集有如下共同特征：

①采用汉字字源理据和汉字的结构理据解析汉字的基本部件：将汉字分为上下结构、上中下结构、左右结构、左中右结构、全包结构、半包结构、品字形结构、镶嵌结构等；

②采用汉字字源理据和汉字的结构理据解析汉字的基本部件十分复杂，而且对汉字的解析具有多样性。如：

“褒、裹、亵”等字，有的专家认为是镶嵌结构的汉字，包体是“衣”，“褒”是由“衣、保”构成；“裹”是由“衣、果”构成；“亵”是由“衣、执”构成。有的专家则认为这些字是上、中、下结构的汉字。“褒”是由“亠、保、

”三部分构成；“裹”是由“亠、果、

”三部分构成；“亵”是由“亠、执、

”三部分构成；

“噩”字，有的专家认为是“镶嵌结构”的汉字，有的专家则认为是“特殊结构”的汉字，二者都认为“噩”字应解析为“王口口口口”；

“夹”字，有的专家认为是“独体字”，有的专家则认为是“镶嵌结构”的汉字，“夹”字的包体是“夫”，“夹”字应解析为“夫丷”两个基本部件。

有的专家将“危”字解析成“、厂、(jié)”三个基本部件；有的专家则将“危”字解析成“厃(wéi)、(jié)”两个基本部件；

③采用汉字字源理据或汉字结构理据解析汉字的基本部件，使基本部件在构建的汉字中失去表音或表义作用。如：

认为“成、咸、或”是包体为“戈”的半包结构的汉字，则：“成”是“戈丿”三个基本部件的集合；“咸”是“戈丿一口”四个基本部件的集合；“或”是“戈口”三个基本部件的集合。据此：

“城、诚、盛、晟”分别是“土戈丿”、“讠戈丿”、“戈丿皿”、“日戈丿”四个基本部件的集合；

“减、碱、喊、感”分别是“冫戈丿一口”；“石戈丿一口”、“口戈丿一口”、“戈丿一口心”五个基本部件的集合；

“域、惑”分别是“土戈口”、“戈口心”四个基本部件的集合。

这种对汉字的强行拆分不仅违反了汉字的书写规范，也使“或、成、咸”在所构建的汉字中失去了表音或表义作用。不符合用户对“或、成、咸”所构建的汉字的认知理念，不利于汉字的识字教学。

④依据汉字字源理据和汉字结构理据对汉字进行构字拆分，严重地违背了《现代汉语通用字笔顺规范》。是构字拆分方法难以应用于汉字识字教学的重要原因之一。

3.已有的汉字基本部件集的命名特征

研究表明，已有的汉字基本部件集对汉字基本部件的命名采用的几乎都是“借代法”。即借用基本部件构建的某个汉字、再根据其在该汉字中的位置，命名为“×字旁”或“×字边”或“×字头”或“×字底”或“×字角”或“×字里”或“×字框”等等。这种命名方法有如下弊端：

①采用“借代法”命名，奇异性大。由于绝大多数的基本部件的构字量有若干个，无论借用它们构建的哪个汉字进行命名，对其构建的其他汉字都具有奇异性，需要用户强行记忆。如：

“爫”是“孚、妥、采、觅、受、舀、爱、奚、舜、爵……”等字的基本部件，检索到“爫”的名称有“采字头、受字头、爱字头、觅字头、孚字头”；

“

”是“卡、卢、卤、上、占、贞……”等字的基本部件，检索到“

”的名称有“上字头、占字头、贞字头”；

“”是“刍、尔、负、龟、角、免、欠、色、危、象、鱼……”等字的基本部件，检索到“”的名称有“危字头、角字头、鱼字头”；

“彐”是“刍、当、妇、归、彗、灵、扫、雪、寻……”等字的基本部件，检索到“彐”的名称有“寻字头、雪字底、横山”；

②采用“借代法”命名，使许多基本部件丧失表音或表义作用。如：

“丩(jiū)”是表音部件，若将“丩”命名为“收字旁”，则在“叫、纠、赳”字中丧失表音作用，在“纠”字中丧失表义作用。

“口(wéi)”，在“团、困、囚、围、国、圈……”等字中起“围”的表义作用。可是，笔者检索到“口”的名称有“国字框、方框”，这些名称都使“口”丧失了表义作用。

本发明的内容

本发明的创新性是对汉字实施“书写层次解析法”(简称“层次解析法”或“层次法”)解析汉字部件。“层次解析法”将汉字定义为：“汉字是按书写规范顺序书写的部件的集合”。

一.书写层次解析法概述

1.层次解析法：对汉字实施第一次两分后产生的非常用字、生僻字、非传统部件进行第二次、第三次拆分……，直至拆分出不可拆分的成字、非成字笔画组合(非成字部件)为止。

2.“层次解析法”对部件、合体部件、基本部件的定义：

部件：一切构成汉字的基本笔画、成字、非成字部件。

合体部件：由多个基本部件组合的部件。

基本部件：一般情况下，基本部件是顺序连续书写的两笔画或两笔画以上的或接或交或连或包、具有构字能力的笔画组合，这些笔画组是一个不能再拆分成其它笔画组合的独立的笔画组合。

二.“层次解析法”解析汉字的方法

1.层次解析法解析汉字的理据：《现代汉语通用字笔顺规范》是“层次解析法”解析汉字的理据。

2.层次解析法解析汉字基本部件的方法：遵循《现代汉语通用字笔顺规范》，将汉字分层解析成由顺序连续书写的、不能再解析成其它笔画组合的基本部件。如：

层次解析法解析汉字基本部件的实例

3.本发明应用“层次解析法”，将GB13000.1全部汉字解析成基本部件的集合，解析出8种基本笔画和431个汉字基本部件。

三.层次解析法解析汉字的基本部件的特征

“层次解析法”解析汉字的基本部件的特征是：“是顺序连续书写的笔画集合”、“基本部件之间具有层次界线”和“具有构字能力”。

1.基本部件是顺序连续书写的笔画集合。如：

“山”的书写笔画是“丨

丨”，笔画书写的动态形态是“丨

山”；

“女”的书写笔画是“く丿一”，笔画书写的动态形态是“

女”；

“我”的书写笔画是“丿一亅丿丶”，笔画的书写动态形态是“丿

我”；

“氵”的书写笔画是“丶丶

”，笔画的书写动态形态是“丶

氵”；

“心”的书写笔画是“、乚丶丶”笔画的书写动态形态是“丶

心”；

“厂”的书写笔画是“一丿”；笔画动态形态是“一厂”；

“白”的书写笔画是“丿丨一一”，笔画的书写动态形态是“丿

白”；

“小”的书写笔画是“亅丿丶”；笔画的书写动态形态是“亅

小”；

“咸”的书写笔画是“一丿一丨

一

丿丶”；笔画的书写动态形态是“一厂

咸”。

汉字基本部件“山、女、我、氵、心、厂、白、小、咸”是顺序连续书写的笔画集合，笔画之间有或交或连或接或包的关系。

2.基本部件之间具有层次界线。如：

汉字字源理据和汉字的结构理据解析“我”字的基本部件是“丿扌戈”。

本发明依据“层次解析法”认为“我”字是由顺序连续书写“丿一亅

丿丶”7个基本笔画的集合，“我”字是不能解析成其它笔画组合的基本部件。即“我”字在“鹅、娥、峨、俄、蛾、饿”等字中是基本部件。而“丿扌戈”既不是顺序连续书写的笔画集合，又没有明显的层次界线，因此“丿扌戈”不是“我”字的基本部件。

汉字字源理据和汉字的结构理据认为“幽”是镶嵌结构的汉字，“幽”字的基本部件是“山幺幺”。

本发明依据“层次解析法”认为“幽”字是顺序连续书写“丨幺幺凵”4个部件的集合。而“山”不是顺序连续书写的笔画集合，且“山”在“幽”字中没有层次界线，因此“山”不是“幽”字的基本部件。

3.基本部件具有构字能力。如：

“我”是“鹅、娥、峨、俄、蛾、饿”等字的基本部件；

“山”是“岸、崔、峰、汕、灿、岔、岱、岛”等字的基本部件；

“女”是“好、如、妈、姐、安、委、姜、婪”等字的基本部件；

“氵”是“江、河、沥、浪、满、波、流、漫”等字的基本部件；

“咸”是“碱、减、感、喊”等字的基本部件。

四.层次解析法的科学性、规范性和实用性

1.“层次解析法”严格遵循《现代汉语通用字笔顺规范》，使汉字的解析过程与汉字的书写过程完全一致，即汉字的解析过程就是汉字的书写过程。实现了汉字解析(拆分)与汉字书写的一致性，是唯一有利于汉字的书写教学的方法。

2.“层次解析法”强调汉字的基本部件必须是由顺序连续书写的笔画组合，保证了汉字基本部件的完整性，从而保证了汉字基本部件在所构建的汉字中的表音或表义作用。如：

“成、戎、戒、咸、威、戚、或”是顺序连续书写的笔画集合，是不能再解析的基本部件。因此：

基本部件“成”在构建的“城、诚、盛、晟”等字中的表音作用得到充分体现；

基本部件“咸”在构建的“减、碱、喊、感”等字中的表音作用得到充分体现；

基本部件“或”有“”两个字音，“或(

)”字是表示“不能肯定”之义。“或()”字是表示“邦国、地域”之义。因此，基本部件“或”在构建的“域、惑”两字中，既体现了它的表音作用，又起到它的表义作用。

3.“层次解析法”避免了产生庞大的汉字基本部件集

汉字字源理据或汉字结构理据解析7000个现代汉语通用字，基本部件有560多个，解析GB13000.1字符集，基本部件有650多个。

“层次解析法”解析GB13000.1字符集的汉字，只有8种基本笔画和431个基本部件。

五.层次解析法的基本部件集

本发明的汉字基本部件集包括8种基本笔画和431个基本部件，基本部件可分为成字基本部件和非成字基本部件两大类。

(一)基本笔画部件

《信息处理用GB13000.1字符集汉字部件规范》把基本笔画分为“横、竖、撇、点、折”5种基本笔画。

本发明对5个基本笔画进行了细分：

“竖(丨亅)”分为“竖(丨)和“钩(亅)”；

“点(丶乀)”分为“点(丶)”和“捺(乀)”；

“折”分为“折(乛くㄥ

)”和“复折(乚ㄅ…)”。(见下表)

(二)成字基本部件

本发明的成字基本部件有307个。成字基本部件分为：

①常用字基本部件

1998年国家语言文字工作委员会和国家教育委员会颁布的《现代汉语常用字表》中的2500个常用字和1000个次常用字中的成字部件为常用字基本部件，共243个。

如“人、大、小、目、口、手、册、成、咸、走、足……”等；

②非常用字基本部件

在3500个常用字和次常用字与GBK(20902个汉字)之间的成字部件为非常用字基本部件，共54个。

如，“勹(bāo)、(jié)、丩(jiū)、丂(kǎo)、巜、癶……”等；

③生僻字基本部件

在GBK(20902个汉字)之外的成字部件为生僻字基本部件，共10个。

如“七(huà)、ヰ、

(mào)、(zǐ)、

(yǐ)、

(yī)、

(yì)……”等。

④合体字基本部件

如“风、象、黑、鼠、鼻”等虽然是合体字，但它们在构建的汉字中是表音或表义部件，同时，它们也是传统的部首。因此，本发明将它们列入基本部件之列。

(三)非成字基本部件

本发明的非成字基本部件有124个。非成字基本部件分为：

①传统非成字基本部件

具有传统俗成名称的非成字部件称为传统部件。

如“艹、宀、亻、扌、氵、冫、辶、廴、……”。

②无名称的非成字基本部件

不具有传统俗成名称的非成字部件称为无名称的非成字基本部件。

如“亠、ナ、、

、メ、、、

、

、

、

、、爫、

、

、

、

、

……”。

六.基本部件的名称、简称及码元设置

(一)基本部件的命名方法

本发明对汉字基本部件的命名、简称及码元设置的原则是：尊重传统，注重科学性、规范性和实用性相统一

本发明对54个非常用字、10个生僻字和82个无名称的非成字基本部件进行了命名，对基本部件设置了简称，建立了“基本部件名称→基本部件简称→汉字码元”的有机联系。

1.基本笔画部件的名称和简称

“—(ˊ)(横)、丨(竖)、亅(钩)、丿(撇)、丶(点)、乀(捺)、乛

く└ㄥレフ

(折)、乚ㄋㄅ(复折)”8种基本笔画的名称和简称分别为：“横、竖、勾、撇、点、捺、折、复”。

2.成字基本部件的名称和简称

成字基本部件的名称和简称就是该字。

如，“几、口、目、马、又、女、鸟、手、身、我……”的名称和简称都是“几、口、又、目、马、女、鸟、手、身、我”。

非常用字基本部件和生僻字基本部件在标明读音的同时，并用“借代法”助记。如：

“勹(bāo)”用“包字头”助记；“丩(jiū)”用“纠字右”助记；

“丂(bǎo)”用“亏字底”助记；“口(wéi)”用“围字框”助记。

生僻字基本部件：

“七(huà)”用“化字右”助记；“

(mào)”用“冒字头”助记；

“

(yì)”用“颐字左”助记；“

(zǐ)”用“姊字右”助记；

“

(yī)”用“殷字左”助记；“

(bì)”用“敝字左”助记。

3.传统非成字基本部件的名称和简称

一般情况下，具有传统名称的非成字基本部件就用传统名称，名称第一个汉字为其简称。

如：“艹”名称为“草字头”，简称为“草”；“”名称为“足字旁”，简称为“足”。

对以下10个传统非成字基本部件，取其名称第二个汉字为其简称：

“亻”传统名称为“单人旁”，取“人”为其简称；

“彳”传统名称为“双人旁”，取“人”为其简称；(注：“彳(chì)”还是成字部件)

“阝”传统名称为“双耳刀”，取“耳”为其简称；

“卩”传统名称为“单耳刀”，取“耳”为其简称；

“忄”传统名称为“竖心旁”，取“心”为其简称；

“”传统名称为“竖心底”，取“心”为其简称；

“攵”传统名称为“反文儿”，取“文”为其简称；

“夂攵”传统名称为“折文儿”，取“文”为其简称；

“犭”传统名称为“反犬旁”，取“犬”为其简称。

4.无名称的非成字基本部件名称和简称

本发明对无名称的非成字基本部件采用“描述法”、“借代法”和“归纳法”命名，名称的第一个汉字为其简称。

①采用“书写描述法”(简称“描述法”)命名

采用“描述法”对无名称的非成字基本部件命名，是本发明的创新。

采用“描述法”对两笔画、三笔画、四笔画的无名称的非成字基本部件命名。即按顺序书写基本部件的笔画名称及其在构建的汉字中的相对位置或作用或笔画间的相互关系进行命名。如：“

”顺序书写的基本笔画是“一丿”，“

”在“不、石、页、夏”的头部，因此“

”命名为“横撇头”，简称“横”。

本发明采用“描述法”对48个无名称的非成字基本部件命名，如下表所示：

非成字基本部件的名称、简称、字母码元和数字码元及其编码输入法表

注：由于“彐”在不同的汉字中所处位置不同，如，在“寻、灵、帚”字中处于“头”部，在“当、雪”字中处于“底”部，在“归、妇、扫”字中处于“右”部。所以，用“*”代替“彐”所处位置，用户可把“彐”命名为“折横横头”或“折横横底”或“折横横右”。

在各种字典中，“爫”归为“爪”部、“”归为“刀”部，为了区别其字形特征，本发明在保留其归类的基础上，也进行了命名：

“爫”命名为“撇点爪”； “”，命名为“撇折刀”。

从上表中可以看出，采用“书写描述法”对这些无名称的非成字基本部件命名，实质上是按其首笔画，将它们分成“横、竖、撇、点、折”五类，因此，用户很容易记住这些基本部件的名称及其码元。

②采用“借代法”命名

统计表明，五笔画以上的无名称的非成字基本部件的构字量一般只有一个。采用“借代法”命名不会产生奇异性。

“

”只是“弟、第、苐”三个字的字底，这三个字的声韵与“弟”相同，因此用“弟字底”对“

”命名，不会产生奇异性。

“

”是“拣、炼、练”字的基本部件，“拣、炼、练”是繁体字“揀、炼、練”的简体字，“柬(jiǎn)”在“揀、煉、練”中起表音作用。“

”是由“柬(jiǎn)”字简化而来。本发明注重字源理据，将“

”命名为“拣字旁”。

本发明用“借代法”对34个无名称的非成字基本部件命名，列于下表：

③采用“归纳法”命名

有些传统基本部件也没有公认的传统名称，需要重新命名。本发明把笔画略有变形，但笔画数相同，表音或表义作用相同的基本部件归为同类基本部件，共有13个。如：“、”与“羊”字的笔画略有变形，但表音、表义作用相同，且笔画数相同，因此，将“、”归为“羊”部。

“炙”的字义是“烤肉”，“

”在“炙”字中表“肉”。显然，“

”与“月”在所构建的汉字中，均起“肉”的作用，因此将“

”归为“月”部。

归纳法命名的基本部件及其简称、字母码元和数字码元及其编码输入法表

七.基本部件的字母码元和数字码元

本发明用基本部件简称的汉语拼音的第一个字母为基本部件的字母码元。

(一)基本笔画部件的字母码元

本发明的8种基本笔画部件：—(

)(横)、丨(竖)、亅(钩)、丿(撇)、丶(点)、乀(捺)、乛

く

ㄥレフ

(折)、乚ㄋㄅ(复折)的简称分别为：“横(héng)、竖(shù)、勾(gōu)、撇(piě)、点(diǎn)、捺(nà)、折(zhé)、复(fù)”，其字母码元分别是“h、s、g、p、d、n、z、f”。

(二)成字基本部件的字母码元

①成字基本部件的字母码元就是该字的汉语拼音的第一个字母。如：

“几(jǐ)、马(mǎ)、尸(shī)、平(ping)、我(wǒ)、豸(zhì)、

(yì)”汉语拼音的第一个字母分别是“j、m、s、p、w、z、y”。因此，“几、马、尸、平、我、豸、

”的字母码元分别是“j、m、s、p、w、z、y”。

②成字基本部件是多音字，其拼音的第一个字母不同，则多音字有多个字母码元。如：

“隹”有“zhuī/wéi/cuī”三个音，则“隹”有“z、w、c”三个码元。

″合(hé/gě)″有“h、g”两个字母码元； ″谷(gǔ/yù)″有“g、y”两个字母码元；

″句(jù/gōu)″有“j、g”两个字母码元； ″曾(céng/zēng)″有“c、z”两个字母码元。

(三)非成字基本部件的字母码元

非成字基本部件的字母码元是其简称的汉语拼音的第一个字母。如：“艹(草字头)、

、(横折横)、

(拣字旁)”的简称分别为“草(cǎo)、横(héng)、拣(jiǎn)”，则“草、横、拣”的汉语拼音第一个字母分别为“c、h、j”，因此，“艹、

、

”的字母码元分别为“c、h、j”。

(四)基本部件的数字码元

本发明根据基本部件的字母码元——a～z26个字母排列在手机、座机、机顶盒数字键的位置(数字)以及在该数字键上排列的顺序数字，两个数字的组合为基本部件的数字码元。

如：“a b c”排列在手机、座机、机顶盒的数字键“2”上，“a”排在第一位，“b”排在第二位，“c”排在第三位，因此“a”的数字码元为“21”；“b”的数字码元为“22”；“c”的数字码元为“23”。

同理，“w、x、y、z”的数字码元分别为“91、92、93、94”。

据此，a～z26个字母码元与数字码元的相互转换关系是：

a＝21；b＝22；c＝23；d＝31；e＝32；f＝33；g＝41；h＝42；i＝43；j＝51；k＝52；l＝53；m＝61；n＝62；o＝63；p＝71；q＝72；r＝73；s＝74；t＝81；u＝82；v＝83；w＝91；x＝92；y＝93；z＝94。

八.基本部件的字母键盘和数字键盘的输入方法

本发明基本部件集的8种基本笔画和431个基本部件，设置了计算机的字母键盘输入和手机、座机、机顶盒的数字键盘输入方法。

(一)基本笔画部件的字母键盘和数字键盘输入方法

顺序输入基本笔画的字母码元和两个“a”或两个“e”(可任选)，即完成基本笔画的计算机字母键盘输入。如，“一

(横)”的字母码元为“h”，顺序键入“h a a”或“h e e”即完成“一

(横)”的字母键盘输入。

顺序输入基本笔画的数字码元和两个“a”或两个“e”的数字码元，即完成基本笔画的数字键盘输入。如，“h”的数字码元为“42”；“a”的数字码元为“21”；“e”的数字码元为“32”，顺序键入“422121”或“423232”，即完成“一

(横)”的数字键盘输入。

(二)成字基本部件的字母键盘和数字键盘输人方法

顺序输入成字的第一个基本部件、最后一个基本部件和该成字的字母码元或数字码元，即完成成字基本部件的字母键盘输入或数字键盘输入。如果，用“层次解析法”拆分不出成字的基本部件，就顺序输入该成字的第一个基本笔画、最后一个基本笔画和该成字的字母码元或数字码元，即完成成字基本部件的字母键盘输入或数字键盘输入。如：

“国(guó)”是由“口(wéi)”和“玉(yù)”构成，“口(wéi)”的字母码元是“w”，“玉(yù)”的字母码元是“y”，“国”的字母码元是“g”，顺序键入“w y g”即完成“国”字的字母键盘的输入。顺序键入“w y g”的数字码元“919341”即完成“国”字的数字键盘的输入。

“我(wǒ)”的第一笔“丿(撇)”的字母码元是“p”；最后一笔“丶(点)”的字母码元是“d”，“我”字的字母码元是“w”，顺序键入“p d w”三个字母码元，即完成“我”字的字母键盘的输入。顺序键入“p d w”的数字码元“713191”即完成“我”字的数字键盘的输入。

(三)非成字基本部件的字母键盘和数字键盘输入方法

顺序输入非成字基本部件名称的前三个字的字母码元或数字码元，即完成非成字基本部件的字母键盘或数字键盘的输入。如：

“亠”的名称为“点(diǎn)横(héng)头(tóu)”，“点横头”的字母码元是“d h t”，顺序键入“d h t”，即完成“亠”的字母键盘输入；顺序键入“d h t”的数字码元“314281”，即完成“亠”的数字键盘输入。

“纟”的名称为“乱(luàn)绞(jiǎo)丝(sī)”，“乱绞丝”的字母码元是“l j s”，顺序键入“l j s”，即完成“纟”的字母键盘输入；顺序键入“l j s”的数字码元“535174”，即完成“纟”的数字键盘输入。

九.本发明的贡献

汉字是中华民族传统文化的精髓和瑰宝。汉字是集形、音、义一体的形音字，字形是汉字的主体信息。人们根据汉字的字形识别汉字、掌握汉字的字义信息，所以，学习汉字主要是识别和掌握汉字的字形。然而，严酷的现实是，至今还没有一种汉字编码输入方法应用于汉字识字教学，广大中小学生仍然使用音码输入汉字。统计表明，当前，有95％以上的用户在使用“音码”，尤其是使用“微软拼音、搜狐拼音”等泊来品的用户越来越多。现在有63％的青年用户患了提笔忘字的所谓“电脑失写症”。令人担忧的是，人们长期使用“音码”，将会逐步地淡化汉字的字形，逐步地忘记汉字的书写。必将导致全民族识别、应用汉字水平的整体退化，对汉字文化的传承和弘扬造成极大的危害，这绝不是危言耸听。

本发明在中文信息处理和汉字识字教学的创新性贡献在于：

1.本发明的“层次解析法”遵循《现代汉语通用字笔顺规范》，对汉字进行解析(拆分)，实现了汉字拆分与汉字书写的一致性，适用于汉字识字教学；

2.本发明的“层次解析法”解析汉字的方法简捷，而且减少了汉字基本部件的数量；

3.本发明的“层次解析法”解析汉字基本部件，使汉字的基本部件在所构建的汉字中充分体现表音或表义作用；

4.本发明采用“描述法”对48个四笔画和四笔画以下的无名称的非成字基本部件命名，使无名称的非成字基本部件的名称与该部件的书写笔顺相一致，符合汉字识字教学，而且方法简捷，易为广大普通用户掌握；

5.本发明采用“借代法”对34个五笔画和五笔画以上的无名称非成字基本部件命名。统计表明，五笔画以上的无名称的非成字基本部件的构字量一般只有一个，所以，采用“借代法”命名不会产生奇异性；

6.本发明对54个非常用字和10个生僻字基本部件，在标明读音的同时，并用“借代法”助记；

7.本发明对13个没有公认名称的传统部件用“归纳法”命名：

8.本发明对基本部件设置简称：成字基本部件的简称就是该字；非成字基本部件的名称的第一个汉字为非成字基本部件的简称；8种基本笔画部件的种类名称就是其名称和简称，其中“复折”的简称为“复”；

9.本发明用基本部件的简称的汉语拼音的第一个字母为基本部件的字母码元；

10.本发明根据基本部件的字母码元——a～z26个字母排列在手机、座机、机顶盒数字键的位置(数字)及在该数字键上排列的顺序数字，两个数字的组合为基本部件的数字码元；

11.本发明建立了字母码元和数字码元之间的有机联系，实现了汉字基本部件的字母码元和数字码元输入的一体化；

12.本发明设置了汉字基本部件的字母键盘和数字键盘输入方法，解决了汉字识字教学用基本部件输入的难题，解决了汉字电化识字教学中汉字基本部件不能适时输入的难题。

Claims

1.层次解析法汉字基本部件及其码元设置和编码输入法的创新性特征在于：

1.建立了汉字部件的解析方法与汉字书写的一致性应用“书写层次解析法”(简称为“层次解析法”)解析GB18030字符集的汉字，解析出汉字的8种基本笔画和431个基本部件：

1)8种基本笔画是：

2)431个基本部件是：

3)基本笔画部件分为“横、竖、勾、撇、点、捺、折、复折”8种；

4)307个成字基本部件是按顺序连续书写而成的或交或连或接或包、具有构字能力的成字；

5)124个非成字基本部件是按顺序连续书写的两笔画或两笔画以上的、具有构字能力的非成字的笔画组合；

6)部分具有表义功能的合体字为成字基本部件；

2.根据本发明权利要求1所述的8种基本笔画和431个基本部件，设置了名称和简称，其命名方法的特征是：

1)8种基本笔画部件的种类名称就是其名称和简称，其中“复折”的简称为“复”；

2)成字部件的名称和简称就是该字；

3)具有传统俗成名称的非成字部件，以传统俗成的名称为其名称，名称的第一个字为其简称；

4)采用“描述法”对48个四笔画和四笔画以下的无名称的非成字基本部件命名，即顺序书写基本部件的笔画名称组合及该基本部件在其所构建的汉字中的相对位置或作用或笔画间的相互关系进行命名，名称的第一个汉字为其简称；

5)采用“借代法”对34个五笔画和五笔画以上的无名称的非成字基本部件命名，即借用基本部件构建的某个汉字、再根据其在该汉字中的相对位置，命名为“×字左”或“×字右”或“×字头”或“×字底”或“×字角”或“×字里”等，名称的第一个汉字为其简称；统计表明，五笔画以上的无名称的非成字基本部件的构字量一般只有一个，采用“借代法”命名不会产生奇异性；

6)非常用字和生僻字基本部件的名称和简称就是该字，再采用“借代法”助记，即根据非常用字和生僻字基本部件的读音，在其构建的汉字中选取一个读音相同或相近的字，以及其在该汉字中的位置命名为“×字旁”或“×字头”或“×字角”或“×字底”或“×字左”或“×字右”；

3.根据本发明权利要求1所述的8种基本笔画和431个基本部件，设置了计算机键盘的字母码元和手机、座机、机顶盒的数字键盘的数字码元，设置字母码元和数字码元的方法和特征是：

1)基本部件的字母码元：

①基本笔画部件的字母码元：基本笔画名称首字的汉语拼音的第一个字母；

②成字基本部件的字母码元：成字的汉语拼音的第一个字母；

③多音字基本部件的字母码元：多音字的汉语拼音的第一个字母不同，则根据不同的首字母设置多个字母码元；

④非成字基本部件的字母码元：其简称的汉语拼音的第一个字母；

2)基本部件的数字码元：

根据基本部件的字母码元——a～z26个字母排列在手机、座机、机顶盒数字键上的位置(数字)以及在该数字键上排列的顺序数字，两个数字的组合为基本部件的数字码元，

a～z26个字母码元与数字码元的相互转换关系是：

a＝21；b＝22；c＝23；d＝31；e＝32；f＝33；g＝41；h＝42；i＝43；j＝51；k＝52；l＝53；m＝61；n＝62；o＝63；p＝71；q＝72；r＝73；s＝74；t＝81；u＝82；v＝83；w＝91；x＝92；y＝93；z＝94；

4.根据本发明权利要求1所述的8种基本笔画和431个基本部件，设置了计算机字母键盘输入和手机、座机、机顶盒的数字键盅输入，输入方法和特征是：

1)顺序输入基本笔画的字母码元和两个“a”或两个“e”(可任选)，即完成基本笔画的计算机字母键盘输入；顺序输入基本笔画的数字码元和两个“a”或两个“e”的数字码元，来实现基本笔画的数字键盘输入；

2)顺序输入成字的第一个基本部件、最后一个基本部件和该成字的字母码元或数字码元，来实现成字基本部件的字母键盘输入或数字键盘输入；

3)顺序输入非成字基本部件名称前三个字的字母码元或数字码元，来实现非成字基本部件的字母键盘或数字键盘的输入。