CN100533359C

CN100533359C - 甲骨文拼音与部件拆分输入法

Info

Publication number: CN100533359C
Application number: CNB2008100492180A
Authority: CN
Inventors: 杨亦鸣; 顾绍通; 马小虎
Original assignee: Xuzhou Normal University
Current assignee: Xuzhou Normal University
Priority date: 2008-01-31
Filing date: 2008-01-31
Publication date: 2009-08-26
Anticipated expiration: 2028-01-31
Also published as: CN101231558A

Abstract

本发明公开了一种用于电子计算机甲骨文字输入的甲骨文拼音与部件拆分输入法，该输入法包括拼音组字和拼形组字，拼音组字采用全拼式拼音输入法，拼形组字是将甲骨文字归纳出569个部件，将得到的部件与键盘上的26个英文字母建立映射关系以便进行拆分取码，形成拼形组字的甲骨文字输入编码。拼音简捷方便；拆分直观，规则简单。甲骨文部件与键盘字母之间存在很强的相似性，关联性强，大大减轻了记忆负担。码符集为26个英文字母，设计了一级简码、二级简码、三级简码、四级简码，平均码长短接近3。规范完整的TrueType格式甲骨文字库的支撑平台，实用性强。显示与打印输出非常方便，实现了所见即所得。

Description

甲骨文拼音与部件拆分输入法

技术领域

本发明涉及一种用于电子计算机的甲骨文字输入法。

背景技术

目前已经出现的甲骨文输入法方案有以下三种：

(1)“古文字三级字符全拼检索法”(刘志基，《辞书研究》2002年第1期)。

该编码方案将甲骨文部件分为基本字符、物象字符、几何图形字符。基本字符相当于传统的偏旁、部首；物象字符是描摹事物形象类别的构字成分，字形中有取象于鸟的成分，则拆分出的物象字符编码为“niaoxing”；基本字符和物象字符之外的构字成分作为几何图形字符，字形中有圆形构字成分，则拆分出的几何图形字符编码为“yuan”。此种编码方法思路可嘉，但是对每一部件都要判断所属字符类别，规则繁多，很不简便，编码过长，如有的字形编码为“zhenglirenshang”，使用起来很不方便。

(2)“之乎者也”一一对应数象甲骨文金文输入法(专利申请号：200310114032.6)。

该编码方案以字形任意笔画形成的交点、接点、折点、重合点及封闭空间为单位，归纳为“之乎者也唯其同兮由于”十个字象系列。按次序对应在通用键盘及数字键盘上，以等同的字象数序编码。该编码方案需要对甲骨文字形进行仔细分析，区分甲骨文字形的结构，甲骨文字形在微观上笔画无法区分这一局限，使得该方案可操作性不强。该方案规则也很多，记忆负担也是很大的。该方案没有甲骨文字库平台的支撑，其性能不得而知。

(3)甲骨文电脑输入法(专利申请号：200510004998.3)。

该编码方案将甲骨文字形分析为三类结构：封闭曲线结构、交叉线段结构、飘离曲线或点结构。根据结构的不同分为眼码、睫码、叶码、枝码、飘码、结构码。对字形进行结构分析后顺序写出上述六码就得出甲骨文字形的编码序列。比如“

”的编码为001201。此种编码方案编码时需要对甲骨文字形仔细分析笔画之间的组合关系，方案中各码之间容易混淆，不易区分，并且该方案码长为6，每一个字形均须分析各类码是否存在，效率低。该方案也没有规范完整的甲骨文字库平台的支撑。

发明内容

本发明的目的是要提供一种甲骨文拼音与部件拆分输入法，该方法编码短，效率高，使用方便。

本发明的目的是这样实现的：该输入法包括拼音组字和拼形组字，拼音组字采用全拼式拼音输入法，拼形组字是将甲骨文字归纳出569个部件，将得到的部件与键盘上的26个英文字母建立映射关系以便进行拆分取码，形成拼形组字的甲骨文字输入编码。

所述的拼音组字是将甲骨文字的拼音字母与键盘上的英文字母对应起来，形成拼音输入的编码序列。

所述的拼形组字是按照从左到右、从上到下及从外到内的顺序对甲骨文字进行拆分取码。

所述的拆分取码是取甲骨文字的第一、二、三、末码作为字形的输入码，不足四码的以空格键结束。

所述的部件包括形似英文字母部件，形似英文字母部件与相应的英文字母建立映射关系。

所述的输入编码中的字符为26个英文字母，含有1、2、3、4个字母的编码序列分别称为一级简码、二级简码、三级简码、四级简码。

所述的输入法还包括甲骨文字库，甲骨文字库使用的是采用二次贝塞尔曲线技术生成的TrueType格式甲骨文字库，采用国际标准Unicode编码，使用的Unicode编码空间为自定义区(Private Use Area，E000-F9FF)，在生成甲骨文字库拟合甲骨文字形的过程中，使用二次贝塞尔曲线来拟合甲骨文字形，通过对缓慢弯曲的较长曲线增加额外控制点的方法提高了字形拟合的精度，字库包括可识读音和意义的甲骨文字形，同时包括未识读音和意义的甲骨文字形。

所述的编码序列和甲骨文字库中的字形序号形成拼音码表和拼形码表，拼音码表的格式：

<甲骨文字拼音序列><Tab键><字形序号[<Tab键>字形序号]>，

拼形码表的格式：

<拆分部件对应的字母序列><Tab键><字形序号[<Tab键>字形序号]>。

所述的569个甲骨文部件与英文字母映射关系是：

本发明优点：

1.使用拼音，简捷方便。

对于甲骨文中可以知道读音的字形，直接输入拼音就可以把字形的所有异体字从甲骨文字库中调出来。这样，可识读音的字形就具备了两种输入方法——拼音输入和拆分取码输入。拼音方案是最自然、最易于为大众接受的编码方案，甲骨文中可识读音的字形占20％以上。对于甲骨文知识的普及教学、平面艺术设计及一般出版物的排版等方面的普通用户来说，使用拼音是最自然的选择。目前已出现的其他方案都未能对甲骨文的读音信息加以利用。

2.拆分直观、规则简单。

对于不知道读音的字形，可以按照甲骨文字形的拓朴结构，利用甲骨文部件象形的特点通过拆分出部件来编码输入。对于从事甲骨文学术研究的科研人员等高级用户来说，由于这部分用户由于对甲骨文字形具有一定的了解，熟悉甲骨文字形的结构，因而采用拆分输入方法是可行的，记住一些编码规则也是可能的和必要的。由于利用了甲骨文部件象形的特点，甲骨文部件与键盘字母之间存在很强的相似性，关联性强，大大减轻了记忆负担。

“古文字三级字符全拼检索法”需要对每一部件都要判断所属字符类别，规则繁多，很不简便，编码过长，如有的字形编码为“zhenglirenshang”，使用起来很不方便。

“之乎者也”一一对应数象甲骨文金文输入法(专利申请号：200310114032.6)需要对甲骨文字形进行仔细分析，区分甲骨文字形的细微结构，甲骨文字形在微观上笔画无法区分这一局限，使得该方案可操作性不强，也没有利用甲骨文部件象形的特点来减轻记忆负担。该方案规则也很多，记忆负担也是很大的。

甲骨文电脑输入法(专利申请号：200510004998.3)需要对甲骨文字形仔细分析笔画之间的组合关系，方案中各码之间容易混淆，不易区分，并且该方案码长为6，每一个字形均须分析各类码是否存在，效率低。

3.码符集为26个英文字母，设计了一级简码、二级简码、三级简码、四级简码，平均码长短，接近3。

“古文字三级字符全拼检索法”中，有的字形编码为“zhenglirenshang”，编码过长，使用起来很不方便。甲骨文电脑输入法(专利申请号：200510004998.3)中对每个字形的编码码长为6，也是很长的。

4.具备自主开发的规范完整的TrueType格式甲骨文字库的支撑平台，实用性强。

目前出现的其他甲骨文输入方案，均不具备规范完整的甲骨文字库平台的支撑，即使有的输入法方案制作了样本字库，也只是部分甲骨文字形，使用的字形拟合软件也存在着明显的局限性，无法准确拟合具备独特特征的甲骨文字形，因此，只能是一种设计、设想而己，其性能不得而知，实用价值也不大。

本发明无论是在电脑屏幕上显示，还是打印输出，都非常地方便，实现了所见即所得。

附图说明

图1是本发明实施例的拼音组字的键盘示意图。

图2是本发明实施例的拼形组字的键盘示意图。

具体实施方式

在图1中，拼音组字采用全拼式拼音输入法，它是将甲骨文字的拼音字母A-Z与键盘上的26英文字母A-Z一一对应起来，形成拼音输入的编码序列。

拼音码表的格式如下：

<甲骨文字拼音序列><Tab键><字形序号[<Tab键>字形序号]>

例如：

da 0197 2386

dan 1140 3846 3051

dang 2055 2255

dao 2476 3132

de 1918

拼音方案是最自然、最易于为大众所接受的编码方案。据统计，甲骨文中可识读音的字形占20％以上。对于这类可识读音和意义的常用甲骨文字形，在甲骨文知识的普及教学、平面艺术设计及一般出版物的排版等方面用途较广，在这些使用领域对甲骨文内部结构的研究无需任何要求，但输入方案要简便易用。因此无需记住一些繁琐的规则，可以采用拼音输入的方法。在Word文档中，当我们在电脑上切入到甲骨文输入法的的拼音输入方法时，屏幕上即可输入、显示甲骨文，并能随意排版。非常适合于对易用性要求很高的普通用户使用。

在图2中，拼形组字是将甲骨文字归纳出569个部件，将得到的部件与键盘上的26个英文字母建立映射关系以便进行拆分取码，形成拼形组字的甲骨文字输入编码。

拼形组字是按照从左到右、从上到下及从外到内的顺序对甲骨文字进行拆分取码。拆分取码是取甲骨文字的第一、二、三、末码作为字形的输入码，不足四码的以空格键结束。部件包括形似英文字母部件，形似英文字母部件与相应的英文字母建立映射关系。

输入编码中的字符为26个英文字母，含有1、2、3、4个字母的编码序列分别称为一级简码、二级简码、三级简码、四级简码。

输入法字库使用的是采用二次贝塞尔曲线技术生成的TrueType格式甲骨文字库，采用国际标准Unicode编码，使用的Unicode编码空间为自定义区(Private Use Area，E000-F9FF)，在生成甲骨文字库拟合甲骨文字形的过程中，使用二次贝塞尔曲线来拟合甲骨文字形，通过对缓慢弯曲的较长曲线增加额外控制点的方法提高了字形拟合的精度，字库包括可识读音和意义的甲骨文字形，同时包括未识读音和意义的甲骨文字形。

拼形码表的格式如下：

<拆分部件对应的字母序列><Tab键><字形序号[<Tab键>字形序号]>

例如：

U 2036 2247 3512 3534 3549

UA 0120 0810 0812

UAAD 2900

UACD 2104

UAD 2255

对于甲骨文中可以知道读音的字形可以通过两种方法输入：第一种方法是直接利用拼音作为其输入编码，通过拼音可以把具有该读音的所有字形包括异体字从字库中调出来；第二种方法是通过拆分的方法。

比如，甲骨文字形读音为fù，输入拼音“fu”，则可以把包括

在内的所有读音为“fu”的字形从甲骨文字库中调出来。对于甲骨文知识的一般教学、平面设计领域的艺术字体设计等一般用户来说，使用简便，无需培训。同时，还可以使用拆分的方法来输入，甲骨文字形

为左右结构，由部件

和

构成，分别对应码元F、D，输入编码即为FD。

对于不知道读音的甲骨文字形可以采取拆分的方法。

(1)对于无法分析出结构，难以拆分出部件的字形，这类字通常都是象形的独体字，例如要输入甲骨文字形“

”时，该字形似大写英文字母D，是一级简码，对应的键位是D键，那么其输入编码即为D。

(2)对于那些可以分析出结构，可以拆分出部件的字形，拆分出的部件数在四个以内的，取第一、二、三、四部件对应的编码作为该字形的输入编码。不足四码的以空格结束。例如要输入甲骨文字形

该字形为左右结构，按照从左到右的顺序，可以拆分出

等部件，所对应的键位是G、X，它的输入码即为GX。又如要输入甲骨文字形

该字形可以拆分为

等4个部件，这四个部件所对应的键位是X、X、Q、P，其输入编码即为XXQP。

(3)对于那些可以分析出结构，可以拆分出部件的字形，而且拆分出的部件超出四个以上的，则取第一、二、三、末码构成该字形的输入编码。例如要输入甲骨文字形

可以拆分出

等五个部件，分别对应的码元为C、E、X、H、S，取第一、二、三、末码，编码序列为CEXS。

Claims

1.一种甲骨文拼音与部件拆分输入法，其特征是该输入法包括拼音组字和拼形组字，拼音组字采用全拼式拼音输入法，拼形组字是将甲骨文字归纳出569个部件，将得到的部件与键盘上的26个英文字母建立映射关系以便进行拆分取码，形成拼形组字的甲骨文字输入编码；拼音组字是将甲骨文字的拼音字母与键盘上的英文字母对应起来，形成拼音输入的编码序列；拼形组字是按照从左到右、从上到下及从外到内的顺序对甲骨文字进行拆分取码；该输入法还包括甲骨文字库，甲骨文字库使用的是采用二次贝塞尔曲线技术生成的TrueType格式甲骨文字库，采用国际标准Unicode编码，使用的Unicode编码空间为自定义区，字库包括可识读音和意义的甲骨文字形，同时包括未识读音和意义的甲骨文字形；569个甲骨文部件与英文字母映射关系是：

2.根据权利要求1所述的甲骨文拼音与部件拆分输入法，其特征是拆分取码是取甲骨文字的第一、二、三、末码作为字形的输入码，不足四码的以空格键结束。

3.根据权利要求1所述的甲骨文拼音与部件拆分输入法，其特征是部件包括形似英文字母部件，形似英文字母部件与相应的英文字母建立映射关系。

4.根据权利要求1所述的甲骨文拼音与部件拆分输入法，其特征是输入编码中的字符为26个英文字母，含有1、2、3、4个字母的编码序列分别称为一级简码、二级简码、三级简码、四级简码。

5.根据权利要求1所述的甲骨文拼音与部件拆分输入法，其特征是编码序列和甲骨文字库中的字形序号形成拼音码表和拼形码表，拼音码表的格式：

<甲骨文字拼音序列><Tab键><字形序号[<Tab键>字形序号]>，

拼形码表的格式：