CN101231558A - 甲骨文拼音与部件拆分输入法 - Google Patents

甲骨文拼音与部件拆分输入法 Download PDF

Info

Publication number
CN101231558A
CN101231558A CNA2008100492180A CN200810049218A CN101231558A CN 101231558 A CN101231558 A CN 101231558A CN A2008100492180 A CNA2008100492180 A CN A2008100492180A CN 200810049218 A CN200810049218 A CN 200810049218A CN 101231558 A CN101231558 A CN 101231558A
Authority
CN
China
Prior art keywords
inscriptions
bones
tortoise shells
parts
input method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008100492180A
Other languages
English (en)
Other versions
CN100533359C (zh
Inventor
杨亦鸣
顾绍通
马小虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xuzhou Normal University
Original Assignee
Xuzhou Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xuzhou Normal University filed Critical Xuzhou Normal University
Priority to CNB2008100492180A priority Critical patent/CN100533359C/zh
Publication of CN101231558A publication Critical patent/CN101231558A/zh
Application granted granted Critical
Publication of CN100533359C publication Critical patent/CN100533359C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种用于电子计算机甲骨文字输入的甲骨文拼音与部件拆分输入法,该输入法包括拼音组字和拼形组字,拼音组字采用全拼式拼音输入法,拼形组字是将甲骨文字归纳出569个部件,将得到的部件与键盘上的26个英文字母建立映射关系以便进行拆分取码,形成拼形组字的甲骨文字输入编码。拼音简捷方便;拆分直观,规则简单。甲骨文部件与键盘字母之间存在很强的相似性,关联性强,大大减轻了记忆负担。码符集为26个英文字母,设计了一级简码、二级简码、三级简码、四级简码,平均码长短接近3。规范完整的TrueType格式甲骨文字库的支撑平台,实用性强。显示与打印输出非常方便,实现了所见即所得。

Description

甲骨文拼音与部件拆分输入法
技术领域
本发明涉及一种用于电子计算机的甲骨文字输入法。
背景技术
目前已经出现的甲骨文输入法方案有以下三种:
(1)“古文字三级字符全拼检索法”(刘志基,《辞书研究》2002年第1期)。
该编码方案将甲骨文部件分为基本字符、物象字符、几何图形字符。基本字符相当于传统的偏旁、部首;物象字符是描摹事物形象类别的构字成分,字形中有取象于鸟的成分,则拆分出的物象字符编码为“niaoxing”;基本字符和物象字符之外的构字成分作为几何图形字符,字形中有圆形构字成分,则拆分出的几何图形字符编码为“yuan”。此种编码方法思路可嘉,但是对每一部件都要判断所属字符类别,规则繁多,很不简便,编码过长,如有的字形编码为“zhenglirenshang”,使用起来很不方便。
(2)“之乎者也”一一对应数象甲骨文金文输入法(专利申请号:200310114032.6)。
该编码方案以字形任意笔画形成的交点、接点、折点、重合点及封闭空间为单位,归纳为“之乎者也唯其同兮由于”十个字象系列。按次序对应在通用键盘及数字键盘上,以等同的字象数序编码。该编码方案需要对甲骨文字形进行仔细分析,区分甲骨文字形的结构,甲骨文字形在微观上笔画无法区分这一局限,使得该方案可操作性不强。该方案规则也很多,记忆负担也是很大的。该方案没有甲骨文字库平台的支撑,其性能不得而知。
(3)甲骨文电脑输入法(专利申请号:200510004998.3)。
该编码方案将甲骨文字形分析为三类结构:封闭曲线结构、交叉线段结构、飘离曲线或点结构。根椐结构的不同分为眼码、睫码、叶码、枝码、飘码、结构码。对字形进行结构分析后顺序写出上述六码就得出甲骨文字形的编码序列。比如“
Figure S2008100492180D00011
”的编码为001201。此种编码方案编码时需要对甲骨文字形仔细分析笔画之间的组合关系,方案中各码之间容易混淆,不易区分,并且该方案码长为6,每一个字形均须分析各类码是否存在,效率低。该方案也没有规范完整的甲骨文字库平台的支撑。
发明内容
本发明的目的是要提供一种甲骨文拼音与部件拆分输入法,该方法编码短,效率高,使用方便。
本发明的目的是这样实现的:该输入法包括拼音组字和拼形组字,拼音组字采用全拼式拼音输入法,拼形组字是将甲骨文字归纳出569个部件,将得到的部件与键盘上的26个英文字母建立映射关系以便进行拆分取码,形成拼形组字的甲骨文字输入编码。
所述的拼音组字是将甲骨文字的拼音字母与键盘上的英文字母对应起来,形成拼音输入的编码序列。
所述的拼形组字是按照从左到右、从上到下及从外到内的顺序对甲骨文字进行拆分取码。
所述的拆分取码是取甲骨文字的第一、二、三、末码作为字形的输入码,不足四码的以空格键结束。
所述的部件包括形似英文字母部件,形似英文字母部件与相应的英文字母建立映射关系。
所述的输入编码中的字符为26个英文字母,含有1、2、3、4个字母的编码序列分别称为一级简码、二级简码、三级简码、四级简码。
所述的输入法还包括甲骨文字库,甲骨文字库使用的是采用二次贝塞尔曲线技术生成的True Type格式甲骨文字库,采用国际标准Unicode编码,使用的Unicode编码空间为自定义区(Private Use Area,E000-F9FF),在生成甲骨文字库拟合甲骨文字形的过程中,使用二次贝塞尔曲线来拟合甲骨文字形,通过对缓慢弯曲的较长曲线增加额外控制点的方法提高了字形拟合的精度,字库包括可识读音和意义的甲骨文字形,同时包括未识读音和意义的甲骨文字形。
所述的编码序列和甲骨文字库中的字形序号形成拼音码表和拼形码表,拼音码表的格式:
    <甲骨文字拼音序列><Tab键><字形序号[<Tab键>字形序号]>,
拼形码表的格式:
    <拆分部件对应的字母序列><Tab键><字形序号[<Tab键>字形序号]>。
所述的569个甲骨文部件与英文字母映射关系是:
Figure S2008100492180D00021
Figure S2008100492180D00031
本发明优点:
1.使用拼音,简捷方便。
对于甲骨文中可以知道读音的字形,直接输入拼音就可以把字形的所有异体字从甲骨文字库中调出来。这样,可识读音的字形就具备了两种输入方法——拼音输入和拆分取码输入。拼音方案是最自然、最易于为大众接受的编码方案,甲骨文中可识读音的字形占20%以上。对于甲骨文知识的普及教学、平面艺术设计及一般出版物的排版等方面的普通用户来说,使用拼音是最自然的选择。目前已出现的其他方案都未能对甲骨文的读音信息加以利用。
2.拆分直观、规则简单。
对于不知道读音的字形,可以按照甲骨文字形的拓朴结构,利用甲骨文部件象形的特点通过拆分出部件来编码输入。对于从事甲骨文学术研究的科研人员等高级用户来说,由于这部分用户由于对甲骨文字形具有一定的了解,熟悉甲骨文字形的结构,因而采用拆分输入方法是可行的,记住一些编码规则也是可能的和必要的。由于利用了甲骨文部件象形的特点,甲骨文部件与键盘字母之间存在很强的相似性,关联性强,大大减轻了记忆负担。
“古文字三级字符全拼检索法”需要对每一部件都要判断所属字符类别,规则繁多,很不简便,编码过长,如有的字形编码为“zhenglirenshang”,使用起来很不方便。
“之乎者也”一一对应数象甲骨文金文输入法(专利申请号:200310114032.6)需要对甲骨文字形进行仔细分析,区分甲骨文字形的细微结构,甲骨文字形在微观上笔画无法区分这一局限,使得该方案可操作性不强,也没有利用甲骨文部件象形的特点来减轻记忆负担。该方案规则也很多,记忆负担也是很大的。
甲骨文电脑输入法(专利申请号:200510004998.3)需要对甲骨文字形仔细分析笔画之间的组合关系,方案中各码之间容易混淆,不易区分,并且该方案码长为6,每一个字形均须分析各类码是否存在,效率低。
3.码符集为26个英文字母,设计了一级简码、二级简码、三级简码、四级简码,平均码长短,接近3。
“古文字三级字符全拼检索法”中,有的字形编码为“zhenglirenshang”,编码过长,使用起来很不方便。甲骨文电脑输入法(专利申请号:200510004998.3)中对每个字形的编码码长为6,也是很长的。
4.具备自主开发的规范完整的True Type格式甲骨文字库的支撑平台,实用性强。
目前出现的其他甲骨文输入方案,均不具备规范完整的甲骨文字库平台的支撑,即使有的输入法方案制作了样本字库,也只是部分甲骨文字形,使用的字形拟合软件也存在着明显的局限性,无法准确拟合具备独特特征的甲骨文字形,因此,只能是一种设计、设想而已,其性能不得而知,实用价值也不大。
本发明无论是在电脑屏幕上显示,还是打印输出,都非常地方便,实现了所见即所得。
附图说明
图1是本发明实施例的拼音组字的键盘示意图。
图2是本发明实施例的拼形组字的键盘示意图。
具体实施方式
在图1中,拼音组字采用全拼式拼音输入法,它是将甲骨文字的拼音字母A-Z与键盘上的26英文字母A-Z一一对应起来,形成拼音输入的编码序列。
拼音码表的格式如下:
    <甲骨文字拼音序列><Tab键><字形序号[<Tab键>字形序号]>
例如:
da      0197    2386
dan     1140    3846    3051
dang    2055    2255
dao     2476    3132
de      1918
拼音方案是最自然、最易于为大众所接受的编码方案。据统计,甲骨文中可识读音的字形占20%以上。对于这类可识读音和意义的常用甲骨文字形,在甲骨文知识的普及教学、平面艺术设计及一般出版物的排版等方面用途较广,在这些使用领域对甲骨文内部结构的研究无需任何要求,但输入方案要简便易用。因此无需记住一些繁琐的规则,可以采用拼音输入的方法。在Word文档中,当我们在电脑上切入到甲骨文输入法的的拼音输入方法时,屏幕上即可输入、显示甲骨文,并能随意排版。非常适合于对易用性要求很高的普通用户使用。
在图2中,拼形组字是将甲骨文字归纳出569个部件,将得到的部件与键盘上的26个英文字母建立映射关系以便进行拆分取码,形成拼形组字的甲骨文字输入编码。
拼形组字是按照从左到右、从上到下及从外到内的顺序对甲骨文字进行拆分取码。拆分取码是取甲骨文字的第一、二、三、末码作为字形的输入码,不足四码的以空格键结束。部件包括形似英文字母部件,形似英文字母部件与相应的英文字母建立映射关系。
输入编码中的字符为26个英文字母,含有1、2、3、4个字母的编码序列分别称为一级简码、二级简码、三级简码、四级简码。
输入法字库使用的是采用二次贝塞尔曲线技术生成的True Type格式甲骨文字库,采用国际标准Unicode编码,使用的Unicode编码空间为自定义区(Private Use Area,E000-F9FF),在生成甲骨文字库拟合甲骨文字形的过程中,使用二次贝塞尔曲线来拟合甲骨文字形,通过对缓慢弯曲的较长曲线增加额外控制点的方法提高了字形拟合的精度,字库包括可识读音和意义的甲骨文字形,同时包括未识读音和意义的甲骨文字形。
拼形码表的格式如下:
    <拆分部件对应的字母序列><Tab键><字形序号[<Tab键>字形序号]>
例如:
U       2036  2247  3512  3534  3549
UA      0120  0810  0812
UAAD    2900
UACD    2104
UAD     2255
对于甲骨文中可以知道读音的字形可以通过两种方法输入:第一种方法是直接利用拼音作为其输入编码,通过拼音可以把具有该读音的所有字形包括异体字从字库中调出来;第二种方法是通过拆分的方法。
比如,甲骨文字形“
Figure S2008100492180D00051
”,读音为fù,输入拼音“fu”,则可以把包括“
Figure S2008100492180D00052
”在内的所有读音为“fu”的字形从甲骨文字库中调出来。对于甲骨文知识的一般教学、平面设计领域的艺术字体设计等一般用户来说,使用简便,无需培训。同时,还可以使用拆分的方法来输入,甲骨文字形“
Figure S2008100492180D00053
”为左右结构,由部件
Figure S2008100492180D00054
Figure S2008100492180D00055
构成,分别对应码元F、D,输入编码即为FD。
对于不知道读音的甲骨文字形可以采取拆分的方法。
(1)对于无法分析出结构,难以拆分出部件的字形,这类字通常都是象形的独体字,例如要输入甲骨文字形“”时,该字形似大写英文字母D,是一级简码,对应的键位是D键,那么其输入编码即为D。
(2)对于那些可以分析出结构,可以拆分出部件的字形,拆分出的部件数在四个以内的,取第一、二、三、四部件对应的编码作为该字形的输入编码。不足四码的以空格结束。例如要输入甲骨文字形“
Figure S2008100492180D00062
”,该字形为左右结构,按照从左到右的顺序,可以拆分出“”、“
Figure S2008100492180D00064
”等部件,所对应的键位是G、X,它的输入码即为GX。又如要输入甲骨文字形“
Figure S2008100492180D00065
”,该字形可以拆分为“
Figure S2008100492180D00066
”、“
Figure S2008100492180D00067
”、“
Figure S2008100492180D00068
”、“
Figure S2008100492180D00069
”等4个部件,这四个部件所对应的键位是X、X、Q、P,其输入编码即为XXQP。
(3)对于那些可以分析出结构,可以拆分出部件的字形,而且拆分出的部件超出四个以上的,则取第一、二、三、末码构成该字形的输入编码。例如要输入甲骨文字形“
Figure S2008100492180D000610
”,可以拆分出“
Figure S2008100492180D000611
”、“
Figure S2008100492180D000612
”、“”、“”、“
Figure S2008100492180D000615
”等五个部件,分别对应的码元为C、E、X、H、S,取第一、二、三、末码,编码序列为CEXS。

Claims (9)

1.一种甲骨文拼音与部件拆分输入法,其特征是该输入法包括拼音组字和拼形组字,拼音组字采用全拼式拼音输入法,拼形组字是将甲骨文字归纳出569个部件,将得到的部件与键盘上的26个英文字母建立映射关系以便进行拆分取码,形成拼形组字的甲骨文字输入编码。
2.根据权利要求1所述的甲骨文拼音与部件拆分输入法,其特征是拼音组字是将甲骨文字的拼音字母与键盘上的英文字母对应起来,形成拼音输入的编码序列。
3.根据权利要求1所述的甲骨文拼音与部件拆分输入法,其特征是拼形组字是按照从左到右、从上到下及从外到内的顺序对甲骨文字进行拆分取码。
4.根据权利要求1所述的甲骨文拼音与部件拆分输入法,其特征是拆分取码是取甲骨文字的第一、二、三、末码作为字形的输入码,不足四码的以空格键结束。
5.根据权利要求1所述的甲骨文拼音与部件拆分输入法,其特征是部件包括形似英文字母部件,形似英文字母部件与相应的英文字母建立映射关系。
6.根据权利要求1所述的甲骨文拼音与部件拆分输入法,其特征是输入编码中的字符为26个英文字母,含有1、2、3、4个字母的编码序列分别称为一级简码、二级简码、三级简码、四级简码。
7.根据权利要求1所述的甲骨文拼音与部件拆分输入法,其特征是该输入法还包括甲骨文字库,甲骨文字库使用的是采用二次贝塞尔曲线技术生成的True Type格式甲骨文字库,采用国际标准Unicode编码,使用的Unicode编码空间为自定义区,字库包括可识读音和意义的甲骨文字形,同时包括未识读音和意义的甲骨文字形。
8.根据权利要求6所述的甲骨文拼音与部件拆分输入法,其特征是编码序列和甲骨文字库中的字形序号形成拼音码表和拼形码表,拼音码表的格式:
    <甲骨文字拼音序列><Tab键><字形序号[<Tab键>字形序号]>,
拼形码表的格式:
    <拆分部件对应的字母序列><Tab键><字形序号[<Tab键>字形序号]>。
9.根据权利要求1所述的甲骨文拼音与部件拆分输入法,其特征是569个甲骨文部件与英文字母映射关系是:
Figure S2008100492180C00011
Figure S2008100492180C00021
CNB2008100492180A 2008-01-31 2008-01-31 甲骨文拼音与部件拆分输入法 Expired - Fee Related CN100533359C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2008100492180A CN100533359C (zh) 2008-01-31 2008-01-31 甲骨文拼音与部件拆分输入法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2008100492180A CN100533359C (zh) 2008-01-31 2008-01-31 甲骨文拼音与部件拆分输入法

Publications (2)

Publication Number Publication Date
CN101231558A true CN101231558A (zh) 2008-07-30
CN100533359C CN100533359C (zh) 2009-08-26

Family

ID=39898080

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2008100492180A Expired - Fee Related CN100533359C (zh) 2008-01-31 2008-01-31 甲骨文拼音与部件拆分输入法

Country Status (1)

Country Link
CN (1) CN100533359C (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101872478A (zh) * 2010-05-31 2010-10-27 徐州师范大学 甲骨拓片字形的计算机辅助复原方法
CN103488798A (zh) * 2013-10-14 2014-01-01 大连民族学院 一种甲骨文自动识别方法
CN104424264A (zh) * 2013-08-29 2015-03-18 北大方正集团有限公司 汉字制作方法和装置
CN106406560A (zh) * 2016-08-29 2017-02-15 武汉开目信息技术股份有限公司 桌面操作系统中机械工程字符矢量字体输出方法和系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101872478A (zh) * 2010-05-31 2010-10-27 徐州师范大学 甲骨拓片字形的计算机辅助复原方法
CN104424264A (zh) * 2013-08-29 2015-03-18 北大方正集团有限公司 汉字制作方法和装置
CN103488798A (zh) * 2013-10-14 2014-01-01 大连民族学院 一种甲骨文自动识别方法
CN103488798B (zh) * 2013-10-14 2016-06-15 大连民族学院 一种甲骨文自动识别方法
CN106406560A (zh) * 2016-08-29 2017-02-15 武汉开目信息技术股份有限公司 桌面操作系统中机械工程字符矢量字体输出方法和系统
CN106406560B (zh) * 2016-08-29 2019-03-08 武汉开目信息技术股份有限公司 桌面操作系统中机械工程字符矢量字体输出方法和系统

Also Published As

Publication number Publication date
CN100533359C (zh) 2009-08-26

Similar Documents

Publication Publication Date Title
US5903861A (en) Method for specifically converting non-phonetic characters representing vocabulary in languages into surrogate words for inputting into a computer
US6292768B1 (en) Method for converting non-phonetic characters into surrogate words for inputting into a computer
US5331557A (en) Audio-video coding system for Chinese characters
CN100533359C (zh) 甲骨文拼音与部件拆分输入法
CN1072029A (zh) 五笔二维编码法及键盘
CN105045410B (zh) 一种形式化拼音和汉字对应识别的方法
Lu Computers and Chinese writing systems
CN102053955B (zh) 一种符号输入的方法和系统
CN100501656C (zh) 一种音形结合的向电子设备中手写汉字的输入法
Aranta et al. Utilization Of Hexadecimal Numbers In Optimization Of Balinese Transliteration String Replacement Method
CN100458668C (zh) 首音汉字输入法
CN1018205B (zh) 计算机中文声数编码输入技术
Joshi et al. Input Scheme for Hindi Using Phonetic Mapping
CN1027839C (zh) 中华双拼汉字编入的计算机键盘
Huor et al. Detection and correction of homophonous error word for Khmer language
CN108459735A (zh) 声韵双击触摸屏汉语拼音输入方法
CN102141844B (zh) 带声、韵、调读音的汉字内码输入法
CN109308128A (zh) 一种字母滑行输入法
CN1327314C (zh) 以外语为输入单位的计算机汉字编码输入方法
CN1327313C (zh) 计算机汉字十大结构符型输入法
CA2270956A1 (en) Method for converting non-phonetic characters into surrogate words for inputting into a computer
Goonetilleke et al. An efficient and user-friendly Sinhala input method based on phonetic transcription
CN1036359C (zh) 计算机汉字反切编码输入法
Everson Proposal to encode the Wancho script in the UCS
CN105022496B (zh) 一种汉字音代数输入法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090826

Termination date: 20130131