CN100533359C - 甲骨文拼音与部件拆分输入法 - Google Patents
甲骨文拼音与部件拆分输入法 Download PDFInfo
- Publication number
- CN100533359C CN100533359C CNB2008100492180A CN200810049218A CN100533359C CN 100533359 C CN100533359 C CN 100533359C CN B2008100492180 A CNB2008100492180 A CN B2008100492180A CN 200810049218 A CN200810049218 A CN 200810049218A CN 100533359 C CN100533359 C CN 100533359C
- Authority
- CN
- China
- Prior art keywords
- inscriptions
- bones
- tortoise shells
- font
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种用于电子计算机甲骨文字输入的甲骨文拼音与部件拆分输入法,该输入法包括拼音组字和拼形组字,拼音组字采用全拼式拼音输入法,拼形组字是将甲骨文字归纳出569个部件,将得到的部件与键盘上的26个英文字母建立映射关系以便进行拆分取码,形成拼形组字的甲骨文字输入编码。拼音简捷方便;拆分直观,规则简单。甲骨文部件与键盘字母之间存在很强的相似性,关联性强,大大减轻了记忆负担。码符集为26个英文字母,设计了一级简码、二级简码、三级简码、四级简码,平均码长短接近3。规范完整的TrueType格式甲骨文字库的支撑平台,实用性强。显示与打印输出非常方便,实现了所见即所得。
Description
技术领域
本发明涉及一种用于电子计算机的甲骨文字输入法。
背景技术
目前已经出现的甲骨文输入法方案有以下三种:
(1)“古文字三级字符全拼检索法”(刘志基,《辞书研究》2002年第1期)。
该编码方案将甲骨文部件分为基本字符、物象字符、几何图形字符。基本字符相当于传统的偏旁、部首;物象字符是描摹事物形象类别的构字成分,字形中有取象于鸟的成分,则拆分出的物象字符编码为“niaoxing”;基本字符和物象字符之外的构字成分作为几何图形字符,字形中有圆形构字成分,则拆分出的几何图形字符编码为“yuan”。此种编码方法思路可嘉,但是对每一部件都要判断所属字符类别,规则繁多,很不简便,编码过长,如有的字形编码为“zhenglirenshang”,使用起来很不方便。
(2)“之乎者也”一一对应数象甲骨文金文输入法(专利申请号:200310114032.6)。
该编码方案以字形任意笔画形成的交点、接点、折点、重合点及封闭空间为单位,归纳为“之乎者也唯其同兮由于”十个字象系列。按次序对应在通用键盘及数字键盘上,以等同的字象数序编码。该编码方案需要对甲骨文字形进行仔细分析,区分甲骨文字形的结构,甲骨文字形在微观上笔画无法区分这一局限,使得该方案可操作性不强。该方案规则也很多,记忆负担也是很大的。该方案没有甲骨文字库平台的支撑,其性能不得而知。
(3)甲骨文电脑输入法(专利申请号:200510004998.3)。
发明内容
本发明的目的是要提供一种甲骨文拼音与部件拆分输入法,该方法编码短,效率高,使用方便。
本发明的目的是这样实现的:该输入法包括拼音组字和拼形组字,拼音组字采用全拼式拼音输入法,拼形组字是将甲骨文字归纳出569个部件,将得到的部件与键盘上的26个英文字母建立映射关系以便进行拆分取码,形成拼形组字的甲骨文字输入编码。
所述的拼音组字是将甲骨文字的拼音字母与键盘上的英文字母对应起来,形成拼音输入的编码序列。
所述的拼形组字是按照从左到右、从上到下及从外到内的顺序对甲骨文字进行拆分取码。
所述的拆分取码是取甲骨文字的第一、二、三、末码作为字形的输入码,不足四码的以空格键结束。
所述的部件包括形似英文字母部件,形似英文字母部件与相应的英文字母建立映射关系。
所述的输入编码中的字符为26个英文字母,含有1、2、3、4个字母的编码序列分别称为一级简码、二级简码、三级简码、四级简码。
所述的输入法还包括甲骨文字库,甲骨文字库使用的是采用二次贝塞尔曲线技术生成的TrueType格式甲骨文字库,采用国际标准Unicode编码,使用的Unicode编码空间为自定义区(Private Use Area,E000-F9FF),在生成甲骨文字库拟合甲骨文字形的过程中,使用二次贝塞尔曲线来拟合甲骨文字形,通过对缓慢弯曲的较长曲线增加额外控制点的方法提高了字形拟合的精度,字库包括可识读音和意义的甲骨文字形,同时包括未识读音和意义的甲骨文字形。
所述的编码序列和甲骨文字库中的字形序号形成拼音码表和拼形码表,拼音码表的格式:
<甲骨文字拼音序列><Tab键><字形序号[<Tab键>字形序号]>,
拼形码表的格式:
<拆分部件对应的字母序列><Tab键><字形序号[<Tab键>字形序号]>。
所述的569个甲骨文部件与英文字母映射关系是:
本发明优点:
1.使用拼音,简捷方便。
对于甲骨文中可以知道读音的字形,直接输入拼音就可以把字形的所有异体字从甲骨文字库中调出来。这样,可识读音的字形就具备了两种输入方法——拼音输入和拆分取码输入。拼音方案是最自然、最易于为大众接受的编码方案,甲骨文中可识读音的字形占20%以上。对于甲骨文知识的普及教学、平面艺术设计及一般出版物的排版等方面的普通用户来说,使用拼音是最自然的选择。目前已出现的其他方案都未能对甲骨文的读音信息加以利用。
2.拆分直观、规则简单。
对于不知道读音的字形,可以按照甲骨文字形的拓朴结构,利用甲骨文部件象形的特点通过拆分出部件来编码输入。对于从事甲骨文学术研究的科研人员等高级用户来说,由于这部分用户由于对甲骨文字形具有一定的了解,熟悉甲骨文字形的结构,因而采用拆分输入方法是可行的,记住一些编码规则也是可能的和必要的。由于利用了甲骨文部件象形的特点,甲骨文部件与键盘字母之间存在很强的相似性,关联性强,大大减轻了记忆负担。
“古文字三级字符全拼检索法”需要对每一部件都要判断所属字符类别,规则繁多,很不简便,编码过长,如有的字形编码为“zhenglirenshang”,使用起来很不方便。
“之乎者也”一一对应数象甲骨文金文输入法(专利申请号:200310114032.6)需要对甲骨文字形进行仔细分析,区分甲骨文字形的细微结构,甲骨文字形在微观上笔画无法区分这一局限,使得该方案可操作性不强,也没有利用甲骨文部件象形的特点来减轻记忆负担。该方案规则也很多,记忆负担也是很大的。
甲骨文电脑输入法(专利申请号:200510004998.3)需要对甲骨文字形仔细分析笔画之间的组合关系,方案中各码之间容易混淆,不易区分,并且该方案码长为6,每一个字形均须分析各类码是否存在,效率低。
3.码符集为26个英文字母,设计了一级简码、二级简码、三级简码、四级简码,平均码长短,接近3。
“古文字三级字符全拼检索法”中,有的字形编码为“zhenglirenshang”,编码过长,使用起来很不方便。甲骨文电脑输入法(专利申请号:200510004998.3)中对每个字形的编码码长为6,也是很长的。
4.具备自主开发的规范完整的TrueType格式甲骨文字库的支撑平台,实用性强。
目前出现的其他甲骨文输入方案,均不具备规范完整的甲骨文字库平台的支撑,即使有的输入法方案制作了样本字库,也只是部分甲骨文字形,使用的字形拟合软件也存在着明显的局限性,无法准确拟合具备独特特征的甲骨文字形,因此,只能是一种设计、设想而己,其性能不得而知,实用价值也不大。
本发明无论是在电脑屏幕上显示,还是打印输出,都非常地方便,实现了所见即所得。
附图说明
图1是本发明实施例的拼音组字的键盘示意图。
图2是本发明实施例的拼形组字的键盘示意图。
具体实施方式
在图1中,拼音组字采用全拼式拼音输入法,它是将甲骨文字的拼音字母A-Z与键盘上的26英文字母A-Z一一对应起来,形成拼音输入的编码序列。
拼音码表的格式如下:
<甲骨文字拼音序列><Tab键><字形序号[<Tab键>字形序号]>
例如:
da 0197 2386
dan 1140 3846 3051
dang 2055 2255
dao 2476 3132
de 1918
拼音方案是最自然、最易于为大众所接受的编码方案。据统计,甲骨文中可识读音的字形占20%以上。对于这类可识读音和意义的常用甲骨文字形,在甲骨文知识的普及教学、平面艺术设计及一般出版物的排版等方面用途较广,在这些使用领域对甲骨文内部结构的研究无需任何要求,但输入方案要简便易用。因此无需记住一些繁琐的规则,可以采用拼音输入的方法。在Word文档中,当我们在电脑上切入到甲骨文输入法的的拼音输入方法时,屏幕上即可输入、显示甲骨文,并能随意排版。非常适合于对易用性要求很高的普通用户使用。
在图2中,拼形组字是将甲骨文字归纳出569个部件,将得到的部件与键盘上的26个英文字母建立映射关系以便进行拆分取码,形成拼形组字的甲骨文字输入编码。
拼形组字是按照从左到右、从上到下及从外到内的顺序对甲骨文字进行拆分取码。拆分取码是取甲骨文字的第一、二、三、末码作为字形的输入码,不足四码的以空格键结束。部件包括形似英文字母部件,形似英文字母部件与相应的英文字母建立映射关系。
输入编码中的字符为26个英文字母,含有1、2、3、4个字母的编码序列分别称为一级简码、二级简码、三级简码、四级简码。
输入法字库使用的是采用二次贝塞尔曲线技术生成的TrueType格式甲骨文字库,采用国际标准Unicode编码,使用的Unicode编码空间为自定义区(Private Use Area,E000-F9FF),在生成甲骨文字库拟合甲骨文字形的过程中,使用二次贝塞尔曲线来拟合甲骨文字形,通过对缓慢弯曲的较长曲线增加额外控制点的方法提高了字形拟合的精度,字库包括可识读音和意义的甲骨文字形,同时包括未识读音和意义的甲骨文字形。
拼形码表的格式如下:
<拆分部件对应的字母序列><Tab键><字形序号[<Tab键>字形序号]>
例如:
U 2036 2247 3512 3534 3549
UA 0120 0810 0812
UAAD 2900
UACD 2104
UAD 2255
对于甲骨文中可以知道读音的字形可以通过两种方法输入:第一种方法是直接利用拼音作为其输入编码,通过拼音可以把具有该读音的所有字形包括异体字从字库中调出来;第二种方法是通过拆分的方法。
比如,甲骨文字形读音为fù,输入拼音“fu”,则可以把包括在内的所有读音为“fu”的字形从甲骨文字库中调出来。对于甲骨文知识的一般教学、平面设计领域的艺术字体设计等一般用户来说,使用简便,无需培训。同时,还可以使用拆分的方法来输入,甲骨文字形为左右结构,由部件和构成,分别对应码元F、D,输入编码即为FD。
对于不知道读音的甲骨文字形可以采取拆分的方法。
(2)对于那些可以分析出结构,可以拆分出部件的字形,拆分出的部件数在四个以内的,取第一、二、三、四部件对应的编码作为该字形的输入编码。不足四码的以空格结束。例如要输入甲骨文字形该字形为左右结构,按照从左到右的顺序,可以拆分出等部件,所对应的键位是G、X,它的输入码即为GX。又如要输入甲骨文字形该字形可以拆分为等4个部件,这四个部件所对应的键位是X、X、Q、P,其输入编码即为XXQP。
Claims (5)
1.一种甲骨文拼音与部件拆分输入法,其特征是该输入法包括拼音组字和拼形组字,拼音组字采用全拼式拼音输入法,拼形组字是将甲骨文字归纳出569个部件,将得到的部件与键盘上的26个英文字母建立映射关系以便进行拆分取码,形成拼形组字的甲骨文字输入编码;拼音组字是将甲骨文字的拼音字母与键盘上的英文字母对应起来,形成拼音输入的编码序列;拼形组字是按照从左到右、从上到下及从外到内的顺序对甲骨文字进行拆分取码;该输入法还包括甲骨文字库,甲骨文字库使用的是采用二次贝塞尔曲线技术生成的TrueType格式甲骨文字库,采用国际标准Unicode编码,使用的Unicode编码空间为自定义区,字库包括可识读音和意义的甲骨文字形,同时包括未识读音和意义的甲骨文字形;569个甲骨文部件与英文字母映射关系是:
2.根据权利要求1所述的甲骨文拼音与部件拆分输入法,其特征是拆分取码是取甲骨文字的第一、二、三、末码作为字形的输入码,不足四码的以空格键结束。
3.根据权利要求1所述的甲骨文拼音与部件拆分输入法,其特征是部件包括形似英文字母部件,形似英文字母部件与相应的英文字母建立映射关系。
4.根据权利要求1所述的甲骨文拼音与部件拆分输入法,其特征是输入编码中的字符为26个英文字母,含有1、2、3、4个字母的编码序列分别称为一级简码、二级简码、三级简码、四级简码。
5.根据权利要求1所述的甲骨文拼音与部件拆分输入法,其特征是编码序列和甲骨文字库中的字形序号形成拼音码表和拼形码表,拼音码表的格式:
<甲骨文字拼音序列><Tab键><字形序号[<Tab键>字形序号]>,
拼形码表的格式:
<拆分部件对应的字母序列><Tab键><字形序号[<Tab键>字形序号]>。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2008100492180A CN100533359C (zh) | 2008-01-31 | 2008-01-31 | 甲骨文拼音与部件拆分输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2008100492180A CN100533359C (zh) | 2008-01-31 | 2008-01-31 | 甲骨文拼音与部件拆分输入法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101231558A CN101231558A (zh) | 2008-07-30 |
CN100533359C true CN100533359C (zh) | 2009-08-26 |
Family
ID=39898080
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2008100492180A Expired - Fee Related CN100533359C (zh) | 2008-01-31 | 2008-01-31 | 甲骨文拼音与部件拆分输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100533359C (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101872478B (zh) * | 2010-05-31 | 2012-08-22 | 徐州师范大学 | 甲骨拓片字形的计算机辅助复原方法 |
CN104424264A (zh) * | 2013-08-29 | 2015-03-18 | 北大方正集团有限公司 | 汉字制作方法和装置 |
CN103488798B (zh) * | 2013-10-14 | 2016-06-15 | 大连民族学院 | 一种甲骨文自动识别方法 |
CN106406560B (zh) * | 2016-08-29 | 2019-03-08 | 武汉开目信息技术股份有限公司 | 桌面操作系统中机械工程字符矢量字体输出方法和系统 |
-
2008
- 2008-01-31 CN CNB2008100492180A patent/CN100533359C/zh not_active Expired - Fee Related
Non-Patent Citations (4)
Title |
---|
可视化甲骨文输入法的设计与实现. 刘永革,栗青生.计算机工程与应用,第17期. 2004 |
可视化甲骨文输入法的设计与实现. 刘永革,栗青生.计算机工程与应用,第17期. 2004 * |
简说"古文字三级字符全拼编码检字系统". 刘志基.辞书研究,第1期. 2002 |
简说"古文字三级字符全拼编码检字系统". 刘志基.辞书研究,第1期. 2002 * |
Also Published As
Publication number | Publication date |
---|---|
CN101231558A (zh) | 2008-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5903861A (en) | Method for specifically converting non-phonetic characters representing vocabulary in languages into surrogate words for inputting into a computer | |
US6292768B1 (en) | Method for converting non-phonetic characters into surrogate words for inputting into a computer | |
CN102682022B (zh) | 一种汉字全息活字库的实现方法 | |
US5331557A (en) | Audio-video coding system for Chinese characters | |
CN100533359C (zh) | 甲骨文拼音与部件拆分输入法 | |
CN105045410B (zh) | 一种形式化拼音和汉字对应识别的方法 | |
Lu | Computers and Chinese writing systems | |
CN1072029A (zh) | 五笔二维编码法及键盘 | |
CN102053955B (zh) | 一种符号输入的方法和系统 | |
CN100501656C (zh) | 一种音形结合的向电子设备中手写汉字的输入法 | |
Aranta et al. | Utilization Of Hexadecimal Numbers In Optimization Of Balinese Transliteration String Replacement Method | |
CN100458668C (zh) | 首音汉字输入法 | |
CN1018205B (zh) | 计算机中文声数编码输入技术 | |
KR20110039419A (ko) | 중국어수업에 적용되는 한자입력방법 | |
JP3803253B2 (ja) | 漢字入力のための方法および装置 | |
CN1027839C (zh) | 中华双拼汉字编入的计算机键盘 | |
Joshi et al. | Input Scheme for Hindi Using Phonetic Mapping | |
Huor et al. | Detection and correction of homophonous error word for Khmer language | |
CN108459735A (zh) | 声韵双击触摸屏汉语拼音输入方法 | |
CN102141844B (zh) | 带声、韵、调读音的汉字内码输入法 | |
CN109308128A (zh) | 一种字母滑行输入法 | |
CN1327313C (zh) | 计算机汉字十大结构符型输入法 | |
CN1327314C (zh) | 以外语为输入单位的计算机汉字编码输入方法 | |
CA2270956A1 (en) | Method for converting non-phonetic characters into surrogate words for inputting into a computer | |
Goonetilleke et al. | An efficient and user-friendly Sinhala input method based on phonetic transcription |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090826 Termination date: 20130131 |
|
CF01 | Termination of patent right due to non-payment of annual fee |