CN1241100C - 同一声形数码汉字输入法 - Google Patents

同一声形数码汉字输入法 Download PDF

Info

Publication number
CN1241100C
CN1241100C CN 02119466 CN02119466A CN1241100C CN 1241100 C CN1241100 C CN 1241100C CN 02119466 CN02119466 CN 02119466 CN 02119466 A CN02119466 A CN 02119466A CN 1241100 C CN1241100 C CN 1241100C
Authority
CN
China
Prior art keywords
code
character
strokes
stroke
yards
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 02119466
Other languages
English (en)
Other versions
CN1459700A (zh
Inventor
徐惠才
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 02119466 priority Critical patent/CN1241100C/zh
Publication of CN1459700A publication Critical patent/CN1459700A/zh
Application granted granted Critical
Publication of CN1241100C publication Critical patent/CN1241100C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

这是一项将汉字数字化的编码方法。该编码方法采用0~9的数字编码,编码长度不超过四位码。在近三万汉个汉字的编码运用中,90%的重码不足10个,10%的重码不足30个,平均重码3.47。取汉字的首尾编码,这完全符合人的最佳识别速度。它完全适用于计算机领域、通讯领域;金融、交通、文教、行政管理等行业的数字输入终端设施。在数字输入产品方面具有广阔的开发空间。

Description

同一声形数码汉字输入法
本发明涉及汉字编码方法,尤其涉及一种将汉字从根本上数字化和拼音化而在计算机领域、通讯录领域;金融、商贸、交通、行政管理等行业数字输入终端设施上,实现同一平台声码形码互补的输入方法及其应用。
由于计算机的飞速发展,文字信息处理技术领域可谓万“码”奔腾。就其类别一般分为形码、音码、音形结合码、区位代码四大类,它们从字元、字根、字形、结构、几何形状、角度形状、读音及读音加字形等等方面着手,用英文字母或数字或其它特殊符号作代码给汉字编码。这些发明创造在技术上都各有长处是毫无疑问的、对于信息技术的推动作用是不可否认的。但,由于有的发明过分强调自身的长处、强调个性特征、强调某一方面的独创性,导致技术处理上的不平衡、实际使用上的不平衡,甚至有的长处反而变成了短处。“好用难学、好学难用”是很多编码方法普遍存在的问题。有些编码技术对硬件设备和使用者提出了特别的限制和专业技术的高要求,极大地影响了其技术的普及,这可能就是科技成果难以真正实现其社会价值的原因之一。例如公开号为CN1164059A,发明名称为《汉字笔形码编码方法》的发明专利申请,其汉字为编码方法是通过选择汉字中的子汉字对汉字进行拆分,然后采用声码、韵码和笔形码给汉字编码。这种编码方法在应用过程中必须具备相当程度的汉字构造知识和相配套的硬件设施;有的音形结合码,表面上是结合了声码和形码的优点,实际上是把对汉字读音能力的要求和对汉字结构拆分能力的要求加到一块,对使用者提出了更全面的高要求;有些听起来简单的汉字编码方法,在实际应用中却很不简单。如“一字码”、“二笔码”输入法,只要稍加分析就会明白,当选作代码的数量为一定时,有限的代码怎能涵盖数以万计的汉字;还有的编码方法从汉字的几何结构入手,其方法是否好用,暂且不论,单就那厚厚的使用说明书已经让人望而生畏(包括专利申请文件,都显得那样的“缠绵”)。很多汉字编码方法(包括计算机输入法)都存在着一个共同的技术问题,那就是代码的使用频率极不平衡,大量的空码位(没有汉字与之对应的编码)必然导致高频代码的汉字高重码。诸如此类的问题与不足之处,除了在本发明中得到改善以外;本发明还特别注意到了与其它硬件设施的兼容(如应用于液晶显示电话,能让聋哑之人打电话变为现实,至于那些应用前景如何广阔的空话等到实现之日再说吧)。
本发明的目的在于提供一种将汉字数字化,让汉字编码查找、传输替代、计算机汉字输入、文字信息交换、数字通讯系统、简繁体汉字等都能共用的编码方法。
本发明的目的是通过以下技术方案实现的:
一、字元笔形的定义
1、字元笔形,本发明是以构成汉字的单笔或复笔的笔画形状作为字元笔形。而字元的确定是在近叁万个汉字中(GB2313-GB18030字符集所收录的汉字),经过反复的排列比较、拆分组合、笔形使用频率分析、调整平衡后,将这些字元归纳为十类。再结合国家语委对横、竖、撇、捺、折的一贯定义和字元形状与数字形状的共同特征分别用0~9的数字替代。如横(一)、竖(丨)、撇(丿)、捺点(丶)、折(乙)的一贯定义是1、2、3、4、5,而“言、厂、又、耳、口”五类字元(含汉字字形)分别与“6、7、8、9、0”之间存在着结构共通或形状相似之处。
2、字元笔形分类与数字代码表:
Figure C0211946600051
3、帮助记忆口诀:
                方框虫0横串1
                竖钩挂2竹撇3
                点火捺4折丝5
                对点言6金角7
                8又交叉月身9
二、编码规则
1、编码长度,一个汉字最多取四个字元笔形编四位码,如不足四个字元(笔形)的,则有几个取几个,取过的字元不再取。即一个汉字最多取4码,不足4码则有几码是几码,不重复取码。
2、编码顺序,按照汉字的书写规则(笔顺),顺取两码、再从末笔起倒取两码。
3、给码原则:
①取大优先,当几种字元(笔形)在一起时,以笔画数多者为先;
②笔顺优先,当几种字元(笔形)在一起而且笔画数相同时,笔顺先到的笔形优先;
③特征显著的笔形优先,当几种字元(笔形)在一起含混不清时,以特征最明显者优先。
实例1  “焱”字,是由3个字元“火”组成,而“火”的代码是“4”,所以“焱=444”;
实例2  “省”字,第一码是竖(丨)=2,第二码是对点(ハ)=6,第三码(倒数第一字元)为方框(目)=0,第四码(倒数第二字元)为目中一横(一)1,即“省=2601”;
实例3  “耒”字,取过“丰”之后,“木”已经不存在应取“人”,所以“耒”字的全码是27。
本发明之所以取名为“同一声形数码”是因为该编码方法可与计算机拼音输入法连接。在键盘上表现为主副键盘不做任何切换操作,可同一平台分别输入声(音)码、形(数字)码;可以编成检字表式的字库集;使汉字的编码、读音、简体、繁体显示于同一板块或同一平台;还可与申请号为01135698.7的发明专利《英文数字码》连接运用,在同一输入终端实现简繁体汉字、英文字母、数字及其运算的一体操作。

Claims (1)

1.一种同一声形数码汉字输入法,通过计算机的键盘和通讯系统的数字输入终端输入汉字,其特征是在同一操作平台、同一输入状态下输入汉语拼音、简繁体汉字的数字形码;数字形码是将简繁体汉字的字元笔形归纳为十种类型,对应到0~9的数字上,其字元笔形与数字代码对应表如下:
Figure C021194660002C1
所述简繁体汉字的取码原则:一是顺取2码倒取2码;二是一个汉字最多输入4位码,不足四码有几码取几码,不重复取码;三是取大、笔顺、笔形显著的优先取码。
CN 02119466 2002-05-25 2002-05-25 同一声形数码汉字输入法 Expired - Fee Related CN1241100C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 02119466 CN1241100C (zh) 2002-05-25 2002-05-25 同一声形数码汉字输入法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 02119466 CN1241100C (zh) 2002-05-25 2002-05-25 同一声形数码汉字输入法

Publications (2)

Publication Number Publication Date
CN1459700A CN1459700A (zh) 2003-12-03
CN1241100C true CN1241100C (zh) 2006-02-08

Family

ID=29426788

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 02119466 Expired - Fee Related CN1241100C (zh) 2002-05-25 2002-05-25 同一声形数码汉字输入法

Country Status (1)

Country Link
CN (1) CN1241100C (zh)

Also Published As

Publication number Publication date
CN1459700A (zh) 2003-12-03

Similar Documents

Publication Publication Date Title
CN1241100C (zh) 同一声形数码汉字输入法
CN100520685C (zh) 一种汉字拼音识别码输入法
CN1037598A (zh) 八笔首音(傻瓜)码汉字输入方法
CN1069351A (zh) 汉字直观音形编码输入法及键盘
CN1116335A (zh) 一种利用笔写屏技术的汉字输入系统
CN1053049C (zh) 音数码计算机汉字输入方法
CN1349157A (zh) 数字笔形码汉字输入法
CN1204484C (zh) 四笔汉字输入方法
CN1080070A (zh) 形声位全息汉字编码
CN1139024C (zh) 汉字l码输入方法
CN1306238A (zh) 汉字笔画输入法
CN1018774B (zh) 形音符汉字、符号编码法及其键盘
CN1327313C (zh) 计算机汉字十大结构符型输入法
CN1107256C (zh) 一种汉字右码计算机输入方法
CN1317736A (zh) 数字键音形码
CN1885241A (zh) 一种可减少候选字的汉字输入方法:拼音编码+笔画编码
CN1299190C (zh) 一种内外五笔画数字键盘汉字输入方法
CN100389375C (zh) 一种数字码输入法
CN1245305A (zh) 总笔划向量输入法
CN1164695A (zh) 汉字笔形数值编码法
CN1298139A (zh) 五三音码
CN1313547A (zh) 汉字四角笔画数字编码输入法
CN1316691A (zh) 数字键拼音码
CN1290879A (zh) 中文信息处理汉字数字化规范编码输入技术
CN1153334A (zh) 计算机汉字“字块编码”方案

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20060208