CN1245918A - 七形定义汉字形码编码方法 - Google Patents
七形定义汉字形码编码方法 Download PDFInfo
- Publication number
- CN1245918A CN1245918A CN 99114945 CN99114945A CN1245918A CN 1245918 A CN1245918 A CN 1245918A CN 99114945 CN99114945 CN 99114945 CN 99114945 A CN99114945 A CN 99114945A CN 1245918 A CN1245918 A CN 1245918A
- Authority
- CN
- China
- Prior art keywords
- shape
- stroke
- chinese character
- code
- font code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明公开了一套能够用明确、统一、简单的定义来对所有汉字(包括繁体字)的形码进行编码的方法,它将汉字的所有笔画、偏旁部首及汉字的首形或尾形按笔画的分布与组合规律分为七大形态二十大分形,配以相应的二十六个大写英文字母取汉字形码代码,从而解决了汉字电脑输入不能按定义取码的瓶颈问题。
Description
本发明涉及电脑领域中的汉字形码编码方法。
我国汉字为方块字形,按形编码已成为汉字电脑输入的一大特点。目前电脑汉字的形码输入都是把字根进行无规律的简单归类,难学难记。例如五笔字型中代码为G的集合内的王旁青头戋(兼)五一,五个字根。这五个字根之间没有内在联系和统一规律,全靠硬性记忆。而且按这类无科学分类的字根结合来编码,其固定代码集合内的字根一个也不能多,一个也不能少,不适合汉字演变的需要,而七形定义汉字形码编码可以把所有笔画,偏旁部首和所有汉字(包括繁体字)的笔画组合有规律的统一起来,凡符合某七形形码定义的笔画组合都符合该定义代码,非常灵活规律强,不随汉字演变而改动。
针对上述汉字编码中的实际情况,本发明的目的在于向公众提供一种能按汉字笔画分布与组合规律,科学地按定义编汉字形码的方法,解决目前汉字电脑输入不能按简单、准确统一的定义来进行编码的瓶颈问题。
实现本发明的目的的技术方案是,按照汉字笔画的分布与组合规律,将汉字的所有笔画、偏旁部首及汉字的首形或尾形分为线形、散形、单笔画连形、折笔画连形、平行对称形、封闭形和五行形共七大形态,七大形态又按定义分为二十六种分形,再配以相应的二十六个大写英文字母编码,即得七形定义(形)码。此种编码方法把笔画、偏旁部首和所有汉字(包括繁体字)的笔画组合统一起来,一个定义确定一个代码,规律性极强,便于学习和记忆。
本发明另一技术特征是,汉字形码编码以上述七形定义形码为主,其具体方案有:
单汉字的形码编码由首形码+尾形码+音形码共三码组成;
双字词语的形码编码由第一个汉字的首形码+尾形码+第二个汉字的首形码+尾形码共四码组成;
三字词语的形码编码由第一个汉字的首形码+第二个汉字的首形码+第三个汉字的首形码+尾形码;
四字词组的形码编码分别取第一、第二、第三、第四个汉字的直形码共四码组成;
多字词组的形码编码分别取第一、第二、第三和最后一个汉字的首形共四码位组成;
上述的首形码是指一个汉字以首笔画为中心符合前述七形定义编码规则的形码;上述尾形码是指一个汉字以末笔画为中心符合前述七形定义编码规则的形码;上述音码是指汉字的声母码。
下面结合实施例详细说明本发明。
本发明是在研究笔画在汉字或偏旁部首中的分布与组合规律的基础之上完成的。因此有必要先对笔画的基本特点和组合规律加以分析。一、对汉字笔画特点和组合规律的分析
(一)、笔画的基本特点:
1、笔画是一条连续的不间断的直线线段或曲线线段。
2、所有独立的笔画都具有两个端点——即笔画的起点和终点。
以上箭头所指为笔画的端点——起点和终点。
3、所有独立的笔画都具有线形特征,所谓线形是指象一条线一样无论是直线,还是曲线都只有两个端点。(点笔画可看作是两个端点的距离非常近的线形)。
(二)、笔画的组合规律
1、散形组合:由至少两条或两条以上的独立笔画组合成互不连接有规律的分散状态。
例字:冷 斗 情 尚 认 问 形 热
2、连接组合:指笔画之间相交或相交叉的连接形态。七形定义形码中的笔画连接有线形连接和非线形连接两种形态。
(1)线形连接:是指笔画之间连接后由于笔画的端点互相重合,最终形成一条只具有两个端点的线形。
(2)非线形连接:是指笔画之间连接后至少具有三个端点的连接形态。
具有三个端点的连接形态是相交连接形态。
具有四个端点的连接形是相交叉连接形态。
(三)、本发明七形定义码把横笔画和坚笔画统称为直笔画,把撇笔画,捺笔画统称为斜笔画。本发明七形定义码中的笔画只计方向不计长短。
二、本发明汉字形码编码规则的规定
本发明分别从三个方向研究笔画的分布和组合规律即:1、只研究笔画的不连接形态(包括线形和散形)2、只研究两条笔画的连接形态(包括单笔画连形和折笔画连形)3、研究三条或三条以上笔画的连接形态(包括平行对称和封闭形)。其特点是以汉字或偏旁部首的首笔画为中心,符合本发明七形码定义的组合形态为首形,以汉字或偏旁部首的末笔画为中心,符合本发明七形形码定义的组合形态为尾形。
(一)、线形定义:只具有两个端点的直线线段或曲线线段。包括下述两种分形。
1、笔画线形定义:不与其它笔画相连的所有独立笔画。取代码为A。助记口诀是独立笔画是线形。以下例字的首形都符合笔画线形定义。
例字:方 亡 神 衬 永 衣 良 户 亦 变之 必 一 豆 雨
代码: O N T A J J J U C M M A A D A
例字: 云 元 灭 得 胤 旧 虱 长 买 司 乏 为
代码:N K Z A A S H A H S M A
2、组合线形定义:由几条笔画组合成的只具有两个端点的线形。取代码为B。助记口决是多条笔画合一线。以下例字的首形都符合组合线形定义。
例字:辰 军 贝 见 几 凡 朵 风 罕 厂 同 区 降 陕 改 弓 迎
代码: J G J L B A W J P B R J N H U B M(二)、散形定义:由至少两条独立笔画组合成互不连接面符合书写习惯规律的分散形态。分为以下四种分形。
1.双散形定义:只有两条独立笔画组合成互不连接的分散形态,(没有钩笔画参与),取代码为C。助记口诀是双散只有两笔画。以下例字的首形都符合双散形定义,
例字:冰 冷 斗 头 凌 米 半 叛 卷 敝 关 首 羊 盖 弟
代码:J M G H U W P M B U H T P T I
例字:酋 差 父 竖 临 师 归 二 示 文 亥 齐 卒 率
代码:T P J D S O M C E J J C G G
2、多散形定义:由三条或三条以上笔画组合成互不连接的分散形态。(没有钩笔画参与),取代码为D。助记口诀是多散至少三笔画。以下例字的首形都符合多散形定义。
例字:情 快 壮 浆 三 尚 光 肖 采 爱 立 辛 产 亲 巢 巡
代码:V H Z J D R K V W M D P B C W M
例字:兰 州 言 六 少 省 尖 前 兼 益 须 豹 翠
代码:D D R D D T H E I T J A G
3、钩散形定义:散形中有钩笔画(包括竖钩、竖弯钩,提笔画、折钩等)参与的形态。统一归类为钩散形,取代码为E,助记口诀是钩散定有钩提笔。以下侧字的首形都符合钩散形定义。
例字:请 门 问 闫 讯 小 儿 心 刀 习 羽
首形:讠 门 门 门 讠 小 儿 心 刀 习 习
尾形:月 门 口 三 十 小 儿 心 刀 习 习
代码:V E R D G E E E E E E
4、混散形定义:有组合线形厂,
参与的散形,本发明七形定义形码中规定只有广,疒,宀,
的笔画组合才符合混散形定义,取代码为F。助记口诀是混散广、病(广)、字学头(宀
)。以下例字的首形都符合混散形定义。
例字:广 庙 病 疟 字 官 定 学 党 穴 空
代码:F T J N K S I K K C P上述的线形和散形被看作是只研究笔画的不连接形态,其首形和尾形的取码规则是以首笔画或末笔画为中心,符合七形形码定义的组合笔画之形。
注:线形和散形被看作是只研究笔画的不连接形态。其首形和尾形是以首笔画或末笔画为中心,符合七形形码定义的组合之形。
例:取首形码:
方 豆——首先找出首笔画分别为(丶)(一),这两条笔画在汉字中不与其它笔画相连接是一条独立笔画所以符合笔画线形定义。
壮 须——首先找出它们的首笔画分别为(丶)(ノ),围绕首笔画还有两条独立笔画它们和首笔画共同组成符合多笔画散形定义之形(丬)(彡)。
厅 改——首先找出两汉字的首笔画分别为(一),(一)与首笔画连接成一条线形的笔画分别是(丿),(一)
在汉字中分别组成了一条不与其它笔画相连接的线形(厂)
所以两汉字首形符合组合线形定义。
注:线形和散形的尾形取码规律和首形相同。
例取尾形码:
(三)、单笔画连形定义:七形定义形码中的单笔画连形是指没有折笔画或折钩笔画参与的两条笔画的非线形连接形态,(注:竖弯钩笔画“乚”不属于折钩笔画)。下分六种分形。
1、横竖连形定义:只有横笔画与竖笔画两条笔画的连接形态。以下字例首形都符合横竖连形定义,代码为G。助记口诀是横笔只与竖笔连。
例字:束 直 妻 卖 未 末 来 者 老 载 赤 上 止 齿 占 步
首形:十 十 十 十 十 十 十 十 十 十 十
代码:I T U H W W W S L A C G G B R D
例字:下 正 雨 再 丐 项 业 北 非 南 肆
代码:I G C V O J G L G P P
2、横斜连形定义:只有横笔画与斜笔画两条笔画的连接形态,代码为H。助记口诀是横笔只与耕笔连。以下例字首形都符合横斜连形定义。
例字: 石 歹 万 百 夏 而 页 面 不 更 天 无 五 兀
代码:R U O S U O J T I J H K U K
例字:气 牛 矢 生 先 竹 笔 乍 片 大 在 龙 夹 泰 尢
代码: A G H P K K K G M H Z A H J K
3、竖斜连形定义:只有竖笔画与斜笔画两条笔画的连接形态,代码为I。助记口诀是竖笔只与斜笔连,以下例字首形都符合竖斜连形定义。
例字:住 隹 们 千 舌 乘 秉 延 禹 禾 税 丘 臼 鼠 叟
代码:P P E G R I I M H W K R M E M
4、斜斜连形定义:只有两条斜笔画相互连接的形态,代码为J。助记口诀是斜笔只与斜笔连。以下例字首形都符合斜斜连形定义。例字:杀 希 凶 全 金 食 介 今 翎 令 斤 后 所 爪 瓜 殷 丫 兆 人首形:ㄨ ㄨ ㄨ
丷
人尾形:ハ
凵 王 王
マ
口
ㄡ
人代码:C O B P P J C C E M G R G J J M I J J
5、直钩连形定义:只有直笔画(包括横笔画和竖笔画)与钩或提笔画(折钩笔画除外)相互连接的两条笔画组合形态,代码为K。助记口诀是直笔连接钩提笔。以下例字的首形都符合直钩连形定义。例字:提 寸 事 才 求 扎 丁 于 可 牙 切 比 屯 弋 瓦 皮 蛋首形:
丁 丁 丁 丁
七
尾形:
丶
乚 丁
丁
匕
丶 丶 ㄡ
代码: I A V L A A K K K L O L N A A M H
6、斜钩,钩钩连形定义(简称斜钩连形):只有斜笔画与钩或提笔画(折钩笔画除外),或钩笔画与钩笔画(折钩笔画除外)相互连接的两条笔画组合形态,代码为L。助记口诀是斜笔连接钩提笔。以下例字首形都符合斜钩,钩钩连形定义。
例字: 猎 饱 尔 手 我 乎 毛 乇 匕 旨 疑 印 农 水
代码: S V E K A K K K L S I B J J
(四)、折笔画连形定义:在七形定义形码中是指有折笔画或折钩笔画参与的两条连接笔画之形态,统一归类为折笔画连形。折笔画连形与单笔画连形的区别是单笔画连形没有折笔画和折钩笔画参与。下分三种分形。
1、顺时针折笔画连形定义:折笔画的运笔方向(折钩笔画除外)是沿着顺时针方向的两条笔画的连接形态简称顺折连形,代码为M。助记口诀是顺时折笔双笔连。以下例字首形都符合顺折连形定义。
例字: 圣 久 登 邓 又 叉 劲 专 色 鱼 角 争 龟 危
例字: 白 自 鬼 奥 追 寻 录 敢
2、逆时针折笔画连形定义:折笔画的运笔方向(折钩笔画除外)是沿着反时针方向的两条笔画的连接形态简称逆折连形,代码为N。助记口诀是逆时折笔双笔连。以下例字首形都符合逆折连形定义。
例字: 山 车 东 至 互 发 组 幼 系 能 允 收 巨
运笔规律:折笔画的终点在整个折笔画的右方或右下方,则该折笔画就是逆时斜折笔画。
3、折钩笔画连形定义:七形定义形码中把有折钩笔画参与的两条笔画的连接形态统一归为折钩连形,代码为O。助记口诀是折钩笔画双笔连。
例字:匀 句 包 力 办 刀 九 巾 内 也 与 马
代码: C R V O C O O O J O A A
例字: 乌 向 舟 鸟 身 飞
代码: A R A A O J
以上单笔画连形和折笔画连形属于本发明七形定义形码中只研究两条笔画的连接形态。取码规律是首形取最先和首笔画相连接的两条笔画的连接形态,尾形取最后和未笔画相连接的两条笔画的连接形态。
例如取:需 牛 叟 瓜 提 山 手 巾字的首形和尾形。先找出每个字的首笔画分别是(一)(丿)(ノ)(ノ)(一)()(ノ)(丨)最先和首笔画相连接的笔画分别是(丨)(一)(丨)(丿)(亅)(丨)(亅)
所以它们的首形分别是横竖连形需),横斜连形(),竖斜连形(
),斜斜连形
横钩连形(
,提),逆时针折笔画连形(
,山),斜钩连形手)和折钩连形(
,巾)。
先找出每个字的未笔画分别是(丨)(丨)()()()(丨)(亅)(丨)最后和未笔画相连接的笔画分别是
(一)(丿)(丨)()(一)
所以它们尾形分别是折钩连形
需),横竖连形(十,牛)顺时针折笔连形(又叟),斜斜连形
爪),竖斜连形
提),逆时针折笔连形(凵,山)横钩连形
手)和折钩连形
巾)。
(五)、平行对称形定义:至少有两条或两条以上相对平行的直笔画,被另一条直笔画从相对的中心位置对称连接的形态。下分二种分形。
1、横平行对称形定义:至少有两条相对平行的横笔画,被另一条竖笔画从相对的中心位置对称连接的形态。代码为P。助记口诀是多横平行穿一竖。以下例字的首形都符合横平行对称形定义。
例字:工 干 班 平 巫 士 王 玉 击 丰 韦 走 青 麦
代码:P P P P P P P A N P O I V U
2、竖平行对称形定文:至少有两条相对平行的竖笔画被另一条横笔画从相对的中心位置对称连接的形态,代码为Q。助记口诀是多竖平行穿一横。以下例字的首形都符合竖平行对称形定义。
例字:草 艺 菜 茶 花 带
首形:艹 艹 艹 艹 艹
尾形:十 乙 木 ハ
代码:G A W C L O上面的平行对称形是本发明七形定义形码中研究三条或三条以上笔画有规律的组合形态,其取码特点是以首笔画为中心的首形,首笔画必是一条平行笔画或轴线笔画,以未笔画为中心的尾形,未笔画必是一条平行笔画或轴线笔画。
例: 二(平行笔) 丨(轴线笔画)
干 二(平行笔画) 丨(轴线笔画)
工 二(平行笔画) 丨(轴线笔画)
王 三(平行笔画) 丨(轴线笔画)
丰 三(平行笔画) 丨(轴线笔画)
例:取击、环、班、丰、草、带字的首形——首先找出它们的首笔画分别是(一)(一)(一)(一)(丨)(丨)与首笔画平行的笔画分别是(一)(一)(一)(一,一)(丨,丨)(丨,丨,丨)汉字中几条平行笔画与轴线笔画连接成横平行对称形(,击)(干环)(王 班)(丰,丰)和竖平行对称行(艹,草)(,带)。
取空、旱、全、丰、字的尾形——首先找出它们的末笔画分别是(一)(丨)(一)(丨)与末笔画平行的笔画或与末笔画的连接笔画平行的笔画分别是(一)(一)(一一)(一一),与轴线笔画共同组成横平行对称形(工,空)(干,旱)(王,全)(丰,丰)。
(六)、封闭形定义:由至少三条笔画所围成的具有至少一个封闭空间的形态。
例形:口 日 目 田 女 月 已 巴
例形中由几条笔画围成的一个或几个空白地带就是笔画围成的封闭空间。
按封闭形的特点和规律又可直接分为直封闭形和斜封闭形。
1、直封闭形定义:构成封闭空间的笔画是直笔画或呈相对直角的折笔画。
直封闭形按封闭空间的多少可以分为:
(1)单直封闭形定义:只有一个封闭空间的直封闭形。代码为R。助记口诀是一个空间单直封。
例字:口 吕 吃 困 回 凹 凸 革 共 亚 严 世 兄 足
代码:R R A W R R R G C R H N K I
(2)双直封闭形定义:只有两个封闭空间的直封闭形,代码为S。助记口诀是两个空间双直封。以下例字首形都符合双直封闭形定义。
例字:日 是 易 曷 中 虫 贵 甘 某 建 黑
首形:日 日 日 日 中 中 中 甘 甘 肀
代码:S I O A S H J S W M D
(3)多直封闭形定义:有三个或三个以上封闭空间的直封闭形。代码为T。助记口诀是三个空间多直封闭。
例形:目 且 田 由 甲 申 果 里 罗 耳 票 曲 甚 皿 西 酉 串
首形:目 且 田 由 甲 申 甲 甲 罒 耳 覀 曲
皿 西 酉 串
尾形:目 且 田 由 甲 申 木 土 夕 耳 小 曲
皿 西 酉 串
代码:T T T T T T W P U T E T N T T T T
2、斜钩封闭形定义:构成封闭空间的笔画中有斜笔画和钩笔画(包括钩笔画或提笔画)参与的形态。
(1)斜封闭形定义:构成封闭空间的笔画中有斜笔画或非直角折笔画的形态。代码为U。助记口诀是斜封边有斜笔画。以下例字首形都符合斜封闭形定义。
例字:女 好 条 夕 尸 局 井 开 丑 尹 眉 央 史 然
代码:U K C U U R U U U U T H J D
(2)钩封闭形定义:构成封闭空间的笔画中有钩笔画或提笔画参与的形态,代码为V。助记口诀是钩封边有钩提笔。以下例字首形都符合钩封闭形定义。
例字:月 电 用 甩 巴 氏 民 弗 已 冉 那 丹 册 隶 曳 母 两
代码:V V V V V V V V V V B A V J L A J
上述封闭形在七形定义码中是研究三条或三条以上笔画的连接形态,其取码规律是以首笔画为中心的首形或以末笔画为中心的尾形,其首形的首笔画或尾形的末笔画必是构成封闭形的一条边,再看构成封闭形的所有笔画整体符合哪些封闭形定义。例:田、月、民、巴不能取成口、
已,因为田、月、民、巴中的每一条笔画都是构成封闭形的一条边,所以要取田、月、民、巴等字的整体。
例:取、果、丹、虫、开、回字的首形。首先找出它们的首笔画分别是(丨、丿、丨、一、丨),首笔画与其它笔画共同组成封闭形整体是(甲、果)
丹)(中虫)(口回)所以它们分别符合多直封闭形定义(甲果),钩封闭形定义
丹),双直封闭形定义(中虫)斜封闭形定义(开,
),单直封闭形定义(口回)。封闭形尾形取码方法与首形相同。
七:五行形定义:是本发明七形定义形码中唯一以意取形的形码。为了便于准确的理解和记忆以五行木、金、水、火、土之意从偏旁部首中取木、钅(金)、氵(水)、火、土、(土)之形为五行形码。
1、木行形(代码为W)例字:木 李 果 未 术
例形:木 木 木 木 木
2、金行形(代码为X)例字:钉 锐 锋 锁 铜
例形:钅 钅 钅 钅 钅
3、水行形(代码为Y)例字:池 波 海 河 江
例形:氵 氵 氵 氵 氵
4、火行形(代码为Z)例字:火 炎 灰 灭 烟
例形:火 火 火 火 火
5、土行形(代码为Z)例字:块 堤 土 寺 圭 去 幸 至 在
例形: 土 土 土 土 土 土 土
火行形与土行形合用一个代码Z。三、本发明七形定义汉字编码输入方法
七形定义形码是指完全按七形定义取的形码,以七形定义码为主体,可以有多种汉字编码输入方案。
(一)、七形定义音形码汉字编码输入方法
1、七形定义音形码单汉字编码输入
(1)、七形定义音形码单汉字码包括首形码+尾形码+音码,按三个健位的编码输入。
首形码:是一个汉字以首笔画为中心符合七形定义形码规则的编码。
尾形码:是一个汉字以末笔画为中心符合七形定义形码规则的编码。
音 码:是以汉字的声母(在健盘上表现为相对应的大写英文字母)为音码。
例:字 首形+尾形+音=码 字 首形+尾形+音=码
舌(亻) (口) S IRS 冷 (冫) (マ) L CML
(2)、如果一个汉字为多音字其音码可取任一拼音声母。
例:字 码 字 码 字 码 字 码
重 IPC 参 NDC 校 EJX 恶 REE
重 IPZ 参 NDS 校 WJJ 恶 REW
(3)、对于没有读音的偏旁部首或字根的输入在首尾码后加字母V,作为音码。
例:首形码 尾形码 音码 首形码 尾形码 音码
(A A V) (X X V)
(A A V) (A I V)
(N A V) (E E V)
(B B V) (L A V)
国标所属6763个汉字编码见七形定义音形码表。
(4)、繁体字是汉字文化的一部分。为了研究和使用的需要,如港、澳、台地区由于各种原因仍然大量地使用繁体字,所以解决繁体字的输入具有重要的意义,而七形定义形码既能输入简化汉字又能输入繁体汉字。
繁体汉字的输入方法与简化字的输入方法一样也是取以首笔画为中心符合七形定义形码的形码为首形码,取以末笔画为中心符合七形定义形码的形码为尾形码。取汉字的拼音声母为音码。
例:马(OAM) 车(NGC) 间(ESJ) 见(BLJ)
馬(VDM) 車(GGC) 間(SVJ) 見(TKJ)在实际操作输入中,繁体字的输入不是经常性的。所以应把简化字与繁体字分为两级,如果需要输入繁体字则可以用功能键来转换,以提高简化字的输入速度。
(5)、在对半包围(匠字框)或全包围口(大口框)的形码中,如果汉字的首形和尾形为同一体,则首形码取首形,尾形码取以次末笔画为中心符合七形定义形码的形码。
例: 字 首形 尾形 码 字 首形 尾形 码
首区 匚 ㄨ BJQ 首枢 木 匚 WBS
尾匠 匚 BGJ 尾筐 匚 HBK
一回 口 口 RRH 异咽 口 口 RRY
体围 口
ROW 体恩 口 心 REE2、词汇码编码输入
使用词组输入会使汉字的输入速度更快。所有的词汇码都是四码位。词汇在代码的取码规则分为以下四种类型。
(1)、双字词
双字词的编码取法为:依次序取每个单字符合七形定义的首形+尾形,共四码组成。
例:词组 首形+尾形+首形+尾形=码
中华 中 + 中 + 亻 + 十 =(SSIG)
三字词的编码取法为:取前两个字的首形码,取最后一个汉字的首形码和尾形码共四码组成。例:词 组 首形+首形+首形+尾形=码
计算机 讠 + + 木 + 几 =(EHWB)
中国人 中 + 口 + 人 + 人 =(SRJJ)
(3)、四字词
四字词组的编码,分别取四个单字的首形码共四码组成。
例:词 组 首形+ 首形+ 首形 + 首形 =码
(4)、多字词
多字词组的编码,分别取第一、第二、第三、及最后一个字的首形码,共四码组成。
七形定义码可实现纯单字输入,也可以实现单字与词组混合输入。由于单字输入是三个码位所以混合输入时要在单字的三个码位后加击一个空格健。
例:单字 单字 词组=单字码 +单字码 +词组码
我 是 学生=LAO空格+SIS空格+FKHP4、重码处理
七形定义音形码的纯单字输入由于只使用了首形码+尾形码+音码共三个码位组成,所以重码只占国标6763个汉字的三分之二左右。大部分为两个字,三个字一组的重码,四个字至九个字一组的重码极少如采用高频汉字先上屏幕的原则,则有60-70%左右的汉字只需击三次键就能完成七形定义音形码的纯单字输入,实现了汉字易学易记快速输入的目的。词组重码的输入用选择键进行选择。
(二)、七形混合定义音形码汉字编码输入法
本发明七形定义形码是完全按定义对笔画组合进行归类的取码方法。此种取码方法可以把笔画、偏旁部首和所有汉字(包括繁体字)的笔画组合统一起来,一个定义确定一个代码规律性极强。但由于汉字的结构复杂,一方面要求取码有易学易记和规律性极强的特点,另一方面又要求重码极少甚至是无重码。我们以七形定义码为主体调整部分偏旁部首的笔画组合,就成为一套七形混合定义编码。与上述七形定义形码相比一是扩大了编码的空间容量,二是减少了重码。
1、七形混合定义编码方法:
(1)把心(心字底)从钩散形分离出来归入五行中的金行(钅心代码X)。
(2)、把辶(走字底)从顺时针折笔连形中分离出来归入五行中的水行(氵,代码Y)。
(3)、把笔画组合人字形(包括人从众贝页亥字的尾形)从斜斜连形中分离出来归入竖平行对称形(艹,人从众贝页亥代码Q)。
(5)、把偏旁部首(竹字头)从横斜连形中分离出来归入斜斜连形(,ㄨ
代码J)。
2、七形混合定义音形码汉字编码输入
混合定义音形码的纯单字输入、词组输入、繁体字输入与七形定义音形码的输入方法相同,不同的是调整后的笔画组合和偏旁部首不能按定义取码。
例:七形定义音形码 七形混合定义音形码
思——TES 思——TXS
过——KMG 过——KYG
贝——BJB 贝——BQB
寸——KAC 寸——KFC
龙——HAL 龙——HFL
笔——HKB 笔——JKB
跟——RJG 跟——LJG由于七形定义形码中的金行(钅)、水行(氵)、竖平行对称行
本发明有如下特点
1、以七形定义形码为主体的汉字编码有七形定义音形码和七形混合定义音形码几套编码方案,以满足不同操作者的需要。
2、七形定义音形码和七形混合定义音形码可以纯单字输入,单字与词组混合输入,还可以对简化字和繁体字进行输入。
3、七形定义形码易学易记规律性及强,只要熟记定义就能见字知码。不用字根也不拆分汉字有相对的稳定性和可扩充性,不随汉字的演变而改动。
4、以七形定义形码为主体的七形定义音形码只有首形码+尾形码+音形码共三个码位组成,所有汉字输入连选择键在内不超过击四次键。如果采用高频汉字先上屏幕的原则,则在国标规定的6763个汉字中60-70%的汉字输入只需要击三次键,相当于有3000-4000个简码汉字,而五笔字型只有600多个简码汉字,因而提高了汉字的输入速度。5、解疑
例1、成(厂首形) 内(冂首形)
虽然以上两个例字的首形分离出来后符合组合线形定义,但七形定义形码是研究笔画在汉字中的组合规律,是不折分的。例字中首形在汉字中有其它笔画相连,不能独立成为组合线形所以以上例字首形分别符合横斜连形定义和折钩连形定义。
例2、米 半 卷 办 东 亦——首形(丷)和尾形(
)在书写上是连续对称的独立笔画符合七形定义形码双散形定义。
例5、豕 水 飞 兆 泰 隶——例字中尾形的末笔画是一条斜笔画,最后与末笔画相连的也是一条斜笔画所以符合斜斜连形定义。
例6、白 自——例字中首笔(ノ)与折笔画()最先相连成
形所以首形符合顺折连形定义。
例9、正 未 止 业 非——平行对称形的平行笔画只被轴线笔画连接而不能与其它笔画相连,轴线笔画也要在平行笔画相对的中心位置连接如:干、里、全字的首形或尾形都符合平行对称形定义而例9中汉字的首形或尾形不符合平行对称形定义。
例10、至 壬 寺 圭 庄——土行形是从平行对称形中分离出来的,所以首先要符合平行对称形定义。区别是只有两条平行笔画并且竖笔画只可能与其它笔画相交而不能交叉例10中汉字的首形或尾形符合土行而例字里字的尾形不符合土行形。另外独立的土字和独立的士字是不一样的形码。
例11、平 巫——平行对称形(干,工)在汉字中不与其它笔画相连接所以符合平行对称形定义。
例12、臼——朱笔画(一)与折笔画()最后相连成()形所以尾形符合顺时针折笔画连形定义。
例13、斜封闲形如:女、尸、开和多封闭形如:四、西、酉的区别是斜封闭形中的斜笔画至少有一外端点在封闭形外。而多封闭形如:四、西、酉中虽然有斜笔画但斜笔画端点都在封闭形内。
例14、聂、耿、具、助把耳字旁、且字旁归入多直封闭形。
例15、乏、买字的首形不能取成散形,而只能取成笔画线形(ノ,乏)(乛,买)
例16、穴字的首形或尾形分别取成(宀,八)。
例17、予 矛字的首形是(マ),按字典中的解释为一条横折笔画()一条斜笔画(丶)互相连接成(マ),所以应归为顺时针折笔画连形。
例18、(食字旁)、欠、尔、农、鸩字的首形,按字典中的解释为首笔画是斜笔画,第二笔画是横钩笔画(乛),所以它们的首形应归为斜钩连形。
注:七形定义形码以汉字的印刷体为取形标准,同时兼顾人们的书写习惯。
Claims (5)
1、一种电脑汉字形码的编码方法,其特征在于它将汉字的所有笔画、偏旁部首及汉字的首形或尾形按笔画的分布与组合规律分为线形、散形、单笔画连形、折笔画连形、平行对称形、封闭形和五行形七大形态,此七大形态又按定义分为二十六分形,配以相应的二十六个大写英文字为编码。
2、如权利要求1所述的电脑汉字形码的编码方法,其特征在于七大形态下属的二十六分形分别为:
线形分为:笔画线形、组合线形;
散形分为:双散形、多散形、钩散形、混合散形;
单笔画连形分为:横竖连形、横斜连形、竖斜连形、斜斜连形、直钩连形、斜钩与钩钩连形;
折笔画连形分为:顺时针折笔画连形、逆时针折笔画连形、折钩笔画连形;
平行对称形分为:横平行对称形、竖平行对称形;
封闭形分为:单直封闭形、双直封闭形、多直封闭形、斜封闭形、钩封闭形;
五行形分为:金行、木行、水行、火行、土行。
3、如权利要求1、2所述的电脑汉字形码编码方法,其特征在于单汉字的编码由首形码+尾形码+音形码组成;所述首形码是一个汉字以首笔画为中心符合上述七形定义编码规则的形码,所述尾形码是一个汉字以末笔画为中心符合上述七形定义编码规则的形码,所述音码是以汉字的声母为编码。
4、如权利要求3所述的电脑汉字的编码方法,其特征在于没有读音的偏旁部首或字根,其音码为大写英文字母V。
5、如权利要求1、2所述的电脑汉字形码的编码方法,其特征在于双字词语的编码由第一个汉字的首形码+尾形码+第二个汉字的首形码+尾形码组成,三字词语的编码由第一个汉字的首形码+第二个汉字的首形码+第三个汉字的首形码+尾形码组成,四字词语的编码方法由第一、第二、第三、和第四个汉字的首形码共四码组成。多字词语的编码方法由第一个汉字、第二个汉字、第三个汉字和最后一个汉字的首形码共四码组成,所述首形码是一个汉字的首笔画为中心符合上述七形形码定义编码规则的形码,所述尾形码是一个汉字以末笔画为中心符合上述七形形码定义编码规则的形码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 99114945 CN1245918A (zh) | 1999-06-18 | 1999-06-18 | 七形定义汉字形码编码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 99114945 CN1245918A (zh) | 1999-06-18 | 1999-06-18 | 七形定义汉字形码编码方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1245918A true CN1245918A (zh) | 2000-03-01 |
Family
ID=5277974
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 99114945 Pending CN1245918A (zh) | 1999-06-18 | 1999-06-18 | 七形定义汉字形码编码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1245918A (zh) |
-
1999
- 1999-06-18 CN CN 99114945 patent/CN1245918A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN85101817A (zh) | 安子介式汉字笔形电脑编码法及其键盘 | |
CN1900886A (zh) | 单击与多键并击混合输入中、英文的方法和键盘 | |
CN1031302C (zh) | 汉字部首分类编码输入方法 | |
CN1245918A (zh) | 七形定义汉字形码编码方法 | |
CN1163815C (zh) | 汉语形声字输入方法 | |
CN1808355A (zh) | 中文谐音输入法 | |
CN1851620A (zh) | 笔画汉字输入法及其专用键盘 | |
CN1045128C (zh) | 音形三码计算机汉字输入法 | |
CN1129836C (zh) | 形意类字母汉字多功能输入法 | |
CN1116634C (zh) | 一种汉字拼音语言文字编码的计算机汉字输入方法 | |
CN101051246A (zh) | 一种计算机键盘形象码汉字编码输入法 | |
CN1121646C (zh) | 写字码电脑汉字输入法 | |
CN1054695C (zh) | 计算机汉字八四码输入法及键盘 | |
CN1030156C (zh) | 英文/东方文字根象形输入法 | |
CN1074842C (zh) | 简明数码汉字输入方法 | |
CN1632725A (zh) | 实现汉字结构变化不同同步显示的汉字输入系统 | |
CN1109288C (zh) | 模糊元码汉字输入法 | |
CN1124539C (zh) | 计算机汉字输入方法及键盘 | |
CN1276337C (zh) | 计算机汉字编码输入方法 | |
CN1725156A (zh) | 汉字输入方法及使用该方法进行输入的键盘 | |
CN1038366C (zh) | 计算机汉字输入方法 | |
CN1043209A (zh) | 计算机汉字处理方法 | |
CN1645297A (zh) | 实现日语平假名、片假名和汉字混合输入的系统 | |
CN1123820C (zh) | 形音汉字输入方法 | |
CN1387106A (zh) | 一种汉字拼音语言文字编码方法及其键盘 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned | ||
C20 | Patent right or utility model deemed to be abandoned or is abandoned |