CN1223397A - 写字码电脑汉字输入法 - Google Patents
写字码电脑汉字输入法 Download PDFInfo
- Publication number
- CN1223397A CN1223397A CN 98117188 CN98117188A CN1223397A CN 1223397 A CN1223397 A CN 1223397A CN 98117188 CN98117188 CN 98117188 CN 98117188 A CN98117188 A CN 98117188A CN 1223397 A CN1223397 A CN 1223397A
- Authority
- CN
- China
- Prior art keywords
- code
- piece
- font
- chinese character
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Document Processing Apparatus (AREA)
- Controls And Circuits For Display Device (AREA)
Abstract
本发明是一种把组成汉字结构的基本元素归纳为:“八种笔画、四种块”的写字码电脑汉字输入法,采用以声代形的取码方式,利用拆首(或末)笔画法的拆码规则和人们日常对汉字结构的描述方式对汉字进行编码,编码规范、易懂;如:丙=横内(BHN);串=吕竖(CLS);矛=矛撇(MYP);令=今点(LJD);玲=王今点(LWJD);国=口里玉(GKLY));闯=门里马(CMLM);李=木下子(LMXZ)。由于单字输入重码率低于6.5%,故本发明适合于广大电脑爱好者使用。
Description
本发明是一种采用音形码编码方案的电脑汉字输入法。
本发明的任务就是提供一种简单易学、编码规范、直观、易懂,单字输入重码率低于6.5%的写字码电脑汉字输入法;写字码电脑汉字输入法(以下简称写字码)是以方块汉字的“块”为基础,并把人们日常对汉字结构的描述方式溶入编码方案,充分利用人们在日常生活中读写汉字时对汉字结构的印象来达到见字识码的目的。
本发明把构成所有汉字的基本元素归纳为:“八种笔画、四种块”。一.组成汉字结构的八种笔画及其代码
笔画 横 竖 撇 捺 折 提 点 钩
代码 H S P N Z T D L
关于竖、折、钩三种笔画的笔形结构的划分特作如下说明:
1.竖笔画:是指垂直向下竖写的一笔;竖笔画的笔形结构为:“丨”。
注意:这里把“钩”笔画的取码特定为:“L”;这是与其它几种笔画取码不同的地方。
二.组成汉字结构的四种块及其取码约定
所谓“块”,这里定义为:在汉字结构中独立存在的偏旁部首、字形块、近似字形块及一个或几个相连的笔画组成的既不是偏旁部首也不是字形块或近似字形块的汉字结构中的其它部件均称为组成汉字结构的“块”。
块的划分原则:是以写字码所指定的偏旁部首和近似字形块为基础,在遵循以下编码方案和取大字优先的原则基础上,以每个汉字能分解成由偏旁部首形块、字形块和近似字形块组成的三个“块”者优先。
如:操 扌品木 染 氵九木 糊 米古月 鞭 革亻更 熟 享丸灬
敌 千口攵 翼 羽田共 懿 壹次心 额 宀各页 倔 亻尸出
朝 十早月 薪 艹亲斤 冀 北田共 票 西二小 捺 扌大示
翠 习习卒 茫 艹氵亡 落 艹氵各 警 苟攵言 照 日召灬
在取大字优先的前提下,如果存在不同的分块情况,应以取散块优先;
如:禁 木木示 祟 出二小
但是,当不足三个块的汉字中含有脱离开相交或相连的笔画后被分开的两部分均能构成字(或偏旁部首、近似字)形块的部件时,应在脱离开相交或相连的笔画后再进行分块。
1.偏旁部首形块及其代码
对于上述几个规范性偏旁部首和引申偏旁部首的特殊取码方法作如下说明:
如:示字旁“礻”和衣字旁“衤”在《现代汉语词典》中又分别称为:“示补儿”和“衣补儿”,由于这两种偏旁在结构上非常接近,为了避免出现在输入汉字的过程中对这两种偏旁的区分,统一取。示补儿”和。“衣补儿”中“补”字的声母“B”作为其代码。
把“豸”,引申为“豺字旁”.并取其代码为:“C”。
卷字头
的代码职为:“J”。把
引申为:“祭字头”,职其代码为:“J”。
把“匚”引申为“区字框”,并职其代码为:“Q”。
折文旁“夂”、反文旁“攵”和王字旁
的代码都取为:“W”。
竖心旁“忄”的代码是取“心”字的声母“X”作为代码;并把“彐、厷、、乡”分别引申为“雪字底”、“雄字旁”、“小字头”和“夕字头”,其代码均取为:“X”。
2.近似字形块及其代码
近似字形块:是指在字形结构上与现有汉字很相近但又不是汉字的汉字结构中的部件。近似字形块的取码原则是:取与其在结构上相近的汉字读音的首字母作为代码。
本发明常用到的近似字形块及其代码有:
说明:在汉字结构中,不论是近似字形块还是偏旁部首形块(包括引申偏旁部首)的取码都是固定的,且都是以取大优先,不可以拆分。
如:在“尚、肖”两个汉字中就分别含有上面所引申的尚字头
、小字头“”和近似字形块
,按照取大优先的原则,应把“尚”字分解成尚字头
和“口”字形块两部分;把“肖”字分解成小字头“”和近似字形块
两部分。
3.字形块及其代码
字形块:是指在汉字结构中所含有的字。
如:在汉字“差、墩、敬”中分别含有“工、享、句”三个字形块。
字形块的取码原则:在取大字优先的前提下,取对字形块读音的首字母作为其代码。
说明:一个字形块可以包含有子字形块、偏旁部首形块、近似字形块和非字形块;但是当在取大字优先的基础上,不能把汉字分解成三个或三个块以上时,应把包含有其它块的字形块分解成若干个子项块。
如:在取大字优先的前提下,只能把“剑”字分解成“佥”字形块和立刀旁“刂”两部分;但是,由于字形块“佥”还可以继续分解,因此在对“剑”字进行编码时,应把其分解成、一、非字形块”和立刀旁“刂”四部分。
特别约定:
(1)取字母“U”作为“鱼”字的首声码。
(2)当“日、曰、目、子、孑、米、厶”七个汉字中的某一个在汉字结构中是作为一个字形块存在时(除其本身的编码按照以下编码方案中的编码规则进行编码外),在任何情况下都不对这七个字形块进行拆码,并分别取其代码为:“R、R、M、Z、Z、M、Y”。
此外,有些偏僻汉字在日常生活中虽然不经常用到,但在汉字结构中却大多含有这些字形块存在,为此这里把一些在编码过程中常用到的偏僻汉字及其读音的首字母列表如下:
4.非字形块及其取码原则
非字形块:是指由一个独立的笔画或几个相连或相交的笔画组成的除写字码所指定的偏旁部首形块、字形块和近似字形块外的汉字结构中的其它部件。
非字形块的取码原则:在遵循写字码编码方案的基础上,按照以下优先顺序进行取码:
(1)当汉字结构中的非字形块是一个独立的笔画时,其代码就是取其笔画的代码。
如:在“俪”字中的次块“一”和“引”字中的末块“丨”都属于汉字结构中的由一个独立的笔画构成的非字形块,故按照上述原则应分别取其代码为:“H”、“S”。
(2)当由两个或多个笔画组成的汉字结构中的非字形块在与其前面(或其后面)的相邻块或几个结构块结合在一起后,如果能够构成字形块,且所构成的字形块不是被编码汉字本身,非字形块的代码是取与其前面(或其后面)的相邻块或几个结构块结合在一起后所构成的字形块的代码。
如:在“槽、橄、都”三个汉字中分别含有非字形块
,由于其分别在汉字结构中能与其后面的相邻块“日、攵、日”结合在一超后构成字形块“曹、敢、者”,故按照上述规定,对“槽、橄、都”三个汉字中非字形块的取码分别为:“C、G、Z”。
(3)当由两个或多个笔画组成的汉字结构中的非字形块在去掉其首(或末)笔画后,如果其剩余部分能够构成字形块,那么该非字形块的取码为:“非字形块的首笔画代码+去掉其首笔画后所构成的字形块读音的首字母”或“去掉非字形块的末首笔画后剩余部分所构成的字形块读音的首字母+非字形块的末笔画代码”;当汉字的编码超过四码时,只取非字形块的首笔画的代码作为其代码。
如:在“曹、敢、者”三个汉字中所含有的非字形块
,在分别去掉其首(或末)笔画后其剩余部分分别能构成“曲、耳、土”三个字形块,故把非字形块
在“曹、敢、者”三个汉字中分别拆成“横曲、折耳、土撇”,并分别取其代码分别为:“HQ、ZE、TP”。
这类常用的非字形块还有以下几个,它们分别存在于以下汉字中:
(4)其余情况下只取非字形块首笔画的代码作为非字形块的代码。
如:画 一田折 餐 竖又食 段 撇几又 鬼 撤厶 所 撇斤 那 折阝三.对于不足四码的汉字补足码的取码约定及优先权
1.当只有两个块组成的汉字结构的末块中含有由末笔画组成的除末块本身外的且不与其它笔画相交的最大字形块时,取该字形块的代码作为补足码;
如:棹 木卓早(Z) 绝 纟色巴(B) 帔 巾皮又(Y) 傀 亻鬼厶(Y) 涌 氵甬用(Y)
2.当只有两个块组成的汉字结构的末块中不含有由末笔画组成的除末块本身外的最大字形块时,如果末块是一个字形块就取其首笔画的代码作为补足码;如果末块是一个非字形块,则是取非字形块的末笔画的代码作为补足码。
如:捭 扌卑撇(P) 芭 艹巴折(Z) 沌 氵屯横(H) 钇 钅乙折(Z) 铣 钅先撇(P)
朽 木横折(Z) 是 日横捺(N) 戎 戈横撇(P) 第 折撇(P) 冱 冫互横(H)
3.当组成汉字结构的末块是偏旁时,重复输入该偏旁的代码作为补足码。
如:邺 业阝阝(E) 刖 月刂刂(L) 郫 卑阝阝(E) 祁 礻阝阝(E)四.编码方案
编码说明:每个汉字的最长编码为四位,取对汉字读音的首字母作为汉字编码的首码(以下称之为首声码),对于多音字可以分别取对其读音的首字母作为首声码;其它几位编码则是分别取由汉字的基本元素“八种笔画、四种块”所构成的字形结构的特征码。
“V”键为通用代码键,在不知道汉字的某位编码时可以用“V”键来代替。
1.拆首笔画法
去掉汉字的首笔画后,其剩余部分还可以构成字形块的汉字的编码规则为:
汉字编码=首声码+首笔画代码+去掉汉字的首笔画后所成字形块读音的首字母。
如:来横米LHM 丙横内BHN 王横土WHT 天横大THD 午撇干WPG
干横十GHS 禾撇木HPM 方点万FDW 末横木MHM 千撇十QPS
白撇日BPR 百横自BHB 夫横大FHD 矢撇天SPT 元横兀YHW
亚横业YHY 正横止ZHZ 买折头MZT 朱撇未ZPW 自撇目ZPM
戋横戈JHG 再横冉ZHR 乏撇之FPZ 吏横史LHS 丢撤去DPQ
良点艮LDG 下横卜XHB 灭横火MHH 乇撇七TPQ 夭撇大YPD
户点尸HDS 失撇夫SPF 主点王ZDW 币撇巾BPJ 无横尢WHY
未横木WHM 大横人DHR 卞点下BDX 广点厂GDC 歹横夕DHX
2.拆末笔画法
去掉汉字的末笔画后,其剩余部分还可以构成字形块的汉字的编码规则为:
汉字编码=首声码+去掉汉字的末笔画后剩余部分所成字形块读音的首字母+汉字的末笔画的代码。
如:用 月竖YYS 甩 月钩SYL 令 今点LJD 土 十横TSH 士 十横SSH
生 牛横SNH 太 大点TDD 犬 大点QDD 本 木横BMH 中 口竖ZKS
产 立撇CLP 申 日竖SRS 甲 日竖JRS 电 日钩DRL 玉 王点YWD
丰 三竖FSS 羊 兰竖YLS 串 吕竖CLS 尺 尸捺CSN 甚 其折SQZ
矛 予撇MYP 亏 二折KEZ 于 二钩YEL 乒 丘撇PQP 乓 丘捺PQN
子 了横ZLH 兔 免点TMD 凡 几点FJD 丸 九点WJD 术 木点SMD
孑 了提JLT 孓 了捺JLN 斥 斤点CJD 氐 氏点DSD 韭 非横JFH
如果在去掉汉字的首笔画或末笔画后其剩余部分都可以构成字形块,应以拆首笔画后剩余部分能构成字形块的取码优先;如:壬 撇士RPS。
这里把“少、世、丘”三个汉字的编码也按照拆末笔画法的取码规则特别约定如下:
说明:当汉字结构中含有可以用拆首(或末)笔画法拆码的字形块时,且当汉字结构中的其它结构块不能再进行分块或拆码时,除另有约定外,这类字形块也按照拆首(或末)笔画法的拆码规则进行取码。
如:玲
今点LWJD 洋 氵兰竖YDLS 污 氵二折WDEZ 泄 氵廿折XDEZ。
3.去掉汉字的前两个既不能构成字(或近似字)形块又不能构成偏旁部首的笔画后,其剩余部分还可以构成字形块或近似字形块的汉字的编码规则为:
汉字编码=首声码+首笔画代码+次笔画代码+去掉汉字的前两个笔画后剩余部分所构成的字形块或近似字形块的代码。
如:左 横撇工ZHPG 灰 横撤火HHPH 负 撇折贝FPZB 色 撇折巴SPZB
东 横折小DHZX 角 撇折用JPZY 欠 撇折人QPZR 贝 竖折人BSZR
尔 撇折小EPZX 卓 竖横早ZSHZ 布 横撇巾BHPJ 卢 竖横尸LSHS
石 横撇口SHPK 页 横撇贝YHPB 车 横折十CHZS 每 撇横母MPHM
说明:这里不能把“米”字中的前两个笔画当成写字码所引申的偏旁部首“丷”,因为“米”字中的前两个笔画是被其竖笔画分开的两个部分。又如,在对“半”字取码时也是不能把“半”字的前两个笔画当成引申部首“丷”。
4.在截断贯穿汉字上下结构的竖笔画后,使得被分开的两部分都能构成字(或近似字)形块的汉字的编码规则为:汉字编码=首声码+被分开的上层字(或近似字)形块的代码+X+被分开的下层字(或近似字)形块的代码。
如:里 田下土LTXT 熏 千下黑XQXH 果 田下木GTXM 击 土下山JTXS
重 千下里CQXL 出 山下山CSXS 番 采下田PCXT 缶 午下山FWXS
5.按照上述4条拆码规则不能进行拆码的独体字和国标字库中偏旁部首的编码规则为:
汉字编码=首声码+首笔画代码+次笔画代码+末笔画代码。
如:卑 撇竖竖BPSS 戈 横钩点GHLD 禺 竖折点YSZD 木 横竖捺MHSN
斤 撇撇竖JPPS 戊 横撇点WHPD 横 撤横WHPH 山 竖折竖SSZS
垂 撇横横CPHH 专 横横点ZHHD 也 折竖钩YZSL 平 横点竖PHDS
书 折折点SZZD 与 横折横YHZH 尸 折横撇SZHP 女 折撇横NZPH
开 横横竖KBHS 年 撇横竖NPHS 毛 撇横钩MPHL 上 竖横横SSHH
如果构成汉字或偏旁部首的笔画只有一个笔画或两个笔画,按实际笔画数取其代码
如:一 横YH 十 横竖SHS 乙 折YZ 力 折撇LZP 九 撇折JPZ
偏旁部首的编码=O(字母O)+首笔画代码+次笔画代码+末笔画代码。
如:彳=O+P(撇)+P(撇)+S(竖) 亻=O+P(撇)+竖(S)
6.对于不能分解成三个或三个块以上的汉字,当其结构中含有脱离开相交或相连的笔画后使得被分开的两部分能构成偏旁部首或近似字形块的部件时,汉字的编码规则为:在脱离开相交或相连的笔画后,按照其书写顺序分别取其首块代码、次块代码和末块代码。
7.左右结构汉字的编码规则
(1)由三个或多个块组成的汉字编码
①在取大字优先的前提下,对于能分解成由字形块、偏旁部首形块或近似字形块组成的三部分左右结构汉字的编码规则是:按照各个块的书写顺序取每个块的代码。
操 扌品木CTPM 糊 米古月HMGY 影 日京彡YRJP 结 纟士口JJSK
树 木又寸SMYC 赣 章夂贡GZWG 插 扌千臼CTQJ 涨 氵弓长ZDGZ
倾 亻
页QRBY 技 扌十又JTSY 阿 阝
口AEDK 掏 扌勹甫TTBF
②当由三个块组成的左右结构的汉字中含有非字形块时,对其中非字形块的取码应按照非字形块取码原则中的有关规定进行,汉字的编码规则为:按照各个块的书写顺序分别取各个块的代码。
漓 氵亠离LDDL 倌 亻宀官GRBG 偏 亻户扁PRHB 骋 马由横CMYH
搌 扌尸展ZTSZ 梯 木丷弟TMDD 猪 犭者日ZQZR 墙 啬回QTSH
③含有三个块以上的左右结构汉字的编码规则为:应优先对左边块取大字,当其右边的块不能进行分块或当左边的几个块结合在一起后不能构成字形块时,再对左边块进行分块取码,汉字的编码规则为:汉字编码=首声码+首块代码+次块代码+末块代码。
如:激 氵白攵JDBW 假 亻折又JRZY 撬 扌毛毛QTMM 撰 扌巳共ZTSG
摘 扌亠古ZTDG 溜 氵留田LDLT 俪 亻一丽LRHL 潮 氵十月CDSY
瀑 氵日水PDRS 欲 谷欠人YGQR 辞 舌立十CSLS 磁
CSDY
疏
亠钩SZDL 谵 讠詹言ZYZY 谬 讠羽彡MYYP 壤 亠
RTDP
稿 禾亠口GBDK 僻 亻尸辛PRSX 瀛 氵亡凡YDWF 鼾 自田干HZTG
颤 亠回页CDHY 短 矢横豆DSHD 翰 十早羽HSZY 酸 酉厶攵SYYW
当汉字结构中含有与整体字读音的首字母相同的字形块时,应优先对该字形块进行分块取码;如:豁宀丰谷HBFG。
(2)由两个块组成的左右结构汉字的编码
①当由两个块组成的左右结构的汉字中含有可以用拆首(或末)笔画法进行拆码的字形块时,汉字的编码规则为:优先对该字形块进行拆码,并按照各个块的书写顺序分别取其拆码后的代码。
如:肤 月横大FYHD 杜 木十横DMSH 样 木兰竖YMLS 胜 月牛横SYNH
柄 木横内BMHN 砂
撇SSXP 铲 钅立撇CJLP 沫 氵横木MDHM
枉 木横土WMHT 刊 横十刂 KHSL 使 亻横史SRHS 执 扌九点ZTJD
利 撇木刂LPML 和 撇木口HPMK 拆 扌斤点CTJD 列 横夕刂LHXL
伸 亻日竖SRRS 访 讠点万FYDW 托 扌撇七TTPQ 眇 目
撇MMXP
说明:如果当组成汉字结构的两个块都能够用拆首(或末)笔画法进行拆码时,应优先拆与整体字读音相同的字形块;如:种=Z+H(禾)+K(口)+S(竖)。
②当由两个块组成的左右结构汉字中的字形块不能使用拆首(或末)笔画法进行拆码时,或当组成汉字结构的两个块是偏旁部首形块或近似字形块时,汉字的编码规则为:
汉字编码=首声码+首块代码+次块代码+补足码。
垠 艮折YTGZ 虹 虫工 HCG 仇 亻九 CRJ 涿 氵豕横ZDSH
攻
攵 GGW 郎
阝 LLE 极 木及 JMJ 机 木几JM和JMJP
说明:除重码汉字外,对于大多数常用汉字一般不加补足码。
③当组成汉字结构的两个块中有一个块是非字形块时,汉字的编码规则为:
汉字编码=首声码+首块代码+次块代码+补足码。
当其中含有可以用非字形块取码规则中的拆首(或末)笔画后其剩余部分能构成字形块的非字形块时,按照各个结构块的书写顺序分别取其拆码后的代码。
8.“品”字形结构和倒“品”字形结构汉字的编码规则为:
按照各个块的书写顺序在取大字优先的前提下,分别取“品”字形或倒“品”字形结构汉字中前两个块的首块代码和末块代码。
鼎 目
DMPP 势 扌丸力STWL 熟 享丸灬SXWD 染 氵九木RDJM
戆 章夂心GZWX 薪 艹亲斤XCQJ 露 雨
各LYZG 茫 艹氵亡MCDW
落 艹氵各LCDG 繁 每攵小FMWX 照 日召灬ZRZD 堡 亻呆土BRDT
警 苟攵言JGWY 禁 木木示JMMS 堕 阝有土DEYT 翠 习习卒CXXZ
集 亻点木JRDM 崔 山亻点CSRD 乔 夭撇竖QYPS 介
撇竖JRPS
9.上下结构汉字的编码规则及优先权
(1)由上中下三个字形块或近似字形块组成的汉字,优先按照由上到下的顺序取每个块的代码。
如:章 立日十ZLRS 竟 立日儿JLRE 意 立日心YLRX 冀 北田共JBTG
(2)在取大字优先的前提下,由两个块组成的上下结构汉字的编码规则:
①由上下两个字(或近似字)形块组成的上下结构汉字的编码规则为:
汉字编码=首声码+上层字(或近似字)形块的代码+X+下层字(或近似字)形块的代码。
如:李 木下子LMXZ 剪 前下刀JQXD 皂 白下七ZBXQ 穿 穴下牙CXXY
究 穴下九JXXJ 崇 山下宗CSXZ 弯 亦下弓WYXG 窗 穴下囱CXXC
亲 立下
QLXM 舌 千下口SQXK 吕 口下口LKXK 孟 子下皿MZXM
感 咸下心GXXX 靠 告下非KGXF 奔 大下卉BDXH 真 直下
ZZXB
柔 矛下木RMXM 誉 兴下言YXXY 晨 日下辰CRXC 卡 上下卜KSXB
雹 雨下包BYXB 惫 备下心BBXX 忠 中下心ZZXX 忍 刃下心RRXX
吞 天下口TTXK 零 雨下令LYXL 奕 亦下大YYXD 焉 正下
YZXY
②在取大字优先的前提下,当组成汉字上下结构的两个块中,至少有一个块是偏旁部首形块或近似字形块时,汉字的编码规则为:汉字编码=首声码+首块代码+次块代码+补足码。
如:芭 艹巴折BCBZ 笔 毛撇BZMP 惠 横心HHX 亦 亠撇捺YDPN
说明:当这种结构的汉字中含有可以用拆首(或末)笔画法进行拆码的字形块时,汉字编码规则为:按照从上到下的顺序分别取各个块拆码后的代码。
③当组成上下结构汉字的两个块中,含有可以用对非字形块取码规则中的拆首(或末)笔画后其剩余部分可构成字形块的非字形块时,汉字的编码是按照由上到下的顺序分别取各个块拆码后的代码。
如:告 撇土口GPTK 老 土撇匕LTPB 者 土撇日ZTPR 考 土撇横KTPH
(3)在取大字优先的前提下,对于不能分解成上下两个或三个字形块的汉字,且当其是由三个或多个其它块组成的上下三层或多层结构汉字的编码规则为:在取大字优先的基础上,按照由上到下的顺序分别取其前两层靠左侧的首块代码和最底层的末块代码。
如:器 口犬口QKQK 攀 木大手PMDS 赢 亡口凡YWKF 褒 亠保
BDBP
登 癶一豆DDHD 爵
罒寸JPSC 熊 厶月灬XYYD 卒 亠从十ZDCS
(4)在取大字优先的前提下,对于不能分解成上下两个或三个字形块的汉字,且当其是由三个或多个其它块组成的上下两层结构汉字的编码规则为:
在取大字优先的基础上,按照各个块的书写顺序分别取其首块代码、次块代码和末块代码;如:辔 纟车口PJCK。
10.“口”字形结构和“门”字形结构汉字的编码规则为:
(1)当“门”或“口”字里所含有的块是字形块时,汉字的编码规则为:
汉字编码=首声码+KL(或ML)+口(或门)内所含有的字形块读音的首字母。
如:国 口里玉GKLY 回 口里口HKLK 囚 口里人QKLR 团 口里才TKLC
困 口里木KKLM 因 口里大YKLD 固 口里古GKLG 四 口里儿SKLE
围 口里韦WKLW 圆 口里员YKLY 圈 口里卷JKLJ 图 口里冬TKLD
问 门里口WMLK 闯 门里马CMLM 闲 门里木XMLM 闵 门里文MMLW
间 门里日JMLR 阔 门里活KMLH 阐 门里单CMLD 阀 门里伐FMLF
闭 门里才BMLC 闪 门里人SMLR 闻 门里耳WMLE 阁 门里各GMLG
此外,把“日、目、目、田”四个汉字的编码规则特别约定为:
如:日 口里横RKLH 目 口里二MKLE 日 口里横YKLH 田 口里十TKLS
注意:这里把“口”内的单一横笔画取码为:“H”,两个横笔画的取码为:“E(二)”。
说明:当汉字中含有“田”字形块且在汉字结构中的其它块不能拆码时,应把“田”字形块分解成“口、十”两部分,并取其代码为:“KS”;如:钿 钅口十DJKS。
(2)当“口”或“门”字里所含有的块不是字形块时,汉字的编码规则为:应按照由外向里的顺序分别取其首块代码、次块代码和末块的代码;
如:阙=Q+M(门)+D(尹)+Q(欠) 圜=H+K(口)+S(罒)+P
11.带有走之旁“辶”汉字的编码规则:
(1)当走之旁“辶”上是一个字形块或近似字形块时,汉字的编码规则为:
汉字编码=首声码+走之旁“辶”上字(或近似字)形块读音的首字母+XZ。
如:这 文下辶 ZWXZ 过 寸下辶 GCXZ 遇 禺下辶YYXZ 道 首下辶 DSXZ
造 告下辶 ZGXZ 还 还下辶 HBXZ 逋 甫下辶BFXZ 速 束下辶 SSXZ
迫 白下辶 PBXZ 选 兆下辶 TZXZ 送 关下辶 SGXZ 选 先下辶 XXXZ
迷 米下辶 MMXZ 迹 亦下辶 JYXZ 逸 兔下辶 YTXZ 逮 隶下辶 DLXZ
(2)当走之旁“辶”上所含有的字形块读音的首字母与整体字读音的首字母相同时,应优先对该字形块进行分块取码或用拆首(或末)笔画法进行拆码,汉字的编码规则是:按照各个块的书写顺序分别取其拆码后的代码。
如:达 一人辶 DHRZ 返 反又辶 FFYZ 迟 尸捺辶 CSNZ 述 木点辶 SMDZ
遍 户扁辶 BHBZ 远 一兀辶 YHWZ 逦 一丽辶 LHLZ 逅 后口辶 HHKZ
运 二厶辶 YEYZ 逗 一口辶 DHKZ 迕 撇干辶 WPGZ 迁 撇十辶 QPSZ
逻 罒夕辶 LSXZ 逶 禾女辶 WHNZ 邈 豸白辶 MCBZ 迦 力口辶 JLKZ
逞 口王辶 CKWZ 适 千口辶 SQKZ 遛 留刀辶 LLDZ 避 尸口辶 BSKZ
逼 横口辶 BHKZ 遑 白王辶 HBWZ 遁 盾十辶 DDSZ 迸 丷开辶 BDKZ
(3)当走之旁“辶”上是由两个字形块或两个以上其它结构块组成时,汉字的编码规则是:按照汉字的书写顺序分别取首块代码、次块代码和走之旁“辶”的代码“Z”。如:透 禾乃辶 THNZ 邀 白方辶 YBFZ 迢 刀口辶TDKZ 邂 角刀辶 XJDZ
遮 广廿辶 ZGEZ 遣 中一辶 QZHZ 遐 折折辶 XZZZ 遢 日羽辶 TRYZ
(4)当走之旁“辶”上是一个或两个不能构成字形块的其它块时,汉字的编码规则为:按照汉字的书写顺序分别取走之旁“辶”上各个块代码和走之旁“辶”的代码。
如:逢 夂丰辶 FWFZ 迅 折十辶 XZSZ 迤 撇也辶 YPYZ 遂 丷豕辶 SDSZ
12.由于在国标字库中含有建字旁“廴”的汉字很少,为减少重码,把建字旁“廴”的代码取为:“J”,带有建字旁“廴”汉字的编码规则为:
汉字编码=首声码+建字旁“廴”上字(或近似字)形块读音的首字母+XJ。
13.含有“戊”字形块结构汉字的编码规则为:
按照由外向内所组成的各个结构块的顺序分别取其首块代码、次块代码和末块代码。
成 戊一口XWHK 戚 戊上小QWSX 减 冫戊口JDWK
说明:这里把“成”字的取码特别约定为:成=C+W(戊)+Z(戊字形块内折笔画的代码);对在汉字结构中“成”字形块的取码也是按照这一约定进行取码;如:铖钅戊折CJWZ。
14.其它半包围结构汉字汉字的编码规则为:
(1)在大字优先取码的前提下,当汉字能分解成三个或多个块时,按照由上到下、由左到右、由外向里的顺序依次取汉字结构的首块代码、次块代码和末块代码;
居 尸十口JSSK 瘕 疒折又XBZY 癌 疒品山ABPS 励 厂万力LCWL
瘾 疒阝急YBEJ 癣 疒鱼羊XBUY 匐 勹横田FBHT 腐 广付肉FGFR
(2)由两个块组成的半包围结构汉字的编码规则是:按照汉字各个结构块的书写顺序分别取各个块的代码和补足码。
厉 厂万 LCW 店 广占 DGZ 序 广予 XGY 向 撇口XPK
包 勹巳BBS 皮 折又 PZY 尾 尸毛 WSM 眉 折目MZM
(3)当由两个块组成的半包围结构的汉字中,含有可用拆首(或末)笔画法进行拆码的字形块时,应使用拆首(末)笔画法对该字形块进行拆码,汉字的编码规则是:按照书写顺序分别取各个块的拆码后的代码。
如:病 疒横内BBHN 氧 气兰竖YQLS 厌 厂大点YCDD 庆 广横人QGHR
说明:由于“方”字形块的读音与整体字“房”的读音相同,故在这里不对“户”字形块拆码,而是优先对“方”字形块进行拆码。
15.大写数字快速输入码的设置:
对于大写数字“壹、贰、叁、肆、伍、陆、柒、捌、玖、拾”,除可按照上面的编码规则进行输入外,为方便财会人员经常对大写数字的使用,写字码还设置了大写数字的快速输入编码,就是用字母“O”作为这十个大写数字的一级简码。
即:O=壹贰叁肆伍陆柒捌玖拾。
使用时只要输入“字母O+数字键(1、2、…、9、0)中的某一个数字,就可以分别快速输入大写数字“壹、贰、叁、肆、伍、陆、柒、捌、玖、拾”。
此外,对于财会人员经常使用的“元、角、分、佰、仟、万、亿、零”也设置了快速输入码,即:字母O+(元、角、分、佰、仟、万、亿、零)中的某个汉字读音的首字母。
在这一编码中,只有“元”和“亿”两个字会出现重码,在输入代码“OY”时,选择数字键1可输入“元”字,选择数字键2可输入“亿”字。
16.对于容易读错或不知道其读音的汉字编码的约定
本发明对国标字库中的4000个非常用汉字进行了双重编码,一种是取汉字读音的首字母作为汉字编码的首声码,另一种是取字母“U”作为其首位编码,汉字结构的特征码都是按照以上编码规则进行编码;设置双重编码的目的就是对于不认识的汉字,可直接用字母“U”代替其首声码,从而克服了因使用通用代码键而产生很多重码的问题。
如:瘛 疒丰心UBFX或CBFX 蛊 虫下皿 UCXM或GCXM 罂 贝贝缶UBBF或YBBF
葩 艹白巴UCBB或PCBB 钓 钅勹点UJBD或DJBD 谬 讠羽彡UYYP或MYYP
17.标点符号和一些常用符号的编码方法
标点符号和一些常用符号的编码规则是取字母“I”作为其编码的首码,然后取人们日常对其习惯性叫法的读音的首字母。
如:顿号“、”=i+d;如果输入代码“idh”,提示行上将会出现逗号“,”和顿号“、”供选择。
写字码提供的常用标点符号和特殊符号的编码列表如下:
符号名称 | 代码 | 可输入的符号内容 | 说明 |
顿号、逗号感叹号分号冒号句号问号单引号双引号书名号省略号破折号代字号各种括号分节号百分号千分号序号罗马数字运算符温度符号欧姆符号无穷大符号各种符号各种字母 | idhigifimijiwidyisyismislipzidzikifjibfiqixiliyiwdioiwqiiz | 、,!;:。?‘ ’“”《》……——~()〔〕《》〖〗【】{}<>§%‰①②③④⑤⑥⑦⑧⑨⑩(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)㈠㈡㈢㈣㈤㈥㈦㈧㈨㈩ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩⅪⅫ±×÷+-=*℃Ω∞∝*~&£#※§№@$等αβγ λ μπρσδε等 | 对于不同括号的编码可直接用字母i加上括号的读音,如:小括号的编码为:ixkh |
18.词组编码
字、词混合输入是写字码的主要特点之一,写字码提供了50000多条词组,因此在使用词组输入时将会大大提高汉字的输入速度。
(1)两字词的取码原则是:分别取每个字的前两位编码。
如:说明=S(说)+Y(讠)+M(明)+R(日) 问题=W(问)+M(门)+T(题)+R(日)
集体=J(集)+R(亻)+T(体)+R(亻) 岁月=S(岁)+S(山)+Y(月)+P(丿)
理论=L(理)+W
+L(论)+Y(讠) 心情=X(心)+D(丶)+Q(情)+X(忄)
(2)三字词的取码原则是:分别取每个字的首声码加上末位字的第二位编码。
如:新中国=XZG+K(口) 工程部=GCB+L(立) 阴雨天=YYT+H(一)
不好看=BHK+S() 转折点=ZZD+Z(占) 突破=TPK+S(竖)
(3)多字词的取码原则是:取前三个字的首声码加上末位字的首声码。
如:社会主义=SHZY 市场经济=SCJJ 发展中国家=FZZ+J(家)
身体健康=STJK 精神愉快=JSYK 生活幸福=SHXF
艰苦奋斗=JKFD 项目经理=XMJL 项目经理部=XMJ+B(部)
自强不息=ZQBX 中华人民共和国=ZHR+G(国)五.简码的设置
设置简码的目的就是为了提高常用汉字的输入速度,写字码提供的简码包括:
(1)一级简码:写字码提供的一级简码汉字有23个,它们是:
奥北成的儿非工火就口领马能皮起日世同鱼为小业质
A B C D E F G H J K L M N P Q R S T U W X Y Z
(2)二级简码
二级简码汉字共有485个,对于一些常用汉字还提供了与其经常连用的联想词组;
如:BH 不 不会 BJ 编 编辑 BL 办 办理 BZ步步骤 EH 而 而后
EY 恶 恶意 FD 奋 奋斗 FN 妇 妇女 FZ发发展 GH 更 更换
GJ 钢 钢筋 GN 姑 姑娘 GS 骨 骨髓 JB疾疾病 MZ 民 民主
JJ 经 经济 JX 举 举行 KH 开 开会 LZ录录制 SH 事 事后
PH 平 平衡 QP 气 气魄 SD 商 商店 WR伟伟人 WX 惋 惋惜
TJ 统 统计 TY 通 通用 OR 偶 偶然 WD文文档 YG 应 应该
(3)三级简码
写字码提供的三级简码汉字有2380多个。六.容错码的设置
对一些拆码容易出错的汉字,写字码提供了大量的容错码。
如:交 六下乂JLXY或亠父 JDF 我 撇横点WPHD或撇 扌戈WPTG
欲 谷欠人YGQR或八人欠YBRQ 雇 户亻点GHRD或 点尸隹GDSZ
避 尸口辶BSKZ或尸辛辶BSXZ 燕 廿北灬YEBD或 艹北灬YCBD
真 直下八ZZXB或十下具ZSXJ 赳 走钩竖JZLS或 走折竖JZZS
走 横竖捺ZHSN或土竖捺ZTSN 缶 午下山FWXS或 撇横竖FPHS
因为在字典中有“走”字旁,因此在“土”字旁中找不到“走”字,故“走”字的正确编码是按照对独体字的编码规则进行编码的。七.把写字码挂接在不同汉字操作系统上的方法
1.把写字码电脑汉字输入法挂接在UCDOS5.0操作系统上的方法:
①按照写字码编码方案中对不同结构汉字的编码规则和对部分汉字编码的实施例,对国标字库中的全部汉字进行编码。
②按照UCDOS5.0中的“万能输入法管理器”所要求的编码源文件的格式,利用字处理软件(如CCED、Word等)把每个汉字及其编码编辑成相应格式的汉字编码源文件XZMUC.TXT;挂接在UCDOS5.0操作系统上的写字码编码源文件(XZMUC.TXT)的格式如下:
名称=[写字码]
功能键号=9
码元表=abcdefghijklmnopqrstuwxyz
万能键=V
最大码长=4
是否自动选择输入=N
是否执行模糊搜索=Y
是否使用自定义词组=Y
自定义词组编码方案=O
奥 a
遨 aa
安 ab
安 abn
蔼 ac
艾 acy
蔼 acyh
. .
. .
④利用UCDOS5.0系统本身所提供的万能输入法编码字典管理器(IMDMNG),把写字码的码表文件XZMUC.TXT编译成写字码的编码字典XZMUC.IMD,命令格式为:
IMDMNG XZMUC.TXT XZMUC.IMD
把编译好的XZMUC.IMD拷贝至UCDOS的DRV子目录下。
④然后运行UCDOS5.0系统本身所提供的万能输入法加载程序来实现写字码的挂接,命令格式为:Limd XZMUC
⑤接组合键ALT+F9,提示行上将会显示[写字码],此时即可使用写字码编码方案中的编码规则进行输入汉字了。
2.把写字码电脑汉字输入法挂接在Windows95操作系统上的方法:
①按照写字码编码方案中对不同结构汉字的编码规则和对部分汉字编码的实施例,对国标字库中的全部汉字进行编码。
②按照Windows95中的“输入法管理器”所要求的编码源文件的格式,利用字处理软件把每个汉字及其编码编辑成相应格式的写字码编码源文件XzmWin.txt,挂接Windows95中文操作系统上的写字码编码源文件的格式如下:
[Description]
Name=写字码
MaxCodes=4
MaxElement=2
UsedCodes=abcdefghijklmnopqrstuwxyz
WildChar=v
NumRules=3
[Rule]
ce2=p11+p12+p21+p22
ce3=p11+p21+p31+p32
ce4=p11+p21+p31+p41
[Text]
奥a
遨aa
安ab
安abn
蔼ac
艾acy
蔼acyh
.
.
③把写字码的编码源文件XzmWin.txt复制到Windows95中的System子目录下,打开并运行Windows95附件窗口中的“输入法生成器”,在“输入法生成器”窗口,单击“浏览”,选择System目录下的XzmWin.TXT文件,并在“浏览”窗口中选择“确认”,接着单击“输入法生成器”窗口中的“转换”按钮,转换结束后选“确认”,随后单击“输入法生成器”中的“创建”按钮,对后面出现的提示窗口选择“确认”;最后关闭“输入法生成器”。
④打开Word或“写字板”后,单击屏幕右下角的“EN”,屏幕的右下角将会显示“写字码输入法”,用鼠标选择后,就可以使用写字码输入汉字了。
本发明写明了对组成方块汉字的四种基本结构“块”的定义及其取码的方法,以及对不同结构类型汉字的编码方案。
本发明提出的拆首(或末)笔画法的拆码规则和把人们在日常生活中对汉字结构的描述方式溶入编码方案的思想,使得每个汉字的音形编码更直观、易懂;同时对于不认识的汉字进行了双重编码,写字码的单字输入重码率低于6.5%,并且提供了5万多条词组,因此写字码既适合于广大电脑爱好者使用也适合于广大中小学生使用。
Claims (4)
1.一种把组成汉字结构的基本元素归纳为“八种笔画、四种块”,并采用以声代形的取码方式把人们日常对汉字结构的描述方式溶入编码方案的写字码电脑汉字输入法,构成写字码电脑汉字输入法编码方案的必要技术特征包括:
(Ⅰ)组成汉字结构的八种笔画及其代码
笔画 横 竖 撇 捺 折 提 点 钩
代码 H S P N Z T D L
(Ⅱ)组成汉字结构的四种块和补足码的取码约定
(1)偏旁部首形块及其代码
(3)字形块及其代码
字形块的取码原则是:在取大字优先的前提下,取对字形块读音的首字母作为其代码;
(4)非字形块及其取码原则
①当汉字结构中的非字形块是一个独立的笔画时,取其笔画的代码;
②当由两个或多个笔画组成的非字形块,在与其前面(或其后面)的相邻块或几个结构块结合在一起后,如果能够构成字形块,且所构成的字形块不是被编码汉字本身,其代码是取与其前面(或其后面)的相邻块或几个结构块结合在一起后所构成的字形块的代码;
③当由两个或多个笔画组成的非字形块,在去掉其首(或末)笔画后,如果其剩余部分能构成字形块,其代码是取:“非字形块的首笔画代码+去掉其首笔画后所构成的字形块读音的首字母”或“去掉非字形块的末首笔画后剩余部分所构成的字形块读音的首字母+非字形块的末笔画代码”;当汉字的编码超过四位时,只取其首笔画的代码;
④其余情况下只取非字形块首笔画的代码;
(5)补足码的取码约定及优先权
①当由两个块组成的汉字的末块中,含有由末笔画组成的除末块本身外的且不与其它笔画相交的最大字形块时,取该字形块的代码作为补足码;
②当由两个块组成的汉字的末块中,不含有由末笔画组成的除末块本身外的最大字形块时,如果末块是一个字形块就取其首笔画的代码作为补足码;如果末块是一个非字形块,则是取非字形块的末笔画的代码作为补足码;
③当组成汉字结构的米块是偏旁时,重复输入偏旁的代码作为补足码;
(Ⅲ)对于不同结构汉字的编码方案:
(1)在去掉汉字的首(或末)笔画后,剩余部分还可以构成字形块的汉字的编码规则是:
汉字编码=首声码+首笔画代码+去掉汉字的首笔画后所成字形块读音的首字母,或,
汉字编码=首声码+去掉汉字的末笔画后所成字形块读音的首字母+汉字末笔画的代码;
(2)去掉汉字的前两个既不能构成字(或近似字)形块又不能构成偏旁部首的笔画后,其剩余部分还可以构成字形块或近似字形块的汉字的编码规则为:
汉字编码=首声码+首笔画代码+次笔画代码+去掉汉字的前两个笔画后剩余部分所构成的字形块或近似字形块的代码;
(3)对于在截断贯穿汉字上下结构的竖笔画后,使得被分开的两部分都能构成字(或近似字)形块的汉字的编码规则是:
汉字编码=首声码+被分开的上层字(或近似字)形块的代码+X+被分开的下层字(或近似字)形块的代码;
(4)按照上述3条拆码规则不能进行拆码的独体字的编码规则为:
汉字编码=首声码+首笔画代码+次笔画代码+末笔画代码;
如果构成汉字的笔画只有一个笔画或两个笔画,按实际笔画数取其代码;
(5)对于不能分解成三个或三个块以上的汉字,当其结构中含有脱离开相交或相连的笔画后使得被分开的两部分能构成偏旁部首或近似字形块的部件时,汉字的编码规则为:
把偏旁部首或近似字脱离开与其相交或相连的笔画后,按照书写顺序分别取其首块代码、次块代码扣末块代码;
(6)左右结构汉字的编码规则
(6)左右结构汉字的编码规则
①在取大字优先的前提下,对于能分解成由字形块、偏旁部首形块或近似字形块组成的三部分左右结构汉字的编码规则是:按照各个块的书写顺序取每个块的代码;
②当由三个块组成的左右结构的汉字中含有非字形块时,对其中非字形块的取码应按照非字形块取码原则中的有关规定进行,汉字的编码规则为:按照各个块的书写顺序分别取各个块的代码;
③含有三个块以上的左右结构汉字的编码规则为:应优先对左边块取大字,当其右边的块不能进行分块或当左边的几个块结合在一起后不能构成字形块时,再对左边块进行分块取码,汉字的编码规则为:
汉字编码=首声码+首块代码+次块代码+末块代码;
④当由两个块组成的左右结构的汉字中含有可以用拆首(或末)笔画法进行拆码的字形块时,汉字的编码规则为:优先对该字形块进行拆码,并按照各个块的书写顺序分别取其拆码后的代码;
⑤当由两个块组成的左右结构汉字中的字形块不能使用拆首(或末)笔画法进行拆码时,或当组成汉字结构的两个块是偏旁部首形块或近似字形块时,汉字的编码规则为:
汉字编码=首声码+首块代码+次块代码+补足码;
⑥当组成汉字结构的两个块中有一个块是非字形块时,汉字的编码规则为:
汉字编码=首声码+首块代码+次块代码+补足码;
(7)“品”字形结构和倒“品”字形结构汉字的编码规则为:
按照各个块的书写顺序在取大字优先的前提下,分别取“品”字形或倒“品”字形结构汉字中前两个块的首块代码和末块代码;
(8)上下结构汉字的编码规则及优先权
①由上中下三个字形块或近似字形块组成的汉字,优先按照由上到下的顺序取每个块的代码;
②在取大字优先的前提下,由上下两个字(或近似字)形块组成的上下结构汉字的编码规则为:
汉字编码=首声码+上层字(或近似字)形块的代码+X+下层字(或近似字)形块的代码;
③在取大字优先的前提下,当组成汉字上下结构的两个块中,至少有一个块是偏旁部首形块或近似字形块时,汉字的编码规则为:汉字编码=首声码+首块代码+次块代码+补足码;
④当组成上下结构汉字的两个块中,含有可以用对非字形块取码规则中的拆首(或末)笔画后其剩余部分可构成字形块的非字形块时,汉字的编码是按照由上到下的顺序分别取各个块拆码后的代码;
⑤在取大字优先的前提下,对于不能分解成上下两个或三个字形块的汉字,且当其是由三个或多个其它块组成的上下三层或多层结构汉字的编码规则为:在取大字优先的基础上,按照由上到下的顺序分别取其前两层靠左侧的首块代码和最底层的末块代码;
⑥在取大字优先的前提下,对于不能分解成上下两个或三个字形块的汉字,且当其是由三个或多个其它块组成的上下两层结构汉字的编码规则为:
在取大字优先的基础上,按照各个块的书写顺序分别取其首块代码、次块代码和末块代码;
(9)“口”字形结构和“门”字形结构汉字的编码规则为:
①当“口”或“门”字里所含有的块是字形块时,汉字的编码规则为:
汉字编码=首声码+KL(或ML)+口(或门)里所含有的字形块读音的首字母;
②当“口”或“门”字里所含有的块不是字形块时,汉字的编码规则为:按照由外向里的顺序分别取其首块代码、次块代码和末块代码;
(10)带有走之旁“辶”或建字旁“廴”汉字的编码规则:
①当走之旁“辶”或建字旁“廴”上是一个字形块或近似字形块时,汉字的编码规则为:汉字编码=首声码+走之旁“辶”或建字旁“廴”上字形块或近似字形块读音的首字母+XZ(或XJ);
②当走之旁“辶”上所含有的字形块读音的首字母与整体字读音的首字母相同时,应优先对该字形块进行分块取码或用拆首(或末)笔画法码进行拆码,并按照各个块的书写顺序分别取各个块拆码后的代码;
③当走之旁“辶”上是由两个字形块或两个以上其它结构块组成时,汉字的编码规则是:按照书写顺序分别取其首块代码、次块代码再加上走之旁“辶”的代码“Z”;
④当走之旁“辶”上是一个或两个不能构成字形块的其它块时,汉字的编码规则为:按照汉字的书写顺序分别取走之旁“辶”上各个块的代码和走之旁“辶”的代码;
(11)含有“戊”字形块结构的汉字编码规则为:
按照由外向内所组成的各个结构块的顺序分别取其首块代码、次块代码和末块代码;
(12)其它半包围结构汉字汉字的编码规则为:
①在大字优先取码的前提下,当汉字能分解成三个或多个块时,按照由上到下、由左到右、由外向里的顺序依次取汉字结构的首块代码、次块代码和末块代码;
②由两个块组成的半包围结构汉字的编码规则是:按照汉字各个结构块的书写顺序分别取各个块的代码和补足码;
③当由两个块组成的半包围结构的汉字中含有可用拆首(或末)笔画法进行拆码的字形块时,应使用拆首(或末)笔画法对该字形块进行拆码,汉字的编码规则为:按照各个块书写顺序分别取其拆码后的代码;
写字码电脑汉字输入法对不同结构汉字编码方案的主要特征包括:
(1)在去掉汉字的首(或末)笔画后,剩余部分还可以构成字形块的汉字的编码规则是:
汉字编码=首声码+首笔画代码+去掉汉字的首笔画后所成字形块读音的首字母,或,
汉字编码=首声码+去掉汉字的末笔画后所成字形块读音的首字母+汉字末笔画的代码;
(2)对于在截断贯穿汉字上下结构的竖笔画后,使得被分开的两部分都能构成字(或近似字)形块的汉字的编码规则是:
汉字编码=首声码+被分开的上层字(或近似字)形块的代码+X+被分开的下层字(或近似字)形块的代码;
(3)当由两个块组成的左右结构或半包围结构的汉字中,含有可以用拆首(或末)笔画法顺序分别取其拆码后的代码。
(4)在取大字优先的前提下,由上下两个字(或近似字)形块组成的上下结构汉字的编码规则为:
汉字编码=首声码+上层字(或近似字)形块的代码+X+下层字(或近似字)形块的代码;
(5)在取大字优先的前提下,当“口”或“门”字里所含有的是一个字形块时,汉字的编码规则为:
汉字编码=首声码+KL(或ML)+口(或门)里所含有的字形块读音的首字母;
(6)当走之旁“辶”或建字旁“廴”上是一个字形块或近似字形块时,汉字的编码规则为:汉字编码=首声码+走之旁“辶”或建字旁“廴”上字形块或近似字形块读音的首字母+XZ(或XJ);
(7)当走之旁“辶”上所含有的字形块读音的首字母与整体字读音的首字母相同时,应优先对该字形块进行分块取码或用拆首(或末)笔画法进行拆码,并按照各个块的书写顺序分别取各个块拆码后的代码;
2.根据权利要求1所述的写字码电脑汉字输入法的编码方案,其中对汉字结构中所含有的偏旁部首形块和近似字形块的取码都是固定的,且都是以取大优先,不可以拆分。
3.根据权利要求1所述的写字码电脑汉字输入法的编码方案,其中对由两个或多个笔画组成的非字形块的取码,在去掉其首(或末)笔画后,如果其剩余部分能构成字形块,非字形块的取码为:“非字形块的首笔画代码+去掉其首笔画后所构成的字形块读音的首字母”或“去掉非字形块的末首笔画后剩余部分所构成的字形块读音的首字母+非字形块的末笔画代码”;当汉字的编码超过四位时,只取非字形块的首笔画的代码。
4.根据权利要求1所述的写字码电脑汉字输入法的编码方案,其中对汉字结构中所含有的字形块进行拆码的优先条件是:优先对汉字结构中所含有的与整体字读音相同的字形块进行拆码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 98117188 CN1121646C (zh) | 1997-10-14 | 1998-08-18 | 写字码电脑汉字输入法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN97116996 | 1997-10-14 | ||
CN97116996.9 | 1997-10-14 | ||
CN 98117188 CN1121646C (zh) | 1997-10-14 | 1998-08-18 | 写字码电脑汉字输入法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1223397A true CN1223397A (zh) | 1999-07-21 |
CN1121646C CN1121646C (zh) | 2003-09-17 |
Family
ID=27805963
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 98117188 Expired - Fee Related CN1121646C (zh) | 1997-10-14 | 1998-08-18 | 写字码电脑汉字输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1121646C (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102722262A (zh) * | 2012-05-28 | 2012-10-10 | 秦一明 | 一种彻底解决全部汉字键入、存储、检索问题的键盘输入法 |
-
1998
- 1998-08-18 CN CN 98117188 patent/CN1121646C/zh not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102722262A (zh) * | 2012-05-28 | 2012-10-10 | 秦一明 | 一种彻底解决全部汉字键入、存储、检索问题的键盘输入法 |
CN102722262B (zh) * | 2012-05-28 | 2015-06-24 | 秦一明 | 一种解决全部汉字键入、存储、检索问题的键盘输入法 |
Also Published As
Publication number | Publication date |
---|---|
CN1121646C (zh) | 2003-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1900886A (zh) | 单击与多键并击混合输入中、英文的方法和键盘 | |
CN1121646C (zh) | 写字码电脑汉字输入法 | |
CN1163815C (zh) | 汉语形声字输入方法 | |
CN1851620A (zh) | 笔画汉字输入法及其专用键盘 | |
CN1031302C (zh) | 汉字部首分类编码输入方法 | |
CN1119759C (zh) | 中文汉语到盲文的自动转换方法 | |
CN1808355A (zh) | 中文谐音输入法 | |
CN1881145A (zh) | 优选码输入系统 | |
CN101051246A (zh) | 一种计算机键盘形象码汉字编码输入法 | |
CN1038366C (zh) | 计算机汉字输入方法 | |
CN1116634C (zh) | 一种汉字拼音语言文字编码的计算机汉字输入方法 | |
CN1725156A (zh) | 汉字输入方法及使用该方法进行输入的键盘 | |
CN1908870A (zh) | 单击与多键并击混合输入中英文的方法和键盘 | |
CN1118740C (zh) | 以字符底平线的基本单元结构形态选取代码的计算机汉字输入方法 | |
CN1231831C (zh) | 一种三分数码输入法 | |
CN1065973C (zh) | 音速码汉字输入方法及其输入键盘 | |
CN1054447C (zh) | 计算机汉字输入坐标码编码方法 | |
CN1045128C (zh) | 音形三码计算机汉字输入法 | |
CN1357814A (zh) | 计算机汉语键盘及其汉语信息的输入和处理方法 | |
CN1387106A (zh) | 一种汉字拼音语言文字编码方法及其键盘 | |
CN1148635C (zh) | 反切码计算机汉字输入法 | |
CN1694051A (zh) | 计算机简拼有形中文输入法 | |
CN1514335A (zh) | 规范部首部件汉字通用教学系统及其键盘 | |
CN1710527A (zh) | 一种用数字键对拼音文字进行输入的方法 | |
CN1245918A (zh) | 七形定义汉字形码编码方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |