CN1949152A - 汉字首拼码输入法 - Google Patents
汉字首拼码输入法 Download PDFInfo
- Publication number
- CN1949152A CN1949152A CN 200610124932 CN200610124932A CN1949152A CN 1949152 A CN1949152 A CN 1949152A CN 200610124932 CN200610124932 CN 200610124932 CN 200610124932 A CN200610124932 A CN 200610124932A CN 1949152 A CN1949152 A CN 1949152A
- Authority
- CN
- China
- Prior art keywords
- code
- root
- radical
- stroke
- pie
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
汉字首拼码输入法,涉及一种形音码汉字输入法。编码由三-五位代码组成,代码分为字根代码、抽根代码和本字代码,字根代码是用字根或用形状相近的基本字根的第一个拼音字母表示的代码,抽根代码是用抽根的第一拼音字母表示的代码,本字代码是用汉字或字根字的第一个拼音字母表示的代码。汉字编码顺序为:取第一字根代码,取第二字根代码,无第三字根取第一抽根代码,取本字代码,取第二抽根代码,有第三字根取第三字根代码,第三字根后无字根取第一抽根代码,取本字代码,有字根取最末字根代码,取第一抽根代码。本发明采用习惯读音,对发音的准确度要求要低。本发明利用汉字本身信息进行编码,易学易记,规则简单,输入方便、快捷。
Description
技术领域
本发明涉及一种形音码汉字输入法。
背景技术
现有的汉字编码方案有几百种之多,大致可以归纳为四种类型:数字码、音码、形码和音形码。目前使用较多的编码为拼音码和五笔字型码。拼音码易学好记,规律性强,规则简单,但对发音要求较高,且重码率高;五笔字型码输入速度快,重码率低,但规则多,规律性不是很强,难记。中国汉字由一定顺序的笔画叠加表示一定形意,有固有结构。如能根据汉字的结构进行编码很有必要。
发明内容
本发明旨在提供一种利用汉字本身信息,易学易记,规则简单,输入方便、快捷的汉字首拼码输入法。
本发明的实现方式为,汉字首拼码输入法,编码由三-五位代码组成,代码分为字根代码、抽根代码和本字代码,字根代码是用字根或用形状相近的基本字根的第一个拼音字母表示的代码,抽根代码是用抽根的第一拼音字母表示的代码,本字代码是用汉字或字根字的第一个拼音字母表示的代码,首拼码规定笔划的读音为:“丶”点,“一”横,“丨”竖,“丿”撇,“乙”钩,捺笔“”读点,提笔
读横,所有转折笔划读钩,
字根字编码顺序为:取字根代码、取抽根代码,抽根后无笔划的加数字键,有笔划的取抽根后第一笔划代码,无笔划的加数字键,有笔划的取抽根后第二笔划代码,无笔划的加数字键,有笔划的取抽根后第三笔划代码。
汉字编码顺序为:取第一字根代码,取第二字根代码,无第三字根取第一抽根代码,取本字代码,取第二抽根代码,有第三字根取第三字根代码,第三字根后无字根取第一抽根代码,取本字代码,有字根取最末字根代码,取第一抽根代码。
基本字根与代码对照如下:
代码 字根
c 厂寸车齿虫川镸卄丆廾
d 大丁刀丶刂癶
f 方丰非
h 火一黑禾
j 戋巾金臼斤九几己巳已钅
p 片皮丿
r 日曰人彳亻
s 三十士石上山四手尸厶水灬氵礻丨罒彡饣氺巛
t 土田扌
抽根从基本字根中抽出,抽根抽取规则为:(1)单笔划字根以该笔划作抽根,(2)两笔划字根,以第一笔划作为抽根,(3)两笔划以上字根,以第一、二笔划组合形状作为抽根,(4)两笔划以上字根,第一、二笔划组合形状不符合字根形状要求,以第一笔划作为抽根,
组合或拆分字根的规则为:(1)笔划串中的全部笔划能够同时进入一个字根里,这些笔划优先组合,同时优先与前后顺笔笔划进行组合,(2)相同名称的顺笔笔划尽可能组合在一个字根里,(3)将顺笔笔划组合成体大的字根,(4)选用最直观的字根。
本发明采用拼音的第一个字母作为代码,比“拼音码”对发音的准确度要求要低,“首拼码”的字根都有读音,且大部分采用习惯读音,字根转成代码,比“五笔字型码”有规律,易记忆。本发明采用首拼码,对有相同代码而形状不同的字根用抽根代码来区分、对有相同字根而形状不同的汉字用本字代码来区分,比“五笔字型码”用末笔字型识别码来区分规则要简单。
本发明的首拼码可以兼容“拼音码”,两码并存有补充作用。如果当前的汉字笔划不清楚,可以用“拼音码”来编码。“拼音码”的编码方法为:将单个汉字的声母和韵母逐个输入即可。声母加韵母有六个字母的,去掉第二个字母“h”,韵母ü用v代替。重码选数字键。
本发明利用汉字本身信息进行编码,易学易记,规则简单,输入方便、快捷。
附图说明
图1为汉字编码顺序图表
图2为字根字编码顺序图表
图3为非字字根编码顺序图表
图4为词组编码顺序图表
具体实施方式
本发明利用汉字本身信息进行编码。各字根的对应抽根、抽码即本码的详细情况如下:
c代码内,镸读长,卄、廾读草、丆读厂,厂寸车齿虫川镸卄丆廾对应的抽根分别为一一七冂一十一丿,抽码分别为hhqbwehshsp,厂寸车齿虫川的本码为c。
d代码内,丶读点,刂读刀,癶读登,大丁刀丶刂癶对应的抽根分别为一乙丶丨乙,抽码分别为shgdsg,大丁刀的本码为d。
f代码内,方丰非对应的抽根分别为亠二丨,抽码分别为ees。
g代码内,宀读盖,读高,广干工革古戈骨乙弓宀对应的抽根分别为亠二一十十七冂乙丶丶亠,抽码分别为eehssqwgwdde,广干工革古戈骨弓的本码为g,乙的本码为y。
j代码内,己巳已读己,
读具,钅读金,读己,戋巾金臼斤九几己巳已钅
对应的抽根分别为二冂人亻厂丿丿
冂乙,抽码分别为ewrrcppwwwqwg,戋巾金臼斤九几己的本码为j,巳、已的本码分别为s、y。
l代码内,
读立,丷读兰,立鹿兰力了
丷对应的抽根分别为亠亠丷乙乙亠丶丷,抽码分别为eelggedl,立鹿兰力了的本码为l。
n代码内,卄读廿,牜读牛,勹读了,
纟读纽,廿牛乃鸟女卄牜勹
纟对应的抽根分别为十丿勹乙十丿乙
抽码分别为sqpngsqpgn,廿牛乃鸟女的本码为n。
s代码内,灬
罒读四,氵、
彡读三,礻读示,读十,读手,氺读水,三十士石上山四手尸厶水灬氵礻丨
罒彡饣氺巛对应的抽根分别为二一十丆丨冂丿
乙乙丶丶丶一丨冂冂丿
乙ㄍ,抽码分别为ehscbswpwggdddhswwpeqge,三十士石上山四手尸厶水的本码为s。
t代码内,扌读提,土田扌对应的抽根分别为十冂一,抽码分别为swh,土田的本码为t。
y代码内,讠读言,衤、
读衣,
读雨,ス、
读又,言雨酉弋业由乂月用鱼又予也幺讠衤
ス对应的抽根分别为亠一一七
冂丿
乙
乙
丶丶一丿丿乙乙,抽码分别为ehhqewpwwqgygnddhppgg,言雨酉弋业由乂月用鱼又予也幺的本码为y。
z代码内,孑读子,丬读壮,辶读之,
读足,爫读爪,读竹,廴读之,之止早竹舟子孑丬辶
爫廴对应的抽根分别为丶冂了了冫丶冂丿乙,抽码分别为dbwqclledbwpqg,之止早竹舟子的本码为z,孑的本码为j。
本发明组合或拆分字根的规则为:(1)笔划串中的全部笔划能够同时进入一个字根里,这些笔划优先组合,同时优先与前后顺笔笔划进行组合,(2)相同名称的顺笔笔划尽可能组合在一个字根里,(3)将顺笔笔划组合成体大的字根,(4)选用最直观的字根。其中笔划串是指相交笔划以相交形式串联在一起的,即为相交笔划串,例如:丈、丰、井:相连笔划以相连形式串联在一起的为相连笔划串,例如:万、止、目。体大的字根是指字根后面再组合任意个顺笔笔划都不会成为字根的字根。
参照图2,字根字编码顺序为:取字根代码、取抽根代码,抽根后无笔划的加数字键,有笔划的取抽根后第一笔划代码,抽根后无第2笔划的加数字键,有第2笔划的取抽根后第二笔划代码加数字键,有第3笔划的取抽根后第3笔划代码,无第3笔划的加数字键。具体举例如下:
单笔划字根字编码规则为字根代码+抽根代码+本字代码+数字键或字根代码+抽根代码+数字键。如“一”,字根代码一为h,抽根代码也为h,编码为hhy或hh,
两笔划字根字编码规则为:字根代码+抽根代码+后一码+本字代码+数字键或字根代码+抽根代码+后一码+数字键。如字“八”,八的字根代码为b,抽根丿的代码为p,抽根后丶的代码为d,编码为bpdb(b为本字代码)或bpd;“干”的字根代码为g,抽根二的代码为e,抽根后的笔划丨的代码为s,编码为gesg(g为本字代码)或ges。
三笔字根字的编码规则为字根代码+抽根代码+后一码+后二码+本字代码或字根代码+抽根代码+后一码+后二码+数字键。如“工”拆分工一丨一,编码为:ghshg或ghsh。“犬”拆分犬‘’丶丶,编码为:qsddq或qsdd。
抽根为一笔的四笔及四笔以上字根字和抽根为两笔的五笔及五笔以上字根字编码规则为字根代码+抽根代码+后一码+后二码+后三码。如:五拆分五一丨乙一,编码为:whsgh。鱼拆分鱼丨乙一,编码为yqsgh
参照图3,非字字根编码规则为字根代码+抽根代码+后一码+后二码+数字键,中间缺项时该位置直接进入数字键。如“疒”拆分亠丿丶,编码为bepd。
参照图1,字根字以外的汉字编码顺序为:取第一字根代码,取第二字根代码,无第三字根取第一抽根代码,取本字代码,取第二抽根代码,有第三字根取第三字根代码,第三字根后无字根取第一抽根代码,取本字代码,有字根取最末字根代码,取第一抽根代码。
两个字根的汉字编码规则为第一字根代码+第二字根代码+第一抽根代码+本字代码或直接用数字键+第二抽根代码。如“千”拆分丿十丿千(数字健)一,编码为psprs或psp。“壬”拆分丿士丿壬十,编码为psprs或psp。
三个字根的汉字编码规则为第一字根代码+第二字根代码+第三字根代码+第一抽根代码+本字代码或数字键。如“芒”拆分艹亠乙十芒,编码为cegsm或cegs。“虻”拆分虫亠乙冂虻,编码为cegwm或cegw。
四个及四个以上字根的汉字编码规则为第一字根代码+第二字根代码+第三字根代码+最末字根代码+第一抽根代码。如“根”拆分木彐乙
十,编码为m xgys,“眼”拆分目彐乙
冂,编码为mx gyw,“塘”拆分土广彐口十,编码为tgxks,“搪”拆分扌广彐口一,编码为tgxkh。
参照图4,词组编码规则如下:
1、两字词组编码规则
第一字取前两码,第二字取前三码。例如:
幸福:土丷礻一口 编码为:tl shk
2、三字词组编码规则
第一字取前两码,第二字取前一码,第三字取前两码。例如:
座右铭:广人钅夕编码为:grsjx
3、四字及四字以上词组编码规则为第一字取前两码,第二、三、末字各取前一码。如“抛砖引玉”取扌九石弓王,编码为tjsgw。
注:前三码是指:两个字根之汉字的第一、第二字根代码和第一字根抽根代码;三个及三个以上字根之汉字的第一、第二和第三字根代码:字根字的字根代码、抽根代码和抽根后第一笔划代码;如果抽根后没有笔划,则用数字键。
本发明采用在标准简化字前四位编码之前加上指定代码“A”来实现对繁体字进行编码。如:“歡”(欢)拆分又欠乙欢,编码为ayqgh(h为本字代码)或ayqg。樂(乐)拆分小丿乐,编码为awxpl(l为本字代码)或awxp。
本发明采用的首拼码可以对国标区位码进行移植编码。其方法为:V(指定代码)+区位码四个数字的代换码。代换码的规定:键盘第三排的十个字母(Q、W、E、R、T、Y、U、I、O、P)分别是十个数字(1、2、3、4、5、6、7、8、9、0)的代换码。如:
∞:国标区位码(0162) 编码为:vpqyw
VIII: (0288) 编码为:vpwii
下面举出常用汉字拆分的具体实施例:
点起笔:
冖,产:立丿,
亠,衰:
一
亠囗口,襄:亠口口
交:亠八乂,离:文凵冂厶,亡:亠乙,亥:亠乙丿人,州:丶丿丶丨,羊:兰丨,
兰
一,:兰丿,半:丷二丨,
丷干,
丷王,
丷二丿,关:大,:丷二人,并:廾,
丷干凵,酋:丷酉,首:丿目,屰:凵丿,丫:丷丨,曾:丷囗
日,
丷巾八,为:丶力丶,良:丶彐乙
隺:冖亻亠,冘:冖儿,农:冖
永:丶乙乙
横起笔:平:一丷十,来:一米,夹:一人,灭:一火,
一丰,三丿,
三人,耒:丰八,
干,
勹,
二
一,未:二,末:一木,
一日一山,天:一大,夫:二人,井:二
元:二儿,无:一乙,于:二乙,亍:一丁,韦:二乙丨,示:二小,下:一卜,
十,正:一止,考:土丿一乙,者:土丿日,赤:土
丐:一乙, :十戈,垩:一业土,严:一业丿,甘:卄二,
卄三,茾:卄一廾,
卄一冂人,世:廿乙,:
一
本:木一,巫:工人人,樊:木乂乂大,柬:一
甫:一月丨丶,或:弋口一彡,
一口丨冖,再:一冂土,哥:丁口丁口,
一冂,束:一口
臣:匚丨
丨,吏:一口乂,事:一口彐乙,丙:一冂人,
大丷,丈:丶,爽:大乂乂乂,辰:厂二乙
咸:戈口,戍:戈人,兀:一儿,不:丆卜,百:丆日,直:十
页:丆贝,万:丆乙,尤:
乙,歹:一夕,臧:戈丿乙丨,尨:
乙彡,豕:丆
匹:匚儿,成:戈
求:一氺丶,疌:一彐
巨:匚
夷:一弓人,屯:一凵乙,才:一乙丿,
七丿,旡:匚儿,瓦:一乙乙丶,互:一
一,牙:匚乙丿,
七乙八。
竖起笔:北:丨二匕,卝:丨一,芈:丨一上十,凸:丨一丨一,桌:日木,卤:口乂,
丶,
丨乙冂,且:冂三,
丨二,里:日土,
口,果:日木,戢:口戈
三,禺:日巾一丶,曳:日匕,
口丨一,
冂卄,典:冂八,央:冂大,
口儿,
囗
冂
囬:冂
三,见:冂儿,啚:口十囗口。
撇起笔:豸:爫
人冫ㄑ,余:人一朩,兆:儿冫ㄑ,乎:丿乙,
丿米丨,午:十,生:丿,
止,
一,朱:牛八,缶:
山,
巾,矢:大,失:
人,垂:丿一卄士,壬:丿士,
丿土,乍:丨二,乖:丿十丨匕,舌:丿古,臿:丿十臼,
丿一
土,重:丿一日土,升:丿廾,长:丿七丶,秉:丿一彐,我:丿扌匕丶,
亻三,舆:亻二车八,丘:亻工,
丿止,自:丿目,身:丿冂三丿,卑:白丿十,禹:丿口巾丶,
亻
囱:丿口夕,爪:丨丶,甪:丿用,
彐乙,
丶,久:
丶,及:丿廴,
夂、,岛:勹丶乙山,卵:
丶丿丶,氏:
七,象:口丿
丿,匆:勹
丶,乐:
小。
Claims (2)
1、汉字首拼码输入法,其特征在于编码由三-五位代码组成,代码分为字根代码、抽根代码和本字代码,字根代码是用字根或用形状相近的基本字根的第一个拼音字母表示的代码,抽根代码是用抽根的第一拼音字母表示的代码,本字代码是用汉字或字根字的第一个拼音字母表示的代码,首拼码规定笔划的读音为:“丶”点,“一”横,“丨”竖,“丿”撇,“乙”钩,捺笔“ ”读点,提笔“ ”读横,所有转折笔划读钩,
字根字编码顺序为:取字根代码、取抽根代码,抽根后无笔划的加数字键,有笔划的取抽根后第一笔划代码,无笔划的加数字键,有笔划的取抽根后第二笔划代码,无笔划的加数字键,有笔划的取抽根后第三笔划代码。
汉字编码顺序为:取第一字根代码,取第二字根代码,无第三字根取第一抽根代码,取本字代码,取第二抽根代码,有第三字根取第三字根代码,第三字根后无字根取第一抽根代码,取本字代码,有字根取最末字根代码,取第一抽根代码。
基本字根与代码对照如下:
代码 字根
b 卜 贝 八 白 匕 巴 疒
c 厂 寸 车 齿 虫 川 镸 卄 廾
d 大 丁 刀 丶 刂 癶
f 方 丰 非
g 广 干 工 革 古 戈 骨 乙 弓 宀 冖
j 戋 巾 金 臼 斤 九 几 己 巳 已 钅
n 廿 牛 乃 鸟 女 牜 勹
纟
p 片 皮 丿
r 日 曰 人 彳 亻
s 三 十 士 石 上 山 四 手 尸 厶 水 灬 氵 礻 ナ 丨 罒 彡 饣 氺
t 土 田 扌
抽根从基本字根中抽出,抽根抽取规则为:(1)单笔划字根以该笔划作抽根,(2)两笔划字根,以第一笔划作为抽根,(3)两笔划以上字根,以第一、二笔划组合形状作为抽根,(4)两笔划以上字根,第一、二笔划组合形状不符合字根形状要求,以第一笔划作为抽根,
组合或拆分字根的规则为:(1)笔划串中的全部笔划能够同时进入一个字根里,这些笔划优先组合,同时优先与前后顺笔笔划进行组合,(2)相同名称的顺笔笔划尽可能组合在一个字根里,(3)将顺笔笔划组合成体大的字根,(4)选用最直观的字根。
2、根据权利要求1所述的汉字首拼码输入法,其特征在于字根字编码顺序为:取字根代码、取抽根代码,抽根后无笔划的加数字键,有笔划的取抽根后第一笔划代码,抽根后无第2笔划的加数字键,有第2笔划的取抽根后第二笔划代码加数字键,有第3笔划的取抽根后第3笔划代码,无第3笔划的加数字键。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200610124932 CN1949152A (zh) | 2006-11-03 | 2006-11-03 | 汉字首拼码输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200610124932 CN1949152A (zh) | 2006-11-03 | 2006-11-03 | 汉字首拼码输入法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1949152A true CN1949152A (zh) | 2007-04-18 |
Family
ID=38018685
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200610124932 Pending CN1949152A (zh) | 2006-11-03 | 2006-11-03 | 汉字首拼码输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1949152A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111158498A (zh) * | 2019-11-28 | 2020-05-15 | 庞宇图 | 一种计算机汉字输入方法及系统 |
-
2006
- 2006-11-03 CN CN 200610124932 patent/CN1949152A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111158498A (zh) * | 2019-11-28 | 2020-05-15 | 庞宇图 | 一种计算机汉字输入方法及系统 |
CN111158498B (zh) * | 2019-11-28 | 2023-06-09 | 庞宇图 | 一种计算机汉字输入方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1949152A (zh) | 汉字首拼码输入法 | |
CN1215398C (zh) | 基于音码元和形码元为基础的汉字输入方法及键盘 | |
CN100339806C (zh) | 汉字三码输入法 | |
CN1028680C (zh) | 汉字全息码 | |
CN1256651C (zh) | 汉字手写输入法 | |
CN1059745C (zh) | 计算机形声位全息汉字输入法 | |
CN1048342C (zh) | 首母码汉字输入法 | |
CN1267807C (zh) | 一种用汉字及部首读音编码的汉字输入方法 | |
CN1117309C (zh) | 一种拼音汉字编码的输入法 | |
CN1269010C (zh) | 汉字位码键盘输入法 | |
CN1078717C (zh) | 全汉字定义码输入法 | |
CN1101569C (zh) | 音形码汉字输入方法 | |
CN1818835A (zh) | 一种汉字编码输入法 | |
CN1054693C (zh) | 一种动态部件二三拆分的计算机汉字输入方法 | |
CN1204486C (zh) | “三合一”汉字编码及键盘输入法 | |
CN1069766C (zh) | 电脑、字典共用新部首汉字输入法 | |
CN1252573C (zh) | 声画汉字输入法 | |
CN1293451C (zh) | 三击形音汉字输入法 | |
CN1109289C (zh) | 汉字形声偏旁泛字根结构的码元编码输入方法 | |
CN1109956C (zh) | 一种汉字部首音码的计算机输入方法 | |
CN1030357C (zh) | 汉字自然分割计算机键盘输入法 | |
CN1369765A (zh) | 汉字最小单字形音码输入法 | |
CN1873590A (zh) | 三键码汉字输入法 | |
CN1201931A (zh) | 汉字拼音语言文字编码方法及其键盘 | |
CN1206139A (zh) | 混沌意象区位码汉字输入技术及键盘 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |