CN1110743C - 一种笔音意编码汉字的计算机输入方法 - Google Patents
一种笔音意编码汉字的计算机输入方法 Download PDFInfo
- Publication number
- CN1110743C CN1110743C CN 98124053 CN98124053A CN1110743C CN 1110743 C CN1110743 C CN 1110743C CN 98124053 CN98124053 CN 98124053 CN 98124053 A CN98124053 A CN 98124053A CN 1110743 C CN1110743 C CN 1110743C
- Authority
- CN
- China
- Prior art keywords
- characters
- radicals
- word
- traditional chinese
- writing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明涉及一种笔音意编码法及其汉字输入键盘。它依据汉字的偏旁部首所表示的意义,将汉字的偏傍部首划分为人及人体能器官、大自然现象、动植物、农产品和渔贝、日常用具、工具及武器、计量估量、统治者及其它五大类,并对应地将输入键盘分为高频数字、人体、自然、生物、用具区、计统六个区。它具有拆字简单、形音意统一、直观易学、即学即会、重码极少,字词兼容,可扩展性强等优点,有其独到的设计思想,是最先进而实用的汉字输入法。
Description
技术领域
本发明涉及一种汉字输入方法,尤其是一种根据汉字笔形、发音、意义进行编码的输入方法及键盘。
背景技术
目前计算机汉字输入编码技术有十多种,这些编码方法都是从汉字的单一方面进行编码,如“五笔字型”是从汉字的笔形方面入手编码,它具有重码少,字词兼容等特点。但也存在诸如拆字难,拆分过细、碎,记忆量大,非专业打字员不易掌握等缺点。各种音码输入法是根据汉字的发音进行编码,其特点是编码自然,容易学习掌握,但存在重码多,不利于提高打字速度等缺点。尽管这些编码方法应用广泛,但只是反映了五千年来汉字文化遗产的一个侧面,要真正体现汉字的无穷魅力必须从汉字的形、音和意三个方面系统的、综合的加以揭示。
发明内容
本发明的目的在于提供一种具有拆字简单、笔音意统一、直观易学、重码少,字词兼容,可扩展性强的笔音意统一的汉字编码输入法。
本发明的另一目的在于提供一种笔音意汉字编码输入用键盘。
本发明的技术方案是:依据汉字的偏旁部首所表示的意义,将238个偏傍部首划分为五大类六个区,五大类是:人及人体功能器官类,大自然现象类,动植物、农产品和渔贝类,日常用具、工具及武器类,计量估量、统治者及其它类。六个区是:高频数字区,人体区,自然区,生物区,用具区,计统区,且每个区分布若干个偏傍部首,并按使用频率的高低依次分为5组或6组。本发明结合现代汉语的特点,制定了单字和多字编码规则,从而实现了编码方案的自然、高效和低重码。
本发明的另一技术方案是根据汉字偏旁部首所表示的意义,对应地将输入键盘分为六个区,它们是:一区(高频数字区),345678六个数字键;二区(人体区),GFDSA五个英文字母键;三区(自然区),HJKLM五个英文字母键;四区(生物区),TREWQ五个英文字母键;五区(用具区),YUIOP五个英文字母键;六区(计统区),NBVCXZ六个英文字母键。
汉字各偏旁部首对应的键盘是:
3 宝(宀,冖)
数
4 草(艹,廾,丌,卄,
)
5 手(扌,)
字
6 水(氵,
氺)
7 木(ホ)
区
8 口
G 人(亻)入且
爪(爫)老(耂)厶
人
F 言(讠)齿(齒)戋乃分工
D 耳(阝,卩,
)目(自)身子(孑,了)骨
体
S 心(忄,)舌旁厂止
也
自
L 月(
用)黑冷(冫,丬,爿,今,令)千夕
区
生
W 竹()鹿丁(亍)走(辶廴之辶)虎(虍)凶(乂,凵)
区
用
区
N 王(玉,主)文(攵,夂)韦(韋)示(礻)豸
计
B 八(ソ,,癶)米七(匕)留(
)古(占)辰
V 小(,少)门(冂門)已(己巳)兑四(罒)斤聿(肀聿)
统
C 九(臼,丸)欠病(疒)尸(户,
)寸亥
区
笔音意汉字编码法及其键盘是根据汉字偏旁部首所表示的意义将238个偏傍部首划分为六个区,分别布局在键盘32个键上,形成偏傍部首和字母(数字)之间的对应关系,从而达到了编码目的。
针对目前各种笔形编码方法所采用的字根、字元、部首和部件较多这一特点,笔音意编码法还根据汉字偏旁部首的表示的意义将238偏傍部首划分成主部首和辅部首(括号中的部首),这样部首之间就形成了有层次的主辅关系,便于管理和记忆,达到有规律可循的目的。
笔音意编码法将同一键位上的所有部首用它们所在键的同一个区位码来代替,区位码为字母或数字。
为了减少重码,笔音意编码法还提出了“相似部首”,并把相似部首编在同一键位上。这种“相似部首”分为形状相似和读音相似两种。形状相似指当一个汉字或偏旁部首添加点、横、竖、撇、捺笔画后就成了另外的汉字或部首;当减少点、横、竖、撇、捺笔画后又“变”回原来的汉字或部首。如:大、太两字。象这样的两个及两个以上汉字或部首当添加(减少)点横竖撇捺笔画后成了另外(原来)汉字或部首,它们就称作相似汉字或部首。读音相似指读音相近或相似的汉字或部首。如羽(予),由(尤、尢),匹(疋)。在笔音意码里统称相似部首。相似部首的引入,使汉字拆分变得非常容易,且减少了击键次数(平均每字击3.2键)。如下列形状相似部首:1、加点(丶)后的相似部首:
大:太,王:主玉,乌:鸟,几:凡,)尢:尤,
刀:刃,又:叉,今:令,尸:户,冫:氵,
厂:广,冖:宀,礻:衤,艮:良,九:丸,2、加横(一)后的相似部首:
口:日,日:目,匕:七,月:且,占:古,
了:子,戈:戋,西:酉,3、加竖(丨)后的相似部首:
上:止,巳:巴等部首4、加撇(丿)后的相似部首:
木:禾,古:舌,十:千,士:壬,弋:戈,
小:少,皿:血,5、加捺后的相似部首与加点情形一致。
根据笔音意编码法相似性原理,有部分部首未列入238个部首内,如:斤和斥,万和方等。相似部首在笔音意编码中起到三个方面的作用。(1)拆字容易,且笔形减少。如:以“太”字组成的汉字--态汰钛肽酞,均拆成两笔即可。(2)编码简短且降低击键次数。这也是设计笔音意码的一个指导思想。一个优秀的编码方案应具备编码简短,击键次数少且重码少,引入相似部首概念后能有效地达到此目的。如果每字击足全码时,笔音意码平均每字击3.71键;如果计简码,则平均每字击3.23键。(3)容易记忆。把相似的两个部首归纳在一起,符合汉字的构造原理,容易记忆。
用笔音意编码法对汉字进行拆分编码时,取第一、二、三及末笔所在的部首组成四码,如偏傍部首数不足四码时,其末码补加该字的声母。如:安:3AA,码:XEM,标:7NB,按:53AA,度:OTAD,意:UKSY,举:6BUU,桦:7GBJ,诞:FISW,停:GO8W。
上述前六个字尾码加了该字的声母。在拆字时由于“一”和“乙”两字是不能被分解的字,或者说这两字拆分时只能拆成它本身,因此这两字的编码为YE和PY。其余汉字均要进行拆分。由于《汉语拼音方案》中有一部分汉字没有声母只有韵母,如:安、鹅、欧等字,因此笔音意码规定这些韵母的第一个字母代替“声母”,称“假声母”,这样声母就增加了a、o、e三个。如:“安”字的编码为3AA。引入这三个假声母后,英文字母与汉语拼音中的声母基本对应。再由于《汉语拼音方案)》中有声母zh、ch、sh三个,笔音意码规定用z、c、s三个单声母代替。也就是说当尾码加声母涉及zh、ch、sh声母出现时分别用单声母z、c、s代替即可。如:“昌”字的编码为KKC。
笔音意编码法中,键名字即以每键上第一个汉字为名的字,其输入方法为连击四次。如:
一、数字区:宝(3)草(4)手(5)水(6)木(7)口(8)
二、人体区:人(G)言(F)耳(D)心(S)女(A)
三、自然区:土(H)山(J)日(K)月(L)金(M)
四、生物区:丝(T)虫(R)马(E)竹(W)鱼(Q)
五、用具区:五(Y)方(U)车(I)广(O)羽(P)
六、计统区:王(N)八(B)小(V)九(C)大(X)火(Z)
笔音意编码法中,主部首成字汉字(助记口诀中的汉字)的编码及输入除按照上述编码方法及输入方法外,还可按:本部+序号(3--8)方法进行。所谓“本部”指各偏傍部首所在的键。“序号”是指某一助记口诀中的某一汉字所在位置的排列顺序号,该顺序号从3开始到8。如F键上的口诀是“言齿戋乃分工”,言排在第一位,其编码序号为3,则编码及输入为F3;齿排在第二位,其编码序号为4,则输入键为F4。下面列出主部首成字汉字的编码一览表,输入时需击两键加空格键:(1)、数字区:
宝(33)草(43)手(53)水(63)木(73)口(83)(2)、人体区:
人(G3)入(G4)且(G5)爪(G6)老(G7)厶(G8)
言(F3)齿(F4)戋(F5)乃(F6)分(F7)工(F8)
耳(D3)目(D4)身(D5)子(D6)骨(D7)
心(S3)舌(S4)旁(S5)厂(S6)止(S7)也(S8)
女(A3)儿(A4)足(A5)又(A6)见(A7)母(A8)(3)、自然区:
土(H3)包(H4)气(H5)上(H6)雨(H7)央(H8)
山(J3)十(J4)力(J5)甲(J6)丙(J7)舟(J8)
日(K3)耒(K4)开(K5)辛(K6)白(K7)
月(L3)落(L4)冷(L5)千(L6)夕(L7)
金(M3)由(M4)田(M5)几(M6)片(M7)而(M8)(4)、生物区:
丝(T3)隹(T4)牛(T5)鸟(T6)革(T7)啼(T8)
虫(R3)禾(R4)早(R5)豆(R6)豕(R7)皮(R8)
马(E3)经(E4)医(E5)犬(E6)羊(E7)毛(E8)
竹(W3)鹿(W4)丁(W5)走(W6)虎(W7)凶(W8)
鱼(Q3)贝(Q4)丰(Q5)三(Q6)角(Q7)川(Q8)(5)、用具区:
五(Y3)刀(Y4)不(Y5)归(Y6)外(Y7)一(Y8)
方(U3)框(U4)衣(U5)竖(U6)二(U7)立(U8)
车(I3)弓(I4)皿(I5)壬(I6)甫(I7)撇(I8)
广(O3)亦(O4)巾(O5)欧(O6)干(O7)捺(O8)
羽(P3)匹(P4)酉(P5)戈(P6)矢(P7)乙(P8)(6)、计统区:
王(N3)文(N4)韦(N5)恩(N6)示(N7)豸(N8)
八(B3)米(B4)七(B5)留(B6)古(B7)辰(B8)
小(V3)门(V4)已(V5)兑(V6)四(V7)斤(V8)
九(C3)欠(C4)病(C5)尸(C6)寸(C7)亥(C8)
大(X3)石(X4)页(X5)良(X6)巴(X7)西(X8)
火(Z3)鬼(Z4)申(Z5)食(Z6)其(Z7)缶(Z8)。
笔音意编码法中,常用部首的编码及输入采用:双本部+序号(3--8)的方法进行。“双本部”是指对某一常用部首所在的键连击两次(连续编两码),如“冖”在3键上,双本部为33;“阝”在D键上,双本部为DD。“序号”指在笔音意编码总表中常用部首一栏内所列出的某一部首的排列顺序(从3到8)。如3键上的“冖”排在第二位,其序号为4,则输入的键为334;又如D键上的“阝”排在第一位,序号为3,则输入键为DD3。该常用部首有54个,其排列顺序是不能改变的,它们具有较强的记忆规律。
笔音意编码法中,高频字的输入可以按一级简码输入。即输入时需击一键加空格键。如:
数字区:到(3)会(4)我(6)学(6)本(7)中(8)
人体区:他(G)说(F)了(D)在(S)后(A)
自然区:地(H)出(J)的(K)是(L)时(M)
生物区:为(T)和(R)生(E)可(W)行(Q)
用具区:一(Y)国(U)年(I)于(O)以(P)
计统区:这(N)公(B)个(V)来(C)要(X)有(Z)。
笔音意编码法中二级简码汉字均为笔音意编码总表中任意两个部首组成的汉字,输入时只需击二键加空格键即可。二级简码汉字共有831个,如:字(3D)观(AA)话(FS)行(UW)岩(JX)多(LL)。
笔音意编码法中三级简码汉字均为笔音意编码总表中任意三个部首组成的汉字,输入时只需击三键加空格键即可。三级简码共有2537个字,如:宽(34A)宫(388)劳(43J)莺(34T)按(53A)势(5CJ)湘(67D)森(777)等,其余字在有关教材中给出,这里不在列示。
笔音意编码法中,重码补码是指码长度为三位的重码汉字,其第一个汉字末尾补Z,第二个汉字末尾补X,第三个汉字末尾补C,第四个汉字末尾补V,第五个汉字末尾补B,第六个汉字末尾补N,第七个汉字末尾补M,这样就将三位重码汉字转化为四位不重码。如:打入5PZ和空格键后有“找扎”两字重码,若需“找”字再打入Z则“找”字自动上屏。同样打入X键后“扎”字自动上屏。使用这条重码补码规则后,重码由静态的306个字转变为183个。
笔音意编码法中,两字词汇的编码是:每字各取前两笔部首组成四码,即每字取第一、第二部首组成四码。如:
汉字:氵又宀子(6A3D),讨论:讠寸讠人(FCFG),
时间:日寸门日(KCVK),政府:一止广亻(YSOG),
开口:一廾口口(Y488),电话:日乙讠舌(KPFS)。
笔音意编码中,三字词汇的编码是:前两个汉字各取首笔,后一个字取前两笔。如:电视机:KN7M,工程师:YRYY,全过程:GCR8,
共青团:TQUJ,上海市:H6OO,热电厂:5KYI,
故事片:BYIU,发起人:PWGG。
笔音意编码法中,四字词汇的编码是:每字取第一笔组成四码。如:
生活水平:I66Y,日积月累:KRLM,沪深股市:66LO,
起死回生:WZUI,行政管理:UYWN,任劳任怨:G4GL。
笔音意编码中,超过四字以上词汇编码是:前三字各取第一笔,最末字取第一笔组成四码。如:
中共中央总书记:8T8F,邓小平理论:AVYF,
建设有中国特色的社会主义:VFZO,国务院办公厅:UNDS。
笔音意编码法中,有些部首没有一定意义或不便归类,因此按助记口诀是否朗朗上口来进行归类定位。如:L键上的“冷”及辅部首,Y键上的“归”及辅部首,O键上的“捺”及辅部首,P键上的“乙”及辅部首,Z键上的“缶”及辅部首等。另外,为了有效地减少重码,把符合上述编码法之一的某部或某几部调整到另外的区、键上,如:厂和广按相似编码法应布局在一起,但遵从这一方法而把它们分开。
由于汉字结构的复杂性,在拆分汉字时有些汉字会拆出两种或多种不同的结果,这样编码也就有多种结果,象这样的编码称为容错码。笔音意编码法中容错码分为两种,一种是拆字时产生二意性的编码,称笔形容错码,如“产”拆成“立丿”或“六厂”。另一种是指一个汉字有两种以上不同声母的编码,称读音容错码,如“行”读Xing和Hang两音。相应的“产”字编码为:UIC和OSC,“行”字编码:UWX和UWH。
在初学笔音意码汉字输入法时,部分字词的编码不清楚,可以通过查询键--/键(?所在的键--反斜杠)进行查询。例如打入Q/QU则有“裴”字出现,并给出QYQU的编码。当然/可以出现在四码中的任意一码位置上,也可以多个/同时出现。当编码中有/时,所查询的是具有某一特点的一类编码,这些编码按汉字的使用频度排列,若所需字词排在第二位置以后,用序数(1234567890)选择,若所需字词处在第一位时,则继续往下输入,此时第一位置上的字词会自动上屏。
笔音意编码法在设计编码方案时已充分考虑到用户自定义的专业词汇的编码问题。目前较多的编码方案对用户自定义的专业词汇的编码只容许自身的编码规则,而不容许其它编码方法的编码规则,给用户造成了极大的不方便和无自主性。笔音意编码法则不同,提供给用户自定义专业词汇的编码是一个开放式低重码的体系,即在笔音意编码法中容许诸如简拼、双拼等编码规则存在而输入灵活自然,不需换档,不需加识别码,一切随心所欲地由用户自行决定。当然用户也可以按笔音意码的编码规则定义专业词汇。下面介绍四种方法。
1、遵从笔音意码的编码规则进行编码。编码如前,这里不再赘述。
2、遵从音码类编码规则定义专业词汇。如遵从自然码的编码规则定义:“世界和平与人类进步事业”其编码为UJHY。如遵从双拼双音编码规则定义:“金山电脑有限公司”其编码JSD。
3、遵从音码类规则的分层次(分类)定义专业词汇。这种方法定义的专业词汇一般不会与笔音意码的单字二字词相重码。所谓分层次(分类)是指专业词汇第四码用序数字(3--8)来区分。如用3代表科技类词汇,4代表医药卫生类词汇,5代表机械电子类词汇等等。如要定义经济管理类专业词汇,则用3代表计划类词汇,用4代表统计类词汇,用8代表价格类词汇等等。
例如:粮食总产量LSZ4,国民生产总值GMS4。
4、数字化编码与英文名称缩写定义专业词汇。当然这种方法应用于所需的专业词汇不多时。如:四川长虹电器股份有限公司3456,中央电视台CCTV,艾滋病AIDS,中国工商银行ICBC。
笔音意编码法的编码规则涉及汉字的拆分和读音两个方面,并遵从以下规定:
1.遵从汉字的书写顺序从左到右,从上到下,从外到内,并把书写时起笔所在的偏旁部首称作第一笔,把次笔所在的部首称作第二笔,把末笔所在的部首称作末笔。当第一、第二、第三、第四笔部首均不属于“笔音意码编码总表”中的部首时,一律拆成五种基本笔画。即横竖撇捺折,而“点”归入捺笔,“提”归入横笔,竖勾作竖笔。笔音意码中的“字”是指国家标准楷书字形而非草书等字形。
2.笔音意码规定:凡是由“辶、廴”构成的汉字,末笔均为“辶”和“廴”编码。如:“这”字拆成“文、辶”。凡是由“口”构成的汉字,“口”均作为首笔,并规定一次写完,如“困”字拆成“口、木”。其余各部首均遵从书写习惯顺序。
笔音意编码法编码总则是:
取大优先靠部首,
完整部首不分离,
不成部首拆五笔。
三笔写完加声母,
多字词汇纯形码。
笔音意编码法是以汉字的偏旁部首为基础,通过精心优选出238个偏旁部首,包容了全部繁简汉字的偏旁部首。当然这里所指的部首与《新华字典》等工具书的部首概念含意(是汉字的基本组成部分,是固定在某一位置上形成汉字分类检索的一个标识)没有多大的变化,而范围有了拓展,它包含了部分汉字和非汉字,为了方便乃称作部首。它与字根、字元和部件是有区别的。
取大优先靠部首是指在拆分汉字时要优先选取书写中较大部首者。如“有”字要先选“ナ”部而不选“一”部;“用”字要先取“月”和“丨”而不先取“冂”。
完整部首不分离是指已构成笔音意码编码总表中的部首时,该部首不能被拆开分成若干部首或笔画。如“交”字折成:“六”和“乂”而不能折成“亠”、“八”和“乂”。
不成部首拆五笔是指各笔所在部首均不属于笔音意码编码总表中的部首时,则拆分成五种基本笔画--横、竖、撇、捺、折。这种情形大都存在于末笔。如“止”字折成:“”、“丨”和“一”。
三笔写完加声母是指起笔、次笔和末笔三笔以内把该字拆完的其末尾加该字的声母作为尾码。如“加”字折成: 力”和“口”,其编码为:J8J;“完”字折成“宀”、“一”和“兀”,其编码为3YMW。
多字词汇纯形码是指两字以上的词汇其编码尾码不再加其声母,而依据其规则取各个部首,因此属于纯形码。如“汉字”一词的编码为6A3D。
从上述总则中可以看出笔音意编码,分为单字和多字两种编码规则,且两种规则都统一在部首意义上。
笔音意编码法在拆分汉字时要求所拆出的若干部首要有一定的含义,不能硬性地把一个不可分割的部首拆开,而是以偏旁部首为依据自然拆分,无需刻意雕琢,实现了会《新华字典》偏旁部首查字就能拆字编码输入偏傍部首,是目前拆字最简单的编码方案。笔音意编码法汉字拆分原则是指把一个汉字分别拆成符合笔音意编码总表中的部首。如“李”拆成“木”和“子”,“赵”拆成“走”和“乂”等等。汉字拆分时应遵循以下原则:
1、取大优先原则。是指在拆分汉字时要优先选取书写中较大部首者。以下汉字的拆分体现了这一原则:
栏:木ソ三,韩:十早韦,无:一尢,束:一口小,产:立丿,没:氵殳。
2、兼顾含义原则。是指汉字拆分后的各个部首能体现该字的意义。以下汉字拆成:
永:亠水,神:礻申,三:一一一,工:一丨一, 黑:口ソ土灬。当然,绝大多数汉字按部首拆分后已做到了兼顾含义这一原则。
3、完整部首不分离原则。是指已构成一个部首时该部首不能再继续拆分为若干个部首。以下汉字的拆分就能体现这一原则:
我:丿扌戈,戢:口耳戈,回:口口,酒:氵酉,雄:ナ厶隹,
份:亻分,领:令页,被:衤皮,帆:巾凡,弯:亦弓,
捉:扌足,成:戊乙,彤:冂亠彡,无:一尢,鞋:革土土,
闹:门宀巾,投:扌殳,罐:缶艹口隹。
对于交连汉字,即指两个或两个以上部首交叉重迭构成的汉字,在拆分时亦遵循上述原则。如:
4、常用部首不拆分原则。在笔音意码里部首是组成汉字的基本单位,而常用部首(54部)和横竖撇捺折一样是不可再拆分的最小单位,因此在拆字时,对于54部常用部首是不能被拆分的,这也是笔音意码与其它编码方法不同之处。如:宀、阝、艹、廾、彐、豸、冂等, 这些常用部首有它自己的编码规则。当涉及笔音意编码总表中的成字部首时也要细分,即继续拆分成“常用部首”或横竖撇捺折中的一种。如:
分:八刀,且:月一,自:丿目,令:人丶マ,革:廿口十,
骨:冂乙冖月,玉:王丶,其:
二八,亥:亠乙丿人,皮:乙丿丨又。
总之,笔音意码对汉字的拆分遵从自然部首分离,无须对一个偏旁部首进行强制拆分。在拆字中坚持一个标准,即同类结构的汉字在拆分时执行一个标准。
本发明具有下列优点:
1.拆字简单且重码少。笔音意码对汉字的拆分以偏旁部首为依据,部首自然拆开,实现了会《新华字典)》偏旁部首查字就能拆字编码,无师自通。对于国标(GB2312-80)汉字库中6763个汉字,拆为三笔以下的汉字有4328个占64%,拆为四笔的汉字有2435个占36%,且平均每字拆为3.09部,击3.23键,是目前众多汉字输入法中拆字最简单、击键次数最少的一种。不仅如此动态重码仅有183个汉字,重码率为2.7%。
2.编码规则符合自然习惯。笔音意码的编码规则是根据汉字的造字规律、读字规律和写字规律,从简单到复杂这一过程入手,制定了“善解人意”的编码规则,即凡是三笔(这里的“笔”是指笔音意码编码总表中的一个部首称作一笔)以内写完的汉字其编码末尾均加该字的声母。而符合这一规律的汉字全都是简单的常用汉字,不符合这一规律的多数为“复杂”的不常用汉字,其编码取第一、第二、第三笔和末笔部首。不仅如此,凡三笔写完的2629个汉字全都为三级简码,这样尾码加声母仅有1580个字,何况在这1580个字中又产生831个字为二级简码。编码规则中不添加任何识别码,每字直接拆分编码即可。
3.用户自扩充的专业词汇与原字词汇量之间重码率极低。目前各种流行的编码方法只要扩充词汇量,其重码就大大增加。而笔音意码由于采用了形、音、意编码,在新增加专业或非专业词汇量的情况下,确保新词汇与原来字词汇重率极低。特别是当新增词汇量第四码用序号(3--8)分类编码时,可完全实现与单字无重码。
4,笔音意编码法较好地解决了诸如宀、亻、钅等偏旁部首的输入问题。众所周知,多数音码类编码方法对宀、亻、钅等偏旁部首采用了“近似音”方法编码,重码多;有的形码类编码方法虽然进行了编码,但拆分太细使用不方便。而笔音意码给每个偏旁部首赋一个编码,实现了有序方便记忆的无重码编码。
5,笔音意编码法实现三级简码事前预知并无需记忆。目前众多的编码方法为了降低击键次数都设计有一、二和三级简码,由于简码汉字众多,且无记忆规律可循,要记住大量的简码汉字确实是件十分困难的事。因此,简码在实际输入中利用率较低,特别是三级简码如同虚设。为了更有效地利用三级简码,笔音意码提出了“事前预知是否有无三级简码”的判断标准,即:凡是三“笔”写完的汉字均有三级简码。根据这一标准,在拆字时就知晓有无三级简码。于是,笔音意码中2529个汉字的三级简码就无需记忆了。
6,中心键盘设计。笔音意码键盘布局采用中心键盘设计,即以5TGB和6YHN八个键的中心线为轴心,将键盘分为左右两半,离轴心线最近的字母(数字)键上布有构字较多、击键次数较频的偏旁部首,随着轴心向左右两边扩展部首频率逐渐减弱。这样布局既符合人体学键盘设计原理,又符合手指越灵活越负担重的原则,便于减少专业打字强劳动下手腕疲倦。
7,拆字符合语文规范。 笔音意码在拆分汉字时以小学生《常用汉字的笔画、笔顺、结构》(辽宁教育出版社,1996年4月重印本)为标准,严格按自然书写笔画顺序进行,不添加任何人为的规定,符合国家语言文字规范,全面与现行语文教学相衔接。
具体实施方式
图1为本发明之笔音意编码总表;
图2为本发明之主部首键盘分布图;
图3为本发明与五笔字型对照简表。
图1中:
①.‘提’笔归“一”,‘:’和飞字的末笔两点归“冫”,‘竖勾’归“丨”,提土旁归土。
②.‘()’内的部首称作辅部首,‘()’外(前)的部首称作主部首。如“人”为主部首,“亻”为辅部首。
③.在助记口诀中‘()’内的大写字母表示本句所有部首在该字母上,小写字母为该字的汉语拼音声母,也表示本句所有部首在该字母上。
④.字母‘U’可与本句中的‘丩’产生形象记忆,‘V’与‘冂’产生联想记忆,‘O’与‘丶’形象记忆,‘W’与‘凶’形象记忆。
⑤.黑体字(宝草老冷丝经竹虎归框竖撇捺匹留病)只起主部首作用,实际不参加编码,如:‘彪’字拆成“虍几彡”而不拆成“虎彡”。
⑥.厶读‘私’音,戋读‘尖’音,耒读‘垒’音,隹读‘追’音,豕读‘史’音,豸读‘志’音,聿读‘玉’音,缶读‘否’音。
⑦.版权标识是指笔音意码所有权的有关信息,使用权标识是指依法取得本编码方案的合法用户名称信息。
图3中:“224”和“3.72”这两个数据来源《软件报》1996年第32期,其余数据为笔者统计。
平均每字拆笔数,即平均每字拆为多少笔数。(1)有32个一级码,有2个字不拆(即“一”和“乙”),有54个常用部首和32个键名汉字不拆,共计119个字拆一笔。(2)有1580个字拆为二笔,(3)有2629个拆为三笔,(4)有2435个字拆为四笔,计算加权平均数为:3.09笔。
平均每字击键数,即平均每字打多少键。(1)有32个字击一笔,(2)有831个字击二键,(3)有2629个字三级简码、有750个字和54个常用部首击三键,共计3433个字。(4)有2467个字击四笔。计算加权平均数为:3.23键。
笔音意码汉字输入法版本说明及码表(软件)安装说明
一、笔音意码汉字输入法版本说明
笔音意码汉字输入法经过征求用户意见和反复优化设计后正式确定为1.0版,该版有26810条字词,其中:(1)单字11682个汉字,其中:①GB 2312-80字库有6763个,②一级简码有32个,③二级简码有867个,④三级简码有2692个(有8个字又是一级简码,有55个字为147个不常用字的三级简码),⑤容错字361个,⑥有147个不常用汉字,即GB 2312-80没有收集但现实生活中有用的汉字,如:镕、馼、碁、旻等字,⑦重码补码汉字810个。(2)词组15128条,其中:①二字词组有12641条,②三字词组有1014条,③四字词组有1346条,④五字及以上词组有226条。
1.0版是针对GB 2312-80字符集而推出的,用A作为标识。如:在UCDOS 5.0以上版本支持下的码表约定为:BYY 1.0A FOR UCDOS,在WINDOWS 95中文版支持下的码表约定为:BYY 1.0AFOR WINDOWS95,这样区分是为了适应各种操作系统输入法生成器的要求。对于GBK等字符集以后将由1.0B、1.0C等版本承担。
二、笔音意码汉字输入法码表(软件)安装说明
笔音意码汉字输入法码表目前仅提供UCDOS 5.O以上版本支持下的码表表,其它操作系统支持下的码表以后逐步提供给用户,现将UCDOS 5.0以上版本支持下的码表安装使用说明如下:
(1)、在DOS下将磁盘插入A(或B)驱动器,将byy.imd文件拷入UCDOS目录下DRV子目录,即:
C>copy a:byy.imd c:\ucdos\drv回车将byy.bat文件拷入UCDOS目录下,即:
C>copy a:byy.bat c:\ucdos回车
(2)、启动ucdos系统,在ucdos目录下打入byy即可。
C>ucdos(或up)回车
C>byy回车
(3)、进入字处理软件(如:WPS、CCED等)后,同时按下Alt键和F8键即可为笔音意码输入法。
Claims (4)
1、一种笔音意编码汉字的计算机输入方法,其特征在于依据汉字的偏旁部首所表示的意义,将汉字的偏旁部首划分为数字区,人体区,自然区,生物区,用具区,计统区,且每个区所对应的输入键盘如下:
3 宝(宀,冖)
数
4 草(艹,廾,丌,卄,
)
5 手(扌,)
字
7 木(ホ)
区
8 口
G 人(亻)入且
爪(爫)老(耂)厶
人
F 言(讠)齿(齒)戋乃分工
体 D 耳(阝,卩,
)目(自)身子(孑,了)骨
S 心(忄,)舌旁厂止
也
区
A 女儿
足
又(マ,叉,殳)见(見)母
自
然 K 日(曰,
)耒开辛白
L 月(
用)黑冷(冫,丬,爿,今,令)千夕
区
M 金(钅,釒)由(尢,兀,尤)田几(
凡)片而
生
物 E 马(馬)经
犬(犭)羊(
)毛(镸)
W 竹()鹿丁(亍)走(辶廴之辶)虎(虍)凶(乂,凵)
用
区
P 羽(予)匹(匚疋
)酉戈(
弋戊)矢乙(フ
乚ㄋ丂)
N 王(玉,主)文(攵,夂)韦(韋)示(礻)豸
计
V 小(,少)门(冂門)已(己巳)兑四(罒)斤聿(肀聿)
统
X 大(太)石页(頁)良(
艮)巴西(覀)
区
2、根据权利要求1所述的笔音意编码汉字的计算机输入方法,其特征在于各键上的成字汉字的输入方法是:先击该主部首成字汉字所在的键,加该字在助记口诀中所在的3-8位置序号,加空格键。3-8位置序号。
3、根据权利要求1所述的笔音意编码汉字的计算机输入方法,其特征在于词汇的编码和输入方法为:两字词各到其前两笔部首组成四码,三字词取前两个字的第一部首加后一个字的第一、第二部首组成四码,四字词取每个字的第一部首组成四码,超过四字以上词汇的取前三字第一部首加最末一字的第一部首组成四码。
4、根据权利要求1所述的笔音意编码汉字的计算机输入方法,其特征在于高频字的输入方法为:该高频字所在键加空格键。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 98124053 CN1110743C (zh) | 1998-03-18 | 1998-12-31 | 一种笔音意编码汉字的计算机输入方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN98104844.7 | 1998-03-18 | ||
CN98104844 | 1998-03-18 | ||
CN 98124053 CN1110743C (zh) | 1998-03-18 | 1998-12-31 | 一种笔音意编码汉字的计算机输入方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1235297A CN1235297A (zh) | 1999-11-17 |
CN1110743C true CN1110743C (zh) | 2003-06-04 |
Family
ID=25744638
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 98124053 Expired - Fee Related CN1110743C (zh) | 1998-03-18 | 1998-12-31 | 一种笔音意编码汉字的计算机输入方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1110743C (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104007834B (zh) * | 2000-05-03 | 2020-08-14 | 苏荣斌 | 世界文字信息数字化运算编码输入方法及其信息处理系统 |
CN104965598A (zh) * | 2014-04-09 | 2015-10-07 | 陆春荣 | 中文键盘及其中华汉码编码方案设计 |
-
1998
- 1998-12-31 CN CN 98124053 patent/CN1110743C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1235297A (zh) | 1999-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1523518A (zh) | 智能汉语文化辞典系统 | |
CN1110743C (zh) | 一种笔音意编码汉字的计算机输入方法 | |
CN1019424B (zh) | 音形笔画综合编码汉字高速输入法及所用键盘 | |
CN1028680C (zh) | 汉字全息码 | |
CN1107896C (zh) | 一种简繁体汉字自动转换的编码输入方法 | |
CN1166997C (zh) | 汉字免拆分快速输入法 | |
CN1186976A (zh) | 计算机汉字八四码输入法及键盘 | |
CN1825255A (zh) | 和码汉字形码输入法及其单手键盘 | |
CN1164689A (zh) | 以词为单位的音形意汉字计算机输入法及中西文兼容键盘 | |
CN1054447C (zh) | 计算机汉字输入坐标码编码方法 | |
CN1420424A (zh) | 一种用汉字及部首读音编码的汉字输入方法 | |
CN1188769C (zh) | 一种汉字计算机输入方法 | |
CN1661531A (zh) | 声画码汉字输入法及内嵌式拼音/标调一步到位输入的实现 | |
CN1049990C (zh) | 一种口算编码计算机汉字输入法 | |
CN1069766C (zh) | 电脑、字典共用新部首汉字输入法 | |
CN1536473A (zh) | 汉字笔画输入法 | |
CN1467614A (zh) | “三合一”汉字编码及键盘输入法 | |
CN1182232A (zh) | 知音码汉字编码技术 | |
CN1182458C (zh) | 纯金码汉字输入法 | |
CN1932731A (zh) | 汉字输入方法 | |
CN1848051A (zh) | 标准汉字输入法 | |
CN1240957A (zh) | 汉字部首笔顺和字频拼音互补输入法 | |
CN1357814A (zh) | 计算机汉语键盘及其汉语信息的输入和处理方法 | |
CN1249566C (zh) | 新华码汉字输入法 | |
CN1115885A (zh) | 中文音形码 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |