CN1064150C - 计算机中文信息编码输入法 - Google Patents

计算机中文信息编码输入法 Download PDF

Info

Publication number
CN1064150C
CN1064150C CN97103598A CN97103598A CN1064150C CN 1064150 C CN1064150 C CN 1064150C CN 97103598 A CN97103598 A CN 97103598A CN 97103598 A CN97103598 A CN 97103598A CN 1064150 C CN1064150 C CN 1064150C
Authority
CN
China
Prior art keywords
sign indicating
indicating number
correspondence
word
female sign
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN97103598A
Other languages
English (en)
Other versions
CN1166646A (zh
Inventor
苏永全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN97103598A priority Critical patent/CN1064150C/zh
Publication of CN1166646A publication Critical patent/CN1166646A/zh
Application granted granted Critical
Publication of CN1064150C publication Critical patent/CN1064150C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

本发明涉及的是一种以计算机键盘为输入媒介的计算机中文信息编码输入法,其编码技术方案是:它所组成的与中文信息对应的码串是由分别代表每一汉字声母和韵母的代码及区分码依次顺序连接组成。本技术的编码输入法符合现代汉语规范标准和人们思维方式及语言表达习惯,实现了以词或词组的录入方式,无重码,易于学习和掌握,适用范围广。

Description

计算机中文信息编码输入法
本发明涉及的是向计算机系统输入中文信息的编码方法,尤其涉及的是以计算机键盘为输入媒介的中文信息编码输入法。
汉字信息输入方法的种类非常多,归纳起来有以下几大类:1、形码输入法,以专职人员常用的五笔字型汉字编码法最为典型,这种方法经过一定时间的专业培训,其输入速度较快,但其不足是:①拆分字根和拆分原则、键盘分布规则较为特殊,记忆量大,不规律方法较多,遗忘率较高,必须重复强化记忆、使用才会维持高输入速度;②该输入法是以单个汉字输入为主,不仅不符合人们的语言表达习惯和思维方式,而且其字型拆分方法与现行国家语言文字方面的规范标准、现行中小学语文教学方案存在较大差异,难以更广泛地推广应用,而主要成为专职人员的输入法;③存在大量重码,本输入法的编码码串基本以四个码元为限,导致特别是收录大量常用词条的高版本重码率的积聚增加,成为实现盲打和高速录入的严重障碍。2、音码输入法,以双音输入法最为典型,这种方法是以汉语拼音为模板进行编码的,易于学习,适于非专业录入人员使用,但其不足是:①由于汉字的同音字和同音双音词很多,造成大量重码,尤其对于全拼全音码串以较长,因而严重影响了音码汉字输入法的输入效率;②对不会读的字无法输入,除非变换其他汉字输入法;③以音托的方式定义键盘键位,缺少规律性,尤其对于双拼双音韵母安排更杂乱、缺少规律性。3、音形码输入法,以“四笔声形”码为例,其编排规则是“本、首、末、次”的四码原则,其中本码为本字的声母,首、末、次码分别为首部件代码、末部件代码和次部件代码,其部件拆分法与五笔字型拆分方法类同,如“扒”其编码为:B(本码)、F(扌首码)、B(八末码)、N(次码),“抽”其编码为:U(ch本码),F(扌首码)、Y(由末码)、T(土次码),同样存在部件零散、包含大量无规律性和规则、以音托方式定义键盘键位、排列无规律的弊端。综上所述,现有的各种汉字输入法普遍存在键盘键位定义、汉字编码方法不符合语言学习规范的弱点,限制了各编码方法的广泛使用;为缩短码串采取封闭式编码方法、并由于本身基于的编码原理,造成大量重码的出现,妨碍了以词或词组为主的方式进行录入,不符合人们的思维方式和语言表达习惯,影响了输入效率。因此,现有的各种计算机汉字编码输入技术方案并非理想。
本发明的目的是提供一种用标准键盘为输入媒介、向计算机输入中文信息的输入法,尤其提供一种以音码输入法为基础、结合汉字字形、简单易学、消除重码、能够以词或词组为主要录入单位的中文信息输入编码方法。
本发明的计算机中文信息编码输入法的技术构成方案是,其编码规则它是以中文信息每一构成字拼音的声母、韵母及作为同音词或词组区分码的不同的第一字部首或其字余的声母或韵母作为区分码为母码、以将各母码固定在计算机标准键盘各键位上所对应的键标为代码依词或词组顺序编码;
键标代码与拼音声母、韵母母码的对应关系,即键盘定义如下:A对应的母码为iao、B对应的母码为zh\u、C对应的母码为sh\uai、D对应的母码为h\ian、E对应的母码为m\an、F对应的母码为k\ia、G对应的母码为g\i、H对应的母码为j\ie、I对应的母码为n\en、J对应的母码为q\in、K对应的母码为x\ing、L对应的母码为iong、M对应的母码c\uen、N对应的母码为z\uei、O对应的母码为I\eng、P对应的母码为ou\er、Q对应的母码为ao、R对应的母码为p\ai、S对应的母码为iang、T对应的母码为b\a、U对应的母码为t\ei、V对应的母码为ch\ua、W对应的母码为f\ang、X对应的母码为r\uan、V对应的母码为d\e、Z对应的母码为uang、;对应的母码为iou、′对应的母码为üe、[对应的母码为ü、]对应的母码为üan、,对应的母码为s\ong\ueng、。对应的母码为o\uo、/对应的母码为ün;其中部首所对应的拼音为:
一  画      八b-a      辶 zh-i     四  画    七  画
丶d-ian     人r-en     工g-ong     灬h-ou    辰ch-en
一h-eng     入r-u      土t-u       礻sh-i    豕sh-i
丨sh-u      亻r-en     士sh-i      攴p-o     豸sh-i
丿p-ic      勹b-ao     艹c-ao      攵wen     谷g-u
乙zh-e      儿er       大d-a       殳sh-u
zh-e        几j-i      廾n-ong     yu     八  画
zh-e        厶s-i      尢you       聿yu
zh-e        又you      寸c-un      爿p-an    雨yu
zh-e        廴j-ian    弋yi                  黾m-in
zh-e        卩d-an      扌t-i      五  画    隹zh-ui
            阝er       口wei
二 画       凵sh-an    彳ch-i       疒b-ing   九  画
亠wen       刀d-ao     彡s-an       衤yi
冫l-iang    力l-i      夕x-i        钅j-in    音yin
冖p-ing     夂d-ong    疋p-i                  鬼g-ui
讠yah      三  画      犭q-uan
二er       饣sh-i                六  画     十一画
十shi      氵d-ian     彐x-un
厂ch-ang   忄x—in     屮ch-u    耒l-ei     麻m-a
匚q=u      宀g-ai      幺yao     虍h-u
卜b-u      丬zh-uang   孑z-i     缶f-ou     十二画
刂d-ao     广g-uang    纟s-i     艮g-en
门t-ong    门m-en      巛ch-uan  糸m-i      黑h-ei。
本发明所设计的计算机中文信息输入编码方案其优点是:①虽然是以汉语拼音方案》为编码基础,但是由于结合了依据《现代汉语词典》部首划分规则的字根拆分方式,并赋予固定读音,使本输入法不仅能够录入不知其读音的中文信息,而且这种字根拆分方式完全摒弃了现有各输入法存在的汉字拆分零散和缺少规律性的弊病,使其符合现代汉语的规范要求,实现与现有汉语的完全兼容。②本发明技术是以重新定义的键盘键位为输入媒介的,这种键盘定义是分别以汉语拼音声母、韵母原有顺序进行定义的,键盘由中间向两侧其声母定义包括:左手第一行键位分别为:b、p、m、f,右手为:d、t、n、l,第二行键位左手为:g、k、h,右手为:j、q、x,第三行键位左手为:zh、ch、sh、r,右手为:z、c、s,其韵母定义以第一行字母键位左手为例,其排列为:a、ai、an、ang、ao,可以看出该键盘定义与拼音规律相统一,使该输入法更符合国家语言文字的教育程序规范,易于记忆、使用,这就使计算机不仅适合成人,而且还能成为中小学生语言学习过程中的辅助工具。③由本发明技术方案可知,本中文信息编码输入法采用的是树状开放编码方式,不仅适合、还能够最大限限度地收录常用词、习惯用语、成语等大量词汇,使目前以字为主的输入方法改变为以词或词组为主的录入方式,字输入成为其一辅助输入手段。另外,由于将记录词或词组的汉字的部首或字余作为同音字或同音词的区分码,从而根本消除了重码,使原有繁琐的手动翻动、按动数字键、眼睛搜寻选择方式变成人脑的自然选择,使计算机中文信息录入更符合人们思维方式和语言表达习惯,能够实现快速输入和盲打、想打、听打。④本编码输入技术与目前最先进的WINDOWS′95输入法管理器相挂运行后能够充分发挥本输入法的特长,这是由于该输入法管理器采用动态扫描选择录入方式,人机界面友好、直观,以该输入法管理器作为本发明这种开放式输入编码技术的运行环境,在许多情况下无须输入全部码串即可录入整个词或词组,可使每个字的动态平均码长为2键左右,录入方式更加快捷。由上所述,本中文信息编码输入技术是以现代汉语拼音和标准部首为基础原理设计而成的编码技术方案和键盘定义方式,符合现代汉语规范标准和人们思维方式及语言表达习惯,使本输入法易于掌握和学习,拓宽了它的应用范围。
下面将对本发明的中文信息编码输入法方案进行详细说明。
附图为本发明中文信息输入编码技术所使用的键盘定义图。
本发明将中文信息分为会读音和不会读音汉字两类:
一、不会读音的汉字信息的编码方法:
1、对于单音词:
编码=①(字)部首声+(字)部首韵+(字)字余声+(字)字余韵
②(字)部首声+(字)部首韵+(字)字余声+(字)字余韵+(字)
字余某一部分声/韵;
如,“绱”的编码为:,(s)g(i)c(sh)w(ang)/(与会读音词编码的区分码),则总的编码为:“,gcw/”;“雹”的编码为:1(零声母)[(u)t(b)q(ao)/(与会读音词编码的区分码),则总的编码为:“1[tq/”。
2、对于双音以上词或词组:双音以上及下面的“3、”所述的五音或五音以上的词或词组中当包含有不会读音的字时,其编码规则是以代表该字部首或字余的声母或韵母的代码及与其余会读汉字的代表其声母或韵母的代码共同依词或词组顺序连接组成其编码码串,即:
编码=(字N)部首声/韵+(字N)字余声/韵+(会读音字)编码
如,“绱鞋”的编码为:,(s)c(sh)k(x)h(ie)L(避免重码键),则总的编码为:“,ckhL”;“三宥”的编码为:,(s)e(an)g(g);(iou)L(避免重码键),则总的编码为:“,eg;L”。
3、对于五音或五音以上词或词组:
编码=(字N)部首声/韵+(会读音字)编码
二、会读音的汉字信息的编码:
1、对于单音词:
编码=①(字)声
     ②(字)韵
     ③(字)声+(字)韵
     ④(字)声+(字)韵+(字)部首声/韵
     ⑤(字)声+(字)韵+(字)部首声/韵+(字)字余声/韵
     ⑥(字)声+(字)韵+(字)部首声/韵+(字)字余声/韵+(字)
       字余部首声/韵
     ⑦(字)声+(字)韵+(字)部首声/韵+(字)字余声/韵+(字)
       字余部首声/韵+(字)字余字余声/韵
2、对于双音词或词组:
编码=①(字1)声+(字1)韵+(字2)声+(字2)韵
     ②(字1)声+(字1)韵+(字2)声+(字2)韵+(字1)部首声/韵
     ③(字1)声+(字1)韵+(字2)声+(字2)韵+(字1)部首声/韵+
      (字2)部首声/韵
     ④(字1)声+(字1)韵+(字2)声+(字2)韵+(字1)部首声/韵+
      (字2)部首声/韵+(字2)字余声/韵
如,“一直”的编码为:L(零声母键)g(i)b(zh)g(i);
    “一致”的编码为:L(零声母键)g(i)b(zh)g(i)m(uen);
    “医治”的编码为:L(零声母键)g(i)b(zh)g(i)j(q);
    “意志”的编码为:L(零声母键)g(i)b(zh)g(i)o(l);由于“意”为双部首字,所以其另一编码为:L(零声母健)g(i)b(zh)g(i)k(x)。
    “抑制”的编码为:L(零声母键)g(i)b(zh)g(i)u(t);
3、对于三音词或词组:
编码=①(字1)声+(字1)韵+(字2)声+(字2)韵+(字3)声+(字3)韵
   ②(字1)声+(字1)韵+(字2)声+(字2)韵+(字3)声+(字3)韵
   +(字N)部首声/韵
如:
“看一下”的编码为:f(k)e(an)L(零声母)g(i)k(x)f(ia)
“砍一下”的编码为:f(k)e(an)L(零声母)g(i)k(x)f(ia)c(sh)
“刊一下”的编码为:f(k)e(an)L(零声母)g(i)k(x)f(ia)y(d)
“一本书”的编码为:L(零声母)g(i)t(b)i(en)c(sh)b(u)
“一朵花”的编码为:L(零声母)g(i)y(d)。(uo)d(h)v(ua)
4、对于四音词或词组:
编码=①(字1)声+(字1)韵+(字2)声+(字2)韵+(字3)声+(字3)
       韵+(字4)声+(字4)韵
     ②(字1)声+(字1)韵+(字2)声+(字2)韵+(字3)声+(字3)韵
      +(字4)声+(字4)韵+(字N)部首声/韵
如,“耸入云霄”的编码为:,(s),(ong)x(r)b(u)L(零声母)/(un)k(x)a(iao)
“送货上门”的编码为:,(s),(ong)d(h)。(uo)c(sh)w(ang)e(m)i(en)。
5、对于五音以上的词或词组:
编码=(字1)声/韵+(字2)声/韵+(字3)声/韵+…+(字N)声/韵
如“诉讼代理人”的编码方法为:,(s),(s)y(d)o(l)x(r),则总的编码为:“,,yox”。
本编码中,对于双音词以上的词或词组,若第二词的第一字与第一词的第一字不同,则取第二词的第一字部首声母或韵母所代表的代码作为区分码;若第二词的第一字与第一词的第一字相同而第二字不同,则取第二词的第二字部首的声母或韵母所代表的代码作为区分码。以此类推,作为同音词或词组的区分码的选取规则是以第二词或词组与第一词或词组的不同的第一字取代表其部首的声母或韵母的代码作为区分码。
由上所举实例可以看出,本中文信息编码输入法的词定义是相当广泛的,远远超过了现有的各种编码输入方案,因此形成了以词或词组为主的输入方法,如下面一段文字就是作如下词组划分进行编码输入的:“他是一个心脏病患者,患病前他住在国外。患病后的一些日子,他一直感觉不好。他的心脏上长有一个肿瘤。他打算回国治疗。”
在上述技术方案中,为防止不会读音的中文信息编码与会读音的中文信息编码产生同码,即防止出现重码,本技术方案中采用了不会作为部首声母出现的键位“/”作为两种编码方式的末尾区分码,还用虽可用部首声母但其出现频率极低的键位“L”作为含有不会读音字的单音词与双音词或词组之间的末尾区分码。

Claims (4)

1、一种计算机中文信息编码输入法,其特征在于它是以中文信息每一构成字拼音的声母、韵母及作为同音词或词组区分码的不同的第一字部首或其字余的声母或韵母作为区分码为母码、以将各母码固定在计算机标准键盘各键位上所对应的键标为代码依词或词组顺序编码;
键标代码与拼音声母、韵母母码的对应关系,即键盘定义如下:A对应的母码为iao、B对应的母码为zh\u、C对应的母码为sh\uai、D对应的母码为h\ian、E对应的母码为m\an、F对应的母码为k\ia、G对应的母码为g\i、H对应的母码为j\ie、I对应的母码为n\en、J对应的母码为q\in、K对应的母码为x\ing、L对应的母码为iong、M对应的母码c\uen、N对应的母码为z\uei、O对应的母码为I\eng、P对应的母码为ou\er、Q对应的母码为ao、R对应的母码为p\ai、S对应的母码为iang、T对应的母码为b\a、U对应的母码为t\ei、V对应的母码为ch\ua、W对应的母码为f\ang、X对应的母码为r\uan、Y对应的母码为d\e、Z对应的母码为uang、;对应的母码为iou、′对应的母码为üe、[对应的母码为ü、]对应的母码为üan、,对应的母码为s\ong\ueng、。对应的母码为o\uo、/对应的母码为ün;其中部首所对应的拼音为:
一  画      八b-a     辶zh-i      四  画    七  画
丶d-ian     人r-en    工g-ong     灬h-ou    辰ch-en
一h-eng     入r-u     土t-u       礻sh-i    豕sh-i
丨sh-u      亻r-en    士sh-i      攴p-o     豸sh-i
丿p-ie      勹b-ao    艹c-ao      攵wen     谷g-u
乙zh-e      儿er      大d-a       殳sh-u
zh-e        几j-i     廾n-ong    
Figure 9710359800021
yu     八  画
zh-e        厶s-i     尢you       聿yu
zh-e        又you     寸c-un      爿p-an    雨yu
zh-e        廴j-ian   弋yi                  黾m-in
zh-e        卩d-an    扌t-i       五  画    隹zh-ui
            阝er      口wei
二画        凵sh-an   彳ch-i      疒b-ing   九  画
亠wen       刀d-ao    彡s-an      衤yi
冫l-iang    力l-i     夕x-i       钅j-in    音yin
冖p-ing     夂d-ong   疋p-i       鬼g-ui
讠yan       三  画    犭q-uan
二er                     饣sh-i      六画    十一画
十shi       氵d-ian      彐x-un
厂ch-ang    忄x-in       屮ch-u     耒l-ei    麻m-a
匚q=u       宀g-ai       幺yao      虍h-u
卜b-u       丬zh-uang    孑z-i      缶f-ou    十二画
刂d-ao      广g-uang     纟s-i      艮g-en
冂t-ong     门m-en       巛ch-uan   糸m-i     黑h-ei。
2、根据权利要求1所述的中文信息编码输入法,其特征在于不会读音的单音词其编码方法为以代表其汉字部首和字余的声母和韵母对应键位代码依次连接组成编码,以‘/’作为两种编码方法的末尾区分码。
3、根据权利要求1和2所述的中文信息编码输入法,其特征在于对于包含有不知读音字的词或词组的编码方法为:以代表该字部首或字余的声母或韵母对应的键位代码与其余汉字代表其声母和韵母的键位代码共同依词或词组顺序连接组成其编制为代码码串,并以键位“L”作为含有不会读音字的双音或双音以上词或词组之间的末尾区分码。
4、根据权利要求1或2所述的计算机中文编码输入法,其特征在于零声母的码元为“L”。
CN97103598A 1997-05-10 1997-05-10 计算机中文信息编码输入法 Expired - Fee Related CN1064150C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN97103598A CN1064150C (zh) 1997-05-10 1997-05-10 计算机中文信息编码输入法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN97103598A CN1064150C (zh) 1997-05-10 1997-05-10 计算机中文信息编码输入法

Publications (2)

Publication Number Publication Date
CN1166646A CN1166646A (zh) 1997-12-03
CN1064150C true CN1064150C (zh) 2001-04-04

Family

ID=5166760

Family Applications (1)

Application Number Title Priority Date Filing Date
CN97103598A Expired - Fee Related CN1064150C (zh) 1997-05-10 1997-05-10 计算机中文信息编码输入法

Country Status (1)

Country Link
CN (1) CN1064150C (zh)

Also Published As

Publication number Publication date
CN1166646A (zh) 1997-12-03

Similar Documents

Publication Publication Date Title
CN105938402B (zh) 一种声形码汉字输入法及键盘
CN1064150C (zh) 计算机中文信息编码输入法
CN1645356A (zh) 多维汉语学习系统
CN1224866A (zh) 音形码汉字输入方法
CN1257444C (zh) 计算机汉语全音输入法
CN1137432C (zh) 快易码汉字输入法
CN1088210C (zh) 六区五位汉语音节和汉字键盘输入方法
CN1584809A (zh) 可做拼音汉字的汉字编码的输入法
CN1081773A (zh) “多声递推联想”汉语词字编码
CN1120406C (zh) 计算机汉字部首输入方法
CN101034319A (zh) 汉字输入方法及其专用键盘
CN1055167C (zh) 汉字部首笔顺码的输入方法
CN1115052A (zh) 汉字的声韵调形位动态智能输入法
CN1416039A (zh) 电脑速记易捷码汉字输入方法
CN1038888A (zh) 音形义兼容与汉拼字联词编码系列及键盘
CN1060277C (zh) 以句子为输入单位的计算机汉字编码输入方法
CN1123817C (zh) 一种汉字输入法
CN1068203A (zh) 音形义字词兼容编码系统与键盘
CN1077551A (zh) 汉字拼书编码法及其输入键盘
CN1202045A (zh) 音代码计算机汉字输入法
CN1347024A (zh) 拼音简化字繁体字通用的自然读成码输入法
CN1458570A (zh) 无调双拼的拼音基本音节编码方法及其键盘
CN1074296A (zh) 一种汉语声韵音位汉字编码方法
CN1117163A (zh) 一种汉字象形编码输入法及其键盘
CN1095502A (zh) 字元谱汉字编码法(炎黄码)及其键盘

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C57 Notification of unclear or unknown address
DD01 Delivery of document by public notice

Addressee: Su Yongquan

Document name: payment instructions

C57 Notification of unclear or unknown address
DD01 Delivery of document by public notice

Addressee: Su Yongquan

Document name: Notification of Termination of Patent Right

C57 Notification of unclear or unknown address
DD01 Delivery of document by public notice

Addressee: Xu Fengyan

Document name: Resume right request approval decision

C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20010404