CN1056357A - 中文输入法 - Google Patents

中文输入法 Download PDF

Info

Publication number
CN1056357A
CN1056357A CN 90102790 CN90102790A CN1056357A CN 1056357 A CN1056357 A CN 1056357A CN 90102790 CN90102790 CN 90102790 CN 90102790 A CN90102790 A CN 90102790A CN 1056357 A CN1056357 A CN 1056357A
Authority
CN
China
Prior art keywords
word
dictionary
speech
compound vowel
initial consonant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 90102790
Other languages
English (en)
Inventor
吴统雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 90102790 priority Critical patent/CN1056357A/zh
Publication of CN1056357A publication Critical patent/CN1056357A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

一种以“词”所包含各字之先行字音(常是声母, 少数是韵母)结合成检索键语的思考式中文输入法。 检索两字词、单字词时可在检索键语中附加字形,以 增加检索速度。同时配合“词”的“阶层式词库管理” 方法,以简化词的检索程序与节约词的存储器容量。 同时,本输入法配合软件技术,具有线上学习能力,一 旦发生新词,使用者不需要离开当时之工作软件,即 可根据输入规则建立新词,从此永久使用。

Description

本发明涉及中文计算机输入法、中文计算机系统(软、硬件结构)及中文计算机应用环境等技术领域。具体地说,本发明是一种以“词”所包含各字之先行字音(通常是声母,少数是韵母)结合成检索键语的思考式中文输入法,其中检索两字词、单字词时,可在检索键语中附加字形,以增加检索速度;同时,配合“词”的“阶层式词库管理”方法,以简化词的检索程序与节约词的存储器容量。
根据发明人的研究归纳,当前各种中文计算机输入法,不外基于4种类型;
-“1键1字”类型
-“字根”的拆解与组合类型
-“字音”的拆解与组合类型
-由检索键语组合成“词”的类型
1键1字类型或其修正方法(如另一手按控制键,达成1键多字的效果。)早经学者批评为显然无法在短期内学会,不适合一般人使用。
字音组合成拼音的类型,若与从小学习注音的习惯结合,一般人使用应不成问题。但是,中文的同音字太多,使用时还要加上好几次选择的手续,输入程序十分繁琐。同时,中国幅员广大,南北方的母音、声调往往不统一,也造成检索的困难,不适合须要经常处理大量文书的人使用。
字根的拆解类型兴起最早,也是当前的主流,优点是只要记忆字根,就可以输入。但缺点则是字多,字根少,难免会发生重复,于是各种字根输入法便发展出来了许多不合理的规则,甚至变化规则、反规则,还是需要勉强背诵,不容易学习。
现在从拆解字根出发的输入方法很多,但因为根据的基本原则相同,优劣可能都差不多。这好比“朝三暮四”的故事,一只猴子吃7粒果子的情形。中文字数就是那么多,前面字根拆解的少,后面字根就要拆解的多;后面字根拆解的少,前面字根就要拆解的多。彼此的好处、坏处,差别其实并不太大。
因此,各种字根输入法虽然推广了很久,但是普及效果还是有限。
“词”检索的类型,则提供了相当好的基本观念。中文基本上是以字为单位,但实际上表达意义的时候,较少以1字表意,而通常是以“词”表意。因此,若将检“字”的观念,转化为检“词”的观念,那么,就可以按较少的键,而可以显示出较多的字。
不过,“词”的检索键语要怎么设计,还没有最佳的方法。过去,常用检字的字根结合成词,同样不容易记忆与使用。
人类在思考时,是以一组一组的概念在思考,而不是一个一个字的在思考;同时,思考时,在脑海中形成的是“声音”,而不是“字形”;而每组根念的“声音”是一种“声音的整体”,也不是由母音、子音、声调分割开来的形式。所以,过去的计算机输入法,或者是拆解字根,或者拆解字音,都违背了人类正常的思考方式,很难学习,更难由一般人很自然的使用。
本项发明人发现,在每组概念“声音的整体”中,最重要的决定因素,是概念中每个字的“第一个声音”。我们可以用注音符号表示这个声音,也可以用相对的英文字母表示这个声音,譬如:“台湾省”只要按“ㄊㄨㄕ”或是按“TWS”,形成检索键语,就可以顺着思想的流程,很轻松、很自然的在计算机上写出这三个字了,完全不需要背任何规则。
而且,“词”的字愈多,,造成拆解重复的可能性愈少。从排列组合的观念来看,4字“词”会重复的概率极小,3字“词”会重复的可能性也已很少。
不过。检索“两字词”与“单字词”时,将是一个问题,因为中文“双声叠韵”的情形很多,拆解造成重复的概率也随之提高,则必需按选择键了。
如果不想按选择键,那么检索两字词、单字词时,可在检索键语中附加字形,以增加检索速度。本项发明人因此把字音检索和字根检索结合起来、形成检索键语,好比三只猴子(字根、字音、词)一起吃7粒果子,就可能简化输入程序,达成容易学习,又不那么繁琐的效果。
同时,本项发明使检索“两字词”时,规则与检“单字词”相同,以使观念连贯一气。而检索3字以上的“词”时,规则便可以简化。
本发明之中文输入法具有以下5项特性:
·想打/以“音”为主
这项发明的特色,是将中国语文学的知识与信息科技结合在一起,形成一种不需要背诵规则的“思考式计算机写作法”,它是为一般人“创造性的写作”而设计,亦即在写作思考时“边想边写”;而非为打字员、输入员“提供劳力”而设计,不是看着字形“边拆解边打”。
人类在思考时,呈现在脑海中的是“字音”,而非字形;所以本输入法系以“音”为主。
·词输入/音-形-词,整合输入
人类在思考时,脑海中的概念是以“词”的方式出现,而不是以“一个字、一个字”的方式出现。所以,本输入法以“音”组成“词”输入。
“词”可能是多字词,也可能是单字词。本项输入法研究者发现,3字以上的词,重复率不高;而单字词、两字词的重复率就很高,为了减少选择的情形,本输入法并有“精简规则”,就是在单字词、两字词时附加字形,便可以使两字词重复率降低趋近于0,使单字词重复率降低趋近于32.4%。但是,单字词的使用情形很少,经由本输入法研究者分析,使用超过百分之0.1的常用单字词,只有20个;这些单字词各配上一个音键,便成为“一字一键”;也就是说,在实际使用时,绝大多数的单家词是“一字一键”,并不需要附加字形,输入比两字词还方便。
·基本词库/词库管理系统
“词”如果无限制增加,实际使用上会发生困难。所以,本输入法并分析了词的:常用、次常用、专业用、个人用的性质,建立了阶层式的词库。同时,以硬件技术改善软件系统,增加了词库存取的效益。
·线上学习能力
“词”会随着使用者的生活经验而增加,不可能完全事前建立完成。所以,本输入法骈以软件技术形成“线上学习能力”使用者可以在工作时,随时依据本输入法的规则建立新词,永久记忆;而且,不需要离开当时工作的软件,不会中断工作。
·最迅速、最易学、最有效益
本项输入法平均每字按1.29键,是当前各种输入法按键最少的方法。
本项输入法键盘与英文键盘整合,不需要背键盘、不需要背规则,在试用期间,任何人可以在3分钟内学会,是当前最容易学习的方法。
本项输入法使用存贮器容量不超过1024K,是当前使用词库观念的输入法中,最有效益的方法。
本发明的使用举例
输入时可以使用注音,也可以使用英文字母。但是为了减少学习键盘,发明人建议以英文输入为主。
-多字(三字以上)词
只要键入“词”的每个字的第一个音,也就是英文国际拼音的第一个字母。譬如:
“输入法”:s.r.f
“中文电脑”:z  w  d  n
大部分字,每字只需敲一次键,即可输入。
键盘设计与英文打字机相同,使用者不必再学。
使用速度,一般人员每分钟300字,主管人员每分钟150字,专业打字人员可能可以达到每分钟600字。
-单字词
只要键入字的第一个音,加上起始字形与结束字形。譬如:
“热”:r  土  火
“情”:q  心  月
大部分字只需敲三次键,即可输入,平均也只敲键3.5次即可。字首、字尾符合传统的部首拆解,不必硬背。
使用速度,一般人员每分钟60字,主管人员每分钟30字,专业打字人员可能可以达到每分钟100字。
-常用单字词,只要键入单音即可,如:
“的”:d
“是”:s
-两字词
只要键入“词”的每个字的第一个音,加上第一个字的起始字形,第二个字的结束字形。譬如:
“中华”:z  h  丨  十
“热情”:r  q  土  月
使用速度,一般人员每分钟150字,主管人员每分钟75字,专业打字人员可能可以达到每分钟300字。
本发明输入法的定义与规则
(1)定义
字:每个词所包含的字数。
音:每一字首音/使用国际拼音、中英文整合键盘。
形:首:第一字首形/使用与字典或习惯相同之自然字根,不需另背。
尾:末一字尾形/使用与字典或习惯相同之自然字根,不需另背。
·音:英文字母/相对汉语注意关系
b:ㄅ  d:ㄉ
p:ㄆ  t:ㄊ
m:ㄇ  n:ㄋ
f:ㄈ  l:ㄌ
g:ㄍ  j:ㄐ
k:ㄎ  q:ㄑ
h:ㄏ  x:ㄒ
z:ㄓ丶ㄗ  a:ㄚ丶ㄞ丶ㄠ丶ㄢ丶ㄤ
c:ㄔ丶ㄘ  i:一丶ㄝ
s:ㄕ丶ㄙ  w:ㄨ
r:ㄖ丶ㄜ丶ㄦ  o:ㄛ丶ㄡ
u:ㄩ
e:ㄟ丶ㄣ丶ㄥ(不常用)
·形:可因个人习惯弹性使用
为使已经使用中文输入的人,在习惯上均可与本项输入法相容,本项输入法所附加的字形,可以使用过去任何较流行的字根。台湾的“仓颉输入法”、“简捷输入法”,国内的“五笔输入法”等,均可使用。
这方面也说明,本项发明的重点在于“思考方式”与“词使用”的分析,而不是“字根”的分析。
(2)输入规则
●单字词
[一般单字词]
·音-首-尾-<选择键>
(如有重复字,则加选择键)
(选择键可按数字序,或按键盘上左手固定位置的英文字母序;亦即a-s-d-f-…等于1-2-3-4…,使得手不必移动,而增加速度。)
譬如:按“r土火”时,只有“热”一个字,便不需要再按选择键。而按“q心月”时,显示器最下面一行将出现“情悄”两字。再按数字键<2>,或英文字母键<S>时,均可获得“悄”字。
[常用单字词:一键一字]
·计20个,“而、然”,“和、会”两组,需加按选择键。
q:其  a:(未定义)  z:在
w:为  s:是  x:新
e:以  d:的  c:(
r:而/然  f:法  v:(未定义)
t:同  g:更  b:不
y:(未定义)  h:和/会  n:那
u:与  j:就  m:(未定义)
i:有  k:可
o:(未定义)  l:“
p:(未定义)
*l、c为中文特殊标点符号,同时规定:
ll:”  cc:)
●两字词
[一所规则]
·音-音-<选择键>
[精简规则]
·音-音-首-尾
[第一、或第二字为输入字形/或常用单字词,形可省]
·音-音-<形>
譬如:“只有”只要按“zi口”,“有”是常用单字词,便不需要再按“有”的字尾“月”。
“心情”只要按“xq月”,“心”是习惯上的字根,便不需要再按。再譬如:“不是”只要按“bs”,“不、是”都是常用单字词,便不需要再按字形。
[两字词,而为“人名、地名、专有名词”时]
·音-音(亦即不加字首、字尾)
譬如:“台湾”只要按“tw”。
●三字词以上/如果在8字以上,至多输入前7字的首音即可。
·音-音-音
·音-音-音-音
以此类推
(六)本项发明的“阶层式词库管理方法”
现在看到的词库,都没有提供“管理方法”,以致发生:
1.词库太庞大,占用存储器太多。
2.词库中的词,绝大部分被使用到的机会很少,浪费存储器。
3.使用者想用的词,往往不在词库中,并不实用。
本项发明因此提出“阶层式词库管理方法”,方法是:
1.依据现行文字使用情况,将“词”使用的频率、出现的场合,分析、分类。
2.依据前项分析结果,将相同的特性的词,整理、归纳在一起,设计出“阶层式词库”。
3.不同阶层的词,以不同的方式建立、存储、管理。
4.以达成:占用存储器经济、使用率高、同时满足普遍性与个别性使用的需求。
本项发明的“阶层式词库”如下表:
第一层  第二层  第三层
系统词库  公共词库
行业词库
使用者词库  团体词库
部门词库  部门通用词库
个人词库
1:系统词库与使用者词库
系统词库系由系统提供,预先建立的词库;使用者词库,则为使用者依据本项发明的输入法规则,自行建立的词库。
2.公共词库与行业词库
公共词库为一般人都会用到、而且常用的名词、动词、形容词、副词,以及成语等。
行业词库为某一种特定行业,经常会使用的词,而其他行业却极少可能使用的词,如“信息行业词库”、“医药行业词库”……等。
3.团体词库
团体词库为一个独立法人,如公司、部会……中,多数成员均有可能使用到的词,如人名、标语、往来对象……等。
4.部门词库
部门词库则为独立法人之下,一个部门如业务部、财务部……中,成员会使用到的词。以下又分作“部门通用词库”:部门专会使用到的词;以及“个人词库”:个人的亲戚朋友姓名等。
(七)本项发明“阶层式词库”的记忆方法
本项发明推算出了各阶层词库所需要的最适容量范围,发明了存储方法,另包括:适用存储器、词库建立者如下表:
词库阶层  容量最  建议使用  建立者
适范围  之存储器
公共词库  64-512k  EEPROM  或其他存储器  系统预先设定
行业词库  64-128k  EEPROM  或其他存储器  系统预先设定
团体词库  64-256k  EEPROM,硬磁盘或其他  团体预先设定
部门通用词库  64k  硬磁盘或其他存储器  使用者自行建立
个人词库  64k  硬磁盘或其他存储器  使用者自行建立
如果百分之百满足使用词库的需求,本项发明的方法,将使最大容量仍然在1024K以下,占用存储器甚少,为本项发明的另一特色。
以上所述,为本项发明的全部说明。

Claims (19)

1、一种以“词”所包含各字之先行字音(通常是声母,少数时候是韵母)结合成检索键语的思考式中文输入法,其特征在于检索两字词、单字词时,可在检索键语中附加字形,以增加检索速度,
同时,配合“词”的“阶层式词库管理”方法,以简化词的检索程序,与节约词的存储器容量,
该输入法为:
“一般单字词”为:键入“该字之声母(或韵母)→“该字之字首”→“该字之字尾”→“选择键”,
“常用单字词”为:键入“该字之声母(或韵母)”→“选择键”,
“两字词”为:键入“第一字之声母(或韵母)”→“第二字之声母(或韵母)”→“选择键”;或为:键入“第一字之声母”(或韵母)”→“第二字之声母(或韵母)”→“第一字之字首”→“第二字之字尾”→“选择键”,
“三字以上之词”为:依序键入词中“各字之声母(或韵母)”,再键入一“选择键”。
2、如权利要求1所述之方法,其特征在于其中关于“一般单字词”的输入法为:键入“该字之声母(或韵母)”→“该字之字首”→“该字之字尾”→“选择键”。
3、如权利要求2所述之方法,其特征在于可省略“该字之字首”,或省略“该字之字尾”之键入动作。
4、如权利要求2或3所述之方法,其特征在于可省略“选择键”之键入动作。
5、如权利要求1所述之方法,其特征在于其中关于“常用单字词”的输入法为:键入“该字之声母(或韵母)”→“选择键”。
6、如权利要求5所述之方法,其特征在于可省略“选择键”之键入动作。
7、如权利要求1所述之方法,其特征在于其中关于“两字词”的第一种输入法为:键入“第一字之声母(或韵母)”→“第二字之声母(或韵母)”→“选择键”。
8、如权利要求7所述之方法,其特征在于可省略“选择键”之键入动作。
9、如权利要求1所述之方法,其特征在于其中关于“两字词”的第二种输入法为:键入“第一字之声母(或韵母)”→“第二字之声母(或韵母)”→“第一字之字首”→“第二字之字尾”→“选择键”。
10、如权利要求9所述之方法,其特征在于可省略“第一字之字首”,或省略“第二字之字尾”之键入动作。
11、如权利要求9或10所述之方法,其特征在于可省略“选择键”之键入动作。
12、如权利要求1所述之方法,其特征在于其中关于“三字以上之词”的输入法为:依序键入词中“各字之声母(或韵母)”,再键入一“选择键”。
13、如权利要求12所述之方法,其特征在于可省略“选择键”之键入动作。
14、如权利要求1、2、3、5、7、9、10和12项中任一项所述之方法,其中关于“选择键”之键入动作,其特征在于可用按英文键盘之“a,s,d,f,g,h,j,k,l,;”顺序,代替按数字键盘“1、2、3、4、5、6、7、8、9、10”之顺序。
15、一种如上述各权利要求之一之输入法所引导出来的“阶层式词库管理方法”,该项方法的特征在于:
令计算机系统本身提供一些依据本项发明输入法所预先建立之“词库”的存储器,
令计算机系统预备一些空白存储器,以供使用者依据本项发明输入法,自行建立所需要之“词库”。
16、如权利要求15所述之方法,其特征在于其中关于:令计算机系统本身提供一些依据本项发明输入法,所预先建立之“词库”的存储器。
17、如权利要求16所述之方法,其特征在于本项词库又可分作一般人可共同使用之词库,以及某专门行业内常用之词库。
18、如权利要求15所述之方法,其特征在于其中关于:令计算机系统预备一些空白存储器,以供使用者依据本项发明输入法,自行建立所需要之“词库”。
19、如权利要求18所述之方法,其特征在于本项词库又可分作某一独立团体可共同使用之词库,以及团体内某专门部门内常用之词库,以及纯粹提供个人使用之词库。
CN 90102790 1990-05-10 1990-05-10 中文输入法 Pending CN1056357A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 90102790 CN1056357A (zh) 1990-05-10 1990-05-10 中文输入法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 90102790 CN1056357A (zh) 1990-05-10 1990-05-10 中文输入法

Publications (1)

Publication Number Publication Date
CN1056357A true CN1056357A (zh) 1991-11-20

Family

ID=4877686

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 90102790 Pending CN1056357A (zh) 1990-05-10 1990-05-10 中文输入法

Country Status (1)

Country Link
CN (1) CN1056357A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1317628C (zh) * 2004-01-05 2007-05-23 英华达(上海)电子有限公司 输入法增字系统与方法
CN105549758A (zh) * 2015-12-23 2016-05-04 天津天地伟业数码科技有限公司 一种嵌入式录像设备的汉字五笔输入方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1317628C (zh) * 2004-01-05 2007-05-23 英华达(上海)电子有限公司 输入法增字系统与方法
CN105549758A (zh) * 2015-12-23 2016-05-04 天津天地伟业数码科技有限公司 一种嵌入式录像设备的汉字五笔输入方法

Similar Documents

Publication Publication Date Title
CN1023916C (zh) 简繁五笔字根汉字输入系统
CN1026525C (zh) 智能五笔双拼码计算机汉字输入方法
CN1113305C (zh) 语言处理装置和方法
CN1607491A (zh) 使用操纵杆输入中文的系统和方法
CN1648828A (zh) 去多义性语音输入系统和方法
CN1015218B (zh) 字根编码输入法及其设备
CN1316689A (zh) 汉字输入装置和方法
CN101038508A (zh) Gb拼音输入法
CN1515988A (zh) 一类音形义汉字编码输入法
CN1056357A (zh) 中文输入法
CN1121645C (zh) 音形字理码汉字输入方法
CN1103181A (zh) 多键并击式高速汉字输入方法及键盘装置
CN1102768C (zh) 一种用于电子计算机的汉字音形编码输入方法
CN1129058C (zh) 仿真拼音汉字输入法
CN100338560C (zh) 汉字笔画部件编码输入法及键盘
CN1166997C (zh) 汉字免拆分快速输入法
CN1052200A (zh) 音形义字词兼容编码系列及键盘
CN1838044A (zh) 中文拼音声调笔划组合输入法
CN1023917C (zh) 汉语文字处理之方法
CN1037043A (zh) 计算机汉字输入方法
CN85100087A (zh) 《中文声数编码》方案及其实现方法
CN1038888A (zh) 音形义兼容与汉拼字联词编码系列及键盘
CN1492303A (zh) 二分汉字编码小键盘输入及其显示方法
CN1123818C (zh) 电拼汉字计算机输入法、所用键盘及其中文内码
CN1058342C (zh) 汉字编码的计算机输入方法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C01 Deemed withdrawal of patent application (patent law 1993)
WD01 Invention patent application deemed withdrawn after publication