CN1042784A - 超级智能联想汉字系统及其输入键盘 - Google Patents
超级智能联想汉字系统及其输入键盘 Download PDFInfo
- Publication number
- CN1042784A CN1042784A CN 88108184 CN88108184A CN1042784A CN 1042784 A CN1042784 A CN 1042784A CN 88108184 CN88108184 CN 88108184 CN 88108184 A CN88108184 A CN 88108184A CN 1042784 A CN1042784 A CN 1042784A
- Authority
- CN
- China
- Prior art keywords
- chinese character
- character
- chinese
- keyboard
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Input From Keyboards Or The Like (AREA)
Abstract
本发明超级智能联想汉字操作系统及键盘,属于中文信息科学领域,侧重为办公室工作人员使用计算机输入汉字而设计的。采用笔画数编码,能直接对国家二级字库中汉字进行超级智能联想,不同专业的人员使用时可自动建立本专业的智能联想词汇,删除其他非常用词汇,输入速度愈来愈快,易看键打字或盲打,它可用在计算机、有图形功能的终端,打印机、绘图仪及电子式打字机中。
Description
本发明属于中文信息处理技术科学领域,是一种用于快速输入汉字的超级智能联想汉字操作系统及键盘,他兼容常用汉字编码输入法、二级国标汉字库及普通词汇联想功能,它涉及一种汉字编码输入新方法及其应用键盘。
汉字编码方案是涉及到计算机在我国和其他使用汉字的国家或文字符号较复杂的国家普及推广计算机的关键技术问题,迄今为止,国内外已经提出数百种编码方案,大体上可分为:形码、音码、形音码三类。在众多的方案中,音码的重码太多,难以提高输入速度;电报码、区位码记忆困难;形音码复杂难学;形码基本字元太多记忆困难,如:国内公认的优秀方案,王永民的“五笔字型码”(“优化五笔字型编码法及其键盘”中国专利85100837)实际上有227个字元;四川的“大众码”(“汉字编码方法及其所用键盘”中国专利85104343)有127个字元;从而成为普及的一大障碍。
河南省的王永民研制出来五笔画、五笔字型汉字输入法,已经获得中国、英国和美国的专利权。其特点是具有汉字联想功能,可以联想6000多条成词语。但是它仅仅只能够对成词语进行联想,如:“中国”、“汉字”等。不能够对上下文有关的非成词语进行联想,如:本发明名称中就有的非词语“级智”、“想汉”等。它们虽然不是成词语,但是很明显“级”字之后可能会有“智”字,“想”字之后可能会有“汉”字,即:它们之间存在有上下文关系,构成了非成词语,所以应该进行联想。并且欲进行联想的词语必须预先装入到成词语库中,使用时不很方便,目前,国内流行的“五笔字型”、联想编码等(如“汉字拼音联想编码及双拼键盘”中国专利85100094),都是采用成词语联想,它们都不是真正智能的,都有其固有的弊病,即:当联想完一个成词语后,如:“中国”、“解放军”等,就断了后续词源了,必须重新输入新词头后,才能够继续联想下一个成词语。特别是当许多个成词语被定义成同一个索引词头字时,就要进行翻页操作,在没有翻到最后一页时,就无法确定是否有所想要的联想词组,这样的操作实在是太繁琐了。
多文种电脑(中国专利zl85100868),采用了多文种笔画键盘,但并非是智能的;日本电气株式会社的“中文输入法”(中国专利87104543),仅可对同音字用同音字表分类;香港“安子介式汉字笔形电脑编码法及其键盘”(中国专利85101817),采用六位数字编码,位数较多,编码较复杂;北京市中国科学院研制出来的智能联想汉卡,其特点与五笔字型联想类似,也不是真正智能的,使用时也不方便,特别是硬件汉卡的价格很昂贵,一般用户不愿意采用。
本发明针对以上汉字操作系统及其输入键盘所存在的问题,目的在于实现一种汉字简化编码方案及高速通用汉字输入操作系统,保证其好学、易记、输入快速,并且配备简明通用键盘,以利于计算机汉字化的实现。
以下的说明较好地实现了这一目的。
本发明的汉字输入编码是不同于以上三类汉字输入编码的一种奇特编码,它仅依赖于汉字符号的笔画数,与字形、发音毫无关系,因此它不仅适用于中文输入,而且适用于世界各国文字符号输入用。特别是附加了超级智能联想汉字系统之后,其输入速度得到了大幅度的提高。
对于汉字的输入,可以参考查字典的方法,在现代汉语词典中,其单字条目是按照拼音字母顺序排列的,部首检字表则是按照部首笔画数目多少排列的。检字时,若知道读音者,可以直接翻到其单字条目读音所在的页数,查找同音字区域。若不知道读音者,则要先数偏旁部首的笔画数,找到该偏旁部首在检字表中的页数,再数剩余的笔画数,找到同笔画数的检字表栏目,查找该字及其所对应的页数,最后翻到其单字条目所对应的页数。
本发明即是根据现代汉语词典的部首检字方法设计的,完全符合中国人查找汉字的习惯,其拼音输入法编码,国内早已有人完成了。而笔画数输入法编码,国内至今还没有推出较好的方案。
本发明中的笔画数编码方案,可以将国家标准GB2312-80《信息交换用汉字编码字符集》中二级字库的8178个汉字符号全部输入到计算机中,其中还留有10~15区共564个空字位供给用户新造其他国家文字、新汉字符号或特殊符号使用。
凡单字笔画数小于或等于9画的连体汉字符号,按笔画数分区,在1~9区,用户只按一次与笔画数相同的数字键做为区键,再按翻页键或选字键即可完成该字的输入。凡单字笔画数大于9画的字或可解体字,必须按其成形的偏旁部首拆成两个笔画数尽量相同的部分,将笔画数少的部分做为第一个区码先键入,再将另一部分的笔画数做为第二个区码键入,最后按翻页键(<,>)或选字键(2)即可完成该字输入。当两部分笔画数接近时,依据下列拆分次序:左侧、左上角、上侧、右上角、右侧、即顺时针方向。
连体型笔画数大于9画的汉字符号,一律规定该字在00区中显示,拆成两区后仍有一区大于9画的汉字符号,规定其编码为:xO,(x为小于9画的笔画数)。
超级智能联想选字:按选字键一个就可以输入一个汉字符号,它不能使用盲打,因为联想字库随时都在进行动态更新。
最佳选字:按区键一个,选字键一个,共二键录入一个汉字,预计可以录入:9区×26字=234个高频字,可以实现盲打。
标准选字:按区键二个,选字键一个,共三键录入一个汉字,预计可以录入:82区×26字=2132个常用字,可以实现盲打。并且还比五笔字型的四键输入码少按一次键。
超级智能联想汉字输入方法:根据上下文有关文法,将该汉字之后最常用的26个汉字自动装入到联想字库中,并且根据各汉字的使用频度,修改各汉字的加权系数,系数大者与前一字构成常用联想词汇,系数为0者随时可能会被新字取代,联想系统只对第一级字库,16区~55区执行联想,从而压缩了联想字库的容量。共计有:40区×94字=3760个汉字可以进入联想。即共有:97760个词语联想。对1~15区的符号,56~87区的非常用汉字符号不进行联想处理。联想单词全部显示在提示行中,不必进行翻页查找,汉字输入的联想率可以达到70%以上。最快输入速度可以达到每分钟120个汉字符号。
本发明中CRT显示器上有一提示行,可根据具体显示器的类型及便于观察来设计一行提示的汉字符号数量,以提示尽可能多的信息量,这些汉字与键盘中的字符选字键相对应,利用标准小键盘来完成汉字大键盘的直观输入功能。
在现代汉语中,依据其固有的文法结构,汉字几乎是不能够孤立地出现的,单独的汉字也不能表达出一个完整的意思。在汉语中能够形成固定词汇或短语的组合,仅仅只占汉字常用组合数的十分之一。国家标准一、二级字库中共有汉字6768个,使用它们最多能组成的两字短词仅仅只有6768×6768=45805824个,而这些短词中仅仅只有1%的组合是可能成立的有序集合,所以,两个字的短词约有450858个,以每个字的机内码占用二个字节计算,总共为901716个字节,大约只占用1MB的存储容量,并不算很大。绝大多数汉字的二字有限集合在50个以下,能够超过50个的汉字二字有限集合只有100多个,因此汉字输入完全可以利用大容量的智能联想输入法实现一字一键的快速输入。
本发明的超级智能联想汉字操作系统及键盘,他兼容常用汉字编码输入法、二级国标汉字库及普通词汇联想功能。其特征是:利用标准键盘实现汉字大键盘直观输入功能的汉字笔画数编码输入方法,超级智能联想汉字操作系统及键盘,它能够自动地学习新知识、自动建立知识库、并且进行逻辑分析推理,它还能够自动地删除旧知识,完成知识库的更新操作。他能兼容其它各种输入方法,进行非成词语联想、无需翻页、具有最新录入有效工作方式、可以对加权系数进行修改。每当键入一个汉字之后,与该汉字有上下文关系的一组汉字将出现在CRT显示器上的提示行中,当所提示的一组联想汉字显示有你所想要的后续汉字时,按一次与其对应的字符键(2)中的某一选字键,就可以实现按一键输入一个汉字符号,而且该汉字将重新排序在提示行的最左侧第一个字位上,同时将其使用频度加权系数加一。当所提示的一组联想汉字中没有显示出你所想要的后续汉字时,可以继续键入下一个汉字,该汉字将自动取代一组汉字中使用频度加权系数最低的一个最右侧汉字,并且给其自身定义为最低加权系数0,使其具有学习、分析、判断、推理、更新等功能的专家智能。
超级智能联想汉字系统,信息量大,“五笔字型”成词语联想汉字系统仅设计了6000多个词组,其中还有许多是重复的。超级智能联想汉字系统设计的词组可以达到100000条,并且保证是不重复的。
在3760个常用汉字中,仅仅只有300多个最高频字不能实现完全联想,其余90%以上的汉字都能实现完全联想,汉字输入的联想率可以达到70%以上。就是说:当你输入一篇一万字的文章时,其中有7000多字可以通过联想的方法一键一字的输入,大大提高了工作效率。超级智能联想汉字系统设计的最快输入速度为:每分钟120汉字符号,平均每击键两次即可以输入一个汉字符号。普通工程技术人员使用(非专职操作员),每分钟可以输入汉字符号约30个,每小时可以输入汉字符号1500个,相当于使用中文铅字打字机的专职打字员水平!与有重码的拼音输入法比较,超级智能联想汉字系统输入要快一些,击键也少一些,操作人员也轻松一些。
最新录入有效工作方式:即采用最新录入的汉字取代最早录入的使用频度加权系数最小的汉字,从而保持联想字库的容量不至于无限制的扩大。例如:已经输入了一篇医学文稿后,又输入了一篇电学文稿,则医学文稿中用到的汉字被安排在联想字库的右侧,电学文稿中用到的汉字被安排在联想字库的左侧。每调用一次联想字库中的汉字时,该字的加权系数将自动加一,当某字的所有联想后续字的加权系数均为最大时,就应当调用联想字库修改软件,对加权系数进行修改,否则,该字的处理将会失去专家的智能。
本发明的超级智能联想汉字操作系统及键盘,时空占量极小、码长极短,每个汉字仅使用两位数字编码,占用1个字节,可以容错,即:容许输入各种拆分组合笔画数选择同一个汉字符号,便于存储和用户使用。该系统可以工作在软盘上、硬盘上、RAM区中,便于不同硬件配置的计算机使用。
本发明的主要优点是:
1.“笔画数”编码方法,它符合中国人按偏旁部首笔画数使用现代汉语词典的习惯,无须记忆码表,可以快速的输入国家标准二级字库中的全部8178个汉字符号。将汉字拆分成一至二个部分,每个部分的笔画数均小于或等于9画,对于不能拆的笔画数大于9画的连体字一律规定其编码为00,采用十分直观的有重码选字输入法;
2.超级智能联想输入方法,具有智能专家的学习、分析、推理、判断、更新等功能,基本实现了按一个键就可以输入一个汉字;
3.本发明中的应用键盘与CRT显示器的提示行相对应,将汉字大键盘的直观输入功能用标准小键盘来实现,小键盘上的每个字符键都与CRT显示器上的一个汉字位置相对应;
4.本发明仅对键盘的键位部分做了一些改动,只需使用超级智能联想汉字操作系统软件启动机器,所以具有很大的推广应用价值以及优良的性能价格比;
5.超级智能联想汉字操作系统他与磁盘操作系统是同级软件,能支持各种IBM-PC计算机及其应用软件。
附图一至附图四为本发明的一种实施例,其中:
图一.83键键盘键位分布图;
图二.101键键盘键位分布图;
1.右侧数字小键盘做为汉字拆分笔画数输入用;
2.中部字母键盘做为汉字选字输入用;
3.左侧(上部)功能键盘做为汉字输入方式转换用。
图三.四画汉字“中”,键入笔画数4之后,CRT显示器的提示行;
图四.键入“中”字的选字键后,CRT显示器上的联想提示行。
在该实施例中,联想字库的分配是:一级汉字库共计有40区×94字=3760个汉字符号,每字可以联想26个后续字,每字的机内码占2个字节、使用频度加权系数占一个字节,整个字库占用容量:3760×26×(2+1)=293280个字节。
标准键盘上的26个字母键,与CRT显示器上提示行中的26个汉字符号一一对应,能直接对国家二级字库中的16~55区汉字进行超级智能联想,实现一键一字的输入方式,234个高频汉字,只击键两次(选字键在内),2132个常用字,只击键三次,专业人员使用时,可自动建立本专业智能联想词汇,删除非常用或无用词汇,易看键打字或盲打,它可用在计算机、有图形功能的终端、打印机、绘图仪及电子式打字机中。
以下介绍以实施例输入符号和汉字的一种方法:
(1)画表格:
键入图一键盘表中一区的“1”后,国家标准二级字库中的凡是一笔成形的汉字符号将全部显示在CRT显示器上的提示行中,首先显示出排在标准字库前部的26个汉字符号,按翻页键可以选择其次的26个汉字符号,按选字键则相应的汉字符号将被写到光标处。所输入汉字符号的国标区位码若小于16区或大于55区,则提示行中不继续显示联想词语,可以用键盘继续输入下一个汉字符号。
(2)输入“中国”两字:
键入图一键盘表中1区的“4”后,国家标准二级字库中的凡是四笔成形的汉字符号中前部的26个将显示在CRT显示器的提示行中,参考图三所示,按图中2区选字键的对应字母键,则“中”字将写到光标处,此时,超级智能联想系统自动将提示行变成与“中”字有上下文关系的联想词语显示,参考图四所示,键入与“国”字对应的选字键,则“国”字将被写到光标处,超级智能联想汉字系统会继续将提示行变成与“国”字有上下文关系的词语显示,如此继续下去,就可以实现按一次键就输入一个汉字的最佳汉字非编码输入方案。
Claims (7)
1、用于快速输入汉字的超级智能联想汉字操作系统及键盘,他兼容常用汉字编码输入法、二级国标汉字库及普通词汇联想功能,其特征是:利用标准键盘实现汉字大键盘直观输入功能的汉字笔画数编码输入方法、超级智能联想汉字操作系统及键盘;
2、根据权利要求1所述的一种超级智能联想汉字操作系统及键盘,其特征是:可以利用标准键盘实现汉字大键盘直观输入功能的汉字笔画数编码输入方法,以标准键盘的数字键(1)来表示汉字的笔画数目,每个汉字可以拆分成一至二个小于或等于9画的部分输入,对拆分后仍旧大于9画的连体汉字则一律规定用OO区表示。部分笔画数超过9画时,则用区码数和O表示。其拆分汉字的次序是:当两部分笔画数接近时,依据下列拆分次序:左侧、左上角、上侧、右上角、右侧、即由左侧开始,按顺时针方向转动,可以拆分输入任意个汉字库中的汉字或符号,并且预留一些空字位,供给用户造其他国家文字、新汉字符号或特殊符号时使用,利用数字键盘,将拆分后的汉字笔画数输入到计算机中,完成笔画数汉字输入方法。功能键(3)作为联想汉字输入方式转换用;
3、由权利要求1或2的超级智能联想汉字操作系统及键盘,其特征是:能兼容其它各种输入方法,进行非成词语联想、无需翻页、具有最新录入有效工作方式、可以对加权系数进行修改。每当键入一个汉字之后,与该汉字有上下文关系的一组汉字将出现在CRT显示器上的提示行中,当所提示的一组联想汉字显示有你所想要的后续汉字,按一次与其对应的字符键(2)中的某一选字键,就可以实现按一键输入一个汉字符号,而且该汉字将重新排序在提示行的最左侧第一个字位上,同时将其使用频度加权系数加一。当所提示的一组联想汉字中没有显示出你所想要的后续汉字时,可以继续键入下一个汉字,该汉字将自动取代一组汉字中使用频度加权系数最低的一个最右侧汉字,并且给其自身定义为最低加权系数O;
4、由权利要求1或2的超级智能联想汉字操作系统及键盘,其特征是标准键盘上的26个字符键,与CRT显示器上提示行中的1~26个汉字符号一一对应,若看到需要输入显示器上提示行中的某一个汉字符号时,则只需要按一下键盘上的对应字符键,即可以用标准小键盘来实现汉字大键盘的直观输入功能;
5、根据权利要求2所述的一种超级智能联想汉字操作系统及键盘,其特征是:在汉字字模点阵库中预留大量的空白字位,供给用户新造其他国家文字、新汉字符号或特殊符号时使用,以适应各国文字符号输入计算机的使用方法;
6、根据权利要求2所述的一种超级智能联想汉字操作系统及键盘,其特征是:时空占量极小、码长极短,每个汉字仅使用两位数字编码,占用1个字节,可以容错,即:容许输入各种拆分组合笔画数选择同一个汉字符号,便于存储和用户使用;
7、根据权利要求2所述的一种超级智能联想汉字操作系统及键盘,其特征是:对于国家标准GB2312-80《信息交换用汉字编码字符集》中的每一个汉字符号及用户新造入的各国文字符号均能够实现上下文有关智能联想,每个汉字符号输入之后都会续有1~26个与该字有上下文关系的汉字符号,该字库可以工作在软盘上、硬盘上、RAM区中,该字库可以实现动态更新,该字库使用汉字符号的内码,每个汉字符号均设有使用频度加权系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 88108184 CN1042784A (zh) | 1988-11-22 | 1988-11-22 | 超级智能联想汉字系统及其输入键盘 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 88108184 CN1042784A (zh) | 1988-11-22 | 1988-11-22 | 超级智能联想汉字系统及其输入键盘 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1042784A true CN1042784A (zh) | 1990-06-06 |
Family
ID=4834980
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 88108184 Pending CN1042784A (zh) | 1988-11-22 | 1988-11-22 | 超级智能联想汉字系统及其输入键盘 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1042784A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1060276C (zh) * | 1995-03-14 | 2001-01-03 | 张得一 | 三维天然码输入法 |
CN1086480C (zh) * | 1995-10-14 | 2002-06-19 | 钟诚 | 计算机汉字音形意自然编码键盘输入法 |
CN1092815C (zh) * | 1997-10-19 | 2002-10-16 | 黄宝文 | 一种汉字辞书检索和微机输入法及键盘 |
CN107066110A (zh) * | 2015-10-13 | 2017-08-18 | 联想(新加坡)私人有限公司 | 使用多个输入来检测语素文字的设备和方法 |
CN107251012A (zh) * | 2015-02-27 | 2017-10-13 | 微软技术许可有限责任公司 | 话题知晓的字建议 |
CN109164922A (zh) * | 2018-07-27 | 2019-01-08 | 五八有限公司 | 字符串输入方法、装置、计算机设备及可读存储介质 |
-
1988
- 1988-11-22 CN CN 88108184 patent/CN1042784A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1060276C (zh) * | 1995-03-14 | 2001-01-03 | 张得一 | 三维天然码输入法 |
CN1086480C (zh) * | 1995-10-14 | 2002-06-19 | 钟诚 | 计算机汉字音形意自然编码键盘输入法 |
CN1092815C (zh) * | 1997-10-19 | 2002-10-16 | 黄宝文 | 一种汉字辞书检索和微机输入法及键盘 |
CN107251012A (zh) * | 2015-02-27 | 2017-10-13 | 微软技术许可有限责任公司 | 话题知晓的字建议 |
CN107066110A (zh) * | 2015-10-13 | 2017-08-18 | 联想(新加坡)私人有限公司 | 使用多个输入来检测语素文字的设备和方法 |
CN109164922A (zh) * | 2018-07-27 | 2019-01-08 | 五八有限公司 | 字符串输入方法、装置、计算机设备及可读存储介质 |
CN109164922B (zh) * | 2018-07-27 | 2023-01-13 | 五八有限公司 | 字符串输入方法、装置、计算机设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN85100837A (zh) | 优化五笔字型编码法及其键盘 | |
CN1042784A (zh) | 超级智能联想汉字系统及其输入键盘 | |
CN1097766C (zh) | 汉字五键输入法 | |
CN1027839C (zh) | 中华双拼汉字编入的计算机键盘 | |
CN1033476C (zh) | 多种文字数字编码输入方法及其键盘 | |
CN1384426A (zh) | 电脑汉字典码输入方法 | |
CN85100094A (zh) | 汉字拼音联想编码及双拼键盘 | |
CN1035083C (zh) | 面向词的中文文字处理输入装置 | |
CN1017662B (zh) | 无理序号数字编码法及其键盘 | |
CN101034403A (zh) | 一种小键盘电子字典的智能检索方法 | |
CN207457986U (zh) | 手机三笔数码汉字输入法及键盘 | |
CN1252571C (zh) | 利用数字键输入中英文的方法 | |
CN1243300C (zh) | 计算机汉字三笔数码输入法 | |
CN1208711C (zh) | 英文数码输入法 | |
CN1139023C (zh) | 一种计算机汉字输入方法 | |
CN1388431A (zh) | 中文字母数字统一编码六笔划输入法及其键盘 | |
CN1409204A (zh) | 十二键全数字化中文输入法 | |
CN85104831A (zh) | 头腹尾数码和声韵母码组合式简便汉字编码法和多功能汉字输入中型键盘 | |
CN1556451A (zh) | 一种九数字键盘终端设备及数字选择交互式中文输入方法 | |
CN1251925A (zh) | 毕升计算机汉字输入法及其键盘 | |
CN2314401Y (zh) | 笔记型电脑键盘 | |
CN1153943A (zh) | 九九分级制编码法(包括形序分级编码法与音序分级编码法)及10×10键盘创制方案 | |
CN1049418A (zh) | 统一码计算机汉字键盘输入方法 | |
CN1164695A (zh) | 汉字笔形数值编码法 | |
CN1704881A (zh) | 数字键盘及其汉字拼音输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C01 | Deemed withdrawal of patent application (patent law 1993) | ||
WD01 | Invention patent application deemed withdrawn after publication |