CN110502128B - 一种汉字多元输入方法及系统 - Google Patents
一种汉字多元输入方法及系统 Download PDFInfo
- Publication number
- CN110502128B CN110502128B CN201910817227.8A CN201910817227A CN110502128B CN 110502128 B CN110502128 B CN 110502128B CN 201910817227 A CN201910817227 A CN 201910817227A CN 110502128 B CN110502128 B CN 110502128B
- Authority
- CN
- China
- Prior art keywords
- key position
- character
- code
- root
- last
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
Abstract
本申请提供一种汉字多元输入方法及系统,涉及输入法领域;其方法构建编码库:根据多种多元输入方式保存多种编码,生成多种编码与对应汉字匹配的编码库,编码包括将基本编码码元按其发音之拼音首字母进行分类匹配获取的输入设备的键位编码;输入编码:根据待输入汉字的字根、笔画或拼音,选择多元输入方式的一种键入输入设备的键位;在编码库中查找并显示与输入编码匹配的汉字;本发明根据拼首及末笔等进行高效过滤,重码低易盲打,字根易记不用背,拆打简单易上手;根据字根、笔画等编码方法实现对不认识字的输入。使用者可从多元输入编码方式中任选一种,无需切换,直接从输入设备等各键位区输入相应编码获取所需的字词句。
Description
技术领域
本发明涉及输入法领域,具体而言,涉及一种汉字多元输入方法及系统。
背景技术
现有技术中汉字录入法包括五笔字型、超级形码、大众形音、部首、郑码、笔画、音形笔、仓颉、搜狗拼音、QQ、百度、谷歌、讯飞输入法,使用这些输入法在一定程度上解决了向计算机输入汉字的问题,便捷了现代工作与生活。
但现有输入法中,部分输入法实现简单易学却击键多、重码多、难盲打、速度慢,长期使用眼、手、颈腰椎受损,比如先入为主的音码类、笔画类输入法,音码类如搜狗拼音、QQ拼音和百度拼音等输入法;部分较为专业的输入法难学难记,让人望而生畏、望洋兴叹,比如形码类,形码类包括五笔、仓颉和部首输入等输入法。针对上述问题,现有技术中的专利号:CN200910094739.2专利名称:一种汉字计算机输入法,提供一种简单、易学、快速地汉字集成输入法,使用时根据使用情况选择汉语拼音全拼输入法或者全拼汉字输入法加汉字第一部首、第二部首拼音首字母输入法或者汉字第一部首、第二部首的拼音首字母加全拼汉字输入法或者汉字第一部首、第二部首拼音首字母输入法或者汉字第一部首、第二部首拼音首字母加该汉字全拼首字母输入法或者汉字全拼首字母加第一部首、第二部首拼音首字母输入法或者汉字笔画输入法或者公知五笔字型86版输入法等;这些输入法能在一定程度上降低难度或重码。但是,这些输入法依然存在不可小觑的问题:拼音类输入重码量巨大(在GB2312之最常用的6700多个汉字中,仅计算一字一音,还未考虑一字多音和模糊拼音等,编码即6700多个就有6300多个重复值,重码率大于94%;若加上一字多音和模糊拼音等,在GB18030第一版之21000多个有拼音汉字内编码有43000多个即有42000多个重复值,重码率大于197%),上述专利仅能降低部分难度或重码;同时按上述专利所述的输入法不认识的字难输入,因此需要一种输入法可以克服以上问题,实现简便、快速、准确、多元且无需切换地输入。
发明内容
有鉴于此,本申请实施例的目的包括,提供一种汉字多元输入方法及系统,解决现有输入法重码多、不认识的字难输入等问题,实现多元选择、简便、快速、精准、高效输入。
本申请采用的技术方案如下:
一种汉字多元输入方法,包括
构建编码库:根据多种多元输入方式保存多种编码,生成多种编码与对应汉字匹配的编码库,所述编码包括将基本编码码元按其发音之拼音首字母进行分类匹配获取的输入设备的键位编码;
输入编码:根据待输入汉字的字根、笔画和拼音,选择多元输入方式的一种键入输入设备的键位;
根据编码库查找并显示与输入编码匹配的汉字:根据输入编码查找编码库中与输入编码匹配的汉字后,显示汉字;
其中,所述汉字为单字时,采用的多元输入方式包括如下方式:
单字的第(1+2+3+末)根+识别码,即4根1识别码;
单字的第(1+2+3+末)根+识别码+标志码,即4根1识别码1标志码;
单字的首根+首根后第(1+2+3)笔画+全字末笔画,即1根4笔;
单字的第(1+2+3+…+8)笔画+全字末笔画,即9笔;
单字的拼首+第(1+2+3+末)根+识别码,即1拼首4根1识别码;
单字的拼首+第(1+2+3+末)根+识别码+标志码,即1拼首4根1识别码1标志码;
单字的拼首+首根+首根后第(1+2+3)笔画+全字末笔画,即1拼首1根4笔;
单字的拼首+第(1+2+3+…+8)笔画+全字末笔画,即1拼首9笔;
单字的全拼+第(1+2+3+末)根+识别码,即全拼后4根1识别码;
单字的全拼+第(1+2+3+末)根+识别码+标志码,即全拼后4根1识别码1标志码;
单字的全拼+第(1+2)字根,即全拼+第(1+2)根;
单字的全拼+首根+首根后第(1+2+3)笔画+全字末笔画,即全拼后1根4笔;
单字的全拼+第(1+2+3+…+8)笔画+全字末笔画,即全拼9笔;所述基本编码码元按照其发音之拼音首字母进行分类匹配的输入设备的键位编码具体如下:
“A”键位包括:山上丄生饣水氺手扌石十士氏身少尸束鼠豕乑;
“E”键位包括:二儿ル耳阝卩;
“F”键位包括:方飞非甫丰风夫采;
“G”键位包括:广甘干宀冖高工弓革艮壴谷戈骨冎瓜龜;
“H”键位包括:一禾火黑合亥虍乎户;
“J”键位包括:今金亼钅釒戋夹九斤巾几己井彑臼;
“K”键位包括:开廾巜囗口凵冂ユ匚匸丂丌丩;
“L”键位包括:六立亠了力丽卵耂龙龍鹿來耒良;
“M”键位包括:木朩末门門鬥麻马弓馬皿毛矛吂目母黽米;
“N”键位包括:牛牜ヰヰ鸟女廿乃;
“O”键位包括:日曰月○;
“Q”键位包括:七千丘其气求曲且犬犭;
“R”键位包括:人亻彳壬入;
“S”键位包括:丨亅纟糹糸三卅四罒厶△巳;
“T”键位包括:天屯田土;
“U”键位包括:羽雨鱼魚于禺云与;
“V”键位包括:之廴辶中竹豸爪爫丈隹舟乍止正;
“W”键位包括:五兀戊無万韦未亡王文攵夂タ乌瓦;
“X”键位包括:小心氵彐乡下穴血西覀夕;
“Y”键位包括:用言讠牙永羊夭チ幺亚业也亞亜又ス由酉;
“Z”键位包括:フㄋ乙子孑自足走疋乛乚。
优选地,所述汉字中两字词汇采用的多元输入方式包括如下方式:
首字的(首根+第2根)+二字的(首根+第2根),即每字首根+2根;
首字(拼首+首根)+二字(拼首+首根),即首字的(拼首+首根)+二字的(拼首+首根);
首字(拼首+首根+第2根)+二字(拼首+首根+第2根),即首字的(拼首+首根+第2根)+二字的(拼首+首根+第2根);
首字拼首+二字拼首+二字首根+二字第2根,即每字拼首+二字第(1+2)根;
首字全拼+二字全拼+二字首根+二字第2根,即每字全拼+二字第(1+2)根。
优选地,所述汉字中多字词汇采用的多元输入方式包括如下方式:
每字首根+末字第2根;
每字拼首+末字首根+末字第2根;
每字全拼+末字首根+末字第2根;
第一二三/第一二三末字之每字首根+末字第2根;
第一二三/第一二三末字之每字拼首+末字首根+末字第2根;
第一二三/第一二三末字之每字全拼+末字首根+末字第2根;
每字拼首;
每字全拼。
优选地,所述识别码即末笔字型交叉识别码;所述末笔字型交叉识别码包括横识别码、竖识别码、撇识别码、点识别码和折识别码;
所述横识别码包括横的左右型识别码“h”、横的上下型识别码“j”和横的杂合型识别码“k”;所述竖识别码包括竖的左右型识别码“g”、竖的上下型识别码“f”和竖的杂合型识别码“d”;所述撇识别码包括撇的左右型识别码“y”、撇的上下型识别码“u”和撇的杂合型识别码“i”;所述点识别码包括点的左右型识别码“t”、点的上下型识别码“r”和点的杂合型识别码“e”;所述折识别码包括折的左右型识别码“n”、折的上下型识别码“b”和折的杂合型识别码“v”。
优选地,所述标志码包括“f”。优选地,所述输入设备的键位还包括笔画键位,具体如下:所述“H”键位、“S”键位、“P”键位、“D”键位、“Z”键位分别对应横“一”、竖“丨/亅”、撇“丿”、点“、/乀”和折“フ/ㄋ/乙”笔画。
优选地,所述输入设备的键位还包括功能键位,所述功能键位包括:启动输入法键即“Ctrl”+“Shift”+“9”键位、系统设定键盘即“右Ctrl”键位、添加用户词键即“右Shift”键位、输入方法主/混码切换键即“F9”键位、输入方法主/辅码切换键即“F10”键位、输入方法主/次显切换键即“F11”键位和输入方法主/混显切换键即“F12”键位。
一种汉字多元输入系统,包括
编码库,用于存储与多种多元输入方式输入的编码匹配的汉字字符,所述编码包括将基本编码码元按其发音之拼音首字母进行分类匹配获取的输入设备的键位编码;
输入设备,用于根据待输入汉字的字根、笔画和拼音,选择多元输入方式的一种键入键位;
编码查找单元,用于根据输入设备键入的键位生成输入编码,选择编码库中与输入编码匹配的汉字字符;
显示单元,用于显示编码查找单元查找的汉字字符。
优选地,所述编码库包括:
分类单元,用于将基本编码码元按照其发音之拼音首字母进行分类,所述基本编码码元包括字根和笔画;
编码单元,用于根据多元输入方式输入分类后的基本编码码元生成多种编码;
匹配单元,用于将编码单元的编码匹配对应的汉字;
其中,所述编码库中的所述编码与所述汉字字符的对应关系选自如下(a)-(c)任意一种:
(a):所述汉字为单字时,所述编码与所述汉字字符的对应关系选自如下(1)-(13)中的任意一种:
(1)单字的第(1+2+3+末)字根的键位+识别码构成所述编码;
(2)单字的第(1+2+3+末)字根的键位+识别码+标志码构成所述编码;
(3)单字的首字根的键位+首字根后第(1+2+3)笔画的键位+全字末笔画的键位构成所述编码;
(4)单字的第(1+2+3+…+8)笔画的键位+全字末笔画的键位构成所述编码;
(5)单字的拼首的键位+第(1+2+3+末)字根的键位+识别码构成所述编码;
(6)单字的拼首的键位+第(1+2+3+末)字根的键位+识别码+标志码构成所述编码;
(7)单字的拼首的键位+首字根的键位+首字根后第(1+2+3)笔画的键位+全字末笔画的键位构成所述编码;
(8)单字的拼首的键位+第(1+2+3+…+8)笔画的键位+全字末笔画的键位构成所述编码;
(9)单字的全拼的键位+第(1+2+3+末)字根的键位+识别码构成所述编码;
(10)单字的全拼的键位+第(1+2+3+末)字根的键位+识别码+标志码构成所述编码;
(11)单字的全拼的键位+第(1+2)字根的键位构成所述编码;
(12)单字的全拼的键位+首字根的键位+首字根后第(1+2+3)笔画的键位+全字末笔画的键位构成所述编码;
(13)单字的全拼的键位+第(1+2+3+…+8)笔画的键位+全字末笔画的键位构成所述编码;
(b):当所述汉字为两字词汇时,所述编码与所述汉字字符的对应关系选自如下(1)-(5)中的任意一种:
(1)首字的(首字根+第2字根)的键位+二字的(首字根+第2字根)的键位构成所述编码;
(2)首字(拼首+首字根)的键位+二字(拼首+首字根)的键位构成所述编码;
(3)首字(拼首+首字根+第2根)的键位+二字(拼首+首字根+第2字根)的键位构成所述编码;
(4)首字拼首的键位+二字拼首的键位+二字首字根的键位+二字第2字根的键位构成所述编码;
(5)首字全拼的键位+二字全拼的键位+二字首字根的键位+二字第2字根的键位构成所述编码;
(c):当所述汉字为多字词汇时,所述预存编码与所述汉字字符的对应关系选自如下(1)-(8)中的任意一种:
(1)每字首字根的键位+末字第2字根的键位构成所述编码;
(2)每字拼首的键位+末字首字根的键位+末字第2字根的键位构成所述编码;
(3)每字全拼的键位+末字首字根的键位+末字第2字根的键位构成所述编码;
(4)第一二三/第一二三末字之每字首字根的键位+末字第2字根的键位构成所述编码;
(5)第一二三/第一二三末字之每字拼首的键位+末字首字根的键位+末字第2字根的键位构成所述编码;
(6)第一二三/第一二三末字之每字全拼的键位+末字首字根的键位+末字第2字根的键位构成所述编码;
(7)每字拼首的键位构成所述编码;
(8)每字全拼的键位构成所述编码。
优选地,所述(a)-所述(c)中的所述键位选自如下键位中的任意一种或几种的组合:
“A”键位,其包括的字根如下:山上丄生饣水氺手扌石十士氏身少尸束鼠豕乑;
“E”键位,其包括的字根如下:二儿ル耳阝卩;
“F”键位,其包括的字根如下:方飞非甫丰风夫采;
“G”键位,其包括的字根如下:广甘干宀冖高工弓革艮壴谷戈骨冎瓜龜;
“H”键位,其包括的字根如下:一禾火黑合亥虍乎户;
“J”键位,其包括的字根如下:今金亼钅釒戋夹九斤巾几己井彑臼;
“K”键位,其包括的字根如下:开廾巜囗口凵冂ユ匚匸丂丌丩;
“L”键位,其包括的字根如下:六立亠了力丽卵耂龙龍鹿來耒良;
“M”键位,其包括的字根如下:木朩末门門鬥麻马弓馬皿毛矛吂目母黽米;
“N”键位,其包括的字根如下:牛牜ヰヰ鸟女廿乃;
“O”键位,其包括的字根如下:日曰月○;
“Q”键位,其包括的字根如下:七千丘其气求曲且犬犭;
“R”键位,其包括的字根如下:人亻彳壬入;
“S”键位,其包括的字根如下:丨亅纟糹糸三卅四罒厶△巳;
“T”键位,其包括的字根如下:天屯田土;
“U”键位,其包括的字根如下:羽雨鱼点于禺云与;
“V”键位,其包括的字根如下:之廴辶中竹豸爪爫丈隹舟乍止正;
“W”键位,其包括的字根如下:五兀戊無万韦未亡王文攵夂タ乌瓦;
“X”键位,其包括的字根如下:小心忄彐乡下穴血西覀夕;
“Y”键位,其包括的字根如下:用言讠牙永羊夭チ幺亚业也亞亜又ス由酉;
“Z”键位,其包括的字根如下:フㄋ乙子孑自足走疋乛乚。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1.本发明将基本编码码元按照其发音之拼音首字母分类匹配至输入设备的键位编码,根据多元输入方式对应输入编码生成汉字和多元输入方式匹配的编码库,根据待输入汉字的字根、笔画和拼音,选择多元输入方式的一种键入输入设备的键位,根据编码库查找并显示输入编码对应的汉字,实现汉字的输入;通过拼首及末笔等进行高效过滤,大大降低重码;通过字根、笔画等编码方法实现对不认识字的输入;它适用于计算机、平板电脑、手机等设备,科学规范,实用高效。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明输入方法的流程图;
图2为本发明的字根图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,即所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以下结合实施例对本发明的特征和性能作进一步的详细描述。
实施例1
本申请提出一种汉字多元输入方法及系统,该输入法及系统可应用于计算机、平板电脑或手机等,任意将具有人机交互功能以进行汉字输入的计算机,以实现利用构成汉字的字根、笔画和拼音作为汉字输入码元在上述计算机的键盘上输入汉字,以解决了现有输入法重码多、不认识的字难输入等问题。可以理解,上述的键盘可以是机械键盘,也可以是触摸屏等。
请参阅图1,所述方法包括以下步骤:
构建编码库:根据多种多元输入方式保存多种编码,生成多种编码与对应汉字匹配的编码库,所述编码包括将基本编码码元按其发音之拼音首字母进行分类匹配获取的输入设备的键位编码;
输入编码:根据待输入汉字的字根、笔画和拼音,选择多元输入方式的一种键入输入设备的键位;
根据编码库查找并显示与输入编码匹配的汉字:根据输入编码查找编码库中与输入编码匹配的汉字后,显示汉字;
构建编码库,具体如下:
其中,基本编码码元包括N个字根和基本笔画,N个字根是精选的新华字典中的部分部首或是构字频度较高的汉字局部部件。例如,在本实施例中,N约为480,即选择构成汉字的约有480个字根,其中,该N个字根可以包括但不限于、山、上、丄、生、饣、水、氺、手、扌、石、十、士、氏、身、少、尸、束、鼠、豕、乑、八、丷、巴、勹、白、癶、疒、匕、辟、半、不、卜、贝、艹、卄、卝、、屮、臣、川、巛、虫、寸、长、镸、長、车、車、厂、丆、ナ、齒、齿、朿、、丶、乀、冫、氵、刀、刂、リ、灬、大、豆、弔、歹、东、丁、丅。
多个基本笔画可以是5个基本笔画。例如,所述多个基本笔画包括横“一”、竖“丨/亅”、撇“丿”、点(捺)“、/乀”和折“フ/ㄋ/乙”笔画,折即除竖钩外所有带拐弯转折的笔画。每个基本编码码元可以包括至少一个基本笔画和/或至少一个字根。
基本编码码元按照其发音之拼音首字母进行分类匹配的输入设备的键位编码包括如下步骤:
在本实施例中,字根表中绝大部分字根按照其发音之拼音首字母进行分类(为解决个别键位字根量较大会导致重码多等问题,对部分字根作特别安排,降低重码,其中:声母“zh”类分类在“V”键位上,声母“ch”类分类在“C”键位上,声母“sh”类分类在“A”键位上;零声母韵母“i”类分类在“I”键位上,零声母韵母“ü”类分类在“U”键位上;“○”“日”和圆月的“月”与O形近分类在“O”键位上等),易记、重码少,如图2所示,基本编码码元(也称字元、字根和笔画)按照其发音之拼音首字母进行分类匹配的输入设备的键位编码具体如下(此所示仅为成字码元——即本身已为汉字的字根、字元,详见附图2):
“A”键位包括:山上丄生饣水氺手扌石十士氏身少尸束鼠豕乑;
“E”键位包括:二儿ル耳阝卩;
“F”键位包括:方飞非甫丰风夫采;
“G”键位包括:广甘干宀冖高工弓革艮壴谷戈骨冎瓜龜;
“H”键位包括:一禾火黑合亥虍乎户;
“J”键位包括:今金亼钅釒戋夹九斤巾几己井彑臼;
“K”键位包括:开廾巜囗口凵冂ユ匚匸丂丌丩;
“L”键位包括:六立亠了力丽卵耂龙龍鹿來耒良;
“M”键位包括:木朩末门門鬥麻马弓馬皿毛矛吂目母黽米;
“N”键位包括:牛牜ヰヰ鸟女廿乃;
“O”键位包括:日曰月○;
“Q”键位包括:七千丘其气求曲且犬犭;
“R”键位包括:人亻彳壬入;
“S”键位包括:丨亅纟糹糸三卅四罒厶△巳;
“T”键位包括:天屯田土;
“U”键位包括:羽雨鱼魚于禺云与;
“V”键位包括:之廴辶中竹豸爪爫丈隹舟乍止正;
“W”键位包括:五兀戊無万韦未亡王文攵夂タ乌瓦;
“X”键位包括:小心忄彐乡下穴血西覀夕;
“Y”键位包括:用言讠牙永羊夭チ幺亚业也亞亜又ス由酉;
“Z”键位包括:フㄋ乙子孑自足走疋乛乚。
在本实施例中,所述“H”键位、“S”键位、“P”键位、“D”键位、“Z”键位分别对应横“一”、竖“丨/亅”、撇“丿”、点(捺)“、/乀”和折“フ/ㄋ/乙”笔画,得到的结果如图2所示。
根据输入的编码匹配对应的汉字生成编码库,所述输入的编码包括基本编码码元按照其发音之拼音首字母进行分类匹配的输入设备的键位编码,根据多元输入方式输入对应的键位编码生成输入编码。
输入编码,具体如下:
采用输入设备根据待输入汉字的字根、笔画和拼音,选择多元输入方式的一种键入输入设备的键位,输入设备包括键盘、触摸屏的;
根据编码库查找并显示输入编码对应的汉字,具体如下:
根据输入编码在编码库中查找与输入编码匹配的汉字后,显示汉字,显示模块采用可移动设备或者电脑或者平板。
在本实施例中,所述单字方法包括如下方法:
单字的第(1+2+3+末)根+识别码,即4根1识别码;
单字的第(1+2+3+末)根+识别码+标志码f,即4根1识别码1标志码;
单字的首根+首根后第(1+2+3)笔画+全字末笔画,即1根4笔;
单字的第(1+2+3+...+8)笔画+全字末笔画,即9笔;
单字的拼首+第(1+2+3+末)根+识别码,即1拼首4根1识别码;
单字的拼首+第(1+2+3+末)根+识别码+标志码f,即1拼首4根1识别码1标志码;
本实施例识别码即末笔字型交叉识别码,识别码是为了减少重码而增设的,要特别说明的是:这里所指的识别码与王码五笔的识别码不一致。首先,末笔字型交叉识别码的组成,末笔:即指按书写顺序的最后一个单笔划,横(h)、竖(s)、撇(p)、点(d)、折(z)五种笔划;字型:根据构成汉字的各字根之间的位置关系,可以分为三种类型:左右型(字根之间可有间距,总体左右排列,如“识、别、码、汉、族、湘、封”等)、上下型(字根之间可有间距,总体上下排列,如“笔、字、型、花、华”等)、杂合型(字根之间也许有间距,但汉字整体不易分出上下左右的单体、内体、包围、半包围(包围程度超三分之一及以上的)或仅一个单笔与其它部分间作分界的,如“末、困、凶、司、这、本、尼、式、左、右”等)。其中,左右型汉字占的比重最大,其次是上下型,杂合型汉字所占比重最小;其键位布局如下表:
从中间往左或右两边依次为“左右型”“上下型”“杂合型”,其末笔与其字型交叉处的字母编码即为其末笔字型交叉识别码编码。如“拓”末笔横、左右型、识别码为“h”,“岸”末笔竖、上下型、识别码为“f”,“叨”末笔撇、左右型、识别码为“y”,“或”末笔点、杂合型、识别码为“e”,“匪”末笔折、杂合型、识别码为“v”等。
本实施例标志码采用“f”,标志码是为了尽可能的减少繁体字等带来的重码而增设的,要特别说明的是:这里所指的标志码f除包含国家标准GBK1.0内相对于现行简化字对应的繁体字外,还包含部分相对复杂的异体字及带繁体偏旁部首的生僻字以和GBK1.0外所有汉字等。
在本实施例中,所述两字词汇包括如下方法:
首字(首根+第2根)+二字(首根+第2根)即每字首根2根;
首字拼首+二字拼首+二字首根+二字第2根即每字拼首+二字第(1+2)根;
首字(拼首+首根)+二字(拼首+首根)即首字(拼首+首根)+二字(拼首+首根);首字(拼首+首根+第2根)+二字(拼首+首根+第2根)即每字(拼首+首根+第2根);
首字全拼+二字全拼+二字首根+二字第2根即每字全拼+二字第(1+2)根;
在本实施例中,所述多字词汇采用根笔、拼首+根笔、全拼+笔画输入法、拼首+笔画输入法、全拼方法,具体包括如下方法:
每字(包括末字)首根+末字第2根;
每字(包括末字)拼首+末字首根+末字第2根;
每字(包括末字)全拼+末字首根+末字第2根;
第一二三末(三字词汇为第一二三)字之每字首根+末字第2根;
第一二三末(三字词汇为第一二三)字之每字拼首+末字首根+末字第2根;
第一二三末(三字词汇为第一二三)字之每字全拼+末字首根+末字第2根;
每字拼首;
每字全拼。
在本实施例中,所述多元方法中还包括兼容公知的拼音方法、笔画方法和五笔(86版+新世纪)方法、汉字一字多音、模糊拼音及各种常用特殊符号等之输入。
如图2所示的字根图,具体的,以认识的单字从拼首起,以单字“唉”“攀”进行编码为例进行说明(为便于说明,示例均以全码为准,实际输入时对“1拼首+4根+1识别码+1标志码f”及“4根+1识别码+1标志码f”的有一、二、三、四级简码等之分,会大大减少按键,后同):
当采用:单字的第(1+2+3+末)根+识别码时,“唉”可以编码为ksrdt;当采用:拼首+单字的第(1+2+3+末)根+识别码时,“唉”可以编码为aksrdt;当采用:单字的拼首+首根+首根后4笔(第1+2+3+末笔)时,“唉”可以编码为akzdpd;当采用:单字的拼首+第(1+2+3+…+8)笔+末笔(1拼首9笔时),“唉”可以编码为aszhzdphhd;当采用:全拼+单字的第(1+2+3+末)根+识别码时,“唉”可以编码为aiksrdt;当采用:全拼+首根+次根时,“唉”可以编码为aiks;当采用:单字的全拼+首根+首根后4笔(1+2+3+末笔)时,“唉”可以编码为aikzdpd;当采用:单字的全拼+第(1+2+3+…+8)笔+末笔(1拼首9笔时),“唉”可以编码为aiszhzdphhd。
当采用:单字的第(1+2+3+末)根+识别码时,“攀”可以编码为miiaf;当采用:拼首+单字的第(1+2+3+末)根+识别码时,“攀”可以编码为pmiiaf;当采用:单字的拼首+首根+首根后4笔(1+2+3+末笔)时,“攀”可以编码为pmpdps;当采用:单字的拼首+第(1+2+3+…+8)笔+末笔(1拼首9笔时),“攀”可以编码为phspdpdpds;当采用:全拼+单字的第(1+2+3+末)根+识别码时,“攀”可以编码为panmiiaf;当采用:全拼+首根+次根时,“攀”可以编码为panmi;当采用:单字的全拼+首根+首根后4笔(1+2+3+末笔)时,“攀”可以编码为panmpdps;当采用:单字的全拼+第(1+2+3+…+8)笔+末笔(1拼首9笔时),“攀”可以编码为panhspdpdpds。
不认识的单字首根起,以单字“涸”、“攤”进行编码为例进行说明:
当采用:单字的第(1+2+3+末)根+识别码时,“涸”可以编码为dkakh;当采用:首根+首根后4笔(1+2+3+末笔)时,“涸”可以编码为dszhh;当采用:单字的第(1+2+3+…+8)笔+末笔(9笔时),“涸”可以编码为ddhszhssh。
当采用:单字的第(1+2+3+末)根+识别码+标志码f时,“攤”可以编码为ankvhf;当采用:首根+首根后4笔(1+2+3+末笔)时,“攤”可以编码为ahssh;当采用:单字的第(1+2+3+…+8)笔+末笔(9笔时),“攤”可以编码为hshhssszh。
以二字词语(音形笔结合用)“暗处”进行编码为例进行说明:
当采用:首字(首根+第2根)+二字(首根+第2根)时,“暗处”可以编码为olwb;当采用:首字(拼首+首根)+二字(拼首+首根),“暗处”可以编码为aocw;当采用:首字拼首+二字拼首+二字首根+二字第2根时,“暗处”可以编码为acwb;当采用:首字(拼首+首根+第2根)+二字(拼首+首根+第2根)即首字(拼首+首根+第2根)+二字(拼首+首根+第2根)时,“暗处”可以编码为aolcwb;当采用:首字全拼+二字全拼+二字首根+二字第2根即两字全拼+二字首根+二字第2根时,“暗处”可以编码为anchuwb。
以三字词语(音形笔结合用)“安全员”进行编码为例进行说明:
当采用:首字首根+二字首根+三字首根+三字二根时,“安全员”可以编码为grkb;当采用首字拼首+二字拼首+三字拼首+三字首根+三字二根时,“安全员”可以编码为aqykb;当采用:每字全拼+三字首根+三字二根时,“安全员”可以编码anquanyuankb;
以四字词及以上多字词(音形结合用)“中国科学技术协会”进行编码为例进行说明:
当采用:首字首根+二字首根+三字首根+末字首根+末字第2根时,“中国科学技术协会”可以编码为vkhru;当采用:首字拼首+二字拼首+三字拼首+末字拼首+末字首根+末字第2根时,“中国科学技术协会”可以编码为zgkhru;当采用每字拼首+末字首根+末字第2根时,“中国科学技术协会”可以编码为zgkxjsxhru;当采用每字全拼+末字首根+末字第2根时,“中国科学技术协会”可以编码为zhongguokexuejishuxiehuiru。
由于多元输入方法包括字根和/或笔画和/或拼音或者拼音和五笔之等方法,适用于所有单字、两字词汇、多字词汇,即同一个字或者词语可以采用不同的输入方法,例如:单个的字为“李、刘、张”以及“陈”时,词语为“安全、计算机”以及“中华人民共和国”时,可以采用如下的输入方法(为便于说明,示例均以全码为准,实际输入时对拼首起的或字根起的有一、二、三、四级简码之分,会大大减少按键的,后同):
李-木-子(mzj、mzshh、hspdzshh、lmzj、lmzshh、limzj、limzshh、lhspdzshh、lihspdzshh),
刘-文-刂(wdg、wsss、dhpdsss、lwdg、lwsss、liuwdg、liuwsss、ldhpdsss、liudhpdsss),
张-弓-长(gct、gphzd、zhzphzdd、zgct、zgphzd、zhanggct、zhanggphzd、zzhzphzdd、zhangzhzphzdd),
陈-阝-东(edt、ehzsd、zshzsdd、cedt、cehzsd、chenedt、chenehzsd、czshzsdd、chenzshzsdd),
安全(gnrw、aqrw、agnqrw、anquanrw),
计算机(yvmj、jsjmj、jisuanjimj),
中华人民共和国(vrrk、zhrgkw、zhrmghgkw或zhonghuarenmingongheguokw)。
关于“4根1识别码1标志码”方法:由于当今汉字及词汇信息量越来越多,王码五笔输入法的最大四码早已不堪重负,重码多问题早也已凸显,必须通过增加单字及词汇之编码码数来解决。为了尽可能的沿用五笔中的部分特有价值的内容,故将五笔的“前3根+末1根”之“不足四码+识别码等”改为所有汉字“前3根+末1根+识别码+标志码(f,繁体字或异体字中相对笔画多或GBK1.0之外的才加此)”,即最大为六码(简体为五码),重码明显减少,再通过简码等特殊处理,这样实际用到“末笔字型交叉识别码(简称‘识别码’)”和“标志码”的少之又少,所以难度不但没增加,反而降低了。其拆字方法方法、输入规则要求等与86五笔字型等主要区别说明如下(“1拼首4根1识别码1标志码(是本发明单字输入之主推方法)”,是在“4根1识别码1标志码”基础上加拼音首字母进行的,其法理是加一拼首后类推,同样有几级简码等,不再赘述):
(1)单字输入,有三种情况:
①键名汉字输入
“键名字”:这里把字根表每键的第一个字定为“键名字”;连击该键四次即可输出对应键名,只不过这里的键名拼音首字母及其所在键位与汉语拼音声母字母(除个别特殊安排外)是相对应的,方便记忆;如:bbbb→玻、pppp→坡、mmmm→摸、ffff→佛、dddd→得、tttt→特、nnnn→讷、llll→勒。
②成字字根汉字输入
在每个键位上,除了一个键名字根外,还有其它一些字根本身也是汉字,称之为成字字根,也称主根;成字字根输入公式:键位码+首笔码+次笔码+第三笔码+末笔码;如果该字根不足四笔画,则末笔加输入一次;仍不足四笔,则以空格键结束;如生(aphhh)、车(chzhs)、气(qphhz)、鱼(upzsh)。
五种单笔画的编码,键名、第一笔、末笔码是相同的,一般连击二至三次该键即可输出对应笔画,hhh(一)、亅(sss)、丿(ppp)、丶(ddd)、乙(zzz)。
③键外单字输入(此处以“4根+1末笔字型交叉识别码(简称‘识别码’)+标志码”方法为例)
键外单字是指除键名汉字、成字字根汉字之外的汉字:
a.一至四个字根的,依次键入所有字根的编码+识别码的编码+标志码(f,繁体字或异体字中相对笔画多的才加此)”输入;如:够(bkxxt)、詅(yjdtf)。
b.超过四个字根,则取一、二、三、末四个字根的编码+识别码的编码+标志码(f,繁体字或异体字中相对笔画多的才加此)”输入;赢(mobdr)、賜(mbopyf)。
(2)单字的简码输入(此处以“拼首+4根+1末笔字型交叉识别码(简称‘识别码’)+标志码”方法为例)
为了提高输入速度,将常用汉字只取前边一个、两个、三个或四个字根构成简码。
①一级简码,这里把字根表每键的右上角字定为“一级简码”,只要敲击其键名字母后加空格键即可,它们是:q起,w我,e二,r人,t他,y一,u与,i以,o欧,p平,a安,s三,d的,f发,g国,h和,j就,k可,l了,z在,x下,c出,v中,b不,n年,m民。
②二级简码:二级简码由单字的前两个字根编码组成,只要敲击其前两个字根后加空格键即可,例如:阿(ae)、备(bw)、定(dg)、府(fg)。
③三级简码:三级简码由单字的前两个字根编码组成,只要敲击其前两个字根后加空格键即可,例如:结(jsa)、悸(jxh)、苛(kcd)、淘(tdb)。
④四级简码:四级简码由单字的前两个字根编码组成,只要敲击其前两个字根后加空格键即可,例如:珠(jwrm)、椠(qcjm)、馍(maco)、斓(lwmm)。
支持“?”万能代替各键位编码查询单字编码输入汉字字符。
本发明对应的输入法利用字根和/或拼音和/或笔画的多元方法进行输入,降低拆分难度,根据拼首及末笔等进行快速过滤,大大降低重码,分类根据字根或者笔画的发音之拼音首字母,对此编码设有一、二、三、四级共四级简码以减少击键,提高输入速度。
二字词汇输入效果最佳的是:首字(拼首+首根+第2根)+二字(拼首+首根+第2根)及每字全拼+末字首根+末字第2根;例如:最佳(zoejrt、zuijiart)。
三、四字及以上词汇输入效果最佳的是:123末(三字词汇为第一二三)字拼首+末字首根+末字第2根;例如:电子计算机(dzjjmj)。
输入设备的键位还包括功能键位,对应增设输入方法功能,具体如下:
本申请优化功能之“添加用户词”:即添加用户自造词。方便的自造词功能,可通过点击“右Shift”键位等,轻松的将自己经常会用到的词语或句子添加到用户自定义词库中,且可点选“将新添加词条固顶”等以方便输入。如本工作单位名称、各员工的姓名、相关工作常用语等都可通过“添加用户词”添加到用户自定义词库中,以进一步提高输入汉字的速度和工作效率。如“多元输入法”,可将其复制至剪贴板中(也可在后面造词对话框中直接输入)→点击“右Shift”键位→在弹出的对话框中,点选“剪贴板造词”(此处还可点选“将新添加词条固顶”)→显示相关内容(此例显示——词条:多元输入法,编码:dysfd,可根据自己意思更改编码)→最后点击“确定”即可。
临时词库自动记忆功能:本发明同搜狗拼音等一样拥有临时词库功能,使用此功能,可自动对输入过的内容组词,功能描述如下:输入法程序在每次上屏时,依次连接最近2次、3次(最多16次)...的上屏文本做为临时词保存在临时词库中,以供使用。如依次上屏:“多”“元”“输”“入法”,则在临时词库中自动生成:“多元”“多元输”“多元输入法”“元输”“元输入法”“输入法”六条临时词。临时词最大长度为16。总数量为512,使用先进先出的队列方式维护;可根据需要选择:上屏即存(当临时词上屏时,自动保存为用户词)、重启清空(当计算机重新启动后,临时词库清空等)。
本发明对应的输入法虽为多元输入、智能匹配输出字词句,但为了满足不同需求或喜好的或专业级汉字录入,特将多元输入分为了“主码”、“次显码”和“辅码”三大板块,使用者可以通过:系统设定键盘即“右Ctrl”键位、输入方法主/混码切换键即“F9”键位、输入方法主/辅码切换键即“F10”键位、输入方法主/次显切换键即“F11”键位和输入方法主/混显切换键即“F12”键位等进行选择,如通过点击“右Ctrl”键位,根据自己的实际,在弹出的对话框中选择“高级”→选择“输入方案”和/或“检索范围”中自己想要的方式进行输入。其中,主码主要包括:1拼首4根1识别码1标志码单字及词句输入系列;次显码主要包括:1根4笔或9笔+拼首或全拼系列、兼容王码五笔(86+新世纪)单字及词句输入;辅码主要包括:4根1识别码1标志码单字及词句输入系列。每板块均可通过拼音输入汉字或查询相关根笔输入法编码,使用者可任选一个板块或两个板块或全部板块进行输入工作。
需要说明的是:本发明对应的多元输入法其核心编码从难到易分别有4根1识别码、1根4笔或9笔三种编码;在其前加输拼首或全拼组合后又有六种,再加上兼容的其它公知输入法编码,共计有十余种编码供选择。四个字根的编码其取码规则、基本方法等与公知的字形类输入法类似,如书写顺序、取大优先、兼顾直观、123末取四码、一二三级简码等(后同),但拆记难度远低于其它字形类输入法。输入字、词、句时,根据需求选择多元方法中的一种方法从计算机配套键盘各键位区输入,计算机能自动识别实际使用的方法,无需人工切换,智能优化输入选择的同时提高输入反应速度,通过字根、笔画和拼音结合,实现快速输入认识字或者不认识字,重码过滤好,正确率高,有效的避免了现有输入法重码多或难学易忘等问题。本申请简单易学、多元选择,能快速输入的同时降低重码,实现盲打,输入简便、快速。它属于对计算机、平板电脑、手机等多元输入汉字的方法,科学规范,实用高效,实现输入不认识的字,提高输入速度和正确率。
实践表明:练五笔字根的5节课后基本能盲打字根,平均速度在40字根/分钟左右;练本发明对应的输入法,1节课后即能盲打字根,班平均速度即能达40字/分钟,5节课后速度能达70字/分钟及以上;随着练习时间的推移,拆字差距越来越大,平均速度越来越快,练五笔的单字仅30字/分钟左右,难以提高;练本发明对应的输入法,其速度与日俱增,很快突破50字/分钟,练词语随练习时间增长很快能超100字/分钟。另经与其它输入法(包括现在非常流行的拼音输入等)实测对比,同一批学生、同样的训练方法及时间、同样的测试字词内容、同样的测试环境(阿珊打字通最新版内网模式)测试20分钟平均:其它类最优成绩达45.5字/每分钟时,本发明对应的输入法练习者已达132.2字/每分钟;其它类最优成绩达80字/每分钟时,本发明对应的输入法练习者已达155.6字/每分钟。只要认真练习,对拼音输入能达80-100字/每分钟的,不出数月,使用本发明对应的输入法一般都能超过100-150字/每分钟;同一批学生对比测,使用本发明对应的输入法比其它输入法平均每分钟能高出20-50字及以上。
根据实践数据表明:单字输入难度不大、最受欢迎的是1拼首+1根4笔;但单字输入虽有难度,却重码少、效果最佳的是1拼首+4根+1识别码+1标志码或4根+1识别码+1标志码,此以后者作重点说明:
重码率以GB2312之最常用的6722字为准计实测数据:现有输入法中,五笔86重码率为3.87%;五笔98重码率为3.89%,新世纪五笔新的重码率为7.85%,现代五笔(形音)重码率为3.53%),全拼类(如搜狗、百度拼音等)重码率更是高得惊人——有6324个重复值(这里仅计算了一音多字,还未考虑一字多音,实际重复值还要多得多),重码率约为94.1%;而本发明对应系统之“4根1识别码”类有323个重复值,重码率约为4.8%,“拼首+4根1识别码”类重码率极低——仅有14个重复值,重码率约为0.21%。对不认识的字,不输拼首从首字根起输入即可。五笔单字输入平均每字按键3.83次,全拼类输入法单字输入平均每字按键3.08次,此法几乎字字有重码,常需翻很多页找字;本发明之“拼首+4根1识别码”类单字输入平均每字按键仅3.29次且几乎不用选字,更不用翻页找字。
综上,本发明对应的输入法利用字根和/或拼音和/或笔画的多元方法进行输入,降低拆分难度,根据拼首及末笔等进行快速过滤,大大降低重码,分类根据字根或者笔画的发音之拼音首字母;本发明对应的输入法充分利用了拼音的先知先觉、笔画的简单易学、字形的极低重码、根拼的同键吻合等优点,重码大部分被有效地过滤掉,拆记难度大大降低、易于盲打、输入速度明显提高,特别能用于听打作会议记录及现场直播上屏文字,且能让小学二年级左右的学生等一接触电脑就可以较好地输入自己认识或不认识的字,对信息技术的普及推广无疑大有裨益。本申请是一种既能满足专业要求,又能适应大众的即学即用的顺想智能、快速高效的多元输入法。
实施例2
基于实施例1,本实施例提供一种输入系统,包括
编码库,用于存储与多种多元输入方式输入的编码匹配的汉字字符,所述编码包括将基本编码码元按其发音之拼音首字母进行分类匹配获取的输入设备的键位编码;
输入设备,用于根据待输入汉字的字根、笔画和拼音,选择多元输入方式的一种键入键位;
编码查找单元,用于根据输入设备键入的键位生成输入编码,选择编码库中与输入编码匹配的汉字字符;
显示单元,用于显示编码查找单元查找的汉字字符。
优选地,所述编码库包括:
分类单元,用于将基本编码码元按照其发音之拼音首字母进行分类,所述基本编码码元包括字根和笔画;
编码单元,用于根据多元输入方式输入分类后的基本编码码元生成多种编码;
匹配单元,用于将编码单元的编码匹配对应的汉字;
其中,所述编码库中的所述编码与所述汉字字符的对应关系选自如下(a)-(c)任意一种:
(a):所述汉字为单字时,所述编码与所述汉字字符的对应关系选自如下(1)-(13)中的任意一种:
(1)单字的第(1+2+3+末)字根的键位+识别码构成所述编码;
(2)单字的第(1+2+3+末)字根的键位+识别码+标志码构成所述编码;
(3)单字的首字根的键位+首字根后第(1+2+3)笔画的键位+全字末笔画的键位构成所述编码;
(4)单字的第(1+2+3+…+8)笔画的键位+全字末笔画的键位构成所述编码;
(5)单字的拼首的键位+第(1+2+3+末)字根的键位+识别码构成所述编码;
(6)单字的拼首的键位+第(1+2+3+末)字根的键位+识别码+标志码构成所述编码;
(7)单字的拼首的键位+首字根的键位+首字根后第(1+2+3)笔画的键位+全字末笔画的键位构成所述编码;
(8)单字的拼首的键位+第(1+2+3+…+8)笔画的键位+全字末笔画的键位构成所述编码;
(9)单字的全拼的键位+第(1+2+3+末)字根的键位+识别码构成所述编码;
(10)单字的全拼的键位+第(1+2+3+末)字根的键位+识别码+标志码构成所述编码;
(11)单字的全拼的键位+第(1+2)字根的键位构成所述编码;
(12)单字的全拼的键位+首字根的键位+首字根后第(1+2+3)笔画的键位+全字末笔画的键位构成所述编码;
(13)单字的全拼的键位+第(1+2+3+…+8)笔画的键位+全字末笔画的键位构成所述编码;
(b):当所述汉字为两字词汇时,所述编码与所述汉字字符的对应关系选自如下(1)-(5)中的任意一种:
(1)首字的(首字根+第2字根)的键位+二字的(首字根+第2字根)的键位构成所述编码;
(2)首字(拼首+首字根)的键位+二字(拼首+首字根)的键位构成所述编码;
(3)首字(拼首+首字根+第2根)的键位+二字(拼首+首字根+第2字根)的键位构成所述编码;
(4)首字拼首的键位+二字拼首的键位+二字首字根的键位+二字第2字根的键位构成所述编码;
(5)首字全拼的键位+二字全拼的键位+二字首字根的键位+二字第2字根的键位构成所述编码;
(c):当所述汉字为多字词汇时,所述预存编码与所述汉字字符的对应关系选自如下(1)-(8)中的任意一种:
(1)每字首字根的键位+末字第2字根的键位构成所述编码;
(2)每字拼首的键位+末字首字根的键位+末字第2字根的键位构成所述编码;
(3)每字全拼的键位+末字首字根的键位+末字第2字根的键位构成所述编码;
(4)第一二三/第一二三末字之每字首字根的键位+末字第2字根的键位构成所述编码;
(5)第一二三/第一二三末字之每字拼首的键位+末字首字根的键位+末字第2字根的键位构成所述编码;
(6)第一二三/第一二三末字之每字全拼的键位+末字首字根的键位+末字第2字根的键位构成所述编码;
(7)每字拼首的键位构成所述编码;
(8)每字全拼的键位构成所述编码。
优选地,所述(a)-所述(c)中的所述键位选自如下键位中的任意一种或几种的组合:
“A”键位,其包括的字根如下:山上丄生饣水氺手扌石十士氏身少尸束鼠豕乑;
“E”键位,其包括的字根如下:二儿ル耳阝卩;
“F”键位,其包括的字根如下:方飞非甫丰风夫采;
“G”键位,其包括的字根如下:广甘干宀冖高工弓革艮壴谷戈骨冎瓜龜;
“H”键位,其包括的字根如下:一禾火黑合亥虍乎户;
“J”键位,其包括的字根如下:今金亼钅釒戋夹九斤巾几己井彑臼;
“K”键位,其包括的字根如下:开廾巜囗口凵冂ユ匚匸丂丌丩;
“L”键位,其包括的字根如下:六立亠了力丽卵耂龙龍鹿來耒良;
“M”键位,其包括的字根如下:木朩末门門鬥麻马弓馬皿毛矛吂目母黽米;
“N”键位,其包括的字根如下:牛牜ヰヰ鸟女廿乃;
“O”键位,其包括的字根如下:日曰月○;
“Q”键位,其包括的字根如下:七千丘其气求曲且犬犭;
“R”键位,其包括的字根如下:人イ彳壬入;
“S”键位,其包括的字根如下:丨亅纟糹糸三卅四罒厶△巳;
“T”键位,其包括的字根如下:天屯田土;
“U”键位,其包括的字根如下:羽雨鱼魚于禺云与;
“V”键位,其包括的字根如下:之廴辶中竹豸爪爫丈隹舟乍止正;
“W”键位,其包括的字根如下:五兀戊無万韦未亡王文攵夂タ乌瓦;
“X”键位,其包括的字根如下:小心忄彐乡下穴血西覀夕;
“Y”键位,其包括的字根如下:用言讠牙永羊夭チ幺亚业也亞亜又ス由酉;
“Z”键位,其包括的字根如下:フㄋ乙子孑自足走疋乛乚。
编码库中存储汉字和汉字对应的多元输入方式的编码,比如“唉”存储的编码包括单字的第(1+2+3+末)根+识别码对应的编码ksrdt,拼首+单字的第(1+2+3+末)根+识别码时对应的编码aksrdt,全拼+首根+次根时对应的编码aiks,单字的全拼+首根+首根后4笔(1+2+3+末笔)的编码aikzdpd。系统在选择一种多元输入方式时,将多元输入方式对应的编码和汉字存储构成编码库,再次输入对应编码时,将在编码库中寻找编码对应的汉字,根据多元输入方式编码的汉字重复率低,重码少。在输入编码时后查找时,可选择最佳的查找路径即选择最短编码或者最优编码对应的路径,比如全拼+首根+次根时对应的编码aiks,单字的全拼+首根+首根后4笔(1+2+3+末笔)的编码aikzdpd,当输入aik时,系统可选择最短编码进行快速查找,加快查找速度,从而实现快速输入和显示。
从输入到显示,输入系统进行查表操作,输入的信息是键盘信息,根据击键消息到编码库中查找对应的汉字,其中涉及的编码查找单元、显示单元、分类单元、编码单元、匹配单元完成对应的功能,实现输入和显示。其中,所述多元输入方式、基本码元分类匹配、简码、末笔字型交叉识别码等与实施例1一致,在此不进行赘述。
所述系统包括处理器、存储器和存储在所述存储器中并可在处理器上运行的计算机程序,例如“构建编码库:根据多种多元输入方式保存多种编码,生成多种编码与对应汉字匹配的编码库,所述编码包括将基本编码码元按其发音之拼音首字母进行分类匹配获取的输入设备的键位编码;输入编码:根据待输入汉字的字根、笔画和拼音,选择多元输入方式的一种键入输入设备的键位;根据编码库查找并显示与输入编码匹配的汉字:根据输入编码查找编码库中与输入编码匹配的汉字后,显示汉字;”程序,计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在系统中的执行过程。
所述系统可以是桌上型计算机、笔记本、掌上电脑等计算设备。所述系统可包括,但不仅限于处理器和存储器,输入编码显示单元中包括输入编码模块即处理器,处理器完成组合编码和查表操作、存储器存储编码库,输入设备为计算设备的输入装置,比如键盘或者触摸屏。本领域技术人员可以理解,所述示意图仅仅是所述系统的示例,并不构成对所述系统的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述系统设备还可以包括网络接入设备、总线等。
本发明的系统设置编码库、编码查找单元、显示单元和输入设备,将基本编码码元按照其发音之拼音首字母分类匹配至输入设备的键位编码,根据多元输入方式对应输入编码,所述编码、汉字、多元输入方式对应匹配生成编码库,根据待输入汉字的字根、笔画和拼音,选择多元输入方式的一种键入输入设备的键位,根据编码库查找并显示输入编码对应的汉字,实现汉字的输入;通过拼首及末笔等进行高效过滤,大大降低重码,提高输入效率;通过字根、笔画等编码方法实现对不认识字的输入;它适用于计算机、平板电脑、手机等设备,科学规范,实用高效。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种汉字多元输入方法,其特征在于,包括
构建编码库:根据多种多元输入方式保存多种编码,生成多种编码与对应汉字匹配的编码库,所述编码包括将基本编码码元按其发音之拼音首字母进行分类匹配获取的输入设备的键位编码;
输入编码:根据待输入汉字的字根、笔画和拼音,选择多元输入方式的一种键入输入设备的键位;
根据编码库查找并显示与输入编码匹配的汉字:根据输入编码查找编码库中与输入编码匹配的汉字后,显示汉字;
其中,所述汉字为单字时,采用的多元输入方式包括如下方式:
单字的第(1+2+3+末)根+识别码,即4根1识别码;
单字的第(1+2+3+末)根+识别码+标志码,即4根1识别码1标志码;
单字的首根+首根后第(1+2+3)笔画+全字末笔画,即1根4笔;
单字的第(1+2+3+…+8)笔画+全字末笔画,即9笔;
单字的拼首+第(1+2+3+末)根+识别码,即1拼首4根1识别码;
单字的拼首+第(1+2+3+末)根+识别码+标志码,即1拼首4根1识别码1标志码;
单字的拼首+首根+首根后第(1+2+3)笔画+全字末笔画,即1拼首1根4笔;
单字的拼首+第(1+2+3+…+8)笔画+全字末笔画,即1拼首9笔;
单字的全拼+第(1+2+3+末)根+识别码,即全拼后4根1识别码;
单字的全拼+第(1+2+3+末)根+识别码+标志码,即全拼后4根1识别码1标志码;
单字的全拼+第(1+2)字根,即全拼+第(1+2)根;
单字的全拼+首根+首根后第(1+2+3)笔画+全字末笔画,即全拼后1根4笔;
单字的全拼+第(1+2+3+…+8)笔画+全字末笔画,即全拼9笔;所述基本编码码元按照其发音之拼音首字母进行分类匹配的输入设备的键位编码具体如下:
“A”键位包括:山上上生饣水氺手扌石十士氏身少尸束鼠豕乑;
“E”键位包括:二儿ル耳阝卩;
“F”键位包括:方飞非甫丰风夫采;
“H”键位包括:一禾火黑合亥虍乎户;
“J”键位包括:今金亼钅釒戋夹九斤巾几己井彑臼;
“K”键位包括:开廾巜囗口凵冂ユ匚匸丂丌丩;
“L”键位包括:六立亠了力丽卵耂龙龍鹿來耒良;
“M”键位包括:木朩末门鬥鬥麻马ㄢ馬皿毛矛吂目母黽米;
“O”键位包括:日曰月○;
“Q”键位包括:七千丘其气求曲且犬犭;
“R”键位包括:人亻彳壬入:
“S”键位包括:丨亅纟糹糸三卅四罒厶△巳;
“T”键位包括:天屯田土;
“U”键位包括:羽雨鱼魚于禺云与;
“V”键位包括:之廴辶中竹豸爪爫丈隹舟乍止正;
“W”键位包括:五兀戊無万韦未亡王文攵夂タ乌瓦;
“X”键位包括:小心忄彐乡下穴血西覀夕;
“Y”键位包括:用言讠牙永羊夭チ幺亚业也亜亜又ス由酉;
“Z”键位包括:フㄋ乙子孑自足走疋乛乚。
2.根据权利要求1所述的一种汉字多元输入方法,其特征在于,所述汉字中两字词汇采用的多元输入方式包括如下方式:
首字的(首根+第2根)+二字的(首根+第2根),即每字首根+2根;
首字(拼首+首根)+二字(拼首+首根),即首字的(拼首+首根)+二字的(拼首+首根);
首字(拼首+首根+第2根)+二字(拼首+首根+第2根),即首字的(拼首+首根+第2根)+二字的(拼首+首根+第2根);
首字拼首+二字拼首+二字首根+二字第2根,即每字拼首+二字第(1+2)根;
首字全拼+二字全拼+二字首根+二字第2根,即每字全拼+二字第(1+2)根。
3.根据权利要求1所述的一种汉字多元输入方法,其特征在于,所述汉字中多字词汇采用的多元输入方式包括如下方式:
每字首根+末字第2根;
每字拼首+末字首根+末字第2根;
每字全拼+末字首根+末字第2根;
第一二三/第一二三末字之每字首根+末字第2根;
第一二三/第一二三末字之每字拼首+末字首根+末字第2根;
第一二三/第一二三末字之每字全拼+末字首根+末字第2根;
每字拼首;
每字全拼。
4.根据权利要求1所述的一种汉字多元输入方法,其特征在于,所述识别码即末笔字型交叉识别码;所述末笔字型交叉识别码包括横识别码、竖识别码、撇识别码、点识别码和折识别码;
所述横识别码包括横的左右型识别码“h”、横的上下型识别码“j”和横的杂合型识别码“k”;所述竖识别码包括竖的左右型识别码“g”、竖的上下型识别码“f”和竖的杂合型识别码“d”;所述撇识别码包括撇的左右型识别码“y”、撇的上下型识别码“u”和撇的杂合型识别码“i”;所述点识别码包括点的左右型识别码“t”、点的上下型识别码“r”和点的杂合型识别码“e”;所述折识别码包括折的左右型识别码“n”、折的上下型识别码“b”和折的杂合型识别码“v”。
5.根据权利要求1所述的一种汉字多元输入方法,其特征在于,所述标志码包括“f”。
6.根据权利要求1所述的一种汉字多元输入方法,其特征在于,所述输入设备的键位还包括笔画键位,具体如下:所述“H”键位、“S”键位、“P”键位、“D”键位、“Z”键位分别对应横“一”、竖“丨/亅”、撇“丿”、点“、/乀”和折“フ/ㄋ/乙”笔画。
7.根据权利要求1所述的一种汉字多元输入方法,其特征在于,所述输入设备的键位还包括功能键位,所述功能键位包括:启动输入法键即“Ctrl”+“Shift”+“9”键位、系统设定键盘即“右Ctrl”键位、添加用户词键即“右Shift”键位、输入方法主/混码切换键即“F9”键位、输入方法主/辅码切换键即“F10”键位、输入方法主/次显切换键即“F11”键位和输入方法主/混显切换键即“F12”键位。
8.一种基于权利要求1所述输入方法的系统,其特征在于,包括
编码库,用于存储与多种多元输入方式输入的编码匹配的汉字字符,所述编码包括将基本编码码元按其发音之拼音首字母进行分类匹配获取的输入设备的键位编码;
输入设备,用于根据待输入汉字的字根、笔画和拼音,选择多元输入方式的一种键入键位;
编码查找单元,用于根据输入设备键入的键位生成输入编码,选择编码库中与输入编码匹配的汉字字符;
显示单元,用于显示编码查找单元查找的汉字字符。
9.根据权利要求8所述的一种系统,其特征在于,所述编码库包括:
分类单元,用于将基本编码码元按照其发音之拼音首字母进行分类,所述基本编码码元包括字根和笔画;
编码单元,用于根据多元输入方式输入分类后的基本编码码元生成多种编码;
匹配单元,用于将编码单元的编码匹配对应的汉字;
其中,所述编码库中的所述编码与所述汉字字符的对应关系选自如下(a)-(c)任意一种:
(a):所述汉字为单字时,所述编码与所述汉字字符的对应关系选自如下(1)-(13)中的任意一种:
(1)单字的第(1+2+3+末)字根的键位+识别码构成所述编码;
(2)单字的第(1+2+3+末)字根的键位+识别码+标志码构成所述编码;
(3)单字的首字根的键位+首字根后第(1+2+3)笔画的键位+全字末笔画的键位构成所述编码;
(4)单字的第(1+2+3+…+8)笔画的键位+全字末笔画的键位构成所述编码;
(5)单字的拼首的键位+第(1+2+3+末)字根的键位+识别码构成所述编码;
(6)单字的拼首的键位+第(1+2+3+末)字根的键位+识别码+标志码构成所述编码;
(7)单字的拼首的键位+首字根的键位+首字根后第(1+2+3)笔画的键位+全字末笔画的键位构成所述编码;
(8)单字的拼首的键位+第(1+2+3+…+8)笔画的键位+全字末笔画的键位构成所述编码;
(9)单字的全拼的键位+第(1+2+3+末)字根的键位+识别码构成所述编码;
(10)单字的全拼的键位+第(1+2+3+末)字根的键位+识别码+标志码构成所述编码;
(11)单字的全拼的键位+第(1+2)字根的键位构成所述编码;
(12)单字的全拼的键位+首字根的键位+首字根后第(1+2+3)笔画的键位+全字末笔画的键位构成所述编码;
(13)单字的全拼的键位+第(1+2+3+…+8)笔画的键位+全字末笔画的键位构成所述编码;
(b):当所述汉字为两字词汇时,所述编码与所述汉字字符的对应关系选自如下(1)-(5)中的任意一种:
(1)首字的(首字根+第2字根)的键位+二字的(首字根+第2字根)的键位构成所述编码;
(2)首字(拼首+首字根)的键位+二字(拼首+首字根)的键位构成所述编码;
(3)首字(拼首+首字根+第2根)的键位+二字(拼首+首字根+第2字根)的键位构成所述编码;
(4)首字拼首的键位+二字拼首的键位+二字首字根的键位+二字第2字根的键位构成所述编码;
(5)首字全拼的键位+二字全拼的键位+二字首字根的键位+二字第2字根的键位构成所述编码;
(c):当所述汉字为多字词汇时,所述预存编码与所述汉字字符的对应关系选自如下(1)-(8)中的任意一种:
(1)每字首字根的键位+末字第2字根的键位构成所述编码;
(2)每字拼首的键位+末字首字根的键位+末字第2字根的键位构成所述编码;
(3)每字全拼的键位+末字首字根的键位+末字第2字根的键位构成所述编码;
(4)第一二三/第一二三末字之每字首字根的键位+末字第2字根的键位构成所述编码;
(5)第一二三/第一二三末字之每字拼首的键位+末字首字根的键位+末字第2字根的键位构成所述编码;
(6)第一二三/第一二三末字之每字全拼的键位+末字首字根的键位+末字第2字根的键位构成所述编码;
(7)每字拼首的键位构成所述编码;
(8)每字全拼的键位构成所述编码。
10.根据权利要求8所述的一种系统,其特征在于,所述(a)-所述(c)中的所述键位选自如下键位中的任意一种或几种的组合:
“A”键位,其包括的字根如下:山上丄生饣水氺手扌石十士氏身少尸束鼠豕乑;
“E”键位,其包括的字根如下:二儿ル耳阝卩;
“F”键位,其包括的字根如下:方飞非甫丰风夫采;
“H”键位,其包括的字根如下:一禾火黑合亥虍乎户;
“J”键位,其包括的字根如下:今金亼钅釒戋夹九斤巾几己井彑臼;
“K”键位,其包括的字根如下:开廾巜囗口凵冂ユ匚匸丂丌丩;
“L”键位,其包括的字根如下:六立亠了力丽卵耂龙龍鹿來耒良;
“M”键位,其包括的字根如下:木朩末门門門麻马弓馬皿毛矛吂目母黽米;
“O”键位,其包括的字根如下:日曰月○;
“Q”键位,其包括的字根如下:七千丘其气求曲且犬犭;
“R”键位,其包括的字根如下:人亻彳壬入;
“S”键位,其包括的字根如下:丨亅纟糹糸三卅四罒厶△巳;
“T”键位,其包括的字根如下:天屯田土;
“U”键位,其包括的字根如下:羽雨鱼魚于マ禺云与;
“V”键位,其包括的字根如下:之廴辶中竹豸爪爫丈隹舟乍止正;
“W”键位,其包括的字根如下:五兀戊無万韦未亡王文攵夂タ乌瓦;
“X”键位,其包括的字根如下:小心忄彐乡下穴血西覀夕;
“Y”键位,其包括的字根如下:用言讠牙永羊夭チ幺亚业也亞亜又ス由酉;
“Z”键位,其包括的字根如下:フㄋ乙子孑自足走疋乛乚。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910041178.3A CN109696966A (zh) | 2019-01-16 | 2019-01-16 | 一种简单易学的多元输入法 |
CN2019100411783 | 2019-01-16 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110502128A CN110502128A (zh) | 2019-11-26 |
CN110502128B true CN110502128B (zh) | 2022-09-23 |
Family
ID=66233989
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910041178.3A Withdrawn CN109696966A (zh) | 2019-01-16 | 2019-01-16 | 一种简单易学的多元输入法 |
CN201910817227.8A Active CN110502128B (zh) | 2019-01-16 | 2019-08-30 | 一种汉字多元输入方法及系统 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910041178.3A Withdrawn CN109696966A (zh) | 2019-01-16 | 2019-01-16 | 一种简单易学的多元输入法 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN109696966A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002091159A1 (fr) * | 2001-05-08 | 2002-11-14 | Ge Li | Procede pour la saisie de caracteres chinois au moyen de codes graphiques logiques |
CN1588284A (zh) * | 2004-08-17 | 2005-03-02 | 旷天水 | 一种见字即识形码也可使用音码的汉字键盘输入方法 |
CN103970287A (zh) * | 2014-03-19 | 2014-08-06 | 刘伊翰 | 字组字中文输入法及其字根键盘 |
-
2019
- 2019-01-16 CN CN201910041178.3A patent/CN109696966A/zh not_active Withdrawn
- 2019-08-30 CN CN201910817227.8A patent/CN110502128B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002091159A1 (fr) * | 2001-05-08 | 2002-11-14 | Ge Li | Procede pour la saisie de caracteres chinois au moyen de codes graphiques logiques |
CN1588284A (zh) * | 2004-08-17 | 2005-03-02 | 旷天水 | 一种见字即识形码也可使用音码的汉字键盘输入方法 |
CN103970287A (zh) * | 2014-03-19 | 2014-08-06 | 刘伊翰 | 字组字中文输入法及其字根键盘 |
Non-Patent Citations (1)
Title |
---|
汉字编码的普及目标体系与编码实例;王力德;《中文信息学报》;19941230(第04期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN109696966A (zh) | 2019-04-30 |
CN110502128A (zh) | 2019-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5187480A (en) | Symbol definition apparatus | |
US5586198A (en) | Method and apparatus for identifying characters in ideographic alphabet | |
CN117519493B (zh) | 基于10键键盘及应用于小屏电子设备的全拼输入法 | |
TW530223B (en) | Chinese phonetic input system having functions of incomplete spelling and fuzzy phonetic comparing, and the method thereof | |
WO2016197265A1 (zh) | 一种输入生僻字的方法 | |
CA2496872A1 (en) | Phonetic and stroke input methods of chinese characters and phrases | |
CN101488130A (zh) | 基于计算机网络的通过词义查词的系统及其方法 | |
CN110502128B (zh) | 一种汉字多元输入方法及系统 | |
KR100599873B1 (ko) | 한글자모를 이용한 다문자 입력장치 및 그 방법 | |
CN116627263A (zh) | 一种中小学教学用多功能键盘 | |
CN105045410A (zh) | 一种形式化拼音和汉字对应识别的方法 | |
CN104820503A (zh) | 集拼音和字形编码多种方式于一体的汉字输入系统 | |
JP3803253B2 (ja) | 漢字入力のための方法および装置 | |
JP5141130B2 (ja) | 辞書機能を有する電子機器及びプログラム | |
CN111381687A (zh) | 汉字形、音形两用码及音、形和音形码同台交叉输入汉字的平台 | |
CN1350224A (zh) | 两笔优化拼音输入法及其键盘 | |
US8408914B2 (en) | System and method for learning Chinese character script and Chinese character-based scripts of other languages | |
KR102016805B1 (ko) | 평면 배열 기반 중국어 사전 제공 방법 및 그 장치 | |
CN108459735A (zh) | 声韵双击触摸屏汉语拼音输入方法 | |
CN1050206C (zh) | 正规拼音汉字输入法 | |
KR20080086070A (ko) | 단어 검색 방법 | |
CN112328095A (zh) | 基本不用数字键选字的四用音形码汉字输入法及输入平台 | |
CN117917621A (zh) | 汉字输入方法和系统以及键盘 | |
CN118068969A (zh) | 基于88键大键盘的汉语拼音简拼或形码简拼输入法 | |
CN118068966A (zh) | 基于88键大键盘的形码全拼输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |