CN103838392B - 高频词语并全部汉字快易的键盘、手写、语音输入法 - Google Patents

高频词语并全部汉字快易的键盘、手写、语音输入法 Download PDF

Info

Publication number
CN103838392B
CN103838392B CN201410077649.3A CN201410077649A CN103838392B CN 103838392 B CN103838392 B CN 103838392B CN 201410077649 A CN201410077649 A CN 201410077649A CN 103838392 B CN103838392 B CN 103838392B
Authority
CN
China
Prior art keywords
word
block
code
piece
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410077649.3A
Other languages
English (en)
Other versions
CN103838392A (zh
Inventor
秦明
秦一明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201410077649.3A priority Critical patent/CN103838392B/zh
Publication of CN103838392A publication Critical patent/CN103838392A/zh
Application granted granted Critical
Publication of CN103838392B publication Critical patent/CN103838392B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

高频词语并全部汉字快易的键盘、手写、语音输入法,用325构块拼写一切汉字,构块全都本有或汉语自然地赋有块音,随之按简明规则串连每一字/词的3或4个块音,即成该字/词的拼块音,汉字在万难通晓的字音以外,全都变得像无需注音的德词般“可读”,由字/词的拼块音立即读定它的拼块码。本发明基于词/字拼块码的简易无重码性,以高度一致的方式在各种信息处理设备上实现高频词语并全部汉字杜绝选词/选字操作的快易键盘输入、手写输入、语音输入。

Description

高频词语并全部汉字快易的键盘、手写、语音输入法
技术领域
本发明涉及一种高频词语并全部汉字快易的键盘、手写、语音输入法。
背景技术
现有编码类计算机汉字键盘输入方法的主要问题在于其汉字编码远未完善,转而企图以计算机系统运行程序复杂性的增加和内置模块的增多(即各式各样的“智能化”)来弥补作为中文信息处理基础的汉字编码环节的缺陷,但如此行进迄今仍然没有、继续下去似也难以根本改变中文信息处理的总体效率远低于英文信息处理的这一格局。
现有拼音类计算机汉字键盘输入方法当然可以认为是不编码的而且是汉语自然的,因为小学教育早已普及汉语拼音和常用汉字,这也是绝大多数键盘用户选择了某种拼音输入法的原因。但拼音键入法虽易上手却无普适性且难免低效,即令只就3500常用字说事,受方言的顽固性以及普通话只有四百来个无调音节制约,无论哪种拼音方法事实上总有有折腾致效率下来,寻常用户习焉不察罢了。汉字拼音键入法的适当类比物是中文小型辞书。
现有手写类或语音类计算机汉字输入方法往往因其整体字形写入方式(多辅以其他非手写方式)或连续字音读入方式(多辅以其他非语音方式)而引发种种问题,比如字形或字音识别差错率高、内置模块多、操作流程长等等,输入效率更不理想。
发明专利申请2013101963685改进发明专利申请2012101668694并且提出了一种兼顾高频词语和全部汉字的快易键盘输入法;发明专利申请2013107283030改进2013101963685并且提出了一种兼顾高频词语和全部汉字的快易手写输入法;发明专利申请2014100016673基于2013107283030提出了一种兼顾高频词语和全部汉字的快易语音输入法。因为上述3个申请的字词编码部分共有几乎完全相同的技术特征,所以本发明要将这3个申请统合起来,提出一种兼顾高频词语和全部汉字快易的键盘、手写、语音输入法。
发明内容
本发明要做与轻编码重“智能化”相反的事情,旨在达到以下3个目标:
1.用合乎逻辑的严密方法实现高频词语/全部汉字的简易无重码编码,名为拼块码,其技术特征详尽地描述在具体实施例的前7个步骤中;
2.基于拼块码,本发明将大量简化计算机系统运行汉字的程序,系统中凡是涉及选词/选字的内置模块全部取消,体现在系统硬件中的技术手段极为简单,相关设施的技术特征描述在在具体实施例的第8个步骤中;
3.拼块码立足大众自幼习得的汉字读写经验,见词/字出码,易学难忘,同时又具备极大限度的通用性,远不只能用于汉语字词的计算机键入、写入、读入,其特征表现在具体实施例第7个步骤末尾的字表和词表中。
从操作及效果的角度描述,本发明杜绝高频词语和全部汉字之键盘输入、手写输入、语音输入过程中的选词/选字操作,进而产生可观的技术效果:
1.键入某词语/汉字的拼块码或简码即等于键入该词语/汉字,电脑词语键入模式的动态字均击键次数(不含空格键次)仅约1.5,逐字键入模式的动态字均击键次数(不含空格键次)仅约2.1;
2.写入某词语/汉字的拼块码或简码即等于写入该词语/汉字,词语写入模式的动态字均块码数仅约1.5,逐字写入模式的动态字均块码数仅约2.1;
3.因为每个词语/汉字的拼块码或简码都是由它的拼块音或其前段确定的,所以读入某词语/汉字的拼块音或其前段即等于读入该词语/汉字,词语读入模式的动态字均块音数仅约1.5,逐字读入模式的动态字均块音数仅约2.1。
附图说明
图1是本发明的中英文两用键盘字母键位图;
图2是本发明的手机键盘数字/字母键位图。
本发明的特征和优点通过下面结合附图对实施例的描述将变得更为明显。
具体实施方式
本发明的一个具体实施例由下列8个步骤组成:
1.拼音
汉语拼音都恢复本来写法,再y代替ü;例如yi/wu/yu恢复成i/u/ü,再y代替ü,成i/u/y。
2.字词集
取CJK字符集及其扩展A、B、C集(版本:5.3,2007.10)所收74344字形加上“○”,组成待编码字形集;取《中国语言生活状况报告(2011)》(商务印书馆2011年12月1版)所收25546高频词语,组成待编码词语集;以下字/词即指该字形集/词语集中的字形/词语,但本发明可同样处理全部汉字/词语。
3.子块
每个字中按笔顺的相继数画称为该字的一个子块;n画字恰有n(n+1)/2个子块,例如3画字“也”恰有3×4/2即6个子块“也,丨、乚”。子块既是不容歧解的数学式概念,又是选择余地极大的灵活概念(10万字形的子块总数超过1000万),这就给汉字编码排序打开了新天地。
字中的几个子块称为相继的,若按笔顺其中每一个的末画与下一个的首画构成该字的上下两画,例如“貔”中的“一、比”是相继的;字中的某个子块称为孤立的,若它与该字的其余笔画无公共点,例如“貔”中的是孤立的;字中无公共笔画的子块间的相交、相接关系按笔画间的同名关系理解。
4.构块和块音
在有章法地拆解了上述74345字至少一百遍后,确定下列325子块(下称构块,简称块)恰当构成该74345字:
构块表
其中字号较大的称为根,较小的称为枝。根仅包括9种汉字笔形“一(横)、(提),丨(竖)、亅(钩),丶(点)、(捺),(撇)、○(圈)、乙(折)”、11个汉语数字“○、一、二、…、十”以及另外132个常用字易读子块(注意根“○、一、乙”均见两处,一处作为字,另一处作为笔形),根的拼音属于常识(个别的或需说明一次),例如“刀//衤”的拼音是dao/gu/i;枝的拼音规定是其根的拼音(从枝的构形或读音易联想其根),例如“氵”的拼音即其根“习/亡/水”的拼音xi/uang/shuei;构块的拼音简称块音,仅两三枝的块音不合常用读法(亦非毫无依傍),如“扌”(“把”的子块)的块音是ba而非ti,意在缩短许多高频字的码长。
字若是构块则称块字,若是非笔形根则称根字,根字可说无人不识。
多画块的下列3种变形之一若不改变该块内各画间位置关系且未变成别的块则视同原块(但改动笔画从变块):1)块(“未”除外)中某一画的伸缩或位移,如视同“土/亠”;2)块中的某一“乚”换为之一,或“丿”换为“丨”,或“一”换为“乛”,如“/忄/”视同“巳//土”;3)块(除外)中的某一画或其末段换为它的对偶(称“一”与“丨”与“亅”、“丶”与对偶),如“冫/”视同“亠/氵//才//八”;此外,个别多画块及子块的其它稍许变形亦视同原块(但改动笔画从变块),如视同“未/丷/丰//
5.块码
块码是块音首字母,但依次有下列5种变通之一:
1)若块(“耳、十”及其枝除外)音与“○、一、二、…、九”中某字的块音相同(不计声调,不区别起头的sh和s、n和l及结尾的ng和n),则块码为对应阿拉伯数字(如“巴”的块码是8);
2)若块音末字母是a,则块码为a(如“下”的块码是a);
3)若块音末二字母是uo,则块码为o(如“火”的块码是o);
4)若块音末三字母是uei,则块码为v(如“未”的块码是v);
5)“木”及其枝的块码为w(如的块码是w)。
可见块码仅包括10个阿拉伯数字和26个汉语拼音字母,且兼容构块的众多方言普通话读音,用户极易见块定码;设置5种变通,目的仍在缩短大量高频字的码长。块码按国际通行顺序列在构块表左端。
6.块顺
字的块顺是依次遵守下列3条数学式规则逐一拆下该字的相继构块直至拆尽该字的全部笔画后得到的唯一一串块:
1)块少拆得的块尽量少(但多画字拆成至少2块,其构块“日、口、 厂,又、乂(孤立的)、”依次力避拆散);
2)字大拆得的诸根字总画数尽量大(但相继两块依次力避相交、相接);
3)先小先拆得的块画数尽量小。
规则的但书不必死记,用户自然地拆字就刚好遵守了它。例如“傻”,拆成(亻乂一八夂)对,(亻六夂)错,尽管后者头痛地少1块。
当字含有笔顺难判的子块,其笔顺约定使拆分维持“块少、字大、先小”3规则,但字中包含该子块的列分明方块先写左列后写右列。例如的块顺是(一),的块顺是(刀刀干)。
字的块顺含n个块,该字即称n块字,n块字的块数是n。注意1块字即1画字,再按段数分类,各段均非折,例如“一”是1段字,是4段字。
块顺定义是在拆解前述74345字形至少一百遍的过程中,与构块表互相推进、一并确定的。字的块顺远较笔顺醒目(笔顺之细琐难辨大都消融在块顺当中),而且有助逆转日甚一日的“提笔忘字”。鉴于全部汉字字形固有的结构复杂性,块顺概念可以说已经精简到难以再精简的程度,用户据之随机拆练几百字,见识过种种情形后,便绝少碰到需经推敲才能确定块顺的字了;大体上,非常用字的拆解和常用字的同样容易。
7.拼块音和拼块码
多块字的拼块音按下列数学式规则确定:
但约定,至少5块字若本身或后部形如(这类字太多),则定其拼块音时末画若是末块便不计,例如“圓”的拼块音是linkoumuba,“鰋”的拼块是yhuoiny;多块字本身或2块字末块若无从类推笔顺,则定其拼块音时将该块音重复至块音总数为3,例如的拼块音是iaoliaoliao;
1块字的拼块音按下列数学式规则确定:
段数 1 2 ≥3
拼块音 块音+笔形音+i 块音+各段笔形音 块音+首2段笔形音+末段笔形音
可见任何字的拼块音恰由3或4个块音串成。下面举几个字例,供用户练习字的拼块音时参照:
由字的拼块音将其中每一块音换为同块码,即成该字的准码。例如,由的拼块音quanfengba将其中每一块音换为同块码,即成的准码qf8。于是,一切字的准码普通人都能汉语自然地“读定”:默念字的拼块音同时确定其准码。
现在设若干字(依次按降频、CJK字符集、扩展A集、B集、C集、块数、各块画数、各块笔顺、字结构排列)的准码都是S1S2S3S4,规定第k字的拼块码是S1S2S3S4后缀k-1个0;又设若干字的准码都是S1S2S3同时n个字的准码都是S1S2S30,规定前者第1字的拼块码是S1S2S3,第m(≥2)字的拼块码是S1S2S3后缀n+m-1个0,例如“忘/瑤/忞/”的拼块码是uxd/uxd0/uxd00/uxd000。由此,无论要编码多少字,不同字形必有不同拼块码,但用户只需确定字的准码。
在全部字形中,拼块码不同于准码的少见,且几乎只见于罕用字,而罕用字的码长基本不影响绝大多数用户的中文处理效率:对于一般人,平均读写40万字次难见1次任意指定的非常用字,仅见646次非常用字。
词的拼块音按下列数学式规则确定:
词字数 ≤2 3 ≥4
拼块音 各字音+末字首末块音 各字音 首3字音+末字音
这里,一字的字音特指该字被看做构块时禀有的块音;含阿拉伯数字/汉语拼音字母的词中的每个数字/字母视为以自身为块码的1块字;至少3块字若本身或后部形如则定其拼块音时末画若是末块便不计。
注意任何词的拼块音也恰由3或4个块音串成。下面举几个词例,供用户练习词的拼块音时参照:
由词的拼块音将其中每一块音换为同块码,即成该词的准码,例如,由“例如”的拼块音lirunykou将其中每一块音换为同块码,即成“例如”的准码lrnk。于是,一切词的准码普通人也都能汉语自然地“读定”:默念词的拼块音同时确定其准码。
现在设若干词(按降频排列)的准码都是S1S2S3S4,规定第k词的拼块码是S1S2S3S4后缀k-1个0;又设若干词的准码都是S1S2S3同时n个词的准码都是S1S2S30,规定前者第1词的拼块码是S1S2S3,第m(≥2)词的拼块码是S1S2S3后缀n+m-1个0,例如“电视剧/电视机/董事局”的拼块码是d4j/d4j0/d4j00。由此,不同词形必有不同拼块码,但用户只需确定词的准码。
下面给出按拼块码字典序排列的1)CJK字符集及其扩展A、B、C集74344字形表q部计959字;2)2010年度媒体25546高频词语表r部计387词(其中S1S2S3S4n是S1S2S3S40…0(n个0)的缩写,例如q1h02指q1h000;附注了数字n∈{1,2,3}的词有n级简码(即其准码的前n位),例如“容易2”表示“容易”有2级简码r1),以助用户把握拼块码方法:
1 日2 r02 31 任期 r77y1
2 认领3 r0rr 32 日期3 r77y2
3 r0t 33 r7e
4 r1c 34 r7k
5 热议 r1d1 35 容器 r7kk
6 日益3 r1dm 36 热气 r7p1
7 如意 r1lx 37 人气2 r7p11
8 人意 r1lx1 38 燃气3 r7p12
9 任意3 r1lx2 39 r7q
10 任意球 r1q 40 燃起3 r7tj
11 容易2 r1r5 41 r7w
12 然而2 r2c4 42 r7x
13 r2d 43 r8d
14 人山人海2 r3rh 44 r8n
15 日式 r41d 45 热2 r8o
16 人事3 r41g 46 r8w
17 入市3 r42j 47 绕2 r95
18 认识3 r4d8 48 r9d
19 如实3 r4ga 49 仍旧3 r9sr
20 软实力 r4l 50 人大2 ra1a
21 人世3 r4nz 51 入夏3 ra1u
22 人士2 r4s1 52 容纳3 ra9n
23 人物3 r565 53 人马 raa1
24 入伍3 r5d5 54 如下 raad
25 忍无可忍3 r5kr 55 扔下 raad1
26 任务2 r5ul 56 仁爱 raai
27 容留3 r6bt 57 热爱3 raai1
28 人流量 r6l 58 儒雅 raav
29 人流2 r6vc 59 软化 rad7
30 如期 r77y 60 融化3 rad71
61 儒家 ragq 91 如此3 rczb
62 人家3 ragq1 92 rd1
63 润滑油 rai 93 热带 rd1j
64 辱骂3 rak1 94 韧带 rd1j1
65 融洽3 ravk 95 rd2
66 热辣3 rax8 96 蠕动 rd2l
67 raz 97 rd4
68 日报 rb8i 98 扔掉3 rd8s
69 热播3 rb8t 99 热点3 rdbo
70 人保3 rbdw 100 rdd00
71 忍不住2 rbz00 101 热度 rddi
72 让步3 rbzs 102 绕道 rddz
73 如出一辙3 rc1z 103 柔道 rddz1
74 人次3 rc2q 104 人道3 rddz2
75 人畜 rc2t 105 认定3 rdgr
76 日出 rc30 106 荣登3 rdid
77 让出 rc301 107 rdn
78 认出3 rc302 108 rdr
79 日产3 rc6c 109 热电 rdrz
80 如厕3 rccl 110 让2 rds
81 热词3 rcdk 111 认得 rdsd
82 日程3 rchu 112 入冬3 rdu2
83 妊娠3 rcn1 113 人代会 rdv
84 热炒3 rcop 114 rdx
85 入场券 rcq 115 入党 rdx2
86 人才2 rcsp 116 人道主义3 rdz1
87 入场3 rctp 117 阮2 re5
88 热潮3 rcvy 118 日复一日3 rf1r
89 热忱 rcx2 119 日方2 rf2l
90 日常3 rcxj 120 乳粉3 rf8d
121 乳房3 rfdf 151 乳业3 rio1
122 人防3 rfef 152 日用品 rip
123 燃放3 rffu 153 热映3 rira
124 认购3 rg0z 154 人影 rirp
125 让给3 rg9k 155 燃油2 rivi
126 人工2 rga1 156 荣耀3 rixv
127 软骨3 rggy 157 人居3 rj4k
128 rgk 158 日剧 rj4l
129 人格3 rgwk 159 忍俊不禁3 rjbj
130 日光3 rgx5 160 软件3 rjd6
131 入股3 rgyi 161 日记 rjdj
132 日后 rhck 162 人际3 rjex
133 然后3 rhck1 163 人均GDP rjgp
134 入户 rhd4 164 日军3 rjgs
135 如何2 rhdk 165 人际关系 rjgx
136 任何3 rhdk1 166 容积3 rjh8
137 人和 rhhk 167 容积率 rjl
138 柔和3 rhhk1 168 溶解 rjl6
139 软环境 rhj 169 日间 rjmr
140 融合3 rhrk 170 人间3 rjmr1
141 人海3 rhvm 171 如今2 rjrz
142 日用 ri02 172 人均收入 rjsr
143 任用3 ri021 173 任教3 rjsu
144 任由 ri0t 174 日均 rjt2
145 日夜3 ri2a 175 入境 rjt21
146 容颜3 ri6r 176 人均3 rjt22
147 认养 rid2 177 日渐3 rjvj
148 荣膺3 ridy 178 日均线 rjx
149 软硬件 rij 179 人口2 rk01
150 肉眼3 rimg 180 入口3 rk011
181 rk100 211 人们2 rmdm
182 认可3 rk1g 212 人民代表大会 rmdv
183 入口处 rkc 213 入门 rmdz
184 认可度 rkd00 214 热门3 rmdz1
185 入库3 rkds 215 人民警察3 rmja
186 人口红利3 rkhl 216 人民检察院 rmjy
187 热烈3 rl1o 217 任免3 rml2
188 rl5 218 燃煤3 rmow
189 荣立3 rl61 219 容貌3 rmp2
190 肉类 rl8a 220 人命 rmre
191 人类2 rl8a1 221 任命3 rmre1
192 燃料3 rl8s 222 热卖3 rmta
193 日历3 rlcl 223 人满为患3 rmvh
194 让利3 rlhl 224 人名3 rmxk
195 燃料油 rli 225 人脉3 rmyv
196 热泪盈眶 rlik 226 人民政府3 rmzf
197 让路3 rlkk 227 燃眉之急 rmzj
198 扰乱3 rlqz 228 热恋3 rn2x
199 热量 rlrt 229 忍耐3 rncc
200 容量3 rlrt1 230 如2 rnk
201 热浪3 rlvg 231 热闹3 rnm4
202 热泪 rlvm 232 rnr
203 软肋3 rlyl 233 热能3 rnzb
204 热力 rlzp 234 日落 ro7k
205 人力3 rlzp1 235 如若 ro7k1
206 扰民 rm47 236 荣获3 ro7q
207 人民3 rm471 237 热火3 ro8r
208 柔美3 rm8a 238 热火朝天3 roct
209 人民法院3 rmay 239 人偶 rodn
210 人民币 rmb 240 让座3 rodt
241 柔弱 rog2 271 热热闹闹3 rrnn
242 软弱3 rog21 272 人人 rrpa
243 软着陆 rol 273 融入3 rrpa1
244 roo 274 人肉搜索3 rrso
245 认错3 ropr 275 仍然2 rrxo
246 如火如荼3 rort 276 如日中天3 rrzt
247 如果2 rorw 277 热身 rs0p
248 人1 rpa 278 人身3 rs0p1
249 入2 rpa00 279 人寿3 rs3c
250 任凭3 rpdj 280 人生3 rs61
251 人品 rpkk 281 认输3 rs7l
252 乳品3 rpkk1 282 人数2 rs8u
253 热切3 rq7d 283 忍受3 rsai
254 融券3 rq8d 284 如数家珍 rsaz
255 入侵3 rqdi 285 人生观 rsg
256 日前2 rqdl 286 染色3 rsl8
257 人群3 rqjs 287 燃烧3 rso5
258 热钱3 rqpd 288 人手 rsp8
259 日趋3 rqt3 289 入手3 rsp81
260 人情味 rqv00 290 热身赛 rss
261 认清3 rqvy 291 染色体 rst
262 人权3 rqwi 292 榕树3 rswc
263 人情 rqxy 293 人身自由 rszi
264 柔情 rqxy1 294 人参3 rszp
265 热情3 rqxy2 295 认同2 rt0k
266 日日3 rr02 296 如同3 rt0k1
267 冉冉 rr0t 297 人头3 rt2a
268 柔软3 rr7q 298 忍痛3 rtbi
269 容忍3 rrdx 299 肉体 rtd1
270 嚷嚷3 rrk1 300 人体3 rtd11
301 认同感 rtg 331 忍心 rxdd1
302 热土3 rts1 332 儒学 rxdz
303 融通3 rtzz 333 入学3 rxdz1
304 入网3 ru01 334 热血沸腾3 rxft
305 人文2 ru21 335 融雪剂 rxj
306 日文3 ru211 336 rxo
307 人文精神3 rujs 337 热血 rxpm
308 入围3 rv0l 338 热销3 rxpy
309 融为一体3 rv1t 339 绕行3 rxsd
310 认罪3 rv43 340 荣幸3 rxtg
311 热水器 rv7 341 人行天桥 rxtq
312 认为2 rvdd 342 入校3 rxw1
313 人为3 rvdd1 343 韧性 rxx1
314 让位 rvdl 344 柔性 rxx11
315 入赘3 rvfr 345 任性 rxx12
316 热水3 rvga 346 人性3 rxx13
317 rvk 347 日新月异 rxy1
318 入睡3 rvm1 348 乳腺3 rxyv
319 入会3 rvrz 349 日月 ry02
320 rvu 350 入园3 ry05
321 融汇3 rvv0 351 日元3 ry15
322 rvw 352 如愿以偿 ry1c
323 人选 rx6z 353 如约3 ry9d
324 任选 rx6z1 354 人缘 ry9q
325 入选3 rx6z2 355 如愿3 rycx
326 热线2 rx9d 356 荣誉3 rydi
327 乳腺癌 rxa 357 日语 rydk
328 人行道 rxd00 358 如鱼得水 rydv
329 容许 rxd5 359 入院3 rye5
330 人心 rxdd 360 人员2 rykr
361 入狱3 ryqq
362 ryw
363 入账3 rz0a
364 热衷3 rz21
365 融资2 rz2r
366 认准 rz2v
367 日志3 rz4x
368 人造3 rz6z
369 染指3 rz8r
370 入驻3 rzau
371 肉质 rzcr
372 人质3 rzcr1
373 认知度 rzd00
374 热心 rzdd
375 入主 rzdu
376 入住3 rzdu1
377 任重道远 rzdy
378 认证 rzdz
379 任职3 rze8
380 入住率 rz l
381 乳制品 rzp00
382 肉制品 rzp01
383 认知3 rzpk
384 认真3 rzs8
385 人者3 rztb
386 软组织 rzz00
387 日子3 rzzs
8-1.电脑/手机词字键盘输入
中英文两用键盘由通用键盘经如下增补获得:将空格键按2∶1长度隔断为左键、右键,按图1在26个英语字母键Q、W、E、…、N、M的右下角依次标注汉语拼音字母a、b、c、…、y、z,是为键盘的中文状态,默认状态为中文状态;
手机键盘按图2将10个阿拉伯数字012…9和26个汉语拼音字母abc…z标注到18个键上。
在中英文两用键盘上依次单击完某词的拼块码对应各键位和左键,电脑视屏仅显示该词(“显示某”指“在编辑位置显示某并进入下一键入”),例如依次单击完“容易”的拼块码r1r5对应的键r键1键r键5左键,电脑视屏仅显示“容易”;
在中英文两用键盘上依次单击完某字的拼块码对应各键位和右键,电脑视屏仅显示该字,例如依次单击完的拼块码qf8对应的键q键f键8右键,电脑视屏仅显示
在手机键盘上依次单击或双击完某词的拼块码对应各键位和键*(规定仅当输入块码i~z时双击对应键位),手机视屏仅显示该词,例如依次双击键r单击键1双击键r单击键5单击键*,手机视屏仅显示“容易”;
在手机键盘上依次单击或双击完某字的拼块码对应各键位和键#(规定仅当输入块码i~z时双击对应键位),手机视屏仅显示该字,例如依次双击键q单击键f单击键8单击键#,手机视屏仅显示
任何词/字的准码究竟后缀几个0方成其拼块码由机器去识别,用户只需键入准码再键入若干0直到他要求的词/字出现。
至于简码键入方式,本发明采用专利申请2009100581865的,用户完全不必操心哪些词/字有哪一级简码。这样一来,在电脑或手机上键入中文文本,只需依次敲击所欲词/字的拼块码对应键位至该词/字在视屏编辑位置出现,例如敲毕r1,“容易”已在视屏编辑位置出现。
本键盘输入法的选词/选字键次绝对为0,兼容众多方言普通话故练习输入若干文本后纠错键次几乎为0。又一般人经几小时训练即能按方言普通话盲念1字词和2字词的末字首末块音同时键入相应块码,故本键入法有类似拼音键入法的易盲打度。
8-2.PDA(个人数字助理)词字手写输入
在PDA中预置拼块码感应模块、拼块码识别模块、码-词字转换模块、词字显示模块。
在拼块码感应区用手指或触笔依次写完某词/字的拼块码并给出结束信号(可以是延时停顿、双击感应区,或其他约定操作);
拼块码识别器接受该码;
码-词字转换器从内置词库/字库中检出赋有该码的唯一词/字;
显示屏仅在编辑位置显示该词/字并进入下一写入。
例如,在感应区用手指或触笔依次写完“容易/”的拼块码r1r5/qf8并给出结束信号,识别器接受该码,转换器从词库/字库中检出赋有该码的唯一词/字即“容易/”,显示屏仅在编辑位置显示“容易/”并进入下一写入。
任何词/字的准码究竟后缀几个0方成其拼块码由机器去识别,用户只需写入准码再写入若干0直到他要求的词/字出现。
至于简码写入方式,本发明采用专利申请2009100581865的,用户完全不必操心哪些词/字有哪一级简码。这样一来,在PDA上写入中文文本,只需在拼块码感应区依次书写所欲词/字的拼块码至该词/字在显示屏编辑位置出现,例如在感应区写毕r1,“容易”已在显示屏编辑位置出现。
本手写输入法的拼块码识别准确率极高,因为块码只有012…9abc…z这36个;在感应区手写拼块码时,其中各块码保持先后次序即可,容许大小不一甚至位置重叠,用户无需将注意力集中在感应区,PDA的尺寸可以很小。
8-3.车载导航设备词字语音输入
在车载导航设备中预置拼块音感应模块、音-码转换模块、拼块码识别模块、码-词字转换模块、词字显示模块。
在拼块音感应区依次读完某词/字的拼块音(偶需续读若干ling)并给出结束信号(可以是延时停顿,或其他约定操作);
音-码转换器将该拼块音转换成唯一拼块码;
拼块码识别器接受该码;
码-词字转换器从内置词库/字库中检出赋有该码的唯一词/字;
显示屏仅在编辑位置显示该词/字并进入下一读入。
例如,在感应区依次读完“容易/”的拼块音rongiriu/quanfengba并给出结束信号,音-码转换器将该拼块音转换成唯一拼块码即r1r5/qf8,识别器接受该码,码-词字转换器从词库/字库中检出赋有该码的唯一词/字即“容易/”,显示屏仅在编辑位置显示“容易/”并进入下一读入。
任何词/字的拼块音究竟后缀几个ling方对应于其拼块码由机器去识别,用户只需读入拼块音再读入若干ling直到他要求的词/字出现。
至于简码读入方式,本发明采用专利申请2009100581865的,用户完全不必操心哪些词/字有哪一级简码。这样一来,在车载导航设备上读入中文文本,只需在拼块音感应区依次朗读所欲词/字的拼块音至该词/字在显示屏编辑位置出现,例如在感应区读毕rongi,“容易”已在显示屏编辑位置出现。
本语音输入法的音-码转换准确率很高,因为只需识别拼块音中各块音的涉码音素且兼容许多方言普通话读音;对于在音-码转换环节可能出现差错的几组构块如“儿、耳”,“石、十”,“目、木”,则约定在全部构块中,唯有“耳”及其枝的块音是er三声,“十”及其枝的块音是shi二声,“木”及其枝的块音是mu四声。
上面严格而完备地描述了本发明的一个具体实施例,即将本发明实施于25546高频词语和74345字形的电脑/手机键盘输入、PDA手写输入、车载导航设备语音输入。应当明白,这只是帮助理解本发明的一个例子,并不构成对本发明保护范围的限制,本发明当然能按同样的方式在任何信息处理设备上键入、写入、读入更大的或更小的汉词集和汉字集,只要该设备预置了步骤8-1、8-2、8-3中描述的那些内置模块;另外,为完善本发明而对键盘设置、构块表以及确定块音、块码、块顺、拼块音、拼块码的规则等作出的调整均落在本发明范围内。
注意,绝大多数用户的字词运用很少超出媒体高频词语的范围,故无论键盘输入、手写输入还是语音输入,他皆可基本不用逐字输入方式;对于需要处理很多乃至全部汉词的人士,则略为调整词的拼块音规则便能满足他快速处理的要求。
至此,发明专利申请2012101668694“彻底解决全部汉字检索、输入、存储问题”的承诺理论上已完全兑现;对于所有人,全部汉字的远较以往任何方法快易的书写记忆、辞书检索、键盘输入、手写输入、语音输入就近在眼前,而且他学会上列5项中的任何一项即大致学会其余4项。
那么未来呢?申请人给出如下观察:
全部汉字字形固有的结构复杂性、绝大多数汉字字音的读不出性、常用汉字普通话音节的偏少且读不准性在可以预见的将来不会改变,三者共同注定了中文处理绝无可能全面达到英文处理的简单直接程度,而拼块码方法已令中文处理总体的方式和效率极其接近英文处理的方式和效率;于是道理上似已难有比汉字拼块码更加简易通用但思路迥异的全汉字无重码,随之中文处理总体上似已难有比拼块码方法更加简易有效的普适方法。

Claims (4)

1.高频词语并全部汉字快易的键盘、手写、语音输入法,其特征是包括下列步骤:
汉语拼音都恢复本来写法,再y代替ü;
取CJK字符集及其扩展A、B、C集所收74344字形加上“○”,组成待编码字形集;取《中国语言生活状况报告(2011)》所收25546高频词语,组成待编码词语集;以下字/词即指该字形集/词语集中的字形/词语;
每个字中按笔顺的相继数画称为该字的一个子块,n画字恰有n(n+1)/2个子块;字中的几个子块称为相继的,若按笔顺其中每一个的末画与下一个的首画构成该字的上下两画;字中的某个子块称为孤立的,若它与该字的其余笔画无公共点;字中无公共笔画的子块间的相交、相接关系按笔画间的同名关系理解;
用来构成待编码诸字的下列子块称为构块,简称块:
构块表
0○
1一乙乂衤
2二
3三山彐
4四罒石市
5五无旡兀午
6六
7七
8八丷巴
9九久臼
a丅大瓦爪爫瓜甲
b卜白疒
c厂镸才寸川
d丶丁亻
e耳阝卩
f凡飞丰夫甫方
g亅干工弓个革宀冖冎艮
h一禾
i又由尢酉也业幺用
j几己巾井斤金
k口
l了
m门毛目母皿
n乃女内禸廿
o火灬
p丿片爿皮
q○犬犭欠且丘求曲
r人亽入日
s|上彳手
t土田
u亡吂王文攵夂
v丂水氺氵隹未回
w木
x夕习西覀乡
y于
z乙厶巛子止
其中的3号宋体称为根,5号宋体称为枝;根的拼音属于常识,枝的拼音规定是其根的拼音,构块的拼音简称块音;
字若是构块则称块字,若是非笔形根则称根字;
多画块的下列3种变形之一若不改变该块内各画间位置关系且未变成别的块则视同原块:1)“未”除外的块中某一画的伸缩或位移;2)块中的某一“乚”换为“”之一,或“丿”换为“|”,或“一”换为“乛”;3)“”除外的块中某一画或其末段换为它的对偶,这里称“一”与“”、“|”与“亅”、“丶”与“”对偶;
块码是块音首字母,但依次有下列5种变通之一:1)若“耳、十”及其枝除外的块音与“○、一、二、…、九”中某字的块音在不计声调、不区别起头的sh和s、n和|及结尾的ng和n的前提下相同,则块码为对应阿拉伯数字;2)若块音末字母是a,则块码为a;3)若块音末二字母是uo,则块码为o;4)若块音末三字母是ue i,则块码为v;5)“木”及其枝的块码为w;
字的块顺是依次遵守下列3条规则逐一拆下该字的相继构块直至拆尽该字的全部笔画后得到的惟一一串块:1)块少拆得的块尽量少,但多画字拆成至少2块,其构块“日、口、厂,又、孤立的乂、”依次力避拆散;2)字大拆得的诸根字总画数尽量大,但相继两块依次力避相交、相接;3)先小先拆得的块画数尽量小;
字的块顺含n个块,该字即称n块字;1块字即1画字,再按段数分类,各段均非折;
多块字的拼块音按下列规则确定:
但约定,至少5块字若本身或后部形如“”或“”,则定其拼块音时末画若是末块便不计;多块字本身或2块字末块若无从类推笔顺,则定其拼块音时将该块音重复至块音总数为3;
1块字的拼块音按下列规则确定:
段数 1 2 ≥3 拼块音 块音+笔形音+i 块音+各段笔形音 块音+首2段笔形音+末段笔形音
由字的拼块音将其中每一块音换为同块码,即成该字的准码;
设若干依次按降频、CJK字符集、扩张A集、B集、C集、块数、各块画数、各块笔顺、字结构排列的字的准码都是S1S2S3S4,规定第k字的拼块码是S1S2S3S4后缀k-1个0;又设若干字的准码是都S1S2S3同时n个字的准码都是S1S2S30,规定前者第1字的拼块码是S1S2S3,第m字的拼块码是S1S2S3后缀n+m-1个0,这里m≥2;
词的拼块音按下列规则确定:
词字数 ≤2 3 ≥4 拼块音 各字音+末字首末块音 各字音 首3字音+末字音
这里,一字的字音特指该字被看做构块时禀有的块音;含阿拉伯数字/汉语拼音字母的词中的每个数字/字母视为以自身为块码的1块字;至少3块字若本身或后部形如“”或“”,则定其拼块音时末画若是末块便不计;
由词的拼块音将其中每一块音换为同块码,即成该词的准码;
设若干按降频排列的词的准码都是S1S2S3S4,规定第k词的拼块码是S1S2S3S4后缀k-1个0;又设若干词的准码都是S1S2S3同时n个词的准码都是S1S2S3O,规定前者第1词的拼块码是S1S2S3,第m词的拼块码是S1S2S3后缀n+m-1个0,这里m≥2;
基于词/字拼块码之简易无重码性的高频词语并全部汉字快易键盘输入法,其输入步骤为:
在中英文两用键盘上依次单击完某词/某字的拼块码对应各键位和左键/右键,电脑视屏仅在编辑位置显示该词/该字并进入下一键入;
在手机键盘上依次单击或双击完某词/某字的拼块码对应各键位和键*/键#,手机视屏仅在编辑位置显示该词/该字并进入下一键入,这里规定仅当输入块码i~z时双击对应键位;
在电脑或手机上键入中文文本,只需依次敲击所欲词/字的拼块码对应键位至该词/字在视屏编辑位置出现;
基于词/字拼块码之简易无重码性的高频词语并全部汉字快易手写输入法,其输入步骤为:
在既定设备的拼块码感应区用手指或触笔依次写完某词/字的拼块码并给出预定结束信号;手写拼块码时其中各块码保持先后次序即可,容许大小不一甚至位置重叠;
拼块码识别器接受该码;
码-词字转换器从内置词库/字库中检出赋有该码的唯一词/字;
显示屏仅在编辑位置显示该词/字并进入下一写入;
在既定设备上写入中文文本,只需在它的拼块码感应区用手指或触笔依次书写所欲词/字的拼块码至该词/字在显示屏编辑位置出现;
基于词/字拼块码之简易无重码性的高频词语并全部汉字快易语音输入法,其输入步骤为:
在既定设备的拼块音感应区依次读完某词/字的拼块音并给出预定结束信号;约定在全部构块中唯有”耳”及其枝的块音是er三声,“十”及其枝的块音是shi二声,”木”及其枝的块音是mu四声;
音-码转换器将该拼块音转换成唯一拼块码;
拼块码识别器接受该码;
码-词字转换器从内置词库/字库中检出赋有该码的唯一词/字;
显示屏仅在编辑位置显示该词/字并进入下一读入;
在既定设备上读入中文文本,只需在它的拼块音感应区依次朗读所欲词/字的拼块音至该词/字在显示屏编辑位置出现。
2.如权利要求1所述的高频词语并全部汉字快易的键盘、手写、语音输入法,其特征在于,中英文两用键盘由通用键盘经如下增补获得:将空格键按2∶1长度隔断为左键、右键,在26个英语字母键Q、W、E、…、N、M的右下角依次标注汉语拼音字母a、b、c、…、y、z,是为键盘的中文状态,默认状态为中文状态;
手机指安装了数字键、字母键和视屏的任何手持电子设备,手机键盘将10个阿拉伯数字012…9和26个汉语拼音字母abc…z标注到18个键上。
3.如权利要求1所述的高频词语并全部汉字快易的键盘、手写、语音输入法,其特征在于,所称既定设备指预置了拼块码感应模块、拼块码识别模块、码-词字转换模块、词字显示模块的任何信息处理设备。
4.如权利要求1所述的高频词语并全部汉字快易的键盘、手写、语音输入法,其特征在于,所称既定设备指预置了拼块音感应模块、音-码转换模块、拼块码识别模块、码-词字转换模块、词字显示模块的任何信息处理设备。
CN201410077649.3A 2013-05-24 2014-03-05 高频词语并全部汉字快易的键盘、手写、语音输入法 Expired - Fee Related CN103838392B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410077649.3A CN103838392B (zh) 2013-05-24 2014-03-05 高频词语并全部汉字快易的键盘、手写、语音输入法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN 201310196368 CN103246363A (zh) 2013-05-24 2013-05-24 高频词语并全部汉字电脑/手机快易键盘输入法
CN2013101963685 2013-05-24
CN201310196368.5 2013-05-24
CN201410077649.3A CN103838392B (zh) 2013-05-24 2014-03-05 高频词语并全部汉字快易的键盘、手写、语音输入法

Publications (2)

Publication Number Publication Date
CN103838392A CN103838392A (zh) 2014-06-04
CN103838392B true CN103838392B (zh) 2017-02-08

Family

ID=48925925

Family Applications (2)

Application Number Title Priority Date Filing Date
CN 201310196368 Pending CN103246363A (zh) 2013-05-24 2013-05-24 高频词语并全部汉字电脑/手机快易键盘输入法
CN201410077649.3A Expired - Fee Related CN103838392B (zh) 2013-05-24 2014-03-05 高频词语并全部汉字快易的键盘、手写、语音输入法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN 201310196368 Pending CN103246363A (zh) 2013-05-24 2013-05-24 高频词语并全部汉字电脑/手机快易键盘输入法

Country Status (1)

Country Link
CN (2) CN103246363A (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104571593B (zh) * 2015-02-10 2018-01-30 秦一明 全部汉字汉词简易无重码统一输入法
CN105511636B (zh) * 2015-11-25 2018-05-04 秦一明 改进的全部汉字汉词简易无重码统一输入法
CN106774987A (zh) * 2017-01-10 2017-05-31 秦明 全部汉字汉词简易无重码统一输入法定型
CN108304082A (zh) * 2018-02-27 2018-07-20 秦明 全部汉字汉词简易无重码通用输入法
CN110827803A (zh) * 2019-11-11 2020-02-21 广州国音智能科技有限公司 方言发音词典的构建方法、装置、设备及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101183279A (zh) * 2007-11-14 2008-05-21 秦一明 汉字输入拼块音方案
CN101598976A (zh) * 2009-06-25 2009-12-09 秦严 汉字输入拼块音新方案
CN101984390A (zh) * 2010-11-29 2011-03-09 秦一明 一种电脑/手机统一的全部标准字形简易无重码键盘输入法
CN102722262A (zh) * 2012-05-28 2012-10-10 秦一明 一种彻底解决全部汉字键入、存储、检索问题的键盘输入法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7861164B2 (en) * 2005-11-03 2010-12-28 Bin Qin Method to sequentially encode PINYIN of Chinese character with few symbols
US20090033523A1 (en) * 2007-08-03 2009-02-05 Hoon Kyu Park Language Input System and Method Based on Graphic Symbols

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101183279A (zh) * 2007-11-14 2008-05-21 秦一明 汉字输入拼块音方案
CN101598976A (zh) * 2009-06-25 2009-12-09 秦严 汉字输入拼块音新方案
CN101984390A (zh) * 2010-11-29 2011-03-09 秦一明 一种电脑/手机统一的全部标准字形简易无重码键盘输入法
CN102722262A (zh) * 2012-05-28 2012-10-10 秦一明 一种彻底解决全部汉字键入、存储、检索问题的键盘输入法

Also Published As

Publication number Publication date
CN103246363A (zh) 2013-08-14
CN103838392A (zh) 2014-06-04

Similar Documents

Publication Publication Date Title
CN105957518B (zh) 一种蒙古语大词汇量连续语音识别的方法
CN103838392B (zh) 高频词语并全部汉字快易的键盘、手写、语音输入法
CN110134954B (zh) 一种基于Attention机制的命名实体识别方法
CN110808032B (zh) 一种语音识别方法、装置、计算机设备及存储介质
CN103336803B (zh) 一种嵌名春联的计算机生成方法
CN1523518A (zh) 智能汉语文化辞典系统
CN101140485A (zh) 音形编码汉字输入法
CN102053719A (zh) 华文汉字输入法
CN1420425A (zh) 音形拼音汉字输入法
Peng et al. Encoding Text Information By Pre-trained Model For Authorship Verification.
CN103020046A (zh) 基于人名起源分类的人名音译方法
CN109473007A (zh) 一种音素结合声旁的英语自然拼读教学方法及系统
CN105511636A (zh) 全部汉字汉词简易无重码统一输入法改进
CN107256092B (zh) 汉字数字形码快速输入法
CN106325540B (zh) 一种滇东北次方言苗文的简笔输入法及其应用
CN100365554C (zh) 数字式三击形音汉字输入法
CN112328095B (zh) 基本不用数字键选字的四用音形码汉字输入法及输入平台
CN101587381B (zh) 音形汉字无重码输入法
CN101093421A (zh) 汉字的四笔层次形码及形音的数字编码输入方法
CN101118464A (zh) 易捷系列汉语输入方法
Guangguang The Tongcheng School and the social thought of the late Qing dynasty
CN1117158A (zh) 辅助汉文双拼音义码及其键盘方案
CN1455358A (zh) 华语拼音统一方案及单拼输入与智能转换翻译
CN106774987A (zh) 全部汉字汉词简易无重码统一输入法定型
CN109358758B (zh) 一种字源输入法及其键位安排方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170208

Termination date: 20180305

CF01 Termination of patent right due to non-payment of annual fee