CN105511636A - 全部汉字汉词简易无重码统一输入法改进 - Google Patents

全部汉字汉词简易无重码统一输入法改进 Download PDF

Info

Publication number
CN105511636A
CN105511636A CN201510823609.3A CN201510823609A CN105511636A CN 105511636 A CN105511636 A CN 105511636A CN 201510823609 A CN201510823609 A CN 201510823609A CN 105511636 A CN105511636 A CN 105511636A
Authority
CN
China
Prior art keywords
word
code
block
sound
piece
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510823609.3A
Other languages
English (en)
Other versions
CN105511636B (zh
Inventor
秦一明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201510823609.3A priority Critical patent/CN105511636B/zh
Publication of CN105511636A publication Critical patent/CN105511636A/zh
Application granted granted Critical
Publication of CN105511636B publication Critical patent/CN105511636B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

全部汉字汉词简易无重码统一输入法改进,用287构块组成全部汉字,构块都有大众熟知或易记的块音;串连每一汉字/汉词的最多4/5块音,即成它的拼块音,如同德国人能依简明规则从德语词形直接读出词音,中国人也能依简明规则从汉语字形/词形直接读出字拼块音/词拼块音;默念字/词的拼块音同时便确定它的拼块码或扩码,扩码字典序是汉语全部约十万/百万标准字形/词形的简易无重码序。应用本发明,任何汉字/汉词的辞书文档检索,查得其拼块码即查得该字/词;电脑手机输入,键完/写完/读完其扩码/扩码/扩音或简码/简码/简音即键入/写入/读入该字/词;中文作为全球主要文字之一将近似英文便于大众处理。

Description

全部汉字汉词简易无重码统一输入法改进
技术领域
本发明涉及全部汉字汉词简易无重码统一输入法改进。
背景技术
汉字输入的要害在字词编码而不在现有编码基础上的“智能化”设计。至今,各种流行键盘输入法的普通用户在电脑/手机上平均输1000汉字究竟要击多少次键、费多长时间,如果把实际发生且理当计入的翻页点选、不时纠错、频繁移目都计算进去?哪里有可信统计数据?“智能化”事实上把很多选择的麻烦推给了用户。欲筑高楼,必先坚地基,基于不完善字词码的智能化输入法没有也难以突破汉字输入的整体低效瓶颈,更无法兼用于汉字检索;所谓完善的汉字码,衡量标准终归一条,即大众据之能快易统一地输入检索全部汉字汉词。申请人始终认为一种文字通用一种检索法兼输入法兼存储法(如果该种文字需要事先存储),才是计算机时代包括汉字处理在内的任何文字处理之大道;汉字编码不属于人类那些永无止境的事务,万码奔腾的结局是万码归一。
发明专利申请CN104571593A在申请人先前多个发明专利/申请基础上,将拼块码方法推向汉字处理最大限度的通用性,即通用于汉语全部字词,通用于电脑、手机及其它信息处理设备,通用于键盘、手写、语音等各种输入方式,通用于输入、存储、检索、写记等各个处理领域;基于拼块码,一旦启动国家规模的软、硬件全面配套工程,十几亿华人将从无一能快易处理所有汉字汉词的过去,很快进入初小以上全都能快易处理所有汉字汉词的未来。基本理念十分简单,就是尽量让大众能从母语任何字词形直接读音同时完成该字词的输入/检索,只不过德国人读多音节的词音而中国人读多音节的字词拼块音。对照拼音文字,汉字输入与检索麻烦的根源在于字音和字形全无同构关联,音形互转困难无比,CN104571593A提供了摆脱这一根源的路径。
CN104571593A尚未达到全面有效前提下汉语自然和逻辑精简的极致,从主干到细枝末节还有改进的余地。
汉语10万标准字形的结构复杂性、绝大多数汉字单音节字音的读不出性、5千高频汉字普通话字音的偏少且读不准性在可以预见的将来不会改变,三者共同注定了中文处理绝无可能全面达到英文处理的简单直接程度,前者多出来的第一环即汉字编码(英文无妨视为词、码同一文字),但是汉语较英语音节分明,汉词较英词反而能有更短的完善码。拼块码方法已近汉语自然并逻辑精简的极限,且使中文处理总体的方式和效率足堪比肩英文处理的方式和效率;于是道理上似已难有比汉字扩码更加简易通用但思路迥异的全汉字/汉词无重码,随之汉字处理总体上似已难有比拼块码方法更加简易有效的普适方法。
发明内容
本发明对CN104571593A作以下4类改进:
1.构块从313个调整、减少到用户更易识记、组字更合条理的287个,块顺规则1)及构块变形约定相应调变;
2.块码变通规则3)中的“末2字母为uo”改成“末字母为o”,以使块码兼容更多方言普通话块音,拼音ao相应换成au;
3.2字词和3字词的拼块音规则有合理修改;
4.语音输入时,“木、耳、十”的声调改为一声,以提高语音-字词转换准确率和用户的总体母语自然感;
此外,概念“准码/拼块码”更名为“拼块码/扩码”,对称于“扩码/简码”增加了概念“扩音/简音”,使相关表述更简洁清通,其它多处行文也有改善。
附图说明
图1是本发明的中英文两用键盘字母键位图;
图2是本发明的手机键盘数字/字母键位图。
具体实施方式
本发明的一个具体实施例由以下6个步骤组成:
1.拼音
汉语拼音恢复本来写法,再ü/ao换为y/au,声调不计;例如wu/yu/yao恢复成u/ü/iao,再ü/ao换为y/au,成u/y/iau。
2.子块
每个字中按笔顺的相继数画称为该字的一个子块;n画字恰有n(n+1)/2个子块,例如3画字“也”恰有3×4/2即6个子块“也,丨、乚”。子块既是不容歧解的数学式概念,又是选择余地极大的灵活概念(10万字形的子块总数超过1000万),这就给汉字编码排序打开了新域。
字中的几个子块称为相继的,若按笔顺其中每一个的末画与下一个的首画构成该字的上下两画,例如“解”中的“用、刀、牛”是相继的;字中无公共笔画的子块间的相交、相接关系按笔画间的同名关系理解。
3.构块、块音、块码
用来组成全部汉字的下列287子块称为构块,简称块:
构块表
0○口匚冂
1一乙乂衤
2二亠儿
3三
4四罒士巳石市市礻
5五无旡兀午
6六
7七
8八丷巴扌
9九久臼
a丅大瓦凹爪爫瓜甲
b卜必白疒
c厂厂镸寸川臣虫
d丶丁亻
e耳阝卩
f凡飞夫甫方
g亅干工弓个革宀冖冎艮
h禾
i又由尢酉也业幺用
j几己巾井斤金
k口可丂
丨了
m门毛目母皿
n乃女内禸廿
o火灬或我
p片爿皮
q犬犭且丘求曲
r人亽亼入
s丨上彳手
t土田
u亡王文
v水氺氵未隹鬼
w木
x夕习西乡心
y于
z乚厶巛子止廴自
表中字号较大的称为根,较小的称为枝。大众极易见块读音:根的拼音属于常识(个别的或需说明一次),例如“门//衤”的拼音是men/hu/na/i;枝的拼音规定是其根的拼音(从枝的构形或读音易联想其根),例如“/氵/”的拼音即其根“习/亡/水/于”的拼音xi/uang/suei/y;块的拼音称为块音,仅几个枝的块音有别常用读法但不无依傍,例如“扌”(“把”的块)的块音是ba而非ti,旨在缩短很多高频字的码长。
块/非笔形根若是字则称块字/根字。
多画块的下列3种变形之一若不变各画间关系且未成别块则视同原块:1)块(“未”除外)中某一画的伸缩或位移,如视同“土/亠”;2)块中某一“乚”换为之一,或“丿”换为“丨”,或“一”换为“乛”,如“/忄/”视同“巳//土”;3)块中某一画或其末段换为它的对偶(称“一”与“”、“丨”与“亅”、“丶”与对偶),如“冫///”视同“亠/氵//寸//”。此外个别多画块的其它稍许变形亦视同原块,如视同“丰//电”;又视同“凹/巴/了/予/或/虎”。
上述构块表是完备的:凡标准汉字皆由表中某些块组成。
块码是块音首字母,但依次有下列5种变通之一:
1)若块(“耳、十”及其枝除外)音与“○、一、二、…、九”之一的块音相同(不区别起头的sh和s、n和l及结尾的ng和n),则块码是对应阿拉伯数字(如“巴”的块码是8);
2)若块音末字母为a,则块码是a(如“下”的块码是a);
3)若块音末字母为o,则块码是o(如“火”的块码是o);
4)若块音末三字母为uei,则块码是v(如“未”的块码是v);
5)“木”的块码是w。
可见块码仅包括10个阿拉伯数字和26个汉语拼音字母,且兼容许多方言普通话块音,大众极易见块定码;设置5种变通以激增码位,目的仍在缩短大量高频字的码长。块码按国际通行顺序列在构块表左端。
4.块顺
依次遵守下列3条简明规则逐一拆下某字的相继构块直至拆尽该字的全部笔画,得到的惟一一串块称为该字的块顺:
1)块少拆得的块尽量少(但多画字拆成至少2块,其构块“口、冂、厂、”依次力避拆散;字的等型子块单独分拆,且“*”的余部自成一块除非拆得的块更少;“斗、头”拆成3块);
2)字大拆得的诸根字总画数尽量大(但相继两块依次力避相交、相接);
3)先小先拆得的块画数尽量小。
规则的但书令拆字更轻松,例如“東”的块顺是(一日)而非(一未);当字含有笔顺难判的子块,其笔顺约定使拆分维持“块少、字大、先小”3规则,但字中包含该子块的列分明方块先写左列后写右列,例如的块顺是(一彑丶),的块顺是(刀刀干)。
块顺定义是在数百遍逐字敲拆74344标准字形的过程中,与构块表逐遍互相改善推进、一并确定的。块顺概念把每个汉字转化成大众易定的惟一块串。
字的块顺含n个块,该字即称n块字,例如“東”是3块字。
5.拼块音、拼块码
字的拼块音按下表简明确定:
词的拼块音按下表简明确定:
词字数 拼块音
1 字拼块音4 -->
2 首字拼块音首次末块音+末字拼块音首末块音
3 首字拼块音首末块音+次字拼块音首末块音+末字拼块音首块音
4 首3字拼块音首块音+末字拼块音首末块音
≥5 首4及末字拼块音首块音
词中每个阿拉伯数字和汉语拼音字母看做1块根字;2/3字词若首字/首次字的拼块音少于3/2块音,则从后续字的拼块音中增取块音力求词的拼块音各字均摊地达到5块音,例如“防潮/一部分”的拼块音是erfangsueishiye/ilierbadau。
高频词的拼块音按下表简明确定:
词字数 ≤2 3 ≥4
拼块音 各字音+末字首末块音 各字音 首3及末字音
这里一字的字音特指该字被看做根时赋有的块音,例如高频词“防潮/一部分”的拼块音是fangcausueiye/ibufen。高频词的拼块音无非其拼音的简单伸缩。
全部汉字汉词在万难通晓的单音节字音以外,从此赋有大众能直接读定的多音节码音即拼块音。
由字/词的拼块音将其中每一块音换为同块码,即成它的拼块码(因此字和高频词的拼块码长≤4,词的拼块码长≤5,这样定码长有算术与实践理据)。例如,由“个/一部分”的拼块音gerensu/ilierbadau(作为词)或ibufen(作为高频词)将其中每一块音换为同块码,即成“个/一部分”的拼块码grs/1le8d或1bf。于是任何汉字汉词按方言普通话默念其拼块音便可输入/检索其拼块码,一如任何常用汉词按方言普通话默念其拼音便可输入其简拼。
设依次按降频、CJK字符集、扩展A集、B集、…、各字块数、各块画数、各画笔形、各字结构排列的若干字的拼块码都是s1s2s3s4,规定第t字的扩码是s1s2s3s4后缀t-1个0;又设若干字的拼块码都是s1s2s3同时n个字的拼块码都是s1s2s30,规定前者第1字的扩码是s1s2s3,第t字的扩码是s1s2s3后缀n+t-1个0(t≥2);再设若干字的拼块码都是s1s2同时m个字的拼块码都是s1s20且n个字的拼块码都是s1s200,规定前者第1字的扩码是s1s2,第t字的扩码是s1s2后缀m+n+t-1个0(t≥2);如此继续直至不同字形赋有不同扩码(74344字形至少有60000不同拼块码,即形与码大体是一对一的,所以拼块码后缀0生成扩码可行)。同样处理,不同词形/高频词形也必有不同扩码。字/词的拼块音后缀同样多个lin即成它的扩音。由此,每一扩码、扩音以及稍后定义的简码、简音必对应惟一字形/词形,这些对应交付机器去记识,输入时也只需确定字/词的拼块码或拼块音。
在全部汉字汉词中,其扩码/扩音不同于拼块码/拼块音的大都罕用,而罕用字词的码长/音长几不影响绝大多数用户的中文输入效率:普通人平均读写40万字次难遇1次任意指定的非常用字,仅遇646次非常用字。
汉语字词的拼块音可比方德语词形,拼块码可视为拼块音缩写,扩码与简码/扩音与简音不过是拼块码/拼块音的简单伸缩。
以下例解供初习字/词的拼块码参照,用户适量练习后自能见/想字词立即出码:
【例:“午”,默念upiegan同时输入/检索5pg;
“亅”,默念gou同时输入/检索g;
“貔”,默念piequanpiebi同时输入/检索pqpb】
【例:“增收”,默念tubarizeuen同时输入/检索t8rzu;
“第二次世界大战”,默念zuererniaubu同时输入/检索z22nb】
【例:“增收”,默念zensouzeuen同时输入zszu;
“第二次世界大战”,默念diercizan同时输入d2cz】
下面给出按拼块码字典序排列的1)CJK字符集及其扩展A、B、C集74344字形表6部计660字形;2)2010年度媒体25546高频词语表u部计346词形【拼块码相同的按扩码字典序排列;附注了数字t/n的字词其扩码是拼块码后缀t个0且扩音是拼块音后缀t个lin/有n级简码(即拼块码的前n块码)和简音(即拼块音的前n块音),例如“生1/1”指“生”的扩码是610且扩音是niuilin/有1级简码6和简音niu、“外经贸1”指“外经贸”的扩码是ujm0且扩音是uaijinmaulin、“网站/2”指“网站”有2级简码uz和简音uangzan】供参验,其中拼块码附注*者不同于CN104571593A版本:
1 网/2 u01 31 万物1/3 u565 61 玩法/3 uavz
2 万一 u11 32 外务/3 u5ul 62 问答/3 uazk
3 玩意儿1 u12 33 挽留/2 u6bt 63 完败/3 ub0u
4 外衣/3 u121 34 外流/3 u6vc 64 ub5
5 文艺/3 u171 35 莞/2 u75 65 晚报/3 ub8i
6 万亿/3 u1d1 36 晚期/3 u77y 66 完毕/3 ubbs
7 文艺复兴/3 u1fx 37 外企/3 u7rz 67 腕表 ubf1
8 文艺工作者/3 u1gz 38 u82 68 外表1/3 ubf1
9 文艺界 u1j 39 网吧/2 u8k8 69 温饱 ubl4
10 u1l 40 u8x 70 外包1/3 ubl4
11 玩意 u1lx 41 u9d 71 外部/2 uble
12 王/2 u1t 42 挽救/2 u9qu 72 外边 ublz
13 u1z 43 u9u 73 外币/3 ubpj
14 文/2 u21 44 玩耍/3 ua2n 74 完备/3 ubut
15 u2g 45 温差/3 ua8g 75 文博会 uov*
16 玩儿/3 u2pz 46 外挂 ua8t 76 文本/3 ubw1
17 望而却步/3 u2qb 47 文化大革命 uaam 77 文笔 ubzm
18 u2z 48 文雅/3 uaav 78 稳步/3 ubzp*
19 完善/2 u38k 49 文化/2 uad7 79 外出/3 uc30
20 外事 u41g 50 文化馆1 uag 80 外层/3 uc4z
21 万事/1 u41g 51 玩家/3 uagq 81 晚餐/3 ucbg
22 往事2/3 u41g 52 文案 uagw 82 完成/2 uccd
23 碗/2 u4e 53 文化节 uaj 83 蚊虫1/3 uccd
24 王室 u4gt 54 文化界1 uaj 84 王储 ucdb
25 温室1/3 u4gt 55 文化教育 uajy 85 外传 ucdd
26 文史/3 u4k1 56 文化课 uak 86 外侧/3 ucdg*
27 问世/3 u4nz 57 外加/3 ualk 87 温床 ucdw
28 万无一失/3 u514 58 文化人 uar 88 王朝/3 ucsy
29 文武/3 u52d 59 网卡 uasb 89 ucu
30 文物/2 u565 60 外卡1/3 uasb 90 往常/3 ucxj
91 豌豆/3 ud1d 121 完工/3 uga1 151 弯腰/3 uiyn
92 忘掉/3 ud8s 122 王冠/3 uggc 152 往届/3 uj4i
93 晚点 udbo 123 文稿/3 ughk 153 外交/3 uj61
94 网点1/3 udbo 124 外观/3 ugi2 154 婉拒 uj80
95 温度/3 uddi 125 外管局 ugj 155 问卷/3 uj8e
96 网店 uddk 126 文革/3 ugns 156 完结/3 uj9k
97 问道 uddz 127 网格/3 ugwk 157 顽疾/3 ujba13 -->
98 弯道1 uddz 128 王后 uhck 158 文件/2 ujd6
99 王道2 uddz 129 往后1/3 uhck 159 稳健 ujda
100 稳定/2 udgr 130 问候/3 uhda 160 忘记/3 ujdj
101 温度计 udj 131 温和/3 uhhk 161 文静/3 ujfg
102 问鼎/3 udmz 132 外号 uhkk* 162 外交官 ujg
103 外地人 udr 133 问号1/3 uhkk* 163 旺季/3 ujhz
104 外电 udrz 134 完婚 uhnr 164 外经贸1 ujm
105 外地/3 udti 135 问好 uhnz 165 晚间/3 ujmr
106 文档/3 udw3 136 完好1/3 uhnz 166 问及/3 ujna
107 稳定性 udx 137 吻合/3 uhrk 167 外景/3 ujrx
108 外方/3 uf2l 138 外行/3 uhsd 168 文教 ujsu
109 万分/3 uf8d 139 外环/3 uhug 169 外教1/3 ujsu
110 往返/2 ufcz 140 稳/2 uhx 170 外界/3 ujt2
111 王府/3 ufdc 141 玩忽职守/3 uhzs 171 问津/3 ujv2
112 文风/3 ufj1 142 外用/3 ui02 172 文集 ujvw
113 晚饭/3 ufli 143 网页/3 ui1r 173 文具 ujy8
114 王妃/3 ufnj 144 网瘾/3 uibx 174 玩具1/3 ujy8
115 UFO ufo 145 蜿蜒/3 uica 175 外籍/3 ujzr
116 稳固 ug0k 146 晚宴/3 uign 176 外壳/3 uk4j
117 顽固1 ug0k 147 外延 uipa 177 uk5
118 网购/3 ug0z 148 网银/3 uipg 178 外科/2 ukhs
119 完/2 ug5 149 汪洋/2 uivs 179 文科1/3 ukhs
120 外公/3 ug8z 150 网游/3 uivz 180 外来/2 ul1w
181 往来1/3 ul1w 211 万能/3 unzb 241 晚清/3 uqvy
182 玩乐/3 ulbx 212 王国 uo0d 242 温情/3 uqxy
183 文联/3 ulea 213 万国1 uo0d 243 网签/3 uqz1
184 弯路 ulkk 214 外国2/3 uo0d 244 往日/3 ur01
185 问路1/3 ulkk 215 网罗/3 uo4x 245 晚/2 ur2
186 外立面 ulm 216 网络/2 uo9k 246 宛如/3 urnk
187 紊乱/3 ulqz 217 网络化1 uoa 247 文人 urpa
188 文理 ulut 218 稳妥/3 uoan 248 外人1/3 urpa
189 纹理1/3 ulut 219 网络版 uob 249 uru
190 完了/3 ulzg 220 玩偶/3 uodn 250 温润/3 urvu
191 外力 ulzp 221 网络游戏/3 uoix 251 温柔/3 uryw
192 外面/3 um12 222 忘我/3 uopd 252 网商 us6k
193 网民/3 um47 223 外国人 uor 253 外商1/3 us6k
194 完美/3 um8a 224 网络文学/3 uoux 254 外甥 us6l
195 文明办1 umb 225 外国语 uoy 255 USB usb14 -->
196 外贸/3 umbr 226 U盘/3 upzm* 256 旺盛/3 uscm
197 ume 227 顽皮/3 upci 257 外伤/3 usdl
198 文秘/3 umhb 228 文凭/3 updj 258 网上银行/3 usih
199 问/2 umk 229 旺铺/2 uppf 259 外孙女 usn
200 外貌/3 ump2 230 王牌/3 upps 260 网上/2 uss2
201 玩命 umre 231 外婆 uovn* 261 晚上1/3 uss2
202 文明/3 umry 232 歪曲 uq0n 262 usu
203 外卖/3 umta 233 弯曲1/3 uq0n 263 外省/3 usxz
204 网名 umxk 234 网球场 uqc 264 文书/3 uszd
205 闻名1/3 umxk 235 顽强/3 uqgc 265 外孙 uszx
206 晚年 unps 236 万千/3 uqps 266 外套/3 utac
207 往年1/3 unps 237 完全/2 uqru 267 文体/2 utd1
208 温暖/2 unri 238 忘却 uqte 268 网帖/3 utjk
209 玩弄/3 unu7 239 外墙/3 uqtk 269 问题/1 utrr
210 万能险 unx 240 网球/3 uquq 270 文坛 uttz
271 网坛1/3 uttz 301 温馨/3 ux4r 331 外债 uzdr
272 外逃/3 utxz 302 外线/3 ux9d 332 稳住/3 uzdu
273 温网/3 uu01 303 文学家 uxa 333 问责/3 uzfr
274 万万/3 uu1l 304 外/2 uxb 334 文字/3 uzgz
275 外文/3 uu21 305 问询 uxdr 335 网站/2 uzlk
276 玩/2 uu5 306 闻讯 uxds 336 文章/3 uzls
277 稳稳/3 uuhx 307 文学/3 uxdz 337 外长/3 uzpa
278 嗡嗡/3 uukx 308 往昔/3 uxnr 338 稳重 uzpt
279 问问/3 uumk 309 旺销 uxpy 339 万众/3 uzrr
280 uun 310 外销1/3 uxpy 340 完整/3 uzsz
281 温婉 uune 311 外星人 uxr 341 王者 uztb
282 往往/3 uusu 312 文献/3 uxsq 342 网址/3 uztz
283 uuu 313 万幸/3 uxtg 343 完整性 uzx
284 玩玩 uuu5 314 外泄/3 uxvz 344 问责制1 uzz
285 uux 315 外相/3 uxwm 345 蚊子 uzzs
286 挽回 uv0k 316 外向型1 uxx 346 王子1/3 uzzs
287 外围/3 uv0l 317 惋惜/3 uxxr
288 万岁/3 uv3x 318 玩笑/3 uxza
289 网队/3 uver 319 外运/3 uy2z
290 uvg 320 外援/2 uy8i
291 温水 uvga 321 外语/3 uydk
292 完税/3 uvh2 322 uye 15 -->
293 玩味/3 uvkv 323 望远镜 uyj
294 uvm 324 文员/3 uykr
295 晚会/2 uvrz 325 文娱/3 uyna
296 uvu 326 外遇/3 uyrz
297 外汇/3 uvv0 327 外在/3 uz1t
298 外向 uxpk* 328 问政 uz1u
299 外需 ux12 329 外资/3 uz2r
300 外形/3 ux1p 330 婉转/3 uz7d
6-1.电脑/手机汉字汉词键盘输入
中英文两用键盘由通用键盘经如下增补获得:按图1将26个汉语拼音字母块码abc…yz依次标注在26个英语字母键QWE…NM的右下角,10个阿拉伯数字块码123…90在键盘原位,默认状态为高频汉词输入。
手机指安装了数字键、字母键和视屏的任何手持电子设备,手机键盘按图2将10个阿拉伯数字块码123…90和26个汉语拼音字母块码abc…yz标注到18个键上,默认状态为高频汉词输入。
在中英文两用键盘上顺序单击某字词/高频词的扩码对应各键位及空格键,电脑视屏仅显示该字词/高频词(“显示某”指“在编辑位置显示某并进入下一输入”,下同)。例如,顺序单击“蜼/容易”的扩码cv0/r1r5对应的键c键v键0空格键/键r键1键r键5空格键,视屏仅显示“蜼/容易”;
在手机键盘上顺序单击或双击某字词/高频词的扩码对应各键位及*键(规定仅当输入块码i~z时双击对应键位),手机视屏仅显示该字词/高频词。例如,顺序单击键c双击键v单击键0单击键*/双击键r单击键1双击键r单击键5单击键*,视屏仅显示“蜼/容易”;
任何字/词的拼块码后缀多少0成其扩码让机器去记识,用户只消顺序键完所欲字/词的拼块码必要时接续键0直到该字/词在视屏出现(下简称“屏现”)。例如,顺序键完“蜼”的拼块码cv再键1个0,“蜼”才屏现。
至于简码键入方式,用户完全免记哪些字/词有哪级简码,他只消顺序键击所欲字/词的拼块码至该字/词屏现。例如,顺序键击“容易”的拼块码r1r5至r1,“容易”已屏现。
本键盘输入法的选字/选词键次绝对为0,兼容众多方言普通话音故适量练习后纠错键次几乎为0,总体输入效率极高。
6-2.PDA(个人数字助理)汉字汉词手写输入
在PDA中预置码感应模块、码识别模块、码-字词转换模块、字词显示模块。
在码感应区用手指或触笔顺序写完某字词/高频词的扩码并给结束信号(可以是延时停顿、单击感应区、或其它预定操作),码识别器接受该码,码-字词转换器检出赋有该码的惟一字词/高频词,视屏仅显示该字词/高频词。例如,在码感应区用手指或触笔顺序写完“蜼/容易”的扩码cv0/r1r5并给结束信号,码识别器接受该码,码-字词转换器检出赋有该码的惟一字词/高频词即“蜼/容易”,视屏仅显示“蜼/容易”;
任何字/词的拼块码后缀多少0成其扩码让机器去记识,用户只消顺序写完所欲字/词的拼块码必要时接续写0直到该字/词屏现。例如,顺序写完“蜼”的拼块码cv再写1个0,“蜼”才屏现。
至于简码写入方式,用户完全免记哪些字/词有哪级简码,他只消顺序书写所欲字/词的拼块码至该字/词屏现。例如,顺序书写“容易”的拼块码r1r5至r1,“容易”已屏现。
本手写输入法的码-字词转换准确率极高,因为块码只有012…9abc…z这36个,数字0与字母o之别,写成前者竖扁后者横扁即可;在感应区手写字词码时,只消保持各块码顺序,容许大小不一甚至位置重叠,用户无需将注意力集中在感应区,PDA的尺寸可以很小。总体效率,写字词码较写字词快易无算。
6-3.车载导航设备汉字汉词语音输入
在车载导航设备中预置音感应模块、音-码转换模块、码识别模块、码-字词转换模块、字词显示模块。
在音感应区顺序读完某字词/高频词的扩音并给结束信号(可以是延时停顿、或其它预定操作),音-码转换器将该扩音转换成对应扩码,码识别器接受该码,码-字词转换器检出赋有该码的惟一字词/高频词,视屏仅显示该字词/高频词。例如,在音感应区顺序读完“蜼/容易”的扩音congcueilin/rongiriu并给结束信号,音-码转换器将该扩音转换成对应扩码cv0/r1r5,码识别器接受该码,码-字词转换器检出赋有该码的惟一字词/高频词即“蜼/容易”,视屏仅显示“蜼/容易”;
任何字/词的拼块音后缀多少丨in成其扩音由机器去记识,用户只需顺序读完所欲字/词的拼块音必要时接续读lin直到该字/词屏现。例如,顺序读完“蜼”的拼块音congcuei再读1个lin,“蜼”才屏现。
至于简音读入方式,用户完全免记哪些字/词有哪级简音,他只消顺序朗读所欲字/词的拼块音至该字/词屏现。例如,顺序朗读“容易”的拼块音rongiriu至rongi,“容易”已屏现。
本语音输入法的音-字词转换准确率和总体输入效率都很高,因为机器在最易出问题的音-码转换环节只需识别拼块音读中的涉码音素;对于可能惹事的几组构块如“木、目”,“耳、儿”,“十、石”的声调,则规定唯“木”的读法是mu一声,“耳”及其枝的读法是er一声,“十”及其枝的读法是shi一声。
一般人早已能读会写上万高频词,故稍经练习便能盲念其拼块音同时完成其想输(不拘键入、写入、读入),兼得其写记巩固之利。
上面严格而完备地描述了本发明的一个具体实施例,即将本发明实施于全部汉字汉词的电脑/手机键盘输入、PDA手写输入、车载导航设备语音输入。应当明白,这只是帮助理解本发明的一个例子,并不构成对本发明保护范围的限制,本发明当然能按同样方式在任何信息处理设备上键入、写入、读入任何汉字集或汉词集,只要该设备配置了步骤6-1、6-2、6-3中描述的那些键盘和内置模块。另外,为完善本发明而对键盘设置、构块表以及确定块音、块码、块顺、拼块音、拼块码的规则等可能作出的调整【譬如在把中文大规模书名录、人名录、企业名录、动植物名录、习语名句录等特殊文本当成汉词集来处理时,词的拼块音规则宜做适应性调整】均落在本发明范围内。

Claims (4)

1.全部汉字汉词简易无重码统一输入法改进,其特征是包括下列步骤:
汉语拼音恢复本来写法,再ü/ao换成y/au,声调不计;
每个字中按笔顺的相继数画称为该字的一个子块,n画字恰有n(n+1)/2个子块;字中的几个子块称为相继的,若按笔顺其中每一个的末画与下一个的首画构成该字的上下两画;字中无公共笔画的子块间的相交、相接关系按笔画间的同名关系理解;
用来组成全部汉字的下列287子块称为构块,简称块:
构块表
表中字号较大的称为根,较小的称为枝;根的拼音属于常识,枝的拼音规定是其根的拼音,块的拼音称为块音;
块/非笔形根若是字则称块字/根字;
多画块的下列3种变形之一若不变各画间关系且未成别块则视同原块:1)“未”除外的块中某一画的伸缩或位移;2)块中某一“乚”换为之一,或“丿”换为“丨”,或“一”换为“乛”;3)块中某一画或其末段换为它的对偶,这里称“一”与“丨”与“亅”、“丶”与对偶;视同“丰/冎//电”,视同“凹/巴/了/予/或/虎”;
块码是块音首字母,但依次有下列5种变通之一:1)若“耳、十”及其枝除外的块音与“〇、一、二、…、九”之一的块音在不区别起头的sh和s、n和I及结尾的ng和n这一前提下相同,则块码是对应阿拉伯数字;2)若块音末字母为a,则块码是a;3)若块音末字母为o,则块码是o;4)若块音末三字母为uei,则块码是v;5)“木”的块码是w;
依次遵守下列3条简明规则逐一拆下某字的相继构块直至拆尽该字的全部笔画,得到的惟一一串块称为该字的块顺:1)块少拆得的块尽量少,但多画字拆成至少2块,其构块“口、冂、厂、”依次力避拆散,字的型子块单独分拆,且“*”的余部自成一块除非拆得的块更少,“斗、头”拆成3块;2)字大拆得的诸根字总画数尽量大,但相继两块依次力避相交、相接;3)先小先拆得的块画数尽量小;
当字含有笔顺难判的子块,其笔顺约定使拆分维持“块少、字大、先小”3规则,但字中包含该子块的列分明方块先写左列后写右列;
字的块顺含n个块,该字即称n块字;
字的拼块音按下表简明确定:
词的拼块音按下表简明确定:
词字数 拼块音 1 字拼块音 2 首字拼块音首次末块音+末字拼块音首末块音 3 首字拼块音首末块音+次字拼块音首末块音+末字拼块音首块音 4 首3字拼块音首块音+末字拼块音首末块音 ≥5 首4及末字拼块音首块音
词中每个阿拉伯数字和汉语拼音字母看做1块根字;2/3字词若首字/首次字的拼块音少于3/2块音,则从后续字的拼块音中增取块音力求词的拼块音各字均摊地达到5块音;
高频词的拼块音按下表简明确定:
词字数 ≤2 3 ≥4 拼块音 各字音+末字首末块音 各字音 首3及末字音
这里一字的字音特指该字被看做根时赋有的块音;
由字/词的拼块音将其中每一块音换为同块码,即成该字/词的拼块码;
设依次按降频、CJK字符集、扩展A集、B集、…、各字块数、各块画数、各画笔形、各字结构排列的若干字的拼块码都是S1S2S3S4,规定第t字的扩码是S1S2S3S4后缀t-1个0;又设若干字的拼块码都是S1S2S3同时n个字的拼块码都是S1S2S30,规定前者第1字的扩码是S1S2S3,第t字的扩码是S1S2S3后缀n+t-1个0,这里t≥2;如此继续直至不同字形赋有不同扩码;同样处理,不同词形/高频词形也必有不同扩码;字/词的拼块音后缀同样多个lin即成它的扩音;
字/词的拼块码前n块码称为它的n级简码,拼块音前n块音称为它的n级简音;
任何汉字汉词的键盘输入步骤如下:
在中英文两用键盘上顺序单击某字词/高频词的扩码对应各键位及空格键,电脑视屏仅显示该字词/高频词;在手机键盘上顺序单击或双击某字词/高频词的扩码对应各键位及*键,手机视屏仅显示该字词/高频词,这里规定仅当输入块码i~z时双击对应键位;字/词的拼块码后缀多少0成其扩码让机器去记识,用户只消顺序键完所欲字/词的拼块码必要时接续键0直到该字/词屏现;
简码键入方式,用户完全免记哪些字/词有哪级简码,他只消顺序键击所欲字/词的拼块码至该字/词屏现;
任何汉字汉词的手写输入步骤如下:
在既定设备的码感应区用手指或触笔顺序写完某字词/高频词的扩码并给结束信号,码识别器接受该码,码-字词转换器检出赋有该码的惟一字词/高频词,视屏仅显示该字词/高频词;字/词的拼块码后缀多少0成其扩码让机器去记识,用户只消顺序写完所欲字/词的拼块码必要时接续写0直到该字/词屏现;
简码写入方式,用户完全免记哪些字/词有哪级简码,他只消顺序书写所欲字/词的拼块码至该字/词屏现;
任何汉字汉词的语音输入步骤如下:
在既定设备的音感应区顺序读完某字词/高频词的扩音并给结束信号,音-码转换器将该扩音转换成对应扩码,码识别器接受该码,码-字词转换器检出赋有该码的惟一字词/高频词,视屏仅显示该字词/高频词;字/词的拼块音后缀多少lin成其扩音让机器去记识,用户只消顺序读完所欲字/词的拼块音必要时接续读lin直到该字/词屏现;
简音读入方式,用户完全免记哪些字/词有哪级简音,他只消顺序朗读所欲字/词的拼块音至该字/词屏现。
2.如权利要求1所述的全部汉字汉词简易无重码统一输入法改进,其特征在于,它的键盘输入部分所称中英文两用键盘由通用键盘经如下增补获得:按图1将26个汉语拼音字母块码abc…yz依次标注在26个英语字母键QWE…NM的右下角,10个阿拉伯数字块码123…90在键盘原位,默认状态为高频汉词输入;所称手机指安装了数字键、字母键和视屏的任何手持电子设备,手机键盘按图2将10个阿拉伯数字块码123…90和26个汉语拼音字母块码abc…yz标注到18个键上,默认状态为高频汉词输入。
3.如权利要求1所述的全部汉字汉词简易无重码统一输入法改进,其特征在于,它的手写输入部分所称既定设备指预置了码感应模块、码识别模块、码-字词转换模块、字词显示模块的任何信息处理设备。
4.如权利要求1所述的全部汉字汉词简易无重码统一输入法改进,其特征在于,它的语音输入部分所称既定设备指预置了音感应模块、音-码转换模块、码识别模块、码-字词转换模块、字词显示模块的任何信息处理设备。
CN201510823609.3A 2015-11-25 2015-11-25 改进的全部汉字汉词简易无重码统一输入法 Active CN105511636B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510823609.3A CN105511636B (zh) 2015-11-25 2015-11-25 改进的全部汉字汉词简易无重码统一输入法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510823609.3A CN105511636B (zh) 2015-11-25 2015-11-25 改进的全部汉字汉词简易无重码统一输入法

Publications (2)

Publication Number Publication Date
CN105511636A true CN105511636A (zh) 2016-04-20
CN105511636B CN105511636B (zh) 2018-05-04

Family

ID=55719685

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510823609.3A Active CN105511636B (zh) 2015-11-25 2015-11-25 改进的全部汉字汉词简易无重码统一输入法

Country Status (1)

Country Link
CN (1) CN105511636B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106774987A (zh) * 2017-01-10 2017-05-31 秦明 全部汉字汉词简易无重码统一输入法定型
CN108304082A (zh) * 2018-02-27 2018-07-20 秦明 全部汉字汉词简易无重码通用输入法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI280491B (en) * 2002-05-03 2007-05-01 Easyten Technology Ltd Easyten Chinese text processing and inputting method
CN101183279A (zh) * 2007-11-14 2008-05-21 秦一明 汉字输入拼块音方案
CN103246363A (zh) * 2013-05-24 2013-08-14 秦一明 高频词语并全部汉字电脑/手机快易键盘输入法
CN104571593A (zh) * 2015-02-10 2015-04-29 秦一明 全部汉字汉词简易无重码统一输入法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI280491B (en) * 2002-05-03 2007-05-01 Easyten Technology Ltd Easyten Chinese text processing and inputting method
CN101183279A (zh) * 2007-11-14 2008-05-21 秦一明 汉字输入拼块音方案
CN103246363A (zh) * 2013-05-24 2013-08-14 秦一明 高频词语并全部汉字电脑/手机快易键盘输入法
CN104571593A (zh) * 2015-02-10 2015-04-29 秦一明 全部汉字汉词简易无重码统一输入法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106774987A (zh) * 2017-01-10 2017-05-31 秦明 全部汉字汉词简易无重码统一输入法定型
CN108304082A (zh) * 2018-02-27 2018-07-20 秦明 全部汉字汉词简易无重码通用输入法

Also Published As

Publication number Publication date
CN105511636B (zh) 2018-05-04

Similar Documents

Publication Publication Date Title
Lee et al. A history of the Korean language
CN103838392B (zh) 高频词语并全部汉字快易的键盘、手写、语音输入法
CN103336803B (zh) 一种嵌名春联的计算机生成方法
CN105511636A (zh) 全部汉字汉词简易无重码统一输入法改进
CN102053719B (zh) 华文汉字输入法
CN103020046B (zh) 基于人名起源分类的人名音译方法
CN104571593B (zh) 全部汉字汉词简易无重码统一输入法
Miller Juba Arabic as a written language
CN106774987A (zh) 全部汉字汉词简易无重码统一输入法定型
Zhao Cultural Characteristics and Literature Value of Traditional Guqin Music
CN103777771B (zh) 易捷速录系列输入方法
CN103176614A (zh) 多键共击速录
Birkenes North Frisian dialects: A quantitative investigation using a parallel corpus of translations
CN101303626A (zh) 一种拼音输入法重码多的解决方法
CN101093421A (zh) 汉字的四笔层次形码及形音的数字编码输入方法
CN100440113C (zh) 计算机汉字输入法
Van Hal Early modern views on language and languages (ca. 1450-1800)
CN112328095B (zh) 基本不用数字键选字的四用音形码汉字输入法及输入平台
CN101706685A (zh) 一种汉字输入法
CN117612553B (zh) 一种现代语音采录、分析及展示系统
US20240143089A1 (en) Digitized New Language, Input Method Therefor, and Input Tool Therefor
CN101813979B (zh) 汉字拼音文字码输入法
CN1316686A (zh) 电子计算机汉字词语码编码技术
de Lacouperie Early History of the Chinese Civilisation
Long et al. The history and current situation of the Hmong writing system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant