WO2020087769A1

WO2020087769A1 - 一种拼音文字输入法

Info

Publication number: WO2020087769A1
Application number: PCT/CN2019/000203
Authority: WO
Inventors: 宗刚
Original assignee: 宗刚
Priority date: 2018-11-03
Filing date: 2019-10-31
Publication date: 2020-05-07
Also published as: CN113227946A

Abstract

一种拼音文字输入法，提供一种各国拼音文字的"全局界面式"输入法方案，实现以词为单位的快速输入；通过下述步骤实现：(1)取码步骤：对汉语拼音、外文单词中的多种字母或音素进行分类、分组；将单词拆分、提取成各类码元之间的组合、再组合或交叉组合，形成的编码称为"整词编码骨架"；(2)映射步骤：将不同的"整词编码骨架"分别映射于不同键位；(3)输入步骤：用户点击需要的字词的"整词编码骨架"所对应的键位、键区，或通过屏幕提示界面来精确选择和去除重码，实现具体字词的输入。

Description

一种拼音文字输入法

技术领域

本发明涉及一种将文字输入计算机的方法，具体涉及一种拼音文字输入法。

背景技术

当今世界上仍在广泛使用的文字，只剩下两大类：

拼形文字，主要为中文汉字、其字根主要用来表形；

拼音文字，主要有汉语拼音、英文、阿拉伯文、印地文等，其字根主要用来表音；

——本发明主要探讨后者。

现有的所有输入法，均需要依次输入拼音文字的多个编码，据此检索出结果，其输入速度慢、输入过程较累、还容易出错。

发明内容

本发明的目的是克服上述缺陷，提供一种各国拼音文字的“全局界面式”输入法方案，实现以词为单位的快速输入；

本发明的目的通过下述技术方案实现：

一.综述：

(1)取码步骤：

1-1)分类：对汉语拼音、外文单词中的多种字母或音素进行分类、分组；

可据需要任意自定义(注①)分类，尤其可按其音、形、义理特征或部分特征分类，能帮助计算机处理中减少重码、更便于记忆；

所得类别的代表字母作为“码元”，每类码元代表一组具有相同特征的具体字母或音素；

【A方式】字母的字母一般可先分为辅音(或声母)、元音(或韵母)两大类；

按上述音、形、义理特征对声母进行再分组、对韵母进行再分组，形成各种最终分组、每种分组就是一类码元，并可设置其代表字母；

【B方式】字母也可不先分辅音、元音，直接分成多种最终分组，技术上也可实现，如按形状特征对元音辅音字母共同分类，例如辅音字母可分为：纯曲线型cmn、lj、sg、纯直线型v、wz、ryxk、直曲混合型bht、d、fp、q，则按此标准元音字母也分为：纯曲线型o、e(忽略内部直线)u，纯直线型i，直曲混合型a(其须笔视为直线)；按这种分类方式取码，则相应的切分界限、取码位置也依照这些类别为准，如p i c t u r e可以规定在某些位置取码，如第一位取码p归入“直曲混合型”类。

1-2)，将单词拆分、提取成各类码元之间的组合、再组合或交叉组合，形成的编码称为“整词编码骨架”；

(2)映射步骤：将不同的“整词编码骨架”分别映射于不同键位，其各自映射的先后次序、布局结构可具有一定规律，更便于使用，也可需要自定义(注②)布局；

——所述键盘包括实体键盘的各键位、虚拟屏幕键盘的各键区；

(3)输入步骤：用户点击需要的字词的“整词编码骨架”所对应的键位、键区，或通过屏幕提示界面来精确选择和去除重码，实现具体字词的输入。

二.步骤

下文各章节的要点及章节间的关系流程如下：

①分类：基本码元{字母、或音标、或汉语拼音声母韵母为}

+按各种分类分组(并用代表字母代表)

→②取码：组成字母组合+进行分类

切分：界限、取码位置、编码序列

→③映射：结构

→④输入：界面

1.取码步骤：

首先按音素的音、形、义特征进行分类，可据需要只选用其中部分特征、并可组合运用，具体组合时的结构形式、成分类别、数量、取码位置可以灵活调整，不可能全部一一列举。

26个英文字母能在多数国家通用：元音字母aeoiu、辅音字母bcdfghjklmnpqrstvwxyz：可以作为基本码元代表字母；

主要可以按它们的“形状、发音、义理”三大类特征来进行分类：

(1)分类

1-1)按字母的“形状”特征来分类，所述特征有：成份含直线曲线还是混合、块是否完整以及开口朝向、块是否带有须笔以及须笔朝向、所含块的个数、所含直线的个数及结构；

【A】按“形状”特征，分成下列多国通用“基础辅音字母码元”类别：

【B】上面的实施例中，“t、f，j，h”也可视为附带有须笔的四分之一圆，如

，则

加须笔“-”，同理

，故可调整它们的键位，形成新的实施例方案：

直线开放式相交，以“x”代表{*、l、r、y、k、x)其中*表示0声母

完整圆圈带须笔，以“p”代表(p、q、g、h、b、d)其中h可归“o”类

不完整圆圈一个，以“o”代表(c、ch ^*、n、f、t、j)本类或以“c”代表

不完整圆圈二个，以“S”代表(s、sh ^*、z、zh ^*、m、w)；zh、ch、sh中的h忽略

【C】按其他“形状”特征，还可分为纯曲线型cn、lj、m、sg、纯直线型v、wz、ryxk、直曲混合型hht、d、fp、q。

【D】多语种间的通用和转换

多数其他语种的字母，如俄语、法语、葡萄牙语等，其形状/数量/成分/种类与英文大体相似，仅细节可能不同，故可基本照搬沿用本发明的方法；

少数其他语种的字母，阿拉伯文、印地文、日文等，其形状与英文差异较大，但也可据需要任意自定义分类(注③)——尤其可按其音、形、义特征或部分特征分类，然后再与英文码元选取方案建立一一对应关系，从而得以同理使用本发明的方法和方案；

换言之，以26个英文字母为基准的编码输入方案，可以同理转换到其他语种，哪怕该语种的字母种类不是26个，形状和发音也不全相同，都可同理沿用本发明的各种方法和步骤。

1-2)按“发音特征”来分类，指按各种语音、语言学特征来分类，包括发音部位、发音方法等；

【A】对比

①“国际音标表”、“26个英文字母”、“类英文语种的字母(主要有法语、葡萄牙语、俄语、德语等)”、“其他语种的字母”(主要有汉语拼音、日语、韩语、印地语、阿拉伯语等)四者之间的关系：基本一致、局部不同；

则相同的部分可以通用或互相对应引用，在此基础上、不同的部分可以增减转换；

②英语国际音标共有48个音素，其中元音音素20个、辅音音素28个；

英语字母共有26个，其中有元音字母5个、辅音字母19个、半元音字母2个。

【B】辅音

①“英语国际音标表”/“英文字母”/“汉语拼音”中的辅音基本一一对应，对比：

其中有部分英文字母对应多个相似的“双辅音”音标-如“dr”等，

而“j、q、x”没有音标(在汉语拼音中才有直接发音)，

还有几个书写形式产生变形比如“/j/≈y”；

②【所以，也可以按照国际音标表来细分为的28种辅音，

③或按辅音字母的发音部位、发音方法特征分类，如：塞音/擦音/塞擦音，鼻音：清音/浊音、送气/不送气；】

④对辅音字母，还可按发音部位分类：

舌尖前音zcs	双唇音bpm唇齿音f
舌尖中音dtn(边音l)	舌面音jqx【*汉语拼音独有】
舌尖后音zh、ch、sh、r	舌根音gkh

【C】元音

①其中“基础元音字母码元”类别：即国际音标中的11种单元音：它们可以组成二合、三合复元音，如cn、ing、ui、汉语拼音的iao、iou、uai、uei等；

②【或按：舌位的前后，舌位的高低，唇形的圆展、开合来分类：

注：表中成对的代表圆唇·不圆唇元音。】

③对元音、双元音字母，按国际音标分类：

——可局部调整，o类内也可增设“0韵母”，将

移至a类或u类；

④汉语拼音韵母表，按韵头、韵腹、韵尾不同位置的成分种类进行分类，

如：介母位置的{无介母/有介母i/有介母u}；含有/不含鼻韵母n、ng；复韵母的开头(或结尾)字母相同/不同(如ai和ao都以a开头等}；

(表中的“-”代表该处略写的元音字母e或o)

⑤备选方案

【或按韵头“四呼”把韵母分为四类，即开口、齐齿(i)、合口(u)、撮口(ü)】。

⑥“英语国际音标表”与“英文字母”与“汉语拼音”中的辅音基本一一对应，

英语国际音标表中，英语元音比汉语拼音韵母多出一些双元音如“

”等，但大体相近，所以，也可将英语音标按汉语拼音韵母表来分类布局：

可按数量分为单韵母、复韵母、鼻韵母

{单元音韵母：i、u、ü，a、ia、ua，o、uo，e、ê、ie、üe，(s)i，(sh-)i，er}

{复元音韵母：ai、uai，ei、uei，ao、iao，ou、iou}

{带鼻音韵母：an、ian、uan、üan，en、in、uen、ün，ang、iang、uang，eng、ing、ucng、ong、iong；}

按“单韵母、复韵母、鼻韵母”分行、按含有“aeiou”分列，交叉组合分类如下表：

1-3)按义理特征来分类，义理是指语义、字理，即按照一切语言学特征，包括语法语用、造词训诂、联想式学习、速记法、经验规律，对各类别进行变形、组合，并可建立机器学习库；下文中所说的各“字母组”，也可根据义理特征从中提炼出其“主字母”作为代表字母进行编码。

“义理”概念的范围不易具体界定，但允许任意自定义(注④)各类别的范围、内容，即可囊括一切变化形式。

(2)选取码元

2 1)“主字母”码

英文单词中的音节有四种结构：元、辅元，元辅、辅元辅，可规定每个音节(先)只对开头辅音部分取一个字母的码、只对元音部分取一个字母的码(则闭音节“辅元辅”结构中最后的辅音被暂时忽略取码)；

辅音部分(称辅音段)可能是1个字母或多个字母组合(复辅音)，

元音部分(称辅音段)可能是1个字母或多个字母组合(复元音)，

即一个音段(字母组合)中含多于一个字母的，对其中主(表音)字母取码，该字母代表了该音段整体发音的主要特征、其余字母发辅助音或者不发音：

不发音的辅音可忽略取码，如write中的r、stamp中的s，scent和scissor中的c，又如bright中的gh；

不发音的元音可忽略取码，如单音节词schmooze忽略主辅音m主元音o之外的字母：又如“spl-in-ts”中忽略辅音段的sp、元音段in中以“i”为主、忽略辅助尾音“n”：

——可选方案，辅音字母组中每个辅音都发音的，如bright的b、r均不忽略；

——可选方案，无辅音按0辅音或0声母取码、无元音按0元音或0韵母取码；

一种字母、字母组合可能有多种读音，皆以字母为准，可实现字母式统一编码。

反向换言之：

辅音字母可进行分组，各组中每个具体的辅音字母还可进行扩充，组成以它为“主字母”(见下文)的辅音音节字母组，；

单元音字母i、u、a、o、e可进行扩充，组成双元音、复合元音(如双合、三合复元音)、组成相应的元音音节字母组；

2-2)“音标码”：一种音标可能代表多种字母、字母组，

如：Who中的o、blue中的ue都发/u：/音，故可取同一个码/u：/；

又如：双字母组合“gh或“py″都发/f/音，。

皆以国际音标为准，可实现音标式统一编码，但发/k/音的除字母k、还可能是c等，此时可能难以辨识。

——若同一音标或音标组合有重码结果，可在提示界面中显示供用户选择；

2-3)结合使用方案甲、乙对主表音字母取码，对多于一个字母的音素按音标取码，如photo中的ph取音标/f/类的码p、o则取为主字母码，则整词编码从pobo变为fobo；

(3)切分

3 1)切分音段

英语单词所含字母一般在1～20个，其中8个的最多、5-12个在其次；

英语单词所含音节一般在1～4个，其中2个的最多、3个在其次、再次是1个、4个；

取码时可按自然音节切分，

取码时或按字母种类切分，避免了音节切分错误(尤其对非母语者)，例如，以最后一个元音字母为界限切分，相连的元音或相连的辅音字母，对其主字母\或取其一\或取音标取码，一一切出的单独辅音字母或元音字母可以忽略、或者视为0元音音节\0辅音音节来取码；

如adminisrator-a|dmi|ni|sra|to|r

如tech-nology＝te|ch-no|lo|gy，又如闭音节meat＝mea|t，

如splints＝的spli|nts、stamp sta|mp，

英语单词按所含词根的数量一般分为单根词、双根词、多根词，均可外加词缀，另外还有复合词，都可做为语法界限来分段；

如“in(前缀)-struc(词根)-tion(后缀)”分段各自提取码元；

3 2)跳跃取码

将单词内部按上述语法界限切分成多个“音段”，并在各段中跳跃提取或选取码元，称“跳跃取码”；

“跳跃取码”对选取的成分、位置可灵活运用，如；

对单词中每个音节跳取其各自的主辅音或主元音，

对汉语中每拼音中跳取其各自的主声母或主韵母

——都只使用了两个变量，其坐标式界面结构相同；

(4)编码

将提取的各码元组成“整字编码”特征骨架编码，即各类“音码元”之间的组合、再组合或交叉组合，形成整字或整词的“音骨架”。

2.映射

将上述“词内码元”组合成的各“整词编码”有序映射于二维表格界面：

(1)对于单音节词，可采用“嵌入式”布局，一般适用于输入界面中只包含两个变量的情况，适用于汉语拼音、日语韩语等，这些语种的单词以双、三音节为主；

将按上文中各种分类，分出的辅音组、元音组或元辅音组的组合映射于键盘，

将按上文中各种分类，分出的声母组、韵母组或声韵母组的组合映射于键盘

即：外文单词≈单个汉字，辅音≈声母、元音≈韵母；细分形式如下：

1-1)元/辅音(或声/韵母)分步或分开映射方式

当虚拟键盘和实体键盘键位数相同时，可映射于实体键盘；

当虚拟键盘和实体键盘键位数不同时，主要映射于屏幕键盘；

【A】并列式键盘：声母键位和韵母键位可以并列呈现供用户点击，与传统拼音输入法相似，计算机根据用户先后输入的声母或/和韵母编码检索字词库，得出并显示结果；

【B】重叠式键盘：声母键位和韵母键位也可重叠于同一区域、供用户先后点击、以击键顺次区分，如第一次击键为声母、第二次击键为韵母

——此时还可将声母键位和韵母键位数量调整设置为相同，便于用户使用；如都为24种，其中，声母键盘映射为

——其中c类从o类区调整到了s类区，n也单独移位；或调整键位为：

韵母键盘映射为(其中按上表第三行所示分成8列)：

另外的方案，虚拟韵母键盘还可调整布局，映射为：

——其中按照韵母的主字母类别，及其头/中/尾部的附属成分类别，进行交叉分组、对齐。

1-2)元/辅音(或声/韵母)同时一体映射方式，

将上述“码元”组合成的各“整字编码”有序映射于二维网格界面，包括：

【A】坐标式，分别以声母、韵母种类为x、y轴，坐标轴内按上文所述各种分类方法进行分组，则坐标平面内的声韵组合也相应被划分成有序有规律的分区，分区中的每个单元格都可供用户先后点击；

【B】嵌入式(或称子母式)，可按上文所述各种分类方法进行二维分区并“重复嵌套”：

先对元音(及韵母)按其发音或形状特征进行分类分区，每个分区内再嵌入辅音/声母细类、或进行交叉分类分区——如“先韵后声(按形分声)”方案：

先对辅音(及声母)按其发音或形状特征进行分类分区，每个分区内再嵌入元音/韵母细类、或进行交叉分类分区——如“先声后韵(按音分声)”方案，见【*附图3、附图4】，它们说明了：可灵活调整将各变量分组和分类的数量和层级及布局结构；

【*附图4】说明了：只需要列出存在的拼音，而如Fiu之类不存在的拼音不需列出；

【*附图5】演示了：可将各处的拼音、替代显示为相应汉字，它说明界面各处可显示拼音，也可替代显示为相应汉字，供用户点击，点击某字后还可弹出同音字提示窗，或放大显示该局部界面，在放大的界面区域中全部列出其同音字供用户选择；

——图中左上角区域是韵母大区内的缩写式键位分布，以大号字表示首字母、小号字表示各种后续字母分别与之组合，这样省略了重复出现的大号字。

【*附图6】是“先声后韵(按音分声)”方案，将不同的声母按发音特征细分类后、映射于不同键区，每个键区均再嵌入韵母细类：

【C】随机式，即本输入法所设计的码元，可据用户需要、喜好或习惯任意自定义(注⑤)设置布局，包括调整位置、组别、相互结构关系，宜按照一定规律布局其界面，便于记忆和使用，典型例如“九宫格嵌入QWERTY键盘方案”，打乱了元辅音字母及音、形关系，每个声母大键位内部均分成九宫小区，对应9组(上文所述各种分类中)不同类别的韵母(图略)；

1-3)“先后并列”混合操作方式

尤其坐标式方案，可视为为声韵母“分开”和“一体”两种映射方式，在同一键盘上同时兼按两种方案操作，即：

按前者，先后点击x\y轴内的各声、韵母细类，组成整词编码

按后者，一次点击坐标平面内的各声韵组合键，直接输入各拼音的整体编码。

另外，它还可实现全拼、声母简拼、韵母简拼、甚至双手并击多种方式混用。

(2)对于双、多音节词

一般情况下，输入界面中包含四个变量：依次对“第1音节中的辅音、元音+第2或末音节中的辅音、元音”取码，并将这四个变量的组合、再组合或交叉组合，在二维平面上展开布局，形成全局界面，可据上文，与单音节词同理，灵活调整将各变量的分类、分组，及其层级和数量、布局结构：

2-1)“布局例”之“二次嵌套”系列：

【A】“坐标式+坐标式”二次嵌套成输入界面的布局例：

“第1音节中的辅音、元音”为纵、横坐标构成的“小”二维平面坐标系或表格区域，

“第2音节中的辅音、元音”为纵、横坐标构成的“大”二维平面坐标系或表格区域，

再将“小”二维平面区域嵌入到“大”二维平面区域的每个单元格中去；

同理可调整变量组合，成为近似等效方案

“第1、2音节中的辅音”为纵、横坐标构成的“小”二维平面坐标系或表格区域，

“第1、2音节中的元音”为纵、横坐标构成的“大”二维平面坐标系或表格区域，

——所述“辅音”变量可采用上文按形分类为ycsbp五组【*见附图2】、或xpcs四组，“元音”变量优选采用aciou为主字母的五组，因每组内部都又可细分成几种具体成分，则各组之间再组合、交叉组合时可能会产生重码；

【B】“坐标式+嵌入式”重复嵌套成输入界面的布局例：

将“单音节词的嵌入式键盘”，嵌入到“单音节词的坐标式键盘”中的每个单元格中，其余同理；

【C】“嵌入式+嵌入式”重复嵌套成输入界面的布局例，同理：

将“单音节词的嵌入式键盘”，嵌入到单音节词的嵌入式键盘”中的每个单元格中；

2-2)“布局例”之“二次并列”系列：

将上段“二次嵌套”系列中的“界面之间进行嵌套”，改为“界面之间并列(如左右并排)呈现”，此时用户需要在两个界面中分别击键两次，才能达到原来击键一次的结果，所击打的两个键位之间可以呈现连线，辅助识别，相关键位(可以更多)间的连线也可以由计算机计算推导得出并呈现。

2-3)“布局例”之“二次重叠”系列：

将上段“二次并列”同理，改为先后幻灯式呈现，或分层立体呈现：

2-4)输入时，点击某两个单元格，则计算机检索含有以相应的两个音节(为“音骨架”)的单词，并有可能在词库中检索到重码，此时可进一步选择，或继续输入其他单词，并同理根据句法规则、检索语料库，使用机器自动去除重码，即“以词定字”扩展到“以词组定字”、“以句定字”、“以(二维网状结构的)文章定字”，理论上击键次数越多、重码越少；

被略过、跳过未取码的部分音素(如bed中的d、rcst中的st)、音节(如中间音节、后面第三、四音节)也可作为重码结果显示在其所属码类中：

3到多音节词可关联呈现在相应类别的2音节词的区域(称键区或单元格)内或附近；

2-5)每个辅音区内的细分区域“y+、c+、s+、b+、p+”还可增设“+O韵母”类单音节词行，并参与与各元音的组合；

每个元音区内的细分区域“+a、+e、+i、+o、+u还可增设“+O声母”类单音节词列，并参与与各辅音的组合；

还可增设“O声母”类，并参与与辅音的组合，同样可分别增设y、w为声母；

2-6)灵活运用“跳跃取码”，还可对多音节词依次取各自的辅音、或依次取各自的元音，相当于简码输入；

2-7)码元分类的数量(即分类的粗细程度)可调整，优选分为5类左右，因为(5x5)x(5x5)=625，对应12000个左右的单词，每格大约20个，比较合理；如调整为2类，则(2x2)x(2x2)＝16，或(3x3)x(3x3)＝81更宜于在小屏幕电子设备上展现，但是选重码的效果速度要降低一些——重码内部也可再按其音形义特征分区有规律的分类和布局，并可自定义调整；)

——这种二维表格界面的先进的技术效果，除了一次点击、快速输入整个词，还体现在所见即所得，输入界面直接呈现几乎所有的单词，便于用户直接进行全局交互阅读和操作！

3)还有矩阵式等布局，即本输入法的界面任意调整码元位置、相互结构关系，并更宜按照一定规律布局，便于用户使用。

3.输入

直接点击“欲输入的汉字”的“整词编码”所对应的键位，或通过屏幕提示界面来点选、去重码，实现具体单音节词或单个汉字的输入；

在输入词时，词中所含的单字一般不需要分别选择重码，而可以通过计算机检索词库、自然过滤不合理的重码结果，如汉语dan的重码“单担蛋”、yuan的重码“圆原员”，但连续点击dan和yuan两个键位，只能检索到“单元”一个合理结果，自然过滤了其他重码、不需要人工预先一一选择；

嵌入式界面中同理，如点击“L+ao”区和“D+dong”，则与“L+ao”与“L+lai”等重码，词库中若收录了正确结果“劳动”和“老赖”、则在重码结果中再次选择，而其他结果如“牢来”被自然过滤掉；

还可设置字符信息数据库，根据用户的输入，调出与输入的码类、码位相关的音、形、义属性和扩展信息，如音调、部件信息，及字词间的关联关系等，并以连线、图、突出显示等格式动态呈现其相互关系、流程结构，从而实现了输入和输出、交互一体式的界面系统；4.输入法软件与硬件的结合

(1)一种拼音文字输入系统，包含：

——词信息库单元，用于将存储各类码元包含的具体字母、音素或单字码元组成词的“拼音组成规则”、甚至词与词组合的语料库、句法语法规则，还可包括与各类码元及组合相应的音、形、义、语法、语用方面的其他关联信息；

——界面显示及操作一体式单元，该单元连接拼音词库单元，用以显示按键及其中多个虚拟按键；当本单元被操作而输入基本码元数据后，从字符数据库单元取得匹配的结果并输出，并对关联关系以连线、突出等格式可视化显示。

附图说明

说明书附图1是单音节词的“坐标式键盘”方案；

说明书附图2是双、多音节词的“坐标式键盘”整字编码布局输入界面方案；

说明书附图3、图4是单音节词的嵌入式犍盘映射方案之“先声后韵(按形分声)”例，将在先划分的不同声母大区内，嵌入相同的韵母分区；

说明书附图5是说明书附图4的汉字替代拼音版；

说明书附图6是单音节词的嵌入式键盘映射方案之“先声后韵(按音分声韵)”例

具体实施方式

附图说明中列出的实施例，对不同类别、组别，均可用颜色、线框等格式区分标注，辅助提示用户更快查找。

Claims

一种拼音文字输入法，其特征在于包括下述步骤：

(1)取码步骤：

对汉语拼音、外文单词中的多种字母或音素进行分类、分组，尤其可按其音、形、义理特征或部分特征分类，并可自定义；

所得类别的代表字母作为“码元”，每类码元代表一组具有相同特征的具体字母或音素；

【A方式】字母的字母一般可先分为辅音(或声母)、元音(或韵母)两大类；

按上述音、形、义理特征对声母进行再分组、对韵母进行再分组，形成各种最终分组、每种分组就是一类码元，并可设置其代表字母；

【B方式】字母也可直接分成多种最终分组，如按形状特征对元音辅音字母共同分类，例如辅音字母可分为：纯曲线型cmn、lj、sg、纯直线型v、wz、ryxk、直曲混合型bht、d、fp、q，则按此标准元音字母也分为：纯曲线型o、e、u，纯直线型i，直曲混合型a；则相应的切分界限、取码位置也依照这些类别为准；

将单词拆分、提取成各类码元之间的组合、再组合或交叉组合，形成的编码称为“整词编码骨架”；

(2)映射步骤：将不同的“整词编码骨架”分别映射于不同键位，其各自映射的先后次序、布局结构可具有一定规律，也可自定义布局；

——所述键盘包括实体键盘的各键位、虚拟屏幕键盘的各键区；

(3)输入步骤：用户点击需要的字词的“整词编码骨架”所对应的键位、键区，或通过屏幕提示界面来精确选择和去除重码，实现具体字词的输入。
根据权利要求1所述的拼音文字输入法，其特征在于，所述取码步骤包括：

首先按音素的音、形、义特征进行分类，可据需要只选用其中部分特征、并可组合运用，具体组合时的结构形式、成分类别、数量、取码位置可以灵活调整，不可能全部一一列举；

英文元音字母aeoiu、辅音字母bcdfghjklmnpqrstvwxyz；可以作为基本码元代表字母；

主要可以按它们的“形状、发音、义理”三大类特征来进行分类：

(1)分类

1-1)按字母的“形状”特征来分类，所述特征有：成份含直线曲线还是混合、块是否完整以及开口朝向、块是否带有须笔以及须笔朝向、所含块的个数、所含直线的个数及结构；

【A】按“形状”特征，分成下列多国通用“基础辅音字母码元”类别：

【B】上面的实施例可调整键位，形成新的实施例方案：

直线开放式相交，以“x”代表{*、l、r、y、k、x)其中*表示O声母

完整圆圈带须笔，以“p”代表(p、q、g、h、b、d)其中h可归“o”类

不完整圆圈一个，以“o”代表(c、ch ^*、n、f、t、j)本类或以“c”代表

不完整圆圈二个，以“S”代表(s、sh ^*、z、zh ^*、m、w)；zh、ch、sh中的h忽略

【C】按其他“形状”特征，还可分为纯曲线型cn、lj、m、sg、纯直线型v、wz、ryxk、直曲混合型bht、d、fp、q；

【D】多语种间的通用和转换

多数其他语种的字母，如俄语、法语、葡萄牙语等，其形状/数量/成分/种类与英文大体相似，仅细节可能不同，故可基本照搬沿用本发明的方法；

少数其他语种的字母，阿拉伯文、印地文、日文等，其形状与英文差异较大，但也可据需要任意自定义分类——尤其可按其音、形、义特征或部分特征分类，然后再与英文码元选取方案建立一一对应关系，从而得以同理使用本发明的方法和方案；

换言之，以26个英文字母为基准的编码输入方案，可以同理转换到其他语种，哪怕该语种的字母种类不是26个，形状和发音也不全相同，都可同理沿用本发明的各种方法和步骤；

1-2)按“发音特征”来分类，各种语音、语言学特征包括发音部位、发音方法等；

【A】“国际音标表”、“26个英文字母”、“类英文语种的字母(主要有法语、葡萄牙语、俄语、德语等)”、“其他语种的字母”(主要有汉语拼音、日语、韩语、印地语、阿拉伯语等)四者之间的关系：基本一致、局部不同；

则相同的部分可以通用或互相对应引用，在此基础上、不同的部分可以增减转换；

【B】辅音

①“英语国际音标表”/“英文字母”/“汉语拼音”中的辅音基本一一对应，对比：

其中有部分英文字母对应多个相似的“双辅音”音标如“dr”等，

而“j、q、x”没有音标(在汉语拼音中才有直接发音)，

还有几个书写形式产生变形-比如“/j/≈y”；

②【所以，也可以按照国际音标表来细分为的28种辅音，

③或按辅音字母的发音部位、发音方法特征分类，如：塞音/擦音/塞擦音，鼻音；清音/浊音、送气/不送气；】

④对辅音字母，还可按发音部位分类：

舌尖前音zcs 双唇音bpm唇齿音f 舌尖中音dtn(边音1) 舌面音jqx【*汉语拼音独有】舌尖后音zh、ch、sh、r 舌根音gkh

【C】元音

①其中“基础元音字母码元”类别：即国际音标中的11种单元音：它们可以组成二合、三合复元音，如en、ing、ui、汉语拼音的iao、iou、uai、uei等；

②【或按：舌位的前后，舌位的高低，唇形的圆展、开合来分类：

注：表中成对的代表圆唇·不圆唇元音；】

③对元音、双元音字母，按国际音标分类：

——可局部调整，o类内也可增设“O韵母”，将
移至a类或u类：

④汉语拼音韵母表，按韵头、韵腹、韵尾不同位置的成分种类进行分类，

如：介母位置的{无介母/有介母i/有介母u}；含有/不含鼻韵母n、ng；复韵母的开头(或结尾)字母相同/不同(如ai和ao都以a开头等}；

(表中的“”代表该处略写的元音字母e或o)

⑤备选方案

【或按韵头“四呼”把韵母分为四类，即开口、齐齿(i)、合口(u)、撮口(ü)】；

⑥“英语国际音标表”与“英文字母”与“汉语拼音”中的辅音基本一一对应，

英语国际音标表中，英语元音比汉语拼音韵母多出一些双元音如“ie”等，但大体相近，所以，也可将英语音标按汉语拼音韵母表来分类布局：

可按数量分为单韵母、复韵母、鼻韵母

按“单韵母、复韵母、鼻韵母”分行、按含有“aeiou”分列，交叉组合分类；

1 3)按义理特征来分类，义理是指语义、字理，即按照一切语言学特征，包括语法语用、造词训诂、联想式学习、速记法、经验规律，对各类别进行变形、组合，并可建立机器学习库；下文中所说的各“字母组”，也可根据义理特征从中提炼出其“主字母”作为代表字母进行编码；

“义理”概念的范围不易具体界定，但允许任意自定义各类别的范围、内容；

(2)选取码元

2-1)“主字母”码

英文单词中的音节有四种结构：元、辅元，元辅、辅元辅，可规定每个音节(先)只对开头辅音部分取一个字母的码、只对元音部分取一个字母的码(则闭音节“辅元辅”结构中最后的辅音被暂时忽略取码)；

辅音部分(称辅音段)可能是1个字母或多个字母组合(复辅音)，

元音部分(称辅音段)可能是1个字母或多个字母组合(复元音)，

即一个音段(字母组合)中含多于一个字母的，对其中主(表音)字母取码，该字母代表了该音段整体发音的主要特征、其余字母发辅助音或者不发音：

不发音的辅音可忽略取码，不发音的元音可忽略取码，

——可选方案，辅音字母组中每个辅音都发音的，如bright的b、r均不忽略；

——可选方案，无辅音按O辅音或O声母取码、无元音按O元音或O韵母取码；

一种字母、字母组合可能有多种读音，皆以字母为准，可实现字母式统一编码；

反向换言之；

辅音字母可进行分组，各组中每个具体的辅音字母还可进行扩充，组成以它为“主字母”(见下文)的辅音音节字母组，；

单元音字母i、u、a、o、e可进行扩充，组成双元音、复合元音(如双合、三合复元音)、组成相应的元音音节字母组；

2-2)“音标码”：一种音标可能代表多种字母、字母组，

皆以国际音标为准，可实现音标式统一编码；

——若同一音标或音标组合有重码结果，可在提示界面中显示供用户选择；

2-3)结合使用方案甲、乙对主表音字母取码，对多于一个字母的音素按音标取码；

(3)切分

3-1)切分音段

取码时可按自然音节切分，

取码时或按字母种类切分，避免了音节切分错误(尤其对非母语者)，例如，以最后一个元音字母为界限切分，相连的元音或相连的辅音字母，对其主字母\或取其一\或取音标取码，——切出的单独辅音字母或元音字母可以忽略、或者视为O元音音节\O辅音音节来取码；

英语单词按所含词根的数量一般分为单根词、双根词、多根词，均可外加词缀，另外还有复合词，都可做为语法界限来分段；

3-2)跳跃取码

将单词内部按上述语法界限切分成多个“音段”，并在各段中跳跃提取或选取码元，称“跳跃取码”；

“跳跃取码”对选取的成分、位置可灵活运用，如：

对单词中每个音节跳取其各自的主辅音或主元音，

对汉语中每拼音中跳取其各自的主声母或主韵母

——都只使用了两个变量，其坐标式界面结构相同；

(5)编码

将提取的各码元组成“整字编码”特征骨架编码，即各类“音码元”之间的组合、再组合或交叉组合，形成整字或整词的“音骨架”。
根据权利要求1所述的拼音文字输入法，其特征在于，所述映射步骤包括：

将上述“词内码元”组合成的各“整词编码”有序映射于二维表格界面：

(1)对于单音节词，可采用“嵌入式”布局，一般适用于输入界面中只包含两个变量的情况，适用于汉语拼音、日语韩语等，这些语种的单词以双、三音节为主：

将按上文中各种分类，分出的辅音组、元音组或元辅音组的组合映射于键盘，

将控上文中各种分类，分出的声母组、韵母组或声韵母组的组合映射于键盘

即：外文单词≈单个汉字，辅音≈声母、元音≈韵母；细分形式如下：

1 1)元/辅音(或声/韵母)分步或分开映射方式

当虚拟键盘和实体键盘键位数相同时，可映射于实体键盘；

当虚拟键盘和实体键盘键位数不同时，主要映射于屏幕键盘：

【A】并列式键盘：声母键位和韵母键位可以并列呈现供用户点击，与传统拼音输入法相似，计算机根据用户先后输入的声母或/和韵母编码检索字词库，得出并显示结果；

【B】重叠式键盘：声母键位和韵母键位也可重叠于同一区域、供用户先后点击、以击键顺次区分，如第一次击键为声母、第二次击键为韵母

——此时还可将声母键位和韵母键位数量调整设置为相同，便于用户使用；如都为24种，其中，声母键盘映射为

韵母键盘映射为(其中按上表第三行所示分成8列)：

另外的方案，虚拟韵母键盘还可调整布局——其中按照韵母的主字母类别，及其头/中/尾部的附属成分类别，进行交叉分组、对齐；

1 2)元/辅音(或声/韵母)同时一体映射方式，

将上述“码元”组合成的各“整字编码”有序映射于二维网格界面，包括：

【A】坐标式，分别以声母、韵母种类为x、y轴，坐标轴内按上文所述各种分类方法进行分组，则坐标平面内的声韵组合也相应被划分成有序有规律的分区，分区中的每个单元格都可供用户先后点击；

【B】嵌入式(或称子母式)，可按上文所述各种分类方法进行二维分区并“重复嵌套”：

先对元音(及韵母)按其发音或形状特征进行分类分区，每个分区内再嵌入辅音/声母细类、或进行交叉分类分区——如“先韵后声(按形分声)”方案；

先对辅音(及声母)按其发音或形状特征进行分类分区，每个分区内再嵌入元音/韵母细类、或进行交叉分类分区——如“先声后韵(按音分声)”方案，它们说明了：可灵活调整将各变量分组和分类的数量和层级及布局结构；

只需要列出存在的拼音，而如Fiu之类不存在的拼音不需列出；

可将各处的拼音、替代显示为相应汉字，它说明界面各处可显示拼音，也可替代显示为相应汉字，供用户点击，点击某字后还可弹出同音字提示窗，或放大显示该局部界面，在放大的界面区域中全部列出其同音字供用户选择；

——图中左上角区域是韵母大区内的缩写式键位分布，以大号字表示首字母、小号字表示各种后续字母分别与之组合，这样省略了重复出现的大号字；

“先声后韵(按音分声)”方案，将不同的声母按发音特征细分类后、映射于不同键区，每个键区均再嵌入韵母细类：

【C】随机式，即本输入法所设计的码元，可据用户需要、喜好或习惯任意自定义(注⑤)设置布局，包括调整位置、组别、相互结构关系，宜按照一定规律布局其界面，便于记忆和使用，典型例如“九宫格嵌入QWERTY键盘方案”，打乱了元辅音字母及音、形关系，每个声母大键位内部均分成九宫小区，对应9组(上文所述各种分类中)不同类别的韵母(图略)：

1 3)“先后+并列”混合操作方式

尤其坐标式方案，可视为为声韵母“分开”和“一体”两种映射方式，在同一键盘上同时兼按两种方案操作，即：

按前者，先后点击x\y轴内的各声、韵母细类，组成整词编码

按后者，一次点击坐标平面内的各声韵组合键，直接输入各拼音的整体编码；

另外，它还可实现全拼、声母简拼、韵母简拼、甚至双手并击多种方式混用；

(2)对于双、多音节词

一般情况下，输入界面中包含四个变量：依次对“第1音节中的辅音、元音+第2或末音节中的辅音、元音”取码，并将这四个变量的组合、再组合或交叉组合，在二维平面上展开布局，形成全局界面，可据上文，与单音节词同理，灵活调整将各变量的分类、分组，及其层级和数量、布局结构：

2 1)“布局例”之“二次嵌套”系列：

【A】“坐标式+坐标式”二次嵌套成输入界面的布局例：

“第1音节中的辅音、元音”为纵、横坐标构成的“小”二维平面坐标系或表格区域，

“第2音节中的辅音、元音”为纵、横坐标构成的“大”二维平面坐标系或表格区域，

再将“小”二维平面区域嵌入到“大”二维平面区域的每个单元格中去；

——同理可调整变量组介，成为近似等效方案

“第1、2音节中的辅音”为纵、横坐标构成的“小”二维平面坐标系或表格区域，

“第1、2音节中的元音”为纵、横坐标构成的“大”二维平面坐标系或表格区域，

再将“小”二维平面区域嵌入到“大”二维平面区域的每个单元格中去；

——所述“辅音”变量可采用上文按形分类为ycsbp五组【*见附图2】、或xpcs四组，“元音”变量优选采用aciou为主字母的五组，因每组内部都又可细分成几种具体成分，则各组之间再组合、交叉组合时可能会产生重码；

【B】“坐标式+嵌入式”重复嵌套成输入界面的布局例：

将“单音节词的嵌入式键盘”，嵌入到“单音节词的坐标式键盘”中的每个单元格中；

【C】“嵌入式+嵌入式”重复嵌套成输入界面的布局例，同理：

将“单音节词的嵌入式键盘”，嵌入到单音节词的嵌入式键盘”中的每个单元格中；

2 2)“布局例”之“二次并列”系列：

将上段“二次嵌套”系列中的“界面之间进行嵌套”，改为“界面之间并列(如左右并排)呈现”，此时用户需要在两个界面中分别击键两次，才能达到原来击键一次的结果，所击打的两个键位之间可以呈现连线，辅助识别，相关键位(可以更多)间的连线也可以由计算机计算推导得出并呈现；

2-3)“布局例”之“二次重叠”系列：

将上段“二次并列”同理，改为先后幻灯式呈现，或分层立体呈现；

2-4)输入时，点击某两个单元格，则计算机检索含有以相应的两个音节(为“音骨架”)的单词，并有可能在词库中检索到重码，此时可进一步选择，或继续输入其他单词，并同理根据句法规则、检索语料库，使用机器自动去除重码，即“以词定字”扩展到“以词组定字”、“以句定字”、“以(二维网状结构的)文章定字”，理论上击键次数越多、重码越少；

被略过、跳过未取码的部分音素、音节也可作为重码结果显示在其所属码类中；

3到多音节词可关联呈现在相应类别的2音节词的区域(称键区或单元格)内或附近；

2-5)每个辅音区内的细分区域“y+、c+、s+、b+、p+”还可增设“+O韵母”类单音节词行，并参与与各元音的组合；

每个元音区内的细分区域“+a、+c、+i、+o、+u还可增设“+O声母”类单音节词列，并参与与各辅音的组合；

还可增设“O声母”类，并参与与辅音的组合，同样可分别增设y、w为声母；

2-6)灵活运用“跳跃取码”，还可对多音节词依次取各自的辅音、或依次取各自的元音，相当于简码输入；

2 7)码元分类的数量(即分类的粗细程度)可调整——重码内部也可再按其音形义特征分区有规律的分类和布局，并可自定义调整；)

3)还有矩阵式等布局，即本输入法的界面任意调整码元位置、相互结构关系，并更宜按照一定规律布局，便于用户使用。
根据权利要求1所述的拼音文字输入法，其特征在于，所述输入步骤包括：

直接点击“欲输入的汉字”的“整词编码”所对应的键位，或通过屏幕提示界面来点选、去重码，实现具体单音节词或单个汉字的输入；

在输入词时，词中所含的单字一般不需要分别选择重码，而可以通过计算机检索词库、自然过滤不合理的重码结果——嵌入式界面中同理；

还可设置字符信息数据库，根据用户的输入，调出与输入的码类、码位相关的音、形、义属性和扩展信息，如音调、部件信息，及字词间的关联关系等，并以连线、图、突出显示等格式动态呈现其相互关系、流程结构，从而实现了输入和输出、交互一体式的界面系统；
根据权利要求1所述的拼音文字输入法，其特征在于，输入法软件与硬件的结合

一种拼音文字输入系统，包含：

词信息库单元，用于将存储各类码元包含的具体字母、音素或单字码元组成词的“拼音组成规则”、甚至词与词组合的语料库、句法语法规则，还可包括与各类码元及组合相应的音、形、义、语法、语用方面的其他关联信息；

界面显示及操作一体式单元，该单元连接拼音词库单元，用以显示按键及其中多个虚拟按键；当本单元被操作面输入基本码元数据后，从字符数据库单元取得匹配的结果并输出，并对关联关系以连线、突出等格式可视化显示。