WO2020087769A1 - 一种拼音文字输入法 - Google Patents

一种拼音文字输入法 Download PDF

Info

Publication number
WO2020087769A1
WO2020087769A1 PCT/CN2019/000203 CN2019000203W WO2020087769A1 WO 2020087769 A1 WO2020087769 A1 WO 2020087769A1 CN 2019000203 W CN2019000203 W CN 2019000203W WO 2020087769 A1 WO2020087769 A1 WO 2020087769A1
Authority
WO
WIPO (PCT)
Prior art keywords
code
vowel
consonant
words
letter
Prior art date
Application number
PCT/CN2019/000203
Other languages
English (en)
French (fr)
Inventor
宗刚
Original Assignee
宗刚
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 宗刚 filed Critical 宗刚
Priority to CN201980069356.1A priority Critical patent/CN113227946A/zh
Publication of WO2020087769A1 publication Critical patent/WO2020087769A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes

Definitions

  • the invention relates to a method for inputting characters into a computer, in particular to a Pinyin character input method.
  • Spelling text mainly Chinese characters, and its root is mainly used to express form
  • Pinyin text mainly Chinese Pinyin, English, Arabic, Hindi, etc., the roots of which are mainly used to express pronunciation;
  • the purpose of the present invention is to overcome the above-mentioned shortcomings and provide a "global interface” input method scheme for pinyin text in various countries to achieve fast input in word units;
  • Classification classify and group multiple letters or phonemes in Chinese Pinyin and foreign words
  • code elements The representative letters of the resulting categories are used as "code elements", and each type of code element represents a group of specific letters or phonemes with the same characteristics;
  • each group is a type of symbol, and its representative letter can be set;
  • the letters can be directly divided into various final groups without first dividing consonants and vowels. It can also be achieved technically.
  • the vowel consonants can be classified according to shape characteristics, for example, consonants can be divided into: pure curve type cmn , Lj, sg, pure linear v, wz, ryxk, straight mixed bht, d, fp, q, according to this standard vowel letter is also divided into: pure curvilinear o, e (ignoring the internal straight line) u, Pure straight line type i, straight curved mixed type a (whose pen is regarded as straight line); taking codes according to this classification method, the corresponding cutting limits and taking positions are also in accordance with these categories, such as p, i, c, t r e can stipulate that the code is taken at certain positions, for example, the first bit of the code p is classified into the "straight curved mixed type".
  • mapping steps map different "whole word coding skeletons" to different key positions respectively, and the order and layout structure of their respective mappings may have certain rules, which is more convenient to use, and may also require custom (Note 2) layout ;
  • the keyboard includes the key positions of the physical keyboard and the key areas of the virtual screen keyboard;
  • Input step The user clicks on the key position and key area corresponding to the "whole word coding skeleton" of the desired word, or selects and removes the heavy code through the on-screen prompt interface to realize the input of specific words.
  • the characteristics include: whether the components contain straight lines or curves, whether the blocks are complete and the orientation of the opening, whether the block has a stylus and the orientation of the stylus, the number of blocks , The number and structure of the included straight lines;
  • [C] According to other "shape" features, it can also be divided into pure curve type cn, lj, m, sg, pure linear type v, wz, ryxk, straight curved mixed type hht, d, fp, q.
  • the coding input scheme based on 26 English letters can be converted to other languages in the same way, even if the language type of the language is not 26, and the shape and pronunciation are not the same, all the methods of the present invention can be used similarly And steps.
  • Classification according to "pronunciation characteristics” refers to classification according to various phonetic and linguistic characteristics, including pronunciation parts and pronunciation methods;
  • pronunciation method characteristics classification such as: stop sound / fricative sound / stop fricative sound, nasal sound: unvoiced / voiced sound, aspirated / not aspirated;
  • the "basic vowel alphabet symbol” category that is, the 11 unit sounds in the international phonetic alphabet: they can form two-in-one and three-in-one polyphony, such as cn, ing, ui, Chinese pinyin iao, iou, uai, uei Wait;
  • 4Chinese Pinyin Vowel List is classified according to the types of components in different positions of rhyme head, rhythm belly and rhyme tail,
  • English vowels have more double vowels than Chinese pinyin finals such as "Wait, but they are similar in general, so English phonetic symbols can also be classified and arranged according to the pinyin finals of Chinese:
  • ⁇ Consonants with nasal sounds an, ian, uan, üan, en, in, uen, ün, ang, iang, uang, eng, ing, ucng, ong, iong; ⁇
  • each syllable (first) takes only one letter code for the initial consonant part, and only one letter for the vowel part. Code (then the last consonant in the closed syllable "consonant consonant" structure is temporarily ignored to take the code);
  • consonant segment may be 1 letter or multiple letter combinations (multiple consonants),
  • consonant segment may be 1 letter or multiple letter combinations (complex vowels),
  • the main (phonetic) letter is coded, which represents the main features of the overall pronunciation of the segment, and the remaining letters are pronounced auxiliary or not:
  • Unvoiced consonants can be ignored, such as r in write, s in stamp, scent and c in scissor, and gh in bright;
  • Unvoiced vowels can be ignored for code extraction, such as monosyllable schmooze ignoring letters other than the main consonant m main vowel o: as in “spl-in-ts”, ignoring the consonant segment sp, vowel segment in "I” is the main, ignoring the auxiliary tail "n":
  • each consonant in the consonant alphabet group is pronounced, such as bright b and r are not ignored;
  • a letter or a combination of letters may have multiple pronunciations, all of which are based on letters, which can realize the unified coding of letters.
  • Consonant letters can be grouped, and each specific consonant letter in each group can also be expanded to form a consonant syllable letter group with it as the "primary letter” (see below);
  • the unit vowels i, u, a, o, and e can be expanded to form double vowels, compound vowels (such as double vowels, triple vowels), and the corresponding vowel syllable alphabets;
  • English words generally contain 1-20 letters, of which 8 are the most and 5-12 are the second;
  • English words generally contain 1 to 4 syllables, of which 2 are the most, 3 are second, and again are 1 and 4;
  • English words are generally divided into single root words, double root words, and multiple root words according to the number of included roots, which can be added with affixes.
  • compound words which can be used as grammatical boundaries to segment;
  • “Jump code” can flexibly use the selected components and positions, such as;
  • the extracted symbols are combined into a "full character encoding" feature skeleton encoding, that is, the combination, recombination or cross combination of various "phonetic symbols” to form a “phonetic skeleton” of whole words or words.
  • the "embedded" layout can be used. It is generally applicable to the case where the input interface contains only two variables. It is suitable for Chinese Pinyin, Japanese and Korean, and the words in these languages are mainly double and triple syllables. ;
  • [A] Side-by-side keyboard The initials and finals keys can be presented side-by-side for the user to click, similar to the traditional Pinyin input method.
  • the computer searches the word library according to the initials and / or finals codes entered by the user, and draws and displays the results ;
  • [B] Overlapping keyboard The initials and finals keys can also be overlapped in the same area for the user to click successively, and the keystrokes are divided in order. For example, the first keystroke is the initial and the second keystroke is the final.
  • the number of initials and finals can also be adjusted to the same number, which is convenient for users; if there are 24 types, the initials keyboard is mapped as
  • the finals keyboard map is (which is divided into 8 columns as shown in the third row of the table above):
  • the layout of the virtual final keyboard can be adjusted, and the mapping is:
  • Pinyin and replacement can be displayed as corresponding Chinese characters everywhere. It shows that pinyin can be displayed everywhere on the interface, or it can be replaced as corresponding Chinese characters for users to click, and it can also pop up after clicking a certain word
  • Random that is, the code elements designed by this input method, can be arbitrarily customized according to user needs, preferences or habits (Note 5) to set the layout, including adjusting the position, group, and mutual structural relationship, it should be laid out according to a certain rule Its interface is easy to remember and use.
  • Typical examples include the "Nine Palaces Embedded QWERTY Keyboard Scheme", which disrupts the vowel and consonant letters and the relationship between sound and shape. Each initial key position is divided into nine palaces, corresponding to 9 groups (described above) Various categories of finals (figure omitted);
  • the coordinate scheme can be regarded as two mapping methods of "separation” and “integration” of vowels, and the two schemes can be operated simultaneously on the same keyboard, namely:
  • the input interface contains four variables: in turn, "consonant in the first syllable, vowel + consonant in the second or last syllable, vowel" code, and the combination of these four variables, then Combine or cross-combine, expand the layout on a two-dimensional plane to form a global interface. According to the above, it is the same as the monosyllable words, and the classification and grouping of various variables, their levels and numbers, and the layout structure can be flexibly adjusted:
  • Conscess and vowels in the first syllable are "small" two-dimensional plane coordinate systems or table areas composed of vertical and horizontal coordinates,
  • variable combination can be adjusted to become an approximate equivalent solution
  • Constants in the first and second syllables is a "small" two-dimensional plane coordinate system or table area composed of vertical and horizontal coordinates
  • Vowels in the first and second syllables is a "large" two-dimensional plane coordinate system or table area composed of vertical and horizontal coordinates
  • the "consonant” variable can be classified into five groups of ycsbp [* see the attached figure 2] or four groups of xpcs according to the above.
  • the "vowel” variables are preferably five groups with aciou as the main letter, because each group Internally, it can be subdivided into several specific components, then re-combination and cross-combination between groups may produce double codes;
  • Some phonemes that have been skipped and skipped uncoded (such as d in bed, st in rcst), and syllables (such as middle syllable, third and fourth syllable later) can also be displayed in the code class they belong to as a recode result :
  • 3- to multi-syllable words can be associated and presented in or near the area (called keypad or cell) of the corresponding 2-syllable word;
  • each vowel area can also add "+ O initials" monosyllabic vocabulary, and participate in the combination with each consonant;
  • the words contained in the word generally do not need to select multiple codes separately, but the lexicon can be searched through the computer, and the unreasonable heavy code results can be naturally filtered, such as the Chinese dan heavy code "single egg” and the yuan heavy code “round “Original member”, but by clicking on the two key positions dan and yuan in succession, only a reasonable result of "unit” can be retrieved, and other heavy codes are naturally filtered, and no manual selection is required in advance;
  • a Pinyin text input system including:
  • ——Word information database unit which is used to store the “Pinyin composition rules” of the specific letters, phonemes or single-word symbols contained in various symbols, and even a corpus and syntactic grammar rules of word and word combinations, and may also include Various types of symbols and other related information related to the combination of sound, shape, meaning, grammar and pragmatics;
  • Figure 1 of the specification is a "coordinate keyboard” scheme for monosyllable words
  • Figure 2 of the specification is the input interface scheme for the whole-character code layout of the "coordinate keyboard” with double and multi-syllable words;
  • Figures 3 and 4 of the specification are examples of "first sound followed by rhyme (segmentation by shape)" of the embedded Qian disk mapping scheme of monosyllable words, embedding the same vowel partition in the different initial regions divided first;
  • Figure 5 of the description is the alternate pinyin version of Chinese characters in Figure 4 of the description;
  • Figure 6 of the specification is an example of "first sound followed by rhyme (by phoneme)"

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

一种拼音文字输入法,提供一种各国拼音文字的"全局界面式"输入法方案,实现以词为单位的快速输入;通过下述步骤实现:(1)取码步骤:对汉语拼音、外文单词中的多种字母或音素进行分类、分组;将单词拆分、提取成各类码元之间的组合、再组合或交叉组合,形成的编码称为"整词编码骨架";(2)映射步骤:将不同的"整词编码骨架"分别映射于不同键位;(3)输入步骤:用户点击需要的字词的"整词编码骨架"所对应的键位、键区,或通过屏幕提示界面来精确选择和去除重码,实现具体字词的输入。

Description

一种拼音文字输入法 技术领域
本发明涉及一种将文字输入计算机的方法,具体涉及一种拼音文字输入法。
背景技术
当今世界上仍在广泛使用的文字,只剩下两大类:
拼形文字,主要为中文汉字、其字根主要用来表形;
拼音文字,主要有汉语拼音、英文、阿拉伯文、印地文等,其字根主要用来表音;
——本发明主要探讨后者。
现有的所有输入法,均需要依次输入拼音文字的多个编码,据此检索出结果,其输入速度慢、输入过程较累、还容易出错。
发明内容
本发明的目的是克服上述缺陷,提供一种各国拼音文字的“全局界面式”输入法方案,实现以词为单位的快速输入;
本发明的目的通过下述技术方案实现:
一.综述:
(1)取码步骤:
1-1)分类:对汉语拼音、外文单词中的多种字母或音素进行分类、分组;
可据需要任意自定义(注①)分类,尤其可按其音、形、义理特征或部分特征分类,能帮助计算机处理中减少重码、更便于记忆;
所得类别的代表字母作为“码元”,每类码元代表一组具有相同特征的具体字母或音素;
【A方式】字母的字母一般可先分为辅音(或声母)、元音(或韵母)两大类;
按上述音、形、义理特征对声母进行再分组、对韵母进行再分组,形成各种最终分组、每种分组就是一类码元,并可设置其代表字母;
【B方式】字母也可不先分辅音、元音,直接分成多种最终分组,技术上也可实现,如按形状特征对元音辅音字母共同分类,例如辅音字母可分为:纯曲线型cmn、lj、sg、纯直线型v、wz、ryxk、直曲混合型bht、d、fp、q,则按此标准元音字母也分为:纯曲线型o、e(忽略内部直线)u,纯直线型i,直曲混合型a(其须笔视为直线);按这种分类方式取码,则相应的切分界限、取码位置也依照这些类别为准,如p i c t u r e可以规定在某些位置取码,如第一位取码p归入“直曲混合型”类。
1-2),将单词拆分、提取成各类码元之间的组合、再组合或交叉组合,形成的编码称为“整词编码骨架”;
(2)映射步骤:将不同的“整词编码骨架”分别映射于不同键位,其各自映射的先后次序、布局结构可具有一定规律,更便于使用,也可需要自定义(注②)布局;
——所述键盘包括实体键盘的各键位、虚拟屏幕键盘的各键区;
(3)输入步骤:用户点击需要的字词的“整词编码骨架”所对应的键位、键区,或通过屏幕提示界面来精确选择和去除重码,实现具体字词的输入。
二.步骤
下文各章节的要点及章节间的关系流程如下:
①分类:基本码元{字母、或音标、或汉语拼音声母韵母为}
+按各种分类分组(并用代表字母代表)
→②取码:组成字母组合+进行分类
切分:界限、取码位置、编码序列
→③映射:结构
→④输入:界面
1.取码步骤:
首先按音素的音、形、义特征进行分类,可据需要只选用其中部分特征、并可组合运用,具体组合时的结构形式、成分类别、数量、取码位置可以灵活调整,不可能全部一一列举。
26个英文字母能在多数国家通用:元音字母aeoiu、辅音字母bcdfghjklmnpqrstvwxyz:可以作为基本码元代表字母;
主要可以按它们的“形状、发音、义理”三大类特征来进行分类:
(1)分类
1-1)按字母的“形状”特征来分类,所述特征有:成份含直线曲线还是混合、块是否完整以及开口朝向、块是否带有须笔以及须笔朝向、所含块的个数、所含直线的个数及结构;
【A】按“形状”特征,分成下列多国通用“基础辅音字母码元”类别:
Figure PCTCN2019000203-appb-000001
【B】上面的实施例中,“t、f,j,h”也可视为附带有须笔的四分之一圆,如
Figure PCTCN2019000203-appb-000002
,则
Figure PCTCN2019000203-appb-000003
加须笔“-”,同理
Figure PCTCN2019000203-appb-000004
,故可调整它们的键位,形成新的实施例方案:
直线开放式相交,以“x”代表{*、l、r、y、k、x)其中*表示0声母
完整圆圈带须笔,以“p”代表(p、q、g、h、b、d)其中h可归“o”类
不完整圆圈一个,以“o”代表(c、ch *、n、f、t、j)本类或以“c”代表
不完整圆圈二个,以“S”代表(s、sh *、z、zh *、m、w);zh、ch、sh中的h忽略
【C】按其他“形状”特征,还可分为纯曲线型cn、lj、m、sg、纯直线型v、wz、ryxk、直曲混合型hht、d、fp、q。
【D】多语种间的通用和转换
多数其他语种的字母,如俄语、法语、葡萄牙语等,其形状/数量/成分/种类与英文大体相似,仅细节可能不同,故可基本照搬沿用本发明的方法;
少数其他语种的字母,阿拉伯文、印地文、日文等,其形状与英文差异较大,但也可据需要任意自定义分类(注③)——尤其可按其音、形、义特征或部分特征分类,然后再与英文码元选取方案建立一一对应关系,从而得以同理使用本发明的方法和方案;
换言之,以26个英文字母为基准的编码输入方案,可以同理转换到其他语种,哪怕该语种的字母种类不是26个,形状和发音也不全相同,都可同理沿用本发明的各种方法和步骤。
1-2)按“发音特征”来分类,指按各种语音、语言学特征来分类,包括发音部位、发音方法等;
【A】对比
①“国际音标表”、“26个英文字母”、“类英文语种的字母(主要有法语、葡萄牙语、俄语、德语等)”、“其他语种的字母”(主要有汉语拼音、日语、韩语、印地语、阿拉伯语等)四者之间的关系:基本一致、局部不同;
则相同的部分可以通用或互相对应引用,在此基础上、不同的部分可以增减转换;
②英语国际音标共有48个音素,其中元音音素20个、辅音音素28个;
英语字母共有26个,其中有元音字母5个、辅音字母19个、半元音字母2个。
【B】辅音
①“英语国际音标表”/“英文字母”/“汉语拼音”中的辅音基本一一对应,对比:
Figure PCTCN2019000203-appb-000005
其中有部分英文字母对应多个相似的“双辅音”音标-如“dr”等,
而“j、q、x”没有音标(在汉语拼音中才有直接发音),
还有几个书写形式产生变形比如“/j/≈y”;
②【所以,也可以按照国际音标表来细分为的28种辅音,
Figure PCTCN2019000203-appb-000006
③或按辅音字母的发音部位、发音方法特征分类,如:塞音/擦音/塞擦音,鼻音:清音/浊音、送气/不送气;】
④对辅音字母,还可按发音部位分类:
舌尖前音zcs 双唇音bpm唇齿音f
舌尖中音dtn(边音l) 舌面音jqx【*汉语拼音独有】
舌尖后音zh、ch、sh、r 舌根音gkh
【C】元音
①其中“基础元音字母码元”类别:即国际音标中的11种单元音:它们可以组成二合、三合复元音,如cn、ing、ui、汉语拼音的iao、iou、uai、uei等;
Figure PCTCN2019000203-appb-000007
Figure PCTCN2019000203-appb-000008
②【或按:舌位的前后,舌位的高低,唇形的圆展、开合来分类:
Figure PCTCN2019000203-appb-000009
注:表中成对的代表圆唇·不圆唇元音。】
③对元音、双元音字母,按国际音标分类:
Figure PCTCN2019000203-appb-000010
——可局部调整,o类内也可增设“0韵母”,将
Figure PCTCN2019000203-appb-000011
移至a类或u类;
④汉语拼音韵母表,按韵头、韵腹、韵尾不同位置的成分种类进行分类,
如:介母位置的{无介母/有介母i/有介母u};含有/不含鼻韵母n、ng;复韵母的开头(或结尾)字母相同/不同(如ai和ao都以a开头等};
Figure PCTCN2019000203-appb-000012
Figure PCTCN2019000203-appb-000013
(表中的“-”代表该处略写的元音字母e或o)
⑤备选方案
【或按韵头“四呼”把韵母分为四类,即开口、齐齿(i)、合口(u)、撮口(ü)】。
⑥“英语国际音标表”与“英文字母”与“汉语拼音”中的辅音基本一一对应,
英语国际音标表中,英语元音比汉语拼音韵母多出一些双元音如“
Figure PCTCN2019000203-appb-000014
”等,但大体相近,所以,也可将英语音标按汉语拼音韵母表来分类布局:
可按数量分为单韵母、复韵母、鼻韵母
{单元音韵母:i、u、ü,a、ia、ua,o、uo,e、ê、ie、üe,(s)i,(sh-)i,er}
{复元音韵母:ai、uai,ei、uei,ao、iao,ou、iou}
{带鼻音韵母:an、ian、uan、üan,en、in、uen、ün,ang、iang、uang,eng、ing、ucng、ong、iong;}
按“单韵母、复韵母、鼻韵母”分行、按含有“aeiou”分列,交叉组合分类如下表:
Figure PCTCN2019000203-appb-000015
1-3)按义理特征来分类,义理是指语义、字理,即按照一切语言学特征,包括语法语用、造词训诂、联想式学习、速记法、经验规律,对各类别进行变形、组合,并可建立机器学习库;下文中所说的各“字母组”,也可根据义理特征从中提炼出其“主字母”作为代表字母进行编码。
“义理”概念的范围不易具体界定,但允许任意自定义(注④)各类别的范围、内容,即可囊括一切变化形式。
(2)选取码元
2 1)“主字母”码
英文单词中的音节有四种结构:元、辅元,元辅、辅元辅,可规定每个音节(先)只对开头辅音部分取一个字母的码、只对元音部分取一个字母的码(则闭音节“辅元辅”结构中最后的辅音被暂时忽略取码);
辅音部分(称辅音段)可能是1个字母或多个字母组合(复辅音),
元音部分(称辅音段)可能是1个字母或多个字母组合(复元音),
即一个音段(字母组合)中含多于一个字母的,对其中主(表音)字母取码,该字母代表了该音段整体发音的主要特征、其余字母发辅助音或者不发音:
不发音的辅音可忽略取码,如write中的r、stamp中的s,scent和scissor中的c,又如bright中的gh;
不发音的元音可忽略取码,如单音节词schmooze忽略主辅音m主元音o之外的字母:又如“spl-in-ts”中忽略辅音段的sp、元音段in中以“i”为主、忽略辅助尾音“n”:
——可选方案,辅音字母组中每个辅音都发音的,如bright的b、r均不忽略;
——可选方案,无辅音按0辅音或0声母取码、无元音按0元音或0韵母取码;
一种字母、字母组合可能有多种读音,皆以字母为准,可实现字母式统一编码。
反向换言之:
辅音字母可进行分组,各组中每个具体的辅音字母还可进行扩充,组成以它为“主字母”(见下文)的辅音音节字母组,;
单元音字母i、u、a、o、e可进行扩充,组成双元音、复合元音(如双合、三合复元音)、组成相应的元音音节字母组;
2-2)“音标码”:一种音标可能代表多种字母、字母组,
如:Who中的o、blue中的ue都发/u:/音,故可取同一个码/u:/;
又如:双字母组合“gh或“py″都发/f/音,。
皆以国际音标为准,可实现音标式统一编码,但发/k/音的除字母k、还可能是c等,此时可能难以辨识。
——若同一音标或音标组合有重码结果,可在提示界面中显示供用户选择;
2-3)结合使用方案甲、乙对主表音字母取码,对多于一个字母的音素按音标取码,如photo中的ph取音标/f/类的码p、o则取为主字母码,则整词编码从pobo变为fobo;
(3)切分
3 1)切分音段
英语单词所含字母一般在1~20个,其中8个的最多、5-12个在其次;
英语单词所含音节一般在1~4个,其中2个的最多、3个在其次、再次是1个、4个;
取码时可按自然音节切分,
取码时或按字母种类切分,避免了音节切分错误(尤其对非母语者),例如,以最后一个元音字母为界限切分,相连的元音或相连的辅音字母,对其主字母\或取其一\或取音标取码,一一切出的单独辅音字母或元音字母可以忽略、或者视为0元音音节\0辅音音节来取码;
如adminisrator-a|dmi|ni|sra|to|r
如tech-nology=te|ch-no|lo|gy,又如闭音节meat=mea|t,
如splints=的spli|nts、stamp sta|mp,
英语单词按所含词根的数量一般分为单根词、双根词、多根词,均可外加词缀,另外还有复合词,都可做为语法界限来分段;
如“in(前缀)-struc(词根)-tion(后缀)”分段各自提取码元;
3 2)跳跃取码
将单词内部按上述语法界限切分成多个“音段”,并在各段中跳跃提取或选取码元,称“跳跃取码”;
“跳跃取码”对选取的成分、位置可灵活运用,如;
对单词中每个音节跳取其各自的主辅音或主元音,
对汉语中每拼音中跳取其各自的主声母或主韵母
——都只使用了两个变量,其坐标式界面结构相同;
(4)编码
将提取的各码元组成“整字编码”特征骨架编码,即各类“音码元”之间的组合、再组合或交叉组合,形成整字或整词的“音骨架”。
2.映射
将上述“词内码元”组合成的各“整词编码”有序映射于二维表格界面:
(1)对于单音节词,可采用“嵌入式”布局,一般适用于输入界面中只包含两个变量的情况,适用于汉语拼音、日语韩语等,这些语种的单词以双、三音节为主;
将按上文中各种分类,分出的辅音组、元音组或元辅音组的组合映射于键盘,
将按上文中各种分类,分出的声母组、韵母组或声韵母组的组合映射于键盘
即:外文单词≈单个汉字,辅音≈声母、元音≈韵母;细分形式如下:
1-1)元/辅音(或声/韵母)分步或分开映射方式
当虚拟键盘和实体键盘键位数相同时,可映射于实体键盘;
当虚拟键盘和实体键盘键位数不同时,主要映射于屏幕键盘;
【A】并列式键盘:声母键位和韵母键位可以并列呈现供用户点击,与传统拼音输入法相似,计算机根据用户先后输入的声母或/和韵母编码检索字词库,得出并显示结果;
【B】重叠式键盘:声母键位和韵母键位也可重叠于同一区域、供用户先后点击、以击键顺次区分,如第一次击键为声母、第二次击键为韵母
——此时还可将声母键位和韵母键位数量调整设置为相同,便于用户使用;如都为24种,其中,声母键盘映射为
Figure PCTCN2019000203-appb-000016
——其中c类从o类区调整到了s类区,n也单独移位;或调整键位为:
Figure PCTCN2019000203-appb-000017
韵母键盘映射为(其中按上表第三行所示分成8列):
Figure PCTCN2019000203-appb-000018
Figure PCTCN2019000203-appb-000019
另外的方案,虚拟韵母键盘还可调整布局,映射为:
Figure PCTCN2019000203-appb-000020
——其中按照韵母的主字母类别,及其头/中/尾部的附属成分类别,进行交叉分组、对齐。
1-2)元/辅音(或声/韵母)同时一体映射方式,
将上述“码元”组合成的各“整字编码”有序映射于二维网格界面,包括:
【A】坐标式,分别以声母、韵母种类为x、y轴,坐标轴内按上文所述各种分类方法进行分组,则坐标平面内的声韵组合也相应被划分成有序有规律的分区,分区中的每个单元格都可供用户先后点击;
【B】嵌入式(或称子母式),可按上文所述各种分类方法进行二维分区并“重复嵌套”:
先对元音(及韵母)按其发音或形状特征进行分类分区,每个分区内再嵌入辅音/声母细类、或进行交叉分类分区——如“先韵后声(按形分声)”方案:
Figure PCTCN2019000203-appb-000021
先对辅音(及声母)按其发音或形状特征进行分类分区,每个分区内再嵌入元音/韵母细类、或进行交叉分类分区——如“先声后韵(按音分声)”方案,见【*附图3、附图4】,它们说明了:可灵活调整将各变量分组和分类的数量和层级及布局结构;
【*附图4】说明了:只需要列出存在的拼音,而如Fiu之类不存在的拼音不需列出;
【*附图5】演示了:可将各处的拼音、替代显示为相应汉字,它说明界面各处可显示拼音,也可替代显示为相应汉字,供用户点击,点击某字后还可弹出同音字提示窗,或放大显示该局部界面,在放大的界面区域中全部列出其同音字供用户选择;
——图中左上角区域是韵母大区内的缩写式键位分布,以大号字表示首字母、小号字表示各种后续字母分别与之组合,这样省略了重复出现的大号字。
【*附图6】是“先声后韵(按音分声)”方案,将不同的声母按发音特征细分类后、映射于不同键区,每个键区均再嵌入韵母细类:
Figure PCTCN2019000203-appb-000022
【C】随机式,即本输入法所设计的码元,可据用户需要、喜好或习惯任意自定义(注⑤)设置布局,包括调整位置、组别、相互结构关系,宜按照一定规律布局其界面,便于记忆和使用,典型例如“九宫格嵌入QWERTY键盘方案”,打乱了元辅音字母及音、形关系,每个声母大键位内部均分成九宫小区,对应9组(上文所述各种分类中)不同类别的韵母(图略);
1-3)“先后并列”混合操作方式
尤其坐标式方案,可视为为声韵母“分开”和“一体”两种映射方式,在同一键盘上同时兼按两种方案操作,即:
按前者,先后点击x\y轴内的各声、韵母细类,组成整词编码
按后者,一次点击坐标平面内的各声韵组合键,直接输入各拼音的整体编码。
另外,它还可实现全拼、声母简拼、韵母简拼、甚至双手并击多种方式混用。
(2)对于双、多音节词
一般情况下,输入界面中包含四个变量:依次对“第1音节中的辅音、元音+第2或末音节中的辅音、元音”取码,并将这四个变量的组合、再组合或交叉组合,在二维平面上展开布局,形成全局界面,可据上文,与单音节词同理,灵活调整将各变量的分类、分组,及其层级和数量、布局结构:
2-1)“布局例”之“二次嵌套”系列:
【A】“坐标式+坐标式”二次嵌套成输入界面的布局例:
“第1音节中的辅音、元音”为纵、横坐标构成的“小”二维平面坐标系或表格区域,
“第2音节中的辅音、元音”为纵、横坐标构成的“大”二维平面坐标系或表格区域,
再将“小”二维平面区域嵌入到“大”二维平面区域的每个单元格中去;
同理可调整变量组合,成为近似等效方案
“第1、2音节中的辅音”为纵、横坐标构成的“小”二维平面坐标系或表格区域,
“第1、2音节中的元音”为纵、横坐标构成的“大”二维平面坐标系或表格区域,
再将“小”二维平面区域嵌入到“大”二维平面区域的每个单元格中去;
——所述“辅音”变量可采用上文按形分类为ycsbp五组【*见附图2】、或xpcs四组,“元音”变量优选采用aciou为主字母的五组,因每组内部都又可细分成几种具体成分,则各组之间再组合、交叉组合时可能会产生重码;
【B】“坐标式+嵌入式”重复嵌套成输入界面的布局例:
将“单音节词的嵌入式键盘”,嵌入到“单音节词的坐标式键盘”中的每个单元格中,其余同理;
【C】“嵌入式+嵌入式”重复嵌套成输入界面的布局例,同理:
将“单音节词的嵌入式键盘”,嵌入到单音节词的嵌入式键盘”中的每个单元格中;
2-2)“布局例”之“二次并列”系列:
将上段“二次嵌套”系列中的“界面之间进行嵌套”,改为“界面之间并列(如左右并排)呈现”,此时用户需要在两个界面中分别击键两次,才能达到原来击键一次的结果,所击打的两个键位之间可以呈现连线,辅助识别,相关键位(可以更多)间的连线也可以由计算机计算推导得出并呈现。
2-3)“布局例”之“二次重叠”系列:
将上段“二次并列”同理,改为先后幻灯式呈现,或分层立体呈现:
2-4)输入时,点击某两个单元格,则计算机检索含有以相应的两个音节(为“音骨架”)的单词,并有可能在词库中检索到重码,此时可进一步选择,或继续输入其他单词,并同理根据句法规则、检索语料库,使用机器自动去除重码,即“以词定字”扩展到“以词组定字”、“以句定字”、“以(二维网状结构的)文章定字”,理论上击键次数越多、重码越少;
被略过、跳过未取码的部分音素(如bed中的d、rcst中的st)、音节(如中间音节、后面第三、四音节)也可作为重码结果显示在其所属码类中:
3到多音节词可关联呈现在相应类别的2音节词的区域(称键区或单元格)内或附近;
2-5)每个辅音区内的细分区域“y+、c+、s+、b+、p+”还可增设“+O韵母”类单音节词行,并参与与各元音的组合;
每个元音区内的细分区域“+a、+e、+i、+o、+u还可增设“+O声母”类单音节词列,并参与与各辅音的组合;
还可增设“O声母”类,并参与与辅音的组合,同样可分别增设y、w为声母;
2-6)灵活运用“跳跃取码”,还可对多音节词依次取各自的辅音、或依次取各自的元音,相当于简码输入;
2-7)码元分类的数量(即分类的粗细程度)可调整,优选分为5类左右,因为(5x5)x(5x5)=625,对应12000个左右的单词,每格大约20个,比较合理;如调整为2类,则(2x2)x(2x2)=16,或(3x3)x(3x3)=81更宜于在小屏幕电子设备上展现,但是选重码的效果速度要降低一些——重码内部也可再按其音形义特征分区有规律的分类和布局,并可自定义调整;)
——这种二维表格界面的先进的技术效果,除了一次点击、快速输入整个词,还体现在所见即所得,输入界面直接呈现几乎所有的单词,便于用户直接进行全局交互阅读和操作!
3)还有矩阵式等布局,即本输入法的界面任意调整码元位置、相互结构关系,并更宜按照一定规律布局,便于用户使用。
3.输入
直接点击“欲输入的汉字”的“整词编码”所对应的键位,或通过屏幕提示界面来点选、去重码,实现具体单音节词或单个汉字的输入;
在输入词时,词中所含的单字一般不需要分别选择重码,而可以通过计算机检索词库、自然过滤不合理的重码结果,如汉语dan的重码“单担蛋”、yuan的重码“圆原员”,但连续点击dan和yuan两个键位,只能检索到“单元”一个合理结果,自然过滤了其他重码、不需要人工预先一一选择;
嵌入式界面中同理,如点击“L+ao”区和“D+dong”,则与“L+ao”与“L+lai”等重码,词库中若收录了正确结果“劳动”和“老赖”、则在重码结果中再次选择,而其他结果如“牢来”被自然过滤掉;
还可设置字符信息数据库,根据用户的输入,调出与输入的码类、码位相关的音、形、义属性和扩展信息,如音调、部件信息,及字词间的关联关系等,并以连线、图、突出显示等格式动态呈现其相互关系、流程结构,从而实现了输入和输出、交互一体式的界面系统;4.输入法软件与硬件的结合
(1)一种拼音文字输入系统,包含:
——词信息库单元,用于将存储各类码元包含的具体字母、音素或单字码元组成词的“拼音组成规则”、甚至词与词组合的语料库、句法语法规则,还可包括与各类码元及组合相应的音、形、义、语法、语用方面的其他关联信息;
——界面显示及操作一体式单元,该单元连接拼音词库单元,用以显示按键及其中多个虚拟按键;当本单元被操作而输入基本码元数据后,从字符数据库单元取得匹配的结果并输出,并对关联关系以连线、突出等格式可视化显示。
附图说明
说明书附图1是单音节词的“坐标式键盘”方案;
说明书附图2是双、多音节词的“坐标式键盘”整字编码布局输入界面方案;
说明书附图3、图4是单音节词的嵌入式犍盘映射方案之“先声后韵(按形分声)”例,将在先划分的不同声母大区内,嵌入相同的韵母分区;
说明书附图5是说明书附图4的汉字替代拼音版;
说明书附图6是单音节词的嵌入式键盘映射方案之“先声后韵(按音分声韵)”例
具体实施方式
附图说明中列出的实施例,对不同类别、组别,均可用颜色、线框等格式区分标注,辅助提示用户更快查找。

Claims (5)

  1. 一种拼音文字输入法,其特征在于包括下述步骤:
    (1)取码步骤:
    对汉语拼音、外文单词中的多种字母或音素进行分类、分组,尤其可按其音、形、义理特征或部分特征分类,并可自定义;
    所得类别的代表字母作为“码元”,每类码元代表一组具有相同特征的具体字母或音素;
    【A方式】字母的字母一般可先分为辅音(或声母)、元音(或韵母)两大类;
    按上述音、形、义理特征对声母进行再分组、对韵母进行再分组,形成各种最终分组、每种分组就是一类码元,并可设置其代表字母;
    【B方式】字母也可直接分成多种最终分组,如按形状特征对元音辅音字母共同分类,例如辅音字母可分为:纯曲线型cmn、lj、sg、纯直线型v、wz、ryxk、直曲混合型bht、d、fp、q,则按此标准元音字母也分为:纯曲线型o、e、u,纯直线型i,直曲混合型a;则相应的切分界限、取码位置也依照这些类别为准;
    将单词拆分、提取成各类码元之间的组合、再组合或交叉组合,形成的编码称为“整词编码骨架”;
    (2)映射步骤:将不同的“整词编码骨架”分别映射于不同键位,其各自映射的先后次序、布局结构可具有一定规律,也可自定义布局;
    ——所述键盘包括实体键盘的各键位、虚拟屏幕键盘的各键区;
    (3)输入步骤:用户点击需要的字词的“整词编码骨架”所对应的键位、键区,或通过屏幕提示界面来精确选择和去除重码,实现具体字词的输入。
  2. 根据权利要求1所述的拼音文字输入法,其特征在于,所述取码步骤包括:
    首先按音素的音、形、义特征进行分类,可据需要只选用其中部分特征、并可组合运用,具体组合时的结构形式、成分类别、数量、取码位置可以灵活调整,不可能全部一一列举;
    英文元音字母aeoiu、辅音字母bcdfghjklmnpqrstvwxyz;可以作为基本码元代表字母;
    主要可以按它们的“形状、发音、义理”三大类特征来进行分类:
    (1)分类
    1-1)按字母的“形状”特征来分类,所述特征有:成份含直线曲线还是混合、块是否完整以及开口朝向、块是否带有须笔以及须笔朝向、所含块的个数、所含直线的个数及结构;
    【A】按“形状”特征,分成下列多国通用“基础辅音字母码元”类别:
    Figure PCTCN2019000203-appb-100001
    【B】上面的实施例可调整键位,形成新的实施例方案:
    直线开放式相交,以“x”代表{*、l、r、y、k、x)其中*表示O声母
    完整圆圈带须笔,以“p”代表(p、q、g、h、b、d)其中h可归“o”类
    不完整圆圈一个,以“o”代表(c、ch *、n、f、t、j)本类或以“c”代表
    不完整圆圈二个,以“S”代表(s、sh *、z、zh *、m、w);zh、ch、sh中的h忽略
    【C】按其他“形状”特征,还可分为纯曲线型cn、lj、m、sg、纯直线型v、wz、ryxk、 直曲混合型bht、d、fp、q;
    【D】多语种间的通用和转换
    多数其他语种的字母,如俄语、法语、葡萄牙语等,其形状/数量/成分/种类与英文大体相似,仅细节可能不同,故可基本照搬沿用本发明的方法;
    少数其他语种的字母,阿拉伯文、印地文、日文等,其形状与英文差异较大,但也可据需要任意自定义分类——尤其可按其音、形、义特征或部分特征分类,然后再与英文码元选取方案建立一一对应关系,从而得以同理使用本发明的方法和方案;
    换言之,以26个英文字母为基准的编码输入方案,可以同理转换到其他语种,哪怕该语种的字母种类不是26个,形状和发音也不全相同,都可同理沿用本发明的各种方法和步骤;
    1-2)按“发音特征”来分类,各种语音、语言学特征包括发音部位、发音方法等;
    【A】“国际音标表”、“26个英文字母”、“类英文语种的字母(主要有法语、葡萄牙语、俄语、德语等)”、“其他语种的字母”(主要有汉语拼音、日语、韩语、印地语、阿拉伯语等)四者之间的关系:基本一致、局部不同;
    则相同的部分可以通用或互相对应引用,在此基础上、不同的部分可以增减转换;
    【B】辅音
    ①“英语国际音标表”/“英文字母”/“汉语拼音”中的辅音基本一一对应,对比:
    Figure PCTCN2019000203-appb-100002
    其中有部分英文字母对应多个相似的“双辅音”音标如“dr”等,
    而“j、q、x”没有音标(在汉语拼音中才有直接发音),
    还有几个书写形式产生变形-比如“/j/≈y”;
    ②【所以,也可以按照国际音标表来细分为的28种辅音,
    ③或按辅音字母的发音部位、发音方法特征分类,如:塞音/擦音/塞擦音,鼻音;清音/浊音、送气/不送气;】
    ④对辅音字母,还可按发音部位分类:
    舌尖前音zcs 双唇音bpm唇齿音f 舌尖中音dtn(边音1) 舌面音jqx【*汉语拼音独有】 舌尖后音zh、ch、sh、r 舌根音gkh
    【C】元音
    ①其中“基础元音字母码元”类别:即国际音标中的11种单元音:它们可以组成二合、三合复元音,如en、ing、ui、汉语拼音的iao、iou、uai、uei等;
    ②【或按:舌位的前后,舌位的高低,唇形的圆展、开合来分类:
    注:表中成对的代表圆唇·不圆唇元音;】
    ③对元音、双元音字母,按国际音标分类:
    Figure PCTCN2019000203-appb-100003
    ——可局部调整,o类内也可增设“O韵母”,将
    Figure PCTCN2019000203-appb-100004
    移至a类或u类:
    ④汉语拼音韵母表,按韵头、韵腹、韵尾不同位置的成分种类进行分类,
    如:介母位置的{无介母/有介母i/有介母u};含有/不含鼻韵母n、ng;复韵母的开头(或结尾)字母相同/不同(如ai和ao都以a开头等};
    Figure PCTCN2019000203-appb-100005
    (表中的“”代表该处略写的元音字母e或o)
    ⑤备选方案
    【或按韵头“四呼”把韵母分为四类,即开口、齐齿(i)、合口(u)、撮口(ü)】;
    ⑥“英语国际音标表”与“英文字母”与“汉语拼音”中的辅音基本一一对应,
    英语国际音标表中,英语元音比汉语拼音韵母多出一些双元音如“ie”等,但大体相近,所以,也可将英语音标按汉语拼音韵母表来分类布局:
    可按数量分为单韵母、复韵母、鼻韵母
    按“单韵母、复韵母、鼻韵母”分行、按含有“aeiou”分列,交叉组合分类;
    1 3)按义理特征来分类,义理是指语义、字理,即按照一切语言学特征,包括语法语用、造词训诂、联想式学习、速记法、经验规律,对各类别进行变形、组合,并可建立机器学习库;下文中所说的各“字母组”,也可根据义理特征从中提炼出其“主字母”作为代表字母进行编码;
    “义理”概念的范围不易具体界定,但允许任意自定义各类别的范围、内容;
    (2)选取码元
    2-1)“主字母”码
    英文单词中的音节有四种结构:元、辅元,元辅、辅元辅,可规定每个音节(先)只对开头辅音部分取一个字母的码、只对元音部分取一个字母的码(则闭音节“辅元辅”结构中最后的辅音被暂时忽略取码);
    辅音部分(称辅音段)可能是1个字母或多个字母组合(复辅音),
    元音部分(称辅音段)可能是1个字母或多个字母组合(复元音),
    即一个音段(字母组合)中含多于一个字母的,对其中主(表音)字母取码,该字母代表了该音段整体发音的主要特征、其余字母发辅助音或者不发音:
    不发音的辅音可忽略取码,不发音的元音可忽略取码,
    ——可选方案,辅音字母组中每个辅音都发音的,如bright的b、r均不忽略;
    ——可选方案,无辅音按O辅音或O声母取码、无元音按O元音或O韵母取码;
    一种字母、字母组合可能有多种读音,皆以字母为准,可实现字母式统一编码;
    反向换言之;
    辅音字母可进行分组,各组中每个具体的辅音字母还可进行扩充,组成以它为“主字母”(见下文)的辅音音节字母组,;
    单元音字母i、u、a、o、e可进行扩充,组成双元音、复合元音(如双合、三合复元音)、组成相应的元音音节字母组;
    2-2)“音标码”:一种音标可能代表多种字母、字母组,
    皆以国际音标为准,可实现音标式统一编码;
    ——若同一音标或音标组合有重码结果,可在提示界面中显示供用户选择;
    2-3)结合使用方案甲、乙对主表音字母取码,对多于一个字母的音素按音标取码;
    (3)切分
    3-1)切分音段
    取码时可按自然音节切分,
    取码时或按字母种类切分,避免了音节切分错误(尤其对非母语者),例如,以最后一个元音字母为界限切分,相连的元音或相连的辅音字母,对其主字母\或取其一\或取音标取码,——切出的单独辅音字母或元音字母可以忽略、或者视为O元音音节\O辅音音节来取码;
    英语单词按所含词根的数量一般分为单根词、双根词、多根词,均可外加词缀,另外还有复合词,都可做为语法界限来分段;
    3-2)跳跃取码
    将单词内部按上述语法界限切分成多个“音段”,并在各段中跳跃提取或选取码元,称“跳跃取码”;
    “跳跃取码”对选取的成分、位置可灵活运用,如:
    对单词中每个音节跳取其各自的主辅音或主元音,
    对汉语中每拼音中跳取其各自的主声母或主韵母
    ——都只使用了两个变量,其坐标式界面结构相同;
    (5)编码
    将提取的各码元组成“整字编码”特征骨架编码,即各类“音码元”之间的组合、再组合或交叉组合,形成整字或整词的“音骨架”。
  3. 根据权利要求1所述的拼音文字输入法,其特征在于,所述映射步骤包括:
    将上述“词内码元”组合成的各“整词编码”有序映射于二维表格界面:
    (1)对于单音节词,可采用“嵌入式”布局,一般适用于输入界面中只包含两个变量的情况,适用于汉语拼音、日语韩语等,这些语种的单词以双、三音节为主:
    将按上文中各种分类,分出的辅音组、元音组或元辅音组的组合映射于键盘,
    将控上文中各种分类,分出的声母组、韵母组或声韵母组的组合映射于键盘
    即:外文单词≈单个汉字,辅音≈声母、元音≈韵母;细分形式如下:
    1 1)元/辅音(或声/韵母)分步或分开映射方式
    当虚拟键盘和实体键盘键位数相同时,可映射于实体键盘;
    当虚拟键盘和实体键盘键位数不同时,主要映射于屏幕键盘:
    【A】并列式键盘:声母键位和韵母键位可以并列呈现供用户点击,与传统拼音输入法相似,计算机根据用户先后输入的声母或/和韵母编码检索字词库,得出并显示结果;
    【B】重叠式键盘:声母键位和韵母键位也可重叠于同一区域、供用户先后点击、以击键顺次区分,如第一次击键为声母、第二次击键为韵母
    ——此时还可将声母键位和韵母键位数量调整设置为相同,便于用户使用;如都为24种,其中,声母键盘映射为
    Figure PCTCN2019000203-appb-100006
    韵母键盘映射为(其中按上表第三行所示分成8列):
    Figure PCTCN2019000203-appb-100007
    另外的方案,虚拟韵母键盘还可调整布局——其中按照韵母的主字母类别,及其头/中/尾部的附属成分类别,进行交叉分组、对齐;
    1 2)元/辅音(或声/韵母)同时一体映射方式,
    将上述“码元”组合成的各“整字编码”有序映射于二维网格界面,包括:
    【A】坐标式,分别以声母、韵母种类为x、y轴,坐标轴内按上文所述各种分类方法进行分组,则坐标平面内的声韵组合也相应被划分成有序有规律的分区,分区中的每个单元格都可供用户先后点击;
    【B】嵌入式(或称子母式),可按上文所述各种分类方法进行二维分区并“重复嵌套”:
    先对元音(及韵母)按其发音或形状特征进行分类分区,每个分区内再嵌入辅音/声母细类、或进行交叉分类分区——如“先韵后声(按形分声)”方案;
    先对辅音(及声母)按其发音或形状特征进行分类分区,每个分区内再嵌入元音/韵母细类、或进行交叉分类分区——如“先声后韵(按音分声)”方案,它们说明了:可灵活调整将各变量分组和分类的数量和层级及布局结构;
    只需要列出存在的拼音,而如Fiu之类不存在的拼音不需列出;
    可将各处的拼音、替代显示为相应汉字,它说明界面各处可显示拼音,也可替代显示为相应汉字,供用户点击,点击某字后还可弹出同音字提示窗,或放大显示该局部界面,在放大的界面区域中全部列出其同音字供用户选择;
    ——图中左上角区域是韵母大区内的缩写式键位分布,以大号字表示首字母、小号字表示各种后续字母分别与之组合,这样省略了重复出现的大号字;
    “先声后韵(按音分声)”方案,将不同的声母按发音特征细分类后、映射于不同键区,每个键区均再嵌入韵母细类:
    Figure PCTCN2019000203-appb-100008
    【C】随机式,即本输入法所设计的码元,可据用户需要、喜好或习惯任意自定义(注⑤)设置布局,包括调整位置、组别、相互结构关系,宜按照一定规律布局其界面,便于记忆和使用,典型例如“九宫格嵌入QWERTY键盘方案”,打乱了元辅音字母及音、形关系,每个声母大键位内部均分成九宫小区,对应9组(上文所述各种分类中)不同类别的韵母(图略):
    1 3)“先后+并列”混合操作方式
    尤其坐标式方案,可视为为声韵母“分开”和“一体”两种映射方式,在同一键盘上同时兼按两种方案操作,即:
    按前者,先后点击x\y轴内的各声、韵母细类,组成整词编码
    按后者,一次点击坐标平面内的各声韵组合键,直接输入各拼音的整体编码;
    另外,它还可实现全拼、声母简拼、韵母简拼、甚至双手并击多种方式混用;
    (2)对于双、多音节词
    一般情况下,输入界面中包含四个变量:依次对“第1音节中的辅音、元音+第2或末音节中的辅音、元音”取码,并将这四个变量的组合、再组合或交叉组合,在二维平面上展开布局,形成全局界面,可据上文,与单音节词同理,灵活调整将各变量的分类、分组,及其层级和数量、布局结构:
    2 1)“布局例”之“二次嵌套”系列:
    【A】“坐标式+坐标式”二次嵌套成输入界面的布局例:
    “第1音节中的辅音、元音”为纵、横坐标构成的“小”二维平面坐标系或表格区域,
    “第2音节中的辅音、元音”为纵、横坐标构成的“大”二维平面坐标系或表格区域,
    再将“小”二维平面区域嵌入到“大”二维平面区域的每个单元格中去;
    ——同理可调整变量组介,成为近似等效方案
    “第1、2音节中的辅音”为纵、横坐标构成的“小”二维平面坐标系或表格区域,
    “第1、2音节中的元音”为纵、横坐标构成的“大”二维平面坐标系或表格区域,
    再将“小”二维平面区域嵌入到“大”二维平面区域的每个单元格中去;
    ——所述“辅音”变量可采用上文按形分类为ycsbp五组【*见附图2】、或xpcs四组,“元音”变量优选采用aciou为主字母的五组,因每组内部都又可细分成几种具体成分,则各组之间再组合、交叉组合时可能会产生重码;
    【B】“坐标式+嵌入式”重复嵌套成输入界面的布局例:
    将“单音节词的嵌入式键盘”,嵌入到“单音节词的坐标式键盘”中的每个单元格中;
    【C】“嵌入式+嵌入式”重复嵌套成输入界面的布局例,同理:
    将“单音节词的嵌入式键盘”,嵌入到单音节词的嵌入式键盘”中的每个单元格中;
    2 2)“布局例”之“二次并列”系列:
    将上段“二次嵌套”系列中的“界面之间进行嵌套”,改为“界面之间并列(如左右并排)呈现”,此时用户需要在两个界面中分别击键两次,才能达到原来击键一次的结果,所击打的两个键位之间可以呈现连线,辅助识别,相关键位(可以更多)间的连线也可以由计算机计算推导得出并呈现;
    2-3)“布局例”之“二次重叠”系列:
    将上段“二次并列”同理,改为先后幻灯式呈现,或分层立体呈现;
    2-4)输入时,点击某两个单元格,则计算机检索含有以相应的两个音节(为“音骨架”)的单词,并有可能在词库中检索到重码,此时可进一步选择,或继续输入其他单词,并同理根据句法规则、检索语料库,使用机器自动去除重码,即“以词定字”扩展到“以词组定字”、“以句定字”、“以(二维网状结构的)文章定字”,理论上击键次数越多、重码越少;
    被略过、跳过未取码的部分音素、音节也可作为重码结果显示在其所属码类中;
    3到多音节词可关联呈现在相应类别的2音节词的区域(称键区或单元格)内或附近;
    2-5)每个辅音区内的细分区域“y+、c+、s+、b+、p+”还可增设“+O韵母”类单音节词行,并参与与各元音的组合;
    每个元音区内的细分区域“+a、+c、+i、+o、+u还可增设“+O声母”类单音节词列,并参与与各辅音的组合;
    还可增设“O声母”类,并参与与辅音的组合,同样可分别增设y、w为声母;
    2-6)灵活运用“跳跃取码”,还可对多音节词依次取各自的辅音、或依次取各自的元音,相当于简码输入;
    2 7)码元分类的数量(即分类的粗细程度)可调整——重码内部也可再按其音形义特征分区有规律的分类和布局,并可自定义调整;)
    3)还有矩阵式等布局,即本输入法的界面任意调整码元位置、相互结构关系,并更宜按照一定规律布局,便于用户使用。
  4. 根据权利要求1所述的拼音文字输入法,其特征在于,所述输入步骤包括:
    直接点击“欲输入的汉字”的“整词编码”所对应的键位,或通过屏幕提示界面来点选、去重码,实现具体单音节词或单个汉字的输入;
    在输入词时,词中所含的单字一般不需要分别选择重码,而可以通过计算机检索词库、自然过滤不合理的重码结果——嵌入式界面中同理;
    还可设置字符信息数据库,根据用户的输入,调出与输入的码类、码位相关的音、形、义属性和扩展信息,如音调、部件信息,及字词间的关联关系等,并以连线、图、突出显示等格式动态呈现其相互关系、流程结构,从而实现了输入和输出、交互一体式的界面系统;
  5. 根据权利要求1所述的拼音文字输入法,其特征在于,输入法软件与硬件的结合
    一种拼音文字输入系统,包含:
    词信息库单元,用于将存储各类码元包含的具体字母、音素或单字码元组成词的“拼音组成规则”、甚至词与词组合的语料库、句法语法规则,还可包括与各类码元及组合相应的音、形、义、语法、语用方面的其他关联信息;
    界面显示及操作一体式单元,该单元连接拼音词库单元,用以显示按键及其中多个虚拟按键;当本单元被操作面输入基本码元数据后,从字符数据库单元取得匹配的结果并输出,并对关联关系以连线、突出等格式可视化显示。
PCT/CN2019/000203 2018-11-03 2019-10-31 一种拼音文字输入法 WO2020087769A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201980069356.1A CN113227946A (zh) 2018-11-03 2019-10-31 一种拼音文字输入法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN201811327990 2018-11-03
CN201811327990.4 2018-11-03
CN201811654510.5 2018-12-14
CN201811654510 2018-12-14

Publications (1)

Publication Number Publication Date
WO2020087769A1 true WO2020087769A1 (zh) 2020-05-07

Family

ID=70462970

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2019/000203 WO2020087769A1 (zh) 2018-11-03 2019-10-31 一种拼音文字输入法

Country Status (2)

Country Link
CN (1) CN113227946A (zh)
WO (1) WO2020087769A1 (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101025662A (zh) * 2007-01-10 2007-08-29 余齐国 拓扑拼音输入法及键盘
CN101853084A (zh) * 2010-05-01 2010-10-06 刘学中 中文数字音笔组合输入法及键盘
CN101930289A (zh) * 2007-08-11 2010-12-29 宗刚 一种计算机汉字拼音及形码输入法
CN102122208A (zh) * 2010-08-05 2011-07-13 马向明 两键拼音输入法
US20170277276A1 (en) * 2015-06-11 2017-09-28 Lianhui ZHOU Method for Inputting Chinese Phrase

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1018205B (zh) * 1989-03-22 1992-09-09 唐懋宽 计算机中文声数编码输入技术
IL100988A (en) * 1991-02-27 1995-11-27 Digital Equipment Corp A method for compiling a cipher
CN1332402A (zh) * 2001-05-15 2002-01-23 李一新 字词句万能组合汉字输入法
CN1641550A (zh) * 2004-06-08 2005-07-20 余可立 用数码标示英语英文字母国际音标的计算机信息生成方法
CN100349102C (zh) * 2006-04-01 2007-11-14 余彦中 汉语音字输入方法
CN101556509A (zh) * 2009-02-18 2009-10-14 郭恒勋 国语音标 简化音标 英文键盘和小键盘汉字输入法
CN103246354B (zh) * 2012-02-03 2016-08-17 陈大胜 以通用语文字编码表达汉字的输入法及其键盘
CN105431809B (zh) * 2013-03-15 2018-12-18 谷歌有限责任公司 用于国际语言的虚拟键盘输入
CN103616960A (zh) * 2013-11-28 2014-03-05 王治阳 六元音字母双拼输入法
CN108614640A (zh) * 2018-04-13 2018-10-02 李森 李氏三拼汉字输入方案

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101025662A (zh) * 2007-01-10 2007-08-29 余齐国 拓扑拼音输入法及键盘
CN101930289A (zh) * 2007-08-11 2010-12-29 宗刚 一种计算机汉字拼音及形码输入法
CN101853084A (zh) * 2010-05-01 2010-10-06 刘学中 中文数字音笔组合输入法及键盘
CN102122208A (zh) * 2010-08-05 2011-07-13 马向明 两键拼音输入法
US20170277276A1 (en) * 2015-06-11 2017-09-28 Lianhui ZHOU Method for Inputting Chinese Phrase

Also Published As

Publication number Publication date
CN113227946A (zh) 2021-08-06

Similar Documents

Publication Publication Date Title
US5586198A (en) Method and apparatus for identifying characters in ideographic alphabet
D. Becker Multilingual word processing
KR19990078364A (ko) 문서처리장치 및 그의 방법
CN102165437A (zh) 信息处理装置及信息处理方法
WO2000038083A1 (en) Method and apparatus for performing full bi-directional translation between a source language and a linked alternative language
CN102165438A (zh) 信息处理装置及信息处理方法
CN111880667A (zh) 音素同声近位常用汉字码输入法
CN102053719B (zh) 华文汉字输入法
CN103616960A (zh) 六元音字母双拼输入法
WO2020087769A1 (zh) 一种拼音文字输入法
CN116627263A (zh) 一种中小学教学用多功能键盘
CN103246354A (zh) 以通用语文字编码表达汉字的输入法及其键盘
JP5751537B2 (ja) 国際対応型日本語入力システム
KR100655720B1 (ko) 키패드에서의 알파벳 입력장치 및 그 방법
KR20010083120A (ko) 키패드에서의 알파벳 입력장치 및 그 방법
CN111381687A (zh) 汉字形、音形两用码及音、形和音形码同台交叉输入汉字的平台
CN110502128B (zh) 一种汉字多元输入方法及系统
KR100625357B1 (ko) 키패드에서의 알파벳 입력장치 및 그 방법
CN106325540A (zh) 一种滇东北次方言苗文的简笔输入法及其应用
CN117111752A (zh) 新同声近位汉字码输入法
JPH0441398Y2 (zh)
CN105892704B (zh) 首笔音素字母注音输入法
CN101763170A (zh) 全息汉字输入法
CN105389017A (zh) 带声调的汉语拼音四声输入及书写印刷法
CN115047980A (zh) 一种能准确输入汉字的无拆分汉字输入集成系统

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19879064

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19879064

Country of ref document: EP

Kind code of ref document: A1