CN1045342C - 反映语法特征的汉语表意拼音文字输入法及键盘 - Google Patents
反映语法特征的汉语表意拼音文字输入法及键盘 Download PDFInfo
- Publication number
- CN1045342C CN1045342C CN93120482A CN93120482A CN1045342C CN 1045342 C CN1045342 C CN 1045342C CN 93120482 A CN93120482 A CN 93120482A CN 93120482 A CN93120482 A CN 93120482A CN 1045342 C CN1045342 C CN 1045342C
- Authority
- CN
- China
- Prior art keywords
- chinese
- word
- meaning
- title
- key
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Abstract
一种反映语法特征的汉语表意拼音文字输入法及键盘,是以汉语拼音方案为基础,根据汉语语法,词义和语音特点把字词分为实词和虚词,按实词加意尾、虚词定型化原则设计的表意拼音文字兼汉字编码方案。其输入使用ASCII西文键盘设定取前键、取后键、同音词键、及成语切换键。按语法词义分类的编码方法简单、合理,规律性强,重码率低,不需屏幕提示行,易学易记,不但能作为汉字编码,而且还可以作为一个独立的拼音文字,最适用于国内外汉语教学及电脑写作翻译。
Description
本发明属于计算机文字处理及其输入键盘。
近年来有关汉字编码的专利申请,如雨后春笋,名目繁多,其中有纯字形的五笔字型码,纯汉语拼音的拼音码,介于其间的有:声韵部形码、以及音形义字词兼容码、音义式汉语拼音码、词类词尾附加法全拼汉字输入方案、汉字全息码、汉语汉字的罗马字母拼写法及适用输入设备等等。以上编码,特别是各种笔形码,都是为已经熟练地掌握了汉语和经过训练的专业人员使用的,复杂的编码体系会干扰人使用电脑写作的思路。同时这些编码往往过于追求全面、速度和节约内存等原则,而把分类符号分得很复杂,随意性较多,使用者较难掌握。因此,对于会讲汉语但是识字不多的华侨。少数民族和受教育不足的人来说,还是无法使用计算机处理汉字的。使用这类汉字编码不能发挥计算机在普及汉语和扫盲中的应有作用。
本发明的目的是为会讲汉语普通话而识字不多的人提供一套以汉语拼音方案为基础、根据汉语词的发音和词意使用电脑记录汉语、书写汉字的现代汉语文字处理编码输入方法及键盘,即为国内外普及汉语教育和作家用电脑写作翻译提供一种汉语表意拼音文字写法与汉字编码一致的汉字处理软件编码,这种编码表音表意、可读可译,兼收“一语二文”之效。
本发明的理论依据是:(1)世界上语言的共性是“以音传意”,文字的共性是“为音附形”,因此一种语言中的同音词主要是同音异义词,同音近义词偶可发生,但同音同义词是罕有的;(2)语言的书写过程是从字音到字意再到字形的思维过程。因此本发明发展了如下根据汉语语法特征、按汉语词的原意分类编码的表意拼音体系。
本发明的目的是这样解决的:是以汉语拼音方案为基础,根据汉语语法、词义、语音的特点,增加表义信息成分输入字词:
1.根据汉语语法、词义、语音的特点,把汉语词汇分为实词和虚词两大类。
2.全部虚词、以及划归此组的代词、方位词、能愿动词、专用量词,按照汉语拼音方案拼写,不加表意词尾,其中近百个字采用特殊拼法,总称虚词定型化。
3.实词组中的动词、形容词、数词、以及名词的动物、植物、工具、职业和称谓、人类思想和文化创造、天然物和自然现象、整体物的部件、疾病、名称不同于原料的制品和食品、不可移动的建筑物、含义不清的名词,在其尾部分别加一个辅音字母,作为不发音的表意词尾,总称实词加意尾。
4.没有实词意义的姓氏地名用字,其拼写形式是首位字母大写,在音节后加辅音字母作编码分类。
5.成语的拼写形式是取每个汉字首位字母组成,并在该组字母前后加符号^作切换键。
6.汉语拼音方案中的非罗马元音字母ü,当与l、n拼写时,以eu代替。
7.汉语的同类的同音近义词汇按使用频率排列,使用频率高的首先显示在光标处,并发出声音信号,当操作人员认可所显示的汉字时,可继续输入;当操作人员否认所显示的汉字时,则按同音词键:前一个在光标处的同音词消失,代之以后一个同音词,如此类推找出所需的同音词。
为使用上述编码方法,专门设计了与其相适应的输入方法,该方法使用ASCII西文键盘,只是在ASCII西文键盘上设定取前键、取后键、同音词键、及成语切换键。
本发明具有以下优点和积极效果:
反映语法特征的汉语表意拼音文字输入法,既是一种可以独立用于书写汉语的拼音文字,又是一种明快的汉字编码方法。该方法是根据汉语语法、词义和语音特性,首先把汉语词汇分为实词和虚词两大类,以汉语拼音方案为基础,采取实词加意尾,虚词定型化的方案设计的。根据语法、词义划分表意类型,词汇分类简单、合理,促使汉语词的拼写与汉字一一对应,规律性强,重码率低,易学易记。在屏幕显示上不需要设置提示行,而将汉字直接显示在光标处。在虚词定型化中一个词一个拼法,不加表意词尾,部分常用词采用了特殊拼写法,不但避开了虚词中的同音词干扰,而且起到明显的语法表观指示作用。
本发明使用ASCII西文键盘输入中文,中西文兼容,可以直接显示打印反映语法特征的汉语表意拼音文字编码,也可以直接显示方块汉字。汉字显示设计中还采用了以表意词尾代替打空格断键的方法,以及汉字单字和词组中取前或取后专用键,从而为组词造字提供了灵活性。
本发明符合汉语特性和书写思维过程,规律性强,易学易记,凡是学会汉语拼音后,会讲普通话的人,再经过半天至一天有关汉语语法知识的学习,便可上机使用本发明的编码方法,以方块汉字写作。
本发明除了16类表意词尾和近百个特殊拼写字之外,没有需要特殊记忆的内容,而记忆上百个特定常用单词要比记忆几个特殊编码(例如边角码)更容易。
本发明最适用于国内扫除文盲、外国人学习汉语,外籍华人和作家使用电脑边想边写的书写过程等思维理解比打字速度更重要的场合。
本发明以如下简洁的口诀总结汉语表意拼音文字编码和输入方式:
《汉语表意拼音文字编码口诀》实词加意尾,虚词定型化,全表形音义,反映汉语法;词义从常识,意变意尾变,有尾自切换,无尾打空键;多音词连写,多义词兼收,多义尾空设,成语连打头。单音难定意,取自双音词,取前或取后,另设专用键。形音义兼备,读写思路通,生僻罕用字,笔形码兼容。
以下是本发明的详细描述:
本发明使用ASCII西文键盘,以汉语拼音方案为基础,并根据汉语语法、词义和语音特点,把汉语类分为实词和虚词两大类。汉语词类依照1980年商务版《新华词典》所附现代汉语语法简表,分为12个词类。其中实词包括:动词、形容词、名词、数词、量词和代词。虚词包括:介语、连词、副词、助词、叹词和象声词。本发明是把虚词加上实词中的代词,和名词中的方位词、动词中的能愿动词、量词中的专用量词划归虚词类,按照汉语拼音方案拼写形式输入字词,其中近百个字选择与汉语拼音方案最接近而且有标调规律者定型化,如表1所示。
实词中除去划归为虚词类的那一部分外,按词义划分为动词、形容词、数词、以及名词中的动物、植物、工具、职业和称谓、人类思想和文化创造、自然物和自然现象、整体物的部件、疾病、名称不同于原料的制品和食品、不可移动的建筑物、含义不清的名词,在这14类实词字尾分别加一个辅音字母,作为不发音的表意词尾。如表2所示。
多义词按词义分别收入相应类别中,例如:“种”字作“稻种”讲写作daop zhongp,作“种稻”讲写作“zhongs daop”。
同一类别的同音近义词汇按使用频率和四声顺序排列,使用频率高的首先显示在光标处,并发出声音信号,当操作者认可时,可
表1“虚词定型化”的特殊拼法部分
al 啊a- 阿ay 爱baa 把bey 被bii 比biy 彼by 必ciy 此cy 次dann 但daw 到day 代d (词)的’d(句)的de 得dey 得def的(人)*dungt 冬duy 对dy 第*feyx 废fy 非 | gay 该gey 给go 各gow 够hay 还ho 何how 后jeo 久jew 就jiaw 较*jiaws 叫ji 及jii 即*jil 几jiy 极jy 既*kian 千ko 可ly 里lo 了*nais 埋*maes 买*mays 卖 | mei 没meiy 每mou 某muo 莫naa 哪nae 乃nay 奈ney 内puo 颇qiy 其quo 却-r 儿*shiik 史*shiis 使show 受*shows 授shy 事*shyk 事*shyt 世sy 似taa 她tay 太*tuys 退 | ty 替*van 万veyk 味vi- 微vu- 无vy 未way 外wook 武xeu 许xyang 向*xyangs 像yaw 要*yee 亿yeo 有yeu 与yew 又yiou 犹yiu 尤you 由yii 已yiy 以*yiys 依yuo 越 | zay 在zh 之*zhef 者zhiy 只zho 着zhy 至*zhyk 志*zhys 治zy 自*zyf自(己)-z 子 |
注:其中标*不是虚词。
表2实词加意尾表
继续输入,否认时,按下同音健,则前一个在光标处消失,代之以后一个同音词,直至找到所需的汉字。例如:“压”和“押”为同音近义词“yas”,压在前,押在后;“大意”和“大义“为同音近义词“dayik”,大意在前,大义在后。
NO | 表意分类 | 意尾 | 举例 |
1 | 动 词 | s | 打das骂mas看kans想xiangs飞feis听tings |
2 | 形容词 | x | 多duox新xinx小xiaox香xiangx贵guix早zaox |
3 | 数 词 | 1 | 两liangl五wul廿nianl几jil半banl第八dybal |
4 | 动 物 | b | 人renb禽qinb兽shoub鱼yub虫chongb龙longb |
5 | 植 物 | p | 树shup草caop菜caip玫瑰meiguip葡萄putaop |
6 | 工 具 | h | 车cheh船chuanh刀daoh碗wanh机jih镜jingh |
7 | 职业和职称 | f | 儿erf母muf官guanf主席zhuxif奶奶nainaif |
8 | 人类思想和文化创造 | k | 文wenk书shuk歌gek科学kexuek思想sixiangk |
9 | 天然物和自然现象 | t | 天tiant水shuit风fengt雷leit光guangt色set |
10 | 整体物的部件 | q | 脚jiaoq肉rouq血xueq顶dingq架jiaq座zuoq |
11 | 疾病 | j | 疾jij炎yanj瘤liuj节jiej疤baj感冒ganmaoj |
12 | 名称不同于原料的制品和食品 | c | 饭fanc饼bingc汤tangc布buc绸chouc纸zhic |
13 | 不可移动的建筑物 | th | 楼louth馆guanth塔tath街jieth坝bath桥qiaoth |
14 | 含义不清的名词 | v | 辛xinv亥haiv戊wuv戌xuv巽xunv艮genv涌泉yongquanv百汇baihuiv |
15 | 姓氏地名译名 | ft | 赵Zhaoft魏Weift蒋Jiangft韩Hauft邯郸Handanft兖Yanft |
16 | 成 语 | 众志成城^zzcc^胸有成竹^xycz^天无绝人之路^twjrzl^沆瀣一气^hxyq^有志者事竟成^yzzsjc ^ |
当词汇分割有疑义时,按独立意义的单音字分割输入。例如:“红烧鸭”可写成“bongx shaos yab”;“教研组”可写成“jiaos yans zuf”;“拖拉机”可写成“tuos las jih”因为“红烧”、“教研”、“拖拉”是可分可合的。
汉语拼音方案中的非罗马元音字母ü,当与j、q、x、y拼写时,一律按原方案用U代ü;例如:居ju,区qu,虚xu,迂yu,军jun,缺que,宣xuaan,元yuan;当与l、n拼写时,一律以eu代替。例如:女neu,吕leu,虐neue,略leue。
对于系统词库内没有的词汇,可以用删接组合的方式输入。例如:“礼乐”一词的键入方式是“lijiek”礼节,按取前键;“yinyuek”音乐,按取后键,“取前”或“取后”是本方案中设置的两个专用键。这样便为汉字编码时选词和使用编码时组词提供了更多的灵活性。
对于成语本方案采用标号^作为功能控制键以开通和切断其输入。在书写时写成表意拼音,而在使用电脑时,只要键入成语中每个汉字拼音的第一个字母。例如:“众志成城”为^zhongf zhikchengs chength^,只要键入^zzee^即可。这样便解决了成语中一些罕用汉字词义不确的问题,如“沆瀣一气”,只键入^hxyq^,而不必追究其中“沆瀣”二字的词义。
本发明一律把表意词尾作为音节切换键。只有当前一个字的表意词尾和后一个字的首位字母会形成汉语拼音的组合形式时,才用打空键的方法切换音节:例如一些以元音开头的汉字,以g开头而前一个字以n结尾的汉字,和以h开头面前一个字以z、c、s结尾的汉字。这又可节约系统词库内存。
本发明的实施例:使用本发明“汉语表意拼音文字”译写的三篇短文,即汉字输入编码。
1) guot gek:qis lais !bu yuan zuos nulif d renf
国 歌:起 来! 不 愿 做 奴隶 的 人men!baa women d xuerouq zhus chengs women xinxd们! 把 我们 的 血肉 筑 成 我们 新的changx chenght!zhonghuat minzuf daw lo zuy weixianx d长 城! 中 华 民族 到 了 最 危 险 的shihout meiyge renf bey pos zho fas chus zuy how d hous时候, 每 个 人 被 迫 着 发 出 最 后 的 吼shengt qis lais!qis lais!qis lais!women van zhongf声 起 来! 起 来! 起 来! 我们 万 众yil xing maos zho direnf d paoh huot qianjins!qianjins!一 心 冒 着 敌人 的 炮 火, 前 进! 前 进!qianjins!jins!前 进! 进!
2)maof zedong sik cik:yongs meip
毛 泽东 诗 词:咏 梅
fengt yut songs chunt guis,feis xuet yings chunt daw,
风 雨 送 春 归, 飞 雪 迎 春 到,yii shy xuans yat bail zhang bingt,yiou yeo huap zhiq已 是 悬 崖 百 丈 冰, 犹 有 花 枝qiaox;qiaox ye bu zhengs chunt,zhiy baa chunt lais baos,俏; 俏 也 不 争 春, 只 把 春 来 报,dais daw shant huap lanmanx shit,taa zay congp zhong待 到 山 花 烂漫 时 ,她 在 丛 中xiaos。笑。
3)zhonglit jiasudut--wutit youyu zhonglit zuoyongs
重 力 加速度--物体 由于 重 力 作 用huodes d jiasudut,yongs g biaoshis,zay diqiut fujin获得 的 加 速度,用 g 表 示,在 地 球 附 近renho wutit d jiasudut zay tongyil didiant dou xiangtongx,任何 物 体 的 加速度 在 同 一 地 点 都 相 同,yue wey 980 cm/miao2,dann zay bu tongx weidut he约 为 980 厘米/秒2,但 在 不 同 纬 度 和gaodut shao yeo bu tongx。zay likais dit mian hen gaox高 度 稍 有 不 同。 在 离 开 地 面 很 高chut,zhonglit jiasudut jew xianzhu jians xiaox。处, 重 力 加 速 度 就 显 著 减 小。
Claims (2)
1.本反映语法特征的汉语表意拼音文字输入法,是一种以汉语拼音方案为基础的计算机中文信息输入方法,其特征是:
(1)根据汉语词汇的语法功能,把汉语词汇分为实词和虚词;把虚词从汉语词汇中分出来之后再对实词进行实质的表意分类,然后按照[实词加意尾,虚词定型化]的原则为汉语字、词编码;
(2)把全部虚词和实词中的代词、名词中的方位词、动词中的能愿动词和量词中的个体量词合为一大类;凡没有同音词的,以其汉语拼音为定型化编码;并为一百零三个同音词设计了变通的定型化编码,包括:n→nn,i→y,ai→ay,ao→aw,ou→ow为去声;a→aa,e→ee,i→ii或iy,ai→ae,iu→eo,和在j,q,x,y之后u→eu为上声;还采用了o代e作为“go/各,ko/可,ho/何,lo了,zho/着”的定型化编码,并保留v作为声母w的变体,称为[虚词定型化];
(3)把实词按意义分为16类;在实词的汉语拼音后面分别加上规定不发音的声母作为表意符号,称为[实词加意尾];其表意词尾分配如下:1)动词[s];2)形容词[x];3)数词[l];以下为名词:4)动物的名称[b];5)植物的名称[p];6)职业和称谓的名称[f];7)天然物和自然现象的名称[t];8)文化和思想意识的名称[k];9)工具的名称[h];10)疾病的名称[j];11)整体物的部件名称[q];12)名称不同于原料的制品和食品名称[c];13)古代汉文化里特有的名词[v];14)专有名词[ft];15)不可移动的建筑物[th];16)用成语切换键[\]把成语分开编码,成语编码只使用成语中每个汉字编码的第一个字母;
(4)专有名词:地名、姓氏及古代汉文化里特有的干支序数和针灸穴位名称,一律以大写字母开头并加相应的表意词尾编码;
2.为实施权利要求1反映语法特征的汉语表意拼音文字输入法的输入键盘,编码码元包括26个小写字母、26个大写字母、10个阿拉伯数字和符号[<],[>],[\],[-],其特征是:规定eu代替汉语拼音方案中的韵母″ü″;以[<]为取前键,[>]为取后键,用以由汉语双音词提取单个汉字;[\]为成语切换键,[-]为词头和词尾键。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN93120482A CN1045342C (zh) | 1993-12-07 | 1993-12-07 | 反映语法特征的汉语表意拼音文字输入法及键盘 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN93120482A CN1045342C (zh) | 1993-12-07 | 1993-12-07 | 反映语法特征的汉语表意拼音文字输入法及键盘 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1088323A CN1088323A (zh) | 1994-06-22 |
CN1045342C true CN1045342C (zh) | 1999-09-29 |
Family
ID=4993330
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN93120482A Expired - Fee Related CN1045342C (zh) | 1993-12-07 | 1993-12-07 | 反映语法特征的汉语表意拼音文字输入法及键盘 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1045342C (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100359445C (zh) * | 2006-01-27 | 2008-01-02 | 南京联慧通信技术有限公司 | 移动信息终端使用词组联想和语音提示的汉字输入方法 |
CN101216854B (zh) * | 2008-01-15 | 2010-07-14 | 腾讯科技(深圳)有限公司 | 计算机文字输入方法和系统及其词库维护方法和装置 |
CN103246354A (zh) * | 2012-02-03 | 2013-08-14 | 陈大胜 | 以通用语文字编码表达汉字的输入法及其键盘 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7328147B2 (en) * | 2003-04-03 | 2008-02-05 | Microsoft Corporation | Automatic resolution of segmentation ambiguities in grammar authoring |
CN102955575A (zh) * | 2011-08-19 | 2013-03-06 | 刘鸿健 | 易玄虚数码表及汉英手键输入 |
-
1993
- 1993-12-07 CN CN93120482A patent/CN1045342C/zh not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100359445C (zh) * | 2006-01-27 | 2008-01-02 | 南京联慧通信技术有限公司 | 移动信息终端使用词组联想和语音提示的汉字输入方法 |
CN101216854B (zh) * | 2008-01-15 | 2010-07-14 | 腾讯科技(深圳)有限公司 | 计算机文字输入方法和系统及其词库维护方法和装置 |
CN103246354A (zh) * | 2012-02-03 | 2013-08-14 | 陈大胜 | 以通用语文字编码表达汉字的输入法及其键盘 |
CN103246354B (zh) * | 2012-02-03 | 2016-08-17 | 陈大胜 | 以通用语文字编码表达汉字的输入法及其键盘 |
Also Published As
Publication number | Publication date |
---|---|
CN1088323A (zh) | 1994-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Enfield | A grammar of Lao | |
Donohue | Tone systems in New Guinea | |
CN100568225C (zh) | 文本中数字和特殊符号串的文字符号化处理方法及系统 | |
Li | Manchu: A textbook for reading documents | |
Zender | Diacritical marks and underspelling in the classic Maya script: implications for decipherment. | |
CN106128182A (zh) | 汉字学习系统及其学习方法 | |
CN1045342C (zh) | 反映语法特征的汉语表意拼音文字输入法及键盘 | |
Hadamitzky et al. | Japanese Kanji & Kana:(JLPT All Levels) A Complete Guide to the Japanese Writing System (2,136 Kanji and 92 Kana) | |
CN201600791U (zh) | 具有汉字学习功能的电子装置 | |
WO2010131759A1 (ja) | 中国語入力パソコン | |
CN1420425A (zh) | 音形拼音汉字输入法 | |
Aor | Phonological effects and functions of English loan-words on the Tiv grammar | |
Owen | A description and linguistic analysis of the Tai Khuen writing system | |
Khana | Phonemic variations in similar words of Turkish and Urdu language | |
CN1117158A (zh) | 辅助汉文双拼音义码及其键盘方案 | |
George | The Lexical Shift in Japanese Sign Language (JSL) Toponyms | |
Kong | The Analysis of the Changes of Phonetics and Vocabulary in English | |
Michaud | Pictographs and the language of Naxi rituals | |
Vangsnes | From confetti to kawaii: A study of the nativization of Italian and Japanese loanwords in The Oxford English Dictionary | |
CN1125393C (zh) | 利用计算机键盘汉字编码输入方法 | |
REN et al. | CHAPTER THIRTEEN CHINESE CHARACTERISTICS OF METAPHOR CONSTRUCTION AND THEIR IMPLICATIONS IN TRANSLATION HONGXIA REN AND YANGSHENG GUO | |
Cao | Development and Suggestions of Oroqen Ethnic Education in China: Based on the Current Situation of Oroqen Language Ecology | |
Nongmeikapam et al. | Automatic segmentation of manipuri (Meiteilon) word into syllabic units | |
Huang et al. | Research For Hakka Input Method With Hio-Liu Accent On Mobile Platforms | |
Bauer | MAPPING THE OLD ZHUANG CHARACTER SCRIPT |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |