CN1332294C - 汉语语音编码输入法 - Google Patents

汉语语音编码输入法 Download PDF

Info

Publication number
CN1332294C
CN1332294C CNB2005100208458A CN200510020845A CN1332294C CN 1332294 C CN1332294 C CN 1332294C CN B2005100208458 A CNB2005100208458 A CN B2005100208458A CN 200510020845 A CN200510020845 A CN 200510020845A CN 1332294 C CN1332294 C CN 1332294C
Authority
CN
China
Prior art keywords
input
word
chinese
input method
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2005100208458A
Other languages
English (en)
Other versions
CN1687875A (zh
Inventor
潘昌仁
潘纪鸿
潘欢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CNB2005100208458A priority Critical patent/CN1332294C/zh
Publication of CN1687875A publication Critical patent/CN1687875A/zh
Application granted granted Critical
Publication of CN1332294C publication Critical patent/CN1332294C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明汉语语音编码输入法,将我国汉语拼音方案中的21个声母和35个韵母分为五声和五韵。这十个音分别用十个不同的字符,如十个数字作为声码。4种声调分别用四个不同的字符,如四个数字作为声码。例为:1-bpmf,2-dtnl,3-gkh,4-jqx,5-zcszhchrsh和6-a,7-e,8-i,9-o,0-u。每个字的编码有一个声码和一个调码。针对汉语中有大量4字短语,本输入法以4字短语的编码为主,先输入各字的声码,再输入各字的调码,组成短语的编码,从而大大减少了重码。用减字键从4字短语删减得到单字或2、3字的词。本法仅用两码十个数字,易学易记易掌握,相近的音无需区分,也可正确输入编码;编码简捷,输入速度高;数字编码,适用于手机等的汉语输入。

Description

汉语语音编码输入法
(一)技术领域
本发明涉及一种汉语输入方法,具体为一种汉语语音编码输入法。
(二)技术背景
汉字是象形文字,每个字都有独特的字形和读音,目前,计算机汉字输入问题尚未得到妥善解决,因此汉字输入仍是众人研究的重点。汉字键盘输入法的各种方案现已有上千种,主要可分为声码、形码和声形码等几大类。形码是基于字形,需要先区分字的部首或字根,还要记忆代表各部首或字根的代码,因此学习掌握比较困难。声码是根据字的读音来编码,比形码容易掌握。目前使用较多的主要有“全拼”、“双拼”、“智能拼音”、“自然码”等输入法,基本上都是采用汉语拼音方案中用拉丁字母代表的声母或韵母输入汉字。现代汉语中,有二十一个声母、三十五个韵母,还有一个舌韵母“er”,因此一般键盘上二十六个英文字母就不够用了。若要增加字母并且改造键盘显然不利于普及。汉语拼音方案中是用多个字母组合来表示韵母,如:ai、ei、ao、ou、an、ang、en、eng、ong等等。这就使得一个字的拼音码比较长,如“张”的汉语拼音编码为“zhang”,长达5个字符,若再加上音调码就要6个字符,显然影响输入速度。因而现有的声码输入法方案多是通过借用其它诸如标点符号键和数字键、或通过改变字母大小写、或通过使用一个字母键表示多个韵母的办法来解决。这些解决途径是不够理想的。借用标点符号键和数字键,或者改变字母大小写都会影响输入的快捷和编码的整齐一律。为了缩短编码长度,声码输入法大多省略了声调码,如现在的“全拼”输入法,但无声调码就不能见码读出准确的字音,输入时重码过多,几乎每个拼音音节都对应多个同音字,多的达上百个,选码费时。现有的声码输入法的另一难点是必须要掌握字的准确读音才能得到正确的编码。而对于普通话不够标准的人,往往对发音相近的音难以准确区分,如平舌音z c s与翘舌音zh ch sh r,前鼻音an en in un ün与后鼻音ang eng ing ong,鼻音n与边音1,送气音b、d、g与不送气音p、t、k等,极易混淆,他们使用声码就输入就比较困难
总之在计算机日益普及的今天,汉字输入仍是大众学习和使用计算机的一个瓶颈。这也直接影响了中文编程、软件汉化、文字识别、文字通讯、语音与文本的相互转换等等工作的进程。
(三)发明内容
本发明的目的是公开一种汉语语音编码输入法,用两个字符表示汉语每个字的声和调,基本无重码,简单实用。
本发明公开的汉语语音编码输入法汉语每个字的编码包括声码和调码,本输入法中,将我国汉语拼音方案中的21个声母和35个韵母分为五声和五韵。即按发音的特点将21个声母分为5组为五声,即:
喷发式发音    b、p、m、f,
弹发式发音    d、t、n、l,
高截式发音    g、k、h,
挤截式发音    j、q、x,
阻擦式发音    z、c、s、zh、ch、r、sh,
35个韵母根据打头的基本单韵母a、e、i、o、u分为5组,为即5韵,即:
a组,包括a、ai、ao、an、ang;
e组,包括e、ei、en、eng;
I(y)组,包括i、ia、ie、iao、iou、ian、in、iang、ing、iong、yu、yue、yuan、yun;
o组,包括o、ou、ong;
u组,包括u、ua、uo、uai、uei、uan、uen、uang、ueng。
以上十组音分别用十个不同的字符作为声码,或曰代声码,如可用十个阿拉伯数字作为声码。
阴平、阳平、上声、去声4种声调分别用四个不同的字符作为调码,如可用四个阿拉伯数字作为调码。
每个字的编码由一个声码和一个调码组成。
对于单字来讲本法编码重码较多。但汉语表达很少只是单音节字。本输入法用于4个字、或少于4字、或多于4字的常用的词汇或短语的编码输入时,以词汇或短语为单元,设定先输入各字的声码,之后再输入各字的调码,组成词汇或短语的编码,从而大大减少了重码。
在本人对汉语的研究中看到,汉语常用的表达很少只有一两字的句子,有大量四个字的短语,常用4字短语超过9000句,如:“你吃了吗”、“我回来了”、“她上学去”等,我国的成语更是四字集装的大成,成语可达一万一千多个。四音集装式的短语在信息传载中的简捷性、灵活性和经济性是显而易见的。因此在长期的汉语言谈实践中有多种集四手段。试举则有:
(1)叠四——步步为营 书声朗朗 风风火火 和和气气
(2)填四——说(哪里)话 随(你的)便 花(冤枉)钱 手(实在)长
(3)列四——兄弟姐妹 春夏秋冬 青红皂白 聪明才智
(4)反四——大材小用 白山黑水 此起彼伏 你来我往
(5)联四——反骄破满 我们大家 星罗棋布 积极主动
(6)述四——内容提要 气势恢宏  事有凑巧  三个代表
(7)疑四——如何解决 行不行呢 你去哪儿 他不懂吗
(8)简四——政协委员 人大代表 三中全会 大台港澳
(9)补四——我不去(了) 那不行(的) 咱们走(吧) 这就好(啦)
(10)略四——画蛇添足 世贸组织 汪辜会谈 湘赣边界
(11)代四——那不能用(歪曲历史的教科书不能用)
            这不可喝(没烧开的水不可喝)等等,等等。
故本输入法重点用于4个字的成语或常用词汇短语的输入编码。
本发明公开的汉语语音编码输入法的优点为:1、只用十个字符来进行编码输入,甚至可以只用十个数字编码,不用依靠拉丁字母,更加易学易记易掌握,不认识中国字的人只要会讲中文,即可按读音用本法输入;2、发音相近的音如b和p、d和t、以及z、c、s、zh、ch、sh等均是用同一声码,无需进行区分,普通话不太标准也可正确输入编码;3、一个字只有两个码,编码简捷,输入速度可大有提高;4、按汉语的特点以4字短语为单元进行输入,此时4字短语编码由4个音码和4个调码组成,可有104×44种不同的编码,故本法对基本生活常用的4字短语的编码基本没有重码,即加快输入速度又提高准确性;5、本输入法只用10个数字编码,故适合用于手机及其它小键盘工具的汉语输入。
(四)具体实施方式
本发明公开的汉语语音编码输入法的实施例如下:
本输入法中,汉语每个字的编码包括声码和调码,将我国汉语拼音方案中的21个声母和35个韵母分组,分别用0至9十个阿拉伯数字作为声码。即
1  b、p、m、f
2  d、t、n、l
3  g、k、h
4  z、c、s、zh、ch、r、sh
5  j、q、x
6  u(u、ua、uo、uai、uei、uan、uen、uang、ueng)
7  i(y)(i、ia、ie、iao、iou、ian、in、iang、ing、iong、yu、yue、yuan、yun)
8  e(e、ei、en、eng)
9  a(a、ai、ao、an、ang)
0  o(o、ou、ong)
阴平、阳平、上声、去声4种声调分别用1至4四个阿拉伯数字作为调码。
1  阴平
2  阳平
3  上声
4  去声
每个字由一个声码和一个调码组成。
如:潘    本输入法编码为11
    我    本输入法编码为63
    家    本输入法编码为51
本输入法以4个字的词汇或短语作为一个单元编码输入,先输入各字的声码,之后再输入各字的调码,组成词汇或短语的编码。
如:
“我去上课”,本输入法对单字的编码为:我——63,去——54,上——44,课——34,短语“我去上课”——本输入法编码为65433444;
“守株待兔”,本输入法对单字的编码为:守——43,株——41,待——24,兔——24,短语“守株待兔”——本输入法编码为44223144;
“与时俱进”,本输入法对单字的编码为:与——73,时——42,俱——54,进——54,短语“与时俱进”——本输入法编码为;74553244;
“安步当车”,本输入法对单字的编码为:安——91,步——14,当——21,车——44,短语“安步当车”——本输入法编码为;91241414;
“我要读书”,本输入法对单字的编码为:我——63,要——74,读——22,书——41,短语“我要读书”——本输入法编码为67243421;
“兄弟姐妹”,本输入法对单字的编码为:兄——51,弟——24,姐——53,妹——14,短语“兄弟姐妹”——本输入法编码为52511434;
“跋山涉水”,本输入法对单字的编码为:跋——12,山——41,涉——43,水——44,短语“跋山涉水”——本输入法编码为14442143;
“天下雨了”,本输入法对单字的编码为:天——21,下——54,雨——73,了——22,短语“天下雨了”——本输入法编码为25721432。
其它还有:安家落户95231144,安于现状97541244,按图索骥92434244,白驹过隙15352144,傲然屹立94724244,按步就班91514441好事多磨34213412,百川归海14332113,百步穿杨11473412,百花齐放13512124,百折不挠14123242,成竹在胸44452241,弛名中外41462214,长篇累牍41222142,承前启后45532234,长治久安44592431,畅行无阻45644223,车水马龙44121332,晨钟暮鼓44132143,等等。
2个或3个字的常用词汇或短语也可作为一个单元输入,先输入各字的声码,之后再输入各字的调码,组成词汇或短语的编码。如“朋友”1723,“小朋友”517323,“破天荒”123411,“俄罗斯”824221。
5至10个字的常用词汇或短语也可作为一个单元输入,先输入各字的声码,之后再输入各字的调码,组成词或短语的编码。如“独木不成林”2114214422,“真金不怕火炼”451132114434,“醉翁之意不在酒”46471454114443,“道高一尺魔高一丈”2374137441132114,“司马昭之心路人皆知”414452454131114211,“世上无难事只怕有心人”44624417544422434312,等等。
本法输入编码时提示框显示编码相同的短语,可从提示框直接选择所需输入的短语,往往无需将编码完全输入,即可得到所需要输入的短语汉字。如“呕心沥血”编码为05253144,操作时只输入05提示框中即仅余“呕心沥血”一词,两键完成输入;“燕雀安知鸿鹄之志”编码为7594334442112314,实际输入759即得“燕雀安知鸿鹄之志”,三键完成输入;“哑子吃黄连”编码为7443233122,实际输入744时提示框出现16个词,输入7443提示框余6个词,击74432仅余“哑子吃黄连”,五键得五字词无重码;“一朝天子一朝臣”编码为74247441213122,实际输入742在提示框首页出现该词,选择即可得,当输入7424时提示框上首位为该词,输入74247提示框仅余该词,五击得7字词无重码;如是等等。
虽然4字短语编码有104×44种不同的编码,但还是会出现读音相近短语为重码,如:“她们来了”,与“他们来了”、“它们来了”读音完全相同,本法编码也同为21221221。再如“我忙得很”,本法编码为01233223,与“我没狼狗”、“我白得很”编码相同。此种有重码的情况,从提示框中选取正确的短语。
对于多字的词汇或短语,例如3字、4字或4字以上的词汇或短语,本编码法根据先输入各字声码再输入调码的原则,相近的词汇或短语的本输入法的编码只相差少量字符。如:
“我买西瓜”声码为“6153”,调码为“3311”,其编码为“61533311”;
“我卖西瓜”声码为“6153”,“调码”为“3411”,其编码为“61533411”,与“我买西瓜”只相差第6位1个字符;
“我切西瓜”声码”为“6553”,调码为“3111”,其编码为“65536111”,与“我买西瓜”只相差第2位、第6位2个字符;
“我种南瓜”声码为“6423”,调码为“3421”,其编码为“64233421”,与“我买西瓜”相差第2、3位和第5、6位4个字符;此不赘述。
输入单字、双字词、或三字词时,先输入含有该字的四字短语,减去多余的字即可。如欲输入“曹”字,输入短语“曹操的曹”——44242412,屏上即显现4字:“曹操的曹”,删除前或后三字得“曹”;欲输入“鼓舞”,先输入“欢欣鼓舞”——35361133,删除“欢欣”二字得“鼓舞”;欲输入“中国人”,先输入“中国人民”——43411222,删除最后一字即可。
本输入法在键盘上设置有减字键,如“前减三”键、“后减三”键、“前减二”键、“后减二”键,可用一键完成4字短语的正确删减。
较长的汉语句式分为多个单元进行输入编码,两相邻单元编码之间有空格分开。如:
“我考上了北京大学”,分为两组,“我考上了”、“北京大学”,本输入法编码为6342334115253112。
本输入法按语音编码,且对读音准确度无严格要求,适合与语音录入系统配合使用。计算机配备话筒与语音识别系统,即可与本输入法配合,根据用户读音,在屏幕上显示该读音对应的本输入法编码和词汇短语,用户只需确认或选定后加击减字键即可。

Claims (5)

1、一种汉语语音编码输入法,用数字键盘输入,其特征为:
每个字的编码包括声码和调码,我国汉语拼音方案中的21个声母按发音的特点分为5组为5声,即
喷发式发音    b、p、m、f,
弹发式发音    d、t、n、l,
高截式发音    g、k、h,
挤截式发音    j、q、x,
阻擦式发音    z、c、s、zh、ch、r、sh;
35个韵母根据基本单韵母a、e、i、o、u分为5组为5韵,即:
a组,包括:a、ai、ao、an、ang;
e组,包括:e、ei、en、eng;
i或y组,包括:i、ia、ie、iao、iou、ian、in、iang、ing、iong、yu、yue、yuan、yun;
o组,包括:o、ou、ong;
u组,包括:u、ua、uo、uai、uei、uan、uen、uang、ueng;
用0至9十个阿拉伯数字作为声码,即:
1    b、p、m、f
2    d、t、n、l
3    g、k、h
4    z、c、s、zh、ch、r、sh
5    j、q、x
6    u、ua、uo、uai、uei、uan、uen、uang、ueng
7    i、ia、ie、iao、iou、ian、in、iang、ing、iong、yu、yue、yuan、yun
8    e、ei、en、eng
9    a、ai、ao、an、ang
0    o、ou、ong;
阴平、阳平、上声、去声4种声调分别用1至4四个阿拉伯数字作为调码,即:
1    阴平
2    阳平
3    上声
4    去声;
4个字、2个字、3个字、或5~10个字的常用词汇、短语作为一个单元编码输入,先依次输入词或短语中各个字的声码,再输入该词或短语中各个字的调码。
2、根据权利要求1所述的汉语语音编码输入法,其特征为:
本法输入编码时提示框显示编码相同的词汇或短语,从提示框直接选择,得到所需要输入的短语汉字。
3、根据权利要求1或2所述的汉语语音编码输入法,其特征为:
输入单字、双字词、或三字词时,先输入含有该字的四字短语,再减去多余的字。
4、根据权利要求1或2所述的汉语语音编码输入法,其特征为:
本输入法在键盘上设置有减字键,为“前减三”键、“后减三”键、“前减二”键、“后减二”键,输入单字、双字词、或三字词时,先输入含有该字的四字短语,用减字键减去多余的字。
5、根据权利要求1或2所述的汉语语音编码输入法,其特征为:
较长的汉语句式分为多个单元进行输入,相邻两单元编码之间有空格分开。
CNB2005100208458A 2005-04-30 2005-04-30 汉语语音编码输入法 Expired - Fee Related CN1332294C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2005100208458A CN1332294C (zh) 2005-04-30 2005-04-30 汉语语音编码输入法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2005100208458A CN1332294C (zh) 2005-04-30 2005-04-30 汉语语音编码输入法

Publications (2)

Publication Number Publication Date
CN1687875A CN1687875A (zh) 2005-10-26
CN1332294C true CN1332294C (zh) 2007-08-15

Family

ID=35305917

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005100208458A Expired - Fee Related CN1332294C (zh) 2005-04-30 2005-04-30 汉语语音编码输入法

Country Status (1)

Country Link
CN (1) CN1332294C (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101655840B (zh) * 2009-09-11 2012-12-19 潘昌仁 汉语语音数字化方法和装置
CN103076890A (zh) * 2012-07-01 2013-05-01 潘昌仁 一种文字数字化编码及数字国际公读法
CN103777773A (zh) * 2013-12-04 2014-05-07 潘昌仁 一种独具汉字笔画特色的小键盘及其汉字输入法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1061100A (zh) * 1990-10-23 1992-05-13 郭致平 速记中文输入法
US5212638A (en) * 1983-11-14 1993-05-18 Colman Bernath Alphabetic keyboard arrangement for typing Mandarin Chinese phonetic data
CN1241742A (zh) * 1999-08-09 2000-01-19 余彦中 汉字序码输入方案

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5212638A (en) * 1983-11-14 1993-05-18 Colman Bernath Alphabetic keyboard arrangement for typing Mandarin Chinese phonetic data
CN1061100A (zh) * 1990-10-23 1992-05-13 郭致平 速记中文输入法
CN1241742A (zh) * 1999-08-09 2000-01-19 余彦中 汉字序码输入方案

Also Published As

Publication number Publication date
CN1687875A (zh) 2005-10-26

Similar Documents

Publication Publication Date Title
CN102214238B (zh) 一种汉语词语相近性匹配装置及方法
CN102253728A (zh) 一种声韵双拼汉字输入法及其虚拟键盘
CN1332294C (zh) 汉语语音编码输入法
CN101556509A (zh) 国语音标 简化音标 英文键盘和小键盘汉字输入法
CN101655840A (zh) 汉语语音数字化方法和装置
CN104820503A (zh) 集拼音和字形编码多种方式于一体的汉字输入系统
CN100458668C (zh) 首音汉字输入法
Odinye Phonology of mandarin chinese: a comparison of Pinyin and IPA
CN1018205B (zh) 计算机中文声数编码输入技术
CN101751134A (zh) 正左上方汉字输入法
CN106325540B (zh) 一种滇东北次方言苗文的简笔输入法及其应用
CN103455164A (zh) 一种学汉语工具拼音汉字和拼音笔画输入法
CN101901062B (zh) 基于音素编码的计算机汉字信息处理方法
CN201732370U (zh) 汉语语音数字化装置
CN100440110C (zh) 易通华文输入法
CN103257717A (zh) 实用型吴语上海话输入法拼音方案及键盘
CN101813979B (zh) 汉字拼音文字码输入法
CN107315725A (zh) 汉语普通话信息ascii集合码
CN101025660A (zh) 计算机汉语声韵双击快速录入方法
CN105955508A (zh) 一种注入区别码计算机汉字输入法
Heitner Double U: When Two/u/Make One/w/and the Phonetics of Consonantalization
CN104615269A (zh) 一种藏文拉丁全简双拼编码方案及其智能输入系统
CN104598046A (zh) 首音码汉字输入法
TW594503B (en) Innovative sound pictograph information system representing objects and words
CN111767696A (zh) 一种汉语普通话信息编码方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070815

Termination date: 20110430