CN101281434A - 音数语音输入法 - Google Patents
音数语音输入法 Download PDFInfo
- Publication number
- CN101281434A CN101281434A CNA2008101002583A CN200810100258A CN101281434A CN 101281434 A CN101281434 A CN 101281434A CN A2008101002583 A CNA2008101002583 A CN A2008101002583A CN 200810100258 A CN200810100258 A CN 200810100258A CN 101281434 A CN101281434 A CN 101281434A
- Authority
- CN
- China
- Prior art keywords
- word
- stroke
- chinese character
- words
- chinese
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明音数语音输入法,简称音数输入法,是一种用语音输入汉字的方法。其特征是将汉字的五种单笔画及五种单笔画的两两组合科学合理地安排到1-0数码键上,汉字编码先取汉字音节字母,再按笔顺从汉字首笔开始依次取双笔数码即汉字的相邻两笔取一数码,取到最后只剩一笔时取单笔数码,并用语音将编码的汉字音节和数码音节读入语音输入装置,语音输入装置接收、训练、识别并输出判别结果,从而实现汉字的语音输入。规范简单,好学好用,重码少,词语多,字词兼容,易于提高录入速度,不认识汉字也可使用。
Description
一、技术领域
本发明音数语音输入法,简称音数输入法,是一种用语音输入汉字的方法,属通讯、计算机技术领域,适用于计算机和手机等掌上产品。
二、背景技术
现有汉字输入多为键盘输入,对熟悉键盘的用户来说,用键盘输入自然是种好方法;但多数用户对熟悉和掌握键盘确实是件难事,要达到纯熟和盲打的程度,更是望而生畏。所以研究语音输入成为人们关注的一项课题。如仅按汉语拼音进行语音输入,显然重码率高、准确率低,不易于提高录入速度。汉语是少形态或非形态语言,词语搭配灵活,组句千变万化。“现代汉语实词搭配词典”例证的主要实词搭配就有70余万组,如再与虚词搭配,再组成短语或句子那将是几百万组甚至上千万组。还有人名等各种名称上亿,也不能按规律组成语句。所以汉语要完全按语句进行语音输入是很困难的,换言之语音输入主要还是字词输入,问题是没有语音输入的字词编码方案。
三、发明内容
本发明的目的在于解决上述不足之处,设计出一种用汉字音节字母和数码编码并用汉字音节和数码音节进行语音输入的音数语音输入方案。
1、设计汉字单笔画及双笔组合与1-0数码的对应关系
汉字有五种单笔画即横“一”含提,竖“丨”含竖钩,撇“丿”,点“丶”含捺,折“乙”含各种带转折的笔画;每一种可自成相同笔画的双笔组合,每二种可构成不同笔画的双笔组合。
设计单笔画及双笔组合与1-0数码的对应关系如下:
双笔组合“一丨”含“丨一”,“一丿”含“丿一”,“一丶”含“丶一”,“一乙”含“乙一”,“丨丿”含“丿丨”,“丨丶”含“丶丨”,“丨乙”含“乙丨”,“丿丶”含“丶丿”,“丿乙”含“乙丿”,“丶乙”含“乙丶”。双笔组合对应的数码依“一丨丿丶乙”顺序记忆。
2、用汉字音节字母和数码给汉字和词语编码
根据单笔画及双笔组合与1-0数码的对应关系用汉字音节字母和数码给汉字和词语编码。音节中的后鼻韵母eng、ing可合并为前鼻韵母en、in,舌尖后音zh、ch、sh可合并为舌尖前音z、c、s,鼻音n可合并为边音l。数码取双笔数码和单笔数码:双笔数码为汉字的相邻两笔取一数码,单笔数码为汉字的一笔取一数码。设有模糊键和转换键。汉字和词语的编码方法如下:
①汉字的编码
汉字编码先取汉字音节字母,再按笔顺从汉字首笔开始依次取双笔数码,取到最后只剩一笔时取单笔数码,即一二两笔取一数码,三四两笔取一数码……依此类推;若一二两笔为“一丨”或“丨一”则取数码1,若一二两笔为“一丿”或“丿一”则取数码2……依此类推;笔画足够时数码可取两码或三码:取两数码时第一数码取首双笔数码,第二数码取最后未取的两笔或一笔;取三数码时可从首笔开始连续取两码双笔数码,第三数码取最后未取的两笔或一笔。例如“镜”的编码为“jing29、jing269”,“查”的编码为“cha16、cha186”,“关”的编码为“guan88、guan868”,“术”的编码为“shu19、shu184”,“三”的编码为“san61”,“一”的编码为“yi1”,“二”的编码为“er6”。
②汉字简码
汉字一级简码取汉字音节字母;二级简码取汉字音节字母和一数码;三级简码取汉字音节字母和一二数码。
③词语的编码
二字词语取每字的音节字母或先取每字的音节字母,再取数码一码或两码:取一数码时可取每字首笔画组成的双笔数码;亦可取前字的一数码或后字的一数码;取两数码时取每字的一数码。三字词语取一二三字的音节字母或一二三字的音节字母和三字的一数码。四字及四字以上词语取每字的音节字母。例如“杂交”的编码为“zajiao、zajiao8、zajiao9、zajiao3、zajiao93”,“计算机”的编码为“jisuanji、jisuanji1”,“针锋相对”的编码为“zhenfengxiangdui”。
④阿拉伯数字、标点符号和图形符号的编码:
阿拉伯数字和标点符号用一二三级简码;图形符号按“图”字加其名称作“词语”编码;
所有编码汉字和词语存入编码字词库。
3、用全数码给汉字和词语编码
不认识汉字和词语,根据单笔画及双笔组合与1-0数码的对应关系用全数码给汉字和词语编码,包括以下步骤:
①汉字编码:汉字按笔顺从首笔开始依次取双笔数码,字首四笔以上部首只取两码,越过部首取码后的剩余笔画继续按笔顺依次取双笔数码,取到最后只剩一笔时取单笔数码;取完该取的笔画后仅取1-3码的补取汉字首、末笔画自成的相同笔画双笔数码,仅取4码的补取汉字末笔画自成的相同笔画双笔数码;可取五码以上的汉字,第五码取最后两笔。例如“镜”的编码为26389(钅为四笔以上部首),“天”的编码为6869,“一”为“横”笔画且首、末笔画也为“横”,故其编码为166,“二”的首、末笔画也为“横”,故其编码为666。
②汉字简码:一级简码取汉字全码的一数码;二级简码取汉字全码的一二数码;三级简码取汉字全码的一二三数码;四级简码取汉字全码的一二三四数码。
③词语编码:二字词语取一字的一二数码和二字的一二三数码;三字词语取一字的一数码和二三字的一二数码;四字词语取一二三字的一数码和四字的一二数码;四字以上多字词语取每字的一数码。例如“杂交”的编码为91388,“计算机”的编码为02818。
④标点符号编码:标点符号按词语编码方法将其名称编码输入,即可得到名称对应的标点符号。
所有编码汉字和词语存入编码字词库。
4、设置语音输入装置
犹如设置键盘一样,音数语音输入需要设置语音输入装置,它是用于接收、训练和识别语音的硬件系统;用语音将编码字词库中的汉字和词语编码的汉字音节和数码音节读入语音输入装置,进行训练,事先记住汉字和词语编码的汉字音节和数码音节的特征,对语音信息作大量的信息处理,包括提取原始语谱矩阵,数据压缩,特征抽取……,经训练构成样板汉字词语表。
5、汉字和词语的语音输入
按编码方法将输入汉字或词语编码并用语音将其汉字音节和数码音节读入语音输入装置;全数码编码读入全数码音节;语音输入装置将输入汉字或词语编码的汉字音节和数码音节的特征与样板汉字词语表作比较,判别相应的汉字或词语,并由智能功能处理后将识别到的汉字或词语按出现频率排序输出:
频率最高者呈反色显示且居中:按确定键上屏,输足3或4音节、全数码编码输足5码或5音节者直接输入下文时自动上屏;
频率最高者左右依次按频率递减排列,可翻屏或移动光标选择,使所选字词呈反色显示:按确定键上屏或直接输入下文时自动上屏。
重码字词也可按“#”、“*”或其他键,再按数字键选择。
判别后将未识别到的新词语删除或作为自定义新词语存入编码字词库并扩充到样板汉字词语表。
与现有技术相比,本方案规范简单,好学好用,重码少,词语多,字词兼容,易于提高录入速度,不认识汉字也可使用。
Claims (4)
2、根据权利要求1所述的音数语音输入法,其特征在于:
根据单笔画及双笔组合与1-0数码的对应关系用汉字音节字母和数码给汉字和词语编码;音节中的后鼻韵母eng、ing可合并为前鼻韵母en、in,舌尖后音zh、ch、sh可合并为舌尖前音z、c、s,鼻音n可合并为边音1;数码取双笔数码和单笔数码:双笔数码为汉字的相邻两笔取一数码,单笔数码为汉字的一笔取一数码;设有模糊键和转换键;包括以下步骤:
汉字的编码:汉字编码先取汉字音节字母,再按笔顺从汉字首笔开始依次取双笔数码,取到最后只剩一笔时取单笔数码,即一二两笔取一数码,三四两笔取一数码……依此类推;若一二两笔为“一丨”或“丨一”则取数码1,若一二两笔为“一丿”或“丿一”则取数码2……依此类推;笔画足够时数码可取两码或三码:取两数码时第一数码取首双笔数码,第二数码取最后未取的两笔或一笔;取三数码时可从首笔开始连续取两码双笔数码,第三数码取最后未取的两笔或一笔;
汉字简码:汉字一级简码取汉字音节字母;二级简码取汉字音节字母和一数码;三级简码取汉字音节字母和一二数码;
词语的编码:二字词语取每字的音节字母或先取每字的音节字母,再取数码一码或两码:取一数码时可取每字首笔画组成的双笔数码;亦可取前字的一数码或后字的一数码;取两数码时取每字的一数码;三字词语取一二三字的音节字母或一二三字的音节字母和三字的一数码;四字及四字以上词语取每字的音节字母;
阿拉伯数字、标点符号和图形符号的编码:阿拉伯数字和标点符号用一二三级简码;图形符号按“图”字加其名称作“词语”编码;
所有编码汉字和词语存入编码字词库;
3、根据权利要求1所述的音数语音输入法,其特征在于:
不认识汉字和词语,根据单笔画及双笔组合与1-0数码的对应关系用全数码给汉字和词语编码,包括以下步骤:
汉字编码:汉字按笔顺从首笔开始依次取双笔数码,字首四笔以上部首只取两码,越过部首取码后的剩余笔画继续按笔顺依次取双笔数码,取到最后只剩一笔时取单笔数码;取完该取的笔画后仅取1-3码的补取汉字首、末笔画自成的相同笔画双笔数码,仅取4码的补取汉字末笔画自成的相同笔画双笔数码;可取五码以上的汉字,第五码取最后两笔;
汉字简码:一级简码取汉字全码的一数码;二级简码取汉字全码的一二数码;三级简码取汉字全码的一二三数码;四级简码取汉字全码的一二三四数码;
词语编码:二字词语取一字的一二数码和二字的一二三数码;三字词语取一字的一数码和二三字的一二数码;四字词语取一二三字的一数码和四字的一二数码;四字以上多字词语取每字的一数码;
标点符号编码:标点符号按词语编码方法将其名称编码输入,即可得到名称对应的标点符号;
所有编码汉字和词语存入编码字词库;
4、根据权利要求2至3中任一项所述的音数语音输入法,其特征在于包括以下步骤:
设置语音输入装置:犹如设置键盘一样,音数语音输入需要设置语音输入装置,它是用于接收、训练和识别语音的硬件系统;用语音将编码字词库中的汉字和词语编码的汉字音节和数码音节读入语音输入装置,进行训练,事先记住汉字和词语编码的汉字音节和数码音节的特征,对语音信息作大量的信息处理,包括提取原始语谱矩阵,数据压缩,特征抽取……,经训练构成样板汉字词语表;
汉字和词语的语音输入:按编码方法将输入汉字或词语编码并用语音将其汉字音节和数码音节读入语音输入装置;全数码编码读入全数码音节;语音输入装置将输入汉字或词语编码的汉字音节和数码音节的特征与样板汉字词语表作比较,判别相应的汉字或词语,并由智能功能处理后将识别到的汉字或词语按出现频率排序输出:
频率最高者呈反色显示且居中:按确定键上屏,输足3或4音节、全数码编码输足5码或5音节者直接输入下文时自动上屏;
频率最高者左右依次按频率递减排列,可翻屏或移动光标选择,使所选字词呈反色显示:按确定键上屏或直接输入下文时自动上屏;
重码字词也可按“#”、“*”或其他键,再按数字键选择;
判别后将未识别到的新词语删除或作为自定义新词语存入编码字词库并扩充到样板汉字词语表。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2008101002583A CN101281434A (zh) | 2008-05-15 | 2008-05-15 | 音数语音输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2008101002583A CN101281434A (zh) | 2008-05-15 | 2008-05-15 | 音数语音输入法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101281434A true CN101281434A (zh) | 2008-10-08 |
Family
ID=40013928
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2008101002583A Pending CN101281434A (zh) | 2008-05-15 | 2008-05-15 | 音数语音输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101281434A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101872251A (zh) * | 2010-06-22 | 2010-10-27 | 刘洪学 | 手机音数输入法 |
CN102455787A (zh) * | 2010-11-04 | 2012-05-16 | 朱庆祥 | 一种规范笔画的手机汉字输入法 |
CN103955287B (zh) * | 2014-04-02 | 2017-01-11 | 刘学中 | 汉字和汉语词组的输入法及其键盘 |
-
2008
- 2008-05-15 CN CNA2008101002583A patent/CN101281434A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101872251A (zh) * | 2010-06-22 | 2010-10-27 | 刘洪学 | 手机音数输入法 |
CN102455787A (zh) * | 2010-11-04 | 2012-05-16 | 朱庆祥 | 一种规范笔画的手机汉字输入法 |
CN103955287B (zh) * | 2014-04-02 | 2017-01-11 | 刘学中 | 汉字和汉语词组的输入法及其键盘 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101334704B (zh) | 一种面向移动设备的多通道中文输入法 | |
EP2106581A1 (en) | System and method of cross media input for chinese character input in electronic equipment | |
CN103995600B (zh) | 一种盲文汉字转换装置及其方法 | |
CN100462901C (zh) | Gb拼音输入法 | |
CN1359514A (zh) | 多模式数据输入设备 | |
CN100504733C (zh) | 音形编码汉字输入法 | |
CN101667099B (zh) | 一种连笔键盘文字输入的方法和设备 | |
CN101281434A (zh) | 音数语音输入法 | |
CN103246354B (zh) | 以通用语文字编码表达汉字的输入法及其键盘 | |
CN100458668C (zh) | 首音汉字输入法 | |
CN101071337A (zh) | 一种拼音字母、数字的汉字输入法及键盘和屏幕的显示方法 | |
CN100495299C (zh) | 双笔数码输入法 | |
CN1053049C (zh) | 音数码计算机汉字输入方法 | |
CN1257444C (zh) | 计算机汉语全音输入法 | |
CN1033476C (zh) | 多种文字数字编码输入方法及其键盘 | |
CN1472626A (zh) | 嵌入式智能文字输入解决方法和装置 | |
Chang | Corpus-based adaptation mechanisms for Chinese homophone disambiguation | |
CN102163088A (zh) | 汉字语音输入法 | |
CN102622098A (zh) | 新音形编码汉字输入法 | |
CN101539809B (zh) | 一种朝鲜文字计算机输入的方法 | |
CN101561712B (zh) | 一种应用十二键朝鲜文字键盘输入朝鲜文字的方法 | |
CN100498655C (zh) | 简化汉语拼音两键输入法 | |
Zhao | Nyushu Character Unification——Theory and Rules | |
CN1149147A (zh) | 计算机音词调义汉字编码输入技术及键盘 | |
CN112487762A (zh) | 一种基于汉字音意结构汉字编码的自然语言处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20081008 |