CN1677328A - 汉字字元的语音输入方法与系统 - Google Patents
汉字字元的语音输入方法与系统 Download PDFInfo
- Publication number
- CN1677328A CN1677328A CN 200410033273 CN200410033273A CN1677328A CN 1677328 A CN1677328 A CN 1677328A CN 200410033273 CN200410033273 CN 200410033273 CN 200410033273 A CN200410033273 A CN 200410033273A CN 1677328 A CN1677328 A CN 1677328A
- Authority
- CN
- China
- Prior art keywords
- character
- chinese
- phonetic
- target
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
一种汉字字元的语音输入方法,其步骤叙述如下,首先使用者以语音输入目标字元,然后依据使用者对目标字元的拼音,而产生了包括目标字元的数笔候选字元资料。此时再经由使用者根据系统对目标字元的描述,而从这些候选字元内挑出目标字元。本发明因为将字元拼音和汉字描述语言两种机制作结合,因此能准确的产生字元。
Description
技术领域
本发明是有关于一种语音输入方法,且特别是有关于一种结合字元拼音(Character Spelling Language,简称CSL)和汉字描述语言(CharacterDescription Language,简称CDL)的汉字字元的语音输入方法和系统。
背景技术
在现代科技与电脑技术愈来愈进步的今天,人类和电脑之间的资讯交换变得愈来愈重要。公知人类和电脑沟通的装置例如人类使用键盘对电脑输入指令,而电脑则利用荧幕或是印表机来输出人类所需要的资讯。在以往,当要输入汉字至电脑内时,必须熟悉一些汉字的编码规则,例如市面上各种的汉字输入法。而如果没有对这些汉字输入法受过训练的人,使用这些汉字输入法来输入汉字字元是非常缓慢的。因为这样的缘故,就发展出其他的汉字输入系统,例如手写输入和语音输入等等。
图1显示公知的汉字字元的输入系统方块图。请参照图1,公知的汉字字元的输入系统110主要由语音辨识器112和资料库114组成。当使用者对输入系统110进行语音输入时,语音辨识器112就会依据语音输入101的内容由资料库114内撷取候选字集116,并且将候选字集116显示在荧幕103上,而使用者再根据荧幕103上所显示的候选字集116来选取所要的文字。这种公知的输入系统的缺点,是需要有荧幕103来显示候选字集116供使用者选择,这对目前没有荧幕的输入系统,例如电话语音系统的汉字输入法,是无法加以应用的。
而如美国专利局公告第6,163,767号专利(发明人Donald T.Tang等三人)所设计的资料库系统,是非常不切实际的。因为汉字的变化实在太多了,要将所有汉字的变化编成资料库是不太可能的。就算编成了资料库,其容量之大,也不合适一般个人电脑来使用。另外,此专利也忽略了像是使用者本身口齿不清而造成系统上的误判。例如ㄓ(zh-)念成ㄗ(z-),或是ㄥ(-ng)念成ㄣ(-n)等等的情形。
发明内容
本发明的目的在于提供一种汉字字元的语音输入方法和系统,能够在不需要荧幕的情况下,而能够输出正确的字元。
本发明的再一目的是提供一种汉字字元的语音输入方法和系统,能够在使用者在口齿不清的状况下,而输出正确的字元。
为实现上述和其他目的,本发明提供一种汉字字元的语音输入方法,其步骤叙述如下:首先以语音输入目标字元,然后依据使用者对目标字元的拼音,而产生了包括目标字元的数笔候选字元资料。此时再经由使用者根据系统对目标字元的描述,而从这些候选字元内挑出目标字元。
另外,本发明除了依据使用者对目标字元的拼音,而产生候选字元的外,更加配合了使用者对该目标字元输入的音节(Syllable)来判断目标字元,使得本发明在判断使用者以语音输入字元的准确度大为提升。此外,本发明允许使用者以汉文注音(Zhu Yin)和拼音(Pin Yin))法,来对目标字元拼音。
此外,本发明提供了以下的几种方法,供系统对目标字元进行描述,这几种方法包括了:
a.结构法,利用目标字元的结构来进行描述;
b.片语法,利用包含目标字元的片语、人名或者是成语来进行描述;以及
c.部首(Radical)法,利用目标字元的部首来进行描述。
从另一观点来看,本发明提供一种汉字字元的语音输入系统,包括了有资料库、字元拼音(CSL)分析器和汉字描述语言(CDL)产生器。其中的字元拼音分析器依据使用者对目标字元的拼音的语音输入,由存放本发明的汉字字元的资料库内,撷取候选字集至汉字描述语言产生器。然后汉字描述语言产生器再依据使用者的选择,从候选字集内选取目标字元。
其中,字元拼音分析器允许使用者使用汉文注音或是拼音法来对目标字元拼音。此外,字元拼音分析器除了依据使用者对目标字元拼音的语音输入来产生候选字集以外,更配合了使用者对目标字元的音节的语音输入,以使本发明的字元产生的准确度提升。
而在汉字描述语言产生器方面依据系统对目标字元的结构、部首,或是包括目标字元的片语、人名或是成语来对候选字元进行描述,而帮助使用者从候选字集中选取目标字元。
综上所述,本发明因为将字元拼音和汉字描述语言两种机制作结合,使得本发明即使没有荧幕的显示,还是能够正确的产生字元。另外,本发明在使用者语音输入目标字元以后,会产生候选字集,使得在使用者口齿不清的情况下,仍能正确的产生字元。
为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举一较佳实施例,并配合所附图式,作详细说明如下。
附图说明
图1显示公知的汉字字元的输入系统方块图。
图2显示依照本发明的一较佳实施例的汉字字元的语音输入系统方块图。
图3显示依照本发明的一较佳实施例的汉字字元的语音输入方法流程图。
图4显示依照本发明的一较佳实施例的CDL产生器的运作示意图。
具体实施方式
图2显示依照本发明的一较佳实施例的汉字字元的语音输入系统方块图,而图3显示依照本发明的一较佳实施例的汉字字元的语音输入方法流程图。请合并参照图2和图3,当使用者以语音的方式,对本发明的语音输入系统200,输入一个目标字元时,也就是步骤S310。首先字元拼音分析器(以下简称CSL分析器)201会如步骤S320所示,依据使用者对目标字元的拼音,然后从存放字元资料的资料库203内撷取出可能的候选字集207来,并且将候选字集207送至汉字描述语言产生器(以下简称CDL产生器)209。
而在另一选择实施例中,CSL分析器201除了依据使用者对目标字元的拼音以外,还会配合使用者输入的音节,来撷取候选字集207。然后进行步骤S330,CDL产生器209会针对候选字集207中的每一个字元产生具有鉴别力的字元描述,再由使用者依此从候选字集207中挑出最有可能的字元。
请继续参照图2,更详细来看,本实施例中提供了两种CSL语法,以使CSL分析器201能判断语音输入205所输入的目标字元,这两种CSL语法分述如下。
A.汉文注音语法:使用者依据目标字元的『音节』以及其『汉文注音』来做为语音输入205。例如使用者欲对语音输入系统200输入目标字元『台』,则其语音输入205的内容是“台、ㄊ(te)、ㄞ(ai)、台、二声台”,或者是“ㄊ(te)、ㄞ(ai)、台、二声台”。
B.拼音法语法:使用者依据目标字元的『音节』以及其『拼音法』来做为语音输入205。例如使用者欲对语音输入系统200输入目标字元『台』,则其语音输入205的内容系“台、T、A、I、二、台”,或者是“台、T、A、I、二声台”。另外、在此语法中,拼音法可以是汉语拼音、通用拼音甚或是其他的拼音法。
以上是本实施例提供的两种CSL语法,我们可以很清楚的看到,在以上两种CSL语法中,是依据目标字元的音节和拼音来交互比对,另外,每一个目标字元的输入,其音节会重复出现至少两次,使得比对的样本(Sample)数会增加。因此CSL分析器201在产生候选字集207时,会更加的精确。
另外,CSL分析器201在撷取候选字集207时,会把一些拼音相近的字元加入。例如使用者对语音输入系统200输入目标字元『炒(chao3)』时,CSL分析器201会同时将、『超(chao1)』(声调不同)、『草(cao3)』(彳、厶的差别)等所有可能会混淆的字,全部选入候选字集207内,以避免因为使用者口齿不清而造成语音输入系统200的误判。
图4显示依照本发明的一较佳实施例的CDL产生器的运作示意图。在图2中,当候选字集207被送至CDL产生器209的后,CDL产生器209的运作方式如图4所示。请参照图4,当CDL产生器接收到候选字集207时,会对候选字集207内的字元,逐一依据CDL的语法来产生具有鉴别力的描述。本实施例提供了三种CDL语法让系统对目标字元进行描述。
A.结构描述,系统可以利用目标字元的结构来进行描述。如:『口天、吴』;『三横一竖、王』等。因此,例如当系统在描述目标字元『李』时,可以用字元『李』的结构进行描述,如『木子、李』来对目标字元『李』加以描述。
B.片语描述,系统可以利用包含有目标字元的片语、人名或者是成语等,来对目标进行描述。例如当系统在描述目标字元『李』的时,可以以『桃李满天下的李』或者是『李世民的李』等,来对目标字元『李』加以描述。
C.部首描述,系统可以利用目标字元的结构来进行描述。如:『火字旁的炎』;『三点水的流』等。因此,例如当系统在描述目标字元『李』时,可以用字元『李』的部首进行描述,如『木字旁的李』来对目标字元『李』加以描述。
综上所述,本发明至少有以下几个优点:
1.因此能有效地提升本发明的语音输入系统辨字的准确度;
2.另外,本发明因为使用CSL分析器和CDL产生器来对使用者语音输入的目标字元进行交叉比对,因此本发明不需再使用荧幕才能输出正确的字元。
3.本发明在产生候选字集的时候,同时会把所有容易混淆的字元加入,使得本发明的容错率也会提升。
虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明,任何熟习此技艺人士,在不脱离本发明的精神和范围内,当可作些许的更动与润饰,因此本发明的保护范围以申请的专利范围所界定为准。
Claims (13)
1.一种汉字字元的语音输入方法,包括下列步骤:
以语音输入一目标字元;
依据对该目标字元的拼音,而产生包括该目标字元的多数个候选字元资料;以及
依据对该目标字元的描述,而由该些候选字元中选出正确的该目标字元。
2.如权利要求1所述的汉字字元的语音输入方法,其特征在于,其中产生该些候选字元资料的步骤,还包括依据使用者对该目标字元输入的音节而产生。
3.如权利要求1所述的汉字字元的语音输入方法,其特征在于,其中对该目标字元的拼音的方法,包括汉文注音和拼音法。
4.如权利要求1所述的汉字字元的语音输入方法,其特征在于,其中对该还目标字元的描述的方法为一结构法,该结构法利用该目标字元的结构来进行描述。
5.如权利要求1所述的汉字字元的语音输入方法,其特征在于,其中对该目标字元的描述方法,为一片语法,该片语法利用包含该目标字元的片语、人名和成语三者其中之一来进行描述。
6.如权利要求1所述的汉字字元的语音输入方法,其特征在于,其中对该目标字元的描述方法,为一部首法,该部首法利用该目标字元的部首来进行描述。
7.如权利要求4、5或6所述的汉字字元的语音输入方法,其特征在于,针对该目标字元的描述方法,可为其中任一组合描述。
8.如权利要求1所述的汉字字元的语音输入方法,其特征在于,还包括告知使用者该些候选字元,使得使用者得以从该些候选字元选择该目标字元。
9.一种汉字字元的语音输入系统,包括:
一资料库,存放该语音输入系统的多数个汉字字元;
一字元拼音分析器,依据使用者对一目标字元的拼音的语音输入,由该资料库内撷取一候选字集;以及
一汉字描述语言产生器,依据该候选字集中的字元来产生具有鉴别力描述的语句,使得使用者得以依此从该候选字元中选择该目标字元。
10.如权利要求9所述的汉字字元的语音输入系统,其特征在于,其中使用者使用汉文注音和拼音法二者其中之一来对该目标字元拼音,使得该字元拼音分析器产生该候选字集。
11.如权利要求9所述的汉字字元的语音输入系统,其特征在于,其中该字元拼音分析器还依据使用者对该目标字元的音节的语音输入来产生该候选字集。
12.如权利要求9所述的汉字字元的语音输入系统,其特征在于,其中该汉字描述语言产生器依据该目标字元的结构和部首二者其中之一的描述,产生具有鉴别力描述的语句,使得使用者得以依此从该候选字集中至少选取该目标字元。
13.如权利要求9所述的汉字字元的语音输入系统,其特征在于,其中该汉字描述语言产生器依据使用者利用包括该目标字元的片语、人名和成语三者其中之一的描述,产生具有鉴别力描述的语句,使得使用者得以依此从该候选字集中至少选取该目标字元。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2004100332732A CN100419647C (zh) | 2004-03-29 | 2004-03-29 | 汉字字元的语音输入方法与系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2004100332732A CN100419647C (zh) | 2004-03-29 | 2004-03-29 | 汉字字元的语音输入方法与系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1677328A true CN1677328A (zh) | 2005-10-05 |
CN100419647C CN100419647C (zh) | 2008-09-17 |
Family
ID=35049869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004100332732A Expired - Fee Related CN100419647C (zh) | 2004-03-29 | 2004-03-29 | 汉字字元的语音输入方法与系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100419647C (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104166462A (zh) * | 2013-05-17 | 2014-11-26 | 北京搜狗科技发展有限公司 | 一种文字的输入方法和系统 |
CN104756183A (zh) * | 2012-08-29 | 2015-07-01 | 纽昂斯通讯公司 | 在智能汉语语音口述记录校正中使用字符描述器有效输入模糊字符 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1063554C (zh) * | 1994-03-03 | 2001-03-21 | 李琳山 | 中文电脑的汉语语音输入系统及其方法 |
CN1210301A (zh) * | 1997-07-11 | 1999-03-10 | 林廷 | 计算机声纹输入法和拼音联想法 |
CN1120436C (zh) * | 1997-09-19 | 2003-09-03 | 国际商业机器公司 | 用于识别孤立、非相关汉字的语音识别方法和系统 |
CN1278207C (zh) * | 2001-08-15 | 2006-10-04 | 安平 | 可用于手机的语音识别汉字输入法 |
CN1203390C (zh) * | 2002-08-02 | 2005-05-25 | 北京南山高科技有限公司 | 在具有精简键盘设备上语音输入汉字的方法和装置 |
-
2004
- 2004-03-29 CN CNB2004100332732A patent/CN100419647C/zh not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104756183A (zh) * | 2012-08-29 | 2015-07-01 | 纽昂斯通讯公司 | 在智能汉语语音口述记录校正中使用字符描述器有效输入模糊字符 |
CN104756183B (zh) * | 2012-08-29 | 2018-05-11 | 纽昂斯通讯公司 | 在智能汉语语音口述记录校正中使用字符描述器有效输入模糊字符 |
CN104166462A (zh) * | 2013-05-17 | 2014-11-26 | 北京搜狗科技发展有限公司 | 一种文字的输入方法和系统 |
CN104166462B (zh) * | 2013-05-17 | 2017-07-21 | 北京搜狗科技发展有限公司 | 一种文字的输入方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN100419647C (zh) | 2008-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Protopapas et al. | A comparative quantitative analysis of Greek orthographic transparency | |
Black et al. | Issues in building general letter to sound rules | |
Slimane et al. | A new arabic printed text image database and evaluation protocols | |
CN1187693C (zh) | 以自底向上方式将声调集成到汉语连续语音识别系统中的方法和系统 | |
CN111259976B (zh) | 基于多模态对齐与多向量表征的人格检测方法 | |
CN1804934A (zh) | 计算机辅助汉语发音学习方法 | |
Goldsmith | Probabilistic models of grammar: Phonology as information minimization | |
CN112489634A (zh) | 语言的声学模型训练方法、装置、电子设备及计算机介质 | |
GB2376554A (en) | Artificial language generation and evaluation | |
József et al. | Automated grapheme-to-phoneme conversion system for Romanian | |
Lőrincz | Concurrent phonetic transcription, lexical stress assignment and syllabification with deep neural networks | |
CN1677328A (zh) | 汉字字元的语音输入方法与系统 | |
CN111429886B (zh) | 一种语音识别方法及系统 | |
CN1645356A (zh) | 多维汉语学习系统 | |
Littell | Finite-state morphology for kwak’wala: A phonological approach | |
Akinwonmi | Development of a prosodic read speech syllabic corpus of the Yoruba language | |
CN1350224A (zh) | 两笔优化拼音输入法及其键盘 | |
CN1257444C (zh) | 计算机汉语全音输入法 | |
Ainsworth et al. | Connectionist architectures for a text-to-speech system. | |
US20050216276A1 (en) | Method and system for voice-inputting chinese character | |
CN1323004A (zh) | 汉语盲文到汉字的自动转换方法 | |
Shulby et al. | Automatic disambiguation of homographic heterophone pairs containing open and closed mid vowels | |
Wang | Statistical analysis of mandarin acoustic units and automatic extraction of phonetically rich sentences based upon a very large chinese text corpus | |
CN1106146A (zh) | 电脑汉字声韵调编码输入法及其键盘 | |
Berckmans | Grapheme-to-Phoneme Conversion using Recurrent and Convolutional Neural Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20080917 Termination date: 20190329 |