CN102915224A - 以数字辅助输入、修正的语音输入系统及其方法 - Google Patents
以数字辅助输入、修正的语音输入系统及其方法 Download PDFInfo
- Publication number
- CN102915224A CN102915224A CN 201110218663 CN201110218663A CN102915224A CN 102915224 A CN102915224 A CN 102915224A CN 201110218663 CN201110218663 CN 201110218663 CN 201110218663 A CN201110218663 A CN 201110218663A CN 102915224 A CN102915224 A CN 102915224A
- Authority
- CN
- China
- Prior art keywords
- voice
- letter
- input
- phonetic
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明揭露了一种以数字辅助输入的语音输入系统、一种于语音输入系统中以数字辅助输入的方法及一种于语音输入系统中以数字辅助修正的方法,其于一电子装置的语音输入系统中透过软件驱动而至少提供一语音输入逻辑电路,以分别将one至twenty six等26个数字的发音依序对应定义于A至Z等26个英文字母,并允许用户选择性地于以语音输入时以one至twenty six等26个数字的发音取代以A至Z的发音做字母的输入或错误字符串的字母增加、删除及修订等修正动作。
Description
技术领域
本发明有关于一种以数字辅助输入的语音输入系统、于语音输入系统中以数字辅助输入的方法及于语音输入系统中以数字辅助修正的方法,特指一种可选择性以数字的发音取代字母的发音的语音输入技术手段的应用。
背景技术
随着科技的进步,各种具备运算处理系统的电子设备充斥于现代人的日常生活中,诸如桌上或手提电脑、智能手机、PDA等等,而为了进一步提升该类型电子设备在使用上的便利性,因此输入的技术手段亦不断地推陈出新,而其中以语音辅助作为输入的方式为便利性最佳的一种,其除了可省却使用者的手控或书写操作所带来的困扰外,更造福了因残疾或者老迈而无法自由使用手部做操作的使用者。
然而,现有技术中的语音输入技术于发展上虽逐渐成熟,但于语音识别的准确率上始终仍具有瓶颈,无法达到百分的百的正确率,因此如何提高于该类型的电子设备上输入的准确性,以及如何于遭遇辨识错误时可快速修正以减少因为输入错误所担搁的时间,以避免如过去需要重复不断的尝试直至其辨识正确或者进而改以手控辅助输入等窘境,此为目前语音输入技术手段最需要补强的着眼点,亦为其输入准确率上做改善的难点所在,故基于上述原因考虑,本发明的发明人思索并设计一种以数字辅助输入的语音输入系统、于语音输入系统中以数字辅助输入的方法及于语音输入系统中以数字辅助修正的方法,以期针对现有技术的缺失加以改善,进而增进产业上的实施利用。
发明内容
鉴于上述问题,本发明的主要目的就是在提供一种具备新颖性、进步性及产业利用性等专利要件的以数字辅助输入的语音输入系统、于语音输入系统中以数字辅助输入的方法及于语音输入系统中以数字辅助修正的方法,以期克服现有技术的难点。
为达到上述目的,本发明所采用的技术手段为设计一种以数字辅助输入的语音输入系统,其包含:
一音源输入单元,其为一可供用户输入语音的收音装置;一显示单元,其可受驱控而以一画面对用户做信息显示;及一逻辑处理单元,其为包含至少一处理器及储存装置的逻辑电路,其电性连接于该音源输入单元及该显示单元,透过软件的驱动而可提供一语音输入逻辑电路;其中该语音输入逻辑电路可供用户透过该音源输入单元以语音方式做输入,以读出逐个字母做单字拼读的输入动作,且于用户读出字母时做语音识别并选取最相近的一字母于该显示单元上做排列显示,且该语音输入逻辑电路并分别将one至twenty six等26个数字的发音依序对应定义于A至Z等26个英文字母,进而允许用户选择性地于语音输入时以one至twenty six等26个数字的发音取代直接以A至Z的发音做字母的输入。
其中,该音源输入单元或可为一麦克风,且其中,该显示单元为一液晶显示器。
且本发明进一步提出另一种以数字辅助输入的语音输入系统,其包含:
一音源输入单元,其为一可供用户输入语音的收音装置;一显示单元,其可受驱控而以一画面对用户做信息显示;及一逻辑处理单元,其为包含至少一处理器及储存装置的逻辑电路,其电性连接于该音源输入单元及该显示单元,透过软件的驱动而可提供一语音输入逻辑电路及一语音输入修正逻辑电路;其中该语音输入逻辑电路分别将one至twenty six等26个数字的发音依序对应定义于A至Z等26个英文字母,进而允许用户选择性地以one至twenty six等26个数字的发音取代直接以A至Z的发音做输入,且该语音输入逻辑电路可选择性供用户透过该音源输入单元以语音方式做输入,以读出逐个字母做单字拼读的输入动作,且于用户读出字母时做语音识别并选取最相近的一字母于该显示单元上做排列显示,或者该语音输入逻辑电路可选择性允许用户直接做单字的发音,而后辨识语音并选取最相符的对应单字于该显示单元做显示;其中该语音输入修正逻辑电路可提供复数修正用的语音指令,以供用户以语音方式对语音输入中错误的字母进行修正。
其中,该语音输入修正逻辑电路可首先将待修正的字符串以连续的复数字为一区块,而后该语音输入修正逻辑电路提供增加字母、删除字母、订正字母、修改区块等四种修正模式的对应修正用的语音指令,以允许用户用念出对应的修正模式的修正语音指令针对待修正的字符串进行修正,且该四种修正模式分别对应于四个不同的语音,并透过设定允许用户于一特定语音指令串中,配合至少包含有该四个修正模式其中之一的语音、指定对应修改的字母所属区块的语音指令元及指定对应修改字母序的语音指令元做为参数,来指定修正字符串中特定位置的字母做修正。
其中,该语音输入修正逻辑电路系为将待修正的字符串以连续三个字分为一区块;其中,该音源输入单元为一麦克风,且其中该显示单元为一液晶显示器。
再者,本发明进一步提出一种于语音输入系统中以数字辅助输入的方法,其系于一电子装置的语音输入系统中透过软件驱动而提供一语音输入逻辑电路,以分别将one至twenty six等26个数字的发音依序对应定义于A至Z等26个英文字母,并允许用户选择性地于以语音输入时以one至twenty six等26个数字的发音取代以A至Z的发音做字母的输入。
再者,本发明又进一步提出一种于语音输入系统中以数字辅助修正的方法,其系于一电子装置的语音输入系统中透过软件驱动而提供一语音输入修正逻辑电路,该语音输入修正逻辑电路提供复数修正用的语音指令,以供于用户发现初始语音输入辨识错误时,透过语音方式对语音输入中错误的字母进行修正。
其中,该语音输入修正逻辑电路首先将待修正的字符串以连续的复数字为一区块,而后该语音输入修正逻辑电路提供增加字母、删除字母、订正字母、修改区块等四种修正模式的修正语音指令,以允许用户念出对应的修正模式的修正语音指令针对待修正的字符串进行修正,且该四种修正模式分别对应于四个不同的语音,而该语音输入修正逻辑电路更透过设定允许用户于一特定语音指令串中,配合包含有该四个修正模式其中之一的语音、指定对应修改的字母所属区块的语音指令元及指定对应修改字母序的语音指令元做为参数,来指定针对待修正字符串中特定区块及特定字母序的字母做四种模式其中之一的修正。
相较于先前技术,本发明于设计上可在用户的语音输入上提供高度的便利特征,如此的技术手段将可有效率地避免英文字母间发音相似而辨识不清的问题发生,以期增加语音输入的准确性及流畅性,改善现有技术中语音输入的缺失,且一但语音系统发生辨识错误的字符串产生时,用户更可透过快速的语音指令直接指定字符串中待修正的字母进行增加、删除、订正等等动作,可确实且大幅度地减少辨识错误时的修正动作时间,以免除因为辨识不清而需要不断重复的尝试或者是改以手动修正等困扰。
附图说明
图1为本发明的以数字辅助输入的语音输入系统示意图。
图2为本发明的以数字辅助输入的语音输入系统于语音输入系统中以数字辅助输入的方法及于语音输入系统中以数字辅助修正的方法的实施例图。
图3至6为本发明中四种对应图3的修正动作实施例图。
具体实施方式
为利于贵审查员了解本发明的发明特征、内容与优点及其所能达成的功效,兹将本发明配合附图,并以实施例的表达形式详细说明如下,而其中所使用的图式,其主旨仅为示意及辅助说明书的用,未必为本发明实施后的真实比例与精准配置,故不应就所附的图式的比例与配置关系局限本发明于实际实施上的专利范围,合先叙明。
请配合参看图1所示,本发明为一种以数字辅助输入的语音输入系统,其可实施应用于各种智能型电子装置中,例如计算机、智能型手机或PDA,以做为辅助语音输入的正确性以及减少辨识错误时后续修正的复杂性的技术手段,而该数字辅助输入的语音输入系统于一较佳的实施方式中包含有一音源输入单元(10)、一显示单元(20)及一逻辑处理单元(30)。
前述的音源输入单元(10)为一可供用户输入语音的收音装置,例如为一麦克风。
前述的显示单元(20)可受驱控而以一画面对用户做信息显示,例如可为一液晶显示器。
前述的逻辑处理单元(30)为包含至少一处理器及储存装置的逻辑电路,其电性连接于该音源输入单元(10)及该显示单元(20),透过软件的驱动而可提供至少一语音输入逻辑电路(31)及一语音输入修正逻辑电路(32)。
其中该语音输入逻辑电路(31)可供使用者透过该音源输入单元(10)以语音方式做输入,例如至少可允许使用者以读出逐个字母做单字拼读的输入动作,且于用户读出字母时做语音识别并选取最相近的一字母于该显示单元(20)上做排列显示。此外,该语音输入逻辑电路并分别将1(one)至26(twenty six)等26个数字的发音依序对应定义于A至Z等26个英文字母,进而允许用户选择性地于输入时以1(one)至26(twenty six)等26个数字的发音取代直接以A至Z的发音做字母的输入,例如当用户要输入A-B-C等字符串时,可取而代的以读出1-B-C或者是A-2-C或者是A-B-3,以避免因为于特定的字母间辨识度不高(例如T与C,或A、S与X等,或者A辨识为AA,PE辨识为P等常见情事)的问题而影响输入的流畅性。
而其中1至26的数字语音由于在语音识别技术领域中正确率接近100%,无如英文字母间因为发音相似度高而容易产生混淆,故于实施上无虞。
此外,该语音输入逻辑电路(31)供用户使用输入的语音方式,或者更进一步地可选择性允许使用者直接做单字的发音,而后辨识语音并选取最相符的对应单字于该显示单元(20)做显示。
请进一步配合参看图2所示,其中该语音输入修正逻辑电路(32)可提供复数修正用的语音指令,以供用户以语音方式对语音输入中错误的字母进行修正。例如当用户欲输入的字符串papigoe被误判为gagigoe时,该语音输入修正逻辑电路(32)首先将待修正的字符串以连续的复数字为一区块(block),例如以3个字为一区块,则papigoe即划分为三区块,即pap-igo-e,而同理自然也可以选择性以2个字、4个字或其他字数做为一区块,不在此限。
而后该语音输入修正逻辑电路(32)提供至少四种修正模式的修正语音指令以允许用户以念出对应的修正模式的修正语音指令针对待修正的字符串进行修正,该四种修正模式分别增加字母、删除字母、订正字母、修改区块等,且该四种修正模式分别对应于四个不同的语音,例如增加字母对应于add的语音,删除字母对应于delete的语音,订正字母对应于modify的语音,修改区块对应于correct的语音,并透过设定允许用户于一特定语音指令串中,配合至少包含有该四个修正模式的语音、指定对应修改的字母所属区块的语音指令元及指定对应修改字母序的语音指令元做为参数,来指定针对待修正字符串中特定区块及特定字母序的字母做四种模式的修正,例如:
请进一步配合参看图3至图6所示,当使用者说”ADD letter 6beforesecond letter in first block”即可驱动语音输入修正逻辑电路(32)于第一区块的第二个字母前增加f字母;
当用户说”DELETE second letter in second block”即可驱动语音输入修正逻辑电路(32)删除第二区块中的第二个字母;
当用户说”MODIFY first letter in second block with letter 2”即可驱动语音输入修正逻辑电路(32)将第二区块的第一个字母订正为b字母;
当使用者说”CORRECT first block with letters 135”即可驱动语音输入修正逻辑电路(32)将第一区块的字母取代为ace。然而前述四种模式的语音指令编排逻辑仅为示例性,尚可能有无限的变化,惟利用此原则做修正手段者皆为本发明的专利范畴所涵盖。
而本发明进一步提出一种于语音输入系统中以数字辅助输入的方法,其于一电子装置的语音输入系统中透过软件驱动而提供一语音输入逻辑电路,其分别将1至26等26个数字的发音依序对应定义于A至Z等26个英文字母,进而允许用户选择性地于以语音输入时以1至26等26个数字的发音取代直接以A至Z的发音做字母的输入。
此外,本发明再进一步提出一种于语音输入系统中以数字辅助修正的方法,其于一电子装置的语音输入系统中透过软件驱动而提供一语音输入修正逻辑电路(32),其于用户发现初始语音输入辨识错误时提供复数修正用语音指令,以供用户以语音方式对语音输入中错误的字母进行修正,该语音输入修正逻辑电路(32)首先将待修正的字符串以连续的复数字为一区块,而后该语音输入修正逻辑电路(32)提供至少四种修正模式的修正语音指令,以允许用户念出对应的修正模式的修正语音指令针对待修正的字符串进行修正。
该四种修正模式分别增加字母、删除字母、订正字母、修改区块等四种,且该四种修正模式分别对应于四个不同的语音,例如增加字母对应于add的语音,删除字母对应于delete的语音,订正字母对应于modify的语音,修改区块对应于correct的语音,并透过设定允许用户于一特定语音指令串中,配合至少包含有该四个修正模式其中之一的语音、指定对应修改的字母所属区块的语音指令元及指定对应修改字母序的语音指令元做为参数,来指定针对待修正字符串中特定区块及特定字母序的字母做四种模式其中之一的修正。
而透过本发明于设计上的巧思变化,可于用户的语音输入上提供高度的便利特征,如此的技术手段将可有效率地避免英文字母间发音相似而辨识不清的问题发生,以期增加语音输入的准确性及流畅性,改善现有技术中语音输入的缺失,且一但语音系统发生辨识错误的字符串产生时,用户更可透过快速的语音指令直接指定字符串中待修正的字母进行增加、删除、订正等等动作,可确实且大幅度地减少辨识错误时的修正动作时间,以免除因为辨识不清而需要不断重复的尝试或者是改以手动修正等困扰,有利于实际的实施,故可见其增益性所在。
以上所述的实施例仅为说明本发明的技术思想及特点,其目的在使熟习此项技艺的人士能够了解本发明的内容并据以实施,当不能以的限定本发明的专利范围,即大凡依本发明所揭示的精神所作的均等变化或修饰,仍应涵盖在本发明的专利范围内。
综观上述,可见本发明在突破先前的技术下,确实已达到所欲增进的功效,且也非熟悉该项技艺者所易于思及,其所具的进步性、实用性,显已符合专利的申请要件,爰依法提出专利申请,恳请贵局核准本件发明专利申请案,以励发明,至感德便。
Claims (10)
1.一种以数字辅助输入的语音输入系统,其特征在于,该系统包含:
一音源输入单元,其为一可供用户输入语音的收音装置;
一显示单元,其可受驱控而以一画面对用户做信息显示;及
一逻辑处理单元,其为包含至少一处理器及储存装置的逻辑电路,其电性连接于该音源输入单元及该显示单元,透过软件的驱动而可提供一语音输入逻辑电路;
其中该语音输入逻辑电路可供用户透过该音源输入单元以语音方式做输入,以读出逐个字母做单字拼读的输入动作,且于用户读出字母时做语音识别并选取最相近的一字母于该显示单元上做排列显示,且该语音输入逻辑电路并分别将one至twenty six等26个数字的发音依序对应定义于A至Z等26个英文字母,进而允许用户选择性地于语音输入时以one至twenty six等26个数字的发音取代直接以A至Z的发音做字母的输入。
2.根据权利要求1所述的以数字辅助输入的语音输入系统,其特征在于,该音源输入单元为一麦克风。
3.根据权利要求1所述的以数字辅助输入的语音输入系统,其特征在于,该显示单元为一液晶显示器。
4.一种以数字辅助输入的语音输入系统,其特征在于,该系统包含:
一音源输入单元,其为一可供用户输入语音的收音装置;
一显示单元,其可受驱控而以一画面对用户做信息显示;及
一逻辑处理单元,其为包含至少一处理器及储存装置的逻辑电路,其电性连接于该音源输入单元及该显示单元,透过软件的驱动而可提供一语音输入逻辑电路及一语音输入修正逻辑电路;
其中该语音输入逻辑电路分别将one至twenty six等26个数字的发音依序对应定义于A至Z等26个英文字母,进而允许用户选择性地以one至twentysix等26个数字的发音取代直接以A至Z的发音做输入,且该语音输入逻辑电路可选择性供用户透过该音源输入单元以语音方式做输入,以读出逐个字母做单字拼读的输入动作,且于用户读出字母时做语音识别并选取最相近的一字母于该显示单元上做排列显示,或者该语音输入逻辑电路可选择性允许用户直接做单字的发音,而后辨识语音并选取最相符的对应单字于该显示单元做显示;
其中该语音输入修正逻辑电路可提供复数修正用的语音指令,以供用户以语音方式对语音输入中错误的字母进行修正。
5.根据权利要求4所述的以数字辅助输入的语音输入系统,其特征在于,该语音输入修正逻辑电路可首先将待修正的字符串以连续的复数字为一区块,而后该语音输入修正逻辑电路提供增加字母、删除字母、订正字母、修改区块等四种修正模式的对应修正用的语音指令,以允许用户用念出对应的修正模式的修正语音指令针对待修正的字符串进行修正,且该四种修正模式分别对应于四个不同的语音,并透过设定允许用户于一特定语音指令串中,配合至少包含有该四个修正模式其中之一的语音、指定对应修改的字母所属区块的语音指令元及指定对应修改字母序的语音指令元做为参数,来指定修正字符串中特定位置的字母做修正。
6.根据权利要求5所述的以数字辅助输入的语音输入系统,其特征在于,该语音输入修正逻辑电路为将待修正的字符串以连续三个字分为一区块。
7.根据权利要求5所述的以数字辅助输入的语音输入系统,其特征在于,该音源输入单元为一麦克风,且其中该显示单元为一液晶显示器。
8.一种于语音输入系统中以数字辅助输入的方法,其于一电子装置的语音输入系统中透过软件驱动而提供一语音输入逻辑电路,以分别将one至twentysix等26个数字的发音依序对应定义于A至Z等26个英文字母,并允许用户选择性地于以语音输入时以one至twenty six等26个数字的发音取代以A至Z的发音做字母的输入。
9.一种于语音输入系统中以数字辅助修正的方法,其于一电子装置的语音输入系统中透过软件驱动而提供一语音输入修正逻辑电路,该语音输入修正逻辑电路提供复数修正用的语音指令,以供于用户发现初始语音输入辨识错误时,透过语音方式对语音输入中错误的字母进行修正。
10.根据权利要求9所述的于语音输入系统中以数字辅助修正的方法,其特征在于,该语音输入修正逻辑电路首先将待修正的字符串以连续的复数字为一区块,而后该语音输入修正逻辑电路提供增加字母、删除字母、订正字母、修改区块等四种修正模式的修正语音指令,以允许用户念出对应的修正模式的修正语音指令针对待修正的字符串进行修正,且该四种修正模式分别对应于四个不同的语音,而该语音输入修正逻辑电路更透过设定允许用户于一特定语音指令串中,配合包含有该四个修正模式其中之一的语音、指定对应修改的字母所属区块的语音指令元及指定对应修改字母序的语音指令元做为参数,来指定针对待修正字符串中特定区块及特定字母序的字母做四种模式其中之一的修正。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110218663 CN102915224A (zh) | 2011-08-01 | 2011-08-01 | 以数字辅助输入、修正的语音输入系统及其方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110218663 CN102915224A (zh) | 2011-08-01 | 2011-08-01 | 以数字辅助输入、修正的语音输入系统及其方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102915224A true CN102915224A (zh) | 2013-02-06 |
Family
ID=47613601
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201110218663 Pending CN102915224A (zh) | 2011-08-01 | 2011-08-01 | 以数字辅助输入、修正的语音输入系统及其方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102915224A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104423625A (zh) * | 2013-08-21 | 2015-03-18 | 卡西欧计算机株式会社 | 字符输入装置及字符输入方法 |
-
2011
- 2011-08-01 CN CN 201110218663 patent/CN102915224A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104423625A (zh) * | 2013-08-21 | 2015-03-18 | 卡西欧计算机株式会社 | 字符输入装置及字符输入方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7164367B2 (en) | Component-based, adaptive stroke-order system | |
WO2008124769A1 (en) | Multi-mode input method editor | |
CN103578467A (zh) | 声学模型的建立方法、语音辨识方法及其电子装置 | |
CN1609777A (zh) | 用于字母识别的装置和方法 | |
CN104239289B (zh) | 音节划分方法和音节划分设备 | |
CN110738997A (zh) | 一种信息修正方法、装置、电子设备及存储介质 | |
CN102929394B (zh) | 一种基于手势识别的盲文输入法 | |
CN109754791A (zh) | 声控方法及系统 | |
KR20100081511A (ko) | 중국어 발음을 성조를 나타내는 소정기호를 포함하는 한글 발음기호로 표시 가능한 시스템 및 그 시스템을 이용한 중국어 발음을 성조를 나타내는 소정기호를 포함하는 한글 발음기호 표시 방법 및 중국어의 발음과 중국어 성조를 한글 발음기호로 표기하는 시스템 및 그 시스템을 이용한 중국어 발음과 중국어 성조를 한글 발음기호로 표기하는 방법 | |
CN103616960A (zh) | 六元音字母双拼输入法 | |
CN102915224A (zh) | 以数字辅助输入、修正的语音输入系统及其方法 | |
CN104035551A (zh) | 一种输入方法及电子设备 | |
CN103246354A (zh) | 以通用语文字编码表达汉字的输入法及其键盘 | |
CN1607492B (zh) | 数字式电子设备及使用该设备的汉语拼音输入法 | |
CN105183183A (zh) | 一种方块苗文的音形结合快速输入编码及其优化方法 | |
CN107251137A (zh) | 利用语音改善至少一种语义单元的集合的方法、装置及计算机可读记录介质 | |
CN104571593A (zh) | 全部汉字汉词简易无重码统一输入法 | |
CN210072560U (zh) | 一种汉字发音输入设备 | |
CN202795239U (zh) | 汉语拼音虚拟键盘 | |
CN106325540B (zh) | 一种滇东北次方言苗文的简笔输入法及其应用 | |
KR101243754B1 (ko) | 한글 자모를 활용한 중국 문자의 발음 표기 시스템 | |
CN107066080B (zh) | 汉字字音汉字与符号编码输入方法 | |
CN102012749A (zh) | 汉字十笔画编码 | |
CN107066104B (zh) | 电脑汉英互读互译键盘最佳键位 | |
CN103257717A (zh) | 实用型吴语上海话输入法拼音方案及键盘 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130206 |