CN1427333A - 一种语音输入输出方法以及装置 - Google Patents
一种语音输入输出方法以及装置 Download PDFInfo
- Publication number
- CN1427333A CN1427333A CN 01144523 CN01144523A CN1427333A CN 1427333 A CN1427333 A CN 1427333A CN 01144523 CN01144523 CN 01144523 CN 01144523 A CN01144523 A CN 01144523A CN 1427333 A CN1427333 A CN 1427333A
- Authority
- CN
- China
- Prior art keywords
- unit
- voice
- output
- electronic installation
- function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Mobile Radio Communication Systems (AREA)
Abstract
一种语音输入输出方法以及装置,其可适用于一资讯电子装置上,该资讯电子装置具有一扬声器以及一麦克风,并且须预先安装一语音资料库以及一功能程序库,该语音资料库包括由复数个用以识别该资讯电子装置中各功能单元的控制码、各字母(a-z)以及各数字(0-9)所构成,该功能程序库用以储存多个驱动该资讯电子装置中各功能单元执行运作时的程序码,其中,各功能单元所对应的程序码皆具有一专属的控制码。
Description
技术领域
本发明是有关于一种语音输入输出方法以及装置,具体地说,本发明是可适用于一资讯电子装置上的语音输入输出方法以及装置。
背景技术
近年来由于经济发展的繁荣以及休闲活动的被受重视,使出差及出外旅行的人口随的增加,并且为了满足人们能随时随地处理以及取得所需的资讯,因此,例如个人数字助理(PDA)、掌上型电脑(Pocket PC)、电子字典或手机等可携带式资讯电子装置的需求量不断地提升。
而今出国出差或旅行人士觉得困扰的事不外乎语言不通、汇率计算困难、时间的差距、数字计算、日期的误差、临时资料的记录、电话号码的记忆等诸多问题。目前的可携带式资讯电子装置皆可改善上述的种种问题,但是,在使用此些可携带式资讯电子装置或一般资讯电子装置时均需以键盘按压的方式来执行操作程序,使用上确实有其不方便存在,甚至对于年长或年幼的使用者而言,因视力不佳或手指动作不灵活的情况下,此种按键操作程序更是不方便。
再者,该些资讯电子装置在执行运作时,例如进行数字计算或透过内建的电话簿来查询联络人电话等处理时,使用者往往需近靠于该资讯电子装置前,以观得其显示器上所显示出的运作结果,此种结果取得的方式也有不便性。
发明内容
本发明的主要目的在于提供一种语音输入输出方法以及装置,其可应用于一资讯电子装置,由此不须以键盘输入,即可操作该资讯电子装置。
本发明的另一目的在于提供一种语音输入输出方法以及装置,其可应用于一资讯电子装置,由此让使用者不须观看显示器即可取得该资讯电子装置的运作结果。
为实现上述目的,本发明提供的一种语音输入输出方法,其可适用于一资讯电子装置上,且该资讯电子装置架构至少具有一语音输入单元以及一语音输出单元,该语音输入输出方法:
(1)预先安装一语音资料库于该资讯电子装置上,其中,该语音资料库是包括由复数个用以识别该资讯电子装置中各功能单元的控制码、各字母(a-z)以及各数字(0-9)所构成,该些控制码由一或复数个字母或数字所组成,而该些控制码、字母以及数字皆对应一专属的语音信号,以作为语音辨识之用;
(2)预先安装一功能程序库于该资讯电子装置上,其中,该功能程序库是用以储存多个驱动该资讯电子装置中各功能单元执行运作时的程序码,其中,各功能单元所对应的程序码具有一专属的控制码;
(3)使用者以单一字母、单一数字、简单几个单音节或多音节的指令依序发音,并输入至该语音输入单元中;
(4)由该资讯电子装置的一语音辨识模块接收来自使用者的声音信号,以自该语音资料库中找寻与该声音信号相对应的字母、数字或控制码;
(5)当语音辨识模块中根据该声音信号而找寻到与其相对应的字母或数字时,则进行步骤(6),否则若找寻到与其相对应的控制码时,即自该功能程序库中取出与其相对应的控制码,以执行与该控制码相对应的功能单元,接著返回该步骤(4);
(6)由功能控制模块判断目前是否正在执行功能单元,若是时,即将此些字母或数字暂存于一记忆缓冲区内,以作为该功能单元执行运作时所需的资料来源,接著进行步骤(7);否则返回该步骤(4);以及
(7)当该功能单元产生运作结果时,由语音输出处理模块将功能控制模块所传来的运作结果以线性预测编码(Linear Prediction Code;LPC)方式加以运算,并将运算结果传至该语音输出单元,以供使用者以听觉方式取得结果,并返回该步骤(3)。
其中该资讯电子装置的各功能单元包括一电子字典功能单元、一计算机功能单元、一记事本功能单元、一频道设定选台功能单元及一电话簿功能单元。
其中该资讯电子装置还包括一显示单元,于步骤(7)时,当该功能单元产生运作结果时,由该功能控制模块判断该资讯电子装置不为语音方式输出运作结果时,由功能控制模块将运作结果传至该显示单元中,以供使用者以视觉方式取得结果,并返回步骤(3)。
其中该语音辨识模块包括一具有语音辨识功能的微处理器。
其中该功能控制模块包括一具有资料处理功能的微处理器。
其中该语音输出处理模块包括一具有数字信号处理功能的微处理器。
其中该语音输入单元为一麦克风。
其中该显示单元为一液晶显示器。
其中该语音输出单元为一扬声器。
其中该电子字典功能单元、计算机功能单元、记事本功能单元、频道设定选台功能单元及电话簿功能单元为一软件模块。
其中该资讯电子装置为一可携带式电子装置。
其中该可搅带式电子装置为一个人数字助理(PDA)、一掌上型电脑(Pocket PC,)、一手机、一电子字典或一笔记型电脑。
其中该资讯电子装置为一电话或一桌上型电脑。
本发明提供的一种语音输入输出装置,其可适用于一资讯电子装置上,且该资讯电子装置构成至少具有一语音输入单元以及一语音输出单元,该语音输入输出装置包含:
一语音资料库,该语音资料库包括由复数个用以识别该资讯电子装置中各功能单元的控制码、各字母(a-z)以及各数字(0-9)所构成,其中,该些控制码由一或复数个字母或数字所组成,而该控制码、字母以及数字皆对应一专属的语音信号,以作为语音辨识之用;
一功能程序储存器,用以储存各功能单元执行运作时所需的程序,其中,各功能单元皆具有一用以辨别的控制码;
一语音辨识模块,当使用者由该语音输入单元依序以一字母、一数字、简单几个单音节或多音节的指令的输入方式来输入声音信号后,即由该语音辨识模块自该语音资料库中找出与该声音信号相对应的控制码、字母或字母;
一功能控制模块,若当该语音辨识模块找出一控制码时,使功能控制模块即自功能程序储存器中找出与该控制码相对应的程序,以驱使该资讯电子装置执行运作,若当该语音辨识模块找出一字母或数字时,即将该字母或数字暂存于一记忆缓冲区内。以作为该功能单元执行运作时所需的资料来源;以及
一语音输出处理模块,当该资讯电子装置的输出运作结果设为语音输出方式时,即由该语音输出处理模块将该功能控制模块所产生的运作结果以线性预测编码(Linear Prediction Code;LPC)方式予以运算,并将运算后的结果传至该语音输出单元,以供使用者以听觉方式取得结果。
其中该资讯电子装置的各功能单元包括一电子字典功能单元、一计算机功能单元、一记事相关功能功能、一频道设定选含功能单元及一电话簿功能单元。
其中该资讯电子装置又包括一显示单元,当该资讯电子装置的输出运作结果不设为语音输出方式时,由功能控制模块将运作结果传至该显示单元中,以供使用者以视觉方式取得结果。
其中该语音辨识模块包括一具有语音辨识功能的微处理器。
其中该功能控制模块包括一具有资料处理功能的微处理器。
其中该语音输出处理模块包括一具有数字信号处理功能的微处理器。
其中该语音输入单元为一麦克风。
其中该显示单元为一液晶显示器。
其中该语音输出单元为一扬声器。
其中该电子字典功能单元、计算机功能单元、记事本功能单元、频道设定选台功能单元及电话簿功能单元为一软件模块。
其中该资讯电子装置为一可携带式电子装置。
其中该可携带式电子装置为一个人数字助理(PDA)、一掌上型电脑(Pocket PC)、一手机、一电子字典或一笔元型电脑。
其中该资讯电子装置为一电话或一桌上型电脑。
由于本发明是利用26个英文字母、0到9的阿拉伯数字以及简单的几个单音或多音节所组成的语音指令输入方式来取代目前必需透过手动键盘输入方式以便驱动装置来执行功能,因此,本发明是以语音方式驱动功能功能免除需由按键输入指令或资料,以及需由显示荧幕浏览运作结果以及操作步骤等诸多不便。
附图说明
为了让本发明的上述目的、特征以及其优点能更明显易懂,将与较佳实施例,并配合附图,详细说明本发明的实施例,附图简述如下,其中:
图1为一示意方块图,其显示本发明的语音输入输出装置的基本构造图;
图2为一示意方块图,其显示图1的语音辨识模块内的软硬件构成图;
图3为一示意方块图,其显示图1的功能控制模块内的软硬件构成图;
图4为一示意方块图,其显示图1的语音输出处理模块内的软硬件构成图;
图5为一运作流程图,其中显示本发明的语音输入输出装置的语音辨识模块执行运作时的流程程序;
图6为一运作流程图,其中显示本发明的语音输入输出装置的功能控制模块执行运作时的流程程序:以及
图7为一运作流程图,其中显示本发明的语音输入输出装置的语音输出处理模块执行运作时的流程程序。
具体实施方式
请参阅图1,其用以显示本发明的语音输入输出装置的基本构成图。如图所示,本发明的语音输入输出装置100是应用于例如包括一个人数字助(PDA)、一掌上型电脑(Pocket PC)、一电子字典或一手机等可携带式资讯电子装置中,抑或应用于例如包括一电话或一桌上型电脑专固定式的资讯电子装置中,就语音输入输出装置100包含一语音输入单元101(例如麦克风)、一显示单102(例如液晶显示器)、一语音输出单元103(例如扬声器)、一语音辨识模块110、一功能控制模块120以及一语音输出处理模块140。首先,由使用者依序发出字母(a-z)、数字(0-9)、简单几个单音节或多音节的指令依序发音逐一传入该语音输入单元101后,使该语音辨识模块110判断出使用者所输入的执行指令、而由功能控制模块120根据该输入指令来执行储存于该功能控制模块120中的功能程序(请容后再述),且根据使用者的设定而将该功能程序所执行的运作结果显示于该显示单元102上,抑或由该语音输出处理模块140对该运作结果再一次进行运算处理,以由语音输出单元103将运作结果以语音方式传给使用者。
请参阅图2,其用以显示图1的语音辨识模块110内的软硬件构成图。如图所示,该语音辨别模块110中包含第一微处理器111、一语音资料库112及第一存储器单元113。
该第一微处理器111负责语音辨识工作,其与该语音输入单元101、第一记存储器单元113以及该功能控制模块120耦接,用以执行第一存储器单元113中所储存的程序,其为该语音辨识模块110的主控单元。
该语音资料库112储存于该第一存储器单元113中,配合该语音输入输出装置的功能而预先建立,并包括由复数个用以识别该语音输入输出装置中各功能单元的控制码、各字母(a-z)以及各数字(0-9)所构成,其中,该些控制码由一或复数个字母或数字所组成,例如包括“alt1”或“alt2”等,以及“fun1”或“fun2”等的简单的几个单音或多音节所组成的控制指令,而该控制码、字母以及数字皆对应一专属的语音信号,以供语音识别模块110作为语音辨识之用。
第一存储器单元113可为任何该第一微处理器111得直接存取及执行程序的存储器,例如包含只读存储器(Read Only Memory;ROM)及随机存取存储器(Random Access Memory;RAM),用以存取语音辨识模块110在运作上所须的各个程序及资料,其包含一语音辨识程序114及第一微机通讯程序115,这些程序皆由第一微处理器111来执行。其中,当第一微处理器111接收到由该语音输入单元101所传来的声音信号后,即执行该语音辨识程序114,并由该语音辨识程序114自语音资料库112中根据该声音信号取出对应的控制码、字母或数字;而该第一微机通讯程序115是作为第一微处理器111与位于该功能控制模块120内的微处理器(如图3所示的第二微处理器121)间传输资料的控制程序,以令第一微处理器111将辨识出的控制码、字母或数字传至功能控制模块120中。
请参阅图3,其用以显示图1的功能控制模块120内的软硬件构成图。如图所示,该功能控制模块120中包含第二微处理器121及第二存储器单元122。第二微处理器121执行该语音输入输出装置100所能提供给使用者的功能,其与该显示单元102、该第一微处理器111、该第二存储器单元122以及该语音输出处理模块140藕接,其中,该第二微处理器121用以执行第二存储器单元122中所储存的程序以执行该语音输入输出装置100的功能(请容后说明)。为简化附图及说明,此处的系统构成仅显示与本发明有关的系统构件,其它无关的系统构件,例如收音机相关电路等构件,并未显示于图式中。
第二存储器单元122可为任何该第二微处理器121得直接存取及执行程序的存储器,例如包含只读存储器(Read Only Memory,ROM)及随机存取存储器(Random Access Memory,RAM),用以存取功能控制模块120在运作上所须的各个程序及资料,其包含一功能处理程序123、一电子字典功能程序124、一计算机功能程序125、一记事本功能程序126、一频道设定选台功能程序127、一电话簿功能程序128、一第二微机通讯程序129、一电子字典资料库130以及一电话簿资料库131,上述各功能程序(124至128)皆具有一专属的控制码,用以供第二微处理器121根据由第一微处理器111所传来的控制码来识别目前即将执行的功能程序为何,预先由该功能处理程序123判断第一微处理器111所传来的资料为控制码、字母或数字,若判断为控制码时,即驱动与该控制码相对应的功能程序来执行运作。其中,该电子字典功能程序124用以供使用者查询外语单字或字汇等一般电子字典所能提供的功能,其并根据使用者所输入的单字自电子字典资料库130中找寻与该单字相对应的解释资料;该计算机功能程序125用以供使用者进行加、减、乘或除等数学运算或汇率计算的功能;该记事本功能程序126用以供使用者输入资料并予以储存的记录处理功能;该频道设定选台功能程序127用以供使用者选择所需接收到电台;该电话簿功能程序128用以供使用者查询、建立所需的连络人相关资料,其并根据使用者所输入的联络人姓名自电话簿资料库131中找寻与该联络人姓名相对应的联络电话:该第二微机通讯程序129作为第二微处理器121与该第一微处理器111之间以及作为第二微处理器121与位于该语音输出处理模块140内的微处理器(如图4所示的第三微处理器141)之间传输资料的控制程序,其中,将第一微处理器111所辨识出的控制码、字母或数字传至第二微处理器121中,并执行功能处理程序123,以便根据接收到的控制码执行与该控制码相对的功能程序(124至128其中之一),且在执行该功能程序的同时,也将由第一微处理器111所辨识出的字母或数字传至第二微处理器121中,以供该功能程序作为执行运作时的参考。
此外,该功能处理程序123除了根据该语音辨识模块110所传来的控制码来执行与该控制码相对应的功能程序(124至128其中之一)外,其中,还提供使用者一种可设定该语音输入输出装置100的基本功能的处理,例如,在各功能程序执行运作后经由该显示单元102以视觉方式将运作结果提供给使用者或由语音输出处理模块140以听觉方式将运作结果提供给使用者。
请参阅图4,其用以显示图1的语音输出处理模块140内的软硬件构成图。如图所示,该语音输出处理模块140中包含第三微处理器141以及第三存储器单元142。
该第三微处理器141负责语音输出工作,其与该第二微处理器121、该第三记忆记单元142以及该语音输出单元103耦接,用以执行第三存储器单元142中所储存的程序以将该功能控制模块120申各功能程序(124至128)所执行的结果以声音方式传给使用者。
该第三存储器单元142可为任何该第三微处理器141得直接存取及执行程序的存储器,例如包含只读存储器(Read Only Memory,ROM)及随机存取。存储器(Random Access Memory,RAM),用以存取该语音输出处理模块140在运作上所须的各个程序及资料,其包含一线性预测编码(Linear Prediction Code;以下简称为LPC)计算程序143及第三微机通讯程序144,这些程序,皆由第三微处理器141来执行。其中,当该功能控制模块120各功能程序(124至128)取得运作结果,并判断出使用者将该语音输入输出装置100设定为以语音方式来输出结果时,即由第二微处理器121将运作结果(包括字母或数字)传给第一微处理器111,使第一微处理器111执行语音辨该程序114而自该语音资料库112中找出与该结果相对应的声音信号(即音节)而传回给第二微处理器121,在此,即由该语音辨识模块110及功能控制模块120各自的微机通讯程序(115、144)进行传输控制处理,接著,由第二微处理器121将接收到音节传给第三微处理器141,以令LPC计算程序143将第三微处理器141所收到的音节,及LPC模型加以运算并将运算后的结果以声音输出至语音输出单元103;该第三微机通讯程序144作为第三微处理器141与该第二微处理器121之间传输资料的控制程序,于此用以供第三微处理器141接收由第二微处理器121所传来的音节资料。
举例说明,使用者依序号出“alt”、“5”且逐一经由语音输入单元101传入该语音辨识模块110后(以简单的单音节“alt”来作为一语音指令(控制码)以令该语音辨识模块110易于辨识,也可以其他简单的单音节或多音节作为指令),使第一微处理器111接收到一声音信号,并开始执行该语音辨识程序114且自语音资料库112找出与该声音倌号相对的控制码、字母或数字,由于已预先在该语音资料库112中建立一笔“alt5”的声音资料,且将其设定为一控制码,故由第一微处理器111将该为“alt5”的控制码传给第二微处理器121,并开始执行功能处理程序123以根据该“alt5”的控制码自第二存储器单元122找出即将执行的功能程序(124至128其中之一),在此将“alt5”的控制码预设为电话簿功能程序128所有时,即第二微处理器121执行电话簿功能程序128,其中,该电话簿功能程序128条提供如同一般手机所内建的电话簿功能,例如包括查询、建立、删除或修正等功能,其中,使用者除了以一般方式观看该显示单元102上的功能列来执行上述的功能操作外,若使用者已将该语音输入输出装置100预设为“具有语音输出功能”时,将使该语音输出单元103播放出该电话簿的执行功能,即以语音方式提示使用者“欲执行查询时请说‘Q’”、“欲执行建立时请说‘C’”、欲执行删除时请说‘D’”或“欲执行修正时请说‘M’”等方式;接著,当使用者说出‘Q’后,使语音输入单元101将该为‘Q’的声音信号传入该语音辨识模块110中,以由该第一微处理器111执行语音辨识程序114且自该语音资料库112中找寻与该声音信号相对应的字母、数字或控制码,当第一微处理器111判断出该声音信号为字母‘Q’时,将该字母‘Q’传给第二微处理器121,使第二微处理器121执行电话簿功能程序128中有关于用以查询联络人的巨集程序(未图示),接者,使用者即说出连络人的姓名,其中,是逐一地说出该姓名的组合字母,例如“j”、“o”、“h”、“n”,使语音输入单元101依序将该为“j”、“o”、“h”、“n”的声音信号传入该语音辨识模块110中,然后,由该第一微处理器111执行语音辨识程序114且自该语音资料库112中逐一找寻与各声音信号相对应的字母或数字,当第一微处理器111逐一判断出该声音信号为一组单字“john”时,将该单字“john”传给第二微处理器121,使第二微处理器121自电话簿资料库131找出与该单字“jonn”相对应的联络电话;然后,由第二微处理器121根据该找到的连络电话传给第一微处理器111,使其自语音资料库112中找出与该连络电话相对应的声音信号(即音节),再回传给第二微处理器121,使第二微处理器121结束执行有关于查询连络人的巨集程序,并返回该电话簿功能程序128的主程序(未图示);然后,由第二微处理器121将取得的音节传给第三微处理器141,以执行LPC计算程序143,依LPC模型加以运算并将运算后的结果以声音输出至语音输出单元103,由此让使用者不须按键操作以及显示荧幕观看的情况下,即可取得所需查询的连络人电话号码。
再举一例说明,使用者依序说出“alt”、“4”且逐一经由语音输入单元101传入该语音辨识模块110后,使第一微处理器111接收到一声音信号,并开始执行该语音辨识程序114且自语音资料库112找出与该声音信号相对的控制码、字母或数字,由于已预先在该语音资料库112中建立一笔”alt4”的声音资料,且将其设定为一控制码,故由第一微处理器111将该为“alt4”的控制码传给第二微处理器121,并开始执行功能处理程序123以根据该“alt4”的控制码自第二存储器单元122找出即将执行的功能程序(124至128其中之一),在此将“alt4”的控制码预设为频道设定选台功能程序127所有时,即第二微处理器121执行频道设定选台功能程序127,其中,该频道设定选台功能程序127提供如同用以收听广播电台的收音机选台设定(为简化图式以及说明,各图式中皆未绘出有关于一收音机的相关电路),例如包括FM或AM各频道的设定等,当使用者说出用以驱动该收音机功能的控制码(即alt4)后,即执行频道设定选台功能程序127,此时,若使用者即未设定收听频道时,第二微处理器121即令语音输出处理模块140发出“请输入频道”的语音告知(也可由显示单元102出现告知讯息),之后,使用者即可透过语音输入单元101依序说出“FM103.3”,其中,由于符号“.”不为字母以及数字,因此,该符号“.”即以一控制代码作为输入以便该语音辨识模块110来辨识,例如以一控制代码“fun”、“1”来取代符号“.”,接著由该频道设定选台功能程序127根据使用者说出的“FM103.3”进行电台设定,且由第二微处理器121控制收音机相关电路(未图示)接收该频道所载送出的信号。因此,该语音资料库112即储存多个用以识别特殊符号(即无法以字母或数字表示的符号)的控制代码。
为简化说明,由于该电子字典功能程序124、该计算机功能程序125以及该记事本功能程序126的语音输入操作以及语音输出结果的处理过程也以上述方式加以类推即可,以下将不于详细说明。
请参阅图5是一运作流程图,其中显示本发明的语音输入输出装置100的话音辨识模块110运作时的流程程序。首先,为使该语音输入输出装置100能根据使用者所输入的语音信号而驱使该装置所提供的功能产生运作,故须预先将包括字母(a-z)、数字(0-9)及特定指令(即上述的控制码)以及与该字母(a-z)、数字(0-9)及特定指令所对应的声音信号皆构成于该语音资料库112中,且使用者亦须得知执行该些功能的特定指令为何,例如执行该电子子典功能程序的指令为“alt1”、执行该计算机功能程序的指令为“alt2”、执行该记事本功能程序的指令为“alt3”、执行该频道设定选含功能程序的指令为“alt4”或执行该电话簿功态程序的指令为“alt5”等。如图所示,当使用者逐一地说出一字母、一数字、简单几个单音节或多音节的指令并由该语音输入单元101接收与该字母、数字或音节对应的声音信号,且将其传入该语音辨识模块110后,随即进行步骤S1,由第一微处理器111接收到使用者所传来的声音信号后,即执行该语音辨识程序114并自语音资料库112中找寻与该声音信号相对应的字母、数字或指令,接著进行步骤S2。
于步骤S2中,语音辨识程序114将辨识出来的字母或数字以ASCII(American Standard Code for Information Interchange)型式表示,而将辨识出来的特定指令则以AltN(N表示一特定的控制码)表示,接著进行步骤S3。
于步骤S3中,由第一微处理器111执行第一微机通讯程序115以符辨识出来码号传送至第二微处理器121,接著,即可进行如图6所示的流程步骤。请参阅图6为一运作流程图,其中显示本发明的语音输入输出装置100的功能控制模块120执行运作时的流程程序。如图所示,由第二微处理器121执行第二微机通讯程序129以接收来自第一微处理奏111所辨识出来的码号资料,随即进行步骤S4,由第二微处理器121执行功能处理程序123以判断由语音辨识模块110所传来的辨识码号是否为ASCII型式,若是时,进行步骤S5,否则进行步骤S7。
于步骤S5中,由第二微处理器121判断该功能控制模块120是否正执行储存于第二存储器单元122中的一功能程序(124至128其中之一),若是时,即进行步骤S6;否则返回该步骤S4。
于步骤S6中,由第二微处理器121将此些以ASCII型式的码号暂存于一存储缓冲区内(未图示,该存储缓冲区可包含于第二存储器单元122中),以供第二微处理器121执行功能程序(124至128其中之一)时所需的资料来源,接者进行步骤S13。
于步骤S7中,由第二微处理器121执行该功能处理程序123以判断该语音辨识模块110所传来的辨识码为一特定指令后,即判定该特定指令AltN的N值为何,若N为1时,即进行步骤S8;若N为2时,即进行步骤S9,若N为3时,即进行步骤S10;若N为4时,即进行步骤S11,若N为5时,即进行步骤S12。
于步骤S8中,当功能处理程序123判定该特定指令为Alt1时,即由第二微处理器121执行该电子子典功能程序124,接者返回该步骤S4。
于步骤S9中,当功能处理程序123判定该特定指令为Alt2时,即由第二微处理器121执行该计算机功能程序125,接者返回该步骤S4。
于步骤S10中,当功能处理程序123判定该特定指令为Alt3时,即由第二微处理器121执行该记事本功能程序126,接者返回该步骤S4。
于步骤S11申,当功能处理程序123判定该特定指令为Alt4时,即由第二微处理器121执行该频道设定选台功能程序127,接者返回该步骤S4。
于步骤S12中,当功能处理程序123判定该特定指令为Alt5时,即由第二微处理器121执行该电诂簿功能功能程序128,接者返回该步骤S4。
于步骤S13中,第二微处理器121执行此些功能程序(124至128其中之一)以产生与该功能程序相对应的运作结果,接著进行步骤S14。
于步骤S14中,由第二微处理器121判断该输入输出语音模块100是否将运作结果设定为语音输出,若是时,即执行步骤S15;否则执行步骤S17。
于步骤S15中,当该功能控制模块120各功能程序(124至128)取得运作结果,并判断出使用者将该语音输入输出装置100设定为以语音方式来输出结果时,即由第二微处理器121将运作结果(包括字母或数字)传给第一微处理器111,使第一微处理器111执行语音辨识程序114而自该语音资料库112中找出与该结果相对应的声音信号(即音节)而传回给第二微处理器121,并由该第二微处理须121将接收到音节传给语音输出处理模块140,接著即进行如图7所示的步骤流程。
于步骤S16中,当该功能控制模块120各功能程序(124至128)取得运作结果,并判断出使用者将该语音输入输出装置100设定为以一般方式输出结果时,即由第二微处理器121将运作结果(包括字母或数字)传送至显示单元102。
请参阅图7是一连作流程图,其中显示本发明的语音输入输出装置的语音输出处理模块140运作时的流程程序。如图所示,当第三微处理器141利用第三微机通讯程序144接收来自功能控制模块120所传来的音节资料后,随即进行步骤S17,由第三微处理器141执行该LPC计算程序143以将该接收到的音节资料以LPC模型加以运算,在此,该第三微处理器141是执行一种将文字转换为语音的处理(Text To Speech;TIS),接著进行步骤S18。
于步骤S18中,第三微处理器141将运算后的结果以声音输出至语音输出单元103,由此让使用者以听觉方式取得运算结果。
以上所述仅为本发明的较佳实施例而已,并非用以限定本发明的实质内容的范围,例如,除了上述举例说明中以“alt”或“fun”来作为一语音指令(控制码)外,也可以其他简单的单音节或多音节来组成一语音指令。故本发明的实质内容广义地定义于申请的专利范围中,任何他人所完成的实体或方法,若是与本申请专利范围所定义完全相同,或是同一等效的变更,均将被视为涵盖于此专利范围中。
Claims (26)
1.一种语音输入输出方法,其可适用于一资讯电子装置上,且该资讯电子装置构成至少具有一语音输入单元以及一语音输出单元,该语音输入输出方法:
(1)预先安装一语音资料库于该资讯电子装置上,其中,该语音资料库包括由复数个用以识别该资讯电子装置中各功能单元的控制码、各字母(a-z)以及各数字(0-9)所构成,该些控制码由一或复数个字母或数字所组成,而该些控制码、字母以及数字皆对应一专属的语音信号,以作为语音辨识之用;
(2)预先安装一功能程序库于该资讯电子装置上,其中,该功能程序库用以储存多个驱动该资讯电子装置中各功能单元执行运作时的程序码,其中,各功能单元所对应的程序码具有一专属的控制码;
(3)使用者以单一字母、单一数字、简单几个单音节或多音节的指令依序发音,并输入至该语音输入单元中;
(4)由该资讯电子装置的一语音辨识模块接收来自使用者的声音信号,以自该语音资料库中找寻与该声音信号相对应的字母、数字或控制码;
(5)当语音辨识模块中根据该声音信号而找寻到与其相对应的字母或数字时,则进行步骤(6),否则若找寻到与其相对应的控制码时,即自该功能程序库中取出与其相对应的控制码,以执行与该控制码相对应的功能单元,接著返回该步骤(4);
(6)由功能控制模块判断目前是否正在执行功能单元,若是时,即将此些字母或数字暂存于一存储缓冲区内,以作为该功能单元执行运作时所需的资料来源,接著进行步骤(7);否则返回该步骤(4);以及
(7)当该功能单元产生运作结果时,由语音输出处理模块将功能控制模块所传来的运作结果以线性预测编码(Linear Prediction Code;LPC)方式加以运算,并将运算结果传至该语音输出单元,以供使用者以听觉方式取得结果,并返回该步骤(3)。
2.如权利要求1所述的语音输入输出方法,其特征在于,其中该资讯电子装置的各功能单元包括一电子字典功能单元、一计算机功能单元、一记事本功能单元、一频道设定选台功能单元及一电话簿功能单元。
3.如权利要求1所述的语音输入输出方法,其特征在于,其中该资讯电子装置复包括一显示单元,于该步骤(7)时,当该功能单元产生运作结果时,由该功能控制模块判断该资讯电子装置不为语音方式输出运作结果时,由功能控制模块将运作结果传至该显示单元中,以供使用者以视觉方式取得结果,并返回该步骤(3)。
4.如权利要求1所述的语音输入输出方法,其特征在于,其中该语音辨识模块包括一具有语音辨识功能的微处理器。
5.如权利要求1所述的语音输入输出方法,其特征在于,其中该功能控制模块包括一具有资料处理功能的微处理器。
6.如权利要求1所述的语音输入输出方法,其特征在于,其中该语音输出处理模块包括一具有数位信号处理功能的微处理器。
7.如权利要求1所述的语音输入输出方法,其特征在于,其中该语音输入单元为一麦克风。
8.如权利要求3所述的语音输入输出方法,其特征在于,其中该显示单元为一液晶显示器。
9.如权利要求1所述的语音输入输出方法,其特征在于,其中该语音输出单元为一扬声器。
10.如权利要求2所述的语音输入输出方法,其特征在于,其中该电子字典功能单元、计算机功能单元、记事本功能单元、频道设定选台功能单元及电话簿功能单元为一软件模块。
11.如权利要求1所述的语音输入输出方法,其特征在于,其中该资讯电子装置为一可携带式电子装置。
12.如权利要求11所述的语音输入输出方法,其特征在于,其中该可搅带式电子装置为一个人数字助理(PDA)、一掌上型电脑(PocketPC,)、一手机、一电子字典或一笔记型电脑。
13.如权利要求1所述的语音输入输出方法,其特征在于,其中该资讯电子装置为一电话或一桌上型电脑。
14.一种语音输入输出装置,其可适用于一资讯电子装置上,且该资讯电子装置架构至少具有一语音输入单元以及一语音输出单元,该语音输入输出装置包含:
一语音资料库,该语音资料库包括由复数个用以识别该资讯电子装置中各功能单元的控制码、各字母(a-z)以及各数字(0-9)所构成,其中,该些控制码由一或复数个字母或数字所组成,而该控制码、字母以及数字皆对应一专属的语音信号,以作为语音辨识之用;
一功能程序存储器,用以储存各功能单元执行运作时所需的程序,其中,各功能单元皆具有一用以辨别的控制码;
一语音辨识模块,当使用者由该语音输入单元依序以一字母、一数字、简单几个单音节或多音节的指令的输入方式来输入声音信号后,即由该语音辨识模块自该语音资料库中找出与该声音信号相对应的控制码、字母或字母;
一功能控制模块,若当该语音辨识模块找出一控制码时,使功能控制模块即自功能程序储存存储器中找出与该控制码相对应的程序,以驱使该资讯电子装置执行运作,若当该语音辨识模块找出一字母或数字时,即将该字母或数字暂存于一存储缓冲区内,以作为该功能单元执行运作时所需的资料来源;以及
一语音输出处理模块,当该资讯电子装置的输出运作结果设为语音输出方式时,即由该语音输出处理模块将该功能控制模块所产生的运作结果以线性预测编码(Linear Prediction Code;LPC)方式予以运算,并将运算后的结果传至该语音输出单元,以供使用者以听觉方式取得结果。
15.如权利要求14所述的语音输入输出装置,其特征在于,其中该资讯电子装置的各功能单元包括一电子字典功能单元、一计算机功能单元、一记事相关功能功能、一频道设定选含功能单元及一电话簿功能单元。
16.如权利要求14所述的语音输入输出装置,其特征在于,其中该资讯电子装置还包括一显示单元,当该资讯电子装置的输出运作结果不设为语音输出方式时,由功能控制模块将运作结果传至该显示单元中,以供使用者以视觉方式取得结果。
17.如权利要求14所述的语音输入输出装置,其特征在于,其中该语音辨识模块包括一具有语音辨识功能的微处理器。
18.如权利要求14所述的语音输入输出装置,其特征在于,其中该功能控制模块包括一具有资料处理功能的微处理器。
19.如权利要求14所述的语音输入输出装置,其特征在于,其中该语音输出处理模块包括一具有数字信号处理功能的微处理器。
20.如权利要求14所述的语音输入输出装置,其特征在于,其中该语音输入单元为一麦克风。
21.如权利要求16所述的语音输入输出装置,其特征在于,其中该显示单元为一液晶显示器。
22.如权利要求14所述的语音输入输出装置,其特征在于,其中该语音输出单元为一扬声器。
23.如权利要求15所述的语音输入输出装置,其特征在于,其中该电子字典功能单元、计算机功能单元、记事本功能单元、频道设定选台功能单元及电话簿功能单元为一软件模块。
24.如权利要求14所述的语音输入输出装置,其特征在于,其中该资讯电子装置为一可携带式电子装置。
25.如权利要求24所述的语音输入输出装置,其特征在于,其中该可携带式电子装置为一个人数字助理(PDA)、一掌上型电脑(PocketPC)、一手机、一电子字典或一笔元型电脑。
26.如权利要求14所述的语音输入输出装置,其特征在于,其中该资讯电子装置为一电话或一桌上型电脑。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 01144523 CN1427333A (zh) | 2001-12-18 | 2001-12-18 | 一种语音输入输出方法以及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 01144523 CN1427333A (zh) | 2001-12-18 | 2001-12-18 | 一种语音输入输出方法以及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1427333A true CN1427333A (zh) | 2003-07-02 |
Family
ID=4677642
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 01144523 Pending CN1427333A (zh) | 2001-12-18 | 2001-12-18 | 一种语音输入输出方法以及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1427333A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102298856A (zh) * | 2010-06-23 | 2011-12-28 | 元太科技工业股份有限公司 | 电子阅读装置 |
CN103136708A (zh) * | 2011-11-25 | 2013-06-05 | 国家电网公司 | 电力数据处理方法及装置 |
CN110895938A (zh) * | 2018-09-13 | 2020-03-20 | 广达电脑股份有限公司 | 语音校正系统及语音校正方法 |
-
2001
- 2001-12-18 CN CN 01144523 patent/CN1427333A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102298856A (zh) * | 2010-06-23 | 2011-12-28 | 元太科技工业股份有限公司 | 电子阅读装置 |
CN103136708A (zh) * | 2011-11-25 | 2013-06-05 | 国家电网公司 | 电力数据处理方法及装置 |
CN110895938A (zh) * | 2018-09-13 | 2020-03-20 | 广达电脑股份有限公司 | 语音校正系统及语音校正方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1124554C (zh) | 改进多次敲击文字输入的设备及方法 | |
CN1150452C (zh) | 语音识别校正方法和装置 | |
CN1287269C (zh) | 信息终端设备和操作支持方法 | |
CN1658687A (zh) | 利用移动消息接收机和服务器的基于命令的分组sms | |
CN1427326A (zh) | 向使用数字小键盘的设备提供印地语输入的方法和装置 | |
CN1639707A (zh) | 用于并行多模通信的系统和方法 | |
CN1929655A (zh) | 一种可实现文本与语音转换的手机 | |
CN1299491C (zh) | 使用电话机键盘构成字母数字消息的方法 | |
DE602004001563T2 (de) | Telefonnummerwiederfindungssystem und Verfahren | |
CN101183286A (zh) | 在移动终端中输入字符或数字的装置和方法 | |
CN1575009A (zh) | 具有搜索装置的便携式蜂窝电话及搜索操作功能的方法 | |
CN1427333A (zh) | 一种语音输入输出方法以及装置 | |
CN1469621A (zh) | 可处理外部装置的输入数据的便携式信息装置及其方法 | |
CN1307301A (zh) | 电子金融交易系统与程序 | |
CN1165829C (zh) | 输入日文的方法和便携式移动单元 | |
CN1300003A (zh) | 分割标记流到分立的屏幕显示的方法和装置 | |
CN103455530A (zh) | 随身携带式创建个性化语音对应文本文字数据库的装置 | |
CN1755669A (zh) | 人名输入处理方法及系统 | |
CN1864122A (zh) | 便携型终端装置 | |
CN101425286B (zh) | 显示控制系统及其方法 | |
CN1429040A (zh) | 可群呼式语音发信息系统 | |
CN101052964A (zh) | 对话支援装置 | |
CN1127011C (zh) | 字符输入方法及字符输入装置 | |
JP2001083992A (ja) | 保全作業支援装置 | |
CN1570901A (zh) | 手持交互式字典查询装置及其方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |