CN109830239A - 语音处理装置、语音识别输入系统及语音识别输入方法 - Google Patents

语音处理装置、语音识别输入系统及语音识别输入方法 Download PDF

Info

Publication number
CN109830239A
CN109830239A CN201711166048.XA CN201711166048A CN109830239A CN 109830239 A CN109830239 A CN 109830239A CN 201711166048 A CN201711166048 A CN 201711166048A CN 109830239 A CN109830239 A CN 109830239A
Authority
CN
China
Prior art keywords
module
text
transmitted
voice
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711166048.XA
Other languages
English (en)
Other versions
CN109830239B (zh
Inventor
陈定宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chicony Electronics Co Ltd
Original Assignee
Chicony Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chicony Electronics Co Ltd filed Critical Chicony Electronics Co Ltd
Priority to CN201711166048.XA priority Critical patent/CN109830239B/zh
Publication of CN109830239A publication Critical patent/CN109830239A/zh
Application granted granted Critical
Publication of CN109830239B publication Critical patent/CN109830239B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Abstract

语音处理装置、语音识别输入系统及语音识别输入方法。语音处理装置包括麦克风模块、音讯收发模块、语音识别模块、处理模块及人机传输界面。麦克风模块输出音讯信号。音讯收发模块传送音讯信号至语音识别模块。语音识别模块识别音讯信号后对应回传已识别文档至音讯收发模块。处理模块根据已识别文档产生待传输信息、且控制人机传输界面输出待传输信息,其中待传输信息是指控制指令、待传输文字或其组合。计算机装置包括处理器,处理器接收待传输信息、并对应执行控制指令、或显示待传输文字或其组合。

Description

语音处理装置、语音识别输入系统及语音识别输入方法
技术领域
本发明涉及一种识别系统,特别是一种语音处理装置、语音识别输入系统及语音识别输入方法。
背景技术
过去使用者在操作计算机时,一般都是通过键盘、鼠标或其它周边装置的协助以完成指令或文字的输入。然而,随着语音识别技术的发展,现今诸多电子装置(例如桌上型计算机、笔记型计算机、手机、个人数位助理或其它电子装置)也广泛使用语音作为文字输入的方式。
语音识别在应用方面,大多都是将计算机连接麦克风,使用者可通过麦克风将音讯输入,即可通过语音识别系统将音讯加以识别并转换成文字,以供电脑进行文字输入的动作。然而,目前的麦克风一般都是通过UAC(USB Audio Class)装置协定与计算机连接,因此,容易与计算机系统原有的音效装置产生冲突。
举例来说,假设计算机系统中已内建有麦克风,当计算机通过UAC装置协定外接语音输入用的麦克风时,计算机系统即显示有二个以上的麦克风连接中,此时使用者必须到系统装置选项中进行设定,以选定目前需要使用的麦克风,否则在进行语音输入文字时,会造成系统无法正确开启相应的麦克风或应用程序,导致音乐播放、实时对谈可能被使用者语音介入、或者外接麦克风被其他应用程序占用,导致无法使用语音输入文字的情形。
另一方面,以麦克风输入语音后,经语音识别系统识别后为文字,再将识别后的文字输入计算机。然而,大多数的计算机并没有预装载语音输入法,因此要采用语音输入文字时需额外在计算机上安装语音输入法或是应用程序,使用上较为不便。
发明内容
有鉴于此,本发明提供了一种语音识别输入系统,包括语音处理装置,包括麦克风模块、音讯收发模块、语音识别模块、处理模块以及人机传输界面(HID Interface),所述麦克风模块输出音讯信号,所述音讯收发模块电连接所述麦克风模块、并与所述语音识别模块通讯连接,所述音讯收发模块接收并传送所述音讯信号至所述语音识别模块,所述语音识别模块识别所述音讯信号后对应回传已识别文档至所述音讯收发模块,所述处理模块电连接所述音讯收发模块与所述人机传输界面,所述处理模块接收所述已识别文档、并根据所述已识别文档产生待传输信息,所述待传输信息是指控制指令、待传输文字或其组合,且所述处理模块控制所述人机传输界面输出所述待传输信息;以及计算机装置,包括处理器,所述处理器电连接所述人机传输界面以接收所述待传输信息、并对应执行所述控制指令、或显示所述待传输文字或其组合。
在一个实施例中,所述音讯收发模块为无线音讯收发模块或有线音讯收发模块。
在一个实施例中,所述语音识别模块为云端语音识别模块且通讯连接于网际网络,所述音讯收发模块是以无线或有线方式连接至网际网络以与所述语音识别模块彼此通讯。
在一个实施例中,所述语音识别模块包括翻译单元,所述翻译单元分析所述音讯信号并输出翻译文字,所述已识别文档中包括所述翻译文字。
在一个实施例中,所述语音识别模块包括语意分析单元,所述语意分析单元分析所述已识别文档并对应输出指令文字、非指令文字或其组合,所述处理模块是根据所述指令文字以产生所述控制指令、或根据所述非指令文字以产生所述待传输文字、或其组合。
在一个实施例中,所述处理模块依据所述已识别文档中是否包括触发指令,控制输出所述待传输文字或所述控制指令。
在一个实施例中,所述语音处理装置包括开关模块,所述开关模块连接所述处理模块并可选择性地输出开关信号,所述处理模块依据是否收到所述开关信号,控制输出所述待传输文字或输出所述控制指令。
在一个实施例中,所述处理模块包括编码单元,所述编码单元将所述待传输文字编制为万国码格式。
在一个实施例中,所述语音处理装置为计算机周边装置,所述计算机周边装置为键盘、鼠标、触控笔或扬声器。
本发明还提供了一种语音处理装置包括麦克风模块,输出音讯信号;音讯收发模块,电连接到所述麦克风模块,所述音讯收发模块接收所述音讯信号后传送出去,并接收对应于所述音讯信号的已识别文档;处理模块,电连接到所述音讯收发模块并接收所述已识别文档,所述处理模块根据所述已识别文档产生待传输信息,所述待传输信息是指控制指令、待传输文字或其组合;以及人机传输界面,电连接到所述处理模块,所述处理模块控制所述人机传输界面输出所述待传输信息。
在一个实施例中,所述音讯收发模块是无线音讯收发模块或有线音讯收发模块。
在一个实施例中,所述语音处理装置进一步包括语音识别模块,通讯连接到所述音讯收发模块,所述语音识别模块接收所述音讯信号并加以识别后对应输出所述已识别文档。
在一个实施例中,所述语音识别模块为云端语音识别模块且通讯连接于网际网络,所述音讯收发模块是以无线或有线方式连接至网际网络以与所述语音识别模块彼此通讯。
在一个实施例中,所述语音识别模块包括翻译单元,所述翻译单元分析所述音讯信号并输出翻译文字,所述已识别文档中包括所述翻译文字。
在一个实施例中,所述语音识别模块包括语意分析单元,所述语意分析单元分析所述已识别文档并对应输出指令文字、非指令文字或其组合,所述处理模块是根据所述指令文字以产生所述控制指令、或根据所述非指令文字以产生所述待传输文字、或其组合。
在一个实施例中,所述处理模块包括编码单元,所述编码单元将所述待传输文字编制为万国码格式。
在一个实施例中,所述处理模块依据所述已识别文档中是否包括触发指令,控制输出所述待传输文字或所述控制指令。
在一个实施例中,所述语音识别模块进一步包括开关模块,所述开关模块电连接所述处理模块并可选择性地输出开关信号,所述处理模块依据是否收到所述开关信号,控制输出所述待传输文字或输出所述控制指令。
在一个实施例中,所述语音处理装置为计算机周边装置,所述计算机周边装置为键盘、鼠标、触控笔或扬声器。
本发明还提供了一种语音识别输入方法,包括下列步骤:音讯输出步骤:输出音讯信号;语音识别步骤:语音识别模块识别所述音讯信号后并对应输出已识别文档;处理步骤:处理模块根据所述已识别文档产生待传输信息,其中所述待传输信息是指控制指令、待传输文字或其组合;以及输出步骤:所述处理模块控制人机传输界面输出所述待传输信息。
在一个实施例中,所述语音识别步骤中的所述语音识别模块为云端语音识别模块且通讯连接到网际网络。
在一个实施例中,所述语音识别步骤包括:语意分析单元分析所述已识别文档并对应输出指令文字、非指令文字或其组合,所述处理步骤中包括所述处理模块是根据所述指令文字以产生所述控制指令、或根据所述非指令文字以产生所述待传输文字、或其组合。
在一个实施例中,所述语音识别步骤后进一步包括翻译步骤:翻译单元分析所述音讯信号并输出翻译文字,所述已识别文档中包括所述翻译文字。
在一个实施例中,所述处理步骤中包括:将所述待传输文字编制为万国码格式。
在一个实施例中,所述输出步骤中包括:所述处理模块依据所述已识别文档中是否包括触发指令,控制输出所述待传输文字或输出所述控制指令。
在一个实施例中,所述输出步骤中包括:所述处理模块依据是否收到来自开关模块的开关信号,控制输出所述待传输文字或输出所述控制指令。
在一个实施例中,所述语音识别输入方法进一步包括执行步骤:计算机装置接收所述待传输信息、并对应执行所述控制指令、或显示所述待传输文字或其组合。
综上,本发明实施例的语音处理装置通过人机传输界面与计算机装置连接,使语音处理装置与计算机装置的间能经由HID通讯协定传输资料,相较于过去麦克风经由UAC装置协定与计算机装置连接的方式来说,语音处理装置不会与计算机装置内建的音讯装置产生冲突,使用者不需要到系统装置选项中选择音讯装置,因而原有计算机装置的音讯设定不会受到变动,达到使用上更加便利。
附图说明
图1是本发明语音识别输入系统第一个实施例的系统方框图;
图2是本发明语音识别输入系统第二实施例的系统方框图;
图3是本发明语音识别输入系统第三实施例的系统方框图;
图4是本发明语音识别输入系统第四实施例的系统方框图;
图5是本发明语音识别输入方法第一个实施例的步骤流程图;
图6是本发明语音识别输入方法第二实施例的步骤流程图;
图7是本发明语音识别输入方法第三实施例的步骤流程图;
图8是本发明语音识别输入方法第四实施例的步骤流程图;
图9是本发明语音识别输入方法第五实施例的步骤流程图;
图10是本发明语音识别输入方法第六实施例的步骤流程图。
【符号说明】
1~4 语音识别输入系统
10 语音处理装置
11 麦克风模块
12 音讯收发模块
13、13’ 语音识别模块
131 语意分析单元
132 翻译单元
14 处理模块
141 编码单元
15 人机传输界面
16 开关模块
20 计算机装置
21 处理器
S 音讯信号
T 已识别文档
I 待传输信息
S1 音讯输出步骤
S2、S2’ 语音识别步骤
S3、S3’、S3” 处理步骤
S4 输出步骤
S41~S46 子步骤
S5 执行步骤
S6 翻译步骤
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。
图1为本发明语音识别输入系统第一个实施例的系统方框图。请参见图1所示,语音识别输入系统1包括语音处理装置10与计算机装置20。
在一些实施例中,计算机装置20具体地可为个人计算机、笔记型计算机、平板计算机、智能型手机、导航装置、车用电脑装置、个人数位助理、数位电子广告牌或其他可输入文字或指令的电子装置。
语音处理装置10可用于连接到计算机装置20,用以对音讯(如使用者语音或其他声音)进行识别,并传输命令至计算机装置20以进行文字输入或执行动作。在一些实施例中,语音处理装置10可为计算机周边装置,例如计算机周边装置为键盘、鼠标、触控笔或扬声器,使语音处理装置10可同时具手动的方式以操控计算机装置20进行文字输入或执行动作。
如图1所示,在本实施例中,语音处理装置10包括麦克风模块11、音讯收发模块12、处理模块14以及人机传输界面15。麦克风模块11用以接收并转换外部语音(speech)后对应输出音讯信号S,举例来说,麦克风模块11可选取使用者的语音并对应转换为音讯信号S,例如麦克风模块11可连接或内建信号转换器,以通过信号转换器将使用者语音转换(例如傅立叶转换公式或其他算法转换)为音讯信号S。在一些实施例中,麦克风模块11可为动圈式麦克风、电容式麦克风、驻极体麦克风、微机电麦克风或指向性麦克风。
如图1所示,语音处理装置10的音讯收发模块12电连接麦克风模块11,以接收麦克风模块11传送的音讯信号S。在本实施例中,音讯收发模块12是通过处理模块14间接连接到麦克风模块11,但并不局限于此,音讯收发模块12也可直接连接到麦克风模块11。音讯收发模块12可传送音讯信号S到语音识别模块13以进行语音识别作业。
如图1所示,在一个实施例中,语音处理装置10可通过音讯收发模块12连接到语音识别模块13。例如,语音识别模块13可为近端语音识别模块,音讯收发模块12为有线音讯收发模块,以通过电连接线连接语音识别模块13。或者在图1的实施例中,语音识别模块13为云端语音识别模块且通讯连接到网际网络,例如语音识别模块13设置在云端的系统中,音讯收发模块12是以无线或有线方式连接到网际网络以与语音识别模块13彼此通讯。举例来说,音讯收发模块12可为无线音讯收发模块,其中无线音讯收发模块可为无线远距模块(例如3G/4G/5G模块、无线电模块或无线区网模块)或无线近距模块(例如WiFi模块、蓝牙模块、ZigBee模块),以通过无线的方式连接到网际网络而与语音识别模块13彼此无线通讯。或者,在另一个实施例中,音讯收发模块12也可通过电连接线连接到无线传输装置(例如无线分享器或无线基地台),以通过无线传输装置连接到网际网络以与语音识别模块13彼此通讯。
另外,在图1的实施例中,通过语音识别模块13为云端语音识别模块,使语音处理装置10与计算机装置20不需要额外安装语音识别软件,且语音处理装置10连接到不同的计算机装置20时,不用再重新进行语音训练,使语音处理装置10达到即插即用的功能而大幅提升使用上的便利性。
在另一个实施例中,语音识别模块13也可内建于语音处理装置10中。例如图2所示,为本发明语音识别输入系统第二实施例的系统方框图,本实施例的语音识别输入系统2的语音处理装置10内建有语音识别模块13’,例如语音识别模块13’为具备运算能力的硬件或韧体(例如数位信号处理器或可程序化逻辑装置等),音讯收发模块12为有线音讯收发模块,以通过电连接线连接语音识别模块13’。
再如图1所示,在本实施例中,语音识别模块13识别音讯信号S后即对应回传已识别文档T至音讯收发模块12。举例来说,语音识别模块13可利用统计模式识别技术进行语音识别作业,例如语音识别模块13可内建有信号处理单元、声学模型、发音词典、语言模型及译码器等(图面未显示),其中信号处理单元用于从音讯信号S中提取特征供声学模型使用。声学模型例如可采用隐藏式马可夫(Hidden Markov Model,HMM)模型进行建模。语言模型对所针对的语言进行建模。发音词典包含多个词汇集及其发音,用于提供声学模型与语言模型之间的映射。译码器根据声学模型、语言模型及发音词典,寻找出音讯信号S对应的文字,以将音讯信号S转换为已识别文档T(Text)。其中所述已识别文档T中可包含字符、符号、标点符号、数字、字词、字符串或由多个字符串所组成的词句等等。
再如图1所示,处理模块14电连接音讯收发模块12与人机传输界面15,处理模块14接收并根据已识别文档T产生待传输信息I,其中待传输信息I是指控制指令、待传输文字或其组合。具体而言,待传输文字可为纯文字形式,例如待传输文字可包括字符、符号、标点符号、数字、字词、字符串或由多个字符串所组成的词句等使用者欲输入的文字。控制指令可为信号形式以对应控制计算机装置20执行特定的动作,以计算机装置20为个人计算机、笔记型计算机或智能型手机来说,可对应执行文档搜索、启闭程序、磁碟重组、音量控制、关机、重新开机等特定动作。如果以计算机装置20为导航装置来说,可对应执行路线规划、储存地点、搜寻车位等特定动作。也就是说,处理模块14可根据已识别文档T的内容判断是控制指令、待传输文字还是两者的组合,这在后面详述。
在一个实施例中,语音处理装置10的处理模块14具体地可为具备运算能力的硬件,例如中央处理单元(Central Processing Unit,CPU),或是其他可程序化的微处理器(Microprocessor)、数位信号处理器(Digital Signal Processor,DSP)、可程序化控制器、特殊应用集成电路(Application Specific Integrated Circuits,ASIC)、可程序化逻辑装置(Programmable Logic Device,PLD)或其他类似装置。
再如图1所示,计算机装置20包括处理器21,处理器21电连接人机传输界面15以接收待传输信息I、并对应执行控制指令、或显示待传输文字或其组合。由此,本发明实施例的语音处理装置10通过人机传输界面15与计算机装置20连接,使语音处理装置10与计算机装置20之间能经由HID通讯协定传输资料,相较于过去麦克风经由UAC(USB Audio Class)装置协定与计算机装置20连接的方式来说,语音处理装置10不会与计算机装置20内建的音讯装置(如麦克风、喇叭)产生冲突。详言之,假设计算机装置20为个人计算机或笔记型计算机,其系统音效装置中不会显示有新的音效装置加入,因而不会跟计算机装置20内建的音讯装置产生冲突而有错误动作的情形,使用者也不需要到装置选项中选择需要执行的音讯装置,由此,原有计算机装置20的音讯设定不会受到改变,达到在使用上更加便利的优点。
为了更清楚地说明上述实施例的操作步骤,请参见图5,其中图5为本发明语音识别输入方法第一个实施例的步骤流程图,以下所提的硬件结构可对照上述语音识别输入系统1所公开,首先在这里说明。本实施例在语音识别输入的过程中,首先是先进行音讯输出步骤S1:输出音讯信号S,具体而言,如对照图1所示,使用者可将语音处理装置10通过人机传输界面15连接到计算机装置20,当使用者需要控制计算机装置20执行动作或输入文字时,可对着麦克风模块11发出声音或说出话语,麦克风模块11即可将声音选取并转换为音讯信号S而输出。
在音讯输出步骤S1后,接着可进行语音识别步骤S2:语音识别模块13识别音讯信号S后并对应输出已识别文档T。例如在图1与图2的实施例中,麦克风模块11可传送音讯信号S到音讯收发模块12,以通过音讯收发模块12传送到云端的语音识别模块13(请见图1)或者语音处理装置10内建的语音识别模块13’(请见图2),以识别音讯信号S并转换为文字而输出已识别文档T。
在语音识别步骤S2后,接着可进行处理步骤S3:处理模块14根据已识别文档T产生待传输信息I。例如处理模块14可根据已识别文档T的内容判断待传输信息I是控制指令、待传输文字还是两者的组合。
在处理步骤S3后,接着可进行输出步骤S4:处理模块14控制人机传输界面15(HIDInterface)输出待传输信息I。由此,语音处理装置10与计算机装置20之间即可经由HID通讯协定传输资料,以避免与计算机装置20内建的音讯装置(如麦克风、喇叭)产生冲突,使用者也不需要到计算机装置20的装置选项中选择需要执行的音讯装置,在使用上更加便利。
再如图5所示,本实施例在输出步骤S4后,进一步执行步骤S5:计算机装置20接收待传输信息I、并对应执行控制指令、或显示待传输文字或其组合。具体而言,假设处理模块14输出的是控制指令时,计算机装置20则执行相应的特定动作,例如执行文档搜寻或音量控制等动作。当处理模块14输出的是待传输文字时,计算机装置20则对应输入待传输文字而显示在荧幕上。在一个实施例中,处理模块14也可能同时输出控制指令及待传输文字,以驱使计算机装置20执行动作与输入文字,例如计算机装置20可开启文档并在文档中输入待传输文字、或者计算机装置20开启搜寻引擎并输入待传输文字以进行搜寻作业。
在一些实施例中,处理模块14可通过下述多种方式根据已识别文档T的内容判断待传输信息I是控制指令、待传输文字还是两者的组合。
处理模块14可依据已识别文档T是否包括触发指令,来控制人机传输界面15输出待传输文字或输出控制指令。例如图6所示,为本发明语音识别输入方法第二实施例的步骤流程图。在本实施例中,输出步骤S4可包含三个子步骤,首先子步骤S41:处理模块14可先判断已识别文档T是否包括触发指令,当已识别文档T包括触发指令时,即进行子步骤S42:控制人机传输界面15输出待传输文字,当已识别文档T不包括触发指令时,即进行子步骤S43:控制人机传输界面15输出控制指令。举例来说,请对照图1所示,假设“语音输入”的字词为触发计算机输入文字的条件时,当使用者对麦克风模块11说出:“语音输入,计算机重新启动”,语音识别模块13即可识别上述语音而转换为文字形式的已识别文档T,处理模块14即可根据“语音输入”的字词产生待传输文字,其中待传输文字为“计算机重新启动”的字符串,由于“语音输入”为触发计算机输入文字的触发指令,因此,处理模块14仅会控制人机传输界面15输出“计算机重新启动”的字词以供计算机装置20输入而显示在荧幕上,而非在计算机荧幕上显示“语音输入,计算机重新启动”的字词。在另一个实施例中,假设已识别文档T不包括上述“语音输入”的字词时,处理模块14即控制人机传输界面15输出对应“计算机重新启动”内容的控制指令以对应使计算机装置20进行重新开机的动作。当然,在其他实施例中,已识别文档T中也可包含触发指令及其他控制指令(如搜寻文件或音量控制等),处理模块14可同时控制人机传输界面15输出控制指令与待传输文字,并不局限于此。在另一些实施例中,也可在处理模块14判断已识别文档T中包括触发指令时,控制人机传输界面15输出控制指令,而在已识别文档T中不包括触发指令时,输出待传输文字。由此,本发明实施例通过处理模块14能根据已识别文档T的内容判断待传输信息I是控制指令、待传输文字还是两者的组合,可避免计算机装置20产生错误动作的情形(例如使用者欲通过语音控制计算机装置20进行特定动作时,计算机装置20却根据语音内容输入文字的情形),从而本发明实施例能达到更精确的语音识别输入效果。
或者,语音识别输入系统3的语音处理装置10可包括开关模块16,其中开关模块16可为按钮开关、微动开关、拨动开关、薄膜开关、磁性开关等,使用者可操控开关模块16以对应输出开关信号。处理模块14可依据是否接收到开关信号,控制人机传输界面15输出待传输文字或输出控制指令。如图7所示,为本发明语音识别输入方法第三实施例的步骤流程图。在本实施例中,输出步骤S4可包含三个子步骤,首先子步骤S44:处理模块14是否收到开关信号,如果是,那么进行子步骤S45:控制人机传输界面15输出待传输文字。如果否,那么进行子步骤S46:控制人机传输界面15输出控制指令。具体而言,对照图3所示,为本发明语音识别输入系统第三实施例的系统方框图。使用者可操控开关模块16并且对麦克风模块11说出一段文字,语音识别模块13即可识别上述语音而转换为文字形式的已识别文档T,处理模块14即可根据开关信号控制人机传输界面15输出待传输文字(即该段文字)。反之,当使用者未操控开关模块16而仅对麦克风模块11说出该段文字时,处理模块14则根据该段文字的内容输出控制指令。在一些实施例中,也可在处理模块14收到开关信号时,控制人机传输界面15输出控制指令;在处理模块14未收到开关信号时,则控制人机传输界面15输出待传输文字,并不以此为限。
如图8所示,为本发明语音识别输入方法第四实施例的步骤流程图。本实施例相较于图5的实施例来说,本实施例的语音识别步骤S2’还包括:语意分析单元131分析已识别文档T并对应输出指令文字、非指令文字或其组合。本实施例的处理步骤S3’包括:处理模块14根据已识别文档T中的指令文字产生控制指令、或根据非指令文字以产生待传输文字、或其组合。举例来说,请对照图4所示,为本发明语音识别输入系统第四实施例的系统方框图。在本实施例中,语音识别输入系统4的语音处理装置10的语音识别模块13可包括语意分析单元131以对应分析已识别文档T。在一些实施例中,语意分析单元131具体地可为具备运算能力的硬件,例如可程序化的微处理器(Microprocessor)、数位信号处理器(Digital SignalProcessor,DSP)等。
承上,语意分析技术是指将字句、字符串或段落内容,从其中分析出摘要及大意。利用语意分析可不局限于使用者用词,只要满足一般语言语法即能分析辨别。在一些实施例中,语意分析单元131可通过奇异值分解(Singular Value Decompositiob,SVD)、非负矩阵拆解法(Non-negative matrix factorization,NMF)或类神经网络(Neural Network,NN)或其他算法进行语意分析。具体来说,通过分析已识别文档T的语意即可得知使用者的意图,例如当已识别文档T的字符串中包含“搜寻”、“开启”、“关闭”、“控制”或“调整”等动词时,即可通过语意分析判断使用者有操控计算机装置20进行动作的意图,进而将该字符串输出并表示为指令文字,处理模块14即可对应指令文字的内容产生控制指令。当已识别文档T的字符串中包含“输入”字词时,即可通过语意分析以判断使用者有输入文字的意图,进而将该字符串输出并表示为非指令文字,处理模块14即可对应非指令文字的内容产生待传输文字。
如图9所示,为本发明语音识别输入方法第五实施例的步骤流程图。本实施例相较于图5的实施例来说,本实施例的处理步骤S3”进一步包括:将待传输文字编制为万国码格式(Unicode)。例如在图3的实施例中,处理模块14包括编码单元141(例如文字编辑器),以将待传输文字编制为万国码格式。由于万国码格式的文字可适用各种计算机装置20的系统,因此,计算机装置20可直接读取待传输文字并进行输入作业,不需要再额外安装其他语音输入法,使语音输入更加快速、便利。
如图10所示,为本发明语音识别输入方法第六实施例的步骤流程图。本实施例相较于图5的实施例来说,本实施例在语音识别步骤S2后进一步包括翻译步骤S6:翻译单元132分析音讯信号S并输出翻译文字,已识别文档T中包括翻译文字。具体而言,在图3的实施例中,语音识别模块13可包括翻译单元132,以根据使用者的需求将音讯信号S解读后并翻译为另外一种语言文字。
虽然本发明的技术内容已经以优选实施例公开如上,然其并非用以限定本发明,任何熟习此技术者,在不脱离本发明的精神下所作的一些的改动与修改,皆应涵盖在本发明的范围内,因此本发明的保护范围当以后面所附的权利要求书的界定为准。

Claims (27)

1.一种语音识别输入系统,其特征在于,包括:
语音处理装置,包括麦克风模块、音讯收发模块、语音识别模块、处理模块以及人机传输界面,所述麦克风模块输出音讯信号,所述音讯收发模块电连接所述麦克风模块、并与所述语音识别模块通讯连接,所述音讯收发模块接收并传送所述音讯信号至所述语音识别模块,所述语音识别模块识别所述音讯信号后对应回传已识别文档至所述音讯收发模块,所述处理模块电连接所述音讯收发模块与所述人机传输界面,所述处理模块接收所述已识别文档、并根据所述已识别文档产生待传输信息,所述待传输信息是指控制指令、待传输文字或其组合,且所述处理模块控制所述人机传输界面输出所述待传输信息;以及
计算机装置,包括处理器,所述处理器电连接所述人机传输界面以接收所述待传输信息、并对应执行所述控制指令、或显示所述待传输文字或其组合。
2.如权利要求1所述的语音识别输入系统,其特征在于,所述音讯收发模块为无线音讯收发模块或有线音讯收发模块。
3.如权利要求1所述的语音识别输入系统,其特征在于,所述语音识别模块为云端语音识别模块且通讯连接于网际网络,所述音讯收发模块是以无线或有线方式连接至网际网络以与所述语音识别模块彼此通讯。
4.如权利要求1所述的语音识别输入系统,其特征在于,所述语音识别模块包括翻译单元,所述翻译单元分析所述音讯信号并输出翻译文字,所述已识别文档中包括所述翻译文字。
5.如权利要求1所述的语音识别输入系统,其特征在于,所述语音识别模块包括语意分析单元,所述语意分析单元分析所述已识别文档并对应输出指令文字、非指令文字或其组合,所述处理模块是根据所述指令文字以产生所述控制指令、或根据所述非指令文字以产生所述待传输文字、或其组合。
6.如权利要求1所述的语音识别输入系统,其特征在于,所述处理模块依据所述已识别文档中是否包括触发指令,控制输出所述待传输文字或所述控制指令。
7.如权利要求1所述的语音识别输入系统,其特征在于,所述语音处理装置包括开关模块,所述开关模块连接所述处理模块并可选择性地输出开关信号,所述处理模块依据是否收到所述开关信号,控制输出所述待传输文字或输出所述控制指令。
8.如权利要求1所述的语音识别输入系统,其特征在于,所述处理模块包括编码单元,所述编码单元将所述待传输文字编制为万国码格式。
9.如权利要求1所述的语音识别输入系统,其特征在于,所述语音处理装置为计算机周边装置,所述计算机周边装置为键盘、鼠标、触控笔或扬声器。
10.一种语音处理装置,其特征在于,包括:
麦克风模块,输出音讯信号;
音讯收发模块,电连接到所述麦克风模块,所述音讯收发模块接收所述音讯信号后传送出去,并接收对应于所述音讯信号的已识别文档;
处理模块,电连接到所述音讯收发模块并接收所述已识别文档,所述处理模块根据所述已识别文档产生待传输信息,所述待传输信息是指控制指令、待传输文字或其组合;以及
人机传输界面,电连接到所述处理模块,所述处理模块控制所述人机传输界面输出所述待传输信息。
11.如权利要求10所述的语音处理装置,其特征在于,所述音讯收发模块是无线音讯收发模块或有线音讯收发模块。
12.如权利要求10所述的语音处理装置,其特征在于,进一步包括语音识别模块,通讯连接到所述音讯收发模块,所述语音识别模块接收所述音讯信号并加以识别后对应输出所述已识别文档。
13.如权利要求12所述的语音处理装置,其特征在于,所述语音识别模块为云端语音识别模块且通讯连接于网际网络,所述音讯收发模块是以无线或有线方式连接至网际网络以与所述语音识别模块彼此通讯。
14.如权利要求12所述的语音处理装置,其特征在于,所述语音识别模块包括翻译单元,所述翻译单元分析所述音讯信号并输出翻译文字,所述已识别文档中包括所述翻译文字。
15.如权利要求12所述的语音处理装置,其特征在于,所述语音识别模块包括语意分析单元,所述语意分析单元分析所述已识别文档并对应输出指令文字、非指令文字或其组合,所述处理模块是根据所述指令文字以产生所述控制指令、或根据所述非指令文字以产生所述待传输文字、或其组合。
16.如权利要求10所述的语音处理装置,其特征在于,所述处理模块包括编码单元,所述编码单元将所述待传输文字编制为万国码格式。
17.如权利要求10所述的语音处理装置,其特征在于,所述处理模块依据所述已识别文档中是否包括触发指令,控制输出所述待传输文字或所述控制指令。
18.如权利要求10所述的语音处理装置,其特征在于,进一步包括开关模块,所述开关模块电连接所述处理模块并可选择性地输出开关信号,所述处理模块依据是否收到所述开关信号,控制输出所述待传输文字或输出所述控制指令。
19.如权利要求10所述的语音处理装置,其特征在于,所述语音处理装置为计算机周边装置,所述计算机周边装置为键盘、鼠标、触控笔或扬声器。
20.一种语音识别输入方法,其特征在于,包括下列步骤:
音讯输出步骤:输出音讯信号;
语音识别步骤:语音识别模块识别所述音讯信号后并对应输出已识别文档;
处理步骤:处理模块根据所述已识别文档产生待传输信息,其中所述待传输信息是指控制指令、待传输文字或其组合;以及
输出步骤:所述处理模块控制人机传输界面输出所述待传输信息。
21.如权利要求20所述的语音识别输入方法,其特征在于,所述语音识别步骤中的所述语音识别模块为云端语音识别模块且通讯连接到网际网络。
22.如权利要求20所述的语音识别输入方法,其特征在于,所述语音识别步骤包括:语意分析单元分析所述已识别文档并对应输出指令文字、非指令文字或其组合,所述处理步骤中包括所述处理模块是根据所述指令文字以产生所述控制指令、或根据所述非指令文字以产生所述待传输文字、或其组合。
23.如权利要求20所述的语音识别输入方法,其特征在于,所述语音识别步骤后进一步包括翻译步骤:翻译单元分析所述音讯信号并输出翻译文字,所述已识别文档中包括所述翻译文字。
24.如权利要求20所述的语音识别输入方法,其特征在于,所述处理步骤中包括:将所述待传输文字编制为万国码格式。
25.如权利要求20所述的语音识别输入方法,其中所述输出步骤中包括:所述处理模块依据所述已识别文档中是否包括触发指令,控制输出所述待传输文字或输出所述控制指令。
26.如权利要求20所述的语音识别输入方法,其特征在于,所述输出步骤中包括:所述处理模块依据是否收到来自开关模块的开关信号,控制输出所述待传输文字或输出所述控制指令。
27.如权利要求20所述的语音识别输入方法,其特征在于,进一步包括执行步骤:计算机装置接收所述待传输信息、并对应执行所述控制指令、或显示所述待传输文字或其组合。
CN201711166048.XA 2017-11-21 2017-11-21 语音处理装置、语音识别输入系统及语音识别输入方法 Active CN109830239B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711166048.XA CN109830239B (zh) 2017-11-21 2017-11-21 语音处理装置、语音识别输入系统及语音识别输入方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711166048.XA CN109830239B (zh) 2017-11-21 2017-11-21 语音处理装置、语音识别输入系统及语音识别输入方法

Publications (2)

Publication Number Publication Date
CN109830239A true CN109830239A (zh) 2019-05-31
CN109830239B CN109830239B (zh) 2021-07-06

Family

ID=66858118

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711166048.XA Active CN109830239B (zh) 2017-11-21 2017-11-21 语音处理装置、语音识别输入系统及语音识别输入方法

Country Status (1)

Country Link
CN (1) CN109830239B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112216278A (zh) * 2020-09-25 2021-01-12 威盛电子股份有限公司 语音识别系统、指令产生系统及其语音识别方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102158664A (zh) * 2011-03-31 2011-08-17 四川长虹电器股份有限公司 利用移动终端进行语音控制电视机的方法
CN103491429A (zh) * 2013-09-04 2014-01-01 张家港保税区润桐电子技术研发有限公司 一种音频处理方法和音频处理设备
CN104049965A (zh) * 2013-03-16 2014-09-17 上海能感物联网有限公司 外语语音控制机电设备运行的方法
CN104681025A (zh) * 2013-11-26 2015-06-03 现代摩比斯株式会社 利用语音识别的命令执行系统及其工作方法
CN105234945A (zh) * 2015-09-29 2016-01-13 塔米智能科技(北京)有限公司 一种基于网络语音对话及体感互动的迎宾机器人
CN106331062A (zh) * 2016-08-15 2017-01-11 成都云科新能汽车技术有限公司 一种基于云端平台和车载终端交互的命令发布执行系统与方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102158664A (zh) * 2011-03-31 2011-08-17 四川长虹电器股份有限公司 利用移动终端进行语音控制电视机的方法
CN104049965A (zh) * 2013-03-16 2014-09-17 上海能感物联网有限公司 外语语音控制机电设备运行的方法
CN103491429A (zh) * 2013-09-04 2014-01-01 张家港保税区润桐电子技术研发有限公司 一种音频处理方法和音频处理设备
CN104681025A (zh) * 2013-11-26 2015-06-03 现代摩比斯株式会社 利用语音识别的命令执行系统及其工作方法
CN105234945A (zh) * 2015-09-29 2016-01-13 塔米智能科技(北京)有限公司 一种基于网络语音对话及体感互动的迎宾机器人
CN106331062A (zh) * 2016-08-15 2017-01-11 成都云科新能汽车技术有限公司 一种基于云端平台和车载终端交互的命令发布执行系统与方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112216278A (zh) * 2020-09-25 2021-01-12 威盛电子股份有限公司 语音识别系统、指令产生系统及其语音识别方法

Also Published As

Publication number Publication date
CN109830239B (zh) 2021-07-06

Similar Documents

Publication Publication Date Title
CN111261144B (zh) 一种语音识别的方法、装置、终端以及存储介质
US20140088970A1 (en) Method and device for user interface
KR20170033722A (ko) 사용자의 발화 처리 장치 및 방법과, 음성 대화 관리 장치
KR102056330B1 (ko) 통역장치 및 그 방법
CN110992955A (zh) 一种智能设备的语音操作方法、装置、设备及存储介质
KR20190096308A (ko) 전자기기
US20210327407A1 (en) Speech synthesizer using artificial intelligence, method of operating speech synthesizer and computer-readable recording medium
KR20200057501A (ko) 전자 장치 및 그의 와이파이 연결 방법
CN109887490A (zh) 用于识别语音的方法和装置
KR101959439B1 (ko) 통역방법
KR101207435B1 (ko) 대화형 음성인식 서버, 대화형 음성인식 클라이언트 및 대화형 음성인식 방법
CN109830239A (zh) 语音处理装置、语音识别输入系统及语音识别输入方法
CN205376116U (zh) 一种无线定向语音控制自动引导小车遥控装置
KR102056329B1 (ko) 통역방법
US20220287110A1 (en) Electronic device and method for connecting device thereof
CN104301500A (zh) 一种终端控制方法、装置和终端
US11227578B2 (en) Speech synthesizer using artificial intelligence, method of operating speech synthesizer and computer-readable recording medium
TWI650749B (zh) 語音處理裝置、語音辨識輸入系統及語音辨識輸入方法
Baig et al. Speaker recognition based appliances remote control for severely disabled, low vision and old aged persons
US20230245647A1 (en) Electronic device and method for creating customized language model
WO2024039191A1 (ko) 전자 장치 및 사용자 발화 처리 방법
KR101999779B1 (ko) 통역방법
KR20240020134A (ko) 전자 장치, 지능형 서버, 및 화자 적응형 음성 인식 방법
KR20230118006A (ko) 전자 장치 및 사용자 언어 모델 생성 방법
KR20230052106A (ko) 전자 장치 및 전자 장치의 동작 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant