CN104681025B - 利用语音识别的命令执行系统及其工作方法 - Google Patents
利用语音识别的命令执行系统及其工作方法 Download PDFInfo
- Publication number
- CN104681025B CN104681025B CN201410474844.XA CN201410474844A CN104681025B CN 104681025 B CN104681025 B CN 104681025B CN 201410474844 A CN201410474844 A CN 201410474844A CN 104681025 B CN104681025 B CN 104681025B
- Authority
- CN
- China
- Prior art keywords
- terminal
- voice data
- keyword
- communication module
- speech recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000004891 communication Methods 0.000 claims abstract description 97
- 230000008569 process Effects 0.000 claims abstract description 22
- 238000000605 extraction Methods 0.000 claims description 14
- 230000005540 biological transmission Effects 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 7
- 238000013497 data interchange Methods 0.000 claims description 4
- 238000010295 mobile communication Methods 0.000 claims description 4
- 230000000875 corresponding effect Effects 0.000 abstract description 10
- 238000012795 verification Methods 0.000 abstract description 4
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 abstract 1
- 239000000284 extract Substances 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 230000001276 controlling effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 231100001261 hazardous Toxicity 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/80—Services using short range communication, e.g. near-field communication [NFC], radio-frequency identification [RFID] or low energy communication
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R11/00—Arrangements for holding or mounting articles, not otherwise provided for
- B60R11/02—Arrangements for holding or mounting articles, not otherwise provided for for radio sets, television sets, telephones, or the like; Arrangement of controls thereof
- B60R2011/0294—Apparatus with multi-functionalities, e.g. radio and telephone
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mobile Radio Communication Systems (AREA)
- Telephonic Communication Services (AREA)
- Telephone Function (AREA)
Abstract
本发明涉及一种利用语音识别的命令执行系统及其工作方法,该命令执行系统包括通讯模块,其执行近距离无线通讯;第一终端,其接收用户的语音信号生成语音数据,并且在确认到与所述通讯模块的连接时传输所述语音数据;以及第二终端,其通过所述通讯模块从所述第一终端接收所述语音数据,并通过分析接收到的所述语音数据执行相关工作命令。本发明利用从用户的便携终端机获取到的用户的语音信息驱动存储在音响主机单元的应用程序并执行相应动作,便携终端机与音响主机单元通过近场通讯的近距离无线通讯收发信息,省去了用户直接键入信息所带来的繁琐问题,省略了蓝牙等设备之间的其他认证过程,因此提高了用户便利性。
Description
技术领域
本发明涉及一种语音识别技术,尤其涉及通过传输终端获取到的语音来控制其他设备的技术。
背景技术
考虑到交通安全,现在已禁止驾驶员在车辆行驶过程中使用手机。因此驾车过程中驾驶员只能通过免提装置使用手机。现在,可以通过执行无线通讯连接具有免提装置功能的车辆影音导航(AVN;Audio Video Navigation)系统与手机的连接工作,以连接手机与AVN系统。
例如,AVN系统与手机可以通过蓝牙接口配对,可以从AVN系统确认手机中的信息。蓝牙无线通讯方法设定使得只与用户允许的设备连接,而不向用户不希望连接的设备发起连接。因此,这种蓝牙无线通讯方法能够有效地利用有限的无线资源,用户可以快速设定与目标设备的连接。
但是这种蓝牙无线通讯方法不仅搜索目标设备,还搜索周边所有能够连接的设备,然后为用户提供可连接设备列表,因此会耗费用于搜索所有可连接设备的预定时间。
另外在控制AVN系统时,驾驶员(使用者)可直接操作AVN系统来进行控制,或者可以通过操作手机来控制AVN系统。例如,在利用AVN系统的导航搜索地址时,驾驶员需要直接激活AVN系统的导航,并利用触摸屏等键盘输入地址。
但由于这些动作需要驾驶员直接键入,不方便使用,当车辆处于行驶状态时是一种影响驾驶的危险行为,还可能引发交通事故。
发明内容
技术问题
本发明的目的为提供一种能够通过终端识别用户语音以控制其他设 备的技术方案。
技术方案
为解决上述技术问题,根据本发明一个方面的利用语音识别的命令执行系统,是利用设置于车辆的语音识别的命令执行系统,其包括:第一终端,其利用基于统计声学模型将接收到的用户的语音转换为语音数据;通讯模块,其在所述第一终端靠近时无线接收所述语音数据;以及第二终端,其通过所述通讯模块以有线或无线通讯方式接收所述语音数据,通过分析所述语音数据的图形提取关键词,并运行有关所述关键词的应用程序(application program)。
另外为解决上述技术问题,根据本发明一个方面的利用语音识别的命令执行方法,是利用设置于车辆的语音识别的命令执行系统的第二终端的命令执行方法,其包括:通过通讯模块从第一终端接收语音数据的步骤;通过分析接收到的所述语音数据的图形提取关键词的步骤;以及向执行关于所述关键词的工作命令的应用程序(applicationprogram)传递所述关键词的步骤。
技术效果
根据本发明的实施例,利用从用户的便携终端机获取到的用户的语音信息驱动存储在音响主机单元的应用程序并执行相应动作,便携终端机与音响主机单元通过近场通讯的近距离无线通讯收发信息,省去了用户直接键入信息所带来的繁琐问题,省略了蓝牙等设备之间的其他认证过程,因此提高了用户便利性。
附图说明
图1为本发明实施例的利用语音识别的命令执行系统的框图;
图2为说明本发明的终端间近距离无线通讯的示意图;
图3为说明本发明的将用户语音数据化的工作的示意图;
图4为说明本发明的分析语音数据的工作的示意图;
图5为本发明实施例的利用语音识别的命令执行方法的流程图。
附图标记说明
10:命令执行系统 100:第一终端
200:通讯模块 300:第二终端
具体实施方式
利用设置于车辆的语音识别的命令执行系统包括:第一终端,其利用基于统计声学模型将用户的语音转换为语音数据;通讯模块,其在所述第一终端靠近时无线接收所述语音数据;以及第二终端,其通过所述通讯模块以有线或无线通讯方式接收所述语音数据,通过分析所述语音数据的图形提取关键词,并运行有关所述关键词的应用程序(application program)。
其中,所述第一终端是所述用户的移动通信终端机,所述第二终端是车辆音响主机单元,所述通讯模块是近场通讯(NFC;Near Field Communication)模块。
所述第一终端在靠近所述通讯模块而被所述通讯模块标记(tagging)时,将所述语音数据传输到所述第二终端,其中所述第一终端依次执行基于所述基于统计声学模型的抽样过程、噪声去除过程及特征提取过程,将所述语音信号转换为所述语音数据,并将转换的所述语音数据转换为近场通讯数据交换格式(NDEF;NFC Data Exchange Format)协议形态。
所述关键词是关于所述应用程序中执行的工作命令的单词,所述第二终端的所述应用程序执行对应于提取到的所述关键词的工作命令。
所述第二终端在分析所述语音数据的图形失败时,通过所述通讯模块向所述第一终端传输错误消息。
利用设置于车辆的语音识别的命令执行系统的第二终端的命令执行方法包括:通过通讯模块从第一终端接收语音数据的步骤;通过分析接收到的所述语音数据的图形提取关键词的步骤;以及向执行关于所述关键词的工作命令的应用程序传递所述关键词的步骤。
接收的所述步骤包括以有线或无线通讯方式接收所述第一终端靠近所述通讯模块而从所述第一终端无线传递到所述通讯模块的所述语音数据的步骤。
所述通讯模块是近场通讯(NFC;Near Field Communication)模块,接收的所述步骤包括当所述第一终端靠近所述通讯模块而被所述通讯模块标记(tagging)时,通过所述通讯模块从所述第一终端接收所述语音数据的步骤。
接收的所述步骤包括接收在所述第一终端根据基于统计声学模型转换用 户的语音信号并转换成近场通讯数据交换格式(NDEF;NFC Data Exchange Format)协议形态的所述语音数据的步骤。
提取的所述步骤包括将关于所述应用程序执行的工作命令的单词作为所述关键词来提取的步骤。
还包括所述应用程序执行对应于所述关键词的工作命令的步骤以及当分析所述语音数据的图形失败时,通过所述通讯模块向所述第一终端传输错误消息的步骤。
通过结合附图说明的优选实施例,上述及其他本发明的实施形态将会更加清楚。为使本领域的普通技术人员能够根据这些实施例理解和实施本发明,以下对本发明进行详细说明。
图1为本发明实施例的利用语音识别的命令执行系统的框图。如图所示,命令执行系统10包括第一终端100、通讯模块200及第二终端300。
首先,通讯模块200是执行近距离无线通讯的模块。例如,通讯模块200是用于近距离无线通讯中的近场通讯(NFC;Near Field Communication)的NFC通讯模块。
NFC模块是电子标签(RFID)的一种,是使用13.56MHz频带的非接触式近距离无线通讯模块,是用于实现相隔10cm近距离的终端机间数据传输的模块。NFC模块可使用数据读取及写入功能,因此不需要现有的使用RFID所必须的读取器,并且无需像蓝牙等现有近距离通讯另外设定设备间连接。
并且,NFC利用感应电流的原理,感应电流的原理由英国物理学家法拉第(Faraday)发现,是当磁场靠近线圈时线圈中瞬间产生电流的原理。例如如图2中(A)所示,当磁铁22往复第一线圈21时第二线圈23中也产生电流。
NFC模块可按照上述感应电流的原理工作。此时如图2中(B)所示,NFC模块可利用读取器(reader)24与卡(标签)25工作。例如,读取器24具有其作用相同于第一线圈21的天线,因此当施加电流时会产生持续变化的连续性信号磁场。另外,卡25上具有围绕卡25的第二线圈23,因此当靠近读取器24时线圈中产生电流。此时产生的电流促使内置于卡25的存储芯片工作,因此读取器24能够读取存储在芯片上的信息。
即,当具有卡25的第一终端100靠近具有读取器24的通讯模块200时 产生电流,因此具有通讯模块200的读取器24能够读取记录在内置于第一终端100内的存储器的信息。另外,如上读取到的信息可传输到第二终端300。
第一终端100接收用户的语音信号并用此生成语音数据,并通过通讯模块200将生成的语音数据传输到第二终端300。为接收用户的语音信号,第一终端100包括用于获取用户语音的麦克风。另外,为了将通过麦克风接收到的用户的语音信号生成为语音数据,第一终端100有内置的语音处理器。
为进行语音处理,第一终端100可包括语音识别部110、抽样部120、噪声去除部130及数据化部140。另外,第一终端包括用于存储(临时存储)生成的语音数据的存储器,为了连接用于向第二终端300传输语音数据的通讯模块200,可以内置卡(NFC卡)。
例如,第一终端100可以是现在普遍使用的内置麦克风的移动通信终端机(例如智能手机)。又例如,第一终端100还可以是一般的录音装置(录音机)。以下以本发明的第一终端100是智能手机为例进行说明。
第一终端100通过语音识别部110(例如麦克风)获取(识别)用户的语音。在此,当用户具有向第二终端300传输数据(语音数据)的意向,从而向第一终端100输入请求信号时,第一终端100通过语音识别部110获取用户的语音。例如,第一终端100在用户选择NFC按键时通过语音识别部110获取用户的语音。
此时,用户向第一终端100的麦克风准确地发音关键词及附加信息。其中关键词是关于之后由第二终端300的应用程序执行的工作命令的单词,附加信息是关于应用程序执行的工作命令的具体信息。
例如,当从用户接收到语音“兴趣点(或导航系统)(POI(or NAVI)):首尔特别市江南区瑞草洞00号”时,第二终端300中驱动与关键词“POI”相关的导航应用程序,还可以执行将附加信息“首尔特别市江南区瑞草洞00号”作为兴趣点存储的工作。
又例如,当从用户接收到语音“存储号码:010-0000-0000”时,第二终端300中驱动与关键词“存储号码”相关的联系方式应用程序,还可以执行将附加信息“010-0000-0000”作为联系方式存储的工作。
当通过语音识别部110接收到语音信号时,第一终端100利用语音处理器生成语音数据。其中,第一终端100对从用户接收到的语音信号执行图3 中(A)所示的多个过程中的至少一个过程,以生成语音数据。例如,在步骤S310中通过第一终端100的语音识别部110从用户接收语音信号。在步骤S320中,抽样部120对通过语音识别部110接收到的语音信号抽样。在步骤S330中,噪声去除部130去除抽样部120抽样的语音信号中的噪声。在步骤S340中,数据化部140在噪声去除部130去除噪声后的语音信号中提取特征,以生成语音数据。即如图3中(B)所示,从用户接收到的语音信号(模拟信号)可以在经过预处理过程S350及特征提取过程S360之后,经过利用预先构筑的信息的基于统计声学模型的训练过程S370进行译码S380,以生成语音数据(数字信号)。
另外,第一终端100确认是否生成语音数据,若语音信号未生成为语音数据,则通过输出提示信息来请求用户再次输入语音,例如,第一终端100可通过显示语音重新输入(重新识别)请求信息来向用户请求重新输入语音。
第一终端100为了将生成的语音数据传输到第二终端300,执行按通讯模块200的协议数据格式转换语音数据的过程。例如,第一终端可以将语音数据转换为NDEF(NFC DataExchange Format)协议形态。
如上转换的语音数据可通过通讯模块200(NFC模块)传输到第二终端300。此时,转换的语音数据在第一终端100与通讯模块200间确认连接时,可通过通讯模块200传输到第二终端300。优选地,当第一终端100靠近通讯模块200而被读取器(标签)标记时,可确认第一终端100与通讯模块200建立了连接。即,转换语音数据后,当第一终端100因用户而被通讯模块200标记时,第一终端100确认第一终端100与通讯模块200间建立了通讯连接,因此向第二终端300传输语音数据。
转换语音数据后,若确认出未与通讯模块200连接,则第一终端100将转换的语音数据存储在存储器上。或者,第一终端100不论是否与通讯模块200建立通讯连接,可以无条件地将转换的语音数据存储在存储器上。之后,若确认与通讯模块200建立连接,语音数据传输到第二终端300,则第一终端100可删除存储在存储器上的语音数据。
第二终端300用于分析接收到的语音数据,以执行其相关工作命令。优选地,第二终端300可以是控制车辆的AVN(Audio、Video、Navigation)系统的音响主机单元。或者,第二终端300可以是控制车辆的整个免提系统 的控制单元。第二终端300可以是具有多个应用程序的终端设备。本发明中以第二终端300是控制AVN系统及免提系统的音响主机单元为例进行说明。其中,第二终端300包括用于将语音数据转换处理为文字的语音识别处理器(例如,语音转文本(STT;Speech To Text))。为此,第二终端300可以包括数据分析部310、图形比较部320、信息提取部330、应用程序(App)传递部340及应用程序(App)执行部350。
第二终端300分析处理通过通讯模块200从第一终端100接收到的语音数据(比较图形(图4中(A)))提取关键词及附加信息。例如,当在步骤S410中从第一终端100接收到语音数据时,在步骤S420中利用语音识别引擎分析语音数据。此时第二终端300通过数据分析部310分析从第一终端100接收到的语音数据,并通过图形比较部320比较经过分析的语音数据与预先存储的信息的图形。根据图形比较结果,在步骤S430中第二终端300通过信息提取部330从语音数据中提取信息(关键词及附加信息)。即,第二终端300可以通过语音识别处理器(数据分析部310、图形比较部320、信息提取部330的处理器)分析处理语音数据(分析及图形比较),以提取关键词及附加信息。
其中,关键词是可内置在第二终端300工作的应用程序中执行的工作命令或相关单词,可预先存储在存储器(第二终端的存储器)上。
例如,当用户输入语音“POI(或NAVI):首尔特别市江南区瑞草洞00号”,从而接收到语音数据时,第二终端300可提取关键词“POI”及附加信息“首尔特别市江南区瑞草洞00号”。又例如,当用户输入语音“存储号码,010-0000-0000”,从而接收到语音数据时,第二终端300可提取附加信息“010-0000-0000”及关键词“存储号码”。
进而,第二终端300通过提取到的关键词及附加信息执行内置应用程序(App)的相应命令。例如,第二终端300的应用程序(App)传递部340向有关提取到的关键词及附加信息的应用程序传递相应信息(关键词及附加信息)。应用程序(App)执行部350启动接收到相应信息(关键词及附加信息)的应用程序,以执行相应命令。
例如,当从语音数据“POI(或NAVI):首尔特别市江南区瑞草洞00号”提取到关键词“POI”及附加信息“首尔特别市江南区瑞草洞00号”时,第 二终端300运行内置应用程序中的导航。并且,执行导航功能中的POI(兴趣点)功能,以执行将附加信息“首尔特别市江南区瑞草洞00号”作为兴趣点输入的工作。
又例如,当从语音数据“存储号码:010-0000-0000”提取到附加信息“010-0000-0000”和关键词“存储号码”时,第二终端300运行内置应用程序中的联系方式应用程序。并且,第二终端300可以执行联系方式应用程序功能中的号码存储功能,将附加信息“010-0000-0000”作为联系方式存储。
另外,有一种情况是第二终端300提取了关键词及附加信息,但是仅凭提取到的关键词确定不了应执行的应用程序及其工作。例如,第二终端300内没有预先存储关于获取到的关键词及相关应用程序的情况,或者是存储器中没有预先存储相关单词的情况,遇到这些情况时,在步骤S440中第二终端300判断提取到的关键词的意思模糊。
若步骤S440的判断结果为关键词的意思不模糊,则在步骤S450中第二终端300输出相关应用程序的执行结果。
若步骤S440中因图形分析失败而判断关键词意思模糊,则在步骤S450中第二终端300还判断附加信息的意思模糊性。此时,若判断结果为关键词意思模糊,但附加信息意思不模糊,则第二终端300可利用附加信息推测能够运行的程序。在此类情况下,第二终端300可通过确认附加信息种类来运行相关应用程序。
例如,由于受到用户发音影响或第一终端100出现关于语音信号的语音处理错误,导致用户的发音“搜索地址:首尔特别市江南区瑞草洞00号”被接收成“搜索:首尔特别市江南区瑞草洞00号”时,第二终端300仅凭关键词“搜索”判断不出该执行哪个程序。此时,第二终端300可通过附加信息“首尔特别市江南区瑞草洞00号”推测语音数据与地址有关,从而能够执行与地址相关的导航。
另外,可以预先设定相应程序的基本工作,例如,当导航的基本工作为“搜索地址”时,第二终端300只需附加信息即可运行导航,以搜索附加信息“首尔特别市江南区瑞草洞00号”所指的地址。若导航的基本工作为“查找捷径”,则第二终端300只需附加信息即可运行导航,能够搜索出从当前位置到附加信息所指地址的最快路线。
又例如,由于受到用户发音影响或第一终端100出现关于语音信号的语音处理错误,导致用户的发音“拨打电话:010-0000-0000”被接收成“电话:010-0000-0000”时,第二终端300可通过关键词“电话”运行联系方式应用程序,但无法判断应该执行联系方式应用程序中的哪个工作。这种情况下若联系方式应用程序的基本工作已预先设定为“存储联系方式”,则第二终端300可执行将附加信息“010-0000-0000”存储到联系方式中的工作。或者,若联系方式应用程序的基本工作为“拨打电话”,则即使未正确提取出关键词,第二终端300也能够按用户意图执行向“010-0000-0000”拨打电话的工作。
即,可以对第二终端300设定使得应用程序在只提取到部分关键词时(意思模糊的情况),若存在预先指定的至少一种基本工作,则执行与提取到的关键词相似的基本工作(Default)。
若关键词及附加信息的意思均模糊,则在步骤S460中第二终端300输出错误消息。其中,第二终端300输出的错误消息传输到第一终端100,因此用户能够进行确认。例如,第二终端300输出的错误消息可通过通讯模块200传递到第一终端100。
根据如上所述的本发明实施例,利用从用户的便携终端机获取到的用户的语音信息驱动存储在音响主机单元的应用程序并执行相应动作,便携终端机与音响主机单元通过近场通讯的近距离无线通讯收发信息,省去了用户直接键入信息所带来的繁琐问题,省略了蓝牙等设备之间的其他认证过程,因此提高了用户便利性。
图5为根据本发明实施例的利用语音识别的命令执行方法的流程图。
首先在步骤S510中,命令执行系统10确认是否有用户的按键输入操作,该按键用于通过第一终端100的语音识别来驱动命令系统。
其中,第一终端100是用于获取用户语音的具有内置麦克风的终端。例如,第一终端100可以是现在普遍使用的具有内置麦克风的移动通信终端(例如智能手机)。又例如,第一终端100还可以是一般的录音装置(录音机)。
具体来讲,可通过用户对第一终端100的按键操作动作来确认用户是否具有通过语音识别来驱动命令系统的意向。例如,当通过用户操作激活第一终端100的录音功能时,第一终端100确认为具有向第二终端300传递信息 的意向。又例如,当通过用户操作激活第一终端100的近距离无线通讯(例如,NFC)功能时,确认为具有向第二终端300传递信息的意向。
当步骤S510中确认到具有用于通过语音识别来驱动命令系统的按键操作时,在步骤S520中命令执行系统10从第一终端100接收用户的语音信号。
此时,用户向第一终端100的麦克风准确发音关键词及附加信息。其中,关键词是关于之后在第二终端300的应用程序中执行的工作的单词,附加信息是关于应用程序执行的工作的具体信息。
例如,当从用户获取到语音“POI(或NAVI):首尔特别市江南区瑞草洞00号”时,第二终端300中执行与“POI”相关的导航应用程序,并且可以执行将“首尔特别市江南区瑞草洞00号”作为兴趣点存储的工作。又例如,当从用户接收到语音“存储号码:010-0000-0000”时,第二终端300中执行与“存储号码”相关的联系方式应用程序,并可以执行将“010-0000-0000”作为联系方式存储的工作。
当接收到用户语音信号时,在步骤S530中命令执行系统10在第一终端100中利用语音处理器生成语音数据。
具体来讲,第一终端100对从用户接收到的语音信号执行语音处理器的抽样过程、噪声去除过程及特征提取过程中至少一个过程,以生成语音数据。优选地,可通过对从用户接收到的语音信号(模拟信号)进行抽样、噪声去除、特征提取过程生成语音数据(数字数据)。
另外,第一终端100确认是否生成语音数据,若语音信号未生成为语音数据,则通过输出提示信息来请求用户再次输入语音。优选地,第一终端100可通过显示重新输入语音请求信息来向用户请求重新输入语音。
进而,第一终端100为了将生成的语音数据传输到第二终端300,执行按通讯模块200的协议数据格式转换语音数据的过程。具体来讲,第一终端100可以将语音数据转换为NDEF(NFC Data Exchange Format)协议形态。另外,第一终端100可以将转换成NDEF协议形态的语音数据存储到存储器中。
在步骤S540中,命令执行系统10确认第一终端100与通信模块200之间的通信连接。
优选地,命令执行系统10可以在第一终端100靠近通讯模块200而被读取器(标签)标记时,确认为第一终端100与通讯模块200建立了连接。即, 当第一终端100转换语音数据后第一终端100因用户而被通讯模块200标记时,命令执行系统10可以确认第一终端100与通讯模块200间的通讯连接。
当确认建立了通讯连接时,在步骤S550中命令执行系统10把第一终端100的语音数据传输到第二终端300。
其中,第二终端300可以是控制车辆AVN(Audio、Video、Navigation)的音响主机单元。或者,第二终端300可以是控制车辆的整个免提系统的控制单元。第二终端300可以是具有多个应用程序的终端设备。
在步骤S560中,命令执行系统10在第二终端300分析处理接收到的语音数据以提取信息。
具体来讲,第二终端300可利用将语音数据转换处理为文字的语音识别处理器(例如STT(Speech To Text))分析处理语音数据(图形比较),以提取关键词及附加信息。
例如,当用户输入语音“POI(或NAVI):首尔特别市江南区瑞草洞00号”,从而接收到语音数据时,第二终端300可提取关键词“POI”及附加信息“首尔特别市江南区瑞草洞00号”。又例如,当用户输入语音“存储号码:010-0000-0000”,从而接收到语音数据时,第二终端300可提取附加信息“010-0000-0000”及关键词“存储号码”。此时,关键词是能够内置于第二终端300工作的应用程序执行的工作或相关单词,可以预先存储在存储器(第二终端的存储器)中。
在步骤S570中,命令执行系统10利用提取到的信息执行第二终端300的应用程序的相应动作。
例如,当从语音数据“POI(或NAVI):首尔特别市江南区瑞草洞00号”提取到关键词“POI”及附加信息“首尔特别市江南区瑞草洞00号”时,第二终端300运行内置应用程序中的导航。并且,执行导航功能中的POI(兴趣点)功能,以执行将附加信息“首尔特别市江南区瑞草洞00号”作为兴趣点输入的工作。
又例如,当从语音数据“存储号码:010-0000-0000”提取到附加信息“010-0000-0000”和关键词“存储号码”时,第二终端300运行内置应用程序中的联系方式应用程序。并且,第二终端300可以执行联系方式应用程序功能中的号码存储功能,将附加信息“010-0000-0000”作为联系方式存储。
根据如上所述的本发明实施例,利用从用户的便携终端机获取到的用户的语音信息驱动存储在音响主机单元的应用程序并执行相应动作,便携终端机与音响主机单元通过近场通讯的近距离无线通讯收发信息,省去了用户直接键入信息所带来的繁琐问题,省略了蓝牙等设备之间的其他认证过程,因此提高了用户便利性。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (13)
1.一种利用语音识别的命令执行系统,是利用设置于车辆的语音识别的命令执行系统,其特征在于,包括:
第一终端,其利用基于统计声学模型将接收到的用户的语音转换为语音数据;
通讯模块,其在所述第一终端靠近时无线接收所述语音数据;以及
第二终端,其通过所述通讯模块以有线或无线通讯方式接收所述语音数据,通过分析所述语音数据的图形提取关键词及附加信息,
所述第二终端判断出所述关键词的意思不模糊时输出有关所述关键词的应用程序的执行结果,
判断出所述关键词的意思模糊时判断所述附加信息的意思的模糊性,
在判断结果为所述关键词的意思模糊但所述附加信息的意思不模糊时,利用所述附加信息推测能够运行的应用程序并使之运行,
其中,所述关键词是预先存储在所述第二终端的关于所述应用程序执行的工作命令的单词,所述附加信息是关于所述应用程序执行的工作命令的具体信息。
2.根据权利要求1所述的利用语音识别的命令执行系统,其特征在于:
所述通讯模块是近场通讯模块。
3.根据权利要求2所述的利用语音识别的命令执行系统,其特征在于:
所述第一终端在靠近所述通讯模块而被所述通讯模块标记时,将所述语音数据传输到所述第二终端。
4.根据权利要求1所述的利用语音识别的命令执行系统,其特征在于:
所述第一终端依次执行基于所述基于统计声学模型的抽样过程、噪声去除过程及特征提取过程,将所述语音信号转换为所述语音数据,并将转换的所述语音数据转换为近场通讯数据交换格式协议形态。
5.根据权利要求1所述的利用语音识别的命令执行系统,其特征在于:
所述第二终端的应用程序执行对应于提取到的所述关键词的工作命令。
6.根据权利要求1所述的利用语音识别的命令执行系统,其特征在于:
所述第二终端在分析所述语音数据的图形失败时,通过所述通讯模块向所述第一终端传输错误消息。
7.根据权利要求1所述的利用语音识别的命令执行系统,其特征在于:
所述第一终端是所述用户的移动通信终端机,所述第二终端是车辆音响主机单元。
8.一种利用语音识别的命令执行方法,是利用设置于车辆的语音识别的命令执行系统的第二终端的命令执行方法,其特征在于,包括:
通过通讯模块从第一终端接收语音数据的步骤;
通过分析接收到的所述语音数据的图形提取关键词及附加信息的步骤;
判断所述关键词的意思是否模糊的步骤;
判断出所述关键词的意思不模糊时输出有关所述关键词的应用程序的执行结果的步骤;
判断出所述关键词的意思模糊时判断所述附加信息的意思的模糊性的步骤;以及
在判断结果为所述关键词的意思模糊但所述附加信息的意思不模糊时,利用所述附加信息推测能够运行的应用程序并使之运行的步骤,
其中,所述关键词是预先存储在所述第二终端的关于所述应用程序执行的工作命令的单词,所述附加信息是关于所述应用程序执行的工作命令的具体信息。
9.根据权利要求8所述的利用语音识别的命令执行方法,其特征在于,接收的所述步骤包括:
以有线或无线通讯方式接收所述第一终端靠近所述通讯模块而从所述第一终端无线传递到所述通讯模块的所述语音数据的步骤。
10.根据权利要求8所述的利用语音识别的命令执行方法,其特征在于,接收的所述步骤包括:
当所述第一终端靠近所述通讯模块而被所述通讯模块标记时,通过所述通讯模块从所述第一终端接收所述语音数据的步骤。
11.根据权利要求10所述的利用语音识别的命令执行方法,其特征在于,接收的所述步骤包括:
接收在所述第一终端根据基于统计声学模型转换用户的语音信号并转换成近场通讯数据交换格式协议形态的所述语音数据的步骤。
12.根据权利要求8所述的利用语音识别的命令执行方法,其特征在于,还包括:
所述应用程序执行对应于所述关键词的工作命令的步骤。
13.根据权利要求8所述的利用语音识别的命令执行方法,其特征在于,还包括:
当分析所述语音数据的图形失败时,通过所述通讯模块向所述第一终端传输错误消息的步骤。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020130144544A KR102197143B1 (ko) | 2013-11-26 | 2013-11-26 | 음성 인식을 이용한 명령 수행 시스템 및 그 동작 방법 |
KR10-2013-0144544 | 2013-11-26 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104681025A CN104681025A (zh) | 2015-06-03 |
CN104681025B true CN104681025B (zh) | 2018-04-20 |
Family
ID=53315980
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410474844.XA Active CN104681025B (zh) | 2013-11-26 | 2014-09-17 | 利用语音识别的命令执行系统及其工作方法 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR102197143B1 (zh) |
CN (1) | CN104681025B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105979083A (zh) * | 2016-04-29 | 2016-09-28 | 珠海市魅族科技有限公司 | 一种图形展示方法及装置 |
CN106412315B (zh) * | 2016-10-31 | 2020-05-01 | 努比亚技术有限公司 | Nfc标签、设置nfc标签的方法、nfc标签系统及移动终端 |
CN107808670B (zh) * | 2017-10-25 | 2021-05-14 | 百度在线网络技术(北京)有限公司 | 语音数据处理方法、装置、设备及存储介质 |
CN107819472B (zh) * | 2017-11-14 | 2020-04-17 | 安徽森力汽车电子有限公司 | 车载收音机 |
CN109830239B (zh) * | 2017-11-21 | 2021-07-06 | 群光电子股份有限公司 | 语音处理装置、语音识别输入系统及语音识别输入方法 |
CN107919131A (zh) * | 2017-12-11 | 2018-04-17 | 广东小天才科技有限公司 | 一种通过麦克风设备控制用户终端的方法及系统 |
CN116030790A (zh) * | 2021-10-22 | 2023-04-28 | 华为技术有限公司 | 分布式语音控制方法及电子设备 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1828682A (zh) * | 2005-03-01 | 2006-09-06 | 峻扬实业股份有限公司 | 语音辨识闸道装置 |
CN102006373A (zh) * | 2010-11-24 | 2011-04-06 | 深圳市子栋科技有限公司 | 基于语音命令控制的车载服务系统及方法 |
CN102322866A (zh) * | 2011-07-04 | 2012-01-18 | 深圳市子栋科技有限公司 | 基于自然语音识别的导航方法和系统 |
CN102800178A (zh) * | 2012-07-12 | 2012-11-28 | 李凯 | 遥控玩具的控制方法 |
CN102891706A (zh) * | 2011-07-20 | 2013-01-23 | Lg电子株式会社 | 移动终端和控制该移动终端的方法 |
CN202906954U (zh) * | 2012-08-21 | 2013-04-24 | 无锡爱睿芯电子有限公司 | 一种远距离语音遥控系统 |
CN103116410A (zh) * | 2011-08-10 | 2013-05-22 | Lg电子株式会社 | 移动终端及其控制方法 |
CN103187079A (zh) * | 2011-12-30 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 车载信息系统 |
CN103187059A (zh) * | 2011-12-28 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 基于车载应用的语音处理系统 |
CN103209009A (zh) * | 2013-02-28 | 2013-07-17 | 山东大学 | 一种采用nfc配对的服务器无线输入设备及其工作方法 |
CN203301528U (zh) * | 2013-04-09 | 2013-11-20 | 上海禾未新能源科技有限公司 | 一种信息交互系统 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20000025292A (ko) * | 1998-10-09 | 2000-05-06 | 김영환 | 잡음환경에서의 핵심어 검출에 적합한 음성특징 추출방법 |
KR100577387B1 (ko) * | 2003-08-06 | 2006-05-10 | 삼성전자주식회사 | 음성 대화 시스템에서의 음성 인식 오류 처리 방법 및 장치 |
CN101604233B (zh) * | 2004-02-06 | 2011-08-10 | 刘新斌 | 一种用于交互控制的语音虚拟键盘的使用方法 |
US8942985B2 (en) * | 2004-11-16 | 2015-01-27 | Microsoft Corporation | Centralized method and system for clarifying voice commands |
CN101499277B (zh) * | 2008-07-25 | 2011-05-04 | 中国科学院计算技术研究所 | 一种服务智能导航方法和系统 |
JP5347403B2 (ja) * | 2008-09-22 | 2013-11-20 | ソニー株式会社 | 情報処理装置および方法、プログラム、並びに、情報処理システム |
US9257115B2 (en) * | 2012-03-08 | 2016-02-09 | Facebook, Inc. | Device for extracting information from a dialog |
KR20130123613A (ko) * | 2012-05-03 | 2013-11-13 | 현대엠엔소프트 주식회사 | 음성인식 경로안내장치 및 방법 |
CN103000173B (zh) * | 2012-12-11 | 2015-06-17 | 优视科技有限公司 | 一种语音交互方法及装置 |
CN103021403A (zh) * | 2012-12-31 | 2013-04-03 | 威盛电子股份有限公司 | 基于语音识别的选择方法及其移动终端装置及信息系统 |
-
2013
- 2013-11-26 KR KR1020130144544A patent/KR102197143B1/ko active IP Right Grant
-
2014
- 2014-09-17 CN CN201410474844.XA patent/CN104681025B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1828682A (zh) * | 2005-03-01 | 2006-09-06 | 峻扬实业股份有限公司 | 语音辨识闸道装置 |
CN102006373A (zh) * | 2010-11-24 | 2011-04-06 | 深圳市子栋科技有限公司 | 基于语音命令控制的车载服务系统及方法 |
CN102322866A (zh) * | 2011-07-04 | 2012-01-18 | 深圳市子栋科技有限公司 | 基于自然语音识别的导航方法和系统 |
CN102891706A (zh) * | 2011-07-20 | 2013-01-23 | Lg电子株式会社 | 移动终端和控制该移动终端的方法 |
CN103116410A (zh) * | 2011-08-10 | 2013-05-22 | Lg电子株式会社 | 移动终端及其控制方法 |
CN103187059A (zh) * | 2011-12-28 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 基于车载应用的语音处理系统 |
CN103187079A (zh) * | 2011-12-30 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 车载信息系统 |
CN102800178A (zh) * | 2012-07-12 | 2012-11-28 | 李凯 | 遥控玩具的控制方法 |
CN202906954U (zh) * | 2012-08-21 | 2013-04-24 | 无锡爱睿芯电子有限公司 | 一种远距离语音遥控系统 |
CN103209009A (zh) * | 2013-02-28 | 2013-07-17 | 山东大学 | 一种采用nfc配对的服务器无线输入设备及其工作方法 |
CN203301528U (zh) * | 2013-04-09 | 2013-11-20 | 上海禾未新能源科技有限公司 | 一种信息交互系统 |
Also Published As
Publication number | Publication date |
---|---|
CN104681025A (zh) | 2015-06-03 |
KR102197143B1 (ko) | 2020-12-31 |
KR20150060300A (ko) | 2015-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104681025B (zh) | 利用语音识别的命令执行系统及其工作方法 | |
US20240096345A1 (en) | Electronic device providing response to voice input, and method and computer readable medium thereof | |
JP6802305B2 (ja) | 対話型サーバ、ディスプレイ装置及びその制御方法 | |
US9601107B2 (en) | Speech recognition system, recognition dictionary registration system, and acoustic model identifier series generation apparatus | |
WO2017068560A1 (ja) | 通信装置 | |
JP2006154926A (ja) | キャラクタ表示を利用した電子機器操作システム及び電子機器 | |
CN103425949A (zh) | 用于与可携式电子装置交互的系统和方法 | |
US9800996B2 (en) | Machine to machine system, method and server using social network service | |
CN103620528B (zh) | 利用附件选择文本预测结果 | |
CN104360736A (zh) | 基于手势的终端控制方法和系统 | |
CN104268129A (zh) | 消息回复的方法及装置 | |
CN103808329A (zh) | 近场通讯移动装置及导航装置通讯系统 | |
CN104301522A (zh) | 通讯中的信息输入方法及通讯终端 | |
CN103905638A (zh) | 一种信息处理方法及电子设备 | |
KR20140067687A (ko) | 대화형 음성인식이 가능한 차량 시스템 | |
CN103810598A (zh) | 基于终端设备的支付系统及支付方法 | |
CN105068742B (zh) | 一种智能手表的控制方法及智能手表 | |
CN107708064A (zh) | 一种车载设备定位手机的方法和系统 | |
JP2015162118A (ja) | 通信装置及びその制御方法、プログラム | |
CN101247599B (zh) | 一种多卡移动终端中stk指令处理方法、装置及移动终端 | |
KR101133855B1 (ko) | Ui 정보 제공 시스템 및 방법과 이를 위한 이동통신 단말 | |
KR20190053392A (ko) | 대화 시스템 및 그 제어방법 | |
CN108616586A (zh) | 一种智能模组的通信方法与智能模组 | |
KR101400212B1 (ko) | 서적의 텍스트 정보를 음성 출력하기 위한 사용자 단말기 및 방법 | |
CN105930525A (zh) | 内容搜索方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |