CN106847274A - 一种用于智能机器人的人机交互方法及装置 - Google Patents
一种用于智能机器人的人机交互方法及装置 Download PDFInfo
- Publication number
- CN106847274A CN106847274A CN201611218151.XA CN201611218151A CN106847274A CN 106847274 A CN106847274 A CN 106847274A CN 201611218151 A CN201611218151 A CN 201611218151A CN 106847274 A CN106847274 A CN 106847274A
- Authority
- CN
- China
- Prior art keywords
- voice
- offline
- cloud server
- clouds
- identification result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 230000003993 interaction Effects 0.000 title claims abstract description 30
- 230000002452 interceptive effect Effects 0.000 claims abstract description 61
- 230000005540 biological transmission Effects 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/34—Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Manipulator (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
一种用于智能机器人的人机交互方法及装置,其中,该方法包括:获取用户输入的交互语音信息;将交互语音信息上传至云端服务器,由云端服务器对交互语音信息进行识别,并接收云端服务器发送的云端语音识别结果;其中,将语音信息上传至云端服务器之后,至收到云端服务器发送的云端语音识别结果之前,若接收到用户输入的新的语音信息,则调用离线语音识别模块对用户输入的新的语音信息进行识别得到离线语音识别结果,并根据离线语音识别结果生成相应的多模态反馈信息并输出。本方法避免了在等待云端服务器的语音识别结果的过程中无法对用户所输入的新的语音交互信息进行响应的问题,使得机器人能够更加合理地对用户所输入的语音交互信息进行反馈。
Description
技术领域
本发明涉及机器人技术领域,具体地说,涉及一种用于智能机器人的人机交互方法及装置。
背景技术
随着科学技术的不断发展,信息技术、计算机技术以及人工智能技术的引入,机器人的研究已经逐步走出工业领域,逐渐扩展到了医疗、保健、家庭、娱乐以及服务行业等领域。而人们对于机器人的要求也从简单重复的机械动作提升为具有拟人问答、自主性及与其他机器人进行交互的智能机器人,人机交互也就成为决定智能机器人发展的重要因素。
发明内容
为解决上述问题,本发明提供了一种用于智能机器人的人机交互方法,其包括:
步骤一,获取用户输入的交互语音信息;
步骤二,将所述交互语音信息上传至云端服务器,由所述云端服务器对所述交互语音信息进行识别,并接收所述云端服务器发送的云端语音识别结果;
其中,在所述步骤二中,将所述语音信息上传至云端服务器之后,至收到所述云端服务器发送的云端语音识别结果之前,若接收到用户输入的新的语音信息,则调用离线语音识别模块对用户输入的新的语音信息进行识别得到离线语音识别结果,并根据所述离线语音识别结果生成相应的多模态反馈信息并输出。
根据本发明的一个实施例,在所述步骤二中,调用离线语音识别模块,确定所述用户输入的新的语音信息与所述离线语音识别模块中的预置命令词是否匹配,若匹配,则获得离线语音识别结果。
根据本发明的一个实施例,在所述步骤二中,在调用离线语音识别模块时,如果所述离线语音识别模块识别出预设指令信息,则生成忽略云端语音识别指令,以在接收到所述云端服务器反馈的云端语音识别结果时根据所述忽略云端语音识别指令忽略所述云端语音识别结果。
根据本发明的一个实施例,在所述步骤二中,如果调用离线语音识别模块对用户输入的新的语音信息识别失败,则将所述新的语音信息发送到云端服务器进行识别,并输出指示用户等待的多模态指示数据。
本发明还提供了一种用于智能机器人的人机交互装置,其包括:
交互语音信息获取模块,其用于获取用户输入的交互语音信息;
语音识别模块,其用于将所述交互语音信息上传至云端服务器,由所述云端服务器对所述交互语音信息进行识别,并接收所述云端服务器发送的云端语音识别结果;
其中,所述语音识别模块配置为将所述语音信息上传至云端服务器之后,至收到所述云端服务器发送的云端语音识别结果之前,若接收到用户输入的新的语音信息,则调用离线语音识别模块对用户输入的新的语音信息进行识别得到离线语音识别结果,并根据所述离线语音识别结果生成相应的多模态反馈信息并输出。
根据本发明的一个实施例,所述语音识别模块配置为调用离线语音识别模块,确定所述用户输入的新的语音信息与所述离线语音识别模块中的预置命令词是否匹配,若匹配,则获得离线语音识别结果。
根据本发明的一个实施例,所述语音识别模块配置为在调用离线语音识别模块时,如果所述离线语音识别模块识别出预设指令信息,则生成忽略云端语音识别指令,以在接收到所述云端服务器反馈的云端语音识别结果时根据所述忽略云端语音识别指令忽略所述云端语音识别结果。
根据本发明的一个实施例,所述语音识别模块配置为如果调用离线语音识别模块对用户输入的新的语音信息识别失败,则将所述新的语音信息发送到云端服务器进行识别,并输出指示用户等待的多模态指示数据。
相较于现有的用于机器人的人机交互方法,本发明所提供的人机交互方法避免了在等待云端服务器的语音识别结果的过程中无法对用户所输入的新的语音交互信息进行响应的问题,该方法使得智能机器人能够更加合理地对用户所输入的语音交互信息进行反馈,从而使得智能智能机器人能够表现得更加人性化,提高了智能机器人的用户体验。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要的附图做简单的介绍:
图1是根据本发明一个实施例的用于智能机器人的人机交互方法的实现流程示意图;
图2是根据本发明另一个实施例的用于智能机器人的人机交互方法的实现流程示意图;
图3是根据本发明又一个实施例的用于智能机器人的人机交互方法的实现流程示意图;
图4是根据本发明一个实施例的用于智能机器人的人机交互装置的结构示意图。
具体实施方式
以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。
同时,在以下说明中,出于解释的目的而阐述了许多具体细节,以提供对本发明实施例的彻底理解。然而,对本领域的技术人员来说显而易见的是,本发明可以不用这里的具体细节或者所描述的特定方式来实施。
另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
对于现有的智能机器人来说,其与用户进行语音交互的时候,会将获取到的用户输入的语音交互信息传输到云端服务器,由云端服务器来对上述语音交互信息进行识别并将相应的识别结果推送至智能机器人,这样智能机器人也就可以根据云端服务器所推送来的语音识别结果来生成相应的反馈信息。
然而,对于上述过程来说,从用户输入语音交互信息到智能机器人输出相应的反馈信息往往需要一段长度不等的时长,在该时段内,智能机器人会处于静默状态。这也就使得在现有的人机交互过程中,用户在向智能机器人输入一段语音后,往往需要静静地等待智能机器人的反馈。如果用户在这段等待时长内继续输入新的语音信息的话,智能机器人则不会对用户所输入的信息的语音信息进行响应,从而影响了智能机器人的交互体验。
针对现有技术所存在的上述问题,本发明提供了一种新的用于智能机器人的人机交互方法,该方法利用云端服务器和离线服务器配合地实现对用户输入的语音交互信息的识别与反馈。
为了更加清楚地阐述本发明所提供的用于智能机器人的人机交互方法的实现原理、实现过程以及优点,以下分别结合不同的实施例来对该人机交互方法作进一步地说明。
实施例一:
图1示出了本实施例所提供的用于智能机器人的人机交互方法的实现流程示意图。
如图1所示,本实施例所提供的人机交互方法首先在步骤S101中获取用户输入的交互语音信息。本实施例中,该方法在步骤S101中优选地通过智能机器人所配置的音频采集设备(例如麦克风)来获取用户输入的交互语音信息。
在得到用户的交互语音信息后,该方法会在步骤S102中将上述交互语音信息传输至云端服务器,以由云端服务器对上述交互语音信息进行识别。需要指出的是,在本发明的不同实施例中,根据智能机器人与云端服务器之间所采用的数据传输方式的不同,该方法在步骤S102可以相应地采用不同的合理方式来实现交互语音信息的上传,本发明不限于此。例如,在本发明的一个实施例中,该方法在步骤S102中可以通过WiFi、移动通讯网络或有线网络的方式来将用户输入的交互语音信息上传至云端服务器。
由于云端服务器在对智能机器人上传来的交互语音信息进行语音识别的过程需要耗费一定时长,因此该方法会持续监听云端服务器所反馈的识别结果(即云端语音识别结果)。本实施例中,该方法还会在监听云端服务器所反馈的识别结果的过程监听用户是否输入了新的语音信息。
其中,如果该方法在等待云端服务器反馈云端语音识别结果时接收到用户输入的信息的语音信息,那么如图1所示,该方法则会在步骤S103中调用离线语音识别模块来对获取到的新的语音信息进行识别,从而得到离线语音识别结果。
需要指出的是,在本发明的其他实施例中,该方法所使用的离线语音识别模块还可以采用其他合理的识别基元来对汉语语音进行识别,同时,根据实际需要,该方法还可以利用上述离线识别模块对其他语种的语言进行语音识别,本发明不限于此。
如图1所示,在得到离线语音识别结果后,该方法会在步骤S104中根据步骤S103中所得到的上述离线语音识别结果来生成相应的多模态反馈信息并输出。需要指出的是,在本发明的不同实施例中,根据实际需要,该方法在步骤S104中所生成并输出的多模态反馈信息中所包含的信息形式既可以为某一种,也可以为某一种的组合,本发明不限于此。
例如,用户向智能机器人输入了诸如“明天的天气怎么样”的交互语音信息,该方法在步骤S101中也就会通过智能机器人所配置的语音采集设备获取到上述语音交互信息,并且在步骤S102中将上述语音交互信息上传至云端服务器。在智能机器人输出相应的反馈信息前,该用户又向智能机器人输入了诸如“你看我今天穿这套衣服怎么样”的新的语音信息,此时该方法则会在步骤S103中调用离线语音识别模块对“你看我今天传这套衣服怎么样”这一语音信息进行识别,从而得到相应的离线语音识别结果。在步骤S104中,该方法将根据上述离线语义识别模块所得到的离线语义识别结果来生成诸如“你穿这套衣服太帅啦”的反馈信息。
实施例二:
图2示出了本实施例所提供的用于智能机器人的人机交互方法的实现流程示意图。
如图2所示,本实施例所提供的人机交互方法首先在步骤S201中获取用户输入的交互语音信息,并在步骤S202中将步骤S201中所获取到的交互语音信息上传至云端服务器。其中,如果该方法在等待云端服务器反馈云端语音识别结果时接收到用户输入的信息的语音信息,那么该方法则会在步骤S203中调用离线语音识别模块来对获取到的新的语音信息进行识别,从而得到离线语音识别结果。
需要指出的是,本实施例中,上述步骤S201至步骤S203的实现原理以及实现过程与上述实施例一中步骤S101至步骤S103所阐述的内容类似,故在此不再对步骤S201至步骤S203的相关内容进行赘述。
如图2所示,本实施例中,该方法在利用离线语音识别模块对用户所输入的新的语音信息进行识别的过程中,会在步骤S204中判断上述新的语音信息与离线语音识别模块中的预置命令词是否匹配。其中,如果上述新的语音信息能够与离线语音识别模块中的预置命令词相匹配,该方法则会在步骤S205中生成忽略云端语音识别指令。这样,当接收到云端服务器反馈的云端语音识别结果后,该方法则可以根据上述忽略云端语音识别指令来忽略上述云端语义识别结果,而在步骤S206中只是根据离线语音识别结果生成相应的多模态反馈信息并输出给用户。
需要指出的是,本实施例中,步骤S206的实现原理以及实现过程与上述实施例一中步骤S104所阐述的内容类似,故在此不再对步骤S206进行赘述。
例如,用户向智能机器人输入了诸如“好无聊,给我讲一个XX的故事吧”的交互语音信息,该方法在步骤S201中也就会通过智能机器人所配置的语音采集设备获取到上述语音交互信息,并且在步骤SS02中将上述语音交互信息上传至云端服务器。在智能机器人输出相应的反馈信息前,该用户又向智能机器人输入了诸如“还是给我跳支舞吧”的新的语音信息,此时该方法则会在步骤S203中调用离线语音识别模块对“还是给我跳支舞吧”这一语音信息进行识别,从而得到相应的离线语音识别结果。根据“还是给我跳支舞吧”这一语音信息,该方法会生成忽略云端语音识别指令,这样即使接收到云端服务器所反馈的云端语音识别结果,该方法也不会对该云端语音识别结果进行任何处理,而是在步骤S206中根据离线语音识别模块对“还是给我跳支舞吧”这一语音信息的识别结果来生成相应的机器人动作指令,从而控制智能机器人跳舞。
实施例三:
图3示出了本实施例所提供的用于智能机器人的人机交互方法的实现流程示意图。
如图3所示,本实施例所提供的人机交互方法首先在步骤S301中获取用户输入的交换语音信息,并在步骤S302中将步骤S301中所获取到的交互语音信息上传至云端服务器。其中,如果该方法在等待云端服务器反馈云端语音识别结果时接收到用户输入的信息的语音信息,那么该方法则会在步骤S303中调用离线语音识别模块来对获取到的新的语音信息进行识别,从而得到离线语音识别结果。
需要指出的是,本实施例中,上述步骤S301至步骤S303的实现原理以及实现过程与上述实施例一中步骤S101至步骤S103所阐述的内容类似,故在此不再对步骤S301至步骤S303的相关内容进行赘述。
本实施例中,如图3所示,该方法会在步骤S304中判断离线语音识别模块是否能够对用户所输入的新的语音信息进行正常识别。如果离线语音识别模块无法对用户所输入的新的语音信息进行识别,那么该方法则会在步骤S305中将上述新的语音信息上传至云端服务器,以由云端服务器来对上述新的语音信息进行识别。此外,本实施例中,如果离线语音识别模块无法对用户所输入的信息语音信息进行识别,该方法还会在步骤S306中生成用于指示用户等待的多模态指示数据并输出给当前用户,以提示用户当前无法利用离线语音识别模块对新的语音信息进行识别。当接收到云端服务器所反馈的云端语音识别结果后,该方法会在步骤S307中根据上述云端语音识别结果来生成相应的反馈信息并输出给当前用户,此时该云端语音识别结果既可以是云端服务器通过对用户输入的新的语音信息进行解析所得到的,也可以是云端服务器通过对步骤S302所接收到的交互语音信息以及用户所输入的新的语音信息进行解析所得到的。
而如果离线语音识别模块能够对用户所输入的新的语音信息进行识别,那么该方法则会根据离线语音识别模块所得到的离线语音识别结果来生成相应的多模态反馈信息。
如图3所示,本实施例中,如果该方法在等待云端服务器反馈相应的语音识别结果(即云端语音识别结果)的过程中没有接收到新的语音信息,那么该方法则会在步骤S307中根据上述云端语音识别结果来生成相应的反馈信息并输出给当前用户。此时该云端语音识别结果则是云端服务器通过对步骤S302所接收到的交互语音信息进行解析所得到的。
从上述描述中可以看出,相较于现有的用于机器人的人机交互方法,本发明所提供的人机交互方法避免了在等待云端服务器的语音识别结果的过程中无法对用户所输入的新的语音交互信息进行响应的问题,该方法使得智能机器人能够更加合理地对用户所输入的语音交互信息进行反馈,从而使得智能智能机器人能够表现得更加人性化,提高了智能机器人的用户体验。
本发明还提供了一种用于智能机器人的人机交互装置,图4示出了本实施例中该人机交互装置的结构示意图。
如图4所示,本实施例所提供的人机交互装置优选地包括交互语音信息获取模块401以及语音识别模块。其中,交互语音信息获取模块401用于获取用户输入的交互语音信息。本实施例中,交互语音信息获取模块401优选地通过智能机器人所配置的音频采集设备(例如麦克风)来获取用户输入的交互语音信息。
本实施例中,语音识别模块优选地包括离线语音识别模块402、云端服务器403以及和指令执行机构404。其中,交互语音信息获取模块401在获取到用户所输入的交互语音信息后,会将该交互语音信息上传至云端服务器403,以由云端服务器对上述交互语音信息进行识别。
本实施例中,交互语音信息获取模块401在将获取到的上述交互语音信息上传至云端服务器后,还会持续监听用户是否输入了新的语音信息。如果该人机交互装置尚未接收到云端服务器所推送来的反馈信息(即云端语音识别结果)却通过交互语音信息获取模块401获取到用户输入了新的语音信息。那么此时交互语音信息获取模块401则会将所获取到的上述新的语音信息传输至离线语音识别模块402。离线语音识别模块402会对上述新的语音信息进行识别,从而得到离线语音识别结果。
在得到离线语音识别结果后,离线语音识别模块402可以根据上述离线语音识别结果生成相应的执行指令,并将该执行指令发送至指令执行机构404,从而由指令执行机构404根据上述执行指令来生成相应的多模态反馈信息并输出给用户。
需要指出的是,在本发明的不同实施例中,语音识别模块实现其功能的具体原理以及过程既可以与上述实施例一中步骤S103和步骤S104所阐述的内容相同,也可以与上述实施例二中步骤S203至步骤S206所阐述的内容相同,还可以与上述实施例三中步骤S303至步骤S307所阐述的内容相同,故在此不再对语音识别模块的相关内容进行赘述。
应该理解的是,本发明所公开的实施例不限于这里所公开的特定结构或处理步骤,而应当延伸到相关领域的普通技术人员所理解的这些特征的等同替代。还应当理解的是,在此使用的术语仅用于描述特定实施例的目的,而并不意味着限制。
说明书中提到的“一个实施例”或“实施例”意指结合实施例描述的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,说明书通篇各个地方出现的短语“一个实施例”或“实施例”并不一定均指同一个实施例。
虽然上述示例用于说明本发明在一个或多个应用中的原理,但对于本领域的技术人员来说,在不背离本发明的原理和思想的情况下,明显可以在形式上、用法及实施的细节上作各种修改而不用付出创造性劳动。因此,本发明由所附的权利要求书来限定。
Claims (8)
1.一种用于智能机器人的人机交互方法,其特征在于,包括:
步骤一,获取用户输入的交互语音信息;
步骤二,将所述交互语音信息上传至云端服务器,由所述云端服务器对所述交互语音信息进行识别,并接收所述云端服务器发送的云端语音识别结果;
其中,在所述步骤二中,将所述语音信息上传至云端服务器之后,至收到所述云端服务器发送的云端语音识别结果之前,若接收到用户输入的新的语音信息,则调用离线语音识别模块对用户输入的新的语音信息进行识别得到离线语音识别结果,并根据所述离线语音识别结果生成相应的多模态反馈信息并输出。
2.如权利要求1所述的方法,其特征在于,在所述步骤二中,调用离线语音识别模块,确定所述用户输入的新的语音信息与所述离线语音识别模块中的预置命令词是否匹配,若匹配,则获得离线语音识别结果。
3.如权利要求2所述的方法,其特征在于,在所述步骤二中,在调用离线语音识别模块时,如果所述离线语音识别模块识别出预设指令信息,则生成忽略云端语音识别指令,以在接收到所述云端服务器反馈的云端语音识别结果时根据所述忽略云端语音识别指令忽略所述云端语音识别结果。
4.如权利要求2或3所述的方法,其特征在于,在所述步骤二中,如果调用离线语音识别模块对用户输入的新的语音信息识别失败,则将所述新的语音信息发送到云端服务器进行识别,并输出指示用户等待的多模态指示数据。
5.一种用于智能机器人的人机交互装置,其特征在于,包括:
交互语音信息获取模块,其用于获取用户输入的交互语音信息;
语音识别模块,其用于将所述交互语音信息上传至云端服务器,由所述云端服务器对所述交互语音信息进行识别,并接收所述云端服务器发送的云端语音识别结果;
其中,所述语音识别模块配置为将所述语音信息上传至云端服务器之后,至收到所述云端服务器发送的云端语音识别结果之前,若接收到用户输入的新的语音信息,则调用离线语音识别模块对用户输入的新的语音信息进行识别得到离线语音识别结果,并根据所述离线语音识别结果生成相应的多模态反馈信息并输出。
6.如权利要求5所述的装置,其特征在于,所述语音识别模块配置为调用离线语音识别模块,确定所述用户输入的新的语音信息与所述离线语音识别模块中的预置命令词是否匹配,若匹配,则获得离线语音识别结果。
7.如权利要求6所述的装置,其特征在于,所述语音识别模块配置为在调用离线语音识别模块时,如果所述离线语音识别模块识别出预设指令信息,则生成忽略云端语音识别指令,以在接收到所述云端服务器反馈的云端语音识别结果时根据所述忽略云端语音识别指令忽略所述云端语音识别结果。
8.如权利要求6或7所述的装置,其特征在于,所述语音识别模块配置为如果调用离线语音识别模块对用户输入的新的语音信息识别失败,则将所述新的语音信息发送到云端服务器进行识别,并输出指示用户等待的多模态指示数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611218151.XA CN106847274B (zh) | 2016-12-26 | 2016-12-26 | 一种用于智能机器人的人机交互方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611218151.XA CN106847274B (zh) | 2016-12-26 | 2016-12-26 | 一种用于智能机器人的人机交互方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106847274A true CN106847274A (zh) | 2017-06-13 |
CN106847274B CN106847274B (zh) | 2020-11-17 |
Family
ID=59135718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611218151.XA Active CN106847274B (zh) | 2016-12-26 | 2016-12-26 | 一种用于智能机器人的人机交互方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106847274B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107471226A (zh) * | 2017-09-21 | 2017-12-15 | 塔米智能科技(北京)有限公司 | 一种服务机器人系统及其交互方法 |
CN108447480A (zh) * | 2018-02-26 | 2018-08-24 | 深圳市晟瑞科技有限公司 | 智能家居设备控制的方法、智能语音终端和网络设备 |
CN110570872A (zh) * | 2019-07-15 | 2019-12-13 | 云知声智能科技股份有限公司 | 一种信息反馈的方法及系统 |
CN110570847A (zh) * | 2019-07-15 | 2019-12-13 | 云知声智能科技股份有限公司 | 一种多人场景的人机交互系统及方法 |
CN111243577A (zh) * | 2020-03-27 | 2020-06-05 | 四川虹美智能科技有限公司 | 语音交互方法及装置 |
CN111429924A (zh) * | 2018-12-24 | 2020-07-17 | 同方威视技术股份有限公司 | 语音交互方法、装置、机器人及计算机可读存储介质 |
CN112309399A (zh) * | 2020-10-30 | 2021-02-02 | 上海淇玥信息技术有限公司 | 一种基于语音执行任务的方法、装置和电子设备 |
WO2021017332A1 (zh) * | 2019-07-30 | 2021-02-04 | 广东美的制冷设备有限公司 | 语音控制报错方法、电器及计算机可读存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08297497A (ja) * | 1995-04-27 | 1996-11-12 | Fujitsu Ten Ltd | 車両用音声処理装置 |
JPH09114486A (ja) * | 1995-10-16 | 1997-05-02 | Sony Corp | 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車 |
WO2002060162A2 (en) * | 2000-11-30 | 2002-08-01 | Enterprise Integration Group, Inc. | Method and system for preventing error amplification in natural language dialogues |
WO2010087933A1 (en) * | 2009-01-29 | 2010-08-05 | Ford Global Technologies, Llc | A system and method for interrupting an instructional prompt to signal upcoming input over a wireless communication link |
CN104505093A (zh) * | 2014-12-16 | 2015-04-08 | 佛山市顺德区美的电热电器制造有限公司 | 家用电器及其语音交互方法 |
CN104899002A (zh) * | 2015-05-29 | 2015-09-09 | 深圳市锐曼智能装备有限公司 | 机器人基于对话预测的在线与离线的识别切换方法及系统 |
CN105138110A (zh) * | 2014-05-29 | 2015-12-09 | 中兴通讯股份有限公司 | 语音交互方法及装置 |
CN105488749A (zh) * | 2015-11-30 | 2016-04-13 | 淮阴工学院 | 面向老人和儿童的陪伴系统及交互方式 |
CN105573208A (zh) * | 2015-12-29 | 2016-05-11 | Tcl集团股份有限公司 | 一种控制语音交互的方法和系统 |
-
2016
- 2016-12-26 CN CN201611218151.XA patent/CN106847274B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08297497A (ja) * | 1995-04-27 | 1996-11-12 | Fujitsu Ten Ltd | 車両用音声処理装置 |
JPH09114486A (ja) * | 1995-10-16 | 1997-05-02 | Sony Corp | 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車 |
WO2002060162A2 (en) * | 2000-11-30 | 2002-08-01 | Enterprise Integration Group, Inc. | Method and system for preventing error amplification in natural language dialogues |
WO2010087933A1 (en) * | 2009-01-29 | 2010-08-05 | Ford Global Technologies, Llc | A system and method for interrupting an instructional prompt to signal upcoming input over a wireless communication link |
CN105138110A (zh) * | 2014-05-29 | 2015-12-09 | 中兴通讯股份有限公司 | 语音交互方法及装置 |
CN104505093A (zh) * | 2014-12-16 | 2015-04-08 | 佛山市顺德区美的电热电器制造有限公司 | 家用电器及其语音交互方法 |
CN104899002A (zh) * | 2015-05-29 | 2015-09-09 | 深圳市锐曼智能装备有限公司 | 机器人基于对话预测的在线与离线的识别切换方法及系统 |
CN105488749A (zh) * | 2015-11-30 | 2016-04-13 | 淮阴工学院 | 面向老人和儿童的陪伴系统及交互方式 |
CN105573208A (zh) * | 2015-12-29 | 2016-05-11 | Tcl集团股份有限公司 | 一种控制语音交互的方法和系统 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107471226A (zh) * | 2017-09-21 | 2017-12-15 | 塔米智能科技(北京)有限公司 | 一种服务机器人系统及其交互方法 |
CN108447480A (zh) * | 2018-02-26 | 2018-08-24 | 深圳市晟瑞科技有限公司 | 智能家居设备控制的方法、智能语音终端和网络设备 |
CN108447480B (zh) * | 2018-02-26 | 2020-10-20 | 深圳市晟瑞科技有限公司 | 智能家居设备控制的方法、智能语音终端和网络设备 |
CN111429924A (zh) * | 2018-12-24 | 2020-07-17 | 同方威视技术股份有限公司 | 语音交互方法、装置、机器人及计算机可读存储介质 |
CN110570872A (zh) * | 2019-07-15 | 2019-12-13 | 云知声智能科技股份有限公司 | 一种信息反馈的方法及系统 |
CN110570847A (zh) * | 2019-07-15 | 2019-12-13 | 云知声智能科技股份有限公司 | 一种多人场景的人机交互系统及方法 |
WO2021017332A1 (zh) * | 2019-07-30 | 2021-02-04 | 广东美的制冷设备有限公司 | 语音控制报错方法、电器及计算机可读存储介质 |
CN111243577A (zh) * | 2020-03-27 | 2020-06-05 | 四川虹美智能科技有限公司 | 语音交互方法及装置 |
CN111243577B (zh) * | 2020-03-27 | 2022-04-19 | 四川虹美智能科技有限公司 | 语音交互方法及装置 |
CN112309399A (zh) * | 2020-10-30 | 2021-02-02 | 上海淇玥信息技术有限公司 | 一种基于语音执行任务的方法、装置和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN106847274B (zh) | 2020-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106847274A (zh) | 一种用于智能机器人的人机交互方法及装置 | |
TWI576825B (zh) | 一種機器人系統的聲音識別系統及方法 | |
CN107273477A (zh) | 一种用于机器人的人机交互方法及装置 | |
CN105446491B (zh) | 一种基于智能机器人的交互方法和装置 | |
CN106528530A (zh) | 一种确定句子类型的方法及装置 | |
KR20190075800A (ko) | 지능형 개인 보조 인터페이스 시스템 | |
KR100342726B1 (ko) | 메시지처리방법및메시지처리장치 | |
CN109005190B (zh) | 一种在网页上实现全双工语音对话和页面控制的方法 | |
CN105404617B (zh) | 一种远程桌面的控制方法、受控端及控制系统 | |
TWI703473B (zh) | 用於聊天機器人與人類通話的可編程智能代理機 | |
CN103365836A (zh) | 一种采用自然语言的分布式智能交互的实现方法及其系统 | |
US20180158458A1 (en) | Conversational voice interface of connected devices, including toys, cars, avionics, mobile, iot and home appliances | |
WO2023226914A1 (zh) | 基于多模态数据的虚拟人物驱动方法、系统及设备 | |
CN106182007B (zh) | 一种用于智能机器人的卡顿处理方法及装置 | |
CN111080926A (zh) | 一种自助设备的辅助交互方法与装置 | |
CN106991123A (zh) | 一种面向智能机器人的人机交互方法及装置 | |
CN105206273B (zh) | 语音传输控制方法及系统 | |
CN106863300A (zh) | 一种用于智能机器人的数据处理方法及装置 | |
CN106548777A (zh) | 一种用于智能机器人的数据处理方法及装置 | |
CN107085463A (zh) | 一种支持自然语言信息交互的智能设备控制体系和方法 | |
CN107026829A (zh) | 一种跨终端进行语音录入的交互系统及方法 | |
CN104679733B (zh) | 一种语音对话翻译方法、装置及系统 | |
CN106598241A (zh) | 一种用于智能机器人的交互数据处理方法及装置 | |
CN106354255A (zh) | 一种面向机器人产品的人机交互方法及装置 | |
CN107066288B (zh) | 一种用于智能机器人的多模态交互方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |