CN109378001A - 一种语音交互方法、装置、电子设备及可读存储介质 - Google Patents
一种语音交互方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN109378001A CN109378001A CN201811611104.0A CN201811611104A CN109378001A CN 109378001 A CN109378001 A CN 109378001A CN 201811611104 A CN201811611104 A CN 201811611104A CN 109378001 A CN109378001 A CN 109378001A
- Authority
- CN
- China
- Prior art keywords
- robot
- current page
- user
- guidance information
- guidance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 90
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000003860 storage Methods 0.000 title abstract description 17
- 230000003993 interaction Effects 0.000 claims description 11
- 230000006870 function Effects 0.000 description 20
- 230000008569 process Effects 0.000 description 20
- 238000004891 communication Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 13
- 238000004590 computer program Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000005266 casting Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 241001455214 Acinonyx jubatus Species 0.000 description 1
- 206010011469 Crying Diseases 0.000 description 1
- 241000282373 Panthera pardus Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Manipulator (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种语音交互方法、装置、电子设备及可读存储介质,该方法包括:获取机器人当前页面的引导信息;根据所述引导信息,控制所述机器人引导用户在当前页面通过语音指令与所述机器人交互。本发明中获取机器人当前页面的引导信息,根据获取到的该引导信息,控制机器人引导用户通过语音指令与机器人交互,用户根据引导信息可以知道如何与机器人进行语音交互,从而引导用户培养出与机器人进行语音交互的习惯,便于提高语音交互的普及率。
Description
技术领域
本发明涉及语音处理技术领域,尤其涉及一种语音交互方法、装置、电子设备及可读存储介质。
背景技术
随着智能终端和云计算的快速发展,人工智能的浪潮正在悄然颠覆着我们生活的点点滴滴,人工智能通常应用于智能终端的点触界面,即用户通过触控智能终端的界面进行交互控制。但是受使用人群和使用场景的限制,如使用人群包括老人小孩,使用场景包括双手被占用时,通过触控进行交互控制就显得十分不便。
VUI(Voice User Interface,语音用户界面)作为一个新的领域正在快速发展,已经逐渐成为智能设备的一种重要的交互方式,并且能够解决触控带来的限制。目前很多用户由于不知道怎么与设备语音交互,因此还没有完全培养出与设备进行语音交互的习惯,多数用户看到屏幕的第一反应仍然是触摸点击等,因此导致设备的语音交互的普及率低。
发明内容
本发明提供了一种语音交互方法、装置、电子设备及可读存储介质,用以解决现有技术中设备的语音交互的普及率低的问题。
本发明提供了一种语音交互方法,该方法包括:
获取机器人当前页面的引导信息;
根据所述引导信息,控制所述机器人引导用户在当前页面通过语音指令与所述机器人交互。
进一步地,所述获取机器人当前页面的引导信息,包括:
在打开机器人当前页面的初始时刻,获取机器人当前页面的引导信息。
进一步地,所述获取机器人当前页面的引导信息包括:
查询预先设定的机器人页面和引导信息的对应关系,确定机器人当前页面对应的引导信息。
进一步地,所述根据所述引导信息,控制所述机器人引导用户在当前页面通过语音指令与所述机器人交互之前,所述方法还包括:
确定超过预设时长未获取到文本信息,其中,所述文本信息为机器人采集到的用户的语音指令对应的文本信息。
进一步地,所述根据所述引导信息,控制所述机器人引导用户在当前页面通过语音指令与所述机器人交互之前,所述方法还包括:
识别到用户对当前页面中非功能区域的触控操作。
进一步地,所述根据所述引导信息,控制所述机器人引导用户在当前页面通过语音指令与所述机器人交互,包括:
控制所述机器人在当前页面语音播报所述引导信息;和/或
控制所述机器人在当前页面显示所述引导信息。
进一步地,所述控制所述机器人在当前页面显示所述引导信息,包括以下至少一种方式:
控制所述机器人在当前页面固定显示所述引导信息;
控制所述机器人在当前页面轮播显示所述引导信息;和
控制所述机器人在当前页面的提示框中显示所述引导信息。
进一步地,所述根据所述引导信息,控制所述机器人引导用户在当前页面通过语音指令与所述机器人交互之后,所述方法还包括:
若获取到文本信息,控制所述机器人停止引导用户,其中,所述文本信息为机器人采集到的用户的语音指令对应的文本信息。
进一步地,所述控制所述机器人停止引导用户之后,所述方法还包括:
若确定不存在获取到的文本信息对应的功能操作,重新控制所述机器人引导用户。
进一步地,所述控制所述机器人停止引导用户之前,所述方法还包括:
确定存在获取到的文本信息对应的功能操作。
进一步地,所述当前页面包括主页面或功能页面。
进一步地,所述获取机器人当前页面的引导信息之前,所述方法还包括:
识别到唤醒指令,其中所述唤醒指令包括视觉唤醒指令、语音唤醒指令、触摸唤醒指令中的至少一项。
本发明提供了一种语音交互装置,所述装置包括:
获取模块,用于获取机器人当前页面的引导信息;
控制模块,用于根据所述引导信息,控制所述机器人引导用户在当前页面通过语音指令与所述机器人交互。
进一步地,所述获取模块,具体用于在打开机器人当前页面的初始时刻,获取机器人当前页面的引导信息。
进一步地,所述获取模块,具体用于查询预先设定的机器人页面和引导信息的对应关系,确定机器人当前页面对应的引导信息。
进一步地,所述控制模块,还用于确定超过预设时长未获取到文本信息,其中,所述文本信息为机器人采集到的用户的语音指令对应的文本信息。
进一步地,所述控制模块,还用于识别到用户对当前页面中非功能区域的触控操作。
进一步地,所述控制模块,具体用于控制所述机器人在当前页面语音播报所述引导信息;和/或控制所述机器人在当前页面显示所述引导信息。
进一步地,所述控制模块,具体用于采用以下至少一种方式控制所述机器人在当前页面显示所述引导信息:控制所述机器人在当前页面固定显示所述引导信息;控制所述机器人在当前页面轮播显示所述引导信息;控制所述机器人在当前页面的提示框中显示所述引导信息。
进一步地,所述控制模块,还用于根据所述引导信息,控制所述机器人引导用户在当前页面通过语音指令与所述机器人交互之后,若获取到文本信息,控制所述机器人停止引导用户,其中,所述文本信息为机器人采集到的用户的语音指令对应的文本信息。
进一步地,所述控制模块,还用于控制所述机器人停止引导用户之后,若确定不存在获取到的文本信息对应的功能操作,重新控制所述机器人引导用户。
进一步地,所述控制模块,还用于确定存在获取到的文本信息对应的功能操作。
进一步地,所述当前页面包括主页面或功能页面。
进一步地,所述装置还包括:
识别模块,用于识别到唤醒指令,其中所述唤醒指令包括视觉唤醒指令、语音唤醒指令、触摸唤醒指令中的至少一项。
本发明提供了一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
所述存储器中存储有计算机程序,当所述程序被所述处理器执行时,使得所述处理器执行上述任一项所述方法的步骤。
本发明提供了一种计算机可读存储介质,其存储有可由电子设备执行的计算机程序,当所述程序在所述电子设备上运行时,使得所述电子设备执行上述任一项所述方法的步骤。
本发明提供了一种语音交互方法、装置、电子设备及可读存储介质,该方法包括:获取机器人当前页面的引导信息;根据所述引导信息,控制所述机器人引导用户在当前页面通过语音指令与所述机器人交互。本发明中获取机器人当前页面的引导信息,根据获取到的该引导信息,控制机器人引导用户通过语音指令与机器人交互,用户根据引导信息可以知道如何与机器人进行语音交互,从而引导用户培养出与机器人进行语音交互的习惯,便于提高语音交互的普及率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实例1提供的一种语音交互过程的示意图;
图2为本发明实施例5提供的一种语音引导显示页面的示意图;
图3为本发明实施例9提供的一种电子设备的结构示意图;
图4为本发明实施例提供的一种语音交互装置示意图。
具体实施方式
为了使用户知道如何与机器人进行语音交互,提高语音交互的普及率,本发明实施例提供了一种语音交互方法、装置、电子设备及可读存储介质。
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:
图1为本发明实施例提供的一种语音交互过程的示意图,该过程包括以下步骤:
S101:获取机器人当前页面的引导信息。
本发明实施例提供的语音交互方法的执行主体为电子设备,该电子设备可以为机器人或机器人的控制设备等,如果该电子设备为控制设备,则该控制设备能够与机器人进行通信,从而实现对机器人的控制,该控制设备可以为服务器,也可以为能够起到控制作用的其他设备,在此不做限定。
机器人可以具备页面显示功能,具体可以是机器人具有显示屏,该显示屏具备页面显示功能。
该电子设备能够确定机器人的当前页面,如果该电子设备为机器人,则机器人可以直接获取机器人自身的当前页面,如果该电子设备为控制设备,则该控制设备确定机器人的当前页面可以是机器人将获取到的自身的当前页面的信息发送给控制设备,可以是控制设备控制机器人显示当前页面等,因此控制设备能够确定机器人的当前页面。
电子设备确定机器人当前页面后,可以获取机器人当前页面的引导信息,机器人页面的引导信息可以保存在该电子设备中,可以保存在其他设备中,如果保存在该电子设备中,该电子设备可以直接在本地获取机器人当前页面的引导信息,如果保存在其他设备中,该电子设备可以在其他设备中获取机器人当前页面的引导信息,在此不做限定。
获取机器人当前页面的引导信息可以是实时进行获取,可以是在当前满足引导触发条件时进行获取。
所述当前页面包括主页面或功能页面。
页面的引导信息可以为语音信息、文本信息和图片信息等中的至少一种。
S102:根据所述引导信息,控制所述机器人引导用户在当前页面通过语音指令与所述机器人交互。
获取机器人当前页面的引导信息后,能够根据获取到的该引导信息,控制机器人引导用户在当前页面通过语音指令与机器人交互,具体地机器人可以在当前页面显示引导信息,或语音播放引导信息,用户看到或听到引导信息后,可以根据自身实际需求,采用相应的语音指令与该机器人交互。
如果电子设备为机器人,则机器人可以控制自身在当前页面显示引导信息,或语音播放引导信息,如果电子设备为控制设备,则该控制设备可以向机器人下发携带有引导信息的控制指令,机器人接收到控制指令后在当前页面显示引导信息或语音播放引导信息等。
不同机器人之间具有的功能可以相同可以不同,机器人具有的功能可以根据该机器人待部署的场景进行相应设置或开发。如果该机器人可以具有以下功能如闲聊、天气、日历、面试、问路、参观等,用户在当前页面通过语音指令与该机器人交互可以理解为用户通过语音指令与机器人闲聊、向机器人询问天气、日历、面试流程、向机器人问路、控制机器人带用户进行参观等,使机器人实现上述功能。
根据引导信息,控制机器人引导用户在当前页面通过语音指令与机器人交互可以引导用户与机器人进行有效交互,无论该机器人有无可触控屏幕,均可以引导用户通过语音指令进行控制,从而有效提高与机器人的语音交互的使用量,便于提高语音交互的普及率。
本发明实施例中获取机器人当前页面的引导信息,根据获取到的该引导信息,控制机器人引导用户通过语音指令与机器人交互,用户根据引导信息可以知道如何与机器人进行语音交互,从而引导用户培养出与机器人进行语音交互的习惯,便于提高语音交互的普及率。
实施例2:
在上述实施例的基础上,本发明实施例中,所述获取机器人当前页面的引导信息,包括:
在打开机器人当前页面的初始时刻,获取机器人当前页面的引导信息。
当用户在没有与机器人交互需求时仍实时获取机器人当前页面的引导信息,可能会导致过多占用处理资源,因此可以在当前满足引导触发条件时再进行获取,在本发明实施例中引导触发条件包括机器人当前页面被打开。
电子设备能够确定机器人当前页面被打开,并确定打开机器人当前页面的初始时刻,如果电子设备为机器人,则机器人能够识别某个页面被打开,当识别到某个页面被打开时,可以将被打开的该页面理解为当前页面,并获取该当前页面被打开的时刻为打开机器人当前页面的初始时刻;如果电子设备为控制设备,则电子设备可以控制机器人打开某个页面,可以记录该页面为当前页面,将控制机器人打开该页面的时刻作为打开机器人当前页面的初始时刻,或将接收到机器人反馈该页面被打开的时刻作为打开机器人当前页面的初始时刻等。
当前页面为主页面时,主页面被打开可以是控制机器人初次被唤醒时打开的,可以是根据用户的点击操作或语音指令控制机器人返回的主页面。
当前页面为功能页面时,功能页面被打开可以是根据用户的点击操作或语音指令控制机器人选择的功能页面。
当识别到机器人当前页面被打开时即在打开机器人当前页面的初始时刻,获取机器人当前页面的引导信息,具体地,所述获取机器人当前页面的引导信息包括:
查询预先设定的机器人页面和引导信息的对应关系,确定机器人当前页面对应的引导信息。
确定打开的机器人当前页面后,在预先设定的机器人页面和引导信息的对应关系中,查询确定机器人当前页面对应的引导信息。
具体地,机器人每个页面的引导信息可以相同可以不同,该预先设定的机器人页面和引导信息的对应关系可以保存在电子设备中的配置文件中,电子设备中可以保存有一个或多个配置文件,如果仅保存有一个配置文件,则该一个配置文件中保存有每个页面的引导信息,如果保存有多个配置文件,则该多个配置文件中每个配置文件中保存有一个或多个页面的引导信息。
由于本发明实施例中在打开机器人当前页面的初始时刻,获取机器人当前页面的引导信息,在保证引导用户控制机器人进行语音交互的基础上,可以降低对处理资源的占用。
实施例3:
在上述各实施例的基础上,本发明实施例中,所述根据所述引导信息,控制所述机器人引导用户在当前页面通过语音指令与所述机器人交互之前,所述方法还包括:
确定超过预设时长未获取到文本信息,其中,所述文本信息为机器人采集到的用户的语音指令对应的文本信息。
所述根据所述引导信息,控制所述机器人引导用户在当前页面通过语音指令与所述机器人交互之前,所述方法还包括:
识别到用户对当前页面中非功能区域的触控操作。
为了进一步引导用户与机器人进行语音交互,本发明实施例中还提供了其它引导触发条件,在识别到当前满足设定的引导触发条件时,根据引导信息,控制机器人引导用户通过语音指令与机器人交互。
机器人能够实时采集用户的语音指令。具体地,该机器人中可以安装有语音采集模块,如麦克风或麦克风阵列,为了提高采集的精准度,机器人可以采用麦克风阵列采集用户的语音指令。机器人可以直接将采集到的用户的语音作为接收到的用户的语音指令,可以将采集到的用户的语音进行去噪去回声处理,将处理后的语音作为接收到用户的语音指令。该过程可以理解为机器人的拾音过程。
根据机器人采集到的用户的语音指令能够确定该语音指令对应的文本信息,可以是机器人自身能够直接识别用户的语音指令对应的文本信息,可以是机器人将采集到的用户的语音指令发送给云端即服务器,云端对接收到语音指令进行识别,将识别到的该语音指令对应的文本信息发送给机器人等。
识别语音指令对应的文本信息的过程可以现有技术实现,例如采用ASR(Automatic Speech Recognition,自动语音识别)技术进行识别等,在本发明实施例中不做限定和赘述。
以电子设备为机器人为例,机器人实时采集用户的语音指令发送给云端即服务器,云端对接收到语音指令进行识别,将识别到的该语音指令对应的文本信息发送给机器人进行显示,机器人中保存有预设时长,如果机器人确定超过预设时长未获取到文本信息时,则确定需要对用户进行引导,则根据引导信息,引导用户在当前页面通过语音指令与机器人交互。
该预设时长可以由用户或者厂家进行设置,该预设时长在本发明实施例中不做限定,如1秒2秒或5秒等。
确定超过预设时长未获取到文本信息可以是确定未获取到文本信息时,开始计时,判断计时的结果是否超过预设时长。
本发明实施例中除根据用户的语音指令确定是否对用户进行引导外,还可以根据用户的触控操作确定是否对用户进行引导,此时机器人的显示屏为可触摸显示屏。
机器人当前页面中可以包括功能区域和非功能区域,该非功能区域可以包括非点击区域和/或空白区域,该功能区域可以为显示屏上当前页面中除非功能区域外的其他区域。
如果引导信息包括文本信息,则当前页面中可以显示该引导信息,如果该引导信息可被点击,则可以认为用来显示该引导信息的区域不属于非功能区域,如果该引导信息不可被点击,则可以认为用来显示该引导信息的区域属于非功能区域。
如果用来显示引导信息的区域属于非功能区域,则可以认为显示引导信息的目的在于告知用户如何与机器人进行语义交互,或如何使用当前功能,如果此时用户对显示引导信息的区域进行了点击,此时可以进行后续根据引导信息,引导用户在当前页面通过语音与该机器人交互的过程。
机器人的显示屏为触摸屏,机器人能够识别到用户对当前页面中非功能区域的触控操作,该识别到触控操作的过程可以采用现有技术实现,在本发明实施例中不做赘述。
如果电子设备为控制设备,则机器人可以将识别到的用户是否存在对当前页面中非功能区域的触控操作的结果发送给控制设备,进而控制设备确定用户是否对当前页面中非功能区域进行了触控操作。
如果识别到用户对当前页面中非功能区域的触控操作,则可以进行后续根据引导信息,控制器引导用户在当前页面通过语音指令与该机器人交互的过程。
由于本发明实施例中在确定超过设定时长未获取到文本信息或识别到用户对当前页面中非功能区域的触控操作时,根据引导信息,控制机器人引导用户通过语音指令与机器人交互,从而能够进一步引导用户与机器人进行语音交互。
实施例4:
在上述各实施例的基础上,本发明实施例中,所述根据所述引导信息,控制所述机器人引导用户在当前页面通过语音指令与所述机器人交互,包括:
控制所述机器人在当前页面语音播报所述引导信息;和/或
控制所述机器人在当前页面显示所述引导信息。
为了进一步提高用户的体验,方便引导不同的用户通过语音与机器人交互,本发明实施例采用语音播报或者显示引导信息来引导用户通过语音指令与机器人交互。
当前页面的引导信息可以包括当前页面可支持的语音指令,可以包括当前页面的语音提示信息,如果包括当前页面可支持的语音指令,以主页面为例,该当前页面的引导信息包括“我来面试”、“带我去咖啡厅”、“开始巡逻”等,如果包括当前页面的语音提示信息,则该当前页面的引导信息包括“不支持点击,推荐语音和我交流哦”等。
电子设备可以控制机器人语音播报引导信息来引导用户通过语音指令与机器人交互,具体可以控制机器人在当前页面采用tts(Text To Speech,从文本到语音)语音播报当前页面的引导信息。
采用tts语音播报信息的过程属于现有技术,在本发明实施例中不做赘述。
电子设备可以控制机器人显示引导信息来引导用户通过语音指令与机器人交互,机器人在当前页面显示引导信息时显示的是当前页面的引导信息,即在主页面显示主页面对应的引导信息,在功能页面显示功能页面对应的引导信息,在不同页面设置有对应的引导信息,从而实现了全局引导。
由于本发明实施例中控制机器人语音播报或者显示引导信息来引导用户通过语音指令与机器人交互,进一步提高了用户的体验,方便了引导不同的用户通过语音指令与机器人交互。
实施例5:
在上述各实施例的基础上,本发明实施例中,所述控制所述机器人在当前页面显示所述引导信息包括以下至少一种方式:
控制所述机器人在当前页面固定显示所述引导信息;
控制所述机器人在当前页面轮播显示所述引导信息;和
控制所述机器人在当前页面的提示框中显示所述引导信息。
本发明实施例中控制机器人采用了至少一种方式实现在当前页面显示引导信息,从而满足用户不同的查看需求,进一步提高了用户体验。
控制机器人在当前页面显示引导信息包括控制机器人在当前页面固定显示引导信息,具体地,可以是机器人在当前页面的特定区域固定显示引导信息,可以将当前页面的全部引导信息在机器人当前页面中平铺固定显示,受到页面大小的限制可以将当前页面的部分引导信息在机器人当前页面中平铺固定显示。
在当前页面显示引导信息包括控制机器人在当前页面轮播显示引导信息,具体地,可以是在机器人当前页面的特定区域轮播显示引导信息。在当前页面轮播显示的引导信息的数量可以是在配置文件中预先配置好的,在此不做限定,在当前页面轮播显示的轮播时间间隔可以是在配置文件中预先配置好的,在此不做限定,例如可以为3秒。
在当前页面显示引导信息包括控制机器人在当前页面的提示框中显示引导信息,提示框在机器人当前页面的显示位置和区域不做限定。
具体采用上述方式中的哪种或哪些方式来实现在机器人当前页面显示引导信息,可以在设置文件中预先保存,如针对主页面和不同的功能页面采用哪种或哪些方式显示时可以相同可以不同。
在机器人当前页面显示引导信息时,引导信息在机器人当前页面中显示的位置和区域均不做限定。
该固定显示的引导信息、轮播显示的引导信息及在提示框中显示的引导信息均可以被设置为可被点击或不可被点击,为了培养用户与机器人的语音交互习惯,可以均设置为不可被点击。
如果同时采用固定显示、轮播显示和在提示框中显示这三种方式同时进行引导信息的显示,显示的示意图可以如图2所示,在机器人当前页面固定显示的引导信息包括“我来面试”、“带我去咖啡厅”、“我是访客”、“开始巡逻”、“带我参观一下”、“你叫什么”、“猎豹有什么业务”、“海为什么是蓝色的”。在机器人当前页面轮播显示的引导信息包括“面试”、“来访”、“参观”、“问路”、“巡逻”。在机器人当前页面的提示框中显示引导信息包括喊我“小豹”,问我问题。
由于本发明实施例中控制机器人采用了至少一种方式实现在当前页面显示引导信息,从而满足用户不同的查看需求,进一步提高了用户体验。
实施例6:
在上述各实施例的基础上,本发明实施例中,所述根据所述引导信息,控制所述机器人引导用户在当前页面通过语音指令与所述机器人交互之后,所述方法还包括:
若获取到文本信息,控制所述机器人停止引导用户,其中,所述文本信息为机器人采集到的用户的语音指令对应的文本信息。
根据引导信息控制机器人引导用户在当前页面通过语音指令与机器人交互后,可以在获取到用户的语音指令对应的文本信息,控制机器人停止引导用户。
机器人能够采集到用户的语音指令,电子设备能够获取用户的语音指令对应的文本信息并可以控制机器人进行显示。
机器人在显示用户的语音指令对应的文本信息时可以是在当前页面进行该文本信息的显示,该过程可以理解为文字上屏过程,用户通过当前页面显示的文本信息,可以判断机器人是否拾音及识别文本正确。并且由于用户与机器人进行了语音交互,因此可以控制机器人关闭引导信息,停止引导用户,以保证用户准确与机器人进行语音交互。
所述接收用户的语音指令包括:
确定开始检测到用户语音的第一时间点,并确定检测到用户语音结束设定时间长度后的第二时间点;
将所述第一时间点到所述第二时间点内采集到的用户语音,确定为接收到的用户的语音指令。
在机器人开始检测到用户语音时,记录该开始检测到用户语音的时间点,并将该时间点确定为第一时间点。
在机器人结束检测到用户语音时,记录该结束检测到用户语音的时间点,将该结束检测到用户语音的时间点之后的设定时间长度后的时间点确定为第二时间点。
机器人中保存有该设定时间长度,该设定时间长度可以由用户或者厂家进行设置,该设定时间长度在本发明实施例中不做限定,如1秒2秒或5秒等。
通过设置该设定时间长度,可以进一步保证采集到的用户语音的完整性,从而进一步提高语音指令控制机器人的准确性。
与上述实施例结合,可知以下述例子进行说明,所在界面开始拾音有文字上屏后、引导提示框消失,在首页连续超过1秒无任何拾音和上屏时再次出现。即,当用户发出语音交互指令,机器人发送语音信号到云端进行asr识别,机器人获取到asr识别文本时,引导提示框消失,将用户的语音文字在屏幕上显示。如果一段时间没有接收到云端的asr识别结果,表示用户没有在语音交互,此时再次显示提示框对用户进行引导。
由于本发明实施例中在获取到用户的语音指令对应的文本信息,控制机器人停止引导用户,提供了引导信息的消失逻辑,能够更好地提高用户与机器人的交互。
实施例7:
在上述各实施例的基础上,本发明实施例中,所述控制所述机器人停止引导用户之后,所述方法还包括:
若确定不存在获取到的文本信息对应的功能操作,重新控制所述机器人引导用户。
所述控制所述机器人停止引导用户之前,所述方法还包括:
确定存在获取到的文本信息对应的功能操作。
电子设备中可以保存有语音指令与功能操作的对应关系,因此获取到用户的语音指令对应的文本信息后,可以判断是否存在获取到的文本信息对应的功能操作。
获取到用户的语音指令对应的文本信息后,如果确定存在获取到的文本信息对应的功能操作,控制机器人停止引导用户,进一步的,还可以认为用户的语音指令正确,执行该语音指令对应的功能操作。执行语音指令对应的功能操作的过程可以采用现有技术实现,在本发明实施例中不做赘述。
由于机器人能够实时采集用户的语音指令,因此在控制机器人停止引导用户之后,机器人可以继续采集用户的语音指令,电子设备能够继续获取到用户的语音指令对应的文本信息,如果确定不存在采集到的用户的语音指令的文本信息对应的功能操作,可以认为用户的语音指令不正确,则为了实现用户的准确控制,可以重新控制机器人引导用户在当前页面通过语音指令与该机器人交互,该重新引导的过程可以与上述根据引导信息,控制机器人引导用户在当前页面通过语音指令与机器人交互的过程一致,在此不做赘述。
由于本发明实施例中能够在存在用户的语音指令对应的功能操作时,控制机器人停止引导用户,在不存在用户的语音指令对应的功能操作时,继续进行引导,能够进一步培养用户与机器人进行语音交互的习惯。
实施例8:
在上述各实施例的基础上,本发明实施例中,所述获取机器人当前页面的引导信息之前,所述方法还包括:
识别到唤醒指令,其中所述唤醒指令包括视觉唤醒指令、语音唤醒指令、触摸唤醒指令中的至少一项。
机器人可以确定是否识别到唤醒指令,该唤醒指令包括视觉唤醒指令、语音唤醒指令、触摸唤醒指令中的至少一种。
机器人确定是否识别到唤醒指令时,可以包括是否识别到预唤醒和视觉唤醒,该预唤醒可以是在机器人设定距离外检测到人脸信息,视觉唤醒可以是在机器人设定距离内检测到人脸信息。
该设定距离可以预先保存在机器人中,该设定距离在本发明实施例中不做赘述。
机器人可以通过判断是否采集到用户的唤醒语音指令来确定是否识别到语音唤醒指令。
机器人可以通过识别接收到用户对显示屏的触摸操作来确定是否识别到唤醒指令。
如果确定识别到唤醒指令,继续进行后续获取机器人当前页面的引导信息的过程。
如果确定未识别到唤醒指令,机器人的显示屏可以采用欢迎界面进行显示。该欢迎界面可以是预先设置并保存在机器人中,当机器人未进行工作的待机状态下,均可以显示该欢迎界面,该欢迎界面的显示在本发明实施例中不做赘述。
由于本发明实施例中在识别到唤醒指令后,再进行后续引导的过程,提高了与用户的交互感,提高了用户体验。
实施例9:
在上述各实施例的基础上,本发明实施例还提供了一种电子设备,如图3所示,包括:处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信;
所述存储器303中存储有计算机程序,当所述程序被所述处理器301执行时,使得所述处理器301执行上述任一实施例。
上述电子设备具体可以为机器人,也可以为机器人的控制设备,如机器人的服务器等。上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口302用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述处理器可以是通用处理器,包括中央处理器、网络处理器(NetworkProcessor,NP)等;还可以是数字指令处理器(Digital Signal Processing,DSP)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
在本发明实施例中,处理器执行存储器上所存放的程序时,实现获取机器人当前页面的引导信息,根据获取到的该引导信息,控制机器人引导用户通过语音指令与机器人交互,用户根据引导信息可以知道如何与机器人进行语音交互,从而引导用户培养出与机器人进行语音交互的习惯,便于提高语音交互的普及率。
实施例10:
在上述各实施例的基础上,本发明实施例还提供了一种计算机存储可读存储介质,所述计算机可读存储介质内存储有可由电子设备执行的计算机程序,当所述程序在所述电子设备上运行时,使得所述电子设备执行时实现上述任一实施例。
上述计算机可读存储介质可以是电子设备中的处理器能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器如软盘、硬盘、磁带、磁光盘(MO)等、光学存储器如CD、DVD、BD、HVD等、以及半导体存储器如ROM、EPROM、EEPROM、非易失性存储器(NANDFLASH)、固态硬盘(SSD)等。
在本发明实施例中提供的计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时,实现获取机器人当前页面的引导信息,根据获取到的该引导信息,控制机器人引导用户通过语音指令与机器人交互,用户根据引导信息可以知道如何与机器人进行语音交互,从而引导用户培养出与机器人进行语音交互的习惯,便于提高语音交互的普及率。
图4为本发明实施例提供的一种语音交互装置示意图,该装置包括:
获取模块401,用于获取机器人当前页面的引导信息;
控制模块402,用于根据所述引导信息,控制所述机器人引导用户在当前页面通过语音指令与所述机器人交互。
所述获取模块401,具体用于在打开机器人当前页面的初始时刻,获取机器人当前页面的引导信息。
所述获取模块401,具体用于查询预先设定的机器人页面和引导信息的对应关系,确定机器人当前页面对应的引导信息。
所述控制模块402,还用于确定超过预设时长未获取到文本信息,其中,所述文本信息为机器人采集到的用户的语音指令对应的文本信息。
所述控制模块402,还用于识别到用户对当前页面中非功能区域的触控操作。
所述控制模块402,具体用于控制所述机器人在当前页面语音播报所述引导信息;和/或控制所述机器人在当前页面显示所述引导信息。
所述控制模块402,具体用于采用以下至少一种方式控制所述机器人在当前页面显示所述引导信息:控制所述机器人在当前页面固定显示所述引导信息;控制所述机器人在当前页面轮播显示所述引导信息;和控制所述机器人在当前页面的提示框中显示所述引导信息。
所述控制模块402,还用于根据所述引导信息,控制所述机器人引导用户在当前页面通过语音指令与所述机器人交互之后,若获取到文本信息,控制所述机器人停止引导用户,其中,所述文本信息为机器人采集到的用户的语音指令对应的文本信息。
所述控制模块402,还用于控制所述机器人停止引导用户之后,若确定不存在获取到的文本信息对应的功能操作,重新控制所述机器人引导用户。
所述控制模块402,还用于确定存在获取到的文本信息对应的功能操作。
所述当前页面包括主页面或功能页面。
所述装置还包括:
识别模块403,用于识别到唤醒指令,其中所述唤醒指令包括视觉唤醒指令、语音唤醒指令、触摸唤醒指令中的至少一项。
本发明实施例中获取机器人当前页面的引导信息,根据获取到的该引导信息,控制机器人引导用户通过语音指令与机器人交互,用户根据引导信息可以知道如何与机器人进行语音交互,从而引导用户培养出与机器人进行语音交互的习惯,便于提高语音交互的普及率。
对于系统/装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者一个操作与另一个实体或者另一个操作区分开来,而不一定要求或者暗示这些实体或者操作之间存在任何这种实际的关系或者顺序。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种语音交互方法,其特征在于,所述方法包括:
获取机器人当前页面的引导信息;
根据所述引导信息,控制所述机器人引导用户在当前页面通过语音指令与所述机器人交互。
2.如权利要求1所述的方法,其特征在于,所述获取机器人当前页面的引导信息,包括:
在打开机器人当前页面的初始时刻,获取机器人当前页面的引导信息。
3.如权利要求1或2所述的方法,其特征在于,所述获取机器人当前页面的引导信息包括:
查询预先设定的机器人页面和引导信息的对应关系,确定机器人当前页面对应的引导信息。
4.如权利要求1所述的方法,其特征在于,所述根据所述引导信息,控制所述机器人引导用户在当前页面通过语音指令与所述机器人交互之前,所述方法还包括:
确定超过预设时长未获取到文本信息,其中,所述文本信息为机器人采集到的用户的语音指令对应的文本信息。
5.如权利要求1所述的方法,其特征在于,所述根据所述引导信息,控制所述机器人引导用户在当前页面通过语音指令与所述机器人交互之前,所述方法还包括:
识别到用户对当前页面中非功能区域的触控操作。
6.如权利要求1所述的方法,其特征在于,所述根据所述引导信息,控制所述机器人引导用户在当前页面通过语音指令与所述机器人交互,包括:
控制所述机器人在当前页面语音播报所述引导信息;和/或
控制所述机器人在当前页面显示所述引导信息。
7.如权利要求6所述的方法,其特征在于,所述控制所述机器人在当前页面显示所述引导信息,包括以下至少一种方式:
控制所述机器人在当前页面固定显示所述引导信息;
控制所述机器人在当前页面轮播显示所述引导信息;和
控制所述机器人在当前页面的提示框中显示所述引导信息。
8.如权利要求1或6或7所述的方法,其特征在于,所述根据所述引导信息,控制所述机器人引导用户在当前页面通过语音指令与所述机器人交互之后,所述方法还包括:
若获取到文本信息,控制所述机器人停止引导用户,其中,所述文本信息为机器人采集到的用户的语音指令对应的文本信息。
9.如权利要求8所述的方法,其特征在于,所述控制所述机器人停止引导用户之后,所述方法还包括:
若确定不存在获取到的文本信息对应的功能操作,重新控制所述机器人引导用户。
10.如权利要求8所述的方法,其特征在于,所述控制所述机器人停止引导用户之前,所述方法还包括:
确定存在获取到的文本信息对应的功能操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811611104.0A CN109378001A (zh) | 2018-12-27 | 2018-12-27 | 一种语音交互方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811611104.0A CN109378001A (zh) | 2018-12-27 | 2018-12-27 | 一种语音交互方法、装置、电子设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109378001A true CN109378001A (zh) | 2019-02-22 |
Family
ID=65371975
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811611104.0A Pending CN109378001A (zh) | 2018-12-27 | 2018-12-27 | 一种语音交互方法、装置、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109378001A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110221685A (zh) * | 2019-04-26 | 2019-09-10 | 百度在线网络技术(北京)有限公司 | 互动引导方法、装置、设备和存储介质 |
CN111179931A (zh) * | 2020-01-03 | 2020-05-19 | 青岛海尔科技有限公司 | 用于语音交互的方法、装置及家用电器 |
CN112114770A (zh) * | 2019-06-19 | 2020-12-22 | 百度在线网络技术(北京)有限公司 | 基于语音交互的界面引导方法、装置及设备 |
CN113903336A (zh) * | 2021-09-28 | 2022-01-07 | 济南誉彩信息科技有限公司 | 一种展厅引导控制系统及其讲解机器人的对接方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106302972A (zh) * | 2015-06-05 | 2017-01-04 | 中兴通讯股份有限公司 | 语音使用的提示方法以及终端设备 |
CN107093252A (zh) * | 2017-06-27 | 2017-08-25 | 泉州施米德智能科技有限公司 | 一种智能门系统及其控制方法 |
JP2017182334A (ja) * | 2016-03-29 | 2017-10-05 | 本田技研工業株式会社 | 受付システム及び受付方法 |
CN107538499A (zh) * | 2017-08-16 | 2018-01-05 | 黑龙江中科诺晟自动化设备开发有限公司 | 一种智能图书管理机器人 |
US20180068660A1 (en) * | 2016-09-06 | 2018-03-08 | Kyoto University | Voice interaction apparatus and automatic interaction method using voice interaction apparatus |
CN108509107A (zh) * | 2018-03-26 | 2018-09-07 | 百度在线网络技术(北京)有限公司 | 应用功能信息显示方法、装置及终端设备 |
-
2018
- 2018-12-27 CN CN201811611104.0A patent/CN109378001A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106302972A (zh) * | 2015-06-05 | 2017-01-04 | 中兴通讯股份有限公司 | 语音使用的提示方法以及终端设备 |
JP2017182334A (ja) * | 2016-03-29 | 2017-10-05 | 本田技研工業株式会社 | 受付システム及び受付方法 |
US20180068660A1 (en) * | 2016-09-06 | 2018-03-08 | Kyoto University | Voice interaction apparatus and automatic interaction method using voice interaction apparatus |
CN107093252A (zh) * | 2017-06-27 | 2017-08-25 | 泉州施米德智能科技有限公司 | 一种智能门系统及其控制方法 |
CN107538499A (zh) * | 2017-08-16 | 2018-01-05 | 黑龙江中科诺晟自动化设备开发有限公司 | 一种智能图书管理机器人 |
CN108509107A (zh) * | 2018-03-26 | 2018-09-07 | 百度在线网络技术(北京)有限公司 | 应用功能信息显示方法、装置及终端设备 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110221685A (zh) * | 2019-04-26 | 2019-09-10 | 百度在线网络技术(北京)有限公司 | 互动引导方法、装置、设备和存储介质 |
CN112114770A (zh) * | 2019-06-19 | 2020-12-22 | 百度在线网络技术(北京)有限公司 | 基于语音交互的界面引导方法、装置及设备 |
CN111179931A (zh) * | 2020-01-03 | 2020-05-19 | 青岛海尔科技有限公司 | 用于语音交互的方法、装置及家用电器 |
CN111179931B (zh) * | 2020-01-03 | 2023-07-21 | 青岛海尔科技有限公司 | 用于语音交互的方法、装置及家用电器 |
CN113903336A (zh) * | 2021-09-28 | 2022-01-07 | 济南誉彩信息科技有限公司 | 一种展厅引导控制系统及其讲解机器人的对接方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109378001A (zh) | 一种语音交互方法、装置、电子设备及可读存储介质 | |
EP3612925B1 (en) | Electronic device and method for processing user speech | |
US11037560B2 (en) | Method, apparatus and storage medium for wake up processing of application | |
CN102568478B (zh) | 一种基于语音识别的视频播放控制方法和系统 | |
CN105654949B (zh) | 一种语音唤醒方法及装置 | |
CN103021409B (zh) | 一种语音启动拍照系统 | |
CN109637519B (zh) | 语音交互实现方法、装置、计算机设备及存储介质 | |
CN105612485B (zh) | 一种运行应用程序的方法及装置 | |
CN104992704B (zh) | 语音合成方法和装置 | |
US20160180141A1 (en) | Guided fingerprint enrolment | |
CN108279839A (zh) | 基于语音的交互方法、装置、电子设备及操作系统 | |
EP2945045A1 (en) | Electronic device and method of playing music in electronic device | |
CN108845736A (zh) | 用于车载语音系统的交互方法及系统 | |
CN109634552A (zh) | 一种应用于听写的报读控制方法及终端设备 | |
CN107948672B (zh) | 保存视频数据的方法和系统、以及服务器、穿戴式设备 | |
CN110277092A (zh) | 一种语音播报方法、装置、电子设备及可读存储介质 | |
CN111261151B (zh) | 一种语音处理方法、装置、电子设备及存储介质 | |
CN106971723A (zh) | 语音处理方法和装置、用于语音处理的装置 | |
CN103197911A (zh) | 一种提供语音输入的方法、系统和装置 | |
CN112135160A (zh) | 直播中虚拟对象控制方法及装置、存储介质和电子设备 | |
KR20180109631A (ko) | 전자 장치 및 전자 장치의 기능 실행 방법 | |
CN110010125A (zh) | 一种智能机器人的控制方法、装置、终端设备及介质 | |
CN107862514A (zh) | 公交卡管理方法、装置及系统、存储介质 | |
US20200211545A1 (en) | Voice interaction method, apparatus and device, and storage medium | |
CN109376363A (zh) | 一种基于耳机的实时语音翻译方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190222 |