CN109545212A - 交互方法、智能设备及存储介质 - Google Patents

交互方法、智能设备及存储介质 Download PDF

Info

Publication number
CN109545212A
CN109545212A CN201811508707.8A CN201811508707A CN109545212A CN 109545212 A CN109545212 A CN 109545212A CN 201811508707 A CN201811508707 A CN 201811508707A CN 109545212 A CN109545212 A CN 109545212A
Authority
CN
China
Prior art keywords
smart machine
response message
information
display
phonetic order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811508707.8A
Other languages
English (en)
Inventor
申倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Shanghai Xiaodu Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201811508707.8A priority Critical patent/CN109545212A/zh
Publication of CN109545212A publication Critical patent/CN109545212A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请提供一种交互方法、智能设备及存储介质,其中,该方法包括:获取用户发出的语音指令,基于该语音指令生成针对该语音指令的第一应答信息和第一显示信息,并控制该智能设备播放第一应答信息,同时通过该智能设备的显示组件展示第一显示信息。该技术方案,智能设备与用户进行语音交互的同时,还通过显示组件显示出对应的显示信息,智能设备的功能多样化,用户体验好。

Description

交互方法、智能设备及存储介质
技术领域
本申请涉及电子技术领域,尤其涉及一种交互方法、智能设备及存储介质。
背景技术
故事机是一种可以促进孩子学习兴趣的教育类电子产品,是采用高新电子数模微控技术合成的电子发声器,能够全方位训练儿童学习能力,开启孩子内在潜能。
现有技术中,大多数的故事机具有音频功能,用户可以利用其听儿歌、赏音乐、听故事、学英语、习常识,但是现有故事机的功能单一,用户使用体验差。
发明内容
本申请提供一种交互方法、智能设备及存储介质,以克服现有故事机的功能单一,用户使用体验差的问题。
本申请第一方面提供的一种交互方法,应用于智能设备,所述方法包括:
获取用户发出的语音指令;
基于所述语音指令,生成针对所述语音指令的第一应答信息和第一显示信息;
控制所述智能设备播放所述第一应答信息,同时通过所述智能设备的显示组件展示所述第一显示信息。
在一种可能的设计中,所述基于所述语音指令,生成针对所述语音指令的第一应答信息和第一显示信息,包括:
对所述语音指令进行语义分析,确定所述语音指令对应的语音内容和语音情绪;
根据所述语音内容和所述语音情绪,生成针对所述语音指令的第一应答信息和第一显示信息。
在上述可能的设计中,若所述语音指令为问答指令,则所述第一应答信息为与所述问答指令对应的响应信息,所述第一显示信息为与所述响应信息对应的表情信息;
所述控制所述智能设备播放所述第一应答信息,同时通过所述智能设备的显示组件展示所述第一显示信息,包括:
控制所述智能设备播放所述问答指令对应的响应信息,同时通过所述显示组件展示所述表情信息。
在另一种可能的设计中,若所述语音指令为闹钟提醒指令,则所述第一应答信息为与所述闹钟提醒指令对应的闹铃提示语音,所述第一显示信息为时间信息;
所述控制所述智能设备播放所述第一应答信息,同时通过所述智能设备的显示组件展示所述第一显示信息,包括:
控制所述智能设备在预设时刻发出所述闹铃提示语音,同时所述显示组件显示所述预设时刻的时间信息。
在再一种可能的设计中,所述方法还包括:
获取所述用户通过所述智能设备的操作区域发出的操作指令;
基于所述操作指令,确定所述操作指令对应的第二应答信息和第二显示信息;
控制所述智能设备播放所述第二应答信息,同时通过所述显示组件展示所述第二显示信息。
在上述可能的设计中,若所述操作指令为配网指令,则所述第二应答信息为配网提示音,所述第二显示信息为配网过程信息;
所述控制所述智能设备播放所述第二应答信息,同时通过所述显示组件呈现所述第二显示信息,包括:
控制所述智能设备在配网过程中发出所述配网提示音,同时通过所述显示组件显示所述配网过程信息。
在又一种可能的设计中,若所述操作指令为闹钟设置指令,则所述第二应答信息为闹铃提示语音,所述第二显示信息为时间信息;
所述控制所述智能设备播放所述第二应答信息,同时通过所述显示组件呈现所述第二显示信息,包括:
控制所述智能设备在预设时刻发出闹铃提示语音,同时通过所述显示组件展示所述预设时刻的时间信息。
在又一种可能的设计中,所述显示组件,包括:显示屏、指示灯。
本申请第二方面提供一种智能设备,包括:获取模块、处理模块、控制模块、发声组件和显示组件;
所述获取模块,用于获取用户发出的语音指令;
所述处理模块,用于基于所述语音指令,生成针对所述语音指令的第一应答信息和第一显示信息;
所述控制模块,用于控制所述发声组件播放所述第一应答信息,同时通过所述显示组件展示所述第一显示信息。
在一种可能的设计中,所述处理模块,具体用于对所述语音指令进行语义分析,确定所述语音指令对应的语音内容和语音情绪,根据所述语音内容和所述语音情绪,生成针对所述语音指令的第一应答信息和第一显示信息。
在另一种可能的设计中,若所述语音指令为问答指令,则所述第一应答信息为与所述问答指令对应的响应信息,所述第一显示信息为与所述响应信息对应的表情信息;
所述控制模块,具体用于控制所述发声组件播放所述问答指令对应的响应信息,同时通过所述显示组件展示所述表情信息。
在再一种可能的设计中,若所述语音指令为闹钟提醒指令,则所述第一应答信息为与所述闹钟提醒指令对应的闹铃提示语音,所述第一显示信息为时间信息;
所述控制模块,具体用于控制所述发声组件在预设时刻发出所述闹铃提示语音,同时所述显示组件显示所述预设时刻的时间信息。
在又一种可能的设计中,所述获取模块,还用于获取所述用户通过所述智能设备的操作区域发出的操作指令;
所述处理模块,还用于基于所述操作指令,确定所述操作指令对应的第二应答信息和第二显示信息;
所述控制模块,还用于控制所述发声组件播放所述第二应答信息,同时通过所述显示组件展示所述第二显示信息。
在上述可能的设计中,若所述操作指令为配网指令,则所述第二应答信息为配网提示音,所述第二显示信息为配网过程信息;
所述控制模块,还具体用于控制所述发声组件在配网过程中发出所述配网提示音,同时通过所述显示组件显示所述配网过程信息。
在又一种可能的设计中,若所述操作指令为闹钟设置指令,则所述第二应答信息为闹铃提示语音,所述第二显示信息为时间信息;
所述控制模块,还具体用于控制所述发声组件在预设时刻发出闹铃提示语音,同时通过所述显示组件展示所述预设时刻的时间信息。
本申请实施例提供的交互方法、智能设备及存储介质,智能设备通过获取用户发出的语音指令,根据该语音指令生成针对语音指令的第一应答信息和第一显示信息,以及控制智能设备播放该第一应答信息,同时通过智能设备的显示组件展示该第一显示信息。该技术方案中,智能设备与用户进行语音交互的同时,还通过显示组件显示出对应的显示信息,智能设备的功能多样化,用户体验好。
附图说明
图1为本实施例提供的交互方法所适用的智能设备的外形示意图;
图2为本申请实施例提供的交互方法实施例一的流程示意图;
图3为显示组件展示表情信息的一种示意图;
图4为显示组件展示时间信息的一种示意图;
图5为本申请实施例提供的交互方法实施例二的流程示意图;
图6为本申请实施例提供的交互方法实施例三的流程示意图;
图7为智能设备的显示组件展示配网过程信息的一种示意图;
图8为本申请实施例提供的智能设备实施例一的结构示意图;
图9为本申请实施例提供的智能设备实施例二的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本实施例提供的交互方法适用于智能设备,该智能设备可以是智能机器人、智能故事机、智能音箱、智能闹钟等,也可以是具有语音分析、语音播放功能且具有显示组件的其他设备,本申请实施例并不对其进行限定。
图1为本实施例提供的交互方法所适用的智能设备的外形示意图。如图1所示,该智能设备可以包括:头部11和机身12。在本实施例中,该头部11的正面设置有显示组件111,该头部11的背面设置有发声组件(未示出),该机身12上具有操作区域121。
可以理解的是,上述发声组件还可以设置机身12的某个位置。例如,机身12的背面等位置,本实施例并不限定发声组件的具体位置,其可根据实际情况确定。
在本实施例中,智能设备既具有与用户进行语音交互的功能,也具有闹钟提醒功能。
作为一种示例,智能设备可以获取用户发出的语音指令,并基于该语音指令,通过上述发声组件播放生成的第一应答信息,同时,通过上述显示组件展示生成的第一显示信息。作为另一种示例,智能设备还可以获取用户通过上述操作区域发出的操作指令,并基于该操作指令,通过上述发声组件播放生成的第二应答信息,同时,通过上述显示组件展示生成的第二显示信息。
可选的,在本实施例中,该显示组件可以是显示屏、指示灯等具有显示功能的组件,还可以是其他具有显示功能的组件,本实施例并不限定显示组件的具体表现形式,只要是可以显示文字、数据或图画、动画的组件均属于本申请的保护范围。
关于具体的示例可参见下述实施例中的记载,此处不再赘述。
由上述可知,本申请实施例提供一种交互方法、智能设备及存储介质,智能设备通过获取用户发出的语音指令,根据该语音指令生成针对语音指令的第一应答信息和第一显示信息,以及控制智能设备播放该第一应答信息,同时通过智能设备的显示组件展示该第一显示信息。该技术方案中,智能设备与用户进行语音交互的同时,还通过显示组件显示出对应的显示信息,智能设备的功能多样化,用户体验好。下面,通过具体实施例对本申请的技术方案进行详细说明。
需要说明的是,下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
图2为本申请实施例提供的交互方法实施例一的流程示意图。该交互方法可以适用于上述图1所示的智能设备。如图2所示,该交互方法可以包括如下步骤:
步骤21:获取用户发出的语音指令。
在本实施例中,智能设备的机身内部设置有电路板,该电路板上部署有语音获取模块、处理模块、控制模块等。可选的,当智能设备处于开机状态时,该智能设备可以检测到以其为中心,半径为预设距离形成距离范围内的语音。
可选的,该预设距离可以为0~20cm中的任意数值,例如,5cm、10cm等,该预设距离还可以为大于20cm之外的其他数值,本实施例并不对预设距离的具体取值进行限定,其可根据实际应用场景以及智能设备内部语音获取模块的灵敏度等进行选择。
示例性的,若用户在上述距离范围内朝着智能设备的方向发出语音指令,则该智能设备可以检测并获取到该语音指令。例如,用户在与该智能设备相距5cm的发出“设置一个明天早上7点的闹铃”的语音指令,这时智能设备可以获取到语音指令,并在明天早上7点的时间播放闹铃提示语音提醒用户起床。
步骤22:基于该语音指令,生成针对该语音指令的第一应答信息和第一显示信息。
在本实施例中,该智能设备的语音获取模块获取到用户发出的语音指令后,将其发送给处理模块,该处理模块可以分析该语音指令的语音内容和语音情绪,生成第一应答信息和第一显示信息。
关于本步骤的具体可能实现方式可以参照下述图5所示实施例中的记载,此处不再赘述。
在本实施例中,主要以第一应答信息和第一显示信息的具体形式进行举例说明。
可选的,在一种可能的设计中,若该语音指令为问答指令,则该第一应答信息为与该问答指令对应的响应信息,该第一显示信息为与该响应信息对应的表情信息。
例如,该智能设备可以根据用户发出的语音指令的语音内容和语音情绪实现与用户的日常对话,若用户对智能设备说“我今天好开心呀”,则该智能设备可以根据获取到该语音指令确定出这是个小孩子的音色和音调,因而可以相应的生成响应信息和表情信息,例如,该响应信息为“宝贝开心,我也好开心呀”,该表情信息为“微笑”的表情。
可选的,在另一种可能的设计中,若该语音指令为闹钟提醒指令,则该第一应答信息为与该闹钟提醒指令对应的闹铃提示语音,该第一显示信息为时间信息。
示例性的,若该智能设备获取到的语音指令为“设置一个明天早上7点的闹铃”,则该智能设备根据该语音指令,首先确定今天的日期,并在今天日期的基础上确定语音指令中的日期,其次生成闹铃提示语音为“早上7点钟,该起床啦”的第一应答信息,时间信息为“7:00”的第一显示信息,且闹铃提示语音的播放时间和时间信息的显示时间均为语音指令中的指定日期的早上7点。
示例性的,若该智能设备获取到的语音指令为“晚上8点半提醒我给宝宝讲故事,晚上9点提醒宝宝睡觉”,则该智能设备可以按照时间顺序生成两个闹铃提示语音和两个时间信息。
其中,第一个闹铃提示语音可以为“晚上8点半,该给宝宝讲故事啦”的第一应答信息,相应的,第一个时间信息为“20:30”的第一显示信息,且第一个闹铃提示语音的播放时间和第一个时间信息的展示时间均为晚上8点半。
第二个闹铃提示语音可以为“晚上9点,宝宝该睡觉了”的第一应答信息,相应的,第二个时间信息为“21:00”的第一显示信息,且第二个闹铃提示语音的播放时间和第二个时间信息的展示时间均为晚上9点。
值得说明的是,第一应答信息和第一显示信息的具体内容仅是一种体现形式,其可以根据实际情况确定,本申请实施例并不对其进行限定。
步骤23:控制该智能设备播放第一应答信息,同时通过智能设备的显示组件展示第一显示信息。
在本实施例中,该智能设备的处理模块通过分析该语音指令生成第一应答信息和第一显示信息后,可以向控制模块发送控制指令,这样控制模块可以在第一应答信息的应答时间控制该智能设备播放该第一应答信息,同时通过该智能设备的显示组件展示该第一显示信息。
示例性的,由上述步骤22可知,若该语音指令为问答指令,则该第一应答信息为与该问答指令对应的响应信息,该第一显示信息为与该响应信息对应的表情信息,相应的,该步骤23可以通过如下步骤实现:
控制该智能设备播放该问答指令对应的响应信息,同时通过显示组件展示上述表情信息。
例如,图3为显示组件展示表情信息的一种示意图。可选的,在该响应信息为“宝贝开心,我也好开心呀”,该表情信息为微笑的表情时,如图3所示,该智能设备可以通过上述发声组件播放“宝贝开心,我也好开心呀”的响应信息,同时可以通过显示组件展示一个的表情。示例性的,若智能设备为智能机器人,这两个显示组件可以位于智能机器人的眼睛部位,这样位于眼睛部位的两个显示组件显示的表情更加人性化,用户视觉效果更好。
可选的,在本实施例中,显示组件可以通过显示屏实现,在某些场景下,该显示组件也可以通过指示灯实现,通过控制指示灯发出不同的灯光呈现不同的显示信息。
在本实施例中,用户与智能设备在语音交互过程中,智能设备通过识别用户语音指令可以播放对应的响应信息和展示对应的表情信息,这样,智能设备的形象更像一个能理解用户情绪且能表达自己情感的机器人,用户体验好。
示例性的,由上述步骤22可知,若该语音指令为闹钟提醒指令,则该第一应答信息为与闹钟提醒指令对应的闹铃提示语音,该第一显示信息为时间信息,相应的,该步骤23可以通过如下步骤实现:
控制该智能设备在预设时刻发出闹铃提示语音,同时所述显示组件显示所述预设时刻的时间信息。
例如,图4为显示组件展示时间信息的一种示意图。可选的,在上述闹铃提示语音为“早上7点钟,该起床啦”的第一应答信息,时间信息为“7:00”的第一显示信息时,如图4所示,该智能设备可以通过上述发声组件播放“早上7点钟,该起床啦”的闹铃提示语音,同时可以通过显示组件展示“7:00”的时间信息。
示例性的,对于上述步骤22中的智能设备生成两个第一应答信息和两个第一显示信息的例子。智能设备在20:30的时间通过发声组件播放“晚上8点半,该给宝宝讲故事啦”的第一个第一应答信息,同时,通过显示组件展示“20:30”的第一个第一显示信息。相应的,智能设备在21:00的时间通过发声组件播放“晚上9点,宝宝该睡觉了”的第二个第一应答信息,同时,通过显示组件展示“21:00”的第二个第一显示信息。
在本实施例中,用户与智能设备在语音交互过程中,智能设备通过识别用户语音指令可以播放对应的闹铃提示语音和展示对应的时间信息,这样,扩展了该智能设备的功能,提高产品的竞争力。
值得说明的是,在日常生活中,该智能设备还可以为用户展示实时时间信息,并在用户设定闹钟提醒或设定提醒事项时,在预设的时刻播放闹铃提示信息以及展示对应的时间信息,满足了用户更多的需求。
在本申请的实施例中,基于家长的事情多,容易忘记一些小事,家长可以通过向智能设备发出语音指令,以使该智能设备在指定的时间播放闹铃提示语音和展示时间信息,提示家长自己的安排事件。
此外,智能设备可以实现与闹钟功能的结合,可以让家长给宝宝做时间计划表,家长可以在公众号上安排好一天的计划(例如,早上7:00-8:00:起床、洗漱、吃早餐,8:00-9:00:出去散步、晒太阳、呼吸新鲜空气,9:00-10:00:回家给宝宝听故事、国学、英语,边玩边学,10:00-10:30加餐吃水果,10:30-11:30:一起玩游戏等等),这样,该智能设备可以在对应时间点通过播放闹铃提示语音提醒用户执行对应的计划。该技术方案,用户不仅可以利用智能设备听故事、学习英语等,还可以充分使用其闹钟的作用,扩展了智能设备的功能。
值得说明的是,在本实施例中,智能设备的头部还可以包括耳朵,相应的,机身内部的电路板上还设置有发光模块。因而,在智能设备播放第一应答信息和通过显示组件展示第一显示信息时,该耳朵还可以发出不同的光,进一步提高了用户的使用体验。
本申请实施例提供的交互方法,智能设备获取用户发出的语音指令,基于该语音指令生成针对该语音指令的第一应答信息和第一显示信息,并控制该智能设备播放第一应答信息,同时通过该智能设备的显示组件展示第一显示信息。该技术方案,智能设备与用户进行语音交互的同时,还通过显示组件显示出对应的显示信息,智能设备的功能多样化,用户体验好。
示例性的,在本实施例中,若该智能设备是智能机器人,其目标用户群体主要是0-12岁的小孩子,其首先是一款学习陪伴型产品。例如,在产品结构设计过程中,该智能机器人的眼睛部位可以采用两个显示屏实现。相应的,每个显示屏的内侧,即机身内部分别固定有灯板(例如,8*8mm规格的发光二极管(light emitting diode,LED)灯板)。
由于LED灯板能展示丰富的用户界面UI设计,吸引小孩子的注意力,且显示屏采用茶色、透明度的镜片过滤灯光使得显示屏展示的LED灯光柔和,不会对小孩子的眼睛造成伤害。因而,用户(小孩子和家长)在使用产品的过程中,结合灯光、声音和用户进行交互,即用户与智能机器人交互时,该智能机器人通过眼睛部位的两个显示屏展示语音指令或操作指令对应的显示信息,提高了智能机器人的智能和产品质量,提高了用户的视觉感知和使用体验。
示例性的,在上述实施例的基础上,图5为本申请实施例提供的交互方法实施例二的流程示意图。如图5所示,在实施例中,上述步骤22(基于该语音指令,生成针对该语音指令的第一应答信息和第一显示信息)可以通过如下两个步骤实现:
步骤51:对该语音指令进行语义分析,确定该语音指令对应的语音内容和语音情绪。
可选的,在本实施例中,该语义分析可以包括:语音识别和情绪识别。所以,智能设备获取到用户的语音指令时,其处理模块可以基于语音识别技术(即智能设备的识别和理解过程)把语音指令转变为相应的文本或命令,从而可以确定出该语音指令对应的语音内容;基于情绪识别技术即通过研究用户发出语音指令时用户的可能面部表情、语音、语速、语音内容等方面来判断用户的语音情绪。
示例性的,本实施例并不限定处理模块进行语音识别和情绪识别能力的具体实现方式。例如,作为一种可能实现方式,智能设备的处理模块可以集成有语音识别和情绪识别功能,因而,该处理模块可以直接进行语音和情绪的识别。作为另一种可能实现方式,该智能设备上运行有训练得到的识别模型,因而,处理模块可以通过运行在该识别模型进行语音和情绪的识别。
步骤52:根据该语音内容和语音情绪,生成针对该语音指令的第一应答信息和第一显示信息。
在本实施例中,智能设备确定出语音内容和语音情绪后,可以根据该语音内容和语音情绪进行意图识别,确定用户发出该语音指令的意图,再生成针对该语音指令的第一应答信息和第一显示信息。
本申请实施例提供的交互方法,通过对获取到的语音指令进行语义分析,确定该语音指令对应的语音内容和语音情绪,再根据该语音内容和语音情绪,生成针对该语音指令的第一应答信息和第一显示信息。该技术方案中,智能设备可以基于用户的语音指令生成对应的应答信息和显示信息,提高了智能设备的智能化,提升了用户使用体验。
示例性的,在上述实施例的基础上,图6为本申请实施例提供的交互方法实施例三的流程示意图。如图6所示,该交互方法还可以包括如下步骤:
步骤61:获取用户通过该智能设备的操作区域发出的操作指令。
可选的,在本实施例中,智能设备的机身具有操作区域。作为一种示例,该操作区域设置有多个功能的实体按键,例如,开/关机,配网,儿歌,国学,英语,国学,百科等等。用户可以操作该实体按键,便可以发出对应功能的操作指令。
作为另一示例,该操作区域也可以设置多个功能的虚拟按键,即操作区域不设置实体按键,只要用户按压对应功能的虚拟按键,便可以发出对应功能的操作指令。
步骤62:基于该操作指令,确定该操作指令对应的第二应答信息和第二显示信息。
示例性的,在本实施例中,操作区域中的实体按键或虚拟按键对应的电路与智能设备的处理模块连接,因而,当用户通过操作区域中的实体按键或虚拟按键发出操作指令时,处理模块可以获取到该操作指令,进而根据该操作指令生成对应的第二应答信息和第二显示信息。
可选的,在一种可能的设计中,若该操作指令为配网指令,则第二应答信息为配网提示语音,该第二显示信息为配网过程信息。
例如,当用户对该智能设备配网时,可以按压操作区域的配网按键,该配网按键连接的电路会生成配网指令,并传输给与其连接的处理模块,处理模块根据该配网指令执行相应的配网过程,同时生成配网提示语音和配网过程信息。在本实施例中,将该配网提示语音作为第二应答信息,将配网过程信息作为第二显示信息。
可选的,在另一种可能的设计中,若该操作指令为闹钟设置指令,则该第二应答信息为闹铃提示语音,第二显示信息为时间信息。
例如,用户也可以通过操作区域的设置按键设置闹铃,因而,当用户需要设置闹铃时,可以按压操作区域的设置按键,与该设置按键连接的电路会生成闹钟设置指令,并传输给与其连接的处理模块,处理模块根据该闹钟设置指令生成闹铃提示语音和时间信息。在本实施例中,将该闹钟提示语音作为第二应答信息,将时间信息作为第二显示信息。
步骤63:控制该智能设备播放第二应答信息,同时通过显示组件展示第二显示信息。
在本实施例中,该智能设备的处理模块生成第二应答信息和第二显示信息后,可以向控制模块发送控制指令,这样控制模块可以在第二应答信息的应答时间控制该智能设备播放该第二应答信息,同时通过该智能设备的显示组件展示该第二显示信息。
可以理解的是,本实施例中显示组件的具体表现形式与上述图2所示实施例中显示组件的表现形式一致,关于显示组件的介绍可以参见上述图2所示实施例中的记载,此处不再赘述。
示例性的,若该操作指令为配网指令,则第二应答信息为配网提示语音,该第二显示信息为配网过程信息时,该步骤63可以通过如下步骤实现:
控制该智能设备在配网过程中发出配网提示音,同时通过显示组件展示配网过程信息。
例如,图7为智能设备的显示组件展示配网过程信息的一种示意图。示例性的,若智能设备在配网过程中,配网提示音是“正在配网,请稍候”,配网过程信息为WiFi图标所以,如图7所示,智能设备可以通过上述发声组件播放“正在配网,请稍候”的配网提示音,同时通过显示组件展示该WiFi图标
本实施例中,当用户在配网的过程中,按下配网按键,智能设备的显示组件会展示配网过程信息,同时播放配网提示音提示用户智能设备已进入配网状态,可以协助用户完成配网,提高了用户的使用体验。
示例性的,若该操作指令为闹钟设置指令,第二应答信息为闹铃提示语音,第二显示信息为时间信息时,该步骤63可以通过如下步骤实现:
控制该智能设备在预设时刻发出闹铃提示语音,同时通过显示组件展示该预设时刻的时间信息。
在本实施例中,智能设备的处理模块根据用户发出的闹钟设置指令生成闹铃提示语音和时间信息。可选的,闹铃提示语音的播放时间和时间信息的展示时间均为闹钟的预设时刻。所以,当处理模块向控制模块发送控制指令后,控制模块可以控制该智能设备在该预设时刻发出闹铃提示语音,同时通过显示组件展示出该预设时刻的时间信息,从而实现提醒用户的目的。
值得说明的是,智能设备的控制方式与上述图2所示实施例中步骤23的实现方式类似,此处不再赘述。
本申请实施例提供的交互方法,智能设备获取用户通过该智能设备的操作区域发出的操作指令,基于该操作指令,确定操作指令对应的第二应答信息和第二显示信息,进而控制该智能设备播放第二应答信息,同时通过显示组件展示第二显示信息。该技术方案中,用户不仅可以获取用户发出的语音指令,也可以获取用户通过操作区域发出的操作指令,并通过显示组件与应答信息的结合,提高了智能设备的智能化,用户体验好。
下述为本申请智能设备实施例,可以用于执行本申请方法实施例。对于本申请智能设备实施例中未披露的细节,请参照本申请方法实施例。
图8为本申请实施例提供的智能设备实施例一的结构示意图。如图8所示,该智能设备可以包括:获取模块81、处理模块82、控制模块83、发声组件84和显示组件85。
其中,该获取模块81,用于获取用户发出的语音指令;
该处理模块82,用于基于所述语音指令,生成针对所述语音指令的第一应答信息和第一显示信息;
该控制模块83,用于控制所述发声组件84播放所述第一应答信息,同时通过所述显示组件85展示所述第一显示信息。
示例性的,在本实施例的一种可能设计中,该处理模块82,具体用于对所述语音指令进行语义分析,确定所述语音指令对应的语音内容和语音情绪,根据所述语音内容和所述语音情绪,生成针对所述语音指令的第一应答信息和第一显示信息。
作为一种示例,若所述语音指令为问答指令,则所述第一应答信息为与所述问答指令对应的响应信息,所述第一显示信息为与所述响应信息对应的表情信息;
该控制模块83,具体用于控制所述发声组件84播放所述问答指令对应的响应信息,同时通过所述显示组件85展示所述表情信息。
作为另一种示例,若所述语音指令为闹钟提醒指令,则所述第一应答信息为与所述闹钟提醒指令对应的闹铃提示语音,所述第一显示信息为时间信息;
该控制模块83,具体用于控制所述发声组件84在预设时刻发出所述闹铃提示语音,同时所述显示组件85显示所述预设时刻的时间信息。
示例性的,在本实施例的另一种可能设计中,该获取模块81,还用于获取所述用户通过该智能设备的操作区域发出的操作指令;
该处理模块82,还用于基于所述操作指令,确定所述操作指令对应的第二应答信息和第二显示信息;
该控制模块83,还用于控制所述发声组件84播放所述第二应答信息,同时通过所述显示组件85展示所述第二显示信息。
作为一种示例,若所述操作指令为配网指令,则所述第二应答信息为配网提示音,所述第二显示信息为配网过程信息;
该控制模块83,还具体用于控制所述发声组件84在配网过程中发出所述配网提示音,同时通过所述显示组件85显示所述配网过程信息。
作为另一种示例,若所述操作指令为闹钟设置指令,则所述第二应答信息为闹铃提示语音,所述第二显示信息为时间信息;
该控制模块83,还具体用于控制所述发声组件84在预设时刻发出闹铃提示语音,同时通过所述显示组件85展示所述预设时刻的时间信息。
示例性的,在本实施例的一种可能设计中,所述显示组件可以包括:显示屏、指示灯。
本申请实施例提供的智能设备,可用于执行图2、图5和图7所示实施例中的方法,其实现原理和技术效果类似,在此不再赘述。
需要说明的是,应理解以上智能设备的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,确定模块可以为单独设立的处理元件,也可以集成在上述智能设备的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述智能设备的存储器中,由上述智能设备的某一个处理元件调用并执行以上确定模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(application specific integrated circuit,ASIC),或,一个或多个微处理器(digital signal processor,DSP),或,一个或者多个现场可编程门阵列(field programmable gate array,FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(centralprocessing unit,CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,SOC)的形式实现。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘solid state disk(SSD))等。
图9为本申请实施例提供的智能设备实施例二的结构示意图。如图9所示,该智能设备可以包括:处理器91、存储器92、通信接口93和系统总线94,所述存储器92和所述通信接口93通过所述系统总线94与所述处理器91连接并完成相互间的通信,所述存储器92用于存储计算机执行指令,所述通信接口93用于和其他设备进行通信,所述处理器91执行所述计算机程序时实现如上述图2、图5和图7所示实施例中智能设备的方案。
该图9中提到的系统总线可以是外设部件互连标准(peripheral componentinterconnect,PCI)总线或扩展工业标准结构(extended industry standardarchitecture,EISA)总线等。所述系统总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于实现智能设备与其他设备(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(random access memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
上述的处理器可以是通用处理器,包括中央处理器CPU、网络处理器(networkprocessor,NP)等;还可以是数字信号处理器DSP、专用集成电路ASIC、现场可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可选的,本申请实施例还提供一种存储介质,所述存储介质中存储有指令,当其在计算机上运行时,使得计算机执行如上述图2、图5和图7所示实施例的方法。
可选的,本申请实施例还提供一种运行指令的芯片,所述芯片用于执行上述图2、图5和图7所示实施例的方法。
本申请实施例还提供一种程序产品,所述程序产品包括计算机程序,所述计算机程序存储在存储介质中,至少一个处理器可以从所述存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序时可实现上述图2、图5和图7所示实施例的方法。
本申请中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系;在公式中,字符“/”,表示前后关联对象是一种“相除”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中,a,b,c可以是单个,也可以是多个。
可以理解的是,在本申请的实施例中涉及的各种数字编号仅为描述方便进行的区分,并不用来限制本申请的实施例的范围。
可以理解的是,在本申请的实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请的实施例的实施过程构成任何限定。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (11)

1.一种交互方法,其特征在于,应用于智能设备,所述方法包括:
获取用户发出的语音指令;
基于所述语音指令,生成针对所述语音指令的第一应答信息和第一显示信息;
控制所述智能设备播放所述第一应答信息,同时通过所述智能设备的显示组件展示所述第一显示信息。
2.根据权利要求1所述的方法,其特征在于,所述基于所述语音指令,生成针对所述语音指令的第一应答信息和第一显示信息,包括:
对所述语音指令进行语义分析,确定所述语音指令对应的语音内容和语音情绪;
根据所述语音内容和所述语音情绪,生成针对所述语音指令的第一应答信息和第一显示信息。
3.根据权利要求2所述的方法,其特征在于,若所述语音指令为问答指令,则所述第一应答信息为与所述问答指令对应的响应信息,所述第一显示信息为与所述响应信息对应的表情信息;
所述控制所述智能设备播放所述第一应答信息,同时通过所述智能设备的显示组件展示所述第一显示信息,包括:
控制所述智能设备播放所述问答指令对应的响应信息,同时通过所述显示组件展示所述表情信息。
4.根据权利要求2所述的方法,其特征在于,若所述语音指令为闹钟提醒指令,则所述第一应答信息为与所述闹钟提醒指令对应的闹铃提示语音,所述第一显示信息为时间信息;
所述控制所述智能设备播放所述第一应答信息,同时通过所述智能设备的显示组件展示所述第一显示信息,包括:
控制所述智能设备在预设时刻发出所述闹铃提示语音,同时所述显示组件显示所述预设时刻的时间信息。
5.根据权利要求1所述的方法,其特征在于,还包括:
获取所述用户通过所述智能设备的操作区域发出的操作指令;
基于所述操作指令,确定所述操作指令对应的第二应答信息和第二显示信息;
控制所述智能设备播放所述第二应答信息,同时通过所述显示组件展示所述第二显示信息。
6.根据权利要求5所述的方法,其特征在于,若所述操作指令为配网指令,则所述第二应答信息为配网提示音,所述第二显示信息为配网过程信息;
所述控制所述智能设备播放所述第二应答信息,同时通过所述显示组件呈现所述第二显示信息,包括:
控制所述智能设备在配网过程中发出所述配网提示音,同时通过所述显示组件显示所述配网过程信息。
7.根据权利要求5所述的方法,其特征在于,若所述操作指令为闹钟设置指令,则所述第二应答信息为闹铃提示语音,所述第二显示信息为时间信息;
所述控制所述智能设备播放所述第二应答信息,同时通过所述显示组件呈现所述第二显示信息,包括:
控制所述智能设备在预设时刻发出闹铃提示语音,同时通过所述显示组件展示所述预设时刻的时间信息。
8.根据权利要求1-7任一项所述的方法,其特征在于,所述显示组件,包括:显示屏、指示灯。
9.一种智能设备,其特征在于,包括:获取模块、处理模块、控制模块、发声组件和显示组件;
所述获取模块,用于获取用户发出的语音指令;
所述处理模块,用于基于所述语音指令,生成针对所述语音指令的第一应答信息和第一显示信息;
所述控制模块,用于控制所述发声组件播放所述第一应答信息,同时通过所述显示组件展示所述第一显示信息。
10.一种智能设备,包括处理器、存储器及存储在所述存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如上述权利要求1-8任一项所述的方法。
11.一种存储介质,其特征在于,所述存储介质中存储有指令,当其在计算机上运行时,使得计算机执行如权利要求1-8任一项所述的方法。
CN201811508707.8A 2018-12-11 2018-12-11 交互方法、智能设备及存储介质 Pending CN109545212A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811508707.8A CN109545212A (zh) 2018-12-11 2018-12-11 交互方法、智能设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811508707.8A CN109545212A (zh) 2018-12-11 2018-12-11 交互方法、智能设备及存储介质

Publications (1)

Publication Number Publication Date
CN109545212A true CN109545212A (zh) 2019-03-29

Family

ID=65854235

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811508707.8A Pending CN109545212A (zh) 2018-12-11 2018-12-11 交互方法、智能设备及存储介质

Country Status (1)

Country Link
CN (1) CN109545212A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110288992A (zh) * 2019-06-18 2019-09-27 王东 一种交互方法、装置、电子设备和计算机可读存储介质
CN110931003A (zh) * 2019-10-22 2020-03-27 安信通科技(澳门)有限公司 一种语音功能的控制交互方法及系统
CN111008720A (zh) * 2019-12-09 2020-04-14 上海博泰悦臻电子设备制造有限公司 基于多轮语音交互的餐厅预订方法及终端
CN111063352A (zh) * 2019-12-24 2020-04-24 北京明略软件系统有限公司 基于语音助手的交互方法、装置、电子设备及存储介质
CN111314557A (zh) * 2020-02-20 2020-06-19 上海掌门科技有限公司 信息处理方法和装置
CN111930229A (zh) * 2020-07-22 2020-11-13 北京字节跳动网络技术有限公司 人机交互方法、装置和电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130040611A1 (en) * 2011-08-09 2013-02-14 Htc Corporation A Method and System for Enabling A User to Configure Custom Voice Alarms/Events for Mobile Communication Devices
CN105291109A (zh) * 2015-11-13 2016-02-03 深圳狗尾草智能科技有限公司 机器人动画表情系统及其实现方法
CN107222372A (zh) * 2016-03-22 2017-09-29 阿里巴巴集团控股有限公司 一种信息发送方法和设备
CN107301168A (zh) * 2017-06-01 2017-10-27 深圳市朗空亿科科技有限公司 智能机器人及其情绪交互方法、系统
CN108326855A (zh) * 2018-01-26 2018-07-27 上海器魂智能科技有限公司 一种机器人的交互方法、装置、设备以及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130040611A1 (en) * 2011-08-09 2013-02-14 Htc Corporation A Method and System for Enabling A User to Configure Custom Voice Alarms/Events for Mobile Communication Devices
CN105291109A (zh) * 2015-11-13 2016-02-03 深圳狗尾草智能科技有限公司 机器人动画表情系统及其实现方法
CN107222372A (zh) * 2016-03-22 2017-09-29 阿里巴巴集团控股有限公司 一种信息发送方法和设备
CN107301168A (zh) * 2017-06-01 2017-10-27 深圳市朗空亿科科技有限公司 智能机器人及其情绪交互方法、系统
CN108326855A (zh) * 2018-01-26 2018-07-27 上海器魂智能科技有限公司 一种机器人的交互方法、装置、设备以及存储介质

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110288992A (zh) * 2019-06-18 2019-09-27 王东 一种交互方法、装置、电子设备和计算机可读存储介质
CN110931003A (zh) * 2019-10-22 2020-03-27 安信通科技(澳门)有限公司 一种语音功能的控制交互方法及系统
CN110931003B (zh) * 2019-10-22 2023-07-07 安信通科技(澳门)有限公司 一种语音功能的控制交互方法及系统
CN111008720A (zh) * 2019-12-09 2020-04-14 上海博泰悦臻电子设备制造有限公司 基于多轮语音交互的餐厅预订方法及终端
CN111063352A (zh) * 2019-12-24 2020-04-24 北京明略软件系统有限公司 基于语音助手的交互方法、装置、电子设备及存储介质
CN111063352B (zh) * 2019-12-24 2023-01-17 北京明略软件系统有限公司 基于语音助手的交互方法、装置、电子设备及存储介质
CN111314557A (zh) * 2020-02-20 2020-06-19 上海掌门科技有限公司 信息处理方法和装置
CN111314557B (zh) * 2020-02-20 2022-05-20 上海掌门科技有限公司 信息处理方法和装置
CN111930229A (zh) * 2020-07-22 2020-11-13 北京字节跳动网络技术有限公司 人机交互方法、装置和电子设备

Similar Documents

Publication Publication Date Title
CN109545212A (zh) 交互方法、智能设备及存储介质
KR102306624B1 (ko) 지속적 컴패니언 디바이스 구성 및 전개 플랫폼
Case Calm technology: principles and patterns for non-intrusive design
US11148296B2 (en) Engaging in human-based social interaction for performing tasks using a persistent companion device
US20170206064A1 (en) Persistent companion device configuration and deployment platform
US9711056B1 (en) Apparatus, method, and system of building and processing personal emotion-based computer readable cognitive sensory memory and cognitive insights for enhancing memorization and decision making skills
JP6625418B2 (ja) 人工知能に基づくヒューマンコンピュータインターアクションの方法、装置及び端末機器
Irwin Digital media: Human–technology connection
Singh et al. Building a word-form lexicon in the face of variable input: Influences of pitch and amplitude on early spoken word recognition
Wojciechowski et al. Assisstive technology application for enhancing social and language skills of young children with autism
WO2016011159A1 (en) Apparatus and methods for providing a persistent companion device
KR102087691B1 (ko) 어린이의 화장실 훈련 프로세스를 관리하기 위한 시스템 및 방법
JP2018014575A (ja) 画像表示装置、画像表示方法及び画像表示プログラム
US20200013406A1 (en) Control method for human-computer interaction device, human-computer interaction device and human-computer interaction system
CN109643224A (zh) 信息提示装置和信息提示方法
Wang et al. Smart design of intelligent companion toys for preschool children
CN101112322A (zh) 一种婴幼儿语言发育评估系统及方法
Blocher Affective Social Quest (ASQ): teaching emotion recognition with interactive media & wireless expressive toys
Steen et al. Child-directed speech in a Norwegian kindergarten setting
Platz Design Beyond Devices: Creating Multimodal, Cross-device Experiences
McCarthy et al. Exploration of head related transfer function and environmental sounds as a means to improve auditory scanning for children requiring augmentative and alternative communication
JP7220389B2 (ja) 行動管理方法、プログラム及び行動管理システム
Smith Ok, google: designing information architecture for smart speakers
Wake Waiting in the Hundred Acre Wood: childhood, narrative and time in AA Milne's Works for Children
WO2018183812A1 (en) Persistent companion device configuration and deployment platform

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210518

Address after: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Applicant after: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

Applicant after: Shanghai Xiaodu Technology Co.,Ltd.

Address before: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Applicant before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.