CN112114770A - 基于语音交互的界面引导方法、装置及设备 - Google Patents

基于语音交互的界面引导方法、装置及设备 Download PDF

Info

Publication number
CN112114770A
CN112114770A CN201910532217.XA CN201910532217A CN112114770A CN 112114770 A CN112114770 A CN 112114770A CN 201910532217 A CN201910532217 A CN 201910532217A CN 112114770 A CN112114770 A CN 112114770A
Authority
CN
China
Prior art keywords
display
voice interaction
instruction
voice
skill
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910532217.XA
Other languages
English (en)
Inventor
王文宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Shanghai Xiaodu Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910532217.XA priority Critical patent/CN112114770A/zh
Publication of CN112114770A publication Critical patent/CN112114770A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例提供一种基于语音交互的界面引导方法、装置及设备,该方法包括:获取用户通过语音形式输入的第一指令;对所述第一指令进行语义识别,确定所述第一指令的语义;若所述第一指令的语义指示用户不知道语音交互设备支持的技能,则控制显示装置显示第一引导界面,所述第一引导界面中包括至少一个控件,各所述控件与所述语音交互设备支持的技能一一对应。由此可见,当根据用户输入的语音指令,发现用户不知道语音交互设备支持的技能时,采用第一引导界面展示语音交互设备支持的所有技能,使得用户通过第一引导界面能够快速了解语音交互设备所支持的技能,从而使用户可以快速使用该语音交互设备,提升用户体验。

Description

基于语音交互的界面引导方法、装置及设备
技术领域
本发明实施例涉及人工智能技术领域,尤其涉及一种基于语音交互的界面引导方法、装置及设备。
背景技术
随着人工智能技术的发展,越来越多的语音交互设备融入人们的生活。人们使用语音交互设备的过程中,通过语音与设备进行交互,可以解放用户的双手,提升人们的使用体验。
然而,用户在使用语音交互设备时,可能会不知道语音交互设备具有哪些功能,或者,不知道通过何种语音表达来使用这些功能,导致用户拿到语音交互设备后无法直接使用,用户体验不佳。
发明内容
本发明实施例提供一种基于语音交互的界面引导方法、装置及设备,用以引导用户快速使用语音交互设备,提升用户体验。
第一方面,本发明实施例提供一种基于语音交互的界面引导方法,包括:
获取用户通过语音形式输入的第一指令;
对所述第一指令进行语义识别,确定所述第一指令的语义;
若所述第一指令的语义指示所述用户不知语音交互设备支持的技能,则控制显示装置显示第一引导界面,所述第一引导界面中包括至少一个控件,各所述控件与所述语音交互设备支持的技能一一对应。
可选的,所述方法还包括:
若所述第一指令的语义用于指示所述用户不知语音交互设备的第一技能对应的语音交互方式,则控制所述显示装置显示所述第一技能对应的第二引导界面,所述第二引导界面包括至少一条文本语句,各所述文本语句用于指示使用所述第一技能时所需输入的语音指令。
可选的,所述控制显示装置显示第一引导界面之后,还包括:
若检测到用户在所述第一引导界面操作第一控件,则获取所述第一控件对应的第一技能,控制所述显示装置显示所述第一技能对应的第二引导界面,所述第二引导界面包括至少一条文本语句,各所述文本语句用于指示使用所述第一技能时所需输入的语音指令。
可选的,所述控制所述显示装置显示第二引导界面,包括:
获取所述第一技能对应的展示模板,所述展示模板为下述中的任一:文本模板、单图文模板、多图文模板;
根据所述展示模板,控制所述显示装置显示第二引导界面。
可选的,所述获取所述第一技能对应的展示模板,包括:
获取所述显示装置的显示尺寸;
根据所述显示尺寸,获取所述第一技能对应的展示模板,所述展示模板对应的展示尺寸与所述显示尺寸匹配。
可选的,所述控制所述显示装置显示第二引导界面之后,还包括:
若检测到用户在所述第二引导界面操作文本语句,则控制所述语音交互设备执行接收到所述文本语句对应的语音指令时的动作。
可选的,所述第二引导界面中的文本语句包括唤醒词和所述语音指令。
可选的,所述显示装置为所述语音交互设备的显示屏,或者,所述显示装置为所述语音交互设备对应的控制设备的显示屏。
第二方面,本发明实施例提供一种基于语音交互的界面引导装置,包括:
获取模块,用于获取用户通过语音形式输入的第一指令;
确定模块,用于对所述第一指令进行语义识别,确定所述第一指令的语义;
第一显示模块,用于若所述第一指令的语义指示所述用户不知语音交互设备支持的技能,则控制显示装置显示第一引导界面,所述第一引导界面中包括至少一个控件,各所述控件与所述语音交互设备支持的技能一一对应。
可选的,所述装置还包括:
第二显示模块,用于若所述第一指令的语义用于指示所述用户不知语音交互设备的第一技能对应的语音交互方式,则控制所述显示装置显示所述第一技能对应的第二引导界面,所述第二引导界面包括至少一条文本语句,各所述文本语句用于指示使用所述第一技能时所需输入的语音指令。
可选的,所述装置还包括:
第二显示模块,用于若检测到用户在所述第一引导界面操作第一控件,则获取所述第一控件对应的第一技能,控制所述显示装置显示所述第一技能对应的第二引导界面,所述第二引导界面包括至少一条文本语句,各所述文本语句用于指示使用所述第一技能时所需输入的语音指令。
可选的,所述第二显示模块具体用于:
获取所述第一技能对应的展示模板,所述展示模板为下述中的任一:文本模板、单图文模板、多图文模板;
根据所述展示模板,控制所述显示装置显示第二引导界面。
可选的,所述第二显示模块具体用于:
获取所述显示装置的显示尺寸;
根据所述显示尺寸,获取所述第一技能对应的展示模板,所述展示模板对应的展示尺寸与所述显示尺寸匹配。
可选的,所述装置还包括:
执行模块,用于若检测到用户在所述第二引导界面操作文本语句,则控制所述语音交互设备执行接收到所述文本语句对应的语音指令时的动作。
可选的,所述第二引导界面中的文本语句包括唤醒词和所述语音指令。
可选的,所述显示装置为所述语音交互设备的显示屏,或者,所述显示装置为所述语音交互设备对应的控制设备的显示屏。
第三方面,本发明实施例提供一种基于语音交互的界面引导设备,包括:存储器、处理器以及计算机程序,所述计算机程序存储在所述存储器中,所述处理器运行所述计算机程序执行如第一方面任一项所述的方法。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质包括计算机程序,所述计算机程序被处理器执行时实现如第一方面任一项所述的方法。
本发明实施例提供的基于语音交互的界面引导方法、装置及设备,该方法包括:获取用户通过语音形式输入的第一指令;对所述第一指令进行语义识别,确定所述第一指令的语义;若所述第一指令的语义指示用户不知道语音交互设备支持的技能,则控制显示装置显示第一引导界面,所述第一引导界面中包括至少一个控件,各所述控件与所述语音交互设备支持的技能一一对应。由此可见,当根据用户输入的语音指令,发现用户不知道语音交互设备支持的技能时,采用第一引导界面展示语音交互设备支持的所有技能,使得用户通过第一引导界面能够快速了解语音交互设备所支持的技能,从而使用户可以快速使用该语音交互设备,提升用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例适用的应用场景示意图;
图2为本发明一实施例提供的界面引导方法的流程示意图;
图3为本发明实施例提供的第一引导界面的示意图;
图4为本发明实施例提供的第二引导界面的示意图;
图5为本发明另一实施例提供的界面引导方法的流程示意图;
图6为本发明实施例提供的界面引导过程的示意图;
图7为本发明实施例提供的单图文模板的示意图;
图8为本发明实施例提供的多图文模板的示意图;
图9为本发明实施例提供的界面引导装置的结构示意图;
图10为本发明实施例提供的界面引导设备的硬件结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了便于对本发明技术方案的理解,下面结合图1对本发明实施例所适用的应用场景及设备进行介绍。
图1为本发明实施例适用的应用场景示意图。如图1所示,包括:语音交互设备和服务器。其中,语音交互设备可以是具有语音交互功能的任意电子设备,包括但不限于:手机、电视、智能音箱、智能穿戴设备、智能冰箱、智能车载设备等。语音交互设备和服务器通过网络连接。服务器可以为云端服务器。下面结合两个场景描述用户与语音交互设备的交互过程。
以智能音箱为例,用户可以通过向智能音箱输入语音指令,实现对智能音箱的控制。示例性的,用户向智能音箱输入语音指令“播放歌曲《两只老虎》”,智能音箱接收到该指令后,从服务器获取该歌曲并进行播放。
以智能电视为例,用户可以通过向智能电视输入语音指令,实现对智能电视的控制。示例性的,用户向智能电视输入语音指令“播放今天的新闻”,智能电视接收到该指令后,从服务器获取待播放的新闻内容并进行播放。
可以理解的,随着终端技术的不断发展,语音交互设备支持的技能越来越多。示例性的,智能音箱不仅支持音乐播放技能,还支持天气查询技能、新闻播放技能、闲聊技能、闹钟提醒技能等。智能电视不仅支持视频播放技能、还支持音乐播放技能、闲聊技能、通话技能、闹钟提醒技能等。并且,不同的语音交互设备所支持的技能也可能不同。
目前,当用户在使用语音交互设备时,尤其是初次使用语音交互设备时,可能不知道该语音交互设备具有哪些技能,或者,不知道通过何种语音表达来使用这些功能,导致用户拿到语音交互设备后无法直接使用,用户体验不佳。
为了解决上述问题中的至少一个,本发明实施例提供一种基于语音交互的界面引导方法,当发现用户不知道语音交互设备支持的技能时,通过向用户展示第一引导界面,来实现对用户的引导,使得用户通过第一引导界面能够快速了解语音交互设备所支持的技能,从而使用户可以快速使用该语音交互设备,提升用户体验。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图2为本发明一实施例提供的界面引导方法的流程示意图。本实施例的方法可以由界面引导装置执行,该界面引导装置可以是软件和/或硬件的形式。该界面引导装置可以设置在图1的语音交互设备中,还可以设置在图1的服务器中。
如图2所示,该方法包括:
S201:获取用户通过语音形式输入的第一指令。
S202:对所述第一指令进行语义识别,确定所述第一指令的语义。
S203:若所述第一指令的语义指示所述用户不知语音交互设备支持的技能,则控制显示装置显示第一引导界面,所述第一引导界面中包括至少一个控件,各所述控件与所述语音交互设备支持的技能一一对应。
其中,第一指令是用户以语音形式向语音交互设备输入的指令。
示例性的,用户在不知道语音交互设备支持的技能时,可以向语音交互设备输入第一指令“你会什么”。
示例性的,用户在不知道语音交互设备支持的技能时,可以向语音交互设备输入第一指令“你有哪些技能”。
示例性的,用户在不知道语音交互设备支持的技能时,可以向语音交互设备输入第一指令“你有什么能力”。
示例性的,用户在不知道语音交互设备支持的技能时,可以向语音交互设备输入第一指令“我不了解你”。
示例性的,用户在不知道语音交互设备支持的技能时,可以向语音交互设备输入第一指令“能告诉我你有哪些技能吗”。
获取到用户输入的上述第一指令后,界面引导装置对语音指令进行语义识别,确定第一指令的语义。示例性的,首先采用语音识别技术,对第一指令进行语音识别,得到第一指令对应的文本信息。再采用语义识别技术对文本信息进行语义识别,确定第一指令的语义。其中,语音识别过程和语义识别过程可以采用现有的语音识别技术和语义识别技术,本实施例对此不作赘述。
当第一指令的语义指示用户不知道语音交互设备支持的技能时,控制显示装置显示第一引导界面。其中,第一引导界面中包括至少一个控件,每个控件还该语音交互设备支持的一种技能对应。
本发明实施例中,显示装置可以是语音交互设备的显示屏。示例性的,语音交互设备为带屏的语音交互设备,例如:手机、智能电视、带屏智能音箱等。界面引导装置控制语音交互设备通过显示屏显示第一引导界面。
本发明实施例中,语音交互设备还可以是不带屏设备,例如:不带屏的智能音箱、不带屏的智能冰箱等。当语音交互设备为不带屏设备时,显示装置可以是语音交互设备对应的控制设备的显示屏。例如:智能音箱的客户端设备对应的显示屏。以智能音箱的客户端设备为手机为例,可以通过手机显示屏显示第一引导界面。
图3为本发明实施例提供的第一引导界面的示意图。如图3所示,第一引导界面中包括至少一个控件,每个控件对应一种技能。图3示例了该语音交互设备支持8项技能的情况。用户通过图3所示第一引导界面,可以快速了解到该语音交互设备支持的8项技能分别为:技能商店、音乐、天气、闹钟提醒、拍照、通话、百科、有声。
本实施例提供的界面引导方法,获取用户通过语音形式输入的第一指令;对所述第一指令进行语义识别,确定所述第一指令的语义;若所述第一指令的语义指示用户不知道语音交互设备支持的技能,则控制显示装置显示第一引导界面,所述第一引导界面中包括至少一个控件,各所述控件与所述语音交互设备支持的技能一一对应。由此可见,当根据用户输入的语音指令,发现用户不知道语音交互设备支持的技能时,采用第一引导界面展示语音交互设备支持的所有技能,使得用户通过第一引导界面能够快速了解语音交互设备所支持的技能,从而使用户可以快速使用该语音交互设备,提升用户体验。
一种可能的实施方式中,用户在知道语音交互设备支持的技能的情况下,有可能并不知道某一技能的语音交互方式。如图2所示,本实施例的方法,还可以包括:
S204:若所述第一指令的语义用于指示所述用户不知第一技能对应的语音交互方式,则控制所述显示装置显示所述第一技能对应的第二引导界面,所述第二引导界面包括至少一条文本语句,各所述文本语句用于指示使用所述第一技能时所需输入的语音指令。
其中,第一技能是语音交互设备支持的任一技能。下面以“天气”技能为例,举例说明用户在不知道该技能的语音交互方式的情况下,可能向语音交互设备输入的语音指令。
示例性的,用户在不知道“天气”技能的语音交互方式时,可以向语音交互设备输入第一指令“天气技能怎么使用”。
示例性的,用户在不知道“天气”技能的语音交互方式时,可以向语音交互设备输入第一指令“我不会使用天气技能”。
示例性的,用户在不知道“天气”技能的语音交互方式时,可以向语音交互设备输入第一指令“请告诉我天气技能的使用方式”。
示例性的,用户在不知道“天气”技能的语音交互方式时,可以向语音交互设备输入第一指令“打开天气技能”。
示例性的,用户在不知道“天气”技能的语音交互方式时,可以向语音交互设备输入第一指令“进入天气技能”。
界面引导装置通过对上述的第一指令进行语义识别,确定出第一指令的语义指示用户不知道第一技能对应的语音交互方式时,则控制所述显示装置显示该第一技能对应的第二引导界面。其中,第二引导界面包括至少一条文本语句,各所述文本语句用于指示使用所述第一技能时所需输入的语音指令。
示例性的,第二引导界面中的文本语句,可以是以文本形式描述的用以引导用户的语句,例如:“您可以向语音交互设备输入语音指令‘今天天气怎么样’来使用天气技能”。
示例性的,第二引导界面中的文本语句,还可以是语音指令的直接呈现,例如:“今天天气怎么样”。
用户通过第二引导界面,即可以了解到使用第一技能时所需要输入的语音指令。
可选的,所述第二引导界面中的文本语句包括唤醒词和所述语音指令。其中,唤醒词是用于唤醒语音交互设备的词语。示例性的,当语义交互设备监听到唤醒词后,将该唤醒词之后的语音作为向语音交互设备输入的有效语音。对于没有唤醒词的语音,则直接作为无效语音。对于无效语音,无须进行语音识别过程,以免浪费语音交互设备的处理资源。
后续举例中,假设唤醒词为“小D”。
图4为本发明实施例提供的第二引导界面的示意图。图4示例的是天气技能对应的引导界面。该引导界面中展示了使用天气技能所需输入的语音指令。例如:“小D小D,今天天气怎么样”,“小D小D,北京天气怎么样”,“小D小D,明天会下雪吗”,“小D小D,后天的温度怎么样”,“小D小D,查询上海的天气”。
用户通过图4所示的引导界面,可以快速了解到天气技能对应的语音交互方式。当后续用户需要使用天气技能时,直接向语音交互设备输入对应的语音指令即可。示例性的,当用户后续需要查询南京的天气预报时,则直接向语音交互设备输入语音“小D小D,南京天气怎么样”。
由此可见,用户通过某个技能对应的第二引导界面,能够快速了解到该技能的使用方式,使得用户可以快速使用该技能,提升用户体验。
图5为本发明另一实施例提供的界面引导方法的流程示意图。如图5所示,本实施例的方法,包括:
S501:获取用户通过语音形式输入的第一指令。
S502:对所述第一指令进行语义识别,确定所述第一指令的语义。
S503:若所述第一指令的语义指示所述用户不知语音交互设备支持的技能,则控制显示装置显示第一引导界面,所述第一引导界面中包括至少一个控件,各所述控件与所述语音交互设备支持的技能一一对应。
S504:若检测到用户在所述第一引导界面操作第一控件,则获取所述第一控件对应的第一技能,控制所述显示装置显示所述第一技能对应的第二引导界面,所述第二引导界面包括至少一条文本语句,各所述文本语句用于指示使用所述第一技能时所需输入的语音指令。
本实施例与图2所示实施例的具体实施方式类似,不同之处在于,本实施例中,在显示第一引导界面之后,用户还可以通过操作某个技能对应的控件,从而触发显示装置显示该技能对应的第二引导界面。
图6为本发明实施例提供的界面引导过程的示意图。如图6所示,在第一引导界面中,用户点击或者触摸“天气”技能对应的控件后,显示装置显示“天气技能”对应的第二引导界面。
在图2和图5所示实施例的基础上,控制显示装置显示第二引导界面的步骤,可以具体包括:
获取所述第一技能对应的展示模板,所述展示模板为下述中的任一:文本模板、单图文模板、多图文模板;
根据所述展示模板,控制所述显示装置显示第二引导界面。
其中,不同的技能可以对应不同的展示模板。
其中,文本模板是指在第二引导界面中以文本语句的形式展示语音指令。图4示例的是以文本模板展示天气技能对应的第二引导界面。
单图文模板是指在第二引导界面中展现单个大图片,并配合一句以文本语句的形式展示的语音指令。图7为本发明实施例提供的单图文模板的示意图。图7示例的是闹钟提醒技能对应的第二引导界面。如图7所示,该界面中包括一个大图片以及一个文本语句。
多图文模板是指在第二引导界面中展示多个小图片,并为每个小图片配合一句以文本语句的形式展示的语音指令。图8为本发明实施例提供的多图文模板的示意图。图8示例的是百科技能对应的第二引导界面。如图8所示,该界面中包括多个小图片,每个小图片对应一个文本语句。
需要说明的是,本发明实施例对于附图中所示的语音交互设备所支持的技能,以及各技能对应的第二引导界面的展示模板,并不作具体限定,附图中所示的仅为示例。
一种可能的实施方式中,可以在界面引导装置中设置技能与展示模板之间的对应关系。当需要展示某一个技能对应的第二引导界面时,则根据该对应关系,确定采用哪种模板来展示第二引导界面。
另一种可能的实施方式中,界面引导装置为每种技能设置多种不同的展示模板。其中,不同的展示模板对应不同的展示尺寸。当语音交互设备需要展示某个技能对应的第二引导界面时,界面引导装置首先获取显示装置的显示尺寸。然后,根据显示装置的显示尺寸,获取与该技能对应的展示模板,其中,展示模板对应的展示尺寸与所述显示尺寸匹配。
示例性的,有些展示模板对应的展示尺寸较大,适合在较大的显示装置中显示。有些展示模板对应的展示尺寸较小,适合在较小的显示装置中显示。本实施例中,根据显示装置的显示尺寸,获取技能对应的第二引导界面的展示模板,使得第二引导界面能够适合在任意显示装置中显示。
上述各实施方式中,技能与展示模板之间的对应关系还可以是存储在云端服务器中。当语音交互设备需要显示某个技能对应第二引导界面时,语音交互设备通过与云端服务器交互,获取该技能对应的展示模板。例如:语音交互设备将该技能的标识发送给云端服务器,云端服务器根据该技能的标识确定展示模板,并将展示模板返回给语音交互设备。再例如:语音交互设备将该技能的标识和显示装置的显示尺寸发送给云端服务器,云端服务器根据该技能的标识和显示装置的显示尺寸,确定展示模板,并将展示模板返回给语音交互设备。
上述实施例中,用户通过图4、图7或图8所示的第二引导界面,可以快速了解到使用每个技能所需要输入的语音指令,即,使用户快速了解到如何使用语音指令与语音交互设备进行交互,从而,使得用户能够快速使用该技能,提升用户体验。
在上述实施例的基础上,当用户操作第二引导界面中的文本语句时,语音交互设备模拟用户输入了该文本语句对应的语音指令,控制语音交互设备执行接收到所述文本语句对应的语音指令时的动作。
示例性的,参见图4,假设用户在图4所示的第二引导界面中,点击或者触摸文本语句“小D小D,今天天气怎么样”,则界面引导装置模拟用户说出了该语音指令,并控制语音交互设备执行接收到语音指令“小D小D,今天天气怎么样”时的动作。即,语音交互设备通过与云端服务器交互,获取今天的天气情况,并以语音形式向用户播报天气情况。
本实施例中,用户可以通过在第二引导界面中进行操作,以模拟向语音交互设备输入语音指令,提高了用户与语音交互设备的交互效率,进一步提升用户使用体验。
图9为本发明实施例提供的界面引导装置的结构示意图。如图9所示,本实施例的界面引导装置900,包括:获取模块901、确定模块902和第一显示模块903。
其中,获取模块901,用于获取用户通过语音形式输入的第一指令;
确定模块902,用于对所述第一指令进行语义识别,确定所述第一指令的语义;
第一显示模块903,用于若所述第一指令的语义指示所述用户不知语音交互设备支持的技能,则控制显示装置显示第一引导界面,所述第一引导界面中包括至少一个控件,各所述控件与所述语音交互设备支持的技能一一对应。
可选的,如图9所示,本实施例的界面引导装置900,还可以包括:第二显示模块904。
第二显示模块,用于若所述第一指令的语义用于指示所述用户不知语音交互设备的第一技能对应的语音交互方式,则控制所述显示装置显示所述第一技能对应的第二引导界面,所述第二引导界面包括至少一条文本语句,各所述文本语句用于指示使用所述第一技能时所需输入的语音指令。
可选的,如图9所示,本实施例的界面引导装置900,还可以包括:第二显示模块904。
第二显示模块904,用于若检测到用户在所述第一引导界面操作第一控件,则获取所述第一控件对应的第一技能,控制所述显示装置显示所述第一技能对应的第二引导界面,所述第二引导界面包括至少一条文本语句,各所述文本语句用于指示使用所述第一技能时所需输入的语音指令。
可选的,所述第二显示模块904具体用于:
获取所述第一技能对应的展示模板,所述展示模板为下述中的任一:文本模板、单图文模板、多图文模板;
根据所述展示模板,控制所述显示装置显示第二引导界面。
可选的,所述第二显示模块904具体用于:
获取所述显示装置的显示尺寸;
根据所述显示尺寸,获取所述第一技能对应的展示模板,所述展示模板对应的展示尺寸与所述显示尺寸匹配。
可选的,如图9所示,本实施例的界面引导装置900,还可以包括:执行模块905。
执行模块905,用于若检测到用户在所述第二引导界面操作文本语句,则控制所述语音交互设备执行接收到所述文本语句对应的语音指令时的动作。
可选的,所述第二引导界面中的文本语句包括唤醒词和所述语音指令。
可选的,所述显示装置为所述语音交互设备的显示屏,或者,所述显示装置为所述语音交互设备对应的控制设备的显示屏。
本实施例的界面引导装置,可用于执行上述任一方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图10为本发明实施例提供的界面引导设备的硬件结构示意图。如图10所示,本实施例的界面引导设备1000,包括:处理器1001以及存储器1002;其中,存储器1002,用于存储计算机程序;处理器1001,用于执行存储器存储的计算机程序,以实现上述实施例中的界面引导方法。具体可以参见前述方法实施例中的相关描述。
可选地,存储器1002既可以是独立的,也可以跟处理器1001集成在一起。
当所述存储器1002是独立于处理器1001之外的器件时,所述界面引导设备700还可以包括:总线1003,用于连接所述存储器1002和处理器1001。
本实施例提供的界面引导设备,可用于执行上述任一方法实施例中的技术方案,其实现原理和技术效果类似,本实施例此处不再赘述。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质包括计算机程序,所述计算机程序用于实现如上任一方法实施例中的技术方案。
本发明实施例还提供一种芯片,包括:存储器、处理器以及计算机程序,所述计算机程序存储在所述存储器中,所述处理器运行所述计算机程序执行上述任一方法实施例中的技术方案。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。上述模块成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本发明各个实施例所述方法的部分步骤。
应理解,上述处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合申请所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本发明附图中的总线并不限定仅有一根总线或一种类型的总线。
上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(Application Specific Integrated Circuits,简称:ASIC)中。当然,处理器和存储介质也可以作为分立组件存在于电子设备或主控设备中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (18)

1.一种基于语音交互的界面引导方法,其特征在于,包括:
获取用户通过语音形式输入的第一指令;
对所述第一指令进行语义识别,确定所述第一指令的语义;
若所述第一指令的语义指示所述用户不知语音交互设备支持的技能,则控制显示装置显示第一引导界面,所述第一引导界面中包括至少一个控件,各所述控件与所述语音交互设备支持的技能一一对应。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述第一指令的语义用于指示所述用户不知语音交互设备的第一技能对应的语音交互方式,则控制所述显示装置显示所述第一技能对应的第二引导界面,所述第二引导界面包括至少一条文本语句,各所述文本语句用于指示使用所述第一技能时所需输入的语音指令。
3.根据权利要求1所述的方法,其特征在于,所述控制显示装置显示第一引导界面之后,还包括:
若检测到用户在所述第一引导界面操作第一控件,则获取所述第一控件对应的第一技能,控制所述显示装置显示所述第一技能对应的第二引导界面,所述第二引导界面包括至少一条文本语句,各所述文本语句用于指示使用所述第一技能时所需输入的语音指令。
4.根据权利要求2或3所述的方法,其特征在于,所述控制所述显示装置显示第二引导界面,包括:
获取所述第一技能对应的展示模板,所述展示模板为下述中的任一:文本模板、单图文模板、多图文模板;
根据所述展示模板,控制所述显示装置显示第二引导界面。
5.根据权利要求4所述的方法,其特征在于,所述获取所述第一技能对应的展示模板,包括:
获取所述显示装置的显示尺寸;
根据所述显示尺寸,获取所述第一技能对应的展示模板,所述展示模板对应的展示尺寸与所述显示尺寸匹配。
6.根据权利要求2或3所述的方法,其特征在于,所述控制所述显示装置显示第二引导界面之后,还包括:
若检测到用户在所述第二引导界面操作文本语句,则控制所述语音交互设备执行接收到所述文本语句对应的语音指令时的动作。
7.根据权利要求2或3所述的方法,其特征在于,所述第二引导界面中的文本语句包括唤醒词和所述语音指令。
8.根据权利要求1至3任一项所述的方法,其特征在于,所述显示装置为所述语音交互设备的显示屏,或者,所述显示装置为所述语音交互设备对应的控制设备的显示屏。
9.一种基于语音交互的界面引导装置,其特征在于,包括:
获取模块,用于获取用户通过语音形式输入的第一指令;
确定模块,用于对所述第一指令进行语义识别,确定所述第一指令的语义;
第一显示模块,用于若所述第一指令的语义指示所述用户不知语音交互设备支持的技能,则控制显示装置显示第一引导界面,所述第一引导界面中包括至少一个控件,各所述控件与所述语音交互设备支持的技能一一对应。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第二显示模块,用于若所述第一指令的语义用于指示所述用户不知语音交互设备的第一技能对应的语音交互方式,则控制所述显示装置显示所述第一技能对应的第二引导界面,所述第二引导界面包括至少一条文本语句,各所述文本语句用于指示使用所述第一技能时所需输入的语音指令。
11.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第二显示模块,用于若检测到用户在所述第一引导界面操作第一控件,则获取所述第一控件对应的第一技能,控制所述显示装置显示所述第一技能对应的第二引导界面,所述第二引导界面包括至少一条文本语句,各所述文本语句用于指示使用所述第一技能时所需输入的语音指令。
12.根据权利要求10或11所述的装置,其特征在于,所述第二显示模块具体用于:
获取所述第一技能对应的展示模板,所述展示模板为下述中的任一:文本模板、单图文模板、多图文模板;
根据所述展示模板,控制所述显示装置显示第二引导界面。
13.根据权利要求12所述的装置,其特征在于,所述第二显示模块具体用于:
获取所述显示装置的显示尺寸;
根据所述显示尺寸,获取所述第一技能对应的展示模板,所述展示模板对应的展示尺寸与所述显示尺寸匹配。
14.根据权利要求10或11所述的装置,其特征在于,所述装置还包括:
执行模块,用于若检测到用户在所述第二引导界面操作文本语句,则控制所述语音交互设备执行接收到所述文本语句对应的语音指令时的动作。
15.根据权利要求10或11所述的装置,其特征在于,所述第二引导界面中的文本语句包括唤醒词和所述语音指令。
16.根据权利要求9至11任一项所述的装置,其特征在于,所述显示装置为所述语音交互设备的显示屏,或者,所述显示装置为所述语音交互设备对应的控制设备的显示屏。
17.一种基于语音交互的界面引导设备,其特征在于,包括:存储器、处理器以及计算机程序,所述计算机程序存储在所述存储器中,所述处理器运行所述计算机程序执行如权利要求1至8任一项所述的方法。
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述的方法。
CN201910532217.XA 2019-06-19 2019-06-19 基于语音交互的界面引导方法、装置及设备 Pending CN112114770A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910532217.XA CN112114770A (zh) 2019-06-19 2019-06-19 基于语音交互的界面引导方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910532217.XA CN112114770A (zh) 2019-06-19 2019-06-19 基于语音交互的界面引导方法、装置及设备

Publications (1)

Publication Number Publication Date
CN112114770A true CN112114770A (zh) 2020-12-22

Family

ID=73795616

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910532217.XA Pending CN112114770A (zh) 2019-06-19 2019-06-19 基于语音交互的界面引导方法、装置及设备

Country Status (1)

Country Link
CN (1) CN112114770A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112286487A (zh) * 2020-12-30 2021-01-29 智道网联科技(北京)有限公司 语音引导操作方法、装置、电子设备及存储介质
CN113824937A (zh) * 2021-08-06 2021-12-21 广州小鹏汽车科技有限公司 操作指引方法及装置、车辆及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440138A (zh) * 2013-09-06 2013-12-11 网易(杭州)网络有限公司 一种行为引导方法及装置
US20150046168A1 (en) * 2013-08-06 2015-02-12 Nuance Communications, Inc. Method and Apparatus for a Multi I/O Modality Language Independent User-Interaction Platform
CN104599669A (zh) * 2014-12-31 2015-05-06 乐视致新电子科技(天津)有限公司 一种语音控制方法和装置
CN107146612A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 语音引导方法、装置、智能设备及服务器
CN108287739A (zh) * 2017-12-19 2018-07-17 维沃移动通信有限公司 一种操作引导方法及移动终端
CN108399919A (zh) * 2017-02-06 2018-08-14 中兴通讯股份有限公司 一种语义识别方法和装置
CN108520748A (zh) * 2018-02-01 2018-09-11 百度在线网络技术(北京)有限公司 一种智能设备功能引导方法及系统
WO2018187712A1 (en) * 2017-04-06 2018-10-11 Aibrain, Inc. Adaptive, interactive, and cognitive reasoner of an autonomous robotic system
CN109325097A (zh) * 2018-07-13 2019-02-12 海信集团有限公司 一种语音引导方法及装置、电子设备、存储介质
CN109378001A (zh) * 2018-12-27 2019-02-22 北京猎户星空科技有限公司 一种语音交互方法、装置、电子设备及可读存储介质
CN109408181A (zh) * 2018-10-16 2019-03-01 百度在线网络技术(北京)有限公司 设备技能显示方法和装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150046168A1 (en) * 2013-08-06 2015-02-12 Nuance Communications, Inc. Method and Apparatus for a Multi I/O Modality Language Independent User-Interaction Platform
CN103440138A (zh) * 2013-09-06 2013-12-11 网易(杭州)网络有限公司 一种行为引导方法及装置
CN104599669A (zh) * 2014-12-31 2015-05-06 乐视致新电子科技(天津)有限公司 一种语音控制方法和装置
CN108399919A (zh) * 2017-02-06 2018-08-14 中兴通讯股份有限公司 一种语义识别方法和装置
WO2018187712A1 (en) * 2017-04-06 2018-10-11 Aibrain, Inc. Adaptive, interactive, and cognitive reasoner of an autonomous robotic system
CN107146612A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 语音引导方法、装置、智能设备及服务器
CN108287739A (zh) * 2017-12-19 2018-07-17 维沃移动通信有限公司 一种操作引导方法及移动终端
CN108520748A (zh) * 2018-02-01 2018-09-11 百度在线网络技术(北京)有限公司 一种智能设备功能引导方法及系统
CN109325097A (zh) * 2018-07-13 2019-02-12 海信集团有限公司 一种语音引导方法及装置、电子设备、存储介质
CN109408181A (zh) * 2018-10-16 2019-03-01 百度在线网络技术(北京)有限公司 设备技能显示方法和装置
CN109378001A (zh) * 2018-12-27 2019-02-22 北京猎户星空科技有限公司 一种语音交互方法、装置、电子设备及可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
京白FV: "如何引导用户用你的功能", Retrieved from the Internet <URL:https://zhuanlan.zhihu.com/p/22458855> *
方婷: "基于移动终端界面的用户引导方法探索", 艺术与设计(理论) *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112286487A (zh) * 2020-12-30 2021-01-29 智道网联科技(北京)有限公司 语音引导操作方法、装置、电子设备及存储介质
CN113824937A (zh) * 2021-08-06 2021-12-21 广州小鹏汽车科技有限公司 操作指引方法及装置、车辆及存储介质
CN113824937B (zh) * 2021-08-06 2024-03-12 广州小鹏汽车科技有限公司 操作指引方法及装置、车辆及存储介质

Similar Documents

Publication Publication Date Title
CN110267113B (zh) 视频文件加工方法、系统、介质和电子设备
US10783884B2 (en) Electronic device-awakening method and apparatus, device and computer-readable storage medium
US11200899B2 (en) Voice processing method, apparatus and device
CN110602516A (zh) 基于视频直播的信息交互方法、装置及电子设备
CN107657973B (zh) 文本及音频混合显示方法、装置、终端设备及存储介质
CN109979450B (zh) 信息处理方法、装置及电子设备
CN105453070A (zh) 基于机器学习的用户行为表征
CN108965981B (zh) 视频播放方法、装置、存储介质及电子设备
CN109634501B (zh) 电子书批注添加方法、电子设备及计算机存储介质
KR20200097444A (ko) 음성을 기반으로 그래픽 데이터를 제공하는 전자 장치 및 그의 동작 방법
CN111629253A (zh) 视频处理方法及装置、计算机可读存储介质、电子设备
US11595591B2 (en) Method and apparatus for triggering special image effects and hardware device
US11511200B2 (en) Game playing method and system based on a multimedia file
CN112231021A (zh) 软件新功能的引导方法和装置
WO2014154097A1 (en) Automatic page content reading-aloud method and device thereof
US20210405767A1 (en) Input Method Candidate Content Recommendation Method and Electronic Device
CN112114770A (zh) 基于语音交互的界面引导方法、装置及设备
CN108847066A (zh) 一种教学内容提示方法、装置、服务器和存储介质
CN110413834B (zh) 语音评论修饰方法、系统、介质和电子设备
US11775070B2 (en) Vibration control method and system for computer device
CN112672207B (zh) 音频数据处理方法、装置、计算机设备及存储介质
CN113992972A (zh) 一种字幕显示方法、装置、电子设备和可读存储介质
JP6085067B2 (ja) ユーザデータ更新方法、装置、プログラム、及び記録媒体
CN111079495A (zh) 一种点读模式的开启方法及电子设备
US20140297285A1 (en) Automatic page content reading-aloud method and device thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210518

Address after: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Applicant after: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

Applicant after: Shanghai Xiaodu Technology Co.,Ltd.

Address before: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Applicant before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.