CN110610701B - 语音交互方法、语音交互提示方法、装置和设备 - Google Patents

语音交互方法、语音交互提示方法、装置和设备 Download PDF

Info

Publication number
CN110610701B
CN110610701B CN201810614184.9A CN201810614184A CN110610701B CN 110610701 B CN110610701 B CN 110610701B CN 201810614184 A CN201810614184 A CN 201810614184A CN 110610701 B CN110610701 B CN 110610701B
Authority
CN
China
Prior art keywords
interaction
voice
corpus
application program
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810614184.9A
Other languages
English (en)
Other versions
CN110610701A (zh
Inventor
陈耀轩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taobao China Software Co Ltd
Original Assignee
Taobao China Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taobao China Software Co Ltd filed Critical Taobao China Software Co Ltd
Priority to CN201810614184.9A priority Critical patent/CN110610701B/zh
Publication of CN110610701A publication Critical patent/CN110610701A/zh
Application granted granted Critical
Publication of CN110610701B publication Critical patent/CN110610701B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例提供一种语音交互方法、语音交互提示方法、装置和设备,该方法包括:在界面上关联地显示语音应用程序以及语音应用程序对应的交互语料控件,交互语料控件关联有语音应用程序的交互语料;响应于用户对交互语料控件的触发操作,向服务器发送与交互语料对应的交互指令,以使服务器根据交互指令确定对应的响应语音。通过在用户终端的界面中显示关联了用于启用该语音应用程序的交互语料的交互语料控件,使得用户仅需要通过对该交互语料控件进行操作即可使得服务器能够获得有效的交互触发以做出相应语音响应,用户操作方便、有效。

Description

语音交互方法、语音交互提示方法、装置和设备
技术领域
本发明涉及互联网技术领域,尤其涉及一种语音交互方法、语音交互提示方法、装置和设备。
背景技术
为了提高用户的使用便利性,目前很多服务提供方提供了可以供用户通过语音交互方式进行使用的应用程序(App)以及具有语音交互功能的语音交互设备,比如智能音箱等。
以如下举例的场景来介绍目前一种通常使用的语音交互模式:假设用户具有某种语音交互设备比如智能音箱,该智能音箱可以支持多种语音应用程序的使用即作为多种语音应用程序的交互入口,用户比如可以通过浏览手机的应用商城来发现这些语音应用程序,从而用户想要使用其中的某个语音应用程序时,用户首先需要说出唤醒即开启该智能音箱的设备唤醒语音,当该智能音箱被唤醒即智能音箱开启语音交互功能进入语音交互模式后,用户继而还需要说出启用所需使用的语音应用程序的应用启用语音,以使智能音箱将该应用启用语音发送至服务器,使得服务器获知用户使用的是哪个语音应用程序,从而运行该语音应用程序的处理逻辑对该应用启用语音进行响应。
比如:用户先说出“你好某某某”的设备唤醒语音,将智能音箱唤醒;进而说出“我想要订肯德基”的应用启用语音,使得服务器通过智能音箱接收到该应用启用语音后知道用户想要使用的是提供肯德基订餐服务的某个语音应用程序,此时,服务器可以基于该语音应用程序的处理逻辑回复比如“好的,今天想订几号餐”的响应语音至该智能音箱,智能音箱播放该响应语音。
以上触发对某个语音应用程序的使用的过程,用户需要依次输出合乎要求的设备唤醒语音和应用启动语音才能与相应的语音应用程序进行语音交互,因为如果用户说出的设备唤醒语音、应用启动语音不符合要求,则将无法启动语音交互设备,或者将使得服务器无法理解用户想要使用什么语音应用程序,从而也就无法进行语音响应。因此,目前的语音交互触发方式对于用户来说,便利性较差。
发明内容
有鉴于此,本发明实施例提供一种语音交互方法、语音交互提示方法、装置和设备,用以提高语音应用程序的交互便利性。
第一方面,本发明实施例提供一种语音交互方法,包括:
在界面上关联地显示语音应用程序以及所述语音应用程序对应的交互语料控件,所述交互语料控件关联有所述语音应用程序的交互语料;
响应于用户对所述交互语料控件的触发操作,向服务器发送与所述交互语料对应的交互指令,以使所述服务器根据所述交互指令确定对应的响应语音。
第二方面,本发明实施例提供一种语音交互装置,包括:
显示模块,用于在界面上关联地显示语音应用程序以及所述语音应用程序对应的交互语料控件,所述交互语料控件关联有所述语音应用程序的交互语料;
发送模块,用于响应于用户对所述交互语料控件的触发操作,向服务器发送与所述交互语料对应的交互指令,以使所述服务器根据所述交互指令确定对应的响应语音。
第三方面,本发明实施例提供一种用户终端设备,包括处理器、存储器和显示屏,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现:
通过所述显示屏在界面上关联地显示语音应用程序以及所述语音应用程序对应的交互语料控件,所述交互语料控件关联有所述语音应用程序的交互语料;
响应于用户对所述交互语料控件的触发操作,向服务器发送与所述交互语料对应的交互指令,以使所述服务器根据所述交互指令确定对应的响应语音。
本发明实施例提供了一种计算机存储介质,用于储存计算机程序,所述计算机程序使计算机执行时实现上述第一方面中的语音交互方法。
本发明实施例提供的语音交互方法,比如当用户使用比如手机等用户终端设备浏览应用商城中包含的各种语音应用程序时,为了方便用户在发现想要使用的语音应用程序时能够快速地与该语音应用程序进行交互,在用户终端设备的浏览界面中会关联地显示该语音应用程序和交互语料控件,该交互语料控件关联有语音应用程序的交互语料。基于此,用户想要使用该语音应用程序时,承接于用户当前浏览到该语音应用程序的操作,用户进而仅需通过点击该交互语料控件即可使得服务器进入到该语音应用程序的处理逻辑,因为该交互语料控件关联了该语音应用程序的交互语料,该交互语料一方面可以让用户学习到使用该语音应用程序应该说出什么样的应用启用语音从而与现有的语音交互方式兼容,另一方面,当用户点击该交互语料控件触发用户终端会向服务器发送交互指令时,服务器基于该交互指令即获得了该交互语料,相当于服务器接收到了启动该语音应用程序的应用启用语音,只是该交互语料并非语音形式的数据,无需用户输出,从而使得服务器进入到与该语音应用程序对应的处理逻辑以确定响应语音并发送至语音交互设备进行播放。
本方案中,通过在用户终端设备的界面中显示与语音应用程序对应的、且关联了用于启用该语音应用程序的交互语料的交互语料控件,使得用户在需要使用该语音应用程序时仅需要通过对该交互语料控件进行操作即可使得服务器能够获得有效的交互触发,从而以该语音应用程序对应的处理逻辑做出相应语音响应,用户操作方便、有效。
第四方面,本发明实施例提供另一种语音交互方法,包括:
在界面上显示语音应用程序的至少一种功能选项以及所述至少一种功能选项分别对应的交互语料控件,其中,所述交互语料控件关联有交互语料;
响应于对目标功能选项对应的目标交互语料控件的触发操作,向所述服务器发送与目标交互语料对应的交互指令,以使所述服务器根据所述交互指令确定对应的响应语音,所述目标功能选项包含于所述至少一种功能选项中,所述目标交互语料控件与所述目标交互语料对应。
第五方面,本发明实施例提供另一种语音交互装置,包括:
显示模块,用于在界面上显示语音应用程序的至少一种功能选项以及所述至少一种功能选项分别对应的交互语料控件,其中,所述交互语料控件关联有交互语料;
发送模块,用于响应于对目标功能选项对应的目标交互语料控件的触发操作,向所述服务器发送与目标交互语料对应的交互指令,以使所述服务器根据所述交互指令确定对应的响应语音,所述目标功能选项包含于所述至少一种功能选项,所述目标交互语料控件与所述目标交互语料对应。
第六方面,本发明实施例提供另一种用户终端设备,包括处理器、存储器和显示屏,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现:
在界面上显示语音应用程序的至少一种功能选项以及所述至少一种功能选项分别对应的交互语料控件,其中,所述交互语料控件关联有交互语料;
响应于对目标功能选项对应的目标交互语料控件的触发操作,向所述服务器发送与目标交互语料对应的交互指令,以使所述服务器根据所述交互指令确定对应的响应语音,所述目标功能选项包含于所述至少一种功能选项中,所述目标交互语料控件与所述目标交互语料对应。
本发明实施例提供了一种计算机存储介质,用于储存计算机程序,所述计算机程序使计算机执行时实现上述第四方面中的语音交互方法。
本发明实施例中,当语音应用程序提供了多种功能时,为了能够让用户能够更方便地触发对其中想要使用的功能的使用,在界面上显示出语音应用程序的各功能选项的同时,关联地显示各功能选项分别对应的交互语料控件,该交互语料控件关联有与相应功能选项对应的交互语料。基于此,用户在需要使用语音应用程序的某个功能时仅需要通过对相应交互语料控件进行操作即可使得服务器能够获得有效的交互触发,从而以该语音应用程序对应的处理逻辑做出相应语音响应,用户操作方便、有效。
第七方面,本发明实施例还一种语音交互提示方法,包括:
在界面上关联地显示语音应用程序以及所述语音应用程序对应的交互语料,以使用户通过说出与交互语料对应的交互语音来触发服务器进行与所述语音应用程序对应的语音交互处理。
在该方案中,将使用语音应用程序所需的交互语料直接与语音应用程序关联显示,从而使得用户能够直接看到有效的交互语料,进而说出与该交互语料对应的交互语音以触发与该语音应用程序的正常交互。
第八方面,本发明实施例还一种语音交互方法,包括:
向用户终端设备提供关联有语音应用程序的交互语料的交互语料控件,以供所述用户终端设备在界面上关联地显示所述语音应用程序和所述交互语料控件;
接收所述用户终端设备发送的与所述交互语料对应的交互指令,所述交互指令是所述用户终端设备响应于用户对所述交互语料控件的触发操作而发送的;
确定与所述交互指令对应的确定响应语音;
将所述响应语音发送至语音交互设备进行播放,所述语音交互设备与所述用户终端设备相同或不同。
第九方面,本发明实施例还一种语音交互装置,包括:
发送模块,用于向用户终端设备提供关联有语音应用程序的交互语料的交互语料控件,以供所述用户终端设备在界面上关联地显示所述语音应用程序和所述交互语料控件;
接收模块,用于接收所述用户终端设备发送的与所述交互语料对应的交互指令,所述交互指令是所述用户终端设备响应于用户对所述交互语料控件的触发操作而发送的;
确定模块,用于确定与所述交互指令对应的确定响应语音;
所述发送模块,还用于将所述响应语音发送至语音交互设备进行播放,所述语音交互设备与所述用户终端设备相同或不同。
第十方面,本发明实施例还提供一种服务器,包括:存储器、处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现:
向用户终端设备提供关联有语音应用程序的交互语料的交互语料控件,以供所述用户终端设备在界面上关联地显示所述语音应用程序和所述交互语料控件;
接收所述用户终端设备发送的与所述交互语料对应的交互指令,所述交互指令是所述用户终端设备响应于用户对所述交互语料控件的触发操作而发送的;
确定与所述交互指令对应的响应语音;
将所述响应语音发送至语音交互设备进行播放,所述语音交互设备与所述用户终端设备相同或不同。
通过上述实施例,服务器将语音应用程序对应的交互语料与一控件(称为交互语料控件)相关联,从而用户终端显示该语音应用程序的同时,可以关联显示该交互语料控件,以便用户直接点击该交互语料控件即可触发与该语音应用程序的交互。
第十一方面,本发明实施例提供一种语音交互方法,包括:
向用户终端设备提供与语音应用程序的至少一种功能选项分别对应的交互语料控件以供所述用户终端设备在界面上显示所述至少一种功能选项以及所述至少一种功能选项分别对应的交互语料控件,其中,所述交互语料控件关联有交互语料;
接收所述用户终端设备发送的与目标交互语料对应的交互指令,所述交互指令是所述用户终端设备响应于用户对目标功能选项对应的目标交互语料控件的触发操作而发送的,所述目标交互语料与所述目标交互语料控件对应,所述目标功能选项包含于所述至少一个功能选项中;
确定与所述交互指令对应的响应语音;
将所述响应语音发送至语音交互设备进行播放,所述语音交互设备与所述用户终端设备相同或不同。
第十二方面,本发明实施例提供一种语音交互装置,包括:
发送模块,用于向用户终端设备提供与语音应用程序的至少一种功能选项分别对应的交互语料控件以供所述用户终端设备在界面上显示所述至少一种功能选项以及所述至少一种功能选项分别对应的交互语料控件,其中,所述交互语料控件关联有交互语料;
接收模块,用于接收所述用户终端设备发送的与目标交互语料对应的交互指令,所述交互指令是所述用户终端设备响应于用户对目标功能选项对应的目标交互语料控件的触发操作而发送的,所述目标交互语料与所述目标交互语料控件对应,所述目标功能选项包含于所述至少一个功能选项中;
确定模块,用于确定与所述交互指令对应的响应语音;
所述发送模块,还用于将所述响应语音发送至语音交互设备进行播放,所述语音交互设备与所述用户终端设备相同或不同。
第十三方面,本发明实施例提供一种服务器,包括:存储器、处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现:
向用户终端设备提供与语音应用程序的至少一种功能选项分别对应的交互语料控件以供所述用户终端设备在界面上显示所述至少一种功能选项以及所述至少一种功能选项分别对应的交互语料控件,其中,所述交互语料控件关联有交互语料;
接收所述用户终端设备发送的与目标交互语料对应的交互指令,所述交互指令是所述用户终端设备响应于用户对目标功能选项对应的目标交互语料控件的触发操作而发送的,所述目标交互语料与所述目标交互语料控件对应,所述目标功能选项包含于所述至少一个功能选项中;
确定与所述交互指令对应的响应语音;
将所述响应语音发送至语音交互设备进行播放,所述语音交互设备与所述用户终端设备相同或不同。
通过上述实施例,服务器将语音应用程序的各功能选项分别对应的交互语料与交互语料控件相关联,从而使得用户在用户终端上查看该语音应用程序所提供的功能并想要使用其中的某个功能时,直接点击该相应的交互语料控件即可触发与该语音应用程序的该功能的交互。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种语音交互系统的示意图;
图2为本发明实施例提供的另一种语音交互系统的示意图;
图3为本发明实施例提供的一种语音交互方法的流程图;
图4为图3所示实施例对应的一种界面操作过程示意图;
图5为本发明实施例提供的另一种语音交互方法的流程图;
图6为图5所示实施例对应的一种界面操作过程示意图;
图7为本发明实施例提供的又一种语音交互方法的流程图;
图8为本发明实施例提供的又一种语音交互方法的流程图;
图9为本发明实施例提供的一种语音交互装置的结构示意图;
图10为与图9所示实施例提供的语音交互装置对应的用户终端设备的结构示意图;
图11为本发明实施例提供的另一种语音交互装置的结构示意图;
图12为与图11所示实施例提供的语音交互装置对应的用户终端设备的结构示意图;
图13为本发明实施例提供的又一种语音交互装置的结构示意图;
图14为与图13所示实施例提供的语音交互装置对应的服务器的结构示意图;
图15为本发明实施例提供的又一种语音交互装置的结构示意图;
图16为与图15所示实施例提供的语音交互装置对应的服务器的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种,但是不排除包含至少一种的情况。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
另外,下述各方法实施例中的步骤时序仅为一种举例,而非严格限定。
在具体介绍本发明实施例提供的语音交互方法的具体实现过程之前,先对该语音交互方法可以适用于的场景进行举例说明,参见图1和图2。
图1为本发明实施例提供的一种语音交互系统的示意图,如图1所示,该系统中可以包括用户终端设备和服务器,该场景下,假设该用户终端设备即为与用户进行语音交互的语音交互设备。实际应用中,该用户终端设备比如为用户的手机、平板电脑、笔记本电脑等。
在图1所示场景下,用户终端设备中可以具有类似于应用商城这类应用,其中包含有服务器提供的各种语音应用程序,从而,用户可以打开应用商场浏览其中的语音应用程序。本发明实施例中,将提供语音交互功能的应用程序统称为语音应用程序。
如图1所示,结合本发明实施例提供的语音交互方法,当用户浏览应用商城发现某个感兴趣的语音应用程序时,可以对该语音应用程序进行使用,以了解该语音应用程序的用途,亦即可以试用该语音应用程序,比如试用该语音应用程序的一些热门功能。而为了能够使用该语音应用程序,用户首先需要让服务器知道用户的使用意图,即让服务器知道用户想要使用哪个语音应用程序从而使得服务器进入相应语音应用程序的处理逻辑即比如调用、执行该语音应用程序的服务代码以获得相应的响应语音。因为服务器往往支持用户与多个语音应用程序的交互,因此,相当于服务器需要基于用户的使用意图切换到相应语音应用程序的处理逻辑。而用户的使用意图的表达是用户通过在用户终端设备的承载有所要使用的语音应用程序的界面上执行了特定的操作而触发用户终端设备向服务器告知该用户意图的,进而,服务器在获知到用户意图后,运行相应的处理逻辑获得响应语音,进而将该响应语音发送至用户终端设备进行播放,从而实现对用户启动该语音应用程序的语音交互响应。
图2为本发明实施例提供的另一种语音交互系统的示意图,如图2所示,该系统中可以包括用户终端设备、服务器和语音交互设备。该场景下,用户终端设备和语音交互设备为两种不同的设备,该语音交互设备比如为智能音箱等支持语音交互功能的智能家居设备,当然,不以此为限。与图1所示场景不同的是,服务器反馈的响应语音是发送至该语音交互设备进行播放的。
以上结合两种可选适用场景对本发明实施例提供的语音交互方法的基本思想进行了简单说明,下面分别站在用户终端设备和服务器的角度,结合如下实施例,对该语音交互方法的具体实现过程进行说明。
图3为本发明实施例提供的一种语音交互方法的流程图,本实施例中的语音交互方法可以由用户终端设备来执行。如图3所示,该方法包括如下步骤:
301、在界面上关联地显示语音应用程序以及语音应用程序对应的交互语料控件,交互语料控件关联有语音应用程序的交互语料。
实际应用中,上述显示动作可以是用户终端设备在如下可选的时机下进行的:
比如,用户在打开用户终端设备的应用商城时,触发向服务器发送访问请求,此时,服务器向用户终端设备下发访问响应,该访问响应中即可以包括服务器当前可以提供的各语音应用程序分别对应的界面显示信息。再比如,用户可以通过访问服务器的网页来触发对服务器的访问请求,此时,服务器响应于该访问请求,向用户终端设备下发上述访问响应。针对任一语音应用程序来说,其对应的界面显示信息可以包括该语音应用程序本身的界面显示元素比如图标、名称,以及与该语音应用程序对应的交互语料控件,该交互语料控件关联有语音应用程序的交互语料,该交互语料可以是开发人员在开发出语音应用程序后预先在服务器中为该语音应用程序进行设置的。从而,用户终端设备据此在界面上按照预设的布局样式显示该语音应用程序以及关联有该交互语料的交互语料控件。
其中,可以理解的是,在界面上显示该语音应用程序是指显示该语音应用程序的标识,比如具有应用名称的图标。
交互语料用于告知服务器用户想要使用的是哪个语音应用程序,且针对相应的语音应用程序来说,只有服务器获得该交互语料(不管是语音形式还是非语音形式表达该交互语料)才认为是使用该语音应用程序的有效触发。
该交互语料即对应于如果用户通过语音方式启动该语音应用程序时所需说出的应用启用语音,也就是说,本发明实施例中,将用于启动语音应用程序所应该输出的有效的语音内容以文字的形式与该语音应用程序的图标关联地展示在界面上。
基于此,在一可选方式中,上述交互语料控件与交互语料的关联性可以体现为:交互语料承载于交互语料控件上,此时,服务器只需将交互语料控件发送至用户终端设备即可,用户终端设备在界面上关联地显示语音应用程序和该承载有交互语料的交互语料控件。
在另一可选方式中,该关联性也可以体现为:交互语料与该交互语料控件均对应于同一语音应用程序。具体可选地,交互语料与交互语料控件可以独立分开显示,此时,服务器需要将交互语料控件和交互语料都发送至用户终端设备,用户终端设备在界面上关联地显示语音应用程序、交互语料和交互语料控件。或者,具体可选地,服务器也可以仅将交互语料控件发送至用户终端设备,用户终端设备在界面上关联地显示语音应用程序以及该交互语料控件(相比于直接在界面上显式地显示出交互语料控件和交互语料,此时,相当于交互语料控件与交互语料的关联为隐式的),但是在服务器侧维护有交互语料和交互语料控件的对应关系,或者说交互语料和语音应用程序的对应关系,因为一般来说,语音应用程序与交互语料和交互语料控件是一一对应的。但是,当语音应用程序具有不止一个交互语料时,服务器侧需要维护语音应用程序的各交互语料控件与交互语料的对应关系。
针对第二种情况,为方便理解,如图4所示,假设用户浏览到某订餐应用程序时,想要使用该订餐应用程序,此时,界面显示效果如图4中所示,界面上显示有承载有该订餐语音应用程序的名称aaa的图标、交互语料控件——以具有尝试字样的控件表示、以及交互语料——我想订aaa。
值得说明的是,当在界面上显示交互语料时,比如单独显示或者承载于交互语料控件上显示,可以让用户了解到如果其想要通过传统的语音交互方式使用该语音应用程序应该说出什么样的应用启用语音(即应该说出该交互语料),以与传统的语音交互方式兼容,避免用户说出错误的应用启用语音而导致的无法使得服务器准确识别出用户想要使用该语音应用程序的意图。
302、响应于用户对交互语料控件的触发操作,向服务器发送与交互语料对应的交互指令,以使服务器根据交互指令确定对应的响应语音。
当用户想要使用上述语音应用程序时,可以点击该语音应用程序对应的交互语料控件,此时,用户终端设备会向服务器发送与该操作对应的交互指令。
在一可选方式中,交互指令中包括语音应用程序的标识,以使服务器根据该语音应用程序的标识查询预设数据库以获得对应的交互语料,当语音应用程序仅对应有一个交互语料控件时,亦即获得与该语音应用程序对应的交互语料。其中,该预设数据库中即维护有语音应用程序的标识比如名称与交互语料间的对应关系。
在另一可选方式中,交互指令中还可以直接携带有交互语料,从而,服务器可以直接解析该交互指令而获得该交互语料。
服务器获得交互语料即获知了用户当前的用户意图——使用该语音应用程序,亦即获得了正确的触发服务器进入该语音应用程序的处理逻辑的参数即该交互语料。进而,服务器可以调用该语音应用程序,将该交互语料作为入参输入给该语音应用程序,以获得对应的响应语音,服务器可以进而将该响应语音发送至语音交互设备进行播放,用户听到该响应语音后,用户可以进行后续与该语音应用程序间的正常语音交互。
当语音交互设备为该用户终端设备时,即为发送该响应语音给该用户终端设备,从而,还可以包括如下步骤:
303、播放从服务器接收的响应语音。
继续以图4为例,该响应语音比如为“好的,今天想吃几号餐品”,进而,用户基于该响应语音与该订餐语音应用程序进行后续的语音交互,比如用户进而输出回复语音“我想吃一号餐”,服务器进而控制语音交互设备输出“好的,还需要其他餐品吗”的应答语音,用户继而输出“不用了,就这些,确认购买”的回复语音。
由此可见,本实施例中用户通过在界面上对交互语料控件触发的操作,可以视为是让服务器开启与用户就该语音应用程序进行语音交互的触发条件,以便用户能够进行后续的与该语音应用程序的语音交互。
应该说明的是,实际应用中,本实施例中,使用语音应用程序往往不一定是使用该语音应用程序提供的所有功能,可能是按照预先设定的情况使用其中的部分功能,此时,服务器会按照所使用的功能的处理逻辑进行语音应答;或者可能并非使用其中的任何功能,此时服务器的应答语音可能是预先设定的介绍该语音应用程序的语音。
综上,本发明实施例中,通过在用户终端设备的界面中显示与语音应用程序对应的、且关联了用于启用该语音应用程序的预设交互语料的交互语料控件,使得用户在需要使用该语音应用程序时仅需要通过对该交互语料控件进行操作即可使得服务器能够获得有效的交互触发,从而以该语音应用程序对应的处理逻辑做出相应语音响应,用户操作方便、有效。
图5为本发明实施例提供的另一种语音交互方法的流程图,如图5所示,可以包括如下步骤:
501、在界面上显示语音应用程序的至少一种功能选项以及至少一种功能选项分别对应的交互语料控件,其中,交互语料控件关联有交互语料。
502、响应于对目标功能选项对应的目标交互语料控件的触发操作,向服务器发送与目标交互语料对应的交互指令,以使服务器根据交互指令确定对应的响应语音,目标功能选项包含于至少一种功能选项中,目标交互语料控件与目标交互语料对应。
某个语音应用程序可能会提供多种不同的功能,比如某个用于车辆环境中的语音应用程序,可能提供有导航、音乐等多种功能,用户可以通过语音交互的方式来使用这些功能。而与使用语音应用程序相似的,使用该语音应用程序所提供的功能时,也需要先告知服务器用户想要使用的功能,以使得服务器进而进入到该功能对应的处理逻辑下,进而在该处理逻辑下,用户与该语音应用程序进行后续正常的语音交互以使用相应的功能。
因此,实际应用中,用户在浏览多个语音应用程序的过程中,如果想要使用某个语音应用程序,可以触发针对该语音应用程序的查看操作,比如点击该语音应用程序的图标,此时,用户终端设备的界面上弹出该语音应用程序对应的至少一种功能选项以及至少一种功能选项分别对应的交互语料控件,其中,该至少一个功能选项与该语音应用程序所提供的至少一个功能一一对应,功能选项可以以相应功能的名称来表示。
实际上,每个功能选项可能关联显示有一个或多个交互语料控件,而每个交互语料控件都关联有相应的交互语料,即不同交互语料控件所关联的交互语料不同。
当一个功能选项关联有多个交互语料控件即关联有多个交互语料时,说明该多个交互语料都可以触发服务器进入该功能的处理逻辑,只是,这多个交互语料所对应的响应语音可能是不同的。
本实施例中,针对某个交互语料控件来说,其关联有与相应功能选项对应的交互语料,该关联性可以体现为:该交互语料控件承载有该交互语料,如图6所示,因为当语音应用程序提供的功能较多时,为了提高界面友好性,将交互语料承载于相应的控件上,有利于保证界面的简洁性。当然,该关联性也可以如前述实施例中所介绍的。
承接于图4中的举例,如图6所示,假设某订餐语音应用程序aaa提供的其中一种功能选项为:订几号餐。该功能选项下对应有两个交互语料控件,这两个交互语料控件上分别承载有“订一份aaa的一号餐”和“我想买aaa的餐品b”。一般地,与功能选项相对应的交互语料中往往可以加入表明相应语音应用程序的关键词,比如aaa,从而在一些实施例中,可以更为方便地使得服务器定位到该语音应用程序。
当显示出上述功能选项和交互语料控件后,用户可以根据需求从多个交互语料控件中点击所需的一个,称为目标交互语料控件,该目标交互语料控件关联的交互语料称为目标交互语料,此时,用户终端设备会向服务器发送与该目标交互语料对应的交互指令,以使服务器知道用户想要使用哪个语音应用程序的哪个功能,进而输出相应的响应语音至语音交互设备进行播放。
比如,如图6所示,假设用户点击了“订一份aaa的一号餐”这个控件,则此时服务器可以输出比如“好的,还需要其他餐品吗”的应答语音,用户继而可以输出“不用了,就这些,确认购买”的回复语音。
值得说明的是,在一可选实施例中,图6中举例的一号餐、餐品b可以是用户自行设定的,即该交互语料中可以设置缺省关键词,并提供设置该缺省关键词的设置项,用户通过该设置项设定好自己所需的关键词,从而形成完整的交互语料。该设置项比如为下拉菜单,其中包含多种用户可选的关键词选项。
本实施例中,由于一个功能选项可以对应有一个或多个交互语料控件,一个功能选项对应的交互语料控件的数量的不同,可以影响用户终端设备设备发送的交互指令的形式,具体地,针对用户想要使用的目标功能选项来说,用户终端设备设备可以根据目标功能选项对应的交互语料控件的数量,确定交互指令中包含的参数类型。
在一可选方式中,若用户终端设备设备发现目标功能选项对应的交互语料控件数量为一个,则确定交互指令中包括语音应用程序的标识和目标功能选项的标识,以使服务器根据语音应用程序的标识和目标功能的标识查询预设数据库以获得目标交互语料。其中,该预设数据库中维护有语音应用程序的标识、功能标识与第二预设交互语料的对应关系。
在另一可选方式中,若用户终端设备设备发现目标功能选项对应的交互语料控件数量为至少两个,则确定交互指令中包括语音应用程序的标识、目标功能选项的标识和目标交互语料,以使服务器从交互指令中解析到目标交互语料。
不管上述哪种实现方式,服务器获得目标交互语料的目的在于,得知用户想要使用的是哪个语音应用程序的哪个功能以便将该目标交互语料作为该功能的入参,触发该功能对该交互语料进行正常的响应。
通过上述方案,当语音应用程序提供了多种功能时,为了能够让用户能够更方便地触发对其中想要使用的功能的使用,在界面上显示出语音应用程序的各功能选项的同时,关联地显示各功能选项分别对应的交互语料控件,该交互语料控件关联有与相应功能选项对应的交互语料。基于此,用户在需要使用语音应用程序的某个功能时仅需要通过对相应交互语料控件进行操作即可使得服务器能够获得有效的交互触发,从而以该语音应用程序对应的处理逻辑做出相应语音响应,用户操作方便、有效。
另外,本发明实施例还一种语音交互提示方法,包括:
在界面上关联地显示语音应用程序以及语音应用程序对应的交互语料,以使用户通过说出与交互语料对应的交互语音来触发服务器进行与该语音应用程序对应的语音交互处理。
前述实施例中提到一点,本发明实施例提供的语音交互方法与传统的语音交互方式兼容,也就是说,对于某个语音应用程序来说,用户既可以基于前述实施例提供的方案——通过触发语音应用程序对应的交互语料控件来触发与该语音应用程序的语音交互过程,还可以基于传统的方案——用户说出可以触发与该语音应用程序进行语音交互的应用启用语音。
但是,实际应用中,用户终端设备中可以呈现多个语音应用程序,而不同的语音应用程序对应的应用启用语音或者说本质上是交互语料各不相同,用户需要记忆准确各语音应用程序的应用启用语音才能正常触发与相应的语音应用程序的语音交互,但是对于用户来说,记忆难度较大。
为此,本方案通过将语音应用程序对应的交互语料直接与语音应用程序关联显示的方式,让用户无需记忆交互语料即可看到正确的交互语料。
其中,交互语料在界面上的显示方式不作具体限定,比如可以承载于一个控件中显示,也可以以文本的形式显示,且该交互语料与语音应用程序的位置关系也不做具体限定。
在该方案中,将使用语音应用程序所需的交互语料直接与语音应用程序关联显示,从而使得用户能够直接看到有效的交互语料,进而说出与该交互语料对应的交互语音以触发与该语音应用程序的正常交互。
图7为本发明实施例提供的又一种语音交互方法的流程图,该语音交互方法可以由服务器来执行。如图7所示,可以包括如下步骤:
701、向用户终端设备提供关联有语音应用程序的交互语料的交互语料控件,以供用户终端设备在界面上关联地显示语音应用程序和交互语料控件。
当用户打开用户终端设备的应用商城浏览其中包含的语音应用程序或者用户访问服务器的某个网页时,用户即可在用户终端的界面上看到各语音应用程序以及各语音应用程序对应的交互语料控件。可选地,用户终端设备可以基于用户的上述打开应用商场的操作或者访问某个网页的操作,向服务器发送访问请求,服务器响应于该访问请求,将各语音应用程序对应的交互语料控件下发给用户终端,从而使得用户终端可以在界面上与各语音应用程序关联地显示相应的交互语料控件。
可以理解的是,当交互语料控件与交互语料的关联性体现为前述实施例中提到的可以彼此独立显示时,服务器还将交互语料一并下发给用户终端设备,从而用户终端设备与语音应用程序关联地显示交互语料和交互语料控件。
702、接收用户终端设备发送的与交互语料对应的交互指令,交互指令是用户终端设备响应于用户对交互语料控件的触发操作而发送的。
703、确定与交互指令对应的确定响应语音。
如前所述,交互指令中可以包括语音应用程序的标识,从而,服务器可以根据该语音应用程序的标识查询预设数据库以获得交互语料。进而,可选地,服务器可以根据预先建立的交互语料与响应语音的对应关系得到与当前的交互语料对应的响应语音。可选地,服务器还可以将该交互语料作为入参输入至相应的语音应用程序,以使语音应用程序基于自身的处理逻辑得到响应语音。
704、将响应语音发送至语音交互设备进行播放,语音交互设备与用户终端设备相同或不同。
本实施例中未详细展开的内容可以参见前述实施例中的介绍,在此不赘述。
通过本实施例,服务器将语音应用程序对应的交互语料与一控件(称为交互语料控件)相关联,从而用户终端显示该语音应用程序的同时,可以关联显示该交互语料控件,以便用户直接点击该交互语料控件即可触发与该语音应用程序的交互。
图8为本发明实施例提供的又一种语音交互方法的流程图,该语音交互方法可以由服务器来执行,如图8所示,可以包括如下步骤:
801、向用户终端设备提供与语音应用程序的至少一种功能选项分别对应的交互语料控件以供用户终端设备在界面上显示至少一种功能选项以及至少一种功能选项分别对应的交互语料控件,其中,交互语料控件关联有交互语料。
用户可以通过浏览用户终端设备中的应用商场或者访问服务器来发现各语音应用程序,当用户想要了解某个语音应用程序提供的功能时,比如可以通过点击该语音应用程序来触发功能查看操作,此时,用户终端设备的界面上可以显示语音应用程序提供的至少一种功能选项以及至少一种功能选项分别对应的交互语料控件。
其中,可选地,用户终端设备可以响应于用户的功能查看操作,从服务器中请求获得至少一种功能选项分别对应的交互语料控件,进而与至少一种功能选项对应关联显示。
802、接收用户终端设备发送的与目标交互语料对应的交互指令,交互指令是用户终端设备响应于用户对目标功能选项对应的目标交互语料控件的触发操作而发送的,目标交互语料与目标交互语料控件对应,目标功能选项包含于至少一个功能选项中。
803、确定与交互指令对应的响应语音。
804、将响应语音发送至语音交互设备进行播放,语音交互设备与用户终端设备相同或不同。
本实施例中未详细展开的内容可以参见前述实施例中的介绍,在此不赘述。
通过本实施例,服务器将语音应用程序的各功能选项分别对应的交互语料与交互语料控件相关联,从而使得用户在用户终端上查看该语音应用程序所提供的功能并想要使用其中的某个功能时,直接点击该相应的交互语料控件即可触发与该语音应用程序的该功能的交互。
以下将详细描述本发明的一个或多个实施例的语音交互装置。本领域技术人员可以理解,这些语音交互装置均可使用市售的硬件组件通过本方案所教导的步骤进行配置来构成。
图9为本发明实施例提供的一种语音交互装置的结构示意图,如图9所示,该装置包括:显示模块11、发送模块12。
显示模块11,用于在界面上关联地显示语音应用程序以及所述语音应用程序对应的交互语料控件,所述交互语料控件关联有所述语音应用程序的交互语料。
发送模块12,用于响应于用户对所述交互语料控件的触发操作,向服务器发送与所述交互语料对应的交互指令,以使所述服务器根据所述交互指令确定对应的响应语音。
可选地,该装置还可以包括:播放模块,用于播放从所述服务器接收的所述响应语音。
可选地,所述交互指令中包括所述语音应用程序的标识,以使所述服务器根据所述语音应用程序的标识查询预设数据库以获得所述交互语料。
可选地,所述交互指令中包括所述交互语料,以使所述服务器从所述交互指令中解析出所述交互语料。
图9所示装置可以执行图3所示实施例的方法,本实施例未详细描述的部分,可参考对图3所示实施例的相关说明。该技术方案的执行过程和技术效果参见图3所示实施例中的描述,在此不再赘述。
以上描述了语音交互装置的内部功能和结构,在一个可能的设计中,语音交互装置的结构可实现为用户终端设备,比如为手机、平板电脑等用户终端设备,如图10所示,该用户终端设备可以包括:第一处理器21、第一存储器22和第一显示屏23。其中,所述第一存储器22用于存储支持用户终端设备执行上述图3所示实施例中提供的语音交互方法的程序,所述第一处理器21被配置为用于执行所述第一存储器22中存储的程序。
所述程序包括一条或多条计算机指令,其中,所述一条或多条计算机指令被所述第一处理器21执行时能够实现如下步骤:
通过所述第一显示屏23在界面上关联地显示语音应用程序以及所述语音应用程序对应的交互语料控件,所述交互语料控件关联有所述语音应用程序的交互语料;
响应于用户对所述交互语料控件的触发操作,向服务器发送与所述交互语料对应的交互指令,以使所述服务器根据所述交互指令确定对应的响应语音。
可选地,所述第一处理器21还用于执行前述图3所示实施例中的全部或部分步骤。
其中,所述用户终端设备的结构中还可以包括第一通信接口24,用于与其他设备或通信网络通信。
另外,本发明实施例提供了一种计算机存储介质,用于储存上述用户终端设备所用的计算机软件指令,其包含用于执行上述图3所示方法实施例中语音交互方法所涉及的程序。
图11为本发明实施例提供的另一种语音交互装置的结构示意图,如11所示,该装置包括:显示模块31、发送模块32。
显示模块31,用于在界面上显示语音应用程序的至少一种功能选项以及所述至少一种功能选项分别对应的交互语料控件,其中,所述交互语料控件关联有交互语料。
发送模块32,用于响应于对目标功能选项对应的目标交互语料控件的触发操作,向所述服务器发送与目标交互语料对应的交互指令,以使所述服务器根据所述交互指令确定对应的响应语音,所述目标功能选项包含于所述至少一种功能选项,所述目标交互语料控件与所述目标交互语料对应。
可选地,所述装置还包括:确定模块33,用于根据所述目标功能选项对应的交互语料控件的数量,确定所述交互指令中包含的参数类型。
可选地,所述确定模块33可以用于:若所述目标功能选项对应的交互语料控件数量为一个,则确定所述交互指令中包括所述语音应用程序的标识和所述目标功能选项的标识,以使所述服务器根据所述语音应用程序的标识和所述目标功能的标识查询预设数据库以获得所述目标交互语料。
可选地,所述确定模块33可以用于:若所述目标功能选项对应的交互语料控件数量为至少两个,则确定所述交互指令中包括所述语音应用程序的标识、所述目标功能选项的标识和所述目标交互语料,以使所述服务器从所述交互指令中解析到所述目标交互语料。
图11所示装置可以执行图5所示实施例的方法,本实施例未详细描述的部分,可参考对图5所示实施例的相关说明。该技术方案的执行过程和技术效果参见图5所示实施例中的描述,在此不再赘述。
以上描述了图11所示的语音交互装置的内部功能和结构,在一个可能的设计中,图11所示的语音交互装置的结构可实现为用户终端设备,该用户终端设备比如为智能手机、平板电脑等,如图12所示,该用户终端设备可以包括:第二处理器41、第二存储器42和第二显示屏43。其中,所述第二存储器42用于存储支持该用户终端设备执行上述图5所示实施例中提供的语音交互方法的程序,所述第二处理器41被配置为用于执行所述第二存储器42中存储的程序。
所述程序包括一条或多条计算机指令,其中,所述一条或多条计算机指令被所述第二处理器41执行时能够实现如下步骤:
通过第二显示屏43在界面上显示语音应用程序的至少一种功能选项以及所述至少一种功能选项分别对应的交互语料控件,其中,所述交互语料控件关联有交互语料;
响应于对目标功能选项对应的目标交互语料控件的触发操作,向所述服务器发送与目标交互语料对应的交互指令,以使所述服务器根据所述交互指令确定对应的响应语音,所述目标功能选项包含于所述至少一种功能选项中,所述目标交互语料控件与所述目标交互语料对应。
可选地,所述第二处理器41还用于执行前述图5所示实施例中的全部或部分步骤。
其中,所述用户终端设备的结构中还可以包括第二通信接口44,用于用户终端设备与其他设备或通信网络通信。
另外,本发明实施例提供了一种计算机存储介质,用于储存上述用户终端设备所用的计算机软件指令,其包含用于执行上述图5所示方法实施例中语音交互方法所涉及的程序。
图13为本发明实施例提供的又一种语音交互装置的结构示意图,如13所示,该装置包括:发送模块51、接收模块52、确定模块53。
发送模块51,用于向用户终端设备提供关联有语音应用程序的交互语料的交互语料控件,以供所述用户终端设备在界面上关联地显示所述语音应用程序和所述交互语料控件。
接收模块52,用于接收所述用户终端设备发送的与所述交互语料对应的交互指令,所述交互指令是所述用户终端设备响应于用户对所述交互语料控件的触发操作而发送的。
确定模块53,用于确定与所述交互指令对应的响应语音。
所述发送模块51,还用于将所述响应语音发送至语音交互设备进行播放,所述语音交互设备与所述用户终端设备相同或不同。
图13所示装置可以执行图7所示实施例的方法,本实施例未详细描述的部分,可参考对图7所示实施例的相关说明。该技术方案的执行过程和技术效果参见图7所示实施例中的描述,在此不再赘述。
以上描述了图13所示的语音交互装置的内部功能和结构,在一个可能的设计中,图13所示的语音交互装置的结构可实现为服务器,如图14所示,该服务器可以包括:第三处理器61和第三存储器62。其中,所述第三存储器62用于存储支持服务器执行上述图7所示实施例中提供的语音交互方法的程序,所述第三处理器61被配置为用于执行所述第三存储器62中存储的程序。
所述程序包括一条或多条计算机指令,其中,所述一条或多条计算机指令被所述第三处理器61执行时能够实现如下步骤:
向用户终端设备提供关联有语音应用程序的交互语料的交互语料控件,以供所述用户终端设备在界面上关联地显示所述语音应用程序和所述交互语料控件;
接收所述用户终端设备发送的与所述交互语料对应的交互指令,所述交互指令是所述用户终端设备响应于用户对所述交互语料控件的触发操作而发送的;
确定与所述交互指令对应的响应语音;
将所述响应语音发送至语音交互设备进行播放,所述语音交互设备与所述用户终端设备相同或不同。
可选地,所述第三处理器61还用于执行前述图7所示实施例中的全部或部分步骤。
其中,所述服务器的结构中还可以包括第三通信接口63,用于与其他设备或通信网络通信。
另外,本发明实施例提供了一种计算机存储介质,用于储存上述服务器所用的计算机软件指令,其包含用于执行上述图7所示方法实施例中语音交互方法所涉及的程序。
图15为本发明实施例提供的又一种语音交互装置的结构示意图,如15所示,该装置包括:发送模块71、接收模块72、确定模块73。
发送模块71,用于向用户终端设备提供与语音应用程序的至少一种功能选项分别对应的交互语料控件以供所述用户终端设备在界面上显示所述至少一种功能选项以及所述至少一种功能选项分别对应的交互语料控件,其中,所述交互语料控件关联有交互语料。
接收模块72,用于接收所述用户终端设备发送的与目标交互语料对应的交互指令,所述交互指令是所述用户终端设备响应于用户对目标功能选项对应的目标交互语料控件的触发操作而发送的,所述目标交互语料与所述目标交互语料控件对应,所述目标功能选项包含于所述至少一个功能选项中。
确定模块73,用于确定与所述交互指令对应的响应语音。
所述发送模块71,还用于将所述响应语音发送至语音交互设备进行播放,所述语音交互设备与所述用户终端设备相同或不同。
图15所示装置可以执行图8所示实施例的方法,本实施例未详细描述的部分,可参考对图8所示实施例的相关说明。该技术方案的执行过程和技术效果参见图8所示实施例中的描述,在此不再赘述。
以上描述了图15所示的语音交互装置的内部功能和结构,在一个可能的设计中,图15所示的语音交互装置的结构可实现为服务器,如图16所示,该服务器可以包括:第四处理器81和第四存储器82。其中,所述第四存储器82用于存储支持服务器执行上述图8所示实施例中提供的语音交互方法的程序,所述第四处理器81被配置为用于执行所述第四存储器82中存储的程序。
所述程序包括一条或多条计算机指令,其中,所述一条或多条计算机指令被所述第四处理器81执行时能够实现如下步骤:
向用户终端设备提供与语音应用程序的至少一种功能选项分别对应的交互语料控件以供所述用户终端设备在界面上显示所述至少一种功能选项以及所述至少一种功能选项分别对应的交互语料控件,其中,所述交互语料控件关联有交互语料;
接收所述用户终端设备发送的与目标交互语料对应的交互指令,所述交互指令是所述用户终端设备响应于用户对目标功能选项对应的目标交互语料控件的触发操作而发送的,所述目标交互语料与所述目标交互语料控件对应,所述目标功能选项包含于所述至少一个功能选项中;
确定与所述交互指令对应的响应语音;
将所述响应语音发送至语音交互设备进行播放,所述语音交互设备与所述用户终端设备相同或不同。
可选地,所述第四处理器81还用于执行前述图8所示实施例中的全部或部分步骤。
其中,所述服务器的结构中还可以包括第四通信接口83,用于与其他设备或通信网络通信。
另外,本发明实施例提供了一种计算机存储介质,用于储存上述服务器所用的计算机软件指令,其包含用于执行上述图8所示方法实施例中语音交互方法所涉及的程序。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助加必需的通用硬件平台的方式来实现,当然也可以通过硬件和软件结合的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以计算机产品的形式体现出来,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程语音交互设备的处理器以产生一个机器,使得通过计算机或其他可编程语音交互设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程语音交互设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程语音交互设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (18)

1.一种语音交互方法,其特征在于,包括:
在界面上关联地显示语音应用程序以及所述语音应用程序对应的交互语料控件,所述交互语料控件关联有所述语音应用程序的交互语料;
响应于用户对所述交互语料控件的触发操作,向服务器发送与所述交互语料对应的交互指令,以使所述服务器响应于所述触发操作进入所述语音应用程序对应的处理逻辑,并根据所述处理逻辑和所述交互指令确定对应的响应语音。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
播放从所述服务器接收的所述响应语音。
3.根据权利要求1所述的方法,其特征在于,所述交互指令中包括所述语音应用程序的标识,以使所述服务器根据所述语音应用程序的标识查询预设数据库以获得所述交互语料。
4.根据权利要求1所述的方法,其特征在于,所述交互指令中包括所述交互语料,以使所述服务器从所述交互指令中解析出所述交互语料。
5.一种语音交互方法,其特征在于,包括:
在界面上显示语音应用程序的至少一种功能选项以及所述至少一种功能选项分别对应的交互语料控件,其中,所述交互语料控件关联有交互语料;
响应于对目标功能选项对应的目标交互语料控件的触发操作,向服务器发送与目标交互语料对应的交互指令,以使所述服务器响应于所述触发操作进入所述语音应用程序对应的处理逻辑,并根据所述处理逻辑和所述交互指令确定对应的响应语音,所述目标功能选项包含于所述至少一种功能选项中,所述目标交互语料控件与所述目标交互语料对应。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
根据所述目标功能选项对应的交互语料控件的数量,确定所述交互指令中包含的参数类型。
7.根据权利要求6所述的方法,其特征在于,所述根据所述目标功能选项对应的交互语料控件的数量,确定所述交互指令中包含的参数类型,包括:
若所述目标功能选项对应的交互语料控件数量为一个,则确定所述交互指令中包括所述语音应用程序的标识和所述目标功能选项的标识,以使所述服务器根据所述语音应用程序的标识和所述目标功能的标识查询预设数据库以获得所述目标交互语料。
8.根据权利要求6所述的方法,其特征在于,所述根据所述目标功能选项对应的交互语料控件的数量,确定所述交互指令中包含的参数类型,包括:
若所述目标功能选项对应的交互语料控件数量为至少两个,则确定所述交互指令中包括所述语音应用程序的标识、所述目标功能选项的标识和所述目标交互语料,以使所述服务器从所述交互指令中解析到所述目标交互语料。
9.一种语音交互提示方法,其特征在于,包括:
在界面上关联地显示语音应用程序以及所述语音应用程序对应的交互语料,以使用户通过说出与交互语料对应的交互语音使服务器进入所述语音应用程序对应的处理逻辑,以使所述服务器根据所述处理逻辑进行与所述语音应用程序对应的语音交互处理。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
接收所述用户说出的所述交互语音;
将所述交互语音发送至所述服务器,以使所述服务器确定对应的响应语音;
播放从所述服务器接收到的所述响应语音。
11.一种语音交互装置,其特征在于,包括:
显示模块,用于在界面上关联地显示语音应用程序以及所述语音应用程序对应的交互语料控件,所述交互语料控件关联有所述语音应用程序的交互语料;
发送模块,用于响应于用户对所述交互语料控件的触发操作,向服务器发送与所述交互语料对应的交互指令,以使所述服务器响应于所述触发操作进入所述语音应用程序对应的处理逻辑,并根据所述处理逻辑和所述交互指令确定对应的响应语音。
12.一种用户终端设备,其特征在于,包括:存储器、处理器、显示屏;其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现:
通过所述显示屏在界面上关联地显示语音应用程序以及所述语音应用程序对应的交互语料控件,所述交互语料控件关联有所述语音应用程序的交互语料;
响应于用户对所述交互语料控件的触发操作,向服务器发送与所述交互语料对应的交互指令,以使所述服务器响应于所述触发操作进入所述语音应用程序对应的处理逻辑,并根据所述处理逻辑和所述交互指令确定对应的响应语音。
13.一种语音交互装置,其特征在于,包括:
显示模块,用于在界面上显示语音应用程序的至少一种功能选项以及所述至少一种功能选项分别对应的交互语料控件,其中,所述交互语料控件关联有交互语料;
发送模块,用于响应于对目标功能选项对应的目标交互语料控件的触发操作,向服务器发送与目标交互语料对应的交互指令,以使所述服务器响应于所述触发操作进入所述语音应用程序对应的处理逻辑,并根据所述处理逻辑和所述交互指令确定对应的响应语音,所述目标功能选项包含于所述至少一种功能选项,所述目标交互语料控件与所述目标交互语料对应。
14.一种用户终端设备,其特征在于,包括:存储器、处理器、显示屏;其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现:
通过所述显示屏在界面上显示语音应用程序的至少一种功能选项以及所述至少一种功能选项分别对应的交互语料控件,其中,所述交互语料控件关联有交互语料;
响应于对目标功能选项对应的目标交互语料控件的触发操作,向服务器发送与目标交互语料对应的交互指令,以使所述服务器响应于所述触发操作进入所述语音应用程序对应的处理逻辑,并根据所述处理逻辑和所述交互指令确定对应的响应语音,所述目标功能选项包含于所述至少一种功能选项,所述目标交互语料控件与所述目标交互语料对应。
15.一种语音交互方法,其特征在于,包括:
向用户终端设备提供关联有语音应用程序的交互语料的交互语料控件,以供所述用户终端设备在界面上关联地显示所述语音应用程序和所述交互语料控件;
接收所述用户终端设备发送的与所述交互语料对应的交互指令,所述交互指令是所述用户终端设备响应于用户对所述交互语料控件的触发操作而发送的;
响应于所述触发操作进入所述语音应用程序对应的处理逻辑,并根据所述处理逻辑和所述交互指令确定对应的响应语音;
将所述响应语音发送至语音交互设备进行播放,所述语音交互设备与所述用户终端设备相同或不同。
16.一种服务器,其特征在于,包括:存储器、处理器;其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现:
向用户终端设备提供关联有语音应用程序的交互语料的交互语料控件,以供所述用户终端设备在界面上关联地显示所述语音应用程序和所述交互语料控件;
接收所述用户终端设备发送的与所述交互语料对应的交互指令,所述交互指令是所述用户终端设备响应于用户对所述交互语料控件的触发操作而发送的;
响应于所述触发操作进入所述语音应用程序对应的处理逻辑,并根据所述处理逻辑和所述交互指令确定对应的响应语音;
将所述响应语音发送至语音交互设备进行播放,所述语音交互设备与所述用户终端设备相同或不同。
17.一种语音交互方法,其特征在于,包括:
向用户终端设备提供与语音应用程序的至少一种功能选项分别对应的交互语料控件以供所述用户终端设备在界面上显示所述至少一种功能选项以及所述至少一种功能选项分别对应的交互语料控件,其中,所述交互语料控件关联有交互语料;
接收所述用户终端设备发送的与目标交互语料对应的交互指令,所述交互指令是所述用户终端设备响应于用户对目标功能选项对应的目标交互语料控件的触发操作而发送的,所述目标交互语料与所述目标交互语料控件对应,所述目标功能选项包含于所述至少一个功能选项中;
响应于所述触发操作进入所述语音应用程序对应的处理逻辑,并根据所述处理逻辑和所述交互指令确定对应的响应语音;
将所述响应语音发送至语音交互设备进行播放,所述语音交互设备与所述用户终端设备相同或不同。
18.一种服务器,其特征在于,包括:存储器、处理器;其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现:
向用户终端设备提供与语音应用程序的至少一种功能选项分别对应的交互语料控件以供所述用户终端设备在界面上显示所述至少一种功能选项以及所述至少一种功能选项分别对应的交互语料控件,其中,所述交互语料控件关联有交互语料;
接收所述用户终端设备发送的与目标交互语料对应的交互指令,所述交互指令是所述用户终端设备响应于用户对目标功能选项对应的目标交互语料控件的触发操作而发送的,所述目标交互语料与所述目标交互语料控件对应,所述目标功能选项包含于所述至少一个功能选项中;
响应于所述触发操作进入所述语音应用程序对应的处理逻辑,并根据所述处理逻辑和所述交互指令确定对应的响应语音;
将所述响应语音发送至语音交互设备进行播放,所述语音交互设备与所述用户终端设备相同或不同。
CN201810614184.9A 2018-06-14 2018-06-14 语音交互方法、语音交互提示方法、装置和设备 Active CN110610701B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810614184.9A CN110610701B (zh) 2018-06-14 2018-06-14 语音交互方法、语音交互提示方法、装置和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810614184.9A CN110610701B (zh) 2018-06-14 2018-06-14 语音交互方法、语音交互提示方法、装置和设备

Publications (2)

Publication Number Publication Date
CN110610701A CN110610701A (zh) 2019-12-24
CN110610701B true CN110610701B (zh) 2023-08-25

Family

ID=68887671

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810614184.9A Active CN110610701B (zh) 2018-06-14 2018-06-14 语音交互方法、语音交互提示方法、装置和设备

Country Status (1)

Country Link
CN (1) CN110610701B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111324409B (zh) * 2020-02-14 2023-03-10 腾讯科技(深圳)有限公司 基于人工智能的互动方法和相关装置
CN111930971A (zh) * 2020-05-21 2020-11-13 北京大米科技有限公司 在线教学交互方法、装置、存储介质以及电子设备
CN111722826B (zh) * 2020-06-28 2022-05-13 广州小鹏汽车科技有限公司 语音交互信息的构造方法、车辆和存储介质
CN111818172B (zh) * 2020-07-21 2022-08-19 海信视像科技股份有限公司 一种物联网管理服务器控制智能设备的方法及装置
CN113506569B (zh) * 2021-06-07 2023-02-03 上海七十迈数字科技有限公司 一种语音交互的方法、系统及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106445940A (zh) * 2015-08-05 2017-02-22 阿里巴巴集团控股有限公司 一种导航方法及装置
CN107112015A (zh) * 2014-12-30 2017-08-29 微软技术许可有限责任公司 发现第三方启用语音的资源的能力
CN107329844A (zh) * 2017-06-30 2017-11-07 广东欧珀移动通信有限公司 一种消息交互方法、装置、存储介质和终端
CN107958038A (zh) * 2017-11-21 2018-04-24 北京小米移动软件有限公司 音箱控制方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104683456B (zh) * 2015-02-13 2017-06-23 腾讯科技(深圳)有限公司 业务处理方法、服务器及终端

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107112015A (zh) * 2014-12-30 2017-08-29 微软技术许可有限责任公司 发现第三方启用语音的资源的能力
CN106445940A (zh) * 2015-08-05 2017-02-22 阿里巴巴集团控股有限公司 一种导航方法及装置
CN107329844A (zh) * 2017-06-30 2017-11-07 广东欧珀移动通信有限公司 一种消息交互方法、装置、存储介质和终端
CN107958038A (zh) * 2017-11-21 2018-04-24 北京小米移动软件有限公司 音箱控制方法及装置

Also Published As

Publication number Publication date
CN110610701A (zh) 2019-12-24

Similar Documents

Publication Publication Date Title
CN110610701B (zh) 语音交互方法、语音交互提示方法、装置和设备
US20200357411A1 (en) Voice action discoverability system
US11347540B2 (en) Task completion through inter-application communication
US9584612B2 (en) Systems and methods for pushing applications
US11175968B2 (en) Embedding an interface of one application into an interface of another application
US20160259767A1 (en) Annotations in software applications for invoking dialog system functions
US20160006856A1 (en) Messaging application with in-application search functionality
US10249296B1 (en) Application discovery and selection in language-based systems
US10860289B2 (en) Flexible voice-based information retrieval system for virtual assistant
US20170097967A1 (en) Automated Customization of Display Component Data for Search Results
BR102012024861B1 (pt) sistema para desambiguar entrada de usuário para realizar uma tarefa
CN108491188B (zh) 语音对话产品的开发资源的管理方法及装置
US11893993B2 (en) Interfacing with applications via dynamically updating natural language processing
US11514896B2 (en) Interfacing with applications via dynamically updating natural language processing
US11907316B2 (en) Processor-implemented method, computing system and computer program for invoking a search
US20240152369A1 (en) Interface and mode selection for digital action execution
JP2013535041A (ja) ユーザデータに基づいてネットワーク機能を識別する方法及び装置
CN106558311B (zh) 语音内容提示方法和装置
CN110633391A (zh) 一种信息搜索方法及装置
CN110874176B (zh) 交互方法、存储介质、操作系统和设备
US10503763B2 (en) Methods and systems for executing functions in a text field
US9720748B1 (en) Predefined intents for native applications
US8838596B2 (en) Systems and methods to process enquires by receving and processing user defined scopes first
US20210264910A1 (en) User-driven content generation for virtual assistant
KR20150107066A (ko) 메신저 서비스 시스템, 그 시스템에서의 상용구를 이용한 메신저 서비스 방법 및 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40019511

Country of ref document: HK

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230711

Address after: Room 554, floor 5, building 3, No. 969, Wenyi West Road, Wuchang Street, Yuhang District, Hangzhou City, Zhejiang Province

Applicant after: TAOBAO (CHINA) SOFTWARE CO.,LTD.

Address before: Box 847, four, Grand Cayman capital, Cayman Islands, UK

Applicant before: ALIBABA GROUP HOLDING Ltd.

GR01 Patent grant
GR01 Patent grant