CN111427992A - 对话处理方法及设备 - Google Patents
对话处理方法及设备 Download PDFInfo
- Publication number
- CN111427992A CN111427992A CN201910025807.3A CN201910025807A CN111427992A CN 111427992 A CN111427992 A CN 111427992A CN 201910025807 A CN201910025807 A CN 201910025807A CN 111427992 A CN111427992 A CN 111427992A
- Authority
- CN
- China
- Prior art keywords
- service
- information
- slot
- user
- slot position
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 43
- 238000012545 processing Methods 0.000 claims abstract description 260
- 238000000034 method Methods 0.000 claims abstract description 48
- 230000015654 memory Effects 0.000 claims description 39
- 238000004590 computer program Methods 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 4
- 230000000977 initiatory effect Effects 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 24
- 239000010410 layer Substances 0.000 description 24
- 230000006870 function Effects 0.000 description 19
- 230000008569 process Effects 0.000 description 16
- 230000003993 interaction Effects 0.000 description 15
- 238000004891 communication Methods 0.000 description 14
- 244000269722 Thea sinensis Species 0.000 description 7
- 235000015220 hamburgers Nutrition 0.000 description 7
- 238000013461 design Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 235000006468 Thea sinensis Nutrition 0.000 description 4
- 235000013361 beverage Nutrition 0.000 description 4
- 235000020279 black tea Nutrition 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 230000001960 triggered effect Effects 0.000 description 4
- 235000013336 milk Nutrition 0.000 description 3
- 239000008267 milk Substances 0.000 description 3
- 210000004080 milk Anatomy 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 235000015203 fruit juice Nutrition 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 235000013322 soy milk Nutrition 0.000 description 2
- 235000013616 tea Nutrition 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 235000013405 beer Nutrition 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 239000012792 core layer Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 235000009569 green tea Nutrition 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/02—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/04—Real-time or near real-time messaging, e.g. instant messaging [IM]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请公开了一种对话处理方法及设备。该方法包括:对话处理设备从用户设备接收对话信息;若所述对话信息中不包含能够确定服务的第一槽位类型对应的槽位信息,从服务器获取第一槽位类型对应的服务标识集,并将服务标识集发送到用户设备;从用户设备接收到目标服务标识后,向服务器请求目标服务标识对应的服务,并将执行成功的信息发送到用户设备。采用本实现方式,不但能够及时向用户展示服务项目,而且能够避免用户与对话处理设备发起多轮对话,提高执行服务的效率,进而,提高用户的使用体验。
Description
技术领域
本申请涉及计算机领域,尤其涉及一种对话处理方法及设备。
背景技术
人机对话系统(以下简称对话系统)可以响应用户输入的语音向用户反馈信息,该对话系统可以包括任务型对话系统(task-oriented systems)和非任务型对话系统(non-task-oriented systems)。非任务型对话系统可以是聊天式对话系统。任务型对话系统可以根据用户的语音触发确定的服务,并向该用户反馈相应服务被执行的结果。
其中,服务型对话系统可以对应目标服务器,该目标服务器用于提供和执行一项或多项服务。基于此,该对话系统接收用户输入的语音之后,可以从该语音中获取一个或者多个必选槽位信息。必选槽位信息是指示一项服务必不可少的信息,例如,预订机票这项服务的必选槽位信息包括起始地,起飞时间和目的地。进而,该对话系统可以检测该一个或者多个必选槽位信息是否均包含在该对话系统预置的槽位信息中,若该一个或者多个必选槽位信息均包含在该对话系统预置的槽位信息中,该对话系统根据该一个或者多个必选槽位信息请求该目标服务器执行目标服务。该目标服务器响应该请求检测该目标服务是否包含于该一项或多项服务中,若该目标服务包含于该一项或多项服务中,该目标服务器执行该目标服务。然后,该对话系统可以向用户反馈该目标服务执行成功的信息。此外,若该一个或者多个必选槽位信息中任一槽位信息不包含在该对话系统预置的槽位信息中,或者,若该目标服务不包含在该一项或多项服务中,该对话系统可能向用户反馈该目标服务执行失败的信息,那么,用户可能继续输入其他内容的语音,以使某项服务能够被执行成功。
可见,采用上述对话处理方法,用户与对话系统的对话轮次较多,使得用户的使用体验较差。
发明内容
本申请提供了一种对话处理方法及设备,解决了采用现有对话处理方法,用户与对话系统的对话轮次多的问题。
第一方面,本申请提供了一种对话处理方法,该方法包括:
对话处理设备从用户设备接收对话信息;
若所述对话信息中不包含能够确定服务的第一槽位类型对应的槽位信息,所述对话处理设备从服务器获取所述第一槽位类型对应的服务标识集,所述第一槽位类型指示必选槽位信息中用于指示服务标识的槽位信息所属的槽位类型,所述服务标识集包括所述第一槽位类型对应的多个服务标识;
所述对话处理设备将所述服务标识集发送到所述用户设备;
若从所述用户设备接收到目标服务标识,所述对话处理设备向所述服务器请求所述目标服务标识对应的服务,所述目标服务标识属于所述服务标识集;
若从所述服务器接收服务执行成功的信息,所述对话处理设备将所述执行成功的信息发送到所述用户设备。
采用本实现方式,在服务器自定义的服务项目与相应槽位类型的槽位信息不对应的情况下,对话处理设备将服务器维护的多个服务标识反馈给用户,从而使得用户输入的相应槽位信息一定对应服务器中某项服务项目。从而不但能够及时向用户展示服务项目,而且能够避免用户与对话处理设备发起多轮对话,提高执行服务的效率。
一种可能的实现方式中,对话处理设备从用户设备接收对话信息之后,从服务器获取所述第一槽位类型对应的服务标识集之前,包括:
所述对话处理设备解析所述对话信息;
若从所述对话信息中未解析出所述第一槽位类型对应的槽位信息,所述对话处理设备确定所述对话信息中不包含能够确定服务的第一槽位类型对应的槽位信息。一种可能的实现方式中,对话处理设备从用户设备接收对话信息之后,从服务器获取所述第一槽位类型对应的服务标识集之前,包括:
所述对话处理设备解析所述对话信息得到所述第一槽位类型对应的槽位信息;
所述对话处理设备向所述服务器请求所述槽位信息对应的服务;
若从所述服务器接收到服务执行失败的信息,所述对话处理设备确定所述对话信息中不包含能够确定服务的第一槽位类型对应的槽位信息。
采用本实现方式,在该对话处理设备中预置的槽位信息与用户输入的必选槽位信息不对应,和/或,该对话处理设备中预置的槽位信息与服务器所包含的服务不对应的情况下,该对话处理设备能够及时提供有效的信息和/或处理策略,不仅能够减少不必要的对话轮次,而且处理方式灵活,能够提高用户的使用体验。
一种可能的实现方式中,对话处理设备从用户设备接收对话信息之后,将所述执行成功的信息发送到所述用户设备之前,还包括:
所述对话处理设备解析所述对话信息得到所述第一槽位类型对应的槽位信息;
所述对话处理设备向所述服务器请求所述槽位信息对应的服务;
若从所述服务器接收到所述服务执行成功的信息,且所述对话处理设备中不包含所述槽位信息,所述对话处理设备将所述槽位信息添加到所述第一槽位类型对应的信息库中。
可见,采用本实现方式,不但能够减少对话处理设备与用户的对话轮次,及时为用户提供服务,而且,对话处理设备能够及时更新该对话处理设备所维护的槽位信息。
一种可能的实现方式中,对话处理设备从用户设备接收对话信息之前,包括:
所述对话处理设备接收添加标签指令,所述添加标签指令与所述第一槽位类型对应;
所述对话处理设备为所述第一槽位类型添加标签。
其中,根据槽位信息与服务的关系的描述,必选槽位信息包括指示服务标识的槽位信息,例如,叫车服务中的“顺风车”,以及用于确定服务的常规槽位信息,例如,目的地“清华西门”。其中,服务器为用户提供的服务通常由相关服务人员自定义,所以,服务器所提供的服务可能会更改,例如,“顺风车”服务项目下架,“拼车”服务项目上架,从而导致不存在相应服务标识对应的服务。
基于此,为了便于对话处理设备识别第一槽位类型和第二槽位类型,本申请可以预先按照上述必选槽位类型的属性,通过添加标签的方式标示出第一槽位类型,从而为本申请技术方案的实现提供依据。
一种可能的实现方式中,所述对话信息是文本或者音频。
第二方面,本申请提供了一种对话处理方法,该方法包括:
用户设备向对话处理设备发送对话信息;
所述用户设备从所述对话处理设备接收并提示第一槽位类型对应的服务标识集,所述第一槽位类型指示必选槽位信息中用于指示服务标识的槽位信息所属的槽位类型,所述服务标识集包括所述第一槽位类型对应的多个服务标识;
所述用户设备向所述对话处理设备发送目标服务标识,所述目标服务标识属于所述服务标识集;
所述用户设备从所述对话处理设备接收服务执行成功的信息,所述服务是所述目标服务标识对应的服务。
采用本实现方式,无论用户输入的对话信息是否包含第一槽位类型对应的槽位信息,无论用户输入的槽位信息与对话处理设备中预置的槽位信息的对应关系怎样,并且,无论用户输入的槽位信息与服务器提供的服务的对应关系怎样,该用户均能够获得想要的服务。这样不仅避免用户发起多轮次对话,而且,使得用户能够及时获知服务器所提供的多个服务,从而提高用户的使用体验。
一种可能的实现方式中,所述用户设备提示第一槽位类型对应的服务标识集,包括:
所述用户设备提示所述服务标识集中的全部服务标识。
一种可能的实现方式中,所述用户设备提示第一槽位类型对应的服务标识集,包括:
所述用户设备提示链接所述服务标识集的入口标识;
所述用户设备接收用户输入的打开指令;
所述用户设备提示所述入口标识链接的页面,所述页面中包括所述服务标识集中的全部服务标识。
一种可能的实现方式中,所述用户设备提示第一槽位类型对应的服务标识集,包括:
所述用户设备提示菜单控件,所述菜单控件中提示所述服务标识集中的部分服务标识;
所述用户设备接收用户输入的提示指令;
所述用户设备切换所述菜单控件中所提示的服务标识。
其中,一些实施例中,第一槽位类型对应的服务标识可能是两个或者三个。另一些实施例中,第一槽位类型对应的服务标识可能是十几个。采用本实现方式,能够灵活设置服务标识提示的方式,从而提高用户的使用体验。
第三方面,本申请提供了一种对话处理方法,该方法包括:对话处理设备从用户设备接收对话信息,然后,确定该对话信息中全部必选槽位类型所对应的关键词。若该全部必选槽位类型对应的关键词中,任一关键词对应相应槽位类型中的至少两条槽位信息,对话处理设备确定该至少两条槽位信息中对应最优服务方案的特定槽位信息。进而,对话处理设备可以向服务器请求该特定槽位信息对应的服务,在从服务器接收到相应服务执行成功的信息之后,将相应服务执行成功的信息发送到用户设备。
采用本实现方式,对话处理设备可以在用户输入的关键词含义模糊的情况下,自动为用户提供相对较优的服务,不仅能够避免与用户多轮次对话,而且操作灵活,能够进一步提高用户的使用体验。
第四方面,本申请提供了一种对话处理方法,该方法包括:
对话处理设备从用户设备接收对话信息;
对话处理设备向第一服务器请求该槽位信息对应的服务;
若从第一服务器接收到的该服务执行失败的信息,对话处理设备向第二服务器请求该槽位信息对应的服务;
若从第二服务器接收到的该服务执行成功的信息,对话处理设备向用户设备发送该服务执行成功的信息。
采用本实现方式,在第一服务器无法提供服务时,对话处理设备可以触发第二服务器提供相应服务。这样能够减少对话处理设备与用户的对话轮次,及时为用户提供服务。
第五方面,本申请提供了一种对话处理方法,该方法包括:
接收用户输入的对话信息;
若所述对话信息中不包含能够确定服务的第一槽位类型对应的槽位信息,从本地应用或者服务器获取所述第一槽位类型对应的服务标识集,所述第一槽位类型指示必选槽位信息中用于指示服务标识的槽位信息所属的槽位类型,所述服务标识集包括所述第一槽位类型对应的多个服务标识;
提示所述服务标识集中的服务标识;
若所述用户从所述服务标识集中确定的目标服务标识,向所述本地应用或者所述服务器请求所述目标服务标识对应的服务;
提示所述服务执行成功的信息。
一种可能的实现方式中,在接收用户输入的对话信息之后,在从本地应用或者服务器获取所述第一槽位类型对应的服务标识集之前,包括:
若从所述对话信息中未解析出所述第一槽位类型对应的槽位信息,确定所述对话信息中不包含能够确定服务的第一槽位类型对应的槽位信息。
一种可能的实现方式中,在接收用户输入的对话信息之后,在从本地应用或者服务器获取所述第一槽位类型对应的服务标识集之前,包括:
解析所述对话信息得到所述第一槽位类型对应的槽位信息;
向所述本地应用或者所述服务器请求所述槽位信息对应的服务;
若从所述本地应用和所述服务器均请求服务失败,确定所述对话信息中不包含能够确定服务的第一槽位类型对应的槽位信息。
一种可能的实现方式中,所述从本地应用或者服务器获取所述第一槽位类型对应的服务标识集,包括:
从所述本地应用获取所述第一槽位类型对应的服务标识集;或者,
从所述服务器获取所述第一槽位类型对应的服务标识集;或者,
调用所述本地应用从所述服务器获取所述第一槽位类型对应的服务标识集。
一种可能的实现方式中,提示所述服务标识集中的服务标识包括:
提示所述服务标识集中的全部服务标识;或者,
提示链接所述服务标识集的入口标识;
若用户输入的打开指令,提示所述入口标识链接的页面,所述页面中包括所述服务标识集中的全部服务标识;或者,
提示菜单控件,所述菜单控件中提示所述服务标识集中的部分服务标识;
若用户输入的提示指令,切换所述菜单控件中所提示的服务标识。
第六方面,本申请提供了一种对话处理设备,该对话处理设备具有实现上述方法中无线接入网设备行为的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。在一个可能的设计中,上述无线接入网设备的结构中包括处理器和收发器,所述处理器被配置为处理该对话处理设备执行上述方法中相应的功能。所述收发器用于实现上述对话处理设备与用户设备和服务器之间的信息交互。所述对话处理设备还可以包括存储器,所述存储器用于与处理器耦合,其保存该对话处理设备必要的程序指令和数据。
第七方面,本申请提供了一种用户设备,该用户设备具有实现上述方法中用户设备行为的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。在一个可能的设计中,上述用户设备的结构中包括处理器和收发器,所述处理器被配置为处理该用户设备备执行上述方法中相应的功能。所述收发器用于实现上述用户设备与对话处理设备之间的通信。所述用户设备还可以包括存储器,所述存储器用于与处理器耦合,其保存该用户设备必要的程序指令和数据。
第八方面,本申请提供了一种人机交互系统,该人机交互系统包括用户设备、对话处理设备和服务器,该对话处理设备分别与该用户设备和该服务器进行通信,以完成上述第一方面、第二方面、第三方面、第一方面各种可能的实现方式、第二方面各种可能的实现方式中的任意一种实现方式所述的人机对话操作。其中,该对话处理设备是如第五方面所述的对话处理设备,该用户设备是如第六方面所述的用户设备。
第九方面,本申请提供了一种人机交互系统,该人机交互系统包括用户设备、对话处理设备、第一服务器和第二服务器,该对话处理设备分别与该用户设备、该第一服务器和该第二服务器进行通信,以完成上述第四方面所述的人机对话操作。其中,该对话处理设备是如第五方面所述的对话处理设备,该用户设备是如第六方面所述的用户设备。
第十方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任意可能的方法。
为解决现有人机对话对话轮次多的问题,本申请中,在服务器自定义的服务项目与相应槽位类型的槽位信息不对应的情况下,对话处理设备将服务器维护的服务标识反馈给用户,从而使得用户输入的相应槽位信息一定对应服务器中某项服务项目。采用本实现方式,不但能够及时向用户展示服务项目,而且能够避免用户与对话处理设备发起多轮对话,提高执行服务的效率,进而,提高用户的使用体验。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请提供的多轮次对话的一种实施方式的用户界面;
图2A是本申请提供的对话处理设备10的硬件结构的示意图;
图2B是本申请提供的对话处理设备10的软件架构的示意图;
图3A是本申请提供的用户设备20的硬件结构的示意图;
图3B是本申请提供的用户设备20的软件架构的示意图;
图4是本申请提供的一种操作界面的示意图;
图5A是本申请提供的用户界面的第一种实施方式的示意图;
图5B是本申请提供的用户界面的第二种实施方式的示意图;
图5C是本申请提供的用户界面的第三种实施方式的示意图;
图6是本申请提供的第一实施场景的用户界面示意图;
图7是本申请提供的第二实施场景的用户界面示意图;
图8是本申请提供的第三实施场景的用户界面示意图;
图9是本申请提供的第四实施场景的用户界面示意图;
图10是本申请提供的第五实施场景的用户界面示意图;
图11是本申请提供的人机交互系统的第一种实施方式的结构示意图;
图12是本申请提供的对话处理方法的第一种实施方式的方法流程图;
图13是本申请提供的对话处理方法的第二种实施方式的方法流程图;
图14是本申请提供的人机交互系统的第二种实施方式的结构示意图;
图15是本申请提供的对话处理方法的第四种实施方式的方法流程图;
图16是本申请提供的对话处理方法的第五种实施方式的方法流程图。
具体实施方式
下面将结合本申请中的附图,对本申请的技术方案进行清楚地描述。
本申请以下实施例中所使用的术语只是为了描述特定实施例的目的,而并非旨在作为对本申请的限制。如在本申请的说明书和所附权利要求书中所使用的那样,单数表达形式“一个”、“一种”、“所述”、“上述”、“该”和“这一”旨在也包括复数表达形式,除非其上下文中明确地有相反指示。还应当理解,尽管在以下实施例中可能采用术语第一、第二等来描述某一类对象,但所述对象不应限于这些术语。这些术语仅用来将该类对象的具体对象进行区分。例如,以下实施例中可能采用术语第一、第二等来描述服务器,但服务器不应限于这些术语。这些术语仅用来将所述不同的服务器进行区分。以下实施例中可能采用术语第一、第二等来描述的其他类对象同理,此处不再赘述。另外,本申请中使用的术语“和/或”是指并包含一个或多个所列出项目的任何或所有可能组合。
在对本申请的技术方案进行说明之前,首先对本申请的技术场景和本申请涉及的技术术语进行介绍。
本申请涉及对话处理设备与用户设备(user equipment,UE)之间,以及该对话处理设备与服务器之间的信息交互。其中,该用户设备是用户与对话处理设备进行对话的媒介。该用户设备将用户输入的信息传输至对话处理设备,并提示对话处理设备反馈的信息。该对话处理设备接收到用户设备发送的信息之后,可以请求服务器执行相应信息指示的服务。在从该服务器接收到该服务的执行结果后,该对话处理设备将该执行结果发送到用户设备。
其中,对话管理设备中可以维护意图、槽位类型和槽位信息。服务器中维护服务信息。以下结合示例对技术术语“意图”、“槽位类型”、“槽位信息”和“服务信息”的含义以及各技术术语之间的关系进行介绍。
意图(intent)是指用户的目的,用于指示用户的需求。对话处理设备可以从用户设备输入的信息中识别用户的意图。示例性的,用户设备的输入信息是“帮我预订A市飞到B市的机票”,对话处理设备可以从该输入信息中识别出用户的意图是“预订机票”。其中,意图的识别模型可以根据大量语料训练得到,该大量语料是采用不同表达方式表达该意图的语料。另外,对话处理设备可以维护一个或多个意图。
槽位信息(slot)是指意图内容的具体信息,也是用于触发特定服务的关键信息。槽位信息例如是用户设备输入信息中的关键词。示例性的,输入信息“帮我预订A市飞到B市的机票”中的“A市”和“B市”即为该输入信息的槽位信息。槽位信息可以包括必选槽位信息和可选槽位信息。必选槽位信息是指触发服务必不可少的槽位信息。可选槽位信息是指触发服务非必要的槽位信息。示例性的,触发服务“预订机票”的必选槽位信息包括起始地“A市”,起飞时间“XX年XX月XX日XX时XX分”和目的地“B市”。而该示例中,可选槽位信息例如是“B市所属国家”。
槽位类型(slot_type)用于标识槽位信息所属的分类。示例性的,槽位信息“A市”和槽位信息“B市”属于槽位类型“地址”,槽位信息“XX年XX月XX日XX时XX分”属于槽位类型“时间”。可以理解为,一个槽位类型对应标识一个特定的知识库。其中,根据槽位信息的属性,属于一种槽位类型的所有槽位信息可以以不同的结构形式存储在对话处理设备中。例如,槽位类型“地址”对应的槽位信息可以以城市名列表的形式存储在对话处理设备中。再如,槽位类型“时间”对应的槽位信息可以是时间的全部表达方式。通常,一个意图可以对应一个或者多个槽位类型。例如,意图“预订机票”对应槽位类型“地址”和槽位类型“时间”。
服务是指服务器有目的的执行的动作,以完成特定的服务项目。在服务器中,服务可以通过服务标识标示。本申请中,一个或者多个必选槽位信息可以确定一项服务。其中,该服务的服务标识对应该一个或者多个必选槽位信息中的一项槽位信息,或者,该服务的服务标识是该一个或者多个必选槽位信息中的一项槽位信息。如上述对必选槽位信息的介绍所述,槽位信息“A市”,槽位信息“B市”和槽位信息“XX年XX月XX日XX时XX分”确定服务“预订XX年XX月XX日XX时XX分从A市飞到B市的机票”。而机票预订服务器将“XX年XX月XX日XX时XX分从A市飞到B市”的一张机票与用户信息建立联系,且将该机票标记为被预订状态,即为执行预订“XX年XX月XX日XX时XX分从A市飞到B市”的机票的服务。其中,服务的表现形式可以是指令、程序或者进程。
对话处理设备是能够处理用户发送的语音或者文本,并向用户反馈语音或者文本的设备。一些实施例中,该对话处理设备承载在人机对话的机器人(robot,Bot)中,其中,该Bot独立于用户所使用的用户设备存在,并与该用户设备通过无线通信进行信息交互。在另一些实施例中,支持该对话处理的技能(skill)或者程序搭载在用户设备中。此种场景下,用户设备与对话处理是一台电子设备实体。
服务器可以是承载服务项目对应的程序的计算机,操作系统或者云服务器(elastic compute service,ECS)。该服务器所承载的程序在运行时,能够提供上述的服务项目,并且每项服务项目对应相应的服务标识。其中,该服务器所承载的程序可以是通过特定计算机程序语言编写的源代码,例如超文本标记语言(hyper text markup language,HTML),超文本预处理器(hypertext preprocessor,PHP),java脚本(JavaScript,JS)等。该源代码可以由浏览器或与浏览器功能类似的网页显示组件加载和显示为用户可识别的内容。基于此,相关技术人员可以通过修改该源代码的方式在该服务器中增加新的服务项目,或者删除已有的服务项目。
一些实施例中,用户设备可以是还包含其它功能诸如个人数字助理和/或音乐播放器功能的便携式电子设备,诸如手机、平板电脑、具备无线通讯功能的可穿戴电子设备(如智能手表)等。便携式电子设备的示例性实施例包括但不限于搭载 或者其它操作系统的便携式电子设备。上述便携式电子设备也可以是其它便携式电子设备,诸如具有触敏表面或触控面板的膝上型计算机(Laptop)等。还应当理解的是,在其他一些实施例中,上述电子设备也可以不是便携式电子设备,而是具有触敏表面或触控面板的台式计算机。
用户设备可以通过用户界面(user interface,UI)与对话处理设备进行信息交互。用户界面是应用程序或操作系统与用户之间进行交互和信息交换的介质接口,它实现信息的内部形式与用户可以接受形式之间的转换。应用程序的用户界面是通过java、可扩展标记语言(extensible markup language,XML)等特定计算机语言编写的源代码,界面源代码在终端设备上经过解析,渲染,最终呈现为用户可以识别的内容,比如图片、文字、按钮等控件。控件(control)也称为部件(widget),是用户界面的基本元素,典型的控件有工具栏(toolbar)、菜单栏(menu bar)、文本框(text box)、按钮(button)、滚动条(scrollbar)、图片和文本。界面中的控件的属性和内容是通过标签或者节点来定义的,比如XML通过<Textview>、<ImgView>、<VideoView>等节点来规定界面所包含的控件。一个节点对应界面中一个控件或属性,节点经过解析和渲染之后呈现为用户可视的内容。
本申请所述的对话是指“人机对话”,即用户与对话处理设备的信息交互。一些实施例中,用户可以通过用户设备向对话处理设备发送音频。另一些实施例中,用户可以通过用户设备向对话处理设备发送文本。相应的,一些实施例中,对话处理设备可以将执行结果转换成音频,然后,将该音频发送到用户设备。另一些实施例中,对话处理设备可以将执行结果转换成文本,然后,将该文本发送到用户设备。基于此,用户与对话处理设备进行音频交互,用户与对话处理设备进行文本交互,以及用户与对话处理设备中一方发送音频另一方发送文本的交互,均属于本申请“人机对话”的范畴。
结合现有的对话处理方法,若对话处理设备中预置的槽位信息不包含用户设备输入的必选槽位信息,该对话处理设备将无法确定待请求的第一服务,从而导致第一服务执行失败。若服务器所包含的服务中不包含对话处理设备请求的第一服务,该服务器也无法执行对话处理设备请求的第一服务,从而也会导致第一服务执行失败。而在第一服务执行成功的情况下,用户请求的服务才能够被提供。所以,对话处理设备向用户设备发送第一服务执行失败的信息后,该对话处理设备可能会接收到用户设备发送的触发第二服务的对话。其中,第二服务与第一服务的属性相同。
图1示意了多轮次对话的示例性用户界面。本实施例中,用户通过人机对话的方式请求车辆服务。如图1所示,用户向用户设备输入“帮我叫个顺风车去清华西门”。对话处理设备接收到用户设备发送的信息“帮我叫个顺风车去清华西门”之后,生成请求信息,并将该请求信息发送到目标叫车服务器。其中,该请求信息包括用户当前的地址,目的地“清华西门”和必选槽位信息“顺风车”。示例性的,该目标叫车服务器不提供“顺风车”服务,所以无法执行用户触发的服务。相应的,对话处理设备向用户设备发送“对不起,您所请求的服务无法执行”的信息。进而,用户可以继续向用户设备输入“那帮我叫个快车吧”,从而发起与对话处理设备的新一轮的对话。对话处理设备按照上述请求“顺风车”服务的流程,向目标叫车服务器请求“快车”服务。若目标叫车服务器也不提供“快车”服务,则用户与对话处理设备可能需要进行更多轮次的对话。这样不仅使得对话处理设备不断的执行对话处理操作,占用资源,而且使得用户的使用体验较差。
有鉴于此,本申请提供了一种对话处理方法及设备,在该对话处理设备中预置的槽位信息与用户输入的必选槽位信息不对应,和/或,该对话处理设备中预置的槽位信息与服务器所包含的服务不对应的情况下,该对话处理设备能够及时提供有效的信息和/或处理策略,不仅能够减少不必要的对话轮次,而且处理方式灵活,能够提高用户的使用体验。
以下介绍本申请中提供的示例性对话处理设备10。
图2A示出了对话处理设备10的结构示意图。
对话处理设备10包括处理器11,存储器12和收发器13。其中,处理器11,存储器12和收发器13通过总线接口连接。
可以理解的是,图2A示意的结构并不构成对对话处理设备10的具体限定。在本申请另一些实施例中,对话处理设备10可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器11可以是中央处理器(central processing unit,CPU),网络处理器(network processor,NP)或者CPU和NP的组合。处理器还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(application-specific integrated circuit,ASIC),可编程逻辑器件(programmable logic device,PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complex programmable logic device,CPLD),现场可编程逻辑门阵列(field-programmable gate array,FPGA),通用阵列逻辑(generic array logic,GAL)或其任意组合。
存储器12可以包括易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器也可以包括非易失性存储器(non-volatilememory),例如只读存储器(read-only memory,ROM),快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);存储器还可以包括上述种类的存储器的组合。
收发器13可以是有线收发器,无线收发器或其组合。有线收发器例如可以为以太网接口。以太网接口可以是光接口,电接口或其组合。无线收发器例如可以为无线局域网收发器,蜂窝网络收发器或其组合。
总线接口可以包括任意数量的互联的总线和桥,具体由处理器11代表的一个或多个处理器和存储器12代表的存储器的各种电路链接在一起。总线接口还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起。收发器13提供用于在传输介质上与各种其他设备(如用户设备,服务器)通信的单元。处理器11负责管理总线架构和通常的处理,存储器12可以存储处理器在执行操作时所使用的数据。
本领域技术任何还可以了解到本申请实施例列出的各种说明性逻辑块(illustrative logical block)和步骤(step)可以通过电子硬件、电脑软件,或两者的结合进行实现。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用,可以使用各种方法实现所述的功能,但这种实现不应被理解为超出本申请实施例保护的范围。
图2A所示的硬件架构涉及到执行对话处理的硬件部件。示例性的,收发器13可以用于执行对话处理设备与用户设备之间信息的收发,例如,接收用户设备发送的语音信息,向用户设备发送服务标识和执行结果等。该收发器13还可以用于对话处理设备与服务器之间信息的收发,例如,向服务器发送请求服务的信息,以及从服务器接收服务标识和执行结果等。存储器12用于存储指令和数据。在一些实施例中,存储器12可以保存处理器11刚用过或循环使用的指令或数据。如果处理器11需要再次使用该指令或数据,可从该存储器12中直接调用,从而避免重复存取。存储器12还用于存储一个或者多个意图信息,该一个或者多个意图信息中每个意图信息对应的一个或多个槽位类型,以及该一个或多个槽位类型中每个槽位类型所包含的槽位信息。处理器11调用存储器12中的指令和数据执行除信息收发之外的其他操作,例如,识别语音,解析语义,并根据解析后的语义确定用户意图和槽位信息等。
图2B是本申请的对话处理设备10的软件结构框图。
对话处理设备10的软件系统可以包括用于执行对话处理的各种功能的功能模块。例如,操作系统,收发模块,语音识别(automatic speech recognition,ASR)模块,语义理解(natural language understanding,NLU)模块,对话生成(natural languagegeneration,NLG)模块,槽位信息识别模块,请求信息生成模块等。
一些实施例中,对话处理设备10还包括编辑接口。该编辑接口被触发时,可以呈现编辑操作界面。
图2B所示的软件系统涉及到执行对话处理的功能模块,其中,操作系统驱动各模块执行操作。示例性的,收发模块接收到用户的对话语音后,ASR模块对语音进行识别,然后,NLU模块解析识别后语音的语义。进而,槽位信息识别模块可以从解析后的语义中识别槽位信息,请求信息生成模块生成请求服务的信息。在收发模块从服务器接收到服务的执行结果之后,NLG模块生成将执行结果生成语音,进而收发模块将所生成的语音发送到用户设备。
以下介绍本申请以下实施例中提供的示例性用户设备20。
图3A示出了用户设备20的结构示意图。
用户设备20可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本申请示意的结构并不构成对用户设备20的具体限定。在本申请另一些实施例中,用户设备20可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),控制器,存储器等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。在一些实施例中,用户设备20也可以包括一个或多个处理器110。
其中,控制器可以是用户设备20的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了用户设备20的效率。
在一些实施例中,处理器110可以包括一个或多个接口。该一个或多个接口中包括实现处理器110与音频模块170之间的通信的接口,以及连接处理器110与显示屏194的接口等。此处不再详述。
用户设备20的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
无线通信模块160可以提供应用在用户设备20上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),等无线通信的解决方案。在一些实施例中,用户设备20的天线2和无线通信模块160耦合,使得用户设备20可以通过无线通信技术与网络以及其他设备通信。
用户设备20的显示屏194,以及应用处理器等可以实现提示功能。显示屏194用于提示文本,菜单,音频控件等。
用户设备20可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音频播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。
扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。用户设备20可以通过扬声器170A收听对话处理设备发送的音频对话。
受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当用户设备20接收到音频信息时,用户可以通过将受话器170B靠近耳朵接听该音频信息的声音。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。用户设备20可以设置至少一个麦克风170C。
图3A示例性所示的用户设备20可以通过显示屏194显示提示以下各个实施例中所描述的各个用户界面。用户设备20可以通过麦克风170C向各个用户界面输入语音信息,还可以通过扬声器170A或者受话器170B播放用户界面所提示的音频。
用户设备20的软件系统可以采用分层架构。本申请以分层架构的Android系统为例,示例性说明用户设备20的软件结构。
图3B是本申请的用户设备20的软件结构框图。
分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将Android系统分为四层,从上至下分别为应用程序层,应用程序框架层,安卓运行时(Android runtime)和系统库,以及内核层。
应用程序层可以包括一系列应用程序包。
如图3B所示,应用程序包可以包括相机,图库,WLAN,蓝牙,音乐,视频,短信息等应用程序。
应用程序框架层为应用程序层的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。
如图3B所示,应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。
内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,文本等。
视图系统包括可视控件,例如显示文字的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。
媒体库支持多种常用的音频回放和录制等。媒体库可以支持多种音视频编码格式,例如:MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。
内核层是硬件和软件之间的层。内核层至少包含显示驱动,音频驱动,传感器驱动。
图3B所示的软件系统涉及到执行人机对话的应用呈现(如窗口管理器,视图系统),提供音频编解码的服务,以及内核和基本通信协议。
下面结合人机对话的场景,示例性说明用户设备20软件以及硬件的工作流程。
显示器121呈现人机对话的应用界面之后,麦克风170C接收用户的语音音频。相应的,内核层的音频驱动被触发,将用户的语音音频转换为电信号。无线通信模块160将该电信号发送到对话处理设备。无线通信模块160从对话处理设备接收音频之后,内核层的显示驱动调用窗口管理器显示该音频。压力传感器180A接收到播放音频的指令后,相应硬件中断被发给内核层。内核层的音频驱动触发音频模块170将音频解码,解码后的音频通过扬声器170A或者受话器170B播放。
结合上述对槽位信息与服务的关系的描述,必选槽位信息包括指示服务标识的槽位信息,例如,叫车服务中的“顺风车”,以及用于确定服务的常规槽位信息,例如,目的地“清华西门”。其中,服务器为用户提供的服务通常由相关服务人员自定义,所以,服务器所提供的服务可能会更改,例如,“顺风车”服务项目下架,“拼车”服务项目上架,从而导致不存在相应服务标识对应的服务。然而,一方面,用户可能无法及时获知服务器所提供的服务有哪些,另一方面,对话处理设备中维护的相关槽位信息可能也无法被及时更新,从而产生本申请上述的一些列问题。本申请以下将必选槽位信息中用于指示服务标识的槽位信息所属的槽位类型,称为“第一槽位类型”,将必选槽位信息中的常规槽位信息的槽位类型称为“第二槽位类型”。相应的,下文中引用的“第一槽位类型”均指必选槽位信息中用于指示服务标识的槽位信息所属的槽位类型,下文中引用的“第二槽位类型”均指必选槽位信息中的常规槽位信息的槽位类型,以下不再赘述。
其中,为了便于对话处理设备识别第一槽位类型和第二槽位类型,开发人员在设计对话处理设备过程中,可以按照上述必选槽位类型的属性,通过添加标签的方式标示出第一槽位类型。例如,开发人员可以为必选槽位类型中第一槽位类型添加标签“M”,而不为必选槽位类型中第一槽位类型添加任何标签。相应的,对话处理设备读取到携带标签“M”的槽位类型,则将该槽位类型确定为第一槽位类型。对话处理设备读取到未携带标签“M”的必选槽位类型,则将该必选槽位类型确定为第二槽位类型。
一些实施例中,开发人员在设计槽位类型相关的程序过程中,可以直接为第一槽位类型添加上标签。另一些实施例中,本申请可以提供编辑界面,开发人员可以在该编辑界面上通过勾选的方式为槽位类型分类。
图4示意了一种槽位类型的示例性编辑界面。该编辑界面示意的槽位列表中可以包括槽位类型名称,槽位类型对应的槽位信息库,必选槽位选项,提示选项和提问五个项目。其中,槽位类型名称用于为槽位类型命名,以标示相应槽位类型。槽位类型对应的槽位信息库可以是一个链接,用于链接同一行槽位类型对应的槽位信息库。提问指示相应行槽位类型的槽位信息对应的各种表达方式。必选槽位选项若被选中,则认为相应行的槽位类型被标注为必选槽位类型。相应的,该槽位类型被添加“必选”的标签。提示选项是本实施中用于标注是否是第一槽位类型的选项,基于此,同理,提示选项若被选中,则认为相应行的槽位类型被标注为第一槽位类型。相应的,该槽位类型被添加“提示”的标签。需要指出的,本实施例中,只有相应行的必选槽位选项被选中,该行的提示选项才能够被操作。另外,开发者还可以按照需求触发“+新增槽位类型”添加槽位类型,并且可以点击删除符号删除相应删除符号对应行的槽位类型。
根据上述描述,图4示意的实施例中,槽位类型“车辆类型”和槽位类型“目的地”是必选槽位类型,槽位类型“出发地”是可选槽位类型。必选槽位类型中“车辆类型”是第一槽位类型,“目的地”是第二槽位类型。
基于此,本申请的技术方案,在用户未输入第一槽位类型对应的槽位信息,或者,用户输入的第一槽位类型对应的槽位信息没有匹配的服务的情况下,对话处理设备将第一槽位类型对应的多个服务标识反馈给用户,以使用户从该多个服务标识中选择一个服务标识作为相应槽位信息,从而能够快速准确的触发一项服务。
一些实施例中,该多个服务标识可以是服务器中第一槽位类型对应的全部服务标识。另一些实施例中,该多个服务标识可以是服务器中第一槽位类型对应的部分服务标识。具体的,该多个服务标识可以是其中用户好评高于一定值的服务标识,例如,用户好评高于95%的服务项目对应的服务标识。或者,该多个服务标识可以是距离当前时间一定时间内更新的服务项目的服务标识,例如,该多个服务标识是最近3个月内更新的服务项目的服务标识。
可以理解的是,上述“多个服务标识”的选取条件,仅是本申请的部分示意性实施场景对应的选取条件,不构成对“多个服务标识”选取的具体限定。在另一些实施例中,“多个服务标识”的选取可以根据其他实施场景灵活设定。此处不再赘述。
以下结合示例性用户界面对本申请用户端的实施场景进行介绍。
第一实施场景:用户向用户设备输入对话信息,该对话信息中不包含第一槽位类型对应的槽位信息。然后,该用户设备可以从对话处理设备接收该第一槽位类型对应的全部服务标识。用户可以从该全部服务标识中选择一个服务标识作为第一槽位类型的槽位信息输入用户设备。
一些实施例中,第一槽位类型对应的全部服务标识可能是两个或者三个,例如,第一槽位类型是叫车服务中的“车辆类型”,该“车辆类型”对应“顺风车”,“专车”和“快车”三个服务标识。另一些实施例中,第一槽位类型对应的全部服务标识可能是十几个,例如,第一槽位类型是订餐服务中的“饮品”,该“饮品”对应“可乐”,“雪碧”,“豆浆”,“咖啡”,“果汁”,“牛奶”,“红茶”,“绿茶”,“奶茶”和“啤酒”等十个。而用户界面的尺寸有限,所以,一些实施例中,该全部服务标识的数量小于或者等于预设阈值时,用户设备可以在用户界面上提示该全部服务标识,如图5A示意的用户界面所示。其中,该预设阈值例如是5。另一些实施例中,该全部服务标识的数量大于该预设阈值时,用户设备可以以链接(link)的方式在用户界面上提示该全部服务标识,如图5B示意的用户界面所示。或者,用户设备可以以设置滚动条的菜单栏(menu bar),如图5C示意的用户界面所示。
可以理解的是,图5A至图5C示意的用户界面并不构成对本申请的具体限定。在本申请另一些实施例中,用户界面可以采用不同于上述描述的方式提示服务标识。此处不再详述。
进一步的,若对话信息中包括第二槽位类型对应的槽位信息,用户设备可以从对话处理设备接收到服务执行成功的信息。若对话信息中不包括第二槽位类型对应的槽位信息,用户设备可以从对话处理设备接收到要求用户输入相应槽位信息的对话,用户可以响应相应对话输入相应槽位信息,最终,用户设备可以从对话处理设备接收到服务执行成功的信息。
示例性的,如图6所示,用户向用户界面输入“帮我叫个车”,然后,用户设备提示“当前可用车辆类型包括:专车、快车和拼车,请问您想要哪一种?”。进而,用户选择“快车”。然后,用户界面可以提示“请问您要去哪里?”。在用户输入“清华西门”之后,用户界面提示信息“已经成功为您预约了从您的位置到清华西门的快车”。
第二实施场景:用户向用户设备输入对话信息,该对话信息中包含第一槽位类型对应的槽位信息,但是服务器中不包含该槽位信息对应的服务。进而,该用户设备可以从对话处理设备接收该第一槽位类型对应的多个服务标识。用户可以从该多个服务标识中选择一个服务标识作为第一槽位类型的槽位信息输入用户设备。其中,服务标识对应的用户界面如图5A至图5C所示。另外,用户后续的操作,以及用户设备后续提示的对话内容,与第一实施场景相似,此处不再赘述。
可以理解的是,该多个服务标识在用户界面上提示的方式,如图5A至图5C所述,此处不再赘述。
示例性的,如图7所示,用户向用户界面输入“帮我点一份咖啡”。本实施例中,例如咖啡已售完。那么,用户设备提示“当前有货的饮品包括:牛奶,可乐,雪碧,果汁,奶茶,豆浆,红茶,请问您想要哪一种?”。如图6所示,“饮品”对应的服务标识较多,所以,用户设备通过设置滚动条的菜单栏提示上述标识。用户可以通过上下滑动图6用户界面上的滚动条,查看“饮品”对应的标识。进而,用户例如选择了“红茶”。然后,用户界面提示信息“您所点的红茶15分钟后送到”。其中,本实施例所罗列的饮品种类可以是“当前有货的饮品”中的部分饮品。
第三实施场景:用户向用户设备输入对话信息,该对话信息中包含第一槽位类型对应的槽位信息。其中,对话处理设备中不包含该槽位信息,但是服务器中包含该槽位信息对应的服务。在用户输入第二槽位类型对应的槽位信息后,用户设备提示服务执行成功的信息。
示例性的,如图8所示,用户向用户界面输入“帮我订一下双层汉堡A套餐”。本实施例中,对话处理设备中不包含“双层汉堡A套餐”对应的槽位信息,但是,用户设备可以接收信息“您预订的双层汉堡A套餐半个小时候送到”。
第四实施场景:用户向用户设备输入对话信息,该对话信息中包含第一槽位类型对应的槽位信息。但是第一服务器中不包含该槽位信息对应的服务。在用户输入第二槽位类型对应的槽位信息后,用户设备提示服务由第二服务器执行成功的信息。
示例性的,如图9所示,用户向用户界面输入“查一下明天上午10点到11点香港飞纽约的航班”。本实施例中,第一服务器是维护国内航班数据的服务器,例如是某国内旅游平台的服务器。但是,用户设备可以接收信息“国际航班官方数据提示,明天上午10点到11点香港飞纽约的航班有AA8925,上午10:35分从香港起飞”。
第五实施场景:用户向用户设备输入对话信息,该对话信息中包含第一槽位类型对应的槽位信息,和/或,第一槽位类型对应的槽位信息,但是至少一条上述槽位信息指示的含义不清楚。进而,用户设备提示相应服务按照最佳方案被执行的信息。
其中,槽位信息指示的含义不清楚是指,该槽位信息可以指示多个不同的具体信息,从而导致对话处理设备根据该槽位信息无法触发确定的服务。例如,信息“帮我预订北京站附近的酒店”,其中,“北京站附近的酒店”至少包括“距离北京站500米以内的酒店”,“北京站附近的五星级酒店”以及“距离北京站500米以内的五星级酒店”等更具体的信息。所以,本实施例中“北京站附近”和“酒店”指示的含义均不清楚。另外,最佳方案是指对于用户来讲,最多、快、好和/或省的方案,例如,对于用户来讲行程最短的路线,或者,需要用户支付最少费用的套餐。
示例性的,如图10所示,用户向用户界面输入“帮我预订北京站附近的酒店”。用户设备接收并提示“为您预定了距离北京站400米的五星级酒店X酒店的标准间”。其中,该“X酒店”例如是距离北京站最近的五星级酒店。
可以理解的是,图6至图10示意的实施场景,仅是本申请的部分示意性实施场景,并不构成对本申请适用场景的限定。在另一些实施例中,本申请还可以适用于其他任何用户通过人机对话触发服务的其他任何场景。此处不再赘述。
根据上述对第一实施场景至第五实施场景的描述可知,采用本申请的技术方案,无论用户输入的对话信息是否包含第一槽位类型对应的槽位信息,无论用户输入的槽位信息与对话处理设备中预置的槽位信息的对应关系怎样,并且,无论用户输入的槽位信息与服务器提供的服务的对应关系怎样,该用户均能够获得想要的服务。这样不仅避免用户发起多轮次对话,而且,使得用户能够及时获知服务器所提供的服务,从而提高用户的使用体验。
上述第一实施场景至第五实施场景均是从用户端进行描述,而本申请实现上述各场景效果的执行过程,详见下文对对话处理设备端的描述。以下结合附图和上述各实施场景对本申请对话处理设备端的执行过程进行介绍。
图11示出了本申请人机对话系统第一种实施方式的架构图。本实施例中,对话处理设备中维护的意图、槽位类型和槽位信息等,与服务器支持的服务对应。用户可以通过用户设备与对话设备对话。其中,对话处理设备可以如图2A和图2B所述,用户设备可以如图3A和图3B所述。
结合图11示意的人机对话系统,图12示出了本申请对话处理方法的一种实施方式的方法流程图。图12示出的对话处理方法100包括如下步骤:
步骤S101,对话处理设备从用户设备接收对话信息。
其中,对话信息可以是音频或者文本。若该对话信息是音频,对话处理设备可以对该音频进行语音识别,然后,对语音识别后的内容进行语义理解,从而确定该对话信息对应的意图。若该对话信息是文本,对话处理设备可以对该文本进行语义理解,从而确定该对话信息对应的意图。进一步的,对话处理设备确定该意图对应的一个或者多个必选槽位类型,并确定该一个或多个必选槽位类型中每个必选槽位类型是第一槽位类型还是第二槽位类型。然后,对话处理设备可以识别对话信息中是否包括第一槽位类型对应的槽位信息。其中,本实施例所述的第一槽位类型是指,必选槽位信息中用于指示服务标识的槽位信息所属的槽位类型。本实施例所述的第二槽位类型是指,必选槽位信息中的常规槽位信息的槽位类型。
可选的,结合上述对第一槽位类型和第二槽位类型的描述,对话处理设备可以通过识别每个必选槽位类型是否包含预设标签,来确定该必选槽位类型是否是第一槽位类型。若该必选槽位类型包含预设标签,对话处理设备认为该必选槽位类型是第一槽位类型。若该必选槽位类型不包含预设标签,对话处理设备认为该必选槽位类型是第二槽位类型。其中,预设标签的设置过程以及该预设标签的内容,详见图4对应的实施例所述,此处不再详述。
可选的,对话处理设备可以识别对话信息中的一个或者多个关键词。进而,对应该一个或者多个关键词中每个关键词,一些实施例中,对话处理设备通过词向量模型确定该关键词所属的槽位类型。另一些实施例中,对话处理设备通过该关键词的表达格式确定该关键词所属的槽位类型,例如:根据关键词“12:30”的格式可以确定关键词“12:30”属于槽位类型“时间”。
步骤S102,若对话信息中不包含能够确定服务的第一槽位类型对应的槽位信息,对话处理设备从服务器获取第一槽位类型对应的服务标识集。
其中,服务标识集包括第一槽位类型对应的全部服务标识。
步骤S103,对话处理设备将服务标识集发送到用户设备。
其中,对话信息中不包含能够确定服务的第一槽位类型对应的槽位信息可以包括两种场景:场景一:对话信息中不包含第一槽位类型对应的槽位信息。场景二,对话信息中包含第一槽位类型对应的槽位信息,但是服务器中不包含该槽位信息对应的服务。基于此,为了避免用户多次输入第一槽位类型对应的槽位信息,在上述任一实施方式出现时,对话处理设备可以向服务器发送获取请求,该获取请求可以包括第一槽位类型的标识。然后,服务器响应该获取请求,将第一槽位类型对应的全部服务标识形成的服务标识集发送到对话处理设备。对话处理设备可以将该服务标识集发送到用户设备,以供用户选择任意服务标识作为该第一槽位类型对应的槽位信息。
对应情况一,对话处理设备若从对话信息中未获取到第一槽位类型对应的槽位信息,则对话处理设备确定对话信息中不包含第一槽位类型对应的槽位信息。
示例性的,如上述第一实施场景以及图6示意的实施例。此处不再详述。
对应情况二,对话处理设备从对话信息中获取到第一槽位类型对应的槽位信息,进而,对话处理设备根据该对话信息中包含的全部必选槽位信息,向服务器请求该全部必选槽位信息对应的服务。若从服务器接收到服务执行失败的信息,对话处理设备确定对话信息中不包含能够确定第一槽位类型对应的槽位信息。
示例性的,如上述第二实施场景以及图7示例的实施例,对话处理设备接收到对话信息“帮我点一份咖啡”之后,能够从对话信息“帮我点一份咖啡”中确定第一槽位类型对应的槽位信息“咖啡”。然后,对话处理设备向服务器请求“订咖啡”的服务。由于咖啡已售完,所以服务器执行服务“订咖啡”失败,并可以向对话处理设备发送执行失败的信息。在另一些实施例中,服务器执行服务“订咖啡”失败后,还可以直接将图7示意的有货的饮品发送到对话处理设备。
其中,用户设备提示所述全部服务标识的方式,如图5A至图5C所示,此处不再赘述。
步骤S104,对话处理设备接收用户设备发送的目标服务标识,并向服务器请求该目标服务标识对应的服务。
其中,该目标服务标识属于上述服务标识集。本申请中,该目标服务标识被用作第一槽位类型对应的槽位信息。
可以理解的是,在执行本步骤之前,对话处理设备已经获知第二槽位类型对应的槽位信息。对于对话处理设备获知第二槽位类型对应的槽位信息的执行过程,本实施例不再详述。
步骤S105,对话处理设备从服务器接收服务执行成功的信息,并将该服务执行成功的信息发送到用户设备。
由此可见,本申请的技术方案,若服务器自定义的服务项目与相应槽位类型的槽位信息不对应,对话处理设备将服务器维护的全部服务标识反馈给用户,从而使得用户输入的相应槽位信息一定对应服务器中某项服务项目。采用本实现方式,不但能够及时向用户展示服务项目,而且能够避免用户与对话处理设备发起多轮对话,提高执行服务的效率,进而,提高用户的使用体验。
结合图11示意的人机对话系统,图13示出了本申请对话处理方法的另一种实施方式的方法流程图。图13示意的对话处理方法200包括如下步骤:
步骤S201,对话处理设备从用户设备接收对话信息。
其中,对话信息中包含第一槽位类型对应的槽位信息。此外,本实施例中,对话处理设备接收到对话信息之后的操作与方法100中步骤S101的描述相似,此处不再赘述。
步骤S202,对话处理设备向服务器请求该槽位信息对应的服务。
其中,本实施例中,即使该槽位信息未包含在对话处理设备中预置的槽位信息中,该对话处理设备依然根据该槽位信息请求服务器提供相应服务。
步骤S203,若对话处理设备中不包含该槽位信息,且从服务器接收到该服务执行成功的信息,对话处理设备将该槽位信息添加到第一槽位类型对应的信息库中。
其中,若该槽位信息未包含在对话处理设备中预置的槽位信息中,且该服务被服务器执行成功,说明服务器中维护的服务项目被更新,但是对话处理设备中第一槽位类型对应的槽位信息未被及时更新。示例性的,结合图8示意的实施例,服务器端添加了新产品“双层汉堡A套餐”,但是对话处理设备未更新槽位类型“套餐”对应的信息库,则对话处理设备可以将“双层汉堡A套餐”对应的槽位信息添加到槽位类型“套餐”对应的信息库中。另外,本实施例中,“双层汉堡A套餐”对应的槽位信息可以是“双层汉堡A套餐”。
步骤S204,对话处理设备向用户设备发送该服务执行成功的信息。
可见,采用本实现方式,不但能够减少对话处理设备与用户的对话轮次,及时为用户提供服务,而且,对话处理设备能够及时更新该对话处理设备所维护的槽位信息。
其中,与方法200相对应的用户界面如上述第三实施场景以及图8所示,此处不再详述。
结合图11示意的人机对话系统,本申请还提供了对话处理方法的第三种实施方式。其中,对话处理方法300包括:
对话处理设备从用户设备接收对话信息,然后,确定该对话信息中全部必选槽位类型所对应的关键词。若该全部必选槽位类型对应的关键词中,任一关键词对应相应槽位类型中的至少两条槽位信息,对话处理设备确定该至少两条槽位信息中对应最优服务方案的特定槽位信息。进而,对话处理设备可以向服务器请求该特定槽位信息对应的服务,在从服务器接收到相应服务执行成功的信息之后,将相应服务执行成功的信息发送到用户设备。
其中,对应一个槽位类型中至少两条槽位信息的关键词,可以是包含多个具体槽位信息的概括性词汇。例如,“北京站附近的酒店”可以包括的槽位信息例如有,距离北京站1000米以内的全部的酒店的名称。再如,“清华”可以包括的槽位信息例如有,清华大学的所有门的地址。
本申请中,“最优服务方案”中“最优”的标准,根据服务内容以及用户的需求不同。例如,结合图10示意的实施例,“帮我预订北京站附近的酒店”最优的服务方案例如可以是距离北京站最近的酒店,也可以是距离北京站1000米以内星级最高的酒店。再如,对话信息“帮我叫个车去清华”,最优的服务方案例如可以是行驶路线最短的方案,也可以是费用最低的车辆。基于此,对话处理设备可以根据相应服务场景的计算模型确定。计算模型可以根据相应服务场景的大数据以及用户历史订单数据训练得到。此处不再详述。
进一步的,本实施例中,对话处理设备确定关键词对应的至少两条槽位信息后,可以分别判断每条槽位信息对应的服务是否是上述“最优服务方案”,若是,将该条槽位信息确定为特定槽位信息。
可见,采用本实现方式,对话处理设备可以在用户输入的关键词含义模糊的情况下,自动为用户提供相对较优的服务,不仅能够避免与用户多轮次对话,而且操作灵活,能够进一步提高用户的使用体验。
图14示出了本申请人机对话系统第二种实施方式的架构图。本实施例中,对话处理设备与第一服务器和第二服务器建立连接。用户可以通过用户设备与对话设备对话。其中,对话处理设备可以如图2A和图2B所述,用户设备可以如图3A和图3B所述。
结合图14示意的人机对话系统,图15示出了本申请对话处理方法的第四种实施方式的方法流程图。图15示出的对话处理方法400包括如下步骤:
步骤S401,对话处理设备从用户设备接收对话信息。
其中,对话信息中包含第一槽位类型对应的槽位信息。此外,本实施例中,对话处理设备接收到对话信息之后的操作与方法100中步骤S101的描述相似,此处不再赘述。
步骤S402,对话处理设备向第一服务器请求该槽位信息对应的服务。
步骤S403,若从第一服务器接收到的该服务执行失败的信息,对话处理设备向第二服务器请求该槽位信息对应的服务。
步骤S404,若从第二服务器接收到的该服务执行成功的信息,对话处理设备向用户设备发送该服务执行成功的信息。
其中,与方法400相对应的用户界面如上述第四实施场景以及图9所示,此处不再详述。
示例性的,本实施例中,第一服务器可以是提供定制化服务的服务器,第二服务器可以是与第一服务器提供的服务相关的官方服务器。结合图9示意的实施例,第一服务器例如是提供国内旅游服务的服务器,第二服务器例如是提供国内和国际航班数据的官方服务器。
可见,采用本实现方式,在第一服务器无法提供服务时,对话处理设备可以触发第二服务器提供相应服务。这样能够减少对话处理设备与用户的对话轮次,及时为用户提供服务。
在一种可选的实施方式中,上述图11至图15示意的实施例,对话处理设备可以是云端的方案,即对话处理设备为服务器,是与用户设备相对独立的实体。
在另一种可选的实施方式中,上述图11至图15示意的实施例,对话处理设备可以是端云结合的方案,即对话处理设备包括服务器和用户设备上的功能模块。例如对话处理设备可以包括服务器的Bot平台和用户设备上的应用。
在另一种可选的实施方式中,上述图11至图15示意的实施例,对话处理设备可以是端侧的方案,即对话处理设备是集成在于用户设备上的功能模块。例如,对话处理设备可以是用户设备上的应用。可以理解的是,对话处理设备可以是端侧的方案时,对话处理设备的硬件即为用户设备对应的硬件。
以下实施例提供一种用户设备的方法。该用户设备可以如图3A和图3B所述。
图16示出了本申请实施例的用户设备的对话处理方法的第五种实施方式的方法流程图。图16示出的对话处理方法500包括如下步骤:
步骤S501,接收用户输入的对话信息。
在一种可选的实施方式中,用户设备可以通过人机对话应用接收用户的对话信息,该对话信息中指示了用户想要预定的服务。人机对话应用可以是语音助手,也可以是其他安装的可以实现对话功能的应用。对话信息可以是语音信息,有可以是文字、手势等其他信息。
步骤S502,若所述对话信息中不包含能够确定服务的第一槽位类型对应的槽位信息,从本地应用或者服务器获取第一槽位类型对应的服务标识集。
在一种可实现方式中,若用户输入的对话信息中包含的第一槽位类型对应的槽位信息与当前能提供服务的应用的服务标识集不匹配,例如用户想要预定滴滴打车应用的顺风车服务,但是当前滴滴打车应用不提供顺风车服务了,那么人机对话应用可以从本地应用中查询第一槽位类型对应的服务标识集,供用户选择。该本地应用是能提供用户想预订服务的应用。该本地应用可以是第三方应用,如滴滴打车应用,不同于人机对话应用。
在另一种可实现方式中,若用户输入的对话信息中包含的第一槽位类型对应的槽位信息与当前能提供服务的应用的服务标识集不匹配,人机对话应用也可以从服务器查询第一槽位类型对应的服务标识集,供用户选择。该服务器可以是本地应用对应的服务器,也可以是人机对话应用对应的服务器。本申请不做限定。
类似的,若用户输入的对话信息中不包含的第一槽位类型对应的槽位信息,例如用户想要预定车出行,但是没有车辆类型的信息,而车辆类型为预定车的必要信息,那么人机对话应用可以从本地应用中或从服务器查询第一槽位类型对应的服务标识集,供用户选择。
步骤S503,提示服务标识集中的服务标识。
可选的,用户设备可以通过语音的方式提示用户,例如通过语音助手的语音播报;用户设备也可以通过文字提示用户,或通过多种方式结合提示用户,等。本申请不做限定
步骤S504,若用户从服务标识集中确定的目标服务标识,向本地应用或者服务器请求目标服务标识对应的服务。
与步骤S502的描述类似的,本步骤中,用户设备可以向本地应用,例如滴滴打车应用,请求服务,也可以直接向服务器请求服务。用户设备向服务器请求服务,可以是向人机对话应用对应的服务器发送请求,也可以是直接向本地应用对应的服务器请求。本申请此处不做限定。
步骤S505,提示服务执行成功的信息。
例如,用户如果是想预订车,此时可以提示用户车辆预订成功,等。
需要说明的是,上述各示例性的对话处理方法均基于一个总的技术构思,基于此,各示例性对话处理方法相同或者相似的部分,本申请不再赘述,各示例性对话处理方法的执行过程以及相应用户界面呈现的提示效果,可相互借鉴。
综上,本申请的技术方案,在服务器自定义的服务项目与相应槽位类型的槽位信息不对应的情况下,对话处理设备将服务器维护的服务标识反馈给用户,从而使得用户输入的相应槽位信息一定对应服务器中某项服务项目。采用本实现方式,不但能够及时向用户展示服务项目,而且能够避免用户与对话处理设备发起多轮对话,提高执行服务的效率,进而,提高用户的使用体验。
上述本申请提供的实施例中,分别从各个设备本身、以及从各个设备之间交互的角度对本申请实施例提供的对话处理方法的各方案进行了介绍。例如上述对话处理设备、用户设备和服务器,均包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的模块及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
具体实现中,对应上述各设备,本申请实施例还提供一种计算机存储介质,其中,设置在任意设备中计算机存储介质可存储有程序,该程序执行时,可实施包括图4至图15示意的各实施例中的部分或全部步骤。所述存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,简称:ROM)或随机存储记忆体(random access memory,简称:RAM)等。
本领域技术任何还可以了解到本申请实施例列出的各种说明性逻辑块(illustrative logical block)和步骤(step)可以通过电子硬件、电脑软件,或两者的结合进行实现。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用,可以使用各种方法实现所述的功能,但这种实现不应被理解为超出本申请实施例保护的范围。
应理解,在本申请实施例的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
显然,本领域的技术人员可以对本申请实施例进行各种改动和变型而不脱离本申请实施例的精神和范围。这样,倘若本申请实施例的这些修改和变型属于本申请实施例权利要求及其等同技术的范围之内,则本申请实施例也意图包含这些改动和变型在内。
Claims (30)
1.一种对话处理方法,其特征在于,所述方法包括:
对话处理设备从用户设备接收对话信息;
若所述对话信息中不包含能够确定服务的第一槽位类型对应的槽位信息,所述对话处理设备从服务器获取所述第一槽位类型对应的服务标识集,所述第一槽位类型指示必选槽位信息中用于指示服务标识的槽位信息所属的槽位类型,所述服务标识集包括所述第一槽位类型对应的多个服务标识;
所述对话处理设备将所述服务标识集发送到所述用户设备;
若从所述用户设备接收到目标服务标识,所述对话处理设备向所述服务器请求所述目标服务标识对应的服务,所述目标服务标识属于所述服务标识集;
若从所述服务器接收服务执行成功的信息,所述对话处理设备将所述执行成功的信息发送到所述用户设备。
2.如权利要求1所述的对话处理方法,其特征在于,对话处理设备从用户设备接收对话信息之后,从服务器获取所述第一槽位类型对应的服务标识集之前,包括:
若从所述对话信息中未解析出所述第一槽位类型对应的槽位信息,所述对话处理设备确定所述对话信息中不包含能够确定服务的第一槽位类型对应的槽位信息。
3.如权利要求1所述的对话处理方法,其特征在于,对话处理设备从用户设备接收对话信息之后,从服务器获取所述第一槽位类型对应的服务标识集之前,包括:
所述对话处理设备解析所述对话信息得到所述第一槽位类型对应的槽位信息;
所述对话处理设备向所述服务器请求所述槽位信息对应的服务;
若从所述服务器接收到服务执行失败的信息,所述对话处理设备确定所述对话信息中不包含能够确定服务的第一槽位类型对应的槽位信息。
4.如权利要求1所述的对话处理方法,其特征在于,对话处理设备从用户设备接收对话信息之后,将所述执行成功的信息发送到所述用户设备之前,还包括:
所述对话处理设备解析所述对话信息得到所述第一槽位类型对应的槽位信息;
所述对话处理设备向所述服务器请求所述槽位信息对应的服务;
若从所述服务器接收到所述服务执行成功的信息,且所述对话处理设备中不包含所述槽位信息,所述对话处理设备将所述槽位信息添加到所述第一槽位类型对应的信息库中。
5.如权利要求1至4中任一项所述的对话处理方法,其特征在于,对话处理设备从用户设备接收对话信息之前,包括:
所述对话处理设备接收添加标签指令,所述添加标签指令与所述第一槽位类型对应;
所述对话处理设备为所述第一槽位类型添加标签。
6.如权利要求1至4中任一项所述的对话处理方法,其特征在于,
所述对话信息是文本或者音频。
7.一种对话处理方法,其特征在于,所述方法包括:
用户设备向对话处理设备发送对话信息;
所述用户设备从所述对话处理设备接收并提示第一槽位类型对应的服务标识集,所述第一槽位类型指示必选槽位信息中用于指示服务标识的槽位信息所属的槽位类型,所述服务标识集包括所述第一槽位类型对应的多个服务标识;
所述用户设备向所述对话处理设备发送目标服务标识,所述目标服务标识属于所述服务标识集;
所述用户设备从所述对话处理设备接收服务执行成功的信息,所述服务是所述目标服务标识对应的服务。
8.如权利要求7所述的对话处理方法,其特征在于,所述用户设备提示第一槽位类型对应的服务标识集,包括:
所述用户设备提示所述服务标识集中的全部服务标识。
9.如权利要求7所述的对话处理方法,其特征在于,所述用户设备提示第一槽位类型对应的服务标识集,包括:
所述用户设备提示链接所述服务标识集的入口标识;
所述用户设备接收用户输入的打开指令;
所述用户设备提示所述入口标识链接的页面,所述页面中包括所述服务标识集中的全部服务标识。
10.如权利要求7所述的对话处理方法,其特征在于,所述用户设备提示第一槽位类型对应的服务标识集,包括:
所述用户设备提示菜单控件,所述菜单控件中提示所述服务标识集中的部分服务标识;
所述用户设备接收用户输入的提示指令;
所述用户设备切换所述菜单控件中所提示的服务标识。
11.一种对话处理设备,其特征在于,包括处理器,收发器,所述处理器用于与存储器耦合,读取存储器中的指令并根据所述指令执行操作,其中,
所述收发器,用于从用户设备接收对话信息;
所述处理器,用于在所述对话信息中不包含能够确定服务的第一槽位类型对应的槽位信息时,从服务器获取所述第一槽位类型对应的服务标识集,所述第一槽位类型指示必选槽位信息中用于指示服务标识的槽位信息所属的槽位类型,所述服务标识集包括所述第一槽位类型对应的多个服务标识;
所述收发器,还用于将所述服务标识集发送到所述用户设备;
所述处理器,还用于若从所述用户设备接收到目标服务标识,向所述服务器请求所述目标服务标识对应的服务,所述目标服务标识属于所述服务标识集;
所述收发器,还用于从所述服务器接收服务执行成功的信息,并将所述执行成功的信息发送到所述用户设备。
12.如权利要求11所述的对话处理设备,其特征在于,
所述处理器,还用于解析所述对话信息,并响应从所述对话信息中未解析出所述第一槽位类型对应的槽位信息,确定所述对话信息中不包含能够确定服务的第一槽位类型对应的槽位信息。
13.如权利要求11所述的对话处理设备,其特征在于,
所述处理器,还用于解析所述对话信息得到所述第一槽位类型对应的槽位信息,并向所述服务器请求所述槽位信息对应的服务;还用于响应从所述服务器接收到服务执行失败的信息,确定所述对话信息中不包含能够确定服务的第一槽位类型对应的槽位信息。
14.如权利要求11所述的对话处理设备,其特征在于,
所述处理器,还用于响应从所述服务器接收到所述服务执行成功的信息,且所述对话处理设备中不包含所述槽位信息,将所述槽位信息添加到所述第一槽位类型对应的信息库中。
15.如权利要求11所述的对话处理设备,其特征在于,
所述收发器,还用于接收添加标签指令,所述添加标签指令与所述第一槽位类型对应;
所述处理器,还用于为所述第一槽位类型添加标签。
16.一种用户设备,其特征在于,包括一个或多个处理器;
存储器;
多个应用程序;
以及一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中,所述一个或多个计算机程序包括指令,当所述指令被所述用户设备执行时,使得所述用户设备执行以下步骤:
向对话处理设备发送对话信息;
从所述对话处理设备接收并提示第一槽位类型对应的服务标识集,所述第一槽位类型指示必选槽位信息中用于指示服务标识的槽位信息所属的槽位类型,所述服务标识集包括所述第一槽位类型对应的多个服务标识;
向所述对话处理设备发送目标服务标识,所述目标服务标识属于所述服务标识集;
从所述对话处理设备接收服务执行成功的信息,所述服务是所述目标服务标识对应的服务。
17.如权利要求16所述的用户设备,其特征在于,
所述用户设备,还用于提示所述服务标识集中的全部服务标识。
18.如权利要求16所述的用户设备,其特征在于,
所述用户设备,还用于提示链接所述服务标识集的入口标识;接收用户输入的打开指令;并提示所述入口标识链接的页面,所述页面中包括所述服务标识集中的全部服务标识。
19.如权利要求16所述的用户设备,其特征在于,
所述用户设备,还用于提示菜单控件,所述菜单控件中提示所述服务标识集中的部分服务标识;接收用户输入的提示指令;并切换所述菜单控件中所提示的服务标识。
20.一种人机对话系统,其特征在于,包括服务器,如权利要求11至15中任一项所述的对话处理设备,以及如权利要求16至19中任一项所述的用户设备,其中,所述对话处理设备分别与所述用户设备和所述服务器进行信息交互。
21.一种对话处理方法,其特征在于,所述方法包括:
接收用户输入的对话信息;
若所述对话信息中不包含能够确定服务的第一槽位类型对应的槽位信息,从本地应用或者服务器获取所述第一槽位类型对应的服务标识集,所述第一槽位类型指示必选槽位信息中用于指示服务标识的槽位信息所属的槽位类型,所述服务标识集包括所述第一槽位类型对应的多个服务标识;
提示所述服务标识集中的服务标识;
若所述用户从所述服务标识集中确定的目标服务标识,向所述本地应用或者所述服务器请求所述目标服务标识对应的服务;
提示所述服务执行成功的信息。
22.如权利要求21所述的对话处理方法,其特征在于,在接收用户输入的对话信息之后,在从本地应用或者服务器获取所述第一槽位类型对应的服务标识集之前,包括:
若从所述对话信息中未解析出所述第一槽位类型对应的槽位信息,确定所述对话信息中不包含能够确定服务的第一槽位类型对应的槽位信息。
23.如权利要求21所述的对话处理方法,其特征在于,在接收用户输入的对话信息之后,在从本地应用或者服务器获取所述第一槽位类型对应的服务标识集之前,包括:
解析所述对话信息得到所述第一槽位类型对应的槽位信息;
向所述本地应用或者所述服务器请求所述槽位信息对应的服务;
若从所述本地应用和所述服务器均请求服务失败,确定所述对话信息中不包含能够确定服务的第一槽位类型对应的槽位信息。
24.如权利要求21所述的对话处理方法,其特征在于,所述从本地应用或者服务器获取所述第一槽位类型对应的服务标识集,包括:
从所述本地应用获取所述第一槽位类型对应的服务标识集;或者,
从所述服务器获取所述第一槽位类型对应的服务标识集;或者,
调用所述本地应用从所述服务器获取所述第一槽位类型对应的服务标识集。
25.如权利要求21所述的对话处理方法,其特征在于,提示所述服务标识集中的服务标识包括:
提示所述服务标识集中的全部服务标识;或者,
提示链接所述服务标识集的入口标识;
若用户输入的打开指令,提示所述入口标识链接的页面,所述页面中包括所述服务标识集中的全部服务标识;或者,
提示菜单控件,所述菜单控件中提示所述服务标识集中的部分服务标识;
若用户输入的提示指令,切换所述菜单控件中所提示的服务标识。
26.一种用户设备,其特征在于,包括一个或多个处理器;
存储器;
多个应用程序;
以及一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中,所述一个或多个计算机程序包括指令,当所述指令被所述用户设备执行时,使得所述用户设备执行以下步骤:
接收用户输入的对话信息;
若所述对话信息中不包含能够确定服务的第一槽位类型对应的槽位信息,从本地应用或者服务器获取所述第一槽位类型对应的服务标识集,所述第一槽位类型指示必选槽位信息中用于指示服务标识的槽位信息所属的槽位类型,所述服务标识集包括所述第一槽位类型对应的多个服务标识;
提示所述服务标识集中的服务标识;
若所述用户从所述服务标识集中确定的目标服务标识,向所述本地应用或者所述服务器请求所述目标服务标识对应的服务;
提示所述服务执行成功的信息。
27.如权利要求26所述的用户设备,其特征在于,
所述用户设备,还用于执行若从所述对话信息中未解析出所述第一槽位类型对应的槽位信息,确定所述对话信息中不包含能够确定服务的第一槽位类型对应的槽位信息。
28.如权利要求26所述的用户设备,其特征在于,
所述用户设备,还用于执行解析所述对话信息得到所述第一槽位类型对应的槽位信息;向所述本地应用或者所述服务器请求所述槽位信息对应的服务;若从所述本地应用和所述服务器均请求服务失败,确定所述对话信息中不包含能够确定服务的第一槽位类型对应的槽位信息。
29.如权利要求26所述的用户设备,其特征在于,
所述用户设备,还用于执行从所述本地应用获取所述第一槽位类型对应的服务标识集;或者,
从所述服务器获取所述第一槽位类型对应的服务标识集;或者,
调用所述本地应用从所述服务器获取所述第一槽位类型对应的服务标识集。
30.如权利要求26所述的用户设备,其特征在于,
所述用户设备,还用于执行提示所述服务标识集中的全部服务标识;还用于执行提示链接所述服务标识集的入口标识;若用户输入的打开指令,提示所述入口标识链接的页面,所述页面中包括所述服务标识集中的全部服务标识;还用于执行提示菜单控件,所述菜单控件中提示所述服务标识集中的部分服务标识;若用户输入的提示指令,切换所述菜单控件中所提示的服务标识。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910025807.3A CN111427992B (zh) | 2019-01-10 | 2019-01-10 | 对话处理方法及设备 |
PCT/CN2019/124441 WO2020143381A1 (zh) | 2019-01-10 | 2019-12-11 | 对话处理方法及设备 |
EP19909437.6A EP3889799A4 (en) | 2019-01-10 | 2019-12-11 | DIALOG PROCESSING METHOD AND DEVICE |
US17/371,377 US11977815B2 (en) | 2019-01-10 | 2021-07-09 | Dialogue processing method and device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910025807.3A CN111427992B (zh) | 2019-01-10 | 2019-01-10 | 对话处理方法及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111427992A true CN111427992A (zh) | 2020-07-17 |
CN111427992B CN111427992B (zh) | 2024-10-15 |
Family
ID=71520916
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910025807.3A Active CN111427992B (zh) | 2019-01-10 | 2019-01-10 | 对话处理方法及设备 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11977815B2 (zh) |
EP (1) | EP3889799A4 (zh) |
CN (1) | CN111427992B (zh) |
WO (1) | WO2020143381A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112201250A (zh) * | 2020-09-30 | 2021-01-08 | 中移(杭州)信息技术有限公司 | 一种语义分析方法、装置、电子设备及存储介质 |
CN113590750A (zh) * | 2021-07-30 | 2021-11-02 | 北京小米移动软件有限公司 | 人机对话方法、装置、电子设备及存储介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114117009A (zh) * | 2021-11-30 | 2022-03-01 | 深圳壹账通智能科技有限公司 | 基于对话机器人的子流程配置方法、装置、设备及介质 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107210033A (zh) * | 2015-01-30 | 2017-09-26 | 微软技术许可有限责任公司 | 基于众包来更新用于数字个人助理的语言理解分类器模型 |
CN107347109A (zh) * | 2016-05-06 | 2017-11-14 | 腾讯科技(深圳)有限公司 | 信息交互系统、方法和装置 |
CN107886948A (zh) * | 2017-11-16 | 2018-04-06 | 百度在线网络技术(北京)有限公司 | 语音交互方法及装置,终端,服务器及可读存储介质 |
US20180114528A1 (en) * | 2016-10-26 | 2018-04-26 | IPsoft Incorporated | Systems and methods for generic flexible dialogue management |
US9996531B1 (en) * | 2016-03-29 | 2018-06-12 | Facebook, Inc. | Conversational understanding |
US20180330721A1 (en) * | 2017-05-15 | 2018-11-15 | Apple Inc. | Hierarchical belief states for digital assistants |
US20180336896A1 (en) * | 2017-05-22 | 2018-11-22 | Genesys Telecommunications Laboratories, Inc. | System and method for extracting domain model for dynamic dialog control |
CN108874774A (zh) * | 2018-06-05 | 2018-11-23 | 浪潮软件股份有限公司 | 一种基于意图理解的服务调用方法和系统 |
CN108920497A (zh) * | 2018-05-23 | 2018-11-30 | 北京奇艺世纪科技有限公司 | 一种人机交互方法及装置 |
CN108932946A (zh) * | 2018-06-29 | 2018-12-04 | 百度在线网络技术(北京)有限公司 | 客需服务的语音交互方法和装置 |
CN109002501A (zh) * | 2018-06-29 | 2018-12-14 | 北京百度网讯科技有限公司 | 用于处理自然语言对话的方法、装置、电子设备以及计算机可读存储介质 |
CN109063035A (zh) * | 2018-07-16 | 2018-12-21 | 哈尔滨工业大学 | 一种面向出行领域的人机多轮对话方法 |
CN109101545A (zh) * | 2018-06-29 | 2018-12-28 | 北京百度网讯科技有限公司 | 基于人机交互的自然语言处理方法、装置、设备和介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8073681B2 (en) * | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US9466294B1 (en) * | 2013-05-21 | 2016-10-11 | Amazon Technologies, Inc. | Dialog management system |
US10460227B2 (en) * | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10262062B2 (en) * | 2015-12-21 | 2019-04-16 | Adobe Inc. | Natural language system question classifier, semantic representations, and logical form templates |
CN107665704B (zh) * | 2016-07-29 | 2020-09-11 | 科大讯飞股份有限公司 | 语音指令检测模型构建方法、检测方法及系统、人机交互方法及设备 |
CN109033223B (zh) * | 2018-06-29 | 2021-09-07 | 北京百度网讯科技有限公司 | 用于跨类型对话的方法、装置、设备以及计算机可读存储介质 |
-
2019
- 2019-01-10 CN CN201910025807.3A patent/CN111427992B/zh active Active
- 2019-12-11 WO PCT/CN2019/124441 patent/WO2020143381A1/zh unknown
- 2019-12-11 EP EP19909437.6A patent/EP3889799A4/en active Pending
-
2021
- 2021-07-09 US US17/371,377 patent/US11977815B2/en active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107210033A (zh) * | 2015-01-30 | 2017-09-26 | 微软技术许可有限责任公司 | 基于众包来更新用于数字个人助理的语言理解分类器模型 |
US9996531B1 (en) * | 2016-03-29 | 2018-06-12 | Facebook, Inc. | Conversational understanding |
CN107347109A (zh) * | 2016-05-06 | 2017-11-14 | 腾讯科技(深圳)有限公司 | 信息交互系统、方法和装置 |
US20180114528A1 (en) * | 2016-10-26 | 2018-04-26 | IPsoft Incorporated | Systems and methods for generic flexible dialogue management |
US20180330721A1 (en) * | 2017-05-15 | 2018-11-15 | Apple Inc. | Hierarchical belief states for digital assistants |
US20180336896A1 (en) * | 2017-05-22 | 2018-11-22 | Genesys Telecommunications Laboratories, Inc. | System and method for extracting domain model for dynamic dialog control |
CN107886948A (zh) * | 2017-11-16 | 2018-04-06 | 百度在线网络技术(北京)有限公司 | 语音交互方法及装置,终端,服务器及可读存储介质 |
CN108920497A (zh) * | 2018-05-23 | 2018-11-30 | 北京奇艺世纪科技有限公司 | 一种人机交互方法及装置 |
CN108874774A (zh) * | 2018-06-05 | 2018-11-23 | 浪潮软件股份有限公司 | 一种基于意图理解的服务调用方法和系统 |
CN108932946A (zh) * | 2018-06-29 | 2018-12-04 | 百度在线网络技术(北京)有限公司 | 客需服务的语音交互方法和装置 |
CN109002501A (zh) * | 2018-06-29 | 2018-12-14 | 北京百度网讯科技有限公司 | 用于处理自然语言对话的方法、装置、电子设备以及计算机可读存储介质 |
CN109101545A (zh) * | 2018-06-29 | 2018-12-28 | 北京百度网讯科技有限公司 | 基于人机交互的自然语言处理方法、装置、设备和介质 |
CN109063035A (zh) * | 2018-07-16 | 2018-12-21 | 哈尔滨工业大学 | 一种面向出行领域的人机多轮对话方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112201250A (zh) * | 2020-09-30 | 2021-01-08 | 中移(杭州)信息技术有限公司 | 一种语义分析方法、装置、电子设备及存储介质 |
CN112201250B (zh) * | 2020-09-30 | 2024-03-19 | 中移(杭州)信息技术有限公司 | 一种语义分析方法、装置、电子设备及存储介质 |
CN113590750A (zh) * | 2021-07-30 | 2021-11-02 | 北京小米移动软件有限公司 | 人机对话方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US11977815B2 (en) | 2024-05-07 |
CN111427992B (zh) | 2024-10-15 |
EP3889799A4 (en) | 2022-02-09 |
EP3889799A1 (en) | 2021-10-06 |
US20210334071A1 (en) | 2021-10-28 |
WO2020143381A1 (zh) | 2020-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10650816B2 (en) | Performing tasks and returning audio and visual feedbacks based on voice command | |
US10311877B2 (en) | Performing tasks and returning audio and visual answers based on voice command | |
US20210118463A1 (en) | Interactive server, control method thereof, and interactive system | |
US11874904B2 (en) | Electronic device including mode for using an artificial intelligence assistant function of another electronic device | |
US11494376B2 (en) | Data query method supporting natural language, open platform, and user terminal | |
US11977815B2 (en) | Dialogue processing method and device | |
US20220214894A1 (en) | Command execution method, apparatus, and device | |
CN107733722B (zh) | 用于配置语音服务的方法和装置 | |
WO2018133307A1 (zh) | 一种实现语音控制的方法和终端 | |
CN108701127A (zh) | 电子设备及其操作方法 | |
WO2022134110A1 (zh) | 一种语音理解方法及装置 | |
US20170295260A1 (en) | Platform for interaction via commands and entities | |
CN109036397A (zh) | 用于呈现内容的方法和装置 | |
CN108924030A (zh) | 电子装置、动态配置消息展示方式的方法及存储介质 | |
CN111614705B (zh) | 多终端设备之间服务决策分发的方法及系统 | |
WO2020165816A1 (en) | System and methods for providing personal assistance to the users | |
WO2022083328A1 (zh) | 一种内容推送方法、装置、存储介质和芯片系统 | |
CN114465975B (zh) | 一种内容推送方法、装置、存储介质和芯片系统 | |
CN112786022B (zh) | 终端、第一语音服务器、第二语音服务器及语音识别方法 | |
CN112908319B (zh) | 一种处理信息交互的方法及设备 | |
WO2022161132A1 (zh) | 语音播报方法及装置 | |
US20240111848A1 (en) | Electronic device and control method therefor | |
WO2023179454A1 (zh) | 服务调用方法及电子设备 | |
CN117894307A (zh) | 语音交互方法、语音交互装置和电子设备 | |
CN118331754A (zh) | 消息通知方法、装置、终端及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |