WO2021027198A1

WO2021027198A1 - 语音对话处理方法及装置

Info

Publication number: WO2021027198A1
Application number: PCT/CN2019/123937
Authority: WO
Inventors: 董鑫; 戴中原; 初敏; 顾寒
Original assignee: 苏州思必驰信息科技有限公司
Priority date: 2019-08-15
Filing date: 2019-12-09
Publication date: 2021-02-18
Also published as: US20220293089A1; EP4016330A4; JP7274043B2; EP4016330A1; CN110442701A; JP2022544969A; CN110442701B

Abstract

一种语音对话处理方法及装置，所述语音对话处理方法包括：确定待处理的用户语音所对应的语音语义（S201）；基于对话管理引擎确定针对所述语音语义的答复语句（S202），所述对话管理引擎的训练样本集是根据包括至少一个对话流的对话业务定制文件而构建的，且所述对话流包括具有设定顺序的多个对话节点；根据所确定的答复语句生成用于答复所述用户语音的客服语音（S203）。

Description

语音对话处理方法及装置

本公开要求在2019年08月15日提交中国专利局、申请号为201910752714.0的中国专利申请的优先权，以上申请的全部内容通过引用结合在本公开中。

技术领域

本申请属于智能客服技术领域，例如涉及一种语音对话处理方法及装置。

背景技术

人机交互是研究人和计算机系统之间的交互关系的技术。其中，AI(Artificial Intelligence,人工智能)对话系统是一种新型的人机交互方式，通过自然语音或自然语言形式进行输入输出。目前，AI对话系统已广泛应用于智能手机、智能家居、智能车载、智能客服等场景。

然而，不同的厂商所需求的对话业务流程和内容也都是存在区别的，所以各个厂商都需要定制属于自己的语音对话系统。目前，业务逻辑复杂性造就AI对话系统对话流程开发的复杂性，而导致了对话业务定制开发的低效。另外，当厂商需要对业务流程或内容进行维护修改时，可能需要重复开发或修改代码逻辑，不利于对业务流程的后期维护。

发明内容

本申请提供一种语音对话处理方法及装置，用于至少解决上述技术问题之一。

第一方面，本申请实施例提供一种语音对话处理方法，应用于语音客服服务端，该方法包括：确定待处理的用户语音所对应的语音语义；基于对话管理引擎确定针对所述语音语义的答复语句，所述对话管理引擎的训练样本集是根据包括至少一个对话流的对话业务定制文件而构建的，且所述对话流包括具有设定顺序的多个对话节点；根据所确定的答复语句生成用于答复所述用户语音的客服语音。

第二方面，本申请实施例提供一种语音客服方法，应用于对话流程设计服务端，该方法包括：获取自对话流程设计客户端的对话流程设计请求，并确定对应所述对话流程设计请求的至少一个对话流，其中所述对话流包括具有设定顺序的多个对话节点；根据所述至少一个对话流，生成对话业务定制文件；发送所述对话业务定制文件至语音客服服务端以构建关于对话管理引擎的训练样本集，使得所述语音客服服务端基于所述对话管理引擎执行语音客服服务。

第三方面，本申请实施例提供一种语音对话处理装置，包括：语音语义确定单元，用于确定待处理的用户语音所对应的语音语义；对话管理引擎调用单元，用于基于对话管理引擎确定针对所述语音语义的答复语句，所述对话管理引擎的训练样本集是根据包括至少一个对话流的对话业务定制文件而构建的，且所述对话流包括具有设定顺序的多个对话节点；客服语音生成单元，用于根据所确定的答复语句生成用于答复所述用户语音的客服语音。

第四方面，本申请实施例提供一种语音对话处理装置，包括：对话流确定单元，用于获取自对话流程设计客户端的对话流程设计请求，并确定对应所述对话流程设计请求的至少一个对话流，其中所述对话流包括具有设定顺序的多个对话节点；业务定制文件生成单元，用于根据所述至少一个对话流，生成对话业务定制文件；业务定制文件发送单元，用于发送所述对话业务定制文件至语音客服服务端以构建关于对话管理引擎的训练样本集，使得所述语音客服服务端基于所述对话管理引擎执行语音客服服务。

第五方面，本申请实施例提供一种电子设备，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述方法的步骤。

第六方面，本申请实施例提供一种存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述方法的步骤。

本申请利用对话管理引擎来确定用户语音的语音语义所对应的答复语句，这里对话管理引擎的训练样本集是根据包括至少一个具有设定顺序的多个对话节点的对话流的对话业务定制文件来构建的；对话业务定制文件制作简单方便，不涉及代码逻辑的修改，使得对话业务定制开发的更简便和高效，另外，通过更换业务定制文件就能够完成对对话管理引擎的迭代操作，便于对业务流程的后期维护。

附图说明

为图1为本申请实施例的语音对话处理方法的流程图；

图2示出了应用于语音客服服务端的语音对话处理方法在一示例中的流程图；

图3示出了根据本实施例对话流程在一示例中的示意图。

图4示出了适于应用本申请一实施例的语音对话处理方法的示例性的原理架构示意图；

图5示出了本申请实施例的线上对话系统中对话管理引擎进行建模的原理流程图；

图6示出了应用于对话流程设计服务端的语音客服方法的流程图；

图7A-7Z分别示出了在搭建对话流程的过程中对话设计客户端在不同状态下的截图界面的示例；

图8示出了本申请实施例的语音对话处理装置的结构框图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

在本申请中，“模块”、“系统”等等指应用于计算机的相关实体，如硬件、硬件和软件的组合、软件或执行中的软件等。详细地说，例如，元件可以、但不限于是运行于处理器的过程、处理器、对象、可执行元件、执行线程、程序和/或计算机。还有，运行于服务器上的应用程序或脚本程序、服务器都可以是元件。一个或多个元件可在执行的过程和/或线程中，并且元件可以在一台计算机上本地化和/或分布在两台或多台计算机之间，并可以由各种计算机可读介质运行。元件还可以根据具有一个或多个数据包的信号，例如，来自一个与本地系统、分布式系统中另一元件交互的，和/或在因特网的网络通过信号与其它系统交互的数据的信号通过本地和/或远程过程来进行通信。

最后，还需要说明的是，在本文中，术语“包括”、“包含”，不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

在本文中，术语“引擎”表示对至少一个算法模型进行封装之后所形成的结构。术语“意图”表示针对语句的归类，例如用户语句“再见”应归类于意图“会话结束”。

如图1所示，本申请实施例的语音对话处理方法的示例性流程，其涉及在多个执行主体之间的通信交互，例如在对话流程设计客户端10、对话流程设计服务端20、语音客服服务端30和用户终端40之间进行通信交互。这里，客户端和用户终端可以是任意类型的诸如笔记本电脑、平板电脑、手机之类的终端设备，例如其可以是安装有特定应用程序的终端设备。另外，服务端可表示中心通信网络架构中的服务器或对等通信网络架构中的用于提供服务的主节点设备。

参照图1，本申请实施例的语音对话处理方法的流程100包括：

步骤101、由对话流程设计客户端10生成对话流程设计请求。

其中，对话流程设计客户端10接收厂商语音业务人员的用户操作，并根据用户操作生成对应的对话流程设计请求。这里，对话流程设计请求可以是针对已设计的一个或多个的对话流的请求指令，对话流可以包括具有设定顺序的多个对话节点。

示例性地，厂商语音业务人员可通过在对话流程设计客户端10上绘制针对一个对话项目的多个对话流程，并根据此多个对话流程生成对话流程设计请求。另外，对话流程设计客户端可被配置成具有可供用户拖拽调整对话节点框的图形化界面，这样厂商语音业务人员可通过拖拽对话节点框来较快捷地实现构建对话流程。

步骤102、对话流程设计客户端10将对话流程设计请求发送至对话流程设计服务端20。

步骤103、对话流程设计服务端20根据对话流程设计请求生成对话业务定制文件。

示例性地，对话流程设计服务端20解析对话流程设计请求中的至少一个对话流，并自动识别对话流中的各个有序节点的节点内容和节点类型。进而生成对话业务定制文件，该对话业务定制文件可以是json文件。这里，对话流程设计服务端20可通过与对话流程设计客户端10之间的多次交互操作(例如多个对话流程设计请求)来确定对话业务定制文件。

步骤104、对话流程设计服务端20发送对话业务定制文件至语音客服服务端30。

步骤105、语音客服服务端30基于对话业务定制文件训练对话管理引擎。

这里，语音客服服务端30可基于对话业务定制文件来生成针对对话管理引擎的训练样本集，进而利用训练样本集来训练对话管理引擎。

步骤106、用户终端40发送用户语音至语音客服服务端30。

这里，在对话管理引擎被训练完成之后就可以上线了。此时，上线之后的语音客服服务端可接收自用户终端的用户语音，以为用户提供客服服务。

步骤107、语音客服服务端30确定针对用户语音的客服语音。

，语音客服服务端30可确定待处理的用户语音所对应的语音语义，例如通过应用ASR(Automatic Speech Recognition,语音识别)功能模块和NLU(Natural Language Understanding，自然语言理解)功能模块来实现。然后，语音客服服务端30通过调用对话管理引擎来确定针对语音语义的答复语句，并根据所确定的答复语句生成用于答复用户语音的客服语音。在利用答复语句生成客服语音的过程中，语音客服服务端30可以是通过应用NLG(Natural Language Generation，自然语言生成)功能模块和TTS(Text To Speech，语音合成)功能模块来实现的。

步骤108、语音客服服务端30将客服语音发送至用户终端40。

可理解的是，上述步骤106-108可重复进行，以多次提供客服语音，直到为用户提供满意的客服服务为止。另外，图1所示的实施例仅用作示例，上述流程中的部分步骤是可选的或可替换的，例如语音客服服务端还可以是在本地直接得到对话业务定制文件。

如图2所示，本申请实施例的应用于语音客服服务端30的语音对话处理方法在一示例中的流程，包括：

步骤201、确定待处理的用户语音所对应的语音语义。

步骤202、基于对话管理引擎确定针对语音语义的答复语句，其中对话管理引擎包括通用对话管理模型和业务对话管理模型。

步骤203、根据所确定的答复语句生成用于答复用户语音的客服语音。

在本实施例中，对话管理引擎包括用于处理通用会话的通用对话管理模型和用于处理专门业务的业务对话管理模型。通用对话管理模型可以在不同的多个业务客户服务项目中进行共享以复用代码逻辑，提高了客服系统的开发效率。

在智能客服的呼叫中心场景中，电话中往往伴随有“嗯”、“啊”、“喂”此类特定的电话口语回复。并且，电话过程中常伴有用户进行问候、打断、重复、澄清等通用型的会话请求。然而，目前的AI对话系统在呼叫中心场景下很少对此类对此类会话请求进行优化处理，导致客服服务过程过于僵硬而影响用户体验。

通过本申请实施例中的通用对话管理模型，能够较佳地处理上述会话请求，并提高用户体验。确定用户语音的语音语义所指示的用户意图，并当用户意图属于通用意图集时，使用通用对话管理模型执行针对所述用户意图的通用对话操作，其中通用对话操作包括以下中的任意一种：转人工操作、重复播报操作、退出对话操作和叹词处理操作。

如表1示出了针对通用意图集中各个通用意图所执行的通用对话操作中所涉及的相关流程的描述。

表1

在一些实施方式中，当用户意图不属于通用意图集时，使用业务对话管理模型执行包括以下的业务操作来确定答复语句：确定与用户意图相对应的目标对话流，以及根据所确定的目标对话流中的对话节点来确定答复语句。

示例性地，对话节点包括对话起始节点、用户沟通节点、用户信息识别节点和填槽节点。其中，对话起始节点是对话流起始的节点，用户沟通节点为客服需要与用户进行沟通的节点，用户信息识别节点可以是通过(例如通过函数)将其他服务API调用对用户信息进行识别，填槽节点是将最终所收集的信息添加至对应的槽位的节点。这样，基于用户意图能够调用目标对话流中的相应对话节点，从而执行相应的操作来确定答复语句。

结合如图3所示的对话流程，当用户语音被接入至客服平台时，通过对话流程中的用户信息识别节点直接识别是否是老用户，若是老用户，则直接询问用户是否在历史快递记录中所指示的地点下单；若是新用户，则可调用对话流程中的用户沟通节点来询问用户发货地点。进而，利用语音识别技术得到用户反馈语音中的发货地址之后，完成填槽操作，若未识别或填槽不成功，则可以转人工客服处理。

如图4所示，适于应用本申请一实施例的语音对话处理方法的示例性的原理架构，整体上包括线上AI对话系统和线下DM(Dialogue Management,对话管理)定制平台。这里，线上AI对话系统的接入服务模块通过sip协议(session initiation protocol,会话初始协议)与用户客户端的call center进行对接，从而为用户客户端所指示的用户提供服务。

另外，线上AI对话系统内部有几个大的组件模块，包括：ASR模块、NLU模块、NLG模块、TTS模块和DM引擎。其中，DM引擎分为业务DM和通用DM。

在本申请实施例中，针对呼叫中心场景，将AI对话系统中的对话管理分成业务型DM和通用型DM两种。业务DM是与具体业务流程相关对话管理。与之对应的，通用DM设计是为了处理人机对话过程通用的对话管理，让整个对话更加顺畅，但不涉及具体的业务场景和知识。

在呼叫中心场景的电话对话中，有很多比较通用的对话，比如问候、打断、重复、澄清等。这些都可采用通用DM来处理这些通用型的会话逻辑，如表1所示。可理解的是，通用DM可以作为一个通用模块，嵌入到任何业务DM的前侧，使对话更接近人与人之间的聊天沟通的效果。这种设计既可以改进用户体验，又可以节省不同场景DM的定制开发成本。

如图5所示，本申请实施例的线上AI对话系统中DM引擎进行建模的原理过程。为了实现业务DM的快速定制，将对话管理中的关键要素进行建模，使得业务型对话流程可用json文件方式描述。具体描述如下：

场景(Bot)：即对话机器人，可以理解为某个客服项目。

对话流(Flow):完成某个任务的对话流程。一个项目由一个或多个对话流组成。

对话节点(Node):对话流中某一轮对话，提供不同节点类型，如起始节点、用户沟通节点、填槽节点、用户信息识别节点等。起始节点为该对话流的起始节点，用户沟通节点为一轮对话，填槽节点是为了收集槽位而设计的特殊节点以补全槽位信息，用户信息识别节点是把其他服务API访问进行了封装。

具体操作(Operation)：对话节点中所涉及的具体操作，如该对话节点回复给用户的话术、用到的解析用户说话的意图列表、跳转逻辑等。因此，在确定对话节点之后，可以直接依据对话节点所指示的内容和类型来进行相应的具体操作。

结合如图4的示例，通过线下DM定制平台设计出了对话流程。线下DM定制平台包括对话设计工具和对话测试工具，提供图形化拖拽的方式进行对话设计和测试。线下DM定制平台会把项目的对话生成json格式的文件，线上DM引擎加载该文件，生产AI对话机器人，服务于线上流量。

如图6所示，应用于对话流程设计服务端的语音客服方法的流程，通过对话流程设计服务端与对话流程设计客户端的交互操作实现快速定制对话流程和构建相应的对话业务定制文件。该方法包括：

步骤601、获取自对话流程设计客户端的对话流程设计请求，并确定对应对话流程设计请求的至少一个对话流，其中对话流包括具有设定顺序的多个对话节点。

步骤602、根据至少一个对话流，生成对话业务定制文件。

步骤603、发送对话业务定制文件至语音客服服务端以构建关于对话管理引擎的训练样本集，使得语音客服服务端基于对话管理引擎执行语音客服服务。

对话流程设计客户端被配置成具有可供用户拖拽调整对话节点框的图形化界面，其中对话流程设计客户端10用于接收厂商开发人员针对所述图形化界面的用户操作而生成对应的所述对话流程设计请求。这样，厂商可以通过开发客户端图形化界面拖拽方式生产业务型对话流，以生产相应的json文件，快速完成业务型DM定制。

以下将结合如图7A-7Z中的开发客户端截图来描述在图3所示的具体快递客服场景下在对话流程设计客户端10中进行DM搭建的示例。

如图7A所示，点击左侧创建新场景部分，弹出对话框，输入“场景名称”和“场景描述”。这里，一个场景可以表示一个客服项目。

接着，如图7B所示，新建对话流。点击已创建的场景“快递”，进入如下页面，左侧依次为：1)场景配置：包括场景名称、产品ID、全局变量添加、通用流程添加等；2)对话流定制：在此页面绘制对话流；3)意图定制：添加用户话语所解析出的意图；4)对话测试：对搭建的模型进行测试；5)bot调试：对由可视化工具搭建出的对话流模型自动生成的代码进行修改和调试。

当点击对话流程配置，进入如图7C所示的用户界面。此时，新建对话流“取件地址收集”，点击进入，界面如下图，右侧提供四种节点，分别为：开始节点(或起始节点)、对话节点(或用户沟通节点)、函数节点(或用户信息识别节点)和填槽节点。

在节点配置的过程中，首先添加开始节点所对应的“开场白”(如图7D)。结合如图7E所示的界面截图，具体操作包括：1)点击右侧“开始节点”，在面板添加开始节点；2)点击开始节点上的“编辑”；3)通过“基本设置”：修改节点名称为“开场白”，添加话术文本“你好，这里是xx快递”；4)通过“跳转连线”：添加新的跳转逻辑-跳转至，选择下一节点进行跳转(需添加下一节点后才可跳转，可先跳过此步)。

接着，添加函数节点--“新老客户判断”。如图7F所示，点击“函数节点”，在面板创建函数节点。包括：1)点击编辑，在基本设置中，修改节点名称为“新老客户判断”，添加函数描述“判断此手机号是否拥有历史订单”，并保存；2)完成由开始节点-函数节点跳转：选择“新老客户判断”进行跳转，可以看到对话节点之间的连线出现；3)转至“场景配置”，新建两个全局变量：phone_num、historical_orders。同时在此页面可以添加通用DM流程，如图7G，勾选我们可能用到的通用流程；4)返回对话流，如图7H，编辑“函数节点”基本设置，输入参数设置“phone_num”，返回参数设置“historical_orders”。

接着，如图7I-M所示，添加用户沟通节点--“此地点下单？”和“询问发货地”。1)添加两个用户沟通节点，通过“编辑-基本设置-节点名称”重命名为“此地点下单？” 和“询问发货地”。2)编辑“新老客户判断”，设置跳转连线。点击下方“添加新的跳转逻辑”，条件设置“全局变量历史订单状态isNotEmpty”跳转至“此地点下单？”；再次点击“添加新的跳转逻辑”，条件设置“全局变量历史订单状态isEmpty”跳转至“询问发货地”。保存。3)如图7J所示，转到“意图定制”，添加新的业务意图，新增业务意图“是”、“否”。4)返回对话流程定制，编辑对话节点“此地点下单？”，输入话术文本“系统查询到近期您曾经在XX市XX区XX路XX号寄送过物品，是否仍使用此地址？”。5)添加业务意图“是”、“否”。6)编辑“询问发货地”，添加话术“请问您的发货地点是哪儿？”。

接着，如图7N和7O所示，添加对话节点--“收到地址信息”。1)添加播报对话节点“收到地址信息”；修改基本设置，添加话术“好的，请您耐心等待快递小哥上门取件，祝您生活愉快”；修改“播放后操作”为“对话完成”，保存。2)编辑“此地点下单？”设置跳转连线：条件设置“业务意图contains确定”跳转至“收到地址信息”；条件设置“业务意图contains否定”跳转至“询问发货地”。

接着，如图7P-7U所示，添加填槽节点--“填槽：发货地”。1)添加填槽节点，重命名“填槽：发货地”，编辑对话节点“询问发货地”，设置跳转连线，跳转至“填槽：发货地”。2)转到场景配置，新建全局变量“发货_城市”、“发货_区县”、“发货_街道”。3)转到意图定制，新建意图“只说了街道”、“只说了区县”、“只说了城市”、“只说了街道和区县”、“只说了区县和城市”、“只说了街道和城市”。4)返回对话流定制，编辑“填槽：发货地”，点击基本设置，添加以上六个意图。5)编辑“填槽：发货地”，点击槽位配置，添加新的槽位变量，依次设置：需要填槽的变量-发货_城市、必选、意图-“只说了街道”、“只说了区县”、“只说了街道和区县”；输入反问话术“你在哪个城市呢？”；最多反问次数设置为2。6)同样的方式添加另外两个槽位变量。

接着，如图7V和7W，添加对话节点--“转人工”。包括1)添加对话节点“转人工”。设置话术，选择对话完成。2)编辑“填槽：发货地”，点击跳转连线。如果条件“填槽成功”跳转至“收到地址信息”；如果条件“填槽失败”跳转至“转人工”。由此，搭建完成以上对话流。最终所的到的对话流的结果如图7X所示。

接着，保存本地。如图7Y，可以通过“场景配置-DM文件导出”将json文件保存至本地。

在一些实施方式中，还可以是在本地对所构建的对话流进行测试，以保证功能的完善性。如图7Z所示，通过“点击对话测试-测试发布-输入用户语音”来执行测试操作。

在本申请实施例中，提供了快速定制平台，可以大大加速呼叫中心智能语音开发速度，大大降低开发成本，从而影响整个呼叫中心行业的智能化水平。

如图8所示，本申请一实施例的语音对话处理装置800，包括语音语义确定单元810、对话管理引擎调用单元820和客服语音生成单元830。这里，语音语义确定单元810用于确定待处理的用户语音所对应的语音语义；对话管理引擎调用单元820用于基于对话管理引擎确定针对所述语音语义的答复语句，所述对话管理引擎的训练样本集是根据包括至少一个对话流的对话业务定制文件而构建的，且所述对话流包括具有设定顺序的多个对话节点；客服语音生成单元830用于根据所确定的答复语句生成用于答复所述用户语音的客服语音。

上述本申请实施例的装置可用于执行本申请中相应的方法实施例，并相应的达到上述本申请方法实施例所达到的技术效果，这里不再赘述。

本申请实施例中可以通过硬件处理器(hardware processor)来实现相关功能模块。

另一方面，本申请实施例提供一种存储介质，其上存储有计算机程序，该程序被处理器执行如上在服务器所执行的技能本地管理方法的步骤。

上述产品可执行本申请实施例所提供的方法，具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本申请实施例所提供的方法。

本申请实施例的客户端以多种形式存在，包括但不限于:

(1)移动通信设备:这类设备的特点是具备移动通信功能，并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机，以及低端手机等。

(2)超移动个人计算机设备:这类设备属于个人计算机的范畴，有计算和处理功能，一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等，例如iPad。

(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod)，掌上游戏机，电子书，以及智能玩具和便携式车载导航设备。

(4)其他具有数据交互功能的电子装置。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

Claims

一种语音对话处理方法，应用于语音客服服务端，该方法包括：

确定待处理的用户语音所对应的语音语义；

基于对话管理引擎确定针对所述语音语义的答复语句，所述对话管理引擎的训练样本集是根据包括至少一个对话流的对话业务定制文件而构建的，且所述对话流包括具有设定顺序的多个对话节点；

根据所确定的答复语句生成用于答复所述用户语音的客服语音。
根据权利要求1所述的方法，其中，所述对话管理引擎包括通用对话管理模型和业务对话管理模型，

其中，基于对话管理引擎确定针对所述语音语义的答复语句包括：

确定所述语音语义所指示的用户意图；以及

当所述用户意图属于通用意图集时，使用所述通用对话管理模型执行针对所述用户意图的通用对话操作，其中所述通用对话操作包括以下中的任意一种：转人工操作、重复播报操作、退出对话操作和叹词处理操作。
根据权利要求2所述的方法，还包括：

当所述用户意图不属于所述通用意图集时，使用所述业务对话管理模型执行包括以下的业务操作来确定所述答复语句：

确定与所述用户意图相对应的目标对话流；

根据所确定的目标对话流中的对话节点来确定所述答复语句。
根据权利要求1所述的方法，其中，所述对话业务定制文件是从对话流程设计服务端所获得的，以及所述对话流程设计服务端被配置成通过与对话流程设计客户端交互以构建所述对话业务定制文件。
根据权利要求1-4所述的方法，其中，所述对话节点包括：对话起始节点、用户沟通节点、用户信息识别节点和填槽节点。
一种语音客服方法，应用于对话流程设计服务端，该方法包括：

获取自对话流程设计客户端的对话流程设计请求，并确定对应所述对话流程设计请求的至少一个对话流，其中所述对话流包括具有设定顺序的多个对话节点；

根据所述至少一个对话流，生成对话业务定制文件；

发送所述对话业务定制文件至语音客服服务端以构建关于对话管理引擎的训练样本集，使得所述语音客服服务端基于所述对话管理引擎执行语音客服服务。
根据权利要求6所述的方法，其中，所述对话流程设计客户端被配置成具有可供用户拖拽调整对话节点框的图形化界面，其中所述对话流程设计客户端用于接收针对所述图形化界面的用户操作而生成对应的所述对话流程设计请求。
一种语音对话处理装置，包括：

语音语义确定单元，用于确定待处理的用户语音所对应的语音语义；

对话管理引擎调用单元，用于基于对话管理引擎确定针对所述语音语义的答复语句，所述对话管理引擎的训练样本集是根据包括至少一个对话流的对话业务定制文件而构建的，且所述对话流包括具有设定顺序的多个对话节点；

客服语音生成单元，用于根据所确定的答复语句生成用于答复所述用户语音的客服语音。
一种电子设备，包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述方法的步骤。
一种存储介质，其上存储有计算机程序，其中，该程序被处理器执行时实现权利要求1-7中任一项所述方法的步骤。