CN109063100A - 一种数据处理方法、服务器及电子设备 - Google Patents

一种数据处理方法、服务器及电子设备 Download PDF

Info

Publication number
CN109063100A
CN109063100A CN201810843628.6A CN201810843628A CN109063100A CN 109063100 A CN109063100 A CN 109063100A CN 201810843628 A CN201810843628 A CN 201810843628A CN 109063100 A CN109063100 A CN 109063100A
Authority
CN
China
Prior art keywords
information
business scenario
user
user intent
answer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810843628.6A
Other languages
English (en)
Inventor
杨双涛
胡长建
赵国光
张鹏起
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201810843628.6A priority Critical patent/CN109063100A/zh
Publication of CN109063100A publication Critical patent/CN109063100A/zh
Pending legal-status Critical Current

Links

Abstract

本申请提供了一种数据处理方法、服务器及电子设备,所述方法在获得待解答问题后,对问题数据进行语义解析以及对语义解析所得的业务场景信息及用户意图信息进行配对,并进一步基于配对结果确定与问题相匹配的答案信息。由此可见,本申请在以用户意图信息作为解答答案的确定依据的同时,还结合考虑了业务场景信息,相比于问题域,业务场景信息包括更多的与用户提问需求相关联的信息,可辅助执行主体更准确地定位用户提问需求,进而便于针对待解答问题给出准确度更高的解答答案,尤其在面对复杂语境的用户问题处理时本申请的优势尤为突出,从而本申请进一步优化了智能客服系统的问题解答性能,提升了智能客服系统的问题解答的准确度。

Description

一种数据处理方法、服务器及电子设备
技术领域
本发明属于基于大数据的智能化推理、决策技术领域,尤其涉及一种数据处理方法、服务器及电子设备。
背景技术
智能客服系统是在大规模知识处理基础上发展起来的一种面向行业应用的自动服务系统,其为企业与海量用户之间的沟通建立了一种基于自然语言处理的快捷有效的沟通途径。
针对用户问题自动给予相匹配的解答答案,是智能客服系统一种主要的应用形式之一,现有的智能客服系统为解决用户问题并给出相应答案,一般是首先对用户问题进行问题域(指问题所属的领域范围或类别,如音乐、教育、军事等)划分及用户意图识别,进而根据用户问题所属的问题域及对应的用户意图对用户问题进行解答。其中,所划分的问题域用于作为用户意图的辅助信息以辅助智能客服系统针对用户意图给予相应解答。
然而,问题域的划分粒度往往较粗,如上文所述的音乐、教育、军事等,导致不能为答案的制定提供较好的参考作用,影响问题解答的准确度;且复杂语境的用户输入(即用户问题)往往存在着跨域问题,这就会造成问题域分类困难,而一旦问题域分类错误,便易导致无法正确解答。
发明内容
有鉴于此,本发明的目的在于提供一种数据处理方法、服务器及电子设备,用于进一步优化智能客服系统的问题解答性能,提升智能客服系统的问题解答的准确度。
为此,本发明公开如下技术方案:
一种数据处理方法,包括:
获得待解答问题的问题数据;
对所述问题数据进行语义解析,得到第一数量的业务场景信息及第二数量的用户意图信息;
对所述业务场景信息及所述用户意图信息进行配对,得到业务场景信息与用户意图信息间的配对结果;
基于所述业务场景信息与用户意图信息间的配对结果,确定与所述待解答问题相匹配的答案信息,并反馈所述答案信息。
上述方法,优选的,所述对所述问题数据进行语义解析,得到第一数量的业务场景信息及第二数量的用户意图信息,包括:
基于预先训练的语义解析模型对所述问题数据进行语义解析,得到业务场景信息集及用户意图信息集;所述业务场景信息集包括第一数量的业务场景信息,所述用户意图信息集包括第二数量的用户意图信息;
其中,所述语义解析模型为:基于预定的自然语言处理技术利用预先标注了业务场景信息及用户意图信息的多条历史问题数据训练的模型。
上述方法,优选的,所述对所述业务场景信息及所述用户意图信息进行配对,得到业务场景信息与用户意图信息间的配对结果,包括:
基于预定的推理规则,对所述业务场景信息及所述用户意图信息进行配对,得到第三数量的用户意图信息与业务场景信息二元组、和/或第四数量的未匹配成功的业务场景信息、和/或第五数量的未匹配成功的用户意图信息;
其中,所述推理规则包括至少一个业务场景信息与至少一个用户意图信息间的关联关系。
上述方法,优选的,所述基于所述业务场景信息与用户意图信息间的配对结果,确定与所述待解答问题相匹配的答案信息,包括:
查询预定的知识库,获得与所述第三数量的用户意图信息与业务场景信息二元组中的每个二元组相匹配的答案信息;和/或,
查询预定的知识库,获得与所述第四数量的未匹配成功的业务场景信息中的每个业务场景信息相匹配的答案信息;和/或,
查询预定的知识库,获得与所述第五数量的未匹配成功的用户意图信息中的每个用户意图信息相匹配的答案信息;所述知识库中包括与至少一个用户意图信息与业务场景信息二元组对应的答案信息、和/或与至少一个业务场景信息对应的答案信息、和/或与至少一个用户意图信息对应的答案信息。
上述方法,优选的,所述业务场景信息包括产品状态和/或功能的描述信息;
所述推理规则中包括的至少一个业务场景信息与至少一个用户意图信息间的关联关系为:根据业务知识和/或业务规则预先确定的业务场景信息与用户意图信息间的关联关系;
所述方法还包括:
对数据处理过程中产生的日志信息进行分析,并基于分析结果优化所述推理规则;所述日志信息包括原始问题数据,与原始问题数据相匹配的配对结果信息、答案信息以及使用者对答案信息的反馈信息。
一种服务器,包括:
存储器,用于存储至少一组指令集;
处理器,用于调用并执行所述存储器中的所述指令集,通过执行所述指令集进行以下操作:
获得待解答问题的问题数据;
对所述问题数据进行语义解析,得到第一数量的业务场景信息及第二数量的用户意图信息;
对所述业务场景信息及所述用户意图信息进行配对,得到业务场景信息与用户意图信息间的配对结果;
基于所述业务场景信息与用户意图信息间的配对结果,确定与所述待解答问题相匹配的答案信息,并反馈所述答案信息。
上述服务器,优选的,所述存储器还用于存储预先训练的语义解析模型;
所述处理器对所述问题数据进行语义解析,得到第一数量的业务场景信息及第二数量的用户意图信息,具体包括:
基于所述语义解析模型对所述问题数据进行语义解析,得到业务场景信息集及用户意图信息集;所述业务场景信息集包括第一数量的业务场景信息,所述用户意图信息集包括第二数量的用户意图信息;
其中,所述语义解析模型为:基于预定的自然语言处理技术利用预先标注了业务场景信息及用户意图信息的多条历史问题数据训练的模型。
上述服务器,优选的,所述存储器还用于存储预定推理规则的规则信息;
所述处理器对所述业务场景信息及用户意图信息进行配对,得到业务场景信息与用户意图信息间的配对结果,具体包括:
基于所述推理规则,对所述业务场景信息及用户意图信息进行配对,得到第三数量的用户意图信息与业务场景信息二元组、和/或第四数量的未匹配成功的业务场景信息、和/或第五数量的未匹配成功的用户意图信息;
其中,所述推理规则包括至少一个业务场景信息与至少一个用户意图信息间的关联关系。
上述服务器,优选的,所述存储器还用于存储预定的知识库;
所述处理器基于所述业务场景信息与用户意图信息间的配对结果,确定与所述待解答问题相匹配的答案信息,具体包括:
查询所述知识库,获得与所述第三数量的用户意图信息与业务场景信息二元组中的每个二元组相匹配的答案信息;和/或,
查询所述知识库,获得与所述第四数量的未匹配成功的业务场景信息中的每个业务场景信息相匹配的答案信息;和/或,
查询所述知识库,获得与所述第五数量的未匹配成功的用户意图信息中的每个用户意图信息相匹配的答案信息;所述知识库中包括与至少一个用户意图信息与业务场景信息二元组对应的答案信息、和/或与至少一个业务场景信息对应的答案信息、和/或与至少一个用户意图信息对应的答案信息。
一种电子设备,包括:
存储器,用于存储至少一组指令集;
处理器,用于调用并执行所述存储器中的所述指令集,通过执行所述指令集进行进行操作:
获得待解答问题的问题数据;
对所述问题数据进行语义解析,得到第一数量的业务场景信息及第二数量的用户意图信息;
对所述业务场景信息及所述用户意图信息进行配对,得到业务场景信息与用户意图信息间的配对结果;
基于所述业务场景信息与用户意图信息间的配对结果,确定与所述待解答问题相匹配的答案信息,并反馈所述答案信息。
根据以上方案可知,本申请提供的数据处理方法、服务器及电子设备,在获得待解答问题的问题数据后,对所述问题数据进行语义解析,以及对语义解析所得的业务场景信息及用户意图信息进行配对,并进一步基于业务场景信息与用户意图信息间的配对结果,确定与待解答问题相匹配的答案信息。由此可见,针对待解答问题,本申请在以用户意图信息作为解答答案的确定依据的同时,还结合考虑了问题数据中所携带的业务场景信息,相比于问题域,与用户意图信息相匹配的业务场景信息往往能够包括更多的与用户提问需求相关联的信息,从而,可辅助执行主体更准确地定位用户意图信息所对应的用户提问需求,进而便于针对待解答问题给出准确度更高的解答答案,尤其在面对复杂语境的用户问题处理时本申请的优势尤为突出,从而本申请方案进一步优化了智能客服系统的问题解答性能,提升了智能客服系统的问题解答的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本申请提供的一种数据处理方法实施例一的流程图;
图2是本申请提供的一种数据处理方法实施例二的流程图;
图3是本申请实施例二提供的基于本申请方法的智能客服系统的一种处理逻辑示意图;
图4是本申请提供的一种数据处理方法实施例三的流程图;
图5是本申请实施例三提供的基于本申请方法的智能客服系统的另一种处理逻辑示意图;
图6是本申请提供的一种服务器实施例四的结构示意图;
图7是本申请提供的一种电子设备实施例七的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了进一步优化智能客服系统的问题解答性能,提升智能客服系统的问题解答的准确度,本申请提供了一种数据处理方法、服务器及电子设备,以下将通过多个实施例对本申请的数据处理方法、服务器及电子设备进行说明。
参考图1,是本申请提供的一种数据处理方法实施例一的流程图,该数据处理方法可应用于服务器或电子设备中,例如具体应用于部署在服务器或电子设备中的智能客服系统等,所述服务器可以是单独部署环境或集群部署环境(即服务器集群)中的服务器,所述电子设备可以是但不限于各类型的通用或专用计算机设备。如图1所示,本实施例中,所述数据处理方法包括如下步骤:
步骤101、获得待解答问题的问题数据。
所述待解答问题的问题数据,可以是用户在相应应用场景中基于特定操作所提交的用户问题数据。
比如,可以是用户在利用其终端设备(移动设备或计算机设备等)所调出的某产品/某类产品的智能客服系统上所输入并提交的针对该产品/该类产品的问题数据等,示例性地,如可以是用户在某手机答疑系统上输入并提交的以下问题:I want update myphone,but i cannot turn it on。
步骤102、对所述问题数据进行语义解析,得到第一数量的业务场景信息及第二数量的用户意图信息。
发明人经研究发现,待解答问题的问题数据,除了包括能够反映用户提问需求的用户意图信息,往往还包括一些业务场景信息,如关于产品状态、功能等的相关性描述信息等,尤其是对于复杂语境的用户问题该情况更为明显,而这些信息可作为用户意图的背景信息来辅助执行主体更为精准地确定或定位待解答问题所表明的用户提问需求,以上文中的“I want update my phone,but i cannot turn it on”这一问题为例,该问题中所包括的用户意图信息为“update phone”,业务场景信息为“cannot turn it on”,根据上述的用户意图信息,可知用户提问需求为“update phone”,而结合其对应的业务场景信息“cannotturn it on”,可进一步获知用户的更准确的提问需求为“Update phone if cannot turnit on(如何在无法开机的情况下升级系统)”。
鉴于此,本申请在以用户意图信息作为解答答案的确定依据的同时,还结合考虑问题数据中所携带的业务场景信息,所述业务场景信息可以包括但不限于待解答问题的问题数据中包括的关于产品状态、功能等的相关性描述信息,如以上示例中的“cannot turnit on”。
从而,在获得待解答问题的问题数据后,可进一步对所述问题数据进行语义解析,以解析出其中所包括的业务场景信息及用户意图信息,从而得到第一数量的业务场景信息及第二数量的用户意图信息,进而为后续该待解答问题的答案制定提供依据。
需要说明的是,实际应用中,基于待解答问题的复杂程度,可能会解析出较少数量的业务场景信息及用户意图信息,也可能会解析出较多数量的业务场景信息及用户意图信息(如复杂语境中的复杂问题),且所解析出的业务场景信息与用户意图信息的数量关系并不确定,两者的数量可能一致,也可能并不一致,或者,还可能仅解析出一定数量的用户意图信息未解析出业务场景信息、仅解析出一定数量的业务场景信息未解析出用户意图信息等等。
步骤103、对所述业务场景信息及所述用户意图信息进行配对,得到业务场景信息与用户意图信息间的配对结果。
待解答问题中的某一特定业务场景信息往往与该问题中的某一特定用户意图信息具有较强的关联,能够作为该特定用户意图信息的背景信息,而与该问题中的其他用户意图信息之间则可能关联性不强,鉴于此,为有效利用业务场景信息的参考价值,使其尽可能大的在答案制定中发挥辅助作用,在对待解答问题进行语义解析,得到第一数量的业务场景信息及第二数量的用户意图信息后,可进一步对解析所得的各个业务场景信息及各个用户意图信息进行配对,以使得将关联性较强的业务场景信息及用户意图信息进行匹配,而关联性较弱的业务场景信息及用户意图信息配则不进行匹配。
步骤104、基于所述业务场景信息与用户意图信息间的配对结果,确定与所述待解答问题相匹配的答案信息,并反馈所述答案信息。
在对解析所得的各业务场景信息及各用户意图信息进行配对的基础上,最终可基于待解答问题中业务场景信息与用户意图信息间的配对结果情况,结合考虑用户意图信息以及与其相匹配的业务场景信息(如产品的状态、功能方面的相关描述等)对待解答问题中所反映的用户提问需求进行精准定位(如前文的“Update phone if cannot turn iton”),进而确定出与之相匹配的答案信息,并反馈给用户。
根据以上方案可知,本申请提供的数据处理方法,针对待解答问题,在以用户意图信息作为解答答案的确定依据的同时,还结合考虑了问题数据中所携带的业务场景信息,相比于问题域,与用户意图信息相匹配的业务场景信息往往能够包括更多的与用户提问需求相关联的信息,从而,可辅助执行主体更准确地定位用户意图信息所对应的用户提问需求,进而便于针对待解答问题给出准确度更高的解答答案,尤其在面对复杂语境的用户问题处理时本申请的优势尤为突出,从而本申请方案进一步优化了智能客服系统的问题解答性能,提升了智能客服系统的问题解答的准确度。
参考图2,是本申请提供的一种数据处理方法实施例二的流程图,本实施例继续对所述数据处理方法进行进一步详述,如图2所示,本实施例中,所述数据处理方法包括如下步骤:
步骤201、获得待解答问题的问题数据。
所述待解答问题的问题数据,可以是用户在相应应用场景中基于特定操作所提交的用户问题数据。
比如,可以是用户在利用其终端设备(移动设备或计算机设备等)所调出的某产品/某类产品的智能客服系统上所输入并提交的针对该产品/该类产品的问题数据等,示例性地,如可以是用户在某手机答疑系统上输入并提交的以下问题:I want update myphone,but i cannot turn it on。
步骤202、基于预先训练的语义解析模型对所述问题数据进行语义解析,得到业务场景信息集及用户意图信息集;所述业务场景信息集包括第一数量的业务场景信息,所述用户意图信息集包括第二数量的用户意图信息。
其中,所述语义解析模型为:基于预定的自然语言处理技术利用预先标注了业务场景信息及用户意图信息的多条历史问题数据训练的模型。
所述自然语言处理技术可以为文本分类技术、信息抽取技术等。
为了做到精确的用户语义解析,本实施例具体采用在大数据基础上所训练的语义解析模型实现从用户提交的待解答问题中解析出其所包括的业务场景信息及用户意图信息。
具体地,在模型训练阶段,需要首先获得多条历史问题数据作为训练样本集,并针对训练样本集中的各条历史问题数据进行人工标注,其中,在标注时需要精确标注出历史问题数据中的每一个用户意图和业务场景,每个历史问题数据的标注信息可能包括零个或一个/多个用户意图标注信息,以及零个或一个/多个业务场景标注信息。
在完成历史问题数据的信息标注后,可基于标注有用户意图信息及业务场景信息的各训练样本开始进行语义解析模型的训练,在训练模型时,语义解析模型可以采用文本分类模型,如采用SVM(Support Vector Machine,支持向量机)、CNN(ConvolutionalNeural Network,卷积神经网络)或者LSTM(Long Short-Term Memory,长短期记忆网络)等;也可以选用信息抽取模型,如CRF(conditional random field algorithm,条件随机场算法)、LSTM+CRF等,或者还可以将文本分类模型和信息抽取模型进行有效融合。
在完成模型训练的基础上,后续,可将用户提交的问题数据作为模型的输入信息输入模型,并由模型对其进行处理后输出相应的用户意图信息集I={i1,i2,...,in},及业务场景信息集B={b1,b2,...,bm},其中n表示用户意图信息集中所包括的用户意图信息的数量,m表示业务场景信息集中所包括的业务场景信息的数量。例如,对于输入的问题数据“I want update my phone,but i cannot turn it on”,模型可输出用户意图信息集{“update phone”}和业务场景信息集{“cannot turn on”},而对于输入的问题数据“Icannot receive any call,some tell me i can fix it by updating to androidnougat version,please tell me how to do it”,模型相对应地可输出用户意图信息集{“update phone”}和业务场景信息集{“cannot receive call”}。
对于模型输出的用户意图信息集及业务场景信息集,可分别对二者进行归一化处理,以使得用户意图信息和业务场景信息标准化,进而使得能够被执行主体如服务器等有效识别。
步骤203、基于预定的推理规则,对所述业务场景信息及所述用户意图信息进行配对,得到第三数量的用户意图信息与业务场景信息二元组、和/或第四数量的未匹配成功的业务场景信息、和/或第五数量的未匹配成功的用户意图信息。
其中,所述推理规则包括至少一个业务场景信息与至少一个用户意图信息间的关联关系;所述至少一个业务场景信息与至少一个用户意图信息间的关联关系为:根据业务知识和/或业务规则预先确定的业务场景信息与用户意图信息间的关联关系。
也即,本实施例预先根据实际业务应用中的业务知识和/或业务规则,确定各种不同的业务场景信息(如产品状态、功能等的描述信息)与各种不同的用户意图信息间的关联关系,所述关联关系可以包括但不限于表示关联性较强的强关联、表示关联性较弱的弱关联、或表示不具备关联性的无关联等等,并以此为基础预先制定一套推理规则。
示例性地,例如,根据业务知识可知,当用户手机处于无法开机状态时,用户便无法完成相应的系统更新操作,由此判断出用户意图“update phone”与业务场景“cannotturn it on”之间的关联关系为强关联,又比如,根据业务知识可知,用户手机的系统更新与能否接电话间并无直接关系,即无论用户手机是否能够接电话都可能能够执行系统更新操作,由此判断出用户意图“update phone”与业务场景“cannot receive call”之间的关联关系为弱关联(或无关联),并可将上述强关联类型及弱关联/无关联类型的关联关系信息纳入所述一套推理规则中,后续可将纳入所述推理规则中的每条关联关系信息作为该套推理规则的一条规则进行使用。
在预先制定出上述推理规则的基础上,对于语义解析模型所输出的待解答问题的业务场景信息集及用户意图信息集,可利用上述推理规则对所述业务场景信息集及用户意图信息集进行推理组合,以决策出所述业务场景信息集及用户意图信息集中每个业务场景信息及用户意图信息间的关联关系类型,进而根据两者之间的关联关系类型确定是否可将两者匹配为一对。如针对用户意图信息集{i1,i2,i3}和业务场景信息集{b1,b2,b3}进行推理组合,最终的推理决策结果可能为:得到配对二元组<i1,b3>、<i2,b1>,而i1、b3、i2、b1之外的其他元素则未配对成功。当用户意图集合为空,即语义解析模型识别出零个用户意图,此时推理结果为<None,业务场景>;类似地,当业务场景集合为空时,此时的推理结果为<用户意图,None>。
更具体地,如对于用户意图信息集{“update phone”}和业务场景信息集{“cantturn on”},根据上述推理规则,可知,用户意图信息“update phone”与业务场景信息“cantturn on”之间的关联关系为强关联,从而,可将两者匹配为一对,得到用户意图信息与业务场景信息二元组<“update phone”,“cant turn on”>;而对于用户意图信息集{“updatephone”}和业务场景信息集{“cannot receive call”},根据上述推理规则,可知,用户意图信息“update phone”与业务场景信息“cannot receive call”之间的关联关系为弱关联/无关联,从而,不能将两者匹配为一对,因此,在对其进行配对处理后,可得到未匹配成功的用户意图信息“update phone”,以及未匹配成功的业务场景信息“cannot receive call”,实际应用中,可分别采用二元组形式将其标记为<“update phone”,None>,以及<None,“cannot receive call”>。
步骤204、查询预定的知识库,获得与所述第三数量的用户意图信息与业务场景信息二元组中的每个二元组相匹配的答案信息;和/或,查询预定的知识库,获得与所述第四数量的未匹配成功的业务场景信息中的每个业务场景信息相匹配的答案信息;和/或,查询预定的知识库,获得与所述第五数量的未匹配成功的用户意图信息中的每个用户意图信息相匹配的答案信息。
所述知识库中包括与至少一个用户意图信息与业务场景信息二元组对应的答案信息、和/或与至少一个业务场景信息对应的答案信息、和/或与至少一个用户意图信息对应的答案信息。
所述知识库可同样基于业务知识和/或业务规则预先制定,其中,可根据业务知识预先制定特定业务场景下特定用户意图所对应的答案,以使得所述知识库中包括与至少一个用户意图信息与业务场景信息二元组对应的答案信息,例如,针对手机无法开机的业务场景中需进行系统升级的用户意图,可根据业务知识在知识库中为其制定如下答案:检测无法开机的原因的方法、针对相应原因给出解决策略使其能够成功开机,并同时给出在能够开机情况下的系统升级步骤等。
由于实际应用中,根据推理规则,并不是所有情况下都能够将待解答问题中的业务场景信息及用户意图信息成功配对,也即,在配对处理后,仍有可能包括一定数量的未匹配成功的业务场景信息,和/或一定数量的未匹配成功的用户意图信息,从而在制定知识库时,可结合考虑该情况,在知识库中同时包括与至少一个业务场景信息对应的答案信息,以及与至少一个用户意图信息对应的答案信息,例如针对需进行系统升级的用户意图,可给出一个仅包括升级步骤的这一无关乎业务场景信息的答案,而针对无法接听/拨打电话的业务场景信息,则可给出一个解决无法接听/拨打电话这一问题的处理步骤的答案。
在此基础上,针对待解答问题的配对结果中所包括的第三数量的用户意图信息与业务场景信息二元组、和/或第四数量的未匹配成功的业务场景信息、和/或第五数量的未匹配成功的用户意图信息,可分别通过查询所述知识库,为其确定相对应的答案信息,进而向用户反馈所确定的答案信息。参考图3,图3为基于本实施例方案所提供的智能客服系统的问题解答的处理逻辑示意图。
本实施例以大数据处理为基础,并结合考虑了待解答问题的用户意图信息及业务场景信息对待解答问题进行答案制定,可进一步优化智能客服系统的问题解答性能,提升智能客服系统的问题解答的准确度。
参考图4,是本申请提供的一种数据处理方法实施例三的流程图,本实施例中,如图4所示,所述数据处理方法还可以包括:
步骤105、对数据处理过程中产生的日志信息进行分析,并基于分析结果优化所述推理规则;所述日志信息包括原始问题数据,与原始问题数据相匹配的配对结果信息、答案信息以及使用者对答案信息的反馈信息。
为了进一步对所制定的推理规则进行完善、优化,以使得用户意图信息与业务场景信息间的匹配结果更为合理,本实施例中,在对待解答问题进行上述的数据处理并给出相应解答答案的过程中,同时针对该数据处理过程进行相应的日志记录,所记录的日志信息可以包括但不限于:用户提交的原始问题数据,与原始问题数据相匹配的配对结果信息、答案信息以及使用者如用户对答案信息的反馈信息。
用户对答案信息的反馈信息,可以包括用户反馈的其在解决问题时是否采用了智能客服系统所提供的答案,和/或用户针对所提供的答案给出的相应评价信息(如“满意”、“赞”等正向评价、“不满意”等负向评价,或者以高低分来区分的正向或负向评价意向等)等等,但并不局限于此。
用户的上述反馈信息可以从用户角度对系统提供的答案信息是否准确进行有效评价,而答案信息的制定与利用推理规则进行用户意图与业务场景二元组的推理组合紧密相关联,其中,较合理的用户意图与业务场景的二元组搭配往往可以制定出准确度较高的答案,反之,答案的准确度低,则往往可能是用户意图与业务场景的二元组搭配结果不够合理,而用户意图与业务场景的二元组搭配又是以推理规则为依据所确定的。
鉴于此,本实施例进一步以用户针对系统答案的反馈信息,来衡量所制定的推理规则的合理性,其中,若用户的反馈信息属于正向意向,则表示用户问题在此次答案制定过程中所采用的相应一条/多条规则是合理的,反之,若用户反馈信息属于负向意向,则认为用户问题在此次答案制定过程中所采用的相应一条/多条规则可能存在不合理之处,从而,可对此次答案制定过程中所采用的相应一条/多条规则进行调整,使之更为合理,以此实现对所制定的所述一套推理规则进行优化。
参考图5,具体实施中,与上一实施例相比,本实施例中智能客服系统可增添一根据日志信息进行推理规则优化的处理环节。
本实施例通过对数据处理过程中产生的日志信息进行分析,并基于分析结果优化所述推理规则,可使得所述推理规则越来越趋向于向完善化、合理化方向调整,使其更贴近实际的业务应用情况,从而,本实施例能够在上述各实施例的基础进一步优化智能客服系统的问题解答性能,提升智能客服系统的问题解答的准确度。
参考图6,是本申请提供的一种服务器实施例四的结构示意图,所述服务器可以是单独部署环境或集群部署环境(即服务器集群)中的服务器,如图6所示,所述服务器包括:
存储器601,用于存储至少一组指令集;
处理器602,用于调用并执行所述存储器中的所述指令集,通过执行所述指令集进行以下操作:
获得待解答问题的问题数据;
对所述问题数据进行语义解析,得到第一数量的业务场景信息及第二数量的用户意图信息;
对所述业务场景信息及所述用户意图信息进行配对,得到业务场景信息与用户意图信息间的配对结果;
基于所述业务场景信息与用户意图信息间的配对结果,确定与所述待解答问题相匹配的答案信息,并反馈所述答案信息。
所述待解答问题的问题数据,可以是用户在相应应用场景中基于特定操作所提交的用户问题数据。
比如,可以是用户在利用其终端设备(移动设备或计算机设备等)所调出的某产品/某类产品的智能客服系统上所输入并提交的针对该产品/该类产品的问题数据等,示例性地,如可以是用户在某手机答疑系统上输入并提交的以下问题:I want update myphone,but i cannot turn it on。
发明人经研究发现,待解答问题的问题数据,除了包括能够反映用户提问需求的用户意图信息,往往还包括一些业务场景信息,如关于产品状态、功能等的相关性描述信息等,尤其是对于复杂语境的用户问题该情况更为明显,而这些信息可作为用户意图的背景信息来辅助执行主体更为精准地确定或定位待解答问题所表明的用户提问需求,以上文中的“I want update my phone,but i cannot turn it on”这一问题为例,该问题中所包括的用户意图信息为“update phone”,业务场景信息为“cannot turn it on”,根据上述的用户意图信息,可知用户提问需求为“update phone”,而结合其对应的业务场景信息“cannotturn it on”,可进一步获知用户的更准确的提问需求为“Update phone if cannot turnit on(如何在无法开机的情况下升级系统)”。
鉴于此,本申请在以用户意图信息作为解答答案的确定依据的同时,还结合考虑问题数据中所携带的业务场景信息,所述业务场景信息可以包括但不限于待解答问题的问题数据中包括的关于产品状态、功能等的相关性描述信息,如以上示例中的“cannot turnit on”。
从而,在获得待解答问题的问题数据后,可利用处理器602进一步对所述问题数据进行语义解析,以解析出其中所包括的业务场景信息及用户意图信息,从而得到第一数量的业务场景信息及第二数量的用户意图信息,进而为后续该待解答问题的答案制定提供依据。
需要说明的是,实际应用中,基于待解答问题的复杂程度,可能会解析出较少数量的业务场景信息及用户意图信息,也可能会解析出较多数量的业务场景信息及用户意图信息(如复杂语境中的复杂问题),且所解析出的业务场景信息与用户意图信息的数量关系并不确定,两者的数量可能一致,也可能并不一致,或者,还可能仅解析出一定数量的用户意图信息未解析出业务场景信息、仅解析出一定数量的业务场景信息未解析出用户意图信息等等。
待解答问题中的某一特定业务场景信息往往与该问题中的某一特定用户意图信息具有较强的关联,能够作为该特定用户意图信息的背景信息,而与该问题中的其他用户意图信息之间则可能关联性不强,鉴于此,为有效利用业务场景信息的参考价值,使其尽可能大的在答案制定中发挥辅助作用,处理器602在对待解答问题进行语义解析,得到第一数量的业务场景信息及第二数量的用户意图信息后,可进一步对解析所得的各个业务场景信息及各个用户意图信息进行配对,以使得将关联性较强的业务场景信息及用户意图信息进行匹配,而关联性较弱的业务场景信息及用户意图信息配则不进行匹配。
在对解析所得的各业务场景信息及各用户意图信息进行配对的基础上,最终可基于待解答问题中业务场景信息与用户意图信息间的配对结果情况,结合考虑用户意图信息以及与其相匹配的业务场景信息(如产品的状态、功能方面的相关描述等)对待解答问题中所反映的用户提问需求进行精准定位(如前文的“Update phone if cannot turn iton”),进而确定出与之相匹配的答案信息,并反馈给用户。
根据以上方案可知,本申请提供的服务器,针对待解答问题,在以用户意图信息作为解答答案的确定依据的同时,还结合考虑了问题数据中所携带的业务场景信息,相比于问题域,与用户意图信息相匹配的业务场景信息往往能够包括更多的与用户提问需求相关联的信息,从而,可辅助执行主体更准确地定位用户意图信息所对应的用户提问需求,进而便于针对待解答问题给出准确度更高的解答答案,尤其在面对复杂语境的用户问题处理时本申请的优势尤为突出,从而本申请方案进一步优化了智能客服系统的问题解答性能,提升了智能客服系统的问题解答的准确度。
在本申请接下来的实施例五中,继续对所述服务器中包括的存储器601及处理器602的功能进行详述。
所述存储器601,还用于存储预先训练的语义解析模型;
所述处理器602,对所述问题数据进行语义解析,得到第一数量的业务场景信息及第二数量的用户意图信息,具体包括:基于所述语义解析模型对所述问题数据进行语义解析,得到业务场景信息集及用户意图信息集;所述业务场景信息集包括第一数量的业务场景信息,所述用户意图信息集包括第二数量的用户意图信息;其中,所述语义解析模型为:基于预定的自然语言处理技术利用预先标注了业务场景信息及用户意图信息的多条历史问题数据训练的模型。
所述自然语言处理技术可以为文本分类技术、信息抽取技术等。
为了做到精确的用户语义解析,本实施例具体采用在大数据基础上所训练的语义解析模型实现从用户提交的待解答问题中解析出其所包括的业务场景信息及用户意图信息。
具体地,在模型训练阶段,需要首先获得多条历史问题数据作为训练样本集,并针对训练样本集中的各条历史问题数据进行人工标注,其中,在标注时需要精确标注出历史问题数据中的每一个用户意图和业务场景,每个历史问题数据的标注信息可能包括零个或一个/多个用户意图标注信息,以及零个或一个/多个业务场景标注信息。
在完成历史问题数据的信息标注后,可基于标注有用户意图信息及业务场景信息的各训练样本开始进行语义解析模型的训练,在训练模型时,语义解析模型可以采用文本分类模型,如采用SVM(Support Vector Machine,支持向量机)、CNN(ConvolutionalNeural Network,卷积神经网络)或者LSTM(Long Short-Term Memory,长短期记忆网络)等;也可以选用信息抽取模型,如CRF(conditional random field algorithm,条件随机场算法)、LSTM+CRF等,或者还可以将文本分类模型和信息抽取模型进行有效融合。
在完成模型训练的基础上,后续,可将用户提交的问题数据作为模型的输入信息输入模型,并由模型对其进行处理后输出相应的用户意图信息集I={i1,i2,...,in},及业务场景信息集B={b1,b2,...,bm},其中n表示用户意图信息集中所包括的用户意图信息的数量,m表示业务场景信息集中所包括的业务场景信息的数量。例如,对于输入的问题数据“I want update my phone,but i cannot turn it on”,模型可输出用户意图信息集{“update phone”}和业务场景信息集{“cannot turn on”},而对于输入的问题数据“Icannot receive any call,some tell me i can fix it by updating to androidnougat version,please tell me how to do it”,模型相对应地可输出用户意图信息集{“update phone”}和业务场景信息集{“cannot receive call”}。
对于模型输出的用户意图信息集及业务场景信息集,可分别对二者进行归一化处理,以使得用户意图信息和业务场景信息标准化,进而使得能够被执行主体如服务器等有效识别。
进一步地,所述存储器601还用于存储预定推理规则的规则信息;
所述处理器602对所述业务场景信息及用户意图信息进行配对,得到业务场景信息与用户意图信息间的配对结果,具体包括:基于所述推理规则,对所述业务场景信息及用户意图信息进行配对,得到第三数量的用户意图信息与业务场景信息二元组、和/或第四数量的未匹配成功的业务场景信息、和/或第五数量的未匹配成功的用户意图信息;其中,所述推理规则包括至少一个业务场景信息与至少一个用户意图信息间的关联关系。
所述至少一个业务场景信息与至少一个用户意图信息间的关联关系为:根据业务知识和/或业务规则预先确定的业务场景信息与用户意图信息间的关联关系。
也即,本实施例预先根据实际业务应用中的业务知识和/或业务规则,确定各种不同的业务场景信息(如产品状态、功能等的描述信息)与各种不同的用户意图信息间的关联关系,所述关联关系可以包括但不限于表示关联性较强的强关联、表示关联性较弱的弱关联、或表示不具备关联性的无关联等等,并以此为基础预先制定一套推理规则。
示例性地,例如,根据业务知识可知,当用户手机处于无法开机状态时,用户便无法完成相应的系统更新操作,由此判断出用户意图“update phone”与业务场景“cannotturn it on”之间的关联关系为强关联,又比如,根据业务知识可知,用户手机的系统更新与能否接电话间并无直接关系,即无论用户手机是否能够接电话都可能能够执行系统更新操作,由此判断出用户意图“update phone”与业务场景“cannot receive call”之间的关联关系为弱关联(或无关联),并可将上述强关联类型及弱关联/无关联类型的关联关系信息纳入所述一套推理规则中,后续可将纳入所述推理规则中的每条关联关系信息作为该套推理规则的一条规则进行使用。
在预先制定出上述推理规则的基础上,对于语义解析模型所输出的待解答问题的业务场景信息集及用户意图信息集,可利用上述推理规则对所述业务场景信息集及用户意图信息集进行推理组合,以决策出所述业务场景信息集及用户意图信息集中每个业务场景信息及用户意图信息间的关联关系类型,进而根据两者之间的关联关系类型确定是否可将两者匹配为一对。如针对用户意图信息集{i1,i2,i3}和业务场景信息集{b1,b2,b3}进行推理组合,最终的推理决策结果可能为:得到配对二元组<i1,b3>、<i2,b1>,而i1、b3、i2、b1之外的其他元素则未配对成功。当用户意图集合为空,即语义解析模型识别出零个用户意图,此时推理结果为<None,业务场景>;类似地,当业务场景集合为空时,此时的推理结果为<用户意图,None>。
更具体地,如对于用户意图信息集{“update phone”}和业务场景信息集{“cantturn on”},根据上述推理规则,可知,用户意图信息“update phone”与业务场景信息“cantturn on”之间的关联关系为强关联,从而,可将两者匹配为一对,得到用户意图信息与业务场景信息二元组<“update phone”,“cant turn on”>;而对于用户意图信息集{“updatephone”}和业务场景信息集{“cannot receive call”},根据上述推理规则,可知,用户意图信息“update phone”与业务场景信息“cannot receive call”之间的关联关系为弱关联/无关联,从而,不能将两者匹配为一对,因此,在对其进行配对处理后,可得到未匹配成功的用户意图信息“update phone”,以及未匹配成功的业务场景信息“cannot receive call”,实际应用中,可分别采用二元组形式将其标记为<“update phone”,None>,以及<None,“cannot receive call”>。
进一步地,所述存储器601还用于存储预定的知识库;
所述处理器602,基于所述业务场景信息与用户意图信息间的配对结果,确定与所述待解答问题相匹配的答案信息,具体包括:查询所述知识库,获得与所述第三数量的用户意图信息与业务场景信息二元组中的每个二元组相匹配的答案信息;和/或,查询所述知识库,获得与所述第四数量的未匹配成功的业务场景信息中的每个业务场景信息相匹配的答案信息;和/或,查询所述知识库,获得与所述第五数量的未匹配成功的用户意图信息中的每个用户意图信息相匹配的答案信息;所述知识库中包括与至少一个用户意图信息与业务场景信息二元组对应的答案信息、和/或与至少一个业务场景信息对应的答案信息、和/或与至少一个用户意图信息对应的答案信息。
所述知识库可同样基于业务知识和/或业务规则预先制定,其中,可根据业务知识预先制定特定业务场景下特定用户意图所对应的答案,以使得所述知识库中包括与至少一个用户意图信息与业务场景信息二元组对应的答案信息,例如,针对手机无法开机的业务场景中需进行系统升级的用户意图,可根据业务知识在知识库中为其制定如下答案:检测无法开机的原因的方法、针对相应原因给出解决策略使其能够成功开机,并同时给出在能够开机情况下的系统升级步骤等。
由于实际应用中,根据推理规则,并不是所有情况下都能够将待解答问题中的业务场景信息及用户意图信息成功配对,也即,在配对处理后,仍有可能包括一定数量的未匹配成功的业务场景信息,和/或一定数量的未匹配成功的用户意图信息,从而在制定知识库时,可结合考虑该情况,在知识库中同时包括与至少一个业务场景信息对应的答案信息,以及与至少一个用户意图信息对应的答案信息,例如针对需进行系统升级的用户意图,可给出一个仅包括升级步骤的这一无关乎业务场景信息的答案,而针对无法接听/拨打电话的业务场景信息,则可给出一个解决无法接听/拨打电话这一问题的处理步骤的答案。
在此基础上,针对待解答问题的配对结果中所包括的第三数量的用户意图信息与业务场景信息二元组、和/或第四数量的未匹配成功的业务场景信息、和/或第五数量的未匹配成功的用户意图信息,可分别通过查询所述知识库,为其确定相对应的答案信息,进而向用户反馈所确定的答案信息。参考图3,图3为基于本实施例方案所提供的智能客服系统的问题解答的处理逻辑示意图。
本实施例以大数据处理为基础,并结合考虑了待解答问题的用户意图信息及业务场景信息对待解答问题进行答案制定,可进一步优化智能客服系统的问题解答性能,提升智能客服系统的问题解答的准确度。
与上述实施例的区别在于,在本申请接下来的实施例六中,所述服务器中的存储器601还可以用于存储数据处理过程中所产生的日志信息,所述日志信息包括原始问题数据,与原始问题数据相匹配的配对结果信息、答案信息以及使用者对答案信息的反馈信息;
相对应地,所述处理器602还可以用于:对数据处理过程中产生的日志信息进行分析,并基于分析结果优化所述推理规则。
为了进一步对所制定的推理规则进行完善、优化,以使得用户意图信息与业务场景信息间的匹配结果更为合理,本实施例中,在对待解答问题进行上述的数据处理并给出相应解答答案的过程中,同时针对该数据处理过程进行相应的日志记录,所记录的日志信息可以包括但不限于:用户提交的原始问题数据,与原始问题数据相匹配的配对结果信息、答案信息以及使用者如用户对答案信息的反馈信息。
用户对答案信息的反馈信息,可以包括用户反馈的其在解决问题时是否采用了智能客服系统所提供的答案,和/或用户针对所提供的答案给出的相应评价信息(如“满意”、“赞”等正向评价、“不满意”等负向评价,或者以高低分来区分的正向或负向评价意向等)等等,但并不局限于此。
用户的上述反馈信息可以从用户角度对系统提供的答案信息是否准确进行有效评价,而答案信息的制定与利用推理规则进行用户意图与业务场景二元组的推理组合紧密相关联,其中,较合理的用户意图与业务场景的二元组搭配往往可以制定出准确度较高的答案,反之,答案的准确度低,则往往可能是用户意图与业务场景的二元组搭配结果不够合理,而用户意图与业务场景的二元组搭配又是以推理规则为依据所确定的。
鉴于此,本实施例进一步以用户针对系统答案的反馈信息,来衡量所制定的推理规则的合理性,其中,若用户的反馈信息属于正向意向,则表示用户问题在此次答案制定过程中所采用的相应一条/多条规则是合理的,反之,若用户反馈信息属于负向意向,则认为用户问题在此次答案制定过程中所采用的相应一条/多条规则可能存在不合理之处,从而,可对此次答案制定过程中所采用的相应一条/多条规则进行调整,使之更为合理,以此实现对所制定的所述一套推理规则进行优化。
参考图5,具体实施中,与上一实施例相比,本实施例中智能客服系统可增添一根据日志信息进行推理规则优化的处理环节。
本实施例通过对数据处理过程中产生的日志信息进行分析,并基于分析结果优化所述推理规则,可使得所述推理规则越来越趋向于向完善化、合理化方向调整,使其更贴近实际的业务应用情况,从而,本实施例能够在上述各实施例的基础进一步优化智能客服系统的问题解答性能,提升智能客服系统的问题解答的准确度。
参考图7,是本申请提供的一种电子设备实施例七的结构示意图,所述电子设备可以是但不限于各类型的通用或专用计算机设备。如图7所示,所述电子设备包括:
存储器701,用于存储至少一组指令集;
处理器702,用于调用并执行所述存储器中的所述指令集,通过执行所述指令集进行以下操作:
获得待解答问题的问题数据;
对所述问题数据进行语义解析,得到第一数量的业务场景信息及第二数量的用户意图信息;
对所述业务场景信息及所述用户意图信息进行配对,得到业务场景信息与用户意图信息间的配对结果;
基于所述业务场景信息与用户意图信息间的配对结果,确定与所述待解答问题相匹配的答案信息,并反馈所述答案信息。
所述待解答问题的问题数据,可以是用户在相应应用场景中基于特定操作所提交的用户问题数据。
比如,可以是用户在利用其终端设备(移动设备或计算机设备等)所调出的某产品/某类产品的智能客服系统上所输入并提交的针对该产品/该类产品的问题数据等,示例性地,如可以是用户在某手机答疑系统上输入并提交的以下问题:I want update myphone,but i cannot turn it on。
发明人经研究发现,待解答问题的问题数据,除了包括能够反映用户提问需求的用户意图信息,往往还包括一些业务场景信息,如关于产品状态、功能等的相关性描述信息等,尤其是对于复杂语境的用户问题该情况更为明显,而这些信息可作为用户意图的背景信息来辅助执行主体更为精准地确定或定位待解答问题所表明的用户提问需求,以上文中的“I want update my phone,but i cannot turn it on”这一问题为例,该问题中所包括的用户意图信息为“update phone”,业务场景信息为“cannot turn it on”,根据上述的用户意图信息,可知用户提问需求为“update phone”,而结合其对应的业务场景信息“cannotturn it on”,可进一步获知用户的更准确的提问需求为“Update phone if cannot turnit on(如何在无法开机的情况下升级系统)”。
鉴于此,本申请在以用户意图信息作为解答答案的确定依据的同时,还结合考虑问题数据中所携带的业务场景信息,所述业务场景信息可以包括但不限于待解答问题的问题数据中包括的关于产品状态、功能等的相关性描述信息,如以上示例中的“cannot turnit on”。
从而,在获得待解答问题的问题数据后,可利用处理器602进一步对所述问题数据进行语义解析,以解析出其中所包括的业务场景信息及用户意图信息,从而得到第一数量的业务场景信息及第二数量的用户意图信息,进而为后续该待解答问题的答案制定提供依据。
需要说明的是,实际应用中,基于待解答问题的复杂程度,可能会解析出较少数量的业务场景信息及用户意图信息,也可能会解析出较多数量的业务场景信息及用户意图信息(如复杂语境中的复杂问题),且所解析出的业务场景信息与用户意图信息的数量关系并不确定,两者的数量可能一致,也可能并不一致,或者,还可能仅解析出一定数量的用户意图信息未解析出业务场景信息、仅解析出一定数量的业务场景信息未解析出用户意图信息等等。
待解答问题中的某一特定业务场景信息往往与该问题中的某一特定用户意图信息具有较强的关联,能够作为该特定用户意图信息的背景信息,而与该问题中的其他用户意图信息之间则可能关联性不强,鉴于此,为有效利用业务场景信息的参考价值,使其尽可能大的在答案制定中发挥辅助作用,处理器602在对待解答问题进行语义解析,得到第一数量的业务场景信息及第二数量的用户意图信息后,可进一步对解析所得的各个业务场景信息及各个用户意图信息进行配对,以使得将关联性较强的业务场景信息及用户意图信息进行匹配,而关联性较弱的业务场景信息及用户意图信息配则不进行匹配。
在对解析所得的各业务场景信息及各用户意图信息进行配对的基础上,最终可基于待解答问题中业务场景信息与用户意图信息间的配对结果情况,结合考虑用户意图信息以及与其相匹配的业务场景信息(如产品的状态、功能方面的相关描述等)对待解答问题中所反映的用户提问需求进行精准定位(如前文的“Update phone if cannot turn iton”),进而确定出与之相匹配的答案信息,并反馈给用户。
根据以上方案可知,本申请提供的电子设备,针对待解答问题,在以用户意图信息作为解答答案的确定依据的同时,还结合考虑了问题数据中所携带的业务场景信息,相比于问题域,与用户意图信息相匹配的业务场景信息往往能够包括更多的与用户提问需求相关联的信息,从而,可辅助执行主体更准确地定位用户意图信息所对应的用户提问需求,进而便于针对待解答问题给出准确度更高的解答答案,尤其在面对复杂语境的用户问题处理时本申请的优势尤为突出,从而本申请方案进一步优化了智能客服系统的问题解答性能,提升了智能客服系统的问题解答的准确度。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
为了描述的方便,描述以上系统或装置时以功能分为各种模块或单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
最后,还需要说明的是,在本文中,诸如第一、第二、第三和第四等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种数据处理方法,其特征在于,包括:
获得待解答问题的问题数据;
对所述问题数据进行语义解析,得到第一数量的业务场景信息及第二数量的用户意图信息;
对所述业务场景信息及所述用户意图信息进行配对,得到业务场景信息与用户意图信息间的配对结果;
基于所述业务场景信息与用户意图信息间的配对结果,确定与所述待解答问题相匹配的答案信息,并反馈所述答案信息。
2.根据权利要求1所述的方法,其特征在于,所述对所述问题数据进行语义解析,得到第一数量的业务场景信息及第二数量的用户意图信息,包括:
基于预先训练的语义解析模型对所述问题数据进行语义解析,得到业务场景信息集及用户意图信息集;所述业务场景信息集包括第一数量的业务场景信息,所述用户意图信息集包括第二数量的用户意图信息;
其中,所述语义解析模型为:基于预定的自然语言处理技术利用预先标注了业务场景信息及用户意图信息的多条历史问题数据训练的模型。
3.根据权利要求1所述的方法,其特征在于,所述对所述业务场景信息及所述用户意图信息进行配对,得到业务场景信息与用户意图信息间的配对结果,包括:
基于预定的推理规则,对所述业务场景信息及所述用户意图信息进行配对,得到第三数量的用户意图信息与业务场景信息二元组、和/或第四数量的未匹配成功的业务场景信息、和/或第五数量的未匹配成功的用户意图信息;
其中,所述推理规则包括至少一个业务场景信息与至少一个用户意图信息间的关联关系。
4.根据权利要求3所述的方法,其特征在于,所述基于所述业务场景信息与用户意图信息间的配对结果,确定与所述待解答问题相匹配的答案信息,包括:
查询预定的知识库,获得与所述第三数量的用户意图信息与业务场景信息二元组中的每个二元组相匹配的答案信息;和/或,
查询预定的知识库,获得与所述第四数量的未匹配成功的业务场景信息中的每个业务场景信息相匹配的答案信息;和/或,
查询预定的知识库,获得与所述第五数量的未匹配成功的用户意图信息中的每个用户意图信息相匹配的答案信息;所述知识库中包括与至少一个用户意图信息与业务场景信息二元组对应的答案信息、和/或与至少一个业务场景信息对应的答案信息、和/或与至少一个用户意图信息对应的答案信息。
5.根据权利要求3所述的方法,其特征在于,所述业务场景信息包括产品状态和/或功能的描述信息;
所述推理规则中包括的至少一个业务场景信息与至少一个用户意图信息间的关联关系为:根据业务知识和/或业务规则预先确定的业务场景信息与用户意图信息间的关联关系;
所述方法还包括:
对数据处理过程中产生的日志信息进行分析,并基于分析结果优化所述推理规则;所述日志信息包括原始问题数据,与原始问题数据相匹配的配对结果信息、答案信息以及使用者对答案信息的反馈信息。
6.一种服务器,其特征在于,包括:
存储器,用于存储至少一组指令集;
处理器,用于调用并执行所述存储器中的所述指令集,通过执行所述指令集进行以下操作:
获得待解答问题的问题数据;
对所述问题数据进行语义解析,得到第一数量的业务场景信息及第二数量的用户意图信息;
对所述业务场景信息及所述用户意图信息进行配对,得到业务场景信息与用户意图信息间的配对结果;
基于所述业务场景信息与用户意图信息间的配对结果,确定与所述待解答问题相匹配的答案信息,并反馈所述答案信息。
7.根据权利要求6所述的服务器,其特征在于,所述存储器还用于存储预先训练的语义解析模型;
所述处理器对所述问题数据进行语义解析,得到第一数量的业务场景信息及第二数量的用户意图信息,具体包括:
基于所述语义解析模型对所述问题数据进行语义解析,得到业务场景信息集及用户意图信息集;所述业务场景信息集包括第一数量的业务场景信息,所述用户意图信息集包括第二数量的用户意图信息;
其中,所述语义解析模型为:基于预定的自然语言处理技术利用预先标注了业务场景信息及用户意图信息的多条历史问题数据训练的模型。
8.根据权利要求6所述的服务器,其特征在于,所述存储器还用于存储预定推理规则的规则信息;
所述处理器对所述业务场景信息及用户意图信息进行配对,得到业务场景信息与用户意图信息间的配对结果,具体包括:
基于所述推理规则,对所述业务场景信息及用户意图信息进行配对,得到第三数量的用户意图信息与业务场景信息二元组、和/或第四数量的未匹配成功的业务场景信息、和/或第五数量的未匹配成功的用户意图信息;
其中,所述推理规则包括至少一个业务场景信息与至少一个用户意图信息间的关联关系。
9.根据权利要求8所述的服务器,其特征在于,所述存储器还用于存储预定的知识库;
所述处理器基于所述业务场景信息与用户意图信息间的配对结果,确定与所述待解答问题相匹配的答案信息,具体包括:
查询所述知识库,获得与所述第三数量的用户意图信息与业务场景信息二元组中的每个二元组相匹配的答案信息;和/或,
查询所述知识库,获得与所述第四数量的未匹配成功的业务场景信息中的每个业务场景信息相匹配的答案信息;和/或,
查询所述知识库,获得与所述第五数量的未匹配成功的用户意图信息中的每个用户意图信息相匹配的答案信息;所述知识库中包括与至少一个用户意图信息与业务场景信息二元组对应的答案信息、和/或与至少一个业务场景信息对应的答案信息、和/或与至少一个用户意图信息对应的答案信息。
10.一种电子设备,其特征在于,包括:
存储器,用于存储至少一组指令集;
处理器,用于调用并执行所述存储器中的所述指令集,通过执行所述指令集进行进行操作:
获得待解答问题的问题数据;
对所述问题数据进行语义解析,得到第一数量的业务场景信息及第二数量的用户意图信息;
对所述业务场景信息及所述用户意图信息进行配对,得到业务场景信息与用户意图信息间的配对结果;
基于所述业务场景信息与用户意图信息间的配对结果,确定与所述待解答问题相匹配的答案信息,并反馈所述答案信息。
CN201810843628.6A 2018-07-27 2018-07-27 一种数据处理方法、服务器及电子设备 Pending CN109063100A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810843628.6A CN109063100A (zh) 2018-07-27 2018-07-27 一种数据处理方法、服务器及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810843628.6A CN109063100A (zh) 2018-07-27 2018-07-27 一种数据处理方法、服务器及电子设备

Publications (1)

Publication Number Publication Date
CN109063100A true CN109063100A (zh) 2018-12-21

Family

ID=64835932

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810843628.6A Pending CN109063100A (zh) 2018-07-27 2018-07-27 一种数据处理方法、服务器及电子设备

Country Status (1)

Country Link
CN (1) CN109063100A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109685571A (zh) * 2018-12-24 2019-04-26 深圳市航盛车云技术有限公司 基于车联网的智能客服系统
CN109693244A (zh) * 2018-12-24 2019-04-30 零犀(北京)科技有限公司 优化对话机器人的方法及装置
CN109949637A (zh) * 2019-03-13 2019-06-28 广东小天才科技有限公司 一种客观题目的自动解答方法和装置
CN110110043A (zh) * 2019-04-11 2019-08-09 中山大学 一种多跳视觉问题推理模型及其推理方法
CN110516027A (zh) * 2019-07-22 2019-11-29 北京达佳互联信息技术有限公司 信息集合的更新方法、装置、电子设备及存储介质
CN110929014A (zh) * 2019-12-09 2020-03-27 联想(北京)有限公司 信息处理方法、装置、电子设备及存储介质
CN111126071A (zh) * 2019-12-02 2020-05-08 支付宝(杭州)信息技术有限公司 提问文本数据的确定方法、装置和客服群的数据处理方法
CN111210231A (zh) * 2019-12-31 2020-05-29 联想(北京)有限公司 信息处理方法和信息处理装置
CN111353299A (zh) * 2020-03-03 2020-06-30 腾讯科技(深圳)有限公司 基于人工智能的对话场景确定方法和相关装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106462124A (zh) * 2016-07-07 2017-02-22 深圳狗尾草智能科技有限公司 一种基于意图识别控制家电的方法、系统及机器人
CN106951470A (zh) * 2017-03-03 2017-07-14 中兴耀维科技江苏有限公司 一种基于业务知识图检索的智能问答系统
CN107918634A (zh) * 2017-06-27 2018-04-17 上海壹账通金融科技有限公司 智能问答方法、装置及计算机可读存储介质
CN108197191A (zh) * 2017-12-27 2018-06-22 神思电子技术股份有限公司 一种多轮对话的场景意图中断方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106462124A (zh) * 2016-07-07 2017-02-22 深圳狗尾草智能科技有限公司 一种基于意图识别控制家电的方法、系统及机器人
CN106951470A (zh) * 2017-03-03 2017-07-14 中兴耀维科技江苏有限公司 一种基于业务知识图检索的智能问答系统
CN107918634A (zh) * 2017-06-27 2018-04-17 上海壹账通金融科技有限公司 智能问答方法、装置及计算机可读存储介质
CN108197191A (zh) * 2017-12-27 2018-06-22 神思电子技术股份有限公司 一种多轮对话的场景意图中断方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109693244B (zh) * 2018-12-24 2020-06-12 零犀(北京)科技有限公司 优化对话机器人的方法及装置
CN109693244A (zh) * 2018-12-24 2019-04-30 零犀(北京)科技有限公司 优化对话机器人的方法及装置
CN109685571A (zh) * 2018-12-24 2019-04-26 深圳市航盛车云技术有限公司 基于车联网的智能客服系统
CN109949637A (zh) * 2019-03-13 2019-06-28 广东小天才科技有限公司 一种客观题目的自动解答方法和装置
CN110110043A (zh) * 2019-04-11 2019-08-09 中山大学 一种多跳视觉问题推理模型及其推理方法
CN110516027A (zh) * 2019-07-22 2019-11-29 北京达佳互联信息技术有限公司 信息集合的更新方法、装置、电子设备及存储介质
CN110516027B (zh) * 2019-07-22 2022-04-22 北京达佳互联信息技术有限公司 信息集合的更新方法、装置、电子设备及存储介质
CN111126071A (zh) * 2019-12-02 2020-05-08 支付宝(杭州)信息技术有限公司 提问文本数据的确定方法、装置和客服群的数据处理方法
CN111126071B (zh) * 2019-12-02 2023-05-12 支付宝(杭州)信息技术有限公司 提问文本数据的确定方法、装置和客服群的数据处理方法
CN110929014A (zh) * 2019-12-09 2020-03-27 联想(北京)有限公司 信息处理方法、装置、电子设备及存储介质
CN110929014B (zh) * 2019-12-09 2023-05-23 联想(北京)有限公司 信息处理方法、装置、电子设备及存储介质
CN111210231A (zh) * 2019-12-31 2020-05-29 联想(北京)有限公司 信息处理方法和信息处理装置
CN111353299A (zh) * 2020-03-03 2020-06-30 腾讯科技(深圳)有限公司 基于人工智能的对话场景确定方法和相关装置
CN111353299B (zh) * 2020-03-03 2022-08-09 腾讯科技(深圳)有限公司 基于人工智能的对话场景确定方法和相关装置

Similar Documents

Publication Publication Date Title
CN109063100A (zh) 一种数据处理方法、服务器及电子设备
CN110175227B (zh) 一种基于组队学习和层级推理的对话辅助系统
US20180157960A1 (en) Scalable curation system
US20200184019A1 (en) Clarification of natural language requests using neural networks
CN112507094B (zh) 一种基于强化学习的客服机器人对话方法及其相关组件
WO2020006827A1 (zh) 一种智能应答的方法和装置
CN110209790B (zh) 问答匹配方法和装置
CN110046230B (zh) 生成推荐话术集合的方法、推荐话术的方法和装置
CN112365894A (zh) 基于ai的复合语音交互方法、装置及计算机设备
CN108021934A (zh) 多要素识别的方法及装置
US11880666B2 (en) Generating conversation descriptions using neural networks
Dong et al. A natural language question answering system as a participant in human Q&A portals
CN115146050B (zh) 一种文本生成方法、装置、设备及可读存储介质
CN111858854A (zh) 一种基于历史对话信息的问答匹配方法及相关装置
CN111090735A (zh) 一种基于知识图谱的智能问答方法及其性能评价方法
CN115203393A (zh) 一种对话应答方法及其系统、电子设备、存储介质
CN113987151A (zh) 智能客服回复方法及装置
US20220269743A1 (en) Methods and systems for dynamic search listing ranking of software components
CN113918697A (zh) 一种智能问答系统的优化方法以及优化系统
CN111858846A (zh) 一种信息处理方法及装置
CN115455158A (zh) 智能聊天的信息处理方法、装置、电子设备及存储设备
CN112860873B (zh) 智能应答方法、装置及存储介质
CN115455984A (zh) 一种任务型客服服务升级方法及装置
CN111881266A (zh) 一种应答方法及装置
CN110134775A (zh) 问答数据生成方法及装置、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination