CN116450671B

CN116450671B - 智能交互会话大数据分析方法及大数据服务器

Info

Publication number: CN116450671B
Application number: CN202310691328.1A
Authority: CN
Inventors: 田凯; 张惠元; 宋园园
Original assignee: Big Bear Big Data Technology Changshu Co ltd
Current assignee: Big Bear Big Data Technology Changshu Co ltd
Priority date: 2023-06-12
Filing date: 2023-06-12
Publication date: 2023-08-22
Anticipated expiration: 2043-06-12
Also published as: CN116450671A

Abstract

本发明提供的智能交互会话大数据分析方法及大数据服务器，通过深度结构化语义模型得到待分析请求应答交互会话的结构化语义向量，通过深度热力描述知识模型得到待分析请求应答交互会话的风险热力描述知识，可以尽可能提炼待分析请求应答交互会话的不同的会话语义细节，再依据待分析请求应答交互会话的结构化语义向量和风险热力描述知识，可以进行高质量的聚合，得到待分析请求应答交互会话的会话风险联合描述项，实现对结构化语义向量的丰富，尽可能提升所挖掘的会话文本的风险描述的精度，这样可以利用准确、丰富的会话风险联合描述项进行精准可信的风险预测分析，减少因特征挖掘误差导致的风险预测分析偏差。

Description

智能交互会话大数据分析方法及大数据服务器

技术领域

本发明涉及大数据技术领域，具体而言，涉及智能交互会话大数据分析方法及大数据服务器。

背景技术

随着科技的不断进步和发展，以智能化请求应答为交互模式的新型在线业务服务逐渐成熟，用户通过终端可以和智能化服务系统进行对话、操作等一系列的会话交互处理，极大地提高了业务服务处理的智能化程度和便捷性。然而，在实际的业务服务会话交互过程中，大数据安全问题不容忽视，传统技术大多利用人工智能技术对业务服务会话进行特征分析以实现大数据安全风险预测，但是传统技术在进行业务服务会话的特征挖掘时，难以保障特征挖掘的准确性和丰富程度，从而会造成大数据安全风险预测的偏差。

发明内容

本发明至少提供智能交互会话大数据分析方法及大数据服务器。

本发明提供了一种智能交互会话大数据分析方法，应用于大数据服务器，所述方法包括：

获得待分析请求应答交互会话，通过深度结构化语义模型对所述待分析请求应答交互会话进行会话语义挖掘操作，得到所述待分析请求应答交互会话的结构化语义向量；

获得所述待分析请求应答交互会话的风险热力标注交互会话，通过深度热力描述知识模型对所述待分析请求应答交互会话的风险热力标注交互会话进行会话语义挖掘操作，得到所述待分析请求应答交互会话的风险热力描述知识；

依据所述待分析请求应答交互会话的结构化语义向量和风险热力描述知识，确定所述待分析请求应答交互会话的会话风险联合描述项；

其中，所述深度热力描述知识模型是综合所述深度结构化语义模型和混合调试范例对待调试的热力描述知识模型进行调试所得，所述混合调试范例包括高亮交互会话样例、所述高亮交互会话样例对应的积极交互会话样例和消极交互会话样例；在对所述待调试的热力描述知识模型进行调试时，所述深度结构化语义模型用于挖掘所述高亮交互会话样例、所述积极交互会话样例和所述消极交互会话样例分别对应的结构化语义向量，所述待调试的热力描述知识模型用于挖掘所述高亮交互会话样例、所述积极交互会话样例和所述消极交互会话样例分别对应的风险热力描述知识；所述深度热力描述知识模型是依据第一模型代价变量和第二模型代价变量对所述待调试的热力描述知识模型进行模型配置数据优化所得，所述第一模型代价变量是依据所述高亮交互会话样例、所述积极交互会话样例和所述消极交互会话样例分别对应的风险热力描述知识确定的，所述第二模型代价变量是依据所述高亮交互会话样例、所述积极交互会话样例和所述消极交互会话样例分别对应的结构化语义向量和风险热力描述知识确定的。

在一些可能的实施例中，所述方法还包括：

获得所述混合调试范例，将所述混合调试范例包括的所述高亮交互会话样例、所述积极交互会话样例和所述消极交互会话样例加载至所述深度结构化语义模型中进行会话语义挖掘操作，得到所述高亮交互会话样例的第一结构化语义向量、所述积极交互会话样例的第二结构化语义向量和所述消极交互会话样例的第三结构化语义向量；

获得所述高亮交互会话样例、所述积极交互会话样例和所述消极交互会话样例分别对应的风险热力标注交互会话，将所述高亮交互会话样例、所述积极交互会话样例和所述消极交互会话样例分别对应的风险热力标注交互会话加载至所述待调试的热力描述知识模型中进行会话语义挖掘操作，得到所述高亮交互会话样例、所述积极交互会话样例和所述消极交互会话样例分别对应的风险热力描述知识；

依据所述第一结构化语义向量和所述高亮交互会话样例的风险热力描述知识确定第一会话风险联合描述项，依据所述第二结构化语义向量和所述积极交互会话样例的风险热力描述知识确定第二会话风险联合描述项，以及依据所述第三结构化语义向量和所述消极交互会话样例的风险热力描述知识确定第三会话风险联合描述项；

依据所述高亮交互会话样例、所述积极交互会话样例和所述消极交互会话样例分别对应的风险热力描述知识确定所述第一模型代价变量，依据所述第一会话风险联合描述项、所述第二会话风险联合描述项和所述第三会话风险联合描述项确定所述第二模型代价变量；

依据所述第一模型代价变量和所述第二模型代价变量对所述待调试的热力描述知识模型的模型配置数据进行优化，得到调试后的热力描述知识模型；

其中，所述深度热力描述知识模型是依据所述调试后的热力描述知识模型确定的。

在一些可能的实施例中，所述依据所述第一结构化语义向量和所述高亮交互会话样例的风险热力描述知识确定第一会话风险联合描述项，依据所述第二结构化语义向量和所述积极交互会话样例的风险热力描述知识确定第二会话风险联合描述项，以及依据所述第三结构化语义向量和所述消极交互会话样例的风险热力描述知识确定第三会话风险联合描述项，包括：

将所述高亮交互会话样例、所述积极交互会话样例和所述消极交互会话样例分别对应的风险热力描述知识加载至原始知识下采样模型中进行知识下采样处理，得到所述高亮交互会话样例、所述积极交互会话样例和所述消极交互会话样例分别对应的知识下采样处理后的风险热力描述知识；

依据所述第一结构化语义向量和所述高亮交互会话样例的知识下采样处理后的风险热力描述知识确定第一会话风险联合描述项，依据所述第二结构化语义向量和所述积极交互会话样例的知识下采样处理后的风险热力描述知识确定第二会话风险联合描述项，以及依据所述第三结构化语义向量和所述消极交互会话样例的知识下采样处理后的风险热力描述知识确定第三会话风险联合描述项。

在一些可能的实施例中，所述依据所述待分析请求应答交互会话的结构化语义向量和风险热力描述知识，确定所述待分析请求应答交互会话的会话风险联合描述项，包括：

通过目标知识下采样模型对所述待分析请求应答交互会话的风险热力描述知识进行知识下采样处理，得到所述待分析请求应答交互会话的知识下采样处理后的风险热力描述知识；所述目标知识下采样模型是依据所述第一模型代价变量和所述第二模型代价变量中的一种或者多种对所述原始知识下采样模型进行模型配置数据优化所得；

将所述待分析请求应答交互会话的结构化语义向量和知识下采样处理后的风险热力描述知识进行聚合操作，得到所述待分析请求应答交互会话的会话风险联合描述项。

在一些可能的实施例中，所述依据所述高亮交互会话样例、所述积极交互会话样例和所述消极交互会话样例分别对应的风险热力描述知识确定所述第一模型代价变量，包括：

确定所述高亮交互会话样例和所述积极交互会话样例的风险热力描述知识之间的第一逆向欧式距离，确定所述高亮交互会话样例和所述消极交互会话样例的风险热力描述知识之间的第二逆向欧式距离；

依据所述第一逆向欧式距离和所述第二逆向欧式距离之间的差别，确定混合模型代价变量；

确定所述高亮交互会话样例、所述积极交互会话样例和所述消极交互会话样例分别对应的风险热力描述知识分别对应的目标知识输出值，依据各个所述目标知识输出值以及所述高亮交互会话样例、所述积极交互会话样例和所述消极交互会话样例分别对应的风险热力描述知识，确定模型代价映射变量；

依据所述混合模型代价变量和所述模型代价映射变量确定所述第一模型代价变量。

在一些可能的实施例中，所述依据所述第一会话风险联合描述项、所述第二会话风险联合描述项和所述第三会话风险联合描述项确定所述第二模型代价变量，包括：

确定所述第一会话风险联合描述项与所述第二会话风险联合描述项之间的第三逆向欧式距离，确定所述第一会话风险联合描述项与所述第三会话风险联合描述项之间的第四逆向欧式距离；

依据所述第一结构化语义向量和所述第二结构化语义向量之间的逆向欧式距离，以及所述第一结构化语义向量和所述第三结构化语义向量之间的逆向欧式距离，确定逆向欧式距离差别限值；

依据所述第三逆向欧式距离和所述第四逆向欧式距离之间的差别以及所述逆向欧式距离差别限值，确定所述第二模型代价变量。

在一些可能的实施例中，所述获得所述待分析请求应答交互会话的风险热力标注交互会话，包括：

对所述待分析请求应答交互会话中的各个文本单元的文本特征变量进行区间数值映射处理；

将区间数值映射处理后的待分析请求应答交互会话中的第一种文本单元和第二种文本单元的文本特征变量分别优化为第一文本特征变量和第二文本特征变量，得到所述待分析请求应答交互会话的热力窗口标签集；其中，所述第一种文本单元为区间数值映射处理后文本特征变量小于预设文本特征变量的文本单元，所述第二种文本单元为区间数值映射处理后文本特征变量不小于所述预设文本特征变量的文本单元；

将所述热力窗口标签集与所述待分析请求应答交互会话进行特征运算，得到所述待分析请求应答交互会话的风险热力标注交互会话。

在一些可能的实施例中，所述方法还包括：

依据所述待分析请求应答交互会话的会话风险联合描述项访问风险描述服务系统，所述风险描述服务系统包括请求应答交互会话库中的各个请求应答交互会话的会话风险特征；

如果所述风险描述服务系统中存在与所述待分析请求应答交互会话的会话风险联合描述项相配对的命中会话风险特征，则将所述请求应答交互会话库中所述命中会话风险特征对应的请求应答交互会话确定为所述待分析请求应答交互会话的参考交互会话。

本发明还提供了一种大数据服务器，包括处理器和存储器；所述处理器和所述存储器通信连接，所述处理器用于从所述存储器中读取计算机程序并执行，以实现上述方法。

本发明还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序在运行时实现上述的方法。

本发明的实施例提供的技术方案可以包括以下有益效果：在本发明实施例中，可以通过待调试的热力描述知识模型挖掘高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的风险热力描述知识，依据高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的风险热力描述知识可以确定第一模型代价变量，依据高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的结构化语义向量和风险热力描述知识可以确定第二模型代价变量，最后可以依据第一模型代价变量和第二模型代价变量对待调试的热力描述知识模型进行模型配置数据优化所得深度热力描述知识模型。其中，第一模型代价变量通过权衡高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的风险热力描述知识之间的逆向欧式距离，能够使待调试的热力描述知识模型掌握会话文本中风险热力文本的语义细节，以提升深度热力描述知识模型挖掘的风险热力描述知识的精度；第二模型代价变量通过权衡高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的会话风险联合描述项（可以依据结构化语义向量和风险热力描述知识确定）之间的逆向欧式距离，能够使待调试的热力描述知识模型在风险热力分析的前提下还可以进行联合特征分析，从而实现全局知识（即会话风险联合描述项）的分析，使得深度热力描述知识模型挖掘的风险热力描述知识可以与结构化语义向量进行高质量的聚合，以提高深度热力描述知识模型挖掘的风险热力描述知识的精度。同时，通过高质量聚合可以在得到的会话风险联合描述项中考虑会话文本的风险热力描述知识，就算风险热力文本存在变化或出现会话文本扰动等情况，通过会话风险联合描述项同样可以精准捕捉所对应的文本集（即风险热力文本），以提高会话文本在整体层面的特征表征性能。

这样，通过深度结构化语义模型对待分析请求应答交互会话进行会话语义挖掘操作，得到待分析请求应答交互会话的结构化语义向量，通过深度热力描述知识模型对待分析请求应答交互会话的风险热力标注交互会话进行会话语义挖掘操作，得到待分析请求应答交互会话的风险热力描述知识，可以尽可能提炼待分析请求应答交互会话的不同的会话语义细节，再依据待分析请求应答交互会话的结构化语义向量和风险热力描述知识，可以进行高质量的聚合，得到待分析请求应答交互会话的会话风险联合描述项，实现对结构化语义向量的丰富，尽可能提升所挖掘的会话文本的风险描述的精度，这样可以利用准确、丰富的会话风险联合描述项进行精准可信的风险预测分析，减少因特征挖掘误差导致的风险预测分析偏差。

关于上述大数据服务器、计算机可读存储介质的效果描述参见上述方法的说明。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，此处的附图被并入说明书中并构成本说明书中的一部分，这些附图示出了符合本发明的实施例，并与说明书一起用于说明本发明的技术方案。应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1是本发明实施例示出的一种大数据服务器的方框图。

图2是本发明实施例示出的一种智能交互会话大数据分析方法的流程示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1为本发明实施例提供的大数据服务器10的结构示意图，包括处理器102、存储器104、和总线106。其中，存储器104用于存储执行指令，包括内存和外部存储器，内存也可以理解为内存储器，用于暂时存放处理器102中的运算数据，以及与硬盘等外部存储器交换的数据，处理器102通过内存与外部存储器进行数据交换，当大数据服务器10运行时，处理器102与存储器104之间通过总线106通信，使得处理器102执行本发明实施例的智能交互会话大数据分析方法。

请结合图2，图2是本发明实施例所提供的一种智能交互会话大数据分析方法的流程示意图，应用于大数据服务器，该方法示例性可以包括步骤101-步骤103。

步骤101、获得待分析请求应答交互会话，通过深度结构化语义模型对待分析请求应答交互会话进行会话语义挖掘操作，得到待分析请求应答交互会话的结构化语义向量。

在本发明实施例中，待分析请求应答交互会话可以是在线业务的交互会话文本。深度结构化语义模型（Deep Structured Semantic Models，DSSM）用于挖掘会话文本整体（全文）的语义细节（语义特征）。因此本发明通过深度结构化语义模型对待分析请求应答交互会话进行会话语义挖掘操作（会话语义特征提炼），可以得到待分析请求应答交互会话的结构化语义向量（全局的语义特征），该结构化语义向量是待分析请求应答交互会话在整体层面的语义细节。

在一些示例下，深度结构化语义模型依据混合调试范例（三元组调试范例）和通用的语义提取模型（未调试的语义提取模型）进行调试所得，混合调试范例包括高亮交互会话样例、高亮交互会话样例对应的积极交互会话样例和消极交互会话样例。其中，高亮交互会话样例与高亮交互会话样例对应的积极交互会话样例之间符合相似条件，高亮交互会话样例与高亮交互会话样例对应的消极交互会话样例之间符合不相似条件。通用的语义提取模型用于挖掘混合调试范例中高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的结构化语义向量，可以依据高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的结构化语义向量，确定参考模型代价变量（参考损失参数）和第一模型代价映射变量均值（量化代价参数的平均值），通过参考模型代价变量和第一模型代价映射变量均值对通用的语义提取模型的模型配置数据（模型参数）进行模型配置数据优化，得到优化后的语义提取模型，并依据优化后的语义提取模型确定深度结构化语义模型。此外，高亮交互会话样例可以理解为经过高亮处理或者框选处理的会话文本样例，而积极交互会话样例和消极交互会话样例则可以分别理解为会话文本正样例和会话文本负样例。

步骤102、获得待分析请求应答交互会话的风险热力标注交互会话，通过深度热力描述知识模型对待分析请求应答交互会话的风险热力标注交互会话进行会话语义挖掘操作，得到待分析请求应答交互会话的风险热力描述知识。

在本发明实施例中，待分析请求应答交互会话的风险热力标注交互会话包括待分析请求应答交互会话中的风险热力文本，风险热力文本为待分析请求应答交互会话中较为显著的、或者会话内容的风险活跃性较高（比如存在较多风险敏感词矩）的文本集。深度热力描述知识模型用于挖掘待分析请求应答交互会话的风险热力标注交互会话在整体层面的语义细节，鉴于待分析请求应答交互会话的风险热力标注交互会话中的显著会话文本为待分析请求应答交互会话中的风险热力文本，因此可以将待分析请求应答交互会话的风险热力标注交互会话在整体层面的语义细节，确定为待分析请求应答交互会话中风险热力文本的语义细节，从而对待分析请求应答交互会话中的风险热力文本进行更为准确的细节表征。本发明实施例可以通过深度热力描述知识模型对待分析请求应答交互会话的风险热力标注交互会话进行会话语义挖掘操作，得到待分析请求应答交互会话的风险热力描述知识，该风险热力描述知识是待分析请求应答交互会话中风险热力文本的语义细节。

在一些设计思路下，获得待分析请求应答交互会话中的风险热力标注交互会话的思路包括：对待分析请求应答交互会话中的各个文本单元（可以包括字、词、句中的至少一类）的文本特征变量（文本语义特征值）进行区间数值映射（归一化）处理，区间数值映射处理后的待分析请求应答交互会话中的各个文本单元的文本特征变量的取值范围是0~1。进一步可以将区间数值映射处理后的待分析请求应答交互会话中的第一种文本单元和第二种文本单元的文本特征变量分别优化为第一文本特征变量和第二文本特征变量，得到待分析请求应答交互会话的热力窗口标签集。第一种文本单元为区间数值映射处理后文本特征变量小于预设文本特征变量（可以手动设置，比如0.5）的文本单元，第二种文本单元为区间数值映射处理后文本特征变量不小于预设文本特征变量的文本单元。示例性可以将区间数值映射处理后的待分析请求应答交互会话中的第一种文本单元的文本特征变量优化为第一文本特征变量（第一文本特征变量为0），将区间数值映射处理后的待分析请求应答交互会话中的第二种文本单元的文本特征变量优化为第二文本特征变量（第二文本特征变量为1），从而得到待分析请求应答交互会话的热力窗口标签集。这样，通过本发明实施例可以通过待分析请求应答交互会话的风险热力标注交互会话准确捕捉待分析请求应答交互会话中的风险热力文本，使得后续可以对待分析请求应答交互会话的风险热力文本进行更为准确的细节表征。

在一些示例性实施例中，可以获得可逆残差模型，将待分析请求应答交互会话加载至可逆残差模型中进行处理，得到待分析请求应答交互会话的风险热力的置信权重，若该置信权重大于置信权重阈值，则实施获得待分析请求应答交互会话中的风险热力标注交互会话的步骤。如此一来，可以验证待分析请求应答交互会话是否具有风险热力文本，以确保待分析请求应答交互会话的风险热力标注交互会话中的显著会话文本为待分析请求应答交互会话中的风险热力文本。

本发明实施例中，深度热力描述知识模型是结合深度结构化语义模型和混合调试范例对待调试的热力描述知识模型进行调试所得，该混合调试范例包括高亮交互会话样例、高亮交互会话样例对应的积极交互会话样例和消极交互会话样例；在对待调试的热力描述知识模型进行调试时，深度结构化语义模型用于挖掘高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的结构化语义向量，待调试的热力描述知识模型用于挖掘高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的风险热力描述知识；深度热力描述知识模型是依据第一模型代价变量和第二模型代价变量对待调试的热力描述知识模型进行模型配置数据优化所得，第一模型代价变量是依据高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的风险热力描述知识确定的，第二模型代价变量是依据高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的结构化语义向量和风险热力描述知识确定的。

步骤103、依据待分析请求应答交互会话的结构化语义向量和风险热力描述知识，确定待分析请求应答交互会话的会话风险联合描述项。

在一些示例下，可以聚合待分析请求应答交互会话的结构化语义向量和风险热力描述知识，得到待分析请求应答交互会话的会话风险联合描述项。该聚合处理示例性可以通过融合待分析请求应答交互会话的结构化语义向量和风险热力描述知识实现。采用本发明实施例，可以在会话风险联合描述项中考虑待分析请求应答交互会话的风险热力描述知识，就算风险热力文本存在变化或出现会话文本扰动等情况，通过会话风险联合描述项同样可以精准捕捉所对应的文本集（即风险热力文本），以准确可靠地表达待分析请求应答交互会话，提高挖掘的会话文本语义细节的精度。

如此一来，大数据服务器可以通过深度结构化语义模型对待分析请求应答交互会话进行会话语义挖掘操作，得到待分析请求应答交互会话的结构化语义向量，通过深度热力描述知识模型对待分析请求应答交互会话的风险热力标注交互会话进行会话语义挖掘操作，得到待分析请求应答交互会话的风险热力描述知识，再通过有效整合待分析请求应答交互会话的结构化语义向量和风险热力描述知识，得到待分析请求应答交互会话的会话风险联合描述项，可以使得会话风险联合描述项除了可以表征待分析请求应答交互会话的全局会话文本，还可以表征待分析请求应答交互会话中的风险热力文本，从而可以实现对结构化语义向量的丰富，尽可能提升所挖掘的会话文本的风险描述的精度，这样可以利用准确、丰富的会话风险联合描述项进行精准可信的风险预测分析，减少因特征挖掘误差导致的风险预测分析偏移。

本发明实施例提供的一种深度热力描述知识模型获得方法可以包括如下相关内容。

步骤201、获得混合调试范例，混合调试范例包括高亮交互会话样例、高亮交互会话样例对应的积极交互会话样例和消极交互会话样例。

其中，获得混合调试范例的方式不限，比如可以是样本数据库中获取，也可以接收其他服务器发送的混合调试范例。

步骤202、通过深度结构化语义模型提取高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的结构化语义向量。

在一些示例下，深度结构化语义模型可以通过混合调试范例对通用的语义提取模型进行调试所得。示例性的，将混合调试范例包括的高亮交互会话样例、积极交互会话样例和消极交互会话样例分别加载至通用的语义提取模型中进行会话语义挖掘操作，得到高亮交互会话样例的结构化语义向量、积极交互会话样例的结构化语义向量和消极交互会话样例的结构化语义向量。再基于高亮交互会话样例的结构化语义向量、积极交互会话样例的结构化语义向量和消极交互会话样例的结构化语义向量，以及Triplet loss确定参考模型代价变量。该参考模型代价变量用于让通用的语义提取模型针对结构化语义向量进行语义学习，该语义学习为目标是需保障高亮交互会话样例和积极交互会话样例之间的结构化语义向量尽可能逼近（即逆向欧式距离较高），确保高亮交互会话样例和消极交互会话样例之间的结构化语义向量差别尽可能大（即逆向欧式距离较低）。其中，逆向欧式距离可以理解为特征相似度。此外，该Triplet loss可以用于确保高亮交互会话样例与积极交互会话样例的语义细节之间的逆向欧式距离，和高亮交互会话样例与消极交互会话样例的语义细节之间的逆向欧式距离之差大于逆向欧式距离差别限值（相似度阈值）。

进一步地，确定高亮交互会话样例的结构化语义向量对应的知识输出变量值、积极交互会话样例的结构化语义向量对应的知识输出变量值和消极交互会话样例的结构化语义向量对应的知识输出变量值。即将通用的语义提取模型输出的结构化语义向量中的各个特征值的取值调整到[-1，1]。

最后可以依据目标模型代价变量逆向优化（可以利用Adam算法实现）通用的语义提取模型中的模型配置数据，得到完成调试的语义提取模型，以便于后续在通用的语义提取模型调试的过程中，可以依据完成调试的语义提取模型，确定用于挖掘结构化语义向量的深度结构化语义模型。示例性可以是在目标代价函数趋于稳定或优化次数达到预设调试次数时，将完成调试的语义提取模型确定为深度结构化语义模型。

在一些示例下，在得到深度结构化语义模型之后，可以将混合调试范例包括的高亮交互会话样例、积极交互会话样例和消极交互会话样例加载至深度结构化语义模型中进行会话语义挖掘操作，得到高亮交互会话样例的第一结构化语义向量、积极交互会话样例的第二结构化语义向量和消极交互会话样例的第三结构化语义向量。

步骤203、通过待调试的热力描述知识模型提取高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的风险热力描述知识。

在一些示例性设计思路下，可以获得高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的风险热力标注交互会话，获得过程可以结合以上获得待分析请求应答交互会话的风险热力标注交互会话的过程。进一步将高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的风险热力标注交互会话加载至待调试的热力描述知识模型中进行会话语义挖掘操作，得到高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的风险热力描述知识。

步骤204、依据高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的风险热力描述知识确定第一模型代价变量。

在一些示例下，可以确定高亮交互会话样例和积极交互会话样例的风险热力描述知识之间的第一逆向欧式距离，比如，根据高亮交互会话样例的风险热力描述知识和积极交互会话样例的风险热力描述知识确定第一逆向欧式距离。还可以确定高亮交互会话样例和消极交互会话样例的风险热力描述知识之间的第二逆向欧式距离，比如基于高亮交互会话样例的风险热力描述知识和消极交互会话样例的风险热力描述知识确定第二逆向欧式距离。再依据第一逆向欧式距离和第二逆向欧式距离之间的差别，确定混合模型代价变量。示例性地结合第一逆向欧式距离、第二逆向欧式距离和Triplet loss确定混合模型代价变量。其中，第一逆向欧式距离和第二逆向欧式距离的差值可以理解为第一逆向欧式距离和第二逆向欧式距离之间的差别。该混合模型代价变量是让待调试的热力描述知识模型针对风险热力描述知识进行语义学习。该语义学习为目标是需保障高亮交互会话样例和积极交互会话样例之间的风险热力描述知识尽可能逼近（即逆向欧式距离较高），确保高亮交互会话样例和消极交互会话样例之间的风险热力描述知识差别尽可能大（即逆向欧式距离较低）。

进一步地，可以确定高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的风险热力描述知识分别对应的目标知识输出值，即将待调试的热力描述知识模型输出的风险热力描述知识中的各个特征值的取值调整到[-1，1]。

然后再依据各个目标知识输出值以及高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的风险热力描述知识，确定模型代价映射变量。示例性的，可以结合高亮交互会话样例的风险热力描述知识对应的目标知识输出值和高亮交互会话样例的风险热力描述知识中该知识输出变量值对应的特征值确定第四模型代价映射变量。可以结合积极交互会话样例的风险热力描述知识对应的目标知识输出值和积极交互会话样例的风险热力描述知识中该知识输出变量值对应的特征值确定第五模型代价映射变量。可以结合消极交互会话样例的风险热力描述知识对应的目标知识输出值和消极交互会话样例的风险热力描述知识中该知识输出变量值对应的特征值确定第六模型代价映射变量。进一步地，根据第四模型代价映射变量、第五模型代价映射变量和第六模型代价映射变量的均值得到第二模型代价映射变量均值。进一步将第二模型代价映射变量均值作为模型代价映射变量。最后结合Triplet loss的权重和模型代价映射变量的权重，以及混合模型代价变量和模型代价映射变量确定第一模型代价变量。其中，模型代价映射变量用于使得待调试的热力描述知识模型进行模型学习，可以使得到的深度热力描述知识模型输出的风险热力描述知识的特征处于[-1，1]之间。

步骤205、依据高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的结构化语义向量和风险热力描述知识确定第二模型代价变量。

在一些示例下，可以依据第一结构化语义向量和高亮交互会话样例的风险热力描述知识确定第一会话风险联合描述项，依据第二结构化语义向量和积极交互会话样例的风险热力描述知识确定第二会话风险联合描述项，以及依据第三结构化语义向量和消极交互会话样例的风险热力描述知识确定第三会话风险联合描述项。示例性的，将第一结构化语义向量和高亮交互会话样例的风险热力描述知识进行组合，得到第一会话风险联合描述项，将第二结构化语义向量和积极交互会话样例的风险热力描述知识进行组合，得到第二会话风险联合描述项，以及将第三结构化语义向量和消极交互会话样例的风险热力描述知识进行组合，得到第三会话风险联合描述项。

在另外的设计思路下，可以将高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的风险热力描述知识加载至原始知识下采样模型中进行知识下采样处理（特征压缩操作），得到高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的知识下采样处理后的风险热力描述知识，再依据第一结构化语义向量和高亮交互会话样例的知识下采样处理后的风险热力描述知识确定第一会话风险联合描述项，依据第二结构化语义向量和积极交互会话样例的知识下采样处理后的风险热力描述知识确定第二会话风险联合描述项，以及依据第三结构化语义向量和消极交互会话样例的知识下采样处理后的风险热力描述知识确定第三会话风险联合描述项。即将第一结构化语义向量和高亮交互会话样例的知识下采样处理后的风险热力描述知识进行组合，得到第一会话风险联合描述项，将第二结构化语义向量和积极交互会话样例的知识下采样处理后的风险热力描述知识进行组合，得到第二会话风险联合描述项，以及将第三结构化语义向量和消极交互会话样例的知识下采样处理后的风险热力描述知识进行组合，得到第三会话风险联合描述项。在一些示例下，原始知识下采样模型可以是Multilayer Perceptron等。

进一步地，可以确定第一会话风险联合描述项与第二会话风险联合描述项之间的第三逆向欧式距离。比如结合第一会话风险联合描述项和第二会话风险联合描述项确定第三逆向欧式距离。然后确定第一会话风险联合描述项与第三会话风险联合描述项之间的第四逆向欧式距离，比如结合第一会话风险联合描述项和第三会话风险联合描述项确定第四逆向欧式距离。进一步根据第三逆向欧式距离-第四逆向欧式距离可以得到第三逆向欧式距离和第四逆向欧式距离之间的差别，最后依据第三逆向欧式距离和第四逆向欧式距离之间的差别以及逆向欧式距离差别限值，确定第二模型代价变量，比如结合第三逆向欧式距离、第四逆向欧式距离和逆向欧式距离差别限值和Triplet loss确定第二模型代价变量。该第二模型代价变量是让待调试的热力描述知识模型针对会话风险联合描述项进行语义学习。该语义学习为目标是需保障高亮交互会话样例和积极交互会话样例之间的会话风险联合描述项尽可能逼近（即逆向欧式距离较高），确保高亮交互会话样例和消极交互会话样例之间的会话风险联合描述项差别尽可能大（即逆向欧式距离较低）。

步骤206、依据第一模型代价变量和第二模型代价变量对待调试的热力描述知识模型进行模型配置数据优化，得到深度热力描述知识模型。

在一些示例下，可以计算第一模型代价变量和第二模型代价变量之和，得到聚合模型代价变量，通过聚合模型代价变量逆向优化（可以通过Adam算法实现）待调试的热力描述知识模型的模型配置数据；还可以先用第一模型代价变量逆向优化待调试的热力描述知识模型的模型配置数据，再用第二模型代价变量在第一模型代价变量优化的前提下，再次逆向优化待调试的热力描述知识模型的模型配置数据。在得到调试后的热力描述知识模型之后，可以依据调试后的热力描述知识模型确定深度热力描述知识模型。可选地，当聚合模型代价变量小于代价变量阈值时或调试次数达到设定次数阈值时，可以将调试后的热力描述知识模型确定为深度热力描述知识模型。

其中，第一模型代价变量中的混合模型代价变量通过权衡相似范例二元组（包括高亮交互会话样例和积极交互会话样例）的风险热力描述知识之间的逆向欧式距离是否够大，以及不相似范例二元组（包括高亮交互会话样例和消极交互会话样例）的风险热力描述知识之间的逆向欧式距离是否够小，让待调试的热力描述知识模型能够学习会话文本中风险热力文本的语义细节，以提升深度热力描述知识模型挖掘的风险热力描述知识的精度，此外，第一模型代价变量中的模型代价映射变量能够使深度热力描述知识模型挖掘的风险热力描述知识的取值区间为[-1，1]（即模型学习的作用）；第二模型代价变量通过权衡相似范例二元组的会话风险联合描述项之间的逆向欧式距离是否够大，以及不相似范例二元组的会话风险联合描述项之间的逆向欧式距离是否够小，让待调试的热力描述知识模型在风险热力分析的前提下还可以进行联合特征分析，从而实现全局知识（即会话风险联合描述项）的分析，使得深度热力描述知识模型挖掘的风险热力描述知识可以与结构化语义向量进行高质量的聚合，以提高深度热力描述知识模型输出的风险热力描述知识的精度。此外，通过高质量聚合可以在得到的会话风险联合描述项中考虑会话文本的风险热力描述知识，就算风险热力文本存在变化或出现会话文本扰动等情况，通过会话风险联合描述项同样可以精准捕捉所对应的文本集（即风险热力文本），以提高会话文本在整体层面的特征表征性能。

在一些示例下，还可以依据第一模型代价变量和第二模型代价变量中的一种或者多种对原始知识下采样模型进行模型配置数据优化所得调试后的知识下采样模型，并依据调试后的知识下采样模型确定目标知识下采样模型。即可以通过第一模型代价变量对原始知识下采样模型进行模型配置数据逆向优化，也可以通过第二模型代价变量对原始知识下采样模型进行模型配置数据逆向优化，还可以通过第一模型代价变量和第二模型代价变量之和对原始知识下采样模型进行模型配置数据逆向优化。其中，逆向优化可以理解为反馈式训练。

在一些示例性实施例中，上述依据待分析请求应答交互会话的结构化语义向量和风险热力描述知识，确定待分析请求应答交互会话的会话风险联合描述项，包括：通过目标知识下采样模型对待分析请求应答交互会话的风险热力描述知识进行知识下采样处理，得到待分析请求应答交互会话的知识下采样处理后的风险热力描述知识，将待分析请求应答交互会话的结构化语义向量和知识下采样处理后的风险热力描述知识进行聚合操作，得到待分析请求应答交互会话的会话风险联合描述项。通过目标知识下采样模型可以对风险热力描述知识进行知识的提炼。

在一些示例性实施例中，可以将X*Y个混合调试范例拆解为多个调试样例组，每个调试样例组包括至少一个混合调试范例，针对每一个调试样例组，可以通过当前调试样例组中每一个混合调试范例以及待调试的热力描述知识模型和深度结构化语义模型得到该每一个混合调试范例对应的第一模型代价变量和第二模型代价变量，根据当前调试样例组中所有混合调试范例对应的第一模型代价变量和第二模型代价变量之和的均值逆向优化待调试的热力描述知识模型的模型配置数据，得到调试后的热力描述知识模型，在完成一次调试后，可以在当前的前提下，再取下一个调试样例组继续优化调试后的热力描述知识模型中的模型配置数据，直至符合调试终止要求，如达到预定数目的调试次数就符合调试终止要求，或第一模型代价变量和第二模型代价变量之和的均值小于预设代价变量阈值就符合调试终止要求。此时可以将调试后的热力描述知识模型作为深度热力描述知识模型。

在另外的设计思路下，还提供一种智能交互会话大数据分析方法，该方法包括：可以通过目标模型代价变量对通用的语义提取模型的模型配置数据进行优化，得到完成调试的语义提取模型，并依据完成调试的语义提取模型确定深度结构化语义模型。深度结构化语义模型可以提取混合调试范例中高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的结构化语义向量，待调试的热力描述知识模型可以提取混合调试范例中高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的风险热力描述知识，再加载至原始知识下采样模型可以得到知识下采样处理后的各个风险热力描述知识。可以将高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的结构化语义向量与对应的知识下采样处理后的风险热力描述知识进行组合，得到高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的会话风险联合描述项。通过高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的风险热力描述知识可以确定Triplet Loss和量化代价，从而可以使待调试的热力描述知识模型可以针对风险热力描述知识进行语义学习和模型学习，通过高亮交互会话样例、积极交互会话样例和消极交互会话样例分别对应的会话风险联合描述项可以使待调试的热力描述知识模型和原始知识下采样模型对会话风险联合描述项进行语义学习，从而使待调试的热力描述知识模型在风险热力分析的前提下还可以进行联合特征分析，可以提高深度热力描述知识模型挖掘的风险热力描述知识的精度。

应用本发明实施例，能够使待调试的热力描述知识模型挖掘风险热力描述知识，以及利用深度结构化语义模型挖掘结构化语义向量，通过组合风险热力描述知识和结构化语义向量得到会话风险联合描述项，可以使待调试的热力描述知识模型能够在风险热力分析的前提下，通过会话风险联合描述项实现全面调试，从而使得到的深度热力描述知识模型能够挖掘更为精准的风险热力描述知识，以提高会话风险联合描述项的精度。

在一些可独立的实施例中，在所述依据所述待分析请求应答交互会话的结构化语义向量和风险热力描述知识，确定所述待分析请求应答交互会话的会话风险联合描述项之后，所述方法还包括：利用所述会话风险联合描述项对所述待分析请求应答交互会话的风险类别进行预测分析。

本发明实施例中，在获得了精度更高、细节更为丰富的会话风险联合描述项之后，能够利用该会话风险联合描述项对待分析请求应答交互会话的风险类别进行准确可靠的预测分析，减少预测分析过程中的误差和偏差。例如，可以基于预先训练的深度决策树模型对会话风险联合描述项进行决策分类，从而得到待分析请求应答交互会话的对应的风险类别以及该风险类别对应的置信度。

进一步地，还提供了一种可读存储介质，其上存储有程序，该程序被处理器执行时实现上述的方法。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述示例性描述的系统和装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。在本发明所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其他的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其他的形式。

Claims

1.一种智能交互会话大数据分析方法，其特征在于，应用于大数据服务器，所述方法包括：

其中，所述获得所述待分析请求应答交互会话的风险热力标注交互会话，包括：对所述待分析请求应答交互会话中的各个文本单元的文本特征变量进行区间数值映射处理；将区间数值映射处理后的待分析请求应答交互会话中的第一种文本单元和第二种文本单元的文本特征变量分别优化为第一文本特征变量和第二文本特征变量，得到所述待分析请求应答交互会话的热力窗口标签集；其中，所述第一种文本单元为区间数值映射处理后文本特征变量小于预设文本特征变量的文本单元，所述第二种文本单元为区间数值映射处理后文本特征变量不小于所述预设文本特征变量的文本单元；将所述热力窗口标签集与所述待分析请求应答交互会话进行特征运算，得到所述待分析请求应答交互会话的风险热力标注交互会话；

其中，所述深度热力描述知识模型是综合所述深度结构化语义模型和混合调试范例对待调试的热力描述知识模型进行调试所得，所述混合调试范例包括高亮交互会话样例、所述高亮交互会话样例对应的积极交互会话样例和消极交互会话样例；在对所述待调试的热力描述知识模型进行调试时，所述深度结构化语义模型用于挖掘所述高亮交互会话样例、所述积极交互会话样例和所述消极交互会话样例分别对应的结构化语义向量，所述待调试的热力描述知识模型用于挖掘所述高亮交互会话样例、所述积极交互会话样例和所述消极交互会话样例分别对应的风险热力描述知识；所述深度热力描述知识模型是依据第一模型代价变量和第二模型代价变量对所述待调试的热力描述知识模型进行模型配置数据优化所得，所述第一模型代价变量是依据所述高亮交互会话样例、所述积极交互会话样例和所述消极交互会话样例分别对应的风险热力描述知识确定的，所述第二模型代价变量是依据所述高亮交互会话样例、所述积极交互会话样例和所述消极交互会话样例分别对应的结构化语义向量和风险热力描述知识确定的；

其中，所述方法还包括：

其中，所述深度热力描述知识模型是依据所述调试后的热力描述知识模型确定的；

其中，所述依据所述高亮交互会话样例、所述积极交互会话样例和所述消极交互会话样例分别对应的风险热力描述知识确定所述第一模型代价变量，包括：

依据所述混合模型代价变量和所述模型代价映射变量确定所述第一模型代价变量；

其中，所述依据所述第一会话风险联合描述项、所述第二会话风险联合描述项和所述第三会话风险联合描述项确定所述第二模型代价变量，包括：

2.根据权利要求1所述的方法，其特征在于，所述依据所述第一结构化语义向量和所述高亮交互会话样例的风险热力描述知识确定第一会话风险联合描述项，依据所述第二结构化语义向量和所述积极交互会话样例的风险热力描述知识确定第二会话风险联合描述项，以及依据所述第三结构化语义向量和所述消极交互会话样例的风险热力描述知识确定第三会话风险联合描述项，包括：

3.根据权利要求2所述的方法，其特征在于，所述依据所述待分析请求应答交互会话的结构化语义向量和风险热力描述知识，确定所述待分析请求应答交互会话的会话风险联合描述项，包括：

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

5.一种大数据服务器，其特征在于，包括处理器和存储器；所述处理器和所述存储器通信连接，所述处理器用于从所述存储器中读取计算机程序并执行，以实现上述权利要求1-4任一项所述的方法。

6.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，所述计算机程序在运行时实现上述权利要求1-4任一项所述的方法。