CN115099233A

CN115099233A - 一种语义解析模型的构建方法、装置、电子设备及存储介质

Info

Publication number: CN115099233A
Application number: CN202210745420.7A
Authority: CN
Inventors: 周柱君; 张舒婷
Original assignee: Ping An Bank Co Ltd
Current assignee: Ping An Bank Co Ltd
Priority date: 2022-06-27
Filing date: 2022-06-27
Publication date: 2022-09-23

Abstract

本申请实施例提供一种语义解析模型的构建方法、装置、电子设备及存储介质，其中，该方法包括：构建包含语义信息的训练数据集；将所述训练数据集进行拆分重排，得到增强数据集；构建语义信息编码层、分类解析层和分类结果规范层；根据所述语义信息编码层、所述分类解析层和所述分类结果规范层构建所述语义解析模型；将所述增强数据集输入所述语义解析模型，得到语义解析结果。实施本申请实施例，可以构建一种更加准确地语义解析模型，提高解析效率，缩短解析时间，省去人工审核的过程，同时减少人力成本，节省开支。

Description

一种语义解析模型的构建方法、装置、电子设备及存储介质

技术领域

本申请涉及神经网络技术领域，具体而言，涉及一种语义解析模型的构建方法、装置、电子设备及计算机可读存储介质。

背景技术

当前，随着语义解析模型的应用越来越广泛，越来越多的行业开始使用语义解析模型来提高效率，例如，银行的个人消费贷款业务，来银行申请消费金融贷款的客户数量呈现指数增长的趋势，来银行办理贷款业务时，通常需要银行的工作人员对客户进行贷前审核，而此时，可以应用语义解析模型来缓解审核压力。

传统审核都是通过银行的工作人员面对面对客户进行审核，因而需要大量的工作人员来对申请贷款的客户进行人工贷前面审，这导致需要大量的工作人员来配合完成此项工作，但是，工作人员的数量无法根据客户的数量进行指数型增长，导致很多银行贷款业务停滞。

然而，由于审核业务的复杂、特殊性，现有的语义解析模型无法准确地解析到审核表单的信息，这导致经常需要客户进行大量修改，并且无限延长了客户的等待时间，这为客户和银行都带来极大的不便。

发明内容

本申请实施例的目的在于提供一种语义解析模型的构建方法、装置、电子设备及计算机可读存储介质，可以构建一种更加准确地语义解析模型，提高解析效率，缩短解析时间，省去人工审核的过程，同时减少人力成本，节省开支。

第一方面，本申请实施例提供了一种语义解析模型的构建方法，所述方法包括：

构建包含语义信息的训练数据集；

将所述训练数据集进行拆分重排，得到增强数据集；

构建语义信息编码层、分类解析层和分类结果规范层；

根据所述语义信息编码层、所述分类解析层和所述分类结果规范层构建所述语义解析模型；

将所述增强数据集输入所述语义解析模型，得到语义解析结果。

在上述实现过程中，构建包含语义信息的训练数据集，根据训练数据集进行拆分重排，再通过构建的语义解析模型得到语义分析结果，可以构建一种更加准确地语义解析模型，提高解析效率，缩短解析时间，省去人工审核的过程，同时减少人力成本，节省开支。

进一步地，所述构建包含语义信息的训练数据集的步骤，包括：

获取初始数据集和语义特征；

对所述初始数据集中包含所述语义特征的数据进行标注，得到所述包含语义信息的训练数据集。

在上述实现过程中，对数据集中包含语义特征的数据进行标注，可以使得语义特征突显出来，便于训练过程中语义解析模型对于语义特征的抽取。

进一步地，所述将所述训练数据集进行拆分重排，得到增强数据集的步骤，包括：

将所述训练数据集中被标注的数据进行拆分，得到拆分数据集；

获取子标签；

将所述拆分数据集按所述子标签进行重排，得到所述增强数据集。

在上述实现过程中，对训练数据集中被标注的数据进行拆分，并根据子标签进行重排，可以将训练数据集中的特征进行确认，减少出错概率，使得后续解析的准确度更高。

进一步地，所述将所述增强数据集输入所述语义解析模型，得到语义解析结果的步骤，包括：

将所述增强数据输入所述语义信息编码层，得到语义编码向量；

将所述语义编码向量输入所述分类解析层，得到分类结果；

所述分类结果输入所述分类结果规范层，得到所述语义解析结果。

在上述实现过程中，根据语义信息编码层、分类解析层和分类结果规范层分别进行语义特征的提取，使得每一层对语义的解析更加精准，提高解析结果的准确率，节省解析时间。

进一步地，所述将所述增强数据输入所述语义信息编码层，得到语义编码向量的步骤，还包括：

将所述增强数据进行分词，得到子字符序列；

将所述子字符序列输入所述语义信息编码层，得到所述语义编码向量。

在上述实现过程中，将增强数据进行分词，得到子字符序列后再输入语义信息编码层，使得到的语义编码向量可以携带更多的语义特征，保证语义编码向量的准确性。

进一步地，根据以下公式将所述语义编码向量输入所述分类解析层，得到分类结果：

其中，Bi-LSTM为所述分类解析层所采用的长短期记忆双向循环神经网络，

为所述子字符序列的正向隐藏状态编码，

为所述子字符序列的反向隐藏状态编码，

为所述语义编码向量中的正反向合并隐藏状态编码，Classification Head为分类子网络，O_i为所述分类结果，e_i为所述语义编码向量。

进一步地，根据以下公式得到所述语义解析结果：

其中，t_k为一种特征函数，s_l为另一种特征函数，λ_k为t_k对应的权重，u_l为s_l对应的权重，Z(O)为归一化因子，O_i为所述分类结果，O_i‘为所述语义解析结果。

第二方面，本申请实施例还提供了一种语义解析模型的构建装置，所述装置包括：

构建模块，用于构建包含语义信息的训练数据集；还用于构建语义信息编码层、分类解析层和分类结果规范层；还用于根据所述语义信息编码层、所述分类解析层和所述分类结果规范层构建所述语义解析模型；

拆分重排模块，用于将所述训练数据集进行拆分重排，得到增强数据集；

输入模块，用于将所述增强数据集输入所述语义解析模型，得到语义解析结果。

第三方面，本申请实施例提供的一种电子设备，包括：存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如第一方面任一项所述的方法的步骤。

第四方面，本申请实施例提供的一种计算机可读存储介质，所述存储介质上存储有指令，当所述指令在计算机上运行时，使得所述计算机执行如第一方面任一项所述的方法。

第五方面，本申请实施例提供的一种计算机程序产品，所述计算机程序产品在计算机上运行时，使得计算机执行如第一方面任一项所述的方法。

本公开的其他特征和优点将在随后的说明书中阐述，或者，部分特征和优点可以从说明书推知或毫无疑义地确定，或者通过实施本公开的上述技术即可得知。

并可依照说明书的内容予以实施，以下以本申请的较佳实施例并配合附图详细说明如后。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的语义解析模型的构建方法的流程示意图；

图2为本申请实施例提供的语义解析模型的构建装置的结构组成示意图；

图3为本申请实施例提供的电子设备的结构组成示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。同时，在本申请的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

下面结合附图和实施例，对本申请的具体实施方式作进一步详细描述。以下实施例用于说明本申请，但不用来限制本申请的范围。

实施例一

图1是本申请实施例提供的语义解析模型的构建方法的流程示意图，如图1所示，该方法包括：

S1，构建包含语义信息的训练数据集；

S2，将训练数据集进行拆分重排，得到增强数据集；

S3，构建语义信息编码层、分类解析层和分类结果规范层；

S4，根据语义信息编码层、分类解析层和分类结果规范层构建语义解析模型；

S5，将增强数据集输入语义解析模型，得到语义解析结果。

进一步地，S1包括：

获取初始数据集和语义特征；

对初始数据集中包含语义特征的数据进行标注，得到包含语义信息的训练数据集。

进一步地，S2包括：

将训练数据集中被标注的数据进行拆分，得到拆分数据集；

获取子标签；

将拆分数据集按子标签进行重排，得到增强数据集。

进一步地，S5包括：

将增强数据输入语义信息编码层，得到语义编码向量；

将语义编码向量输入分类解析层，得到分类结果；

分类结果输入分类结果规范层，得到语义解析结果。

进一步地，将所述增强数据输入所述语义信息编码层，得到语义编码向量的步骤，还包括：

将增强数据进行分词，得到子字符序列；

将子字符序列输入语义信息编码层，得到语义编码向量。

语义信息编码层Embedding主要用于融合数据中的语义信息。语义信息编码层Embedding实际为预训练好的语义嵌入编码层，其取自在海量文本上进行了语义预训练后的Bert中文预训练模型中的语义嵌入编码层。此时语义信息编码层中包含了在海量文本的语义预训练过程中学习到的语义编码即将子字符序列转换为的语义编码向量，转换后的语义编码向量继而可以被输入分类解析层中进行解析。

增强数据中的文本字符串，会先被分词为一个个子字符序列，接着分词后得到的所有子字符序列会被输入进语义信息编码层中进行语义嵌入编码，继而将所有子字符序列转换为语义编码向量，其计算过程如下公式所示:

Tokenization(t)∝(x₁,x₂,...,x_i...x_n)0≤i≤n

e_i＝Embedding(x_i)

其中，t代表文本字符串，x_i子字符序列，Embedding(x_i)表示语义信息编码层对子字符序列进行语义嵌入编码，e_i为子字符序列编码转换后的语义编码向量。

进一步地，根据以下公式将所述语义编码向量输入分类解析层，得到分类结果：

其中，Bi-LSTM为分类解析层所采用的长短期记忆双向循环神经网络，

为子字符序列的正向隐藏状态编码，

为子字符序列的反向隐藏状态编码，

为语义编码向量中的正反向合并隐藏状态编码，Classification Head为分类子网络，O_i为分类结果，e_i为语义编码向量。

在语义信息编码层将文本字符串转换为一个个子字符序列的语义编码向量后，将所有的语义编码向量输入分类解析层LSTM中进行解析。分类解析层LSTM可以将文本字符串中的每一个子字符序列分类解析为多个种类的元素，即得到分类结果。

分类解析层LSTM也称为长短期记忆双向循环神经网络，分类解析层LSTM会对文本字符串中所有子字符序列的语义编码向量进行正向与反向的循环编码计算，再将最后一层隐藏层中子字符序列的正向隐藏状态编码与反向隐藏状态编码横向合并，继而将子字符序列的正反向合并的隐藏状态编码输入分类解析层LSTM中的分类子网络中，以进行分类。

进一步地，根据以下公式得到语义解析结果：

其中，t_k为一种特征函数，s_l为另一种特征函数，λ_k为t_k对应的权重，u_l为s_l对应的权重，Z(O)为归一化因子，O_i为分类结果，O_i‘为语义解析结果。

分类结果规范层CRF也称为条件随机场模型。分类结果规范层CRF被用来对分类解析层LSTM输出的分类结果进行规范与约束。当分类结果规范层CRF对分类解析层LSTM输出的分类结果进行规范与约束后，便能防止分类结果中出现排列错误的问题，使得语义解析结果更加准确。

本申请实施例可以应用于银行对客户的业务审核，可以有效地提高审核的效率，简化审核的流程，银行的审核业务在使用本申请实施例提供的语义解析模型进行审核表单的审核后，可以更准确、有效地将审核表单中的语义信息提取出来，大大减少了工作人员的工作量，同时避免客户出现长时间等待，提高客户体验感。

实施例二

为了执行上述实施例一对应的方法，以实现相应的功能和技术效果，下面提供一种语义解析模型的构建装置，如图2所示，该装置包括：

构建模块1，用于构建模块，用于构建包含语义信息的训练数据集；还用于构建语义信息编码层、分类解析层和分类结果规范层；还用于根据语义信息编码层、分类解析层和分类结果规范层构建语义解析模型；

拆分重排模块2，用于将训练数据集进行拆分重排，得到增强数据集；

输入模块3，用于将增强数据集输入语义解析模型，得到语义解析结果。

进一步地，构建模块1还用于：

获取初始数据集和语义特征；

进一步地，拆分重排模块2还用于：

将训练数据集中被标注的数据进行拆分，得到拆分数据集；

获取子标签；

将拆分数据集按子标签进行重排，得到增强数据集。

进一步地，输入模块3还用于：

将增强数据输入语义信息编码层，得到语义编码向量；

将语义编码向量输入分类解析层，得到分类结果；

分类结果输入分类结果规范层，得到语义解析结果。

进一步地，输入模块3还用于：

将增强数据进行分词，得到子字符序列；

将子字符序列输入语义信息编码层，得到语义编码向量。

进一步地，输入模块3还用于根据以下公式将语义编码向量输入分类解析层，得到分类结果：

为子字符序列的正向隐藏状态编码，

为子字符序列的反向隐藏状态编码，

进一步地，输入模块3还用于根据以下公式得到语义解析结果：

上述的语义解析模型的构建装置可实施上述实施例一的方法。上述实施例一中的可选项也适用于本实施例，这里不再详述。

本申请实施例的其余内容可参照上述实施例一的内容，在本实施例中，不再进行赘述。

实施例三

本申请实施例提供一种电子设备，包括存储器及处理器，该存储器用于存储计算机程序，该处理器运行计算机程序以使电子设备执行实施例一的语义解析模型的构建方法。

可选地，上述电子设备可以是服务器。

请参见图3，图3为本申请实施例提供的电子设备的结构组成示意图。该电子设备可以包括处理器31、通信接口32、存储器33和至少一个通信总线34。其中，通信总线34用于实现这些组件直接的连接通信。其中，本申请实施例中设备的通信接口32用于与其他节点设备进行信令或数据的通信。处理器31可以是一种集成电路芯片，具有信号的处理能力。

上述的处理器31可以是通用处理器，包括中央处理器(Central ProcessingUnit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器31也可以是任何常规的处理器等。

存储器33可以是，但不限于，随机存取存储器(Random Access Memory，RAM)，只读存储器(Read Only Memory，ROM)，可编程只读存储器(Programmable Read-Only Memory，PROM)，可擦除只读存储器(Erasable Programmable Read-Only Memory，EPROM)，电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory，EEPROM)等。存储器33中存储有计算机可读取指令，当计算机可读取指令由所述处理器31执行时，设备可以执行上述图1方法实施例涉及的各个步骤。

可选地，电子设备还可以包括存储控制器、输入输出单元。存储器33、存储控制器、处理器31、外设接口、输入输出单元各元件相互之间直接或间接地电性连接，以实现数据的传输或交互。例如，这些元件相互之间可通过一条或多条通信总线34实现电性连接。处理器31用于执行存储器33中存储的可执行模块，例如设备包括的软件功能模块或计算机程序。

输入输出单元用于提供给用户创建任务以及为该任务创建启动可选时段或预设执行时间以实现用户与服务器的交互。输入输出单元可以是，但不限于，鼠标和键盘等。

可以理解，图3所示的结构仅为示意，电子设备还可包括比图3中所示更多或者更少的组件，或者具有与图3所示不同的配置。图3中所示的各组件可以采用硬件、软件或其组合实现。

另外，本申请实施例还提供一种计算机可读存储介质，其存储有计算机程序，该计算机程序被处理器执行时实现实施例一的语义解析模型的构建方法。

本申请实施例还提供一种计算机程序产品，该计算机程序产品在计算机上运行时，使得计算机执行方法实施例所述的方法。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。

也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的装置来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本申请的实施例而已，并不用于限制本申请的保护范围，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应所述以权利要求的保护范围为准。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。