CN110532545A

CN110532545A - 一种基于复合神经网络建模的数据信息抽取方法

Info

Publication number: CN110532545A
Application number: CN201910665705.8A
Authority: CN
Inventors: 肖清林
Original assignee: Fujian Singularity Space-Time Digital Technology Co Ltd
Current assignee: Xiamen Useear Information Technology Co ltd
Priority date: 2019-07-23
Filing date: 2019-07-23
Publication date: 2019-12-03

Abstract

一种基于复合神经网络建模的数据信息抽取方法，方法步骤包括：建立训练模块和复合神经网络模型；利用训练模块对复合神经网络模型进行训练；收集数据信息，构建数据库模块；利用优化的复合神经网络模型对数据库模块进行信息抽取。本发明在BP和CNN的复合神经网络模型的基础上，对信息进行抽取，两者的配合、互补，使得信息抽取准确性高，速度快，满足当前对信息抽取的需求。

Description

一种基于复合神经网络建模的数据信息抽取方法

技术领域

本发明涉及数据信息抽取领域，尤其涉及一种基于复合神经网络建模的数据信息抽取方法。

背景技术

人工神经网络，是20世纪80年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象，建立某种简单模型，按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型，由大量的节点(或称神经元)之间相互联接构成。每个节点代表一种特定的输出函数，称为激励函数。每两个节点间的连接都代表一个对于通过该连接信号的加权值，称之为权重，这相当于人工神经网络的记忆。网络的输出则依网络的连接方式，权重值和激励函数的不同而不同。最近十多年来，人工神经网络的研究工作不断深入，已经取得了很大的进展，其在模式识别、智能机器人、自动控制、预测估计、生物、医学、经济等领域已成功地解决了许多现代计算机难以解决的实际问题，表现出了良好的智能特性，人工神经网络的种类也逐渐多样，其中BP和CNN应用最为广泛。

其中BP是一种按误差反向传播训练的多层前馈网络，它的基本思想是梯度下降法，利用梯度搜索技术，以期使网络的实际输出值和期望输出值的误差均方差为最小；CNN是一类包含卷积计算且具有深度结构的前馈神经网络，仿造生物的视知觉机制构建，可以进行监督学习和非监督学习，其隐含层内的卷积核参数共享和层间连接的稀疏性使得CNN能够以较小的计算量对格点化特征。但两种神经网络单独使用时，仍然具有一定的局限性，比如在对数据信息抽取时，单独的一种神经网络模型的准确性和高效性已经不能满足人们的需求。

为解决上述问题，本申请中提出一种基于复合神经网络建模的数据信息抽取方法。

发明内容

(一)发明目的

为解决背景技术中存在的技术问题，本发明提出一种基于复合神经网络建模的数据信息抽取方法，本发明在BP和CNN的复合神经网络模型的基础上，对信息进行抽取，两者的配合、互补，使得信息抽取准确性高，速度快，满足当前对信息抽取的需求。

(二)技术方案

为解决上述问题，本发明提供了一种基于复合神经网络建模的数据信息抽取方法，包括如下步骤：

S1、建立训练模块和复合神经网络模型，其中复合神经网络模型由CNN和 BP复合构成；

S2、利用训练模块对复合神经网络模型进行训练，得到优化的复合神经网络模型；其中优化的复合神经网络模型包括输入模块、隐模块和输出模块；

S3、收集数据信息，构建数据库模块；

S4、利用优化的复合神经网络模型对数据库模块进行信息抽取；抽取过程为：

a1、通过输入模块向优化的复合神经网络模型下达指令信号；

a2、信号输送至隐模块，并沿正方向在神经元之间逐级传递；

a3、若在传递过程中得到匹配的数据信息，输出模块将数据信息调出，结束工作过程；

a4、若信号传递至神经网络的底端，仍未得到匹配数据信息，则转入反向传播，信号沿原路径返回；返回过程中，修改各级神经元的权值和阈值，减小信号误差；

a5、信号不断沿正反方向往返在各级神经元之间，并同时修改各级神经元的权值和阈值，直至得到匹配的数据信息，输出模块将数据信息调出，结束工作过程。

优选的，在S2中，利用训练模块对复合神经网络模型进行训练包括信号的前向传播和误差的反向传播两个过程。

优选的，计算误差输出时按从输入到输出的方向进行，而调整权值和阈值则从输出到输入的方向进行；正向传播时，输入模块输入信号，通过隐模块作用于输出节点，经过非线性变换，通过输出模块产生输出信号，若实际输出与期望输出不相符，则转入误差的反向传播过程；误差反传是将输出误差通过隐模块向输入模块逐层反传，并将误差分摊给各层所有神经元，从各层神经元获得的误差信号，调整各神经元的权值和阈值。通过调整输入模块节点与隐模块节点的联接强度以及阈值，使误差沿梯度方向下降，经过反复学习训练，确定与最小误差相对应的网络参数(权值和阈值)，训练即告停止。

优选的，隐模块中设置有卷积层。

优选的，用于对输入数据进行特征提取的卷积层，其内部包含多个卷积核；卷积核在工作时，对输入特征做矩阵元素乘法求和并叠加偏差量，计算函数为

其中b为偏差量，Z^l和Z^l+1表示第l+1层的卷积输入和输出，也被称为特征图，L_l+1为Z_l+1的尺寸，这里假设特征图长宽相同，Z(i，j)对应特征图的像素，K为特征图的通道数，f、s₀和p是卷积层参数，对应卷积核大小、卷积步长和填充层数。

本发明的上述技术方案具有如下有益的技术效果：

本发明在BP和CNN的复合神经网络模型的基础上，对信息进行抽取，其中BP是一种按误差反向传播训练的多层前馈网络，它的基本思想是梯度下降法，利用梯度搜索技术，以期使网络的实际输出值和期望输出值的误差均方差为最小；CNN是一类包含卷积计算且具有深度结构的前馈神经网络，仿造生物的视知觉机制构建，可以进行监督学习和非监督学习，其隐含层内的卷积核参数共享和层间连接的稀疏性使得CNN能够以较小的计算量对格点化特征；两者的配合、互补，使得信息抽取准确性高，速度快，满足当前对信息抽取的需求。

附图说明

图1为本发明提出的一种基于复合神经网络建模的数据信息抽取方法的流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明了，下面结合具体实施方式并参照附图，对本发明进一步详细说明。应该理解，这些描述只是示例性的，而并非要限制本发明的范围。此外，在以下说明中，省略了对公知结构和技术的描述，以避免不必要地混淆本发明的概念。

如图1所示，本发明提出的一种基于复合神经网络建模的数据信息抽取方法，包括如下步骤：

S3、收集数据信息，构建数据库模块；

在一个可选的实施例中，在S2中，利用训练模块对复合神经网络模型进行训练包括信号的前向传播和误差的反向传播两个过程。

在一个可选的实施例中，计算误差输出时按从输入到输出的方向进行，而调整权值和阈值则从输出到输入的方向进行；正向传播时，输入模块输入信号，通过隐模块作用于输出节点，经过非线性变换，通过输出模块产生输出信号，若实际输出与期望输出不相符，则转入误差的反向传播过程；误差反传是将输出误差通过隐模块向输入模块逐层反传，并将误差分摊给各层所有神经元，从各层神经元获得的误差信号，调整各神经元的权值和阈值。通过调整输入模块节点与隐模块节点的联接强度以及阈值，使误差沿梯度方向下降，经过反复学习训练，确定与最小误差相对应的网络参数(权值和阈值)，训练即告停止。

在一个可选的实施例中，隐模块中设置有卷积层。

在一个可选的实施例中，用于对输入数据进行特征提取的卷积层，其内部包含多个卷积核；卷积核在工作时，对输入特征做矩阵元素乘法求和并叠加偏差量，计算函数为

本发明中，在BP和CNN的复合神经网络模型的基础上，对信息进行抽取，其中BP是一种按误差反向传播训练的多层前馈网络，它的基本思想是梯度下降法，利用梯度搜索技术，以期使网络的实际输出值和期望输出值的误差均方差为最小；CNN是一类包含卷积计算且具有深度结构的前馈神经网络，仿造生物的视知觉机制构建，可以进行监督学习和非监督学习，其隐含层内的卷积核参数共享和层间连接的稀疏性使得CNN能够以较小的计算量对格点化特征；两者的配合、互补，使得信息抽取准确性高，速度快，满足当前对信息抽取的需求。

应当理解的是，本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理，而不构成对本发明的限制。因此，在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。此外，本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims

1.一种基于复合神经网络建模的数据信息抽取方法，其特征在于，包括如下步骤：

S1、建立训练模块和复合神经网络模型，其中复合神经网络模型由CNN和BP复合构成；

S3、收集数据信息，构建数据库模块；

2.根据权利要求1所述的一种基于复合神经网络建模的数据信息抽取方法，其特征在于，在S2中，利用训练模块对复合神经网络模型进行训练包括信号的前向传播和误差的反向传播两个过程。

3.根据权利要求2所述的一种基于复合神经网络建模的数据信息抽取方法，其特征在于，计算误差输出时按从输入到输出的方向进行，而调整权值和阈值则从输出到输入的方向进行；正向传播时，输入模块输入信号，通过隐模块作用于输出节点，经过非线性变换，通过输出模块产生输出信号，若实际输出与期望输出不相符，则转入误差的反向传播过程；误差反传是将输出误差通过隐模块向输入模块逐层反传，并将误差分摊给各层所有神经元，从各层神经元获得的误差信号，调整各神经元的权值和阈值。

4.根据权利要求1所述的一种基于复合神经网络建模的数据信息抽取方法，其特征在于，隐模块中设置有卷积层。

5.根据权利要求4所述的一种基于复合神经网络建模的数据信息抽取方法，其特征在于，用于对输入数据进行特征提取的卷积层，其内部包含多个卷积核；卷积核在工作时，对输入特征做矩阵元素乘法求和并叠加偏差量，计算函数为