CN111767418A

CN111767418A - 基于神经网络的电子图像文件自动分类方法

Info

Publication number: CN111767418A
Application number: CN202010644228.XA
Authority: CN
Inventors: 李保印; 刘涛; 张宝玉; 张亮亮
Original assignee: China Telecom Wanwei Information Technology Co Ltd
Current assignee: China Telecom Wanwei Information Technology Co Ltd
Priority date: 2020-07-07
Filing date: 2020-07-07
Publication date: 2020-10-13
Anticipated expiration: 2040-07-07
Also published as: CN111767418B

Abstract

本发明涉及电子文档技术领域，特别涉及基于神经网络的电子图像文件自动分类方法。本文关键技术点是将电子文档按照本文的方法进行归类，作为了神经网络的输入参数，根据神经网络BP算法，就会自动计算输出结果，再根据实际结果和计算输出结果，根据BP算法，反向对神经网络进行优化。其中神经网络整个的优化过程和反向学习过程才用传统技术，本发明核心是设计了一套电子文档的归类方式，使其能满足了神经网络分类、识别，解决了原来无法自动分类识别的难题。

Description

基于神经网络的电子图像文件自动分类方法

技术领域

本发明涉及电子文档技术领域，特别涉及基于神经网络的电子图像文件自动分类方法。

背景技术

近年来，由于大数据、云计算、神经网络等技术蓬勃发展，出现了巨大的技术飞跃，这无疑为电子文件自动分类技术的发展提供了难得的发展机遇。在当前人工智能领域的前沿技术中，深度学习在诸多分类任务中取得了很好的效果。如何将电子图像运用到电子文件的管理中，帮助实现电子文件的自动分类，以此提升电子图像信息管理工作的效率。

发明内容

本发明将电子图像文件通过分析神经网络与电子图像文件自动分类相结合解决现有技术的不足，以促进信息管理工作中电子文件自动分类技术的发展。

本发明解决其技术问题所采用的技术方案为：

基于神经网络的电子图像文件自动分类方法，包括如下步骤：

A、配置神经网络

神经网络分为输入层，隐含层和输出层，每一层的节点都与下一层的所有节点相互连接，信号由输入层进入人工神经网络，依次向隐含层顺向传播，直至输出层；

B、数据归一化分类

将图像所包含的信息分为3个层级，分为特征层、对象层、语义概念层；特征层包括颜色、形状、纹理，对象层包括图像中对象、对象之间的空间关系，语义概念层包括场景、行为、主观感受，上述8个参数作为神经网络的输入项；

特征层的颜色分为红、黄、蓝；

特征层的形状分为圆形、长方形、正方形、平行四边形、三角形、梯形、圆柱、圆锥、球形、长方体、正方体和其他；

特征层的纹理分为条线为和非条线；

对象层的图像中对象分为人、动物、植物和其他；

对象层的对象之间的空间关系分为相连、连通和其他；

语义概念层的场景分为人与人、人与事、人与时、事与事和其他；

语义概念层的行为分为意志行为、娱乐消遣行为、行为类别间的联系、各行为类别意志特征；

语义概念层的主观感受分为友好性、易用性、有用性和其他；

C、电子图像文件选取

采用了5000张电子图像为测试数据分别按步骤B分类，其中随机选择3000张组成训练集，用于对模型进行训练；再随机选择1000张组成验证集，用于辅助模型构建；最后1000张组成测试集，用于对训练结果进行测试；

D、分析优化

先利用训练集、验证集的图片对模型进行训练及构建，其中输入层为图像的原始像素，输出层为不同类别的数据归一化分类；最后利用测试集中的图片对训练好的模型进行测试；待通过神经网络经典BP算法，对神经网络连接权值进行优化后，得到最终的识别网络，用识别网络来对电子图像文件进行分类。

所述步骤C中图像数据均来源于华中师范大学档案馆的图像数据库。

本文关键技术点是将电子文档按照本文的方法进行归类，作为了神经网络的输入参数，根据神经网络BP算法，就会自动计算输出结果，再根据实际结果和计算输出结果，根据BP算法，反向对神经网络进行优化。其中神经网络整个的优化过程和反向学习过程才用传统技术，本发明核心是设计了一套电子文档的归类方式，使其能满足了神经网络分类、识别，解决了原来无法自动分类识别的难题。

附图说明

图1为本发明的方法流程图；

图2为神经网络结构。

具体实施方式

A、配置神经网络

B、数据归一化分类

特征层的颜色分为红、黄、蓝；

特征层的纹理分为条线为和非条线；

对象层的图像中对象分为人、动物、植物和其他；

对象层的对象之间的空间关系分为相连、连通和其他；

C、电子图像选取

D、分析优化

分类使用时，

A、配置神经网络

人工神经网络包含了大量的节点，节点之间按照一定规则相连，从而构成一种网络结构，如图1所示，分为输入层，隐含层和输出层，每一层的节点都与下一层的所有节点相连接。信号由输入层进入人工神经网络，依次向隐含层顺向传播，直至输出层。

x₁，x₂，...，x_L为输入层神经元，L为输入层神经元个数。h₁，h₂，...，h_N为隐含层神经元，N为隐藏层神经元个数。y₁，y₂，...，y_M为输出层神经元，M为输出层神经元。u₁₁,u₁₂,u_1N,...,u_L1,u_L2,u_LN为输入层到隐含层之间的连接权值，v₁₁,v_1M,v₁₂,v_2M,...,v_N1,v_NM为隐含层到输出层之间的连接权值。

B、数据归一化分类

数据归一化分类在数据进行归一化对于颜色采用图像的红(r)、黄(g)、蓝(b)的像素值，根据经验公式，设置colour＝0.2*r+0.5*g+0.3*b。

形状shape的值为，圆形为1，长方形为2，正方形为3，平行四边形为4，三角形为5，梯形为6，圆柱为7，圆锥为8，球形为9，长方体为10，正方体为11，其他为-1。

纹理texture：条线为1，非条线为-1。

图像中所包含的对象Object：人为1，动物为2，植物为3，其他为-1。

对象之间的空间关系space：相连关系为1，连通关系为2，其他为-1。

场景Scenes：人与人为1，人与事为2，人与地为3，人与时为4，事与事为5，其他为6。

行为behavior：意志行为为1，潜意识行为为2，娱乐消遣行为为3，为4，为5。

主观感受feel:友好性为1，易用性为2，有用性为3，其他为4。C、神经网络电子图像文件选取。

神经网络对电子图像靠谱系统，分为神经网络学习和神经网络识别两部流程，整体流程图如图1所示：采用了5000张电子图像为测试数据。其中:从中随机选择3000张组成训练集，用于对模型进行训练；再从剩余的2000张中选取1000张组成验证集，用于辅助模型构建；另外1000张组成测试集，用于对训练结果进行测试。所有图像数据均来源于华中师范大学档案馆的图像数据库。

在数据进行归一化是，对于颜色采用图像的红(r)、黄(g)、蓝(b)的像素值，根据经验公式，设置colour＝0.2*r+0.5*g+0.3*b。

纹理texture：条线为1，非条线为-1。

行为behavior：意志行为为1，潜意识行为为2，娱乐消遣行为为3，行为类别间的联系为4，各行为类别意志特征为5。

主观感受feel:友好性为1，易用性为2，有用性为3，其他为4。

D、分析优化

以上述方法对测试数据进行分类，通过神经网络经典BP算法，对神经网络连接权值进行优化，测试数据采用的分类标准为图像数据库中本身已做好的类别划分。数据库中对电子图像进行大类的划分，主要依据图像中事件的差异，兼顾了其他方面的特征。先利用训练集、验证集的图片对模型进行训练及构建，其中输入层就是图像的原始像素，输出层则代表不同类别的可信度；然后利用测试集中的图片对训练好的模型进行测试。

待通过神经网络经典BP算法，对神经网络连接权值进行优化后，得到最终的识别网络，用识别网络来对电子图像文件进行分类。

Claims

1.基于神经网络的电子图像文件自动分类方法，其特征在于包括如下步骤：

A、配置神经网络

B、数据归一化分类

特征层的颜色分为红、黄、蓝；

特征层的纹理分为条线为和非条线；

对象层的图像中对象分为人、动物、植物和其他；

对象层的对象之间的空间关系分为相连、连通和其他；

C、电子图像文件选取

采用了5000张电子图像为测试数据分别按步骤B分类，其中随机选择3000张组成训练集，用于对模型进行训练; 再随机选择1000张组成验证集，用于辅助模型构建;最后1000张组成测试集，用于对训练结果进行测试；

D、分析优化

先利用训练集、验证集的图片对模型进行训练及构建，其中输入层为图像的原始像素，输出层为不同类别的数据归一化分类; 最后利用测试集中的图片对训练好的模型进行测试；待通过神经网络经典BP算法，对神经网络连接权值进行优化后，得到最终的识别网络，用识别网络来对电子图像文件进行分类。

2.根据权利要求1所述基于神经网络的电子图像文件自动分类方法，其特征在于所述步骤C中图像数据均来源于华中师范大学档案馆的图像数据库。