CN111767418A - 基于神经网络的电子图像文件自动分类方法 - Google Patents
基于神经网络的电子图像文件自动分类方法 Download PDFInfo
- Publication number
- CN111767418A CN111767418A CN202010644228.XA CN202010644228A CN111767418A CN 111767418 A CN111767418 A CN 111767418A CN 202010644228 A CN202010644228 A CN 202010644228A CN 111767418 A CN111767418 A CN 111767418A
- Authority
- CN
- China
- Prior art keywords
- layer
- neural network
- divided
- image
- person
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 50
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000005457 optimization Methods 0.000 claims abstract description 6
- 230000006399 behavior Effects 0.000 claims description 28
- 238000012360 testing method Methods 0.000 claims description 22
- 238000012549 training Methods 0.000 claims description 20
- 238000012795 verification Methods 0.000 claims description 8
- 241001465754 Metazoa Species 0.000 claims description 5
- 238000004891 communication Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000013461 design Methods 0.000 abstract description 2
- 210000002569 neuron Anatomy 0.000 description 5
- 238000011161 development Methods 0.000 description 4
- 101000958041 Homo sapiens Musculin Proteins 0.000 description 2
- 102100029469 WD repeat and HMG-box DNA-binding protein 1 Human genes 0.000 description 2
- 101710097421 WD repeat and HMG-box DNA-binding protein 1 Proteins 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 102000046949 human MSC Human genes 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Abstract
本发明涉及电子文档技术领域,特别涉及基于神经网络的电子图像文件自动分类方法。本文关键技术点是将电子文档按照本文的方法进行归类,作为了神经网络的输入参数,根据神经网络BP算法,就会自动计算输出结果,再根据实际结果和计算输出结果,根据BP算法,反向对神经网络进行优化。其中神经网络整个的优化过程和反向学习过程才用传统技术,本发明核心是设计了一套电子文档的归类方式,使其能满足了神经网络分类、识别,解决了原来无法自动分类识别的难题。
Description
技术领域
本发明涉及电子文档技术领域,特别涉及基于神经网络的电子图像文件自动分类方法。
背景技术
近年来,由于大数据、云计算、神经网络等技术蓬勃发展,出现了巨大的技术飞跃,这无疑为电子文件自动分类技术的发展提供了难得的发展机遇。在当前人工智能领域的前沿技术中,深度学习在诸多分类任务中取得了很好的效果。如何将电子图像运用到电子文件的管理中,帮助实现电子文件的自动分类,以此提升电子图像信息管理工作的效率。
发明内容
本发明将电子图像文件通过分析神经网络与电子图像文件自动分类相结合解决现有技术的不足,以促进信息管理工作中电子文件自动分类技术的发展。
本发明解决其技术问题所采用的技术方案为:
基于神经网络的电子图像文件自动分类方法,包括如下步骤:
A、配置神经网络
神经网络分为输入层,隐含层和输出层,每一层的节点都与下一层的所有节点相互连接,信号由输入层进入人工神经网络,依次向隐含层顺向传播,直至输出层;
B、数据归一化分类
将图像所包含的信息分为3个层级,分为特征层、对象层、语义概念层;特征层包括颜色、形状、纹理,对象层包括图像中对象、对象之间的空间关系,语义概念层包括场景、行为、主观感受,上述8个参数作为神经网络的输入项;
特征层的颜色分为红、黄、蓝;
特征层的形状分为圆形、长方形、正方形、平行四边形、三角形、梯形、圆柱、圆锥、球形、长方体、正方体和其他;
特征层的纹理分为条线为和非条线;
对象层的图像中对象分为人、动物、植物和其他;
对象层的对象之间的空间关系分为相连、连通和其他;
语义概念层的场景分为人与人、人与事、人与时、事与事和其他;
语义概念层的行为分为意志行为、娱乐消遣行为、行为类别间的联系、各行为类别意志特征;
语义概念层的主观感受分为友好性、易用性、有用性和其他;
C、电子图像文件选取
采用了5000张电子图像为测试数据分别按步骤B分类,其中随机选择3000张组成训练集,用于对模型进行训练;再随机选择1000张组成验证集,用于辅助模型构建;最后1000张组成测试集,用于对训练结果进行测试;
D、分析优化
先利用训练集、验证集的图片对模型进行训练及构建,其中输入层为图像的原始像素,输出层为不同类别的数据归一化分类;最后利用测试集中的图片对训练好的模型进行测试;待通过神经网络经典BP算法,对神经网络连接权值进行优化后,得到最终的识别网络,用识别网络来对电子图像文件进行分类。
所述步骤C中图像数据均来源于华中师范大学档案馆的图像数据库。
本文关键技术点是将电子文档按照本文的方法进行归类,作为了神经网络的输入参数,根据神经网络BP算法,就会自动计算输出结果,再根据实际结果和计算输出结果,根据BP算法,反向对神经网络进行优化。其中神经网络整个的优化过程和反向学习过程才用传统技术,本发明核心是设计了一套电子文档的归类方式,使其能满足了神经网络分类、识别,解决了原来无法自动分类识别的难题。
附图说明
图1为本发明的方法流程图;
图2为神经网络结构。
具体实施方式
基于神经网络的电子图像文件自动分类方法,包括如下步骤:
A、配置神经网络
神经网络分为输入层,隐含层和输出层,每一层的节点都与下一层的所有节点相互连接,信号由输入层进入人工神经网络,依次向隐含层顺向传播,直至输出层;
B、数据归一化分类
将图像所包含的信息分为3个层级,分为特征层、对象层、语义概念层;特征层包括颜色、形状、纹理,对象层包括图像中对象、对象之间的空间关系,语义概念层包括场景、行为、主观感受,上述8个参数作为神经网络的输入项;
特征层的颜色分为红、黄、蓝;
特征层的形状分为圆形、长方形、正方形、平行四边形、三角形、梯形、圆柱、圆锥、球形、长方体、正方体和其他;
特征层的纹理分为条线为和非条线;
对象层的图像中对象分为人、动物、植物和其他;
对象层的对象之间的空间关系分为相连、连通和其他;
语义概念层的场景分为人与人、人与事、人与时、事与事和其他;
语义概念层的行为分为意志行为、娱乐消遣行为、行为类别间的联系、各行为类别意志特征;
语义概念层的主观感受分为友好性、易用性、有用性和其他;
C、电子图像选取
采用了5000张电子图像为测试数据分别按步骤B分类,其中随机选择3000张组成训练集,用于对模型进行训练;再随机选择1000张组成验证集,用于辅助模型构建;最后1000张组成测试集,用于对训练结果进行测试;
D、分析优化
先利用训练集、验证集的图片对模型进行训练及构建,其中输入层为图像的原始像素,输出层为不同类别的数据归一化分类;最后利用测试集中的图片对训练好的模型进行测试;待通过神经网络经典BP算法,对神经网络连接权值进行优化后,得到最终的识别网络,用识别网络来对电子图像文件进行分类。
所述步骤C中图像数据均来源于华中师范大学档案馆的图像数据库。
分类使用时,
A、配置神经网络
人工神经网络包含了大量的节点,节点之间按照一定规则相连,从而构成一种网络结构,如图1所示,分为输入层,隐含层和输出层,每一层的节点都与下一层的所有节点相连接。信号由输入层进入人工神经网络,依次向隐含层顺向传播,直至输出层。
x1,x2,...,xL为输入层神经元,L为输入层神经元个数。h1,h2,...,hN为隐含层神经元,N为隐藏层神经元个数。y1,y2,...,yM为输出层神经元,M为输出层神经元。u11,u12,u1N,...,uL1,uL2,uLN为输入层到隐含层之间的连接权值,v11,v1M,v12,v2M,...,vN1,vNM为隐含层到输出层之间的连接权值。
B、数据归一化分类
数据归一化分类在数据进行归一化对于颜色采用图像的红(r)、黄(g)、蓝(b)的像素值,根据经验公式,设置colour=0.2*r+0.5*g+0.3*b。
形状shape的值为,圆形为1,长方形为2,正方形为3,平行四边形为4,三角形为5,梯形为6,圆柱为7,圆锥为8,球形为9,长方体为10,正方体为11,其他为-1。
纹理texture:条线为1,非条线为-1。
图像中所包含的对象Object:人为1,动物为2,植物为3,其他为-1。
对象之间的空间关系space:相连关系为1,连通关系为2,其他为-1。
场景Scenes:人与人为1,人与事为2,人与地为3,人与时为4,事与事为5,其他为6。
行为behavior:意志行为为1,潜意识行为为2,娱乐消遣行为为3,为4,为5。
主观感受feel:友好性为1,易用性为2,有用性为3,其他为4。C、神经网络电子图像文件选取。
神经网络对电子图像靠谱系统,分为神经网络学习和神经网络识别两部流程,整体流程图如图1所示:采用了5000张电子图像为测试数据。其中:从中随机选择3000张组成训练集,用于对模型进行训练;再从剩余的2000张中选取1000张组成验证集,用于辅助模型构建;另外1000张组成测试集,用于对训练结果进行测试。所有图像数据均来源于华中师范大学档案馆的图像数据库。
在数据进行归一化是,对于颜色采用图像的红(r)、黄(g)、蓝(b)的像素值,根据经验公式,设置colour=0.2*r+0.5*g+0.3*b。
形状shape的值为,圆形为1,长方形为2,正方形为3,平行四边形为4,三角形为5,梯形为6,圆柱为7,圆锥为8,球形为9,长方体为10,正方体为11,其他为-1。
纹理texture:条线为1,非条线为-1。
图像中所包含的对象Object:人为1,动物为2,植物为3,其他为-1。
对象之间的空间关系space:相连关系为1,连通关系为2,其他为-1。
场景Scenes:人与人为1,人与事为2,人与地为3,人与时为4,事与事为5,其他为6。
行为behavior:意志行为为1,潜意识行为为2,娱乐消遣行为为3,行为类别间的联系为4,各行为类别意志特征为5。
主观感受feel:友好性为1,易用性为2,有用性为3,其他为4。
D、分析优化
以上述方法对测试数据进行分类,通过神经网络经典BP算法,对神经网络连接权值进行优化,测试数据采用的分类标准为图像数据库中本身已做好的类别划分。数据库中对电子图像进行大类的划分,主要依据图像中事件的差异,兼顾了其他方面的特征。先利用训练集、验证集的图片对模型进行训练及构建,其中输入层就是图像的原始像素,输出层则代表不同类别的可信度;然后利用测试集中的图片对训练好的模型进行测试。
待通过神经网络经典BP算法,对神经网络连接权值进行优化后,得到最终的识别网络,用识别网络来对电子图像文件进行分类。
Claims (2)
1.基于神经网络的电子图像文件自动分类方法,其特征在于包括如下步骤:
A、配置神经网络
神经网络分为输入层,隐含层和输出层,每一层的节点都与下一层的所有节点相互连接,信号由输入层进入人工神经网络,依次向隐含层顺向传播,直至输出层;
B、数据归一化分类
将图像所包含的信息分为3个层级,分为特征层、对象层、语义概念层;特征层包括颜色、形状、纹理,对象层包括图像中对象、对象之间的空间关系,语义概念层包括场景、行为、主观感受,上述8个参数作为神经网络的输入项;
特征层的颜色分为红、黄、蓝;
特征层的形状分为圆形、长方形、正方形、平行四边形、三角形、梯形、圆柱、圆锥、球形、长方体、正方体和其他;
特征层的纹理分为条线为和非条线;
对象层的图像中对象分为人、动物、植物和其他;
对象层的对象之间的空间关系分为相连、连通和其他;
语义概念层的场景分为人与人、人与事、人与时、事与事和其他;
语义概念层的行为分为意志行为、娱乐消遣行为、行为类别间的联系、各行为类别意志特征;
语义概念层的主观感受分为友好性、易用性、有用性和其他;
C、电子图像文件选取
采用了5000张电子图像为测试数据分别按步骤B分类,其中随机选择3000张组成训练集,用于对模型进行训练; 再随机选择1000张组成验证集,用于辅助模型构建;最后1000张组成测试集,用于对训练结果进行测试;
D、分析优化
先利用训练集、验证集的图片对模型进行训练及构建,其中输入层为图像的原始像素,输出层为不同类别的数据归一化分类; 最后利用测试集中的图片对训练好的模型进行测试;待通过神经网络经典BP算法,对神经网络连接权值进行优化后,得到最终的识别网络,用识别网络来对电子图像文件进行分类。
2.根据权利要求1所述基于神经网络的电子图像文件自动分类方法,其特征在于所述步骤C中图像数据均来源于华中师范大学档案馆的图像数据库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010644228.XA CN111767418B (zh) | 2020-07-07 | 2020-07-07 | 基于神经网络的电子图像文件自动分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010644228.XA CN111767418B (zh) | 2020-07-07 | 2020-07-07 | 基于神经网络的电子图像文件自动分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111767418A true CN111767418A (zh) | 2020-10-13 |
CN111767418B CN111767418B (zh) | 2023-10-27 |
Family
ID=72723966
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010644228.XA Active CN111767418B (zh) | 2020-07-07 | 2020-07-07 | 基于神经网络的电子图像文件自动分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111767418B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015158198A1 (zh) * | 2014-04-17 | 2015-10-22 | 北京泰乐德信息技术有限公司 | 一种基于神经网络自学习的故障识别方法及系统 |
CN107273971A (zh) * | 2017-06-13 | 2017-10-20 | 石家庄铁道大学 | 基于神经元显著性的前馈神经网络结构自组织方法 |
CN110211684A (zh) * | 2019-06-05 | 2019-09-06 | 四川长虹电器股份有限公司 | 基于遗传算法优化的bp神经网络的心电图分类方法 |
-
2020
- 2020-07-07 CN CN202010644228.XA patent/CN111767418B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015158198A1 (zh) * | 2014-04-17 | 2015-10-22 | 北京泰乐德信息技术有限公司 | 一种基于神经网络自学习的故障识别方法及系统 |
CN107273971A (zh) * | 2017-06-13 | 2017-10-20 | 石家庄铁道大学 | 基于神经元显著性的前馈神经网络结构自组织方法 |
CN110211684A (zh) * | 2019-06-05 | 2019-09-06 | 四川长虹电器股份有限公司 | 基于遗传算法优化的bp神经网络的心电图分类方法 |
Non-Patent Citations (1)
Title |
---|
肖辛格: "基于深度学习的电子文件自动分类技术", 情报探索, no. 6, pages 78 - 82 * |
Also Published As
Publication number | Publication date |
---|---|
CN111767418B (zh) | 2023-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106104406B (zh) | 神经网络及神经网络训练的方法 | |
CN106127702A (zh) | 一种基于深度学习的图像去雾算法 | |
CN107705806A (zh) | 一种使用谱图和深卷积神经网络进行语音情感识别的方法 | |
CN109816032A (zh) | 基于生成式对抗网络的无偏映射零样本分类方法和装置 | |
CN108230278A (zh) | 一种基于生成对抗网络的图像去雨滴方法 | |
CN104103091B (zh) | 3d智能建模方法和系统及3d模型柔性制造系统 | |
CN110222634A (zh) | 一种基于卷积神经网络的人体姿态识别方法 | |
CN107016415A (zh) | 一种基于全卷积网络的彩色图像色彩语义分类方法 | |
Pennock | Models, simulations, instantiations, and evidence: the case of digital evolution | |
CN107516103A (zh) | 一种影像分类方法和系统 | |
CN107194438A (zh) | 一种基于多重栈式自编码的深度特征表示方法 | |
CN104036242A (zh) | 基于Centering Trick卷积限制玻尔兹曼机的物体识别方法 | |
Zhao et al. | Building damage evaluation from satellite imagery using deep learning | |
CN106355210A (zh) | 基于深度神经元响应模式的绝缘子红外图像特征表达方法 | |
Tang | Image classification based on CNN: models and modules | |
CN111767418A (zh) | 基于神经网络的电子图像文件自动分类方法 | |
CN109215036A (zh) | 基于卷积神经网络的人体分割方法 | |
Vialatte et al. | Learning local receptive fields and their weight sharing scheme on graphs | |
CN114265954B (zh) | 基于位置与结构信息的图表示学习方法 | |
CN109978013A (zh) | 一种用于人物动作识别的深度聚类方法 | |
CN109934281A (zh) | 一种二分类网络的非监督训练方法 | |
Hu et al. | Learning salient features for flower classification using convolutional neural network | |
Zhan et al. | Research on evaluation of online teaching effect based on deep learning technology | |
CN114444665A (zh) | 基于图卷积神经网络的伊辛求解器及实现伊辛模型的方法 | |
CN113486929A (zh) | 基于残差收缩模块与注意力机制的岩石薄片图像识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |