CN108733806A - 一种多层次卷积神经网络的数据处理方法 - Google Patents

一种多层次卷积神经网络的数据处理方法 Download PDF

Info

Publication number
CN108733806A
CN108733806A CN201810483294.6A CN201810483294A CN108733806A CN 108733806 A CN108733806 A CN 108733806A CN 201810483294 A CN201810483294 A CN 201810483294A CN 108733806 A CN108733806 A CN 108733806A
Authority
CN
China
Prior art keywords
data
classification
processing method
neural networks
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810483294.6A
Other languages
English (en)
Inventor
程良伦
甘婷婷
李婧瑶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN201810483294.6A priority Critical patent/CN108733806A/zh
Publication of CN108733806A publication Critical patent/CN108733806A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及数据处理技术领域,具体公开了一种多层次卷积神经网络的数据处理方法,包括:S10:对输入的数据进行预处理;S20:在神经网络中创建一个卷积层,初始化该卷积层各神经元的权值并预设该卷积层的阈值;将预处理结果传输到该卷积层中,使用Softmax激活函数对所述卷积层中的预处理结果进行分类处理;S30:判断分类处理得到的分类结果是否达到预设的阈值:若是,则将该分类结果发送至连接层;若否,则将该分类结果发送至特征映射层,在特征映射层对该分类结果进行局部平均和二次提取处理后返回所述S20;S40:从连接层向外输出分类结果。本发明提供的多层次卷积神经网络的数据处理方法,可以高效地提取海量数据中的有效信息。

Description

一种多层次卷积神经网络的数据处理方法
技术领域
本发明涉及数据处理技术领域,尤其涉及一种多层次卷积神经网络的数据处理方法。
背景技术
随着信息技术的飞速发展,数据往往具备数量庞大、种类繁多等特点,这使得有价值的数据往往不易被发现。在获取数据的过程中,对来自不同平台的数据进行处理和整合,可以有效提高数据的有效性,降低重复数据和信息的出现频率。但是,如何将众多物理含义完全不一样的数据,更好的融合在一起,筛选掉冗余的信息,使得数据信息有效规整起来,是目前大数据的一个焦点难题。
在大数据时代,数据形式多种多样,来源也不尽相同,因此,有必要提出一种数据分类融合机制,用于高效地提取海量数据中的有效信息。
发明内容
本发明的目的在于:提供一种多层次卷积神经网络的数据处理方法,可以高效地提取海量数据中的有效信息。
为达此目的,本发明采用以下技术方案:
一种多层次卷积神经网络的数据处理方法,包括:
S10:通过数据归约的处理方法对输入的数据进行预处理;
S20:在神经网络中创建一个卷积层,初始化该卷积层各神经元的权值并预设该卷积层的阈值;将预处理结果传输到该卷积层中,使用Softmax激活函数对所述卷积层中的预处理结果进行分类处理;
S30:判断分类处理得到的分类结果是否达到预设的阈值:
若是,则将该分类结果发送至连接层;
若否,则将该分类结果发送至特征映射层,在特征映射层对该分类结果进行局部平均和二次提取处理后返回所述S20,直至分类处理得到的分类结果达到预设的阈值;
S40:从连接层向外输出分类结果。
作为一种优选的实施方式,所述S10包括:
检测并删除输入数据中不相关的部分;
检测并删除输入数据中冗余的部分。
作为一种优选的实施方式,所述S10还包括:
对输入的数据进行归一化处理。
作为一种优选的实施方式,所述S10与S20之间还包括:
S11:检测预处理结果是否为异常数据:
若是,则将该预处理结果删除;
若否,则执行S20。
作为一种优选的实施方式,所述S40具体为:
通过使用Softmax激活函数对分类结果进行处理后对外输出处理结果。
本发明的有益效果:本发明实施例提供的多层次卷积神经网络的数据处理方法,针对海量多源的异构数据,结合卷积神经网络和级联相关网络,提出了一种CNN(Convolutional Neural Network,卷积神经网络,简称CNN)模型的多层次数据分类融合模型,该模型特征提取层的层数并没有固定,将特征提取层的层数设置足够多,以保证误差最终都能达到预先设定的阈值;当误差未能达到预先设定的阈值时,根据级联相关网络自适应生成网络的特性,可以在训练过程中根据需要生成特征提取层和特征映射层,将新加入的神经元赋予初始权重和阈值,每一层神经元共享权值。该模型可以减少训练时的开销,高效地提取海量数据中的有效信息。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的多层次卷积神经网络的数据处理方法框图。
具体实施方式
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
本发明的描述中,需要说明的是,术语“前”、“后”、“左”、“右”、“顶”、“底”等指示的方位或位置关系为基于图1所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
如图1所示,本发明提供一种多层次卷积神经网络的数据处理方法,包括:
S10:通过数据归约的处理方法对输入的数据进行预处理。
进一步地,S10可以包括:
S101:检测并删除输入数据中不相关或者相关度低的部分;优选地,可以通过一些数据预处理方法进行数据特征相关度检测;
S102:检测并删除输入数据中冗余的部分;
S103:对输入数据进行归一化处理。
具体地,用神经网络对海量的数据进行处理可以取得很好的分类效果,利用深度学习做特征提取是一种比较可取的方法。一般可以依照卷积神经网络进行训练,最后提取中间层作为特征输出。数据融合技术和神经网络技术都是来源于人脑综合处理复杂问题的模拟技术,从数据融合的角度看,神经网络是一个融合系统利用神经元之间不同的连接方式可以构成不同的融合体系。神经网络技术具有综合分析的能力,多传感器系统反映的信息既有全面又有局部特征,因而可以利用神经网络技术来实现数据融合。
于本实施例中,用数据归约法对输入的数据进行预处理,检测并删除不相关、弱相关或冗余属性,可以减少数据融合过程的数据量从而提高数据融合的效率。同时,对输入的数据进行归一化处理,可以在梯度下降的过程中增加收敛性。
S11:检测预处理结果是否为异常数据:
若是,则将该预处理结果删除;
若否,则执行S20。
具体地,例如明显偏离其他数据的数据则可以认为是异常数据。
S20:在神经网络中创建一个卷积层,初始化该卷积层各神经元的权值并预设该卷积层的阈值;将预处理结果传输到该卷积层中,使用Softmax激活函数对所述卷积层中的预处理结果进行分类处理。
具体地,卷积层也就是特征提取层。
S30:判断分类处理得到的分类结果是否达到预设的阈值:
若是,则将该分类结果发送至连接层;
若否,则将该分类结果发送至特征映射层,在所述特征映射层对该分类结果进行局部平均和二次提取处理后返回所述S20,直至分类处理得到的分类结果达到预设的阈值。
具体地,特征提取层的层数并没有固定,只要特征提取层的层数足够多,误差最终都能达到预先设定的阈值。
S40:从连接层向外输出分类结果,结束算法。
进一步地,通过使用Softmax激活函数对分类结果进行处理后对外输出处理结果。
本实施例提供的多层次卷积神经网络的数据处理方法具备以下优点:
①没有固定的特征提取层层数,将特征提取层的层数设置足够多,以保证误差最终都能达到预先设定的阈值;将新加入的神经元赋予初始权重和阈值;
②利用级联相关网络结构自适应特性,在训练过程中根据需要可以增加卷积层和特征映射层的数目,这样的目的可以使得特征提取过程中当数据量比较少的时候,不用减少神经元的数量,进而减少训练时的开销;
③每一层神经元共享权值。权值共享使得能够更有效的进行特征提取,因为它极大的减少了需要学习的自由变量的个数(即参数的个数)。通过控制模型的规模,卷积网络对数据分类问题具有很好的泛化能力;
④由于每一层的神经元共享权值,因而减少了网络自由参数的个数,降低了网络参数选择的复杂度。
⑤卷积神经网络中的每一个特征提取层都紧跟着一个用来求局部平均与二次提取的计算层(即特征映射层),这种特有的两次特征提取结构使网络在识别时对输入样本有较高的畸变容忍能力。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (5)

1.一种多层次卷积神经网络的数据处理方法,其特征在于,包括:
S10:通过数据归约的处理方法对输入的数据进行预处理;
S20:在神经网络中创建一个卷积层,初始化该卷积层各神经元的权值并预设该卷积层的阈值;将预处理结果传输到该卷积层中,使用Softmax激活函数对所述卷积层中的预处理结果进行分类处理;
S30:判断分类处理得到的分类结果是否达到预设的阈值:
若是,则将该分类结果发送至连接层;
若否,则将该分类结果发送至特征映射层,在特征映射层对该分类结果进行局部平均和二次提取处理后返回所述S20,直至分类处理得到的分类结果达到预设的阈值;
S40:从连接层向外输出分类结果。
2.根据权利要求1所述的多层次卷积神经网络的数据处理方法,其特征在于,所述S10包括:
检测并删除输入数据中不相关的部分;
检测并删除输入数据中冗余的部分。
3.根据权利要求2所述的多层次卷积神经网络的数据处理方法,其特征在于,所述S10还包括:
对输入数据进行归一化处理。
4.根据权利要求1所述的多层次卷积神经网络的数据处理方法,其特征在于,所述S10与S20之间还包括:
S11:检测预处理结果是否为异常数据:
若是,则将该预处理结果删除;
若否,则执行S20。
5.根据权利要求1所述的多层次卷积神经网络的数据处理方法,其特征在于,所述S40具体为:
通过使用Softmax激活函数对分类结果进行处理后对外输出处理结果。
CN201810483294.6A 2018-05-18 2018-05-18 一种多层次卷积神经网络的数据处理方法 Pending CN108733806A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810483294.6A CN108733806A (zh) 2018-05-18 2018-05-18 一种多层次卷积神经网络的数据处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810483294.6A CN108733806A (zh) 2018-05-18 2018-05-18 一种多层次卷积神经网络的数据处理方法

Publications (1)

Publication Number Publication Date
CN108733806A true CN108733806A (zh) 2018-11-02

Family

ID=63938615

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810483294.6A Pending CN108733806A (zh) 2018-05-18 2018-05-18 一种多层次卷积神经网络的数据处理方法

Country Status (1)

Country Link
CN (1) CN108733806A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977744A (zh) * 2018-12-25 2019-07-05 国家电网有限公司 一种低开销智能电网数据聚合处理系统及方法
CN110781690A (zh) * 2019-10-31 2020-02-11 北京理工大学 一种多源神经机器翻译模型的融合和压缩方法
CN111461296A (zh) * 2018-12-29 2020-07-28 中科寒武纪科技股份有限公司 数据处理方法、电子设备和可读存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977744A (zh) * 2018-12-25 2019-07-05 国家电网有限公司 一种低开销智能电网数据聚合处理系统及方法
CN109977744B (zh) * 2018-12-25 2020-11-20 国家电网有限公司 一种低开销智能电网数据聚合处理系统及方法
CN111461296A (zh) * 2018-12-29 2020-07-28 中科寒武纪科技股份有限公司 数据处理方法、电子设备和可读存储介质
CN111461296B (zh) * 2018-12-29 2023-09-22 中科寒武纪科技股份有限公司 数据处理方法、电子设备和可读存储介质
CN110781690A (zh) * 2019-10-31 2020-02-11 北京理工大学 一种多源神经机器翻译模型的融合和压缩方法

Similar Documents

Publication Publication Date Title
Karim et al. Unicon: Combating label noise through uniform selection and contrastive learning
CN113378632B (zh) 一种基于伪标签优化的无监督域适应行人重识别方法
CN108733806A (zh) 一种多层次卷积神经网络的数据处理方法
CN111353545B (zh) 一种基于稀疏网络迁移的植株病虫害识别方法
CN106407986A (zh) 一种基于深度模型的合成孔径雷达图像目标识别方法
CN107153817A (zh) 行人重识别数据标注方法和装置
CN112884059B (zh) 一种融合先验知识的小样本雷达工作模式分类方法
CN110348416A (zh) 一种基于多尺度特征融合卷积神经网络的多任务人脸识别方法
CN109615616A (zh) 一种基于abc-pcnn的裂缝识别方法及系统
CN115116559A (zh) 氨基酸中原子坐标的确定及训练方法、装置、设备和介质
CN110119746A (zh) 一种特征识别方法及装置、计算机可读存储介质
CN113255617A (zh) 图像识别方法、装置、电子设备和计算机可读存储介质
CN110245602A (zh) 一种基于深度卷积特征的水下静目标识别方法
CN115238835A (zh) 基于双空间自适应融合的脑电情感识别方法、介质及设备
CN114548300B (zh) 解释业务处理模型的业务处理结果的方法和装置
CN116739759A (zh) 基于订单风险识别的资产资金匹配方法、装置及设备
Xu et al. Resilient binary neural network
Yang et al. Retinal vessel segmentation based on an improved deep forest
CN110427804A (zh) 一种基于二次迁移学习的虹膜身份验证方法
CN112949785B (zh) 对象检测方法、装置、设备及计算机存储介质
CN114140238A (zh) 异常交易数据识别方法、装置、计算机设备和存储介质
CN111507396B (zh) 缓解神经网络对未知类样本产生错误分类的方法及装置
Tun et al. Federated learning with intermediate representation regularization
CN116030077B (zh) 基于多数据集协作学习的视频显著性区域检测方法
CN117014507A (zh) 任务卸载模型的训练方法、任务的卸载方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181102

RJ01 Rejection of invention patent application after publication