CN110414629B - 一种基于copula初始值优化的深度神经网络方法 - Google Patents

一种基于copula初始值优化的深度神经网络方法 Download PDF

Info

Publication number
CN110414629B
CN110414629B CN201910734803.2A CN201910734803A CN110414629B CN 110414629 B CN110414629 B CN 110414629B CN 201910734803 A CN201910734803 A CN 201910734803A CN 110414629 B CN110414629 B CN 110414629B
Authority
CN
China
Prior art keywords
training
copula
initial value
distribution
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910734803.2A
Other languages
English (en)
Other versions
CN110414629A (zh
Inventor
金勇�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Firehome Putian Information Technology Co ltd
Original Assignee
Wuhan Firehome Putian Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Firehome Putian Information Technology Co ltd filed Critical Wuhan Firehome Putian Information Technology Co ltd
Priority to CN201910734803.2A priority Critical patent/CN110414629B/zh
Publication of CN110414629A publication Critical patent/CN110414629A/zh
Application granted granted Critical
Publication of CN110414629B publication Critical patent/CN110414629B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于copula初始值优化的深度神经网络方法,具体包括以下步骤:S1:将标签数据划分为训练集和测试集,训练集用于模型的训练学习,测试集用于测试模型的综合效果;S2:用训练数据去拟合copula分布的多维相关性矩阵参数ρ;S3:设定copula拟合分布为高斯分布,根据已经拟合好的高斯copula函数,按照网络结构规模生产随机数,随机数产生的区域进行调优;S4:将S3得到的随机数矩阵,传入反向传播算法作为初始值,设定学习率、迭代次数及正则化训练参数,进行反向传播训练。本发明提出的一种基于copula初始值优化的深度神经网络方法,将训练数据的统计特征融合进神经网络复杂的优化训练中的初始权重值中,使得反向传播训练达到更好的优化效果。

Description

一种基于copula初始值优化的深度神经网络方法
技术领域
本发明涉及机器学习及深度学习算法领域,特别是涉及一种基于copula初始值优化的深度神经网络方法。
背景技术
随着信息技术的发展,机器学习算法已经证明在多个领域可以产生较好效果,例如图像分类、语义分析、视频处理等。近年来,深度神经网络方法在机器学习领域起到了相对更好的效果。深度信念网络(Deep Belief Network)证明了相对于传统的权重随机初始化,利用无监督的限制玻尔兹曼机训练可以得到更好的初始权重值提供给反向传播算法(Back propagation),从而提高神经网络的表现效果。
因此,为了使得权重初始值能更好的反映出训练数据的特征信息,急于开发出一种深度神经网络方法用于优化反向传播算法,并用于提高分类模型效果。
发明内容
为了克服现有技术的上述不足,本发明提出了一种基于copula初始值优化的深度神经网络方法,解决现有权重初始值不能很好的反应训练数据特征信息的问题。
本发明是通过以下技术方案实现的:
一种基于copula初始值优化的深度神经网络方法,具体包括以下步骤:
S1:图像集划分:将标签数据划分为训练集和测试集,训练集用于模型的训练学习,测试集用于测试模型的综合效果;
S2:特征拟合:用训练数据去拟合copula分布的多维相关性矩阵参数ρ;
S3:初始权重值生产:设定copula拟合分布为高斯分布,根据已经拟合好的高斯copula函数,按照网络结构规模生产随机数,随机数产生的区域进行调优;
S4:将步骤S3得到的随机数矩阵,传入反向传播算法作为初始值,设定学习率、迭代次数及正则化训练参数,进行反向传播训练;
S5:利用训练好的模型参数对模型效果进行测评。
进一步的,S2中矩阵参数ρ相关性的计算包括以下步骤:
S21:当训练数据为密集型数据(即80%以上的数据不为0),直接进行相关性的计算;
S22:当训练数据为稀疏型数据(即80%以上的数据为0),如果输入特征向量全部为0,则强制设定此特征向量与其它特征的相关性为0,其它相关性数值计算方法不变。
进一步的,S3中调优后的随机数服从[0,1]上的高斯copula分布。
与现有技术相比,本发明的有益效果在于:
本发明提出的一种基于copula初始值优化的深度神经网络方法,将训练数据的统计特征融合进神经网络复杂的优化训练中的初始权重值中,使得反向传播训练达到更好的优化效果,本方法对神经网络系列模型中反向传播算法的训练方法优化起到了积极效果。
具体实施方式
展示一下实例来具体说明本发明的某些实施例,且不应解释为限制本发明的范围。对本发明公开的内容可以同时从材料、方法和反应条件进行改进,所有这些改进,均应落入本发明的的精神和范围之内。
一种基于copula初始值优化的深度神经网络方法,具体包括以下步骤:
S1:图像集划分:将标签数据划分为训练集和测试集,训练集用于模型的训练学习,测试集用于测试模型的综合效果;
S2:特征拟合:用训练数据去拟合copula分布的多维相关性矩阵参数ρ,对矩阵参数ρ的相关性计算一般采用如下方法处理:当训练数据为密集型数据(80%以上的数据不为0),拟合特征能很好的融合训练数据的特征信息,故直接进行相关性的计算;当训练数据为稀疏型数据,80%以上的数据为0,会导致相关性矩阵参数的错误估计,可能将两个完全没有直接关系的变量数据之间的依赖夸大,从而间接将非零数值的关联缩小,所以在copula拟合过程中需要针对数据的稀疏性特征做出一定的特殊处理,如果输入特征向量全部为0,则强制设定此特征向量与其它特征的相关性为0,其它相关性数值计算方法不变;
S3:初始权重值生产:设定copula拟合分布为高斯分布,根据已经拟合好的高斯copula函数,按照网络结构规模生产随机数,随机数产生的区域一般分为[-1,1]、[-0.5,0.5]、[0,0.5]及[0,1]这四个区间,最终采用[0,1]作为初始值分布区间;
S4:将步骤S3得到的随机数矩阵,传入反向传播算法作为初始值,设定学习率、迭代次数及正则化训练参数,进行反向传播训练;
S5:利用训练好的模型参数对模型效果进行测评。
实验过程采用了四个数据集(图像分类)进行训练测试,数据集简介以及训练结果分别如下表1和表2。其中Copula_DNN是采用本发明方法得到的结果,而DNN是基于一般初始值的反向传播算法得到的结果,除了初始值生产方法不一致,两者在训练过程中的网络结构和其它训练参数都是相同的:
表1训练数据基本信息
表2测试结果(测试集错误率)
数据集 Copula_DNN DNN
MNIST 1.79% 1.98%
smallMNIST 3.65% 4.10%
USPS 2.55% 2.85%
COIL20 0.21% 1.56%
从上表1-2可以看出,本发明的方法在密集型和稀疏型数据集上的分类结果均取得了相对一般反向传播算法更优良的表现效果。本发明通过一种简单的统计拟合方法,将训练数据的统计特征融合进神经网络复杂的优化训练中的初始权重值中,使得反向传播训练达到更好的优化效果。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (1)

1.一种基于copula初始值优化的深度神经网络方法,其特征在于,具体包括以下步骤:
S1:图像集划分:将标签数据划分为训练集和测试集,训练集用于模型的训练学习,测试集用于测试模型的综合效果;
S2:特征拟合:用训练数据去拟合copula分布的多维相关性矩阵参数ρ;
S3:初始权重值生产:设定copula拟合分布为高斯分布,根据已经拟合好的高斯copula函数,按照网络结构规模生产随机数,随机数产生的区域进行调优;
S4:将步骤S3得到的随机数矩阵,传入反向传播算法作为初始值,设定学习率、迭代次数及正则化训练参数,进行反向传播训练;
S5:利用训练好的模型参数对模型效果进行测评;
S2中矩阵参数ρ相关性的计算包括以下步骤:
S21:当训练数据中80%以上的数据不为0,直接进行相关性的计算;
S22:当训练数据中80%以上的数据为0,如果输入特征向量全部为0,则强制设定此特征向量与其它特征的相关性为0,其它相关性数值计算方法不变;
S3中调优后的随机数服从[0,1]上的高斯copula分布。
CN201910734803.2A 2019-08-09 2019-08-09 一种基于copula初始值优化的深度神经网络方法 Active CN110414629B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910734803.2A CN110414629B (zh) 2019-08-09 2019-08-09 一种基于copula初始值优化的深度神经网络方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910734803.2A CN110414629B (zh) 2019-08-09 2019-08-09 一种基于copula初始值优化的深度神经网络方法

Publications (2)

Publication Number Publication Date
CN110414629A CN110414629A (zh) 2019-11-05
CN110414629B true CN110414629B (zh) 2023-12-08

Family

ID=68366914

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910734803.2A Active CN110414629B (zh) 2019-08-09 2019-08-09 一种基于copula初始值优化的深度神经网络方法

Country Status (1)

Country Link
CN (1) CN110414629B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019057489A1 (de) * 2017-09-20 2019-03-28 Siemens Aktiengesellschaft Verfahren und trainingsdatengenerator zum konfigurieren eines technischen systems sowie steuereinrichtung zum steuern des technischen systems

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019057489A1 (de) * 2017-09-20 2019-03-28 Siemens Aktiengesellschaft Verfahren und trainingsdatengenerator zum konfigurieren eines technischen systems sowie steuereinrichtung zum steuern des technischen systems

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Yan Chu,et al..Change detection of remote sensing image based on deep neural networks .《2nd International Conference on Artificial Intelligence and Industrial Engineering AIIE2016》.2016,全文. *
基于藤Copula-GARCH模型的网络资源风险预测;熊飞;李军;钮焱;;湖北工业大学学报(第05期);全文 *

Also Published As

Publication number Publication date
CN110414629A (zh) 2019-11-05

Similar Documents

Publication Publication Date Title
CN108171762B (zh) 一种深度学习的压缩感知同类图像快速重构系统与方法
TWI794157B (zh) 自動多閾值特徵過濾方法及裝置
CN112215054B (zh) 一种用于水声信号去噪的深度生成对抗方法
CN110717617A (zh) 一种基于深度图网络自编码器的无监督关系预测方法
CN116402825B (zh) 轴承故障红外诊断方法、系统、电子设备及存储介质
CN114239807A (zh) 基于rfe-dagmm的高维数据异常检测方法
CN111611293B (zh) 一种基于特征加权与MapReduce的离群数据挖掘方法
CN111985825A (zh) 一种用于滚磨机定向仪的晶面质量评估方法
CN107229945A (zh) 一种基于竞争学习的深度聚类方法
CN114785824B (zh) 一种智能物联网大数据传输方法及系统
CN109951327B (zh) 一种基于贝叶斯混合模型的网络故障数据合成方法
Srimani et al. Adaptive data mining approach for PCB defect detection and classification
CN110414629B (zh) 一种基于copula初始值优化的深度神经网络方法
CN107609033A (zh) 基于自适应协同进化算法的信息核提取方法
Bakar et al. ROBUST CENTERING IN THE FIXED EFFECT PANEL DATA MODEL.
CN112468229B (zh) 基于混合分布模型的大气湍流信道衰落参数估计方法
Song et al. Convex and non-Convex approaches for statistical inference with class-conditional noisy labels
CN116861964A (zh) 一种基于双判别器生成式对抗网络的异常数据检测方法
CN111275109A (zh) 基于自编码器的电力设备状态数据特征选优方法及系统
US20230348197A1 (en) Sound-based roller fault detecting method by using double-projection neighborhoods preserving embedding
CN115906959A (zh) 基于de-bp算法的神经网络模型的参数训练方法
CN112580667B (zh) 一种纺织图像的特征提取方法
CN113537573A (zh) 基于双重时空特征提取的风电功率运行趋势预测方法
CN110784887B (zh) 网格化无线电信号监测系统中异常信号源数量的检测方法
CN112749807A (zh) 一种基于生成模型的量子态层析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant