CN106033554A - 一种基于分段的两级深度学习模型的大数据处理方法 - Google Patents

一种基于分段的两级深度学习模型的大数据处理方法 Download PDF

Info

Publication number
CN106033554A
CN106033554A CN201510111904.6A CN201510111904A CN106033554A CN 106033554 A CN106033554 A CN 106033554A CN 201510111904 A CN201510111904 A CN 201510111904A CN 106033554 A CN106033554 A CN 106033554A
Authority
CN
China
Prior art keywords
layer
big data
learning model
order
stage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510111904.6A
Other languages
English (en)
Inventor
王劲林
尤佳莉
盛益强
李超鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Acoustics CAS
Shanghai 3Ntv Network Technology Co Ltd
Original Assignee
Institute of Acoustics CAS
Shanghai 3Ntv Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Acoustics CAS, Shanghai 3Ntv Network Technology Co Ltd filed Critical Institute of Acoustics CAS
Priority to CN201510111904.6A priority Critical patent/CN106033554A/zh
Priority to PCT/CN2015/075472 priority patent/WO2016145675A1/zh
Priority to EP15885058.6A priority patent/EP3270329A4/en
Priority to JP2017548135A priority patent/JP2018511870A/ja
Priority to US15/557,463 priority patent/US20180068215A1/en
Publication of CN106033554A publication Critical patent/CN106033554A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)
  • Complex Calculations (AREA)

Abstract

本发明提供了一种基于分段的两级深度学习模型的大数据处理方法,所述方法包括:步骤1)构建并训练基于分段的两级深度学习模型,该模型从纵向层次上分为两级:第一级和第二级;所述第一级的各层从横向上分为M段;第一级中不同段间相邻层的神经元节点间权重为0;步骤2)将待处理的大数据按照数据的类型分为M个子集,分别输入基于分段的两级深度学习模型的第一层的M段进行处理;步骤3)输出大数据处理结果。本发明提出的基于分段的两级深度学习模型能够有效地减小了模型规模,缩短了模型的训练时间;本发明的方法能够提高大数据的处理速度,缩短处理时间。

Description

一种基于分段的两级深度学习模型的大数据处理方法
技术领域
本发明涉及人工智能和大数据领域,特别涉及一种基于分段的两级深度学习模型的大数据处理方法。
背景技术
随着网络技术的快速发展,数据的容量和多样性快速增加,而处理数据的算法复杂度却难以改善,如何高效处理大数据已经成为一个紧迫的难题。在现有的依赖个人经验和手工操作来描述数据、标注数据、选择特征、提取特征、处理数据的方法,已经很难满足大数据快速增长的需求。随着人工智能技术的快速发展,特别是深度学习算法的研究突破,为解决大数据处理问题指明了一个值得探索的方向。
Hinton等人在2006年提出了用于深度置信网的逐层初始化训练方法,这是深度学习方法的研究起点,该方法打破了持续了几十年的深度神经网络训练困难且效果不好的局面。此后,深度学习算法在图像识别、语音识别、自然语言理解等领域得到广泛的应用。深度学习是通过模拟人脑分层次的抽象,将底层数据逐层映射而获得更抽象的特征,由于它可以从大数据中自动提取特征,并通过海量的样本训练获得很好的处理效果,从而得到了广泛的关注。实际上,大数据的快速增长和深度学习的研究突破是相辅相成的,一方面大数据的快速增长需要一种高效处理海量数据的方法,另一方面深度学习模型的训练需要海量的样本数据。总之,大数据可以使深度学习的性能达到极致。
但是,现有的深度学习模型仍然存在很多严重的问题,例如:模型难以扩展、参数优化困难、训练时间过长、推理效率低下等。在2013年Bengio的一篇综述论文中,总结了目前深度学习所面临的挑战和难点,包括如何扩展现有的深度学习模型的规模,并应用到更大的数据集;如何减小参数优化困难;如何避免昂贵的推理和采样;以及如何解开变化因素等。
发明内容
本发明的目的在于克服在大数据应用中现有神经网络深度学习模型存在的上述问题,提出了基于分段的两级深度学习模型,通过对深度学习模型分级分段的处理,对跨段间的权重进行约束,提高了模型的扩展能力,基于该模型,本发明提出了一种基于分段的两级深度学习模型的大数据处理方法,该方法能够提高大数据的处理速度,缩短处理时间。
为了实现上述目的,本发明提出了一种基于分段的两级深度学习模型的大数据处理方法,所述方法包括:
步骤1)构建并训练基于分段的两级深度学习模型,该模型从纵向层次上分为两级:第一级和第二级;所述第一级的各层从横向上分为M段;其中,M为多模态输入的模态个数;第一级中不同段间相邻层的神经元节点间权重为0;
步骤2)将待处理的大数据按照数据的类型分为M个子集,分别输入基于分段的两级深度学习模型的第一层的M段进行处理;
步骤3)输出大数据处理结果。
上述技术方案中,所述步骤1)进一步包括:
步骤101)将深度为L层的深度学习模型从纵向层次上分为两级:第一级和第二级:
输入层为第一层,输出层为第L层,第L*层为划分层,2≤L*≤L-1;则从第一层到第L*层间的所有层称为第一级,而第L*+1层到第L层间的所有层称为第二级;
步骤102)将第一级内每层上的神经元节点从横向上分为M段:
设L层神经网络的输入宽度为N,即每层有N个神经元节点,第一级的神经元节点划分为M段,每一段的宽度为Dm,1≤m≤M,且并在同一段中,任意两层的宽度都相同;
步骤103)将训练样本划分为M个子集,分别输入深度学习模型的第一层的M段;
步骤104)分别对第一级的M段子模型进行训练:
第一级中不同段间相邻层的神经元节点间权重为0,即第m段的所有节点集合为Sm,第l-1层的任意节点为2≤l≤L*,而第o段第l层的任意节点 s j ( o ) , l ∈ S o , 且m≠o,则节点间权重 w i ( m ) , j ( o ) , l = 0 ;
在上述约束条件下,利用深度神经网络学习算法分别对第一级的M段子模型进行训练;
步骤105)对第二级的各层进行训练;
步骤106)通过深度神经网络学习算法对各层的网络参数进行全局微调,直到各层的网络参数达到最优值。
上述技术方案中,L*的取值方法为:在L*的取值区间内通过交叉验证方法确定一个最优值。
本发明的优点在于:
1、本发明提出的基于分段的两级深度学习模型能够有效地减小了模型规模,缩短了模型的训练时间;
2、本发明提出的大数据处理方法支持多源异构或多模态的大数据的并行输入,提高了大数据的处理速度,缩短了处理时间。
附图说明
图1为本发明的基于分段的两级深度学习模型的大数据处理方法的流程图;
图2为基于分段的两级深度学习模型的示意图。
具体实施方式
以下结合附图对本发明的方法做进一步详细的描述。
如图1所示,一种基于分段的两级深度学习模型的大数据处理方法,包括:
步骤1)构建并训练基于分段的两级深度学习模型;包括:
步骤101)将深度为L层的深度学习模型从纵向上分为两级:第一级和第二级:
输入层为第一层,输出层为第L层,第L*层为划分层,其中2≤L*≤L-1,则从第一层到第L*层间的所有层称为第一级,而第L*+1层到第L层间的所有层称为第二级。
L*的取值方法为:在L*的取值区间内通过交叉验证方法确定一个最优值。
步骤102)将第一级内每层上的神经元节点从横向上分为M段;其中,M为多模态输入的模态个数;
如图2所示,设L层神经网络的输入宽度为N,即每层有N个神经元节点,第一级的神经元节点划分为M段,每一段的宽度为Dm,1≤m≤M,且并在同一段中,任意两层的宽度都相同;
步骤103)将训练样本划分为M个子集,分别输入深度学习模型的第一层的M段;
步骤104)分别对第一级的M段子模型进行训练;
第一级中不同段间相邻层的神经元节点间权重为0,即第m段的所有节点集合为Sm,第l-1层的任意节点为2≤l≤L*,而第o段第l层的任意节点 s j ( o ) , l ∈ S o , 且m≠o,则节点间权重 w i ( m ) , j ( o ) , l = 0 ;
在上述约束条件下,利用深度神经网络学习算法分别对第一级的M段子模型进行训练。
步骤105)对第二级的各层进行训练;
步骤106)通过深度神经网络学习算法对各层的网络参数进行全局微调,直到各层的网络参数达到最优值;
所述深度神经网络学习算法为BP算法。
步骤2)将待处理的大数据按照数据的类型分为M个子集,分别输入基于分段的两级深度学习模型的第一层的M段进行处理;
步骤3)输出大数据处理结果。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (3)

1.一种基于分段的两级深度学习模型的大数据处理方法,所述方法包括:
步骤1)构建并训练基于分段的两级深度学习模型,该模型从纵向层次上分为两级:第一级和第二级;所述第一级的各层从横向上分为M段;其中,M为多模态输入的模态个数;第一级中不同段间相邻层的神经元节点间权重为0;
步骤2)将待处理的大数据按照数据的类型分为M个子集,分别输入基于分段的两级深度学习模型的第一层的M段进行处理;
步骤3)输出大数据处理结果。
2.根据权利要求1所述的基于分段的两级深度学习模型的大数据处理方法,其特征在于,所述步骤1)进一步包括:
步骤101)将深度为L层的深度学习模型从纵向层次上分为两级:第一级和第二级:
输入层为第一层,输出层为第L层,第L*层为划分层,2≤L*≤L-1;则从第一层到第L*层间的所有层称为第一级,而第L*+1层到第L层间的所有层称为第二级;
步骤102)将第一级内每层上的神经元节点从横向上分为M段:
设L层神经网络的输入宽度为N,即每层有N个神经元节点,第一级的神经元节点划分为M段,每一段的宽度为Dm,1≤m≤M,且并在同一段中,任意两层的宽度都相同;
步骤103)将训练样本划分为M个子集,分别输入深度学习模型的第一层的M段;
步骤104)分别对第一级的M段子模型进行训练:
第一级中不同段间相邻层的神经元节点间权重为0,即第m段的所有节点集合为Sm,第l-1层的任意节点为2≤l≤L*,而第o段第l层的任意节点 s j ( o ) , l ∈ S o , 且m≠o,则节点间权重 w i ( m ) , j ( o ) , l = 0 ;
在上述约束条件下,利用深度神经网络学习算法分别对第一级的M段子模型进行训练;
步骤105)对第二级的各层进行训练;
步骤106)通过深度神经网络学习算法对各层的网络参数进行全局微调,直到各层的网络参数达到最优值。
3.根据权利要求2所述的基于分段的两级深度学习模型的大数据处理方法,其特征在于,所述L*的取值方法为:在L*的取值区间内通过交叉验证方法确定一个最优值。
CN201510111904.6A 2015-03-13 2015-03-13 一种基于分段的两级深度学习模型的大数据处理方法 Pending CN106033554A (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201510111904.6A CN106033554A (zh) 2015-03-13 2015-03-13 一种基于分段的两级深度学习模型的大数据处理方法
PCT/CN2015/075472 WO2016145675A1 (zh) 2015-03-13 2015-03-31 一种基于分段的两级深度学习模型的大数据处理方法
EP15885058.6A EP3270329A4 (en) 2015-03-13 2015-03-31 Big data processing method for segment-based two-grade deep learning model
JP2017548135A JP2018511870A (ja) 2015-03-13 2015-03-31 セグメントに基づく二段深層学習モデル用のビッグデータの処理方法
US15/557,463 US20180068215A1 (en) 2015-03-13 2015-03-31 Big data processing method for segment-based two-grade deep learning model

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510111904.6A CN106033554A (zh) 2015-03-13 2015-03-13 一种基于分段的两级深度学习模型的大数据处理方法

Publications (1)

Publication Number Publication Date
CN106033554A true CN106033554A (zh) 2016-10-19

Family

ID=56918381

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510111904.6A Pending CN106033554A (zh) 2015-03-13 2015-03-13 一种基于分段的两级深度学习模型的大数据处理方法

Country Status (5)

Country Link
US (1) US20180068215A1 (zh)
EP (1) EP3270329A4 (zh)
JP (1) JP2018511870A (zh)
CN (1) CN106033554A (zh)
WO (1) WO2016145675A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109522914A (zh) * 2017-09-19 2019-03-26 中国科学院沈阳自动化研究所 一种基于图像的模型融合的神经网络结构训练方法
CN109657285A (zh) * 2018-11-27 2019-04-19 中国科学院空间应用工程与技术中心 汽轮机转子瞬态应力的检测方法
WO2019128475A1 (zh) * 2017-12-29 2019-07-04 中兴通讯股份有限公司 数据训练方法及装置、存储介质、电子装置
CN110889492A (zh) * 2019-11-25 2020-03-17 北京百度网讯科技有限公司 用于训练深度学习模型的方法和装置
WO2020113782A1 (zh) * 2018-12-05 2020-06-11 清华大学深圳研究生院 基于数据分布的联合深度学习方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108198625B (zh) * 2016-12-08 2021-07-20 推想医疗科技股份有限公司 一种分析高维医疗数据的深度学习方法和装置
JP6858082B2 (ja) * 2017-06-07 2021-04-14 Kddi株式会社 管理装置、管理方法、及びプログラム
CN107316024B (zh) * 2017-06-28 2021-06-29 北京博睿视科技有限责任公司 基于深度学习的周界报警算法
CN109299782B (zh) * 2018-08-02 2021-11-12 奇安信科技集团股份有限公司 一种基于深度学习模型的数据处理方法及装置
CN109005060B (zh) * 2018-08-02 2022-01-25 上海交通大学 一种基于层级化高度异构分布式系统的深度学习应用优化框架
CN110287175A (zh) * 2019-05-19 2019-09-27 中国地质调查局西安地质调查中心 一种资源环境承载能力的大数据智能测定系统
CN112465030B (zh) * 2020-11-28 2022-06-07 河南财政金融学院 一种基于两级迁移学习的多源异构信息融合故障诊断方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR910020571A (ko) * 1990-05-21 1991-12-20 다카도리 수나오 데이터 처리장치
JPH0438556A (ja) * 1990-06-04 1992-02-07 Takayama:Kk データ処理装置
JP2001022722A (ja) * 1999-07-05 2001-01-26 Nippon Telegr & Teleph Corp <Ntt> 質的変数で条件付けられる数法則の発見方法及び装置及び質的変数で条件付けられる数法則の発見プログラムを格納した記憶媒体
JP2005237668A (ja) * 2004-02-26 2005-09-08 Kazuya Mera コンピュータネットワークにおける感情を考慮した対話装置
WO2014205231A1 (en) * 2013-06-19 2014-12-24 The Regents Of The University Of Michigan Deep learning framework for generic object detection
CN103945533B (zh) * 2014-05-15 2016-08-31 济南嘉科电子技术有限公司 基于大数据的无线实时位置定位方法
CN104102929B (zh) * 2014-07-25 2017-05-03 哈尔滨工业大学 基于深度学习的高光谱遥感数据分类方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109522914A (zh) * 2017-09-19 2019-03-26 中国科学院沈阳自动化研究所 一种基于图像的模型融合的神经网络结构训练方法
WO2019128475A1 (zh) * 2017-12-29 2019-07-04 中兴通讯股份有限公司 数据训练方法及装置、存储介质、电子装置
CN109993299A (zh) * 2017-12-29 2019-07-09 中兴通讯股份有限公司 数据训练方法及装置、存储介质、电子装置
CN109993299B (zh) * 2017-12-29 2024-02-27 中兴通讯股份有限公司 数据训练方法及装置、存储介质、电子装置
CN109657285A (zh) * 2018-11-27 2019-04-19 中国科学院空间应用工程与技术中心 汽轮机转子瞬态应力的检测方法
WO2020113782A1 (zh) * 2018-12-05 2020-06-11 清华大学深圳研究生院 基于数据分布的联合深度学习方法
CN110889492A (zh) * 2019-11-25 2020-03-17 北京百度网讯科技有限公司 用于训练深度学习模型的方法和装置
CN110889492B (zh) * 2019-11-25 2022-03-08 北京百度网讯科技有限公司 用于训练深度学习模型的方法和装置

Also Published As

Publication number Publication date
US20180068215A1 (en) 2018-03-08
WO2016145675A1 (zh) 2016-09-22
JP2018511870A (ja) 2018-04-26
EP3270329A1 (en) 2018-01-17
EP3270329A4 (en) 2018-04-04

Similar Documents

Publication Publication Date Title
CN106033554A (zh) 一种基于分段的两级深度学习模型的大数据处理方法
CN106033555A (zh) 基于满足k度稀疏约束的深度学习模型的大数据处理方法
CN111144329B (zh) 一种基于多标签的轻量快速人群计数方法
US11804074B2 (en) Method for recognizing facial expressions based on adversarial elimination
CN109635936A (zh) 一种基于重训练的神经网络剪枝量化方法
CN104850890B (zh) 基于实例学习和Sadowsky分布的卷积神经网络参数调整方法
CN110110080A (zh) 文本分类模型训练方法、装置、计算机设备及存储介质
CN109977250B (zh) 融合语义信息和多级相似性的深度哈希图像检索方法
CN108399421A (zh) 一种基于词嵌入的深度零样本分类方法
CN106779068A (zh) 调整人工神经网络的方法和装置
CN108009594B (zh) 一种基于变分组卷积的图像识别方法
CN110188863B (zh) 一种适用于资源受限设备的卷积神经网络的卷积核压缩方法
CN110516065A (zh) 一种基于多路动态掩码的注意力神经网络的方法
CN107145893A (zh) 一种基于卷积深度网络的图像识别算法及系统
CN108765512B (zh) 一种基于多层级特征的对抗图像生成方法
JP2018511870A5 (zh)
CN109543029B (zh) 基于卷积神经网络的文本分类方法、装置、介质和设备
CN112990325B (zh) 一种面向嵌入式实时视觉目标检测的轻型网络构建方法
CN108596264A (zh) 一种基于深度学习的社区发现方法
CN110457470A (zh) 一种文本分类模型学习方法及装置
CN112528873A (zh) 基于多级语义表征和语义计算的信号语义识别方法
CN113342809A (zh) 一种基于图神经网络的互联网食品实体对齐方法及系统
Hussain et al. Analysis of techniques for anfis rule-base minimization and accuracy maximization
Du et al. Efficient network construction through structural plasticity
CN105224943A (zh) 基于多线索归一化非负稀疏编码器的图像快速特征表示方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20161019