CN111460818A - 一种基于增强胶囊网络的网页文本分类方法及存储介质 - Google Patents

一种基于增强胶囊网络的网页文本分类方法及存储介质 Download PDF

Info

Publication number
CN111460818A
CN111460818A CN202010243260.7A CN202010243260A CN111460818A CN 111460818 A CN111460818 A CN 111460818A CN 202010243260 A CN202010243260 A CN 202010243260A CN 111460818 A CN111460818 A CN 111460818A
Authority
CN
China
Prior art keywords
capsule
layer
network
data
convolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010243260.7A
Other languages
English (en)
Other versions
CN111460818B (zh
Inventor
石丽红
朱鹏
赵习枝
张福浩
仇阿根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese Academy of Surveying and Mapping
Original Assignee
Chinese Academy of Surveying and Mapping
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese Academy of Surveying and Mapping filed Critical Chinese Academy of Surveying and Mapping
Priority to CN202010243260.7A priority Critical patent/CN111460818B/zh
Publication of CN111460818A publication Critical patent/CN111460818A/zh
Application granted granted Critical
Publication of CN111460818B publication Critical patent/CN111460818B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于增强胶囊网络的网页文本分类方法及其存储介质,该方法为爬取特定领域的网页文本数据,对获取的文本数据进行清洗和数据结构化处理,最终得到实验语料;设定增强胶囊网络的体系结构,依次包括密集卷积网络、主胶囊层和数字胶囊层;将训练集中的训练数据作为增强胶囊网络的输入,对增强胶囊网络进行训练,得到分类器,然后用测试集的测试数据对分类器准确率进行验证。本发明引入了密集卷积网络来提取特征信息,从而使特征更具判断力,提高了模型在数据集上的学习能力。主胶囊层采用动态路由机制对其进一步编码,使获得的特征更具方向性,使得胶囊网络更具有鲁棒性。

Description

一种基于增强胶囊网络的网页文本分类方法及存储介质
技术领域
本发明设计自然语言处理技术领域,具体的,涉及一种基于增强胶囊网络的网页文本分类方法及存储介质,该方法特别适用于社会公共安全事件等相关领域。
背景技术
随着互联网技术的发展,互联网中涉及社会公共安全事件数据量爆炸式增长。公共安全事件是危及到大多数(非全体人民,也非个人)的生命、健康、财产,并可能引起以一系列的公共性问题,进而导致价值系统崩溃、社会秩序紊乱的事件。公共安全事件通常分为自然灾害、事故灾难、公共卫生、社会安全。从互联网上采集大量社会公共安全事件数据的相关网页和信息,并从中自动抽取出风险数据,对社会公共安全监测和预警具有重要意义,但海量数据的复杂性和非结构性给公共安全事件信息的处理带来了巨大的挑战。如何对复杂的网页文本数据中所提取到的社会公共安全事件文本信息进行自动分类是公共安全网络信息分析的重点、难点问题。
文本分类技术是对文本的合理建模,提取到文本的特征表示,使数据集中的待分类文本的内容划分到正确的类别中去。目前,实现文本分类的主流方法是深度学习方法,主要利用卷积神经网络的卷积核提取文本词向量特征,其深浅两层隐藏层属于静态连接。利用池化层对卷积层做二次提取,之后经过全连接层得到分类关系。其中池化层在选择最显著的特征中会丢失许多底层信息,并且需要一定时间训练模型中大量的参数,导致模型训练效率低。
胶囊网络作为一种全新的神经网络提出之后受到广泛关注,胶囊网络用矢量胶囊代替标量神经元,对于特征向量具有良好的方向表示,并改进了传统卷积网络的最大池化操作。但传统胶囊网络仅采用一层卷积进行空间特征提取,未能很好的提取深层特征,使得模型整体精准度不高,并且在特征提取过程中会丢失大量重要的信息。
因此,如何克服上述不足,快速而高效的管理和利用网页文本资源成为亟需解决的技术问题。
发明内容
为了克服现有技术存在的整体精准度不高、特征提取过程中丢失大量重要信息等问题,本发明提出一种基于增强胶囊网络的社会公共安全事件网页文本分类方法。与现有的传统胶囊网络分类方法相比,本发明引入了密集卷积网络来提取特征信息,从而使特征更具判断力,提高了模型在数据集上的学习能力。主胶囊层采用动态路由机制对其进一步编码,使获得的特征更具方向性,使得胶囊网络更具有鲁棒性。
为达此目的,本发明采用以下技术方案:
一种基于增强胶囊网络的网页文本分类方法,包括如下步骤:
数据获取与处理步骤S110:
爬取特定领域的网页文本数据,对获取的文本数据进行清洗和数据结构化处理,最终得到实验语料,将清洗后的纯净数据分为训练集和测试集,选取方式均为随机选取,对网页文本数据进行向量化获取对应词向量;
构建增强胶囊网络体系结构步骤S120:
设定增强胶囊网络的体系结构,该体系结构为三层,依次包括密集卷积网络(DenseNet)、主胶囊层(PrimaryCaps)和数字胶囊层(DigitCaps),所述密集聚集网络包括多个密集卷积模块,所述主胶囊层采用动态路由算法对其进一步编码,数字胶囊层含有多个胶囊;
训练增强胶囊网络对文本分类步骤S130:
将训练集中的训练数据作为增强胶囊网络的输入,对增强胶囊网络进行训练,得到分类器,然后用测试集的测试数据对分类器准确率进行验证。
可选的,所述对获取的文本数据进行清洗和数据结构化处理具体包括:在实验语料中引入社会公共安全事件领域词典,对实验语料作分词处理;引入停用词表,去掉分词后的文本数据中对应的停用词。
可选的,所述将清洗后的纯净数据分为训练集和测试集,选取方式均为随机选取,对网页文本数据进行向量化获取对应词向量,具体为:
将清洗后的纯净数据分为80%训练集和20%测试集,选取方式均为随机选取,对网页文本数据采用Word2vec模型进行向量化获取对应词向量。
可选的,所述密集卷积网络结构组成依次为输入层,1*1卷积层,密集卷积模块,1*1卷积层,2*2平均池化层,密集卷积模块,1*1卷积层,2*2平均池化层,密集卷积模块和2*2平均池化层。
可选的,所述密集卷积模块包括4个卷积层C,每个卷积层C包含6个1*1卷积与6个3*3卷积,卷积层与卷积层之间通过非线性转换函数连接;
所述非线性转换函数包含:批量规范化模块,修正线性单元和3*3卷积。
可选的,所述主胶囊层的动态路由算法具体为:
下层胶囊由上层胶囊计算得出,每个上层胶囊i连接到下层胶囊j的概率为:
Figure BDA0002433256500000031
其中,cij为耦合系数,是下层胶囊i激活上层胶囊j的概率;bij是胶囊i连接到胶囊j的先验概率,初始值设置为0;
据耦合系数cij计算加权求和得输入向量sj
Figure BDA0002433256500000041
Figure BDA0002433256500000042
其中:ui为上层胶囊的输出,
Figure BDA0002433256500000043
为上层胶囊预测向量,Wij为相邻两层的权值转化矩阵,sj为输入向量。使用判别式学习实现非线性压缩,并通过其实现胶囊层级的激活功能;
输出向量vj可表示为:
Figure BDA0002433256500000044
其中:vj为输出向量,sj为输入向量;
接下来为路由更新,通过输出向量vj与上层胶囊预测向量
Figure BDA0002433256500000045
相乘进行更新bij,bij的更新计算公式如下:
Figure BDA0002433256500000046
可选的,所述数字胶囊层中含有10个胶囊,通过每个胶囊活动向量的长度预测其属于某个类别的概率。
可选的,在所述增强胶囊网络中,将密集卷积网络获得7*7*512的特征向量送入主胶囊层;
主胶囊层有32个步长为1,卷积核大小为2×2的核,获得6*6*32*8的特征映射,8为输出向量维度;主胶囊层通过32个卷积核进行特征提取,单个卷积核进行普通卷积操作后进行封装,纵向延展为8,共得到32个8维主胶囊;
数字胶囊层中含有10个胶囊,通过每个胶囊活动向量的长度预测其属于某个类别的概率。
一种存储介质,用于存储计算机可执行指令,其特征在于:
所述计算机可执行指令在被处理器执行时执行上述的基于增强胶囊网络的网页文本分类方法。
本发明提供的基于增强胶囊网络的网页文本分类方法,与现有技术相比,具有如下优势:
1)由于本发明利用密集卷积网络改进后作为一个特征提取器,它密集卷积的设计能够在很深的层次上很好地探索全局和局部特征并且消除梯度消失问题,结合胶囊网络的优点,采用矢量神经元即胶囊代替标量神经元,使得提取特征更具有泛化性,有助于快速收敛和提高模型的精准度。
2)由于本发明在胶囊网络使用动态路由算法,减少了卷积神经网络中数据在反向传播过程中可能给文本分类器模型带来的一些弊端,提高了胶囊网络模型的鲁棒性,使得胶囊网络能够更好地学习文本特征。
附图说明
图1是本发明基于增强胶囊网络的网页文本分类方法的流程图;
图2是本发明增强胶囊网络中密集卷积层的结构示意图;
图3是本发明密集卷积网络中密集卷积模块的结构示意图;
图4是本发明基于增强胶囊网络的网页文本分类方法的具体信息流程示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
具体的,参见图1,示出了本发明的基于增强胶囊网络的网页文本分类方法的基础流程图,包括如下步骤:
数据获取与处理步骤S110:
从新浪新闻、网易新闻、新浪微博等国内主流媒体网站爬取社会公共安全事件网页文本数据,对获取的文本数据进行清洗和数据结构化处理,最终得到实验语料,将清洗后的纯净数据分为训练集和测试集,选取方式均为随机选取,对网页文本数据进行向量化获取对应词向量。
进一步的,所述对获取的文本数据进行清洗和数据结构化处理具体包括:在实验语料中引入社会公共安全事件领域词典,对实验语料作分词处理;引入停用词表,去掉分词后的文本数据中对应的停用词。
更进一步的,将清洗后的纯净数据分为80%训练集和20%测试集,选取方式均为随机选取;对网页文本数据采用Word2vec模型进行向量化获取对应词向量。
在本发明中,相关领域采用了社会公共安全事件,因此,获取了社会公共安全事件网页文本数据,词典采用了社会公共安全事件领域词典。但本发明不以此为限,只要是相关领域的网页文本数据和相关领域的词典都可以实现本发明的效果。
构建增强胶囊网络体系结构步骤S120:
设定增强胶囊网络的体系结构,依次包括密集卷积网络(DenseNet)、主胶囊层(PrimaryCaps)和数字胶囊层(Digi tCaps),所述主胶囊层采用动态路由算法对其进一步编码,数字胶囊层含有多个胶囊。
其中密集卷积模型用于改进胶囊网络结构中的特征提取部分;主胶囊层实现标量神经元到向量神经元的转换,并且采用动态路由算法对其进一步编码,提高模型识别效率,使模型能够快速平稳的收敛;数字胶囊层中含有10个胶囊,通过每个胶囊活动向量的长度预测其属于某个类别的概率。
具体的,所述密集卷积网络通过前后特征的重复利用,获得文本的高级抽象特征,参见图2。密集卷积网络结构组成依次为输入层,1*1卷积层,密集卷积模块(Dense Block),1*1卷积层,2*2平均池化层,密集卷积模块,1*1卷积层,2*2平均池化层,密集卷积模块和2*2平均池化层。
所述密集卷积模块参见图3,包括4个卷积层C,每个卷积层C包含6个1*1卷积与6个3*3卷积,卷积层与卷积层之间通过非线性转换函数连接,所述非线性转换函数包含三个操作:批量规范化模块(Batch Normalization,BN),修正线性单元(Rectified Linear Unit,ReLU)和3*3卷积(Convolution,Conv)。密集卷积模块的主要特点是保证层与层之间获得最大程度信息的传输。因此,虽然文本向量信息在深层网络中传递容易导致信息流变弱而出现梯度消失问题,而密集卷积模块通过前后特征的重复利用,减轻了梯度消失现象。
所述主胶囊层采用动态路由算法,计算深浅两层隐藏层中每个胶囊之间的关系。其预测向量由胶囊网络的输出向量与权重矩阵相乘获得。比较预测向量与父节点输出,若为较小的量值,则升高其他父节点的耦合系数,降低该父节点的耦合系数;若为较大的量值,则降低其他父节点的耦合系数,升高该父节点的耦合系数,也即胶囊增加了对该父节点的贡献,通过深浅两层动态连接,模型可以自动地筛选更有效的胶囊,使得网络能够更好地收敛,提高了整个网络的鲁棒性。
具体的,所述动态路由中,下层胶囊由上层胶囊计算得出,每个上层胶囊i连接到下层胶囊j的概率为:
Figure BDA0002433256500000071
其中,cij为耦合系数,是下层胶囊i激活上层胶囊j的概率;bij是胶囊i连接到胶囊j的先验概率,初始值设置为0。
据耦合系数cij计算加权求和得输入向量sj
Figure BDA0002433256500000072
Figure BDA0002433256500000081
其中:ui为上层胶囊的输出,
Figure BDA0002433256500000082
为上层胶囊预测向量,Wij为相邻两层的权值转化矩阵,sj为输入向量。使用判别式学习实现非线性压缩,并通过其实现胶囊层级的激活功能。输出向量vj可表示为:
Figure BDA0002433256500000083
其中:vj为输出向量,sj为输入向量。
胶囊的输出向量的长度表征实体出现的概率,所以使用非线性压缩“squashing”函数将向量的模长限定在0到1之间。非线性压缩“squashing”函数,可确保短向量的长度能够缩短到几乎为0,而长向量的长度压缩到1的左领域内,输出向量越长,代表文本属于该类概率越大。
接下来进入路由更新环节,通过输出向量vj与上层胶囊预测向量
Figure BDA0002433256500000084
相乘进行更新bij,bij的更新计算公式如下:
Figure BDA0002433256500000085
所述数字胶囊层中含有10个胶囊,通过每个胶囊活动向量的长度预测其属于某个类别的概率。
因此,在所述增强胶囊网络中,将密集卷积网络(DenseNet)获得7*7*512的特征向量送入主胶囊(PrimaryCaps)层;主胶囊(PrimaryCaps)层有32个步长为1,卷积核大小为2×2的核;获得6*6*32*8的特征映射,8为输出向量维度;主胶囊层通过32个卷积核进行特征提取,单个卷积核进行普通卷积操作后进行封装,纵向延展为8,也可看作是8个卷积单元,共得到32个8维主胶囊;数字胶囊层中含有10个胶囊,通过每个胶囊活动向量的长度预测其属于某个类别的概率。
训练增强胶囊网络对文本分类步骤S130:将训练集中的训练数据作为增强胶囊网络的输入,对增强胶囊网络进行训练,得到分类器,然后用测试集的测试数据对分类器准确率进行验证。
具体的,参见图4,示出了本发明基于增强胶囊网络的网页文本分类方法的具体信息流程示意图。本发明实施例通过提供了一种基于增强胶囊网络的网页文本分类方法,可以针对社会公共安全事件等系列领域,包括:爬取网页文本数据进行清洗后,将样本数据分成训练集和测试集。采用Word2vec模型获取词向量,将80%训练数据作为增强胶囊网络的输入,对增强胶囊网络进行训练,得到分类器,最后用20%测试数据验证分类器准确率。
进一步的,本发明还公开了一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时执行上述的基于增强胶囊网络的网页文本分类方法。
本发明提供的基于增强胶囊网络的网页文本分类方法,与现有技术相比,具有如下优势:
1)由于本发明利用密集卷积网络改进后作为一个特征提取器,它密集卷积的设计能够在很深的层次上很好地探索全局和局部特征并且消除梯度消失问题,结合胶囊网络的优点,采用矢量神经元即胶囊代替标量神经元,使得提取特征更具有泛化性,有助于快速收敛和提高模型的精准度。
2)由于本发明在胶囊网络使用动态路由算法,减少了卷积神经网络中数据在反向传播过程中可能给文本分类器模型带来的一些弊端,提高了胶囊网络模型的鲁棒性,使得胶囊网络能够更好地学习文本特征。
显然,本领域技术人员应该明白,上述的本发明的各单元或各步骤可以用通用的计算装置来实现,它们可以集中在单个计算装置上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施方式仅限于此,对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单的推演或替换,都应当视为属于本发明由所提交的权利要求书确定保护范围。

Claims (9)

1.一种基于增强胶囊网络的网页文本分类方法,包括如下步骤:
数据获取与处理步骤S110:
爬取特定领域的网页文本数据,对获取的文本数据进行清洗和数据结构化处理,最终得到实验语料,将清洗后的纯净数据分为训练集和测试集,选取方式均为随机选取,对网页文本数据进行向量化获取对应词向量;
构建增强胶囊网络体系结构步骤S120:
设定增强胶囊网络的体系结构,该体系结构为三层,依次包括密集卷积网络(DenseNet)、主胶囊层(PrimaryCaps)和数字胶囊层(DigitCaps),所述密集聚集网络包括多个密集卷积模块,所述主胶囊层采用动态路由算法对其进一步编码,数字胶囊层含有多个胶囊;
训练增强胶囊网络对文本分类步骤S130:
将训练集中的训练数据作为增强胶囊网络的输入,对增强胶囊网络进行训练,得到分类器,然后用测试集的测试数据对分类器准确率进行验证。
2.根据权利要求1所述的网页文本分类方法,其特征在于:
所述对获取的文本数据进行清洗和数据结构化处理具体包括:在实验语料中引入社会公共安全事件领域词典,对实验语料作分词处理;引入停用词表,去掉分词后的文本数据中对应的停用词。
3.根据权利要求2所述的网页文本分类方法,其特征在于:
所述将清洗后的纯净数据分为训练集和测试集,选取方式均为随机选取,对网页文本数据进行向量化获取对应词向量,具体为:
将清洗后的纯净数据分为80%训练集和20%测试集,选取方式均为随机选取,对网页文本数据采用Word2vec模型进行向量化获取对应词向量。
4.根据权利要求1或2所述的网页文本分类方法,其特征在于:
所述密集卷积网络结构组成依次为输入层,1*1卷积层,密集卷积模块,1*1卷积层,2*2平均池化层,密集卷积模块,1*1卷积层,2*2平均池化层,密集卷积模块和2*2平均池化层。
5.根据权利要求4所述的网页文本分类方法,其特征在于:
所述密集卷积模块包括4个卷积层C,每个卷积层C包含6个1*1卷积与6个3*3卷积,卷积层与卷积层之间通过非线性转换函数连接;
所述非线性转换函数包含:批量规范化模块,修正线性单元和3*3卷积。
6.根据权利要求4所述的网页文本分类方法,其特征在于:
所述主胶囊层的动态路由算法具体为:
下层胶囊由上层胶囊计算得出,每个上层胶囊i连接到下层胶囊j的概率为:
Figure FDA0002433256490000021
其中,cij为耦合系数,是下层胶囊i激活上层胶囊j的概率;bij是胶囊i连接到胶囊j的先验概率,初始值设置为0;
据耦合系数cij计算加权求和得输入向量sj
Figure FDA0002433256490000022
Figure FDA0002433256490000023
其中:ui为上层胶囊的输出,
Figure FDA0002433256490000024
为上层胶囊预测向量,Wij为相邻两层的权值转化矩阵,sj为输入向量。使用判别式学习实现非线性压缩,并通过其实现胶囊层级的激活功能;
输出向量vj可表示为:
Figure FDA0002433256490000025
其中:vj为输出向量,sj为输入向量;
接下来为路由更新,通过输出向量vj与上层胶囊预测向量
Figure FDA0002433256490000031
相乘进行更新bij,bij的更新计算公式如下:
Figure FDA0002433256490000032
7.根据权利要求6所述的网页文本分类方法,其特征在于:
所述数字胶囊层中含有10个胶囊,通过每个胶囊活动向量的长度预测其属于某个类别的概率。
8.根据权利要求1或7所述的网页文本分类方法,其特征在于:
在所述增强胶囊网络中,将密集卷积网络获得7*7*512的特征向量送入主胶囊层;
主胶囊层有32个步长为1,卷积核大小为2×2的核,获得6*6*32*8的特征映射,8为输出向量维度;主胶囊层通过32个卷积核进行特征提取,单个卷积核进行普通卷积操作后进行封装,纵向延展为8,共得到32个8维主胶囊;
数字胶囊层中含有10个胶囊,通过每个胶囊活动向量的长度预测其属于某个类别的概率。
9.一种存储介质,用于存储计算机可执行指令,其特征在于:
所述计算机可执行指令在被处理器执行时执行权利要求1-8中任一项所述的基于增强胶囊网络的网页文本分类方法。
CN202010243260.7A 2020-03-31 2020-03-31 一种基于增强胶囊网络的网页文本分类方法及存储介质 Active CN111460818B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010243260.7A CN111460818B (zh) 2020-03-31 2020-03-31 一种基于增强胶囊网络的网页文本分类方法及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010243260.7A CN111460818B (zh) 2020-03-31 2020-03-31 一种基于增强胶囊网络的网页文本分类方法及存储介质

Publications (2)

Publication Number Publication Date
CN111460818A true CN111460818A (zh) 2020-07-28
CN111460818B CN111460818B (zh) 2023-06-30

Family

ID=71680923

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010243260.7A Active CN111460818B (zh) 2020-03-31 2020-03-31 一种基于增强胶囊网络的网页文本分类方法及存储介质

Country Status (1)

Country Link
CN (1) CN111460818B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112184687A (zh) * 2020-10-10 2021-01-05 南京信息工程大学 基于胶囊特征金字塔的道路裂缝检测方法和存储介质
CN112348038A (zh) * 2020-11-30 2021-02-09 江苏海洋大学 一种基于胶囊网络的视觉定位方法
CN112348119A (zh) * 2020-11-30 2021-02-09 华平信息技术股份有限公司 基于胶囊网络的图像分类方法、存储介质及电子设备
CN113190681A (zh) * 2021-03-02 2021-07-30 东北大学 一种基于胶囊网络遮罩记忆注意力的细粒度文本分类方法
CN113449819A (zh) * 2021-08-27 2021-09-28 中国测绘科学研究院 一种基于胶囊网络的信用评估模型方法及其存储介质
CN114595806A (zh) * 2022-03-02 2022-06-07 桂林理工大学 基于改进胶囊网络林地土壤肥力分析评价模型
CN115270997A (zh) * 2022-09-20 2022-11-01 中国人民解放军32035部队 基于迁移学习的火箭目标姿态稳定判别方法及相关装置

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107038480A (zh) * 2017-05-12 2017-08-11 东华大学 一种基于卷积神经网络的文本情感分类方法
CN107301246A (zh) * 2017-07-14 2017-10-27 河北工业大学 基于超深卷积神经网络结构模型的中文文本分类方法
CN108985316A (zh) * 2018-05-24 2018-12-11 西南大学 一种改进重构网络的胶囊网络图像分类识别方法
CN109241283A (zh) * 2018-08-08 2019-01-18 广东工业大学 一种基于多角度胶囊网络的文本分类方法
CN109410917A (zh) * 2018-09-26 2019-03-01 河海大学常州校区 基于改进型胶囊网络的语音数据分类方法
CN109543084A (zh) * 2018-11-09 2019-03-29 西安交通大学 一种建立面向网络社交媒体的隐蔽敏感文本的检测模型的方法
CN109766553A (zh) * 2019-01-09 2019-05-17 北京邮电大学 一种基于多正则化结合的胶囊模型的中文分词方法
CN110046249A (zh) * 2019-03-11 2019-07-23 中国科学院深圳先进技术研究院 胶囊网络的训练方法、分类方法、系统、设备及存储介质
CN110046671A (zh) * 2019-04-24 2019-07-23 吉林大学 一种基于胶囊网络的文本分类方法
CN110110724A (zh) * 2019-05-07 2019-08-09 东南大学 基于指数型挤压函数驱动胶囊神经网络的文本验证码识别方法
US20190370972A1 (en) * 2018-06-04 2019-12-05 University Of Central Florida Research Foundation, Inc. Capsules for image analysis
CN110647919A (zh) * 2019-08-27 2020-01-03 华东师范大学 一种基于k-均值聚类和胶囊网络的文本聚类方法及系统
CN110657984A (zh) * 2019-09-27 2020-01-07 重庆大学 一种基于强化胶囊网络的行星齿轮箱故障诊断方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107038480A (zh) * 2017-05-12 2017-08-11 东华大学 一种基于卷积神经网络的文本情感分类方法
CN107301246A (zh) * 2017-07-14 2017-10-27 河北工业大学 基于超深卷积神经网络结构模型的中文文本分类方法
CN108985316A (zh) * 2018-05-24 2018-12-11 西南大学 一种改进重构网络的胶囊网络图像分类识别方法
US20190370972A1 (en) * 2018-06-04 2019-12-05 University Of Central Florida Research Foundation, Inc. Capsules for image analysis
CN109241283A (zh) * 2018-08-08 2019-01-18 广东工业大学 一种基于多角度胶囊网络的文本分类方法
CN109410917A (zh) * 2018-09-26 2019-03-01 河海大学常州校区 基于改进型胶囊网络的语音数据分类方法
CN109543084A (zh) * 2018-11-09 2019-03-29 西安交通大学 一种建立面向网络社交媒体的隐蔽敏感文本的检测模型的方法
CN109766553A (zh) * 2019-01-09 2019-05-17 北京邮电大学 一种基于多正则化结合的胶囊模型的中文分词方法
CN110046249A (zh) * 2019-03-11 2019-07-23 中国科学院深圳先进技术研究院 胶囊网络的训练方法、分类方法、系统、设备及存储介质
CN110046671A (zh) * 2019-04-24 2019-07-23 吉林大学 一种基于胶囊网络的文本分类方法
CN110110724A (zh) * 2019-05-07 2019-08-09 东南大学 基于指数型挤压函数驱动胶囊神经网络的文本验证码识别方法
CN110647919A (zh) * 2019-08-27 2020-01-03 华东师范大学 一种基于k-均值聚类和胶囊网络的文本聚类方法及系统
CN110657984A (zh) * 2019-09-27 2020-01-07 重庆大学 一种基于强化胶囊网络的行星齿轮箱故障诊断方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HONGXIA YIN: "Capsule Network With Identifying Transferable Knowledge for Cross-Domain Sentiment Classfication" *
王弘中: "一种基于混合词向量的胶囊网络文本分类方法", 《小型微型计算机系统》 *
贾旭东: "基于多头注意力胶囊网络的文本分类模型", 《清华大学学报(自然科学版)》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112184687A (zh) * 2020-10-10 2021-01-05 南京信息工程大学 基于胶囊特征金字塔的道路裂缝检测方法和存储介质
CN112184687B (zh) * 2020-10-10 2023-09-26 南京信息工程大学 基于胶囊特征金字塔的道路裂缝检测方法和存储介质
CN112348038A (zh) * 2020-11-30 2021-02-09 江苏海洋大学 一种基于胶囊网络的视觉定位方法
CN112348119A (zh) * 2020-11-30 2021-02-09 华平信息技术股份有限公司 基于胶囊网络的图像分类方法、存储介质及电子设备
CN112348119B (zh) * 2020-11-30 2023-04-07 华平信息技术股份有限公司 基于胶囊网络的图像分类方法、存储介质及电子设备
CN113190681A (zh) * 2021-03-02 2021-07-30 东北大学 一种基于胶囊网络遮罩记忆注意力的细粒度文本分类方法
CN113190681B (zh) * 2021-03-02 2023-07-25 东北大学 一种基于胶囊网络遮罩记忆注意力的细粒度文本分类方法
CN113449819A (zh) * 2021-08-27 2021-09-28 中国测绘科学研究院 一种基于胶囊网络的信用评估模型方法及其存储介质
CN114595806A (zh) * 2022-03-02 2022-06-07 桂林理工大学 基于改进胶囊网络林地土壤肥力分析评价模型
CN115270997A (zh) * 2022-09-20 2022-11-01 中国人民解放军32035部队 基于迁移学习的火箭目标姿态稳定判别方法及相关装置
CN115270997B (zh) * 2022-09-20 2022-12-27 中国人民解放军32035部队 基于迁移学习的火箭目标姿态稳定判别方法及相关装置

Also Published As

Publication number Publication date
CN111460818B (zh) 2023-06-30

Similar Documents

Publication Publication Date Title
CN111460818B (zh) 一种基于增强胶囊网络的网页文本分类方法及存储介质
CN107516110B (zh) 一种基于集成卷积编码的医疗问答语义聚类方法
CN111753189A (zh) 一种少样本跨模态哈希检索共同表征学习方法
CN103617290B (zh) 中文机器阅读系统
CN104834747A (zh) 基于卷积神经网络的短文本分类方法
CN111125434B (zh) 一种基于集成学习的关系抽取方法及系统
CN109471944A (zh) 文本分类模型的训练方法、装置及可读存储介质
WO2017193685A1 (zh) 社交网络中数据的处理方法和装置
CN111898703B (zh) 多标签视频分类方法、模型训练方法、装置及介质
WO2023236977A1 (zh) 一种数据处理方法及相关设备
CN111966827A (zh) 基于异构二部图的对话情感分析方法
CN113761250A (zh) 模型训练方法、商户分类方法及装置
CN108920446A (zh) 一种工程文本的处理方法
CN112786160A (zh) 基于图神经网络的多图片输入的多标签胃镜图片分类方法
CN111598223A (zh) 一种基于属性和结构深度融合的网络嵌入方法及其模型
Xu et al. A Hierarchical Intrusion Detection Model Combining Multiple Deep Learning Models With Attention Mechanism
CN113204640A (zh) 一种基于注意力机制的文本分类方法
CN112925907A (zh) 基于事件图卷积神经网络的微博评论观点对象分类方法
Shen et al. Path-based attribute-aware representation learning for relation prediction
CN116956228A (zh) 一种技术交易平台的文本挖掘方法
CN116821340A (zh) 基于深度学习的多标签文本分类方法
CN106779090A (zh) 一种基于自适应Dropout非负矩阵分解的特征学习模型
CN110705259A (zh) 一种多粒度捕获匹配特征的文本匹配方法
CN111768214A (zh) 产品属性的预测方法、系统、设备和存储介质
CN109977194A (zh) 基于无监督学习的文本相似度计算方法、系统、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant