CN107943967A - 基于多角度卷积神经网络与循环神经网络的文本分类算法 - Google Patents
基于多角度卷积神经网络与循环神经网络的文本分类算法 Download PDFInfo
- Publication number
- CN107943967A CN107943967A CN201711212319.0A CN201711212319A CN107943967A CN 107943967 A CN107943967 A CN 107943967A CN 201711212319 A CN201711212319 A CN 201711212319A CN 107943967 A CN107943967 A CN 107943967A
- Authority
- CN
- China
- Prior art keywords
- text
- filter
- neural network
- recognition
- neural networks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 32
- 230000000306 recurrent effect Effects 0.000 title claims abstract description 32
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 31
- 230000004927 fusion Effects 0.000 claims abstract description 24
- 239000013598 vector Substances 0.000 claims description 51
- 238000011176 pooling Methods 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 6
- 238000005267 amalgamation Methods 0.000 claims description 4
- 230000003213 activating effect Effects 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000003062 neural network model Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 2
- 235000019580 granularity Nutrition 0.000 abstract description 5
- 238000000034 method Methods 0.000 description 10
- 238000010801 machine learning Methods 0.000 description 8
- 238000013135 deep learning Methods 0.000 description 4
- 230000007935 neutral effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于多角度卷积神经网络与循环神经网络的文本分类算法,包括步骤:1)对文本进行多角度的卷积神经网络的建模,包括不同的滑窗宽度、过滤器和池化类型,得到一种特征表达;2)对文本进行双向LSTM循环神经网络的建模,得到另一种特征表达;3)对文本的两种特征表达进行特征融合,利用SVM分类器,得到文本的分类。本发明将多粒度、多种卷积、多种池化融入到卷积神经网络中,将双向传播引进LSTM循环神经网络,得到两种文本高层特征表达,通过特征融合方式,建立SVM分类模型,得到文本分类结果。本发明能够捕获不同的文本高层特征表达,通过特征融合,得到文本更丰富的特征表达,建立SVM分类模型,提高分类效果。
Description
技术领域
本发明涉及自然语言处理的文本分类领域,尤其是指一种基于多角度卷积神经网络与循环神经网络的文本分类算法。
背景技术
文本分类有多种应用,例如情感极性分类、主题分类等。针对文本分类,有多种常用的方法,例如基于词典和规则的无监督方法,基于机器学习的有监督方法。基于词典的方法,利用权威的词典,依照经验人工构造特征,模型准确率较高,但由于词典覆盖率较低,导致模型召回率较低。基于机器学习的有监督方法,利用SVM、最大熵模型、朴素贝叶斯、KNN等机器学习方法建模。这些机器学习方法较成熟,理论基础较为坚实,应用广泛,分类效果较好,但受限于文本规模。因为基于机器学习方法需要有类别标签的文本作为训练的输入,而文本的标签需要花费大量的人力物力,因此数据规模一般较小。最近,基于深度学习的方法引起广大学者的重视。基于深度学习的方法只需要少量标识文本和大量未标识文本即可。与传统的机器学习方法不同,基于深度学习的方法不需要手动构造特征,而是通过层次结构自动学习特征,高层的特征通过底层特征的不同组合方式构建,得到的特征具有更丰富的抽象表达能力。
获取输入文本句子的句向量的方法可以分成两类,一种方法是基于词向量的方法,通过不同的组合方式构造句向量,称为组合法。另一种是不通过词向量,直接训练句子得到句向量,称为分布法。
组合法中,可使用不同的神经网络结构组合句向量,例如卷积神经网络、循环神经网络等。卷积神经网络是一种经典的神经网络结构,具有局部感知和共享参数的特点,能够较好捕获到局部信息。但普通的卷积神经网络设定固定的过滤器和池化操作类型,捕获到的局部信息粒度固定、较为死板,缺少多样性。基于时间序列的循环神经网络,会出现梯度消失的问题。因此为解决这个问题,LSTM被提出,它引进了遗忘门等机制,解决了长时依赖问题,能够较好地捕获到序列信息。但普通的LSTM循环神经网络对序列信息只是单方向建模,而文本不具有方向性,这样会使得捕获的序列信息较为片面。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种基于多角度卷积神经网络与循环神经网络的文本分类算法,使用卷积神经网络和循环神经网络两种神经网络结构来获取抽象的高层特征表达,使用经典高效的SVM支持向量机作为分类器。另外,对卷积神经网络结构进行改造,引进多种过滤器和池化类型,得到包含多粒度局部隐含信息的文本特征表达。对于LSTM循环神经网络,采用双向传播,获取包含两个方向序列信息的文本特征表达。最后,通过特征融合方式融合两种特征表达,使用SVM分类器对文本建模,得到文本分类模型。该算法能够捕获不同的文本高层特征表达,通过特征融合,得到文本更丰富的特征表达,建立SVM分类模型,提高分类效果。
为实现上述目的,本发明所提供的技术方案为:基于多角度卷积神经网络与循环神经网络的文本分类算法,包括以下步骤:
1)对文本进行多角度的卷积神经网络的建模,包括不同的滑窗宽度、过滤器类型和池化类型,去掉最后一层softmax层,得到文本的第一种特征表达;
2)对文本进行双向LSTM循环神经网络的建模,去掉最后一层softmax层,得到文本的第二种特征表达;
3)对文本的两种特征表达进行特征融合,利用SVM分类器,得到文本的分类。
在步骤1)中,所述多角度的卷积神经网络是指通过组合不同的滑窗宽度、过滤器类型、池化类型得到的卷积神经网络,包含以下步骤:
1.1)建立两种不同类型的过滤器,一种为整体过滤器,就是匹配整个词向量的过滤器,另一种为单维过滤器,就是在词向量的每一维上进行匹配;假设句子输入是len个词语序列,每一个词语由Dim维词向量表示,代表词语序列中第i个词向量,senti:j代表第i到j个包括第j个词向量的连接,代表第i个词向量的第k维,代表第i到j个包括第j个词向量的第k维;假设一个整体过滤器F为<ws,wF,bF,hF>元组,其中ws为滑窗宽度,为过滤器F的权重向量,为偏置,hF为激活函数;当过滤器F应用于输入词语序列sent,wF和sent内每一个长度为ws的词向量窗口进行内积,加上偏置值bF,应用激活函数hF,得到输出向量其中第i项等于outF[i]=hF(wF·senti:i+ws-1+bF),其中i∈[1,1+len-ws];假设一个单维过滤器F[k]应用于词向量的第k维,由元组表示,其中ws为滑窗宽度,为过滤器F[k]的权重向量,为偏置,为激活函数;过滤器F[k]的输出向量其中第i项等于
1.2)对卷积层输出向量使用不同池化操作;假设group(ws,pooling,sent)是针对输入句子sent进行滑窗宽度ws的卷积操作和池化操作的操作对象,其中pooling∈{max,min,mean};假设对于group(ws,pooling,sent),它的卷积层有numF个过滤器,其中过滤器包括整体过滤器、单维过滤器两种;假设池化层的输出向量为其中第j项等于
1.3)在卷积层使用不同滑窗宽度ws的过滤器;
1.4)建立多角度的卷积神经网络,输入文本进行训练;
1.5)训练完成后,去掉最后一层softmax层,输入文本,输出为文本第一种特征表达。
在步骤2)中,对文本进行双向LSTM循环神经网络的建模,包括以下步骤:
2.1)建立双向LSTM循环神经网络模型结构,对于输入文本前向后向序列分别训练一层LSTM循环神经网络,它们连接同一个输出层,利用该结构对文本进行训练;
2.2)训练完成后,去掉最后一层softmax层,输入文本,输出为文本第二种特征表达。
在步骤3)中,对文本的两种特征表达进行特征融合,利用SVM分类器进行分类,包括以下步骤:
3.1)使用连接的融合方式,对两种文本特征表达进行特征融合;假设fea1为第一种特征表达,fea2为第二种特征表达,为融合后的特征表达,其中代表向量直接连接操作;
3.2)利用SVM分类器,输入融合后的特征表达,训练,得到分类模型。
本发明与现有技术相比,具有如下优点与有益效果:
1、本发明使用多角度的卷积神经网络,引进多种过滤器和池化操作,得到包含多粒度的局部隐含信息的文本特征表达,能够捕获更全面的局部信息。
2、本发明使用双向LSTM循环神经网络,采用双向传播和LSTM结构,得到整个句子两个方向的序列信息的文本特征表达,能够捕获更充分的序列信息。
3、本发明使用卷积神经网络和循环神经网络获取文本丰富的特征表达,使用较成熟的支持向量机SVM分类器代替神经网络最后一层softmax层,作为文本分类器,结合了深度学习能够得到抽象的高层特征表达的特点与机器学习方法成熟、理论基础较为坚实、分类效果较好、应用广泛的优点。
4、本发明通过特征融合方式,融合两种不同的文本特征表达,得到文本更多样化、丰富的特征表达。
附图说明
图1为本发明的文本分类算法流程图。
图2是过滤器的滑窗宽度为ws的卷积层与池化层的基本结构图。
图3为多角度的卷积神经网络基本结构图。
图4为双向LSTM循环神经网络基本结构图。
具体实施方式
下面结合具体实施例对本发明作进一步说明。
如图1到图4所示,本实施例所提供的基于多角度卷积神经网络与循环神经网络的文本分类算法,主要通过多角度卷积神经网络与双向LSTM循环神经网络两种神经网络结构,获取文本两种抽象的高层特征表达,通过特征融合方式,使用SVM分类器对文本进行分类,其包括以下步骤:
1)对文本进行多角度的卷积神经网络的建模;多角度的卷积神经网络引进了不同的滑窗宽度、过滤器类型和池化类型,能够捕获不同粒度的局部隐含信息的特征表达,包含以下步骤:
1.1)建立两种不同类型的过滤器,一种为整体过滤器,就是匹配整个词向量的过滤器,另一种为单维过滤器,就是在词向量的每一维上进行匹配。假设句子输入是len个词语序列,每一个词语由Dim维词向量表示,代表词语序列中第i个词向量,senti:j代表第i到j个包括第j个词向量的连接,代表第i个词向量的第k维,代表第i到j个包括第j个词向量的第k维。假设一个整体过滤器F为<ws,wF,bF,hF>元组,其中ws为滑窗宽度,为过滤器F的权重向量,为偏置,hF为激活函数。当过滤器F应用于输入词语序列sent,wF和sent内每一个长度为ws的词向量窗口进行内积,加上偏置值bF,应用激活函数hF,得到输出向量其中第i项等于outF[i]=hF(wF·senti:i+ws-1+bF),其中i∈[1,1+len-ws]。假设一个单维过滤器F[k]应用于词向量的第k维,由元组表示,其中ws为滑窗宽度,为过滤器F[k]的权重向量,为偏置,为激活函数。过滤器F[k]的输出向量其中第i项等于
1.2)对卷积层输出向量使用不同池化操作。假设group(ws,pooling,sent)是针对输入句子sent进行滑窗宽度ws的卷积操作和池化操作的操作对象,其中pooling∈{max,min,mean}。假设对于group(ws,pooling,sent),它的卷积层有numF个过滤器,其中过滤器包括整体过滤器、单维过滤器两种。假设池化层的输出向量为其中第j项等于
1.3)在卷积层使用不同滑窗宽度ws的过滤器。
1.4)根据步骤1.1)到1.3)所述,建立多角度的卷积神经网络,输入文本进行训练。
1.5)训练完成后,去掉最后一层softmax层,输入文本,输出为文本第一种特征表达。
2)对文本进行双向LSTM循环神经网络的建模,包括以下步骤:
2.1)建立双向LSTM循环神经网络模型结构,对于输入文本前向后向序列分别训练一层LSTM循环神经网络,它们连接同一个输出层,利用该结构对文本进行训练。
2.2)训练完成后,去掉最后一层softmax层,输入文本,输出为文本第二种特征表达。
3)对文本的两种特征表达进行特征融合,利用SVM分类器进行分类,包括以下步骤:
3.1)使用连接的融合方式,对两种文本特征表达进行特征融合。假设fea1为第一种特征表达,fea2为第二种特征表达,为融合后的特征表达,其中代表向量直接连接操作。
3.2)利用SVM分类器,输入融合后的特征表达,训练,得到分类模型。
综上所述,在采用以上方案后,本发明为基于深度学习和机器学习的文本分类方法提供了新的分类思路,将多粒度、多种卷积、多种池化融入到卷积神经网络中,将双向传播引进LSTM循环神经网络,得到两种文本抽象高层特征表达,通过特征融合的融合方式,建立SVM支持向量机分类模型,得到文本分类结果。本发明能够捕获不同的文本高层特征表达,通过特征融合,得到文本更丰富的特征表达,建立SVM分类模型,提高分类效果,值得推广。
以上所述实施例只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。
Claims (4)
1.基于多角度卷积神经网络与循环神经网络的文本分类算法,其特征在于,包括以下步骤:
1)对文本进行多角度的卷积神经网络的建模,包括不同的滑窗宽度、过滤器类型和池化类型,去掉最后一层softmax层,得到文本的第一种特征表达;
2)对文本进行双向LSTM循环神经网络的建模,去掉最后一层softmax层,得到文本的第二种特征表达;
3)对文本的两种特征表达进行特征融合,利用SVM分类器,得到文本的分类。
2.根据权利要求1所述的基于多角度卷积神经网络与循环神经网络的文本分类算法,其特征在于:在步骤1)中,所述多角度的卷积神经网络是指通过组合不同的滑窗宽度、过滤器类型、池化类型得到的卷积神经网络,包含以下步骤:
1.1)建立两种不同类型的过滤器,一种为整体过滤器,就是匹配整个词向量的过滤器,另一种为单维过滤器,就是在词向量的每一维上进行匹配;假设句子输入是len个词语序列,每一个词语由Dim维词向量表示,代表词语序列中第i个词向量,senti:j代表第i到j个包括第j个词向量的连接,代表第i个词向量的第k维,代表第i到j个包括第j个词向量的第k维;假设一个整体过滤器F为<ws,wF,bF,hF>元组,其中ws为滑窗宽度,为过滤器F的权重向量,为偏置,hF为激活函数;当过滤器F应用于输入词语序列sent,wF和sent内每一个长度为ws的词向量窗口进行内积,加上偏置值bF,应用激活函数hF,得到输出向量其中第i项等于outF[i]=hF(wF·senti:i+ws-1+bF),其中i∈[1,1+len-ws];假设一个单维过滤器F[k]应用于词向量的第k维,由元组表示,其中ws为滑窗宽度,为过滤器F[k]的权重向量,为偏置,为激活函数;过滤器F[k]的输出向量其中第i项等于
1.2)对卷积层输出向量使用不同池化操作;假设group(ws,pooling,sent)是针对输入句子sent进行滑窗宽度ws的卷积操作和池化pooling操作的操作对象,其中pooling∈{max,min,mean};假设对于group(ws,pooling,sent),它的卷积层有numF个过滤器,其中过滤器包括整体过滤器、单维过滤器两种;假设池化层的输出向量为其中第j项等于
1.3)在卷积层使用不同滑窗宽度ws的过滤器;
1.4)建立多角度的卷积神经网络,输入文本进行训练;
1.5)训练完成后,去掉最后一层softmax层,输入文本,输出为文本第一种特征表达。
3.根据权利要求1所述的基于多角度卷积神经网络与循环神经网络的文本分类算法,其特征在于:在步骤2)中,对文本进行双向LSTM循环神经网络的建模,包括以下步骤:
2.1)建立双向LSTM循环神经网络模型结构,对于输入文本前向后向序列分别训练一层LSTM循环神经网络,它们连接同一个输出层,利用该结构对文本进行训练;
2.2)训练完成后,去掉最后一层softmax层,输入文本,输出为文本第二种特征表达。
4.根据权利要求1所述的基于多角度卷积神经网络与循环神经网络的文本分类算法,其特征在于:在步骤3)中,对文本的两种特征表达进行特征融合,利用SVM分类器进行分类,包括以下步骤:
3.1)使用连接的融合方式,对两种文本特征表达进行特征融合;假设fea1为第一种特征表达,fea2为第二种特征表达,为融合后的特征表达,其中代表向量直接连接操作;
3.2)利用SVM分类器,输入融合后的特征表达,训练,得到分类模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711212319.0A CN107943967B (zh) | 2017-11-28 | 2017-11-28 | 基于多角度卷积神经网络与循环神经网络的文本分类算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711212319.0A CN107943967B (zh) | 2017-11-28 | 2017-11-28 | 基于多角度卷积神经网络与循环神经网络的文本分类算法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107943967A true CN107943967A (zh) | 2018-04-20 |
CN107943967B CN107943967B (zh) | 2020-05-22 |
Family
ID=61950182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711212319.0A Expired - Fee Related CN107943967B (zh) | 2017-11-28 | 2017-11-28 | 基于多角度卷积神经网络与循环神经网络的文本分类算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107943967B (zh) |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108595440A (zh) * | 2018-05-11 | 2018-09-28 | 厦门市美亚柏科信息股份有限公司 | 短文本内容分类方法和系统 |
CN108664632A (zh) * | 2018-05-15 | 2018-10-16 | 华南理工大学 | 一种基于卷积神经网络和注意力机制的文本情感分类算法 |
CN108875819A (zh) * | 2018-06-08 | 2018-11-23 | 浙江大学 | 一种基于长短期记忆网络的物体和部件联合检测方法 |
CN109068174A (zh) * | 2018-09-12 | 2018-12-21 | 上海交通大学 | 基于循环卷积神经网络的视频帧率上变换方法及系统 |
CN109299262A (zh) * | 2018-10-09 | 2019-02-01 | 中山大学 | 一种融合多粒度信息的文本蕴含关系识别方法 |
CN109543030A (zh) * | 2018-10-12 | 2019-03-29 | 平安科技(深圳)有限公司 | 客服机器人会话文本分类方法及装置、设备、存储介质 |
CN109543084A (zh) * | 2018-11-09 | 2019-03-29 | 西安交通大学 | 一种建立面向网络社交媒体的隐蔽敏感文本的检测模型的方法 |
CN109871444A (zh) * | 2019-01-16 | 2019-06-11 | 北京邮电大学 | 一种文本分类方法及系统 |
CN109949929A (zh) * | 2019-03-19 | 2019-06-28 | 挂号网(杭州)科技有限公司 | 一种基于深度学习大规模病历的辅助诊断系统 |
CN110084240A (zh) * | 2019-04-24 | 2019-08-02 | 网易(杭州)网络有限公司 | 一种文字提取系统、方法、介质和计算设备 |
CN110245227A (zh) * | 2019-04-25 | 2019-09-17 | 义语智能科技(广州)有限公司 | 文本分类的融合分类器的训练方法及设备 |
CN110321833A (zh) * | 2019-06-28 | 2019-10-11 | 南京邮电大学 | 基于卷积神经网络和循环神经网络的人体行为识别方法 |
CN110456026A (zh) * | 2019-08-13 | 2019-11-15 | 北京农业信息技术研究中心 | 一种土壤墒情监测方法及装置 |
WO2019232874A1 (zh) * | 2018-06-04 | 2019-12-12 | 平安科技(深圳)有限公司 | 汉字模型训练方法、汉字识别方法、装置、设备及介质 |
CN110569358A (zh) * | 2019-08-20 | 2019-12-13 | 上海交通大学 | 学习长时依赖和分层结构的文本分类模型、方法及介质 |
CN111125366A (zh) * | 2019-12-25 | 2020-05-08 | 三角兽(北京)科技有限公司 | 文本分类方法及装置 |
CN111144094A (zh) * | 2019-12-09 | 2020-05-12 | 中国电子科技集团公司第三十研究所 | 一种基于CNN与Bi-GRU的文本分类方法 |
WO2020114122A1 (zh) * | 2018-12-07 | 2020-06-11 | 阿里巴巴集团控股有限公司 | 用于分析关系网络图的神经网络系统和方法 |
CN111948622A (zh) * | 2020-08-07 | 2020-11-17 | 哈尔滨工程大学 | 基于并联cnn-lstm的线性调频雷达信号toa估计算法 |
CN112733857A (zh) * | 2021-01-08 | 2021-04-30 | 北京匠数科技有限公司 | 自动分割字符区域的图像文字检测模型训练方法及装置 |
CN113434668A (zh) * | 2021-05-18 | 2021-09-24 | 湘潭大学 | 一种基于模型融合的深度学习文本分类方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105975478A (zh) * | 2016-04-09 | 2016-09-28 | 北京交通大学 | 一种基于词向量分析的网络文章所属事件的检测方法和装置 |
US20170068887A1 (en) * | 2014-09-26 | 2017-03-09 | Samsung Electronics Co., Ltd. | Apparatus for classifying data using boost pooling neural network, and neural network training method therefor |
CN106570148A (zh) * | 2016-10-27 | 2017-04-19 | 浙江大学 | 一种基于卷积神经网络的属性抽取方法 |
CN107133211A (zh) * | 2017-04-26 | 2017-09-05 | 中国人民大学 | 一种基于注意力机制的作文评分方法 |
CN107291822A (zh) * | 2017-05-24 | 2017-10-24 | 北京邮电大学 | 基于深度学习的问题分类模型训练方法、分类方法及装置 |
-
2017
- 2017-11-28 CN CN201711212319.0A patent/CN107943967B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170068887A1 (en) * | 2014-09-26 | 2017-03-09 | Samsung Electronics Co., Ltd. | Apparatus for classifying data using boost pooling neural network, and neural network training method therefor |
CN105975478A (zh) * | 2016-04-09 | 2016-09-28 | 北京交通大学 | 一种基于词向量分析的网络文章所属事件的检测方法和装置 |
CN106570148A (zh) * | 2016-10-27 | 2017-04-19 | 浙江大学 | 一种基于卷积神经网络的属性抽取方法 |
CN107133211A (zh) * | 2017-04-26 | 2017-09-05 | 中国人民大学 | 一种基于注意力机制的作文评分方法 |
CN107291822A (zh) * | 2017-05-24 | 2017-10-24 | 北京邮电大学 | 基于深度学习的问题分类模型训练方法、分类方法及装置 |
Non-Patent Citations (3)
Title |
---|
夏彬彬: "基于Web文本挖掘的情感分析研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
朱少杰: "基于深度学习的文本情感分类研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
石金铭: "面向微博文本的分词及情感分析研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108595440A (zh) * | 2018-05-11 | 2018-09-28 | 厦门市美亚柏科信息股份有限公司 | 短文本内容分类方法和系统 |
CN108595440B (zh) * | 2018-05-11 | 2022-03-18 | 厦门市美亚柏科信息股份有限公司 | 短文本内容分类方法和系统 |
CN108664632B (zh) * | 2018-05-15 | 2021-09-21 | 华南理工大学 | 一种基于卷积神经网络和注意力机制的文本情感分类算法 |
CN108664632A (zh) * | 2018-05-15 | 2018-10-16 | 华南理工大学 | 一种基于卷积神经网络和注意力机制的文本情感分类算法 |
WO2019232874A1 (zh) * | 2018-06-04 | 2019-12-12 | 平安科技(深圳)有限公司 | 汉字模型训练方法、汉字识别方法、装置、设备及介质 |
CN108875819A (zh) * | 2018-06-08 | 2018-11-23 | 浙江大学 | 一种基于长短期记忆网络的物体和部件联合检测方法 |
CN108875819B (zh) * | 2018-06-08 | 2020-10-27 | 浙江大学 | 一种基于长短期记忆网络的物体和部件联合检测方法 |
CN109068174A (zh) * | 2018-09-12 | 2018-12-21 | 上海交通大学 | 基于循环卷积神经网络的视频帧率上变换方法及系统 |
CN109068174B (zh) * | 2018-09-12 | 2019-12-27 | 上海交通大学 | 基于循环卷积神经网络的视频帧率上变换方法及系统 |
CN109299262A (zh) * | 2018-10-09 | 2019-02-01 | 中山大学 | 一种融合多粒度信息的文本蕴含关系识别方法 |
CN109299262B (zh) * | 2018-10-09 | 2022-04-15 | 中山大学 | 一种融合多粒度信息的文本蕴含关系识别方法 |
CN109543030B (zh) * | 2018-10-12 | 2023-04-07 | 平安科技(深圳)有限公司 | 客服机器人会话文本分类方法及装置、设备、存储介质 |
CN109543030A (zh) * | 2018-10-12 | 2019-03-29 | 平安科技(深圳)有限公司 | 客服机器人会话文本分类方法及装置、设备、存储介质 |
CN109543084B (zh) * | 2018-11-09 | 2021-01-19 | 西安交通大学 | 一种建立面向网络社交媒体的隐蔽敏感文本的检测模型的方法 |
CN109543084A (zh) * | 2018-11-09 | 2019-03-29 | 西安交通大学 | 一种建立面向网络社交媒体的隐蔽敏感文本的检测模型的方法 |
WO2020114122A1 (zh) * | 2018-12-07 | 2020-06-11 | 阿里巴巴集团控股有限公司 | 用于分析关系网络图的神经网络系统和方法 |
CN109871444A (zh) * | 2019-01-16 | 2019-06-11 | 北京邮电大学 | 一种文本分类方法及系统 |
CN109949929A (zh) * | 2019-03-19 | 2019-06-28 | 挂号网(杭州)科技有限公司 | 一种基于深度学习大规模病历的辅助诊断系统 |
CN110084240A (zh) * | 2019-04-24 | 2019-08-02 | 网易(杭州)网络有限公司 | 一种文字提取系统、方法、介质和计算设备 |
CN110245227B (zh) * | 2019-04-25 | 2021-12-28 | 义语智能科技(广州)有限公司 | 文本分类的融合分类器的训练方法及设备 |
CN110245227A (zh) * | 2019-04-25 | 2019-09-17 | 义语智能科技(广州)有限公司 | 文本分类的融合分类器的训练方法及设备 |
CN110321833A (zh) * | 2019-06-28 | 2019-10-11 | 南京邮电大学 | 基于卷积神经网络和循环神经网络的人体行为识别方法 |
CN110321833B (zh) * | 2019-06-28 | 2022-05-20 | 南京邮电大学 | 基于卷积神经网络和循环神经网络的人体行为识别方法 |
CN110456026A (zh) * | 2019-08-13 | 2019-11-15 | 北京农业信息技术研究中心 | 一种土壤墒情监测方法及装置 |
CN110569358A (zh) * | 2019-08-20 | 2019-12-13 | 上海交通大学 | 学习长时依赖和分层结构的文本分类模型、方法及介质 |
CN111144094A (zh) * | 2019-12-09 | 2020-05-12 | 中国电子科技集团公司第三十研究所 | 一种基于CNN与Bi-GRU的文本分类方法 |
CN111125366A (zh) * | 2019-12-25 | 2020-05-08 | 三角兽(北京)科技有限公司 | 文本分类方法及装置 |
CN111125366B (zh) * | 2019-12-25 | 2023-05-23 | 腾讯科技(深圳)有限公司 | 文本分类方法及装置 |
CN111948622A (zh) * | 2020-08-07 | 2020-11-17 | 哈尔滨工程大学 | 基于并联cnn-lstm的线性调频雷达信号toa估计算法 |
CN112733857A (zh) * | 2021-01-08 | 2021-04-30 | 北京匠数科技有限公司 | 自动分割字符区域的图像文字检测模型训练方法及装置 |
CN113434668A (zh) * | 2021-05-18 | 2021-09-24 | 湘潭大学 | 一种基于模型融合的深度学习文本分类方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107943967B (zh) | 2020-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107943967A (zh) | 基于多角度卷积神经网络与循环神经网络的文本分类算法 | |
CN109271522B (zh) | 基于深度混合模型迁移学习的评论情感分类方法及系统 | |
CN107122796B (zh) | 一种基于多分支网络融合模型的光学遥感图像分类方法 | |
CN106650725A (zh) | 基于全卷积神经网络的候选文本框生成和文本检测方法 | |
CN109740148A (zh) | 一种BiLSTM结合Attention机制的文本情感分析方法 | |
Wang et al. | Research on Web text classification algorithm based on improved CNN and SVM | |
CN108664632A (zh) | 一种基于卷积神经网络和注意力机制的文本情感分类算法 | |
CN109308318A (zh) | 跨领域文本情感分类模型的训练方法、装置、设备及介质 | |
CN104298651B (zh) | 一种基于深度学习的生物医学命名实体识别和蛋白质交互关系抽取在线方法 | |
CN108920544A (zh) | 一种基于知识图谱的个性化职位推荐方法 | |
CN107291822A (zh) | 基于深度学习的问题分类模型训练方法、分类方法及装置 | |
CN108288035A (zh) | 基于深度学习的多通道图像特征融合的人体动作识别方法 | |
CN107133224A (zh) | 一种基于主题词的语言生成方法 | |
CN107066445A (zh) | 一种属性情感词向量的深度学习方法 | |
CN103955702A (zh) | 基于深度rbf网络的sar图像地物分类方法 | |
CN107688576B (zh) | 一种cnn-svm模型的构建及倾向性分类方法 | |
CN112016601B (zh) | 基于知识图谱增强小样本视觉分类的网络模型构建方法 | |
CN110222634A (zh) | 一种基于卷积神经网络的人体姿态识别方法 | |
CN110059191A (zh) | 一种文本情感分类方法及装置 | |
CN108154156B (zh) | 基于神经主题模型的图像集成分类方法及装置 | |
CN110516065A (zh) | 一种基于多路动态掩码的注意力神经网络的方法 | |
CN112800222B (zh) | 利用共现信息的多任务辅助极限多标签短文本分类方法 | |
CN107480723B (zh) | 基于局部二进制阈值学习网络的纹理识别方法 | |
CN110263164A (zh) | 一种基于模型融合的情感倾向分析方法 | |
CN106503616A (zh) | 一种基于分层超限学习机的运动想象脑电信号分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200522 |