CN106547885B - 一种文本分类系统及方法 - Google Patents

一种文本分类系统及方法 Download PDF

Info

Publication number
CN106547885B
CN106547885B CN201610954497.XA CN201610954497A CN106547885B CN 106547885 B CN106547885 B CN 106547885B CN 201610954497 A CN201610954497 A CN 201610954497A CN 106547885 B CN106547885 B CN 106547885B
Authority
CN
China
Prior art keywords
matrix
vector
text
module
dimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610954497.XA
Other languages
English (en)
Other versions
CN106547885A (zh
Inventor
蔡晓东
赵勤鲁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin University of Electronic Technology
Original Assignee
Guilin University of Electronic Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin University of Electronic Technology filed Critical Guilin University of Electronic Technology
Priority to CN201610954497.XA priority Critical patent/CN106547885B/zh
Publication of CN106547885A publication Critical patent/CN106547885A/zh
Application granted granted Critical
Publication of CN106547885B publication Critical patent/CN106547885B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种文本分类系统及方法,其系统包括初始化模块读取文本,将文本内的句子进行向量化,生成二维的矩阵向量;第一提取模块对二维的矩阵向量进行卷积以及池化处理,生成多个第一矩阵向量;第二提取模块将多个第一矩阵向量分别与attention矩阵进行点乘,生成多个第二矩阵向量;综合表示模块将每一个矩阵向量进行卷积操作,使每一个第二矩阵向量对应转换成一维向量矩阵;分类模块将多个一维向量矩阵分别输入到Fully Contact Layer中进行处理,并将其输出值输入到softmax分类器中,softmax分类器将矩阵值转换成对应类别的概率分布,对文本进分类。本发明使用较少的参数,使网络模型快速收敛,并提取出文本深度的表示信息,进而提高文本的分类正确率。

Description

一种文本分类系统及方法
技术领域
本发明涉及一种文本分类系统及方法。
背景技术
随着互联网和移动终端的广泛使用,用户能够便捷地在互联网和移动平台上表达情感、观点和评论,从而产生了海量的文本信息资源,因此文本分类变得十分重要,文本分类成为越来越热的研究重点。
最近几年来,随着CNN(Convolutional Neural Network,卷积神经网络)和注意力机制(Attention mechanism)在自然语言处理领域中越来越多的应用,目前已取得丰硕成果。现有的技术存在着网络测层数深,参数多,迭代时间过长,并且浅层的网络又不能充分提取有效特征。本方法使用浅层的CNN网络结合注意力机制,在浅层网络中能够有效提取文本信息,并且有效减少参数以及减少迭代时间。
发明内容
本发明的目的是提供一种文本分类系统及方法,所要解决的技术问题是:如何解决网络测层数深,参数多,迭代时间过长,并且浅层的网络又不能充分提取有效特征。
本发明解决上述技术问题的技术方案如下:一种文本分类系统,包括初始化模块、第一提取模块、第二提取模块、综合表示模块和分类模块;
所述初始化模块,用于读取文本,将文本内的句子进行向量化,生成二维的矩阵向量;
所述第一提取模块,用于对二维的矩阵向量进行卷积以及池化处理,生成多个第一矩阵向量;
所述第二提取模块,用于将多个第一矩阵向量分别与attention(attention为注意力)矩阵进行点乘,对应生成多个第二矩阵向量;
所述综合表示模块,用于将每一个矩阵向量进行卷积操作,使每一个第二矩阵向量对应转换成一维向量矩阵;
所述分类模块,用于将多个一维向量矩阵分别输入到Fully Contacted Layer(Fully Contacted Layer为全链接层)中进行处理,并将其输出值输入到softmax分类器中,softmax分类器将矩阵值转换成对应类别的概率分布,对文本进分类。
本发明的有益效果是:初始化模块将由文字构成的文本信息映射到对应的向量空间中,对文本语句实现保留语义信息的向量化;第一提取模块对二维的矩阵向量进行浅层的语义上下文信息提取;第二提取模块对所提取的文本表征信息提取更多和更高水平的复杂特征信息;再通过综合表示模块和分类模块的协调运作,实现使用较少的参数,使网络模型快速收敛,并提取出文本深度的表示信息,进而提高文本的分类正确率。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述初始化模块通过词向量嵌入方法对文本的句子进行分词处理和训练,生成二维的矩阵向量。
采用上述进一步方案的有益效果是:通过词向量嵌入方法能够有效将文本上句子进行向量化,准确率高。
进一步,所述第一提取模块通过不同大小的卷积核对二维的矩阵向量进行卷积处理,输出多个神经元Ci,其中神经元Ci具体表示为:
Figure GDA0002259244280000021
其中,x是表示二维的矩阵向量,Wi代表不同大小的卷积核,
Figure GDA0002259244280000022
是卷积运算符,sigmoid(·)是神经元激活函数,b是计算中使用的偏置向量;式中的卷积核Wi与偏置b是网络的训练参数,通过大量的迭代训练得到较优取值。
采用上述进一步方案的有益效果是:提取二维的矩阵向量中的浅层次向量,进行多层次多角度的文本语义信息提取,不仅对一个词语的向量进行信息提取,还综合考虑前后二个到五个词语的信息,提升语义提取的准确性。
进一步,所述第一提取模块还通过非线性的所述神经元激活函数sigmoid对每一个神经元Ci进行数据规则处理,对应生成的处理结果分别进行池化处理,对应生成多个第一矩阵向量。
采用上述进一步方案的有益效果是:实现第一矩阵向量的尺寸大小,实现使用较少的参数,使网络模型快速收敛。
进一步,所述第二提取模块将多个第一矩阵向量分别与attention矩阵进行点乘,对应得到多个第二矩阵向量,第二矩阵向量表示为Mati=MatFi·MatAttention,其中·为点乘运算,MatFi为第一矩阵向量。
采用上述进一步方案的有益效果是:第二提取模块提取不同词时信息的深层信息,矩阵的不同数值决定了该区域的信息的重要程度,进而可以提取更多和更高水平的复杂特征信息。
进一步,所述综合表示模块对每一个第二矩阵向量分别进行卷积操作,使每一个第二矩阵向量均转变成一维矩阵向量,一维矩阵向量表示为Mat_si∈R1Xk,具体如下:
Figure GDA0002259244280000031
其中,w是卷积核,其w∈RjX1,Mati是第二矩阵向量,b是偏置参数。F(·)是激活函数。
采用上述进一步方案的有益效果是:将每一个第二矩阵向量均转变成一维矩阵向量,准确率高。
进一步,所述综合表示模块还将多个一维矩阵向量进行拼接,得深层次表示文本的矩阵向量Vec,具体如下:
Figure GDA0002259244280000041
Figure GDA0002259244280000042
其中Mat_si为一维矩阵向量。
采用上述进一步方案的有益效果是:综合表示模块最终得到一个文本深层次信息的向量Vec,实现对一个句子进行不同上下文的信息提取以及向量表示。
本发明解决上述技术问题的另一技术方案如下:一种文本分类方法,包括以下步骤:
步骤S1.初始化模块读取文本,将文本内的句子进行向量化,生成二维的矩阵向量;
步骤S2.第一提取模块对二维的矩阵向量进行卷积以及池化处理,生成多个第一矩阵向量;第二提取模块将多个第一矩阵向量分别与attention矩阵进行点乘,对应生成多个第二矩阵向量;
步骤S4.综合表示模块将每一个矩阵向量进行卷积操作,使每一个第二矩阵向量对应转换成一维向量矩阵;
步骤S5.分类模块将多个一维向量矩阵分别输入到Fully Contact Layer中进行处理,并将其输出值输入到softmax分类器中,softmax分类器将矩阵值转换成对应类别的概率分布,对文本进分类。
本发明的有益效果是:初始化模块将由文字构成的文本信息映射到对应的向量空间中,对文本语句实现保留语义信息的向量化;第一提取模块对二维的矩阵向量进行浅层的语义上下文信息提取;第二提取模块对所提取的文本表征信息提取更多和更高水平的复杂特征信息;再通过综合表示模块和分类模块的协调运作,实现使用较少的参数,使网络模型快速收敛,并提取出文本深度的表示信息,进而提高文本的分类正确率。
进一步,所述初始化模块通过词向量嵌入方法对文本的句子进行分词处理和训练,生成二维的矩阵向量。
采用上述进一步方案的有益效果是:通过词向量嵌入方法能够有效将文本上句子进行向量化,准确率高。
进一步,所述第一提取模块通过不同大小的卷积核对二维的矩阵向量进行卷积处理,输出多个神经元Ci,其中神经元Ci具体表示为:
Figure GDA0002259244280000051
其中,x是表示二维的矩阵向量,Wi代表不同大小的卷积核,
Figure GDA0002259244280000052
是卷积运算符,sigmoid(·)是神经元激活函数,b是计算中使用的偏置向量;式中的卷积核Wi与偏置b是网络的训练参数,通过大量的迭代训练得到较优取值。
采用上述进一步方案的有益效果是:提取二维的矩阵向量中的浅层次向量,进行多层次多角度的文本语义信息提取,不仅对一个词语的向量进行信息提取,还综合考虑前后二个到五个词语的信息,提升语义提取的准确性。
附图说明
图1为本发明一种文本分类系统的模块框图;
图2为本发明一种文本分类系统的实施示意图;
图3为本发明一种文本分类方法的流程图。
附图中,各标号所代表的部件列表如下:
1、初始化模块,2、第一提取模块,3、第二提取模块,4、综合表示模块,5、分类模块。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
实施例1:
如图1和图3所示,一种文本分类系统,包括初始化模块1、第一提取模块2、第二提取模块3、综合表示模块4和分类模块5;
所述初始化模块1,用于读取文本,将文本内的句子进行向量化,生成二维的矩阵向量;
所述第一提取模块2,用于对二维的矩阵向量进行卷积以及池化处理,生成多个第一矩阵向量;
所述第二提取模块3,用于将多个第一矩阵向量分别与attention矩阵进行点乘,对应生成多个第二矩阵向量;
所述综合表示模块4,用于将每一个矩阵向量进行卷积操作,使每一个第二矩阵向量对应转换成一维向量矩阵;
所述分类模块5,用于将多个一维向量矩阵分别输入到Fully ContactLayer中进行处理,并将其输出值输入到softmax分类器中,softmax分类器将矩阵值转换成对应类别的概率分布,对文本进分类。
上述实施例中,所述初始化模块1通过词向量嵌入方法对文本的句子进行分词处理和训练,生成二维的矩阵向量;
文档就是一个单词序列比如“A B A C B F G”,对文档中每个不同的单词都得到一个对应的向量(往往是低维向量)表示。比如,对于这样的“A BA C B F G”的一个序列,也许我们最后能得到:A对应的向量为[0.1 0.6 -0.5],B对应的向量为[-0.2 0.9 0.7],假如一个句子由两个词语AB组成,这个句子就向量化成了一个2X3
Figure GDA0002259244280000061
的向量矩阵了。
将所输入的文本长度进行统一化处理成N个词组成的句子,文本长度超出N个词时将进行截断处理,文本长度不够N个词时我们将进行统一标记符号进行对文本的长度进行补充;
将文本实现向量化,既每个句子可以表示如下式子:
X1:N={X1,X2,X3,...,XN}
其中,X表示一个文本,Xi(i∈(1,N))表示文本中的一个K维词向量,一个文本的词向量是用的列向量,一个句子X的维度是KXN维的矩阵,即S∈RKxn;到此实现文本的向量化工作了,将一个文本表示成了二维的矩阵向量。
上述实施例中,所述第一提取模块2通过不同大小的卷积核对二维的矩阵向量进行卷积处理,输出多个神经元Ci,其中神经元Ci具体表示为:
Figure GDA0002259244280000071
其中,x是表示二维的矩阵向量,Wi代表不同大小的卷积核,
Figure GDA0002259244280000072
是卷积运算符,sigmoid(·)是神经元激活函数,b是计算中使用的偏置向量;式中的卷积核Wi与偏置b是网络的训练参数,通过大量的迭代训练得到较优取值;
所述第一提取模块2还通过非线性的所述神经元激活函数sigmoid对每一个神经元Ci进行数据规则处理,对应生成的处理结果分别进行池化处理,对应生成多个第一矩阵向量;
考虑了前后不同词语五种情况,既前后只考虑一个到五个词语,前后只考虑一个词语的时候就使用1X1的卷积核对文本矩阵进行卷积操作,考虑前后两个词的时候使用的是1X2的卷积核进行卷积操作,以此类推。卷积之后并使用非线性的所述神经元激活函数sigmoid对神经元进行数据规则处理;
将非线性的所述神经元激活函数sigmoid输出的结果分别进行池化下采样操作,对句子中前后不同词语个数的词数的信息进一步提取其重要的特征,实现减小特征图的尺寸大小,在本次操作采用的是池化核大小为2X2步长为2的不重叠池化操作,通过这样的方式得到了每个文本的考虑不同词语个数信息的特征图矩阵,其可以表示为F1∈Rdxn,F2∈Rdx (n-1),F3∈Rdx(n-2),F4∈Rdx(n-3),F5∈Rdx(n-4),其中F1表示的考虑前后一个词语信息的提取的特征向量,F2表示的考虑前后两个词语信息的提取的特征向量,以此类推。
上述实施例中,所述第二提取模块3将多个第一矩阵向量分别与attention矩阵进行点乘,对应生成多个矩阵向量,将每一个特征矩阵均送入分类器中进行迭代训练进行反馈学习优化,对应得到多个第二矩阵向量,第二矩阵向量表示为Mati=MatFi·MatAttention,其中·为点乘运算,MatFi为第一矩阵向量;
Attention矩阵最初是由随机初始化,使得考虑不同前后词语个数生成的特征矩阵与该矩阵点乘,生成新的特征矩阵,将该矩阵送入到分类器中进行反馈调节attention矩阵,通过大量的迭代训练进行反馈学习优化这些矩阵参数,得到最优的值,实现对考虑不同词时信息的深层信息,矩阵的不同数值决定了该区域的信息的重要程度,进而可以提取更多和更高水平的复杂特征信息。
上述实施例中,所述综合表示模块4对每一个第二矩阵向量分别进行卷积操作,使每一个第二矩阵向量均转变成一维矩阵向量,一维矩阵向量表示为Mat_si∈R1Xk,具体如下:
Figure GDA0002259244280000081
其中,w是卷积核,Mati是第二矩阵向量,Mati∈RjXk,其中i∈[1,5],j是第二矩阵向量的维度且j>1,k是第二矩阵向量的词语个数,w∈RjX1,b是偏置参数。F(·)是激活函数;
所述综合表示模块4还将多个一维矩阵向量进行拼接,得深层次表示文本的矩阵向量Vec,具体如下:
Figure GDA0002259244280000082
Figure GDA0002259244280000083
其中Mat_si为一维矩阵向量,i∈[1,5];
Figure GDA0002259244280000084
是向量连接符号。
将分别考虑不同个数词语的浅层向量表示信息Mat_si矩阵进行拼接,最终形成了文本向量的最终表示形式。
实施例2:
如图3所示,一种文本分类方法,其特征在于,包括以下步骤:
步骤S1.初始化模块1读取文本,将文本内的句子进行向量化,生成二维的矩阵向量;
步骤S2.第一提取模块2对二维的矩阵向量进行卷积以及池化处理,生成多个第一矩阵向量;第二提取模块3将多个第一矩阵向量分别与attention矩阵进行点乘,对应生成多个第二矩阵向量;
步骤S4.综合表示模块4将每一个矩阵向量进行卷积操作,使每一个第二矩阵向量对应转换成一维向量矩阵;
步骤S5.分类模块5将多个一维向量矩阵分别输入到Fully Contact Layer中进行处理,并将其输出值输入到softmax分类器中,softmax分类器将矩阵值转换成对应类别的概率分布,对文本进分类。
初始化模块1将由文字构成的文本信息映射到对应的向量空间中,对文本语句实现保留语义信息的向量化;第一提取模块2对二维的矩阵向量进行浅层的语义上下文信息提取;第二提取模块3对所提取的文本表征信息提取更多和更高水平的复杂特征信息;再通过综合表示模块4和分类模块5的协调运作,实现使用较少的参数,使网络模型快速收敛,并提取出文本深度的表示信息,进而提高文本的分类正确率。
上述实施例中,所述初始化模块通过词向量嵌入方法对文本的句子进行分词处理和训练,生成二维的矩阵向量;通过词向量嵌入方法能够有效将文本上句子进行向量化,准确率高。
上述实施例中,所述第一提取模块通过不同大小的卷积核对二维的矩阵向量进行卷积处理,输出多个神经元Ci,其中神经元Ci具体表示为:
Figure GDA0002259244280000091
其中,x是表示二维的矩阵向量,Wi代表不同大小的卷积核,
Figure GDA0002259244280000092
是卷积运算符,sigmoid(·)是神经元激活函数,b是计算中使用的偏置向量;式中的卷积核Wi与偏置b是网络的训练参数,通过大量的迭代训练得到较优取值;提取二维的矩阵向量中的浅层次向量,进行多层次多角度的文本语义信息提取,不仅对一个词语的向量进行信息提取,还综合考虑前后二个到五个词语的信息,提升语义提取的准确性。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种文本分类系统,其特征在于:包括初始化模块(1)、第一提取模块(2)、第二提取模块(3)、综合表示模块(4)和分类模块(5);
所述初始化模块(1),用于读取文本,将文本内的句子进行向量化,生成二维的矩阵向量;
所述第一提取模块(2),用于对二维的矩阵向量进行卷积以及池化处理,生成多个第一矩阵向量;
所述第二提取模块(3),用于将多个第一矩阵向量分别与attention矩阵进行点乘,对应生成多个第二矩阵向量;
所述综合表示模块(4),用于将每一个矩阵向量进行卷积操作,使每一个第二矩阵向量对应转换成一维向量矩阵;
所述分类模块(5),用于将多个一维向量矩阵分别输入到Fully Contact Layer中进行处理,并将其输出值输入到softmax分类器中,softmax分类器将矩阵值转换成对应类别的概率分布,对文本进分类。
2.根据权利要求1所述一种文本分类系统,其特征在于:所述初始化模块(1)通过词向量嵌入方法对文本的句子进行分词处理和训练,生成二维的矩阵向量。
3.根据权利要求1所述一种文本分类系统,其特征在于:所述第一提取模块(2)通过不同大小的卷积核对二维的矩阵向量进行卷积处理,输出多个神经元Ci,其中神经元Ci具体表示为:
Figure FDA0002259244270000011
其中,x是表示二维的矩阵向量,Wi代表不同大小的卷积核,
Figure FDA0002259244270000012
是卷积运算符,sigmoid(·)是神经元激活函数,b是计算中使用的偏置向量;式中的卷积核Wi与偏置b是网络的训练参数,通过预设次数的迭代训练得到最终结果。
4.根据权利要求3所述一种文本分类系统,其特征在于:所述第一提取模块(2)还通过非线性的所述神经元激活函数sigmoid对每一个神经元Ci进行数据规则处理,对应生成的处理结果分别进行池化处理,对应生成多个第一矩阵向量。
5.根据权利要求4所述一种文本分类系统,其特征在于:所述第二提取模块(3)将多个第一矩阵向量分别与attention矩阵进行点乘,对应得到多个第二矩阵向量,第二矩阵向量表示为Mati=MatFi·MatAttention,其中·为点乘运算,MatFi为第一矩阵向量。
6.根据权利要求5所述一种文本分类系统,其特征在于:所述综合表示模块(4)对每一个第二矩阵向量分别进行卷积操作,使每一个第二矩阵向量均转变成一维矩阵向量,一维矩阵向量表示为Mat_si∈R1Xk,具体如下:
Figure FDA0002259244270000021
其中,w是卷积核,其w∈RjX1,Mati是第二矩阵向量,R为文本表示成的二维向量矩阵,j是矩阵向量的维度且j>1,k是矩阵向量的词语个数,b是偏置参数,F(·)是激活函数。
7.根据权利要求6所述一种文本分类系统,其特征在于:所述综合表示模块(4)还将多个一维矩阵向量进行拼接,得深层次表示文本的矩阵向量Vec,具体如下:
Figure FDA0002259244270000022
Figure FDA0002259244270000023
其中Mat_si为一维矩阵向量。
8.一种文本分类方法,其特征在于,包括以下步骤:
步骤S1.初始化模块(1)读取文本,将文本内的句子进行向量化,生成二维的矩阵向量;
步骤S2.第一提取模块(2)对二维的矩阵向量进行卷积以及池化处理,生成多个第一矩阵向量;第二提取模块(3)将多个第一矩阵向量分别与attention矩阵进行点乘,对应生成多个第二矩阵向量;
步骤S4.综合表示模块(4)将每一个矩阵向量进行卷积操作,使每一个第二矩阵向量对应转换成一维向量矩阵;
步骤S5.分类模块(5)将多个一维向量矩阵分别输入到Fully Contact Layer中进行处理,并将其输出值输入到softmax分类器中,softmax分类器将矩阵值转换成对应类别的概率分布,对文本进分类。
9.根据权利要求8所述一种文本分类方法,其特征在于:所述初始化模块(1)通过词向量嵌入方法对文本的句子进行分词处理和训练,生成二维的矩阵向量。
10.根据权利要求8所述一种文本分类方法,其特征在于:所述第一提取模块(2)通过不同大小的卷积核对二维的矩阵向量进行卷积处理,输出多个神经元Ci,其中神经元Ci具体表示为:
Figure FDA0002259244270000031
其中,x是表示二维的矩阵向量,Wi代表不同大小的卷积核,
Figure FDA0002259244270000032
是卷积运算符,sigmoid(·)是神经元激活函数,b是计算中使用的偏置向量;式中的卷积核Wi与偏置b是网络的训练参数,通过预设次数的迭代训练得到最终结果。
CN201610954497.XA 2016-10-27 2016-10-27 一种文本分类系统及方法 Active CN106547885B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610954497.XA CN106547885B (zh) 2016-10-27 2016-10-27 一种文本分类系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610954497.XA CN106547885B (zh) 2016-10-27 2016-10-27 一种文本分类系统及方法

Publications (2)

Publication Number Publication Date
CN106547885A CN106547885A (zh) 2017-03-29
CN106547885B true CN106547885B (zh) 2020-04-10

Family

ID=58392913

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610954497.XA Active CN106547885B (zh) 2016-10-27 2016-10-27 一种文本分类系统及方法

Country Status (1)

Country Link
CN (1) CN106547885B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108229645B (zh) 2017-04-28 2021-08-06 北京市商汤科技开发有限公司 卷积加速和计算处理方法、装置、电子设备及存储介质
CN107133345B (zh) * 2017-05-22 2020-11-06 北京百度网讯科技有限公司 基于人工智能的交互方法和装置
CN108009402A (zh) * 2017-07-25 2018-05-08 北京工商大学 一种基于动态卷积网络的微生物基因序列分类模型的方法
CN110019779B (zh) * 2017-09-13 2021-06-08 中移(杭州)信息技术有限公司 一种文本分类方法、模型训练方法及装置
CN107644074A (zh) * 2017-09-19 2018-01-30 北京邮电大学 一种基于卷积神经网络的中文教材可读性分析的方法
CN110019793A (zh) * 2017-10-27 2019-07-16 阿里巴巴集团控股有限公司 一种文本语义编码方法及装置
CN108734290B (zh) * 2018-05-16 2021-05-18 湖北工业大学 一种基于注意力机制的卷积神经网络构建方法及应用
CN109214001A (zh) * 2018-08-23 2019-01-15 桂林电子科技大学 一种中文语义匹配系统及方法
CN109743311B (zh) * 2018-12-28 2021-10-22 绿盟科技集团股份有限公司 一种WebShell检测方法、装置及存储介质
CN111680497B (zh) * 2019-02-25 2023-12-08 北京嘀嘀无限科技发展有限公司 会话识别模型训练方法及装置
CN109948665B (zh) * 2019-02-28 2020-11-27 中国地质大学(武汉) 基于长短时记忆神经网络的人体活动类型分类方法及系统
CN110765755A (zh) * 2019-10-28 2020-02-07 桂林电子科技大学 一种基于双重选择门的语义相似度特征提取方法
CN112148841B (zh) * 2020-09-30 2024-04-19 北京金堤征信服务有限公司 一种对象分类以及分类模型构建方法和装置
CN112989044B (zh) * 2021-03-17 2022-11-18 中国平安人寿保险股份有限公司 文本分类方法、装置、设备及存储介质
CN113268597B (zh) * 2021-05-25 2023-06-27 平安科技(深圳)有限公司 文本分类方法、装置、设备及存储介质
CN115661129A (zh) * 2022-11-21 2023-01-31 湖南视比特机器人有限公司 一种基于协同运动的视觉工件错漏装检测系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572892A (zh) * 2014-12-24 2015-04-29 中国科学院自动化研究所 一种基于循环卷积网络的文本分类方法
CN104834747A (zh) * 2015-05-25 2015-08-12 中国科学院自动化研究所 基于卷积神经网络的短文本分类方法
CN105740349A (zh) * 2016-01-25 2016-07-06 重庆邮电大学 一种结合Doc2vec和卷积神经网络的情感分类方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572892A (zh) * 2014-12-24 2015-04-29 中国科学院自动化研究所 一种基于循环卷积网络的文本分类方法
CN104834747A (zh) * 2015-05-25 2015-08-12 中国科学院自动化研究所 基于卷积神经网络的短文本分类方法
CN105740349A (zh) * 2016-01-25 2016-07-06 重庆邮电大学 一种结合Doc2vec和卷积神经网络的情感分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Attentive Pooling Networks";Santos, C.D.,Tan, M.,Xiang, B., & Zhou B.,;《arXiv prepint arXiv:1602.03609》;20160211;论文第1-8页 *
"Convolutional Neural Networks for Sentence Classification";Yoon Kim;《Eprint Arxiv》;20140903;论文第1-6页 *

Also Published As

Publication number Publication date
CN106547885A (zh) 2017-03-29

Similar Documents

Publication Publication Date Title
CN106547885B (zh) 一种文本分类系统及方法
CN108334605B (zh) 文本分类方法、装置、计算机设备及存储介质
CN110348535B (zh) 一种视觉问答模型训练方法及装置
Lee et al. Variations of AlexNet and GoogLeNet to improve Korean character recognition performance.
CN109871444A (zh) 一种文本分类方法及系统
EP2791869A1 (en) Image classification
WO2021042857A1 (zh) 图像分割模型的处理方法和处理装置
CN113486175B (zh) 文本分类方法、文本分类装置、计算机设备及存储介质
CN110968697B (zh) 文本分类方法、装置、设备及可读存储介质
CN111325190A (zh) 一种表情识别方法、装置、计算机设备及可读存储介质
Neto et al. Sign language recognition based on 3d convolutional neural networks
CN112052687A (zh) 基于深度可分离卷积的语义特征处理方法、装置及介质
CN111241849A (zh) 一种文本语义分析方法及系统
CN111597333B (zh) 一种面向区块链领域的事件与事件要素抽取方法及装置
Atanbori et al. Towards low-cost image-based plant phenotyping using reduced-parameter CNN
CN107562729B (zh) 基于神经网络和主题强化的党建文本表示方法
Sethy et al. Off-line Odia handwritten numeral recognition using neural network: a comparative analysis
Lv et al. Chinese character CAPTCHA recognition based on convolution neural network
Sreemathy et al. Sign language recognition using artificial intelligence
Son et al. An enhancement for image-based malware classification using machine learning with low dimension normalized input images
Ko et al. Convolutional neural networks for character-level classification
CN107506351B (zh) 一种基于字符卷积网络的推特语义相似性分析方法
Yugopuspito et al. Mobile sign language recognition for bahasa indonesia using convolutional neural network
CN114299304A (zh) 一种图像处理方法及相关设备
Ashrafi et al. Development of image dataset using hand gesture recognition system for progression of sign language translator

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant