CN111552803A - 一种基于图小波网络模型的文本分类方法 - Google Patents

一种基于图小波网络模型的文本分类方法 Download PDF

Info

Publication number
CN111552803A
CN111552803A CN202010270346.9A CN202010270346A CN111552803A CN 111552803 A CN111552803 A CN 111552803A CN 202010270346 A CN202010270346 A CN 202010270346A CN 111552803 A CN111552803 A CN 111552803A
Authority
CN
China
Prior art keywords
graph
text
words
network model
wavelet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010270346.9A
Other languages
English (en)
Other versions
CN111552803B (zh
Inventor
李云红
贾凯莉
廉继红
张欢欢
张轩
穆兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Polytechnic University
Original Assignee
Xian Polytechnic University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Polytechnic University filed Critical Xian Polytechnic University
Priority to CN202010270346.9A priority Critical patent/CN111552803B/zh
Publication of CN111552803A publication Critical patent/CN111552803A/zh
Application granted granted Critical
Publication of CN111552803B publication Critical patent/CN111552803B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于图小波网络模型的文本分类方法,包括以下步骤:步骤1、对文本进行预处理,步骤2、建立基于图小波网络模型并训练图小波网络模型;步骤3、构建文本图,根据词与文档的关系,利用改进的TF‑IDF算法建立文本图中词与文档的权重关系,根据词共现理论,利用PMI算法建立文本图中词与词之间的权重关系;步骤4、将构建好的文本图,输入到图小波网络模型中,利用图小波卷积的局部化特性,捕获局部词共现信息,实现文本的分类。本发明解决了现有技术中存在文本分类算法分类准确率不高的问题。

Description

一种基于图小波网络模型的文本分类方法
技术领域
本发明属于自然语言处理技术领域,涉及一种基于图小波网络模型的文本分类方法。
背景技术
随着互联网技术的发展,文本信息呈指数增长。面对海量的文本信息,如何对各种文档进行恰当的表达和分类,从中快速、准确地找到所需的信息,已成为众多研究者关注的焦点。文本分类过程主要涉及文本表示、特征选择、分类器设计三个步骤。其中最重要的步骤为文本表示。词袋(Bag of Words,BOW)模型是最常用的文本表示方法,由于其将文本表示为one-hot向量,忽略了语法和语序信息,丢失了大量的文本信息。为了解决文本表示中存在的问题,神经网络模型被应用于文本表示,如卷积神经网络(Convolutional NeuralNetworks)、递归神经网络(Recurrent Neural Networks)、胶囊神经网络(Capsule NeuralNetworks)等。与传统的文本表示方法相比,RNNs在获取短文本的语义方面表现优越,但在学习长文档的语义特征方面效果较差;CNNs进行文本表示时,与n-gram有些类似,只能提取连续单词的语义成分,可能会失去单词之间的长距离语义依赖性。
近年来,由于图卷积网络(GCNs)能更好的捕获非连续词和长距离词的语义和语法信息,引起了众多研究者的关注。Kipf和Welling提出GCN模型,该方法通过谱图卷积的局部化一阶近似对图卷积进行逼近与简化,使得计算复杂度降低,并可以对局部图结构和节点特征进行编码,学习隐藏层表示,改善了文本分类性能。Chiang等人为了降低图卷积网络的时间复杂度与内存复杂度,提出了Cluster-GCN,该方法使用图聚类算法对子图进行采样,并对采样子图中的节点进行图卷积。由于邻域搜索也被限制在采样子图范围内,因此聚类GCN能同时处理较大的图和使用较深的体系结构,所用时间短,内存少。Xu等人为了降低计算复杂度并提高分类准确率,提出了GWNN(Graph Wavelet Neural Networks),该方法用图小波代替图拉普拉斯的特征向量作为基集,并且利用小波变换和卷积定理定义卷积算子。Yao等人提出TextGCN模型,该方法是将整个文本语料库建模为文档字图,并应用GCN进行分类。
针对TF-IDF算法进行权重计算时,未考虑类间判别强度及分类准确率较低等问题,作者在Text-GCN模型研究基础上提出建立Text-GWNN模型。该模型的优点在于:(1)采用改进的TF-IDF算法构建文本图,能有效解决类间判别强度造成的词与文档权重的不均衡问题;(2)由于GCN模型在图傅里叶变换过程中需要进行特征分解,使得计算量较大;而图小波在节点域是稀疏及局部化的,具有较高的计算效率,并能够为图卷积提供良好的解释能力。
发明内容
本发明的目的是提供一种基于图小波网络模型的文本分类方法,解决了现有技术中存在的分类准确率较低的问题。
本发明所采用的技术方案是,一种基于图小波网络模型的文本分类方法,具体按照以下步骤实施:
步骤1、对文本进行预处理;
步骤2、建立基于图小波网络模型并训练图小波网络模型;
步骤3、构建文本图,根据词与文档的关系,利用改进的TF-IDF算法建立文本图中词与文档的权重关系,根据词共现理论,利用PMI算法建立文本图中词与词之间的权重关系;
步骤4、将构建好的文本图,输入到图小波网络模型中,利用图小波卷积的局部化特性,捕获局部词共现信息,实现文本的分类。
本发明的特点还在于:
步骤1具体按照以下步骤实施:
步骤1.1、利用python中的正则化库,进行分词、清洗数据中存在的乱码及标点符号;
步骤1.2、导入python中的nltk库,加载库中停用词,去除语料库中的停用词。
步骤2具体为,建立图小波网络模型并用监督学习方法对标签文本训练集进行训练,利用Adam和误差反向传播进行参数更新。
步骤2中建立图小波网络模型具体为一个两层的神经网络,每层有20个图卷积核个数,图小波变换以一组小波为基Ψs=(Ψs1,Ψs2,…,Ψsn),因此,图信号x的图小波变换为
Figure BDA0002442935360000031
图小波逆变换为
Figure BDA0002442935360000032
图小波卷积定义为:
Figure BDA0002442935360000033
其中,Ψs=UGsUT,Gs=diag((g(sλ1),…g(sλn))),
Figure BDA0002442935360000034
U为拉普拉斯的特征向量,
Figure BDA0002442935360000035
代表哈达玛积,令
Figure BDA0002442935360000036
则上式可以简化为:
Figure BDA0002442935360000037
则图小波网络模型为:
Figure BDA0002442935360000041
其中,Ψs为小波基,
Figure BDA0002442935360000042
为图小波变换矩阵,
Figure BDA0002442935360000043
是对角滤波矩阵,h为非线性函数,参数l代表第l层神经元,
本模型采用两层的图卷积神经网络,其中第一层非线性激活函数为Relu,第二层非线性激活函数为softmax,则模型可以简化为:
Figure BDA0002442935360000044
其中,W(0)和W(1)为权重矩阵,
Figure BDA0002442935360000045
A为邻接矩阵,IN为单位矩阵,
Figure BDA0002442935360000046
为将中心节点本身视为邻接节点。
步骤2中利用Adam和误差反向传播进行参数更新具体包括:Adam算法具体为,假设前向传播得到最后一层的损失为L,参数更新规则为:
Figure BDA0002442935360000047
其中,α为学习步长,即学习率,ξ为1e-07;
Figure BDA0002442935360000048
Figure BDA0002442935360000049
为使用Adam优化算法时,偏差修正值,其计算公式如下:
Figure BDA00024429353600000410
Figure BDA00024429353600000411
其中,β1为动量梯度下降法的超参数,β2为均方根传播中的超参数,t为迭代次数;
设l层损失值为L,线性输出值为Z,经过非线性函数之后输出值为A,代价函数的计算公式为:
Figure BDA0002442935360000051
其中,Ygf代表有标签的文档索引,F为输出特征的维度,则反向传播规则为:
Figure BDA0002442935360000052
Figure BDA0002442935360000053
其中,g'为非线性激活函数的导数,参数W为训练过程中需要根据损失值进行更新,通过反向传播规则,利用公式(5)的参数更新规则,从而完成参数的更新。
步骤3具体按照以下步骤实施:
设无向图G=(V,E),其中V代表所有节点的集合,E代表边的集合,用拉普拉斯矩阵L=D-A表示图,其中A为邻接矩阵,代表两个节点之间的连接关系,D为度矩阵,代表每个节点与其他节点连接的个数,
步骤3.1、根据语料库的特点,使用词与文档的关联构建无向文本图;在语料库中,节点V的数目为文档数加上文档中不重复出现的词的数目,根据词与文档的关系,如果词在该文档,则使用改进TF-IDF算法建立词与文档之间的权重关系;否则,词与文档之间的权重为0,改进TF-IDF算法具体计算公式为:
Figure BDA0002442935360000054
其中,tfik指的是词i在文档k中出现的次数,N为总文档数,ni为出现词i的文档数,C为总类别数,ci为出现词i的类别数;
步骤3.2、根据词共现理论,采用PMI算法建立词与词之间的权重关系:
Figure BDA0002442935360000061
Figure BDA0002442935360000062
Figure BDA0002442935360000063
其中,p(i,j)为词i和词j同时出现在同一窗口的概率,p(i)为词i出现在窗口中的概率,Nij为词i和词j出现在同一滑动窗口的数目,Ni为语料中包含词i的滑动窗口数目,N为语料中滑动窗口的总数目。
本发明的有益效果是:
1.本发明采用改进TF-IDF算法解决构建文本图时,解决未考虑类间判别强度造成的词与文档权重的不均衡问题;
2.本发明采用图小波网络模型(Graph Wavelet Neural Networks),与GCN模型相比,图小波模型不需要进行特征分解,并且图小波的小波基能更好的发挥卷积的局部化特性,能更好的捕获局部词共现信息,提升文本分类效果;
3.图小波在节点域是稀疏及局部化,能通过超参数S更加灵活的调整节点的邻域,更有效的根据邻域节点获取中心节点表示,具有较高的计算效率,并且改善了文本分类性能。
附图说明
图1是本发明一种基于图小波网络模型的文本分类方法的流程图;
图2是本发明一种基于图小波网络模型的文本分类方法中图小波网络模型图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明一种基于图小波网络模型的文本分类方法,如图1所示,具体按照以下步骤实施:
步骤1、对文本进行预处理,具体按照以下步骤实施:
步骤1.1、利用python中的正则化库,进行分词、清洗数据中存在的乱码及标点符号;
步骤1.2、导入python中的nltk库,加载库中停用词,去除语料库中的停用词;
步骤2、建立图小波网络模型并用监督学习方法对标签文本训练集进行训练,利用Adam和误差反向传播进行参数更新,具体包括,
建立图小波网络模型具体为一个两层的神经网络,每层有20个图卷积核个数,图小波变换以一组小波为基Ψs=(Ψs1,Ψs2,…,Ψsn),因此,图信号x的图小波变换为
Figure BDA0002442935360000071
图小波逆变换为
Figure BDA0002442935360000072
图小波卷积定义为:
Figure BDA0002442935360000073
其中,Ψs=UGsUT,Gs=diag((g(sλ1),…g(sλn))),
Figure BDA0002442935360000074
U为拉普拉斯的特征向量,
Figure BDA0002442935360000075
代表哈达玛积,令
Figure BDA0002442935360000076
则上式可以简化为:
Figure BDA0002442935360000077
则图小波网络模型为:
Figure BDA0002442935360000078
其中,Ψs为小波基,
Figure BDA0002442935360000079
为图小波变换矩阵,
Figure BDA00024429353600000710
是对角滤波矩阵,h为非线性函数,参数l代表第l层神经元,
本模型采用两层的图卷积神经网络,其中第一层非线性激活函数为Relu,第二层非线性激活函数为softmax,则模型可以简化为:
Figure BDA0002442935360000081
其中,W(0)和W(1)为权重矩阵,
Figure BDA0002442935360000082
A为邻接矩阵,IN为单位矩阵,
Figure BDA0002442935360000083
为将中心节点本身视为邻接节点;
利用Adam和误差反向传播进行参数更新具体包括:Adam算法具体为,假设前向传播得到最后一层的损失为L,参数更新规则为:
Figure BDA0002442935360000084
其中,α为学习步长,即学习率,ξ为1e-07;
Figure BDA0002442935360000085
Figure BDA0002442935360000086
为使用Adam优化算法时,偏差修正值,其计算公式如下:
Figure BDA0002442935360000087
Figure BDA0002442935360000088
其中,β1为动量梯度下降法的超参数,β2为均方根传播中的超参数,t为迭代次数;
设l层损失值为L,线性输出值为Z,经过非线性函数之后输出值为A,代价函数的计算公式为:
Figure BDA0002442935360000089
其中,Ygf代表有标签的文档索引,F为输出特征的维度,则反向传播规则为:
Figure BDA0002442935360000091
Figure BDA0002442935360000092
其中,g'为非线性激活函数的导数,参数W为训练过程中需要根据损失值进行更新,通过反向传播规则,利用公式(5)的参数更新规则,从而完成参数的更新;
步骤3、构建文本图,根据词与文档的关系,利用改进的TF-IDF算法建立文本图中词与文档的权重关系,根据词共现理论,利用PMI算法建立文本图中词与词之间的权重关系,具体按照以下步骤实施:
设无向图G=(V,E),其中V代表所有节点的集合,E代表边的集合,用拉普拉斯矩阵L=D-A表示图,其中A为邻接矩阵,代表两个节点之间的连接关系,D为度矩阵,代表每个节点与其他节点连接的个数,
步骤3.1、根据语料库的特点,使用词与文档的关联构建无向文本图;在语料库中,节点V的数目为文档数加上文档中不重复出现的词的数目,根据词与文档的关系,如果词在该文档,则使用改进TF-IDF算法建立词与文档之间的权重关系;否则,词与文档之间的权重为0,改进TF-IDF算法具体计算公式为:
Figure BDA0002442935360000093
其中,tfik指的是词i在文档k中出现的次数,N为总文档数,ni为出现词i的文档数,C为总类别数,ci为出现词i的类别数;
步骤3.2、根据词共现理论,采用PMI算法建立词与词之间的权重关系:
Figure BDA0002442935360000101
Figure BDA0002442935360000102
Figure BDA0002442935360000103
其中,p(i,j)为词i和词j同时出现在同一窗口的概率,p(i)为词i出现在窗口中的概率,Nij为词i和词j出现在同一滑动窗口的数目,Ni为语料中包含词i的滑动窗口数目,N为语料中滑动窗口的总数目;
步骤4、将构建好的文本图,输入到图小波网络模型中,利用图小波卷积的局部化特性,捕获局部词共现信息,实现文本的分类。
实施例
执行步骤1,将源文本经过去除停止词、分词、清洗不需要的数据和去除标点符号等预处理;
执行步骤2,建立基于图小波神经网络(GWNN)模型的文本分类方法并训练图小波神经网络(GWNN)模型;
执行步骤3,根据清洗后的语料库,利用词与文档的关系及词共现理论构建文本图;
执行步骤4,将构建好的文本图,输入图小波模型,其中针对R8、R52及Ohsumed三个英文语料库,分别取s=0.9,0.7,0.5。
如表1所示,本方法使用R8、R52及Ohsumed三个英文语料库进行实验验证;并采用文本分类中常用的准确率(Precision)对文本分类结果进行评价。
准确率与分类效果呈正比,值越大代表分类效果越好,从表二可以看出,本方法的分类准确率最高,改善了文本分类性能。综上所述,本发明方法能有效的对文本进行较准确分类。
表1数据集信息统计
Figure BDA0002442935360000111
表2分类准确率比较
Figure BDA0002442935360000112

Claims (6)

1.一种基于图小波网络模型的文本分类方法,其特征在于,具体按照以下步骤实施:
步骤1、对文本进行预处理;
步骤2、建立基于图小波网络模型并训练图小波网络模型;
步骤3、构建文本图,根据词与文档的关系,利用改进的TF-IDF算法建立文本图中词与文档的权重关系,根据词共现理论,利用PMI算法建立文本图中词与词之间的权重关系;
步骤4、将构建好的文本图,输入到图小波网络模型中,利用图小波卷积的局部化特性,捕获局部词共现信息,实现文本的分类。
2.根据权利要求1所述的一种基于图小波网络模型的文本分类方法,其特征在于,所述步骤1具体按照以下步骤实施:
步骤1.1、利用python中的正则化库,进行分词、清洗数据中存在的乱码及标点符号;
步骤1.2、导入python中的nltk库,加载库中停用词,去除语料库中的停用词。
3.根据权利要求1所述的一种基于图小波网络模型的文本分类方法,其特征在于,所述步骤2具体为,建立图小波网络模型并用监督学习方法对标签文本训练集进行训练,利用Adam和误差反向传播进行参数更新。
4.根据权利要求3所述的一种基于图小波网络模型的文本分类方法,其特征在于,所述步骤2中建立图小波网络模型具体为一个两层的神经网络,每层有20个图卷积核个数,图小波变换以一组小波为基Ψs=(Ψs1,Ψs2,…,Ψsn),因此,图信号x的图小波变换为
Figure FDA0002442935350000021
图小波逆变换为
Figure FDA0002442935350000022
图小波卷积定义为:
Figure FDA0002442935350000023
其中,Ψs=UGsUT,Gs=diag((g(sλ1),…g(sλn))),
Figure FDA0002442935350000024
U为拉普拉斯的特征向量,
Figure FDA0002442935350000025
代表哈达玛积,令
Figure FDA0002442935350000026
则上式可以简化为:
Figure FDA0002442935350000027
则图小波网络模型为:
Figure FDA0002442935350000028
其中,Ψs为小波基,
Figure FDA0002442935350000029
为图小波变换矩阵,
Figure FDA00024429353500000210
是对角滤波矩阵,h为非线性函数,参数l代表第l层神经元,
本模型采用两层的图卷积神经网络,其中第一层非线性激活函数为Relu,第二层非线性激活函数为softmax,则模型可以简化为:
Figure FDA00024429353500000211
其中,W(0)和W(1)为权重矩阵,
Figure FDA00024429353500000212
A为邻接矩阵,IN为单位矩阵,
Figure FDA00024429353500000213
为将中心节点本身视为邻接节点。
5.根据权利要求3所述的一种基于图小波网络模型的文本分类方法,其特征在于,所述步骤2中利用Adam和误差反向传播进行参数更新具体包括:Adam算法具体为,假设前向传播得到最后一层的损失为L,参数更新规则为:
Figure FDA0002442935350000031
其中,α为学习步长,即学习率,ξ为1e-07;
Figure FDA0002442935350000032
Figure FDA0002442935350000033
为使用Adam优化算法时,偏差修正值,其计算公式如下:
Figure FDA0002442935350000034
Figure FDA0002442935350000035
其中,β1为动量梯度下降法的超参数,β2为均方根传播中的超参数,t为迭代次数;
设l层损失值为L,线性输出值为Z,经过非线性函数之后输出值为A,代价函数的计算公式为:
Figure FDA0002442935350000036
其中,Ygf代表有标签的文档索引,F为输出特征的维度,则反向传播规则为:
Figure FDA0002442935350000037
Figure FDA0002442935350000038
其中,g'为非线性激活函数的导数,参数W为训练过程中需要根据损失值进行更新,通过反向传播规则,利用公式(5)的参数更新规则,从而完成参数的更新。
6.根据权利要求1所述的一种基于图小波网络模型的文本分类方法,其特征在于,所述步骤3具体按照以下步骤实施:
设无向图G=(V,E),其中V代表所有节点的集合,E代表边的集合,用拉普拉斯矩阵L=D-A表示图,其中A为邻接矩阵,代表两个节点之间的连接关系,D为度矩阵,代表每个节点与其他节点连接的个数,
步骤3.1、根据语料库的特点,使用词与文档的关联构建无向文本图;在语料库中,节点V的数目为文档数加上文档中不重复出现的词的数目,根据词与文档的关系,如果词在该文档,则使用改进TF-IDF算法建立词与文档之间的权重关系;否则,词与文档之间的权重为0,改进TF-IDF算法具体计算公式为:
Figure FDA0002442935350000041
其中,tfik指的是词i在文档k中出现的次数,N为总文档数,ni为出现词i的文档数,C为总类别数,ci为出现词i的类别数;
步骤3.2、根据词共现理论,采用PMI算法建立词与词之间的权重关系:
Figure FDA0002442935350000042
Figure FDA0002442935350000043
Figure FDA0002442935350000044
其中,p(i,j)为词i和词j同时出现在同一窗口的概率,p(i)为词i出现在窗口中的概率,Nij为词i和词j出现在同一滑动窗口的数目,Ni为语料中包含词i的滑动窗口数目,N为语料中滑动窗口的总数目。
CN202010270346.9A 2020-04-08 2020-04-08 一种基于图小波网络模型的文本分类方法 Active CN111552803B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010270346.9A CN111552803B (zh) 2020-04-08 2020-04-08 一种基于图小波网络模型的文本分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010270346.9A CN111552803B (zh) 2020-04-08 2020-04-08 一种基于图小波网络模型的文本分类方法

Publications (2)

Publication Number Publication Date
CN111552803A true CN111552803A (zh) 2020-08-18
CN111552803B CN111552803B (zh) 2023-03-24

Family

ID=72001143

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010270346.9A Active CN111552803B (zh) 2020-04-08 2020-04-08 一种基于图小波网络模型的文本分类方法

Country Status (1)

Country Link
CN (1) CN111552803B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112464057A (zh) * 2020-11-18 2021-03-09 苏州浪潮智能科技有限公司 一种网络数据分类方法、装置、设备及可读存储介质
CN112529069A (zh) * 2020-12-08 2021-03-19 广州大学华软软件学院 一种半监督节点分类方法、系统、计算机设备和存储介质
CN112632984A (zh) * 2020-11-20 2021-04-09 南京理工大学 基于描述文本词频的图模型移动应用分类方法
CN112818112A (zh) * 2021-02-26 2021-05-18 广东工业大学 一种基于文本分类的广告推送方法、装置和系统
CN112860897A (zh) * 2021-03-12 2021-05-28 广西师范大学 基于改进的ClusterGCN的文本分类方法
CN112925907A (zh) * 2021-02-05 2021-06-08 昆明理工大学 基于事件图卷积神经网络的微博评论观点对象分类方法
CN113657171A (zh) * 2021-07-20 2021-11-16 国网上海市电力公司 基于图小波神经网络的低压配电网台区拓扑识别方法
CN115240037A (zh) * 2022-09-23 2022-10-25 卡奥斯工业智能研究院(青岛)有限公司 模型训练方法、图像处理方法、设备及存储介质
WO2022252458A1 (zh) * 2021-06-02 2022-12-08 苏州浪潮智能科技有限公司 一种分类模型训练方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160140220A1 (en) * 2013-06-14 2016-05-19 Proxem Method for automatic thematic classification of a digital text file
CN110705260A (zh) * 2019-09-24 2020-01-17 北京工商大学 一种基于无监督图神经网络结构的文本向量生成方法
CN110717047A (zh) * 2019-10-22 2020-01-21 湖南科技大学 一种基于图卷积神经网络的Web服务分类方法
CN110929029A (zh) * 2019-11-04 2020-03-27 中国科学院信息工程研究所 一种基于图卷积神经网络的文本分类方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160140220A1 (en) * 2013-06-14 2016-05-19 Proxem Method for automatic thematic classification of a digital text file
CN110705260A (zh) * 2019-09-24 2020-01-17 北京工商大学 一种基于无监督图神经网络结构的文本向量生成方法
CN110717047A (zh) * 2019-10-22 2020-01-21 湖南科技大学 一种基于图卷积神经网络的Web服务分类方法
CN110929029A (zh) * 2019-11-04 2020-03-27 中国科学院信息工程研究所 一种基于图卷积神经网络的文本分类方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHUN-HUI HE等: ""Chinese News Text Classification Algorithm Based on Online Knowledge Extension and Convolutional Neural Network"", 《2019 16TH INTERNATIONAL COMPUTER CONFERENCE ON WAVELET ACTIVE MEDIA TECHNOLOGY AND INFORMATION PROCESSING》 *
公冶小燕等: "基于改进的TF-IDF算法及共现词的主题词抽取算法", 《南京大学学报(自然科学)》 *
王根生等: "基于Word2vec和改进型TF-IDF的卷积神经网络文本分类模型", 《小型微型计算机系统》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112464057A (zh) * 2020-11-18 2021-03-09 苏州浪潮智能科技有限公司 一种网络数据分类方法、装置、设备及可读存储介质
WO2022105108A1 (zh) * 2020-11-18 2022-05-27 苏州浪潮智能科技有限公司 一种网络数据分类方法、装置、设备及可读存储介质
CN112632984A (zh) * 2020-11-20 2021-04-09 南京理工大学 基于描述文本词频的图模型移动应用分类方法
CN112529069A (zh) * 2020-12-08 2021-03-19 广州大学华软软件学院 一种半监督节点分类方法、系统、计算机设备和存储介质
CN112529069B (zh) * 2020-12-08 2023-10-13 广州大学华软软件学院 一种半监督节点分类方法、系统、计算机设备和存储介质
CN112925907A (zh) * 2021-02-05 2021-06-08 昆明理工大学 基于事件图卷积神经网络的微博评论观点对象分类方法
CN112818112A (zh) * 2021-02-26 2021-05-18 广东工业大学 一种基于文本分类的广告推送方法、装置和系统
CN112860897A (zh) * 2021-03-12 2021-05-28 广西师范大学 基于改进的ClusterGCN的文本分类方法
WO2022252458A1 (zh) * 2021-06-02 2022-12-08 苏州浪潮智能科技有限公司 一种分类模型训练方法、装置、设备及介质
CN113657171A (zh) * 2021-07-20 2021-11-16 国网上海市电力公司 基于图小波神经网络的低压配电网台区拓扑识别方法
CN115240037A (zh) * 2022-09-23 2022-10-25 卡奥斯工业智能研究院(青岛)有限公司 模型训练方法、图像处理方法、设备及存储介质
WO2024060684A1 (zh) * 2022-09-23 2024-03-28 卡奥斯工业智能研究院(青岛)有限公司 模型训练方法、图像处理方法、设备及存储介质

Also Published As

Publication number Publication date
CN111552803B (zh) 2023-03-24

Similar Documents

Publication Publication Date Title
CN111552803B (zh) 一种基于图小波网络模型的文本分类方法
CN109271522B (zh) 基于深度混合模型迁移学习的评论情感分类方法及系统
CN108388651B (zh) 一种基于图核和卷积神经网络的文本分类方法
Zhang et al. A text sentiment classification modeling method based on coordinated CNN‐LSTM‐attention model
Chen et al. Research on text sentiment analysis based on CNNs and SVM
CN107526785B (zh) 文本分类方法及装置
CN109446332B (zh) 一种基于特征迁移和自适应学习的人民调解案例分类系统及方法
CN110222163A (zh) 一种融合cnn与双向lstm的智能问答方法及系统
CN111914185B (zh) 一种基于图注意力网络的社交网络中文本情感分析方法
CN112231477B (zh) 一种基于改进胶囊网络的文本分类方法
CN107688576B (zh) 一种cnn-svm模型的构建及倾向性分类方法
CN114896388A (zh) 一种基于混合注意力的层级多标签文本分类方法
CN106682089A (zh) 一种基于RNNs的短信自动安全审核的方法
CN110717330A (zh) 基于深度学习的词句级短文本分类方法
CN107357785A (zh) 主题特征词抽取方法及系统、情感极性判断方法及系统
CN105975497A (zh) 微博话题自动推荐方法及装置
CN116484262B (zh) 一种基于文本分类对纺织设备故障辅助处理方法
CN112287106A (zh) 一种基于双通道混合神经网络的在线评论情感分类方法
CN113255366A (zh) 一种基于异构图神经网络的方面级文本情感分析方法
CN112287240A (zh) 基于双嵌入多层卷积神经网络的案件微博评价对象抽取方法及装置
CN110245292B (zh) 一种基于神经网络过滤噪声特征的自然语言关系抽取方法
CN116152554A (zh) 基于知识引导的小样本图像识别系统
CN113204640B (zh) 一种基于注意力机制的文本分类方法
CN112434686A (zh) 针对ocr图片的端到端含错文本分类识别仪
CN112231476A (zh) 一种改进的图神经网络科技文献大数据分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant