CN111259658A - 一种基于类别稠密向量表示的通用文本分类方法及系统 - Google Patents

一种基于类别稠密向量表示的通用文本分类方法及系统 Download PDF

Info

Publication number
CN111259658A
CN111259658A CN202010080710.5A CN202010080710A CN111259658A CN 111259658 A CN111259658 A CN 111259658A CN 202010080710 A CN202010080710 A CN 202010080710A CN 111259658 A CN111259658 A CN 111259658A
Authority
CN
China
Prior art keywords
text
category
dense
classified
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010080710.5A
Other languages
English (en)
Other versions
CN111259658B (zh
Inventor
郭嘉丰
范意兴
袁浩达
程学旗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Computing Technology of CAS
Original Assignee
Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Computing Technology of CAS filed Critical Institute of Computing Technology of CAS
Priority to CN202010080710.5A priority Critical patent/CN111259658B/zh
Publication of CN111259658A publication Critical patent/CN111259658A/zh
Application granted granted Critical
Publication of CN111259658B publication Critical patent/CN111259658B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种基于类别稠密向量表示的通用文本分类方法及系统,包括:获取包括以标记类别文本的训练数据,使用全连接网络处理该训练数据,得到各类别的类别稠密向量;将待分类文本输入至深度神经网络,得到该待分类文本中每个词的词稠密向量,并集合该词稠密向量得到该待分类文本的文本稠密向量;将该文本稠密向量和该类别稠密向量输入至匹配度测量模型,得到该待分类文本属于各类别的概率分布,将该待分类文本与该概率分布中概率最大的类别相匹配,作为该待分类文本的分类结果。本发明基于类别稠密向量表示,将文本分类问题转化为文本匹配问题,通过计算输入文本与每个类别之间的匹配程度,将文本分到匹配程度最大的类别之中。

Description

一种基于类别稠密向量表示的通用文本分类方法及系统
技术领域
本发明涉及文本分类技术领域,并特别涉及一种基于类别稠密向量表示的通用文本分类方法及系统。
背景技术
基于深度神经网络的文本分类方法可以分为单词特征提取、文本特征提取和非线性分类器三个部分,其中单词特征提取和文本特征提取由编码器完成,非线性分类由分类器完成。如图1所示,其中单词特征提取阶段得到每个词的词向量;文本特征提取是指利用文本中每个词的词向量得到文本的向量表示;非线性分类器是指利用全连接神经网络和Softmax层得到类别的概率分布。
现有的处理文本分类的思路虽然在一些应用领域取得了实际的效果,但是这种处理模式存在以下的不足之处:第一,所有的监督信号都来自于模型最尾端的分类器,在特征提取阶段没有显著的监督信息存在,使得整个分类模型成为一个“黑盒”。第二,最尾端的分类器得到了输入文本属于每个类别的概率分布,但是在整个模型中并没有显式地指出每个类别的语义表示,不具有可解释性。在现有技术中,虽然也有利用类别稠密向量表示处理文本分类问题的技术,其利用类别稠密向量表示增强文本特征提取的准确程度,本质上仍然是利用非线性分类器对提取到的文本特征进行非线性分类,没有建模出文本和不同类别之间的语义相似性,导致对文本信息利用不足,准确率低,不符合人类处理文本分类问题时的模式,缺少可解释性。
发明内容
本发明的目的时解决上述现有技术缺少显式建模文本的语义信息和缺少建模文本与类别之间相似程度的问题,提出了利用类别的稠密向量表示将文本分类问题转化为匹配问题的文本分类范式。
针对现有技术的不足,本发明提出一种基于类别稠密向量表示的通用文本分类方法,其中包括:
步骤1、获取包括以标记类别文本的训练数据,使用全连接网络处理该训练数据,得到各类别的类别稠密向量;
步骤2、将待分类文本输入至深度神经网络,得到该待分类文本中每个词的词稠密向量,并集合该词稠密向量得到该待分类文本的文本稠密向量;
步骤3、将该文本稠密向量和该类别稠密向量输入至匹配度测量模型,得到该待分类文本属于各类别的概率分布,将该待分类文本与该概率分布中概率最大的类别相匹配,作为该待分类文本的分类结果。
所述的基于类别稠密向量表示的通用文本分类方法,其中该步骤1包括:在生成类别稠密向量时,对该训练数据中所有属于同一类别的文本中的词的词向量表示取平均值,作为初始化的类别稠密向量。
所述的基于类别稠密向量表示的通用文本分类方法,其中该步骤1包括:
对于训练数据
Figure BDA0002380219220000021
Xn=[x1,…,xm],xi∈X,yn∈Y,其中X为词典,Y为类别集合,[x1,…,xm]为词序列,m为输入文本长度,N为数据集规模,利用全连接网络获得词向量V=f1(Xn),
Figure BDA0002380219220000022
其中P为文本特征空间的维度;通过对训练数据聚集得到类别的稠密向量表示C=[c1,…,cK],
Figure BDA0002380219220000023
其中K为类别的数量。
所述的基于类别稠密向量表示的通用文本分类方法,其中步骤3中该匹配度测量模型,用于通过下式得到各类该类别稠密向和该文本稠密向量的匹配特征,得到该匹配特征的过程具体包括:通过下式得到该类别稠密向和该文本稠密向量中每个词的余弦相似度、双向线性和元素乘;
Figure BDA0002380219220000024
Mbi-linear=CWbi-linearVT,
Figure BDA0002380219220000025
Figure BDA0002380219220000026
之后将相似度结果拼接,得到类别表示和每个词的匹配特征,再通过深度神经网络得到各类别和整个待分类文本的匹配特征。
所述的基于类别稠密向量表示的通用文本分类方法,其中该步骤3包括:在得到该匹配特征后,通过全连接层得到待分类文本和每个类别之间的匹配得分,再经过softmax层得到待分类文本属于每个类别的概率分布。
本发明还提出了一种基于类别稠密向量表示的通用文本分类系统,其中包括:
模块1、获取包括以标记类别文本的训练数据,使用全连接网络处理该训练数据,得到各类别的类别稠密向量;
模块2、将待分类文本输入至深度神经网络,得到该待分类文本中每个词的词稠密向量,并集合该词稠密向量得到该待分类文本的文本稠密向量;
模块3、将该文本稠密向量和该类别稠密向量输入至匹配度测量模型,得到该待分类文本属于各类别的概率分布,将该待分类文本与该概率分布中概率最大的类别相匹配,作为该待分类文本的分类结果。
所述的基于类别稠密向量表示的通用文本分类系统,其中该模块1包括:在生成类别稠密向量时,对该训练数据中所有属于同一类别的文本中的词的词向量表示取平均值,作为初始化的类别稠密向量。
所述的基于类别稠密向量表示的通用文本分类系统,其中该模块6包括:
对于训练数据
Figure BDA0002380219220000031
Xn=[x1,…,xm],xi∈X,yn∈Y,其中X为词典,Y为类别集合,[x1,…,xm]为词序列,m为输入文本长度,N为数据集规模,利用全连接网络获得词向量V=f1(Xn),
Figure BDA0002380219220000032
其中P为文本特征空间的维度;通过对训练数据聚集得到类别的稠密向量表示C=[c1,…,cK],
Figure BDA0002380219220000033
其中K为类别的数量。
所述的基于类别稠密向量表示的通用文本分类系统,其中模块3中该匹配度测量模型,用于通过下式得到各类该类别稠密向和该文本稠密向量的匹配特征,得到该匹配特征的过程具体包括:通过下式得到该类别稠密向和该文本稠密向量中每个词的余弦相似度、双向线性和元素乘;
Figure BDA0002380219220000034
Mbi-linear=CWbi-linearVT,
Figure BDA0002380219220000035
Figure BDA0002380219220000036
之后将相似度结果拼接,得到类别表示和每个词的匹配特征,再通过深度神经网络得到各类别和整个待分类文本的匹配特征。
所述的基于类别稠密向量表示的通用文本分类系统,其中该模块3包括:在得到该匹配特征后,通过全连接层得到待分类文本和每个类别之间的匹配得分,再经过softmax层得到待分类文本属于每个类别的概率分布。
由以上方案可知,本发明的优点在于:
本发明基于类别稠密向量表示的思想,将文本分类问题转化为文本匹配问题解决,通过计算输入文本与每个类别之间的匹配程度,将文本分到匹配程度最大的类别之中。本发明的文本分类模型在多个标准数据集上的性能都有提升。
附图说明
图1为现有的基于神经网络的文本分类方法框架图;
图2为基于匹配的文本分类范式示意图;
图3基于类别稠密向量表示的文本分类方法图;
图4为本发明流程图;
具体实施方式
为让本发明的上述特征和效果能阐述的更明确易懂,下文特举实施例,并配合说明书附图作详细说明如下。
发明人在进行文本分类技术研究时,特别是采用基于类别稠密向量表示的文本分类技术,发现现有技术中的所有模型都是基于“词的特征->文本特征->非线性分类器”的思路处理文本分类问题的,这些方法由于基于“特征提取->分类器”的传统思路的局限,使得对不同类别的深层语义挖掘的不够充分,同时也使分类模型过多地依赖了文本特征表示,最终分类器的模型参数量要远远小于编码器的模型参数量,在模型的训练过程中会过多地侧重编码器而导致结果产生偏差,影响模型性能。这些问题可以利用深度学习方法中文本匹配的思路来解决。本发明基于类别稠密向量表示的思想,将文本分类问题转化为文本匹配问题解决,通过计算输入文本与每个类别之间的匹配程度,将文本分到匹配程度最大的类别之中。本发明的文本分类模型在多个标准数据集上的性能都有提升。
本发明设计了一种通用的文本分类模型,即基于类别稠密向量表示的通用文本分类方法,称之为类别匹配网络。
基于匹配的文本分类范式。本发明提供一种通用的文本分类范式,如图2所示,这一分类范式包括以下模块:类别编码器、文本编码器和文本匹配模块:类别编码器生成分类体系中所有类别的稠密向量表示;文本编码器利用深度神经网络生成文本中每个词的稠密向量表示和全部文本的稠密向量表示;文本匹配模块通过计算类别的稠密向量表示和文本的稠密向量表示之间的匹配程度,将文本分到匹配程度最大的类别中。其中稠密向量表示和稠密向量间的关系是,将每个词的稠密向量相加和/或最大值池化和/或短期记忆网络处理后得到全部文本的稠密向量。
进一步地,所述类别编码器在生成类别稠密向量表示时,对训练数据中所有属于该类别的文本中的词的词表示取平均值,用作初始化本类别的稠密向量表示。
进一步地,类别的稠密向量表示在初始化后与模型中的其他参数一起训练。
进一步地,所述文本编码器是多层神经网络,输入为待分类文本,输出为文本表示或文本中每个词的词表示。
进一步地,文本匹配模块是多层神经网络,输入为类别的稠密向量表示和文本的稠密向量表示,输出为0.0到1.0之间的浮点数。
基于类别稠密向量表示的文本分类方法:
对于样本集合
Figure BDA0002380219220000051
Xn=[x1,…,xm],xi∈X,yn∈Y,其中X为词典,Y为类别集合,[x1,…,xm]为词序列,m为输入文本长度,N为数据集的规模(样本集合中文本的总量)。利用全连接网络获得词向量V=f1(Xn),
Figure BDA0002380219220000052
Figure BDA0002380219220000053
其中P为文本特征空间的维度;通过对训练数据聚集得到类别的稠密向量表示C=[c1,…,CK],
Figure BDA0002380219220000054
其中K为类别的数量。之后针对每个类别,计算类别和输入文本的匹配得分,在提取匹配特征时,计算类别表示和文本中每个词的词表示的余弦相似度、双向线性和元素乘:
Figure BDA0002380219220000055
Figure BDA0002380219220000056
Figure BDA0002380219220000057
之后将相似度结果拼接,得到类别表示和每个词的匹配特征,再通过LSTM获得类别表示和整个文本的匹配特征,其中Q为匹配特征的维度:
M=concat(expand(Mcos),expand(Mbi-linear),Mponitwise-multi)
Figure BDA0002380219220000058
Figure BDA0002380219220000059
在得到匹配特征后,通过全连接层得到输入文本和每个类别之间的匹配得分,再经过softmax层得到输入文本属于每个类别的概率分布,其中⊙表示矩阵的对应列分别求内积。使用交叉熵作为损失函数:
Figure BDA0002380219220000061
Figure BDA0002380219220000062
Figure BDA0002380219220000063
模型结构如图3所示。
首先载入预训练的匹配模型和类别的稠密向量表示。随后,载入待分类文本中每个词向量。随后,按照公式(1)-(7)计算待分类文本与每个类别的匹配程度。最后,将待分类文本分到匹配程度最大的类别中。流程图如图4所示。
以下为与上述方法实施例对应的系统实施例,本实施方式可与上述实施方式互相配合实施。上述实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在上述实施方式中。
本发明还提出了一种基于类别稠密向量表示的通用文本分类系统,其中包括:
模块1、获取包括以标记类别文本的训练数据,使用全连接网络处理该训练数据,得到各类别的类别稠密向量;
模块2、将待分类文本输入至深度神经网络,得到该待分类文本中每个词的词稠密向量,并集合该词稠密向量得到该待分类文本的文本稠密向量;
模块3、将该文本稠密向量和该类别稠密向量输入至匹配度测量模型,得到该待分类文本属于各类别的概率分布,将该待分类文本与该概率分布中概率最大的类别相匹配,作为该待分类文本的分类结果。
所述的基于类别稠密向量表示的通用文本分类系统,其中该模块1包括:在生成类别稠密向量时,对该训练数据中所有属于同一类别的文本中的词的词向量表示取平均值,作为初始化的类别稠密向量。
所述的基于类别稠密向量表示的通用文本分类系统,其中该模块6包括:
对于训练数据
Figure BDA0002380219220000064
Xn=[x1,…,xm],xi∈X,yn∈Y,其中X为词典,Y为类别集合,[x1,…,xm]为词序列,m为输入文本长度,N为数据集规模,利用全连接网络获得词向量V=f1(Xn),
Figure BDA0002380219220000065
其中P为文本特征空间的维度;通过对训练数据聚集得到类别的稠密向量表示C=[c1,…,cK],
Figure BDA0002380219220000071
其中K为类别的数量。
所述的基于类别稠密向量表示的通用文本分类系统,其中模块3中该匹配度测量模型,用于通过下式得到各类该类别稠密向和该文本稠密向量的匹配特征,得到该匹配特征的过程具体包括:通过下式得到该类别稠密向和该文本稠密向量中每个词的余弦相似度、双向线性和元素乘;
Figure BDA0002380219220000072
Mbi-linear=CWbi-linearVT,
Figure BDA0002380219220000073
Figure BDA0002380219220000074
之后将相似度结果拼接,得到类别表示和每个词的匹配特征,再通过深度神经网络得到各类别和整个待分类文本的匹配特征。
所述的基于类别稠密向量表示的通用文本分类系统,其中该模块3包括:在得到该匹配特征后,通过全连接层得到待分类文本和每个类别之间的匹配得分,再经过softmax层得到待分类文本属于每个类别的概率分布。

Claims (10)

1.一种基于类别稠密向量表示的通用文本分类方法,其特征在于,包括:
步骤1、获取包括以标记类别文本的训练数据,使用全连接网络处理该训练数据,得到各类别的类别稠密向量;
步骤2、将待分类文本输入至深度神经网络,得到该待分类文本中每个词的词稠密向量,并集合该词稠密向量得到该待分类文本的文本稠密向量;
步骤3、将该文本稠密向量和该类别稠密向量输入至匹配度测量模型,得到该待分类文本属于各类别的概率分布,将该待分类文本与该概率分布中概率最大的类别相匹配,作为该待分类文本的分类结果。
2.如权利要求1所述的基于类别稠密向量表示的通用文本分类方法,其特征在于,该步骤1包括:在生成类别稠密向量时,对该训练数据中所有属于同一类别的文本中的词的词向量表示取平均值,作为初始化的类别稠密向量。
3.如权利要求1所述的基于类别稠密向量表示的通用文本分类方法,其特征在于,该步骤1包括:
对于训练数据
Figure FDA0002380219210000011
Xn=[x1,…,xm],xi∈X,yn∈Y,其中X为词典,Y为类别集合,[x1,…,xm]为词序列,m为输入文本长度,N为数据集规模,利用全连接网络获得词向量V=f1(Xn),
Figure FDA0002380219210000012
其中P为文本特征空间的维度;通过对训练数据聚集得到类别的稠密向量表示C=[c1,…,cK],
Figure FDA0002380219210000016
其中K为类别的数量。
4.如权利要求3所述的基于类别稠密向量表示的通用文本分类方法,其特征在于,步骤3中该匹配度测量模型,用于通过下式得到各类该类别稠密向和该文本稠密向量的匹配特征,得到该匹配特征的过程具体包括:通过下式得到该类别稠密向和该文本稠密向量中每个词的余弦相似度、双向线性和元素乘;
Figure FDA0002380219210000013
Mbi-linear=CWbi-linearVT
Figure FDA0002380219210000014
Figure FDA0002380219210000015
之后将相似度结果拼接,得到类别表示和每个词的匹配特征,再通过深度神经网络得到各类别和整个待分类文本的匹配特征。
5.如权利要求4所述的基于类别稠密向量表示的通用文本分类方法,其特征在于,该步骤3包括:在得到该匹配特征后,通过全连接层得到待分类文本和每个类别之间的匹配得分,再经过softmax层得到待分类文本属于每个类别的概率分布。
6.一种基于类别稠密向量表示的通用文本分类系统,其特征在于,包括:
模块1、获取包括以标记类别文本的训练数据,使用全连接网络处理该训练数据,得到各类别的类别稠密向量;
模块2、将待分类文本输入至深度神经网络,得到该待分类文本中每个词的词稠密向量,并集合该词稠密向量得到该待分类文本的文本稠密向量;
模块3、将该文本稠密向量和该类别稠密向量输入至匹配度测量模型,得到该待分类文本属于各类别的概率分布,将该待分类文本与该概率分布中概率最大的类别相匹配,作为该待分类文本的分类结果。
7.如权利要求6所述的基于类别稠密向量表示的通用文本分类系统,其特征在于,该模块1包括:在生成类别稠密向量时,对该训练数据中所有属于同一类别的文本中的词的词向量表示取平均值,作为初始化的类别稠密向量。
8.如权利要求1所述的基于类别稠密向量表示的通用文本分类系统,其特征在于,该模块6包括:
对于训练数据
Figure FDA0002380219210000021
Xn=[x1,…,xm],xi∈X,yn∈Y,其中X为词典,Y为类别集合,[x1,…,xm]为词序列,m为输入文本长度,N为数据集规模,利用全连接网络获得词向量V=f1(Xn),
Figure FDA0002380219210000022
其中P为文本特征空间的维度;通过对训练数据聚集得到类别的稠密向量表示C=[c1,…,cK],
Figure FDA0002380219210000023
其中K为类别的数量。
9.如权利要求8所述的基于类别稠密向量表示的通用文本分类系统,其特征在于,模块3中该匹配度测量模型,用于通过下式得到各类该类别稠密向和该文本稠密向量的匹配特征,得到该匹配特征的过程具体包括:通过下式得到该类别稠密向和该文本稠密向量中每个词的余弦相似度、双向线性和元素乘;
Figure FDA0002380219210000024
Mbi-linear=CWbi-linearVT
Figure FDA0002380219210000025
Figure FDA0002380219210000026
之后将相似度结果拼接,得到类别表示和每个词的匹配特征,再通过深度神经网络得到各类别和整个待分类文本的匹配特征。
10.如权利要求9所述的基于类别稠密向量表示的通用文本分类系统,其特征在于,该模块3包括:在得到该匹配特征后,通过全连接层得到待分类文本和每个类别之间的匹配得分,再经过softmax层得到待分类文本属于每个类别的概率分布。
CN202010080710.5A 2020-02-05 2020-02-05 一种基于类别稠密向量表示的通用文本分类方法及系统 Active CN111259658B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010080710.5A CN111259658B (zh) 2020-02-05 2020-02-05 一种基于类别稠密向量表示的通用文本分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010080710.5A CN111259658B (zh) 2020-02-05 2020-02-05 一种基于类别稠密向量表示的通用文本分类方法及系统

Publications (2)

Publication Number Publication Date
CN111259658A true CN111259658A (zh) 2020-06-09
CN111259658B CN111259658B (zh) 2022-08-19

Family

ID=70947168

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010080710.5A Active CN111259658B (zh) 2020-02-05 2020-02-05 一种基于类别稠密向量表示的通用文本分类方法及系统

Country Status (1)

Country Link
CN (1) CN111259658B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045857A (zh) * 2015-07-09 2015-11-11 中国科学院计算技术研究所 一种社交网络谣言识别方法及系统
CN105630931A (zh) * 2015-12-22 2016-06-01 浪潮软件集团有限公司 一种文档分类的方法及装置
CN109189925A (zh) * 2018-08-16 2019-01-11 华南师范大学 基于点互信息的词向量模型和基于cnn的文本分类方法
CN109446322A (zh) * 2018-10-15 2019-03-08 拉扎斯网络科技(上海)有限公司 文本分析方法、装置、电子设备及可读存储介质
CN109543084A (zh) * 2018-11-09 2019-03-29 西安交通大学 一种建立面向网络社交媒体的隐蔽敏感文本的检测模型的方法
CN109657061A (zh) * 2018-12-21 2019-04-19 合肥工业大学 一种针对海量多词短文本的集成分类方法
CN109977393A (zh) * 2017-12-28 2019-07-05 中国科学院计算技术研究所 一种基于内容争议性的流行新闻预测方法和系统
CN110147551A (zh) * 2019-05-14 2019-08-20 腾讯科技(深圳)有限公司 多类别实体识别模型训练、实体识别方法、服务器及终端
CN110457444A (zh) * 2019-08-14 2019-11-15 山东浪潮人工智能研究院有限公司 一种基于深度文本匹配的同义句转换方法
CN110516070A (zh) * 2019-08-28 2019-11-29 上海海事大学 一种基于文本纠错与神经网络的中文问句分类方法
CN110717039A (zh) * 2019-09-17 2020-01-21 平安科技(深圳)有限公司 文本分类方法和装置、电子设备、计算机可读存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045857A (zh) * 2015-07-09 2015-11-11 中国科学院计算技术研究所 一种社交网络谣言识别方法及系统
CN105630931A (zh) * 2015-12-22 2016-06-01 浪潮软件集团有限公司 一种文档分类的方法及装置
CN109977393A (zh) * 2017-12-28 2019-07-05 中国科学院计算技术研究所 一种基于内容争议性的流行新闻预测方法和系统
CN109189925A (zh) * 2018-08-16 2019-01-11 华南师范大学 基于点互信息的词向量模型和基于cnn的文本分类方法
CN109446322A (zh) * 2018-10-15 2019-03-08 拉扎斯网络科技(上海)有限公司 文本分析方法、装置、电子设备及可读存储介质
CN109543084A (zh) * 2018-11-09 2019-03-29 西安交通大学 一种建立面向网络社交媒体的隐蔽敏感文本的检测模型的方法
CN109657061A (zh) * 2018-12-21 2019-04-19 合肥工业大学 一种针对海量多词短文本的集成分类方法
CN110147551A (zh) * 2019-05-14 2019-08-20 腾讯科技(深圳)有限公司 多类别实体识别模型训练、实体识别方法、服务器及终端
CN110457444A (zh) * 2019-08-14 2019-11-15 山东浪潮人工智能研究院有限公司 一种基于深度文本匹配的同义句转换方法
CN110516070A (zh) * 2019-08-28 2019-11-29 上海海事大学 一种基于文本纠错与神经网络的中文问句分类方法
CN110717039A (zh) * 2019-09-17 2020-01-21 平安科技(深圳)有限公司 文本分类方法和装置、电子设备、计算机可读存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
GUOYIN WANG 等: "Joint Embedding of Words and Labels for Text Classification", 《HTTPS://ARXIV.ORG/ABS/1805.04174》 *
庞亮 等: "深度文本匹配综述", 《计算机学报》 *
范意兴 等: "基于上下文的深度语义句子检索模型", 《中文信息学报》 *
谭嘉莉: "面向校园心理咨询的对话回复模型研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Also Published As

Publication number Publication date
CN111259658B (zh) 2022-08-19

Similar Documents

Publication Publication Date Title
CN110298037B (zh) 基于增强注意力机制的卷积神经网络匹配的文本识别方法
CN111126386B (zh) 场景文本识别中基于对抗学习的序列领域适应方法
CN112818861B (zh) 一种基于多模态上下文语义特征的情感分类方法及系统
CN109284406B (zh) 基于差异循环神经网络的意图识别方法
CN111860674A (zh) 样本类别识别方法、装置、计算机设备及存储介质
CN112765352A (zh) 基于具有自注意力机制的图卷积神经网络文本分类方法
CN110297888B (zh) 一种基于前缀树与循环神经网络的领域分类方法
CN112052684A (zh) 电力计量的命名实体识别方法、装置、设备和存储介质
JP6738769B2 (ja) 文ペア分類装置、文ペア分類学習装置、方法、及びプログラム
CN111475622A (zh) 一种文本分类方法、装置、终端及存储介质
CN110569869A (zh) 一种用于多模态情绪检测的特征级融合方法
CN111400494A (zh) 一种基于GCN-Attention的情感分析方法
CN113849648A (zh) 分类模型训练方法、装置、计算机设备和存储介质
CN113221852A (zh) 一种目标识别方法及装置
CN114579746A (zh) 一种优化的高精度文本分类方法及装置
CN115687609A (zh) 一种基于Prompt多模板融合的零样本关系抽取方法
CN112163114A (zh) 一种基于特征融合的图像检索方法
CN115064154A (zh) 混合语言语音识别模型的生成方法及装置
CN112434686B (zh) 针对ocr图片的端到端含错文本分类识别仪
CN111723572B (zh) 基于CNN卷积层和BiLSTM的中文短文本相关性度量方法
CN111950592B (zh) 一种基于监督最小二乘多类核典型相关分析的多模态情感特征融合方法
EP4285281A1 (en) Annotation-efficient image anomaly detection
CN110288002B (zh) 一种基于稀疏正交神经网络的图像分类方法
CN116883746A (zh) 一种基于分区池化超图神经网络的图节点分类方法
CN111259658B (zh) 一种基于类别稠密向量表示的通用文本分类方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant