CN116541523A - 一种基于大数据的法律判决舆情分类方法 - Google Patents

一种基于大数据的法律判决舆情分类方法 Download PDF

Info

Publication number
CN116541523A
CN116541523A CN202310485333.7A CN202310485333A CN116541523A CN 116541523 A CN116541523 A CN 116541523A CN 202310485333 A CN202310485333 A CN 202310485333A CN 116541523 A CN116541523 A CN 116541523A
Authority
CN
China
Prior art keywords
public opinion
level feature
text
feature vectors
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310485333.7A
Other languages
English (en)
Inventor
王进
倪瑞
廖唯皓
朱淼
袁鑫浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yami Technology Guangzhou Co ltd
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202310485333.7A priority Critical patent/CN116541523A/zh
Publication of CN116541523A publication Critical patent/CN116541523A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于自然语言处理领域,具体涉及一种基于大数据的法律判决舆情分类方法;该方法包括:获取法律判决文本数据和带标签的舆情文本数据;提取舆情文本的词级特征向量和句级特征向量;提取法律判决文本的词级特征向量;根据舆情文本的词级特征向量和法律判决文本的词级特征向量得到舆情文本的交叉词级特征向量;对舆情文本的句级特征向量作聚类处理,得到正向舆情聚类中心和非正向舆情聚类中心;根据交叉词级特征进行分类,得到舆情文本的分类结果;计算模型总损失;根据总损失调整模型参数,得到训练好的文本分类模型;本发明提高了模型的分类准确度。

Description

一种基于大数据的法律判决舆情分类方法
技术领域
本发明属于自然语言处理领域,具体涉及一种基于大数据的法律判决舆情分类方法。
背景技术
对于文本分类来说,传统的方法主要有基于规则的方法、基于统计的方法和基于深度学习的方法。基于规则的方法需要专家知识来人工定义规则和随时改进规则,对于很多需要理解语境的文本无法通过简单的规则进行处理,因此不太适用于大规模的文本分类;基于统计的方法往往存在数据稀疏性问题且难以处理长文本,这会导致训练和推理变得非常困难,难以用于实际;基于深度学习的方法,通过各种深度学习网络提取文本的数学表征,最后进行分类任务,目前大部分文本分类的最优模型都开始采用基于深度学习的方法。
深度学习的方法有多种,例如基于Bert的文本分类方法、基于LSTM神经网络的文本分类方法等,但是这些方法通常只对输入的舆情文本进行分类,没有注入相关的先验知识,模型只能针对当前舆情文本进行分类,对于文本中出现的一些判决书中的词不能获得其完整的信息。
发明内容
针对现有技术存在的不足,本发明提出了一种基于大数据的法律判决舆情分类方法,该方法包括:获取法律判决文本数据和待分类的舆情文本数据,将法律判决文本数据和待分类的舆情文本数据输入到训练好的文本分类模型中,得到舆情文本数据的分类结果;
文本分类模型的训练过程包括:
S1:获取法律判决文本数据和带标签的舆情文本数据;
S2:根据舆情文本数据提取舆情文本的词级特征向量和句级特征向量;根据法律判决文本数据提取法律判决文本的词级特征向量和句级特征向量;
S3:采用多头注意力机制对舆情文本的词级特征向量和法律判决文本的词级特征向量进行处理,得到舆情文本的交叉词级特征向量;
S4:对舆情文本的句级特征向量作聚类处理,得到正向舆情聚类中心和非正向舆情聚类中心;
S5:将交叉词级特征向量输入到全连接神经网络进行处理,得到舆情文本的低维特征;根据低维特征对舆情文本进行分类,得到舆情文本的分类结果;
S6:对低维特征和两个聚类中心作对比学习并计算对比学习损失;根据标签和分类结果计算全连接分类损失;根据对比学习损失函数与全连接分类损失计算模型总损失;
S7:根据总损失调整模型参数,得到训练好的文本分类模型。
优选的,所述步骤S2具体包括:
S21:采用预训练的Bert模型对舆情文本数据进行处理,得到舆情文本的词级特征向量和句级特征向量;
S22:查询预训练的Bert模型的vocab词表,得到法律判决文本的词级特征向量;将词级特征向量通过全连接网络获得法律判决文本的句级特征向量。
优选的,所述步骤S3具体包括:将舆情文本的词级特征向量分别输入到不同的线性层进行处理,得到K矩阵和V矩阵;将法律判决文本的词级特征向量输入到线性层进行处理,得到Q矩阵;根据K矩阵、V矩阵和Q矩阵得到交叉词级特征向量。
进一步的,计算交叉词级特征向量的公式为:
其中,M表示交叉词级特征向量,dk表示多头注意力机制中每个头的维度,E表示单位矩阵,softmax()表示softmax激活函数。
优选的,对舆情文本的句级特征向量作聚类处理的过程包括:
S41:将法律判决文本的句级特征向量作为正向舆情聚类中心,并随机初始化与正向舆情聚类中心维度相同的非正向舆情聚类中心;
S42:计算每个舆情文本的句级特征向量与两个聚类中心的距离,将句级特征向量归类到距离最小的类别;
S43:更新非正向舆情聚类中心并返回步骤S42;直到非正向舆情聚类中心不再发生变化。
进一步的,计算舆情文本的句级特征向量与聚类中心距离的公式为:
其中,distance表示舆情文本的句级特征向量与聚类中心的距离,hi表示句级特征向量第i个维度的值,ci表示聚类中心第i个维度的值,d表示句级特征向量的维度。
进一步的,更新非正向舆情聚类中心的过程包括:计算所有被归类到非正向舆情的的句级特征向量的聚类中心,将该聚类中心作为新的非正向舆情聚类中心,计算新的非正向舆情聚类中心的公式为:
其中,表示新的非正向舆情聚类中心,m表示所有被归类到非正向舆情的句级特征向量个数,Hid表示所有被归类到非正向舆情的句级特征向量集合H中第i个向量在第d个维度上的值。
优选的,计算对比学习损失的公式为:
其中,l1表示对比学习损失,Si表示舆情文本中第i条舆情评论的低维特征向量,C1表示正向舆情聚类中心,表示非正向舆情聚类中心,sim()表示求余弦相似度,min()表示求最小值,b表示每批次的舆情评论数量,/>表示第i条舆情评论的预测结果。
优选的,计算全连接分类损失的公式为:
其中,l2表示全连接分类损失,yi表示第i条舆情评论的标签,表示第i条舆情评论的预测概率值。
本发明的有益效果为:本发明采用基于聚类的对比学习和基于cross attention的注意力机制解决了传统模型无法结合判决文书和舆情以获取更多信息来充分挖掘舆情与判决文书之间的内在关系的问题,通过基于聚类的对比学习,缓解了句极特征向量与由舆情文本词向量构成的序列向量表征不一致的问题并提高了模型的鲁棒性,基于crossattention的注意力机制,引入了更多关于舆情的前缀信息,模型对于舆情中出现的一些关键信息结合判决文书信息后将会有更深入的理解,提高了模型的分类准确度。
附图说明
图1为本发明中文本分类模型训练流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提出了一种基于大数据的法律判决舆情分类方法,如图1所示,所述方法包括以下内容:获取法律判决文本数据和待分类的舆情文本数据,将法律判决文本数据和待分类的舆情文本数据输入到训练好的文本分类模型中,得到舆情文本数据的分类结果;
文本分类模型的训练过程包括:
S1:获取法律判决文本数据和带标签的舆情文本数据。
获取法律判决文本数据,具体的,获取中国裁判文书网获取判决文书,根据文书概要,依次拼接案件类型、案由、审理程序和标题,构成法律判决文本数据。从互联网上获取与判决文书相关的舆情评论,并对其进行人工标注,标注1表明该评论不反对该判决文书,作为正向舆情,标注0表示该评论反对该判决文书,作为非正向舆情,得到带标签的舆情文本数据。根据一条判决文书对应多条舆情文本的原则,将所有舆情文本按照判决文书进行聚合,对每条判决文书抽取对应80%的舆情文本作为训练集,其余作为测试集。
S2:根据舆情文本数据提取舆情文本的词级特征向量和句级特征向量;根据法律判决文本数据提取法律判决文本的词级特征向量和句级特征向量。
将训练集分批次输入模型以对模型进行训练,具体的:
S21:采用预训练的Bert模型对舆情文本数据进行处理,具体的,将Bert模型输出的CLS位置的向量作为舆情文本的句级特征向量,其余位置的输出作为舆情文本的词级特征向量序列;
S22:查询预训练的Bert模型的vocab词表,得到法律判决文本的词级特征向量;并将词级特征向量通过全连接网络获得法律判决文本的句级特征向量。
S3:采用多头注意力机制对舆情文本的词级特征向量和法律判决文本的词级特征向量进行处理,得到舆情文本的交叉词级特征向量。
将舆情文本的词级特征向量分别输入到不同的线性层进行处理,得到K矩阵和V矩阵;将法律判决文本的词级特征向量输入到线性层进行处理,得到Q矩阵;根据K矩阵、V矩阵和Q矩阵计算交叉词级特征向量,具体的,构建cross attention网络,用法律判决文本对应的Q矩阵去查询舆情文本对应的K矩阵中的内容,获得舆情文本对应的V矩阵的重要性权重,通过将权重矩阵V的对角线元素削弱来缓解每个词过度关注自身的问题;采用多头注意力机制对舆情文本的词级特征向量和法律判决文本的词级特征向量进行处理的公式表示为:
其中,M表示交叉词级特征向量,dk表示多头注意力机制中每个头的维度,E表示单位矩阵,softmax()表示softmax激活函数,表示对于矩阵中的每一个元素xi,将其值缩放到[0,1]的范围内。
S4:对舆情文本的句级特征向量作聚类处理,得到正向舆情聚类中心和非正向舆情聚类中心。
S41:将法律判决文本的句级特征向量作为正向舆情聚类中心C1,并随机初始化与正向舆情聚类中心维度相同的非正向舆情聚类中心C2
聚类中心Ci,i=1,2可表示为:
Ci={c1,c2,...,cd}
S42:计算每个舆情文本的句级特征向量与两个聚类中心的距离,将句级特征向量归类到距离最小的类别。
其中,distance表示舆情文本的句级特征向量与聚类中心的距离,hi表示句级特征向量第i个维度的值,ci表示聚类中心第i个维度的值,d表示句级特征向量的维度。
将舆情文本的句级特征向量归类到与聚类中心距离最小的类别(正向舆情或反向舆情)。
S43:更新非正向舆情聚类中心并返回步骤S42;直到非正向舆情聚类中心不再发生变化。
更新非正向舆情聚类中心的过程包括:计算所有被归类到非正向舆情的句级特征向量的聚类中心,将该聚类中心作为新的非正向舆情聚类中心,计算新的非正向舆情聚类中心的公式为:
其中,表示新的非正向舆情聚类中心,m表示所有被归类到非正向舆情的句级特征向量个数,Hid表示所有被归类到非正向舆情的句级特征向量集合H中第i个向量在第d个维度上的值。
S5:将交叉词级特征向量输入到全连接神经网络进行处理,得到舆情文本的低维特征;根据低维特征对舆情文本进行分类,具体的,将低维特征通过全连接神经网络获得对于每个类别的概率,选取概率最大的类别作为舆情文本的分类结果。
S6:对低维特征和两个聚类句级特征向量作对比学习并计算对比学习损失;根据标签和分类结果计算全连接分类损失;根据对比学习损失函数与全连接分类损失计算模型总损失。
计算对比学习损失l1的公式为:
其中,l1表示对比学习损失,Si表示舆情文本中第i条舆情评论的低维特征向量,C1表示正向舆情聚类中心,表示非正向舆情聚类中心,sim()表示求余弦相似度,min()表示求最小值,b表示每批次的舆情评论数量,/>表示第i条舆情评论的预测结果;通过这样的设计,可以让模型着重关注于被模型预测错误的数据,使得模型在对比学习中与对应类别的聚类中心对齐。
计算全连接分类损失l2的公式为:
其中,yi表示第i条舆情评论的标签,表示第i条舆情评论的预测概率值。
根据对比学习损失函数与全连接分类损失计算模型总损失,具体公式为:
其中l1表示对比学习损失函数,l2表示全连接分类损失函数。
S7:根据总损失调整模型参数,得到得到训练好的文本分类模型。
根据损失函数优化模型,当损失最小时,完成模型的训练;获取法律判决文本数据和待分类的舆情文本数据,将法律判决文本数据和待分类的舆情文本数据输入到训练好的文本分类模型中,可得到舆情文本数据的分类结果。
以上所举实施例,对本发明的目的、技术方案和优点进行了进一步的详细说明,所应理解的是,以上所举实施例仅为本发明的优选实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内对本发明所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于大数据的法律判决舆情分类方法,其特征在于,包括:获取法律判决文本数据和待分类的舆情文本数据,将法律判决文本数据和待分类的舆情文本数据输入到训练好的文本分类模型中,得到舆情文本数据的分类结果;
文本分类模型的训练过程包括:
S1:获取法律判决文本数据和带标签的舆情文本数据;
S2:根据舆情文本数据提取舆情文本的词级特征向量和句级特征向量;根据法律判决文本数据提取法律判决文本的词级特征向量和句级特征向量;
S3:采用多头注意力机制对舆情文本的词级特征向量和法律判决文本的词级特征向量进行处理,得到舆情文本的交叉词级特征向量;
S4:对舆情文本的句级特征向量作聚类处理,得到正向舆情聚类中心和非正向舆情聚类中心;
S5:将交叉词级特征向量输入到全连接神经网络进行处理,得到舆情文本的低维特征;根据低维特征对舆情文本进行分类,得到舆情文本的分类结果;
S6:对低维特征和两个聚类中心作对比学习并计算对比学习损失;根据标签和分类结果计算全连接分类损失;根据对比学习损失函数与全连接分类损失计算模型总损失;
S7:根据总损失调整模型参数,得到训练好的文本分类模型。
2.根据权利要求1所述的一种基于大数据的法律判决舆情分类方法,其特征在于,所述步骤S2具体包括:
S21:采用预训练的Bert模型对舆情文本数据进行处理,得到舆情文本的词级特征向量和句级特征向量;
S22:查询预训练的Bert模型的vocab词表,得到法律判决文本的词级特征向量;将词级特征向量通过全连接网络获得法律判决文本的句级特征向量。
3.根据权利要求1所述的一种基于大数据的法律判决舆情分类方法,其特征在于,所述步骤S3具体包括:将舆情文本的词级特征向量分别输入到不同的线性层进行处理,得到K矩阵和V矩阵;将法律判决文本的词级特征向量输入到线性层进行处理,得到Q矩阵;根据K矩阵、V矩阵和Q矩阵得到交叉词级特征向量。
4.根据权利要求3所述的一种基于大数据的法律判决舆情分类方法,其特征在于,计算交叉词级特征向量的公式为:
其中,M表示交叉词级特征向量,dk表示多头注意力机制中每个头的维度,E表示单位矩阵,softmax()表示softmax激活函数。
5.根据权利要求1所述的一种基于大数据的法律判决舆情分类方法,其特征在于,对舆情文本的句级特征向量作聚类处理的过程包括:
S41:将法律判决文本的句级特征向量作为正向舆情聚类中心,并随机初始化与正向舆情聚类中心维度相同的非正向舆情聚类中心;
S42:计算每个舆情文本的句级特征向量与两个聚类中心的距离,将句级特征向量归类到距离最小的类别;
S43:更新非正向舆情聚类中心并返回步骤S42;直到非正向舆情聚类中心不再发生变化。
6.根据权利要求5所述的一种基于大数据的法律判决舆情分类方法,其特征在于,计算舆情文本的句级特征向量与聚类中心距离的公式为:
其中,distance表示舆情文本的句级特征向量与聚类中心的距离,hi表示句级特征向量第i个维度的值,ci表示聚类中心第i个维度的值,d表示句级特征向量的维度。
7.根据权利要求5所述的一种基于大数据的法律判决舆情分类方法,其特征在于,更新非正向舆情聚类中心的过程包括:计算所有被归类到非正向舆情的的句级特征向量的聚类中心,将该聚类中心作为新的非正向舆情聚类中心,计算新的非正向舆情聚类中心的公式为:
其中,表示新的非正向舆情聚类中心,m表示所有被归类到非正向舆情的句级特征向量个数,Hid表示所有被归类到非正向舆情的句级特征向量集合H中第i个向量在第d个维度上的值。
8.根据权利要求1所述的一种基于大数据的法律判决舆情分类方法,其特征在于,计算对比学习损失的公式为:
其中,l1表示对比学习损失,Si表示舆情文本中第i条舆情评论的低维特征向量,C1表示正向舆情聚类中心,表示非正向舆情聚类中心,sim()表示求余弦相似度,min()表示求最小值,b表示每批次的舆情评论数量,/>表示第i条舆情评论的预测结果。
9.根据权利要求1所述的一种基于大数据的法律判决舆情分类方法,其特征在于,计算全连接分类损失的公式为:
其中,l2表示全连接分类损失,yi表示第i条舆情评论的标签,表示第i条舆情评论的预测概率值。
CN202310485333.7A 2023-04-28 2023-04-28 一种基于大数据的法律判决舆情分类方法 Pending CN116541523A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310485333.7A CN116541523A (zh) 2023-04-28 2023-04-28 一种基于大数据的法律判决舆情分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310485333.7A CN116541523A (zh) 2023-04-28 2023-04-28 一种基于大数据的法律判决舆情分类方法

Publications (1)

Publication Number Publication Date
CN116541523A true CN116541523A (zh) 2023-08-04

Family

ID=87449930

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310485333.7A Pending CN116541523A (zh) 2023-04-28 2023-04-28 一种基于大数据的法律判决舆情分类方法

Country Status (1)

Country Link
CN (1) CN116541523A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117407527A (zh) * 2023-10-19 2024-01-16 重庆邮电大学 一种教育领域舆情大数据分类方法
CN117453916A (zh) * 2023-10-26 2024-01-26 重庆邮电大学 一种基于大数据的微博异常用户检测方法

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107704558A (zh) * 2017-09-28 2018-02-16 北京车慧互动广告有限公司 一种用户意见抽取方法及系统
CN110750646A (zh) * 2019-10-16 2020-02-04 乐山师范学院 一种旅店评论文本的属性描述提取方法
CA3135387A1 (en) * 2019-04-18 2020-10-22 Microsoft Technology Licensing, Llc Architectures for modeling comment and edit relations
CN111858945A (zh) * 2020-08-05 2020-10-30 上海哈蜂信息科技有限公司 基于深度学习的评论文本方面级情感分类方法及系统
CN112926336A (zh) * 2021-02-05 2021-06-08 昆明理工大学 基于正文评论交互式注意力的微博案件方面级观点识别方法
CN113282754A (zh) * 2021-06-10 2021-08-20 北京中科闻歌科技股份有限公司 针对新闻事件的舆情检测方法、装置、设备和存储介质
US20220036011A1 (en) * 2020-07-30 2022-02-03 InfoAuthN AI Inc. Systems and Methods for Explainable Fake News Detection
CN114398480A (zh) * 2021-11-26 2022-04-26 重庆邮电大学 基于关键信息抽取的金融舆情细分方面检测方法和设备
CN114548321A (zh) * 2022-03-05 2022-05-27 昆明理工大学 基于对比学习的自监督舆情评论观点对象分类方法
CN115146629A (zh) * 2022-05-10 2022-10-04 昆明理工大学 一种基于对比学习的新闻文本与评论相关性分析方法
CN115169449A (zh) * 2022-06-29 2022-10-11 中山大学 基于对比学习与持续性学习的属性级情感分析方法、系统及存储介质
CN115906835A (zh) * 2022-11-23 2023-04-04 之江实验室 一种基于聚类和对比学习的中文问句文本表示学习的方法
CN115952291A (zh) * 2023-03-14 2023-04-11 山东大学 基于多头自注意力及lstm的金融舆情分类方法及系统

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107704558A (zh) * 2017-09-28 2018-02-16 北京车慧互动广告有限公司 一种用户意见抽取方法及系统
CA3135387A1 (en) * 2019-04-18 2020-10-22 Microsoft Technology Licensing, Llc Architectures for modeling comment and edit relations
CN110750646A (zh) * 2019-10-16 2020-02-04 乐山师范学院 一种旅店评论文本的属性描述提取方法
US20220036011A1 (en) * 2020-07-30 2022-02-03 InfoAuthN AI Inc. Systems and Methods for Explainable Fake News Detection
CN111858945A (zh) * 2020-08-05 2020-10-30 上海哈蜂信息科技有限公司 基于深度学习的评论文本方面级情感分类方法及系统
CN112926336A (zh) * 2021-02-05 2021-06-08 昆明理工大学 基于正文评论交互式注意力的微博案件方面级观点识别方法
CN113282754A (zh) * 2021-06-10 2021-08-20 北京中科闻歌科技股份有限公司 针对新闻事件的舆情检测方法、装置、设备和存储介质
CN114398480A (zh) * 2021-11-26 2022-04-26 重庆邮电大学 基于关键信息抽取的金融舆情细分方面检测方法和设备
CN114548321A (zh) * 2022-03-05 2022-05-27 昆明理工大学 基于对比学习的自监督舆情评论观点对象分类方法
CN115146629A (zh) * 2022-05-10 2022-10-04 昆明理工大学 一种基于对比学习的新闻文本与评论相关性分析方法
CN115169449A (zh) * 2022-06-29 2022-10-11 中山大学 基于对比学习与持续性学习的属性级情感分析方法、系统及存储介质
CN115906835A (zh) * 2022-11-23 2023-04-04 之江实验室 一种基于聚类和对比学习的中文问句文本表示学习的方法
CN115952291A (zh) * 2023-03-14 2023-04-11 山东大学 基于多头自注意力及lstm的金融舆情分类方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
白健等: "基于弹幕的网络舆情文本挖掘与情感分析", 软件工程, vol. 25, no. 11 *
魏刚等: "基于信息增强的中文舆情文本情感分析", 通信技术, vol. 55, no. 7 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117407527A (zh) * 2023-10-19 2024-01-16 重庆邮电大学 一种教育领域舆情大数据分类方法
CN117453916A (zh) * 2023-10-26 2024-01-26 重庆邮电大学 一种基于大数据的微博异常用户检测方法

Similar Documents

Publication Publication Date Title
CN110298037B (zh) 基于增强注意力机制的卷积神经网络匹配的文本识别方法
WO2023024412A1 (zh) 基于深度学习模型的视觉问答方法及装置、介质、设备
CN111209401A (zh) 网络舆情文本信息情感极性分类处理系统及方法
WO2018028077A1 (zh) 一种基于深度学习的中文语义分析的方法及装置
CN116541523A (zh) 一种基于大数据的法律判决舆情分类方法
CN110188195B (zh) 一种基于深度学习的文本意图识别方法、装置及设备
CN114943230B (zh) 一种融合常识知识的中文特定领域实体链接方法
CN112905736B (zh) 一种基于量子理论的无监督文本情感分析方法
CN112434686B (zh) 针对ocr图片的端到端含错文本分类识别仪
CN115545041B (zh) 一种增强医疗语句语义向量表示的模型构造方法及系统
CN111540470B (zh) 一种基于bert迁移学习的社交网络抑郁倾向检测模型及其训练方法
CN114648016A (zh) 一种基于事件要素交互与标签语义增强的事件论元抽取方法
CN113869055A (zh) 基于深度学习的电网项目特征属性识别方法
CN115238693A (zh) 一种基于多分词和多层双向长短期记忆的中文命名实体识别方法
CN111460147A (zh) 一种基于语义增强的标题短文本分类方法
CN112950414B (zh) 一种基于解耦法律要素的法律文本表示方法
CN114756678A (zh) 一种未知意图文本的识别方法及装置
CN114356990A (zh) 基于迁移学习的基地命名实体识别系统及方法
CN116522165B (zh) 一种基于孪生结构的舆情文本匹配系统及方法
CN112329449A (zh) 基于情感词典和Transformer的情感分析方法
CN116227486A (zh) 一种基于检索和对比学习的情感分析方法
CN114997331A (zh) 基于度量学习的小样本关系分类方法及系统
CN115062615A (zh) 一种金融领域事件抽取方法和装置
CN112015921B (zh) 一种基于学习辅助知识图谱的自然语言处理方法
CN114611489A (zh) 文本逻辑条件抽取ai模型构建方法、抽取方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20240125

Address after: Room 801, 85 Kefeng Road, Huangpu District, Guangzhou City, Guangdong Province

Applicant after: Yami Technology (Guangzhou) Co.,Ltd.

Country or region after: China

Address before: 400065 Chongwen Road, Nanshan Street, Nanan District, Chongqing

Applicant before: CHONGQING University OF POSTS AND TELECOMMUNICATIONS

Country or region before: China

TA01 Transfer of patent application right