CN110717332A - 基于非对称孪生网络的新闻与案件相似度计算方法 - Google Patents

基于非对称孪生网络的新闻与案件相似度计算方法 Download PDF

Info

Publication number
CN110717332A
CN110717332A CN201910680008.XA CN201910680008A CN110717332A CN 110717332 A CN110717332 A CN 110717332A CN 201910680008 A CN201910680008 A CN 201910680008A CN 110717332 A CN110717332 A CN 110717332A
Authority
CN
China
Prior art keywords
news
case
semantic
document
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910680008.XA
Other languages
English (en)
Other versions
CN110717332B (zh
Inventor
余正涛
赵承鼎
郭军军
线岩团
黄于欣
相艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN201910680008.XA priority Critical patent/CN110717332B/zh
Publication of CN110717332A publication Critical patent/CN110717332A/zh
Application granted granted Critical
Publication of CN110717332B publication Critical patent/CN110717332B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及基于非对称孪生网络的新闻与案件相似度计算方法,属于自然语言处理技术领域。本发明首先通过计算文本中句子与标题的相似度选取与新闻标题最相关的句子表征文档,从而去除新闻文本中的冗余句子,再利用非对称孪生网络对文档、案件描述建模,考虑到案件要素蕴含案件的关键语义信息,将案件要素作为监督信息融入到非对称孪生网络中对新闻文档和案件描述进行编码,最终通过计算文档相似度判断新闻与案件的相关性。本发明通过基于非对称孪生网络对新闻文本和案件描述进行相似度计算,能对不平衡的新闻文本和案件描述进行语义编码建模,有益于提升相似度计算的准确率。

Description

基于非对称孪生网络的新闻与案件相似度计算方法
技术领域
本发明涉及基于非对称孪生网络的新闻与案件相似度计算方法,属于自然语 言处理技术领域。
背景技术
法律领域新闻舆情分析是当前自然语言处理研究的热点问题,新闻与案件的 相关性分析是法律领域新闻舆情分析的重要环节,是后续案件新闻舆情分析的基 础、前提和支柱,其准确率直接影响到多个后续新闻舆情分析的准确与否,例如: 情感分类、话题分析、摘要生成等。为了解决后续工作的质量和性能,需要构建 高准确率的新闻与案件的相关性分析方法。借助孪生网络计算文本相关性是一种 有效途径,其对平衡样本具有良好的学习能力,但在新闻与案件的相关性计算中 面临文本不平衡和新闻文本冗余的问题,因此,提出了基于非对称孪生网络的新 闻与案件相关性计算方法。
发明内容
本发明提供了基于非对称孪生网络的新闻与案件相似度计算方法,以用于解 决传统文本相关性分析方法对于不平衡语料的难学习问题,以及解决了新闻文本 冗余的问题,实现了新闻文本和案件描述的相似度计算且准确率高。
本发明的技术方案是:基于非对称孪生网络的新闻与案件相似度计算方法, 所述基于非对称孪生网络的新闻与案件相似度计算方法的具体步骤如下:
Step1、通过分析热门新闻构建新闻与案件的相关性语料库,再利用新闻标 题压缩新闻文档,得到压缩后的新闻文档;这有益于解决新闻文档内容冗余的问 题;
作为本发明的优选方案,所述步骤Step1的具体步骤为:
Step1.1、首先计算文档中每个句子与标题的相关性,计算每个文档中的句子Si与新闻标题St的相关性的公式为:Score(St,Si)=ROUGE(St,Si),然后从中选出相关 性高的几个句子作为新闻文档D′的表示,具体公式为:
Figure BDA0002144453410000011
由 于标题的事实性与主题性,有益于提取出与案件事实更为相关的新闻句子。
Step2、通过案件描述C′构建案件要素,案件要素集合;案件要素的定义有 益于得到更为精炼的案件信息,从而更利于神经网络学习到有用的特征;
Step3、利用Step2中得到的案件要素集合,抽取出Step1中得到的压缩后的 新闻文档中的案件要素;首先通过结巴分词工具对Step1中得到的压缩后的新闻 文本D′进行分词处理;有益于更准确且更全面地提取出新闻中的案件要素词。 对得到的每个词和Step2中得到的每个案件要素进行余弦相似度计算,当余弦相 似度大于阈值x时将该词抽取为该篇新闻中的案件要素,得到新闻文档的要素集 合De′。
Step4、通过非对称孪生网络分别对案件描述和Step1得到的压缩后的新闻文 档进行语义建模编码,分别得到案件描述和新闻文档的语义表征;提出的非对成 孪生网络有益于对于文本不平衡的案件描述和新闻文本进行建模,从而得到语义 更为准确的语义空间向量。
首先通过预训练的词向量矩阵,对新闻文档D′、新闻中案件要素E′和案件 描述C′中的词进行词嵌入,将每个词映射到向量空间中表示;
通过双向LSTM分别对嵌入后的新闻文档、新闻中案件要素和案件描述进 行编码,得到新闻文档、新闻中案件要素和案件描述的浅层语义表征;通过案件 要素指导有益于提取出新闻文本中的案件语义信息。
在每个时间步上,LSTM通过计算上一步的隐层表示ht-1、输入词向量w和 长期记忆ct-1得到隐层表示ht和长期记忆ct,具体公式为: (ht,ct)=LSTM(ct-1,ht-1,w)。通过拼接前向和后向的隐状态,得到双向LSTM 的隐状态,具体公式为:
Figure RE-GDA0002308518820000021
将双向LSTM的每一个时间步上的输出集合作为浅层语义表征;新闻文档D′ 编码为Dh∈{h1,h2...hk}∈RU,其中U表示LSTM隐层维度大小,同理,C′和E′ 也分别编码为双向LSTM的输出集合Ch、Eh
通过注意力机制建立Dh与Eh的联系,对与要素相关性高的词增强语义,相 关性低的词降低语义。首先计算Dh中词hd与Eh中每个词he的相关性评分,具 体公式为Score(hd,he)=hd TWahe,其中Wa为用于计算hd,he相关性评分的注意 力矩阵,再对所有评分进行归一化处理,具体公式为:
Figure BDA0002144453410000031
最终得到要素注意力权重Eweighted,具体公式为:
通过Eweighted将Dh最终转化为经过要素监督的Dweighted,具体公式为: Dweighted=α*Eweight+(1-α)*De′。其中α为用于分配要素部分和文档本身部分 的编码在新的向量表征中所占的权重。Wa,α都是可训练的参数。
通过另一层的双向LSTM对Dweighted和Ch再进行编码,具体公式为: Dout=BiLSTM2(Dweighted),Cout=BiLSTM2(Ch),得到新闻文本和案件描述的深层 语义表示,分别为Dout、Cout。有益于将新闻和案件的语义映射到同一语义空间 下进行计算,从而提升相关性计算的准确率。
Step5、通过对Step4中得到的新闻文档和案件描述的语义表征在向量空间中 进行相似度计算,得到新闻和案件的语义相似度;利用Step5中得到的新闻和案 件的语义相似度,根据语义相似度是否大于阈值p判断出新闻与案件的是否具有 相关性。通过将相关性归一化进行判别,有益于简化对是否相关进行判别时的复 杂度。
首先通过Step4中得到的得到新闻文本和案件描述的深层语义表示Dout、 Cout,通过计算两者的曼哈顿距离表征新闻文本和案件描述的语义差距,具体公 式为:Distance(Dout,Cout)=manhattan(Dout,Cout)。
由于语义差距与相似度呈负相关,将曼哈顿距离通过sigmoid函数映射到 (0,1)区间上,来计算出Dout和Cout的相似度Similarity(Dout,Cout)。具体公式为: Similarity(Dout,Cout)=1-sigmoid(Distance(Dout,Cout))。
最终,若相似度大于阈值p,则判定新闻文档与案件相关,否则判定不相关。
本发明的有益效果是:
本发明通过基于非对称孪生网络对新闻文本和案件描述进行相似度计算,能 对不平衡的新闻文本和案件描述进行语义建模编码,有益于提升相似度计算的准 确率,进而对新闻文本和案件描述实现了有效的相关性分析,利于提升后续案件 新闻舆情的情感分类、话题分析、摘要生成等工作的效果。
附图说明
图1为本发明中的流程图;
图2为本发明中的相似度计算模型图。
具体实施方式
实施例1:如图1-2所示,一种基于非对称孪生网络的新闻与案件相似度计 算方法,所述基于非对称孪生网络的新闻与案件相似度计算方法的具体步骤如下:
Step1、通过分析近年来的热门新闻,本实施例可以选择例如“昆山反杀案” 等若干个热门案件,爬取与案件相关的新闻4513条。通过建立新闻与案件相关 关系,得到新闻-案件对应数据4607对。通过人为校准,选出有效数据3374对, 其中相关的案件-新闻对1630对,不相关数据1744对。从中分离出675对作为 验证集,验证集中相关数据326对,不相关数据349对;
再利用新闻标题对新闻文档进行压缩,得到压缩后的新闻文档:首先计算文 档中每个句子与标题的相关性,计算每个文档中的句子Si与新闻标题St的相关 性的公式为:Score(St,Si)=ROUGE(St,Si),然后从中选出相关性较高的3个句子 作为新闻文档D′的表示,具体公式为:
Figure BDA0002144453410000041
Step2、对每个案件的案件描述C′进行案件要素标注,标注出案件性质、被 告姓名、犯案时间、犯案地点、案件类型、审理法院等案件要素;
Step3、利用Step2中得到的案件要素集合,抽取出Step1中得到的压缩后的 新闻文档中的案件要素:
Step3.1、通过结巴分词工具对Step1中得到的压缩后的新闻文档D′进行分词 处理;
Step3.2、对Step3.1得到的每个词和Step2中得到的每个案件要素进行余弦相 似度计算,当余弦相似度大于阈值0.8时将该词抽取为该篇新闻中的案件要素, 得到新闻文档的要素集合De′。
Step4、通过非对称孪生网络分别对案件描述和Step1得到的压缩后的新闻文 档进行语义编码,分别得到案件描述和新闻文档的语义表征;
Step4.1、首先通过预训练的词向量矩阵,对新闻文档D′、新闻中案件要素E′ 和案件描述C′中的词进行词嵌入,将每个词映射到向量空间中表示;词嵌入的 维度为300维;
Step4.2、通过双向LSTM分别对嵌入后的新闻文档D′、新闻中案件要素E′和 案件描述C′进行编码,得到新闻文档、新闻中案件要素和案件描述的浅层语义 表征;双向LSTM的隐层维度为128维;在每个时间步上,LSTM通过计算上一 步的隐层表示ht-1、输入词向量w和长期记忆ct-1得到隐层表示ht和长期记忆ct, 具体公式为:(ht,ct)=LSTM(ct-1,ht-1,w)。通过拼接前向和后向的隐状态,得到 双向LSTM的隐状态,具体公式为:
Figure BDA0002144453410000052
将双向LSTM的每一个时间步上的输出集合作为浅层语义表征;新闻文档D′ 编码为Dh∈{h1,h2...hk}∈RU,其中U表示LSTM隐层维度大小,同理,C′和E′ 也分别编码为双向LSTM的输出集合Ch、Eh
通过注意力机制建立Dh与Eh的联系,对于要素相关性高的词增强语义,相 关性低的词降低语义。首先计算Dh中词hd与Eh中每个词he的相关性评分,具 体公式为Score(hd,he)=hd TWahe,其中Wa为用于计算hd,he相关性评分的注意 力矩阵,再对所有评分进行归一化处理,具体公式为:
Figure BDA0002144453410000051
最终得到要素注意力权重Eweighted,具体公式为:
Figure BDA0002144453410000053
通过Eweighted将Dh最终转化为经过要素监督的Dweighted,具体公式为: Dweighted=α*Eweight+(1-α)*De′。其中α为用于分配要素部分和文档本身部分 的编码在新的向量表征中所占的权重。Wa,α都是可训练的参数。
通过另一层的双向LSTM对Dweighted和Ch再进行编码,具体公式为: Dout=BiLSTM2(Dweighted),Cout=BiLSTM2(Ch),得到新闻文本和案件描述的深层 语义表示,分别为Dout、Cout,此层双向LSTM维度为32维。
Step5、首先通过Step5中得到的得到新闻文本和案件描述的深层语义表示 Dout、Cout,通过计算两者的曼哈顿距离表征新闻文本和案件描述的语义差距。 将曼哈顿距离通过sigmoid函数映射到(0,1)区间上,来计算出Dout和Cout的相似 度Similarity(Dout,Cout)=1-sigmoid(Distance(Dout,Cout)),其中
Distance(Dout,Cout)=manhattan(Dout,Cout)。
最终,若相似度大于阈值0.5,则判定新闻文档与案件相关,否则判定不相关。
为了验证本发明的效果,分别使用传统的孪生网络和非对称孪生网络模型对 新闻和案件的相关性分析进行实验对比,以及是否融入基于标题的新闻文本压缩 方法的对新闻和案件的相关性分析进行对比,其准确率(p)、召回率(r)、F1-score 效果对比如表1、表2所示:
表1为是否使用非对称孪生网络模型对新闻和案件的相关性分析的效果对比;
表1不同方法的有效性验证结果
Figure BDA0002144453410000061
从表1可以看出,使用非对称孪生网络模型进行案件和新闻的相关性分析时 的准确率为90.02%,比使用传统孪生网络模型方法高出5.07%。由此可见,非 对称孪生网络能更好的学习到新闻文本和案件描述中不平衡的案件相关特征,有 利于相关性判别准确率的提升。
表2为是否融入基于标题的新闻文本压缩方法的对新闻和案件的相关性分析 的效果对比;
表2为是否压缩对相似度计算影响实验结果
Figure BDA0002144453410000062
从表2可以看出,融入基于标题的新闻文本压缩方法进行案件和新闻的相关 性分析时的准确率为90.02%,比不进行文本压缩的方法高出4.51%。由此可见, 融入基于标题的新闻文本压缩方法可以去除掉新闻中的案件无关冗余信息,因此 神经网络学习到对判定新闻与案件相关性更为有用的特征,有利于相关性判别准 确率的提升。
上面结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于 上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本 发明宗旨的前提下作出各种变化。

Claims (5)

1.基于非对称孪生网络的新闻与案件相似度计算方法,其特征在于:
所述基于非对称孪生网络的新闻与案件相似度计算方法的具体步骤如下:
Step1、利用新闻标题压缩新闻文档,得到压缩后的新闻文档;
Step2、通过案件描述构建案件要素,案件要素集合;
Step3、利用Step2中得到的案件要素集合,抽取出Step1中得到的压缩后的新闻文档中的案件要素;
Step4、通过非对称孪生网络分别对案件描述和Step1得到的压缩后的新闻文档进行语义编码,分别得到案件描述和新闻文档的语义表征;
Step5、通过对Step4中得到的新闻文档和案件描述的语义表征在向量空间中进行相似度计算,得到新闻和案件的语义相似度;
Step6、利用Step5中得到的新闻和案件的语义相似度,根据语义相似度是否大于阈值0.5判断出新闻与案件的是否具有相关性。
2.根据权利要求1所述的基于非对称孪生网络的新闻与案件相似度计算方法,其特征在于:所述步骤Step1的具体步骤为:
Step1.1、首先计算文档中每个句子与标题的相关性,计算每个文档中的句子Si与新闻标题St的相关性的公式为:Score(St,Si)=ROUGE(St,Si),然后从中选出相关性高的几个句子作为新闻文档D′的表示,具体公式为:
Figure FDA0002144453400000011
3.根据权利要求1所述的基于非对称孪生网络的新闻与案件相似度计算方法,其特征在于:所述步骤Step3的具体步骤:
Step3.1、通过结巴分词工具对Step1中得到的压缩后的新闻文档进行分词处理;
Step3.2、对Step3.1得到的每个词和Step2中得到的每个案件要素进行余弦相似度计算,当余弦相似度大于阈值0.8时将该词抽取为该篇新闻中的案件要素,得到新闻文档的要素集合。
4.根据权利要求1所述的基于非对称孪生网络的新闻与案件相似度计算方法,其特征在于:所述步骤Step4的具体步骤为:
Step4.1、首先通过预训练的词向量矩阵,对新闻文档D′、新闻中案件要素E′和案件描述C′中的词进行词嵌入,将每个词映射到向量空间中表示;
Step4.2、通过双向LSTM分别对嵌入后的新闻文档、新闻中案件要素和案件描述进行编码,得到新闻文档、新闻中案件要素和案件描述的浅层语义表征;
Step4.3、将Step4.2中得到的新闻中案件要素语义表征作为监督信息,通过注意力机制建立案件要素和Step4.2中得到的新闻语义表征之间的联系,得到新闻的案件语义表征;
Step4.4、通过双向LSTM分别对Step4.3中得到的新闻的案件语义表征和Step4.2中得到的案件描述的浅层语义表征进行再次编码,得到新闻文档和案件描述的深层语义表征。
5.根据权利要求1所述的基于非对称孪生网络的新闻与案件相似度计算方法,其特征在于:所述步骤Step5的具体步骤为:
Step5.1通过对新闻文档和案件描述的深层语义表征计算曼哈顿距离,通过计算两者的曼哈顿距离表征新闻文本和案件描述的语义差距,从而得到新闻和案件的语义差异性;
Step5.2通过对Step5.1中的语义差异性进行非线性变换,利用sigmoid函数使其映射到(0,1)空间上,得到新闻和案件的语义相似度。
CN201910680008.XA 2019-07-26 2019-07-26 基于非对称孪生网络的新闻与案件相似度计算方法 Active CN110717332B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910680008.XA CN110717332B (zh) 2019-07-26 2019-07-26 基于非对称孪生网络的新闻与案件相似度计算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910680008.XA CN110717332B (zh) 2019-07-26 2019-07-26 基于非对称孪生网络的新闻与案件相似度计算方法

Publications (2)

Publication Number Publication Date
CN110717332A true CN110717332A (zh) 2020-01-21
CN110717332B CN110717332B (zh) 2020-09-08

Family

ID=69210129

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910680008.XA Active CN110717332B (zh) 2019-07-26 2019-07-26 基于非对称孪生网络的新闻与案件相似度计算方法

Country Status (1)

Country Link
CN (1) CN110717332B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111382333A (zh) * 2020-03-11 2020-07-07 昆明理工大学 基于案件相关性联合学习与图卷积的新闻文本句中案件要素抽取方法
CN111414455A (zh) * 2020-03-20 2020-07-14 北京百度网讯科技有限公司 舆情分析方法、装置、电子设备及可读存储介质
CN111709231A (zh) * 2020-04-30 2020-09-25 昆明理工大学 一种基于自注意变分自编码的类案推荐方法
CN111831820A (zh) * 2020-03-11 2020-10-27 昆明理工大学 基于案件要素指导及深度聚类的新闻与案件相关性分析方法
CN113255369A (zh) * 2021-06-10 2021-08-13 平安国际智慧城市科技股份有限公司 文本相似度分析的方法、装置及存储介质
CN113378090A (zh) * 2021-04-23 2021-09-10 国家计算机网络与信息安全管理中心 一种互联网网站相似度分析方法、装置以及可读存储介质
CN113779976A (zh) * 2021-09-27 2021-12-10 成都数之联科技有限公司 裁判规则提取方法及系统及装置及介质
CN113901990A (zh) * 2021-09-15 2022-01-07 昆明理工大学 多视角集成学习的案件与新闻相关性分析方法
CN114693396A (zh) * 2022-02-28 2022-07-01 广州华多网络科技有限公司 地址信息匹配方法及其装置、设备、介质、产品
CN114881028A (zh) * 2022-06-08 2022-08-09 深圳市赛为智能股份有限公司 案件相似度匹配方法、装置、计算机设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105760546A (zh) * 2016-03-16 2016-07-13 广州索答信息科技有限公司 互联网新闻摘要的自动生成方法和装置
CN106933800A (zh) * 2016-11-29 2017-07-07 首都师范大学 一种金融领域的事件句抽取方法
CN109543009A (zh) * 2018-10-17 2019-03-29 龙马智芯(珠海横琴)科技有限公司 文本相似度评估系统及文本相似度评估方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105760546A (zh) * 2016-03-16 2016-07-13 广州索答信息科技有限公司 互联网新闻摘要的自动生成方法和装置
CN106933800A (zh) * 2016-11-29 2017-07-07 首都师范大学 一种金融领域的事件句抽取方法
CN109543009A (zh) * 2018-10-17 2019-03-29 龙马智芯(珠海横琴)科技有限公司 文本相似度评估系统及文本相似度评估方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JACK VALMADRE ET A: "End-to-end representation learning for Correlation Filter based tracking", 《ARXIV》 *
李兰君 等: "基于改进孪生网络结构的相似法律案例检索研究", 《北京大学学报(自然科学版)》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111382333B (zh) * 2020-03-11 2022-06-21 昆明理工大学 基于案件相关性联合学习与图卷积的新闻文本句中案件要素抽取方法
CN111831820A (zh) * 2020-03-11 2020-10-27 昆明理工大学 基于案件要素指导及深度聚类的新闻与案件相关性分析方法
CN111382333A (zh) * 2020-03-11 2020-07-07 昆明理工大学 基于案件相关性联合学习与图卷积的新闻文本句中案件要素抽取方法
CN111831820B (zh) * 2020-03-11 2022-07-19 昆明理工大学 基于案件要素指导及深度聚类的新闻与案件相关性分析方法
CN111414455A (zh) * 2020-03-20 2020-07-14 北京百度网讯科技有限公司 舆情分析方法、装置、电子设备及可读存储介质
CN111414455B (zh) * 2020-03-20 2024-03-01 北京百度网讯科技有限公司 舆情分析方法、装置、电子设备及可读存储介质
CN111709231A (zh) * 2020-04-30 2020-09-25 昆明理工大学 一种基于自注意变分自编码的类案推荐方法
CN111709231B (zh) * 2020-04-30 2022-11-18 昆明理工大学 一种基于自注意变分自编码的类案推荐方法
CN113378090B (zh) * 2021-04-23 2022-09-06 国家计算机网络与信息安全管理中心 一种互联网网站相似度分析方法、装置以及可读存储介质
CN113378090A (zh) * 2021-04-23 2021-09-10 国家计算机网络与信息安全管理中心 一种互联网网站相似度分析方法、装置以及可读存储介质
CN113255369B (zh) * 2021-06-10 2023-02-03 平安国际智慧城市科技股份有限公司 文本相似度分析的方法、装置及存储介质
CN113255369A (zh) * 2021-06-10 2021-08-13 平安国际智慧城市科技股份有限公司 文本相似度分析的方法、装置及存储介质
CN113901990A (zh) * 2021-09-15 2022-01-07 昆明理工大学 多视角集成学习的案件与新闻相关性分析方法
CN113779976A (zh) * 2021-09-27 2021-12-10 成都数之联科技有限公司 裁判规则提取方法及系统及装置及介质
CN113779976B (zh) * 2021-09-27 2023-07-07 成都数之联科技股份有限公司 裁判规则提取方法及系统及装置及介质
CN114693396A (zh) * 2022-02-28 2022-07-01 广州华多网络科技有限公司 地址信息匹配方法及其装置、设备、介质、产品
CN114881028A (zh) * 2022-06-08 2022-08-09 深圳市赛为智能股份有限公司 案件相似度匹配方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN110717332B (zh) 2020-09-08

Similar Documents

Publication Publication Date Title
CN110717332B (zh) 基于非对称孪生网络的新闻与案件相似度计算方法
CN110717047B (zh) 一种基于图卷积神经网络的Web服务分类方法
CN110298037B (zh) 基于增强注意力机制的卷积神经网络匹配的文本识别方法
WO2023065544A1 (zh) 意图分类方法、装置、电子设备及计算机可读存储介质
WO2021114745A1 (zh) 一种基于词缀感知的社交媒体命名实体识别方法
CN110750635B (zh) 一种基于联合深度学习模型的法条推荐方法
CN108984526A (zh) 一种基于深度学习的文档主题向量抽取方法
CN111061843A (zh) 一种知识图谱引导的假新闻检测方法
CN111221939A (zh) 评分方法、装置和电子设备
CN110046250A (zh) 三嵌入卷积神经网络模型及其文本多分类方法
CN109271524B (zh) 知识库问答系统中的实体链接方法
CN112287687B (zh) 基于案件属性感知的案件倾向性抽取式摘要方法
CN111581967B (zh) 一种联合LW2V与Triplet网络的新闻主题事件检测方法
CN112287695A (zh) 基于跨语言双语预训练及Bi-LSTM的汉-越平行句对抽取方法
CN111143507B (zh) 一种基于复合式问题的阅读理解方法
CN114818717B (zh) 融合词汇和句法信息的中文命名实体识别方法及系统
CN113988074B (zh) 一种动态融合词典信息的中文命名实体识别方法和装置
CN107180026A (zh) 一种基于词嵌入语义映射的事件短语学习方法及装置
CN113627151B (zh) 跨模态数据的匹配方法、装置、设备及介质
CN112561718A (zh) 基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法
CN109284381B (zh) 融合表情符号库和主题模型的方面观点褒贬态度挖掘方法
CN111061873B (zh) 一种基于Attention机制的多通道的文本分类方法
CN111159405B (zh) 基于背景知识的讽刺检测方法
CN113111663A (zh) 一种融合关键信息的摘要生成方法
CN111581943A (zh) 一种基于句子关联图的汉越双语多文档新闻观点句识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant