CN114691895A - 一种基于指针网络的刑事案情实体关系联合抽取方法 - Google Patents
一种基于指针网络的刑事案情实体关系联合抽取方法 Download PDFInfo
- Publication number
- CN114691895A CN114691895A CN202210603102.7A CN202210603102A CN114691895A CN 114691895 A CN114691895 A CN 114691895A CN 202210603102 A CN202210603102 A CN 202210603102A CN 114691895 A CN114691895 A CN 114691895A
- Authority
- CN
- China
- Prior art keywords
- entity
- head
- representing
- case
- relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 45
- 238000000034 method Methods 0.000 claims abstract description 18
- 239000002356 single layer Substances 0.000 claims abstract description 9
- 230000008569 process Effects 0.000 claims abstract description 8
- 238000004364 calculation method Methods 0.000 claims description 15
- 239000013598 vector Substances 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 13
- 238000002372 labelling Methods 0.000 claims description 9
- 239000010410 layer Substances 0.000 claims description 7
- 239000000126 substance Substances 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 2
- 101100497221 Bacillus thuringiensis subsp. alesti cry1Ae gene Proteins 0.000 claims 1
- 230000006870 function Effects 0.000 description 8
- 238000013473 artificial intelligence Methods 0.000 description 7
- 230000006872 improvement Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Tourism & Hospitality (AREA)
- Biophysics (AREA)
- Technology Law (AREA)
- Databases & Information Systems (AREA)
- Animal Behavior & Ethology (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于指针网络的刑事案情实体关系联合抽取方法,用于解决刑事案件审判过程中对案件涉及到的复杂人物关系地梳理。本发明将刑事案情实体关系抽取看作三元组抽取问题,即先抽取头实体,在通过头实体相关信息抽取尾实体和关系,具体先对法律文书中对案情描述部分的目标文本进行编码,再通过单层指针网络解码方式抽取头实体和头实体类型;接着融入上下文编码信息、头实体特征编码和位置编码信息,最后通过多层指针网络解码方式抽取尾实体和关系类型。本方法能有效地解决案情描述中实体重叠、关系重叠问题,可以用于起诉意见书、起诉书、刑事判决书、询问笔录等不同类型文书中涉及到的案情描述文本,能够帮助办案人员对案件进行梳理。
Description
技术领域
本发明属于自然语言处理领域,涉及到一种基于指针网络的刑事案情实体关系联合抽取方法。
背景技术
现代信息技术正在推动司法领域的深刻变革,以人工智能司法应用、司法大数据为核心的“智慧法院建设”被置于同司法体制改革并行的地位。人工智能在案例智能推送、裁判结果预测、裁判文书自动生成等方面的应用,已成为地方法院探索人工智能司法 应用最活跃的领域。国务院发布的《新一代人工智能发展规划》将“智慧法院建设”纳入其中,这标志着人工智能司法应用已上升为国家战略。着眼当前,基层执法办案依然面临“案多人少”、执法能力与社会需求、执法公正与执法效率等一系列矛盾。若把大数据、人工智能与司法体制改革结合起来,将会给司法工作注入前所未有的创造力。
信息抽取作为一种人工智能相关技术,能够将非结构化文本转成人们所需要的结构化文本信息,在智慧司法领域应用广泛。而实体关系抽取作为信息抽取一项关键任务,也是自然语言处理研究的热门之一。目前,实体关系抽取分为pipeline方式和联合抽取方式两种。pipeline方式即先进行实体识别,再进行关系分类,两个过程是分开、没有交互的。联合抽取方式则通过实现实体识别和关系分类这两个过程的参数共享,使这两个过程的信息能够交互,从而提高抽取性能。
在司法领域应用实体关系抽取,其中一个重要方向是梳理案件情节信息,主要从询问笔录、起诉书、起诉意见书、刑事判决书等不同类型文书抽取出相关实体以及实体间的关系信息,帮助检察办案人员快速了解案件脉络。针对司法领域案件数据特征,特别涉及人数众多的复杂案件,其中的案件人物关系错综复杂,存在相同实体存在多种关系、不同实体存在相同关系的情况,即“一对多”的关系重叠问题、“多对一”的实体重叠问题。
因此,需要一种基于指针网络的刑事案情实体关系联合抽取方法,有效依据司法领域案件数据特点解决实体关系抽取问题。
发明内容
本发明主要解决的技术问题在于在刑事案件审判过程中,存在案情复杂、案件涉及人物众多时,人物关系难以梳理等问题,同时针对司法领域“案多人少”问题,本发明提供一种基于指针网络的刑事案情实体关系联合抽取方法。
为达到上述目的,本发明的技术方案如下:将刑事案情实体关系抽取看作三元组抽取问题,即先抽取头实体,在通过头实体相关信息抽取尾实体和关系,具体先对法律文书中对案情描述部分的目标文本进行编码,再通过单层指针网络解码方式抽取头实体;接着融入上下文编码信息和头实体位置编码信息,最后通过多层指针网络解码方式抽取尾实体和关系。
本发明的一种基于指针网络的刑事案情描述实体关系联合抽取方法,包括如下步骤:
1)获取刑事案件裁判文书原始语料,提取案情描述文本并进行标注;
2)采用预训练模型对案情描述文本进行特征编码;
3)利用单层指针网络解码方式抽取头实体;
4)利用多层指针网络解码方式抽取尾实体和关系。
作为本发明的一种改进,所述步骤1)中,首先从原始刑事案件裁判文书中提取案情描述相关文本信息;接着设置实体关系标注规则,依据规则对案情描述文本进行数据标注,具体步骤是先标记出头实体和头实体标签,接着根据每一个头实体分别标记出对应的尾实体和对应关系。最后将标注好的数据划分训练集和测试集,用于后续模型训练。
作为本发明的一种改进,所述步骤2)中,采用BERT预训练模型对待抽取的文本数据进行特征编码,编码结果对头实体抽取、尾实体和关系抽取两个任务共享。其中采用共享编码参数的联合抽取方式能够缓解非联合抽取方式带来的误差传播的问题。
作为本发明的一种改进,所述步骤3)中,用单层指针网络解码方式抽取头实体,抽取结果以(entity1,tag1)实体对的形式输出,其中entity1表示头实体名称,tag1表示头实体类型,具体步骤如下:
3.1预测头实体开始位置,
头实体开始位置和位置标签计算如公式如下:
3.2预测头实体结束位置,
头实体结束位置和位置标签计算如公式如下:
3.3获取头实体和头实体类型,
通过公式(1)和(2)获取头实体的开始、结束位置以及对应头实体类型,遍历所有的,当时,对应位置间的文本内容及为头实体,最终结果输出为,其中表示头实体,表示头实体标签。采用单层指针网络解码方式获取头实体,可以有效解决头实体重叠问题,即存在多个头实体且头实体之间存在部分重合。
具体步骤如下:
4.1获取头实体位置编码信息,
本发明采用三角函数式位置编码方式,计算公式如下:
PE是二维矩阵,其中行表示词,列表示词向量;分别表示在每个词的词向量的偶数位置添加sin变量,奇数位置添加cos变量,以此完成位置编码的计算,其中表示头实体在文本中的位置;表示词向量的第维;表示词向量维度;
4.2获取尾实体和关系类型,
依据步骤3)中获取的头实体,从步骤2)中得到的案情描述文本特征编码中抽取头实体的特征编码,再融入上下文特征编码,即案情描述文本特征编码、头实体位置编码,最终得,具体表示为,将代入公式(1)获取实体开始位置概率和对应标签信息,此步骤中实体具体表示尾实体、标签信息具体表示对应关系类型;再根据公式(2)获取实体结束位置概率和对应标签信息,此步骤中实体具体表示尾实体、标签信息具体表示对应关系类型,遍历所有的,当时,对应位置间的文本内容及为预测的尾实体,最终输出形式为,其中表示尾实体, 表示关系类型;
在针对头实体抽取对应尾实体和关系时,采用了上下文编码、头实体特征编码和头实体位置编码多种方式加强了对当前头实体的感知能力,能够有效地提高尾实体和关系抽取地准确性。采用多层指针网络解码方式获取尾实体和关系类型,即每一层是一个关系对应的尾实体,能够解决使用单层指针网络解码方式无法抽取多种关系的问题,即一对多(单一的头尾实体对对应多种关系)问题;
4.3损失函数计算,
通过指针网络的解码方式获取到头实体、尾实体和关系类型,在模型训练过程中,损失函数定义为头实体和头实体类型抽取、尾实体和关系类型抽取两个任务的加权求和,计算公式如下:
对不同任务损失函数赋值可动态调节的权重,进行加权求和的方式有效解决刑事案件中存在的关系类别不均衡问题。
相对于现有技术,本发明的优点如下:
1. 传统实体关系抽取是采用pipeline的方式,即先抽取实体,再抽取关系,pipeline的方式忽略了这两个任务的内在关联关系,同时存在没有关系的候选实体对所带来的冗余信息问题,增加计算复杂度且提升错误率。而本发明提出的实体关系联合抽取方法,对两个任务进行统一建模,共享参数,利用两个任务间的潜在关联信息,有效缓解误差传播;2.传统的实体关系抽取先识别实体,再对识别出来的实体进行关系分类,且一般采用BILOU的序列标注框架,此方法每个token只能属于一种类型,不能有效的处理实体重叠、多对一(多个头尾实体对应一种关系)或一对多(单一的头尾实体对对应多种关系)等问题。而本发明提出的基于指针网络的解码方式,将实体抽取转化为两个n元softmax分类预测实体的首尾指针位置,解决了实体重叠问题;同时本发明提出的将实体关系联合抽取看成SPO问题,先抽取头实体S再抽取尾实体O和关系P,能够解决一对多和多对一的问题;3.传统实体关系联合抽取模型中损失函数为两个任务的损失和,如此会导致多任务学习会被某个任务所主导或学偏,本发明提出将模型中的损失定义为动态可调节的,可以有效解决因数据中关系类别不均衡所导致的学习效果差的问题。
附图说明
图1是基于指针网络的刑事案情实体关系联合抽取方法流程图;
图2是实体关系标注规则示意图;
图3是实体关系联合抽取模型结构图。
具体实施方式
为了加深对本发明的认识和理解,下面结合附图详细的介绍本方案。
实施例1:一种基于指针网络的刑事案情实体关系联合抽取方法,方法流程图如图1所示,具体包括如下步骤:
1.获取刑事案件裁判文书原始语料,提取案情描述文本并进行标注,数据预处理是模型训练的第一步,获取刑事案件裁判文书原始语料并提取案情描述文本后,设置实体关系标注规则,并按此规则对数据中实体关系进行标注,标注规则示意图如图2所示。实体关系标注分为两步,第一步先标记出头实体位置和头实体标签,第二步标记尾实体位置和对应关系。
第一步中,生成大小的空矩阵,其中为待抽取文本长度,第一维中在实体的开始位置处标记头实体标签信息T,其余位置标记O,即在“刘某民”中“刘”的位置标记T,T表示“被告人”实体类型;第二维中在实体的结束位置处标记头实体标签信息T,其余位置标记O,即在“刘某民”中“民”的位置标记T。同理第二步中,针对关系类型R1,R1表示盗窃对象,在“吴某明”中“吴”的位置标记R1,在“吴某明”中“明”的位置标记R1;针对关系类型R2,R2表示盗窃财物,在“电动车”中“电”的位置标记R2,在“电动车”中“车”的位置标记R2。
2.采用预训练模型对案情描述文本进行特征编码;
3.利用单层指针网络解码方式抽取头实体,
3.1 预测头实体开始位置,如公式(1)所示:
3.2预测头实体结束位置,如公式(2)所示:
3.3获取头实体和头实体类型,
通过公式(1)和(2)获取头实体的开始、结束位置以及对应头实体类型,遍历所有的,当时,对应位置间的文本内容及为头实体,最终抽取结果以实体对的形式输出,其中表示头实体,表示头实体标签,如图3所示,具体输出(刘某民,被告人),其中“刘某民”是头实体,“被告人”是头实体类型;
4.利用多层指针网络解码方式抽取尾实体和关系,
4.1获取头实体位置编码信息,
本发明采用三角函数式位置编码方式,计算公式如下:
PE是二维矩阵,其中行表示词,列表示词向量;分别表示在每个词的词向量的偶数位置添加sin变量,奇数位置添加cos变量,以此完成位置编码的计算,其中表示头实体在文本中的位置;表示词向量的第维;表示词向量维度;
4.2获取尾实体和关系类型,
依据步骤3)中获取的头实体,从步骤2)中得到的案情描述文本特征编码中抽取头实体的特征编码,再融入上下文特征编码,即案情描述文本特征编码、头实体位置编码,最终得,具体表示为,将代入公式(1)获取实体开始位置概率和对应标签信息,此步骤中实体具体表示尾实体、标签信息具体表示对应关系类型;再根据公式(2)获取实体结束位置概率和对应标签信息,此步骤中实体具体表示尾实体、标签信息具体表示对应关系类型,遍历所有的,当时,对应位置间的文本内容及为预测的尾实体,最终输出形式为,其中表示尾实体, 表示关系类型,如图3所示,具体输出(吴某明,盗窃对象),其中“吴某明”是尾实体,“盗窃对象”是关系类型。
在模型测试阶段,整合步骤3.3和步骤4.2的输出结果,即可以获取刑事案情实体关系联合抽取结果(刘某民,盗窃对象,吴某明);
4.3损失函数计算,
通过指针网络的解码方式获取到头实体、尾实体和关系类型,在模型训练过程中,损失函数定义为头实体和头实体类型抽取、尾实体和关系类型抽取两个任务的加权求和,计算公式如下:
需要说明的是上述实施例仅仅是本发明的较佳实施例,并没有用来限定本发明的保护范围,在上述技术方案的基础上做出的等同替换或者替代,均属于本发明的保护范围。
Claims (5)
1.一种基于指针网络的刑事案情实体关系联合抽取方法,该方法包括如下步骤:
1)获取刑事案件裁判文书原始语料,提取案情描述文本并进行标注;
2)采用预训练模型对案情描述文本进行特征编码;
3)利用单层指针网络解码方式抽取头实体;
4)利用多层指针网络解码方式抽取尾实体和关系。
2.根据权利要求1所述的基于指针网络的刑事案情实体关系联合抽取方法,其特征在于,所述步骤1)中,从原始刑事案件裁判文书中提取案情描述相关文本信息,设置实体关系标注规则,依据规则对案情描述文本进行数据标注,首先先标记出头实体和头实体类型,接着根据每一个头实体分别标记出对应的尾实体和对应关系类型。
4.根据权利要求1所述的基于指针网络的刑事案情实体关系联合抽取方法,其特征在于,所述步骤3)中,利用单层指针网络解码方式抽取头实体,即预测头实体的开始和结束位置以及头实体的标签,具体步骤如下:
3.1 预测头实体开始位置,如公式(1)所示:
3.2预测头实体结束位置,如公式(2)所示:
3.3获取头实体和头实体类型,
5.根据权利要求1所述的基于指针网络的刑事案情实体关系联合抽取方法,其特征在于,所述步骤4)中,利用多层指针网络解码方式预测尾实体和关系,其中每一层包含尾实体的开始和结束位置以及对应的关系类型,具体步骤如下:
4.1获取头实体位置编码信息,
PE是二维矩阵,其中行表示词,列表示词向量;分别表示在每个词的词向量的偶数位置添加sin变量,奇数位置添加cos变量,以此完成位置编码的计算,其中表示头实体在文本中的位置;表示词向量的第维;表示词向量维度;
4.2获取尾实体和关系类型,
依据步骤3)中获取的头实体,从步骤2)中得到的案情描述文本特征编码中抽取头实体的特征编码,再融入上下文特征编码,即案情描述文本特征编码、头实体位置编码,最终得,具体表示为,将代入公式(1)获取实体开始位置概率和对应标签信息,此步骤中实体具体表示尾实体、标签信息具体表示对应关系类型;再根据公式(2)获取实体结束位置概率和对应标签信息,此步骤中实体具体表示尾实体、标签信息具体表示对应关系类型,遍历所有的,当时,对应位置间的文本内容及为预测的尾实体,最终输出形式为,其中表示尾实体, 表示关系类型;
4.3损失函数计算 ,
在模型训练过程中,损失函数为头实体和头实体类型抽取、尾实体和关系类型抽取两个任务加权和,具体计算方法为先对上述两个任务赋值可以动态调节的权重,再进行求和,计算公式如下:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210603102.7A CN114691895B (zh) | 2022-05-31 | 2022-05-31 | 一种基于指针网络的刑事案情实体关系联合抽取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210603102.7A CN114691895B (zh) | 2022-05-31 | 2022-05-31 | 一种基于指针网络的刑事案情实体关系联合抽取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114691895A true CN114691895A (zh) | 2022-07-01 |
CN114691895B CN114691895B (zh) | 2022-08-26 |
Family
ID=82131135
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210603102.7A Active CN114691895B (zh) | 2022-05-31 | 2022-05-31 | 一种基于指针网络的刑事案情实体关系联合抽取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114691895B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117408247A (zh) * | 2023-12-15 | 2024-01-16 | 南京邮电大学 | 一种基于关系指针网络的智能制造三元组抽取方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113495929A (zh) * | 2021-05-18 | 2021-10-12 | 浙江工业大学 | 一种基于自注意力的三元组抽取方法 |
CN113553850A (zh) * | 2021-03-30 | 2021-10-26 | 电子科技大学 | 一种基于有序结构编码指针网络解码的实体关系抽取方法 |
CN114064938A (zh) * | 2022-01-17 | 2022-02-18 | 中国人民解放军总医院 | 医学文献的关系抽取方法、装置、电子设备及存储介质 |
CN114417839A (zh) * | 2022-01-19 | 2022-04-29 | 北京工业大学 | 基于全局指针网络的实体关系联合抽取方法 |
-
2022
- 2022-05-31 CN CN202210603102.7A patent/CN114691895B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113553850A (zh) * | 2021-03-30 | 2021-10-26 | 电子科技大学 | 一种基于有序结构编码指针网络解码的实体关系抽取方法 |
CN113495929A (zh) * | 2021-05-18 | 2021-10-12 | 浙江工业大学 | 一种基于自注意力的三元组抽取方法 |
CN114064938A (zh) * | 2022-01-17 | 2022-02-18 | 中国人民解放军总医院 | 医学文献的关系抽取方法、装置、电子设备及存储介质 |
CN114417839A (zh) * | 2022-01-19 | 2022-04-29 | 北京工业大学 | 基于全局指针网络的实体关系联合抽取方法 |
Non-Patent Citations (1)
Title |
---|
钟灵玥: ""基于深度学习的实体关系抽取研究与应用"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117408247A (zh) * | 2023-12-15 | 2024-01-16 | 南京邮电大学 | 一种基于关系指针网络的智能制造三元组抽取方法 |
CN117408247B (zh) * | 2023-12-15 | 2024-03-29 | 南京邮电大学 | 一种基于关系指针网络的智能制造三元组抽取方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114691895B (zh) | 2022-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022178919A1 (zh) | 一种基于噪声标签学习的纳税人行业分类方法 | |
CN113468888A (zh) | 基于神经网络的实体关系联合抽取方法与装置 | |
CN110134946B (zh) | 一种针对复杂数据的机器阅读理解方法 | |
CN116151256A (zh) | 一种基于多任务和提示学习的小样本命名实体识别方法 | |
CN113743119B (zh) | 中文命名实体识别模块、方法、装置及电子设备 | |
CN114490953B (zh) | 训练事件抽取模型的方法、事件抽取的方法、装置及介质 | |
CN113869053A (zh) | 一种面向司法文本命名实体识别的方法及系统 | |
CN114417839A (zh) | 基于全局指针网络的实体关系联合抽取方法 | |
CN115438674B (zh) | 实体数据处理、实体链接方法、装置和计算机设备 | |
CN112328859B (zh) | 一种基于知识感知注意力网络的虚假新闻检测方法 | |
CN115292568B (zh) | 一种基于联合模型的民生新闻事件抽取方法 | |
CN115759092A (zh) | 一种基于albert的网络威胁情报命名实体识别方法 | |
CN114691895B (zh) | 一种基于指针网络的刑事案情实体关系联合抽取方法 | |
Hakimov et al. | Evaluating architectural choices for deep learning approaches for question answering over knowledge bases | |
CN116522165B (zh) | 一种基于孪生结构的舆情文本匹配系统及方法 | |
Wu et al. | One improved model of named entity recognition by combining BERT and BiLSTM-CNN for domain of Chinese railway construction | |
CN116663539A (zh) | 基于RoBERTa和指针网络的中文实体与关系联合抽取方法及系统 | |
CN116975161A (zh) | 电力设备局放文本的实体关系联合抽取方法、设备、介质 | |
CN115934883A (zh) | 一种基于语义增强的多特征融合的实体关系联合抽取方法 | |
CN114298052B (zh) | 一种基于概率图的实体联合标注关系抽取方法和系统 | |
CN116976341A (zh) | 实体识别方法、装置、电子设备、存储介质及程序产品 | |
CN114297408A (zh) | 一种基于级联二进制标注框架的关系三元组抽取方法 | |
CN115422945A (zh) | 一种融合情感挖掘的谣言检测方法及系统 | |
CN115169285A (zh) | 一种基于图解析的事件抽取方法及系统 | |
CN115905458A (zh) | 一种基于机器阅读理解模型的事件抽取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |