CN115795051A - 一种基于实体关系获取链接实体的数据处理系统 - Google Patents

一种基于实体关系获取链接实体的数据处理系统 Download PDF

Info

Publication number
CN115795051A
CN115795051A CN202211543319.XA CN202211543319A CN115795051A CN 115795051 A CN115795051 A CN 115795051A CN 202211543319 A CN202211543319 A CN 202211543319A CN 115795051 A CN115795051 A CN 115795051A
Authority
CN
China
Prior art keywords
entity
priority
key
preset
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211543319.XA
Other languages
English (en)
Other versions
CN115795051B (zh
Inventor
傅晓航
刘羽
常鸿宇
张正义
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongke Yuchen Technology Co Ltd
Original Assignee
Zhongke Yuchen Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongke Yuchen Technology Co Ltd filed Critical Zhongke Yuchen Technology Co Ltd
Priority to CN202211543319.XA priority Critical patent/CN115795051B/zh
Publication of CN115795051A publication Critical patent/CN115795051A/zh
Application granted granted Critical
Publication of CN115795051B publication Critical patent/CN115795051B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于实体关系获取链接实体的数据处理系统,所述系统包括:初始实体列表、预设实体关系优先级集、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:当初始实体的数量大于等于预设的实体数量阈值时,获取关键实体集和关键实体优先级集,从初始实体列表中删除最大关键优先级的关键实体对应的初始实体,根据预设实体关系优先级集,获取第一中间实体集对应的第一关键优先级集,从而获取第一目标链接实体列表,根据第一目标链接实体列表获取第二目标链接实体列表;本发明能够在获取链接实体的过程中,未对每个实体优先级进行多次处理,增加了获取链接实体的效率,从而提高了获取链接实体的准确度。

Description

一种基于实体关系获取链接实体的数据处理系统
技术领域
本发明涉及实体链接技术领域,特别是涉及一种基于实体关系获取链接实体的数据处理系统。
背景技术
随着互联网的普及和发展,大量信息数据被存储于互联网平台中,例如百度百科、维基百科等数据库中存有大量的文本信息,如何对数据库中的文本信息进行处理获取有价值的信息,成为目前热门研究方向,近来,实体链接技术不断更新,将文本中已识别出的实体正确指向数据库中目标实体对理解文本的真实含义具有重大意义,能够解决文本中存在的实体多样性和歧义的问题。
目前,现有技术中获取链接实体的方法为:对文本中的实体进行链接,通过计算从文本中抽取的实体指称与知识库中获得的候选实体之间的上下文的优先级,对每个优先级进行处理,选择进行处理后的最大优先级对应的候选实体作为链接实体。
综上所述获取链接实体的方法存在的问题:在获取链接实体的过程中,未考虑实体关系和实体关系与实体关系之间的关联程度,同时对每个实体优先级进行多次处理,降低了获取链接实体的效率,降低了获取链接实体的准确度。
发明内容
针对上述技术问题,本发明采用的技术方案为:一种基于实体关系获取链接实体的数据处理系统,系统包括:初始实体列表A={A1,A2,……,Ai,……,Am}、预设实体关系优先级集、处理器和存储有计算机程序的存储器,其中,Ai为第i个初始实体,i=1……m,m为初始实体的数量,当计算机程序被处理器执行时,实现以下步骤:
S300,将m与预设的实体数量阈值m0进行比对。
S310,当m≥m0时,获取A对应的关键实体集A'={A'1,A'2,……,A'i,……,A'm}和A'对应的关键实体优先级集FA'={FA'1,FA'2,……,FA'i,……,FA'm},其中,A'i={A'i1,A'i2,……,A'ij,……,A'in},A'ij为Ai对应的关键实体列表中第j个关键实体,FA'i={FA'i1,FA'i2,……,FA'ij,……,FA'in},FA'ij为A'ij对应的关键实体优先级,j=1……n,n为关键实体列表中关键实体的数量,其中,FA'i1>FA'i2>……>FA'ij>……>FA'in
S320,当FA'i1为FA'中最大的关键优先级时,获取A'i1为Ai的链接实体,其中,所述链接实体为对任一实体进行实体链接获取到的实体。
S330,从A中删除Ai,获取第一初始实体列表B={B1,B2,……,Bd,……,Bm-1}、B对应的第一中间实体集B'={B'1,B'2,……,B'd,……,B'm-1}和B'对应的第一中间优先级集FB'={FB'1,FB'2,……,FB'd,……,FB'm-1},其中,Bd为第d个第一初始实体,B'd={B'd1,B'd2,……,B'dj,……,B'dn},B'dj为Bd对应的第一中间实体列表中第j个第一中间实体,FB'd={FB'd1,FB'd2,……,FB'dj,……,FB'dn},FB'dj为B'dj对应的第一中间优先级,d=1……m-1,其中,FB'd1>FB'd2>……>FB'dj>……>FB'dn
S340,根据预设实体关系优先级集,获取B'对应的第一关键优先级集VFB'={VFB'1
VFB'2,……,VFB'd,……,VFB'm-1},VFB'd={VFB'd1,VFB'd2,……,VFB'dj,……,VFB'dn},其中,
VFB'dj为对应的第一关键优先级。
S350,根据VFB',获取第一目标链接实体列表C={C1,C2,……,Cζ,……,Cη},Cζ为第ζ个第一目标链接实体,ζ=1……η,η为第一目标链接实体的数量,其中,所述第一目标链接实体为当VFB'd1为VFB'd中最大的第一关键优先级时,获取B'd1为Bd对应的链接实体。
S360,根据C,获取第二初始实体列表D={D1,D2,……,De,……,Dt},De为第e个第二初始实体,其中,所述第二初始实体为从B中删除Cζ对应的第一初始实体后的任意一个初始实体。
S370,根据D,获取第二目标链接实体列表C0={C0 1,C0 2,……,C0 i,……,C0 m},C0 i为Ai对应的链接实体,其中,C0通过重复执行S320~S360,直到获取到的第二初始实体列表为空集时。
本发明与现有技术相比具有明显的有益效果,借由上述技术方案,本发明提供的一种基于实体关系获取链接实体的数据处理系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有以下有益效果:
本发明提供的一种基于实体关系获取链接实体的数据处理系统,所述系统包括:初始实体列表、预设实体关系优先级集、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:将初始实体的数量与预设的实体数量阈值进行比较,当初始实体的数量大于等于预设的实体数量阈值时,获取初始实体列表对应的关键实体集和关键实体集对应的关键实体优先级集,获取最大的关键优先级,将最大关键优先级对应的关键实体作为关键实体对应的初始实体的链接实体,从初始实体列表中删除最大关键优先级对应的初始实体,获取第一初始实体列表、第一初始实体列表对应的第一中间实体集和第一中间实体集对应的第一中间优先级集,根据预设实体关系优先级集,获取第一中间实体集对应的第一关键优先级集,根据第一关键优先级集获取第一目标链接实体列表,根据第一目标链接实体列表获取第二初始实体列表,根据第二初始实体列表获取第二目标链接实体列表;上述,在获取链接实体的过程中,考虑了实体关系和实体关系与实体关系之间的关联程度,未对每个实体优先级进行多次处理,增加了获取链接实体的效率,从而提高了获取链接实体的准确度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的一种基于实体关系获取链接实体的数据处理系统的执行计算机程序的流程图。
图2为本发明实施例一提供的S340步骤的流程图;
图3为本发明实施例二提供的一种基于实体关系获取链接实体的数据处理系统的执行计算机程序的流程图;
图4为为本发明实施例三提供的一种基于实体关系获取链接实体的数据处理系统的执行计算机程序的流程图;
图5为为本发明实施例四提供的一种基于实体关系获取链接实体的数据处理系统的执行计算机程序的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
一种基于实体关系获取链接实体的数据处理系统,所述系统包括:初始实体列表A={A1,A2,……,Ai,……,Am}、预设实体关系优先级集、处理器和存储有计算机程序的存储器,其中,Ai为第i个初始实体,i=1……m,m为初始实体的数量;当所述计算机程序被处理器执行时,实现以下步骤,如图1所示:
S300,将m与预设的实体数量阈值m0进行比对。
具体的,m0的取值为3。
S310,当m≥m0时,获取A对应的关键实体集A'={A'1,A'2,……,A'i,……,A'm}和A'对应的关键实体优先级集FA'={FA'1,FA'2,……,FA'i,……,FA'm},其中,A'i={A'i1,A'i2,……,A'ij,……,A'in},A'ij为Ai对应的关键实体列表中第j个关键实体,FA'i={FA'i1,FA'i2,……,FA'ij,……,FA'in},FA'ij为A'ij对应的关键实体优先级,j=1……n,n为关键实体列表中关键实体的数量,其中,FA'i1>FA'i2>……>FA'ij>……>FA'in
具体的,所述系统中还包括预设实体列表和预设三元组集,预设实体列表包括若干个预设实体,预设三元组集包括每一预设实体对应的预设三元组列表,其中,预设三元组列表包括每一预设实体对应的若干个预设三元组,本领域技术人员知晓,现有技术中任意一种获取三元组的方法均属于本发明的保护范围,在此不再赘述。
进一步的,所述预设实体为从预先设置的知识库中获取到的任一实体,本领域技术人员知晓,现有技术中任一知识库均属于本发明的保护范围,在此不再赘述;例如,知识库为维基百科等。
进一步的,所述关键实体优先级为将初始实体和初始实体对应的关键实体输入至实体匹配模型中,获取到的初始实体与初始实体对应的关键实体之间的匹配概率,其中,本领域技术人员知晓,现有技术中任意一种实体匹配模型均属于本发明的保护范围,在此不再赘述。
具体的,所述预设实体关系优先级集Y0={Y0 1,Y0 2,……,Y0 a,……,Y0 u},Y0 a={Y0 a1,Y0 a2,……,Y0 ay,……,Y0 aq},Y0 ay为第a个预设三元组与第y个非预设三元组之间的实体关系优先级,a=1……u,u为预设三元组的数量,y=1……q,q为非预设三元组的数量;本领域技术人员知晓,所述实体关系优先级为任一实体关系与其它实体关系或实体之间的关联程度,其中,所述实体关系为包括任意两个实体和两个实体之间的关系的三元组。
进一步的,所述非预设三元组为对样本三元组进行去重处理获取到的三元组,其中,样本三元组为将样本文本输入至实体关系抽取模型中获取到的三元组,本领域技术人员知晓,样本文本为用于训练实体关系抽取模型的文本,在此不再赘述。
进一步的,本领域技术人员知晓,现有技术中任一通过实体关系抽取模型获取三元组的方法均属于本发明的保护范围,在此不再赘述。
S320,当FA'i1为FA'中最大的关键优先级时,获取A'i1为Ai的链接实体,其中,所述链接实体为对任一实体进行实体链接获取到的实体。
S330,从A中删除Ai,获取第一初始实体列表B={B1,B2,……,Bd,……,Bm-1}、B对应的第一中间实体集B'={B'1,B'2,……,B'd,……,B'm-1}和B'对应的第一中间优先级集FB'={FB'1,FB'2,……,FB'd,……,FB'm-1},其中,Bd为第d个第一初始实体,B'd={B'd1,B'd2,……,B'dj,……,B'dn},B'dj为Bd对应的第一中间实体列表中第j个第一中间实体,FB'd={FB'd1,FB'd2,……,FB'dj,……,FB'dn},FB'dj为B'dj对应的第一中间优先级,d=1……m-1,其中,FB'd1>FB'd2>……>FB'dj>……>FB'dn
具体的,所述第一初始实体为从A中删除Ai后的任一初始实体,所述第一中间实体为从A'中获取到的第一初始实体对应的关键实体,所述第一中间优先级为从FA'中获取到的第一初始实体对应的关键优先级。
S340,根据预设实体关系优先级集,获取B'对应的第一关键优先级集VFB'={VFB'1
VFB'2,……,VFB'd,……,VFB'm-1},VFB'd={VFB'd1,VFB'd2,……,VFB'dj,……,VFB'dn},其中,
VFB'dj为对应的第一关键优先级。
具体的,在S340中通过如下步骤获取VFB'dj,如图2所示:
S3401,根据Ai和Bd,获取Bd对应的第一候选三元组ABid,其中,所述Bd对应的第一候选三元组为包括Ai、Bd和Ai和Bd之间的关系的三元组。
S3403,根据预设实体关系优先级集,获取ABid对应的第一待定优先级={EAB1 id,EAB2 id,……,EABy id,……,EABq id},EABy id为ABid对应的第y个第一待定优先级;可以理解为:当ABid与Y0 a一致时,则EABy id=Y0 ay
S3405,根据A'i1和B'd,获取B'd对应的第一候选三元组AB'id,其中,所述B'd对应的第一候选三元组包括A'i1、B'd和A'i1和B'd之间的关系的三元组。
S3407,获取AB'id对应的第二待定优先级列表WAB'id={WAB'1 id,WAB'2 id,……,WAB'y id,……,WAB'q id},WAB'y id为AB'id对应的第y个第二待定优先级。
具体的,所述第二待定优先级为将包括A'i1和B'd样本文本输入至实体关系抽取模型中获取到的非预设三元组对应的优先级。
S3409,根据EABid和WAB'id,获取VFB'dj
进一步的的,在S3409中还包括如下步骤:
S34091,当预设实体关系优先级表中不存在负值的预设实体关系优先级时,获取VFB'dj,其中,VFB'dj符合如下条件:
Figure BDA0003978754860000061
S34093,当预设实体关系优先级表中存在负值的预设实体关系优先级时,获取VFB'dj,其中,VFB'dj符合如下条件:
Figure BDA0003978754860000062
上述,通过判断预设实体关系优先级集中预设实体关系优先级的值表示方式,提供了不同获取中间优先级的方法,使得获取到的中间优先级更加精确,进而提高获取链接实体的准确度。
S350,根据VFB',获取第一目标链接实体列表C={C1,C2,……,Cζ,……,Cη},Cζ为第ζ个第一目标链接实体,ζ=1……η,η为第一目标链接实体的数量,其中,所述第一目标链接实体为当VFB'd1为VFB'd中最大的第一关键优先级时,获取B'd1为Bd对应的链接实体;可以理解为:FB'd中最大值的位置与VFB'd中的最大值的位置不发生变化时,获取VFB'd中的最大值对应的第一中间实体为其对应的第一初始实体的链接实体。
S360,根据C,获取第二初始实体列表D={D1,D2,……,De,……,Dt},De为第e个第二初始实体,其中,所述第二初始实体为从B中删除Cζ对应的第一初始实体后的任意一个初始实体。
具体的,η+t=m-1。
上述,基于实体与实体之间的关系对任一初始实体的关键实体对应的实体优先级进行处理,当初始实体的关键实体对应的实体优先级进行处理后获取到的实体优先级中最大实体优先级的位置保持不变时,直接获取满足条件的关键实体作为初始实体的链接实体,减少了需要处理的数据量,提高了获取链接实体的效率,进而使得获取到的链接实体的准确度较高。
S370,根据D,获取第二目标链接实体列表C0={C0 1,C0 2,……,C0 i,……,C0 m},C0 i为Ai对应的链接实体,其中,C0通过重复执行S320~S360,直到获取到的第二初始实体列表为空集时。
上述,基于实体与实体之间的关系,对任一初始实体的关键实体对应的实体优先级进行处理后,获取到更加精确的实体优先级,以使得根据更加精确的实体优先级,获取初始实体的链接实体,进而提高了获取链接实体的准确度。
本实施例一提供的一种基于实体关系获取链接实体的数据处理系统,所述系统包括:初始实体列表、预设实体关系优先级集、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:将初始实体的数量与预设的实体数量阈值进行比较,当初始实体的数量大于等于预设的实体数量阈值时,获取初始实体列表对应的关键实体集和关键实体集对应的关键实体优先级集,获取最大的关键优先级,将最大关键优先级对应的关键实体作为关键实体对应的初始实体的链接实体,从初始实体列表中删除最大关键优先级对应的初始实体,获取第一初始实体列表和、第一初始实体列表对应的第一中间实体集和第一中间实体集对应的第一中间优先级集,根据预设实体关系优先级集,获取第一中间实体集对应的第一关键优先级集,根据第一关键优先级集获取第一目标链接实体列表,根据第一目标链接实体列表获取第二初始实体列表,根据第二初始实体列表获取第二目标链接实体列表;上述,在获取链接实体的过程中,考虑了实体关系和实体关系与实体关系之间的关联程度,未对每个实体优先级进行多次处理,增加了获取链接实体的效率,从而提高了获取链接实体的准确度。
实施例二
本实施例提供了一种获取基于实体关系链接实体的数据处理系统,所述系统包括:初始实体列表A={A1,A2,……,Ai,……,Am}、预设实体标签优先级集、处理器和存储有计算机程序的存储器,其中,Ai为第i个初始实体,i=1……m,m为初始实体的数量;当所述计算机程序被处理器执行时,实现以下步骤,如图3所示:
S100,将m与预设的实体数量阈值m0进行比对。
具体的,m0的取值为3。
S110,当m<m0时,获取A对应的关键实体集A'={A'1,A'2,……,A'i,……,A'm}和A'对应的关键实体优先级集FA'={FA'1,FA'2,……,FA'i,……,FA'm},其中,A'i={A'i1,A'i2,……,A'ij,……,A'in},A'ij为Ai对应的关键实体列表中第j个关键实体,FA'i={FA'i1,FA'i2,……,FA'ij,……,FA'in},FA'ij为A'ij对应的关键实体优先级,j=1……n,n为关键实体列表中关键实体的数量。
具体的,所述系统中还包括初始文本集,所述初始文本集包括若干个初始文本,其中,所述初始文本为用户从任一网页上通过爬虫方法获取到的文本,本领域技术人员知晓,现有技术中任意一个爬虫方法均属于本发明的保护范围,在此不再赘述。
进一步的,所述初始实体为将初始文本输入至实体识别模型中获取到的实体;本领域技术人员也知晓,现有技术中任一通过实体识别模型获取实体的方法均属于本发明的保护范围,在此不再赘述;例如,实体识别模型为NER模型。
具体的,所述系统中还包括预设实体列表、预设实体列表对应的预设实体标签列表和预设三元组集,预设实体列表包括若干个预设实体,预设实体标签列表包括每一预设实体对应的预设实体标签,预设三元组集包括每一预设实体对应的预设三元组列表,其中,预设三元组列表包括每一预设实体对应的若干个预设三元组,本领域技术人员知晓,现有技术中任意一种获取三元组的方法均属于本发明的保护范围,在此不再赘述。
进一步的,所述预设实体为从预先设置的知识库中获取到的任一实体,本领域技术人员知晓,现有技术中任一知识库均属于本发明的保护范围,在此不再赘述;例如,知识库为维基百科等。
进一步的,所述预设实体标签为表征预设实体对应的实体类型的唯一标签,本领域技术人员知晓,现有技术中任一获取实体对应的实体标签的方法均属于本发明的保护范围,在此不再赘述。
具体的,所述关键实体为在与初始实体一致的预设实体对应的预设三元组列表中,每一预设三元组中除初始实体之外的实体;例如当初始实体为北京时,获取到的关键实体为北平、燕京等。
进一步的,所述关键实体优先级为将初始实体和初始实体对应的关键实体输入至实体匹配模型中,获取到的初始实体与初始实体对应的关键实体之间的匹配概率,其中,本领域技术人员知晓,现有技术中任意一种实体匹配模型均属于本发明的保护范围,在此不再赘述。
具体的,所述预设实体标签优先级集U0={U0 1,U0 2,……,U0 f,……,U0 z},U0 f={U0 f1,U0 f2,……,U0 fr,……,U0 fs},U0 fr为第f个预设实体标签与第r个非预设实体标签之间的标签优先级,f=1……z,z为预设实体标签的数量,r=1……s,s为非预设实体标签的数量;本领域技术人员知晓,所述标签优先级为任一实体标签与其它实体标签或任一实体之间的关联程度。
进一步的,所述非预设实体标签为对样本实体标签进行去重处理获取到的实体标签,其中,样本实体标签为将样本文本输入至实体识别模型中获取到的实体标签,本领域技术人员知晓,样本文本为用于训练实体识别模型的文本,在此不再赘述。
S120,根据预设实体标签优先级集,获取A'对应的目标优先级集RA'={RA'1,RA'2,……,RA'i,……,RA'm},RA'i={RA'i1,RA'i2,……,RA'ij,……,RA'in},RA'ij为A'ij对应的目标优先级。
具体的,在S120中通过以下步骤获取RA'ij
S1201,获取A'ij对应的关键实体标签Aij,其中,Aij为从预设实体标签列表中获取到的A'ij对应的预设实体标签。
S1203,根据U0,获取Aij对应的第一中间标签优先级列表PAij={PA1 ij,PA2 ij,……,PAr ij,……,PAs ij},PAr ij为Aij对应的第r个第一中间标签优先级;可以理解为:当Aij与U0 fr对应的预设实体标签一致时,则U0 fr=PAr ij
S1205,获取Ai对应的第二中间标签标签优先级列表KA'i={KA'i1,KA'i2,……,KA'ir,……,KA'is},KA'ir为Ai对应的第二中间标签优先级。
具体的,所述第二中间标签优先级为将初始实体输入至实体识别模型中获取到的非预设实体标签对应的标签优先级。
S1207,根据PAij和KA'i,获取RA'ij
具体的,S1207中还包括如下步骤:
S12071,当预设实体标签优先级集不存在负值的预设实体标签优先级时,获取RA'ij,其中,RA'ij符合如下条件:
Figure BDA0003978754860000091
S12073,当预设实体标签优先级集存在负值的预设实体标签优先级时,获取RA'ij,其中,RA'ij符合如下条件:
Figure BDA0003978754860000092
上述,通过判断预设实体标签优先级集中预设实体优先级的值表示方式,提供了不同获取目标优先级的方法,使得获取到的目标优先级更加精确,进而提高获取链接实体的准确度。
S130,根据RA'i,获取A对应的链接实体列表A0={A0 1j,A0 2j,……,A0 ij,……,A0 mj},其中,A0 ij为Ai的链接实体;可以理解为:当RA'ij为RA'i中最大的目标优先级时,将A'ij作为A0 ij
具体的,所述链接实体为对任一实体进行实体链接获取到的实体。
上述,对任一初始实体的关键实体对应的实体优先级进行处理后,获取到更加精确的实体优先级,以使得根据更加精确的实体优先级,获取初始实体的链接实体,进而提高了获取链接实体的准确度。
本实施例二提供的一种基于实体关系获取链接实体的数据处理系统,包括:初始实体列表、预设实体标签优先级集、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:将初始实体的数量与预设的实体数量阈值进行比对,当初始实体的数量小于预设的实体数量阈值时,获取初始实体列表对应的关键实体集,根据预设实体标签优先级集,获取关键实体集对应的目标优先级集,其中,预设实体标签优先级为预设实体标签和非预设实体标签之间的标签优先级,标签优先级为任一实体标签与其它实体标签或任一实体之间的关联程度,根据目标优先级集,获取初始实体对应的链接实体;上述,在获取链接实体时,不局限于实体本身,考虑了实体对应的实体标签以及实体标签与实体标签之间的关联程度,提高了获取到的链接实体的准确度。
实施例三
本实施例提供了一种基于实体关系获取链接实体的数据处理系统,所述系统包括:初始实体列表A={A1,A2,……,Ai,……,Am}、预设实体关系优先级集、处理器和存储有计算机程序的存储器,其中,Ai为第i个初始实体,i=1……m,m为初始实体的数量;当所述计算机程序被处理器执行时,实现以下步骤,如图4所示:
S200,将m与预设的实体数量阈值m0进行比对。
具体的,m0的取值为3。
S210,当m≥m0时,获取A对应的关键实体集A'={A'1,A'2,……,A'i,……,A'm}和A'对应的关键实体优先级集FA'={FA'1,FA'2,……,FA'i,……,FA'm},其中,A'i={A'i1,A'i2,……,A'ij,……,A'in},A'ij为Ai对应的关键实体列表中第j个关键实体,FA'i={FA'i1,FA'i2,……,FA'ij,……,FA'in},FA'ij为A'ij对应的关键实体优先级,j=1……n,n为关键实体列表中关键实体的数量。
具体的,所述系统中还包括初始文本集,所述初始文本集包括若干个初始文本,其中,所述初始文本为用户从任一网页上通过爬虫方法获取到的文本,本领域技术人员知晓,现有技术中任意一个爬虫方法均属于本发明的保护范围,在此不再赘述。
进一步的,所述初始实体为将初始文本输入至实体识别模型中获取到的实体;本领域技术人员也知晓,现有技术中任一通过实体识别模型获取实体的方法均属于本发明的保护范围,在此不再赘述;例如,实体识别模型为NER模型。
具体的,所述系统中还包括预设实体列表和预设三元组集,预设实体列表包括若干个预设实体,预设三元组集包括每一预设实体对应的预设三元组列表,其中,预设三元组列表包括每一预设实体对应的若干个预设三元组,本领域技术人员知晓,现有技术中任意一种获取三元组的方法均属于本发明的保护范围,在此不再赘述。
进一步的,所述预设实体为从预先设置的知识库中获取到的任一实体,本领域技术人员知晓,现有技术中任一知识库均属于本发明的保护范围,在此不再赘述;例如,知识库为维基百科等。
进一步的,所述关键实体优先级为将初始实体和初始实体对应的关键实体输入至实体匹配模型中,获取到的初始实体与初始实体对应的关键实体之间的匹配概率,其中,本领域技术人员知晓,现有技术中任意一种实体匹配模型均属于本发明的保护范围,在此不再赘述。
具体的,所述预设实体关系优先级集Y0={Y0 1,Y0 2,……,Y0 a,……,Y0 u},Y0 a={Y0 a1,Y0 a2,……,Y0 ay,……,Y0 aq},Y0 ay为第a个预设三元组与第y个非预设三元组之间的实体关系优先级,a=1……u,u为预设三元组的数量,y=1……q,q为非预设三元组的数量;本领域技术人员知晓,所述实体关系优先级为任一实体关系与其它实体关系或实体之间的关联程度,其中,所述实体关系为包括任意两个实体和两个实体之间的关系的三元组。
进一步的,所述非预设三元组为对样本三元组进行去重处理获取到的三元组,其中,样本三元组为将样本文本输入至实体关系抽取模型中获取到的三元组,本领域技术人员知晓,样本文本为用于训练实体关系抽取模型的文本,在此不再赘述。
进一步的,本领域技术人员知晓,现有技术中任一通过实体关系抽取模型获取三元组的方法均属于本发明的保护范围,在此不再赘述。
S220,根据FA',获取中间实体集FA={FA1,FA2,……,FAg,……,FAm-1}和FA对应的中间优先级集TFA={TFA1,TFA2,……,TFAg,……,TFAm-1},FAg为第g个中间实体列表,TFAg为FAg对应的中间优先级列表,g=2……m-1。
具体的,在S220中通过如下步骤获取FAg
S2201,遍历TFAg-1,获取TFAg-1中最大的中间优先级。
S2203,从FAg-1中删除TFAg-1中最大的中间优先级对应的中间实体后,获取到FAg
进一步的,在S2201中通过如下步骤获取TFAg-1
S22011,获取FAg-2对应的第一关键实体集DFAg-2={DFAg-2 1,DFAg-2 2,……,DFAg -2 x,……,
DFAg-2 m-g+2},DFAg-2 x={DFAg-2 x1,DFAg-2 x2,……,DFAg-2 xj,……,DFAg-2 xn},DFAg-2 xj为FAg-2中第x个
中间实体对应的第j个第一关键实体,其中,所述第一关键实体为从A'中获取到的中间实体对应的关键实体,x=1……m-g+2。
S22013,获取TFAg-2={TFAg-2 1,TFAg-2 2,……,TFAg-2 x,……,TFAg-2 m-g},TFAg-2 x={TFAg-2 x1
TFAg-2 x2,……,TFAg-2 xj,……,TFAg-2 xn},TFAg-2 xj为DFAg-2 xj对应的中间优先级。
S22015,当TFAg-2 xj为TFAg-2中最大的中间优先级时,获取FAg-2中第x个中间实体和DFAg-2 xj
S22017,获取候选优先级集GFAg-2={GFAg-2 1,GFAg-2 2,……,GFAg-2 p,……,GFAg -2 m-g-1},GFAg-2 p={GFAg-2 p1,GFAg-2 p2,……,GFAg-2 pj,……,GFAg-2 pn},GFAg-2 pj为第p个候选优先级列表中第j个候选优先级,p=1……m-g-1,其中,所述候选优先级列表为TFAg-2删除TFAg -2 x后其它中间优先级列表按照顺序排列获取到中间优先级列表。
S22019,根据预设实体关系优先级列表,获取TFAg-1={TFAg-1 1,TFAg-1 2,……,TFAg -1 p,……,TFAg-1 m-g-1},TFAg-1 p={TFAg-1 p1,TFAg-1 p2,……,TFAg-1 pj,……,TFAg-1 pn},其中TFAg -1 pj为对GFAg-2 pj进行处理获取到的。
具体的,在S22019中通过如下步骤获取TFAg-1 pj
S1,根据TFAg-1 pj对应的第一关键实体和DFAg-2 xj,获取TFAg-1 pj对应的第一关键三元组,其中,TFAg-1 pj对应的第一关键三元组为包括TFAg-1 pj对应的第一关键实体、DFAg-2 xj以及TFAg-1 pj对应的第一关键实体和DFAg-2 xj之间的关系的三元组。
S2,根据预设实体关系优先级集,获取TFAg-1 pj对应的第一关键三元组的第一优先级E0={E0 1,E0 2,……,E0 y,……,E0 q},E0 y为TFAg-1 pj对应的第一关键三元组的第y个第一优先级;可以理解为:当TFAg-1 pj对应的第一关键三元组与Y0 a一致时,则E0 y=Y0 ay
S3,根据FAg-2中第x个中间实体和TFAg-1 pj对应的初始实体,获取TFAg-1 pj对应的第二关键三元组,其中,所述TFAg-1 pj对应的第二关键三元组为包括FAg-2中第x个中间实体、TFAg-1 pj对应的初始实体以及FAg-2中第x个中间实体和TFAg-1 pj对应的初始实体之间的关系的三元组。
S4,获取TFAg-1 pj对应的第二关键三元组对应的第二优先级列表T0={T0 1,T0 2,……,T0 y,……,T0 q},T0 y为TFAg-1 pj对应的第二关键三元组对应的第y个第二优先级。
具体的,所述第二优先级为将包括FAg-2中第x个中间实体和TFAg-1 pj对应的初始实体的样本文本输入至实体关系抽取模型中获取到的非预设三元组对应的优先级。
S5,根据E0和T0,获取TFAg-1 pj
进一步的的,在S5中还包括如下步骤:
S51,当预设实体关系优先级表中不存在负值的预设实体关系优先级时,获取TFAg xj,其中,TFAg xj符合如下条件:
Figure BDA0003978754860000131
S53,当预设实体关系优先级表中存在负值的预设实体关系优先级时,获取TFAg xj,其中,TFAg xj符合如下条件:
Figure BDA0003978754860000132
上述,通过判断预设实体关系优先级集中预设实体关系优先级的值表示方式,提供了不同获取中间优先级的方法,使得获取到的中间优先级更加精确,进而提高获取链接实体的准确度。
在一个具体的实施例中,
当g=2时,通过如下步骤获取TFA1
S11,获取FA0对应的第一关键实体集DFA0={DFA0 1,DFA0 2,……,DFA0 i,……,DFA0 m},DFA0 i={DFA0 i1,DFA0 i2,……,DFA0 ij,……,DFA0 in},其中,DFA0 i与A'i一致,DFA0 ij与A'ij一致。
S21,获取TFA0={FA'1,FA'2,……,FA'i,……,FA'm},FA'i={FA'i1,FA'i2,……,FA'ij,……,
FA'in}。
S31,根据预设实体关系优先级列表,获取TFA1,其中,TFA1的获取方式参照本实施例中S22015~22019步骤。
通过如下步骤获取FA1
S10,遍历FA',获取FA'中最大的关键实体优先级。
S20,从A'中删除FA'中最大的关键实体优先级对应的关键实体后,获取到FA1
S230,根据TFA,获取FA对应的链接实体列表FA0={FA0 1,FA0 2,……,FA0 g,……,FA0 m-1},其中,FA0 g为获取到的第g个链接实体;可以理解为:当TFAg中某一中间优先级为最大优先级时,获取其对应的中间实体为其对应的初始实体的链接实体。
具体的,所述链接实体为对任一实体进行实体链接获取到的实体。
上述,基于实体与实体之间的关系,对任一初始实体的关键实体对应的实体优先级进行处理后,获取到更加精确的实体优先级,以使得根据更加精确的实体优先级,获取初始实体的链接实体,进而提高了获取链接实体的准确度。
本实施例三提供的一种基于实体关系获取链接实体的数据处理系统,系统包括初始实体列表、预设实体关系优先级集、处理器和存储由计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:将初始实体的数量与预设的实体数量阈值进行比对,当初始实体的数量大于等于预设的实体数量阈值时,获取初始实体列表对应的关键实体集和关键实体集对应的关键实体优先级集,根据关键实体优先级集,获取中间实体集和中间实体集对应的中间优先级集,其中,实体关系优先级为任一实体关系与其它实体关系或实体之间的关联程度,根据中间优先级集,获取中间实体对应的链接实体列表;上述,在获取链接实体的过程中,不局限于实体之间的相似度,基于实体关系和实体关系与实体关系之间的关联程度,对实体优先级进行处理,获取到更加精确的实体优先级,提高了获取链接实体的准确度。
实施例四
一种基于实体关系获取链接实体的数据处理系统,所述系统包括:初始实体列表A={A1,A2,……,Ai,……,Am}、预设实体标签优先级集、预设实体关系优先级集、处理器和存储有计算机程序的存储器,其中,Ai为第i个初始实体,i=1……m,m为初始实体的数量;当所述计算机程序被处理器执行时,实现以下步骤,如图5所示:
S400,获取A对应的关键实体集A'={A'1,A'2,……,A'i,……,A'm}和A'对应的关键实体优先级集FA'={FA'1,FA'2,……,FA'i,……,FA'm},其中,A'i={A'i1,A'i2,……,A'ij,……,A'in},A'ij为Ai对应的关键实体列表中第j个关键实体,FA'i={FA'i1,FA'i2,……,FA'ij,……,FA'in},FA'ij为A'ij对应的关键实体优先级,j=1……n,n为关键实体列表中关键实体的数量。
具体的,关键实体的获取方式可以参照实施例一中的关键实体的获取方式,在此不再赘述。
具体的,关键实体优先级的获取方式可以参照实施例一中的关键实体优先级的获取方式,在此不再赘述。
S410,根据预设实体标签优先级集,获取A'对应的第一候选优先级集SA'={SA'1,SA'2,……,SA'i,……,SA'm},SA'i={SA'i1,SA'i2,……,SA'ij,……,SA'in},SA'ij为A'ij对应的第一候选优先级。
具体的,SA'ij的获取方式可以参照实施例一中RA'ij的获取方式,在此不再赘述。
S420,根据预设实体关系优先级集,获取A'对应的第二候选优先级集VA'={VA'1,VA'2,……,VA'i,……,VA'm},VA'i={VA'i1,VA'i2,……,VA'ij,……,VA'in},VA'ij为A'ij对应的第二候选优先级。
具体的,VA'ij的获取方式可以参照实施例二中TFAg-1 pj的获取方式或实施例三中VFB'dj的获取方式获取到的。
S430,根据SA'和VA',获取A'对应的最终优先级集EA'={EA'1,EA'2,……,EA'i,……,EA'm},EA'i={EA'i1,EA'i2,……,EA'ij,……,EA'in},其中,EA'ij符合如下条件:
EA'ij=(SA'ij+VA'ij)/2。
S440,根据EA'i,获取A的最终链接实体列表PA={PA1j,PA2j,……,PAij,……,PAmj},其中,PAij为Ai的最终链接实体;可以理解为:当EA'ij为EA'i中最大的最终优先级时,将A'i作为PAij
上述,通过两种方式对任一初始实体的关键实体对应的实体优先级进行处理,获取到更加精确的实体优先级,以使得根据更加精确的实体优先级,获取初始实体的链接实体,进而提高了获取链接实体的准确度。
本实施例四提供的一种基于实体关系获取链接实体的数据处理系统,系统包括初始实体列表、预设实体标签优先级集、预设实体关系优先级集、处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:获取初始实体列表对应的关键实体集和关键实体集对应的关键实体优先级集,根据预设实体标签优先级集获取关键实体集对应的第一候选优先级集,根据预设实体关系优先级集,获取关键实体对应的第二候选优先级集,根据第一候选优先级集和第二候选优先级集,获取关键实体对应的最终优先级集,根据最终优先级集,获取初始实体列表对应的最终链接实体列表;上述,既考虑了实体标签与实体标签的关联程度,又考虑了实体关系与实体关系之间的关联程度,获取到了更加精确的实体优先级,以使得根据更加精确的实体优先级,获取初始实体的链接实体,进而提高了获取链接实体的准确度。
虽然已经通过示例对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员还应理解,可以对实施例进行多种修改而不脱离本发明的范围和精神。本发明开的范围由所附权利要求来限定。

Claims (9)

1.一种基于实体关系获取链接实体的数据处理系统,其特征在于,所述系统包括:初始实体列表A={A1,A2,……,Ai,……,Am}、预设实体关系优先级集、处理器和存储有计算机程序的存储器,其中,Ai为第i个初始实体,i=1……m,m为初始实体的数量,当所述计算机程序被处理器执行时,实现以下步骤:
S300,将m与预设的实体数量阈值m0进行比对;
S310,当m≥m0时,获取A对应的关键实体集A'={A'1,A'2,……,A'i,……,A'm}和A'对应的关键实体优先级集FA'={FA'1,FA'2,……,FA'i,……,FA'm},其中,A'i={A'i1,A'i2,……,A'ij,……,A'in},A'ij为Ai对应的关键实体列表中第j个关键实体,FA'i={FA'i1,FA'i2,……,FA'ij,……,FA'in},FA'ij为A'ij对应的关键实体优先级,j=1……n,n为关键实体列表中关键实体的数量,其中,FA'i1>FA'i2>……>FA'ij>……>FA'in
S320,当FA'i1为FA'中最大的关键优先级时,获取A'i1为Ai的链接实体,其中,所述链接实体为对任一实体进行实体链接获取到的实体;
S330,从A中删除Ai,获取第一初始实体列表B={B1,B2,……,Bd,……,Bm-1}、B对应的第一中间实体集B'={B'1,B'2,……,B'd,……,B'm-1}和B'对应的第一中间优先级集FB'={FB'1,FB'2,……,FB'd,……,FB'm-1},其中,Bd为第d个第一初始实体,B'd={B'd1,B'd2,……,B'dj,……,B'dn},B'dj为Bd对应的第一中间实体列表中第j个第一中间实体,FB'd={FB'd1,FB'd2,……,FB'dj,……,FB'dn},FB'dj为B'dj对应的第一中间优先级,d=1……m-1,其中,FB'd1>FB'd2>……>FB'dj>……>FB'dn
S340,根据预设实体关系优先级集,获取B'对应的第一关键优先级集VFB'={VFB'1
VFB'2,……,VFB'd,……,VFB'm-1},VFB'd={VFB'd1,VFB'd2,……,VFB'dj,……,VFB'dn},其
中,VFB'dj为对应的第一关键优先级;
S350,根据VFB',获取第一目标链接实体列表C={C1,C2,……,Cζ,……,Cη},Cζ为第ζ个第一目标链接实体,ζ=1……η,η为第一目标链接实体的数量,其中,所述第一目标链接实体为当VFB'd1为VFB'd中最大的第一关键优先级时,获取B'd1为Bd对应的链接实体;
S360,根据C,获取第二初始实体列表D={D1,D2,……,De,……,Dt},De为第e个第二初始实体,其中,所述第二初始实体为从B中删除Cζ对应的第一初始实体后的任意一个初始实体;
S370,根据D,获取第二目标链接实体列表C0={C0 1,C0 2,……,C0 i,……,C0 m},C0 i为Ai对应的链接实体,其中,C0通过重复执行S320~S360,直到获取到的第二初始实体列表为空集时。
2.根据权利要求1所述的基于实体关系获取链接实体的数据处理系统,其特征在于,m0的取值为3。
3.根据权利要求1所述的基于实体关系获取链接实体的数据处理系统,所述预设实体关系优先级集Y0={Y0 1,Y0 2,……,Y0 a,……,Y0 u},Y0 a={Y0 a1,Y0 a2,……,Y0 ay,……,Y0 aq},Y0 ay为第a个预设三元组与第y个非预设三元组之间的实体关系优先级,a=1……u,u为预设三元组的数量,y=1……q,q为非预设三元组的数量。
4.根据权利要求1所述的基于实体关系获取链接实体的数据处理系统,其特征在于,在S330中所述第一初始实体为从A中删除Ai后的任一初始实体。
5.根据权利要求1所述的基于实体关系获取链接实体的数据处理系统,其特征在于,在S330中所述第一中间实体为从A'中获取到的第一初始实体对应的关键实体。
6.根据权利要求1所述的基于实体关系获取链接实体的数据处理系统,其特征在于,在S330中所述第一中间优先级为从FA'中获取到的第一初始实体对应的关键优先级。
7.根据权利要求1所述的基于实体关系获取链接实体的数据处理系统,其特征在于,在S340中通过如下步骤获取VFB'dj
S3401,根据Ai和Bd,获取Bd对应的第一候选三元组ABid,其中,所述Bd对应的第一候选三元组为包括Ai、Bd和Ai和Bd之间的关系的三元组;
S3403,根据预设实体关系优先级集,获取ABid对应的第一待定优先级={EAB1 id,EAB2 id,……,EABy id,……,EABq id},EABy id为ABid对应的第y个第一待定优先级;可以理解为:当ABid与Y0 a一致时,则EABy id=Y0 ay
S3405,根据A'i1和B'd,获取B'd对应的第一候选三元组AB'id,其中,所述B'd对应的第一候选三元组包括A'i1、B'd和A'i1和B'd之间的关系的三元组;
S3407,获取AB'id对应的第二待定优先级列表WAB'id={WAB'1 id,WAB'2 id,……,WAB'y id,……,WAB'q id},WAB'y id为AB'id对应的第y个第二待定优先级;
S3409,根据EABid和WAB'id,获取VFB'dj
8.根据权利要求7所述的基于实体关系获取链接实体的数据处理系统,其特征在于,在S3409中还包括如下步骤:
S34091,当预设实体关系优先级表中不存在负值的预设实体关系优先级时,获取VFB'dj,其中,VFB'dj符合如下条件:
Figure FDA0003978754850000031
S34093,当预设实体关系优先级表中存在负值的预设实体关系优先级时,获取VFB'dj,其中,VFB'dj符合如下条件:
Figure FDA0003978754850000032
9.根据权利要求1所述的基于实体关系获取链接实体的数据处理系统,其特征在于,η+t=m-1。
CN202211543319.XA 2022-12-02 2022-12-02 一种基于实体关系获取链接实体的数据处理系统 Active CN115795051B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211543319.XA CN115795051B (zh) 2022-12-02 2022-12-02 一种基于实体关系获取链接实体的数据处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211543319.XA CN115795051B (zh) 2022-12-02 2022-12-02 一种基于实体关系获取链接实体的数据处理系统

Publications (2)

Publication Number Publication Date
CN115795051A true CN115795051A (zh) 2023-03-14
CN115795051B CN115795051B (zh) 2023-05-23

Family

ID=85445303

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211543319.XA Active CN115795051B (zh) 2022-12-02 2022-12-02 一种基于实体关系获取链接实体的数据处理系统

Country Status (1)

Country Link
CN (1) CN115795051B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117435697A (zh) * 2023-12-21 2024-01-23 中科雨辰科技有限公司 一种获取核心事件的数据处理系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190311275A1 (en) * 2018-04-10 2019-10-10 Beijing Baidu Netcome Science and Technology Co., Ltd. Method and apparatus for recommending entity
CN112560485A (zh) * 2020-11-24 2021-03-26 北京三快在线科技有限公司 一种实体链接方法、装置、电子设备及存储介质
CN113157946A (zh) * 2021-05-14 2021-07-23 咪咕文化科技有限公司 实体链接方法、装置、电子设备及存储介质
WO2021212682A1 (zh) * 2020-04-21 2021-10-28 平安国际智慧城市科技股份有限公司 知识抽取方法、装置、电子设备及存储介质
CN113761218A (zh) * 2021-04-27 2021-12-07 腾讯科技(深圳)有限公司 一种实体链接的方法、装置、设备及存储介质
WO2022140900A1 (zh) * 2020-12-28 2022-07-07 华为技术有限公司 个人知识图谱构建方法、装置及相关设备
CN115129883A (zh) * 2022-05-27 2022-09-30 腾讯科技(深圳)有限公司 实体链接方法和装置、存储介质及电子设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190311275A1 (en) * 2018-04-10 2019-10-10 Beijing Baidu Netcome Science and Technology Co., Ltd. Method and apparatus for recommending entity
WO2021212682A1 (zh) * 2020-04-21 2021-10-28 平安国际智慧城市科技股份有限公司 知识抽取方法、装置、电子设备及存储介质
CN112560485A (zh) * 2020-11-24 2021-03-26 北京三快在线科技有限公司 一种实体链接方法、装置、电子设备及存储介质
WO2022140900A1 (zh) * 2020-12-28 2022-07-07 华为技术有限公司 个人知识图谱构建方法、装置及相关设备
CN113761218A (zh) * 2021-04-27 2021-12-07 腾讯科技(深圳)有限公司 一种实体链接的方法、装置、设备及存储介质
CN113157946A (zh) * 2021-05-14 2021-07-23 咪咕文化科技有限公司 实体链接方法、装置、电子设备及存储介质
CN115129883A (zh) * 2022-05-27 2022-09-30 腾讯科技(深圳)有限公司 实体链接方法和装置、存储介质及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117435697A (zh) * 2023-12-21 2024-01-23 中科雨辰科技有限公司 一种获取核心事件的数据处理系统
CN117435697B (zh) * 2023-12-21 2024-03-22 中科雨辰科技有限公司 一种获取核心事件的数据处理系统

Also Published As

Publication number Publication date
CN115795051B (zh) 2023-05-23

Similar Documents

Publication Publication Date Title
CN115618140B (zh) 一种获取链接实体的数据处理系统
US11232141B2 (en) Method and device for processing an electronic document
CN109885692B (zh) 知识数据存储方法、装置、计算机设备和存储介质
WO2021012519A1 (zh) 基于人工智能的问答方法、装置、计算机设备及存储介质
CN112651238A (zh) 训练语料扩充方法及装置、意图识别模型训练方法及装置
CN110166522B (zh) 服务器识别方法、装置、可读存储介质和计算机设备
CN113011529B (zh) 文本分类模型的训练方法、装置、设备及可读存储介质
US20180276244A1 (en) Method and system for searching for similar images that is nearly independent of the scale of the collection of images
CN112699923A (zh) 文档分类预测方法、装置、计算机设备及存储介质
CN115795051A (zh) 一种基于实体关系获取链接实体的数据处理系统
CN111324687A (zh) 知识库中数据处理方法、装置、计算机设备和存储介质
WO2015134310A1 (en) Cross indexing with grouplets
CN116032741A (zh) 一种设备识别方法、装置、电子设备和计算机存储介质
CN110471854B (zh) 一种基于高维数据混合约简的缺陷报告指派方法
Boillet et al. Confidence estimation for object detection in document images
CN116167339B (zh) 一种基于实体关系获取链接实体的数据处理系统
CN112364169B (zh) 基于nlp的wifi识别方法、电子设备和介质
CN115757801A (zh) 用于医疗文本的基于决策树的模型训练方法和装置
CN115017144A (zh) 一种基于图神经网络的司法文书案情要素实体识别方法
CN112905820B (zh) 一种基于逻辑学习的多图检索方法
CN111460268B (zh) 数据库查询请求的确定方法、装置和计算机设备
JP6844565B2 (ja) ニューラルネットワーク装置及びプログラム
CN107480469B (zh) 一种用于在基因序列中快速搜索给定模式的方法
CN116579344B (zh) 一种案件主体抽取方法
WO2018100700A1 (ja) データ変換装置とデータ変換方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant