CN115563287B - 一种获取关联对象的数据处理系统 - Google Patents

一种获取关联对象的数据处理系统 Download PDF

Info

Publication number
CN115563287B
CN115563287B CN202211534326.3A CN202211534326A CN115563287B CN 115563287 B CN115563287 B CN 115563287B CN 202211534326 A CN202211534326 A CN 202211534326A CN 115563287 B CN115563287 B CN 115563287B
Authority
CN
China
Prior art keywords
event
tag
list
label
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211534326.3A
Other languages
English (en)
Other versions
CN115563287A (zh
Inventor
张正义
刘羽
傅晓航
刘宸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongke Yuchen Technology Co Ltd
Original Assignee
Zhongke Yuchen Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongke Yuchen Technology Co Ltd filed Critical Zhongke Yuchen Technology Co Ltd
Priority to CN202211534326.3A priority Critical patent/CN115563287B/zh
Publication of CN115563287A publication Critical patent/CN115563287A/zh
Application granted granted Critical
Publication of CN115563287B publication Critical patent/CN115563287B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Devices For Executing Special Programs (AREA)

Abstract

本发明提供了一种获取关联对象的数据处理系统,系统包括:初始事件标签列表、处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:根据初始事件标签列表获取初始事件标签列表对应的第一关键事件标签集和初始事件标签列表对应的第二关键事件标签集,根据第一事件标签集和第二事件标签集,获取第一事件标签集对应的第一优先级集以及第二事件标签集对应的第二优先级集,根据第一优先级集和第二优先级集获取初始事件标签列表对应的指定事件标签集,根据目标对象对应的目标事件标签和指定事件标签集,获取目标对象的关联对象,本发明考虑事件发生的先后顺序和事件之间的相关性,使得获取到的关联对象的准确度较高。

Description

一种获取关联对象的数据处理系统
技术领域
本发明涉及事件处理技术领域,特别是涉及一种获取关联对象的数据处理系统。
背景技术
随着互联网的普及和发展,大量自然语言文本通过网络产生和传播,自然语言文本具有结构不统一和更新速度快等特点,如何从大量自然语言文本中及时准确地获取所需文本成为当前热门研究问题,自然语言文本中包含大量事件,例如新闻文本中包含大量新闻事件,通过准确获取新闻文本中的事件对象的文本能够为用户提供全面的新闻事件,并同时能够对新闻文本进行不断更新。
目前,现有技术中,获取关联对象的方法为:通过事件抽取模型进行事件抽取,从而获取对象,将获取到的对象与数据库中的对象进行相似度比较,从而获取相关联的对象。
综上所述获取关联对象的方法存在的问题:一方面,未考虑事件发生的先后顺序,无法获取事件相关的事件,会造成在获取事件的文本集的过程中相关事件遗漏的问题;
另一方面,局限于事件相似度的比较,未考虑事件之间的相关性,使得获取到的关联对象的准确度较低。
发明内容
针对上述技术问题,本发明采用的技术方案为:一种获取关联对象的数据处理系统,系统包括:初始事件标签列表E={E1,E2,……,Ei,……,Em}、处理器和存储有计算机程序的存储器,其中,Ei为第i个初始事件标签,i=1,2,……,m,m为初始事件标签的数量,当计算机程序被处理器执行时,实现以下步骤:
S100,根据E,获取E对应的第一关键事件标签集A={A1,A2,……,Ai,……,Am}和E对应的第二关键事件标签集A0={A0 1,A0 2,……,A0 i,……,A0 m},Ai={E'i,Ei},其中,Ai中关键事件标签列表E'i的排序在Ei之前,表示为E'i中任一关键事件标签对应的事件发生在Ei对应的事件之前,A0 i={Ei,E'i},其中,A0 i中关键事件标签列表E'i的排序在Ei之后,表示为E'i中任一关键事件标签对应的事件发生在Ei对应的事件之后。
S200,根据A和A0,获取A对应的第一优先级集B={B1,B2,……,Bi,……,Bm}和A0对应的第二优先级集B0={B0 1,B0 2,……,B0 i,……,B0 m},Bi为Ai对应的第一优先级列表,B0 i为A0 i对应的第二优先级列表,其中,在S200中通过以下步骤获取Bi和B0 i
S201,获取E'i={E'i1,E'i2,……,E'ij,……,E'in},E'ij为Ei对应的第j个关键事件标签,j=1,2,……,n,n为关键事件标签的数量,n=m-1,其中,Ei对应的关键事件标签为E中除Ei之外的任一初始事件标签。
S203,基于E'i和Ei,获取Bi={Bi1,Bi2,……,Bij,……,Bin},Bij符合如下条件:
Bijijij,其中,εij为第一对象数量,λij为第二对象数量。
S205,根据Bi,获取B0 i={B0 i1,B0 i2,……,B0 ij,……,B0 in},B0 ij符合如下条件:
B0 ij=1-Bij
S300,根据B和B0,获取E对应的指定事件标签集D={D1,D2,……,Di,……,Dm},Di={Di1,Di2},Di1为Ei对应的第一指定事件标签列表,Di2为Ei对应的第二指定事件标签列表。
S400,根据目标对象对应的目标事件标签和D,获取目标对象的关联对象。
本发明提供了一种获取关联对象的数据处理系统,系统包括:初始事件标签列表、处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:根据初始事件标签列表获取初始事件标签列表对应的第一关键事件标签集和初始事件标签列表对应的第二关键事件标签集,即获取发生在初始事件标签对应事件之前的事件标签以及发生在初始事件标签对应事件之后的事件标签,根据第一事件标签集和第二事件标签集,获取第一事件标签集对应的第一优先级集以及第二事件标签集对应的第二优先级集,根据第一优先级集和第二优先级集获取初始事件标签列表对应的指定事件标签集,根据目标对象对应的目标事件标签和指定事件标签集,获取目标对象的关联对象。可知,本发明一方面,考虑事件发生的先后顺序,获取事件相关的事件,避免了在获取事件的文本集的过程中相关事件遗漏的问题;另一方面,不局限于事件相似度的比较,考虑事件之间的相关性,使得获取到的关联对象的准确度较高。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种获取关联对象的数据处理系统执行计算机程序时的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明提供了一种获取关联对象的数据处理系统,所述系统包括:初始事件标签列表E={E1,E2,……,Ei,……,Em}、处理器和存储有计算机程序的存储器,其中,Ei为第i个初始事件标签,i=1,2,……,m,m为初始事件标签的数量,当所述计算机程序被处理器执行时,实现以下步骤,如图1所示:
具体的,所述系统中还包括初始对象列表G={G1,G2,……,Gr,……,Gs}和G对应的初始文本列表G0={G0 1,G0 2,……,G0 r,……,G0 s},其中,Gr为第r个初始对象,G0 r为Gr对应的初始文本,r=1,2,……,s,s为初始对象的数量。
进一步的,所述初始文本为描述初始对象的文本,初始对象为存储在数据提供平台中对象,例如,人物等;其中,本领域技术人员知晓任意一个数据提供平台,均属于本发明的保护范围,在此不再赘述,例如,数据提供平台为维基百科平台等。
具体的,在S100之前通过以下步骤获取E:
S1,根据G0,获取G对应的初始对象标签集G'={G'1,G'2,……,G'r,……,G's},G'r={G'r1,G'r2,……,G'rg,……,G'rz(r)},G'rg为Gr对应的初始对象标签列表中第g个初始对象标签,g=1,2,……,z(r),z(r)为Gr对应的初始对象标签列表中初始对象标签的数量。
进一步的,在S1中通过以下步骤获取G'r
S11,根据G0 r,获取Gr对应的待选事件标签列表KGr
具体的,所述待选事件标签列表包括若干个待选事件标签,所述待选事件标签为待选事件对应的事件标签,其中,所述待选事件是指将初始文本输入至事件抽取模型中获取到的任一事件,本领域人员知晓,根据实际需求选取的任一事件抽取模型,均属于本发明的保护范围,在此不再赘述。
进一步的,所述事件标签为将文本输入至事件抽取模型中获取到的事件触发词,例如,事件触发词为结婚、离婚等。
S12,对KGr进行去重处理,获取到G'r;本领域人员知晓现有技术中任一标签去重处理的方法,均属于到本发明的保护范围,在此不再赘述。
S2,对G'进行去重处理,获取到E;可以理解为:获取每一初始对象对应的初始对象标签列表后,对所有的初始对象对应的初始对象标签列表构成的初始对象标签集进行去重处理,从而获取初始事件标签列表,本领域人员知晓现有技术中任一标签去重处理的方法,均属于到本发明的保护范围,在此不再赘述。
上述,根据初始对象对应的初始文本列表获取初始对象标签集,通过对获取到的初始对象标签集进行去重处理,从而获取初始标签列表,遍历了初始对象对应的初始文本集中的全部文本以获取初始标签列表,避免了事件标签的遗漏,使得后续获取关联对象的准确度较高。
S100,根据E,获取E对应的第一关键事件标签集A={A1,A2,……,Ai,……,Am}和E对应的第二关键事件标签集A0={A0 1,A0 2,……,A0 i,……,A0 m},Ai={E'i,Ei},其中,Ai中关键事件标签列表E'i的排序在Ei之前,表示为E'i中任一关键事件标签对应的事件发生在Ei对应的事件之前,A0 i={Ei,E'i},其中,A0 i中关键事件标签列表E'i的排序在Ei之后,表示为E'i中任一关键事件标签对应的事件发生在Ei对应的事件之后。
上述,遍历初始事件标签集获取每个初始标签对应的第一关键事件标签和第二关键事件标签,能够获取到发生在每一初始事件标签对应的事件之前的事件和发生每一初始标签对应的事件之后的标签,从而有效获取到事件标签按照发生的先后顺序进行排序形成的标签,避免了相关事件标签的遗漏,从而提高关联对象的准确性。
S200,根据A和A0,获取A对应的第一优先级集B={B1,B2,……,Bi,……,Bm}和A0对应的第二优先级集B0={B0 1,B0 2,……,B0 i,……,B0 m},Bi为Ai对应的第一优先级列表,B0 i为A0 i对应的第二优先级列表。
具体的,在S200中通过以下步骤获取Bi和B0 i
S201,获取E'i={E'i1,E'i2,……,E'ij,……,E'in},E'ij为Ei对应的第j个关键事件标签,j=1,2,……,n,n为关键事件标签的数量。
进一步的,Ei对应的关键事件标签为E中除Ei之外的任一初始事件标签。
S203,基于E'i和Ei,获取Bi={Bi1,Bi2,……,Bij,……,Bin},Bij符合如下条件:
Bijijij,其中,εij为第一对象数量,λij为第二对象数量。
进一步的,在S203中还包括如下步骤:
S2031,获取G'对应的初始时间列表T={T1,T2,……,Tr,……,Ts},Tr={Tr1,Tr2,……,Trg,……,Trz(r)},Trg为G'rg对应的事件发生时间;其中,本领域技术人员知晓,在将初始文本输入至事件抽取模型中获取到的任一事件的同时,还可以获取事件发生时间,在此不再赘述。
进一步的,Tr是按照事件发生的先后顺序进行排序的,可以理解为:G'rg对应的事件发生在G'rg+1对应的事件之前。
S2032,遍历G'r且当G'r∩Ei∩E'ij≠Null时,将Gr作为第一对象,以使得根据所有的第一对象,构建第一对象列表。
S2033,获取第一对象列表对应的第一标签集,其中,第一标签集包括若干个第一标签列表,其中任一第一标签列表为每一第一对象对应的初始对象标签列表。
S2034,从任一第一标签列表中获取第一子标签和第二子标签,其中,所述第一子标签为在第一标签列表中与Ei一致的初始标签,所述第二子标签为在第一标签列表中与E'ij一致的初始标签。
S2035,从Tr中获取第一子标签对应的事件发生时间和第二子标签对应的事件发生时间。
S2036,当第一子标签对应的事件发生时间大于第二子标签对应的事件发生时间时,将第一子标签对应的第一对象作为第二对象。
S205,根据Bi,获取B0 i={B0 i1,B0 i2,……,B0 ij,……,B0 in},B0 ij符合如下条件:
B0 ij=1-Bij
上述,获取每个初始事件标签对应的第一关键事件标签发生的优先级和第二关键事件标签发生的优先级,根据事件标签以及事件标签之间的优先级,有效获取到了事件标签之间的相关性,避免了事件标签对应的相关事件标签遗漏,提高了后续筛选发生在任意一个事件标签对应的事件之前的事件和发生在任意一个事件标签对应事件之后的事件的准确度,使得后续获取关联对象的准确度较高。
S300,根据B和B0,获取E对应的指定事件标签集D={D1,D2,……,Di,……,Dm},Di={Di1,Di2},Di1为Ei对应的第一指定事件标签列表,Di2为Ei对应的第二指定事件标签列表。
具体的,在S300中还包括如下步骤:
S301,当Bij≥B'时,将Bij对应的关键事件标签插入至Di1中。
S303,当B0 ij≥B'时,将B0 ij对应的关键事件标签插入至Di2中。
具体的,B'为预设的优先级阈值,本领域技术人员知晓,根据实际需求确定的优先级阈值,均属于本发明的保护范围,在此不再赘述。
进一步的,B'的取值范围为0.8~0.9。
优选的,B'的取值为0.9。
上述,判断两个事件标签按照时间先后进行排序所形成的标签能够发生的优先级,通过选择优先级满足预设条件所对应的事件标签获取发生在任意一个事件标签对应的事件之前的事件和发生在任意一个事件标签对应的事件之后的事件,提高了获取到的与任意一个事件标签对应的事件相关联的事件的准确度,使得后续获取关联对象的准确度较高。
S400,根据目标对象对应的目标事件标签和D,获取目标对象的关联对象。
具体的,所述目标对象为用户需要查询的对象,例如,人物等。
具体的,所述目标事件标签为将目标对象对应的目标文本输入至事件抽取模型中,获取到的事件标签,其中,目标文本为用于描述用户需要查询的对象的文本。
进一步的,获取目标事件标签的事件抽取模型与获取初始事件标签的事件抽取模型一致,在此不再赘述。
具体的,在S400中还包括如下步骤:
S401,获取目标对象对应的目标对象编码向量U0和目标事件标签对应的目标事件标签编码向量E0
具体的,目标对象编码向量通过将目标对象输入至文本编码模型中,本领域技术人员知晓,现有技术中任一获取编码向量的方法,均属于本发明的保护范围,在此不再赘述。
进一步的,所述目标事件标签编码向量的获取方式与目标编码向量的获取方式一致。
S403,根据U0和G,获取U0对应的候选事件标签集。
具体的,在S403中还包括如下步骤:
S4031,获取U0对应的第一相似度列表H0={H0 1,H0 2,……,H0 r,……,H0 s},H0 r为U0与Gr对应的初始对象编码向量之间的第一相似度,本领域技术人员知晓,现有技术中任一获取编码向量之间的相似度的方法,均属于本发明的保护范围,在此不再赘述。
进一步的,U0的维度与Gr对应的初始对象编码向量的维度一致。
S4033,当H0 r=H'时,将KGr插入至U0对应的候选事件标签集中,其中,H'为预设的相似度阈值。
具体的,H'的取值为1。
S405,根据E0和D,获取E0对应的最终事件标签集。
具体的,在S405中还包括如下步骤:
S4051,获取E0对应的第二相似度列表F0={F0 1,F0 2,……,F0 i,……,F0 m},F0 i为E0与Ei对应的初始事件标签编码向量之间的第二相似度,本领域技术人员知晓,现有技术中任一获取编码向量之间的相似度的方法,均属于本发明的保护范围,在此不再赘述。
进一步的,E0的维度与Ei对应的初始事件标签编码向量的维度一致。
S4053,当F0 i=H'时,将Di作为E0对应的最终事件标签集。
S407,根据候选事件标签集和最终事件标签集,获取目标对象对应的关联对象。
具体的,S407中还包括如下步骤:
S4071,获取第一事件标签集,所述第一事件标签集包括若干个第一事件标签列表,其中,所述第一事件标签列表为候选事件标签集中任一待选事件标签列表与最终事件标签集中的第一指定关键事件标签列表之间的交集构建成的标签列表。
S4072,当第一事件标签集为空集时,获取第二事件标签集,所述第二事件标签集包括若干个第二事件标签列表,其中,所述第二事件标签列表为候选事件标签集中任一待选事件标签列表与最终事件标签集中的第二指定关键事件标签列表之间的交集构建成的标签列表。
S4073,当第二事件标签集为空集时,将候选事件标签集中任一待选事件标签列表对应的初始对象作为目标对象的关联对象。
S4074,当第二事件标签集不为空集时,获取第三事件标签集,其中,所述第三事件标签集包括若干个第三事件标签列表,第三事件标签列表为第二事件标签集中删除不为空集的第二事件标签列表后的任一第二事件标签列表。
S4075,将第三事件标签列表对应的初始对象作为目标对象的关联对象。
S4076,当第一事件标签集不为空集时,获取第一中间事件标签集,其中,所述第一中间事件标签集包括若干个第一中间事件标签列表,第一中间事件标签列表为不为空集的第一事件标签列表。
S4077,根据第一中间事件标签列表,从候选事件标签集中获取第一中间事件标签列表对应的待选事件标签列表作为第二中间事件标签列表。
S4078,当第二中间事件标签列表为空集时,将第二中间事件标签列表对应的初始对象作为目标对象的关联对象。
上述,获取目标对象编码向量对应的候选事件标签集和目标事件标签编码向量对应的最终事件标签集,将候选事件标签集与最终事件标签集进行对比,从而获取目标对象的关联对象,不局限于找与目标对象相似的对象,考虑了发生在目标事件标签对应的事件之前的事件和发生在目标事件标签对应的事件之后的事件,提高了获取到的关联对象的准确度。
本发明提供了一种获取关联对象的数据处理系统,系统包括:初始事件标签列表、处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:根据初始事件标签列表获取初始事件标签列表对应的第一关键事件标签集和初始事件标签列表对应的第二关键事件标签集,即获取发生在初始事件标签对应事件之前的事件标签以及发生在初始事件标签对应事件之后的事件标签,根据第一事件标签集和第二事件标签集,获取第一事件标签集对应的第一优先级集以及第二事件标签集对应的第二优先级集,根据第一优先级集和第二优先级集获取初始事件标签列表对应的指定事件标签集,根据目标对象对应的目标事件标签和指定事件标签集,获取目标对象的关联对象。可知,本发明一方面,考虑事件发生的先后顺序,获取事件相关的事件,避免了在获取事件的文本集的过程中相关事件遗漏的问题;另一方面,不局限于事件相似度的比较,考虑事件之间的相关性,使得获取到的关联对象的准确度较高。
虽然已经通过示例对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员还应理解,可以对实施例进行多种修改而不脱离本发明的范围和精神。本发明开的范围由所附权利要求来限定。

Claims (7)

1.一种获取关联对象的数据处理系统,其特征在于,所述系统包括:初始事件标签列表E={E1,E2,……,Ei,……,Em}、初始对象列表G={G1,G2,……,Gr,……,Gs}、G对应的初始文本集G0={G0 1,G0 2,……,G0 r,……,G0 s}、处理器和存储有计算机程序的存储器,其中,Ei为第i个初始事件标签,i=1,2,……,m,m为初始事件标签的数量,Gr为第r个初始对象,G0 r为Gr对应的初始文本列表,r=1……s,s为初始对象的数量,当所述计算机程序被处理器执行时,实现以下步骤:
S100,根据E,获取E对应的第一关键事件标签集A={A1,A2,……,Ai,……,Am}和E对应的第二关键事件标签集A0={A0 1,A0 2,……,A0 i,……,A0 m},Ai={E'i,Ei},其中,Ai中关键事件标签列表E'i的排序在Ei之前,表示为E'i中任一关键事件标签对应的事件发生在Ei对应的事件之前,A0 i={Ei,E'i},其中,A0 i中关键事件标签列表E'i的排序在Ei之后,表示为E'i中任一关键事件标签对应的事件发生在Ei对应的事件之后;
其中,在S100之前通过以下步骤获取E:
S1,根据G0,获取G对应的初始对象标签集G'={G'1,G'2,……,G'r,……,G's},G'r={G'r1,G'r2,……,G'rg,……,G'rz(r)},G'rg为Gr对应的初始对象标签列表中第g个初始对象标签,g=1,2,……,z(r),z(r)为Gr对应的初始对象标签列表中初始对象标签的数量;
S2,对G'进行去重处理,获取到E;
S200,根据A和A0,获取A对应的第一优先级集B={B1,B2,……,Bi,……,Bm}和A0对应的第二优先级集B0={B0 1,B0 2,……,B0 i,……,B0 m},Bi为Ai对应的第一优先级列表,B0 i为A0 i对应的第二优先级列表,其中,在S200中通过以下步骤获取Bi和B0 i
S201,获取E'i={E'i1,E'i2,……,E'ij,……,E'in},E'ij为Ei对应的第j个关键事件标签,j=1,2,……,n,n为关键事件标签的数量,其中,Ei对应的关键事件标签为E中除Ei之外的任一初始事件标签;
S203,基于E'i和Ei,获取Bi={Bi1,Bi2,……,Bij,……,Bin},Bij符合如下条件:
Bijijij,其中,εij为第一对象数量,λij为第二对象数量;
其中,在S203中还包括如下步骤:
S2031,获取G'对应的初始时间列表T={T1,T2,……,Tr,……,Ts},Tr={Tr1,Tr2,……,Trg,……,Trz(r)},Trg为G'rg对应的事件发生时间;
S2032,遍历G'r且当G'r∩Ei∩E'ij≠Null时,将Gr作为第一对象,以使得根据所有的第一对象,构建第一对象列表;
S2033,获取第一对象列表对应的第一标签集,其中,第一标签集包括若干个第一标签列表,其中任一第一标签列表为每一第一对象对应的初始对象标签列表;
S2034,从任一第一标签列表中获取第一子标签和第二子标签,其中,所述第一子标签为在第一标签列表中与Ei一致的初始标签,所述第二子标签为在第一标签列表中与E'ij一致的初始标签;
S2035,从Tr中获取第一子标签对应的事件发生时间和第二子标签对应的事件发生时间;
S2036,当第一子标签对应的事件发生时间大于第二子标签对应的事件发生时间时,将第一子标签对应的第一对象作为第二对象;
S205,根据Bi,获取B0 i={B0 i1,B0 i2,……,B0 ij,……,B0 in},B0 ij符合如下条件:
B0 ij=1-Bij
S300,根据B和B0,获取E对应的指定事件标签集D={D1,D2,……,Di,……,Dm},Di={Di1,Di2},Di1为Ei对应的第一指定事件标签列表,Di2为Ei对应的第二指定事件标签列表;
S400,根据目标对象对应的目标事件标签和D,获取目标对象的关联对象。
2.根据权利要求1所述的获取关联对象的数据处理系统,其特征在于,在S1中通过以下步骤获取G'r
S11,根据Gr和G0 r,获取Gr对应的待选事件标签列表KGr
S12,对KGr进行去重处理,获取到G'r
3.根据权利要求1所述的获取关联对象的数据处理系统,其特征在于,在S300中还包括如下步骤:
S301,当Bij≥B'时,将Bij对应的关键事件标签插入至Di1中,其中,B'为预设的优先级阈值;
S303,当B0 ij≥B'时,将B0 ij对应的关键事件标签插入至Di2中。
4.根据权利要求1所述的获取关联对象的数据处理系统,其特征在于,在S400中还包括如下步骤:
S401,获取目标对象对应的目标对象编码向量U0和目标事件标签对应的目标事件标签编码向量E0
S403,根据U0和G,获取U0对应的候选事件标签集;
S405,根据E0和D,获取E0对应的最终事件标签集;
S407,根据候选事件标签集和最终事件标签集,获取目标对象对应的关联对象。
5.根据权利要求4所述的获取关联对象的数据处理系统,其特征在于,在S403中还包括如下步骤:
S4031,获取U0对应的第一相似度列表H0={H0 1,H0 2,……,H0 r,……,H0 s},H0 r为U0与Gr对应的初始对象编码向量之间的第一相似度;
S4033,当H0 r=H'时,将KGr插入至U0对应的候选事件标签集中,其中,H'为预设的相似度阈值。
6.根据权利要求5所述的获取关联对象的数据处理系统,其特征在于,H'的取值为1。
7.根据权利要求4所述的获取关联对象的数据处理系统,其特征在于,在S405中还包括如下步骤:
S4051,获取E0对应的第二相似度列表F0={F0 1,F0 2,……,F0 i,……,F0 m},F0 i为E0与Ei对应的初始事件标签编码向量之间的第二相似度;
S4053,当F0 i=H'时,将Di作为E0对应的最终事件标签集。
CN202211534326.3A 2022-12-02 2022-12-02 一种获取关联对象的数据处理系统 Active CN115563287B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211534326.3A CN115563287B (zh) 2022-12-02 2022-12-02 一种获取关联对象的数据处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211534326.3A CN115563287B (zh) 2022-12-02 2022-12-02 一种获取关联对象的数据处理系统

Publications (2)

Publication Number Publication Date
CN115563287A CN115563287A (zh) 2023-01-03
CN115563287B true CN115563287B (zh) 2023-03-17

Family

ID=84770247

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211534326.3A Active CN115563287B (zh) 2022-12-02 2022-12-02 一种获取关联对象的数据处理系统

Country Status (1)

Country Link
CN (1) CN115563287B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115797849B (zh) * 2023-02-03 2023-04-28 以萨技术股份有限公司 一种基于图像确定异常行为的数据处理系统
CN116071924B (zh) * 2023-02-03 2023-09-22 以萨技术股份有限公司 一种基于任务分配获取目标车流量的数据处理系统
CN116092023B (zh) * 2023-02-03 2023-10-20 以萨技术股份有限公司 一种确定异常行为的数据处理系统
CN115797883B (zh) * 2023-02-06 2023-04-28 以萨技术股份有限公司 一种确定异常事件的数据处理系统
CN116257760B (zh) * 2023-05-11 2023-08-11 浪潮电子信息产业股份有限公司 一种数据划分方法、系统、设备及计算机可读存储介质
CN116684205B (zh) * 2023-08-03 2023-09-29 北京立思辰安科技术有限公司 一种获取网络系统异常程度的方法、介质及设备
CN117435697B (zh) * 2023-12-21 2024-03-22 中科雨辰科技有限公司 一种获取核心事件的数据处理系统
CN117473093B (zh) * 2023-12-25 2024-04-12 中科雨辰科技有限公司 一种基于llm模型获取目标事件的数据处理系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6738737B1 (en) * 1999-02-18 2004-05-18 Cirrus Logic, Inc. Race condition ordering and functional verification system and method
CN110688495B (zh) * 2019-12-09 2020-04-24 武汉中科通达高新技术股份有限公司 一种事件信息的知识图谱模型构建方法、装置、存储介质
CN114925692B (zh) * 2022-07-21 2022-10-11 中科雨辰科技有限公司 一种获取目标事件的数据处理系统
CN114996414B (zh) * 2022-08-05 2022-09-30 中科雨辰科技有限公司 一种确定相似事件的数据处理系统

Also Published As

Publication number Publication date
CN115563287A (zh) 2023-01-03

Similar Documents

Publication Publication Date Title
CN115563287B (zh) 一种获取关联对象的数据处理系统
CN109522557B (zh) 文本关系抽取模型的训练方法、装置及可读存储介质
CN108804641B (zh) 一种文本相似度的计算方法、装置、设备和存储介质
CN112231555B (zh) 基于用户画像标签的召回方法、装置、设备及存储介质
CN109117442B (zh) 一种应用推荐方法及装置
CN112733545A (zh) 文本分块方法、装置、计算机设备和存储介质
CN112364014B (zh) 数据查询方法、装置、服务器及存储介质
CN112685475A (zh) 报表查询方法、装置、计算机设备及存储介质
CN110866102A (zh) 检索处理方法
CN115544215B (zh) 一种关联对象的获取方法、介质及设备
CN113918807A (zh) 数据推荐方法、装置、计算设备及计算机可读存储介质
CN110597977B (zh) 数据处理方法、装置、计算机设备和存储介质
CN112800226A (zh) 用于获取文本分类模型的方法、用于文本分类的方法、装置及设备
CN112395881A (zh) 物料标签的构建方法、装置、可读存储介质及电子设备
CN115017269B (zh) 一种确定相似文本的数据处理系统
CN114742062B (zh) 文本关键词提取处理方法及系统
CN115098619A (zh) 资讯去重方法、装置、电子设备及计算机可读取存储介质
CN112416754B (zh) 一种模型评测方法、终端、系统及存储介质
CN113239259A (zh) 确定相似店铺的方法和装置
CN113688633A (zh) 一种提纲确定方法及装置
CN112579774A (zh) 模型训练方法、模型训练装置及终端设备
CN112667809A (zh) 一种文本处理方法、装置及电子设备、存储介质
CN107622129B (zh) 一种知识库的组织方法及装置、计算机存储介质
CN111199170A (zh) 配方文件识别方法及装置、电子设备、存储介质
CN114723073B (zh) 语言模型预训练、产品搜索方法、装置以及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant