CN114580392B - 一种识别实体的数据处理系统 - Google Patents

一种识别实体的数据处理系统 Download PDF

Info

Publication number
CN114580392B
CN114580392B CN202210466016.6A CN202210466016A CN114580392B CN 114580392 B CN114580392 B CN 114580392B CN 202210466016 A CN202210466016 A CN 202210466016A CN 114580392 B CN114580392 B CN 114580392B
Authority
CN
China
Prior art keywords
entity
target
characteristic
similarity
obtaining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210466016.6A
Other languages
English (en)
Other versions
CN114580392A (zh
Inventor
张正义
傅晓航
常鸿宇
刘羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongke Yuchen Technology Co Ltd
Original Assignee
Zhongke Yuchen Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongke Yuchen Technology Co Ltd filed Critical Zhongke Yuchen Technology Co Ltd
Priority to CN202210466016.6A priority Critical patent/CN114580392B/zh
Publication of CN114580392A publication Critical patent/CN114580392A/zh
Application granted granted Critical
Publication of CN114580392B publication Critical patent/CN114580392B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及实体识别技术领域,尤其是一种识别实体的数据处理系统。所述系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括样本实体集,当所述计算机程序被处理器执行时,实现以下步骤:获取目标实体的特征列表和从数据库中获取任一样本实体的特征列表,从目标实体的特征列表确定出目标实体的第一目标特征列表且从样本实体的特征列表确定出样本实体的第二目标特征列表,基于第一目标特征列表与第二目标特征列表获取相似度,当相似度满足预设条件时,确定目标实体等于样本实体;本发明能够准确的识别出实体,避免因无法准确的识别出实体导致无法获取实体的相关信息。

Description

一种识别实体的数据处理系统
技术领域
本发明涉及实体识别技术领域,尤其涉及一种识别实体的数据处理系统。
背景技术
在文本中需要对专有实体进行识别,例如、人名、地名、玩具名等专有名称;现有技术中,对专有实体识别方法主要分为基于规则词典的方法和基于统计模型的方法,基于规则词典的方法主要通过构建线下大规模的实体词典以字符串匹配的方式来进行识别,基于统计模型的方法主要是通过构建统计模型,利用人工标注的训练语料来训练模型从而进行识别。
但是,无论是基于规则词典的方式还是基于规则词典的方式都无法准确的识别出专有实体且也无法确定已识别的实体是否为已知的专有名词,进而导致无法准确的获取专有实体信息。
发明内容
针对上述技术问题,本发明采用的技术方案为一种识别实体的数据处理系统,所述系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括样本实体集B={B1,……,Bi,……,Bm},Bi是指第i个样本实体的特征列表,i=1……m,m为样本实体数量,当所述计算机程序被处理器执行时,实现以下步骤:
S100、获取目标实体的特征列表A={A1,……,Aj,……,An},Aj是指目标实体的第j特征的特征字符串,j=1……n,n为特征类型数量;
S200、从数据库中获取任一Bi={Bi1,……,Bij,……,Bin},Bij是指第i个样本实体对应的第j个特征的特征字符串;
S300、根据A,获取到目标实体的第一目标特征列表C={C1,……,Cr,……,Cs},Cr是指目标实体对应的第r个第一目标特征的特征字符串,r=1……s,s为目标实体的第一目标特征数量;
S400、根据Bi,获取到样本实体的第二目标特征列表Di={Di1,……,Dir,……,Dis},Dr是指样本实体对应的第r个第二目标特征的特征字符串;
S500、根据C和Di,获取目标实体与第i个样本实体之间的相似度Fi,以构建目标实体的相似度列表F={F1,……,Fi,……,Fm},其中,Fi符合如下条件:
Figure 400825DEST_PATH_IMAGE002
,Fir是指Cr与Dir之间的相似度,Wr是指Fir对应的权重值;
S600、遍历F且根据Fi,获取目标实体的目标相似度;
S700、根据目标相似度,获取到目标相似度对应的样本实体且将目标实体确定为目标相似度对应的样本实体。
本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明提供的一种识别实体的数据处理系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:
本发明的一种识别实体的数据处理系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括样本实体集,当所述计算机程序被处理器执行时,实现以下步骤:获取目标实体的特征列表和从数据库中获取任一样本实体的特征列表,从目标实体的特征列表确定出目标实体的第一目标特征列表且从样本实体的特征列表确定出样本实体的第二目标特征列表,基于第一目标特征列表与第二目标特征列表获取相似度,当相似度满足预设条件时,确定目标实体等于样本实体;能够准确的识别出实体,避免因无法准确的识别出实体导致无法获取实体的相关信息。
同时,对于特征的不同采用不同的相似度算法,有利于确定相似度的准确性,进而准确的确定目标实体是否为样本实体,避免因无法准确的识别出实体导致无法获取实体的相关信息。
此外,能够根据目标实体和样本实体之间相同特征数量,选择相似度阈值,使得更加准确的确定目标实体是否为样本实体。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
图1为本发明实施例提供的一种识别实体的数据处理系统的执行步骤的流程图。
具体实施方式
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种获取目标位置的数据处理系统的具体实施方式及其功效,详细说明如后。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例
本实施例提供了一种识别实体的数据处理系统,所述系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括样本实体集B={B1,……,Bi,……,Bm},Bi是指第i个样本实体的特征列表,i=1……m,m为样本实体数量,当所述计算机程序被处理器执行时,实现以下步骤:
S100、获取目标实体的特征列表A={A1,……,Aj,……,An},Aj是指目标实体的第j特征的特征字符串,j=1……n,n为特征类型数量。
具体地,在S100步骤中还通过如下步骤获取A:
S101、获取目标问题语句且从所述目标问题语句中提取出实体作为目标实体,本领域技术人员知晓采取现有技术中任一槽位填充方法获取目标实体,在此不再赘述。
具体地,所述目标问题语句是指用户需要查询的问题构成的语句,例如,目标问题语句句为:“T1海鸟号快艇有多长”,其中,目标实体为T1海鸟号快艇。
S103、将所述目标实体输入至预设细粒度模型中获取到A,本领域技术人员知晓选择现有技术中任一细粒度模型,在此在赘述。
优选地,n=3,例如,当T1海鸟号快艇输入至预设细粒度模型中,获取A={T1、海鸟号、快艇},其中,T1是型号,海鸟号是代号,快艇是类型。
S200、从数据库中获取任一Bi={Bi1,……,Bij,……,Bin},Bij是指第i个样本实体对应的第j个特征的特征字符串,其中,样本实体可以理解为已知的实体。
具体地,每一Bi均是通过所述预设细粒度模型进行获取,可以理解为:每一样本实体对应的特征维度与目标实体的特征类型一致。
优选地,A的特征顺序与Bi的特征顺序一致。
S300、根据A,获取到目标实体的第一目标特征列表C={C1,……,Cr,……,Cs},Cr是指目标实体对应的第r个第一目标特征的特征字符串,r=1……s,s为目标实体的第一目标特征数量。
具体地,在S300步骤中还通过如下步骤获取C:
S301、当Aj=null时,从A中删除Aj,获取目标实体的第一中间特征列表A'={A'1,……,A'x,……,A'q},A'x是指目标实体的第x个第一特征的特征字符串,x=1……q,q为目标实体的第一特征数量q≤n,可以理解为:第一中间特征列表为从目标实体的特征列表中删除空集特征的特征列表。
S303、当Bij=null时,从Bi中删除Bij,获取样本实体的第二中间特征列表B'i={B'i1,……,B'iy,……,B'ip},B'iy是指样本实体的第y个第二特征的特征字符串,y=1……p,p为样本实体的第二特征数量p≤n;可以理解为:第二中间特征列表为从样本实体的特征列表中删除空集特征的特征列表。
S305、当A'x对应的特征与每一B'iy对应的特征均不一致时,从A'中删除A'x,获取到C;通过将目标实体的特征列表和样本实体的特征列表中特征值为空集的特征进行删除,能够简化相似度的获取过程,避免无特征值的特征对获取目标实体和样本实体之间的相似度的干扰,提高目标实体和样本实体之间的相似度的获取准确性。
S400、根据Bi,获取到样本实体的第二目标特征列表Di={Di1,……,Dir,……,Dis},Dr是指样本实体对应的第r个第二目标特征的特征字符串。
具体地,在S400步骤中还通过如下步骤获取Di
S401、获取C;
S403、遍历C且从B'i中删除与Cr对应的特征不一致的第二特征,获取到Di
优选地,C的特征顺序和Di的特征顺序一致,能够有利于获取目标实体和样本实体之间相同特征的相似度。
S500、根据C和Di,获取目标实体与第i个样本实体之间的相似度Fi,以构建目标实体的相似度列表F={F1,……,Fi,……,Fm},其中,Fi符合如下条件:
Figure 492147DEST_PATH_IMAGE004
,Fir是指Cr与Dir之间的相似度,Wr是指Fir对应的权重值。
具体地,在S500步骤中还包括如下步骤:
S501、获取预设特征列表,其中,所述预设特征列表存储在数据库中,本领域技术人员根据实际需求设置所述预设特征列表,所述预设特征列表中预设特征对应的相似度采用同一获取方式。
S503、遍历C且当Cr对应的特征与预设特征类型列表中任一预设特征一致时,获取Fir,以根据Fir获取Fi,Fir符合如下条件:
Figure 559460DEST_PATH_IMAGE006
,其中,λir是指Cr和Dir之间的编辑距离,Uir是指在Cr对应的特征 字符串中字符数量与Dir对应的特征字符串中字符数量之间的最大字符数量。
S505、当Cr对应的特征与预设特征类型列表中任一预设特征不一致时,获取预设映射表,其中,所述预设映射表存储在数据库中,所述预设映射表是指任一非预设特征的特征值与相关特征值之间的映射关系列表,所述相关特征值是指任一非预设特征对应的相近特征值和/或者相似特征值,例如,快艇与快艇摩托相似。
S507、根据预设映射表且当Cr对应的特征与Dir对应的特征之间存在映射关系,则确定Fir=1,以根据Fir且获取Fi
S509、当Cr对应的特征与Dir对应的特征之间无映射关系,则将Cr对应的特征与Dir对应的特征输入至预设相似度模型中获取Fir,以根据Fir获取Fi
优选地,预设相似度模型为语义相似度模型,本领域技术人员可以采用任意一种语义相似度模型,在此不再赘述;能够对于特征的不同采用不同的相似度算法,有利于确定相似度的准确性,进而准确的确定目标实体是否为样本实体。
S600、遍历F且根据Fi,获取目标实体的目标相似度。
具体地,在S600步骤中还通过如下步骤获取目标相似度:
S601、获取目标实体的类型;例如,T1海鸟号快艇对应的类型为快艇、“某某”对应的类型为人物等。
S603、遍历Bi且当Bi对应的样本实体的类型与目标实体的类型不一致时,从F中删除Bi对应的Fi,构建中间相似度列表F'={F'1,……,F'g,……,F'z},F'g是指第g个中间相似度,g=1……z,z为中间相似度数量,能够排除一些与目标实体类型不一致的样本实体,减少数据搜索量,提高实体识别的准确和效率。
S605、当F'g≥F'g对应的相似度阈值Fg0,将F'g确定为目标实体的关键相似度且获取到F''={F''1,……,F''t,……,F''k},F''t是指目标实体的第t个关键相似度,t=1……k,k为关键相似度数量且k≤z。
具体地,在S605步骤中还通过如下步骤获取Fg0
S6051、获取预设的相似度阈值列表H={H1,……,Hj,……,Hn},其中,Hj是指当特征数量为j时的相似度阈值;
S6053、获取F'g对应的第一目标特征数量sg且当j=sg时,确定Fg0=Hj。能够根据目标实体和样本实体之间相同特征数量,选择相似度阈值,使得更加准确的确定目标实体是否为样本实体。
优选地,H1>……>Hj>……>Hn;可以理解为:当特征数量越少时,预设的相似度阈值越大,以使得当目标实体和样本实体之间相同特征数量较少时,准确的确定目标实体是否为样本实体。
S607、遍历F''且从F''中获取最大关键相似度作为目标相似度。
S700、根据目标相似度,获取到目标相似度对应的样本实体且将目标实体确定为目标相似度对应的样本实体。
本实施例提供了一种识别实体的数据处理系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括样本实体集,当所述计算机程序被处理器执行时,实现以下步骤:获取目标实体的特征列表和从数据库中获取任一样本实体的特征列表,从目标实体的特征列表确定出目标实体的第一目标特征列表且从样本实体的特征列表确定出样本实体的第二目标特征列表,基于第一目标特征列表与第二目标特征列表获取相似度,当相似度满足预设条件时,确定目标实体等于样本实体;能够准确的识别出实体,避免因无法准确的识别出实体导致无法获取实体的相关信息。
同时,对于特征的不同采用不同的相似度算法,有利于确定相似度的准确性,进而准确的确定目标实体是否为样本实体,避免因无法准确的识别出实体导致无法获取实体的相关信息。
此外,能够根据目标实体和样本实体之间相同特征数量,选择相似度阈值,使得更加准确的确定目标实体是否为样本实体。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (10)

1.一种识别实体的数据处理系统,其特征在于,所述系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括样本实体集B={B1,……,Bi,……,Bm},Bi是指第i个样本实体的特征列表,i=1……m,m为样本实体数量,当所述计算机程序被处理器执行时,实现以下步骤:
S100、获取目标实体的特征列表A={A1,……,Aj,……,An},Aj是指目标实体的第j特征的特征字符串,j=1……n,n为特征类型数量;
S200、从数据库中获取任一Bi={Bi1,……,Bij,……,Bin},Bij是指第i个样本实体对应的第j个特征的特征字符串;
S300、根据A,获取到目标实体的第一目标特征列表C={C1,……,Cr,……,Cs},Cr是指目标实体对应的第r个第一目标特征的特征字符串,r=1……s,s为目标实体的第一目标特征数量;
S400、根据Bi,获取到样本实体的第二目标特征列表Di={Di1,……,Dir,……,Dis},Di r是指样本实体对应的第r个第二目标特征的特征字符串;
S500、根据C和Di,获取目标实体与第i个样本实体之间的相似度Fi,以构建目标实体的相似度列表F={F1,……,Fi,……,Fm},其中,Fi符合如下条件:
Figure DEST_PATH_IMAGE002
,Fir是指Cr与Dir之间的相似度,Wr是指Fir对应的权重值;
在S500步骤中还包括如下步骤:
S501、获取预设特征列表;
S503、遍历C且当Cr对应的特征与预设特征类型列表中任一预设特征一致时,获取Fir,以根据Fir获取Fi,Fir符合如下条件:
Figure DEST_PATH_IMAGE004
,其中,λir是指Cr和Dir之间的编辑距离,Uir是指在Cr对应的特征字符串中字符数量与Dir对应的特征字符串中字符数量之间的最大字符数量;
S505、当Cr对应的特征与预设特征类型列表中任一预设特征不一致时,获取预设映射表,其中,所述预设映射表存储在数据库中,所述预设映射表是指任一非预设特征的特征值与相关特征值之间的映射关系列表,所述相关特征值是指任一非预设特征对应的相近特征值和/或者相似特征值;
S507、根据预设映射表且当Cr对应的特征与Dir对应的特征之间存在映射关系,则确定Fir=1,以根据Fir且获取Fi
S509、当Cr对应的特征与Dir对应的特征之间无映射关系,则将Cr对应的特征与Dir对应的特征输入至预设相似度模型中获取Fir,以根据Fir获取Fi
S600、遍历F且根据Fi,获取目标实体的目标相似度;
S700、根据目标相似度,获取到目标相似度对应的样本实体且将目标实体确定为目标相似度对应的样本实体。
2.根据权利要求1所述的识别实体的数据处理系统,其特征在于,在S100步骤中还通过如下步骤获取A:
S101、获取目标问题语句且从所述目标问题语句中提取出实体作为目标实体;
S103、将所述目标实体输入至预设细粒度模型中获取到A。
3.根据权利要求2所述的识别实体的数据处理系统,其特征在于,每一Bi均是通过所述预设细粒度模型进行获取。
4.根据权利要求1所述的识别实体的数据处理系统,其特征在于,A的特征顺序与Bi的特征顺序一致。
5.根据权利要求1所述的识别实体的数据处理系统,其特征在于,在S300步骤中还通过如下步骤获取C:
S301、当Aj=null时,从A中删除Aj,获取目标实体的第一中间特征列表A'={A'1,……,A'x,……,A'q},A'x是指目标实体的第x个第一特征的特征字符串,x=1……q,q为目标实体的第一特征数量q≤n;
S303、当Bij=null时,从Bi中删除Bij,获取样本实体的第二中间特征列表B'i={B'i1,……,B'iy,……,B'ip},B'iy是指样本实体的第y个第二特征的特征字符串,y=1……p,p为样本实体的第二特征数量p≤n;
S305、当A'x对应的特征与每一B'iy对应的特征均不一致时,从A'中删除A'x,获取到C。
6.根据权利要求5所述的识别实体的数据处理系统,其特征在于,在S400步骤中还通过如下步骤获取Di
S401、获取C;
S403、遍历C且从B'i中删除与Cr对应的特征不一致的第二特征,获取到Di
7.根据权利要求1所述的识别实体的数据处理系统,其特征在于,C的特征顺序和Di的特征顺序一致。
8.根据权利要求1所述的识别实体的数据处理系统,其特征在于,在S600步骤中还通过如下步骤获取目标相似度:
S601、获取目标实体的实体类型;
S603、遍历Bi且当Bi对应的样本实体的实体类型与目标实体的实体类型不一致时,从F中删除Bi对应的Fi,构建中间相似度列表F'={F'1,……,F'g,……,F'z},F'g是指第g个中间相似度,g=1……z,z为中间相似度数量;
S605、当F'g≥F'g对应的相似度阈值Fg0,将F'g确定为目标实体的关键相似度且获取到F''={F''1,……,F''t,……,F''k},F''t是指目标实体的第t个关键相似度,t=1……k,k为关键相似度数量且k≤z;
S607、遍历F''且从F''中获取最大关键相似度作为目标相似度。
9.根据权利要求8所述的识别实体的数据处理系统,其特征在于,在S605步骤中还通过如下步骤获取Fg0
S6051、获取预设的相似度阈值列表H={H1,……,Hj,……,Hn},其中,Hj是指当特征数量为j时的相似度阈值;
S6053、获取F'g对应的第一目标特征数量sg且当j=sg时,确定Fg0=Hj
10.根据权利要求9所述的识别实体的数据处理系统,其特征在于,
H1>……>Hj>……>Hn
CN202210466016.6A 2022-04-29 2022-04-29 一种识别实体的数据处理系统 Active CN114580392B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210466016.6A CN114580392B (zh) 2022-04-29 2022-04-29 一种识别实体的数据处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210466016.6A CN114580392B (zh) 2022-04-29 2022-04-29 一种识别实体的数据处理系统

Publications (2)

Publication Number Publication Date
CN114580392A CN114580392A (zh) 2022-06-03
CN114580392B true CN114580392B (zh) 2022-07-29

Family

ID=81783638

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210466016.6A Active CN114580392B (zh) 2022-04-29 2022-04-29 一种识别实体的数据处理系统

Country Status (1)

Country Link
CN (1) CN114580392B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115169319B (zh) * 2022-07-21 2023-02-07 中科雨辰科技有限公司 一种识别符号的数据处理系统
CN114996280B (zh) * 2022-08-01 2022-10-25 每日互动股份有限公司 一种数据表的字段信息纠正方法、装置、设备及介质
CN115408160B (zh) * 2022-09-16 2023-05-05 湖南胜云光电科技有限公司 一种进程监控的数据处理系统
CN115248837B (zh) * 2022-09-21 2022-12-23 中科雨辰科技有限公司 一种获取文本的地理实体的数据处理系统
CN115455950B (zh) * 2022-09-27 2023-06-16 中科雨辰科技有限公司 一种获取文本的数据处理系统
CN116226154B (zh) * 2023-05-05 2023-07-14 北京睿企信息科技有限公司 一种集群数据库的升级系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509479A (zh) * 2017-12-13 2018-09-07 深圳市腾讯计算机系统有限公司 实体推荐方法及装置、终端及可读存储介质
CN111401300A (zh) * 2020-04-07 2020-07-10 浙江大华技术股份有限公司 一种人脸聚类归档方法、装置及存储介质
CN112784018A (zh) * 2021-01-28 2021-05-11 新华智云科技有限公司 一种用于人物实体库的文本相似度实体消歧方法和系统
CN113239697A (zh) * 2021-06-01 2021-08-10 平安科技(深圳)有限公司 实体识别模型训练方法、装置、计算机设备及存储介质
CN113342909A (zh) * 2021-08-06 2021-09-03 中科雨辰科技有限公司 识别相同实体模型的数据处理系统
CN114091425A (zh) * 2021-11-25 2022-02-25 北京富通东方科技有限公司 医学实体对齐方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3138018A4 (en) * 2014-04-30 2017-10-11 Google, Inc. Identifying entities to be investigated using storefront recognition
CN105989040B (zh) * 2015-02-03 2021-02-09 创新先进技术有限公司 智能问答的方法、装置及系统
CN112908487B (zh) * 2021-04-19 2023-09-22 中国医学科学院医学信息研究所 一种临床指南更新内容的自动识别方法及系统
CN113935486B (zh) * 2021-12-16 2022-03-04 中科雨辰科技有限公司 一种知识图谱的建立方法、计算机设备和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509479A (zh) * 2017-12-13 2018-09-07 深圳市腾讯计算机系统有限公司 实体推荐方法及装置、终端及可读存储介质
CN111401300A (zh) * 2020-04-07 2020-07-10 浙江大华技术股份有限公司 一种人脸聚类归档方法、装置及存储介质
CN112784018A (zh) * 2021-01-28 2021-05-11 新华智云科技有限公司 一种用于人物实体库的文本相似度实体消歧方法和系统
CN113239697A (zh) * 2021-06-01 2021-08-10 平安科技(深圳)有限公司 实体识别模型训练方法、装置、计算机设备及存储介质
CN113342909A (zh) * 2021-08-06 2021-09-03 中科雨辰科技有限公司 识别相同实体模型的数据处理系统
CN114091425A (zh) * 2021-11-25 2022-02-25 北京富通东方科技有限公司 医学实体对齐方法及装置

Also Published As

Publication number Publication date
CN114580392A (zh) 2022-06-03

Similar Documents

Publication Publication Date Title
CN114580392B (zh) 一种识别实体的数据处理系统
JP3689455B2 (ja) 情報処理方法及び装置
CN110019732B (zh) 一种智能问答方法以及相关装置
CN110569328B (zh) 实体链接方法、电子装置及计算机设备
CN109684625B (zh) 实体处理方法、装置和存储介质
CN109634924B (zh) 基于机器学习的文件系统参数自动调优方法及系统
WO2003071450A2 (en) System and method for identifying relationships between database records
CN112732883A (zh) 基于知识图谱的模糊匹配方法、装置和计算机设备
US5553284A (en) Method for indexing and searching handwritten documents in a database
CN111460170B (zh) 一种词语识别方法、装置、终端设备及存储介质
CN110442702A (zh) 搜索方法、装置、可读存储介质和电子设备
CN112632261A (zh) 智能问答方法、装置、设备及存储介质
CN115982338A (zh) 一种基于查询路径排序的领域知识图谱问答方法及系统
CN116561388A (zh) 一种获取标签的数据处理系统
CN110795942B (zh) 基于语义识别的关键词确定方法、装置和存储介质
CN106570196B (zh) 视频节目的搜索方法和装置
CN113761151A (zh) 同义词挖掘、问答方法、装置、计算机设备和存储介质
CN112632406A (zh) 查询方法、装置、电子设备及存储介质
CN112651590B (zh) 一种指令处理流程推荐的方法
CN115797795A (zh) 基于强化学习的遥感影像问答式检索系统及方法
CN114021572B (zh) 一种自然语言处理方法、装置、设备及可读存储介质
CN113312523B (zh) 字典生成、搜索关键字推荐方法、装置和服务器
US7523115B2 (en) Method for finding objects
CN112965998A (zh) 一种化合物数据库建立及检索方法及系统
CN110633363A (zh) 一种基于nlp和模糊多准则决策的文本实体推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant