CN115248837B - 一种获取文本的地理实体的数据处理系统 - Google Patents
一种获取文本的地理实体的数据处理系统 Download PDFInfo
- Publication number
- CN115248837B CN115248837B CN202211148441.7A CN202211148441A CN115248837B CN 115248837 B CN115248837 B CN 115248837B CN 202211148441 A CN202211148441 A CN 202211148441A CN 115248837 B CN115248837 B CN 115248837B
- Authority
- CN
- China
- Prior art keywords
- geographic
- geographic entity
- entity
- entities
- list
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Remote Sensing (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种获取文本的地理实体的数据处理系统,通过获取目标文本对应的初始地理实体集并对初始地理实体列表进行处理获取第一地理实体集,第一地理实体信息包含第一地理实体以及第一地理实体的数量,并计算第一地理实体列表与预设的关键地理实体每个字符间的相似度,得到预设关键地理实体对应的第二地理实体集,对第二地理实体集进行处理获取目标地理实体列表,并通过逐步比较第二地理实体的数量确定目标地理实体列表,也就是目标文本具体描述的地理实体列表,因此,可以使目标地理实体列表的选取更加准确。
Description
技术领域
本发明涉及地理实体匹配技术领域,特别是涉及一种获取文本的地理实体的数据处理系统。
背景技术
现有技术中,当对文本中的地理实体进行识别时,往往对文本中的地理实体进行直接识别,并且当识别出的地理实体对应两个或多个地点时,不进行判断,随机输出其中一个识别得到的地理实体;另一个方法中,当识别出的地理实体对应两个或多个地点时,获取文本所在位置,判断文本所在位置与识别出的地理位置之间的距离,选择距离最近的进行输出。
现有技术中存在的问题为:输出的地理实体不够准确,存在和文本中描述的地点不同的情况,因此,会对用户理解文本内容带来误差。
发明内容
针对上述技术问题,本发明采用的技术方案为:
一种获取文本的地理实体的数据处理系统,包括:数据库、处理器和存储有计算机程序的存储器,其中,数据库包括:初始地理实体集,当计算机程序被处理器执行时,实现如下步骤:
S100、根据所述初始地理实体集,获取初始地理实体集对应的第一地理实体集A={A1,……,Ai,……,An},Ai={Ai1,……,Aig,……,Aiz},Aig为Ai对应的第g个第一地理实体信息,g的取值为1到z,z为第一地理实体信息的数量,i的取值为1到n,n为第一地理实体列表的数量,其中,第一地理实体信息包括:第一地理实体和第一地理实体对应第一获取实体数量;
S200、根据A和预设的关键地理实体A0,获取A0对应的第二地理实体集Z={Z1,……,Zt,……,Zk},Zt={Zt1,……,Ztg,……,Ztz},Ztg为Zt对应的第g个第二地理实体信息,t的取值为1到k,k为第二地理实体的数量,其中,第二地理实体信息包括:第二地理实体和第二地理实体对应的第二获取实体数量,所述第二地理实体为与A0之间的相似度都不小于D0的第一地理实体,D0为预设相似度阈值;
S300、若k=k0,将Zk作为目标地理实体列表,k0为预设的地理实体数量阈值;
S400、若k≠k0,获取第三地理实体集Cg={Cg 1,……,Cg e,……,Cg hg},Cg e={Cg e1,……,Cg eg,……,Cg ez},Cg eg为Cg e对应的第g个第三地理实体信息,e的取值为1到hg,hg为第三地理实体列表的数量,所述第三地理实体列表为SZgmax对应的第二地理实体列表,SZgmax为任一第二地理实体对应的第二获取实体数量的最大值;
S500、若hg=k0,将Cg hg作为目标地理实体列表;
S600、若hg≠k0,获取第四地理实体集Cg+1={Cg+1 1,……,Cg+1 d,……,Cg+1 w},Cg+1 d为第d个第四地理实体列表,d的取值为1到w,w为第四地理实体列表的数量,所述第四地理实体列表为Cg+1 max对应的第三地理实体列表,Cg+1 max为Cg中任一第g+1个第三地理实体数量的最大值。
本发明至少具有以下有益效果:
(1)通过获取目标文本对应的初始地理实体集并对初始地理实体列表进行处理获取第一地理实体集,第一地理实体信息包含第一地理实体以及第一地理实体的数量,并计算第一地理实体列表与预设的关键地理实体每个字符间的相似度,得到预设关键地理实体对应的第二地理实体集,对第二地理实体集进行处理获取目标地理实体列表,并通过逐步比较第二地理实体的数量确定目标地理实体列表,也就是目标文本具体描述的地理实体列表,因此,可以使目标地理实体列表的选取更加准确;
(2)当比较到第四地理实体列表的第g0个第四地理实体时,任一中间地理实体集中存在两个或两个以上中间地理实体列表时,可以通过获取目标文本发送时对应的地理实体列表与当前中间地理实体集中的中间地理实体列表进行相似度计算,并将当前中间地理实体集中与目标文本对应的地理实体列表相似度最大的中间地理实体列表作为目标地理实体列表,因此,在节省计算程序的基础上保证了准确性,节省了时间资源,提高了计算效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种获取文本的地理实体的数据处理系统执行计算机程序的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供一种获取文本的地理实体的数据处理系统,所述系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括:初始地理实体集,当计算机程序被处理器执行时,如图1所示,实现如下步骤:
S100、根据所述初始地理实体集,获取初始地理实体集对应的第一地理实体集A={A1,……,Ai,……,An},Ai={Ai1,……,Aig,……,Aiz},Aig为Ai对应的第g个第一地理实体信息,g的取值为1到z,z为第一地理实体信息的数量,i的取值为1到n,n为第一地理实体列表的数量,其中,第一地理实体信息包括:第一地理实体和第一地理实体对应第一获取实体数量。
优选地,r=5。
进一步地,原始地理实体列表按优先级的顺序从高到低排列,可以理解为,低优先级的原始地理实体在高优先级原始地理实体的区域范围内,所述高优先级的原始地理实体的区域范围包括多个低优先级的原始地理实体对应的区域范围。
进一步的,在S100中,还包括如下步骤获取A:
S110、获取初始地理实体集B={B1,……,Bj,……,Bm},Bj={Bj1,……,Bjr,……,Bjsj},Bjr为Bj对应的第r个初始地理实体,r的取值为1到sj,sj为Bj对应的初始地理实体的数量,j的取值为1到m,m为目标文本的数量。
具体地,本领域技术人员知晓,任意一种通过对目标文本地点进行识别获取目标文本对应的原始地理实体的方法均落入本发明保护范围内,在此不再赘述。
进一步地,遍历目标文本,获取初始地理实体,当获取到的两个初始地理实体或多个初始地理实体之间的字符数小于预设字符阈值B0时,将两个初始地理实体或多个初始地理实体按从国家实体信息到街道实体信息的顺序进行整理,获取整理后的地点信息Bj,本领域技术人员可根据实际需求设置预设字符阈值,在此不再赘述。
S130、根据Bj,获取第一中间地理实体集E={E1,……,Ea,……,Ec},Ec={Ea1,……,Eag,……,Eaz},Eag为Ea对应的第g个第一中间地理实体信息,a的取值为1到c,c为第一中间地理实体列表的数量,所述第一中间地理实体为地理实体信息数量为为z的初始地理实体。
具体地,本领域技术人员知晓,任意一种补齐初始地理实体信息的方法均落入本发明的保护范围内,在此不再赘述。
S150、对E进行处理,获取第二中间地理实体集Eʹ={Eʹ1,……,Eʹi,……,Eʹn},Eʹi为第i个第二中间地理实体列表,任一第二中间地理实体列表中任一第二中间地理实体之间的相似度小于D0。
具体地,D0=1,可以理解为,当第一地理实体信息与目标文本对应的原始地理实体完全对应时,将第一地理实体添加到第二地理实体列表中,因此,可以使目标文本对应的初始地理实体与第一地理实体对应准确,以使得到的第二地理实体列表更加准确。
S170、根据Bj和Eʹ,获取第三中间地理实体集D={D1,……,Dj,……,Dm},Dj={Dj1,……,Djy,……,Djqj},Djy为Dj对应的第y个第三中间地理实体,y的取值为1到qj,qj为Dj对应的第三中间地理实体的数量,所述第三中间地理实体为与Bj之间所有字符的相似度都不小于D0的第二中间地理实体。
具体地,在本发明实施例中,将每一Eʹi与Bj进行比较获取Dj。
S190、对Djy进行排序处理,获取A。
具体地,本领域技术人员知晓,任意一种对第二地理实体进行排序处理的方法均落入本发明保护范围内,在此不再赘述。
S200、根据A和预设的关键地理实体A0,获取A0对应的第二地理实体集Z={Z1,……,Zt,……,Zk},Zt={Zt1,……,Ztg,……,Ztz},Ztg为Zt对应的第g个第二地理实体信息,t的取值为1到k,k为第二地理实体的数量,其中,第二地理实体信息包括:第二地理实体和第二地理实体对应的第二获取实体数量,所述第二地理实体为与A0之间的相似度都不小于D0的第一地理实体,D0为预设相似度阈值。
具体地,本领域技术人员知晓可根据实际需求设置A0,
优选地,A0∈A。
进一步地,k≤s。
进一步地,A0的字符长度小于Amax,Amax为第一地理实体列表中字符长度最大的第一地理实体。
S300、若k=k0,将Zk作为目标地理实体列表,k0为预设的地理实体数量阈值。
具体地,k0=1,可以理解为,当第二地理实体集中存在与A0唯一对应的第二地理实体列表时,将Zk对应为目标地理实体列表。
S400、若k≠k0,获取第三地理实体集Cg={Cg 1,……,Cg e,……,Cg hg},Cg e={Cg e1,……,Cg eg,……,Cg ez},Cg eg为Cg e对应的第g个第三地理实体信息,e的取值为1到hg,hg为第三地理实体列表的数量,所述第三地理实体列表为SZgmax对应的第二地理实体列表,SZgmax为任一第二地理实体对应的第二获取实体数量的最大值。
具体地,S400还可包括如下步骤:
S410、当k>k0时,获取第四中间地理实体集Fg={Fg 1,……,Fg x,……,Fg pg},Fg x={Fg x1,……,Fg xg,……,Fg xz},Fg xg为Fg x对应的第g个第四中间地理实体信息,x的取值为1到pg,pg为第四地理实体列表的数量,其中,第四中间地理实体信息包括:第四中间地理实体和第四中间地理实体对应的第四中间获取实体数量,所述第四中间地理实体为第四中间获取实体数量的取值为d1 g到d2 g对应的第二地理实体,d1 g为第四中间获取实体数量上限值,d2 g第四中间获取实体数量下限值。
具体地,d2 g=第二获取实体数量,d1 g=w0×第二获取实体数量,w0为预设数量占比阈值。
优选地,w0的取值范围为0.9-1。
S430、若pg=k0,将Fg pg作为目标地理实体列表。
S450、若pg≠k0,获取第五中间地理实体列表Fg+1={Fg+1 1,……,Fg+1 b,……,Fg+1 v},Fg +1 b={Fg+1 b1,……,Fg+1 bg,……,Fg+1 bz},Fg+1 bg为Fg+1 b对应的第g个第五中间地理实体信息,b的取值为1到v,v为第五中间地理实体列表的数量,其中,第五中间地理实体信息包括:第五中间地理实体和第五中间地理实体对应的第五中间获取实体数量,所述第五中间地理实体为第五中间获取实体数量的取值为d1 g+1到d2 g+1对应的第四中间地理实体,d1 g+1为第五中间获取实体数量的上限值,d2 g+1为第五中间获取实体数量的下限值。
具体地,d2 g+1=Fg+1 max,d1 g+1=w0×Fg+1 max,Fg+1 max为Fg中任一第g+1个第三中间地理实体信息数量的最大值
上述,在对某一地点实体数量进行统计时,有概率出现在两个不同第四中间地理实体的数量相近的情况,只依靠选择最大数量确定目标地理实体列表会产生误差,因此,设定一个范围,当Fg xg的数量处于此范围内的保留并进行后续判断,可以使得到的最终地点更加准确。
S500、若hg=k0,将Cg hg作为目标地理实体列表。
S600、若hg≠k0,获取第四地理实体集Cg+1={Cg+1 1,……,Cg+1 d,……,Cg+1 w},Cg+1 d为第d个第四地理实体列表,d的取值为1到w,w为第四地理实体列表的数量,所述第四地理实体列表为Cg+1 max对应的第三地理实体列表,Cg+1 max为Cg中任一第g+1个第三地理实体数量的最大值。
S700、当g=g0且hg>1时,获取目标文本发送时对应的地理实体列表H0=(H0 1,……,H0 g,……,H0 z),H0 g为目标文本对应的第g个发送时所处的地理实体信息。
具体地,本领域技术人员知晓,任意一种获取目标文本发送时对应的地理实体的方法均落入本发明保护范围,在此不再赘述。
优选地,g0=4。
S800、根据H0和Cg,获取相似度列表K={K1,……,Ke,……,Khg},Ke为H0与Cg e之间的相似度。
S900、遍历K,获取Kmax对应的第三地理实体列表作为目标地理实体列表,Kmax为K中最大相似度。
上述,当比较到第四地理实体列表的第g0个第四地理实体时,任一中间地理实体集中存在两个或两个以上中间地理实体列表时,可以通过获取目标文本发送时对应的地理实体列表与当前中间地理实体集中的中间地理实体列表进行相似度计算,并将当前中间地理实体集中与目标文本对应的地理实体列表相似度最大的中间地理实体列表作为目标地理实体列表,因此,在节省计算程序的基础上保证了准确性,节省了时间资源,提高了计算效率。
本说明书提供的实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或服务器产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行,例如并行处理器或者多线程处理的环境。
虽然已经通过示例对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员还应理解,可以对实施例进行多种修改而不脱离本发明的范围和精神。本发明开的范围由所附权利要求来限定。
Claims (7)
1.一种获取文本的地理实体的数据处理系统,其特征在于,所述系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括:初始地理实体集,当计算机程序被处理器执行时,实现如下步骤:
S100、根据所述初始地理实体集,获取初始地理实体集对应的第一地理实体集A={A1,……,Ai,……,An},Ai={Ai1,……,Aig,……,Aiz},Aig为Ai对应的第g个第一地理实体信息,g的取值为1到z,z为第一地理实体信息的数量,i的取值为1到n,n为第一地理实体列表的数量,其中,第一地理实体信息包括:第一地理实体和第一地理实体对应第一获取实体数量;
S200、根据A和预设的关键地理实体A0,获取A0对应的第二地理实体集Z={Z1,……,Zt,……,Zk},Zt={Zt1,……,Ztg,……,Ztz},Ztg为Zt对应的第g个第二地理实体信息,t的取值为1到k,k为第二地理实体列表的数量,其中,第二地理实体信息包括:第二地理实体和第二地理实体对应的第二获取实体数量,所述第二地理实体为与A0之间的相似度都不小于D0的第一地理实体,D0为预设相似度阈值;
S300、若k=k0,将Zk作为目标地理实体列表,k0为预设的地理实体数量阈值;
S400、若k≠k0,获取第三地理实体集Cg={Cg 1,……,Cg e,……,Cg hg},Cg e={Cg e1,……,Cg eg,……,Cg ez},Cg eg为Cg e对应的第g个第三地理实体信息,e的取值为1到hg,hg为第三地理实体列表的数量,所述第三地理实体列表为SZgmax对应的第二地理实体列表,SZgmax为任一第二地理实体对应的第二获取实体数量的最大值;
S500、若hg=k0,将Cg hg作为目标地理实体列表;
S600、若hg≠k0,获取第四地理实体集Cg+1={Cg+1 1,……,Cg+1 d,……,Cg+1 w},Cg+1 d为第d个第四地理实体列表,d的取值为1到w,w为第四地理实体列表的数量,所述第四地理实体列表为Cg+1 max对应的第三地理实体列表,Cg+1 max为Cg中任一第g+1个第三地理实体数量的最大值;
进一步,将第二地理实体列表中的第二地理实体信息的数量设定取值范围,S400还可包括如下步骤:
S410、当k>k0时,获取第四中间地理实体集Fg={Fg 1,……,Fg x,……,Fg pg},Fg x={Fg x1,……,Fg xg,……,Fg xz},Fg xg为Fg x对应的第g个第四中间地理实体信息,x的取值为1到pg,pg为第四地理实体列表的数量,其中,第四中间地理实体信息包括:第四中间地理实体和第四中间地理实体对应的第四中间获取实体数量,所述第四中间地理实体为第四中间获取实体数量的取值为d1 g到d2 g对应的第二地理实体,d1 g为第四中间获取实体数量上限值,d2 g第四中间获取实体数量下限值;
S430、若pg=k0,将Fg pg作为目标地理实体列表;
S450、若pg≠k0,获取第五中间地理实体列表Fg+1={Fg+1 1,……,Fg+1 b,……,Fg+1 v},Fg+1 b={Fg+1 b1,……,Fg+1 bg,……,Fg+1 bz},Fg+1 bg为Fg+1 b对应的第g个第五中间地理实体信息,b的取值为1到v,v为第五中间地理实体列表的数量,其中,第五中间地理实体信息包括:第五中间地理实体和第五中间地理实体对应的第五中间获取实体数量,所述第五中间地理实体为第五中间获取实体数量的取值为d1 g+1到d2 g+1对应的第四中间地理实体,d1 g+1为第五中间获取实体数量的上限值,d2 g+1为第五中间获取实体数量的下限值;
进一步,在S600后还包括如下步骤:
S700、当g=g0且hg>1时,获取目标文本发送时对应的地理实体H0=(H0 1,……,H0 g,……,H0 z),H0 g为目标文本对应的第g个发送时所处的地理实体信息;
S800、根据H0和Cg,获取相似度列表K={K1,……,Ke,……,Khg},Ke为H0与Cg e之间的相似度;
S900、遍历K,获取Kmax对应的第三地理实体列表作为目标地理实体列表,Kmax为K中最大相似度。
2.根据权利要求1所述的获取文本的地理实体的数据处理系统,其特征在于,在S100中,还包括如下步骤获取A:
S110、获取初始地理实体集B={B1,……,Bj,……,Bm},Bj={Bj1,……,Bjr,……,Bjsj},Bjr为Bj对应的第r个初始地理实体,r的取值为1到sj,sj为Bj对应的初始地理实体的数量,j的取值为1到m,m为目标文本的数量;
S130、根据Bj,获取第一中间地理实体集E={E1,……,Ea,……,Ec},Ec={Ea1,……,Eag,……,Eaz},Eag为Ea对应的第g个第一中间地理实体信息,a的取值为1到c,c为第一中间地理实体列表的数量,所述第一中间地理实体为地理实体信息数量为z的初始地理实体;
S150、对E进行处理,获取第二中间地理实体集Eʹ={Eʹ1,……,Eʹi,……,Eʹn},Eʹi为第i个第二中间地理实体列表,任一第二中间地理实体列表中任一第二中间地理实体之间的相似度小于D0;
S170、根据Bj和Eʹ,获取第三中间地理实体集D={D1,……,Dj,……,Dm},Dj={Dj1,……,Djy,……,Djqj},Djy为Dj对应的第y个第三中间地理实体,y的取值为1到qj,qj为Dj对应的第三中间地理实体的数量,所述第三中间地理实体为与Bj之间所有字符的相似度都不小于D0的第二中间地理实体;
S190、对Djy进行排序处理,获取A。
3.根据权利要求1所述的获取文本的地理实体的数据处理系统,其特征在于,在S410中,d2 g符合如下条件:
d2 g=第二获取实体数量。
4.根据权利要求1所述的获取文本的地理实体的数据处理系统,其特征在于,在S410中,d1 g符合如下条件:
d1 g=w0×第二获取实体数量,w0为预设数量占比阈值。
5.根据权利要求1所述的获取文本的地理实体的数据处理系统,其特征在于,在S450中,d2 g+1符合如下条件:
d2 g+1=Fg+1 max,Fg+1 max为Fg中任一第g+1个第三中间地理实体信息数量的最大值。
6.根据权利要求1所述的获取文本的地理实体的数据处理系统,其特征在于,在S450中,d1 g+1符合如下条件:
d1 g+1=w0×Fg+1 max。
7.根据权利要求4或6中任意一项所述的获取文本的地理实体的数据处理系统,其特征在于,w0的取值范围为0.9-1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211148441.7A CN115248837B (zh) | 2022-09-21 | 2022-09-21 | 一种获取文本的地理实体的数据处理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211148441.7A CN115248837B (zh) | 2022-09-21 | 2022-09-21 | 一种获取文本的地理实体的数据处理系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115248837A CN115248837A (zh) | 2022-10-28 |
CN115248837B true CN115248837B (zh) | 2022-12-23 |
Family
ID=83699252
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211148441.7A Active CN115248837B (zh) | 2022-09-21 | 2022-09-21 | 一种获取文本的地理实体的数据处理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115248837B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115964190B (zh) * | 2022-12-07 | 2023-07-14 | 中科雨辰科技有限公司 | 一种更新历史事件信息的数据处理系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110569322A (zh) * | 2019-07-26 | 2019-12-13 | 苏宁云计算有限公司 | 地址信息解析方法、装置、系统及数据获取方法 |
CN111382570A (zh) * | 2018-12-28 | 2020-07-07 | 深圳市优必选科技有限公司 | 文本实体识别方法、装置、计算机设备及存储介质 |
CN114328766A (zh) * | 2020-09-27 | 2022-04-12 | 中国科学院空天信息创新研究院 | 一种地理知识图数据库构建方法、装置、介质及设备 |
CN114416998A (zh) * | 2022-01-24 | 2022-04-29 | 平安国际智慧城市科技股份有限公司 | 文本标签的识别方法、装置、电子设备及存储介质 |
CN114580392A (zh) * | 2022-04-29 | 2022-06-03 | 中科雨辰科技有限公司 | 一种识别实体的数据处理系统 |
CN114996413A (zh) * | 2022-08-03 | 2022-09-02 | 中科雨辰科技有限公司 | 一种获取实体训练集的数据处理系统 |
CN115017269A (zh) * | 2022-08-05 | 2022-09-06 | 中科雨辰科技有限公司 | 一种确定相似文本的数据处理系统 |
CN115017242A (zh) * | 2022-04-22 | 2022-09-06 | 阿里巴巴(中国)有限公司 | 地理围栏的生成方法和装置、存储介质及处理器 |
-
2022
- 2022-09-21 CN CN202211148441.7A patent/CN115248837B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111382570A (zh) * | 2018-12-28 | 2020-07-07 | 深圳市优必选科技有限公司 | 文本实体识别方法、装置、计算机设备及存储介质 |
CN110569322A (zh) * | 2019-07-26 | 2019-12-13 | 苏宁云计算有限公司 | 地址信息解析方法、装置、系统及数据获取方法 |
WO2021017679A1 (zh) * | 2019-07-26 | 2021-02-04 | 苏宁易购集团股份有限公司 | 地址信息解析方法、装置、系统及数据获取方法 |
CN114328766A (zh) * | 2020-09-27 | 2022-04-12 | 中国科学院空天信息创新研究院 | 一种地理知识图数据库构建方法、装置、介质及设备 |
CN114416998A (zh) * | 2022-01-24 | 2022-04-29 | 平安国际智慧城市科技股份有限公司 | 文本标签的识别方法、装置、电子设备及存储介质 |
CN115017242A (zh) * | 2022-04-22 | 2022-09-06 | 阿里巴巴(中国)有限公司 | 地理围栏的生成方法和装置、存储介质及处理器 |
CN114580392A (zh) * | 2022-04-29 | 2022-06-03 | 中科雨辰科技有限公司 | 一种识别实体的数据处理系统 |
CN114996413A (zh) * | 2022-08-03 | 2022-09-02 | 中科雨辰科技有限公司 | 一种获取实体训练集的数据处理系统 |
CN115017269A (zh) * | 2022-08-05 | 2022-09-06 | 中科雨辰科技有限公司 | 一种确定相似文本的数据处理系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115248837A (zh) | 2022-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110852755B (zh) | 针对交易场景的用户身份识别方法和装置 | |
US20190332963A1 (en) | Systems and methods for visualizing a pattern in a dataset | |
CN105338619B (zh) | 定位方法及装置 | |
CN108241745A (zh) | 样本集的处理方法及装置、样本的查询方法及装置 | |
CN106919957B (zh) | 处理数据的方法及装置 | |
CN107291939B (zh) | 酒店信息的聚类匹配方法及系统 | |
CN115248837B (zh) | 一种获取文本的地理实体的数据处理系统 | |
de Oliveira et al. | Comparing co-evolution methods and their application to template-free protein structure prediction | |
US20210193269A1 (en) | Method for Assessing Classification Annotations Assigned to DNA Sequences of Organisms | |
Melnikov et al. | Various algorithms, calculating distances of DNA sequences, and some computational recommendations for use such algorithms | |
CN112529112B (zh) | 一种矿物识别的方法和装置 | |
JP2004030694A (ja) | デジタル映像テクスチャー分析方法 | |
CN107909097B (zh) | 样本库中样本的更新方法及装置 | |
CN111488751A (zh) | 二维码图像处理方法、装置、电子设备及存储介质 | |
EP2518656A1 (en) | Taxonomic classification system | |
CN115185939B (zh) | 多源数据的数据处理方法 | |
CN116564401A (zh) | 一种模型训练、细胞分割系统、方法及存储介质 | |
CN107391728B (zh) | 数据挖掘方法以及数据挖掘装置 | |
CN111026935B (zh) | 基于自适应度量融合的跨模态检索重排序方法 | |
CN114816518A (zh) | 基于simhash的源代码中开源成分筛选识别方法及系统 | |
CN110060737B (zh) | 一种基于最大频率虚拟个体的str快速比对方法及系统 | |
EP2390811B1 (en) | Identification of ribosomal DNA sequences | |
CN111428063A (zh) | 基于地理空间位置划分的图像特征关联处理方法及系统 | |
CN115880745B (zh) | 一种获取人脸图像特征的数据处理系统 | |
CN114860738B (zh) | 一种用于订单号环境类别确定的数据处理系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |