CN111737430B - 实体链接方法、装置、设备以及存储介质 - Google Patents
实体链接方法、装置、设备以及存储介质 Download PDFInfo
- Publication number
- CN111737430B CN111737430B CN202010548446.3A CN202010548446A CN111737430B CN 111737430 B CN111737430 B CN 111737430B CN 202010548446 A CN202010548446 A CN 202010548446A CN 111737430 B CN111737430 B CN 111737430B
- Authority
- CN
- China
- Prior art keywords
- entity
- search term
- information
- determining
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000000605 extraction Methods 0.000 claims description 41
- 230000015654 memory Effects 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 14
- 238000001914 filtration Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 abstract description 4
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000013135 deep learning Methods 0.000 abstract description 2
- 239000013598 vector Substances 0.000 description 29
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 235000013305 food Nutrition 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 235000012054 meals Nutrition 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/387—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种实体链接方法、装置、设备以及存储介质,涉及数据处理技术领域,尤其涉及人工智能、智能搜索、深度学习和知识图谱等技术领域。具体实现方案为:提取目标搜索项中的实体作为搜索项实体,并从知识库中确定候选实体集;提取候选实体的空间域信息,所述空间域信息包括属性信息和/或地理位置信息;根据所述搜索项实体以及所述候选实体的空间域信息,从所述候选实体集中确定所述搜索项实体映射至知识库中的目标实体。根据本申请的技术提高了目标实体的准确率。
Description
技术领域
本申请实施例涉及数据处理技术领域,尤其涉及人工智能、智能搜索、深度学习和知识图谱等技术领域。具体地,本申请实施例提供一种实体链接方法、装置、设备以及存储介质。
背景技术
实体链接是将一段文本中的某些字符串映射到知识库中对应的实体上。
近些年智能虚拟助手如智能音箱等设备在人们生活中使用的越来越多,并且多数用户搜索项(Query)的回答都需要用到位置信息,例如地图服务,导航以及兴趣点(Pointof Interest,POI)相关信息查询等。并且在实际场景中用户Query会包含大量实体名称,这些实体名称可能包含多重含义。因此对用户Query中的实体进行实体链接,以获得用户Query实际所指的实体显得至关重要。
发明内容
本公开提供了一种实体链接方法、装置、设备以及存储介质。
根据本公开的一方面,提供了一种实体链接方法,该方法包括:
提取目标搜索项中的实体作为搜索项实体,并从知识库中确定候选实体集;
提取候选实体的空间域信息,所述空间域信息包括属性信息和/或地理位置信息;
根据所述搜索项实体以及所述候选实体的空间域信息,从所述候选实体集中确定所述搜索项实体映射至知识库中的目标实体。
根据本公开的另一方面,提供了一种实体链接装置,该装置包括:
实体提取模块,用于提取目标搜索项中的实体作为搜索项实体,并从知识库中确定候选实体集;
信息提取模块,用于提取候选实体的空间域信息,所述空间域信息包括属性信息和/或地理位置信息;
实体确定模块,用于根据所述搜索项实体以及所述候选实体的空间域信息,从所述候选实体集中确定所述搜索项实体映射至知识库中的目标实体。
根据本公开的又一方面,提供了一种电子设备,该设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请实施例中任一项所述的方法。
根据本公开的又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请实施例中任一项所述的方法。
根据本申请的技术提高了目标实体的准确率。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是本申请实施例提供的一种实体链接方法的流程图;
图2是本申请实施例提供的另一种实体链接方法的流程图;
图3是申请实施例提供的一种空间域信息的获取流程示意图;
图4是本申请实施例提供的又一种实体链接方法的流程图;
图5是本申请实施例提供的又一种实体链接方法的流程图;
图6是本申请实施例提供的又一种实体链接方法的流程图;
图7是本申请实施例提供的又一种实体链接方法的流程图;
图8是本申请实施例提供的又一种实体链接方法的流程图;
图9是本申请实施提供的一种基于多任务模型实现的实体链接方法的流程示意图;
图10是本申请实施例提供的一种实体链接装置的结构示意图;
图11是根据本申请实施例的实体链接方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是本申请实施例提供的一种实体链接方法的流程图。本实施例可适用于将检索项中的实体词映射到知识库中对应实体上的情况。该方法可以由一种实体链接装置来执行,该装置可以由软件和/或硬件的方式实现。参见图1,本申请实施例提供的实体链接方法包括:
S110、提取目标搜索项中的实体作为搜索项实体,并从知识库中确定候选实体集。
其中,目标搜索项是指待进行实体链接的搜索项。
在一个实施例中,搜索项也可以理解为检索文本,检索文本是用户检索时输入的文本。
示例性地,目标搜索项可以是:从某地到某公园怎么走。
搜索项实体是从目标搜索项中提取的实体。
实体是客观存在并可相互区别的事物。实体可以是具体的人、事或物。
继续以目标搜索项为从某地到某公园怎么走为例,搜索项实体可以是某地和某公园。
知识库中包括作为知识的实体以及实体信息。
候选实体是从知识库中获取的,可能与搜索项实体对应的实体。
候选实体集是由至少两个候选实体构成的集合。
可选地,可以将知识库中的全部实体作为候选实体,也可以将知识库中与搜索项实体的相似度大于设定相似度阈值的实体作为候选实体。
本实施例对搜索项实体的提取步骤以及候选实体集的确定步骤的执行顺序不做限定。可选地,候选实体集的确定步骤可以先于搜索项实体的提取步骤执行。
S120、提取候选实体的空间域信息,所述空间域信息包括属性信息和/或地理位置信息。
其中,所述空间域信息是指在语义空间和/或地理位置空间的信息。
属性信息是指描述候选实体属性的信息。
地理位置信息是描述候选实体所属地理位置的信息。
在一个实施例中,属性信息可以是美食、火锅等。地理位置信息可以是省、市、区县等。
示例性地,若候选实体是一家火锅店,则该候选实体的属性信息可以是中餐馆和/或美食,该候选实体的地理位置信息可以是某街道、某区县和某市中的至少一种。
S130、根据所述搜索项实体以及所述候选实体的空间域信息,从所述候选实体集中确定所述搜索项实体映射至知识库中的目标实体。
其中,目标实体是指搜索项实体映射至知识库中的实体。
继续以目标搜索项为从某地到某公园怎么走为例,目标实体是知识库中属性信息与搜索项实体的属性信息匹配的实体,也可以是知识库中地理位置信息与搜索项实体的地理位置信息匹配的实体,还可以是知识库中属性信息和地理位置信息均与搜索项实体的属性信息和地理位置信息匹配的实体。
在一个实施例中,根据所述搜索项实体以及所述候选实体的空间域信息,从所述候选实体集中确定所述搜索项实体映射至知识库中的目标实体,可以包括:
提取所述搜索项实体的空间域信息;
匹配所述搜索项实体的空间域信息与所述候选实体的空间域信息;
根据匹配结果,从所述候选实体集中确定所述搜索项实体映射至知识库中的目标实体。
本申请实施例的技术方案,通过利用候选实体的空间域信息将候选实体与目标搜索项中的搜索项实体进行链接。因为搜索项本身具有空间域信息,所以基于候选实体的空间域信息可以实现候选实体与搜索项实体基于空间域信息的匹配,从而提高目标实体的准确率。
图2是本申请实施例提供的另一种实体链接方法的流程图。本方案是在上述方案的基础上,对步骤“提取候选实体的空间域信息”的具体优化。参见图2,本方案提供的实体链接方法包括:
S210、提取目标搜索项中的实体作为搜索项实体,并从知识库中确定候选实体集。
S220、将所述候选实体输入关系识别模型,从所述关系识别模型的特征提取网络层中输出所述候选实体的空间域信息,所述候选实体中包括所述空间域信息关联的实体。
其中,所述空间域信息关联的实体是指表征所述空间域信息的实体。
示例性地,所述空间域信息关联的实体可以是中餐馆、美食、某街道和某区县等。
所述关系识别模型是用于识别输入实体在空间域的从属关系的网络。
其中,在空间域的从属关系包括属性信息的从属关系和/或地理位置信息的从属关系。
例如,属性信息的从属关系可以是:美食包括中餐,中餐包括火锅。地理位置信息的从属关系可是:省包括市,市包括区县,区县包括兴趣点。
在一个实施例中,所述关系识别模型的特征提取网络层包括词向量转换层和关系特征提取层。参见图3,将所述候选实体输入词向量转换层,将词向量转换层的输出结果输入至关系特征提取层,输出所述候选实体的空间域信息。
可选地,所述关系识别模型可以是任意可实现关系识别的网络模型。典型地,所述关系识别模型是图神经网络模型。
所述关系识别模型的训练包括:
利用至少两个样本实体以及所述至少两个样本实体在空间域的从属关系,对初始识别模型进行训练,得到所述关系识别模型。
其中,样本实体是指作为样本用于训练初始识别模型的实体。
空间域是指属性空间和/或地理位置空间。
因为通过所述关系识别模型中的特征提取网络层可以提取候选实体在空间域的从属关系,又因为所述候选实体中包括所述空间域信息关联的实体,所以通过所述关系识别模型的特征提取网络层可以提取候选实体的空间域信息。
S230、根据所述搜索项实体以及所述候选实体的空间域信息,从所述候选实体集中确定所述搜索项实体映射至知识库中的目标实体。
本申请实施例的技术方案,通过利用候选实体在空间域的从属关系表征候选实体的空间域信息,因为候选实体集包括的空间域信息关联实体的种类较多,所以基于该方式确定的空间域信息更加丰富,进而可以提高目标实体的准确率。
图4是本申请实施例提供的又一种实体链接方法的流程图。本方案是在上述方案的基础上,对步骤“根据所述搜索项实体以及所述候选实体的空间域信息,从所述候选实体集中确定所述搜索项实体映射至知识库中的目标实体”的具体优化。参见图4,本方案提供的实体链接方法包括:
S310、提取目标搜索项中的实体作为搜索项实体,并从知识库中确定候选实体集。
S320、提取候选实体的空间域信息,所述空间域信息包括属性信息和/或地理位置信息。
S330、根据所述搜索项实体,所述搜索项实体的上下文信息和/或所述搜索项实体的类型信息,以及所述候选实体的空间域信息,从所述候选实体集中确定所述目标实体。
其中,搜索项实体的上下文信息是指在目标搜索项中位于搜索项实体上下文的信息。
搜索项实体的类型信息是指搜索项实体所属类型的信息。
在一个实施例中,搜索项实体所属类型可以包括:兴趣点、区域、地图数据中的区域状的地理实体、属性标签、城市、品牌、省、周边、时间和人群。搜索项实体的类型信息与候选实体的属性信息对应。
可选地,根据所述搜索项实体,所述搜索项实体的上下文信息和/或所述搜索项实体的类型信息,以及所述候选实体的空间域信息,从所述候选实体集中确定所述目标实体,包括:
根据所述搜索项实体、所述搜索项实体的上下文信息和所述候选实体的空间域信息,从所述候选实体集中确定所述目标实体;或者,
根据所述搜索项实体、所述搜索项实体的类型信息和所述候选实体的空间域信息,从所述候选实体集中确定所述目标实体;或者,
根据所述搜索项实体、所述搜索项实体的类型信息、所述搜索项实体的上下文信息和所述候选实体的空间域信息,从所述候选实体集中确定所述目标实体。
在一个实施例中,所述根据所述搜索项实体、所述搜索项实体的上下文信息和所述搜索项实体的类型信息,以及所述候空间域信息,从所述候选实体集中确定所述目标实体,可以包括:
根据所述空间域信息中的属性信息、所述空间域信息中的地理位置信息以及所述搜索项实体,确定第一相似度得分;
根据所述空间域信息中的属性信息和所述搜索项实体的类型信息,确定第二相似度得分;
根据所述空间域信息中的属性信息、所述空间域信息中的地理位置信息以及所述搜索项实体的上下文信息,确定所述候选实体与所述搜索项实体的第三相似度得分;
根据所述第一相似度得分、所述第二相似度得分和所述第三相似度得分,从所述候选实体集中确定所述目标实体。
其中,所述第一相似度得分、所述第二相似度得分和所述第三相似度均用于描述所述候选实体与所述搜索项实体的相似程度。
在一个实施例中,根据所述第一相似度得分、所述第二相似度得分和所述第三相似度得分,从所述候选实体集中确定所述目标实体,可以包括:
根据所述第一相似度得分、所述第二相似度得分和所述第三相似度得分,确定所述候选实体与所述搜索项实体的相似度;
根据确定的相似度,从所述候选实体集中确定所述目标实体。
本申请实施例的技术方案,通过增加所述搜索项实体的上下文信息和/或所述搜索项实体的类型信息作为确定目标实体的依据,从而提高目标实体的准确率。
图5是本申请实施例提供的又一种实体链接方法的流程图。本方案是在上述方案的基础上,对步骤“根据所述搜索项实体以及所述候选实体的空间域信息,从所述候选实体集中确定所述搜索项实体映射至知识库中的目标实体”的具体优化。参见图5,本方案提供的实体链接方法包括:
S410、提取目标搜索项中的实体作为搜索项实体,并从知识库中确定候选实体集。
S420、提取候选实体的空间域信息,所述空间域信息包括属性信息和/或地理位置信息。
S430、根据所述搜索项实体,确定所述目标搜索项的意图信息和所述搜索项实体的信息。
其中,目标搜索项的意图信息是指目标搜索项描述的搜索意图的信息。
在一个实施例中,根据所述搜索项实体,确定所述目标搜索项的意图信息和所述搜索项实体的信息,包括:
基于所述搜索项实体的特征提取网络层,对所述搜索项实体进行特征提取,得到所述搜索项实体的特征信息;
其中,所述特征信息中包括所述目标搜索项的意图信息和所述搜索项实体的信息,该特征提取网络层中的参数基于样本搜索项的意图和样本搜索项链接的实体训练得到。
样本搜索项是作为样本用于训练所述搜索项实体的特征提取网络层的搜索项。
在一个实施例中,该特征提取网络层作为搜索意图识别模型和搜索项实体链接模型的公共网络层,将搜索意图识别模型和搜索项实体链接模型连接,形成多任务模型。利用样本搜索项的意图和样本搜索项链接的实体对该多任务模型进行训练,从而得到该特征提取网络层中的参数。
S440、根据所述意图信息、所述搜索项实体的信息,以及所述候选实体的空间域信息,从所述候选实体集中确定所述搜索项实体映射至知识库中的目标实体。
本申请对上述方案的执行顺序不做限定。可选地,上述S430可以先于S420执行。
本申请实施例的技术方案,通过提取所述目标搜索项的意图信息,根据提取的意图信息确定目标实体,从而进一步提高目标实体的准确率。
图6是本申请实施例提供的又一种实体链接方法的流程图。本方案是在上述方案的基础上,对步骤“从知识库中确定候选实体集”的具体优化。参见图6,本方案提供的实体链接方法包括:
S510、提取目标搜索项中的实体作为搜索项实体。
S520、根据所述目标搜索项中包括的位置信息,确定所述目标搜索项的关联位置。
其中,所述目标搜索项的关联位置是指所述目标搜索项中搜索项实体所在的位置。
在一个实施例中,若所述目标搜索项中包括的位置信息是具体的地点,则将该位置信息可以作为所述目标搜索项的关联位置;若所述目标搜索项中包括的位置信息是相对用户当前位置的信息,则可以根据用户的当前位置确定所述目标搜索项的关联位置。
示例性地,若相对用户当前位置的信息是用户当前位置的附近或周围,则可以将用户的当前位置作为所述目标搜索项的关联位置。
S530、根据所述关联位置,对知识库中的实体进行过滤。
S540、根据剩余实体确定所述候选实体集。
其中剩余实体是指知识库中经过过滤剩余的实体。通常该剩余实体是位于所述关联位置附近的实体。
在一个实施例中,根据剩余实体确定所述候选实体集,可以包括:
将剩余实体作为候选实体,构成所述候选实体集。
S550、提取候选实体的空间域信息,所述空间域信息包括属性信息和/或地理位置信息。
S560、根据所述搜索项实体以及所述候选实体的空间域信息,从所述候选实体集中确定所述搜索项实体映射至知识库中的目标实体。
本申请对上述实施例的执行顺序不做限定。可选地,S520至S540可以先于S510执行。
本申请实施例的技术方案,通过所述目标搜索项的关联位置对知识库中的实体进行过滤,从而过滤掉距离目标搜索项的关联位置较远的实体,根据剩余实体确定所述候选实体集,从而提高候选实体集的准确率。
为提高候选实体集的召回率,所述根据剩余实体确定所述候选实体集,包括:
根据所述搜索项实体和/或所述搜索项实体的近义实体,从所述剩余实体中确定所述候选实体集。
其中,所述近义实体是指与所述搜索项实体的语义相近的实体。
示例性地,若搜索项实体是餐馆,则近义实体可以是饭店、饭庄和酒店等。
图7是本申请实施例提供的又一种实体链接方法的流程图。本方案是在上述方案的基础上,对步骤“从知识库中确定候选实体集”的具体优化。参见图7,本方案提供的实体链接方法包括:
S610、提取目标搜索项中的实体作为搜索项实体。
S620、根据所述搜索项实体的出现信息、所述搜索项实体的文本信息以及所述搜索项实体的语义信息中的至少一种,确定所述搜索项实体与知识库中实体的相似度。
其中,所述搜索项实体的出现信息是指,所述搜索项实体在知识库中实体的出现信息。
在一个实施例中,该出现信息可以是出现在知识库中的实体中、未出现在知识库中的实体中或部分出现在知识库中的实体中。
例如,若搜索项实体是饭店,知识库中的实体是某饭店,则确定所述搜索项实体的出现信息是出现在知识库中的实体中。
在一个实施例中,根据所述搜索项实体的出现信息、所述搜索项实体的文本信息以及所述搜索项实体的语义信息,确定所述搜索项实体与知识库中实体的相似度,可以包括:
根据所述搜索项实体的出现信息,确定第四相似度得分;
根据所述搜索项实体的文本信息,确定第五相似度得分;
根据所述搜索项实体的语义信息,确定第六相似度得分;
根据所述第四相似度得分、所述第五相似度得分和所述第六相似度得分,确定所述搜索项实体与知识库中实体的相似度。
其中,所述第四相似度得分、所述第五相似度得分和所述第六相似度得分均用于描述所述搜索项实体与知识库中实体之间的相似程度。
在一个实施例中,根据所述搜索项实体的文本信息,确定所述第五相似度得分,可以包括:
根据所述搜索项实体的文本信息,确定所述搜索项实体与知识库中实体的文本距离;
根据该文本距离,确定该第五相似度得分。
典型地,文本距离可以基于编辑距离算法计算得到。
在一个实施例中,根据所述搜索项实体的语义信息,确定所述第六相似度得分,可以包括:
根据所述搜索项实体的语义信息,确定所述搜索项实体与知识库中实体的语义距离;
根据该语义距离,确定该第六相似度得分。
典型地,语义距离可以基于搜索项实体的词向量与知识库中实体的词向量之间的距离确定。
S630、根据确定的相似度,从知识库的实体中确定所述候选实体集。
S640、提取候选实体的空间域信息,所述空间域信息包括属性信息和/或地理位置信息。
S650、根据所述搜索项实体以及所述候选实体的空间域信息,从所述候选实体集中确定所述搜索项实体映射至知识库中的目标实体。
本申请对上述实施例的执行顺序不做限定。可选地,S620至S630可以先于S610执行。
本申请实施例的技术方案,通过根据所述搜索项实体的出现信息、所述搜索项实体的文本信息以及所述搜索项实体的语义信息中的至少一种,确定所述搜索项实体与知识库中实体的相似度;根据确定的相似度,从知识库的实体中确定所述候选实体集,从而进一步提高候选实体集的准确率。
图8是本申请实施例提供的又一种实体链接方法的流程图。本方案是在上述方案的基础上,以基于多任务模型,将搜索项意图识别任务和搜索项实体链接任务联合实现为例,提供的一种可选方案。本方案仅对搜索项实体链接任务关联的实体链接方法进行展开,对搜索意图识别任务不做限定。参见图8,本方案提供的实体链接方法包括:
S710、提取目标搜索项中的实体作为搜索项实体。
S720、根据所述目标搜索项中包括的位置信息,确定所述目标搜索项的关联位置。
S730、根据所述关联位置,对知识库中的实体进行过滤。
S740、根据所述搜索项实体的出现信息、所述搜索项实体的文本信息以及所述搜索项实体的语义信息,从经过过滤的知识库实体中确定与所述搜索项实体相似的第一实体子集。
S750、根据所述搜索项实体的近义实体的出现信息、所述近义实体的文本信息以及所述近义实体的语义信息,从经过过滤的知识库实体中确定与该近义实体相似的第二实体子集。
S760、将所述第一实体子集和所述第二实体子集作为所述目标搜索项的候选实体集。
S770、将所述候选实体集中的至少两个候选实体输入关系特征提取网络层,输出所述至少两个候选实体的关系特征向量。
其中该关系特征向量中包括有候选实体的空间域信息,所述候选实体中包括所述空间域信息关联的实体。
该关系特征提取网络层为关系识别模型的特征提取网络层。
S780、根据所述关系特征向量和所述搜索项实体的词向量,确定所述候选实体和所述搜索项实体的第一相似度得分;根据所述候选实体的标签特征向量和所述搜索项实体的类别特征向量,确定所述候选实体和所述搜索项实体的第二相似度得分;根据所述候选实体的关系特征向量和所述搜索项实体的上下文特征向量,确定所述候选实体和所述搜索项实体的第三相似度得分。
S790、根据所述第一相似度得分、所述第二相似度得分和所述第三相似度得分,从所述候选实体集中确定与所述目标搜索项关联的目标实体。
其中,提取搜索项实体的词向量的词向量转换网络层,以及提取搜索项实体的类别向量的特征提取网络层作为搜索项意图识别任务和搜索项实体链接任务的公共网络层,该公共网络层的参数基于样本搜索项的意图和样本搜索项链接的实体训练得到。
示例性地,参见图9以目标搜索项为从五道口到朝阳公园怎么走为例,搜索项实体为五道口和朝阳公园。候选实体为朝阳公园桥、朝阳公园和森林公园等。搜索项实体的上下文信息为从、五道口、到和怎么走。
继续参见图9,该示例中的实体链接过程可以描述为:基于候选实体的关系特征提取网络层,提取候选实体的关系特征向量,基于搜索项实体的词向量转换层,提取搜索项实体的词向量;根据候选实体的关系特征向量和搜索项实体的词向量,确定候选实体和搜索项实体的第一相似度得分901;基于标签特征提取网络层,提取候选实体的标签特征向量;基于类别特征提取网络层,提取搜索项实体的类别特征向量;根据候选实体的标签特征向量和搜索项实体的类别特征向量,确定候选实体和搜索项实体的第二相似度得分902;基于上下文特征提取网络层,提取搜索项实体的上下文特征向量;根据候选实体的关系特征向量和搜索项实体的上下文特征向量,确定候选实体和搜索项实体的第三相似度得分903;根据所述第一相似度得分901、所述第二相似度得分902和所述第三相似度得分902,从候选实体集中确定与搜索项实体关联的目标实体。
其中,搜索实体的词向量转换层和类别特征提取网络层中的参数利用样本搜索项的意图和样本搜索项链接的实体联合训练得到。
本方案通过根据所述搜索项实体、所述搜索项实体的上下文信息以及所述搜索项实体的类型信息,从所述候选实体集中确定与所述目标搜索项关联的目标实体,从而提高目标实体的准确率。
通过基于候选实体间的空间域信息,从所述候选实体集中确定与所述目标搜索项关联的目标实体,从而实现对候选实体的消歧,提高目标实体的准确率。
通过根据目标搜索项的意图,从所述候选实体集中确定与所述目标搜索项关联的目标实体,从而提高目标实体的准确率。
图10是本申请实施例提供的一种实体链接装置的结构示意图。参见图8,本实施例提供的实体链接装置1000包括:实体提取模块801、信息提取模块1002和实体确定模块1003。
其中,实体提取模块1001,用于提取目标搜索项中的实体作为搜索项实体,并从知识库中确定候选实体集;
信息提取模块1002,用于提取候选实体的空间域信息,所述空间域信息包括属性信息和/或地理位置信息;
实体确定模块1003,用于根据所述搜索项实体以及所述候选实体的空间域信息,从所述候选实体集中确定所述搜索项实体映射至知识库中的目标实体。
本申请实施例的技术方案,通过利用候选实体的空间域信息将候选实体与目标搜索项中的搜索项实体进行链接。因为搜索项本身具有空间域信息,所以基于候选实体的空间域信息可以实现候选实体与搜索项实体基于空间域信息的匹配,从而提高目标实体的准确率。
进一步地,所述信息提取模块,包括:
信息确定单元,用于将所述候选实体输入关系识别模型,从所述关系识别模型的特征提取网络层中输出所述候选实体的空间域信息,所述候选实体中包括所述空间域信息关联的实体;
所述关系识别模型的训练包括:
利用至少两个样本实体以及所述至少两个样本实体在空间域的从属关系,对初始识别模型进行训练,得到所述关系识别模型。
进一步地,所述实体确定模块,包括:
实体确定单元,用于根据所述搜索项实体,所述搜索项实体的上下文信息和/或所述搜索项实体的类型信息,以及所述候选实体的空间域信息,从所述候选实体集中确定所述目标实体。
进一步地,所述实体确定单元具体用于:
根据所述空间域信息中的属性信息、所述空间域信息中的地理位置信息以及所述搜索项实体,确定第一相似度得分;
根据所述空间域信息中的属性信息和所述搜索项实体的类型信息,确定第二相似度得分;
根据所述空间域信息中的属性信息、所述空间域信息中的地理位置信息以及所述搜索项实体的上下文信息,确定第三相似度得分;
根据所述第一相似度得分、所述第二相似度得分和所述第三相似度得分,从所述候选实体集中确定所述目标实体。
进一步地,所述实体确定模块,包括:
意图确定单元,用于根据所述搜索项实体,确定所述目标搜索项的意图信息和所述搜索项实体的信息;
实体确定单元,用于根据所述意图信息、所述搜索项实体的信息,以及所述候选实体的空间域信息,从所述候选实体集中确定所述搜索项实体映射至知识库中的目标实体。
进一步地,所述意图确定单元具体用于:
基于所述搜索项实体的特征提取网络层,对所述搜索项实体进行特征提取,得到所述搜索项实体的特征信息;
其中所述特征信息中包括所述目标搜索项的意图信息和所述搜索项实体的信息,该特征提取网络层中的参数基于样本搜索项的意图和样本搜索项链接的实体训练得到。
进一步地,所述实体提取模块,包括:
位置确定单元,用于根据所述目标搜索项中包括的位置信息,确定所述目标搜索项的关联位置;
实体过滤单元,用于根据所述关联位置,对知识库中的实体进行过滤;
实体集确定单元,用于根据剩余实体确定所述候选实体集。
进一步地,所述实体集确定单元具体用于:
根据所述搜索项实体和/或所述搜索项实体的近义实体,从所述剩余实体中确定所述候选实体集。
进一步地,所述实体提取模块,包括:
相似度确定单元,用于根据所述搜索项实体的出现信息、所述搜索项实体的文本信息以及所述搜索项实体的语义信息中的至少一种,确定所述搜索项实体与知识库中实体的相似度;
实体确定单元,用于根据确定的相似度,从知识库的实体中确定所述候选实体集。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图11所示,是根据本申请实施例的实体链接方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图11所示,该电子设备包括:一个或多个处理器1101、存储器1102,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图11中以一个处理器1101为例。
存储器1102即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的实体链接方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的实体链接方法。
存储器1102作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的实体链接方法对应的程序指令/模块(例如,附图10所示的实体提取模块1001、信息提取模块1002和实体确定模块1003)。处理器1101通过运行存储在存储器1102中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的实体链接方法。
存储器1102可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据实体链接电子设备的使用所创建的数据等。此外,存储器1102可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器1102可选包括相对于处理器1101远程设置的存储器,这些远程存储器可以通过网络连接至实体链接电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
实体链接方法的电子设备还可以包括:输入装置1103和输出装置1104。处理器1101、存储器1102、输入装置1103和输出装置1104可以通过总线或者其他方式连接,图11中以通过总线连接为例。
输入装置1103可接收输入的数字或字符信息,以及产生与实体链接电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置1104可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
根据本申请的技术提高了目标实体的准确率。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (20)
1.一种实体链接方法,包括:
提取目标搜索项中的实体作为搜索项实体,并从知识库中确定候选实体集;
将所述候选实体输入关系识别模型,从所述关系识别模型的特征提取网络层中输出所述候选实体的空间域信息,所述候选实体中包括所述空间域信息关联的实体,所述关系识别模型是用于识别输入实体在空间域的从属关系的网络,所述空间域信息包括属性信息和/或地理位置信息;
根据所述搜索项实体以及所述候选实体的空间域信息,从所述候选实体集中确定所述搜索项实体映射至知识库中的目标实体;其中,所述目标实体是所述知识库,与所述搜索项实体中的所述属性信息和/或所述地理位置信息匹配的实体。
2.根据权利要求1所述的方法,其中,所述关系识别模型的训练包括:
利用至少两个样本实体以及所述至少两个样本实体在空间域的从属关系,对初始识别模型进行训练,得到所述关系识别模型。
3.根据权利要求1或2所述的方法,其中,所述根据所述搜索项实体以及所述候选实体的空间域信息,从所述候选实体集中确定所述搜索项实体映射至知识库中的目标实体,包括:
根据所述搜索项实体,所述搜索项实体的上下文信息和/或所述搜索项实体的类型信息,以及所述候选实体的空间域信息,从所述候选实体集中确定所述目标实体。
4.根据权利要求3所述的方法,其中,根据所述搜索项实体、所述搜索项实体的上下文信息和所述搜索项实体的类型信息,以及所述空间域信息,从所述候选实体集中确定所述目标实体,包括:
根据所述空间域信息中的属性信息、所述空间域信息中的地理位置信息以及所述搜索项实体,确定第一相似度得分;
根据所述空间域信息中的属性信息和所述搜索项实体的类型信息,确定第二相似度得分;
根据所述空间域信息中的属性信息、所述空间域信息中的地理位置信息以及所述搜索项实体的上下文信息,确定第三相似度得分;
根据所述第一相似度得分、所述第二相似度得分和所述第三相似度得分,从所述候选实体集中确定所述目标实体。
5.根据权利要求1或2所述的方法,其中,所述根据所述搜索项实体以及所述候选实体的空间域信息,从所述候选实体集中确定所述搜索项实体映射至知识库中的目标实体,包括:
根据所述搜索项实体,确定所述目标搜索项的意图信息和所述搜索项实体的信息;
根据所述意图信息、所述搜索项实体的信息,以及所述候选实体的空间域信息,从所述候选实体集中确定所述搜索项实体映射至知识库中的目标实体。
6.根据权利要求5所述的方法,其中,所述根据所述搜索项实体,确定所述目标搜索项的意图信息和所述搜索项实体的信息,包括:
基于所述搜索项实体的特征提取网络层,对所述搜索项实体进行特征提取,得到所述搜索项实体的特征信息;
其中所述特征信息中包括所述目标搜索项的意图信息和所述搜索项实体的信息,该特征提取网络层中的参数基于样本搜索项的意图和样本搜索项链接的实体训练得到。
7.根据权利要求1或2所述的方法,其中,所述从知识库中确定候选实体集,包括:
根据所述目标搜索项中包括的位置信息,确定所述目标搜索项的关联位置;
根据所述关联位置,对知识库中的实体进行过滤;
根据剩余实体确定所述候选实体集。
8.根据权利要求7所述的方法,其中,所述根据剩余实体确定所述候选实体集,包括:
根据所述搜索项实体和/或所述搜索项实体的近义实体,从所述剩余实体中确定所述候选实体集。
9.根据权利要求1或2中所述的方法,其中,所述从知识库中确定候选实体集,包括:
根据所述搜索项实体的出现信息、所述搜索项实体的文本信息以及所述搜索项实体的语义信息中的至少一种,确定所述搜索项实体与知识库中实体的相似度;
根据确定的相似度,从知识库的实体中确定所述候选实体集。
10.一种实体链接装置,包括:
实体提取模块,用于提取目标搜索项中的实体作为搜索项实体,并从知识库中确定候选实体集;
信息提取模块包括:信息确定单元,用于将所述候选实体输入关系识别模型,从所述关系识别模型的特征提取网络层中输出所述候选实体的空间域信息,所述候选实体中包括所述空间域信息关联的实体,所述空间域信息包括属性信息和/或地理位置信息;所述关系识别模型是用于识别输入实体在空间域的从属关系的网络;其中,在空间域的从属关系包括属性信息的从属关系和/或地理位置信息的从属关系;
实体确定模块,用于根据所述搜索项实体以及所述候选实体的空间域信息,从所述候选实体集中确定所述搜索项实体映射至知识库中的目标实体;其中,所述目标实体是所述知识库,与所述搜索项实体中的所述属性信息和/或所述地理位置信息匹配的实体。
11.根据权利要求10所述的装置,其中,所述关系识别模型的训练包括:
利用至少两个样本实体以及所述至少两个样本实体在空间域的从属关系,对初始识别模型进行训练,得到所述关系识别模型。
12.根据权利要求10或11所述的装置,其中,所述实体确定模块,包括:
实体确定单元,用于根据所述搜索项实体,所述搜索项实体的上下文信息和/或所述搜索项实体的类型信息,以及所述候选实体的空间域信息,从所述候选实体集中确定所述目标实体。
13.根据权利要求12所述的装置,其中,所述实体确定单元具体用于:
根据所述空间域信息中的属性信息、所述空间域信息中的地理位置信息以及所述搜索项实体,确定第一相似度得分;
根据所述空间域信息中的属性信息和所述搜索项实体的类型信息,确定第二相似度得分;
根据所述空间域信息中的属性信息、所述空间域信息中的地理位置信息以及所述搜索项实体的上下文信息,确定第三相似度得分;
根据所述第一相似度得分、所述第二相似度得分和所述第三相似度得分,从所述候选实体集中确定所述目标实体。
14.根据权利要求10或11所述的装置,其中,所述实体确定模块,包括:
意图确定单元,用于根据所述搜索项实体,确定所述目标搜索项的意图信息和所述搜索项实体的信息;
实体确定单元,用于根据所述意图信息、所述搜索项实体的信息,以及所述候选实体的空间域信息,从所述候选实体集中确定所述搜索项实体映射至知识库中的目标实体。
15.根据权利要求14所述的装置,其中,所述意图确定单元具体用于:
基于所述搜索项实体的特征提取网络层,对所述搜索项实体进行特征提取,得到所述搜索项实体的特征信息;
其中所述特征信息中包括所述目标搜索项的意图信息和所述搜索项实体的信息,该特征提取网络层中的参数基于样本搜索项的意图和样本搜索项链接的实体训练得到。
16.根据权利要求10或11所述的装置,其中,所述实体提取模块,包括:
位置确定单元,用于根据所述目标搜索项中包括的位置信息,确定所述目标搜索项的关联位置;
实体过滤单元,用于根据所述关联位置,对知识库中的实体进行过滤;
实体集确定单元,用于根据剩余实体确定所述候选实体集。
17.根据权利要求16所述的装置,其中,所述实体集确定单元具体用于:
根据所述搜索项实体和/或所述搜索项实体的近义实体,从所述剩余实体中确定所述候选实体集。
18.根据权利要求10或11中所述的装置,其中,所述实体提取模块,包括:
相似度确定单元,用于根据所述搜索项实体的出现信息、所述搜索项实体的文本信息以及所述搜索项实体的语义信息中的至少一种,确定所述搜索项实体与知识库中实体的相似度;
实体确定单元,用于根据确定的相似度,从知识库的实体中确定所述候选实体集。
19.一种电子设备,其中,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9中任一项所述的方法。
20.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行权利要求1-9中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010548446.3A CN111737430B (zh) | 2020-06-16 | 2020-06-16 | 实体链接方法、装置、设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010548446.3A CN111737430B (zh) | 2020-06-16 | 2020-06-16 | 实体链接方法、装置、设备以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111737430A CN111737430A (zh) | 2020-10-02 |
CN111737430B true CN111737430B (zh) | 2024-04-05 |
Family
ID=72649501
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010548446.3A Active CN111737430B (zh) | 2020-06-16 | 2020-06-16 | 实体链接方法、装置、设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111737430B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112163101B (zh) * | 2020-10-30 | 2024-01-26 | 武汉大学 | 一种面向空间知识图谱的地理实体匹配与融合方法 |
CN112989235B (zh) * | 2021-03-09 | 2023-08-01 | 北京百度网讯科技有限公司 | 基于知识库的内链构建方法、装置、设备和存储介质 |
CN113535883B (zh) * | 2021-07-16 | 2023-10-31 | 携程旅游信息技术(上海)有限公司 | 商业场所实体链接方法、系统、电子设备及存储介质 |
CN117151107A (zh) * | 2022-05-24 | 2023-12-01 | 中国电信股份有限公司 | 一种意图识别方法、装置、存储介质和电子设备 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101894170A (zh) * | 2010-08-13 | 2010-11-24 | 武汉大学 | 基于语义关联网络的跨模信息检索方法 |
CN103399885A (zh) * | 2013-07-19 | 2013-11-20 | 百度在线网络技术(北京)有限公司 | 兴趣点代表图片的挖掘方法、装置和服务器 |
CN105224648A (zh) * | 2015-09-29 | 2016-01-06 | 浪潮(北京)电子信息产业有限公司 | 一种实体链接方法与系统 |
CN106202382A (zh) * | 2016-07-08 | 2016-12-07 | 南京缘长信息科技有限公司 | 链接实体方法和系统 |
JP2017123168A (ja) * | 2016-01-05 | 2017-07-13 | 富士通株式会社 | セマンティック知識ベースにおける実体にショートテキストにおける実体言及を関連付ける方法及び装置 |
CN107679186A (zh) * | 2017-09-30 | 2018-02-09 | 北京奇虎科技有限公司 | 基于实体库进行实体搜索的方法及装置 |
CN108415902A (zh) * | 2018-02-10 | 2018-08-17 | 合肥工业大学 | 一种基于搜索引擎的命名实体链接方法 |
CN108875007A (zh) * | 2018-06-15 | 2018-11-23 | 腾讯科技(深圳)有限公司 | 兴趣点的确定方法和装置、存储介质、电子装置 |
CN108959270A (zh) * | 2018-08-10 | 2018-12-07 | 新华智云科技有限公司 | 一种基于深度学习的实体链接方法 |
CN109145153A (zh) * | 2018-07-02 | 2019-01-04 | 北京奇艺世纪科技有限公司 | 意图类别的识别方法和装置 |
CN109271524A (zh) * | 2018-08-02 | 2019-01-25 | 中国科学院计算技术研究所 | 知识库问答系统中的实体链接方法 |
CN109783624A (zh) * | 2018-12-27 | 2019-05-21 | 联想(北京)有限公司 | 基于知识库的答案生成方法、装置和智能会话系统 |
CN110147421A (zh) * | 2019-05-10 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 一种目标实体链接方法、装置、设备及存储介质 |
CN110704600A (zh) * | 2019-09-30 | 2020-01-17 | 北京百度网讯科技有限公司 | 问答动态匹配方法、装置和电子设备 |
CN110837550A (zh) * | 2019-11-11 | 2020-02-25 | 中山大学 | 基于知识图谱的问答方法、装置、电子设备及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10410139B2 (en) * | 2016-01-05 | 2019-09-10 | Oracle International Corporation | Named entity recognition and entity linking joint training |
US10706113B2 (en) * | 2017-01-06 | 2020-07-07 | Microsoft Technology Licensing, Llc | Domain review system for identifying entity relationships and corresponding insights |
KR101983455B1 (ko) * | 2017-09-21 | 2019-05-28 | 숭실대학교산학협력단 | 지식베이스 구축 방법 및 그 서버 |
-
2020
- 2020-06-16 CN CN202010548446.3A patent/CN111737430B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101894170A (zh) * | 2010-08-13 | 2010-11-24 | 武汉大学 | 基于语义关联网络的跨模信息检索方法 |
CN103399885A (zh) * | 2013-07-19 | 2013-11-20 | 百度在线网络技术(北京)有限公司 | 兴趣点代表图片的挖掘方法、装置和服务器 |
CN105224648A (zh) * | 2015-09-29 | 2016-01-06 | 浪潮(北京)电子信息产业有限公司 | 一种实体链接方法与系统 |
JP2017123168A (ja) * | 2016-01-05 | 2017-07-13 | 富士通株式会社 | セマンティック知識ベースにおける実体にショートテキストにおける実体言及を関連付ける方法及び装置 |
CN106202382A (zh) * | 2016-07-08 | 2016-12-07 | 南京缘长信息科技有限公司 | 链接实体方法和系统 |
CN107679186A (zh) * | 2017-09-30 | 2018-02-09 | 北京奇虎科技有限公司 | 基于实体库进行实体搜索的方法及装置 |
CN108415902A (zh) * | 2018-02-10 | 2018-08-17 | 合肥工业大学 | 一种基于搜索引擎的命名实体链接方法 |
CN108875007A (zh) * | 2018-06-15 | 2018-11-23 | 腾讯科技(深圳)有限公司 | 兴趣点的确定方法和装置、存储介质、电子装置 |
CN109145153A (zh) * | 2018-07-02 | 2019-01-04 | 北京奇艺世纪科技有限公司 | 意图类别的识别方法和装置 |
CN109271524A (zh) * | 2018-08-02 | 2019-01-25 | 中国科学院计算技术研究所 | 知识库问答系统中的实体链接方法 |
CN108959270A (zh) * | 2018-08-10 | 2018-12-07 | 新华智云科技有限公司 | 一种基于深度学习的实体链接方法 |
CN109783624A (zh) * | 2018-12-27 | 2019-05-21 | 联想(北京)有限公司 | 基于知识库的答案生成方法、装置和智能会话系统 |
CN110147421A (zh) * | 2019-05-10 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 一种目标实体链接方法、装置、设备及存储介质 |
CN110704600A (zh) * | 2019-09-30 | 2020-01-17 | 北京百度网讯科技有限公司 | 问答动态匹配方法、装置和电子设备 |
CN110837550A (zh) * | 2019-11-11 | 2020-02-25 | 中山大学 | 基于知识图谱的问答方法、装置、电子设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
多策略候选集构建与实体链接;杨紫怡 等;计算机工程与科学;20181231;第40卷(第12期);全文 * |
实体链接研究综述;陆伟;武川;;情报学报(01);107-114 * |
Also Published As
Publication number | Publication date |
---|---|
CN111737430A (zh) | 2020-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111737430B (zh) | 实体链接方法、装置、设备以及存储介质 | |
RU2688271C2 (ru) | Поиск изображений на естественном языке | |
EP3230979B1 (en) | Method and system for determining user intent in a spoken dialog based on transforming at least one portion of a semantic knowledge graph to a probabilistic state graph | |
CN110851738B (zh) | 获取poi状态信息的方法、装置、设备和计算机存储介质 | |
CN108701161B (zh) | 为搜索查询提供图像 | |
CN113094550B (zh) | 视频检索方法、装置、设备和介质 | |
CN110909170B (zh) | 兴趣点知识图谱构建方法、装置、电子设备及存储介质 | |
CN110926486B (zh) | 一种路线确定方法、装置、设备和计算机存储介质 | |
JP7159405B2 (ja) | 地図情報表示方法、装置、電子デバイス及び記憶媒体 | |
JP2022512269A (ja) | Poi名を抽出する方法、装置、デバイス、プログラム及びコンピュータ記憶媒体 | |
CN113553414B (zh) | 智能对话方法、装置、电子设备和存储介质 | |
CN111814077B (zh) | 信息点查询方法、装置、设备和介质 | |
CN112328890B (zh) | 搜索地理位置点的方法、装置、设备及存储介质 | |
CN112528001B (zh) | 一种信息查询方法、装置及电子设备 | |
CN113220835B (zh) | 文本信息处理方法、装置、电子设备以及存储介质 | |
US20210240983A1 (en) | Method and apparatus for building extraction, and storage medium | |
JP7206514B2 (ja) | 地理位置点のソート方法、ソートモデルの訓練方法及び対応装置 | |
CN115455161A (zh) | 对话处理方法、装置、电子设备及存储介质 | |
CN111538815A (zh) | 一种文本查询方法、装置、设备及存储介质 | |
CN112101013A (zh) | 地点抽取方法、装置、设备以及存储介质 | |
CN112541362A (zh) | 一种泛化处理的方法、装置、设备和计算机存储介质 | |
KR102565798B1 (ko) | 지리적 위치점들의 공간 관계를 추출하는 방법 및 장치 | |
CN113516491A (zh) | 推广信息展示方法、装置、电子设备及存储介质 | |
CN112328896B (zh) | 用于输出信息的方法、装置、电子设备和介质 | |
CN111753195B (zh) | 标签体系构建方法、装置、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |