CN110489561A - 知识图谱构建方法、装置、计算机设备和存储介质 - Google Patents
知识图谱构建方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN110489561A CN110489561A CN201910627988.7A CN201910627988A CN110489561A CN 110489561 A CN110489561 A CN 110489561A CN 201910627988 A CN201910627988 A CN 201910627988A CN 110489561 A CN110489561 A CN 110489561A
- Authority
- CN
- China
- Prior art keywords
- entity
- knowledge
- data
- resource
- incidence relation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013507 mapping Methods 0.000 title claims abstract description 198
- 238000010276 construction Methods 0.000 title claims abstract description 35
- 238000000034 method Methods 0.000 claims abstract description 21
- 238000004590 computer program Methods 0.000 claims description 19
- 238000000605 extraction Methods 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 6
- 230000001419 dependent effect Effects 0.000 abstract description 4
- 230000000875 corresponding effect Effects 0.000 description 46
- 239000000047 product Substances 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 239000000203 mixture Substances 0.000 description 6
- 239000000284 extract Substances 0.000 description 4
- 238000013499 data model Methods 0.000 description 3
- 238000009412 basement excavation Methods 0.000 description 2
- 230000009193 crawling Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种知识图谱构建方法、装置、计算机设备和存储介质。本申请涉及知识图谱领域,所述方法通过预生成的知识图谱本体来构建知识图谱,由于预生成的知识图谱本体包括资源标识和资源标识之间的关联关系,那么从知识数据中识别出属于资源标识的实体后,可以根据资源标识之间的关联关系准确确定实体之间的关联关系,是构建实体三元组的基础,这样得到的知识图谱依赖于资源标识之间的关联关系生成,能够更为准确地表达知识数据中实体之间的关系,使得构建的知识图谱更准确。当获取到新的用于提取实体三元组的知识数据时,根据知识图谱中已有实体的实体属性与知识数据间的相似度,确定实体是否已存在于知识图谱中,能够更准确地更新知识图谱。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种知识图谱构建方法、装置、计算机设备和存储介质。
背景技术
行业知识图谱是面向特定领域的知识图谱。资源行业的资源数据十分丰富,知识众多,知识图谱的本体Schema设计是后续知识推理、挖掘的基础。目前,针对资源行业的知识图谱构建,通常都是直接地将其它行业的知识图谱本体直接移植过来用于建立资源行业知识图谱的建立,但是实际上,由于不同行业涉及的业务不同,知识数据是存在很大差异的,导致这种方式构建得到的知识图谱所表达的知识数据之间的联系不够准确,也会影响基于知识图谱进行知识路径分析的准确性。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高知识图谱的准确性的知识图谱构建方法、装置、计算机设备和存储介质。
一种知识图谱构建方法,所述方法包括:
获取源自于各资源数据源的资源数据;
对所述资源数据进行预处理,得到统一格式的知识数据;
获取预生成的知识图谱本体,所述本体包括资源标识以及所述资源标识之间的关联关系;
识别所述知识数据中属于所述资源标识的实体,根据所述资源标识之间的关联关系,从所述知识数据中确定所述实体之间的关联关系,并根据所述实体以及所述实体之间的关联关系,得到包含所述关联关系的实体三元组,根据所述实体三元组构建知识图谱;
当获取到新的用于提取实体三元组的知识数据时,获取所述知识图谱中已有实体所对应的实体属性,根据所述实体属性与所述知识数据的相似度,确定所述实体三元组中的实体是否指向所述已有实体;
若是,则将所述实体三元组链接至所述已有实体;
若否,则为所述实体三元组中的实体分配唯一的实体标识,并将所述实体三元组中实体所对应的实体标识、实体之间的关联关系添加至所述知识图谱对应的知识库中。
在其中一个实施例中,所述知识图谱本体的生成步骤包括:
按照FSDM模型中数据的分类对资源领域数据进行分类,并将属于同一类别的资源数据以资源标识表示;
按照不同类别的资源数据之间的预设关系,建立各所述资源标识之间的关联关系;
获取为各所述资源标识预先配置的资源属性;
将所述资源标识、所述资源标识之间的关联关系以及所述资源属性存储在知识库中,得到知识图谱本体。
在其中一个实施例中,所述对所述资源数据进行预处理,得到统一格式的知识数据,包括:
对来源于不同资源数据、且重复的资源数据进行去重处理;
以预设数据填补缺失的资源数据;以及
对相同类型的资源数据进行转换,得到相同数据格式的知识数据。在其中一个实施例中,
所述识别所述知识数据中属于所述资源标识的实体,包括:
对所述知识数据进行命名实体识别,得到实体以及对应的实体类型;
当所述实体类型属于知识图谱本体中的资源标识时,保留识别的实体;
当所述实体类型不属于知识图谱本体中的资源标识时,丢弃识别的实体。
在其中一个实施例中,所述根据所述资源标识之间的关联关系,从所述知识数据中确定所述实体之间的关联关系,包括:
基于所述知识数据所体现的上下文信息,对各所述实体进行关系抽取,得到各所述实体之间的关联关系;
当所述实体之间的关联关系属于所述知识图谱本体中的资源标识之间的关联关系时,则根据所述实体以及所述实体之间的关联关系建立实体三元组;
当所述实体之间的关联关系不属于知识图谱本体中的资源标识之间的关联关系时,则丢弃所述实体之间的关联关系。
在其中一个实施例中,所述根据所述实体以及所述实体之间的关联关系,得到包含所述关联关系的实体三元组,包括:
当所述实体之间的关联关系为实体关系时,则生成包括所述实体以及所述实体关系的实体三元组;
当所述实体之间的关联关系为属性关系时,则生成包括所述实体以及所述属性关系的实体三元组。
一种知识图谱构建装置,所述装置包括:
获取模块,用于获取源自于各资源数据源的资源数据;
预处理模块,用于对所述资源数据进行预处理,得到统一格式的知识数据;
知识图谱本体获取模块,用于获取预生成的知识图谱本体,所述本体包括资源标识以及所述资源标识之间的关联关系;
知识图谱构建模块,用于识别所述知识数据中属于所述资源标识的实体,根据所述资源标识之间的关联关系,从所述知识数据中确定所述实体之间的关联关系,并根据所述实体以及所述实体之间的关联关系,得到包含所述关联关系的实体三元组,根据所述实体三元组构建知识图谱;
知识图谱更新模块,用于当获取到新的用于提取实体三元组的知识数据时,获取所述知识图谱中已有实体所对应的实体属性,根据所述实体属性与所述知识数据的相似度,确定所述实体三元组中的实体是否指向所述已有实体;若是,则将所述实体三元组链接至所述已有实体;若否,则为所述实体三元组中的实体分配唯一的实体标识,并将所述实体三元组中实体所对应的实体标识、实体之间的关联关系添加至所述知识图谱对应的知识库中。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取源自于各资源数据源的资源数据;
对所述资源数据进行预处理,得到统一格式的知识数据;
获取预生成的知识图谱本体,所述本体包括资源标识以及所述资源标识之间的关联关系;
识别所述知识数据中属于所述资源标识的实体,根据所述资源标识之间的关联关系,从所述知识数据中确定所述实体之间的关联关系,并根据所述实体以及所述实体之间的关联关系,得到包含所述关联关系的实体三元组,根据所述实体三元组构建知识图谱;
当获取到新的用于提取实体三元组的知识数据时,获取所述知识图谱中已有实体所对应的实体属性,根据所述实体属性与所述知识数据的相似度,确定所述实体三元组中的实体是否指向所述已有实体;
若是,则将所述实体三元组链接至所述已有实体;
若否,则为所述实体三元组中的实体分配唯一的实体标识,并将所述实体三元组中实体所对应的实体标识、实体之间的关联关系添加至所述知识图谱对应的知识库中。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取源自于各资源数据源的资源数据;
对所述资源数据进行预处理,得到统一格式的知识数据;
获取预生成的知识图谱本体,所述本体包括资源标识以及所述资源标识之间的关联关系;
识别所述知识数据中属于所述资源标识的实体,根据所述资源标识之间的关联关系,从所述知识数据中确定所述实体之间的关联关系,并根据所述实体以及所述实体之间的关联关系,得到包含所述关联关系的实体三元组,根据所述实体三元组构建知识图谱;
当获取到新的用于提取实体三元组的知识数据时,获取所述知识图谱中已有实体所对应的实体属性,根据所述实体属性与所述知识数据的相似度,确定所述实体三元组中的实体是否指向所述已有实体;
若是,则将所述实体三元组链接至所述已有实体;
若否,则为所述实体三元组中的实体分配唯一的实体标识,并将所述实体三元组中实体所对应的实体标识、实体之间的关联关系添加至所述知识图谱对应的知识库中。
上述知识图谱构建方法、装置、计算机设备和存储介质,通过预生成的知识图谱本体来构建知识图谱,由于预生成的知识图谱本体包括资源标识和资源标识之间的关联关系,那么从知识数据中识别出属于资源标识的实体后,可以根据资源标识之间的关联关系准确确定实体之间的关联关系,是构建实体三元组的基础,这样得到的知识图谱依赖于资源标识之间的关联关系生成,能够更为准确地表达知识数据中实体之间的关系,使得构建的知识图谱更为准确。另一方面,当获取到新的用于提取实体三元组的知识数据时,根据知识图谱中已有实体的实体属性与知识数据之间的相似度,确定知识数据是否已存在于知识图谱中,能够更为准确地补充和更新知识图谱。
附图说明
图1为一个实施例中知识图谱构建方法的应用场景图;
图2为一个实施例中知识图谱构建方法的流程示意图;
图3为一个实施例中知识图谱本体中各个资源标识之间的关系的示意图;
图4为一个实施例中为资源标识“基金”分配的资源属性的示意图;
图5为一个实施例中以图的形式表示构建的知识图谱的示意图;
图6为一个实施例中知识图谱构建装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的知识图谱构建方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。服务器104可以获取源自于各资源数据源的资源数据;对资源数据进行预处理,得到统一格式的知识数据;获取预生成的知识图谱本体,本体包括资源标识以及资源标识之间的关联关系;识别知识数据中属于资源标识的实体,根据资源标识之间的关联关系,从知识数据中确定实体之间的关联关系,并根据实体以及实体之间的关联关系,得到包含关联关系的实体三元组,根据实体三元组构建知识图谱;当获取到新的用于提取实体三元组的知识数据时,获取知识图谱中已有实体所对应的实体属性,根据实体属性与知识数据的相似度,确定实体三元组中的实体是否指向已有实体;若是,则将实体三元组链接至已有实体;若否,则为实体三元组中的实体分配唯一的实体标识,并将实体三元组中实体所对应的实体标识、实体之间的关联关系添加至知识图谱对应的知识库中。终端102可以获取用户输入的与资源相关的检索词条,将检索词条发送至服务器104,由服务器104采用命名实体识别技术从检索词条中提取出实体,并按照提取出的实体从构建的知识图谱中查找与该实体相关的知识数据,并返回至终端102,终端102可以以图的形式向用户展示与检索词条对应的检索结果。
其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种知识图谱构建方法,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:
步骤202,获取源自于各资源数据源的资源数据。
其中,资源数据源包括互联网网站、金融机构数据库或保险机构数据库等。获取的资源数据包括从互联网上获取的公开数据、从金融机构或保险机构的关系数据库中获取的高质量的资源信息,包括基金、股票和证券等相关的信息等。具体地,服务器可以从公开网站上爬取大量有关基金、证券相关的非结构化的文本数据,以及网页、表格等半结构化数据,还可以从权威机构数据库中直接获取结构化数据,作为资源数据。
步骤204,对资源数据进行预处理,得到统一格式的知识数据。
其中,预处理是指对得到的资源数据去除噪声的过程,经过预处理得到统一格式的可以用于构建知识图谱的知识数据。
在其中一个实施例中,预处理包括数据去重处理、数据补全处理和数据统一处理中的至少一种;对资源数据进行预处理,得到统一格式的知识数据,包括:对来源于不同资源数据源、且重复的资源数据进行去重处理。
具体地,获取的每一条资源数据包括用于描述资源的不同属性的描述信息,当获取的多条资源数据描述的是同一个资源的不同属性,则可以将这多条资源数据合并;当获取的多条资源数据描述的是同一个资源的相同属性,则删除重复的资源数据。比如,不同网站上可能都存在与某个基金相关的信息,对于从多个网站上爬取到的与该基金相关的重复的数据,需要进行去重处理,删除重复的数据,降低知识数据的冗余度。
在其中一个实施例中,还可以包括:以预设数据填补缺失的资源数据。
具体地,当获取的资源数据中缺失了与资源的某一属性相关的描述信息时,则可以用预设数据进行填补。当爬取到与该资源的该属性相关的描述信息时,再用该描述信息进行补全。比如,有的平台提供的基金信息可能不包括基金到期日等,可以用“不存在”进行填补,当爬取到与基金的基金到期日对应的描述信息时,再将该描述信息补入与该基金对应的资源数据中。
在其中一个实施例中,还可以包括:对相同类型的资源数据进行转换,得到相同数据格式的资源数据。也就是,对于用于描述不同资源的相同属性的描述信息,可以将其用统计的数据格式表示。比如,获取多条资源数据所描述的资源为不同的基金经理,对于各个基金经理的出生日期,可以统一采用XXXX(年)-XX(月)-XX(日)的格式。
步骤206,获取预生成的知识图谱本体,本体包括资源标识以及资源标识之间的关联关系。
其中,知识图谱本体(Schema)描述了资源领域所涉及的资源概念、资源概念与资源概念之间的关系以及资源属性。每个资源概念和资源属性用一个全局唯一确定的ID来标识,称为它们的标识符(Identifier),也就是资源标识。由于知识图谱本体对于资源领域的知识数据普遍适用,从而基于知识图谱本体构建得到的知识图谱准确性较高。资源概念指的是资源领域中具有共同特性的实体所构成的集合。资源概念与实体是对应的,实体指的是资源领域中具有可区别性且独立存在的某个具体的事物,比如资源概念为“公司”,而相应的实体为“XX基金公司”。
在其中一个实施例中,上述知识图谱本体的生成步骤包括:按照FSDM模型中数据的分类对资源领域数据进行分类,并将属于同一类别的资源数据以资源标识表示;按照不同类别的资源数据之间的预设关系,建立各资源标识之间的关联关系;获取为各资源标识预先配置的资源属性;将资源标识、资源标识之间的关联关系以及资源属性存储在知识库中,得到知识图谱本体。
其中,FSDM模型(Financial Services Data Model,企业级资源数据模型)是一个企业级的数据模型,在该模型中,与资源相关的信息被分解为九大数据概念,分别为:参与方、产品、合约、分类、事件、地点、资源项目、业务方向和条件。该模型在关系型数据库中以实体表、关系表和属性表为基础构建数据仓库,因此,在构建资源领域的知识图谱本体时,可以基于FSDM模型对资源信息的分类,将资源数据进行分类,并将属于同一类别的资源数据以资源标识表示。
比如,与参与方对应的资源概念可以定义为资源投资市场所包括的参与人,包括:个人投资者、寿险公司、财险公司、养老基金公司、投资基金公司、商业银行、投资银行、上市公司的母公司、上市公司的子公司、集团公司、券商、监管机构、政府、做市商、基金经理、研究员、高管、股东、法人代表和基金公司等。与产品对应的资源概念可以定义为可用于投资的资产,包括:普通股票、优先股票、股票型基金、债券型基金、混合型基金、货币性基金、期货、债券、期权、保险、理财产品和产品组合等。与合约对应的资源概念可以定义为资源投资过程中产生的合同,包括:股票合约、基金合约、期货合约、期权合约、债券合约、保险产品合约、理财产品合约和产品组合合约等。与分类对应的资源概念可以定义为资源投资领域中各实体的类别、评级和风格等。与事件对应的资源概念可以定义为资源投资过程中发生的事件以及组成的事实,包括:买入、卖出、发布资讯、发布财务报告、发表研究报告、颁布政策、发布公告、市场投资者情绪、市场行情和发布法规等。与条件对应的资源概念可以定义为用于触发资源投资活动的条件,包括:宏观经济情况、投资市场行情情况、政策、法规、公司的估值指标、财务指标、行业情况和市场情况等。
需要说明的是,知识图谱本体中的资源概念与资源概念是互斥的,资源数据中识别出的实体只能对应其中的某一个资源概念,也就是属于其中的某一个资源标识。知识图谱本体中的资源概念不受限于上面描述的部分,还可以根据实际业务情况对每个资源概念进一步细分,明确各个资源概念之间的上下位关系。
预设的概念关系是各个资源概念之间的关联关系,也就是资源标识之间的关联关系。如图3所示,为一个实施例中知识图谱本体中各个资源标识之间的关系的示意图。参照图3,产品与产品之间存在相关关系,包括正相关和负相关两种。参与方与参与方之间存在社会关系和经济关系,其中,社会关系包括同事、曾同事、配偶、父母、子女等;经济关系包括调研、控股、任职和曾任职。参与方与产品之间存在运营关系,参与方与事件之间存在发行关系和交易关系。资产与资源项目之间存在依赖关系。业务方向与条件之间存在依赖关系。合约与产品之间存在标的关系:该合约的标的是产品。事件与条件之间存在符合关系:事件符合条件。参与方与事件之间存在产生关系:发表、发布、公布。需要说明的是,构建的知识图谱本体中资源概念之间的关系不受限于上面描述的部分,可以根据实际业务情况对各个资源概念之间的关系进行细化。
资源属性是为资源概念分配的属性,也就是为资源标识预先配置的资源属性。在为某个资源概念分配资源属性时,也需要考虑到分配的资源属性是否普遍适用于资源领域中该资源概念所对应的实体。如图4所示,为一个实施例中为资源概念“基金”分配的资源属性的示意图。参照图4,对于“基金”而言,对应的资源属性包括“基本资料”、“业绩表现”、“年度回报”、“资产配置”、“行业配置”等,而“基本资料”又包括“成立日期、到期日、规模、管理机构、基金经理和基金风格”等,这些信息是基金普遍具备的。
因此,服务器可在构建知识图谱本体时,依据对资源领域信息进行分类得到资源概念、预设的资源概念之间的关联关系以及为各个资源概念分配的资源属性,通过本体建模语言以资源标识的形式将这些资源概念根据关系进行关联,构建资源领域的知识图谱本体。从上述内容可以知道,知识图谱概本体中包括了理解资源数据所需的三种要素,包括:用于描述资源概念的概念集(资源标识集)、用于描述资源概念与资源概念之间关联关系集以及用于描述概念的资源属性的资源属性集。
在其中一个实施例中,由于资源领域所涉及的概念和范围是相对固定的,为了能够限制待构建的知识图谱中涉及的实体以及实体关系,提高得到的知识图谱的准确性,可以采用自顶向下的方式构建资源领域知识图谱本体。
步骤208,识别知识数据中属于资源标识的实体,根据资源标识之间的关联关系,从知识数据中确定实体之间的关联关系,并根据实体以及实体之间的关联关系,得到包含关联关系的实体三元组,根据实体三元组构建知识图谱。
具体地,服务器在获取到知识数据后,可按照预先生成的知识图谱本体中包括的资源标识,采用命名实体识别技术从知识数据中识别出与属于知识图谱本体中资源标识的实体。在从知识数据中按照知识图谱本体包括的资源标识识别出相应的实体后,服务器可以采用关系抽取技术,从知识数据中抽取出实体与实体之间的关联关系,根据抽取的关系以及抽取的关系所关联的两个实体得到包括抽取出的关系的实体三元组。
在其中一个实施例中,识别知识数据中属于资源标识的实体,包括:对知识数据进行命名实体识别,得到实体以及对应的实体类型;当实体类型属于知识图谱本体中的资源标识时,保留识别的实体;当实体类型不属于知识图谱本体中的资源标识时,丢弃识别的实体。
具体地,服务器可采用命名实体识别技术从知识数据中识别出实体以及对应的实体类型,当实体类型不属于知识图谱本体中用于描述资源概念的资源标识时,则说明该实体不属于资源概念,也就是该实体并非构建知识图谱所需的信息,可以将识别出的实体丢弃;当识别出的实体类型属于知识图谱本体中的用于描述资源概念的资源标识时,则说明该实体是构建知识图谱所需要的信息,该信息可以用于进行资源领域的知识挖掘和知识推理。
在本实施例中,通过将知识图谱本体所包括的资源标识与识别出的实体对应的实体类型进行匹配,从而对识别出的实体进行筛选,能够保证构建的知识图谱的精准性,也能降低知识图谱的厚度,过滤掉无效的信息。
在其中一个实施例中,根据资源标识之间的关联关系,从知识数据中确定实体之间的关联关系,包括:基于知识数据所体现的上下文信息,对各实体进行关系抽取,得到各实体之间的关联关系;当实体之间的关联关系属于知识图谱本体中的资源标识之间的关联关系时,则根据实体以及实体之间的关联关系建立实体三元组;当实体之间的关联关系不属于知识图谱本体中的资源标识之间的关联关系时,则丢弃实体之间的关联关系。
具体地,当抽取到的实体之间的关系属于知识图谱本体中的资源标识之间的关联关系时,说明抽取的关联关系是构建知识图谱所需要的关系,抽取的关联关系对于表示资源领域知识数据之间的关联性较为关键,或者是抽取的关联关系对于描述实体属性较为关键,则需要将抽取的关系保留。当抽取到的实体之间的关联关系不属于知识图谱本体中资源标识之间的关联关系时,则说明抽取的关联关系并非构建知识图谱所需要的关键信息,可以丢弃抽取的实体之间的关联关系。
在本实施例中,通过将知识图谱本体所包括的资源标识之间的关联关系与抽取得到的实体之间的关联关系进行匹配,从而对抽取出的实体之间的关联关系进行筛选,能够保证构建的知识图谱的精准性,也能降低知识图谱的厚度,过滤掉无效的信息。
在其中一个实施例中,根据实体以及实体之间的关联关系,得到包含关联关系的实体三元组,包括:当实体之间的关联关系为实体关系时,则生成包括实体以及实体关系的实体三元组;当实体之间的关联关系为属性关系时,则生成包括实体以及属性关系的实体三元组。
具体地,当实体之间的关联关系为实体关系时,即抽取的关系是两个不同实体之间的关联关系,则生成包括实体以及实体关系的实体三元组,即实体1-关系-实体2。当实体之间的关联关系为属性关系时,即抽取的关系是实体与其属性之间的关联关系,则生成包括实体、属性关系以及属性值的实体三元组,即实体1-属性-属性值,这里的属性值也可能是实体2。
步骤210,当获取到新的用于提取实体三元组的知识数据时,获取知识图谱中已有实体所对应的实体属性,根据实体属性与知识数据的相似度,确定实体三元组中的实体是否指向已有实体;若是,则将实体三元组链接至已有实体;若否,则为实体三元组中的实体分配唯一的实体标识,并将实体三元组中实体所对应的实体标识、实体之间的关联关系添加至知识图谱对应的知识库中。
具体地,从知识数据中提取出与知识图谱本体匹配的实体三元组后,就可以将得到的实体三元组导入至知识库中,构建资源领域的知识图谱。知识库可以是图数据库。
当获取到新的用于提取新的实体三元组的知识数据时,服务器可以根据知识图谱中已有实体对应的实体属性,根据实体属性与知识数据的相似度对新的实体三元组所包括的实体进行语义消歧。其中,实体消歧是指对真实世界中同一对象对应的不同实体代指进行统一并将这些实体代指归并为一个具有全局唯一标识的实体,并将归并的这一实体添加到知识图谱中。服务器可以根据实体属性与知识数据的相似度,确定新的实体三元组中的实体是否指向已有实体,若相似度超过阈值,也就是新的实体三元组中的实体指向已有实体,则新的实体三元组链接至已有实体,若相似度低于阈值,也就是新的实体三元组中的实体是一个全新的实体,则服务器为实体三元组中的实体分配唯一的实体标识,并将实体三元组中实体所对应的实体标识、实体之间的关联关系添加至知识图谱对应的知识库中。
如图5所示,为一个实施例中以图的形式表示构建的知识图谱的示意图。图5中只是显示了部分数据用于示意知识图谱。在图5中,实体对应的实体类型属于知识图谱本体中的资源标识;实体与实体之间存在实体关系,这些实体关系属于知识图谱本体中资源标识与资源标识之间的关联关系;实体与属性之间存在属性关系,这些属性关系也属于知识图谱中资源标识所具备的属性关系。
在一个具体的实施例中,知识图谱构建方法具体包括以下步骤:
按照FSDM模型中数据的分类对资源领域数据进行分类,并将属于同一类别的资源数据以资源标识表示;按照不同类别的资源数据之间的预设关系,建立各资源标识之间的关联关系;获取为各资源标识预先配置的资源属性;将资源标识、资源标识之间的关联关系以及资源属性存储在知识库中,得到知识图谱本体;
获取源自于各资源数据源的资源数据,对资源数据进行预处理,得到统一格式的知识数据;
对知识数据进行命名实体识别,得到实体以及对应的实体类型;
当实体类型属于知识图谱本体中的资源标识时,保留识别的实体;
当实体类型不属于知识图谱本体中的资源标识时,丢弃识别的实体,基于知识数据所体现的上下文信息,对各实体进行关系抽取,得到各实体之间的关联关系;
当实体之间的关联关系属于知识图谱本体中的资源标识之间的关联关系时,则根据实体以及实体之间的关联关系建立实体三元组;
当实体之间的关联关系不属于知识图谱本体中的资源标识之间的关联关系时,则丢弃实体之间的关联关系;
当实体之间的关联关系为实体关系时,则生成包括实体以及实体关系的实体三元组;
当实体之间的关联关系为属性关系时,则生成包括实体以及属性关系的实体三元组;
根据实体三元组构建知识图谱;
当获取到新的用于提取实体三元组的知识数据时,获取知识图谱中已有实体所对应的实体属性,根据实体属性与知识数据的相似度,确定实体三元组中的实体是否指向已有实体;若是,则将实体三元组链接至已有实体;若否,则为实体三元组中的实体分配唯一的实体标识,并将实体三元组中实体所对应的实体标识、实体之间的关联关系添加至知识图谱对应的知识库中。
上述知识图谱构建方法,通过预生成的知识图谱本体来构建知识图谱,由于预生成的知识图谱本体包括资源标识和资源标识之间的关联关系,那么从知识数据中识别出属于资源标识的实体后,可以根据资源标识之间的关联关系准确确定实体之间的关联关系,是构建实体三元组的基础,这样得到的知识图谱依赖于资源标识之间的关联关系生成,能够更为准确地表达知识数据中实体之间的关系,使得构建的知识图谱更为准确。另一方面,当获取到新的用于提取实体三元组的知识数据时,根据知识图谱中已有实体的实体属性与知识数据之间的相似度,确定知识数据是否已存在于知识图谱中,能够更为准确地补充和更新知识图谱。
应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图6所示,提供了一种知识图谱构建装置600,包括:获取模块602、预处理模块604、知识图谱本体获取模块606、知识图谱构建模块608和知识图谱更新模块610,其中:
获取模块602,用于获取源自于各资源数据源的资源数据;
预处理模块604,用于对资源数据进行预处理,得到统一格式的知识数据;
知识图谱本体获取模块606,用于获取预生成的知识图谱本体,本体包括资源标识以及资源标识之间的关联关系;
知识图谱构建模块608,用于识别知识数据中属于资源标识的实体,根据资源标识之间的关联关系,从知识数据中确定实体之间的关联关系,并根据实体以及实体之间的关联关系,得到包含关联关系的实体三元组,根据实体三元组构建知识图谱;
知识图谱更新模块610,用于当获取到新的用于提取实体三元组的知识数据时,获取知识图谱中已有实体所对应的实体属性,根据实体属性与知识数据的相似度,确定实体三元组中的实体是否指向已有实体;若是,则将实体三元组链接至已有实体;若否,则为实体三元组中的实体分配唯一的实体标识,并将实体三元组中实体所对应的实体标识、实体之间的关联关系添加至知识图谱对应的知识库中。
在其中一个实施例中,知识图谱构建装置还包括本体生成模块,用于按照FSDM模型中数据的分类对资源领域数据进行分类,并将属于同一类别的资源数据以资源标识表示;按照不同类别的资源数据之间的预设关系,建立各资源标识之间的关联关系;获取为各资源标识预先配置的资源属性;将资源标识、资源标识之间的关联关系以及资源属性存储在知识库中,得到知识图谱本体。
在其中一个实施例中,预处理模块604具体用于对来源于不同资源数据、且重复的资源数据进行去重处理;以预设数据填补缺失的资源数据;以及对相同类型的资源数据进行转换,得到相同数据格式的知识数据。
在其中一个实施例中,知识图谱构建模块608还用于对知识数据进行命名实体识别,得到实体以及对应的实体类型;当实体类型属于知识图谱本体中的资源标识时,保留识别的实体;当实体类型不属于知识图谱本体中的资源标识时,丢弃识别的实体。
在其中一个实施例中,知识图谱构建模块608具体用于基于知识数据所体现的上下文信息,对各实体进行关系抽取,得到各实体之间的关联关系;当实体之间的关联关系属于知识图谱本体中的资源标识之间的关联关系时,则根据实体以及实体之间的关联关系建立实体三元组;当实体之间的关联关系不属于知识图谱本体中的资源标识之间的关联关系时,则丢弃实体之间的关联关系。
在其中一个实施例中,关系抽取模块608还用于当实体之间的关联关系为实体关系时,则生成包括实体以及实体关系的实体三元组;当实体之间的关联关系为属性关系时,则生成包括实体以及属性关系的实体三元组。
上述知识图谱构建装置,通过预生成的知识图谱本体来构建知识图谱,由于预生成的知识图谱本体包括资源标识和资源标识之间的关联关系,那么从知识数据中识别出属于资源标识的实体后,可以根据资源标识之间的关联关系准确确定实体之间的关联关系,是构建实体三元组的基础,这样得到的知识图谱依赖于资源标识之间的关联关系生成,能够更为准确地表达知识数据中实体之间的关系,使得构建的知识图谱更为准确。另一方面,当获取到新的用于提取实体三元组的知识数据时,根据知识图谱中已有实体的实体属性与知识数据之间的相似度,确定知识数据是否已存在于知识图谱中,能够更为准确地补充和更新知识图谱。
关于知识图谱构建装置的具体限定可以参见上文中对于知识图谱构建方法的限定,在此不再赘述。上述知识图谱构建装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储金融领域的知识数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种知识图谱构建方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的知识图谱构建装置可以实现为一种计算机程序的形式,计算机程序可在如图7所示的计算机设备上运行。计算机设备的存储器中可存储组成该知识图谱构建装置的各个程序模块,比如,图6所示的获取模块602、预处理模块604、知识图谱本体获取模块606、知识图谱构建模块608和知识图谱更新模块610。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的知识图谱构建方法中的步骤。
例如,图7所示的计算机设备可以通过如图6所示的知识图谱构建装置中的获取模块602执行步骤202。计算机设备可通过预处理模块604执行步骤204。计算机设备可通过知识图谱本体获取模块606执行步骤206。计算机设备可通过知识图谱构建模块608执行步骤208。计算机设备可通过知识图谱更新模块610执行步骤210。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述知识图谱构建方法的步骤。此处知识图谱构建方法的步骤可以是上述各个实施例的知识图谱构建方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述知识图谱构建方法的步骤。此处知识图谱构建方法的步骤可以是上述各个实施例的知识图谱构建方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种知识图谱构建方法,所述方法包括:
获取源自于各资源数据源的资源数据;
对所述资源数据进行预处理,得到统一格式的知识数据;
获取预生成的知识图谱本体,所述本体包括资源标识以及所述资源标识之间的关联关系;
识别所述知识数据中属于所述资源标识的实体,根据所述资源标识之间的关联关系,从所述知识数据中确定所述实体之间的关联关系,并根据所述实体以及所述实体之间的关联关系,得到包含所述关联关系的实体三元组,根据所述实体三元组构建知识图谱;
当获取到新的用于提取实体三元组的知识数据时,获取所述知识图谱中已有实体所对应的实体属性,根据所述实体属性与所述知识数据的相似度,确定所述实体三元组中的实体是否指向所述已有实体;
若是,则将所述实体三元组链接至所述已有实体;
若否,则为所述实体三元组中的实体分配唯一的实体标识,并将所述实体三元组中实体所对应的实体标识、实体之间的关联关系添加至所述知识图谱对应的知识库中。
2.根据权利要求1所述的方法,其特征在于,所述知识图谱本体的生成步骤包括:
按照FSDM模型中数据的分类对资源领域数据进行分类,并将属于同一类别的资源数据以资源标识表示;
按照不同类别的资源数据之间的预设关系,建立各所述资源标识之间的关联关系;
获取为各所述资源标识预先配置的资源属性;
将所述资源标识、所述资源标识之间的关联关系以及所述资源属性存储在知识库中,得到知识图谱本体。
3.根据权利要求1所述的方法,其特征在于,所述对所述资源数据进行预处理,得到统一格式的知识数据,包括:
对来源于不同资源数据、且重复的资源数据进行去重处理;
以预设数据填补缺失的资源数据;以及
对相同类型的资源数据进行转换,得到相同数据格式的知识数据。
4.根据权利要求1所述的方法,其特征在于,所述识别所述知识数据中属于所述资源标识的实体,包括:
对所述知识数据进行命名实体识别,得到实体以及对应的实体类型;
当所述实体类型属于知识图谱本体中的资源标识时,保留识别的实体;
当所述实体类型不属于知识图谱本体中的资源标识时,丢弃识别的实体。
5.根据权利要求1所述的方法,其特征在于,所述根据所述资源标识之间的关联关系,从所述知识数据中确定所述实体之间的关联关系,包括:
基于所述知识数据所体现的上下文信息,对各所述实体进行关系抽取,得到各所述实体之间的关联关系;
当所述实体之间的关联关系属于所述知识图谱本体中的资源标识之间的关联关系时,则根据所述实体以及所述实体之间的关联关系建立实体三元组;
当所述实体之间的关联关系不属于知识图谱本体中的资源标识之间的关联关系时,则丢弃所述实体之间的关联关系。
6.根据权利要求5所述的方法,其特征在于,所述根据所述实体以及所述实体之间的关联关系,得到包含所述关联关系的实体三元组,包括:
当所述实体之间的关联关系为实体关系时,则生成包括所述实体以及所述实体关系的实体三元组;
当所述实体之间的关联关系为属性关系时,则生成包括所述实体以及所述属性关系的实体三元组。
7.一种知识图谱构建装置,其特征在于,所述装置包括:
获取模块,用于获取源自于各资源数据源的资源数据;
预处理模块,用于对所述资源数据进行预处理,得到统一格式的知识数据;
知识图谱本体获取模块,用于获取预生成的知识图谱本体,所述本体包括资源标识以及所述资源标识之间的关联关系;
知识图谱构建模块,用于识别所述知识数据中属于所述资源标识的实体,根据所述资源标识之间的关联关系,从所述知识数据中确定所述实体之间的关联关系,并根据所述实体以及所述实体之间的关联关系,得到包含所述关联关系的实体三元组,根据所述实体三元组构建知识图谱;
知识图谱更新模块,用于当获取到新的用于提取实体三元组的知识数据时,获取所述知识图谱中已有实体所对应的实体属性,根据所述实体属性与所述知识数据的相似度,确定所述实体三元组中的实体是否指向所述已有实体;若是,则将所述实体三元组链接至所述已有实体;若否,则为所述实体三元组中的实体分配唯一的实体标识,并将所述实体三元组中实体所对应的实体标识、实体之间的关联关系添加至所述知识图谱对应的知识库中。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
实体获取模块,用于对所述知识数据进行命名实体识别,得到实体以及对应的实体类型;当所述实体类型属于知识图谱本体中的资源标识时,保留识别的实体;当所述实体类型不属于知识图谱本体中的资源标识时,丢弃识别的实体。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910627988.7A CN110489561A (zh) | 2019-07-12 | 2019-07-12 | 知识图谱构建方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910627988.7A CN110489561A (zh) | 2019-07-12 | 2019-07-12 | 知识图谱构建方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110489561A true CN110489561A (zh) | 2019-11-22 |
Family
ID=68547029
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910627988.7A Pending CN110489561A (zh) | 2019-07-12 | 2019-07-12 | 知识图谱构建方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110489561A (zh) |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111026816A (zh) * | 2019-12-09 | 2020-04-17 | 重庆锐云科技有限公司 | 基于知识图谱的高净值客户群识别方法、装置及存储介质 |
CN111159210A (zh) * | 2019-12-31 | 2020-05-15 | 北京明略软件系统有限公司 | 一种信息处理系统、方法及装置 |
CN111198852A (zh) * | 2019-12-30 | 2020-05-26 | 浪潮通用软件有限公司 | 微服务架构下知识图谱驱动的元数据关系推理方法 |
CN111242774A (zh) * | 2020-01-23 | 2020-06-05 | 中国建设银行股份有限公司 | 银行客户资产图谱构建方法和装置 |
CN111291135A (zh) * | 2020-01-21 | 2020-06-16 | 深圳追一科技有限公司 | 知识图谱构建方法和装置、服务器、计算机可读存储介质 |
CN111368097A (zh) * | 2020-03-30 | 2020-07-03 | 中国建设银行股份有限公司 | 一种知识图谱抽取方法及装置 |
CN111444181A (zh) * | 2020-03-20 | 2020-07-24 | 腾讯科技(深圳)有限公司 | 知识图谱更新方法、装置及电子设备 |
CN111488461A (zh) * | 2020-03-24 | 2020-08-04 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN111597354A (zh) * | 2020-05-21 | 2020-08-28 | 北京明略软件系统有限公司 | 知识图谱配置方法、装置、计算机设备和可读存储介质 |
CN111753027A (zh) * | 2020-06-29 | 2020-10-09 | 中国科学院文献情报中心 | 一种面向多实体的隐式知识图谱表示的方法及装置 |
CN111782820A (zh) * | 2020-06-30 | 2020-10-16 | 京东数字科技控股有限公司 | 知识图谱创建方法及装置、可读存储介质及电子设备 |
CN112148893A (zh) * | 2020-09-25 | 2020-12-29 | 南方电网数字电网研究院有限公司 | 能源分析知识图谱构建方法与能源分析可视化方法 |
CN112445919A (zh) * | 2021-02-01 | 2021-03-05 | 深圳追一科技有限公司 | 知识图谱构建方法和装置、服务器、计算机可读存储介质 |
CN112463986A (zh) * | 2020-12-08 | 2021-03-09 | 北京明略软件系统有限公司 | 信息存储的方法及装置 |
CN112507035A (zh) * | 2020-11-25 | 2021-03-16 | 国网电力科学研究院武汉南瑞有限责任公司 | 输电线路多源异构数据统一标准化处理系统及方法 |
CN112650855A (zh) * | 2020-12-26 | 2021-04-13 | 曙光信息产业股份有限公司 | 知识图谱工程化构建方法、装置、计算机设备和存储介质 |
CN112714032A (zh) * | 2021-03-29 | 2021-04-27 | 网络通信与安全紫金山实验室 | 无线网络协议知识图谱构建分析方法、系统、设备及介质 |
CN112818131A (zh) * | 2021-02-01 | 2021-05-18 | 亚信科技(成都)有限公司 | 一种威胁情报的图谱构建方法、系统及存储介质 |
CN112989066A (zh) * | 2021-03-25 | 2021-06-18 | 北京百度网讯科技有限公司 | 数据处理方法和装置、电子设备、计算机可读介质 |
CN113157947A (zh) * | 2021-05-20 | 2021-07-23 | 中国工商银行股份有限公司 | 知识图谱的构建方法、工具、装置和服务器 |
CN113569007A (zh) * | 2021-06-18 | 2021-10-29 | 武汉理工数字传播工程有限公司 | 一种处理知识服务资源的方法、装置及存储介质 |
CN113934729A (zh) * | 2021-10-20 | 2022-01-14 | 平安国际智慧城市科技股份有限公司 | 一种基于知识图谱的数据管理方法、相关设备及介质 |
CN114817423A (zh) * | 2022-04-26 | 2022-07-29 | 电子科技大学 | 一种面向金融行业的知识图谱更新系统 |
WO2023078104A1 (zh) * | 2021-11-05 | 2023-05-11 | 中兴通讯股份有限公司 | 知识图谱构建方法、平台及计算机存储介质 |
CN116932780A (zh) * | 2023-09-13 | 2023-10-24 | 之江实验室 | 天文知识图谱构建方法、资源查找方法、设备和介质 |
CN113569007B (zh) * | 2021-06-18 | 2024-06-21 | 武汉理工数字传播工程有限公司 | 一种处理知识服务资源的方法、装置及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130006975A1 (en) * | 2010-03-12 | 2013-01-03 | Qiang Li | System and method for matching entities and synonym group organizer used therein |
CN103999081A (zh) * | 2011-12-12 | 2014-08-20 | 国际商业机器公司 | 生成用于信息领域的自然语言处理模型 |
CN108021718A (zh) * | 2017-12-29 | 2018-05-11 | 中国电子科技集团公司信息科学研究院 | 物联网能力知识图谱及其构建方法 |
CN108647318A (zh) * | 2018-05-10 | 2018-10-12 | 北京航空航天大学 | 一种基于多源数据的知识融合方法 |
CN108694177A (zh) * | 2017-04-06 | 2018-10-23 | 北大方正集团有限公司 | 知识图谱构建方法及系统 |
CN109885691A (zh) * | 2019-01-08 | 2019-06-14 | 平安科技(深圳)有限公司 | 知识图谱补全方法、装置、计算机设备及存储介质 |
CN109919585A (zh) * | 2019-05-14 | 2019-06-21 | 上海市浦东新区行政服务中心(上海市浦东新区市民中心) | 基于知识图谱的人工智能辅助行政审批方法、系统及终端 |
-
2019
- 2019-07-12 CN CN201910627988.7A patent/CN110489561A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130006975A1 (en) * | 2010-03-12 | 2013-01-03 | Qiang Li | System and method for matching entities and synonym group organizer used therein |
CN103999081A (zh) * | 2011-12-12 | 2014-08-20 | 国际商业机器公司 | 生成用于信息领域的自然语言处理模型 |
CN108694177A (zh) * | 2017-04-06 | 2018-10-23 | 北大方正集团有限公司 | 知识图谱构建方法及系统 |
CN108021718A (zh) * | 2017-12-29 | 2018-05-11 | 中国电子科技集团公司信息科学研究院 | 物联网能力知识图谱及其构建方法 |
CN108647318A (zh) * | 2018-05-10 | 2018-10-12 | 北京航空航天大学 | 一种基于多源数据的知识融合方法 |
CN109885691A (zh) * | 2019-01-08 | 2019-06-14 | 平安科技(深圳)有限公司 | 知识图谱补全方法、装置、计算机设备及存储介质 |
CN109919585A (zh) * | 2019-05-14 | 2019-06-21 | 上海市浦东新区行政服务中心(上海市浦东新区市民中心) | 基于知识图谱的人工智能辅助行政审批方法、系统及终端 |
Cited By (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111026816B (zh) * | 2019-12-09 | 2022-09-02 | 重庆锐云科技有限公司 | 基于知识图谱的高净值客户群识别方法、装置及存储介质 |
CN111026816A (zh) * | 2019-12-09 | 2020-04-17 | 重庆锐云科技有限公司 | 基于知识图谱的高净值客户群识别方法、装置及存储介质 |
CN111198852A (zh) * | 2019-12-30 | 2020-05-26 | 浪潮通用软件有限公司 | 微服务架构下知识图谱驱动的元数据关系推理方法 |
CN111159210B (zh) * | 2019-12-31 | 2023-06-13 | 北京明智和术科技有限公司 | 一种信息处理系统、方法及装置 |
CN111159210A (zh) * | 2019-12-31 | 2020-05-15 | 北京明略软件系统有限公司 | 一种信息处理系统、方法及装置 |
CN111291135A (zh) * | 2020-01-21 | 2020-06-16 | 深圳追一科技有限公司 | 知识图谱构建方法和装置、服务器、计算机可读存储介质 |
CN111242774A (zh) * | 2020-01-23 | 2020-06-05 | 中国建设银行股份有限公司 | 银行客户资产图谱构建方法和装置 |
CN111444181A (zh) * | 2020-03-20 | 2020-07-24 | 腾讯科技(深圳)有限公司 | 知识图谱更新方法、装置及电子设备 |
CN111488461A (zh) * | 2020-03-24 | 2020-08-04 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN111368097A (zh) * | 2020-03-30 | 2020-07-03 | 中国建设银行股份有限公司 | 一种知识图谱抽取方法及装置 |
CN111597354A (zh) * | 2020-05-21 | 2020-08-28 | 北京明略软件系统有限公司 | 知识图谱配置方法、装置、计算机设备和可读存储介质 |
CN111753027B (zh) * | 2020-06-29 | 2023-03-14 | 中国科学院文献情报中心 | 一种面向多实体的隐式知识图谱表示的方法及装置 |
CN111753027A (zh) * | 2020-06-29 | 2020-10-09 | 中国科学院文献情报中心 | 一种面向多实体的隐式知识图谱表示的方法及装置 |
CN111782820B (zh) * | 2020-06-30 | 2024-05-17 | 京东科技控股股份有限公司 | 知识图谱创建方法及装置、可读存储介质及电子设备 |
CN111782820A (zh) * | 2020-06-30 | 2020-10-16 | 京东数字科技控股有限公司 | 知识图谱创建方法及装置、可读存储介质及电子设备 |
CN112148893A (zh) * | 2020-09-25 | 2020-12-29 | 南方电网数字电网研究院有限公司 | 能源分析知识图谱构建方法与能源分析可视化方法 |
CN112507035A (zh) * | 2020-11-25 | 2021-03-16 | 国网电力科学研究院武汉南瑞有限责任公司 | 输电线路多源异构数据统一标准化处理系统及方法 |
CN112463986A (zh) * | 2020-12-08 | 2021-03-09 | 北京明略软件系统有限公司 | 信息存储的方法及装置 |
CN112650855B (zh) * | 2020-12-26 | 2022-09-13 | 曙光信息产业股份有限公司 | 知识图谱工程化构建方法、装置、计算机设备和存储介质 |
CN112650855A (zh) * | 2020-12-26 | 2021-04-13 | 曙光信息产业股份有限公司 | 知识图谱工程化构建方法、装置、计算机设备和存储介质 |
CN112445919A (zh) * | 2021-02-01 | 2021-03-05 | 深圳追一科技有限公司 | 知识图谱构建方法和装置、服务器、计算机可读存储介质 |
CN112818131B (zh) * | 2021-02-01 | 2023-10-03 | 亚信科技(成都)有限公司 | 一种威胁情报的图谱构建方法、系统及存储介质 |
CN112818131A (zh) * | 2021-02-01 | 2021-05-18 | 亚信科技(成都)有限公司 | 一种威胁情报的图谱构建方法、系统及存储介质 |
CN112989066B (zh) * | 2021-03-25 | 2023-06-23 | 北京百度网讯科技有限公司 | 数据处理方法和装置、电子设备、计算机可读介质 |
CN112989066A (zh) * | 2021-03-25 | 2021-06-18 | 北京百度网讯科技有限公司 | 数据处理方法和装置、电子设备、计算机可读介质 |
CN112714032A (zh) * | 2021-03-29 | 2021-04-27 | 网络通信与安全紫金山实验室 | 无线网络协议知识图谱构建分析方法、系统、设备及介质 |
CN113157947A (zh) * | 2021-05-20 | 2021-07-23 | 中国工商银行股份有限公司 | 知识图谱的构建方法、工具、装置和服务器 |
CN113569007A (zh) * | 2021-06-18 | 2021-10-29 | 武汉理工数字传播工程有限公司 | 一种处理知识服务资源的方法、装置及存储介质 |
CN113569007B (zh) * | 2021-06-18 | 2024-06-21 | 武汉理工数字传播工程有限公司 | 一种处理知识服务资源的方法、装置及存储介质 |
CN113934729A (zh) * | 2021-10-20 | 2022-01-14 | 平安国际智慧城市科技股份有限公司 | 一种基于知识图谱的数据管理方法、相关设备及介质 |
WO2023078104A1 (zh) * | 2021-11-05 | 2023-05-11 | 中兴通讯股份有限公司 | 知识图谱构建方法、平台及计算机存储介质 |
CN114817423A (zh) * | 2022-04-26 | 2022-07-29 | 电子科技大学 | 一种面向金融行业的知识图谱更新系统 |
CN116932780A (zh) * | 2023-09-13 | 2023-10-24 | 之江实验室 | 天文知识图谱构建方法、资源查找方法、设备和介质 |
CN116932780B (zh) * | 2023-09-13 | 2024-01-09 | 之江实验室 | 天文知识图谱构建方法、资源查找方法、设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110489561A (zh) | 知识图谱构建方法、装置、计算机设备和存储介质 | |
Stevenson et al. | The value of text for small business default prediction: A deep learning approach | |
Chen et al. | Hybrid models based on rough set classifiers for setting credit rating decision rules in the global banking industry | |
US11010832B2 (en) | Loan audit system and method with chained confidence scoring | |
CN109785144A (zh) | 一种资产分类方法、装置、设备及介质 | |
CN109543925A (zh) | 基于机器学习的风险预测方法、装置、计算机设备和存储介质 | |
CN110458324A (zh) | 风险概率的计算方法、装置和计算机设备 | |
Jallan et al. | Text mining of the securities and exchange commission financial filings of publicly traded construction firms using deep learning to identify and assess risk | |
Zehra et al. | Financial knowledge graph based financial report query system | |
Wibisono et al. | The use of big data analytics and artificial intelligence in central banking | |
CN112364182A (zh) | 基于图特征的企业风险传导预测方法、设备及存储介质 | |
CN110442713A (zh) | 文章管理方法、装置、计算机设备和存储介质 | |
CN116401379A (zh) | 金融产品数据推送方法、装置、设备及存储介质 | |
Mekayel Anik et al. | An intelligent technique for stock market prediction | |
Zhang et al. | Using deep learning to interpolate the missing data in time-series for credit risks along supply chain | |
de Armas et al. | Minimizing trigger error in parametric earthquake catastrophe bonds via statistical approaches | |
Kumar et al. | Stocks Analysis and Prediction of Indian Oil Trading Using Big Data Analytics | |
US11880394B2 (en) | System and method for machine learning architecture for interdependence detection | |
CN111784495B (zh) | 担保圈识别方法、装置、计算机设备和存储介质 | |
Kawahara et al. | Cash flow prediction of a bank deposit using scalable graph analysis and machine learning | |
Chakraborty et al. | Automating the process of taxonomy creation and comparison of taxonomy structures | |
Rodriguez et al. | Applying knowledge management to enterprise risk management: Is there any value in using KM for ERM? | |
Hossain | Implementation of Big Data Analytics in Credit Risk Management in the Banking and Financial Services Sector: A Contemporary Literature Review | |
Yu | [Retracted] Big Data Analytics and Discrete Choice Model for Enterprise Credit Risk Early Warning Algorithm | |
US11892989B2 (en) | System and method for predictive structuring of electronic data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |