CN109885692A - 知识数据存储方法、装置、计算机设备和存储介质 - Google Patents

知识数据存储方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN109885692A
CN109885692A CN201910025164.2A CN201910025164A CN109885692A CN 109885692 A CN109885692 A CN 109885692A CN 201910025164 A CN201910025164 A CN 201910025164A CN 109885692 A CN109885692 A CN 109885692A
Authority
CN
China
Prior art keywords
data
knowledge data
knowledge
information
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910025164.2A
Other languages
English (en)
Other versions
CN109885692B (zh
Inventor
孙佳兴
胡逸凡
陈泽晖
黄鸿顺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910025164.2A priority Critical patent/CN109885692B/zh
Publication of CN109885692A publication Critical patent/CN109885692A/zh
Priority to PCT/CN2019/118619 priority patent/WO2020143326A1/zh
Application granted granted Critical
Publication of CN109885692B publication Critical patent/CN109885692B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及知识图谱技术领域,尤其涉及一种知识数据存储方法、装置、计算机设备和存储介质,包括:抽取知识数据来源的知识数据;抽取所述知识数据中的实体信息,将所述实体信息进行向量化转化,生成实体数据向量,抽取所述知识数据中的关系信息,将所述关系信息进行向量化转换,生成关系数据向量;获取所述实体数据向量的实体ID标识和所述关系数据向量的关系ID标识,聚类形成知识数据子集;计算任意两个所述知识数据子集的信息相似度,设立知识图谱的节点;获取所述知识图谱的节点的特征信息,根据特征信息与数据库存储位置的对应关系,将知识数据存储到数据库中。本申请有效解决了知识数据存储时间长和查询速度慢的问题。

Description

知识数据存储方法、装置、计算机设备和存储介质
技术领域
本申请涉及知识图谱技术领域,尤其涉及一种知识数据存储方法、装置、计算机设备和存储介质。
背景技术
知识图谱又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
在将知识图谱中的知识数据存储到数据库中时,存在着由于知识图谱关联的数据量大,导致存储时间长。并且在对知识图谱中的知识数据进行查询时,无法快速查询到所需的知识数据。
发明内容
有鉴于此,有必要针对现有知识数据存储时间长查询速度慢的问题,提供一种知识数据存储方法、装置、计算机设备和存储介质。
一种知识数据存储方法,包括如下步骤:
发送知识数据抽取指令至待抽取知识数据的知识数据来源,接收所述知识数据来源的反馈信息,根据所述反馈信息中所包含的知识数据形式抽取所述知识数据来源的知识数据;
抽取所述知识数据中的实体信息,将所述实体信息进行向量化转化,生成实体数据向量,抽取所述知识数据中的关系信息,将所述关系信息进行向量化转换,生成关系数据向量;
获取所述实体数据向量的实体ID标识和所述关系数据向量的关系ID标识,将具有同一实体ID标识的知识数据进行聚类后形成知识数据集,聚类所述知识数据集中具有同一关系ID标识的知识数据后形成知识数据子集;
计算任意两个所述知识数据子集的信息相似度,在信息相似度大于预设的相似度阈值的所述知识数据子集之间设立知识图谱的节点;
获取所述知识图谱的节点的特征信息,根据所述特征信息与数据库存储位置的对应关系,将所述知识数据存储到数据库中。
在其中一个可能的实施例中,所述发送知识数据抽取指令至待抽取知识数据的知识数据来源,接收所述知识数据来源的反馈信息,根据所述反馈信息中所包含的知识数据形式抽取所述知识数据来源的知识数据,包括:
获取所述待抽取知识数据的知识数据来源的网络地址,将所述网络地址与预设的网络地址列表中的内容进行比对,若所述网络地址在所述网络地址列表中则发送知识数据抽取指令,否则不发送;
接收所述知识数据来源的反馈信息,从所述反馈信息中抽取出数据来源形式的形式关键词,根据所述形式关键词确定所述知识数据来源的形式;
获取所述知识数据来源的形式对应的抽取方法,根据所述抽取方法抽取所述知识数据来源的知识数据。
在其中一个可能的实施例中,所述抽取所述知识数据中的实体信息,将所述实体信息进行向量化转化,生成实体数据向量,抽取所述知识数据中的关系信息,将所述关系信息进行向量化转换,生成关系数据向量,包括:
根据已有知识图谱中的实体数据的数量获取所述实体信息对应的向量维度,根据已有知识图谱中的关系数据的数量获取所述关系信息对应的向量维度;
根据所述实体信息对应的向量维度以及所述知识数据来源的知识数据中包含的实体数据生成所述实体信息对应的向量中每个维度的元素后得到初始实体数据向量;
根据所述关系信息对应向量的维度以及所述知识数据来源的知识数据中包含的关系数据生成所述关系信息对应的向量中每个维度的元素后得到初始关系数据向量;
将所述初始实体数据向量归一化处理得到所述实体数据向量;
将所述初始关系数据向量归一化处理得到所述关系数据向量。
在其中一个可能的实施例中,所述获取所述实体数据向量的实体ID标识和所述关系数据向量的关系ID标识,将具有同一实体ID标识的知识数据进行聚类后形成知识数据集,聚类所述知识数据集中具有同一关系ID标识的知识数据后形成知识数据子集,包括:
将所述实体数据向量进行转置后与原所述实体数据向量做积,形成一实体信息矩阵,其中,实体信息矩阵的元素为所述知识数据来源的知识数据中包含的实体数据的乘积值;
将所述实体信息矩阵进行二值化处理后得到二值化的实体信息矩阵,获取所述二值化的实体信息矩阵的主对角线元素,将所述主对角线元素相加后得到所述实体ID标识;
抽取具有相同实体ID标识的知识数据后按照知识数据生成的时间顺序进行排序,形成一知识数据集;
将所述关系数据向量进行转置后与原所述关系数据向量做积,形成一关系信息矩阵,其中,关系信息矩阵的元素为所述知识数据来源的知识数据中包含的关系数据的乘积值;
将所述关系信息矩阵进行二值化处理后得到二值化的关系信息矩阵,获取所述二值化的关系信息矩阵的主对角线元素,将所述主对角线元素相加后得到所述关系ID标识;
遍历所述知识数据集,从所述知识数据集包含的关系信息中抽取出带有所述关系ID标识的知识数据,按照抽取时所述知识数据在所述知识数据集中的位置进行排序,形成一知识数据子集。
在其中一个可能的实施例中,所述计算任意两个所述知识数据子集的信息相似度,在信息相似度大于预设的相似度阈值的所述知识数据子集之间设立知识图谱的节点,包括:
将所述知识数据子集中的知识数据进行离散化处理,得到所述知识数据子集的离散值;
将任意两个数据子集对应的离散值入参到相似度函数中进行运算,出参后得到所述任意两个数据子集的信息相似度;
将所述信息相似度入参到误差修正函数中进行修成后得到修正后的信息相似度,将所述修正后的信息相似度与所述相似度阈值进行比较,若所述修正后的信息相似度大于所述相似度阈值,则在所述知识数据子集之间设立知识图谱的节点,否则不建立。
在其中一个可能的实施例中,所述获取所述知识图谱的节点的特征信息,根据所述特征信息与数据库存储位置的对应关系,将所述知识数据存储到数据库中,包括:
抽取所述知识图谱的节点所连接的所述知识数据子集中所包含的属性信息,获取所述属性信息的属性数值;
将所述属性数值作为存储到所述数据库的键值,获取所述键值对应的数据库存储位置;
根据所述数据库存储位置,建立所述知识数据的树枝状存储索引,根据所述知识数据子集在所述树枝状存储索引中的节点位置,将所述知识图谱的节点所连接的所述知识数据子集中的知识数据存储到所述数据库中。
在其中一个可能的实施例中,所述获取所述知识数据来源的形式对应的抽取方法,根据所述抽取方法抽取所述知识数据来源的知识数据,包括:
若所述获取所述知识数据来源的形式为非结构化文本数据,则采用神经网络模型对所述知识数据来源的知识数据进行抽取,包括:
获取所述非结构化文本数据,根据预先训练好的词向量层将所述非结构化文本数据进行矩阵化转换生成文本矩阵,所述文本矩阵的元素为数值化的非结构化文本数据;
将所述文本矩阵进行正则化处理,得到正则化文本矩阵;
提取所述正则化文本矩阵中的数值元素,将所述数值元素入参到交叉熵损失函数中进行运算,出参后得到修正后的数值元素,将所述修正后的数值元素返回到所述正则化文本矩阵的原位置,得到修正后的正则化文本矩阵,其中,交叉熵损失函数的计算公式为:
式中:L(θ)表示修正后的数值元素,m表示预定义关系类型的总个数;ri是预定义关系类型的概率值,取值为0或1;M是预定义标签的总个数;yi是第j个预定义标签的概率值,取值为0或1;θ表示数值元素。
将所述修正后的正则化文本矩阵中的元素依次入参到长短时记忆神经网络模型中进行训练后,得到所述非结构化文本数据的特征编码,根据所述特征编码抽取所述知识数据来源的知识数据。
一种知识数据存储装置,包括如下模块:
数据获取模块,设置为发送知识数据抽取指令至待抽取知识数据的知识数据来源,接收所述知识数据来源的反馈信息,根据所述反馈信息中所包含的知识数据形式抽取所述知识数据来源的知识数据;
向量生成模块,设置为抽取所述知识数据中的实体信息,将所述实体信息进行向量化转化,生成实体数据向量,抽取所述知识数据中的关系信息,将所述关系信息进行向量化转换,生成关系数据向量;
数据聚类模块,设置为获取所述实体数据向量的实体ID标识和所述关系数据向量的关系ID标识,将具有同一实体ID标识的知识数据进行聚类后形成知识数据集,聚类所述知识数据集中具有同一关系ID标识的知识数据后形成知识数据子集;
节点设立模块,设置为计算任意两个所述知识数据子集的信息相似度,在信息相似度大于预设的相似度阈值的所述知识数据子集之间设立知识图谱的节点;
数据存储模块,设置为获取所述知识图谱的节点的特征信息,根据所述特征信息与数据库存储位置的对应关系,将所述知识数据存储到数据库中。
一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述知识数据存储方法的步骤。
一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述知识数据存储方法的步骤。
上述知识数据存储方法、装置、计算机设备和存储介质,包括:发送知识数据抽取指令至待抽取知识数据的知识数据来源,接收所述知识数据来源的反馈信息,根据所述反馈信息中所包含的知识数据形式抽取所述知识数据来源的知识数据;抽取所述知识数据中的实体信息,将所述实体信息进行向量化转化,生成实体数据向量,抽取所述知识数据中的关系信息,将所述关系信息进行向量化转换,生成关系数据向量;获取所述实体数据向量的实体ID标识和所述关系数据向量的关系ID标识,将具有同一实体ID标识的知识数据进行聚类后形成知识数据集,聚类所述知识数据集中具有同一关系ID标识的知识数据后形成知识数据子集;计算任意两个所述知识数据子集的信息相似度,在信息相似度大于预设的相似度阈值的所述知识数据子集之间设立知识图谱的节点;获取所述知识图谱的节点的特征信息,根据所述特征信息与数据库存储位置的对应关系,将所述知识数据存储到数据库中。本技术方案通过对知识数据进行有效整理,从而有效解决了知识数据存储时间长查询速度慢的问题。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。
图1为本申请在一个实施例中的一种知识数据存储方法的整体流程图;
图2为本申请在一个实施例中的一种知识数据存储方法中的数据获取过程示意图;
图3为本申请在一个实施例中的一种知识数据存储方法中的向量生成过程示意图;
图4为本申请在一个实施例中的一种基知识数据存储装置的结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
图1为本申请在一个实施例中的一种知识数据存储方法的整体流程图,如图1所示,一种知识数据存储方法,包括以下步骤:
S1,发送知识数据抽取指令至待抽取知识数据的知识数据来源,接收所述知识数据来源的反馈信息,根据所述反馈信息中所包含的知识数据形式抽取所述知识数据来源的知识数据;
具体的,获取带抽取知识数据的知识数据来源IP地址,根据所述IP地址,获取距离所述IP地址最近的数据采集服务器,由所述数据采集服务器发送知识数据抽取指令至待抽取知识数据的知识数据来源。在接收所述知识来源的反馈信息后,将所述反馈信息进行语段分割,分割成数个子语段,从所述子语段中抽取反应知识数据形式的特征词。其中,知识数据的形式主要有三种:结构化知识数据、半结构化知识数据和非结构化知识数据。
S2,抽取所述知识数据中的实体信息,将所述实体信息进行向量化转化,生成实体数据向量,抽取所述知识数据中的关系信息,将所述关系信息进行向量化转换,生成关系数据向量;
具体的,在知识数据中主要包含着三种信息,分别是:实体信息、关系信息和属性信息。在原有的知识数据中,实体信息和关系信息均是以文字化的形式存在的,这样不便于进行相似性的比较,而将实体信息和关系信息进行向量化转化后得到实体数据向量和关系数据向量能够进行量化比较,从而提升信息处理的速度。
S3,获取所述实体数据向量的实体ID标识和所述关系数据向量的关系ID标识,将具有同一实体ID标识的知识数据进行聚类后形成知识数据集,聚类所述知识数据集中具有同一关系ID标识的知识数据后形成知识数据子集;
具体的,所述实体ID标识是在实体数据向量产生的时候赋予的,其可以根据实体数据向量的产生时间作为实体ID标识。比如,A实体向量产生的时间为10:00则实体ID标识为1000。类似地,所述关系数据向量的关系ID标识也可以采用与所述实体ID标识同样的方式赋予。
S4,计算任意两个所述知识数据子集的信息相似度,在信息相似度大于预设的相似度阈值的所述知识数据子集之间设立知识图谱的节点;
具体的,信息相似度的计算方法可以采用欧几里得距离算法、皮尔逊相关系数和余弦相似度算法等。在具体计算过程中,可以采用上述方法中的一种或者多种,当采用多种相似度算法进行计算时,可以将不同相似度算法得到的结果进行比较,若两种算法得到的相似度的差值大于误差阈值(通常为95%)则需要重新建立知识数据子集。
本步骤中,知识图谱的节点是指在已有的知识图谱中增加一个知识点。比如,在已有的知识图谱中“蔬菜”这一属性连接有“白菜”、“花菜”和“辣椒”三个实体,新加入的实体信息为“青椒”,通过与“辣椒”进行相似度计算后,则在已有的知识图谱中设立“青椒”这一节点。
S5,获取所述知识图谱的节点的特征信息,根据所述特征信息与数据库存储位置的对应关系,将所述知识数据存储到数据库中。
具体的,知识图谱的节点特征信息是指该节点不同于其它节点的信息,比如,“青椒”节点与“辣椒”节点相比,其特征信息为“青”。将所述特征信息进行二值化处理后得到二进制的字符串。提取所述二进制字符串的前5为字符,将所述前5位字符与数据库的键值做比较,获取键值是所述前5位字符数据库存储位置后,将所述知识数据存储到数据库中。
本实施例,通过对知识数据进行有效整理,从而能够快速的存储到数据库的相应位置,从而便于查询知识数据。
图2为本申请在一个实施例中的一种知识数据存储方法中的数据获取过程示意图,如图所示,所述S1,发送知识数据抽取指令至待抽取知识数据的知识数据来源,接收所述知识数据来源的反馈信息,根据所述反馈信息中所包含的知识数据形式抽取所述知识数据来源的知识数据,包括:
S101、获取所述待抽取知识数据的知识数据来源的网络地址,将所述网络地址与预设的网络地址列表中的内容进行比对,若所述网络地址在所述网络地址列表中则发送知识数据抽取指令,否则不发送;
具体的,获取所述待抽取知识数据的知识数据来源的网络地址,根据所述网络地址的格式确定所述网络地址的类型,即所述网络地址是静态IP地址还是动态IP地址,若是静态IP地址,则从数据库中调取IP地址表进行比对后,确定所述静态IP地址是否在所述IP地址表上,在则发送知识数据获取指令,不在则不发送;若是动态IP地址,则对所述动态IP地址进行DNS解析得到所述动态IP地址对应的DNS解析代码,而后调用数据库中的DNS解析代码表对所述DNS解析代码进行比对,确定所述DNS解析代码是否在所述DNS解析代码表上,在则发送知识数据获取指令,不在则不发送。
S102、接收所述知识数据来源的反馈信息,从所述反馈信息中抽取出数据来源形式的形式关键词,根据所述形式关键词确定所述知识数据来源的形式;
具体的,形式关键词是指知识数据是结构化数据、半结构化数据还是非结构化数据。比如,反馈信息中出现“表”这一形式关键词,则对应的是结构化数据;出现“网页”这一形式关键词,则对应的是半结构化数据;出现“文本”这一形式关键词,则对应非结构化数据。
S103、获取所述知识数据来源的形式对应的抽取方法,根据所述抽取方法抽取所述知识数据来源的知识数据。
具体的,不同形式的数据来源对应不同的数据抽取方法,比如,半结构化的网页数据通常采用网络爬虫进行爬取,对于非结构化的文本,通常采用文本语言进行抽取。
本实施例,通过对知识数据来源的反馈信息进行分析,确定知识数据来源的数据形式,从而能够采用正确的抽取方式对知识数据来源的知识数据进行抽取。
图3为本申请在一个实施例中的一种知识数据存储方法中的向量生成过程示意图,如图所示,所述S2,抽取所述知识数据中的实体信息,将所述实体信息进行向量化转化,生成实体数据向量,抽取所述知识数据中的关系信息,将所述关系信息进行向量化转换,生成关系数据向量,包括:
S201、根据已有知识图谱中的实体数据的数量获取所述实体信息对应的向量维度,根据已有知识图谱中的关系数据的数量获取所述关系信息对应的向量维度;
具体的,已有知识图谱是指在数据库中已经存储的知识图谱,对已有知识图谱进行实体特征词查询可以得出实体数据的数量,比如,体育知识图谱中的实体特征词可以是“球”、“泳”、“车”等,然后根据这些特征词可以找的相应的实体数据,如“篮球”、“800米自由泳”等。实体信息对应的向量维度是实体信息重复出现的次数,关系信息对应的向量维度是关系信息重复出现的次数。
S202、根据所述实体信息对应的向量维度以及所述知识数据来源的知识数据中包含的实体数据生成所述实体信息对应的向量中每个维度的元素后得到初始实体数据向量;
具体的,实体数据向量是指在知识图谱中的不同实体数据采用向量的形式进行表示,实体数据向量可以是人物实体数据向量、地区实体数据向量、疾病实体数据向量或症状实体数向量等。
S203、根据所述关系信息对应向量的维度以及所述知识数据来源的知识数据中包含的关系数据生成所述关系信息对应的向量中每个维度的元素后得到初始关系数据向量;
具体的,关系数据向量是指连接不同的实体数据之间的关系数据采用向量的形式进行表示,关系数据可以是症状关系数据向量或身体检查关系数据等。
S204、将所述初始实体数据向量归一化处理得到所述实体数据向量;将所述初始关系数据向量归一化处理得到所述关系数据向量。
本实施例,通过建立实体数据向量和关系数据向量,使实体信息和关系信息数量化表示,从而便于对实体信息和关系信息的关联性进行分析。
在一个实施例中,所述S3,获取所述实体数据向量的实体ID标识和所述关系数据向量的关系ID标识,将具有同一实体ID标识的知识数据进行聚类后形成知识数据集,聚类所述知识数据集中具有同一关系ID标识的知识数据后形成知识数据子集,包括:
将所述实体数据向量进行转置后与原所述实体数据向量做积,形成一实体信息矩阵,其中,实体信息矩阵的元素为所述知识数据来源的知识数据中包含的实体数据的乘积值;
将所述实体信息矩阵进行二值化处理后得到二值化的实体信息矩阵,获取所述二值化的实体信息矩阵的主对角线元素,将所述主对角线元素相加后得到所述实体ID标识;
抽取具有相同实体ID标识的知识数据后按照知识数据生成的时间顺序进行排序,形成一知识数据集;
将所述关系数据向量进行转置后与原所述关系数据向量做积,形成一关系信息矩阵,其中,关系信息矩阵的元素为所述知识数据来源的知识数据中包含的关系数据的乘积值;
将所述关系信息矩阵进行二值化处理后得到二值化的关系信息矩阵,获取所述二值化的关系信息矩阵的主对角线元素,将所述主对角线元素相加后得到所述关系ID标识;
遍历所述知识数据集,从所述知识数据集包含的关系信息中抽取出带有所述关系ID标识的知识数据,按照抽取时所述知识数据在所述知识数据集中的位置进行排序,形成一知识数据子集。
本实施例,通过对对实体ID标识和关系ID标识的形成过程进行限定,从而使在进行数据追踪时能够有效找到问题数据的位置。
在一个实施例中,所述S4,计算任意两个所述知识数据子集的信息相似度,在信息相似度大于预设的相似度阈值的所述知识数据子集之间设立知识图谱的节点,包括:
将所述知识数据子集中的知识数据进行离散化处理,得到所述知识数据子集的离散值;
具体的,离散化是指把无限空间中有限的个体映射到有限的空间中去,以此来提高算法的时空效率。在进行离散化处理前,可以使用unique()函数等去除知识数据中的重复数据,而后再对知识数据离散化。
将任意两个数据子集对应的离散值入参到相似度函数中进行运算,出参后得到所述任意两个数据子集的信息相似度;
具体的,相似度函数可以是欧氏距离函数、余弦函数、汉明函数等。
将所述信息相似度入参到误差修正函数中进行修成后得到修正后的信息相似度,将所述修正后的信息相似度与所述相似度阈值进行比较,若所述修正后的信息相似度大于所述相似度阈值,则在所述知识数据子集之间设立知识图谱的节点,否则不建立。
具体的,误差修正函数可以是一次误差修正函数,也可以是二次误差修正函数,在使用二次误差修正函数时需要对信息相似度数值进行协整回归后再进行计算。相似度阈值是根据历史数据得到的,通常相似度阈值的取值为99%
本实施例,通过对知识图谱的节点的设立进行条件限定,从而更好的确定知识数据存储的位置。
在一个实施例中,所述S5,获取所述知识图谱的节点的特征信息,根据所述特征信息与数据库存储位置的对应关系,将所述知识数据存储到数据库中,包括:
抽取所述知识图谱的节点所连接的所述知识数据子集中所包含的属性信息,获取所述属性信息的属性数值;
具体的,将所述属性信息进行数值转换时,可以采用的转化方式是获取所述属性信息的字符数或者笔画数,将所述字符数或者所述笔画数作为属性数值。
将所述属性数值作为存储到所述数据库的键值,获取所述键值对应的数据库存储位置;
根据所述数据库存储位置,建立所述知识数据的树枝状存储索引,根据所述知识数据子集在所述树枝状存储索引中的节点位置,将所述知识图谱的节点所连接的所述知识数据子集中的知识数据存储到所述数据库中。
其中,树枝状存储索引是将数据库中的存储位置进行树结构分级,比如X数据存储在数据库中的位置为A区B文件夹C子文件夹,那么树枝状的存储索引就是A-B-C,其中A为树枝状存储索引的主节点,B为从节点,C为次级从节点,在获取X数据存储位置时,先获取A主节点,然后依次获取B从节点和C次级从节点,从而获得X数据的存储位置。
本实施例,有效获得知识数据的准确存储位置,从而便于查询知识数据。
在一个实施例中,所述S103、获取所述知识数据来源的形式对应的抽取方法,根据所述抽取方法抽取所述知识数据来源的知识数据,包括:
若所述获取所述知识数据来源的形式为非结构化文本数据,则采用神经网络模型对所述知识数据来源的知识数据进行抽取,包括:
获取所述非结构化文本数据,根据预先训练好的词向量层将所述非结构化文本数据进行矩阵化转换生成文本矩阵,所述文本矩阵的元素为数值化的非结构化文本数据;
其中,训练好的词向量层是根据历史数据在长短时记忆神经网络模型中训练后得到的;在将非结构化文本数据进行矩阵化转换时,根据词向量层的生成位置,将数值化的非结构化文本数据写入到文本矩阵中。
将所述文本矩阵进行正则化处理,得到正则化文本矩阵;
提取所述正则化文本矩阵中的数值元素,将所述数值元素入参到交叉熵损失函数中进行运算,出参后得到修正后的数值元素,将所述修正后的数值元素返回到所述正则化文本矩阵的原位置,得到修正后的正则化文本矩阵,其中,交叉熵损失函数的计算公式为:
式中:L(θ)表示修正后的数值元素,m表示预定义关系类型的总个数;ri是预定义关系类型的概率值,取值为0或1;M是预定义标签的总个数;yi是第j个预定义标签的概率值,取值为0或1;θ表示数值元素。
其中,在本实施例中,预定义关系类型是指文本数据对应各个词向量的关系类型,比如,名词后面连接动词等;预定义关系类型的概率值是指任意两个词向量的关系类型出现的概率,比如,“吃”和“饭”紧密连接成“吃饭”的概率是90%,而间隔连接的为“吃XX饭”的概率是10%;预定义标签是指词向量的标签,比如,副词5个,名词3个,则标签的总个数为8个;预定义标签的概率是指某种词向量的标签出现的概率,比如,上例中,副词的概率为0.675。
将所述修正后的正则化文本矩阵中的元素依次入参到长短时记忆神经网络模型中进行训练后,得到所述非结构化文本数据的特征编码,根据所述特征编码抽取所述知识数据来源的知识数据。
其中,特征编码可以采用独热编码,利用独热编码对知识数据来源中的文本数据进行编码,然后将编码后的所有文本数据信息与历次编码后的数据信息进行比对,则抽取比对一致的那部分数据。
本实施例,能够有效的从非结构化的文本数据中抽取出所需要的知识数据,提升知识数据抽取的效率。
在一个实施例中,提出了一种知识数据存储装置,如图4所示,包括:
数据获取模块41,设置为发送知识数据抽取指令至待抽取知识数据的知识数据来源,接收所述知识数据来源的反馈信息,根据所述反馈信息中所包含的知识数据形式抽取所述知识数据来源的知识数据;
向量生成模块42,设置为抽取所述知识数据中的实体信息,将所述实体信息进行向量化转化,生成实体数据向量,抽取所述知识数据中的关系信息,将所述关系信息进行向量化转换,生成关系数据向量;
数据聚类模块43,设置为获取所述实体数据向量的实体ID标识和所述关系数据向量的关系ID标识,将具有同一实体ID标识的知识数据进行聚类后形成知识数据集,聚类所述知识数据集中具有同一关系ID标识的知识数据后形成知识数据子集;
节点设立模块44,设置为计算任意两个所述知识数据子集的信息相似度,在信息相似度大于预设的相似度阈值的所述知识数据子集之间设立知识图谱的节点;
数据存储模块45,设置为获取所述知识图谱的节点的特征信息,根据所述特征信息与数据库存储位置的对应关系,将所述知识数据存储到数据库中。
一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述各实施例中所述知识数据存储方法的步骤。
一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述各实施例中所述知识数据存储方法的步骤。所述存储介质可以为非易失性存储介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁盘或光盘等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请一些示例性实施例,其中描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种知识数据存储方法,其特征在于,包括:
发送知识数据抽取指令至待抽取知识数据的知识数据来源,接收所述知识数据来源的反馈信息,根据所述反馈信息中所包含的知识数据形式抽取所述知识数据来源的知识数据;
抽取所述知识数据中的实体信息,将所述实体信息进行向量化转化,生成实体数据向量,抽取所述知识数据中的关系信息,将所述关系信息进行向量化转换,生成关系数据向量;
获取所述实体数据向量的实体ID标识和所述关系数据向量的关系ID标识,将具有同一实体ID标识的知识数据进行聚类后形成知识数据集,聚类所述知识数据集中具有同一关系ID标识的知识数据后形成知识数据子集;
计算任意两个所述知识数据子集的信息相似度,在信息相似度大于预设的相似度阈值的所述知识数据子集之间设立知识图谱的节点;
获取所述知识图谱的节点的特征信息,根据所述特征信息与数据库存储位置的对应关系,将所述知识数据存储到数据库中。
2.根据权利要求1所述的知识数据存储方法,其特征在于,所述发送知识数据抽取指令至待抽取知识数据的知识数据来源,接收所述知识数据来源的反馈信息,根据所述反馈信息中所包含的知识数据形式抽取所述知识数据来源的知识数据,包括:
获取所述待抽取知识数据的知识数据来源的网络地址,将所述网络地址与预设的网络地址列表中的内容进行比对,若所述网络地址在所述网络地址列表中则发送知识数据抽取指令,否则不发送;
接收所述知识数据来源的反馈信息,从所述反馈信息中抽取出数据来源形式的形式关键词,根据所述形式关键词确定所述知识数据来源的形式;
获取所述知识数据来源的形式对应的抽取方法,根据所述抽取方法抽取所述知识数据来源的知识数据。
3.根据权利要求1所述的知识数据存储方法,其特征在于,所述抽取所述知识数据中的实体信息,将所述实体信息进行向量化转化,生成实体数据向量,抽取所述知识数据中的关系信息,将所述关系信息进行向量化转换,生成关系数据向量,包括:
根据已有知识图谱中的实体数据的数量获取所述实体信息对应的向量维度,根据已有知识图谱中的关系数据的数量获取所述关系信息对应的向量维度;
根据所述实体信息对应的向量维度以及所述知识数据来源的知识数据中包含的实体数据生成所述实体信息对应的向量中每个维度的元素后得到初始实体数据向量;
根据所述关系信息对应向量的维度以及所述知识数据来源的知识数据中包含的关系数据生成所述关系信息对应的向量中每个维度的元素后得到初始关系数据向量;
将所述初始实体数据向量归一化处理得到所述实体数据向量;
将所述初始关系数据向量归一化处理得到所述关系数据向量。
4.根据权利要求1所述的知识数据存储方法,其特征在于,所述获取所述实体数据向量的实体ID标识和所述关系数据向量的关系ID标识,将具有同一实体ID标识的知识数据进行聚类后形成知识数据集,聚类所述知识数据集中具有同一关系ID标识的知识数据后形成知识数据子集,包括:
将所述实体数据向量进行转置后与原所述实体数据向量做积,形成一实体信息矩阵,其中,实体信息矩阵的元素为所述知识数据来源的知识数据中包含的实体数据的乘积值;
将所述实体信息矩阵进行二值化处理后得到二值化的实体信息矩阵,获取所述二值化的实体信息矩阵的主对角线元素,将所述主对角线元素相加后得到所述实体ID标识;
抽取具有相同实体ID标识的知识数据后按照知识数据生成的时间顺序进行排序,形成一知识数据集;
将所述关系数据向量进行转置后与原所述关系数据向量做积,形成一关系信息矩阵,其中,关系信息矩阵的元素为所述知识数据来源的知识数据中包含的关系数据的乘积值;
将所述关系信息矩阵进行二值化处理后得到二值化的关系信息矩阵,获取所述二值化的关系信息矩阵的主对角线元素,将所述主对角线元素相加后得到所述关系ID标识;
遍历所述知识数据集,从所述知识数据集包含的关系信息中抽取出带有所述关系ID标识的知识数据,按照抽取时所述知识数据在所述知识数据集中的位置进行排序,形成一知识数据子集。
5.根据权利要求1所述的知识数据存储方法,其特征在于,所述计算任意两个所述知识数据子集的信息相似度,在信息相似度大于预设的相似度阈值的所述知识数据子集之间设立知识图谱的节点,包括:
将所述知识数据子集中的知识数据进行离散化处理,得到所述知识数据子集的离散值;
将任意两个数据子集对应的离散值入参到相似度函数中进行运算,出参后得到所述任意两个数据子集的信息相似度;
将所述信息相似度入参到误差修正函数中进行修成后得到修正后的信息相似度,将所述修正后的信息相似度与所述相似度阈值进行比较,若所述修正后的信息相似度大于所述相似度阈值,则在所述知识数据子集之间设立知识图谱的节点,否则不建立。
6.根据权利要求1所述的知识数据存储方法,其特征在于,所述获取所述知识图谱的节点的特征信息,根据所述特征信息与数据库存储位置的对应关系,将所述知识数据存储到数据库中,包括:
抽取所述知识图谱的节点所连接的所述知识数据子集中所包含的属性信息,获取所述属性信息的属性数值;
将所述属性数值作为存储到所述数据库的键值,获取所述键值对应的数据库存储位置;
根据所述数据库存储位置,建立所述知识数据的树枝状存储索引,根据所述知识数据子集在所述树枝状存储索引中的节点位置,将所述知识图谱的节点所连接的所述知识数据子集中的知识数据存储到所述数据库中。
7.根据权利要求2所述的知识数据存储方法,其特征在于,所述获取所述知识数据来源的形式对应的抽取方法,根据所述抽取方法抽取所述知识数据来源的知识数据,包括:
若所述获取所述知识数据来源的形式为非结构化文本数据,则采用神经网络模型对所述知识数据来源的知识数据进行抽取,包括:
获取所述非结构化文本数据,根据预先训练好的词向量层将所述非结构化文本数据进行矩阵化转换生成文本矩阵,所述文本矩阵的元素为数值化的非结构化文本数据;
将所述文本矩阵进行正则化处理,得到正则化文本矩阵;
提取所述正则化文本矩阵中的数值元素,将所述数值元素入参到交叉熵损失函数中进行运算,出参后得到修正后的数值元素,将所述修正后的数值元素返回到所述正则化文本矩阵的原位置,得到修正后的正则化文本矩阵,其中,交叉熵损失函数的计算公式为:
式中:L(θ)表示修正后的数值元素,m表示预定义关系类型的总个数;ri是预定义关系类型的概率值,取值为0或1;M是预定义标签的总个数;yi是第j个预定义标签的概率值,取值为0或1;θ表示数值元素;
将所述修正后的正则化文本矩阵中的元素依次入参到长短时记忆神经网络模型中进行训练后,得到所述非结构化文本数据的特征编码,根据所述特征编码抽取所述知识数据来源的知识数据。
8.一种知识数据存储装置,其特征在于,包括:
数据获取模块,设置为发送知识数据抽取指令至待抽取知识数据的知识数据来源,接收所述知识数据来源的反馈信息,根据所述反馈信息中所包含的知识数据形式抽取所述知识数据来源的知识数据;
向量生成模块,设置为抽取所述知识数据中的实体信息,将所述实体信息进行向量化转化,生成实体数据向量,抽取所述知识数据中的关系信息,将所述关系信息进行向量化转换,生成关系数据向量;
数据聚类模块,设置为获取所述实体数据向量的实体ID标识和所述关系数据向量的关系ID标识,将具有同一实体ID标识的知识数据进行聚类后形成知识数据集,聚类所述知识数据集中具有同一关系ID标识的知识数据后形成知识数据子集;
节点设立模块,设置为计算任意两个所述知识数据子集的信息相似度,在信息相似度大于预设的相似度阈值的所述知识数据子集之间设立知识图谱的节点;
数据存储模块,设置为获取所述知识图谱的节点的特征信息,根据所述特征信息与数据库存储位置的对应关系,将所述知识数据存储到数据库中。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项权利要求所述知识数据存储方法的步骤。
10.一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7中任一项权利要求所述知识数据存储方法的步骤。
CN201910025164.2A 2019-01-11 2019-01-11 知识数据存储方法、装置、计算机设备和存储介质 Active CN109885692B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910025164.2A CN109885692B (zh) 2019-01-11 2019-01-11 知识数据存储方法、装置、计算机设备和存储介质
PCT/CN2019/118619 WO2020143326A1 (zh) 2019-01-11 2019-11-15 知识数据存储方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910025164.2A CN109885692B (zh) 2019-01-11 2019-01-11 知识数据存储方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN109885692A true CN109885692A (zh) 2019-06-14
CN109885692B CN109885692B (zh) 2023-06-16

Family

ID=66925945

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910025164.2A Active CN109885692B (zh) 2019-01-11 2019-01-11 知识数据存储方法、装置、计算机设备和存储介质

Country Status (2)

Country Link
CN (1) CN109885692B (zh)
WO (1) WO2020143326A1 (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110569372A (zh) * 2019-09-20 2019-12-13 四川大学 一种心脏病大数据知识图谱系统的构建方法
CN110795562A (zh) * 2019-10-29 2020-02-14 腾讯科技(深圳)有限公司 图谱优化方法、装置、终端及存储介质
CN111026865A (zh) * 2019-10-18 2020-04-17 平安科技(深圳)有限公司 知识图谱的关系对齐方法、装置、设备及存储介质
WO2020143326A1 (zh) * 2019-01-11 2020-07-16 平安科技(深圳)有限公司 知识数据存储方法、装置、计算机设备和存储介质
CN111752943A (zh) * 2020-05-19 2020-10-09 北京网思科平科技有限公司 一种图谱关系路径定位方法和系统
CN112328791A (zh) * 2020-11-09 2021-02-05 济南大学 一种基于DiTextCNN的中文政务信息的文本分类方法
CN112364173A (zh) * 2020-10-21 2021-02-12 中国电子科技网络信息安全有限公司 一种基于知识图谱的ip地址机构溯源方法
CN112380355A (zh) * 2020-11-20 2021-02-19 华南理工大学 一种时隙异构知识图谱的表示与存储方法
CN114065359A (zh) * 2021-11-26 2022-02-18 广东三维家信息科技有限公司 一种装修设计生成方法、装置、电子设备及存储介质
CN115063156A (zh) * 2022-06-28 2022-09-16 支付宝(杭州)信息技术有限公司 一种风险的处理方法、装置及设备
CN115129719A (zh) * 2022-06-28 2022-09-30 深圳市规划和自然资源数据管理中心 一种基于知识图谱的定性位置空间范围构建方法
CN115187153A (zh) * 2022-09-14 2022-10-14 杭银消费金融股份有限公司 应用于业务风险溯源的数据处理方法及系统
CN116720578A (zh) * 2023-05-12 2023-09-08 航天恒星科技有限公司 一种具有时空特性的知识图谱的存储方法
CN117033541A (zh) * 2023-10-09 2023-11-10 中南大学 一种时空知识图谱索引方法及相关设备

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111932174B (zh) * 2020-07-28 2024-05-28 中华人民共和国深圳海关 货运监管异常信息获取方法、装置、服务器及存储介质
CN111782825B (zh) * 2020-08-20 2024-08-09 支付宝(杭州)信息技术有限公司 知识库构建方法及装置
CN112256927B (zh) * 2020-10-21 2024-06-04 网易(杭州)网络有限公司 基于属性图的知识图谱数据处理方法和装置
CN112256884A (zh) * 2020-10-23 2021-01-22 国网辽宁省电力有限公司信息通信分公司 一种基于知识图谱的数据资产库访问方法和装置
CN112306687B (zh) * 2020-10-30 2024-06-21 深圳平安智汇企业信息管理有限公司 基于知识图谱的资源分配方法、装置、计算机设备和介质
CN112612899B (zh) * 2020-11-24 2024-06-18 中国传媒大学 知识图谱的构建方法、装置、存储介质和电子设备
CN112579789A (zh) * 2020-12-04 2021-03-30 珠海格力电器股份有限公司 一种设备故障诊断的方法和装置及设备
CN112487214B (zh) * 2020-12-23 2024-06-04 中译语通科技股份有限公司 基于实体共现矩阵的知识图谱关系抽取方法及系统
CN112650858B (zh) * 2020-12-29 2023-09-26 中国平安人寿保险股份有限公司 应急协助信息的获取方法、装置、计算机设备及介质
CN112883735B (zh) * 2021-02-10 2024-01-12 卡奥斯数字科技(上海)有限公司 一种表单图像的结构化处理方法、装置、设备及存储介质
CN113094506B (zh) * 2021-04-14 2023-08-18 每日互动股份有限公司 一种基于关系图谱的预警方法、计算机设备及存储介质
CN113312410B (zh) * 2021-06-10 2023-11-21 平安证券股份有限公司 数据图谱的构建方法、数据查询方法及终端设备
CN113505889B (zh) * 2021-07-23 2024-08-02 中国平安人寿保险股份有限公司 图谱化知识库的处理方法、装置、计算机设备和存储介质
CN113590835A (zh) * 2021-07-28 2021-11-02 上海致景信息科技有限公司 纺织行业数据的知识图谱构建方法、装置及处理器
CN113837028B (zh) * 2021-09-03 2024-05-14 广州大学 一种基于时空知识图谱的道路流量分析方法和装置
CN114168748A (zh) * 2021-12-06 2022-03-11 国家电网有限公司信息通信分公司 一种大规模运维知识图谱存储和多粒度可视化方法
CN114840686B (zh) * 2022-05-07 2024-01-02 中国电信股份有限公司 基于元数据的知识图谱构建方法、装置、设备及存储介质
CN116523039B (zh) * 2023-04-26 2024-02-09 华院计算技术(上海)股份有限公司 连铸知识图谱的生成方法及装置、存储介质、终端
CN117390201B (zh) * 2023-11-06 2024-10-01 南京题谱思信息科技有限公司 知识领域的知识图谱构建方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017080220A1 (zh) * 2015-11-12 2017-05-18 百度在线网络技术(北京)有限公司 知识数据的处理方法和装置
US20170147556A1 (en) * 2015-11-24 2017-05-25 International Business Machines Corporation Knowledge-based editor with natural language interface
CN107943998A (zh) * 2017-12-05 2018-04-20 竹间智能科技(上海)有限公司 一种基于知识图谱的人机对话控制系统及方法
CN107943874A (zh) * 2017-11-13 2018-04-20 平安科技(深圳)有限公司 知识图谱处理方法、装置、计算机设备及存储介质
CN108345647A (zh) * 2018-01-18 2018-07-31 北京邮电大学 基于Web的领域知识图谱构建系统及方法
CN108595449A (zh) * 2017-11-23 2018-09-28 北京科东电力控制系统有限责任公司 调度自动化系统知识图谱的构建与应用方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11334692B2 (en) * 2017-06-29 2022-05-17 International Business Machines Corporation Extracting a knowledge graph from program source code
CN107665252B (zh) * 2017-09-27 2020-08-25 深圳证券信息有限公司 一种创建知识图谱的方法及装置
CN107944012A (zh) * 2017-12-08 2018-04-20 北京百度网讯科技有限公司 知识数据计算系统、方法、服务器及存储介质
CN108804419A (zh) * 2018-05-22 2018-11-13 湖南大学 一种基于知识图谱的线下医药零售精准推荐技术
CN109086347A (zh) * 2018-07-13 2018-12-25 武汉尼维智能科技有限公司 一种国际海运危险货物知识图谱系统的构建方法、装置及存储介质
CN109885692B (zh) * 2019-01-11 2023-06-16 平安科技(深圳)有限公司 知识数据存储方法、装置、计算机设备和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017080220A1 (zh) * 2015-11-12 2017-05-18 百度在线网络技术(北京)有限公司 知识数据的处理方法和装置
US20170147556A1 (en) * 2015-11-24 2017-05-25 International Business Machines Corporation Knowledge-based editor with natural language interface
CN107943874A (zh) * 2017-11-13 2018-04-20 平安科技(深圳)有限公司 知识图谱处理方法、装置、计算机设备及存储介质
CN108595449A (zh) * 2017-11-23 2018-09-28 北京科东电力控制系统有限责任公司 调度自动化系统知识图谱的构建与应用方法
CN107943998A (zh) * 2017-12-05 2018-04-20 竹间智能科技(上海)有限公司 一种基于知识图谱的人机对话控制系统及方法
CN108345647A (zh) * 2018-01-18 2018-07-31 北京邮电大学 基于Web的领域知识图谱构建系统及方法

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020143326A1 (zh) * 2019-01-11 2020-07-16 平安科技(深圳)有限公司 知识数据存储方法、装置、计算机设备和存储介质
CN110569372A (zh) * 2019-09-20 2019-12-13 四川大学 一种心脏病大数据知识图谱系统的构建方法
CN110569372B (zh) * 2019-09-20 2022-08-30 四川大学 一种心脏病大数据知识图谱系统的构建方法
CN111026865A (zh) * 2019-10-18 2020-04-17 平安科技(深圳)有限公司 知识图谱的关系对齐方法、装置、设备及存储介质
CN111026865B (zh) * 2019-10-18 2023-07-21 平安科技(深圳)有限公司 知识图谱的关系对齐方法、装置、设备及存储介质
WO2021072891A1 (zh) * 2019-10-18 2021-04-22 平安科技(深圳)有限公司 知识图谱的关系对齐方法、装置、设备及存储介质
CN110795562A (zh) * 2019-10-29 2020-02-14 腾讯科技(深圳)有限公司 图谱优化方法、装置、终端及存储介质
CN111752943A (zh) * 2020-05-19 2020-10-09 北京网思科平科技有限公司 一种图谱关系路径定位方法和系统
CN112364173B (zh) * 2020-10-21 2022-03-18 中国电子科技网络信息安全有限公司 一种基于知识图谱的ip地址机构溯源方法
CN112364173A (zh) * 2020-10-21 2021-02-12 中国电子科技网络信息安全有限公司 一种基于知识图谱的ip地址机构溯源方法
CN112328791A (zh) * 2020-11-09 2021-02-05 济南大学 一种基于DiTextCNN的中文政务信息的文本分类方法
CN112380355A (zh) * 2020-11-20 2021-02-19 华南理工大学 一种时隙异构知识图谱的表示与存储方法
CN114065359A (zh) * 2021-11-26 2022-02-18 广东三维家信息科技有限公司 一种装修设计生成方法、装置、电子设备及存储介质
CN115063156A (zh) * 2022-06-28 2022-09-16 支付宝(杭州)信息技术有限公司 一种风险的处理方法、装置及设备
CN115129719A (zh) * 2022-06-28 2022-09-30 深圳市规划和自然资源数据管理中心 一种基于知识图谱的定性位置空间范围构建方法
CN115187153A (zh) * 2022-09-14 2022-10-14 杭银消费金融股份有限公司 应用于业务风险溯源的数据处理方法及系统
CN115187153B (zh) * 2022-09-14 2022-12-09 杭银消费金融股份有限公司 应用于业务风险溯源的数据处理方法及系统
CN116720578A (zh) * 2023-05-12 2023-09-08 航天恒星科技有限公司 一种具有时空特性的知识图谱的存储方法
CN116720578B (zh) * 2023-05-12 2024-01-23 航天恒星科技有限公司 一种具有时空特性的知识图谱的存储方法
CN117033541A (zh) * 2023-10-09 2023-11-10 中南大学 一种时空知识图谱索引方法及相关设备
CN117033541B (zh) * 2023-10-09 2023-12-19 中南大学 一种时空知识图谱索引方法及相关设备

Also Published As

Publication number Publication date
CN109885692B (zh) 2023-06-16
WO2020143326A1 (zh) 2020-07-16

Similar Documents

Publication Publication Date Title
CN109885692A (zh) 知识数据存储方法、装置、计算机设备和存储介质
CN105354307B (zh) 一种图像内容识别方法及装置
CN109886294A (zh) 知识融合方法、装置、计算机设备和存储介质
Hore et al. A scalable framework for cluster ensembles
CN111191466B (zh) 一种基于网络表征和语义表征的同名作者消歧方法
US9098741B1 (en) Discriminitive learning for object detection
CN111382283B (zh) 资源类别标签标注方法、装置、计算机设备和存储介质
CN112364173B (zh) 一种基于知识图谱的ip地址机构溯源方法
CN107391565B (zh) 一种基于主题模型的跨语言层次分类体系匹配方法
Kotekar et al. Enhancing service discovery using cat swarm optimisation based web service clustering
CN113806582B (zh) 图像检索方法、装置、电子设备和存储介质
CN113779429A (zh) 交通拥堵态势预测方法、装置、设备及存储介质
CN109189848A (zh) 知识数据的抽取方法、系统、计算机设备和存储介质
Wang et al. Link prediction in heterogeneous collaboration networks
Prasanth et al. Effective big data retrieval using deep learning modified neural networks
Cousseau et al. Linking place records using multi-view encoders
JP2023517518A (ja) ヌル値又は同等の値を有するリレーショナル・テーブルのためのベクトル埋込モデル
CN116029394A (zh) 自适应文本情感识别模型训练方法、电子设备及存储介质
Kumar et al. Personalized web service recommendation through mishmash technique and deep learning model
Podder et al. Ontology-driven content-based retrieval of heritage images
CN111723301B (zh) 基于层次化主题偏好语义矩阵的关注关系识别及标注方法
CN113204662A (zh) 基于拍搜行为预测用户所属群组的方法、装置和计算机设备
CN113392294A (zh) 样本标注方法及装置
Le et al. Developing a model semantic‐based image retrieval by combining KD‐tree structure with ontology
JP2020061147A (ja) Cnn基盤イメージ検索方法および装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant