CN107943874A - 知识图谱处理方法、装置、计算机设备及存储介质 - Google Patents
知识图谱处理方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN107943874A CN107943874A CN201711116399.XA CN201711116399A CN107943874A CN 107943874 A CN107943874 A CN 107943874A CN 201711116399 A CN201711116399 A CN 201711116399A CN 107943874 A CN107943874 A CN 107943874A
- Authority
- CN
- China
- Prior art keywords
- current
- data
- vector
- data vector
- relation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种知识图谱处理方法、装置、计算机设备及存储介质。该方法包括将知识图谱中的当前实体数据按照向量的形式表示,生成当前实体数据向量,并将当前关系数据按照向量的形式表示,生成当前关系数据向量;计算当前实体数据关系单位矩阵;采用当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量,建立损失函数;利用损失函数,优化当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量;采用当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量更新知识图谱。上述知识图谱处理方法、装置、计算机设备及存储介质,无需针对每个知识图谱的扩充逻辑都编写代码,提高知识图谱的扩充效率。
Description
技术领域
本发明涉及计算机技术领域,特别是涉及一种知识图谱处理方法、装置、计算机设备及存储介质。
背景技术
随着互联网技术的发展,用户需要从互联网上获取相关的信息或数据,知识图谱可以在当某类数据或信息非常复杂的情况下,将各类数据以及各类数据之间的关系表示出来,从而将这些数据系统地展示给用户,而随着信息或数据不断地增加,则需要对知识图谱进行不断地扩充,使知识图谱更加完善。
一般地,在对知识图谱进行不断扩充的过程中,会编写大量的程序从而制定相应的扩充逻辑,根据该扩充逻辑对头实体数据以及与该头实体数据对应的关系数据进行推理,得到尾实体数据,进而实现对知识图谱的不断扩充。对于不同的知识图谱,需要重新编写程序制定对应的扩充逻辑,导致对知识图谱中的数据处理效率低,进而导致对知识图谱扩充的效率低,适用性不强。
发明内容
基于此,有必要针对知识图谱扩充的效率低,适用性不强的问题,提供一种知识图谱处理方法、装置、计算机设备及存储介质。
一种知识图谱处理方法,所述方法包括:
将知识图谱中的当前实体数据按照向量的形式表示,生成当前实体数据向量,将知识图谱中的当前关系数据按照向量的形式表示,生成当前关系数据向量;
根据所述当前实体数据向量与所述当前关系数据向量计算当前实体数据关系单位矩阵;
采用所述当前实体数据关系单位矩阵、所述当前实体数据向量与所述当前关系数据向量,建立损失函数;
利用所述损失函数,优化所述当前实体数据关系单位矩阵、所述当前实体数据向量与所述当前关系数据向量得到当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量;
采用所述当前实体数据关系矩阵、所述优化后的当前实体数据向量与所述优化后的当前关系数据向量更新所述知识图谱。
在其中一个实施例中,所述将知识图谱中的当前实体数据按照向量的形式表示,生成当前实体数据向量,将知识图谱中的当前关系数据按照向量的形式表示,生成当前关系数据向量的步骤,包括:
根据知识图谱中的实体数据的数量获取所述当前实体数据向量的维度,根据所述知识图谱中关系数据的数量获取所述当前关系数据向量的维度;
根据所述当前实体数据向量的维度以及所述当前实体数据生成所述当前实体数据向量中每个维度的元素得到当前初始实体数据向量;
根据所述当前关系数据向量的维度以及所述当前关系数据生成所述当前关系数据向量中每个维度的元素得到当前初始关系数据向量;
将所述当前初始实体数据向量归一化处理得到所述当前实体数据向量;
将所述当前初始关系数据向量归一化处理得到所述当前关系数据向量。
在其中一个实施例中,所述根据所述当前实体数据关系单位矩阵、所述当前实体数据向量与所述当前关系数据向量,建立损失函数的步骤,包括:
根据所述当前实体数据关系单位矩阵、所述当前实体数据向量和所述当前关系数据向量,建立第一打分函数;
根据所述知识图谱中的另一实体数据生成替换所述当前实体数据向量,根据所述替换实体数据向量、所述当前实体数据关系单位矩阵和所述当前关系数据向量,建立第二打分函数;
根据所述第一打分函数与所述第二打分函数,建立所述损失函数。
在其中一个实施例中,所述采用所述当前实体数据关系矩阵、所述优化后的当前实体数据向量与所述优化后的当前关系数据向量更新所述知识图谱的步骤,包括:
通过所述第一打分函数,计算所述当前实体数据关系矩阵、与所述优化后的当前实体数据向量对应的知识图谱中的实体数据、与所述优化后的当前关系数据向量对应的所述知识图谱中的关系数据的关联度;
当所述关联度小于阈值时,则将关联度小于阈值的所述知识图谱中的实体数据和所述关系数据关联更新至所述知识图谱中。
在其中一个实施例中,所述利用所述损失函数,优化所述当前实体数据关系单位矩阵、所述当前实体数据向量与所述当前关系数据向量得到当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量的步骤,包括:
采用所述当前实体数据关系单位矩阵、所述当前实体数据向量与所述当前关系数据向量计算所述损失函数的值;
当所述损失函数的值不小于阈值时,则将所述当前实体数据关系单位矩阵、所述当前实体数据向量与所述当前关系数据向量作为所述当前实体数据关系矩阵、所述优化后的当前实体数据向量与所述优化后的当前关系数据向量。
在其中一个实施例中,所述方法还包括:
当所述损失函数的值小于阈值时,则步骤A:根据当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量计算当前梯度;
步骤B:根据预设的距离系数、预设的调整参数以及所计算的当前梯度更新所述当前实体数据关系单位矩阵、所述当前实体数据向量与所述当前关系数据向量;
步骤C:根据更新后的所述当前实体数据关系单位矩阵、更新后的所述当前实体数据向量与更新后的所述当前关系数据向量计算所述损失函数的值;
当所述损失函数的值小于所述阈值时,则重复上述步骤A、步骤B与步骤C,直至所述损失函数的值不小于阈值时,则将更新后的所述当前实体数据关系单位矩阵、更新后的所述当前实体数据向量与更新后的所述当前关系数据向量作为所述当前实体数据关系矩阵、所述优化后的当前实体数据向量与所述优化后的当前关系数据向量。
一种知识图谱处理装置,所述装置包括:
生成模块,用于将知识图谱中的当前实体数据按照向量的形式表示,生成当前实体数据向量,将知识图谱中的当前关系数据按照向量的形式表示,生成当前关系数据向量;
计算模块,用于根据所述当前实体数据向量与所述当前关系数据向量计算当前实体数据关系单位矩阵;
损失函数建立模块,用于采用所述当前实体数据关系单位矩阵、所述当前实体数据向量与所述当前关系数据向量,建立损失函数;
优化模块,用于利用所述损失函数,优化所述当前实体数据关系单位矩阵、所述当前实体数据向量与所述当前关系数据向量得到当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量;
更新模块,用于采用所述当前实体数据关系矩阵、所述优化后的当前实体数据向量与所述优化后的当前关系数据向量更新所述知识图谱。
在其中一个实施例中,所述生成模块,包括:
获取单元,用于根据知识图谱中的实体数据的数量获取所述当前实体数据向量的维度,根据所述知识图谱中关系数据的数量获取所述当前关系数据向量的维度;
第一元素生成单元,用于根据所述当前实体数据向量的维度以及所述当前实体数据生成所述当前实体数据向量中每个维度的元素得到当前初始实体数据向量;
第二元素生成单元,用于根据所述当前关系数据向量的维度以及所述当前关系数据生成所述当前关系数据向量中每个维度的元素得到当前初始关系数据向量;
第一处理单元,用于将所述当前初始实体数据向量归一化处理得到所述当前实体数据向量;
第二处理单元,用于将所述当前初始关系数据向量归一化处理得到所述当前关系数据向量。
一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法中的步骤。
一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法中的步骤。
上述知识图谱处理方法、装置、计算机设备及存储介质,将知识图谱中的实体数据与关系数据设置为向量形式,根据向量形式的实体数据与关系数据计算实体关系单位矩阵,建立损失函数,利用损失函数优化实体关系单位矩阵得到实体关系矩阵,进而利用损失函数优化向量形式的实体数据与关系数据得到优化后的实体数据向量与优化后的关系数据向量,实现对图谱数据的更新,统一采用损失函数进行优化,进而根据优化后得到的实体关系矩阵、优化后的实体数据向量与优化后的关系数据向量更新知识图谱,无需针对每个知识图谱的扩充逻辑都编写代码,提高知识图谱的扩充效率。
附图说明
图1为知识图谱处理方法的应用场景图;
图2为一实施例中知识图谱处理方法的流程图;
图3为一实施例中优化步骤的流程图;
图4为一实施例中知识图谱处理装置的结构示意图;
图5为一实施例中计算机设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
在详细说明根据本发明的实施例前,应该注意到的是,所述的实施例主要在于与知识图谱处理方法、装置、计算机设备及存储介质相关的步骤和装置组件的组合。因此,所述装置组件和方法步骤已经在附图中通过常规符号在适当的位置表示出来了,并且只示出了与理解本发明的实施例有关的细节,以免因对于得益于本发明的本领域普通技术人员而言显而易见的那些细节模糊了本发明的公开内容。
在本文中,诸如左和右,上和下,前和后,第一和第二之类的关系术语仅仅用来区分一个实体或动作与另一个实体或动作,而不一定要求或暗示这种实体或动作之间的任何实际的这种关系或顺序。术语“包括”、“包含”或任何其他变体旨在涵盖非排他性的包含,由此使得包括一系列要素的过程、方法、物品或者设备不仅包含这些要素,而且还包含没有明确列出的其他要素,或者为这种过程、方法、物品或者设备所固有的要素。
请参照图1,图1为一实施例中知识图谱处理方法的应用场景图,其中包括知识图谱处理平台和服务器,服务器上存储有初始的建立完成的知识图谱,知识图谱处理平台可以从服务器上获取到的初始的建立完成的知识图谱,知识图谱处理平台将知识图谱中的当前实体数据按照向量的形式表示,生成当前实体数据向量,将知识图谱中的当前关系数据按照向量的形式表示,生成当前关系数据向量,进而根据当前实体数据向量与当前关系数据向量计算实体数据关系单位矩阵,知识图谱处理平台采用当前实体数据关系单位矩阵,当前实体数据向量与当前关系数据相连,建立损失函数,进而知识图谱处理平台利用损失函数,优化当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量,得到当前实体数据关系矩阵,优化后的当前实体数据向量与优化后的当前关系数据向量,知识图谱处理平台采用当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量更新知识图谱,更新后的知识图谱可以存储在服务器上,用户可以通过知识图谱处理平台向服务器发送查询知识图谱的请求,进而可以通过知识图谱平台的显示界面查看知识图谱,系统地表现数据之间的关系。
在其中一个实施例中,可参见图2,提供一知识图谱处理方法的流程图,本实施例中以该方法应用到上述图1中的知识图谱处理平台中来举例说明,该平台上运行有知识图谱处理程序,通过该知识图谱处理程序来实施知识图谱处理。该方法包括如下步骤:
S202:将知识图谱中的当前实体数据按照向量的形式表示,生成当前实体数据向量,将知识图谱中的当前关系数据按照向量的形式表示,生成当前关系数据向量。
具体地,知识图谱是指可以描述不同领域中存在的各种概念的网络图,知识图谱可以由实体数据与关系数据构成,关系数据用来将不同的实体数据进行连接,进而系统地展示各种数据之间的关系,如知识图谱可以表示为人员关系知识图谱,其中存储有分支“张某-妻子-李某”,其中“张某”和“李某”为实体数据,“妻子”为关系数据,知识图谱还可以是医疗知识图谱,其中存储有分支“感冒-症状-发烧”,其中“感冒”和“发烧”为实体数据,“症状”为关系数据,且知识图谱的形式不限于此;实体数据是指具有相应的特性,且可以标识相关的概念的数据,实体数据可以是人物实体数据、地区实体数据、疾病实体数据或症状实体数据等,例如,实体数据可以是人物实体数据张某或王某等,可以是地区实体数据上海或北京等,可以是疾病实体数据感冒或糖尿病等,也可以是症状实体数据发烧或咳嗽等;关系数据是指可以连接两个实体数据的相应的属性数据,关系数据可以是出生地关系数据,症状关系数据或身体检查关系数据等,例如,关系数据可以是出生地、疾病的症状或疾病检查项目等;实体数据向量是指在知识图谱中的不同实体数据采用向量的形式进行表示,实体数据向量可以是人物实体数据向量、地区实体数据向量、疾病实体数据向量或症状实体数据向量等;关系数据向量是指连接不同的实体数据之间的关系数据采用向量的形式进行表示,关系数据可以是症状关系数据向量或身体检查关系数据等。
进一步地,知识图谱处理平台从服务器上获取到知识图谱,根据知识图谱中存储的不同的实体数据与关系数据,知识图谱处理平台将当前实体数据按照向量的形式进行表示,即生成当前实体数据向量,且知识图谱处理平台将当前关系数据也按照向量的形式进行表示,即生成当前关系数据向量。例如,知识图谱处理平台从服务器上获取到知识图谱,该知识图谱可以是医疗知识图谱,根据知识图谱中存储的不同的实体数据,如疾病实体数据、症状实体数据、身体检查实体数据,将当前的实体数据用向量形式表示,如疾病实体数据中的感冒实体数据表现为感冒实体数据向量,为[1,2,3],根据知识图谱存储的不同的关系数据,如症状关系数据或身体检查关系数据,将当前的关系数据用向量形式表示,如将症状关系数据表现为症状关系数据向量,为[1,1.5,3]等。需要说明的是,知识图谱中的实体数据向量与关系数据向量的维度与每一个维度的元素可以根据知识图谱存储的实体数据与关系数据进行不同设置。
S204:根据当前实体数据向量与当前关系数据向量计算当前实体数据关系单位矩阵。
具体地,实体数据关系单位矩阵是指可以表现实体数据与实体数据所对应的关系数据之间的联系的矩阵,该矩阵为单位矩阵,例如,实体数据关系单位矩阵可以表现人物与人物间关系的联系的矩阵,即为人物关系单位矩阵,也可以是表现疾病与疾病症状建的联系的矩阵,即为疾病症状单位矩阵。进一步地,知识图谱处理平台根据生成的当前实体数据向量与当前关系数据向量,获取当前关系数据对应的向量空间,进而将当前实体数据向量投影到关系数据对应的向量空间中得到投影矩阵,将该投影矩阵进行单位化处理,即可得到当前实体数据关系矩阵;例如,在医疗知识图谱中,知识图谱处理平台根据症状向量获取到症状关系数据对应的向量空间,进而将感冒向量投影到症状向量对应的向量空间中得到投影矩阵,进而将投影矩阵进行单位化处理,即可得到感冒症状单位矩阵。
S206:采用当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量,建立损失函数。
具体地,损失函数是指以函数形式采用实体数据向量、关系数据向量以及实体数据关系单位向量将知识图谱中的实体数据与关系数据之间的联系表现出来,损失函数可以展示实体数据与关系数据之间的关联,损失函数还可以用来以已知的实体数据推理关联的关系数据,损失函数还可以用来以已知的关系数据推理关联的实体数据,损失函数还可以优化实体数据向量、关系数据向量与实体数据关系单位矩阵从而得到所需的实体数据向量、关系数据向量与实体数据关系矩阵。进一步地,知识图谱处理平台根据生成的当前实体数据向量与当前关系数据向量,以及计算得到的当前实体数据关系单位矩阵,生成损失函数。例如,在医疗知识图谱中,知识图谱处理平台采用知识图谱中的感冒向量、症状向量,以及根据感冒向量与症状向量生成的感冒症状关系单位矩阵,建立损失函数。
S208:利用损失函数,优化当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量得到当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量。
具体地,实体数据关系矩阵是指将实体数据向量投影到关系数据向量的投影矩阵进行单位化从而得到实体数据关系单位矩阵后进而进行优化得到的非单位矩阵,实体数据关系矩阵更精确表示实体数据与关系数据之间的联系。进一步地,知识图谱处理平台利用损失函数,将当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量进行优化,得到当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量。例如,在医疗知识图谱中,知识图谱建立平台利用损失函数,将感冒向量、症状向量与感冒症状关系单位矩阵进行优化,得到优化后的感冒向量、优化后的症状向量以及感冒症状关系矩阵。
S210:采用当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量更新知识图谱。
具体地,知识图谱处理平台采用损失函数,对当前实体关系单位矩阵、当前实体数据向量与当前关系数据向量进行优化得到当前实体数据关系矩阵、优化后的当前实体数据向量以及优化后的当前关系数据,进而可以根据优化得到的当前实体数据关系矩阵、优化后的当前实体数据向量以及优化后的当前关系数据,对知识图谱进行更新。进一步地,知识图谱处理平台可以将优化的实体数据向量对应的在知识图谱中存储的实体数据,根据该优化后的实体数据向量、优化后的当前关系数据向量和当前实体数据关系矩阵,查找到知识图谱中存储的该实体数据对应的关系数据,进而将该实体数据对应的关系数据向关联,得到新的知识图谱的分支,从而更新知识图谱。例如,在医疗知识图谱中,存储有实体数据为“感冒”与“验血”,关系数据为“身体检查”,且实体数据与关系数据之间没有建立关联,则有实体数据向量为感冒向量与验血向量,关系数据向量为身体检查向量,实体数据关系单位矩阵有感冒身体检查单位实体矩阵与验血身体检查单位实体矩阵,进而根据损失函数进行优化,得到优化后的感冒向量与优化后的验血向量,以及感冒身体检查实体矩阵与验血身体检查实体矩阵,进而根据优化后的感冒向量、优化后的验血向量、感冒身体检查实体矩阵与验血身体检查实体矩阵查找到实体数据“感冒”与“验血”是和关系数据“身体检查”对应,则将实体数据“感冒”“验血”与实体数据“身体检查”进行相关联,得到新的知识图谱的分支“感冒-身体检查-验血”,从而可以更新知识图谱。
需要说明的是,实体数据可以包括至少两个不同的数据,关系数据为不同的至少两个数据之间一一对应的关系,进一步地,实体数据可以包含头实体数据与尾实体数据,关系数据可以为头实体数据与尾实体数据之间一一对应的关系,则可以是根据知识图谱中的当前实体数据与当前关系数据生成当前头实体数据向量、当前尾实体数据向量与当前关系数据向量;进而,根据当前头实体数据向量与当前关系数据向量计算当前头实体数据关系单位矩阵,根据当前尾实体数据向量与当前关系数据向量计算当前尾实体数据关系单位矩阵;知识图谱处理平台采用当前头实体关系单位矩阵、当前尾实体关系单位矩阵、当前头实体数据向量、当前尾实体数据向量与当前关系数据向量,建立损失函数;知识图谱处理平台利用损失函数,优化当前头实体关系单位矩阵得到当前头实体关系矩阵,优化当前尾实体关系单位矩阵得到当前尾实体关系矩阵,优化当前头实体数据向量得到当前优化后的头实体数据向量,优化当前尾实体数据向量得到优化后的尾实体数据向量,优化当前关系数据向量得到优化后的当前关系数据向量;知识图谱处理平台采用当前头实体关系矩阵、当前尾实体关系矩阵、优化后的当前头实体数据向量、优化后的当前尾实体数据向量以及优化后的关系数据向量更新知识图谱。
本实施例中,将知识图谱中的实体数据与关系数据设置为向量形式,根据向量形式的实体数据与关系数据计算实体关系单位矩阵,建立损失函数,利用损失函数优化实体关系单位矩阵得到实体关系矩阵,进而利用损失函数优化向量形式的实体数据与关系数据得到优化后的实体数据向量与优化后的关系数据向量,实体数据向量、关系数据向量以及实体数据关系矩阵优化准确,根据优化后的实体数据向量、优化后的关系数据向量以及实体数据关系矩阵实现对图谱数据的更新,统一采用损失函数进行优化,进而根据优化后得到的实体关系矩阵、优化后的实体数据向量与优化后的关系数据向量更新知识图谱,无需针对每个知识图谱的扩充逻辑都编写代码,提高知识图谱的扩充效率。
在其中一个实施例中,步骤S202可以包括如下的流程,步骤S202,即将知识图谱中的当前实体数据按照向量的形式表示,生成当前实体数据向量,将知识图谱中的当前关系数据按照向量的形式表示,生成当前关系数据向量的步骤,可以包括:
根据知识图谱中的实体数据的数量获取当前实体数据向量的维度,根据知识图谱中关系数据的数量获取当前关系数据向量的维度。具体地,知识图谱处理平台根据知识图谱中存储的实体数据的数量,则获取当前实体数据向量的维度,进而知识图谱处理平台根据知识图谱中存储的关系数据的数量,获取当前关系数据向量的维度,可以是,知识图谱处理平台根据知识图谱中的实体数据的数量,获取到当前实体数据向量的维度为m维,进而根据知识图谱中的实体数据的数量,获取到当前实体数据向量的维度为n维,例如,当知识图谱中存储的实体数据的数量为100个,则获取到当前实体数据向量的维度为10维,当知识图谱中存储的关系数据的数量为50个,则获取到当前关系数据的维度为5维。需要说明的是,当知识图谱中的实体数据与关系数据的个数越多时,则获取到的实体数据向量的维度与关系数据向量的维度越大,使得实体数据向量与关系数据向量表示的实体数据与关系数据更准确,例如,当实体数据的数量为200个时,则获取到当前实体数据向量的维度为20维,当知识图谱中存储的关系数据的数量100个时,则获取到当前关系数据向量的维度为10维。且知识图谱中可以根据实体数据的数量与关系数据的数量预先设置有相关的维度,例如,可以预设有200个实体数据时,则实体数据向量的维度为10维、15维或21维等,可以预设有100个关系数据时,则关系数据向量的维度为5维、10维或13维等,进而知识图谱根据实体数据的数量与关系数据的数量获取预设的实体数据向量的维度与关系数据向量的维度。
根据当前实体数据向量的维度以及当前实体数据生成当前实体数据向量中每个维度的元素得到当前初始实体数据向量。具体地,知识图谱处理平台根据获取到的当前实体数据的维度以及当前实体数据,依次生成当前实体数据向量中每个维度的元素得到当前初始实体数据向量。可以是,知识图谱获取到的当前实体数据的维度为m维,则当前实体数据向量中每个维度的元素是按照的范围依次生成随机数,进而得到初始实体数据向量,且根据当前实体数据,该初始实体数据向量上携带有表示该实体数据的标识,则为当前初始实体数据向量。例如,知识图谱获取到当前实体数据的维度为100维,当前实体数据向量为感冒向量,则当前实体数据向量中的100维的每个维度的元素是按照的范围依次生成随机数,进而得到初始实体数据向量,且该初始实体向量对应的实体数据是感冒数据,则将初始实体数据向量上携带标识是感冒数据的标识,则该初始实体向量为感冒初始向量。
根据当前关系数据向量的维度以及当前关系数据生成当前关系数据向量中每个维度的元素得到当前初始关系数据向量。具体地,知识图谱处理平台根据获取到的当前关系数据的维度以及当前关系数据,依次生成当前关系数据向量中每个维度的元素得到当前初始关系数据向量。可以是,知识图谱获取到的当前关系数据的维度为n维,则当前关系数据向量中每个维度的元素是按照的范围依次生成随机数,进而得到当前初始关系数据向量,且根据当前初始关系数据,该初始关系数据向量上携带有表示该关系数据的标识,则为当前初始关系数据向量。例如,知识图谱获取到当前关系数据的维度为50维,当前实体数据向量为症状向量,则当前实体数据向量中的50维的每个维度的元素是按照的范围依次生成随机数,进而得到初始关系数据向量,且该初始关系向量对应的关系数据是症状数据,则将初始关系数据向量上携带标识是症状数据的标识,则该初始实体向量为症状初始向量。
将当前初始实体数据向量归一化处理得到当前实体数据向量。具体地,知识图谱处理平台将得到的当前初始实体向量进行归一化处理,则得到当前实体数据向量。可以是,知识图谱处理平台计算当前初始实体向量的模长,进而,将当前初始实体向量中的每一维元素分别与当前初始实体向量的模长计算比值得到当前实体数据向量,即得到的当前实体数据向量的模长为1。例如,知识图谱处理平台得到当前初始实体数据向量为感冒数据初始向量,如感冒初始向量为[1,2,3],感冒初始向量的模长为则将感冒初始向量中的每一维元素1、2和3分别与向量的模长计算比值,即可得到感冒向量为
将当前初始关系数据向量归一化处理得到当前关系数据向量。具体地,知识图谱处理平台将得到的当前初始关系向量进行归一化处理,则得到当前关系数据向量。可以是,知识图谱处理平台计算当前初始关系向量的模长,进而,将当前初始关系向量中的每一维元素分别与当前初始关系向量的模长计算比值得到当前关系数据向量,即得到的当前关系数据向量的模长为1。例如,知识图谱处理平台得到当前初始关系数据向量为症状初始向量,如症状初始向量为[4,5],症状初始向量的模长为则将症状初始向量中的每一维元素4和5分别与向量的模长计算比值,即可得到症状向量为
本实施例中,知识图谱处理平台根据实体数据的数量获取当前实体数据向量的维度,并根据关系数据的数量获取当前关系数据向量的维度,可以保证当前实体数据的向量与当前关系数据向量可以分别准确反应当前实体数据与当前关系数据,进而根据获取到的实体数据向量的维度与实体数据生成实体数据向量中每个维度的元素得到当前初始实体数据向量,将得到的当前初始实体数据向量进行归一化处理得到当前实体数据向量,根据获取到的关系数据向量的维度与关系数据生成关系数据向量中每个维度的元素得到当前初始关系数据向量,将得到的当前初始关系数据向量进行归一化处理得到当前关系数据向量,得到的当前实体数据向量与当前关系数据向量为归一化处理后的向量,可以提高整体的运算速度。
在其中一个实施例中,步骤S204可以包括如下流程,步骤S204,即根据当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量,建立损失函数的步骤,可以包括:
根据当前实体数据关系单位矩阵、当前实体数据向量和当前关系数据向量,建立第一打分函数。具体地,第一打分函数是指可以评价知识图谱中建立了正确的分支的实体数据与关系数据之间关联程度的函数,可以是,设置为根据第一打分函数计算出的值越小,则表示知识图谱中实体数据与关系数据的关联程度越高。进一步地,知识图谱处理平台根据计算得到的当前实体数据关系单位矩阵、当前实体数据向量和当前关系数据向量,可以建立第一打分函数。可以是,知识图谱中的当前实体数据有当前头实体数据,当前尾实体数据,联系当前头实体数据与当前尾实体数据的为关系数据,则知识图谱平台根据得到的当前头实体关系单位矩阵与当前尾实体关系单位矩阵,当前头实体数据向量、当前尾实体数据向量,以及当前关系数据向量,建立第一打分函数,第一打分函数可以是
其中,h为当前头实体数据向量,r为当前关系数据向量,t为当前尾实体数据向量,Wr,1为当前头实体关系单位矩阵,Wr,2为当前尾实体关系单位矩阵。例如,在医疗知识图谱中,当前实体数据为“胃炎、胃疼”,则“胃炎”为当前头实体数据,“胃疼”为当前尾实体数据,当前关系数据为“症状”,该当前关系数据可以联系当前头实体数据“胃炎”与当前尾实体数据“胃疼”,则当前头实体数据向量为“胃炎向量”,当前尾实体数据向量“胃疼向量”,当前关系数据向量为“症状向量”,当前头实体关系单位矩阵为“胃炎症状单位矩阵”,当前尾实体关系单位矩阵为“胃疼症状单位矩阵”,进而h可以表示胃炎向量,r可以表示症状向量,t可以表示胃疼向量,Wr,1可以表示胃炎症状单位矩阵,Wr,2可以表示胃疼关系单位矩阵,进而建立第一打分函数。需要说明的是,知识图谱中存储的实体数据与关系数据都可以采用向量形式表示,且根据当前实体数据与当前关系数据不同,h、r、t、Wr,1与Wr,2可以分别表示不同的当前头实体数据向量、当前关系数据向量、当前尾实体数据向量、当前头实体关系单位向量与当前尾实体关系单位向量。
根据知识图谱中的另一实体数据生成替换实体数据向量,根据替换实体数据向量、当前实体数据关系单位矩阵和当前关系数据向量,建立第二打分函数。具体地,第二打分函数是指可以评价知识图谱中未建立起分支的实体数据与关系数据之间关联程度的函数,可以是,设置为根据第二打分函数计算出的值越小,则表示知识图谱中实体数据与关系数据的关联程度越高。进一步地,知识图谱处理平台根据另一实体数据生成替换实体数据向量,根据以上计算得到的当前实体数据关系单位矩阵、当前关系数据向量和替换实体数据向量,可以建立第二打分函数。再进一步地,知识图谱处理平台选取任意另一实体数据,该另一实体数据中包括另一头实体数据与另一尾实体数据,且另一头实体数据可以替换当前头实体数据得到替换头实体数据,另一尾实体数据替换当前尾实体数据得到替换尾实体数据,由此可以生成替换头实体数据向量与替换尾实体数据向量,则知识图谱平台根据当前实体数据关系单位矩阵与当前尾实体关系单位矩阵,替换头实体数据向量、替换尾实体数据向量,以及当前关系数据向量,建立第二打分函数,第二打分函数可以是
其中,h’为替换头实体数据向量,r为当前关系数据向量,t’为替换尾实体数据向量,Wr,1为当前头实体关系单位矩阵,Wr,2为当前尾实体关系单位矩阵。例如,在医疗知识图谱中,当前实体数据为“胃炎、胃疼”,则“胃炎”为当前头实体数据,“胃疼”为当前尾实体数据,当前关系数据为“症状”,知识图谱处理平台选取任意另一实体数据“感冒、发烧”,该另一实体数据中包括另一头实体数据“感冒”和另一尾实体数据向量“发烧”,则用“感冒”替换“胃炎”,用“发烧”替换“胃疼”,从而得到替换头实体数据为“感冒”,得到替换尾实体数据为“发烧”,由此生成替换头实体数据向量为“感冒向量”,生成替换尾实体数据向量为“发烧向量”,当前关系数据向量为“症状向量”,当前头实体关系单位矩阵为“胃炎症状单位矩阵”,当前尾实体关系单位矩阵为“胃疼症状单位矩阵”,进而h’可以表示感冒向量,r可以表示症状向量,t’可以表示发烧向量,Wr,1可以表示胃炎症状单位矩阵,Wr,2可以表示胃疼关系单位矩阵,进而建立第二打分函数。
根据第一打分函数与第二打分函数,建立损失函数。具体地,知识图谱处理平台根据上述得到的第一打分函数与第二打分函数,建立损失函数,进一步地,知识图谱处理平台可以根据第一打分函数与第二打分函数表现的实体数据向量、替换实体数据向量、关系数据向量以及实体数据关系单位矩阵的关系,建立损失函数,建立的损失函数可以是:
L=∑(h,r,t)∈G,Gr(h',r,t')∈G'max(0,γ+fr(h,t)-fr(h',t')) (3)
其中,L表示损失函数,G表示当前实体数据与关系数据的集合,G’表示与当前实体数据与关系数据没有交集的替换实体数据与关系数据的集合,h表示当前头实体数据向量,r表示关系数据向量,t表示当前尾实体数向量,h’表示替换头实体数据向量,t’表示替换尾实体数据向量,fr(h,t)表示第一打分函数,fr(h',t')表示第二打分函数,γ表示超参数,可以设定为1、2、3、5等。
本实施例中,采用在知识图谱中已建立起分支的实体数据与关系数据,且根据当前实体数据关系向量、实体数据对应的当前实体数据向量、关系数据对应内的关系数据向量建立第一打分函数,并且替换实体数据得到替换实体数据,根据当前实体数据关系向量,替换实体数据对应的替换实体数据向量,关系数据对应的关系数据向量建立第二打分函数,进而建立损失函数,即根据不同的实体数据与关系数据建立打分函数,保证打分函数建立时样本的多样性,从而保证建立的损失函数可以评价多种关系,增强适用性。
在其中一个实施例中,步骤S210的可以包括如下流程,步骤S210,即采用当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量更新知识图谱的步骤,可以包括:
通过第一打分函数,计算当前实体数据关系矩阵、与优化后的当前实体数据向量对应的知识图谱中的实体数据、与优化后的当前关系数据向量对应的知识图谱中的关系数据的关联度。具体地,关联度是评价实体数据与关系数据是否有关联的参数,可以是,设置为通过第一打分函数计算的值越小,则关联度越高,也可以是,设置为通过第一打分函数计算的值越大,则关联度越高等。知识图谱处理平台从知识图谱中随机选取实体数据作为当前实体数据,进而随机选取关系数据作为当前关系数据,进一步地,知识图谱处理平台得到优化后的当前关系数据向量、优化后的当前实体数据向量以及当前实体数据关系矩阵,知识图谱处理平台采用第一打分函数,即通过当前实体数据关系矩阵、优化后的当前实体数据向量、优化后的当前关系数据向量,计算该当前实体数据与当前关系数之间的关联度。
当关联度小于阈值时,则将关联度小于阈值的知识图谱中的实体数据和关系数据关联更新至知识图谱中。具体地,当知识图谱处理平台采用上述方法计算出的关联度小于阈值时,则认为该实体数据与该关系数据之间存在正确的关联关系,则该关系数据可以用于连接该实体数据,则知识图谱处理平台将该关联度小于阈值的知识图谱中的实体数据和关系数据更新为新的分支,即更新至知识图谱中。进一步地,实体数据可以包括头实体数据与尾实体数据,知识图谱处理平台采用第一打分函数,根据头实体数据向量、尾实体数据向量、关系数据向量、头实体数据关系矩阵与尾实体数据关系矩阵与关系向量计算头实体数据、尾实体数据与关系数据之间的得分,当得分小于阈值时,则认为头实体数据、尾实体数据可以采用该关系数据进行关联,即可将该头实体数据、关系数据与尾实体数据形成新的分支更新至知识图谱中。例如,设置有得分阈值为3,知识图谱中存储有实体数据“胃炎、胃镜”,关系数据“身体检查”,知识图谱处理平台可以采用第一打分函数,计算胃炎向量、胃镜向量、身体检查向量、胃炎身体检查关系矩阵与胃镜身体检查关系矩阵计算“胃炎”、“胃镜”与“身体检查”之间的得分,当得分小于3时,则认为头实体数据“胃炎”与尾实体数据“胃镜”可以采用关系数据“身体检查”进行关联,即可将“胃炎”、“胃镜”与“身体检查”形成新的分支即为“胃炎-身体检查-胃镜”更新至知识图谱中。
本实施例中,采用打分函数,计算实体数据与关系数的关联度,进而将得到的关联度高的实体数据与关系数据更新至知识图谱中,采用第一打分函数准确计算实体数据与关系数据之间的得分从而判断关联度,使得更新知识图谱更加准确。
在其中一个实施例中,步骤S208可以包括如下流程,步骤S208,即利用损失函数,优化当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量得到当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量的步骤,可以包括:
采用当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量计算损失函数的值。当损失函数的值不小于阈值时,则将当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量作为当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量。
具体地,知识图谱处理平台预设有损失函数值的阈值,知识图谱建立平台根据当前实体数据关系单位矩阵、当前实体数据向量以及当前关系数据向量,计算损失函数的值,当损失函数的值等于预设的阈值或大于预设的阈值时,则将计算损失函数值的当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量作为当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量。
本实施例中,当计算出的损失函数值不小于阈值时,则认为当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量为当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量,节省计算时间,提高运算速度。
在其中一个实施例中,提供一关联步骤,该关联步骤可以在步骤采用当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量计算损失函数的值之后执行,该关联步骤可以包括:
当损失函数的值小于阈值时,则步骤A:根据当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量计算当前梯度。
具体地,梯度是指变化步长,即可表示当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量的变化步长。进一步地,知识图谱处理平台根据当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量计算当前梯度。可以是,知识图谱处理平台根据当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量计算出第一打分函数,进而对第一打分函数求偏导,即可得到梯度。
步骤B:根据预设的距离系数、预设的调整参数以及所计算的当前梯度更新当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量。
具体地,距离系数是指表示实体数据与关系数据的关联度的系数,距离系数可以根据需要进行设定,例如,当在知识图谱中建立起联系的实体数据与关系数据的距离系数可以设置为1,当在知识图谱中未建立起联系的实体数据与关系数据的距离系数可以设置为-1等。调整参数是指预设的系数,调整参数可以进行认为调整,调整参数的值不超过1,如0.01、0.06、0.2或0.9等。知识图谱根据预设的距离系数、预设的调整参数以及所计算的当前梯度更新当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量从而得到更新后的当前实体数据关系单位矩阵、更新后的当前实体数据向量与更新后的当前关系数据向量计算损失函数的值。
步骤C:根据更新后的当前实体数据关系单位矩阵、更新后的当前实体数据向量与更新后的当前关系数据向量计算损失函数的值。具体地,知识图谱处理平台根据更新后的当前实体数据关系单位矩阵、更新后的当前实体数据向量与更新后的当前关系数据向量再次计算损失函数的值。
当损失函数的值小于阈值时,则重复上述步骤A、步骤B与步骤C,直至损失函数的值超过阈值时,则将更新后的当前实体数据关系单位矩阵、更新后的当前实体数据向量与更新后的当前关系数据向量作为当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量。具体地,知识图谱处理平台预设有损失函数的值的阈值,当计算得到损失函数的值仍小于阈值时,则重复步骤A、步骤B与步骤C,直至计算得到的损失函数的值不小于阈值时,则认为此时更新后的当前实体数据关系单位矩阵、更新后的当前实体数据向量与更新后的当前关系数据向量作为当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量。
本实施例中,采用计算损失函数的值的方法,当损失函数的值小于阈值时,则循环更新相应的梯度,进而采用更新的梯度、预设的距离系数与预设的调整参数更新当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量,直至计算出损失函数的值不小于阈值,则将更新后的当前实体数据关系单位矩阵、更新后的当前实体数据向量与更新后的当前关系数据向量作为当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量,循环步骤逐步优化,使得优化结果准确。
在其中一个实施例中,请参见图3,提供一优化步骤的流程图,该优化步骤可以包括;
S302:采用当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量计算损失函数的值。
具体地,知识图谱处理平台预设有损失函数值的阈值,知识图谱建立平台根据当前实体数据关系单位矩阵、当前实体数据向量以及当前关系数据向量,计算损失函数的值。例如,知识图谱处理平台预设有损失函数的值为3.1,当知识图谱建立平台根据当前实体数据关系单位矩阵、当前实体数据向量以及当前关系数据向量,计算损失函数的值。
S304:当损失函数的值不小于阈值时,则将当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量作为当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量。
S306:当损失函数的值小于阈值时,则根据当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量计算当前梯度。
具体地,梯度是指变化步长,即可表示当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量的变化步长。进一步地,知识图谱处理平台根据当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量计算当前梯度。可以是,知识图谱处理平台根据当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量计算出第一打分函数,进而对第一打分函数求偏导,即可得到梯度,则梯度可以表示为:
grad=2×(Wr,1h+r-Wr,2t) (4)
其中,h为当前头实体数据向量,r为当前关系数据向量,t为当前尾实体数据向量,Wr,1为当前头实体关系单位矩阵,Wr,2为当前尾实体关系单位矩阵
步骤308:根据预设的距离系数、预设的调整参数以及所计算的当前梯度更新当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量。
具体地,距离系数是指表示实体数据与关系数据的关联度的系数,距离系数可以根据需要进行设定,例如,当在知识图谱中建立起联系的实体数据与关系数据的距离系数可以设置为1,当在知识图谱中未建立起联系的实体数据与关系数据的距离系数可以设置为-1等。调整参数是指预设的系数,调整参数可以进行认为调整,调整参数的值不超过1,如0.01、0.06、0.2或0.9等。知识图谱根据预设的距离系数、预设的调整参数以及所计算的当前梯度更新当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量从而得到更新后的当前实体数据关系单位矩阵、更新后的当前实体数据向量与更新后的当前关系数据向量计算损失函数的值。
进一步地,知识图谱根据预设的距离系数、预设的调整参数以及所计算的当前梯度更新当前实体数据关系单位矩阵的每一列,从而得到更新后的当前实体数据关系单位矩阵,进而更新当前实体数据向量的每一维元素得到更新后的当前实体数据向量,进而更新当前关系数据向量的每一维元素得到更新后的当前关系数据向量。可以是,当前实体数据向量包括当前头实体数据向量与当前尾实体数据向量,当前实体数据关系单位矩阵包括当前头实体数据关系单位矩阵与当前尾实体数据关系单位矩阵,且用iscorrect表示距离系数,rate表示调整参数,grad表示计算的梯度,h为当前头实体数据向量,r为当前关系数据向量,t为当前尾实体数据向量,Wr,1为当前头实体关系单位矩阵,Wr,2为当前尾实体关系单位矩阵;则当前头实体数据关系单位矩阵Wr,1的每一列减去isCorrect×rate×grad×h得到更新后的头实体数据关系单位矩阵Wr,1';将当前尾实体关系矩阵Wr,2的每一列都加上isCorrect×rate×grad×t得到更新后的尾实体数据关系单位矩阵Wr,2';将头实体数据向量h的每一维元素减去isCorrect×rate×grad×Wr,1'(i)得到更新后的头实体向量h1,其中,Wr,1'(i)表示对应更新次数i的更新后的头实体数据关系单位矩阵的第i列,如进行第一次更新,则对应为第一次更新后的头实体数据关系单位矩阵的第一列;尾实体数据向量的每一维元素加上isCorrect×rate×grad×Wr,2'(i)得到更新后的尾实体向量h2,Wr,2'(i)表示对应更新次数i的更新后的尾实体数据关系单位矩阵的第i列,如进行第一次更新,则对应为第一次更新后的尾实体数据关系单位矩阵的第一列,将当前关系数据向量的每一维元素减去isCorrect×rate×grad得到更新后的关系数据向量。
步骤310:根据更新后的当前实体数据关系单位矩阵、更新后的当前实体数据向量与更新后的当前关系数据向量计算损失函数的值。具体地,知识图谱处理平台根据更新后的当前实体数据关系单位矩阵、更新后的当前实体数据向量与更新后的当前关系数据向量再次计算损失函数的值。
S312:当损失函数的值小于阈值时,则重复上述步骤306、步骤308与步骤310,直至损失函数的值超过阈值时,则将更新后的当前实体数据关系单位矩阵、更新后的当前实体数据向量与更新后的当前关系数据向量作为当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量。
具体地,当知识图谱处理平台根据上述步骤计算的损失函数的值小于阈值时,则重复上述步骤306、步骤308与步骤310,直至损失函数的值超过阈值时,则将更新后的当前实体数据关系单位矩阵、更新后的当前实体数据向量与更新后的当前关系数据向量作为当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量知识图谱处理平台预设有损失函数的值的阈值,当计算得到损失函数的值仍小于阈值时,则根据第一次更新后的实体数据关系单位矩阵、第一次更新后的实体数据向量与第一次更新后的关系数据向量更新梯度,进而根据预设的距离系数、预设的调整参数以及所及算的更新梯度将第一次更新后的实体数据关系单位矩阵、第一次更新后的实体数据向量与第一次更新后的关系数据向量再次进行更新,根据再次更新后的当前实体数据关系单位矩阵、再次更新后的当前实体数据向量与再次更新后的当前关系数据向量计算损失函数的值,则根据循环计算,直至计算得到的损失函数的值不小于阈值时,则认为此时更新后的当前实体数据关系单位矩阵、更新后的当前实体数据向量与更新后的当前关系数据向量作为当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量。
本实施例中,当知识图谱处理平台计算出的损失函数值不小于阈值时,则认为当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量为当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量,则节省计算时间,提高运算速度。当知识图谱处理平台计算出的损失函数的值小于阈值时,则循环更新相应的梯度,进而采用更新的梯度、预设的距离系数与预设的调整参数更新当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量,直至计算出损失函数的值不小于阈值,则将更新后的当前实体数据关系单位矩阵、更新后的当前实体数据向量与更新后的当前关系数据向量作为当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量,循环步骤逐步优化,使得优化结果准确。
在其中一个实施例中,请参见图4,提供一知识图谱处理装置的结构示意图,知识图谱处理装置400,包括:
生成模块410,用于将知识图谱中的当前实体数据按照向量的形式表示,生成当前实体数据向量,将知识图谱中的当前关系数据按照向量的形式表示,生成当前关系数据向量。
计算模块420,用于根据当前实体数据向量与当前关系数据向量计算当前实体数据关系单位矩阵。
损失函数建立模块430,用于采用当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量,建立损失函数。
优化模块440,用于利用损失函数,优化当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量得到当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量。
更新模块450,用于采用当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量更新知识图谱。
在其中一个实施例中,生成模块410可以包括:获取单元,用于根据知识图谱中的实体数据的数量获取当前实体数据向量的维度,根据知识图谱中关系数据的数量获取当前关系数据向量的维度。第一元素生成单元,用于根据当前实体数据向量的维度以及当前实体数据生成当前实体数据向量中每个维度的元素得到当前初始实体数据向量。第二元素生成单元,用于根据当前关系数据向量的维度以及当前关系数据生成当前关系数据向量中每个维度的元素得到当前初始关系数据向量。第一处理单元,用于将当前初始实体数据向量归一化处理得到当前实体数据向量。第二处理单元,用于将当前初始关系数据向量归一化处理得到当前关系数据向量。
在其中一个实施例中,损失函数建立模块430可以包括:第一打分函数建立单元,用于根据当前实体数据关系单位矩阵、当前实体数据向量和当前关系数据向量,建立第一打分函数。第二打分函数建立单元,用于根据知识图谱中的另一实体数据生成替换当前实体数据向量,根据替换实体数据向量、当前实体数据关系单位矩阵和当前关系数据向量,建立第二打分函数。损失函数建立单元,用于根据第一打分函数与第二打分函数,建立损失函数。
在其中一个实施例中,更新模块450可以包括:关联度计算单元,用于通过第一打分函数,计算当前实体数据关系矩阵、与优化后的当前实体数据向量对应的知识图谱中的实体数据、与优化后的当前关系数据向量对应的知识图谱中的关系数据的关联度。更新单元,用于当关联度小于阈值时,则将关联度小于阈值的知识图谱中的实体数据和关系数据关联更新至知识图谱中。
在其中一个实施例中,优化模块可以包括:第一计算单元,用于采用当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量计算损失函数的值。第一优化单元,用于当损失函数的值不小于阈值时,则将当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量作为当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量。
在其中一个实施例中,优化模块还可以包括:梯度计算单元,用于当损失函数的值小于阈值时,则步骤A:根据当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量计算当前梯度。计算更新单元,用于实现步骤B:根据预设的距离系数、预设的调整参数以及所计算的当前梯度更新当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量。更新计算单元,用于实现步骤C:根据更新后的当前实体数据关系单位矩阵、更新后的当前实体数据向量与更新后的当前关系数据向量计算损失函数的值。循环单元,用于当损失函数的值小于阈值时,则重复上述步骤A、步骤B与步骤C,直至损失函数的值不小于阈值时,则将更新后的当前实体数据关系单位矩阵、更新后的当前实体数据向量与更新后的当前关系数据向量作为当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量。
上述关于知识图谱处理装置的具体限定可以参见上文中关于知识图谱处理方法的限定,在此不再赘述。上述知识图谱处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。该处理器可以为中央处理单元(CPU)、微处理器、单片机等。上述知识图谱处理装置可以实现为一种计算机程序的形式,计算机程序可在如图1所示的事件评价数据处理平台上运行。
在其中一个实施例中,请参见图5,提供一执行知识图谱建立的计算机设备的结构示意图,该计算机设备可以是常规终端或其他任何合适的计算机设备,包括存储器、处理器、操作系统、数据库以及存储在存储器上并可在处理器上运行的知识图谱处理程序,其中存储器可以包括内存储器,内存储器为非易失性存储介质中的操作系统、数据库和计算机可执行程序提供高速缓存的运行环境,处理器执行知识图谱建立程序时实现以下步骤:将知识图谱中的当前实体数据按照向量的形式表示,生成当前实体数据向量,将知识图谱中的当前关系数据按照向量的形式表示,生成当前关系数据向量。根据当前实体数据向量与当前关系数据向量计算当前实体数据关系单位矩阵。采用当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量,建立损失函数。利用损失函数,优化当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量得到当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量。采用当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量更新知识图谱。
在其中一个实施例中,处理器执行该程序时所实现的将知识图谱中的当前实体数据按照向量的形式表示,生成当前实体数据向量,将知识图谱中的当前关系数据按照向量的形式表示,生成当前关系数据向量的步骤可以包括:根据知识图谱中的实体数据的数量获取当前实体数据向量的维度,根据知识图谱中关系数据的数量获取当前关系数据向量的维度。根据当前实体数据向量的维度以及当前实体数据生成当前实体数据向量中每个维度的元素得到当前初始实体数据向量。根据当前关系数据向量的维度以及当前关系数据生成当前关系数据向量中每个维度的元素得到当前初始关系数据向量。将当前初始实体数据向量归一化处理得到当前实体数据向量。将当前初始关系数据向量归一化处理得到当前关系数据向量。
在其中一个实施例中,处理器执行该程序时所实现的根据当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量,建立损失函数的步骤可以包括:根据当前实体数据关系单位矩阵、当前实体数据向量和当前关系数据向量,建立第一打分函数。根据知识图谱中的另一实体数据生成替换当前实体数据向量,根据替换实体数据向量、当前实体数据关系单位矩阵和当前关系数据向量,建立第二打分函数。根据第一打分函数与第二打分函数,建立损失函数。
在其中一个实施例中,处理器执行该程序时所实现的采用当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量更新知识图谱的步骤可以包括:通过第一打分函数,计算当前实体数据关系矩阵、与优化后的当前实体数据向量对应的知识图谱中的实体数据、与优化后的当前关系数据向量对应的知识图谱中的关系数据的关联度。当关联度小于阈值时,则将关联度小于阈值的知识图谱中的实体数据和关系数据关联更新至知识图谱中。
在其中一个实施例中,处理器执行该程序时实现利用损失函数,优化当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量得到当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量的步骤可以包括:采用当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量计算损失函数的值。当损失函数的值不小于阈值时,则将当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量作为当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量。
在其中一个实施例中,处理器执行程序时还可以实现以下步骤:当损失函数的值小于阈值时,则步骤A:根据当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量计算当前梯度。步骤B:根据预设的距离系数、预设的调整参数以及所计算的当前梯度更新当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量。步骤C:根据更新后的当前实体数据关系单位矩阵、更新后的当前实体数据向量与更新后的当前关系数据向量计算损失函数的值。当损失函数的值小于阈值时,则重复上述步骤A、步骤B与步骤C,直至损失函数的值不小于阈值时,则将更新后的当前实体数据关系单位矩阵、更新后的当前实体数据向量与更新后的当前关系数据向量作为当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量。
上述关于计算机设备的具体限定可以参见上文中关于知识图谱建立方法的限定,在此不再赘述。
在其中一个实施例中,请继续参见图5,提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:将知识图谱中的当前实体数据按照向量的形式表示,生成当前实体数据向量,将知识图谱中的当前关系数据按照向量的形式表示,生成当前关系数据向量。根据当前实体数据向量与当前关系数据向量计算当前实体数据关系单位矩阵。采用当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量,建立损失函数。利用损失函数,优化当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量得到当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量。采用当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量更新知识图谱。
在其中一个实施例中,该程序被处理器执行时所实现的将知识图谱中的当前实体数据按照向量的形式表示,生成当前实体数据向量,将知识图谱中的当前关系数据按照向量的形式表示,生成当前关系数据向量的步骤可以包括:根据知识图谱中的实体数据的数量获取当前实体数据向量的维度,根据知识图谱中关系数据的数量获取当前关系数据向量的维度。根据当前实体数据向量的维度以及当前实体数据生成当前实体数据向量中每个维度的元素得到当前初始实体数据向量。根据当前关系数据向量的维度以及当前关系数据生成当前关系数据向量中每个维度的元素得到当前初始关系数据向量。将当前初始实体数据向量归一化处理得到当前实体数据向量。将当前初始关系数据向量归一化处理得到当前关系数据向量。
在其中一个实施例中,该程序被处理器执行时所实现的根据当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量,建立损失函数的步骤可以包括:根据当前实体数据关系单位矩阵、当前实体数据向量和当前关系数据向量,建立第一打分函数。根据知识图谱中的另一实体数据生成替换当前实体数据向量,根据替换实体数据向量、当前实体数据关系单位矩阵和当前关系数据向量,建立第二打分函数。根据第一打分函数与第二打分函数,建立损失函数。
在其中一个实施例中,该程序被处理器执行时所实现的采用当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量更新知识图谱的步骤可以包括:通过第一打分函数,计算当前实体数据关系矩阵、与优化后的当前实体数据向量对应的知识图谱中的实体数据、与优化后的当前关系数据向量对应的知识图谱中的关系数据的关联度。当关联度小于阈值时,则将关联度小于阈值的知识图谱中的实体数据和关系数据关联更新至知识图谱中。
在其中一个实施例中,该程序被处理器执行时实现利用损失函数,优化当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量得到当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量的步骤可以包括:采用当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量计算损失函数的值。当损失函数的值不小于阈值时,则将当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量作为当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量。
在其中一个实施例中,该程序被处理器执行时还可以实现以下步骤:当损失函数的值小于阈值时,则步骤A:根据当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量计算当前梯度。步骤B:根据预设的距离系数、预设的调整参数以及所计算的当前梯度更新当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量。步骤C:根据更新后的当前实体数据关系单位矩阵、更新后的当前实体数据向量与更新后的当前关系数据向量计算损失函数的值。当损失函数的值小于阈值时,则重复上述步骤A、步骤B与步骤C,直至损失函数的值不小于阈值时,则将更新后的当前实体数据关系单位矩阵、更新后的当前实体数据向量与更新后的当前关系数据向量作为当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量。
上述关于存储介质的具体限定可以参见上文中关于知识图谱处理方法的限定,在此不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,计算机可读取的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种知识图谱处理方法,其特征在于,所述方法包括:
将知识图谱中的当前实体数据按照向量的形式表示,生成当前实体数据向量,将知识图谱中的当前关系数据按照向量的形式表示,生成当前关系数据向量;
根据所述当前实体数据向量与所述当前关系数据向量计算当前实体数据关系单位矩阵;
采用所述当前实体数据关系单位矩阵、所述当前实体数据向量与所述当前关系数据向量,建立损失函数;
利用所述损失函数,优化所述当前实体数据关系单位矩阵、所述当前实体数据向量与所述当前关系数据向量得到当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量;
采用所述当前实体数据关系矩阵、所述优化后的当前实体数据向量与所述优化后的当前关系数据向量更新所述知识图谱。
2.根据权利要求1所述的方法,其特征在于,所述将知识图谱中的当前实体数据按照向量的形式表示,生成当前实体数据向量,将知识图谱中的当前关系数据按照向量的形式表示,生成当前关系数据向量的步骤,包括:
根据知识图谱中的实体数据的数量获取所述当前实体数据向量的维度,根据所述知识图谱中关系数据的数量获取所述当前关系数据向量的维度;
根据所述当前实体数据向量的维度以及所述当前实体数据生成所述当前实体数据向量中每个维度的元素得到当前初始实体数据向量;
根据所述当前关系数据向量的维度以及所述当前关系数据生成所述当前关系数据向量中每个维度的元素得到当前初始关系数据向量;
将所述当前初始实体数据向量归一化处理得到所述当前实体数据向量;
将所述当前初始关系数据向量归一化处理得到所述当前关系数据向量。
3.根据权利要求1所述的方法,其特征在于,所述根据所述当前实体数据关系单位矩阵、所述当前实体数据向量与所述当前关系数据向量,建立损失函数的步骤,包括:
根据所述当前实体数据关系单位矩阵、所述当前实体数据向量和所述当前关系数据向量,建立第一打分函数;
根据所述知识图谱中的另一实体数据生成替换所述当前实体数据向量,根据所述替换实体数据向量、所述当前实体数据关系单位矩阵和所述当前关系数据向量,建立第二打分函数;
根据所述第一打分函数与所述第二打分函数,建立所述损失函数。
4.根据权利要求3所述的方法,其特征在于,所述采用所述当前实体数据关系矩阵、所述优化后的当前实体数据向量与所述优化后的当前关系数据向量更新所述知识图谱的步骤,包括:
通过所述第一打分函数,计算所述当前实体数据关系矩阵、与所述优化后的当前实体数据向量对应的知识图谱中的实体数据、与所述优化后的当前关系数据向量对应的所述知识图谱中的关系数据的关联度;
当所述关联度小于阈值时,则将关联度小于阈值的所述知识图谱中的实体数据和所述关系数据关联更新至所述知识图谱中。
5.根据权利要求1所述的方法,其特征在于,所述利用所述损失函数,优化所述当前实体数据关系单位矩阵、所述当前实体数据向量与所述当前关系数据向量得到当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量的步骤,包括:
采用所述当前实体数据关系单位矩阵、所述当前实体数据向量与所述当前关系数据向量计算所述损失函数的值;
当所述损失函数的值不小于阈值时,则将所述当前实体数据关系单位矩阵、所述当前实体数据向量与所述当前关系数据向量作为所述当前实体数据关系矩阵、所述优化后的当前实体数据向量与所述优化后的当前关系数据向量。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
当所述损失函数的值小于阈值时,则步骤A:根据当前实体数据关系单位矩阵、当前实体数据向量与当前关系数据向量计算当前梯度;
步骤B:根据预设的距离系数、预设的调整参数以及所计算的当前梯度更新所述当前实体数据关系单位矩阵、所述当前实体数据向量与所述当前关系数据向量;
步骤C:根据更新后的所述当前实体数据关系单位矩阵、更新后的所述当前实体数据向量与更新后的所述当前关系数据向量计算所述损失函数的值;
当所述损失函数的值小于所述阈值时,则重复上述步骤A、步骤B与步骤C,直至所述损失函数的值不小于阈值时,则将更新后的所述当前实体数据关系单位矩阵、更新后的所述当前实体数据向量与更新后的所述当前关系数据向量作为所述当前实体数据关系矩阵、所述优化后的当前实体数据向量与所述优化后的当前关系数据向量。
7.一种知识图谱处理装置,其特征在于,所述装置包括:
生成模块,用于将知识图谱中的当前实体数据按照向量的形式表示,生成当前实体数据向量,将知识图谱中的当前关系数据按照向量的形式表示,生成当前关系数据向量;
计算模块,用于根据所述当前实体数据向量与所述当前关系数据向量计算当前实体数据关系单位矩阵;
损失函数建立模块,用于采用所述当前实体数据关系单位矩阵、所述当前实体数据向量与所述当前关系数据向量,建立损失函数;
优化模块,用于利用所述损失函数,优化所述当前实体数据关系单位矩阵、所述当前实体数据向量与所述当前关系数据向量得到当前实体数据关系矩阵、优化后的当前实体数据向量与优化后的当前关系数据向量;
更新模块,用于采用所述当前实体数据关系矩阵、所述优化后的当前实体数据向量与所述优化后的当前关系数据向量更新所述知识图谱。
8.根据权利要求7所述的装置,其特征在于,所述生成模块包括:
获取单元,用于根据知识图谱中的实体数据的数量获取所述当前实体数据向量的维度,根据所述知识图谱中关系数据的数量获取所述当前关系数据向量的维度;
第一元素生成单元,用于根据所述当前实体数据向量的维度以及所述当前实体数据生成所述当前实体数据向量中每个维度的元素得到当前初始实体数据向量;
第二元素生成单元,用于根据所述当前关系数据向量的维度以及所述当前关系数据生成所述当前关系数据向量中每个维度的元素得到当前初始关系数据向量;
第一处理单元,用于将所述当前初始实体数据向量归一化处理得到所述当前实体数据向量;
第二处理单元,用于将所述当前初始关系数据向量归一化处理得到所述当前关系数据向量。
9.一种计算机设备,其特征在于,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任意一项所述方法中的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6任意一项所述方法中的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711116399.XA CN107943874B (zh) | 2017-11-13 | 2017-11-13 | 知识图谱处理方法、装置、计算机设备及存储介质 |
PCT/CN2018/077054 WO2019091019A1 (zh) | 2017-11-13 | 2018-02-23 | 知识图谱处理方法、装置、计算机设备及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711116399.XA CN107943874B (zh) | 2017-11-13 | 2017-11-13 | 知识图谱处理方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107943874A true CN107943874A (zh) | 2018-04-20 |
CN107943874B CN107943874B (zh) | 2019-08-23 |
Family
ID=61934912
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711116399.XA Active CN107943874B (zh) | 2017-11-13 | 2017-11-13 | 知识图谱处理方法、装置、计算机设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN107943874B (zh) |
WO (1) | WO2019091019A1 (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108563780A (zh) * | 2018-04-25 | 2018-09-21 | 北京比特智学科技有限公司 | 课程内容推荐方法和装置 |
CN109524065A (zh) * | 2018-11-07 | 2019-03-26 | 平安医疗健康管理股份有限公司 | 医疗数据查询方法、医疗数据平台及相关装置 |
CN109597856A (zh) * | 2018-12-05 | 2019-04-09 | 北京知道创宇信息技术有限公司 | 一种数据处理方法、装置、电子设备及存储介质 |
CN109829072A (zh) * | 2018-12-26 | 2019-05-31 | 深圳云天励飞技术有限公司 | 构建图谱方法及相关装置 |
CN109885692A (zh) * | 2019-01-11 | 2019-06-14 | 平安科技(深圳)有限公司 | 知识数据存储方法、装置、计算机设备和存储介质 |
CN110110155A (zh) * | 2019-04-03 | 2019-08-09 | 中国人民解放军战略支援部队信息工程大学 | 基于元社会关系圈的人物知识图谱属性获取方法及装置 |
CN110275962A (zh) * | 2019-06-25 | 2019-09-24 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN110866124A (zh) * | 2019-11-06 | 2020-03-06 | 北京诺道认知医学科技有限公司 | 基于多数据源的医学知识图谱融合方法及装置 |
CN110879853A (zh) * | 2018-09-06 | 2020-03-13 | 腾讯科技(深圳)有限公司 | 信息向量化方法与计算机可读存储介质 |
CN111061754A (zh) * | 2019-12-10 | 2020-04-24 | 北京明略软件系统有限公司 | 一种家族图谱的确定方法、装置、电子设备及存储介质 |
WO2021051630A1 (zh) * | 2019-09-19 | 2021-03-25 | 平安科技(深圳)有限公司 | 基于数据关系分析的知识融合方法、装置、计算机设备和存储介质 |
CN112599213A (zh) * | 2021-03-04 | 2021-04-02 | 联仁健康医疗大数据科技股份有限公司 | 一种分类编码确定方法、装置、设备及存储介质 |
WO2021072891A1 (zh) * | 2019-10-18 | 2021-04-22 | 平安科技(深圳)有限公司 | 知识图谱的关系对齐方法、装置、设备及存储介质 |
WO2021212683A1 (zh) * | 2020-04-24 | 2021-10-28 | 平安国际智慧城市科技股份有限公司 | 基于法律知识图谱的查询方法、装置、电子设备及介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105630901A (zh) * | 2015-12-21 | 2016-06-01 | 清华大学 | 一种知识图谱表示学习方法 |
CN106355627A (zh) * | 2015-07-16 | 2017-01-25 | 中国石油化工股份有限公司 | 一种用于生成知识图谱的方法及系统 |
CN106503035A (zh) * | 2016-09-14 | 2017-03-15 | 海信集团有限公司 | 一种知识图谱的数据处理方法和装置 |
CN106528609A (zh) * | 2016-09-28 | 2017-03-22 | 厦门理工学院 | 一种向量约束嵌入转换的知识图谱推理方法 |
CN106844658A (zh) * | 2017-01-23 | 2017-06-13 | 中山大学 | 一种中文文本知识图谱自动构建方法及系统 |
CN106909622A (zh) * | 2017-01-20 | 2017-06-30 | 中国科学院计算技术研究所 | 知识图谱向量表示方法、知识图谱关系推理方法及系统 |
US9697192B1 (en) * | 2013-06-28 | 2017-07-04 | Digital Reasoning Systems, Inc. | Systems and methods for construction, maintenance, and improvement of knowledge representations |
CN106934042A (zh) * | 2017-03-16 | 2017-07-07 | 中国人民解放军国防科学技术大学 | 一种知识图谱表示模型及其方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106528610A (zh) * | 2016-09-28 | 2017-03-22 | 厦门理工学院 | 一种基于路径张量分解的知识图谱表示学习方法 |
-
2017
- 2017-11-13 CN CN201711116399.XA patent/CN107943874B/zh active Active
-
2018
- 2018-02-23 WO PCT/CN2018/077054 patent/WO2019091019A1/zh active Application Filing
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9697192B1 (en) * | 2013-06-28 | 2017-07-04 | Digital Reasoning Systems, Inc. | Systems and methods for construction, maintenance, and improvement of knowledge representations |
CN106355627A (zh) * | 2015-07-16 | 2017-01-25 | 中国石油化工股份有限公司 | 一种用于生成知识图谱的方法及系统 |
CN105630901A (zh) * | 2015-12-21 | 2016-06-01 | 清华大学 | 一种知识图谱表示学习方法 |
CN106503035A (zh) * | 2016-09-14 | 2017-03-15 | 海信集团有限公司 | 一种知识图谱的数据处理方法和装置 |
CN106528609A (zh) * | 2016-09-28 | 2017-03-22 | 厦门理工学院 | 一种向量约束嵌入转换的知识图谱推理方法 |
CN106909622A (zh) * | 2017-01-20 | 2017-06-30 | 中国科学院计算技术研究所 | 知识图谱向量表示方法、知识图谱关系推理方法及系统 |
CN106844658A (zh) * | 2017-01-23 | 2017-06-13 | 中山大学 | 一种中文文本知识图谱自动构建方法及系统 |
CN106934042A (zh) * | 2017-03-16 | 2017-07-07 | 中国人民解放军国防科学技术大学 | 一种知识图谱表示模型及其方法 |
Non-Patent Citations (2)
Title |
---|
ANTOINE BORDES ET AL.: ""Translating Embeddings for Modeling"", 《ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS 26》 * |
GUOLIANG JI ET AL.: ""Knowledge Graph Embedding via Dynamic Mapping Matrix"", 《2015 ASSOCIATION FOR COMPUTATIONAL LINGUISTICS》 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108563780A (zh) * | 2018-04-25 | 2018-09-21 | 北京比特智学科技有限公司 | 课程内容推荐方法和装置 |
CN110879853A (zh) * | 2018-09-06 | 2020-03-13 | 腾讯科技(深圳)有限公司 | 信息向量化方法与计算机可读存储介质 |
CN110879853B (zh) * | 2018-09-06 | 2023-05-26 | 腾讯科技(深圳)有限公司 | 信息向量化方法与计算机可读存储介质 |
CN109524065A (zh) * | 2018-11-07 | 2019-03-26 | 平安医疗健康管理股份有限公司 | 医疗数据查询方法、医疗数据平台及相关装置 |
CN109597856A (zh) * | 2018-12-05 | 2019-04-09 | 北京知道创宇信息技术有限公司 | 一种数据处理方法、装置、电子设备及存储介质 |
CN109829072A (zh) * | 2018-12-26 | 2019-05-31 | 深圳云天励飞技术有限公司 | 构建图谱方法及相关装置 |
CN109885692A (zh) * | 2019-01-11 | 2019-06-14 | 平安科技(深圳)有限公司 | 知识数据存储方法、装置、计算机设备和存储介质 |
CN109885692B (zh) * | 2019-01-11 | 2023-06-16 | 平安科技(深圳)有限公司 | 知识数据存储方法、装置、计算机设备和存储介质 |
CN110110155B (zh) * | 2019-04-03 | 2021-01-26 | 中国人民解放军战略支援部队信息工程大学 | 基于元社会关系圈的人物知识图谱属性获取方法及装置 |
CN110110155A (zh) * | 2019-04-03 | 2019-08-09 | 中国人民解放军战略支援部队信息工程大学 | 基于元社会关系圈的人物知识图谱属性获取方法及装置 |
CN110275962A (zh) * | 2019-06-25 | 2019-09-24 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN110275962B (zh) * | 2019-06-25 | 2021-07-20 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
WO2021051630A1 (zh) * | 2019-09-19 | 2021-03-25 | 平安科技(深圳)有限公司 | 基于数据关系分析的知识融合方法、装置、计算机设备和存储介质 |
WO2021072891A1 (zh) * | 2019-10-18 | 2021-04-22 | 平安科技(深圳)有限公司 | 知识图谱的关系对齐方法、装置、设备及存储介质 |
CN110866124A (zh) * | 2019-11-06 | 2020-03-06 | 北京诺道认知医学科技有限公司 | 基于多数据源的医学知识图谱融合方法及装置 |
CN110866124B (zh) * | 2019-11-06 | 2022-05-31 | 北京诺道认知医学科技有限公司 | 基于多数据源的医学知识图谱融合方法及装置 |
CN111061754A (zh) * | 2019-12-10 | 2020-04-24 | 北京明略软件系统有限公司 | 一种家族图谱的确定方法、装置、电子设备及存储介质 |
WO2021212683A1 (zh) * | 2020-04-24 | 2021-10-28 | 平安国际智慧城市科技股份有限公司 | 基于法律知识图谱的查询方法、装置、电子设备及介质 |
CN112599213A (zh) * | 2021-03-04 | 2021-04-02 | 联仁健康医疗大数据科技股份有限公司 | 一种分类编码确定方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2019091019A1 (zh) | 2019-05-16 |
CN107943874B (zh) | 2019-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107943874A (zh) | 知识图谱处理方法、装置、计算机设备及存储介质 | |
CN110222831A (zh) | 深度学习模型的鲁棒性评估方法、装置及存储介质 | |
CN105279554B (zh) | 基于哈希编码层的深度神经网络的训练方法及装置 | |
CN113642659B (zh) | 一种训练样本集生成的方法、装置、电子设备及存储介质 | |
CN104142969B (zh) | 数据分块的处理方法和装置 | |
CN104317894A (zh) | 样本标注的确定方法和装置 | |
CN109886554A (zh) | 违规行为判别方法、装置、计算机设备和存储介质 | |
CN111310918B (zh) | 一种数据处理方法、装置、计算机设备及存储介质 | |
CN113254549A (zh) | 人物关系挖掘模型的训练方法、人物关系挖掘方法及装置 | |
EP4302276A1 (en) | Method and system for generating in-game insights | |
CN110705045A (zh) | 一种利用网络拓扑特性构建加权网络的链路预测方法 | |
CN115510042A (zh) | 基于生成对抗网络的电力系统负荷数据填补方法及装置 | |
CN108320026A (zh) | 机器学习模型训练方法和装置 | |
CN109388778A (zh) | 一种迭代容积点无迹卡尔曼滤波方法 | |
US9674083B2 (en) | Path calculation order deciding method, program and calculating apparatus | |
CN112949748A (zh) | 基于图神经网络的动态网络异常检测算法模型 | |
CN106802958B (zh) | Cad数据到gis数据的转换方法及系统 | |
CN109657268A (zh) | 一种基于特征值的不确定网络中免疫策略设计方法 | |
JP2020046891A (ja) | 予測プログラム、予測方法および学習装置 | |
CN109121133B (zh) | 一种位置隐私保护方法及装置 | |
CN110209780A (zh) | 一种问题模板生成方法、装置、服务器及存储介质 | |
CN115455457B (zh) | 基于智慧大数据的链数据管理方法、系统和存储介质 | |
CN117134958A (zh) | 用于网络技术服务的信息处理方法及系统 | |
CN113472515B (zh) | 一种用于检验用户防御侧信道攻击能力的方法 | |
US20160292300A1 (en) | System and method for fast network queries |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |