CN111291196A - 知识图谱的完善方法及装置、数据处理方法及装置 - Google Patents

知识图谱的完善方法及装置、数据处理方法及装置 Download PDF

Info

Publication number
CN111291196A
CN111291196A CN202010076738.1A CN202010076738A CN111291196A CN 111291196 A CN111291196 A CN 111291196A CN 202010076738 A CN202010076738 A CN 202010076738A CN 111291196 A CN111291196 A CN 111291196A
Authority
CN
China
Prior art keywords
knowledge
graph
similarity
attribute
combined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010076738.1A
Other languages
English (en)
Other versions
CN111291196B (zh
Inventor
黄引刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010076738.1A priority Critical patent/CN111291196B/zh
Publication of CN111291196A publication Critical patent/CN111291196A/zh
Application granted granted Critical
Publication of CN111291196B publication Critical patent/CN111291196B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0206Price or cost determination based on market factors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Technology Law (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Animal Behavior & Ethology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种知识图谱的完善方法及装置、数据处理方法及装置,该知识图谱的完善方法通过服务器接收计算设备发送的用于获取目标对象的知识图谱的请求;根据请求在知识图谱集合中获取目标对象的组合知识图谱,目标对象的组合知识图谱包括目标对象的属性和目标对象关联的对象,知识图谱集合包括至少一个对象的组合知识图谱,组合知识图谱是由至少两个知识图谱合成的,至少两个知识图谱为同一个对象的知识图谱;向计算设备发送目标对象的组合知识图谱。由此可知,知识图谱集合由服务器不断的、自动的根据多个知识图谱合成,可以全面的、实时的更新多个对象的组合知识图谱构成的知识图谱集合。

Description

知识图谱的完善方法及装置、数据处理方法及装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种知识图谱的完善方法及装置、数据处理方法及装置。
背景技术
知识图谱用于描述实体的属性和实体之间的联系。随着计算机科学的发展,人工智能领域的兴起,知识图谱的应用也越发广泛。传统的建立人物知识图谱的方法,即手工构建人物之间的关系,或者直接从网络平台,例如,维基百科、百度百科等,爬取人工编辑好的人物关系知识图谱,难免存在如下问题:首先,人物知识图谱不全面,一般只有部分公众人物的信息;其次,人工构建知识图谱时效性低。因此,如何获取到全面的、时效性高的人物知识图谱成为目前亟待解决的问题。
发明内容
本发明实施例提供了一种知识图谱的完善方法及装置、数据处理方法及装置,可以提供一种自动基于社交网络的知识图谱完善现有知识图谱集合的方法,以实现全面的、时效性高的获取到人物的知识图谱。
第一方面,本发明实施例提供了一种知识图谱的完善方法,所述知识图谱的完善方法包括:
接收计算设备发送的用于获取目标对象的知识图谱的请求;
根据所述请求在知识图谱集合中获取所述目标对象的组合知识图谱,所述目标对象的组合知识图谱包括所述目标对象的属性和所述目标对象关联的对象,所述知识图谱集合包括至少一个对象的组合知识图谱,所述组合知识图谱是由至少两个知识图谱合成的,所述至少两个知识图谱为同一个对象的知识图谱;
向所述计算设备发送所述目标对象的组合知识图谱。
作为一种可能的实现方式,所述方法还包括:
在第一数据库中获取第一知识图谱,所述第一数据库包括N个对象的知识图谱,N为正整数;
从第二数据库中获取至少一个第二知识图谱,所述第一知识图谱和所述第二知识图谱均用于指示第一对象的属性和所述第一对象关联的对象,所述第一对象为所述N个对象中任意一个对象;
将所述第一知识图谱和所述至少一个第二知识图谱合成为所述第一对象的组合知识图谱。
作为一种可能的实现方式,所述第二数据库包括至少一个对象的知识图谱,所述至少一个对象中每一个对象的姓名与所述第一对象的姓名相同。
作为一种可能的实现方式,所述从第二数据库中获取至少一个第二知识图谱,包括:
在第二数据库中获取第二对象的知识图谱,所述第二数据库包括M个对象的知识图谱,M为正整数,所述第二对象为所述M个对象中一个对象;
在根据所述第一知识图谱和所述第二对象的知识图谱识别到所述第一对象和所述第二对象为同一对象时,确定所述第二对象的知识图谱为所述第二知识图谱。
作为一种可能的实现方式,所述第二对象的知识图谱包括所述第二对象的属性,所述方法还包括:
若所述第二对象的属性与所述第一对象的属性相同,则确定所述第一对象和所述第二对象为同一对象。
作为一种可能的实现方式,所述方法还包括:
确定所述第一对象分别与所述第二数据库中每一个对象的相似度,得到相似度集合;
在所述相似度集合中最大相似度大于第一阈值时,确定所述第二数据库中的所有对象中所述最大相似度对应的对象为所述第二对象;
在所述第二对象为所述最大的相似度对应的对象,确定所述第一对象和所述第二对象为同一对象。
作为一种可能的实现方式,第三对象为所述第二数据库中的所有对象中任意一个对象,所述第二数据库包括所述第三对象的知识图谱,所述第三对象的知识图谱包括所述第三对象的属性和所述第三对象关联的对象,所述确定所述第一对象分别与所述第二数据库中每一个对象的相似度包括确定所述第一对象与所述第三对象的相似度。
作为一种可能的实现方式,所述第一对象与所述第三对象的相似度是由所述第一对象的属性与所述第三对象的属性的相似度和所述第一对象关联的对象与所述第三对象关联的对象的相似度的加权求和得到的。
作为一种可能的实现方式,所述确定所述第一对象与所述第三对象的相似度,包括执行H次相似度计算,H为正整数,在第h次相似度计算中通过如下公式计算:
Figure BDA0002378457090000031
其中,i表示所述第一对象,j表示所述第三对象,simh(i,j)为第h次相似度计算得到计算结果;β为不大于1的正数;simh-1(i,j)为第h-1次相似度计算得到计算结果;t为所述第一对象关联的对象中对象的索引,t为不大于T的正整数,T为所述第一对象关联的对象的总个数,e为所述第三对象关联的对象中对象的索引,e为不大于E的正整数,E为所述第三对象关联的对象的总个数;simh-1(t,e)为第h-1次相似度计算得到对象t和对象e的相似度;在所述第一对象与所述对象t的关系与所述第三对象与所述对象e的关系相同时,f(ri,t,rj,e)=1;在所述第一对象与所述对象t的关系与所述第三对象与所述对象e的关系不同时,f(ri,t,rj,e)=0;pi,t为所述第一对象与所述对象t的关系的可信度,qj,e为所述第三对象与所述对象e的关系的可信度;h为正整数,h≤H;
第H次相似度计算得到结果为所述第一对象与所述第三对象的相似度。
作为一种可能的实现方式,所述第一知识图谱中所有属性和所述第二知识图谱中所有属性组成属性集合,属性a为所述属性集合中的任意一个属性,所述将所述第一知识图谱和所述至少一个第二知识图谱合成为所述第一对象的组合知识图谱,包括:
若所述第一知识图谱和所述第二知识图谱都包括所述属性a且所述第二知识图谱中所述属性a的可信度大于所述第一知识图谱中所述属性a的可信度,将所述第一知识图谱中所述属性a的属性值替换为所述第二知识图谱中所述属性a的属性值;或,
若所述第一知识图谱不包括所述属性a且所述第二知识图谱包括所述属性a,在所述第一知识图谱中增加所述第二知识图谱中所述属性a的属性值。
作为一种可能的实现方式,对象b为所述第二知识图谱中所有关联对象中的任意一个对象,所述将所述第一知识图谱和所述至少一个第二知识图谱合成为所述第一对象的组合知识图谱,包括:
若所述第一知识图谱不包括所述对象b且所述第二知识图谱都包括所述对象b,在所述第一知识图谱中增加所述第二知识图谱中所述对象b。
第二方面,本发明实施例提供一种数据处理方法,所述方法包括:
接收终端发送的第一请求,所述第一请求用于向计算设备请求目标对象的信息;
根据所述第一请求,获取所述目标对象的组合知识图谱;
根据所述组合知识图谱向所述目标对象发送目标信息;
其中,所述目标对象的组合知识图谱是通过如权第一方面所述的任意一种知识图谱的完善方法得到的。
第三方面,本发明实施例提供一种知识图谱的完善装置,所述装置包括:
接收单元,用于接收计算设备发送的用于获取目标对象的知识图谱的请求;
第一获取单元,用于根据所述请求在知识图谱集合中获取所述目标对象的组合知识图谱,所述目标对象的组合知识图谱包括所述目标对象的属性和所述目标对象关联的对象,所述知识图谱集合包括至少一个对象的组合知识图谱,所述组合知识图谱是由至少两个知识图谱合成的,所述至少两个知识图谱为同一个对象的知识图谱;
发送单元,用于向所述计算设备发送所述目标对象的组合知识图谱。
作为一种可能的实现方式,所述装置还包括:
第二获取单元,用于在第一数据库中获取第一知识图谱,所述第一数据库包括N个对象的知识图谱,N为正整数;
第三获取单元,用于从第二数据库中获取至少一个第二知识图谱,所述第一知识图谱和所述第二知识图谱均用于指示第一对象的属性和所述第一对象关联的对象,所述第一对象为所述N个对象中任意一个对象;
合成单元,用于将所述第一知识图谱和所述至少一个第二知识图谱合成为所述第一对象的组合知识图谱。
作为一种可能的实现方式,所述第二数据库包括至少一个对象的知识图谱,所述至少一个对象中每一个对象的姓名与所述第一对象的姓名相同。
作为一种可能的实现方式,所述第三获取单元从第二数据库中获取至少一个第二知识图谱,包括:
在第二数据库中获取第二对象的知识图谱,所述第二数据库包括M个对象的知识图谱,M为正整数,所述第二对象为所述M个对象中一个对象;
在根据所述第一知识图谱和所述第二对象的知识图谱识别到所述第一对象和所述第二对象为同一对象时,确定所述第二对象的知识图谱为所述第二知识图谱。
作为一种可能的实现方式,所述第二对象的知识图谱包括所述第二对象的属性,所述装置还包括:
确定单元,若所述第二对象的属性与所述第一对象的属性相同,则用于确定所述第一对象和所述第二对象为同一对象。
作为一种可能的实现方式,所述确定单元还用于:
确定所述第一对象分别与所述第二数据库中每一个对象的相似度,得到相似度集合;
在所述相似度集合中最大相似度大于第一阈值时,确定所述第二数据库中的所有对象中所述最大相似度对应的对象为所述第二对象;
在所述第二对象为所述最大的相似度对应的对象,确定所述第一对象和所述第二对象为同一对象。
作为一种可能的实现方式,第三对象为所述第二数据库中的所有对象中任意一个对象,所述第二数据库包括所述第三对象的知识图谱,所述第三对象的知识图谱包括所述第三对象的属性和所述第三对象关联的对象,所述确定单元确定所述第一对象分别与所述第二数据库中每一个对象的相似度包括确定所述第一对象与所述第三对象的相似度。
作为一种可能的实现方式,所述第一对象与所述第三对象的相似度是由所述第一对象的属性与所述第三对象的属性的相似度和所述第一对象关联的对象与所述第三对象关联的对象的相似度的加权求和得到的。
作为一种可能的实现方式,所述确定单元确定所述第一对象与所述第三对象的相似度,包括执行H次相似度计算,H为正整数,在第h次相似度计算中通过如下公式计算:
Figure BDA0002378457090000061
其中,i表示所述第一对象,j表示所述第三对象,simh(i,j)为第h次相似度计算得到计算结果;β为不大于1的正数;simh-1(i,j)为第h-1次相似度计算得到计算结果;t为所述第一对象关联的对象中对象的索引,t为不大于T的正整数,T为所述第一对象关联的对象的总个数,e为所述第三对象关联的对象中对象的索引,e为不大于E的正整数,E为所述第三对象关联的对象的总个数;simh-1(t,e)为第h-1次相似度计算得到对象t和对象e的相似度;在所述第一对象与所述对象t的关系与所述第三对象与所述对象e的关系相同时,f(ri,t,rj,e)=1;在所述第一对象与所述对象t的关系与所述第三对象与所述对象e的关系不同时,f(ri,t,rj,e)=0;pi,t为所述第一对象与所述对象t的关系的可信度,qj,e为所述第三对象与所述对象e的关系的可信度;h为正整数,h≤H;
第H次相似度计算得到结果为所述第一对象与所述第三对象的相似度。
作为一种可能的实现方式,所述第一知识图谱中所有属性和所述第二知识图谱中所有属性组成属性集合,属性a为所述属性集合中的任意一个属性,所述合成单元将所述第一知识图谱和所述至少一个第二知识图谱合成为所述第一对象的组合知识图谱,包括:
若所述第一知识图谱和所述第二知识图谱都包括所述属性a且所述第二知识图谱中所述属性a的可信度大于所述第一知识图谱中所述属性a的可信度,将所述第一知识图谱中所述属性a的属性值替换为所述第二知识图谱中所述属性a的属性值;或,
若所述第一知识图谱不包括所述属性a且所述第二知识图谱包括所述属性a,在所述第一知识图谱中增加所述第二知识图谱中所述属性a的属性值。
作为一种可能的实现方式,对象b为所述第二知识图谱中所有关联对象中的任意一个对象,所述合成单元将所述第一知识图谱和所述至少一个第二知识图谱合成为所述第一对象的组合知识图谱,包括:
若所述第一知识图谱不包括所述对象b且所述第二知识图谱都包括所述对象b,在所述第一知识图谱中增加所述第二知识图谱中所述对象b。
第四方面,本发明实施例提供一种数据处理的装置,所述装置包括:
接收单元,用于接收终端发送的第一请求,所述第一请求用于向计算设备请求目标对象的信息;
获取单元,用于根据所述第一请求,获取所述目标对象的组合知识图谱;
发送单元,用于根据所述组合知识图谱向所述目标对象发送目标信息;
其中,所述目标对象的组合知识图谱是通过如第一方面所述的任意一种知识图谱的完善方法得到的。
第五方面,本申请实施例提供了一种知识图谱的完善装置,该知识图谱的完善装置包括处理器和存储器,所述处理器和存储器耦合,其中,所述存储器用于存储计算机指令,所述处理器用于执行所述计算机指令,调用所述程序代码,以实现第一方面的实施例所公开的知识图谱的完善方法。
第六方面,本申请实施例提供了一种数据处理的装置,该数据处理的装置包括处理器和存储器,所述处理器和存储器耦合,其中,所述存储器用于存储计算机指令,所述处理器用于执行所述计算机指令,调用所述程序代码,以实现第二方面的实施例所公开的数据处理的方法。
第七方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,当所述计算机程序被计算机设备运行时,实现第一方面的实施例所公开的知识图谱的完善方法。
第八方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,当所述计算机程序被计算机设备运行时,实现第二方面的实施例所公开的数据处理的方法。
第九方面,本申请实施例提供了一种计算机程序,当所述计算机程序被计算机设备运行时,实现第一方面的实施例所公开的知识图谱的完善方法。
第十方面,本申请实施例提供了一种计算机程序,当所述计算机程序被计算机设备运行时,实现第一方面的实施例所公开的数据处理的方法。
在本发明实施例中,服务器接收计算设备发送的用于获取目标对象的知识图谱的请求;服务器根据请求在知识图谱集合中获取目标对象的组合知识图谱,目标对象的组合知识图谱包括目标对象的属性和目标对象关联的对象,知识图谱集合包括至少一个对象的组合知识图谱,组合知识图谱是由至少两个知识图谱合成的,至少两个知识图谱为同一个对象的知识图谱;服务器向计算设备发送目标对象的组合知识图谱。由此可知,服务器用于获取目标对象的知识图谱的知识图谱集合,包括多个对象的组着知识图谱,每一个对象的组合知识图谱是服务器不断的自动根据多个知识图谱合成的,因此,可以全面的、实时的更新多个对象的组合知识图谱构成的知识图谱集合。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种完善知识图谱的系统架构示意图;
图2是本发明实施提供的一种知识图谱的完善方法的流程示意图;
图3a是本发明实施例提供的一种完善第一对象的组合知识图谱的方法流程示意图;
图3b是本发明实施例示例性提供的一种待完善的知识图谱集合的示意图;
图3c是本发明实施例示例性提供的一种一个对象的知识图谱的示意图;
图3d为本发明实施例示例性提供的一种基于第二数据库形成的知识图谱的示意图;
图3e是本发明实施例提供的另一种基于第二数据库形成的知识图谱;
图3f是本发明实施例示例性的提供的一种组合知识图谱的示意图;
图4是本发明实施例示例性的给出的一种至少一个第二知识图谱的形成方式;
图5是本发明实施例提供的一种应用知识图谱集合的方法流程图;
图6是本发明实施例提出了一种知识图谱的完善装置600;
图7本发明实施例提出了的一种数据处理装置700;
图8是本发明实施例提供的又一种知识图谱的完善装置800的结构示意图;
图9是本发明实施例提供的又一种数据处理装置900的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
本申请实施例可以应用到自然语言处理领域。自然语言处理(Nature Languageprocessing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
本申请实施例还可以应用到大数据领域。大数据(Big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。随着云时代的来临,大数据也吸引了越来越多的关注,大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
需要说明的是,本申请实施例所指知识图谱为人物的知识图谱,每一个人物在知识图谱中可以作为一个对象,一个对象的知识图谱包括该对象的属性和该对象关联的对象。
需要说明的是,本申请实施例包括两个过程,一个过程是知识图谱集合的完善,一个过程是知识图谱集合的应用。在知识图谱集合的完善过程中,本申请实施例提出的知识图谱集合、组合知识图谱、对象的至少一个知识图谱三个概念之间的关系:知识图谱集合包括至少一个对象的组合知识图谱,一个对象的组合知识图谱是由一个对象的至少一个知识图谱合成的,一个对象的至少一个知识图谱是由多个社交网络平台提供的。在知识图谱集合的应用过程中,终端向服务器请求目标对象的知识图谱,得到的实际是知识图谱集合中目标对象的组合知识图谱,此时也称为目标对象的知识图谱。
为便于理解本申请实施例,下面先对本申请实施例所基于的一种知识图谱的完善方法的系统架构进行描述。请参阅图1,图1是本申请实施例提供的一种完善知识图谱的系统架构示意图,该系统架构示意图可以包括终端101、计算设备102、知识图谱服务器103和社交网络服务器104。
知识图谱服务器103存储知识图谱集合,知识图谱集合包括至少一个对象的组合知识图谱,对象的组合知识图谱包括该对象的属性和该对象关联的对象。知识图谱服务器103可以不断的从社交网络服务器104获取知识图谱,从而不断的更新和完善知识图谱服务器103中的知识图谱集合。知识图谱服务器103更新和完善知识图谱集合包括:匹配知识图谱集合中的对象与从社交网络服务器104获取到的知识图谱中的对象为同一对象之后,将从社交网络服务器104获取到的该对象的知识图谱合成到知识图谱集合中该对象的组合知识图谱中,从而实现知识图谱集合的不断完善。其中,社交网络服务器104包括至少一个社交网络的服务器,社交网络服务器104用于提供多个社交平台的知识图谱。例如,微信的服务器可以提供微信平台的知识图谱;微博的服务器可以提供微博平台的知识图谱。
终端101可以向计算设备102发送用于获取目标对象的信息的请求,计算设备102根据该请求可以从知识图谱服务器103中获取目标对象的组合知识图谱。计算设备102获取到目标对象的组合知识图谱后,可以根据目标对象的组合知识图谱中目标对象的属性和目标对象关联的对象获取目标对象的信息,并将目标对象的信息发送至终端101。在一种实现场景中,可以用于评估目标对象的信用额度。具体的,首先,终端101可以向计算设备102发送用于获取目标对象的信用额度的请求;其次,计算设备102接收到该请求之后,根据该请求从知识图谱服务器103获取目标对象的组合知识图谱;然后,计算设备102可以根据目标对象的组合知识图谱中与目标对象关联的对象的信用额度评估目标对象的信用额度,例如,计算目标对象关联的所有对象的信用额度的平均值作为目标对象的信用额度;最后,计算设备102将评估得到的目标对象的信用额度发送至终端101。终端101可以根据接收到的该信用额度提供该信用额度对应的资源给该目标对象。
在另一种实现场景中,可以用于评估目标对象购买保险产品的价格,或评估目标对象购买保险产品发生风险的概率来定位目标对象购买保险产品的价格。具体的,首先,终端101向计算设备102请求目标对象购买保险产品A的价格;其次,计算设备102根据该请求从知识图谱服务器103获取目标对象的组合知识图谱;然后,计算设备102根据该目标对象的组合知识图谱中目标对象的属性或目标对象关联的对象评估目标对象购买保险产品A的价格,例如,计算设备102可以根据目标对象关联的所有对象购买保险产品A的价格来评估目标对象购买保险产品A的价格,再例如,根据目标对象关联的所有对象购买的保险产品A发生风险的概率来评估目标对象购买保险产品A发生风险的概率,从而,根据目标对象购买保险产品A发生风险的概率来确定目标对象购买保险产品A的价格;最后,计算设备102将评估得到的目标对象购买保险产品A的价格发送至终端101,以使终端101根据接收到的该购买保险产品A的价格对目标对象定价。
计算设备102还可以主动获取目标对象的组合知识图谱,根据目标对象的组合知识图谱向终端101发送目标信息,此时,终端101为目标对象的终端。在一种实现场景中,计算设备102可以从知识图谱服务器103获取目标对象的组合知识图谱,根据目标对象的组合知识图谱分析得到目标对象感兴趣的目标信息,例如,根据目标对象的属性分析得到的目标信息;然后,计算设备102将目标信息发送至终端101,以使终端101可以接收到目标对象感兴趣的目标信息。例如,向目标对象推荐广告、电子读物等的应用中,计算设备102可以根据目标对象的组合知识图谱中目标对象的属性,向目标对象推荐与目标对象的属性相关的目标信息。
不限于图1所示的完善知识图谱的系统架构示意图,本申请实施例提供的完善知识图谱的系统架构图还可以包括其他设备,此处不做限定。
下面介绍本申请实施例涉及的两种方法。其中,实施例一介绍完善知识图谱的实现方法,实施例二介绍了应用知识图谱进行数据处理的实现方法。
实施例一:
基于上述的描述,本申请实施例提出一种知识图谱的完善方法,该知识图谱的完善方法可以由上述所提及的图1中完善知识图谱的系统执行。其中,终端可以是终端101,计算设备可以是计算设备102,服务器可以是知识图谱服务器103,社交网络服务器可以是社交网络服务器104。请参阅图2,图2为本发明实施提供的一种知识图谱的完善方法的流程示意图,该知识图谱的完善方法可以包括如下部分或全部步骤:
S200、计算设备向服务器发送的用于获取目标对象的知识图谱的请求。
S202、服务器接收上述请求。
服务器包括知识图谱集合,服务器可以不断的更新和完善知识图谱集合。当服务器接收到计算设备发送的用于获取目标对象的知识图谱的请求时,将最新的知识图谱集合中获取的目标对象的知识图谱发送至计算设备。
计算设备是指可以根据获取的目标对象的知识图谱分析获得目标对象的特征信息的设备,例如,根据目标对象关联的对象的特征来分析或评估目标对象的特征。应理解,计算设备可以是服务器、计算机、手机等设备,此处不做限定。
S204、服务器根据该请求在知识图谱集合中获取目标对象的组合知识图谱,该目标对象的组合知识图谱包括目标对象的属性和目标对象关联的对象,知识图谱集合包括至少一个对象的组合知识图谱,组合知识图谱是由至少两个知识图谱合成的,至少两个知识图谱为同一个对象的知识图谱。
在一种实现方式中,服务器根据该请求携带的目标对象,在知识图谱集合中查找目标对象,在查找到目标对象时,将知识图谱集合中目标对象的属性和目标对象关联的对象作为目标对象的组合知识图谱发送至计算设备。
S206、服务器向计算设备发送目标对象的组合知识图谱。
服务器向计算设备发送的目标对象的组合知识图谱即作为步骤S202中计算设备请求的目标对象的知识图谱。
步骤S204中服务器包括的知识图谱集合可以不断完善。知识图谱集合包括至少一个对象的组合知识图谱,通过不断完善知识图谱集合中每一个对象的组合知识图谱来完善该知识图谱集合。本申请实施例以完善第一对象的组合知识图谱为例来说明知识图谱集合的完善。如图3a所示,为本申请实施例提供的一种完善第一对象的组合知识图谱的方法流程示意图,该方法可以包括如下部分或全部步骤:
S302、服务器在第一数据库中获取第一知识图谱,第一数据库包括N个对象的知识图谱,N为正整数。
本申请实施例中,第一数据库指待完善的知识图谱集合包括的数据对应的数据库。第一数据库中的数据可视化后形成待完善的知识图谱集合,待完善的知识图谱集合包括N个对象。例如,请参阅图3b,图3b是本申请实施例示例性提供的一种待完善的知识图谱集合的示意图。如图3b所示,该待完善的知识图谱集合包括八个对象:i1、i2、i3、i4、i5、i6、i7。第一知识图谱用于指示第一对象的知识图谱,第一知识图谱包括第一对象的属性和第一对象关联的对象,第一对象是第一数据库中N个对象中的任意一个对象,即待完善的知识图谱集合中的任意一个对象。例如,第一对象可以为如图3b中的“i1”,那么,第一对象的知识图谱可以如图3c所示,图3c是本申请实施例示例性提供的一种一个对象的知识图谱的示意图,包括第一对象“i1”的属性:姓名、年龄、性别、学历;第一对象“i1”关联的对象:i3和i4。
S304、服务器从第二数据库中获取至少一个第二知识图谱,第一知识图谱和第二知识图谱均用于指示第一对象的属性和该第一对象关联的对象,第一对象为N个对象中任意一个对象。
本申请实施例中,第二数据库用于存储社交网络平台提供的知识图谱包括的数据,第二数据库中的数据可以包括一个或多个社交网络平台提供的知识图谱对应的数据,第二数据库包括至少一个对象。社交网络平台可以指微博、微信、QQ等社交平台。第二数据库中的数据形成社交网络平台的知识图谱。例如,请参阅图3d,图3d为本申请实施例示例性提供的一种基于第二数据库形成的知识图谱的示意图,如图3d所示,第二数据库形成的知识图谱包括两个知识图谱:知识图谱1和知识图谱2,知识图谱1和知识图谱2是两个不同的社交平台提供的数据。由图3d可知,知识图谱1包括对象j1、j2、j4和j5,知识图谱2包括对象j3、j6和j7。
第二知识图谱是指第二数据库中与第一对象为同一对象的对象对应的知识图谱。当服务器匹配到第二数据库中的一个对象与第一对象为同一对象时,那么这个第二数据库中的对象对应的知识图谱即为一个第二知识图谱。因为第二数据库中的数据可以来自不同的社交网络平台,因此,在第二数据库中可以存在一个或多个与第一对象为同一对象的对象,从而,第二数据库中可以存在一个或多个第二知识图谱。其中,服务器从第二数据库中获取至少一个第二知识图谱的实现方式,即服务器匹配第一对象与第二数据库中的对象是否为同一对象可以具体参见下述步骤S402-S404。
可选地,第二数据库中的至少一个对象也可以是从一个或多个社交网络平台提供的数据中筛选出来的与第一对象姓名相同的对象的数据。例如,上述第一对象为“小王”时,第二数据库中的数据也可以是从一个或多个社交网络平台提供的数据中筛选的对象“小王”的信息。请参阅图3e,图3e是本申请实施例提供的另一种基于第二数据库形成的知识图谱,如图3e所示,姓名为“小王”的对象包括对象j1和对象j3,对象j1和对象j3的知识图谱如图3e所示,对象j1和对象j3来自不同的社交网络平台。
上述第二数据库包括的数据:第二数据库包括的数据为与第一对象姓名相同的对象的数据与第二数据库包括社交网络平台提供的所有对象的数据比较而言,服务器在匹配第一对象与第二数据库中的对象是否为同一对象的过程中,可以减少大量的数据计算,在一定程度上提高数据处理的效率。
S306、服务器将第一知识图谱和至少一个第二知识图谱合成为第一对象的组合知识图谱。
本申请实施例以第一知识图谱与一个第二知识图谱合成为例说明合成组合知识图谱的实现方式:第一知识图谱中所有属性和第二知识图谱中所有属性组成属性集合,属性a为属性集合中的任意一个属性,将第一知识图谱和第二知识图谱合成为一个组合知识图谱,包括:第一种情况,若第一知识图谱和第二知识图谱都包括属性a且第二知识图谱中属性a的可信度大于第一知识图谱中所述属性a的可信度,将第一知识图谱中属性a的属性值替换为第二知识图谱中属性a的属性值。其中,可信度是指属性值为真的程度,每一个属性值的可信程度可以预先设定。例如,若第一对象为上述图3c中的“i1”,服务器判断出第二数据库中的“j1”与“i1”为同一对象。“i1”和“j1”的属性集合包括“姓名、年龄、性别、学历、职业”。若“j1”的“年龄”的可信度大于“i1”的“年龄”的可信度,那么将“i1”的“年龄”的属性值替换成“23岁”。第二种情况,若第一知识图谱不包括属性a且第二知识图谱都包括属性a,在第一知识图谱中增加第二知识图谱中属性a的属性值。例如,“j1”的“职业”属性值为“教师”,“i1”无“职业”属性,则将“职业”为“教师”的属性值增加到“i1”的属性中。第三种情况,若第一知识图谱中的第一对象包括属性a,第二知识图谱中的第二对象不包括属性a,则保留第一知识图谱中的第一对象的属性a。例如,“i1”的属性“性别”的可信度大于“j1”的属性“性别”的可信度,那么保留“i1”的属性“性别”的属性值不变。
可选地,在一些实现方式中,若第一知识图谱不包括对象b且第二知识图谱包括对象b,在第一知识图谱中增加第二知识图谱中的对象b。例如,“j1”的知识图谱包括对象“j2”,“i1”的知识图谱不包括对象“j2”,那么,将“j1”的知识图谱中的对象“j2”添加到“i1”的知识图谱中。最终,对象“i1”与“j1”的合成的组合知识图谱如图3f所示,图3f为本申请实施例示例性的提供的一种组合知识图谱的示意图。
服务器按照上述实现方式将至少一个第二知识图谱中每一个第二知识图谱与第一知识图谱合成为组合知识图谱,至少一个第二知识图谱中所有知识图谱与第一对象的知识图谱即合成为第一对象的组合知识图谱。
下面介绍上述步骤S304中服务器从第二数据库中获取至少一个第二知识图谱的具体实现方式:
S402、服务器在第二数据库中获取第二对象的知识图谱,第二数据库包括M个对象的知识图谱,M为正整数,第二对象为M个对象中一个对象。
S404、服务器在根据第一知识图谱和第二对象的知识图谱识别到第一对象和第二对象为同一对象时,确定该第二对象的知识图谱为第二知识图谱。
下面介绍服务器根据第一知识图谱和第二对象的知识图谱识别第一对象和第二对象是否为同一对象的两种实现方式:
实现方式(一):
若第二对象的属性与第一对象的属性相同,则确定第一对象和第二对象为同一对象。
在实现方式(一)中服务器确定第一对象与第二对象为同一对象时,将该第一对象与该第二对象加入到集合Z1中。
例如,若第一对象为上述图3c中的“i1”,第一对象“i1”的属性:“姓名:小王”,“性别:男”,“学历:本科”,“年龄:24”;第二对象为上述图3e中的“j3”,第二对象“j3”的属性:“姓名:小王”,“性别:男”,“学历:本科”,“年龄:24”。则服务器判断第一对象“i1”和第二对象“j3”为同一对象。则Z1集合中包括{<i1,j3>}。
实现方式(二):
S502、服务器确定第一对象分别与第二数据库中每一个对象的相似度,得到相似度集合。
S504、服务器在相似度集合中的最大相似度大于第一阈值时,确定第二数据库中的所有对象中最大相似度对应的对象为第二对象。
可选地,第一阈值可以根据实际情况预设。
S506、在第二对象为最大的相似度对应的对象时,服务器确定第一对象和第二对象为同一对象。
上述步骤S502中服务器确定第一对象分别与第二数据库中每一个对象的相似度可以包括如下两种实现方式:
确定第一对象与第二数据库中的每一个对象的相似度的实现方式,本申请实施例以第二数据库中包括与第一对象姓名相同的对象为例进行说明。第三对象为第二数据库中的所有对象中任意一个对象,第二数据库包括第三对象的知识图谱,第三对象的知识图谱包括第三对象的属性和第三对象关联的对象,确定第一对象分别与第二数据库中每一个对象的相似度包括确定第一对象与第三对象的相似度。
实现方式(1):
第一对象与第三对象的相似度是由第一对象的属性与第三对象的属性的相似度和第一对象关联的对象与第三对象关联的对象的相似度的加权求和得到的。第一对象与第三对象的相似度的计算公式如下:
sim(i,j)=alpha*node_sim(i,j)+(1-alpha)*edge_sim(i,j)
其中,i表示第一对象,j表示第三对象;sim(i,j)表示第一对象与第三对象的相似度;alpha为不大于1的正数;node_sim(i,j)表示第一对象的属性与第三对象的属性的相似度;edge_sim(i,j)表示第一对象关联的对象与第三对象关联的对象的相似度。
第一对象的属性与第三对象的属性的相似度可以通过属性相似度的加权和来衡量。在一种实现方式中,第一对象的属性与第三对象的属性的相似度node_sim(i,j)的计算公式可以表示为如下形式:
Figure BDA0002378457090000161
其中,M表示属性的总个数,M为正整数;k表示属性的索引,k为不大于M的正整数;wk表示属性k的权重,每一个属性的权重可以根据实际情况预先设定,不同的属性通过设定权重从而体现不同属性对相似度结果的贡献程度的不同;pi,k*qj,k用于表示第一对象的第k个属性与第三对象的第k个属性的相似度。在一种实现方式中,第一对象的第k个属性与第三对象的第k个属性的相似度,即pi,k*qj,k,可以通过余弦相似度计算。此时,pi,k表示第一对象i的属性k的向量,qj,k表示第三对象j的属性k的向量。
可选地,在计算第一对象与第三对象的相似度的过程中,还可以增加每一个属性的可信度来提高计算相似度的准确性。
可选地,不限于上述提出的计算第一对象的第k个属性与第三对象的第k个属性的相似度的实现方式,还可以采用其它计算相似度的方式,此处不做限定。
第一对象关联的对象与第三对象关联的对象的相似度可以通过计算第一对象关联的对象的关系结构与第三对象关联的对象的关系结构的相似度来衡量,在一些实现方式中,第一对象关联的对象与第三对象关联的对象的相似度edge_sim(i,j)的计算公式可以表示为如下形式:
Figure BDA0002378457090000171
其中,t为第一对象i关联的对象中对象的索引,t为不大于T的正整数,T为第一对象i关联的对象的总个数;e为第三对象关联的对象中对象的索引,e为不大于E的正整数,E为第三对象关联的对象的总个数。在第一对象i与对象t的关系与第三对象j与对象e的关系相同时,f(ri,t,rj,e)=1;在第一对象i与对象t的关系与第三对象j与对象e的关系不同时,f(ri,t,rj,e)=0。
可选地,pi,t可以为第一对象i与对象t的关系的可信度,qj,e可以为第三对象j与对象e的关系的可信度,此时,pi,t*qj,e可以表示第一对象i与对象t的关系与第三对象j与对象e的关系的总的可信程度。
可选地,pi,t*qj,e还可以用于表示第一对象i关联的对象t与第三对象j关联的对象e的相似度。其中,对象t与对象e的相似度可以参照上述方式获得。
可选的,pi,t*qj,e可以不是必须的。
根据上述实现方式(1)提供的相似度的计算方法,可以得到第一对象与第二数据库中的每一个对象的相似度,即相似度集合1。服务器从相似度集合1中获取最大相似度,与上述步骤S504中第一阈值进行比较,当最大相似度大于第一阈值时,将最大相似度对应的对象与第一对象加入到集合Z2中。
实现方式(2):
确定第一对象与第三对象的相似度,还可以通过迭代计算对象关联的对象的相似度来确定第一对象与第三对象的相似度。例如,请参阅图3c和图3e,若第一对象为“i1”,第三对象为“j1”,那么,比较对象i1和对象j1的相似度:首先,计算对象i1和j1的相似度;其次,计算对象i1关联的对象i3和i4分别与对象j1关联的对象j2和j4的相似度;然后,计算i3和i4关联的对象与j2和j4关联的对象的相似度。按照上述方式,不断延伸对象关联的对象的相似度,从而迭代计算第一对象与第三对象的相似度,可以更加精准确定对象之间的相似度,从而,提高对象匹配的准确率。
下面介绍确定第一对象与第三对象的相似度的计算公式,包括执行H次相似度计算,H为正整数,在第h次相似度计算中通过如下公式计算:
Figure BDA0002378457090000181
其中,i表示所述第一对象,j表示所述第三对象,simh(i,j)为第h次相似度计算得到计算结果,β为不大于1的正数,simh-1(i,j)为第h-1次相似度计算得到计算结果;t为第一对象关联的对象中对象的索引,t为不大于T的正整数,T为第三对象关联的对象的总个数,e为第三对象关联的对象中对象的索引,e为不大于E的正整数,E为第三对象关联的对象的总个数;simh-1(t,e)为第h-1次相似度计算得到对象t和对象e的相似度;在第一对象与对象t的关系与第三对象与对象e的关系相同时,f(ri,t,rj,e)=1;在第一对象与对象t的关系与第三对象与对象e的关系不同时,f(ri,t,rj,e)=0;pi,t为第一对象与对象t的关系的可信度,qj,e为第三对象与对象e的关系的可信度;h为正整数,h≤H。
第H次相似度计算得到结果为第一对象与第三对象的相似度。
根据上述实现方式(2)提供的相似度的计算方法,又可以得到第一对象与第二数据库中的每一个对象的相似度,即相似度集合2。服务器从相似度集合2中获取最大相似度,与上述步骤S504中第一阈值进行比较,当最大相似度大于第一阈值时,将最大相似度对应的对象与第一对象加入到集合Z3中。
可选地,不限于上述实现方式(1)、实现方式(2)提及的两种计算第一对象与第三对象的相似度的方式,还有通过其它方式计算第一对象与第三对象的相似度,此处不做限定。
可选地,不限于上述实现方式(一)、实现方式(二)提及的两种根据第一知识图谱和第二对象的知识图谱识别第一对象和第二对象是否为同一对象的实现方式,还可以通过其它方式根据第一知识图谱和第二对象的知识图谱识别第一对象和第二对象是否为同一对象,此处不做限定。
本申请实施例中,步骤S304中服务器从第二数据库中获取至少一个第二知识图谱,该至少一个第二知识图谱可以是集合Z1、Z2、Z3中的任意一个或多个集合组成的集合Z包括的知识图谱。例如,在一种实现方式中,请参见图4,图4是本申请实施例示例性的给出的一种至少一个第二知识图谱的形成方式。如图4所示,集合Z1、Z2、Z3合并为集合Z,集合Z包括的知识图谱即为至少一个第二知识图谱。
可选地,集合Z1、Z2、Z3可能为空。
可选地,至少一个第二知识图谱可以是对集合Z进行去重处理后得到的集合包括的知识图谱。
实施例二:
服务器根据上述方法不断的更新和完善知识图谱集合。下面介绍应用知识图谱集合的方法。请参阅图5,图5本申请实施例提供的一种应用知识图谱集合的方法流程图,该方法包括以下部分或全部步骤。
S600、终端向计算设备发送第一请求,第一请求用于向计算设备请求目标对象的信息。
S602、计算设备根据第一请求,从服务器获取目标对象的组合知识图谱。
计算设备可以从服务器获取到知识图谱集合,进一步地,从知识图谱集合中查找到目标对象的组合知识图谱。知识图谱集合是通过上述实施例一所述的知识图谱的完善方法得到的,具体可以参见实施例一中相关描述,此处不再赘述。
S604、计算设备根据该组合知识图谱向目标对象发送目标信息。
在一种实现场景中,第一请求具体用于向计算设备请求目标对象的贷款额度。可选地,第一请求还可以携带目标对象的房产信息、车辆信息等可以用于评估目标对象的资产状况的信息。计算设备根据目标对象的组合知识图谱和请求携带的目标对象的房产信息、车辆信息等综合评估目标对象的贷款额度,然后将贷款额度发送至目标对象的终端。此时,目标信息指目标对象的贷款额度。
在一种实现场景中,第一请求具体用于向计算设备请求目标对象的购买保险产品A的价格。可选地,第一请求还可以携带目标对象历史购买保险产品A的风险程度。计算设备可以根据目标对象的组合知识图谱和目标对象历史购买保险产品A的风险程度综合评估目标对象购买产品A需要支付的价格。此时,目标信息指目标对象的购买产品A需要支付的价格。
可选地,第一请求也可以不是必须的。计算设备可以自动根据目标对象的组合知识图谱向目标对象发送目标信息。在一种实现场景中,计算设备识别终端的目标对象,从服务器的知识图谱集合中查找目标对象的组合知识图谱。在一种实现方式中,可以根据目标对象的组合知识图谱确定出目标对象感兴趣的事物,然后,计算设备向终端的目标对象推荐目标对象感兴趣的广告、电子读物等,此时,目标信息指目标对象感兴趣的广告、电子读物等。
本申请实施例,服务器接收计算设备发送的用于获取目标对象的知识图谱的请求;服务器根据请求在知识图谱集合中获取目标对象的组合知识图谱,目标对象的组合知识图谱包括目标对象的属性和目标对象关联的对象,知识图谱集合包括至少一个对象的组合知识图谱,组合知识图谱是由至少两个知识图谱合成的,至少两个知识图谱为同一个对象的知识图谱;服务器向计算设备发送目标对象的组合知识图谱。由此可知,服务器用于获取目标对象的知识图谱的知识图谱集合,包括多个对象的组着知识图谱,每一个对象的组合知识图谱是服务器不断的自动根据多个知识图谱合成的,因此,可以全面的、实时的更新多个对象的组合知识图谱构成的知识图谱集合,在根据目标对象获取目标对象的知识图谱的过程中,可以获取到目标对更加实时、全面的知识图谱。
基于上述方法实施例的描述,本发明实施例提出了一种知识图谱的完善装置600,该知识图谱的完善装置600可运行如图2、图3a和图5对应的服务器,该知识图谱的完善装置600可以是运行于服务器中的计算机程序(包括程序代码)。请参见图5,该知识图谱的完善装置可以运行如下单元:
接收单元601,用于接收计算设备发送的用于获取目标对象的知识图谱的请求;
第一获取单元602,用于根据所述请求在知识图谱集合中获取所述目标对象的组合知识图谱,所述目标对象的组合知识图谱包括所述目标对象的属性和所述目标对象关联的对象,所述知识图谱集合包括至少一个对象的组合知识图谱,所述组合知识图谱是由至少两个知识图谱合成的,所述至少两个知识图谱为同一个对象的知识图谱;
发送单元603,用于向所述计算设备发送所述目标对象的组合知识图谱。
在一种实施方式中,所述装置600还包括:
第二获取单元604,用于在第一数据库中获取第一知识图谱,所述第一数据库包括N个对象的知识图谱,N为正整数;
第三获取单元605,用于从第二数据库中获取至少一个第二知识图谱,所述第一知识图谱和所述第二知识图谱均用于指示第一对象的属性和所述第一对象关联的对象,所述第一对象为所述N个对象中任意一个对象;
合成单元606,用于将所述第一知识图谱和所述至少一个第二知识图谱合成为所述第一对象的组合知识图谱。
在一种实施方式中,所述第二数据库包括至少一个对象的知识图谱,所述至少一个对象中每一个对象的姓名与所述第一对象的姓名相同。
在一种实现方式中,所述第三获取单元605从第二数据库中获取至少一个第二知识图谱,包括:
在第二数据库中获取第二对象的知识图谱,所述第二数据库包括M个对象的知识图谱,M为正整数,所述第二对象为所述M个对象中一个对象;
在根据所述第一知识图谱和所述第二对象的知识图谱识别到所述第一对象和所述第二对象为同一对象时,确定所述第二对象的知识图谱为所述第二知识图谱。
在一种实现方式中,所述第二对象的知识图谱包括所述第二对象的属性,所述装置还包括:
确定单元607,若所述第二对象的属性与所述第一对象的属性相同,则用于确定所述第一对象和所述第二对象为同一对象。
在一种实现方式中,所述确定单元607还用于:
确定所述第一对象分别与所述第二数据库中每一个对象的相似度,得到相似度集合;
在所述相似度集合中最大相似度大于第一阈值时,确定所述第二数据库中的所有对象中所述最大相似度对应的对象为所述第二对象;
在所述第二对象为所述最大的相似度对应的对象,确定所述第一对象和所述第二对象为同一对象。
在一种实现方式中,第三对象为所述第二数据库中的所有对象中任意一个对象,所述第二数据库包括所述第三对象的知识图谱,所述第三对象的知识图谱包括所述第三对象的属性和所述第三对象关联的对象,所述确定单元607确定所述第一对象分别与所述第二数据库中每一个对象的相似度包括确定所述第一对象与所述第三对象的相似度。
在一种实现方式中,所述第一对象与所述第三对象的相似度是由所述第一对象的属性与所述第三对象的属性的相似度和所述第一对象关联的对象与所述第三对象关联的对象的相似度的加权求和得到的。
在一种实现方式中,所述确定单元607确定所述第一对象与所述第三对象的相似度,包括执行H次相似度计算,H为正整数,在第h次相似度计算中通过如下公式计算:
Figure BDA0002378457090000221
其中,i表示所述第一对象,j表示所述第三对象,simh(i,j)为第h次相似度计算得到计算结果;β为不大于1的正数;simh-1(i,j)为第h-1次相似度计算得到计算结果;t为所述第一对象关联的对象中对象的索引,t为不大于T的正整数,T为所述第一对象关联的对象的总个数,e为所述第三对象关联的对象中对象的索引,e为不大于E的正整数,E为所述第三对象关联的对象的总个数;simh-1(t,e)为第h-1次相似度计算得到对象t和对象e的相似度;在所述第一对象与所述对象t的关系与所述第三对象与所述对象e的关系相同时,f(ri,t,rj,e)=1;在所述第一对象与所述对象t的关系与所述第三对象与所述对象e的关系不同时,f(ri,t,rj,e)=0;pi,t为所述第一对象与所述对象t的关系的可信度,qj,e为所述第三对象与所述对象e的关系的可信度;h为正整数,h≤H;
第H次相似度计算得到结果为所述第一对象与所述第三对象的相似度。
在一种实现方式中,所述第一知识图谱中所有属性和所述第二知识图谱中所有属性组成属性集合,属性a为所述属性集合中的任意一个属性,所述合成单元606将所述第一知识图谱和所述至少一个第二知识图谱合成为所述第一对象的组合知识图谱,包括:
若所述第一知识图谱和所述第二知识图谱都包括所述属性a且所述第二知识图谱中所述属性a的可信度大于所述第一知识图谱中所述属性a的可信度,将所述第一知识图谱中所述属性a的属性值替换为所述第二知识图谱中所述属性a的属性值;或,
若所述第一知识图谱不包括所述属性a且所述第二知识图谱包括所述属性a,在所述第一知识图谱中增加所述第二知识图谱中所述属性a的属性值。
在一种实现方式中,对象b为所述第二知识图谱中所有关联对象中的任意一个对象,所述合成单元606将所述第一知识图谱和所述至少一个第二知识图谱合成为所述第一对象的组合知识图谱,包括:
若所述第一知识图谱不包括所述对象b且所述第二知识图谱都包括所述对象b,在所述第一知识图谱中增加所述第二知识图谱中所述对象b。
应理解,上述各个功能单元的具体功能实现方式可以参见上述图2、图3a和图5对应实施例中的相关描述,这里不再进行赘述。
在本发明实施例中,服务器接收计算设备发送的用于获取目标对象的知识图谱的请求;服务器根据请求在知识图谱集合中获取目标对象的组合知识图谱,目标对象的组合知识图谱包括目标对象的属性和目标对象关联的对象,知识图谱集合包括至少一个对象的组合知识图谱,组合知识图谱是由至少两个知识图谱合成的,至少两个知识图谱为同一个对象的知识图谱;服务器向计算设备发送目标对象的组合知识图谱。由此可知,服务器用于获取目标对象的知识图谱的知识图谱集合,包括多个对象的组着知识图谱,每一个对象的组合知识图谱是服务器不断的自动根据多个知识图谱合成的,因此,可以全面的、实时的更新多个对象的组合知识图谱构成的知识图谱集合。
请参阅图7,图7本发明实施例提出了一种数据处理装置700,该数据处理装置700可运行如图2和图5对应的计算设备,该数据处理装置700可以是运行于计算设备中的计算机程序(包括程序代码)。请参见图7,该数据处理装置可以运行如下单元:
接收单元701,用于接收终端发送的第一请求,所述第一请求用于向计算设备请求目标对象的信息;
获取单元702,用于根据所述第一请求,获取所述目标对象的组合知识图谱;
发送单元703,用于根据所述组合知识图谱向所述目标对象发送目标信息;
其中,所述目标对象的组合知识图谱是通过如权利要求1-11任意一种知识图谱的完善方法得到的。
应理解,上述各个功能单元的具体功能实现方式可以参见上述图2和图5对应实施例中的相关描述,这里不再进行赘述。
请参阅图8,图8是本发明实施例提供的又一种知识图谱的完善装置800的结构示意图。该知识图谱的完善装置800具体可以对应于图1中的知识图谱服务器103,装置800可以包括:处理器801、总线802、网络接口803和存储器804。其中,通信总线802用于实现这些组件之间的连接通信。网络接口803可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。如图8所示,作为一种计算机可读存储介质的存储器804中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序,在装置800运行时,可以将上述操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在如图8所示的知识图谱的完善装置800中,网络接口803可提供网络通讯功能;而处理器801可以用于调用存储器804中存储的设备控制应用程序,以实现:
通过网络接口803接收计算设备发送的用于获取目标对象的知识图谱的请求;
根据所述请求在知识图谱集合中获取所述目标对象的组合知识图谱,所述目标对象的组合知识图谱包括所述目标对象的属性和所述目标对象关联的对象,所述知识图谱集合包括至少一个对象的组合知识图谱,所述组合知识图谱是由至少两个知识图谱合成的,所述至少两个知识图谱为同一个对象的知识图谱;
向所述计算设备发送所述目标对象的组合知识图谱。
在本申请实施例的一种实现中,所述通过网络接口803还可以:
在第一数据库中获取第一知识图谱,所述第一数据库包括N个对象的知识图谱,N为正整数;
从第二数据库中获取至少一个第二知识图谱,所述第一知识图谱和所述第二知识图谱均用于指示第一对象的属性和所述第一对象关联的对象,所述第一对象为所述N个对象中任意一个对象;
通过处理器801可以将所述第一知识图谱和所述至少一个第二知识图谱合成为所述第一对象的组合知识图谱。
在本申请实施例的一种实现中,所述第二数据库包括至少一个对象的知识图谱,所述至少一个对象中每一个对象的姓名与所述第一对象的姓名相同。
在本申请实施例的一种实现中,所述通过网络接口803从第二数据库中获取至少一个第二知识图谱,包括:
在第二数据库中获取第二对象的知识图谱,所述第二数据库包括M个对象的知识图谱,M为正整数,所述第二对象为所述M个对象中一个对象;
在根据所述第一知识图谱和所述第二对象的知识图谱识别到所述第一对象和所述第二对象为同一对象时,确定所述第二对象的知识图谱为所述第二知识图谱。
在本申请实施例的一种实现中,所述第二对象的知识图谱包括所述第二对象的属性,所述处理器801还用于:
若所述第二对象的属性与所述第一对象的属性相同,则确定所述第一对象和所述第二对象为同一对象。
在本申请实施例的一种实现中,所述处理器801还用于
确定所述第一对象分别与所述第二数据库中每一个对象的相似度,得到相似度集合;
在所述相似度集合中最大相似度大于第一阈值时,确定所述第二数据库中的所有对象中所述最大相似度对应的对象为所述第二对象;
在所述第二对象为所述最大的相似度对应的对象,确定所述第一对象和所述第二对象为同一对象。
在本申请实施例的一种实现中,第三对象为所述第二数据库中的所有对象中任意一个对象,所述第二数据库包括所述第三对象的知识图谱,所述第三对象的知识图谱包括所述第三对象的属性和所述第三对象关联的对象,所述处理器801确定所述第一对象分别与所述第二数据库中每一个对象的相似度包括确定所述第一对象与所述第三对象的相似度。
在本申请实施例的一种实现中,所述第一对象与所述第三对象的相似度是由所述第一对象的属性与所述第三对象的属性的相似度和所述第一对象关联的对象与所述第三对象关联的对象的相似度的加权求和得到的。
在本申请实施例的一种实现中,所述处理器801确定所述第一对象与所述第三对象的相似度,包括执行H次相似度计算,H为正整数,在第h次相似度计算中通过如下公式计算:
Figure BDA0002378457090000261
其中,i表示所述第一对象,j表示所述第三对象,simh(i,j)为第h次相似度计算得到计算结果;β为不大于1的正数;simh-1(i,j)为第h-1次相似度计算得到计算结果;t为所述第一对象关联的对象中对象的索引,t为不大于T的正整数,T为所述第一对象关联的对象的总个数,e为所述第三对象关联的对象中对象的索引,e为不大于E的正整数,E为所述第三对象关联的对象的总个数;simh-1(t,e)为第h-1次相似度计算得到对象t和对象e的相似度;在所述第一对象与所述对象t的关系与所述第三对象与所述对象e的关系相同时,f(ri,t,rj,e)=1;在所述第一对象与所述对象t的关系与所述第三对象与所述对象e的关系不同时,f(ri,t,rj,e)=0;pi,t为所述第一对象与所述对象t的关系的可信度,qj,e为所述第三对象与所述对象e的关系的可信度;h为正整数,h≤H;
第H次相似度计算得到结果为所述第一对象与所述第三对象的相似度。
在本申请实施例的一种实现中,所述第一知识图谱中所有属性和所述第二知识图谱中所有属性组成属性集合,属性a为所述属性集合中的任意一个属性,所述处理器801将所述第一知识图谱和所述至少一个第二知识图谱合成为所述第一对象的组合知识图谱,包括:
若所述第一知识图谱和所述第二知识图谱都包括所述属性a且所述第二知识图谱中所述属性a的可信度大于所述第一知识图谱中所述属性a的可信度,将所述第一知识图谱中所述属性a的属性值替换为所述第二知识图谱中所述属性a的属性值;或,
若所述第一知识图谱不包括所述属性a且所述第二知识图谱包括所述属性a,在所述第一知识图谱中增加所述第二知识图谱中所述属性a的属性值。
在本申请实施例的一种实现中,对象b为所述第二知识图谱中所有关联对象中的任意一个对象,所述处理器801将所述第一知识图谱和所述至少一个第二知识图谱合成为所述第一对象的组合知识图谱,包括:
若所述第一知识图谱不包括所述对象b且所述第二知识图谱都包括所述对象b,在所述第一知识图谱中增加所述第二知识图谱中所述对象b。
需要说明的是,上述图6中的接收单元601、获取单元602、发送单元603、第二获取单元604、第三获取单元605可以由图8中的网络接口801来实现,上述图6中的合成单元606、确定单元607可以由图8中的处理器801来实现。
应当理解,本发明实施例中所描述的知识图谱的完善装置800可执行前文图2、图3a和图5任一个所对应实施例中对所述知识图谱的完善方法的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
请参阅图9,图9是本发明实施例提供的又一种数据处理装置900的结构示意图。该数据处理装置900具体可以对应于图1中的计算设备102,装置900可以包括:处理器901、总线902、网络接口903和存储器904。其中,通信总线902用于实现这些组件之间的连接通信。网络接口903可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。如图9所示,作为一种计算机可读存储介质的存储器904中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序,在装置900运行时,可以将上述操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在如图9所示的数据处理装置900中,网络接口903可提供网络通讯功能;而处理器901可以用于调用存储器904中存储的设备控制应用程序,以实现:
通过网络接口903接收终端发送的第一请求,所述第一请求用于向计算设备请求目标对象的信息;
根据所述第一请求,获取所述目标对象的组合知识图谱;
根据所述组合知识图谱向所述目标对象发送目标信息;
其中,所述目标对象的组合知识图谱是通过如权利要求1-11任意一种知识图谱的完善方法得到的。
应当理解,本发明实施例中所描述的数据处理装置900可执行前文图2和图5所对应实施例中计算设备对所述数据处理方法的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本发明实施例还提供了一种计算机存储介质,且所述计算机存储介质中存储有前文提及的知识图谱的完善装置600和知识图谱的完善装置800所执行的计算机程序,且所述计算机程序包括程序指令,当所述处理器执行所述程序指令时,能够执行前文图2、图3a和图5所对应实施例中服务器执行的方法,这里将不再进行赘述。
本发明实施例还提供了一种计算机存储介质,且所述计算机存储介质中存储有前文提及的数据处理装置700和数据处理装置900所执行的计算机程序,且所述计算机程序包括程序指令,当所述处理器执行所述程序指令时,能够执行前文图2和图5所对应实施例中计算设备执行的方法,这里将不再进行赘述。
另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本发明所涉及的计算机存储介质实施例中未披露的技术细节,请参照本发明方法实施例的描述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (15)

1.一种知识图谱的完善方法,其特征在于,所述方法包括:
接收计算设备发送的用于获取目标对象的知识图谱的请求;
根据所述请求在知识图谱集合中获取所述目标对象的组合知识图谱,所述目标对象的组合知识图谱包括所述目标对象的属性和所述目标对象关联的对象,所述知识图谱集合包括至少一个对象的组合知识图谱,所述组合知识图谱是由至少两个知识图谱合成的,所述至少两个知识图谱为同一个对象的知识图谱;
向所述计算设备发送所述目标对象的组合知识图谱。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在第一数据库中获取第一知识图谱,所述第一数据库包括N个对象的知识图谱,N为正整数;
从第二数据库中获取至少一个第二知识图谱,所述第一知识图谱和所述第二知识图谱均用于指示第一对象的属性和所述第一对象关联的对象,所述第一对象为所述N个对象中任意一个对象;
将所述第一知识图谱和所述至少一个第二知识图谱合成为所述第一对象的组合知识图谱。
3.根据权利要求2所述的方法,其特征在于,所述第二数据库包括至少一个对象的知识图谱,所述至少一个对象中每一个对象的姓名与所述第一对象的姓名相同。
4.根据权利要求2或3任一项所述的方法,其特征在于,所述从第二数据库中获取至少一个第二知识图谱,包括:
在第二数据库中获取第二对象的知识图谱,所述第二数据库包括M个对象的知识图谱,M为正整数,所述第二对象为所述M个对象中一个对象;
在根据所述第一知识图谱和所述第二对象的知识图谱识别到所述第一对象和所述第二对象为同一对象时,确定所述第二对象的知识图谱为所述第二知识图谱。
5.根据权利要求4所述的方法,其特征在于,所述第二对象的知识图谱包括所述第二对象的属性,所述方法还包括:
若所述第二对象的属性与所述第一对象的属性相同,则确定所述第一对象和所述第二对象为同一对象。
6.根据权利要求4所述的方法,其特征在于,所述方法还包括:
确定所述第一对象分别与所述第二数据库中每一个对象的相似度,得到相似度集合;
在所述相似度集合中最大相似度大于第一阈值时,确定所述第二数据库中的所有对象中所述最大相似度对应的对象为所述第二对象;
在所述第二对象为所述最大的相似度对应的对象,确定所述第一对象和所述第二对象为同一对象。
7.根据权利要求6所述的方法,其特征在于,第三对象为所述第二数据库中的所有对象中任意一个对象,所述第二数据库包括所述第三对象的知识图谱,所述第三对象的知识图谱包括所述第三对象的属性和所述第三对象关联的对象,所述确定所述第一对象分别与所述第二数据库中每一个对象的相似度包括确定所述第一对象与所述第三对象的相似度。
8.根据权利要求7所述的方法,其特征在于,所述第一对象与所述第三对象的相似度是由所述第一对象的属性与所述第三对象的属性的相似度和所述第一对象关联的对象与所述第三对象关联的对象的相似度的加权求和得到的。
9.根据权利要求7所述的方法,其特征在于,所述确定所述第一对象与所述第三对象的相似度,包括执行H次相似度计算,H为正整数,在第h次相似度计算中通过如下公式计算:
Figure FDA0002378457080000021
其中,i表示所述第一对象,j表示所述第三对象,simh(i,j)为第h次相似度计算得到计算结果;β为不大于1的正数;simh-1(i,j)为第h-1次相似度计算得到计算结果;t为所述第一对象关联的对象中对象的索引,t为不大于T的正整数,T为所述第一对象关联的对象的总个数,e为所述第三对象关联的对象中对象的索引,e为不大于E的正整数,E为所述第三对象关联的对象的总个数;simh-1(t,e)为第h-1次相似度计算得到对象t和对象e的相似度;在所述第一对象与所述对象t的关系与所述第三对象与所述对象e的关系相同时,f(ri,t,rj,e)=1;在所述第一对象与所述对象t的关系与所述第三对象与所述对象e的关系不同时,f(ri,t,rj,e)=0;pi,t为所述第一对象与所述对象t的关系的可信度,qj,e为所述第三对象与所述对象e的关系的可信度;h为正整数,h≤H;
第H次相似度计算得到结果为所述第一对象与所述第三对象的相似度。
10.根据权利要求2或3所述的方法,其特征在于,所述第一知识图谱中所有属性和所述第二知识图谱中所有属性组成属性集合,属性a为所述属性集合中的任意一个属性,所述将所述第一知识图谱和所述至少一个第二知识图谱合成为所述第一对象的组合知识图谱,包括:
若所述第一知识图谱和所述第二知识图谱都包括所述属性a且所述第二知识图谱中所述属性a的可信度大于所述第一知识图谱中所述属性a的可信度,将所述第一知识图谱中所述属性a的属性值替换为所述第二知识图谱中所述属性a的属性值;或,
若所述第一知识图谱不包括所述属性a且所述第二知识图谱包括所述属性a,在所述第一知识图谱中增加所述第二知识图谱中所述属性a的属性值。
11.根据权利要求2或3所述的方法,其在特征在于,对象b为所述第二知识图谱中所有关联对象中的任意一个对象,所述将所述第一知识图谱和所述至少一个第二知识图谱合成为所述第一对象的组合知识图谱,包括:
若所述第一知识图谱不包括所述对象b且所述第二知识图谱都包括所述对象b,在所述第一知识图谱中增加所述第二知识图谱中所述对象b。
12.一种数据处理方法,其特征在于,所述方法包括:
接收终端发送的第一请求,所述第一请求用于向计算设备请求目标对象的信息;
根据所述第一请求,获取所述目标对象的组合知识图谱;
根据所述组合知识图谱向所述目标对象发送目标信息;
其中,所述目标对象的组合知识图谱是通过如权利要求1-11任意一种知识图谱的完善方法得到的。
13.一种知识图谱的完善装置,其特征在于,所述装置包括:
接收单元,用于接收计算设备发送的用于获取目标对象的知识图谱的请求;
获取单元,用于根据所述请求在知识图谱集合中获取所述目标对象的组合知识图谱,所述目标对象的组合知识图谱包括所述目标对象的属性和所述目标对象关联的对象,所述知识图谱集合包括至少一个对象的组合知识图谱,所述组合知识图谱是由至少两个知识图谱合成的,所述至少两个知识图谱为同一个对象的知识图谱;
发送单元,用于向所述计算设备发送所述目标对象的组合知识图谱。
14.一种数据处理装置,其特征在于,所述装置包括:
接收单元,用于接收终端发送的第一请求,所述第一请求用于向计算设备请求目标对象的信息;
获取单元,用于根据所述第一请求,获取所述目标对象的组合知识图谱;
发送单元,用于根据所述组合知识图谱向所述目标对象发送目标信息;
其中,所述目标对象的组合知识图谱是通过如权利要求1-11任意一种知识图谱的完善方法得到的。
15.一种知识图谱的完善装置,其特征在于,包括处理器和存储器,所述处理器和存储器耦合,其中,所述存储器用于存储计算机指令,所述处理器用于执行所述计算机指令,以使所述知识图谱的完善装置实现如权利要求1-12任一项所述的方法。
CN202010076738.1A 2020-01-22 2020-01-22 知识图谱的完善方法及装置、数据处理方法及装置 Active CN111291196B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010076738.1A CN111291196B (zh) 2020-01-22 2020-01-22 知识图谱的完善方法及装置、数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010076738.1A CN111291196B (zh) 2020-01-22 2020-01-22 知识图谱的完善方法及装置、数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN111291196A true CN111291196A (zh) 2020-06-16
CN111291196B CN111291196B (zh) 2024-03-22

Family

ID=71021316

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010076738.1A Active CN111291196B (zh) 2020-01-22 2020-01-22 知识图谱的完善方法及装置、数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN111291196B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112258339A (zh) * 2020-09-29 2021-01-22 广东电力通信科技有限公司 一种基于电网系统技术的数据处理储备方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103377250A (zh) * 2012-04-27 2013-10-30 杭州载言网络技术有限公司 基于邻域的top-k推荐方法
CN106326422A (zh) * 2016-08-24 2017-01-11 北京大学 一种基于知识本体的食品安全数据信息检索的方法及系统
US20170329817A1 (en) * 2016-05-13 2017-11-16 Maana, Inc. Machine-assisted object matching
CN107704637A (zh) * 2017-11-20 2018-02-16 中国人民解放军国防科技大学 一种面向突发事件的知识图谱构建方法
US20180082197A1 (en) * 2016-09-22 2018-03-22 nference, inc. Systems, methods, and computer readable media for visualization of semantic information and inference of temporal signals indicating salient associations between life science entities
CN109344262A (zh) * 2018-10-31 2019-02-15 百度在线网络技术(北京)有限公司 知识体系的建立方法、装置及存储介质
CN109739939A (zh) * 2018-12-29 2019-05-10 颖投信息科技(上海)有限公司 知识图谱的数据融合方法和装置
CN109960810A (zh) * 2019-03-28 2019-07-02 科大讯飞(苏州)科技有限公司 一种实体对齐方法及装置
CN110245198A (zh) * 2019-06-18 2019-09-17 北京百度网讯科技有限公司 多源售票数据管理方法及系统、服务器和计算机可读介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103377250A (zh) * 2012-04-27 2013-10-30 杭州载言网络技术有限公司 基于邻域的top-k推荐方法
US20170329817A1 (en) * 2016-05-13 2017-11-16 Maana, Inc. Machine-assisted object matching
CN106326422A (zh) * 2016-08-24 2017-01-11 北京大学 一种基于知识本体的食品安全数据信息检索的方法及系统
US20180082197A1 (en) * 2016-09-22 2018-03-22 nference, inc. Systems, methods, and computer readable media for visualization of semantic information and inference of temporal signals indicating salient associations between life science entities
CN107704637A (zh) * 2017-11-20 2018-02-16 中国人民解放军国防科技大学 一种面向突发事件的知识图谱构建方法
CN109344262A (zh) * 2018-10-31 2019-02-15 百度在线网络技术(北京)有限公司 知识体系的建立方法、装置及存储介质
CN109739939A (zh) * 2018-12-29 2019-05-10 颖投信息科技(上海)有限公司 知识图谱的数据融合方法和装置
CN109960810A (zh) * 2019-03-28 2019-07-02 科大讯飞(苏州)科技有限公司 一种实体对齐方法及装置
CN110245198A (zh) * 2019-06-18 2019-09-17 北京百度网讯科技有限公司 多源售票数据管理方法及系统、服务器和计算机可读介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王辉: "异构信息网中kNN查询技术研究", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 05, 15 May 2019 (2019-05-15), pages 138 - 1082 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112258339A (zh) * 2020-09-29 2021-01-22 广东电力通信科技有限公司 一种基于电网系统技术的数据处理储备方法及系统

Also Published As

Publication number Publication date
CN111291196B (zh) 2024-03-22

Similar Documents

Publication Publication Date Title
CN111427971B (zh) 用于计算机系统的业务建模方法、装置、系统和介质
CN110135978B (zh) 用户金融风险评估方法、装置、电子设备和可读介质
CN112231592A (zh) 基于图的网络社团发现方法、装置、设备以及存储介质
CN113393306A (zh) 产品推荐方法、装置、电子设备及计算机可读介质
CN111696656B (zh) 一种互联网医疗平台的医生评价方法、装置
CN110348516B (zh) 数据处理方法、装置、存储介质及电子设备
CN111291196A (zh) 知识图谱的完善方法及装置、数据处理方法及装置
WO2023185125A1 (zh) 产品资源的数据处理方法及装置、电子设备、存储介质
CN116756281A (zh) 知识问答方法、装置、设备和介质
CN115758271A (zh) 数据处理方法、装置、计算机设备和存储介质
US11593740B1 (en) Computing system for automated evaluation of process workflows
KR102368961B1 (ko) 인공 신경망 기반의 주거 환경 개선 서비스 중개 시스템 및 그 방법
CN114332472A (zh) 一种基于图神经网络的数据处理方法及装置
CN112101390A (zh) 属性信息确定方法、属性信息确定装置及电子设备
CN112214387B (zh) 基于知识图谱的用户操作行为预测方法及装置
CN113807749B (zh) 一种对象评分方法和装置
US11989243B2 (en) Ranking similar users based on values and personal journeys
CN115659167B (zh) 多特征库合并方法及装置、设备、计算机可读存储介质
CN114722061B (zh) 数据处理方法及装置、设备、计算机可读存储介质
CN114844889B (zh) 视频处理模型的更新方法、装置、电子设备及存储介质
CN114547448B (zh) 数据处理、模型训练方法、装置、设备、存储介质及程序
CN118133954A (zh) 一种数据分析方法、装置、电子设备及计算机可读介质
CN116993201A (zh) 服务质量的评估方法、装置、服务器及存储介质
CN116403266A (zh) 人脸识别方法、装置、电子设备、介质和程序产品
CN117271870A (zh) 推荐信息生成方法、装置、电子设备和计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40024657

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant