CN109492111B - 最短路径查询方法、系统、计算机设备和存储介质 - Google Patents

最短路径查询方法、系统、计算机设备和存储介质 Download PDF

Info

Publication number
CN109492111B
CN109492111B CN201811093461.2A CN201811093461A CN109492111B CN 109492111 B CN109492111 B CN 109492111B CN 201811093461 A CN201811093461 A CN 201811093461A CN 109492111 B CN109492111 B CN 109492111B
Authority
CN
China
Prior art keywords
shortest path
graph
fund
fund knowledge
knowledge base
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811093461.2A
Other languages
English (en)
Other versions
CN109492111A (zh
Inventor
陈泽晖
胡逸凡
谢云
黄鸿顺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201811093461.2A priority Critical patent/CN109492111B/zh
Priority to PCT/CN2018/124237 priority patent/WO2020056984A1/zh
Publication of CN109492111A publication Critical patent/CN109492111A/zh
Application granted granted Critical
Publication of CN109492111B publication Critical patent/CN109492111B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Technology Law (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及图论和网络分析技术领域,特别涉及一种最短路径查询方法、系统、计算机设备和存储介质。一种最短路径方法,包括获取信息源中的基金知识后建立基金知识元库;对基金知识进行融合并存储于数据库中;定期计算全图和各子图中所有实体两两间最短路径,并建立最短路径矩阵;获取查询请求,并从最短路径矩阵中搜索对应的结果;当最短路径矩阵中不存在对应的结果时,到基金知识元库中筛选出对应的子图;计算子图中特定的两两实体最短路径。通过对全图和子图的建立与维护,实现了图谱的实时查询和全量查询功能,通过进一步对图谱中各实体间的路径的计算,为图谱中各实体关系的进一步推理提供了基础。

Description

最短路径查询方法、系统、计算机设备和存储介质
技术领域
本申请涉及图论和网络分析技术领域,特别是涉及一种最短路径查询方法、系统、计算机设别和存储介质。
背景技术
知识图谱本质上是语义网络,是一种基于图的数据结构,由节点和边组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式,通俗地讲,知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力,知识的推理可以理解成“链接预测”,也就是从已有的关系图谱里推导出新的关系或链接,常用的推理算法包括基于逻辑的推理和基于分布式表示方法的推理。
知识图谱可以结合多种数据源去分析实体之间的关系,从而对用户的行为有更好的理解,在大数据时代,很多数据都是未经处理过的非结构化数据,比如文本、图片、音频、视频等。特别在互联网金融行业里,往往需要根据大量的文本数据,并从这些非结构化数据里提取出有价值的信息。
而现有的知识图谱中对于各实体的分析不全面,且对于各实体的查询也比较简单,不能实现实时查询和全量查询的功能。
发明内容
基于此,有必要针对现有知识图谱中对于各实体的分析不全面且不能对各实体进行实时查询和全量查询的问题,提供一种最短路径查询方法、系统、计算机设备和存储介质。
一种最短路径查询方法,所述最短路径查询方法,包括如下步骤:
获取基金信息源中的基金知识后建立基金知识元库,所述基金知识元库为全图,所述全图中包含多个子图,所述全图和各所述子图中包括实体;
将所述基金知识元库中的所述基金知识进行融合,并将经过融合的所述基金知识元库存储于数据库中;
定期计算所述全图和各所述子图中所有实体两两之间的最短路径,根据所述最短路径的计算结果建立最短路径矩阵;
获取查询请求,根据所述查询请求从所述最短路径矩阵中搜索对应的最短路径结果;
当所述查询请求在所述最短路径矩阵中不存在对应的结果时,则根据所述查询请求到所述基金知识元库中筛选出对应的所述子图;
对所述子图中特定的两两实体采用预设算法计算最短路径。
在一个实施例中,所述获取基金信息源中的基金知识后建立基金知识元库,包括:
对信息源中的基金知识进行识别,识别所述基金知识的数据类型和数据来源;
根据所述基金知识的数据类型和数据来源进行筛选与归纳,筛选出具有相同所述数据类型和相同所述数据来源的所述基金知识并归纳为一类;
根据归纳整理后的所述基金知识,建立基金知识元库。
在一个实施例中,所述将所述基金知识元库中的所述基金知识进行融合,并将经过融合的所述基金知识元库存储于数据库中,包括:
对所述基金知识元库中的各实体进行ID标识,所述基金知识元库中还包括各实体间的关系和各实体的属性;
根据所述ID标识对所述基金知识元库中的各实体进行判断,具有统一ID标识的为同一实体,将所述同一实体根据所述关系和所述属性进行合并后完成所述基金知识的融合,不具有统一ID标识的,则无需进行合并;
将经过融合的所述基金知识元库存储于数据库中。
在一个实施例中,所述定期计算所述全图和各所述子图中所有实体两两之间的最短路径,根据所述最短路径的计算结果建立最短路径矩阵,包括:
将全图中边的权重设置为1,运用FLOYD算法对全图进行等权重多源最短路径的计算;
设置各子图中的边的权重,运用FLOYD算法对各子图进行带权重多源最短路径的计算;
根据所述等权重多源最短路径的计算结果和所述带权重多源最短路径的计算结果,建立最短路径矩阵;
定期检查所述基金知识元库,若有实体和关系的变化,在所述基金知识元库和所述最短路径矩阵中更新该实体和关系。
在一个实施例中,所述获取查询请求,根据所述查询请求从所述最短路径矩阵中搜索与所述查询请求对应的最短路径结果,包括:
获取所述查询请求中包含的两个实体的关键词,到所述最短路径矩阵中进行关键词搜索;
在所述最短路径矩阵中搜索到所述查询请求对应的最短路径结果,则将该结果通过d3js技术进行展示。
在一个实施例中,所述对所述子图中特定的两两实体采用预设算法计算最短路径,包括:
采用Dijkstra算法对所述子图中特定的两点进行最短路径的计算,其中特定的两点指所述查询请求中包含的两个实体,并将该计算结果以json数据格式返回后采用d3js技术进行展示。
在一个实施例中,所述定期计算所述全图和所述各子图中所有实体两两之间的最短路径,根据所述最短路径的计算结果建立最短路径矩阵之后,还包括:
获取所述最短路径矩阵中两两实体间的路径长度,将该路径长度与预设阈值进行比对,若该路径长度低于所述阈值,标识该路径长度所对应的两个实体;
将标识后的所述实体输出至其它平台中,所述其它平台对所述标识后的基金实体进行深度关系挖掘。
基于相同的构思,本申请还提供一种最短路径查询系统,所述最短路径查询系统包括:
获取单元,设置为获取基金信息源中的基金知识后建立基金知识元库,所述基金知识元库为全图,所述全图中包含多个子图,所述全图和各所述子图中包括实体;
融合单元,设置为将所述基金知识元库中的所述基金知识进行融合,并将经过融合的所述基金知识元库存储于数据库中;
维护单元,设置为定期计算所述全图和各所述子图中所有实体两两之间的最短路径,根据所述最短路径的计算结果建立最短路径矩阵;
最短路径查询单元,设置为获取查询请求,根据所述查询请求从所述最短路径矩阵中搜索与所述查询请求对应的最短路径结果;
子图查询单元,设置为当所述查询请求在所述最短路径矩阵中不存在对应的结果时,则根据所述查询请求到所述基金知识元库中筛选出对应的所述子图;
运算单元,设置为对所述子图中特定的两两实体采用预设算法计算最短路径。
基于相同的技术构思,本申请实施例还提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被一个或多个所述处理器执行时,使得一个或多个所述处理器执行上述最短路径查询方法的步骤。
基于相同的技术构思,本申请实施例还提供了一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个所述处理器执行上述最短路径查询方法的步骤。
上述最短路径查询方法、系统、计算机设备和存储介质,通过获取基金信息源中的基金知识后建立基金知识元库;将所述基金知识元库中的所述基金知识进行融合,并将其存储于数据库中;定期计算所述全图和各所述子图中所有实体两两之间的最短路径,根据所述最短路径的计算结果建立最短路径矩阵;获取查询请求,从所述最短路径矩阵中搜索与所述查询请求对应的最短路径结果;当所述查询请求在所述最短路径矩阵中不存在对应的结果时,则根据所述查询请求到所述基金知识元库中筛选出对应的所述子图;对所述子图中特定的两两实体采用预设算法计算最短路径。通过对全图和子图的建立与维护,实现了图谱的实时查询和全量查询功能,经过进一步的对图谱中各实体的路径计算,为图谱中各实体关系的进一步推理提供了基础。
附图说明
图1为本申请在一个实施例中最短路径查询方法的流程图;
图2为本申请在一个实施例中建立基金知识元库的流程图;
图3为本申请在一个实施例中建立最短路径矩阵的流程图;
图4为本申请在一个实施例中最短路径查询系统的功能框架图。
具体实施方式
图1为本申请在一个实施例中最短路径查询方法的流程图,如图所示,该流程图包括:
S1、获取基金信息源中的基金知识后建立基金知识元库,所述基金知识元库为全图,所述全图中包含多个子图,所述全图和各所述子图中包括实体;
本步骤中通过把基金信息源中的知识经过识别、理解、筛选、归纳等过程抽取出来,建立基金知识元库,所述知识元库除了包括实体外,还包括实体之间的关系和实体的属性。
S2、将所述基金知识元库中的所述基金知识进行融合,并将经过融合的所述基金知识元库存储于数据库中;
本步骤中通过使来自不同基金知识源的知识在同一框架规范下进行数据整合,并对所述知识元库中的实体进行ID标识,该融合过程中包括新数据替换旧数据的融合,还包括根据预设的融合规则对知识的质量进行评估和带权重的融合。
S3、定期计算所述全图和各所述子图中所有实体两两之间的最短路径,根据所述最短路径的计算结果建立最短路径矩阵;
本步骤中根据预设的权重规则,对全图和各子图中所有的实体两两计算其最短路径,并根据计算的最短路径结果建立最短路径矩阵,并且定期检查所述基金知识元库中的图谱,若有实体或关系的更新,则在对应的图谱和最短路径矩阵中进行更新。
S4、获取查询请求,根据所述查询请求从所述最短路径矩阵中搜索与所述查询请求对应的最短路径结果;
本步骤中获取查询请求为查询两个基金经理之间的距离,对该查询请求进行判断,判断其是否有额外查询条件,若没有额外查询条件,则到所述最短路径矩阵中搜索其对应的最短路径的结果,并将该结果进行展示。
S5、当所述查询请求在所述最短路径矩阵中不存在对应的结果时,则根据所述查询请求到所述基金知识元库中筛选出对应的所述子图;
本步骤中查询条件中两个基金经理之间的距离还包含额外条件,故在所述最短路径矩阵中不存在其对应的结果,其额外条件比如基金经理A,B之间不通过基金公司C的最短路径,基金经理A,B之间只通过其他人相连的最短路径等,根据查询请求中的关键词到所述基金知识元库中匹配到其对应的子图。
S6、对所述子图中特定的两两实体采用预设算法计算最短路径;
本步骤中接收包含额外查询条件的查询请求对应的子图,并采用Dijkstra算法对该子图中特定的两个实体的最短路径,比如计算基金经理A,B不通过基金公司C的最短路径。
本申请通过上述步骤方法,实现了对图谱中两两实体的最短路径计算的功能,并通过计算得到的最短路径建立了最短路径矩阵,实现了图谱可实时查询、全量查询的功能。
图2为本申请在一个实施例中建立基金知识元库的流程图,如图2所示,该流程图包括:
S101、对信息源中的基金知识进行识别,识别所述基金知识的数据类型和数据来源;
本步骤中通过对基金信息源中的知识根据其数据类型和数据来源进行识别,例如企业内部数据库的数据为结构化数据,天天基金网等网站中的图表数据为半结构化数据,基金研报、基金经理简历、雪球社区评论等整篇文本数据为非结构化数据。
S102、根据所述基金知识的数据类型和数据来源进行筛选与归纳,筛选出具有相同所述数据类型和相同所述数据来源的所述基金知识并归纳为一类;
本步骤中将具有同一数据类型和同一数据来源的知识数据归纳为同一类,并且根据其不同的数据类型采取不同的抽取方法,例如对于结构化数据,通过人工设定规则来进行数据抽取,对于半结构化数据,通过爬虫或正规表达式匹配来进行数据抽取,对于非结构化数据,通过自然语言处理来进行数据抽取。
S103、根据归纳整理后的所述基金知识,建立基金知识元库;
本实施例中通过对基金信息源中的数据进行抽取并建立基金知识元库,为后续对所述基金知识元库中的数据进行进一步的整合提供了基础。
在一个实施例中,所述将所述基金知识元库中的所述基金知识进行融合,并将经过融合的所述基金知识元库存储于数据库中,包括:
S201、对所述基金知识元库中的各实体进行ID标识,所述基金知识元库中还包括各实体间的关系和各实体的属性;
本步骤中在对所述知识元库中的知识数据根据预设融合规则进行融合之前,先对所有的实体进行ID标识,例如,基金实体和股票实体以市场交易代码作为ID标识。
S202、根据所述ID标识对所述基金知识元库中的各实体进行判断,具有统一ID标识的为同一实体,将所述同一实体根据所述关系和所述属性进行合并后完成所述基金知识的融合,不具有统一ID标识的,则无需进行合并;
本步骤中对数据的融合包括新数据替换旧数据的融合,还包括根据预设融合规则对知识的质量进行评估和带权重的融合,该预设融合规则即将所述基金知识元库中的实体进行ID标识,对于同一ID标识的实体进行关系与属性的融合,对于不具有同一ID标识的实体进行相似属性的融合;
S203、将经过融合的所述基金知识元库存储于数据库中;
本步骤中将所述基金知识元库中的实体按照关系和属性的不同进行融合后存储于数据库中,所述数据库包括关系数据库,RDF数据库,图数据库或任意数据库的结合。
本实施例中通过对所述基金知识元库中的实体进行ID标识,再将进行ID标识的实体根据预设融合规则进行融合,并将融合后的所述基金知识元库存储于数据库中,将所述知识元库中的知识进行有序的整合,为后续能够快速的匹配基金实体在所述基金知识元库中相对应的子图。
图3为本申请在一个实施例中建立最短路径矩阵的流程图,如图3所示,该流程图包括:
S301、将全图中边的权重设置为1,运用FLOYD算法对全图进行等权重多源最短路径的计算;
本步骤中将全图中所有实体两两间的边的权重均设置为1,再运用FLOYD算法对全图中所有的实体进行两两实体的最短路径的计算,全图中计算的最短路径为等权重多源最短路径,其中FLOYD算法如下步骤所示:
S30101、从任意一条单边路径开始,所有两点之间的距离为边的权重,如果两点之间无边相连为无穷大。
S30102、对于每一对顶点i和j,看看是否存在一个顶点k使得从i到k再到j比己知的路径更短,如果是更新它。
Floyd算法是一个动态规划算法,它的递推公式如下:
d[i][j]=min(d[i][j],d[i][k]+d[k][j])。
S302、设置各子图中的边的权重,运用FLOYD算法对各子图进行带权重多源最短路径的计算;
本步骤中通过对各子图中的实体间的边设置权重,运用FLOYD算法计算两两实体间的带权重多源最短路径,比如两个基金经理之间的关系若为亲属、同导师、共同管理过同一个基金的,其权重设置为1;如果两个基金经理之间的关系为同所学校毕业的、同公司或同学的,则权重设置为2。
S303、根据所述等权重多源最短路径的计算结果和所述带权重多源最短路径的计算结果,建立最短路径矩阵;
本步骤中获取全图中计算的等权重多源最短路径与各子图中计算的带权重多源在最短路径的计算结果,根据该计算结果建立最短路径矩阵。
S304、定期检查所述基金知识元库,若有实体和关系的变化,在所述基金知识元库和所述最短路径矩阵中更新该实体和关系;
本步骤中定期检查所述基金知识元库中的实体和关系是否发生变化,若有变化,则将变化后的实体或关系更新到全图和对应的子图中,并分别计算等权重多源最短路径和带权重多源最短路径,将计算结果更新于所述最短路径矩阵中。
本实施例中通过预设算法分别对全图和各子图中的实体两两计算其最短路径,并建立最短路径矩阵,为后续能够实时查询和全量查询最短路径提供基础。
在一个实施例中,所述获取查询请求,根据所述查询请求从所述最短路径矩阵中搜索与所述查询请求对应的最短路径结果,包括:
S401、获取所述查询请求中包含的两个实体的关键词,到所述最短路径矩阵中进行关键词搜索;
本步骤中所述实体包括基金公司、基金、基金经理等,此步骤中,默认用户查询的就是等权的一条最短路径,对于不同类型的关系都看做是等长度的边。
S402、在所述最短路径矩阵中搜索到所述查询请求对应的最短路径结果,则将该结果通过d3js技术进行展示。
本实施例中对于等权重最短路径可到所述最短路径矩阵中直接获取,体现了图谱具备实时查询的功能。
在一个实施例中,所述对所述子图中特定的两两实体采用预设算法计算最短路径,并将计算结果进行展示,包括采用Dijkstra算法对所述子图中特定的两点进行最短路径的计算,其中特定的两点指所述查询请求中包含的两个实体,并将该计算结果以json数据格式返回后采用d3js技术进行展示,其中,Dijkstra算法的计算如下步骤所示:
S601、起点A到自身的长度为0,A到别的点之间的直线距离为边的权重,如果两点之间无边相连为无穷大;
S602、将A放入一个集合M中,并且找出集合外其它点距离最小的点C放入集合中;
S603、由于新加进来的C可能影响集合M中其它点到起点A的距离,更新集合M中各个顶点到起点A的距离;
S604、重复步骤S602、步骤S603,直到遍历完所有顶点。
本实施例中对带有额外查询条件的查询请求,通过先匹配子图再进行计算的过程,对于不能在所述最短路径矩阵中快速获取的最短路径结果,也能通过快速的计算过程获取,体现了图谱具备全量查询的功能。
在一个实施例中,所述定期计算所述全图和所述各子图中所有实体两两之间的最短路径,根据所述最短路径的计算结果建立最短路径矩阵之后,还包括:
获取所述最短路径矩阵中两两实体间的路径长度,将该路径长度与预设阈值进行比对,若该路径长度低于所述阈值,标识该路径长度所对应的两个实体;
将标识后的所述实体输出至其它平台中,所述其它平台对所述标识后的基金实体进行深度关系挖掘。
本实施例中通过将所述最短路径矩阵中两两实体间的路径长度与预设阈值进行比对,将低于所述阈值的路径长度对应的实体进行标识,更加有利于挖掘风格类似的基金经理及他们之间潜在的影响关系。
基于相同的构思,本申请还提出了一种最短路径查询系统,如图4所示,所述最短路径查询系统包括获取单元、融合单元、维护单元、最短路径查询单元、子图查询单元和运算单元,其中:获取单元,设置为获取基金信息源中的基金知识后建立基金知识元库,所述基金知识元库为全图,所述全图中包含多个子图,所述全图和各所述子图中包括实体;融合单元,设置为将所述基金知识元库中的所述基金知识进行融合,并将经过融合的所述基金知识元库存储于数据库中;维护单元,设置为定期计算所述全图和各所述子图中所有实体两两之间的最短路径,根据所述最短路径的计算结果建立最短路径矩阵;最短路径查询单元,设置为获取查询请求,根据所述查询请求从所述最短路径矩阵中搜索与所述查询请求对应的最短路径结果;子图查询单元,设置为当所述查询请求在所述最短路径矩阵中不存在对应的结果时,则根据所述查询请求到所述基金知识元库中筛选出对应的所述子图;运算单元,设置为对所述子图中特定的两两实体采用预设算法计算最短路径。
基于相同的技术构思,本申请实施例还提供一种计算机设备,所述计算机设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被一个或多个处理器执行时,使得一个或多个所述处理器执行计算机可读指令时实现上述各实施例中的最短路径查询方法的步骤。
基于相同的技术构思,本申请实施例还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个所述处理器执行所述计算机可读指令时实现上述各实施例中的最短路径查询方法的步骤。所述存储介质可以为非易失性存储介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读数据库(ROM,Read Only Memory)、随机存取数据库(RAM,RandomAccess Memory)、磁盘或光盘等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本申请的说明书记载的范围。
以上所述实施例仅表达了本申请一些示例性实施例,其描述较为具体和详细,但并不能因此而理解为对本申请专利所要求保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些变形和改进都属于本申请所要求的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (8)

1.一种最短路径查询方法,其特征在于,所述最短路径查询方法包括:
获取基金信息源中的基金知识后建立基金知识元库,所述基金知识元库为全图,所述全图中包含多个子图所述全图和各所述子图中包括实体;
将所述基金知识元库中的所述基金知识进行融合,并将经过融合的所述基金知识元库存储于数据库中;
定期计算所述全图和各所述子图中所有实体两两之间的最短路径,根据所述最短路径的计算结果建立最短路径矩阵,具体包括:
将全图中边的权重设置为1,运用FLOYD算法对全图进行等权重多源最短路径的计算;设置各子图中的边的权重,运用FLOYD算法对各子图进行带权重多源最短路径的计算;根据所述等权重多源最短路径的计算结果和所述带权重多源最短路径的计算结果,建立最短路径矩阵;定期检查所述基金知识元库,若有实体和关系的变化,在所述基金知识元库和所述最短路径矩阵中更新该实体和关系;
获取查询请求,根据所述查询请求从所述最短路径矩阵中搜索对应的最短路径结果;
当所述查询请求在所述最短路径矩阵中不存在对应的结果时,则根据所述查询请求到所述基金知识元库中筛选出对应的所述子图;
对所述子图中特定的两两实体采用预设算法计算最短路径;
所述对所述子图中特定的两两实体采用预设算法计算最短路径包括:采用Dijkstra算法对所述子图中特定的两点进行最短路径的计算,其中特定的两点指所述查询请求中包含的两个实体,并将该计算结果以json数据格式返回后采用d3js技术进行展示。
2.如权利要求1所述的一种最短路径查询方法,其特征在于,所述获取基金信息源中的基金知识后建立基金知识元库,包括:
对信息源中的基金知识进行识别,识别所述基金知识的数据类型和数据来源;
根据所述基金知识的数据类型和数据来源进行筛选与归纳,筛选出具有相同所述数据类型和相同所述数据来源的所述基金知识并归纳为一类;
根据归纳整理后的所述基金知识,建立基金知识元库。
3.如权利要求1所述的一种最短路径查询方法,其特征在于,所述将所述基金知识元库中的所述基金知识进行融合,并将经过融合的所述基金知识元库存储于数据库中,包括:
对所述基金知识元库中的各实体进行ID标识,所述基金知识元库中还包括各实体间的关系和各实体的属性;
根据所述ID标识对所述基金知识元库中的各实体进行判断,具有统一ID标识的为同一实体,将所述同一实体根据所述关系和所述属性进行合并后完成所述基金知识的融合,不具有统一ID标识的,则无需进行合并;
将经过融合的所述基金知识元库存储于数据库中。
4.如权利要求1所述的一种最短路径查询方法,其特征在于,所述获取查询请求,根据所述查询请求从所述最短路径矩阵中搜索与所述查询请求对应的最短路径结果,包括:
获取所述查询请求中包含的两个实体的关键词,到所述最短路径矩阵中进行关键词搜索;
在所述最短路径矩阵中搜索到所述查询请求对应的最短路径结果,则将该结果通过d3js技术进行展示。
5.如权利要求1所述的一种最短路径查询方法,其特征在于,所述定期计算所述全图和所述各子图中所有实体两两之间的最短路径,根据所述最短路径的计算结果建立最短路径矩阵之后,还包括:
获取所述最短路径矩阵中两两实体间的路径长度,将该路径长度与预设阈值进行比对,若该路径长度低于所述阈值,标识该路径长度所对应的两个实体;
将标识后的所述实体输出至其它平台中,所述其它平台对所述标识后的实体进行深度关系挖掘。
6.一种最短路径查询系统,其特征在于,所述最短路径查询系统包括:
获取单元,设置为获取基金信息源中的基金知识后建立基金知识元库,所述基金知识元库为全图,所述全图中包含多个子图所述全图和各所述子图中包括实体;
融合单元,设置为将所述基金知识元库中的所述基金知识进行融合,并将经过融合的所述基金知识元库存储于数据库中;
维护单元,设置为定期计算所述全图和各所述子图中所有实体两两之间的最短路径,根据所述最短路径的计算结果建立最短路径矩阵,具体包括:
将全图中边的权重设置为1,运用FLOYD算法对全图进行等权重多源最短路径的计算;设置各子图中的边的权重,运用FLOYD算法对各子图进行带权重多源最短路径的计算;根据所述等权重多源最短路径的计算结果和所述带权重多源最短路径的计算结果,建立最短路径矩阵;定期检查所述基金知识元库,若有实体和关系的变化,在所述基金知识元库和所述最短路径矩阵中更新该实体和关系;
最短路径查询单元,设置为获取查询请求,根据所述查询请求从所述最短路径矩阵中搜索与所述查询请求对应的最短路径结果;
子图查询单元,设置为当所述查询请求在所述最短路径矩阵中不存在对应的结果时,则根据所述查询请求到所述基金知识元库中筛选出对应的所述子图;
运算单元,设置为对所述子图中特定的两两实体采用预设算法计算最短路径;
所述运算单元具体用于:采用Dijkstra算法对所述子图中特定的两点进行最短路径的计算,其中特定的两点指所述查询请求中包含的两个实体,并将该计算结果以json数据格式返回后采用d3js技术进行展示。
7.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被一个或多个所述处理器执行时,使得一个或多个所述处理器执行如权利要求1至5中任一项所述的最短路径查询方法的步骤。
8.一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个所述处理器执行如权利要求1至5中任一项所述的最短路径查询方法的步骤。
CN201811093461.2A 2018-09-19 2018-09-19 最短路径查询方法、系统、计算机设备和存储介质 Active CN109492111B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811093461.2A CN109492111B (zh) 2018-09-19 2018-09-19 最短路径查询方法、系统、计算机设备和存储介质
PCT/CN2018/124237 WO2020056984A1 (zh) 2018-09-19 2018-12-27 最短路径查询方法、系统、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811093461.2A CN109492111B (zh) 2018-09-19 2018-09-19 最短路径查询方法、系统、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN109492111A CN109492111A (zh) 2019-03-19
CN109492111B true CN109492111B (zh) 2023-05-30

Family

ID=65690485

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811093461.2A Active CN109492111B (zh) 2018-09-19 2018-09-19 最短路径查询方法、系统、计算机设备和存储介质

Country Status (2)

Country Link
CN (1) CN109492111B (zh)
WO (1) WO2020056984A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347810B (zh) * 2019-05-30 2022-08-19 重庆金融资产交易所有限责任公司 对话式检索回答方法、装置、计算机设备及存储介质
CN110377628A (zh) * 2019-07-23 2019-10-25 京东方科技集团股份有限公司 一种信息获取方法、装置及电子设备
CN110837550B (zh) * 2019-11-11 2023-01-17 中山大学 基于知识图谱的问答方法、装置、电子设备及存储介质
CN111309944B (zh) * 2020-01-20 2023-07-14 同方知网数字出版技术股份有限公司 一种基于图数据库的数字人文搜索方法
CN111640218B (zh) * 2020-05-28 2022-06-21 广东电网有限责任公司 一种无人机巡检路线规划方法、装置、终端及存储介质
CN112231350B (zh) * 2020-10-13 2022-04-12 汉唐信通(北京)科技有限公司 一种基于知识图谱的企业商机挖掘方法和装置
CN112396184B (zh) * 2020-12-01 2023-09-05 中山大学 一种基于图结构数据的关系挖掘方法及系统
CN112749212A (zh) * 2021-01-20 2021-05-04 青岛以萨数据技术有限公司 一种基于六度空间理论的人员库系统平台及构建方法
CN112949745B (zh) * 2021-03-23 2024-04-19 中国检验检疫科学研究院 多源数据的融合处理方法、装置、电子设备及存储介质
CN113568324B (zh) * 2021-06-29 2023-10-20 之江实验室 一种基于仿真演绎的知识图谱修正方法
CN113723047A (zh) * 2021-07-27 2021-11-30 山东旗帜信息有限公司 一种基于法律文件的图谱构建方法、设备及介质
CN113569030A (zh) * 2021-07-29 2021-10-29 北京三快在线科技有限公司 信息查询方法、装置、设备及存储介质
CN114543796B (zh) * 2022-02-14 2023-09-08 国网电力科学研究院有限公司 一种室外定位方法、系统及存储介质
CN115878713B (zh) * 2022-10-27 2023-10-20 浙江大学 一种复杂大规模sdn网络实体快速查询方法及平台

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107368468A (zh) * 2017-06-06 2017-11-21 广东广业开元科技有限公司 一种运维知识图谱的生成方法及系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102332009B (zh) * 2011-09-02 2013-09-04 北京大学 一种大规模数据集上的关系查询方法
GB201118332D0 (en) * 2011-10-24 2011-12-07 Skype Ltd Processing search queries in a network of interconnected nodes
CN107016459A (zh) * 2016-03-23 2017-08-04 西安电子科技大学 一种基于网络社区信息的点到点最短路径计算方法
CN107369098B (zh) * 2016-05-11 2021-10-26 华为技术有限公司 社交网络中数据的处理方法和装置
CN106445988A (zh) * 2016-06-01 2017-02-22 上海坤士合生信息科技有限公司 一种大数据的智能处理方法和系统
CN106897273B (zh) * 2017-04-12 2018-02-06 福州大学 一种基于知识图谱的网络安全动态预警方法
CN107451210B (zh) * 2017-07-13 2020-11-20 北京航空航天大学 一种基于查询松弛结果增强的图匹配查询方法
CN108073711B (zh) * 2017-12-21 2022-01-11 北京大学深圳研究生院 一种基于知识图谱的关系抽取方法和系统
CN108491556A (zh) * 2018-04-18 2018-09-04 武汉轻工大学 基于大数据降维处理的公交线路查询方法和查询设备

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107368468A (zh) * 2017-06-06 2017-11-21 广东广业开元科技有限公司 一种运维知识图谱的生成方法及系统

Also Published As

Publication number Publication date
WO2020056984A1 (zh) 2020-03-26
CN109492111A (zh) 2019-03-19

Similar Documents

Publication Publication Date Title
CN109492111B (zh) 最短路径查询方法、系统、计算机设备和存储介质
CN109299090B (zh) 基金中心度计算方法、系统、计算机设备和存储介质
US10977293B2 (en) Technology incident management platform
US10296658B2 (en) Use of context-dependent statistics to suggest next steps while exploring a dataset
US11734233B2 (en) Method for classifying an unmanaged dataset
US11544578B2 (en) Method, device and equipment for fusing different instances describing same entity
US10475045B2 (en) Database management methods, systems, and devices for identifying related customer support tickets
US9519862B2 (en) Domains for knowledge-based data quality solution
US20130117202A1 (en) Knowledge-based data quality solution
US20130117219A1 (en) Architecture for knowledge-based data quality solution
US10210551B1 (en) Calculating data relevance for valuation
US20210149851A1 (en) Systems and methods for generating graph data structure objects with homomorphism
US20210334292A1 (en) System and method for reconciliation of data in multiple systems using permutation matching
CN109408643B (zh) 基金相似度计算方法、系统、计算机设备和存储介质
CN110737779B (zh) 知识图谱的构建方法、装置、存储介质和电子设备
US20170372349A1 (en) Augmenting missing values in historical or market data for deals
US20170228402A1 (en) Inconsistency Detection And Correction System
US10503480B2 (en) Correlation based instruments discovery
CN112131259B (zh) 一种相似恶意软件推荐方法、装置、介质和设备
US8166453B2 (en) Method and system for inconsistency resolution with cycle detection in a model-driven software environment
US10671668B2 (en) Inferring graph topologies
EP2731021B1 (en) Apparatus, program, and method for reconciliation processing in a graph database
Idrissou et al. Network metrics for assessing the quality of entity resolution between multiple datasets
Langer et al. Fame. q-a formal approach to master quality in enterprise linked data
US10698936B2 (en) Generating and using multiple representations of data objects in computing systems and environments

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant