CN109299090A - 基金知识推理方法、系统、计算机设备和存储介质 - Google Patents

基金知识推理方法、系统、计算机设备和存储介质 Download PDF

Info

Publication number
CN109299090A
CN109299090A CN201811019068.9A CN201811019068A CN109299090A CN 109299090 A CN109299090 A CN 109299090A CN 201811019068 A CN201811019068 A CN 201811019068A CN 109299090 A CN109299090 A CN 109299090A
Authority
CN
China
Prior art keywords
fund
entity
knowledge
node
subgraph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811019068.9A
Other languages
English (en)
Other versions
CN109299090B (zh
Inventor
陈泽晖
胡逸凡
黄鸿顺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201811019068.9A priority Critical patent/CN109299090B/zh
Priority to PCT/CN2018/124220 priority patent/WO2020048058A1/zh
Publication of CN109299090A publication Critical patent/CN109299090A/zh
Application granted granted Critical
Publication of CN109299090B publication Critical patent/CN109299090B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Computational Linguistics (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Software Systems (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Stored Programmes (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及软件开发和维护技术领域,尤其涉及一种基金知识推理方法、系统、计算机设备和存储介质。基金知识推理方法包括:抽取基金知识并建立基金知识元库;对基金知识元库中的基金知识进行融合并将其存储于数据库中;到基金知识元库中筛选出与查询请求对应的子图,计算子图中各实体的节点中心度,将节点中心度的计算结果返回至前台进行展示;计算子图中两两实体间的最短路径,并根据所述两两实体间的最短路径来计算每个实体的节点中心度。本发明通过基金知识图谱的构建与维护,实现了以多角度、动态地对图谱中各节点的中心性分析功能,提高了工作效率。

Description

基金知识推理方法、系统、计算机设备和存储介质
技术领域
本发明涉及图论与网络分析技术领域,特别是涉及基金知识推理方法、系统、计算机设备和存储介质。
背景技术
在图论与网络分析中,中心性是判定网络中节点重要性的指标,是节点重要性的量化,这些中心性度量指标最初应用在社会网络中,随后被推广到其它类型网络的分析中。在社会网络中,一项基本任务是需要鉴定一群人中哪些人比其他人更具有影响力,帮助研究人员分析和理解扮演者在网络中担当的角色。为完成这种分析,这些人以及人与人之间的联系被模型化成网络图,网络图中的节点代表人,节点之间的连边表示人与人之间的联系。基于建立起来的网络结构图,使用一系列中心性度量方法就可以计算出哪个个体比其他个体更重要。
目前的知识图谱,只是由知识点相互连接而成的关系网络展示,该关系网络都是由节点和节点关系构成,但是现有技术对某个节点对其他节点的重要程度,不能很好地进行多角度和动态分析。
发明内容
基于此,有必要针对现有技术不能很好地对关系网络中某个节点对其它节点的重要程度进行多角度的动态分析的问题,提供一种基金知识推理方法、系统、计算机设备和存储介质。
一种基金知识推理方法,所述基金知识推理方法,包括如下步骤:
抽取基金知识推理平台中的信息源中的基金知识后建立基金知识元库,所述基金知识元库中包含多个子图,各子图中包括实体、关系和属性;
根据预设规则将所述基金知识元库中的所述基金知识进行融合;
将经过融合的所述基金知识元库存储于数据库中;
在基金知识推理平台的前台输入查询请求,并将所述查询请求发送至基金知识推理平台的后台;
到所述基金知识元库中筛选出与所述查询请求对应的子图,并计算该子图中的实体的节点中心度,将所述节点中心度的计算结果返回至所述前台进行展示;
接收与所述查询请求对应的子图,计算所述子图中两两实体间的最短路径,并根据所述两两实体间的最短路径来计算每个实体的节点中心度。
在一个实施例中,所述抽取基金知识推理平台中的信息源中的基金知识后建立基金知识元库,包括:
对蕴含于信息源中的基金知识进行识别,识别所述基金知识的数据类型和数据来源;
根据所述基金知识的数据类型和数据来源进行筛选与归纳,筛选出具有相同所述数据类型和相同所述数据来源的所述基金知识并归纳为一类;
根据归纳整理后的所述基金知识,建立基金知识元库。
在一个实施例中,所述根据预设规则将所述基金知识元库中的所述基金知识进行融合,包括:
对所述基金知识元库中的各实体进行ID标识;
对所述基金知识元库中的各实体进行判断,具有统一ID标识的为同一实体,将所述同一实体进行关系和属性的合并,不具有统一ID标识的,则根据各实体属性的相似度进行合并。
在一个实施例中,所述将经过融合的所述基金知识元库存储于数据库中,还包括定期检查与更新所述基金知识元库中的实体、关系和属性,定期检查与更新包括在固定时间段内检查所述基金知识元库中的所述实体与所述关系是否有变化,若所述实体或所述关系发生了变化,则将变化后的所述实体与所述关系更新至所述基金知识元库中。
在一个实施例中,所述到所述基金知识元库中筛选出与所述查询请求对应的子图,并计算该子图中的实体的节点中心度,将所述节点中心度的计算结果返回至所述前台进行展示,包括:
接收所述查询请求,并根据所述查询请求的关键词到所述基金知识元库中匹配对应的子图;
对所述关键词包含的一个或多个所述子图进行节点中心度的计算;
获取各所述子图的节点中心度的结果,并将最符合所述查询请求的所述节点中心度的结果返回至所述前台;
所述节点中心度的结果以json数据格式返回至所述前台,并用d3js技术将所述节点中心度的结果在前台展示出路径图。
在一个实施例中,所述接收与所述查询请求对应的子图,计算所述子图中两两实体间的最短路径,并根据所述两两实体间的最短路径来计算每个实体的节点中心度,包括对带权重多源最短路径的计算,所述带权重多源最短路径的计算包括根据预设规则按实体关系类型分配边的权重,再通过预设算法来计算多源最短路径;
所述多源最短路径包含所述子图中任意两两实体的最短路径;
对所述子图中两两实体间的最短路径进行计算的同时,还包括点度中心度的计算;
所述点度中心度包括所述子图中某个所述实体的所述关系的数量。
在一个实施例中,所述接收与所述查询请求对应的子图,计算所述子图中两两实体间的最短路径,并根据所述两两实体间的最短路径来计算每个实体的节点中心度还包括:
获取所述子图中任意两两实体的多源最短路径的计算结果;
将所述多源最短路径的计算结果代入公式(1)和公式(2)中分别计算对应节点的中介中心度和紧密中心度,其中公式(1)如下:
公式(1)表示节点i在子图中的中介中心度,其中,Pjk表示任意两个节点jk之间的最短路径个数,Pjk(i)是节点jk之间通过节点i的最短路径个数,所述中介中心度包含一个节点担任其它两个节点之间最短路径的桥梁的次数,该次数越高时,所述中介节点度越大,公式(2)如下:
公式(2)表示节点x在子图中的紧密中心度,d(y,x)表示节点x到任意节点y的最短路径的长度,即节点x的紧密中心度是x到其它所有节点的最短路径距离之和的倒数,所述紧密中心度包含一个节点在所述子图中所处于的网络中心位置的程度,若一个节点与许多其它节点都很靠近,该节点越接近网络中心位置;
将该节点的所述中介中心度和所述紧密中心度进行求和运算,该求和结果即为节点中心度。
基于相同的构思,本申请还提供一种基金知识推理系统,所述基金知识推理系统包括:
抽取单元,设置为抽取基金知识推理平台中的信息源中的基金知识后建立基金知识元库,所述基金知识元库中包含多个子图,各子图中包括实体、关系和属性;
融合单元,设置为根据预设规则将所述基金知识元库中的所述基金知识进行融合;
存储单元,设置为将经过融合的所述基金知识元库存储于数据库中;
输入单元,设置为在基金知识推理平台的前台输入查询请求,并将所述查询请求发送至基金知识推理平台的后台;
查询单元,设置为到所述基金知识元库中筛选出与所述查询请求对应的子图,并计算该子图中的实体的节点中心度,将所述节点中心度的计算结果返回至所述前台进行展示;
运算单元,设置为接收与所述查询请求的对应的子图,计算所述子图中两两实体间的最短路径,并根据所述两两实体间的最短路径来计算每个实体的节点中心度。
基于相同的技术构思,本申请实施例还提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被一个或多个所述处理器执行时,使得一个或多个所述处理器执行上述基金知识推理方法的步骤。
基于相同的技术构思,本申请实施例还提供了一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个所述处理器执行如上述基金知识推理方法的步骤。
上述基金知识推理方法、系统、计算机设备和存储介质,通过抽取基金知识并建立基金知识元库;对基金知识元库中的基金知识进行融合并将其存储于数据库中;到基金知识元库中筛选出与查询请求对应的子图,计算子图中各实体的节点中心度,将节点中心度的计算结果返回至前台进行展示;计算子图中两两实体间的最短路径,并根据所述两两实体间的最短路径来计算每个实体的节点中心度。因此,对于输入的某一查询请求,实时运算平台运用一种包含中心性度量算法的分析框架对该查询请求进行计算分析,实现了多角度、动态地对全图谱或各子图中各节点的中心性分析,提高了工作效率。
附图说明
图1为本申请在一个实施例中基金知识推理方法的流程图;
图2为本申请在一个实施例中图谱构建过程的流程图;
图3为本申请在一个实施例中图谱查询过程的流程图;
图4为本申请在一个实施例中实施运算过程的流程图;
图5为本申请在一个实施例中基金知识推理系统的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1为本申请在一个实施例中提供的基金知识推理方法的流程图,如图所示,包括:
S1、抽取基金知识推理平台中的信息源中的基金知识后建立基金知识元库,所述基金知识元库中包含多个子图,各子图中包括实体、关系和属性;
本步骤通过把蕴含于信息源中的知识经过识别、理解、筛选、归纳等过程抽取出来,建立知识元库,所述知识元库包括实体、关系和属性。
S2、根据预设规则将所述基金知识元库中的所述基金知识进行融合;
本步骤通过使来自不同知识源的知识在同一框架规范下进行数据整合,并对所述知识元库中的实体进行ID标识,该融合过程中包括新数据替换旧数据的融合,还包括根据预设融合规则对知识的质量进行评估和带权重的融合。
S3、将经过融合的所述基金知识元库存储于数据库中;
本步骤将经过融合处理后的数据进行存储,存储数据库可以采用关系数据库,RDF数据库,图数据库等,或者采用任意数据库相结合的方式。
S4、在基金知识推理平台的前台输入查询请求,并将所述查询请求发送至基金知识推理平台的后台;
本步骤通过在基金知识推理平台的前台输入查询请求,所述查询请求包括用户需要基金A的数据,所述前台将包含了基金A的所述查询请求传送至基金知识推理平台的后台。
S5、到所述基金知识元库中筛选出与所述查询请求对应的子图,并计算该子图中的实体的节点中心度,将所述节点中心度的计算结果返回至所述前台进行展示;
本步骤中所述后台根据所述查询请求中包含的基金A的关键词到所述基金知识元库中筛选出与基金A对应的子图,并将该对应的子图传送中基金知识推理平台的实时运算器中进行各实体的节点中心度的计算,所述后台从所述实时运算器中获取该计算结果,将该计算结果以json数据格式返回至所述前台,所述前台运用d3js技术将该计算结果进行展示。
S6、接收与所述查询请求对应的子图,计算所述子图中两两实体间的最短路径,并根据所述两两实体间的最短路径来计算每个实体的节点中心度;
本步骤中所述实时运算器获取所述子图,根据预设规则按实体关系类型分配边的权重,再通过预设算法计算两两实体间的最短路径,根据计算得到的两两实体间的最短路径,再根据预设算法计算出所述子图中各节点的中介中心度和紧密中心的,将子图中各节点的中介中心度和紧密中心度进行求和运算,得到该节点的节点中心度。
本申请通过上述步骤方法,实现了对知识图谱中各节点中心度的计算功能,通过该计算能够多角度和动态的分析图谱中某个节点对其它节点的重要程度,更加有助于挖掘知识图谱中各节点之间的潜在关系。
图2为本申请在一个实施例中提供的图谱构建过程的流程图,如图所示,包括:
S101、对蕴含于信息源中的基金知识进行识别,识别所述基金知识的数据类型和数据来源;
本步骤中通过对基金知识元库中的知识根据其数据类型和数据来源进行识别,例如企业内部数据库的数据为结构化数据,天天基金网等网站中的图表数据为半结构化数据,基金研报、基金经理简历、雪球社区评论等整篇文本数据为非结构化数据。
S102、根据所述基金知识的数据类型和数据来源进行筛选与归纳,筛选出具有相同所述数据类型和相同所述数据来源的所述基金知识并归纳为一类;
本步骤中将具有同一数据类型和同一数据来源的知识数据归纳为同一类,并且根据其不同的数据类型采取不同的抽取方法,例如对于结构化数据,通过人工设定规则来进行数据抽取,对于半结构化数据,通过爬虫或正规表达式匹配来进行数据抽取,对于非结构化数据,通过自然语言处理来进行数据抽取。
S103、根据归纳整理后的所述基金知识,建立基金知识元库。
本实施例中通过对信息源中的数据进行抽取并建立了基金知识元库,为后续对所述基金知识元库中的数据进行进一步的整合提供了基础。
在一个实施例中,所述根据预设规则将所述基金知识元库中的所述基金知识进行融合,包括:
对所述基金知识元库中的各实体进行ID标识;
本步骤中在对所述知识元库中的知识数据根据预设融合规则进行融合之前,先对所有的实体进行ID标识,例如,基金实体和股票实体以市场交易代码作为ID标识。
对所述基金知识元库中的各实体进行判断,具有统一ID标识的为同一实体,将所述同一实体进行关系和属性的合并,不具有统一ID标识的,则根据各实体属性的相似度进行合并。
本步骤中对数据的融合包括新数据替换旧数据的融合,还包括根据预设融合规则对知识的质量进行评估和带权重的融合,该预设融合规则即将所述基金知识元库中的实体进行ID标识,对于同一ID标识的实体进行关系与属性的融合,对于不具有同一ID标识的实体进行相似属性的融合。
本实施例中通过对所述基金知识元库中的实体进行ID标识,再将进行ID标识的实体根据预设融合规则进行融合,将所述知识元库中的知识进行有序的整合,为后续能够快速的在所述基金知识元库中查找到需要的基金的基金信息。
在一个实施例中,所述将经过融合的所述基金知识元库存储于数据库中之后,还包括定期检查与更新所述基金知识元库中的实体、关系和属性,所述定期检查与更新包括在固定时间段内检查所述基金知识元库中的所述实体与所述关系是否有变化,若所述实体或所述关系发生了变化,则将变化后的所述实体与所述关系更新至所述基金知识元库中。
本步骤中所述数据库包括关系数据库、RDF数据库、图数据库或其中任意数据库相结合的方式,所述定期检查与更新包括在固定时间段内检查所述基金知识元库中的所述实体与所述关系是否有变化,若所述实体或所述关系发生了变化,则将变化后的所述实体与所述关系更新至所述基金知识元库中。
本实施例中通过对所述基金知识元库进行定期检查,有助于更好的维护所述基金知识元库。
图3为本申请在一个实施例中提供的图谱查询过程的流程图,如图3所示,该流程图包括:
S501、接收所述查询请求,并根据所述查询请求的关键词到所述基金知识元库中匹配对应的子图;
本步骤中所述后台接收所述前台发送的所述查询请求,比如用户需要查询范围内人脉最广/最核心的基金经理,所述后台获取该查询请求的关键词,比如该查询条件为复旦大学校友中人脉最广的基金经理是谁,易方达基金公司旗下最核心的基金经理是谁,并到所述基金知识元库中匹配到对应的子图。
S502、对所述关键词包含的一个或多个所述子图进行节点中心度的计算;
S503、根据所述查询请求的关键词到所述基金知识元库中匹配到与该关键词对应的一个或多个子图,比如匹配到的子图分别为复旦大学子图和易方达基金公司子图,并将对应子图传送至所述实时运算器中进行节点中心度的计算。
S504、获取各所述子图的节点中心度的结果,并将最符合所述查询请求的所述节点中心度的结果返回至所述前台;
本步骤中所述后台从所述实时运算器中获取各子土的节点中心度的计算结果,比如分别获取复旦大学子图和易方达基金公司子图的计算结果,将最符合所述查询请求的子图的计算结果返回至所述前台。
S505、所述节点中心度的结果以json数据格式返回至所述前台,并用d3js技术将所述节点中心度的结果在前台展示出路径图。
本实施例中通过对所述查询请求匹配对应子图的过程,有助于快速的定位与该查询请求最相近的图谱关系,有助于快速的对该查询请求中包含的实体进行节点中心性分析。
图4为本申请在一个实施例中提供的实时运算过程的流程图,如图4所示,该流程图包括对带权重多源最短路径的计算,所述带权重多源最短路径的计算包括根据预设规则按实体关系类型分配边的权重,再通过预设算法来计算多源最短路径;
S601、所述多源最短路径包含所述子图中任意两两实体的最短路径;
本步骤中根据预设规则按所述预设规则,例如基金经历之间的关系是有权重的,如果两个基金经理之间的关系若为亲属、同导师、共同管理过同一个基金的,则权重设置为1;如果两个基金经理之间的关系若为同所学校毕业的、同公司或同学的,则权重设置为2。
S602、对所述子图中两两实体间的最短路径进行计算的同时,还包括点度中心度的计算,所述点度中心度包括所述子图中某个所述实体的所述关系的数量。
本实施例中通过根据预设规则计算出所述子图中两两实体间的最短路径,为后续计算所述子图中各实体的节点中心度提供基础。
在一个实施例中,接收与所述查询请求对应的子图,计算所述子图中两两实体间的最短路径,并根据所述两两实体间的最短路径来计算每个实体的节点中心度还包括:
获取所述子图中任意两两实体的多源最短路径的计算结果;
将所述多源最短路径的计算结果代入公式(1)和公式(2)中分别计算对应节点的中介中心度和紧密中心度,其中公式(1)如下:
公式(1)表示节点i在子图中的中介中心度,其中,Pjk表示任意两个节点jk之间的最短路径个数,Pjk(i)是节点jk之间通过节点i的最短路径个数,所述中介中心度包含一个节点担任其它两个节点之间最短路径的桥梁的次数,该次数越高时,所述中介节点度越大,公式(2)如下:
公式(2)表示节点x在子图中的紧密中心度,d(y,x)表示节点x到任意节点y的最短路径的长度,即节点x的紧密中心度是x到其它所有节点的最短路径距离之和的倒数,所述紧密中心度包含一个节点在所述子图中所处于的网络中心位置的程度,若一个节点与许多其它节点都很靠近,该节点越接近网络中心位置;
将该节点的所述中介中心度和所述紧密中心度进行求和运算,该求和结果即为节点中心度。
本实施例中通过所述子图中两两实体间的最短路径的计算结果,结合预设的算法,对所述子图中的实体进行中介中心度和紧密中心度的计算,通过将中介中心度和紧密中心度进行求和最终得到对应实体的节点中心度的计算结果,实现了多角度、动态地对全图谱和各子图中各节点的中心性分析,提高了工作效率。
基于相同的构思,本申请还提出了一种基金知识推理系统,如图5所示,所述基金知识推理系统包括抽取单元、融合单元、存储单元、输入单元、查询单元和运算单元,其中:抽取单元,设置为抽取基金知识推理平台中的信息源中的基金知识后建立基金知识元库,所述基金知识元库中包含多个子图,各子图中包括实体、关系和属性;融合单元,设置为根据预设规则将所述基金知识元库中的所述基金知识进行融合;存储单元,设置为将经过融合的所述基金知识元库存储于数据库中;输入单元,设置为在基金知识推理平台的前台输入查询请求,并将所述查询请求发送至基金知识推理平台的后台;查询单元,设置为到所述基金知识元库中筛选出与所述查询请求对应的子图,并计算该子图中的实体的节点中心度,将所述节点中心度的计算结果返回至所述前台进行展示;运算单元,设置为接收与所述查询请求的对应的子图,计算所述子图中两两实体间的最短路径,并根据所述两两实体间的最短路径来计算每个实体的节点中心度。
基于相同的技术构思,本申请实施例还提供一种计算机设备,所述计算机设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被一个或多个处理器执行时,使得一个或多个所述处理器执行计算机可读指令时实现上述各实施例中的基金知识推理方法的步骤。
基于相同的技术构思,本申请实施例还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个所述处理器执行所述计算机可读指令时实现上述各实施例中的基金知识推理方法的步骤。所述存储介质可以为非易失性存储介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁盘或光盘等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明一些示例性实施例,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种基金知识推理方法,其特征在于,所述基金知识推理方法包括:
抽取基金知识推理平台中的信息源中的基金知识后建立基金知识元库,所述基金知识元库中包含多个子图,各子图中包括实体、关系和属性;
根据预设规则将所述基金知识元库中的所述基金知识进行融合;
将经过融合的所述基金知识元库存储于数据库中;
在基金知识推理平台的前台输入查询请求,并将所述查询请求发送至基金知识推理平台的后台;
到所述基金知识元库中筛选出与所述查询请求对应的子图,并计算该子图中的实体的节点中心度,将所述节点中心度的计算结果返回至所述前台进行展示;
接收与所述查询请求对应的子图,计算所述子图中两两实体间的最短路径,并根据所述两两实体间的最短路径来计算每个实体的节点中心度。
2.如权利要求1所述的一种基金知识推理方法,其特征在于,所述抽取基金知识推理平台中的信息源中的基金知识后建立基金知识元库,包括:
对蕴含于信息源中的基金知识进行识别,识别所述基金知识的数据类型和数据来源;
根据所述基金知识的数据类型和数据来源进行筛选与归纳,筛选出具有相同所述数据类型和相同所述数据来源的所述基金知识并归纳为一类;
根据归纳整理后的所述基金知识,建立基金知识元库。
3.如权利要求1所述的一种基金知识推理方法,其特征在于,所述根据预设规则将所述基金知识元库中的所述基金知识进行融合,包括:
对所述基金知识元库中的各实体进行ID标识;
对所述基金知识元库中的各实体进行判断,具有统一ID标识的为同一实体,将所述同一实体进行关系和属性的合并,不具有统一ID标识的,则根据各实体属性的相似度进行合并。
4.如权利要求1所述的一种基金知识推理方法,其特征在于,所述将经过融合的所述基金知识元库存储于数据库中之后,还包括定期检查与更新所述基金知识元库中的实体、关系和属性,所述定期检查与更新包括在固定时间段内检查所述基金知识元库中的所述实体与所述关系是否有变化,若所述实体或所述关系发生了变化,则将变化后的所述实体与所述关系更新至所述基金知识元库中。
5.如权利要求1所述的一种基金知识推理方法,其特征在于,所述到所述基金知识元库中筛选出与所述查询请求对应的子图,并计算该子图中的实体的节点中心度,将所述节点中心度的计算结果返回至所述前台进行展示,包括:
接收所述查询请求,并根据所述查询请求的关键词到所述基金知识元库中匹配对应的子图;
对所述关键词包含的一个或多个所述子图进行节点中心度的计算;
获取各所述子图的节点中心度的结果,并将最符合所述查询请求的所述节点中心度的结果返回至所述前台;
所述节点中心度的结果以json数据格式返回至所述前台,并用d3js技术将所述节点中心度的结果在前台展示出路径图。
6.如权利要求1所述的一种基金知识推理方法,其特征在于,所述接收与所述查询请求对应的子图,计算所述子图中两两实体间的最短路径,并根据所述两两实体间的最短路径来计算每个实体的节点中心度,包括对带权重多源最短路径的计算,所述带权重多源最短路径的计算包括根据预设规则按实体关系类型分配边的权重,再通过预设算法来计算多源最短路径;
所述多源最短路径包含所述子图中任意两两实体的最短路径;
对所述子图中两两实体间的最短路径进行计算的同时,还包括点度中心度的计算;
所述点度中心度包括所述子图中某个所述实体的所述关系的数量。
7.如权利要求6所述的一种基金知识推理方法,其特征在于,所述接收与所述查询请求对应的子图,计算所述子图中两两实体间的最短路径,并根据所述两两实体间的最短路径来计算每个实体的节点中心度还包括:
获取所述子图中任意两两实体的多源最短路径的计算结果;
将所述多源最短路径的计算结果代入公式(1)和公式(2)中分别计算对应节点的中介中心度和紧密中心度,其中公式(1)如下:
公式(1)表示节点i在子图中的中介中心度,其中,Pjk表示任意两个节点jk之间的最短路径个数,Pjk(i)是节点jk之间通过节点i的最短路径个数,所述中介中心度包含一个节点担任其它两个节点之间最短路径的桥梁的次数,该次数越高时,所述中介节点度越大,公式(2)如下:
公式(2)表示节点x在子图中的紧密中心度,d(y,x)表示节点x到任意节点y的最短路径的长度,即节点x的紧密中心度是x到其它所有节点的最短路径距离之和的倒数,所述紧密中心度包含一个节点在所述子图中所处于的网络中心位置的程度,若一个节点与许多其它节点都很靠近,该节点越接近网络中心位置;
将该节点的所述中介中心度和所述紧密中心度进行求和运算,该求和结果即为节点中心度。
8.一种基金知识推理系统,其特征在于,所述基金知识推理系统包括:
抽取单元,设置为抽取基金知识推理平台中的信息源中的基金知识后建立基金知识元库,所述基金知识元库中包含多个子图,各子图中包括实体、关系和属性;
融合单元,设置为根据预设规则将所述基金知识元库中的所述基金知识进行融合;
存储单元,设置为将经过融合的所述基金知识元库存储于数据库中;
输入单元,设置为在基金知识推理平台的前台输入查询请求,并将所述查询请求发送至基金知识推理平台的后台;
查询单元,设置为到所述基金知识元库中筛选出与所述查询请求对应的子图,并计算该子图中的实体的节点中心度,将所述节点中心度的计算结果返回至所述前台进行展示;
运算单元,设置为接收与所述查询请求的对应的子图,计算所述子图中两两实体间的最短路径,并根据所述两两实体间的最短路径来计算每个实体的节点中心度。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被一个或多个所述处理器执行时,使得一个或多个所述处理器执行如权利要求1至7中任一项所述的基金知识推理方法的步骤。
10.一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个所述处理器执行如权利要求1至7中任一项所述的基金知识推理方法的步骤。
CN201811019068.9A 2018-09-03 2018-09-03 基金中心度计算方法、系统、计算机设备和存储介质 Active CN109299090B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811019068.9A CN109299090B (zh) 2018-09-03 2018-09-03 基金中心度计算方法、系统、计算机设备和存储介质
PCT/CN2018/124220 WO2020048058A1 (zh) 2018-09-03 2018-12-27 基金知识推理方法、系统、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811019068.9A CN109299090B (zh) 2018-09-03 2018-09-03 基金中心度计算方法、系统、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN109299090A true CN109299090A (zh) 2019-02-01
CN109299090B CN109299090B (zh) 2023-05-30

Family

ID=65166045

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811019068.9A Active CN109299090B (zh) 2018-09-03 2018-09-03 基金中心度计算方法、系统、计算机设备和存储介质

Country Status (2)

Country Link
CN (1) CN109299090B (zh)
WO (1) WO2020048058A1 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347757A (zh) * 2019-07-12 2019-10-18 北京熵简科技有限公司 一种智能投研知识图谱系统
CN111369331A (zh) * 2020-02-28 2020-07-03 中国工商银行股份有限公司 交叉性风险防控方法及装置
CN111782820A (zh) * 2020-06-30 2020-10-16 京东数字科技控股有限公司 知识图谱创建方法及装置、可读存储介质及电子设备
CN111814001A (zh) * 2019-04-11 2020-10-23 杭州海康威视数字技术股份有限公司 反馈信息的方法和装置
CN112163094A (zh) * 2020-08-25 2021-01-01 中国科学院计算机网络信息中心 一种科技资源汇聚与持续服务方法及装置
CN112199960A (zh) * 2020-11-12 2021-01-08 北京三维天地科技股份有限公司 一种标准知识元粒度解析系统
CN112347113A (zh) * 2020-09-16 2021-02-09 北京中兵数字科技集团有限公司 航空数据融合方法、航空数据融合装置和存储介质
CN112948469A (zh) * 2021-04-16 2021-06-11 平安科技(深圳)有限公司 数据挖掘方法、装置、计算机设备及存储介质
CN115994231A (zh) * 2023-03-24 2023-04-21 西南石油大学 稠油配汽优化的知识图谱优化方法
CN111814001B (zh) * 2019-04-11 2024-05-10 杭州海康威视数字技术股份有限公司 反馈信息的方法和装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111813951A (zh) * 2020-06-18 2020-10-23 国网上海市电力公司 一种基于技术图谱的关键点识别方法
CN112445875B (zh) * 2020-12-14 2024-03-01 招商局金融科技有限公司 数据关联及检验方法、装置、电子设备及存储介质
CN113723047A (zh) * 2021-07-27 2021-11-30 山东旗帜信息有限公司 一种基于法律文件的图谱构建方法、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103179052A (zh) * 2011-12-20 2013-06-26 中国科学院声学研究所 一种基于接近度中心性的虚拟资源分配方法及系统
CN104636424A (zh) * 2014-12-02 2015-05-20 南昌大学 一种基于图谱分析构建文献综述框架的方法
CN106919689A (zh) * 2017-03-03 2017-07-04 中国科学技术信息研究所 基于术语释义知识单元的专业领域知识图谱动态构建方法
CN107103403A (zh) * 2017-03-06 2017-08-29 广东工业大学 一种用cio/cto社交网络预测科技公司业绩的方法
CN108052547A (zh) * 2017-11-27 2018-05-18 华中科技大学 基于问句和知识图结构分析的自然语言问答方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201320225D0 (en) * 2013-11-15 2014-01-01 Microsoft Corp Processing search queries using a data structure
CN105389622B (zh) * 2015-10-20 2017-04-26 西安交通大学 一种基于知识地图的多约束学习路径推荐方法
CN106294588A (zh) * 2016-07-28 2017-01-04 广东中标数据科技股份有限公司 快速搜索所要查询内容的方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103179052A (zh) * 2011-12-20 2013-06-26 中国科学院声学研究所 一种基于接近度中心性的虚拟资源分配方法及系统
CN104636424A (zh) * 2014-12-02 2015-05-20 南昌大学 一种基于图谱分析构建文献综述框架的方法
CN106919689A (zh) * 2017-03-03 2017-07-04 中国科学技术信息研究所 基于术语释义知识单元的专业领域知识图谱动态构建方法
CN107103403A (zh) * 2017-03-06 2017-08-29 广东工业大学 一种用cio/cto社交网络预测科技公司业绩的方法
CN108052547A (zh) * 2017-11-27 2018-05-18 华中科技大学 基于问句和知识图结构分析的自然语言问答方法及系统

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111814001B (zh) * 2019-04-11 2024-05-10 杭州海康威视数字技术股份有限公司 反馈信息的方法和装置
CN111814001A (zh) * 2019-04-11 2020-10-23 杭州海康威视数字技术股份有限公司 反馈信息的方法和装置
CN110347757A (zh) * 2019-07-12 2019-10-18 北京熵简科技有限公司 一种智能投研知识图谱系统
CN111369331A (zh) * 2020-02-28 2020-07-03 中国工商银行股份有限公司 交叉性风险防控方法及装置
CN111782820A (zh) * 2020-06-30 2020-10-16 京东数字科技控股有限公司 知识图谱创建方法及装置、可读存储介质及电子设备
CN111782820B (zh) * 2020-06-30 2024-05-17 京东科技控股股份有限公司 知识图谱创建方法及装置、可读存储介质及电子设备
CN112163094A (zh) * 2020-08-25 2021-01-01 中国科学院计算机网络信息中心 一种科技资源汇聚与持续服务方法及装置
CN112347113A (zh) * 2020-09-16 2021-02-09 北京中兵数字科技集团有限公司 航空数据融合方法、航空数据融合装置和存储介质
CN112199960A (zh) * 2020-11-12 2021-01-08 北京三维天地科技股份有限公司 一种标准知识元粒度解析系统
WO2022217712A1 (zh) * 2021-04-16 2022-10-20 平安科技(深圳)有限公司 数据挖掘方法、装置、计算机设备及存储介质
CN112948469B (zh) * 2021-04-16 2023-10-13 平安科技(深圳)有限公司 数据挖掘方法、装置、计算机设备及存储介质
CN112948469A (zh) * 2021-04-16 2021-06-11 平安科技(深圳)有限公司 数据挖掘方法、装置、计算机设备及存储介质
CN115994231A (zh) * 2023-03-24 2023-04-21 西南石油大学 稠油配汽优化的知识图谱优化方法
CN115994231B (zh) * 2023-03-24 2023-05-16 西南石油大学 稠油配汽优化的知识图谱优化方法

Also Published As

Publication number Publication date
WO2020048058A1 (zh) 2020-03-12
CN109299090B (zh) 2023-05-30

Similar Documents

Publication Publication Date Title
CN109299090A (zh) 基金知识推理方法、系统、计算机设备和存储介质
Mardani et al. A novel extended approach under hesitant fuzzy sets to design a framework for assessing the key challenges of digital health interventions adoption during the COVID-19 outbreak
US9892164B2 (en) Reducing a large amount of data to a size available for interactive analysis
CN105653559A (zh) 用于在数据库中进行搜索的方法和装置
Ashraf et al. Increasing employee organizational commitment by correlating goal setting, employee engagement and optimism at workplace
US20180101657A1 (en) Medical risk factors evaluation
Pääkkönen et al. Quality management architecture for social media data
US10998103B2 (en) Medical risk factors evaluation
Kaya et al. Unsupervised link prediction in evolving abnormal medical parameter networks
US20230100996A1 (en) Data analysis and rule generation for providing a recommendation
Zhou et al. Use of artificial neural networks for selective omission in updating road networks
Yuan GIS research to address tensions in geography
Jaouadi et al. A distributed model for sampling large scale social networks
Sahoh et al. Smart emergency management based on social big data analytics: Research trends and future directions
López-Sáncez et al. Towards the automatic identification and monitoring of radicalization activities in twitter
Regin et al. Electronic Tourism as A Destination Marketing Strategy for World Travellers
Sun et al. How we collaborate: characterizing, modeling and predicting scientific collaborations
Shridhar et al. SNAIR: a framework for personalised recommendations based on social network analysis
US10706056B1 (en) Audit log report generator
Zhao et al. Building social networks out of cognitive blocks: factors of interest in agent-based socio-cognitive simulations
Arafeh et al. Sampling online social networks with tailored mining strategies
Zhang et al. Incentive-punitive risk function with interval valued intuitionistic fuzzy information for outsourced software project risk assessment
Bhattacharyya et al. Smart and Innovative Trends in Next Generation Computing Technologies: Third International Conference, NGCT 2017, Dehradun, India, October 30-31, 2017, Revised Selected Papers, Part I
Kehrer et al. A systematic literature review of big data literature for EA evolution
Kpiebaareh et al. User-connection behaviour analysis in service management using bipartite labelled property graph

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant