CN113312517A - 基金知识图谱获取方法、装置和电子设备 - Google Patents
基金知识图谱获取方法、装置和电子设备 Download PDFInfo
- Publication number
- CN113312517A CN113312517A CN202010118488.3A CN202010118488A CN113312517A CN 113312517 A CN113312517 A CN 113312517A CN 202010118488 A CN202010118488 A CN 202010118488A CN 113312517 A CN113312517 A CN 113312517A
- Authority
- CN
- China
- Prior art keywords
- fund
- graph
- attribute
- information
- graph database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000012545 processing Methods 0.000 claims description 15
- 238000004140 cleaning Methods 0.000 claims description 12
- 238000010276 construction Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 230000000007 visual effect Effects 0.000 abstract description 6
- 238000013461 design Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000009193 crawling Effects 0.000 description 4
- 238000011835 investigation Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 239000003999 initiator Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9038—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供一种基金知识图谱获取方法、装置和电子设备,该方法包括:获取基金查询信息;从图数据库中获取与所述基金查询信息对应的知识图谱;其中,所述图数据库由预获取的基金的数据信息确定;显示所述知识图谱,为用户提供可视化的查询结果,用户通过知识图谱可对基金有更全面的了解,便于用户购买到符合自身需求的基金产品,降低经济风险,尽量避免财产损失。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基金知识图谱获取方法、装置和电子设备。
背景技术
知识图谱是一种图结构的知识库,属于知识工程的范畴。不同于普通知识库,知识图谱融合所有学科,将不同来源、不同类型、不同结构的知识单元通过链接关联成图,基于各学科的元数据,为用户提供更广度、更深度的知识体系并不断扩充。
公募基金是指以公开方式向社会公众投资者募集资金并以证券为投资对象的证券投资基金。公募基金是以大众传播手段招募,发起人集合公众资金设立投资基金,进行证券投资。
目前,普通用户获得公募基金信息的渠道较少。银行营销基金理财产品时,由客户经理人工推荐。由于客户经理的专业知识、素质、信任度参差不齐,顾客购买产品时判断的依据偏少且易受倾向干扰,购买到不符合自身需求的产品,引起较大的经济风险,造成财产损失。
发明内容
本发明的目的在于提供一种基金知识图谱获取方法、装置和电子设备,以解决用户购买到不符合自身需求的产品,引起较大的经济风险,造成财产损失的问题。
为了达到上述目的,本发明提供一种基金知识图谱获取方法,包括:
获取基金查询信息;
从图数据库中获取与所述基金查询信息对应的知识图谱;其中,所述图数据库由预获取的基金的数据信息确定;
显示所述知识图谱。
进一步的,所述获取基金查询信息,包括:
显示基金详情页,所述基金详情页包括多个基金信息;
接收用户输入的对所述基金详情页中的第一基金信息的选中操作,获取基金查询信息;
所述显示所述知识图谱,包括:
显示至少包括基金名称、基金经理名称和基金公司名称的知识图谱。
进一步的,所述图数据库的构建过程包括:
获取所述基金的数据信息;
对所述数据信息进行清洗,并对所述数据信息中的字段值进行同一格式化,获得格式化数据信息;
根据所述数据信息获取多个实体,并为所述多个实体中的各实体设置标识;
根据所述格式化数据信息,分别对所述多个实体中的各个实体进行属性匹配,获取所述实体的属性表;
根据所述多个实体中各实体的关系进行三元组抽取,获取关系表,所述关系表用于存储两个不同实体之间的关系;
将所述属性表和所述关系表导入至所述图数据库。
进一步的,所述将所述属性表和所述关系表导入至所述图数据库,包括:
若所述属性表包括嵌套属性或者属性多值,则采用拼接符拼接的方式对所述嵌套属性或者所述属性多值进行处理,并将处理后的所述属性表导入所述图数据库;
将所述关系表导入所述图数据库。
进一步的,所述图数据库的实体包括基金、基金经理以及基金公司。
本发明实施例还提供一种基金知识图谱获取装置,包括:
获取模块,用于获取基金查询信息;
查询模块,用于从图数据库中获取与所述基金查询信息对应的知识图谱;其中,所述图数据库由预获取的基金的数据信息确定;
显示模块,用于显示所述知识图谱。
进一步的,所述获取模块,用于:
显示基金详情页,所述基金详情页包括多个基金信息;
接收用户输入的对所述基金详情页中的第一基金信息的选中操作,获取基金查询信息;
所述显示模块,用于:
显示至少包括基金名称、基金经理名称和基金公司名称的知识图谱。
进一步的,所述图数据库的构建过程包括:
获取所述基金的数据信息;
对所述数据信息进行清洗,并对所述数据信息中的字段值进行同一格式化,获得格式化数据信息;
根据所述数据信息获取多个实体,并为所述多个实体中的各实体设置标识;
根据所述格式化数据信息,分别对所述多个实体中的各个实体进行属性匹配,获取所述实体的属性表;
根据所述多个实体中各实体的关系进行三元组抽取,获取关系表,所述关系表用于存储两个不同实体之间的关系;
将所述属性表和所述关系表导入至所述图数据库。
进一步的,所述将所述属性表和所述关系表导入至所述图数据库,包括:
若所述属性表包括嵌套属性或者属性多值,则采用拼接符拼接的方式对所述嵌套属性或者所述属性多值进行处理,并将处理后的所述属性表导入所述图数据库;
将所述关系表导入所述图数据库。
进一步的,所述图数据库的实体包括基金、基金经理以及基金公司。
本发明实施例还提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现本发明实施例提供的基金知识图谱获取方法中的步骤。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例提供的基金知识图谱获取方法中的步骤。
本发明实施例中,获取基金查询信息;从图数据库中获取与所述基金查询信息对应的知识图谱;其中,所述图数据库由预获取的基金的数据信息确定;显示所述知识图谱,为用户提供可视化的查询结果,用户通过知识图谱可对基金有更全面的了解,便于用户购买到符合自身需求的基金产品,降低经济风险,尽量避免财产损失。
附图说明
图1是本发明实施例提供的基金知识图谱获取方法的流程图;
图2a是本发明实施例提供的基金知识图谱获取流程示意图;
图2b是本发明实施例提供的基金模式构建结构图;
图2c是本发明实施例提供的基金知识图谱显示示意图;
图3是本发明实施例提供的基金知识图谱获取装置的结构图;
图4是本发明实施例提供的一种电子设备的结构图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
请参见图1,图1是本发明实施例提供的一种基金知识图谱获取方法的流程图,如图1所示,本实施提供的基金知识图谱获取方法,应用于电子设备,包括以下步骤:
步骤101、获取基金查询信息。
基金查询信息可为基金代码、基金名称、基金公司、基金代理人中的一项或多项。电子设备可通过用户输入来获取基金查询信息。
步骤102、从图数据库中获取与所述基金查询信息对应的知识图谱;其中,所述图数据库由预获取的基金的数据信息确定。
图数据库中存储有基金相关的实体、实体的属性表、以及各实体之间的关系,根据基金查询信息在图数据库中查询,可获取到对应的知识图谱。基金的数据信息预先获取,例如,通过业务需求对数据进行调研,通过调研结果对数据进行建模设计;根据设计好的模型对数据进行网络爬取或下载,来获得基金的数据信息。基金的数据信息可包括基金的相关信息,例如,基金代码、基金名称、基金公司、基金代理人、日常申购费等中的一项或多项,基金的数据信息具体可根据实际情况灵活设置。
步骤103、显示所述知识图谱。
在电子设备的显示屏上显示获取到的知识图谱,以便于用户查看。
本实施例中,电子设备获取基金查询信息;从图数据库中获取与所述基金查询信息对应的知识图谱;其中,所述图数据库由预获取的基金的数据信息确定;显示所述知识图谱,为用户提供可视化的查询结果,用户通过知识图谱可对基金有更全面的了解,便于用户购买到符合自身需求的基金产品,降低经济风险,尽量避免财产损失。
在本申请一个实施例中,步骤101、获取基金查询信息,包括:
显示基金详情页,所述基金详情页包括多个基金信息;
接收用户输入的对所述基金详情页中的第一基金信息的选中操作,获取基金查询信息;
步骤103、显示所述知识图谱,包括:
显示至少包括基金名称、基金经理名称和基金公司名称的知识图谱。
本实施例中,电子设备在其显示屏上显示基金详情页,基金详情页可包括多个基金信息,每个基金信息可包括基金名称、基金类型、基金代码和基金公司等,多个基金信息可以列表的形式显示,一个基金信息在一行显示。基金详情页上还可包括查询框,用户可在查询框中输入基金查询信息,也可通过点击基金详情页中的一个基金信息,以选中第一基金信息,此种情况下,第一基金信息即为基金查询信息。
电子设备根据基金查询信息在图数据库中查找,获取到根据基金查询信息确定的知识图谱,该知识图谱中包括基金名称、基金经理名称和基金公司名称,用户通过知识图谱,可方便了解到基金、基金经理和基金公司之间的关系,便于用户购买到符合自身需求的基金产品,降低经济风险,尽量避免财产损失。
在本申请一个实施例中,所述图数据库的构建过程包括:
获取所述基金的数据信息;
对所述数据信息进行清洗,并对所述数据信息中的字段值进行同一格式化,获得格式化数据信息;
根据所述数据信息获取多个实体,并为所述多个实体中的各实体设置标识;
根据所述格式化数据信息,分别对所述多个实体中的各实体进行属性匹配,获取实体的属性表;
根据所述多个实体中各实体的关系进行三元组抽取,获取关系表,所述关系表用于存储两个不同实体之间的关系;
将所述属性表和所述关系表导入至所述图数据库。
在本实施例中,图数据库的构建主要包括数据获取和数据处理两部分。对于数据获取部分,首先通过业务需求对数据进行调研,通过调研结果对数据进行建模设计,再根据设计好的模型对数据进行网络爬取或下载,来获得基金的数据信息,基金的数据信息可为基金代码、基金名称、基金公司、基金代理人中的一项或多项。
对于数据处理部分,包括如下几个部分:
数据清洗:针对爬虫及下载数据(即基金的数据信息)进行清洗,对数据信息中的字段值进行同一格式化,使得格式化后的字段值符合图数据库的存储要求;
构建字典:根据数据信息获取多个实体,并为所述多个实体中的各实体设置标识,即根据模式(schema)设计对实体进行字典构建,生成具有全局唯一标识及全局唯一的实体;
属性表生成:根据所述格式化数据信息,分别对所述多个实体中的各实体进行属性匹配,获取实体的属性表,即对数据清洗处理后的爬虫及下载数据进行筛选,对每一个实体进行属性匹配并生成实体对应的属性表;
关系表生成:根据所述多个实体中各实体的关系进行三元组抽取,获取关系表,所述关系表用于存储两个不同实体之间的关系,即根据实体间的关系进行三元组抽取,并用字典构建步骤生成的全局唯一标识对实体值进行替换,例如,基金1的标识为0100,那么对于三元组中的基金A,可用0100进行替换。
数据入库:将所述属性表和所述关系表导入至所述图数据库,即将生成的属性表及关系表导入至图数据库中。
经过上述步骤之后,图数据库构建完成,为后续用户查询,并为用户提供可视化的知识图谱提供数据支撑。
在本申请一个实施例中,所述将所述属性表和所述关系表导入至所述图数据库,包括:
若所述属性表包括嵌套属性或者属性多值,则采用拼接符拼接的方式对所述嵌套属性或者所述属性多值进行处理,并将处理后的所述属性表导入所述图数据库;
将所述关系表导入所述图数据库。
在本实施例中,嵌套属性是指属性包括子属性,例如,属性A包括子属性a1和a2,那么属性A为嵌套属性;属性多值是指一个属性有多个值,例如,属性B的值可以取b1和b2。
若所述属性表包括嵌套属性或者属性多值,则采用拼接符拼接的方式对所述嵌套属性或者所述属性多值进行处理,拼接符可为“|”。采用拼接符拼接的方式对属性表进行处理之后,可避免属性表中嵌套属性和属性多值的情况,对于属性表中的每一个属性均没有子属性,对于属性表中的每一个属性,均只有一个取值。最后,将处理完成的属性表导入至图数据库中,并将关系表也导入至图数据库中。
图数据库中的实体包括基金、基金经理以及基金公司,可减少实体节点数量及关系种类,符合业务展示需求。
如图2a-图2c所示,以下对本申请提供的基金知识图谱获取方法的整个过程进行进一步说明。
图数据库的构建主要分为以下几个部分:
数据准备:首先通过业务需求对数据进行调研,通过调研结果对数据进行建模设计;根据设计好的模型对数据进行网络爬取或下载;
数据清洗:针对爬虫及下载数据进行清洗,对字段值进行同一格式化;
构建字典:根据模式(schema)设计对实体进行字典构建,生成具有全局唯一标识及全局唯一的实体;
属性表生成:根据字典对爬取数据进行筛选,同时对每一个实体进行属性匹配并生成相应属性表;
关系表生成:即三元组抽取,根据实体间的关系进行三元组抽取,并用字典构建步骤生成的全局唯一标识对实体值进行替换;
数据入库:将生成的属性表及关系表导入至图数据库中;
知识图谱服务:结合前端可视化界面调用,将查询部分封装成服务模块。根据前端的统一资源定位符(Uniform Resource Locator,简称URL)请求,实时对图数据库进行访问查询,并根据需求进行数据返回。
模式(schema)设计为知识图谱构建过程中的核心部分,决定了数据在图数据库中的存储形式,以及对外提供服务的数据展现形式,对数据访问性能产生较大影响,图数据库主要利用链式存储的方式将实体间关系连接存储,所以其更适合对实体间关系进行探索,如果模式设计不符合要求,则探索功能及性能将大打折扣。其设计主要分为以下几个部分:
对爬虫数据(即基金的数据信息)进行结构性探索,探究其数据结构是否支持Neo4j(Neo4j是一个高性能的、非关系型的图形数据库)图数据库存储。鉴于图数据库对属性存储采用类远程字典服务(Remote Dictionary Server,简称redis)式键值存储,并不支持属性嵌套或属性多值的存储方式,如表1所示,不同基金拥有不同的费率模式及金额等模式,但其属性键为同一个,此种情况下存在属性多值。
表1
数据探索后进行模式整体设计,对于嵌套属性和属性多值采用‘|’拼接的方式进行存储。
最终确定以基金、基金经理、基金公司为实体,其余数据为属性的存储方式,减少节点数量及关系种类,符合业务展示需求。
知识图谱前端服务构建:前端服务为知识图谱的重要组成部,其设计主要如下:
服务框架主要采用Python的Flask框架,该框架具有重量轻,便携式及部署方便等特点;提供服务时只需指定路由URL访问路径,利用python装饰器方法即可提供服务。
服务模块主要设计为:图数据库连接模块,主要负责调用图数据库,采用python的py2neo模块进行图数据库连接;
图数据库查询接口类,通过查询接口对图数据库进行查询,将确定的查询模式形成函数共后续调用;
flask服务路由,flask框架主要提供前端查询服务,通过路由的方式向前端提供三个接口,分别为ip:5000/v1/funds、ip:5000/v1/funds/company、ip:5000/v1/funds/manager,分别用于查询基金关系、基金公司关系及属性、基金经理关系及属性,并返回至前端进行处理;
多协程处理模块,多协程处理模块通过增加协程的方式解决python语言线程锁问题,通过增加协程方式处理部分并发,采用gevent模块实现;
高并发处理模块,通过gunicorn模块实现,该模块通过进程内并发的方式复制相同的进程对大量请求进行处理,能够有效应对高并发场景。
知识图谱可视化显示:
首页显示方式为:在页面左侧显示基金详情页,右侧显示基金知识图谱。点击基金详情页的基金信息,则显示基金公司相关信息,包括下属基金、基金经理、详细信息等。继续点击,则可向下展示。
对于显示的基金知识图谱,点击某一基金,则显示与基金相关的基金净值、基金费率、投资方向、基金经理、基金公司。其中基金净值、基金费率和投资方向都以弹窗形式进行展示;基金经理和基金公司分别进行延伸,展示同个经理(公司)相关的其他基金,图2c所示为基金知识图谱示意图。
请参见图3,图3是本发明实施例提供的一种基金知识图谱获取装置的结构图,如图3所示,基金知识图谱获取装置300包括:
获取模块301,用于获取基金查询信息;
查询模块302,用于从图数据库中获取与所述基金查询信息对应的知识图谱;其中,所述图数据库由预获取的基金的数据信息确定;
显示模块303,用于显示所述知识图谱。
在本申请一个实施例中,所述获取模块301,用于:
显示基金详情页,所述基金详情页包括多个基金信息;
接收用户输入的对所述基金详情页中的第一基金信息的选中操作,获取基金查询信息;
所述显示模块303,用于:
显示至少包括基金名称、基金经理名称和基金公司名称的知识图谱。
在本申请一个实施例中,所述图数据库的构建过程包括:
获取所述基金的数据信息;
对所述数据信息进行清洗,并对所述数据信息中的字段值进行同一格式化,获得格式化数据信息;
根据所述数据信息获取多个实体,并为所述多个实体中的各实体设置标识;
根据所述格式化数据信息,分别对所述多个实体中的各个实体进行属性匹配,获取所述实体的属性表;
根据所述多个实体中各实体的关系进行三元组抽取,获取关系表,所述关系表用于存储两个不同实体之间的关系;
将所述属性表和所述关系表导入至所述图数据库。
在本申请一个实施例中,所述将所述属性表和所述关系表导入至所述图数据库,包括:
若所述属性表包括嵌套属性或者属性多值,则采用拼接符拼接的方式对所述嵌套属性或者所述属性多值进行处理,并将处理后的所述属性表导入所述图数据库;
将所述关系表导入所述图数据库。
在本申请一个实施例中,所述图数据库的实体包括基金、基金经理以及基金公司。
需要说明的是,本实施例中上述基金知识图谱获取装置300可以实现图1方法实施例中任意实施方式,也就是说,图1所示实施例中方法实施例中的任意实施方式都可以被本实施例中的上述基金知识图谱获取装置300所实现,以及达到相同的有益效果,此处不再赘述。
请参见图4,图4是本发明实施例提供的一种电子设备的结构图,如图4所示,电子设备400包括:存储器401、处理器402及存储在所述存储器401上并可在所述处理器402上运行的计算机程序,其中,
所述处理器402用于读取存储器401中的计算程序,执行下列过程:
获取基金查询信息;
从图数据库中获取与所述基金查询信息对应的知识图谱;其中,所述图数据库由预获取的基金的数据信息确定;
显示所述知识图谱。
进一步的,所述处理器402在执行获取基金查询信息时,具体执行:
显示基金详情页,所述基金详情页包括多个基金信息;
接收用户输入的对所述基金详情页中的第一基金信息的选中操作,获取基金查询信息;
所述处理器402在执行显示所述知识图谱时,具体执行:
显示至少包括基金名称、基金经理名称和基金公司名称的知识图谱。
进一步的,所述图数据库的构建过程包括:
获取所述基金的数据信息;
对所述数据信息进行清洗,并对所述数据信息中的字段值进行同一格式化,获得格式化数据信息;
根据所述数据信息获取多个实体,并为所述多个实体中的各实体设置标识;
根据所述格式化数据信息,分别对所述多个实体中的各个实体进行属性匹配,获取所述实体的属性表;
根据所述多个实体中各实体的关系进行三元组抽取,获取关系表,所述关系表用于存储两个不同实体之间的关系;
将所述属性表和所述关系表导入至所述图数据库。
进一步的,所述将所述属性表和所述关系表导入至所述图数据库,包括:
若所述属性表包括嵌套属性或者属性多值,则采用拼接符拼接的方式对所述嵌套属性或者所述属性多值进行处理,并将处理后的所述属性表导入所述图数据库;
将所述关系表导入所述图数据库。
进一步的,所述图数据库的实体包括基金、基金经理以及基金公司。
需要说明的是,本实施例中上述电子设备可以实现图3所示实施例中方法实施例中任意实施方式,也就是说,图3所示实施例中方法实施例中的任意实施方式都可以被本实施例中的上述电子设备所实现,以及达到相同的有益效果,此处不再赘述。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例提供的第一种的基金知识图谱获取方法(图1所示的基金知识图谱获取方法)中的步骤。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (12)
1.一种基金知识图谱获取方法,其特征在于,包括:
获取基金查询信息;
从图数据库中获取与所述基金查询信息对应的知识图谱;其中,所述图数据库由预获取的基金的数据信息确定;
显示所述知识图谱。
2.根据权利要求1所述的方法,其特征在于,所述获取基金查询信息,包括:
显示基金详情页,所述基金详情页包括多个基金信息;
接收用户输入的对所述基金详情页中的第一基金信息的选中操作,获取基金查询信息;
所述显示所述知识图谱,包括:
显示至少包括基金名称、基金经理名称和基金公司名称的知识图谱。
3.根据权利要求1所述的方法,其特征在于,所述图数据库的构建过程包括:
获取所述基金的数据信息;
对所述数据信息进行清洗,并对所述数据信息中的字段值进行同一格式化,获得格式化数据信息;
根据所述数据信息获取多个实体,并为所述多个实体中的各实体设置标识;
根据所述格式化数据信息,分别对所述多个实体中的各个实体进行属性匹配,获取所述实体的属性表;
根据所述多个实体中各实体的关系进行三元组抽取,获取关系表,所述关系表用于存储两个不同实体之间的关系;
将所述属性表和所述关系表导入至所述图数据库。
4.根据权利要求3所述的方法,其特征在于,所述将所述属性表和所述关系表导入至所述图数据库,包括:
若所述属性表包括嵌套属性或者属性多值,则采用拼接符拼接的方式对所述嵌套属性或者所述属性多值进行处理,并将处理后的所述属性表导入所述图数据库;
将所述关系表导入所述图数据库。
5.根据权利要求1所述的方法,其特征在于,所述图数据库的实体包括基金、基金经理以及基金公司。
6.一种基金知识图谱获取装置,其特征在于,包括:
获取模块,用于获取基金查询信息;
查询模块,用于从图数据库中获取与所述基金查询信息对应的知识图谱;其中,所述图数据库由预获取的基金的数据信息确定;
显示模块,用于显示所述知识图谱。
7.根据权利要求6所述的装置,其特征在于,所述获取模块,用于:
显示基金详情页,所述基金详情页包括多个基金信息;
接收用户输入的对所述基金详情页中的第一基金信息的选中操作,获取基金查询信息;
所述显示模块,用于:
显示至少包括基金名称、基金经理名称和基金公司名称的知识图谱。
8.根据权利要求6所述的装置,其特征在于,所述图数据库的构建过程包括:
获取所述基金的数据信息;
对所述数据信息进行清洗,并对所述数据信息中的字段值进行同一格式化,获得格式化数据信息;
根据所述数据信息获取多个实体,并为所述多个实体中的各实体设置标识;
根据所述格式化数据信息,分别对所述多个实体中的各个实体进行属性匹配,获取所述实体的属性表;
根据所述多个实体中各实体的关系进行三元组抽取,获取关系表,所述关系表用于存储两个不同实体之间的关系;
将所述属性表和所述关系表导入至所述图数据库。
9.根据权利要求8所述的装置,其特征在于,所述将所述属性表和所述关系表导入至所述图数据库,包括:
若所述属性表包括嵌套属性或者属性多值,则采用拼接符拼接的方式对所述嵌套属性或者所述属性多值进行处理,并将处理后的所述属性表导入所述图数据库;
将所述关系表导入所述图数据库。
10.根据权利要求6所述的装置,其特征在于,所述图数据库的实体包括基金、基金经理以及基金公司。
11.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至5中任一项所述的基金知识图谱获取方法中的步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的基金知识图谱获取方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010118488.3A CN113312517A (zh) | 2020-02-26 | 2020-02-26 | 基金知识图谱获取方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010118488.3A CN113312517A (zh) | 2020-02-26 | 2020-02-26 | 基金知识图谱获取方法、装置和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113312517A true CN113312517A (zh) | 2021-08-27 |
Family
ID=77369883
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010118488.3A Pending CN113312517A (zh) | 2020-02-26 | 2020-02-26 | 基金知识图谱获取方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113312517A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115482115A (zh) * | 2022-09-22 | 2022-12-16 | 广州飞卓科汇信息科技有限公司 | 一种基于大数据的基金信息交互方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180082183A1 (en) * | 2011-02-22 | 2018-03-22 | Thomson Reuters Global Resources | Machine learning-based relationship association and related discovery and search engines |
CN109359199A (zh) * | 2018-08-27 | 2019-02-19 | 平安科技(深圳)有限公司 | 基金经理社团划分方法、系统、计算机设备和存储介质 |
CN109377375A (zh) * | 2018-09-03 | 2019-02-22 | 平安科技(深圳)有限公司 | 基金关系图谱生成方法、系统、计算机设备和存储介质 |
CN109597855A (zh) * | 2018-11-29 | 2019-04-09 | 北京邮电大学 | 基于大数据驱动的领域知识图谱构建方法及系统 |
-
2020
- 2020-02-26 CN CN202010118488.3A patent/CN113312517A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180082183A1 (en) * | 2011-02-22 | 2018-03-22 | Thomson Reuters Global Resources | Machine learning-based relationship association and related discovery and search engines |
CN109359199A (zh) * | 2018-08-27 | 2019-02-19 | 平安科技(深圳)有限公司 | 基金经理社团划分方法、系统、计算机设备和存储介质 |
CN109377375A (zh) * | 2018-09-03 | 2019-02-22 | 平安科技(深圳)有限公司 | 基金关系图谱生成方法、系统、计算机设备和存储介质 |
CN109597855A (zh) * | 2018-11-29 | 2019-04-09 | 北京邮电大学 | 基于大数据驱动的领域知识图谱构建方法及系统 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115482115A (zh) * | 2022-09-22 | 2022-12-16 | 广州飞卓科汇信息科技有限公司 | 一种基于大数据的基金信息交互方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10852925B2 (en) | Dashboard builder with live data updating without exiting an edit mode | |
US8838636B2 (en) | Unifying hetrogenous data | |
AU780565B2 (en) | Method and apparatus for selecting aggregate levels and cross product levels for a data warehouse | |
US7293031B1 (en) | Report specification generators and interfaces | |
CN110147360B (zh) | 一种数据整合方法、装置、存储介质和服务器 | |
US8645332B1 (en) | Systems and methods for capturing data refinement actions based on visualized search of information | |
US6604095B1 (en) | Method, system, program, and data structure for pivoting columns in a database table | |
US9251212B2 (en) | Profiling in a massive parallel processing environment | |
US20230306059A1 (en) | Tool to build and store a data model and queries for a graph database | |
US20080294596A1 (en) | System and method for processing queries for combined hierarchical dimensions | |
US20060294069A1 (en) | Sorting and filtering in an interactive report | |
US10579589B2 (en) | Data filtering | |
US7937415B2 (en) | Apparatus and method for stripping business intelligence documents of references to unused data objects | |
US9779135B2 (en) | Semantic related objects | |
Baumgartner et al. | Web data extraction for business intelligence: the lixto approach | |
US8051110B2 (en) | Identifying screen flows to support multiple entities and their diverse rules with a single application instance | |
US20090199158A1 (en) | Apparatus and method for building a component to display documents relevant to the content of a website | |
CN110362591B (zh) | 一种报表展现方法和装置 | |
Berti et al. | A generic approach to extract object-centric event data from databases supporting SAP ERP | |
CN113312517A (zh) | 基金知识图谱获取方法、装置和电子设备 | |
US8812550B2 (en) | Systems, methods and apparatus for assessing compliance and federating databases | |
CN104636422A (zh) | 用于挖掘数据集中的模式的方法和系统 | |
CN112328837A (zh) | 数据展示方法、装置、设备及存储介质 | |
CN108073643A (zh) | 任务处理方法和装置 | |
Hema et al. | Federated query processing service in service oriented business intelligence |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |