CN114817423A - 一种面向金融行业的知识图谱更新系统 - Google Patents
一种面向金融行业的知识图谱更新系统 Download PDFInfo
- Publication number
- CN114817423A CN114817423A CN202210447417.7A CN202210447417A CN114817423A CN 114817423 A CN114817423 A CN 114817423A CN 202210447417 A CN202210447417 A CN 202210447417A CN 114817423 A CN114817423 A CN 114817423A
- Authority
- CN
- China
- Prior art keywords
- updating
- entity
- unit
- data
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000009193 crawling Effects 0.000 claims description 9
- 238000012216 screening Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 6
- 238000000034 method Methods 0.000 abstract description 5
- 230000009466 transformation Effects 0.000 abstract description 4
- 238000012545 processing Methods 0.000 abstract description 2
- 230000007547 defect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明属于数据处理技术领域,尤其涉及一种面向金融行业的知识图谱更新系统;本发明为知识图谱数据层中的部分实体属性设置改变周期:基于需变换的实体属性的变换周期及当前时间,确定实体属性的下次更新时间,并基于所获取的需变换实体属性值修改对应的实体属性值。所采用的局部更新实体属性的方法能有效减少因全量更新实体属性所消耗的大量资源和时间。
Description
技术领域
本发明属于数据处理技术领域,尤其涉及一种面向金融行业的知识图谱更新系统。
背景技术
知识图谱作为推动知识结构化、智能化的工具被广泛应用于教育、医疗、农业、通信以及电子商务等领域。另外,知识图谱因其具备的图展示、图挖掘以及图模型的计算有优势,可直观、自然且高效的占时金融业务交易场景,帮助金融从业人员开展分析和决策,因此在金融行业备受关注。
知识图谱包含模式层和数据层,其中模式层是图谱的抽象化,以三元组(实体-关系-实体)的形式存储,数据层是模式层的具体实例。如图1所示,模式层中定义两个概念“股票”和“人”,两者的关联关系为“董事长”。定义概念“股票”的属性为“股票代码”和“市值”;定义概念“人”的属性为“性别”和“年龄”。如图1所示,对应的数据层分别为:“中国平安”的股票代码和市值分别为“02318”和“1.04万亿”;其董事长为“马哲明”,性别“男”,年龄“65”。然而,股票的市值随时会发生变化,董事长的年龄也会增长,因此董事长可能存在换人的情况等等,因此需要对构建好的知识图谱进行定期更新。而目前面向金融行业的智能客服框架因受限于系统依赖的问答知识库无法有效、智能的扩展和更新;并且当前的知识图谱更新所采用的全量更新方式需要消耗大量的资源和时间。
发明内容
为了解决上述现有技术中存在的技术问题,本发明提供了一种面向金融行业的知识图谱更新系统,拟解决目前面向金融行业的客服框架因受限于系统依赖的问答知识库无法有效、智能的扩展和更新,并且采用全量更新方式需要消耗大量的资源和时间的技术问题。
本发明采用的技术方案如下:
一种面向金融行业的知识图谱更新系统,包括设置模块、确定模块以及更新模块;
所述设置模块中设置用于更新数据层实体数据的模式层;所述设置模块包括实体属性提取单元和属性值设置单元,基于实体属性提取单元和属性设置单元设置模式层中各实体的更新时间和更新规则;
所述确定模块包括扫描筛选单元和连接单元,所述扫描筛选单元用于扫描筛选得出知识图谱中即将更新的实体,在基于连接单元将即将更新的实体与所述更新模块建立连接;
所述更新模块包括数据爬取单元及数据替换单元,更新模块基于即将更新的实体的属性的值和更新时间,通过爬取单元从多方金融数据源中获取对应的实体的值。
本发明在数据的设计上是由金融数据提供方来支持知识图谱模式,在确保图谱模式保持一致性的基础上根据不同数据源的数据进行选择和扩展实体属性及更改属性值;本发明通过多方金融数据源的方式解决了金融数据不稳定、维护代价高的缺点。
并且在本发明的更新模块中基于将更新的实体的属性的值和更新时间,通过爬取单元从多方金融数据源中获取对应的实体值;故,本发明基于需变换的实体属性的变换周期及当前时间,确定实体属性的下次更新时间,并基于所获取的需变换实体属性值修改对应的实体属性值;所采用的局部更新实体属性的方法能有效减少因全量更新实体属性所消耗的大量资源和时间。
优选的,在所述更新模块中定义有实时更新实体和定时更新实体。
优选的,所述多方金融数据源包括新浪财经、东方财富、上海交易所和深圳交易所。
本发明的有益效果包括:
本发明在数据的设计上是由金融数据提供方来支持知识图谱模式,在确保图谱模式保持一致性的基础上根据不同数据源的数据进行选择和扩展实体属性及更改属性值;本发明通过多方金融数据源的方式解决了金融数据不稳定、维护代价高的缺点。
并且在本发明的更新模块中基于将更新的实体的属性的值和更新时间,通过爬取单元从多方金融数据源中获取对应的实体值;故,本发明基于需变换的实体属性的变换周期及当前时间,确定实体属性的下次更新时间,并基于所获取的需变换实体属性值修改对应的实体属性值;所采用的局部更新实体属性的方法能有效减少因全量更新实体属性所消耗的大量资源和时间。
附图说明
图1为知识图谱的模式层和数据层。
图2为本发明的金融知识图谱数据更新框架。
图3为本发明的知识图谱系统装置示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面结合附图2和附图3对本发明作进一步的详细说明:
参见附图2和附图3,一种面向金融行业的知识图谱更新系统,包括设置模块、确定模块以及更新模块;
所述设置模块中设置用于更新数据层实体数据的模式层;所述设置模块包括实体属性提取单元和属性值设置单元,基于实体属性提取单元和属性设置单元设置模式层中各实体的更新时间和更新规则;由于数据层为模式层的实例,且在知识图谱实际应用中,相同模式的数据成千上万,因此通过设置模式层更新数据层实体数据的方式大幅度提升图谱数据的更新速度。
所述确定模块包括扫描筛选单元和连接单元,所述扫描筛选单元用于扫描筛选得出知识图谱中即将更新的实体,在基于连接单元将即将更新的实体与所述更新模块建立连接;
所述更新模块包括数据爬取单元及数据替换单元,更新模块基于即将更新的实体的属性的值和更新时间,通过爬取单元从多方金融数据源中获取对应的实体的值。
在所述更新模块中定义有实时更新实体和定时更新实体。
所述多方金融数据源包括新浪财经、东方财富、上海交易所和深圳交易所。
本发明在数据的设计上是由金融数据提供方来支持知识图谱模式,在确保图谱模式保持一致性的基础上根据不同数据源的数据进行选择和扩展实体属性及更改属性值;本发明通过多方金融数据源的方式解决了金融数据不稳定、维护代价高的缺点。
并且在本发明的更新模块中基于将更新的实体的属性的值和更新时间,通过爬取单元从多方金融数据源中获取对应的实体值;故,本发明基于需变换的实体属性的变换周期及当前时间,确定实体属性的下次更新时间,并基于所获取的需变换实体属性值修改对应的实体属性值;所采用的局部更新实体属性的方法能有效减少因全量更新实体属性所消耗的大量资源和时间。
本发明通过整合多方金融数据源的方式保证金融知识图谱更新数据的稳定性和可行性。另外,本发明提出的知识图谱更新系统较以往的知识图谱更新方式而言更具体化和模块化,在保障实体属性值的实时性的前提下有效提升图谱实体属性值的更新速度。最后,本发明针对金融知识图谱提出的定时局部更新方法与定时全量更新相比,能在不影响不需要更新的实体属性值的前提下更新需要更新的属性值,有效节省更多计算资源和时间,进而提高了知识图谱更新的效率。
本发明的一种面向经融行业的知识图谱更新系统中我们对人名、性别、公司名称、股票代号等不经常发生变动的属性设置固定变换周期,而对公司股价、股票买卖等情况的变动实体进行实时更新,这样就能减少图谱更新时对设备的压力,有效极大程度的提升了整个图谱的更新效率。
以上所述实施例仅表达了本申请的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请技术方案构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。
Claims (3)
1.一种面向金融行业的知识图谱更新系统,其特征在于,包括设置模块、确定模块以及更新模块;
所述设置模块中设置用于更新数据层实体数据的模式层;所述设置模块包括实体属性提取单元和属性值设置单元,基于实体属性提取单元和属性设置单元设置模式层中各实体的更新时间和更新规则;
所述确定模块包括扫描筛选单元和连接单元,所述扫描筛选单元用于扫描筛选得出知识图谱中即将更新的实体,在基于连接单元将即将更新的实体与所述更新模块建立连接;
所述更新模块包括数据爬取单元及数据替换单元,更新模块基于即将更新的实体的属性的值和更新时间,通过爬取单元从多方金融数据源中获取对应的实体的值。
2.根据权利要求1所述的一种面向金融行业的知识图谱更新系统,其特征在于,在所述更新模块中定义有实时更新实体和定时更新实体。
3.根据权利要求1所述的一种面向金融行业的知识图谱更新系统,其特征在于,所述多方金融数据源包括新浪财经、东方财富、上海交易所和深圳交易所。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210447417.7A CN114817423A (zh) | 2022-04-26 | 2022-04-26 | 一种面向金融行业的知识图谱更新系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210447417.7A CN114817423A (zh) | 2022-04-26 | 2022-04-26 | 一种面向金融行业的知识图谱更新系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114817423A true CN114817423A (zh) | 2022-07-29 |
Family
ID=82508219
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210447417.7A Pending CN114817423A (zh) | 2022-04-26 | 2022-04-26 | 一种面向金融行业的知识图谱更新系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114817423A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110019823A (zh) * | 2017-07-13 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 更新知识图谱的方法及装置 |
CN110489561A (zh) * | 2019-07-12 | 2019-11-22 | 平安科技(深圳)有限公司 | 知识图谱构建方法、装置、计算机设备和存储介质 |
CN111444351A (zh) * | 2020-03-24 | 2020-07-24 | 清华苏州环境创新研究院 | 一种行业工艺领域知识图谱构建方法及装置 |
CN112632197A (zh) * | 2021-02-01 | 2021-04-09 | 上海冰鉴信息科技有限公司 | 基于知识图谱的业务关系处理方法及装置 |
CN112883201A (zh) * | 2021-03-23 | 2021-06-01 | 西安电子科技大学昆山创新研究院 | 一种基于智慧社区大数据的知识图谱构建方法 |
CN113342807A (zh) * | 2021-05-20 | 2021-09-03 | 电子科技大学 | 一种基于混合数据库的知识图谱及其构建方法 |
CN113761121A (zh) * | 2021-04-30 | 2021-12-07 | 中科天玑数据科技股份有限公司 | 一种结构化数据的知识抽取方法 |
-
2022
- 2022-04-26 CN CN202210447417.7A patent/CN114817423A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110019823A (zh) * | 2017-07-13 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 更新知识图谱的方法及装置 |
CN110489561A (zh) * | 2019-07-12 | 2019-11-22 | 平安科技(深圳)有限公司 | 知识图谱构建方法、装置、计算机设备和存储介质 |
CN111444351A (zh) * | 2020-03-24 | 2020-07-24 | 清华苏州环境创新研究院 | 一种行业工艺领域知识图谱构建方法及装置 |
CN112632197A (zh) * | 2021-02-01 | 2021-04-09 | 上海冰鉴信息科技有限公司 | 基于知识图谱的业务关系处理方法及装置 |
CN112883201A (zh) * | 2021-03-23 | 2021-06-01 | 西安电子科技大学昆山创新研究院 | 一种基于智慧社区大数据的知识图谱构建方法 |
CN113761121A (zh) * | 2021-04-30 | 2021-12-07 | 中科天玑数据科技股份有限公司 | 一种结构化数据的知识抽取方法 |
CN113342807A (zh) * | 2021-05-20 | 2021-09-03 | 电子科技大学 | 一种基于混合数据库的知识图谱及其构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11797585B2 (en) | Data updating method and apparatus, electronic device and computer readable storage medium | |
CN108491491B (zh) | 智能客服知识图谱的构建方法与系统 | |
CN109033284A (zh) | 基于知识图谱的电力信息运维系统数据库构建方法 | |
CN111581990A (zh) | 跨境交易撮合匹配方法及装置 | |
CN102254012A (zh) | 一种基于外存的图数据存储方法及子图查询方法 | |
CN111651614A (zh) | 药膳知识图谱的构建方法、系统、电子设备及存储介质 | |
CN112507098B (zh) | 问题处理方法、装置、电子设备、存储介质及程序产品 | |
CN112597775A (zh) | 信贷风险预测方法及装置 | |
CN107861933A (zh) | 生成运维报表的方法和装置 | |
CN112925920A (zh) | 一种智慧社区大数据知识图谱网络社团检测方法 | |
CN112463986A (zh) | 信息存储的方法及装置 | |
CN111159427B (zh) | 一种基于众包的知识图谱构建方法及系统 | |
CN103810216A (zh) | 物品显示标识排序方法及服务器 | |
CN116701584A (zh) | 基于电力用户画像的智能问答方法、装置以及电子设备 | |
Fallucchi et al. | Supporting humanitarian logistics with intelligent applications for disaster management | |
CN115098567A (zh) | 一种基于bi平台的低代码平台数据传输方法 | |
CN114817423A (zh) | 一种面向金融行业的知识图谱更新系统 | |
CN117610649A (zh) | 知识图谱的构建方法、装置、存储介质及电子设备 | |
CN105022785A (zh) | 基于orm框架的数据同步传递电商平台 | |
CN112069817A (zh) | 一种学者知识抽取与融合方法及装置 | |
US20210326514A1 (en) | Method for generating interpretation text, electronic device and storage medium | |
CN115456413A (zh) | 人员与岗位的匹配方法、装置、设备及存储介质 | |
CN112765489B (zh) | 一种社交网络链路预测方法及系统 | |
CN115168609A (zh) | 一种文本匹配方法、装置、计算机设备和存储介质 | |
CN111127145B (zh) | 基于catboost算法与深度学习结合的排序推荐方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220729 |
|
RJ01 | Rejection of invention patent application after publication |