CN111104475A - 知识图谱的数据存储方法、智能构建方法及实现系统 - Google Patents

知识图谱的数据存储方法、智能构建方法及实现系统 Download PDF

Info

Publication number
CN111104475A
CN111104475A CN201911119571.6A CN201911119571A CN111104475A CN 111104475 A CN111104475 A CN 111104475A CN 201911119571 A CN201911119571 A CN 201911119571A CN 111104475 A CN111104475 A CN 111104475A
Authority
CN
China
Prior art keywords
data
knowledge graph
node information
domain
item node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911119571.6A
Other languages
English (en)
Other versions
CN111104475B (zh
Inventor
罗章龙
周建平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Sugo Technology Co ltd
Original Assignee
Guangdong Sugo Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Sugo Technology Co ltd filed Critical Guangdong Sugo Technology Co ltd
Priority to CN201911119571.6A priority Critical patent/CN111104475B/zh
Publication of CN111104475A publication Critical patent/CN111104475A/zh
Application granted granted Critical
Publication of CN111104475B publication Critical patent/CN111104475B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种知识图谱的数据存储方法、智能构建方法及实现系统,其中,所述知识图谱的智能构建方法,包括步骤:A1、获取业务需求内容;A2、解析出业务需求内容的业务需求目的;A3、解析出业务需求目的中的关键字;A4、根据关键字匹配出归属结构目录域、关键字域、标签域中的事项节点信息数据;A5、根据匹配视角的不同,把获得的事项节点信息数据进行区分,分成结构节点目录数据集合、关键字节点目录集合、标签节点目录集合;A6、把相应的节点目录集合进行聚类,并构建成对应的知识图谱。本发明提供的知识图谱的数据存储方法、智能构建方法及实现系统,基于多专业间的数据逻辑关系构建,达到了个性化的数据智能构建的目的。

Description

知识图谱的数据存储方法、智能构建方法及实现系统
技术领域
本发明涉及大数据技术领域,特别是涉及一种知识图谱的数据存储方法、智能构建方法及实现系统。
背景技术
知识图谱(Knowledge Graph)是一种称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源数据及其关联信息,挖掘数据、决策分析、构建绘制和显示知识及它们之间的相互联系。在铁路行业中铁路运营资源的知识图谱的应用主要是针对事件体现及其关联事项进行构建后,可以自由设定专题节点进行智能拓展分析。使得知识图谱中聚焦一个事项,则可以发现其事项的基本信息,以及事项下各事件的节点及其串接关系等内容。
就技术要构建的知识图谱而言,将面临的难点将会是以下几点:
1、属性抽取及多来源属性融合和不同事项间关系的确立。现有技术对于事项的图片构建,采用基于事项性质的组织架构归属进行抽取与聚类融合。现有技术的缺点是基于铁路行业,对不同专业的事项,其特定属性的确定都需要专业人士的介入,但仅仅靠人力始终无法高效处理,且对于标准也各自带有自我主观因素的问题。而根据统一的规范进行,虽然能识文本中以关键字为中心词的关系,但对于名词同位语之类的关系抽取就容易出现误判。此外这种方法无法对未收入的名词进行有效地处理和判断。
2、现有铁路行业的知识图谱属性提炼不能实现文本之间自动相关性分析和推理,实现根据业务要求,数据能智能完成点到点的自适应学习与关系建立。
3、现有的铁路运营资源的知识图谱的构建,需要业务人员针对整体事项进行定义和分类,导致图谱构建流程过长,扩展不够灵活。
因此,需要提供一种知识图谱的数据存储方法、智能构建方法及实现系统以解决上述技术问题。
发明内容
本发明主要解决的技术问题是提供一种知识图谱的数据存储方法、智能构建方法及实现系统,在基于多专业间的数据逻辑关系构建,达到个性化的数据智能构建,且能使在节点内容频繁变更也不会影响任何铁路运营资源的知识图谱的构建。
为解决上述技术问题,本发明采用的第一种技术方案是提供一种知识图谱的数据存储方法,包括步骤:
S1、获取事项节点信息数据及其录入人员的组织信息;
S2、根据数据字典,对事项节点信息数据进行关键字提炼;
S3、根据所述关键字的性质及其录入人员的组织信息对事项节点信息数据进行区分,设定事项节点数据的归属结构目录域,根据关键字导向标签信息,对所述事项节点信息数据按类型分域存储。
实施例中,作为优选:所述步骤S3中所述的域包括事项节点数据的本身内容域、归属结构目录域、关键字域、标签域。
实施例中,作为优选:
所述步骤S2包括:根据数据字典,对事项节点信息数据进行关键字提炼,如果事项节点信息数据不在所述数据字典的覆盖范围之内,则对所述数据字典进行扩充,直到所述的事项节点信息数据落在数据字典的覆盖范围之内。
为解决上述技术问题,本发明采用的第二种技术方案是提供一种知识图谱的智能构建方法,包括步骤:
A1、获取业务需求内容;
A2、解析出业务需求内容的业务需求目的;
A3、解析出业务需求目的中的关键字;
A4、根据关键字匹配出归属结构目录域、关键字域、标签域中的事项节点信息数据;
A5、根据匹配视角的不同,把获得的事项节点信息数据进行区分,分成结构节点目录数据集合、关键字节点目录集合、标签节点目录集合;
A6、根据匹配视角的不同,把相应的节点目录集合进行聚类,并构建成对应的知识图谱。
本发明的有益效果是:本发明提供的一种知识图谱的数据存储方法、智能构建方法及实现系统,基于多专业间的数据逻辑关系构建,达到个性化的数据智能构建,且能使在节点内容频繁变更也不会影响任何资源的知识图谱的构建。
附图说明
图1是本发明的一种知识图谱的数据存储方法的第一优选实施例的流程示意图;
图2是图1所示的一种知识图谱的数据存储方法的进一步优选方案的流程示意图;
图3是本发明的一种知识图谱的智能构建方法的第二优选实施例的流程示意图。
具体实施方式
下面结合图示对本发明的技术方案进行详述。
实施例一
请参见图1所示,本发明提供一种知识图谱的数据存储方法,包括步骤:
S1、获取事项节点信息数据及其录入人员的组织信息;
S2、根据数据字典,对事项节点信息数据进行关键字提炼;
S3、根据所述关键字的性质及其录入人员的组织信息对事项节点信息数据进行区分,设定事项节点数据的归属结构目录域,根据关键字导向标签信息,对所述事项节点信息数据按类型分域存储。
在本实施例中,优选:所述步骤S3中所述的域包括事项节点数据的本身内容域、归属结构目录域、关键字域、标签域。
为了能够使得,后续知识图谱的构建能够个性化灵活定制,在本实用新型的实施例中,如图2所示,优选,所述步骤S2包括:根据数据字典,对事项节点信息数据进行关键字提炼,如果事项节点信息数据不在所述数据字典的覆盖范围之内,则对所述数据字典进行扩充,直到所述的事项节点信息数据落在数据字典的覆盖范围之内。由于,采用了对数据字典的扩充,使得后续的事项节点信息数据能够得到有效的匹配,防止频繁出现无法匹配的问题。解决了现有技术的关键词匹配过程中,由于关键字的未录入而无法实现匹配的技术问题。
且本发明的知识图谱的数据存储方法,存储智能,避免了只靠人力,始终无法高效处理的问题,也避免了对于标准带有自我主观因素的干扰问题。
在本实施例中,优选:所述录入人员的组织信息包括:录入人员的组织信息,即所属部门、车间、工种等信息,譬如部门有机务部、工务部、电务部等,车间有检修车间、整备车间、运用车间等,工种有管理人员、专业技术人员、操作技能人员等,再细分有钳工、焊工、电工等。
实施例二
如图3所示,本发明提供的第二种技术方案是提供一种知识图谱的智能构建方法,包括步骤:
A1、获取业务需求内容;
A2、解析出业务需求内容的业务需求目的;
A3、解析出业务需求目的中的关键字;
A4、根据关键字匹配出归属结构目录域、关键字域、标签域中的事项节点信息数据;
A5、根据匹配视角的不同,把获得的事项节点信息数据进行区分,分成结构节点目录数据集合、关键字节点目录集合、标签节点目录集合;
A6、根据匹配视角的不同,把相应的节点目录集合进行聚类,并构建成对应的知识图谱。
本实施例中,采用自动提取业务需求目的的关键字,并利用关键字、标签等信息实现数据的自动构建。且能够保证事项节点数据频繁变更的情况下,也不会影响事项资源的知识图谱的智能构建。
实施例三
本发明提供的第三种技术方案是提供一种知识图谱的实现系统,该实现系统用于实现本发明的知识图谱的数据存储方法、智能构建方法。而且该实现系统,用于实现铁路资源运营的知识图谱的数据存储及智能构建。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (6)

1.一种知识图谱的数据存储方法,其特征在于,包括步骤:
S1、获取事项节点信息数据及其录入人员的组织信息;
S2、根据数据字典,对事项节点信息数据进行关键字提炼;
S3、根据所述关键字的性质及其录入人员的组织信息对事项节点信息数据进行区分,设定事项节点数据的归属结构目录域,根据关键字导向标签信息,对所述事项节点信息数据按类型分域存储。
2.根据权利要求1所述的知识图谱的数据存储方法,其特征在于,所述步骤S3中所述的域包括事项节点数据的本身内容域、归属结构目录域、关键字域、标签域。
3.根据权利要求1所述的知识图谱的数据存储方法,其特征在于,
所述步骤S2包括:根据数据字典,对事项节点信息数据进行关键字提炼,如果事项节点信息数据不在所述数据字典的覆盖范围之内,则对所述数据字典进行扩充,直到所述的事项节点信息数据落在数据字典的覆盖范围之内。
4.一种知识图谱的智能构建方法,其特征在于,包括步骤:
A1、获取业务需求内容;
A2、解析出业务需求内容的业务需求目的;
A3、解析出业务需求目的中的关键字;
A4、根据关键字匹配出归属结构目录域、关键字域、标签域中的事项节点信息数据;
A5、根据匹配视角的不同,把获得的事项节点信息数据进行区分,分成结构节点目录数据集合、关键字节点目录集合、标签节点目录集合;
A6、根据匹配视角的不同,把相应的节点目录集合进行聚类,并构建成对应的知识图谱。
5.一种知识图谱的实现系统,其特征在于,所述知识图谱的实现系统用于实现权利要求1-3任意一项所述的知识图谱的数据存储方法及用于实现权利要求4所述的知识图谱的智能构建方法。
6.根据权利要求5所述的知识图谱的实现系统,其特征在于,所述知识图谱的实现系统,用于实现铁路资源运营的知识图谱的数据存储及智能构建。
CN201911119571.6A 2019-11-15 2019-11-15 知识图谱的数据存储与智能构建方法及实现系统 Active CN111104475B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911119571.6A CN111104475B (zh) 2019-11-15 2019-11-15 知识图谱的数据存储与智能构建方法及实现系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911119571.6A CN111104475B (zh) 2019-11-15 2019-11-15 知识图谱的数据存储与智能构建方法及实现系统

Publications (2)

Publication Number Publication Date
CN111104475A true CN111104475A (zh) 2020-05-05
CN111104475B CN111104475B (zh) 2020-11-03

Family

ID=70420624

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911119571.6A Active CN111104475B (zh) 2019-11-15 2019-11-15 知识图谱的数据存储与智能构建方法及实现系统

Country Status (1)

Country Link
CN (1) CN111104475B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115525235A (zh) * 2022-11-04 2022-12-27 上海威固信息技术股份有限公司 一种基于存储结构的数据运算方法及系统
CN115841406A (zh) * 2022-10-31 2023-03-24 江苏中科西北星信息科技有限公司 一种基于知识图谱的养老政策延续落实处理方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160125462A1 (en) * 2014-10-31 2016-05-05 Informite Inc. Systems and methods for semantic keyword analysis for paid search
US20180150753A1 (en) * 2016-11-30 2018-05-31 International Business Machines Corporation Analyzing text documents
CN108197175A (zh) * 2017-12-20 2018-06-22 国网北京市电力公司 技术监督数据的处理方法和装置、存储介质、处理器
CN109471947A (zh) * 2018-11-06 2019-03-15 北京锐安科技有限公司 一种数据的知识谱图构建方法、装置、设备及存储介质
CN109710701A (zh) * 2018-12-14 2019-05-03 浪潮软件股份有限公司 一种用于公共安全领域大数据知识图谱的自动化构建方法
CN109947949A (zh) * 2019-03-12 2019-06-28 国家电网有限公司 知识信息智能管理方法、装置及服务器

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160125462A1 (en) * 2014-10-31 2016-05-05 Informite Inc. Systems and methods for semantic keyword analysis for paid search
US20180150753A1 (en) * 2016-11-30 2018-05-31 International Business Machines Corporation Analyzing text documents
CN108197175A (zh) * 2017-12-20 2018-06-22 国网北京市电力公司 技术监督数据的处理方法和装置、存储介质、处理器
CN109471947A (zh) * 2018-11-06 2019-03-15 北京锐安科技有限公司 一种数据的知识谱图构建方法、装置、设备及存储介质
CN109710701A (zh) * 2018-12-14 2019-05-03 浪潮软件股份有限公司 一种用于公共安全领域大数据知识图谱的自动化构建方法
CN109947949A (zh) * 2019-03-12 2019-06-28 国家电网有限公司 知识信息智能管理方法、装置及服务器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
马灿: "面向_智慧法院_的知识图谱构建方法与研究_马灿", 《中国优秀硕士学位论文全文数据库》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115841406A (zh) * 2022-10-31 2023-03-24 江苏中科西北星信息科技有限公司 一种基于知识图谱的养老政策延续落实处理方法及系统
CN115525235A (zh) * 2022-11-04 2022-12-27 上海威固信息技术股份有限公司 一种基于存储结构的数据运算方法及系统
CN115525235B (zh) * 2022-11-04 2023-09-08 上海威固信息技术股份有限公司 一种基于存储结构的数据运算方法及系统

Also Published As

Publication number Publication date
CN111104475B (zh) 2020-11-03

Similar Documents

Publication Publication Date Title
US10489454B1 (en) Indexing a dataset based on dataset tags and an ontology
US7730104B2 (en) Extraction of information from structured documents
EP4053802A1 (en) Video classification method and apparatus, device and storage medium
CN109359194B (zh) 用于预测信息类别的方法和装置
CN111104475B (zh) 知识图谱的数据存储与智能构建方法及实现系统
EP3916584A1 (en) Information processing method and apparatus, electronic device and storage medium
US10572566B2 (en) Image quality independent searching of screenshots of web content
CN107729396B (zh) 数据动态查询方法及装置
US20220350857A1 (en) Methods and systems for browser extension used to generate relative xpath, absolute xpath and/or css selectors
US8589531B2 (en) Network difference reporting
CN112836018A (zh) 应急预案的处理方法及装置
US7283986B2 (en) End-to-end business integration testing tool
CN113505242A (zh) 一种知识图谱自动嵌入的方法及系统
CN111858905A (zh) 模型训练方法、信息识别方法、装置、电子设备及存储介质
Lal et al. SANE: System for fine grained named entity typing on textual data
US20190026365A1 (en) Method and system for generating an ontology for one or more tickets
Claeys et al. Intelligent authoring and management system for assembly instructions
CN112783966B (zh) 一种基于业务元数据的sql可视化设计生成方法及系统
EP3051468A1 (en) A graphical user interface for temporal representation of structured information in an object model
WO2015016133A1 (ja) 情報管理装置及び情報管理方法
CN112257440B (zh) 用于处理关于目标对象的请求方法、计算设备和介质
CN108629012B (zh) 取证数据解析准确性的智能校验方法和系统
CN112612866A (zh) 知识库文本同步方法、装置、电子设备及存储介质
CN113760698A (zh) 一种测试用例文件数据的转换方法和装置
Zhang et al. GNOme–Glycan Naming and Subsumption Ontology

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant