CN113254594B - 一种面向智慧电厂的安全知识图谱构建方法及系统 - Google Patents

一种面向智慧电厂的安全知识图谱构建方法及系统 Download PDF

Info

Publication number
CN113254594B
CN113254594B CN202110683084.3A CN202110683084A CN113254594B CN 113254594 B CN113254594 B CN 113254594B CN 202110683084 A CN202110683084 A CN 202110683084A CN 113254594 B CN113254594 B CN 113254594B
Authority
CN
China
Prior art keywords
entity
data
knowledge
knowledge graph
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110683084.3A
Other languages
English (en)
Other versions
CN113254594A (zh
Inventor
祝敬伟
郭峰
何立军
周亚明
芮文君
陈国祥
党明锐
顾舒
吉云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guoneng Xinkong Internet Technology Co Ltd
Original Assignee
Guoneng Xinkong Internet Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guoneng Xinkong Internet Technology Co Ltd filed Critical Guoneng Xinkong Internet Technology Co Ltd
Priority to CN202110683084.3A priority Critical patent/CN113254594B/zh
Publication of CN113254594A publication Critical patent/CN113254594A/zh
Application granted granted Critical
Publication of CN113254594B publication Critical patent/CN113254594B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P80/00Climate change mitigation technologies for sector-wide applications
    • Y02P80/10Efficient use of energy, e.g. using compressed air or pressurized fluid as energy carrier

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Animal Behavior & Ethology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种面向智慧电厂的安全知识图谱构建方法及系统。该方法首先进行数据采集以及知识模型的构建,根据知识模型将数据进行分类、清洗与存储;之后对实体未分离的数据进行知识抽取,并利用知识抽取的结果以及实体已分离的数据进行知识图谱的构建;最终将构建好的知识图谱运用于不同场景之中。本发明还公开了一个利用该方法的系统。本发明基于特征的知识抽取方法相比现有技术而言能够更准确地进行实体抽取,通过对实体与句子编码再利用CNN的方法能够更快速准确的进行关系抽取。本发明构建的知识图谱综合考虑了电力企业安全管理的应用现状与需求,能够有效的减少电厂生产环节的安全风险,便于企业在电力生产中实现智能管理,保障电厂的生产安全。

Description

一种面向智慧电厂的安全知识图谱构建方法及系统
技术领域
本发明涉及电力系统安全技术领域,尤其涉及一种面向智慧电厂的安全知识图谱构建方法及系统。
背景技术
随着大数据、物联网、云计算、移动互联、智能控制等新技术的快速发展,智慧企业EPC工程建设的技术条件已经成熟。
21世纪以来,信息技术深刻地影响着全世界每一个角落,给各行各业带来了天翻地覆的变化。安全管理作为企业经营发展的基础,一直在被全世界广泛关注。总体来看,近几年电力企业深入开展电网运行风险管控,电网安全生产管控能力和事故防范水平显著提升。但在电力生产安全的管理上仍存在很多问题。例如安全责任管理制度不完善、工作人员安全意识不强、岗位具体责任要求不明确等。这些问题不仅影响电力企业的安全生产,对工作人员的人身安全也有一定的威胁。因此,亟需研究一种智慧电厂知识图谱系统,保障智慧电厂的安全生产管理。
发明内容
为了解决上述技术问题,本发明提出了一种针对智慧电厂安全管控领域的知识图谱构建与应用方法。本发明的目的是研究电力企业安全主题的智能化管理方法,提出了一种通过构建电厂人员信息知识图谱和电厂作业区域安全知识图谱,实现对人员和区域的精准画像与智能检索,借助知识图谱挖掘企业员工之间的潜在关系,进行风险识别与预警,同时利用知识推理进行安全问题的逻辑推理等。减少电厂生产环节的安全风险,为电力企业稳定发展奠定坚实基础。
本发明采用如下的技术方案。
本发明公开了一种面向智慧电厂的安全知识图谱构建方法,包括以下步骤:
步骤1:采集包含人员信息的原始文本数据以及包含区域作业的原始文本数据;
步骤2:构建反映多实体关系的知识模型;
步骤3:依据步骤2构建的知识模型,对步骤1采集的文本数据进行分类、清洗得到结构化与半结构化数据并将它们存入多种数据源;
步骤4:从步骤3的多种数据源提取所储存的半结构化数据并从中进行知识抽取;
步骤5:通过步骤4得到的知识抽取数据以及步骤3的结构化数据构建人员知识图谱与区域作业知识图谱并进行存储;
步骤6:将步骤5得到的人员知识图谱以及区域作业知识图谱运用于不同应用场景之中。
在步骤1中,所述人员信息的原始文本数据包括含有员工id、员工姓名、员工出生日期、员工学历、员工岗位、员工联系方式、员工所属部门、员工所属岗位、员工所属区域、员工状态的文本以及员工区域安全权限等级;
区域作业的原始文本数据包括含有区域信息、部门信息、岗位信息、设备信息、高风险作业信息、隐患记录信息、违章记录信息以及安全检查任务信息的文本;
区域信息包括区域id、区域编码、区域名称、区域状态、区域责任部门、区域负责人、区域负责人联系电话、区域创建部门、上级区域名称、风险等级以及区域描述的文本;
部门信息包括部门id、部门名称、部门人数、部门责任人、部门电话以及部门地址的文本;
岗位信息包括岗位id、岗位名称、岗位人数、岗位所属部门、岗位职责、岗位资格证、岗位学历以及岗位专业的文本;
设备信息包括设备id、设备名称、设备购买日期、设备使用年限以及设备负责人的文本;
高风险作业信息包括高风险作业id、高风险作业起止时间、高风险作业所属部门、高风险作业状态、高风险作业种类、高风险作业参与人数以及高风险作业参与人名的文本;
隐患记录信息包括针对该区域作业产生的隐患id、隐患名称、隐患类型、隐患发现时间、隐患解决时间、隐患负责部门以及隐患负责人的文本;
违章记录信息包括违章id、违章人员姓名、违章内容、违章时间、违章类型、违章负责部门以及违章负责人的文本;
安全检查任务信息包括安全检查任务id、安全检查人员姓名、安全检查任务内容、安全检查任务等级、安全检查任务状态以及安全检查完成时间的文本。
在步骤2中,知识模型由实体与实体间的关系,即语义关系构成;
实体包括区域实体、人员实体、部门实体、岗位实体、设备实体、高风险作业实体、隐患记录实体、违章记录实体和安全检查任务实体;
实体关系为各类实体间的关联关系,包括所属关系、授权关系、负责关系与参与关系。
在步骤3中,数据清洗包括对数据进行格式校验、不一致性校验、模糊数据的人工确认以及人工录入数据,通过这一系列操作发现并纠正数据中可识别的错误,处理无效值和缺失值,删除无效值并对缺失值进行补充;
结构化数据为清洗后的实体已分离的二维形式的原始文本数据;所述二维形式的原始文本数据中的一行数据表示一个实体信息;
半结构化数据为清洗后的实体未分离的文本形式的原始文本数据。
此处的原始文本数据指代步骤1采集的包含人员信息的原始文本数据以及包含区域作业的原始文本数据。
在步骤4中,知识抽取包括实体抽取、关系抽取和属性抽取;
所述实体抽取是从半结构化数据中提取原子信息元素,其包括员工姓名、部门名称、岗位名称、区域名称以及区域地理位置;一个原子信息元素即为一个实体;其提取方法包括基于特征的提取方法和神经网络方法;
所述关系抽取是采用基于监督学习的方法从半结构化数据中抽取出两个或者多个实体之间的语义关系;
所述属性抽取是指从半结构化数据中采集特定实体的属性信息。
基于特征的提取方法包括以下内容:
步骤401.1:从多种数据源中以1:4的比例随机选取部分半结构化数据并使用jieba对原始文本进行标注,得到带有词性的字符序列;
步骤401.2:将带有词性的字符序列作为分词模型的训练输入,分词模型输入数据的字符序列为
Figure 401490DEST_PATH_IMAGE001
,其对应的状态序列为
Figure 332406DEST_PATH_IMAGE002
,即分词模型所要区分的词性类型;分词模型如下:
Figure 913560DEST_PATH_IMAGE003
其中:
Figure 199792DEST_PATH_IMAGE004
为字符序列以及状态序列的条件概率,
Figure 131975DEST_PATH_IMAGE005
为特征函数,
Figure 679631DEST_PATH_IMAGE006
表示特征函数的总数,特征函数取值方法有两种:将字符序列与状态序列中的每一个词性进行比对,如果符合状态序列中的词性,则对应该状态序列位置上的
Figure 630139DEST_PATH_IMAGE005
为1,否则
Figure 870627DEST_PATH_IMAGE005
为0;
Figure 290107DEST_PATH_IMAGE007
为特征函数的权重参数;
Figure 641454DEST_PATH_IMAGE008
为文本当前的输出状态,
Figure 213512DEST_PATH_IMAGE009
为上一步输出状态;
Figure 890481DEST_PATH_IMAGE010
为当前的输入序列;
Figure 797257DEST_PATH_IMAGE011
为全局归一化因子,其计算方法为:
Figure 686716DEST_PATH_IMAGE012
当条件概率
Figure 628127DEST_PATH_IMAGE004
最大时,分词模型训练结束;
步骤401.3:将剩余的半结构化数据输入训练好的分词模型,得到分词后使用维特比算法进行序列标注得到实体信息。
神经网络方法所涉及的模型包括隐马尔可夫模型及BiLSTM模型。
关系抽取的方法包括以下内容:
步骤402.1:将从多种数据源中提取的半结构化数据中的句子和步骤401.3所得到的实体信息作为输入,对于每一个实体,按句子中各个词离实体的相对距离进行编码;
步骤402.2:将一条文本数据在n个实体处各切一刀将文本切成n+1段;
步骤402.3:将步骤402.2分割的n+1数据分别通过CNN提取特征;
步骤402.4:将提取出来的特征通过maxpooling层之后进行拼接后送入softmax层,最终得到两个或者多个实体之间语义关系的分类。
编码的方法为,对于当前需要进行编码的实体,将其的相对距离设置为0,则位于该实体前第n位的词语的相对距离为-n;位于该实体后第m位词语的相对距离为m。
步骤5包括以下内容:
步骤501: 对知识抽取中抽取得到的空值进行处理,使读取出来的空值是空字符串,将处理后的知识抽取结果和步骤3中的结构化数据进行合并,称合并结果为实体表;
步骤502: 将实体表中与人员有关的实体、语义关系以及实体属性导入图形数据库,创建人员知识图谱的实体节点及实体关系;将实体表中与区域作业有关的实体、语义关系以及实体属性导入另外一个图形数据库,创建区域作业知识图谱的实体节点及实体关系;
依据步骤2构建的知识模型,实体节点对应知识模型中的实体;实体关系对应知识模型中实体间的关联关系;构建知识图谱的过程中,实体和实体属性以节点形式存在,语义关系以连接两节点的有向边形式存在。
图形数据库包括Neo4j以及GraphDB。
在步骤6中,应用场景包括知识图谱的关联分析场景、识别预警风险场景、智能画像场景、深层关系推理场景和信息展示与推送场景;
知识图谱的关联分析场景通过把知识映射到图谱的实体节点之间形成节点之间的关联,实现从一个实体出发,寻找其各项语义及场景下的关联实例,从而构建人员相关和区域作业相关的关联关系;通过实体抽取的员工姓名得到人员节点,通过实体抽取的区域名称得到区域节点;
识别预警风险场景分为人员安全预警场景和区域风险预警场景;基于人员知识图谱和区域作业知识图谱,通过对各个人员节点和区域节点中如人员状态、区域状态属性值的实时监测,实现对人员的工作情况和作业区域的使用情况进行监控;在区域风险预警场景中,当有人员进入高风险区域时进行风险预警,对不符合区域安全权限的人员进入区域进行作业时也进行预警;
智能画像场景对电厂各项数据进行整理与分类,分别构建人员画像和区域画像,基于人员知识图谱和区域作业知识图谱,以键值对的形式,分别从图谱中提炼电厂核心人员信息和区域信息,集中对电厂核心人员信息和区域信息进行展示;
深层关系推理场景运用人员知识图谱通过员工的部门和岗位关系实现人员关系的推理,可以在事故发生的时候,找到承担责任的上级领导;该场景运用区域作业知识图谱分析目前该区域的安全情况,推理该区域需要预警的作业或活动;
信息展示与推送场景根据区域作业知识图谱中的实体节点与实体关系,在相关人员进入作业区域时,推送区域的危险风险、操作规程、安全规程、安全隐患;当人员进入该区域后,如果安全权限不够,则向区域的负责人推送预警信息。
本发明还公开了一个基于安全知识图谱构建方法的安全知识图谱构建系统,包括原始文本数据采集模块、知识模型构建模块、原始文本数据预处理模块、数据存储模块、知识抽取模块、知识图谱构建模块以及知识图谱应用模块,其特征在于:
原始文本数据采集模块采集人员信息的原始文本数据以及区域作业的原始文本数据,并将所采集到的数据输入至原始文本数据预处理模块;
知识模型构建模块根据实体与实体间的关系构建知识模型;
原始文本数据预处理模块根据知识模型构建模块构建好的知识模型对输入的原始文本数据进行分类、清洗,清洗后的数据分为结构化数据与非结构化数据并将它们存入数据存储模块中对应的数据库;
数据存储模块将结构化数据与非结构化数据存入多种数据源;
知识抽取模块从数据存储模块中读取非结构化数据,并从中进行实体抽取、关系抽取以及属性抽取,并将抽取后的结果输入至知识图谱构建模块;
知识图谱构建模块根据知识抽取模块的抽取结果以及数据存储模块中的结构化数据进行知识图谱构建,并将构建好的知识图谱输入至知识图谱应用模块;
知识图谱应用模块将知识图谱构建模块构建出的知识图谱应用于关联分析场景、识别预警风险场景、智能画像场景、深层关系推理场景和信息展示与推送场景中。
本发明在构建安全主题知识图谱的基础上,利用构建好的知识图谱进行数据分类展示、可视化分析、知识推理,进而挖掘深层关系,实现智慧搜索与智能交互。本发明中基于特征的知识抽取方法相比现有技术而言能够更准确地对实体进行抽取,本发明对实体以及句子其他词语的编码并结合CNN的方法能够更快速且准确的对关系进行抽取。本发明构建的知识图谱可以进行关联分析并挖掘出人员区域等实体之间的关联关系。其中,风险识别通过对电厂各区域的全面监控及时发现各种风险进而降低风险概率;智能画像的构建将电厂重要的公开信息加以展示,便于管理人员高效快速掌握人员、区域的情况;深层关系推理则通过知识推理、关联关系分析进行电厂深层关系的挖掘;最后数据的展示与区域手册的推送能有效地便利企业员工,提高管理与工作效率。
附图说明
图1为本发明一种面向智慧电厂的安全知识图谱构建方法的流程图。
具体实施方式
下面结合附图对本申请作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本申请的保护范围。
如图1所示,本发明一种面向智慧电厂的安全知识图谱构建方法,包括:
步骤1:采集包含人员信息的原始文本数据以及包含区域作业的原始文本数据;
人员信息的原始文本数据包括含有员工id、员工姓名、员工出生日期、员工学历、员工岗位、员工联系方式、员工所属部门、员工所属岗位、员工所属区域、员工状态的文本以及员工区域安全权限等级;
区域作业的原始文本数据包括含有区域信息、部门信息、岗位信息、设备信息、高风险作业信息、隐患记录信息、违章记录信息以及安全检查任务信息的文本;
区域信息包括区域id、区域编码、区域名称、区域状态、区域责任部门、区域负责人、区域负责人联系电话、区域创建部门、上级区域名称、风险等级以及区域描述的文本;
部门信息包括部门id、部门名称、部门人数、部门责任人、部门电话以及部门地址的文本;
岗位信息包括岗位id、岗位名称、岗位人数、岗位所属部门、岗位职责、岗位资格证、岗位学历以及岗位专业的文本;
设备信息包括设备id、设备名称、设备购买日期、设备使用年限以及设备负责人的文本;
高风险作业信息包括高风险作业id、高风险作业起止时间、高风险作业所属部门、高风险作业状态、高风险作业种类、高风险作业参与人数以及高风险作业参与人名的文本;
隐患记录信息包括针对该区域作业产生的隐患id、隐患名称、隐患类型、隐患发现时间、隐患解决时间、隐患负责部门以及隐患负责人的文本;
违章记录信息包括违章id、违章人员姓名、违章内容、违章时间、违章类型、违章负责部门以及违章负责人的文本;
安全检查任务信息包括安全检查任务id、安全检查人员姓名、安全检查任务内容、安全检查任务等级、安全检查任务状态以及安全检查完成时间的文本。
在本实施例中,每2秒采集一次数据以获得数据的实时更新。
步骤2:构建反映实体关系的知识模型;
知识模型由实体与实体间的关系,即语义关系构成;
实体包括人员实体、区域实体、部门实体、岗位实体、设备实体、高风险作业实体、隐患记录实体、违章记录实体、安全检查任务实体;
实体间的关系包括各实体之间的各类关联关系,关联关系包括所属关系、授权关系、负责关系、位于关系、完成关系、隶属关系、产生关系、管理关系、存在关系、记录关系、职掌关系、发生于关系、从事关系与监管关系、上下级关系。
在本实施例中,所属关系对应岗位实体与部门实体间的关系;授权关系对应区域实体与人员实体间的关系;负责关系对应人员实体与区域实体间的关系;位于关系对应设备实体与区域实体间的关系;完成关系对应区域实体与高风险作业实体间的关系;隶属关系对应人员实体与部门实体间的关系;产生关系对应区域实体与违章记录实体间的关系;管理关系对应人员实体与违章记录实体间的关系;存在关系对应区域实体与安全检查任务实体间的关系;记录关系对应区域实体与检查任务档案实体间的关系;职掌关系对应人员实体与隐患记录实体间的关系;发生于关系对应隐患记录实体与设备实体间的关系;从事关系对应人员实体与岗位实体间的关系;监管关系对应人员实体与高风险作业实体间的关系;上下级关系对应人员实体与人员实体间的关系。
步骤3:依据步骤2构建的知识模型,对步骤1采集的文本数据进行分类、清洗得到结构化与半结构化数据并将它们并存入多种数据源;
数据清洗包括对数据进行格式校验、不一致性校验、模糊数据的人工确认以及人工录入数据,通过这一系列操作发现并纠正数据中可识别的错误,删除无效值;
在本实施例中,清洗后的数据包括二维形式的原始文本数据以及文本形式的原始文本数据;二维形式的原始文本数据中的实体已分离,一行数据表示一个实体信息,因此无需进行知识抽取;文本形式的原始文本数据实体未分离。此处的原始文本数据指代步骤1采集的包含人员信息的原始文本数据以及包含区域作业的原始文本数据。
将清洗后的二维形式的原始文本数据以excel表或关系数据库的形式储存为结构化数据,并将清洗后的文本形式的原文本始数据以XML或JSON文件的形式储存为半结构化数据;
多种数据源包括MIS系统与数据中台。
步骤4:从步骤3的多种数据源提取所储存的半结构化数据并从中进行知识抽取;
知识抽取包括实体抽取、关系抽取和属性抽取。
实体抽取是从半结构化数据中提取原子信息元素;原子信息元素可根据不同的实际需求进行选择,在本实施例中,原子信息元素包括员工姓名、部门名称、岗位名称以及区域名称;一个原子信息元素即一个实体。
提取实体的方法主要有包括基于特征的提取方法和神经网络方法。
基于特征的提取方法包括以下内容:
步骤401.1:从多种数据源中以1:4的比例随机选取部分半结构化数据并使用jieba对原始文本进行标注,得到带有词性的字符序列;
步骤401.2:将带有词性的字符序列作为分词模型的训练输入,分词模型输入数据的字符序列为
Figure 459686DEST_PATH_IMAGE001
,其对应的状态序列为
Figure 853758DEST_PATH_IMAGE013
,即分词模型所要区分的词性类型。 分词模型如下:
Figure 546907DEST_PATH_IMAGE003
其中:
Figure 77246DEST_PATH_IMAGE004
为字符序列以及状态序列的条件概率,
Figure 578241DEST_PATH_IMAGE005
为特征函数,
Figure 459609DEST_PATH_IMAGE006
表示特征函数的总数,特征函数取值方法有两种:将字符序列与状态序列中的每一个词性进行比对,如果符合状态序列中的词性,则对应该状态序列位置上的
Figure 956450DEST_PATH_IMAGE005
为1,否则
Figure 606874DEST_PATH_IMAGE005
为0。
Figure 514656DEST_PATH_IMAGE007
为特征函数的权重参数;
Figure 148900DEST_PATH_IMAGE008
为文本当前的输出状态,
Figure 183852DEST_PATH_IMAGE009
为上一步输出状态;
Figure 954362DEST_PATH_IMAGE010
为当前的输入序列;
Figure 534510DEST_PATH_IMAGE011
为全局归一化因子,其计算方法为:
Figure 390470DEST_PATH_IMAGE012
当条件概率
Figure 229113DEST_PATH_IMAGE004
最大时,分词模型训练结束。
步骤401.3:将剩余的半结构化数据输入训练好的分词模型,得到分词后使用维特比算法进行序列标注得到实体信息。
神经网络方法可自动地从文本中对有效特征进行表示和捕获,进而完成实体识别,神经网络方法所涉及的模型包括隐马尔可夫模型及BiLSTM模型;
关系抽取是从半结构化数据中抽取出两个或者多个实体之间的语义关系,包括以下内容:
步骤402.1:将从多种数据源中提取的半结构化数据中的句子和步骤401.3所得到的实体信息作为输入,对于每一个实体,按句子中各个词离实体的相对距离进行编码。
所述编码的方法为,对于当前需要进行编码的实体,将其的相对距离设置为0,则位于该实体前第n位的词语的相对距离为-n;位于该实体后第m位词语的相对距离为m。
如针对句子“小李是化工区域的负责人”,实体为“小李”、“化工区域”以及“负责人”,则针对实体“小李”的编码为:
[0(对应“小李”),1(对应“是”),2(对应“化工区域”),3(对应”的“),4(对应”负责人“)]
针对实体“化工区域”的编码为:
[-2(对应“小李”),-1(对应“是”),0(对应“化工区域”),1(对应”的“),2(对应”负责人“)];
针对实体“负责人“的编码为:
[-4(对应“小李”),-3(对应“是”),-2(对应“化工区域”),-1(对应”的“),0(对应”负责人“)]
步骤402.2:将一条文本数据在n个实体处各切一刀将文本切成n+1段;
步骤402.3:将步骤402.2分割的n+1数据分别通过CNN提取特征;
步骤402.4:提取出来的特征通过maxpooling层之后进行拼接后送入softmax层,最终得到两个或者多个实体之间语义关系的分类。
属性抽取是从半结构化数据中采集特定实体的属性信息。
特定实体指需使用其属性信息以构建知识图谱的实体,根据所要构建知识图谱的实际情况在所提取的实体中对特定实体进行选择,在本实施例中,特定实体指得是员工姓名实体。在本实施例中,对于某个电厂员工即员工姓名实体而言,抽取的属性信息包括其员工id、出生日期、学历、员工状态以及岗位。
将实体的属性视作实体与属性值之间的一种名词性语义关系,属性抽取任务则与关系抽取任务的方法一致。
步骤5:通过步骤4得到的知识抽取数据以及步骤3的结构化数据构建人员知识图谱与区域作业知识图谱并进行存储。
人员知识图谱与区域作业知识图谱的构建包括以下内容:
步骤501: 对知识抽取中抽取得到的空值进行处理,使读取出来的空值是空字符串,将处理后的知识抽取结果和步骤3中的二维形式的原始文本数据进行合并,称合并结果为实体表;
步骤502: 将实体表中与人员有关的实体、语义关系以及实体属性导入图形数据库,创建人员知识图谱的实体节点及实体关系;
将实体表中与区域作业有关的实体、语义关系以及实体属性导入另外一个图形数据库,创建区域作业知识图谱的实体节点及实体关系;
依据步骤2构建的知识模型,实体节点对应知识模型中的实体;实体关系对应知识模型中实体间的语义关系;构建知识图谱的过程中,实体和实体属性以节点形式存在,语义关系以连接两节点的有向边形式存在。
可使用的图形数据库包括Neo4j以及GraphDB。
根据电厂现有数据的类型与规模的不同进行存储。存储方式主要包括图数据库、关系数据库和RDF三元组形式。形成所需知识图谱后将这些知识图谱存储于数据库中,提供可运维的系统,便于下一步的应用。
步骤6:将步骤5得到的人员知识图谱与区域作业知识图谱运用于不同应用场景之中。
在本实施例中,所涉及到的应用场景包括知识图谱的关联分析场景、识别预警风险场景、智能画像场景、深层关系推理场景和信息展示与推送场景。
知识图谱的关联分析场景通过把知识映射到图谱的实体节点之间形成节点之间的关联,实现快速从一个实体出发,寻找其各项语义及场景下的关联实例,从而构建人员相关和区域作业相关的关联关系;通过实体抽取的员工姓名得到人员节点,通过实体抽取的区域名称得到区域节点。
在人员知识图谱中,通过人员节点可得到其人员信息、违章记录信息和隐患记录信息,与该人员有关的部门信息、岗位信息、设备信息,以及上下级关系、授权关系、负责关系、隶属关系、管理关系、职掌关系、从事关系与监管关系。在区域作业知识图谱中,通过区域节点可以得到所有区域信息,并显示区域内的高风险作业信息、违章记录信息以及隐患记录信息。
识别预警风险场景分为人员安全预警场景和区域风险预警场景。基于人员知识图谱和区域作业知识图谱,通过对各个人员节点和区域节点中如员工状态、区域状态等的实时监测,实现对人员的工作情况和作业区域的使用情况进行监控。
在人员安全预警场景中,对人员的目前状况、作业区域风险指数进行评估,若员工状态值为“离职”、“待岗”、“停职”、“退休”,同时区域风险指数为02或03,则判定工作人员状况为“不合格”,员工状态值为“在岗”时工作人员状态为“合格”,应选派合适人员进行作业以避免事故的发生;区域风险指数分别是:01:无风险;02:低风险;03:高风险。
在区域风险预警场景中,当有人员进入高风险区域时进行风险预警,对不符合区域安全权限的人员进入区域进行作业时也进行预警;
智能画像场景对电厂各项数据进行整理与分类,分别构建人员画像和区域画像,基于人员知识图谱和区域作业知识图谱,以键值对的形式,分别从图谱中提炼电厂核心人员信息和区域信息,集中对电厂核心人员信息和区域信息进行展示。其中人员画像包括人员组织机构、个人基本信息、安全档案,区域画像包括区域责任部门、区域责任人、责任人联系方式;
深层关系推理场景运用人员知识图谱通过员工的部门和岗位关系实现人员关系的推理,人员关系主要是上下级关系,可以在事故发生的时候,快速找到承担责任的上级领导。该场景运用区域作业知识图谱分析目前该区域的安全情况,推理该区域需要预警的作业或活动;
信息展示与推送场景对区域作业知识图谱进行展示。根据区域作业知识图谱中的实体节点与实体关系,在相关人员进入作业区域时,推送区域的危险风险、操作规程、安全规程、安全隐患等信息;当人员进入该区域后,如果安全权限不够,则向区域的负责人推送预警信息等。
通过以上步骤,最终得到较优的考虑了电厂发展现状和安全管理需求的智慧电厂知识图谱系统,对电厂的智慧化管理有一定的指导意义,保障了电厂的安全生产管理。
本发明还公开了利用一个基于面向智慧电厂的安全知识图谱构建方法的安全知识图谱构建系统,包括原始文本数据采集模块、知识模型构建模块、原始文本数据预处理模块、数据存储模块、知识抽取模块、知识图谱构建模块以及知识图谱应用模块;
原始文本数据采集模块采集人员信息的原始文本数据以及区域作业的原始文本数据,并将所采集到的数据输入至原始文本数据预处理模块;
知识模型构建模块根据实体与实体间的关系构建知识模型;
原始文本数据预处理模块根据知识模型构建模块构建好的知识模型对输入的原始文本数据进行分类、清洗,清洗后的数据分为结构化数据与非结构化数据并将它们存入数据存储模块中对应的数据库;
数据存储模块将结构化数据与非结构化数据存入多种数据源;
知识抽取模块从数据存储模块中读取非结构化数据,并从中进行实体抽取、关系抽取以及属性抽取,并将抽取后的结果输入至知识图谱构建模块;
知识图谱构建模块根据知识抽取模块的抽取结果以及数据存储模块中的结构化数据进行知识图谱构建,并将构建好的知识图谱输入至知识图谱应用模块;
知识图谱应用模块将知识图谱构建模块构建出的知识图谱应用于关联分析场景、识别预警风险场景、智能画像场景、深层关系推理场景和信息展示与推送场景中。
以上所述具体实施方式仅为本发明的较佳实施例,并不用以限制本发明。本发明所属技术领域的技术人员可以对所描述的具体实施案例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。

Claims (12)

1.一种面向智慧电厂的安全知识图谱构建方法,其特征在于,所述构建方法包括以下步骤:
步骤1:采集包含人员信息的原始文本数据以及包含区域作业的原始文本数据;
步骤2:构建反映多实体关系的知识模型;
步骤3:依据步骤2构建的知识模型,对步骤1采集的文本数据进行分类、清洗得到结构化与半结构化数据并将它们存入多种数据源;
步骤4:从步骤3的多种数据源提取所储存的半结构化数据并从中进行知识抽取;
知识抽取包括实体抽取、关系抽取和属性抽取;
所述实体抽取是从半结构化数据中提取原子信息元素,其包括员工姓名、部门名称、岗位名称、区域名称以及区域地理位置;一个原子信息元素即为一个实体;
实体抽取方法包括以下内容:
步骤401.1:从多种数据源中随机选取部分半结构化数据并使用jieba对原始文本进行标注,得到带有词性的字符序列;
步骤401.2:将带有词性的字符序列作为分词模型的训练输入,分词模型输入数据的字符序列为
Figure 831151DEST_PATH_IMAGE002
,其对应的状态序列为
Figure DEST_PATH_IMAGE003
Figure 616574DEST_PATH_IMAGE004
,即分词模型所要区分的词性类型;分词模型如下:
Figure DEST_PATH_IMAGE005
其中:
Figure 368629DEST_PATH_IMAGE006
为字符序列以及状态序列的条件概率,
Figure DEST_PATH_IMAGE007
为特征函数,
Figure 145086DEST_PATH_IMAGE008
表示特征函数的总数,特征函数取值方法有两种:将字符序列与状态序列中的每一个词性进行比对,如果符合状态序列中的词性,则对应该状态序列位置上的
Figure DEST_PATH_IMAGE009
为1,否则
Figure 349803DEST_PATH_IMAGE007
为0;
Figure 17544DEST_PATH_IMAGE010
为特征函数的权重参数;
Figure DEST_PATH_IMAGE011
为文本当前的输出状态,
Figure 873374DEST_PATH_IMAGE012
为上一步输出状态;
Figure DEST_PATH_IMAGE013
为当前的输入序列;
Figure 804421DEST_PATH_IMAGE014
为全局归一化因子,其计算方法为:
Figure 978657DEST_PATH_IMAGE015
当条件概率
Figure 184510DEST_PATH_IMAGE006
最大时,分词模型训练结束;
步骤401.3:将剩余的半结构化数据输入训练好的分词模型,得到分词后使用维特比算法进行序列标注得到实体信息;
所述关系抽取是采用基于监督学习的方法从半结构化数据中抽取出两个或者多个实体之间的语义关系;
所述属性抽取是指从半结构化数据中采集特定实体的属性信息;
步骤5:通过步骤4得到的知识抽取数据以及步骤3的结构化数据构建人员知识图谱与区域作业知识图谱并进行存储;
步骤6:将步骤5得到的人员知识图谱以及区域作业知识图谱运用于不同应用场景之中。
2.根据权利要求1所述的安全知识图谱构建方法,其特征在于:
在所述步骤1中,所述人员信息的原始文本数据包括含有员工id、员工姓名、员工出生日期、员工学历、员工岗位、员工联系方式、员工所属部门、员工所属岗位、员工所属区域、员工状态的文本以及员工区域安全权限等级;
区域作业的原始文本数据包括含有区域信息、部门信息、岗位信息、设备信息、高风险作业信息、隐患记录信息、违章记录信息以及安全检查任务信息的文本;
区域信息包括区域id、区域编码、区域名称、区域状态、区域责任部门、区域负责人、区域负责人联系电话、区域创建部门、上级区域名称、风险等级以及区域描述的文本;
部门信息包括部门id、部门名称、部门人数、部门责任人、部门电话以及部门地址的文本;
岗位信息包括岗位id、岗位名称、岗位人数、岗位所属部门、岗位职责、岗位资格证、岗位学历以及岗位专业的文本;
设备信息包括设备id、设备名称、设备购买日期、设备使用年限以及设备负责人的文本;
高风险作业信息包括高风险作业id、高风险作业起止时间、高风险作业所属部门、高风险作业状态、高风险作业种类、高风险作业参与人数以及高风险作业参与人名的文本;
隐患记录信息包括针对该区域作业产生的隐患id、隐患名称、隐患类型、隐患发现时间、隐患解决时间、隐患负责部门以及隐患负责人的文本;
违章记录信息包括违章id、违章人员姓名、违章内容、违章时间、违章类型、违章负责部门以及违章负责人的文本;
安全检查任务信息包括安全检查任务id、安全检查人员姓名、安全检查任务内容、安全检查任务等级、安全检查任务状态以及安全检查完成时间的文本。
3.根据权利要求1或2所述的安全知识图谱构建方法,其特征在于:
在所述步骤2中,所述知识模型由实体与实体间的关系,即语义关系构成;
所述实体包括区域实体、人员实体、部门实体、岗位实体、设备实体、高风险作业实体、隐患记录实体、违章记录实体和安全检查任务实体;
所述实体关系为各类实体间的关联关系,包括所属关系、授权关系、负责关系与参与关系。
4.根据权利要求3所述的安全知识图谱构建方法,其特征在于:
在所述步骤3中,所述数据清洗包括对数据进行格式校验、不一致性校验、模糊数据的人工确认以及人工录入数据,通过这一系列操作发现并纠正数据中可识别的错误,处理无效值和缺失值,删除无效值并对缺失值进行补充;
所述结构化数据为清洗后的实体已分离的二维形式的原始文本数据;所述二维形式的原始文本数据中的一行数据表示一个实体信息;
所述半结构化数据为清洗后的实体未分离的文本形式的原始文本数据;
所述原始文本数据指代步骤1所采集的包含人员信息的原始文本数据以及包含区域作业的原始文本数据。
5.根据权利要求1所述的安全知识图谱构建方法,其特征在于:
在所述步骤401.1中,多种数据源中随机选取部分半结构化数据的比例值为1:4。
6.根据权利要求1所述的安全知识图谱构建方法,其特征在于:
所述实体抽取方法还可使用神经网络,所涉及的模型包括隐马尔可夫模型及BiLSTM模型。
7.根据权利要求1或6所述的安全知识图谱构建方法,其特征在于:
所述关系抽取的方法包括以下内容:
步骤402.1:将从多种数据源中提取的半结构化数据中的句子和步骤401.3所得到的实体信息作为输入,对于每一个实体,按句子中各个词离实体的相对距离进行编码;
步骤402.2:将一条文本数据在n个实体处各切一刀将文本切成n+1段;
步骤402.3:将步骤402.2分割的n+1数据分别通过CNN提取特征;
步骤402.4:将提取出来的特征通过maxpooling层之后进行拼接后送入softmax层,最终得到两个或者多个实体之间语义关系的分类。
8.根据权利要求7所述的安全知识图谱构建方法,其特征在于:
所述编码的方法为,对于当前需要进行编码的实体,将其的相对距离设置为0,则位于该实体前第n位的词语的相对距离为-n;位于该实体后第m位词语的相对距离为m。
9.根据权利要求8所述的安全知识图谱构建方法,其特征在于:
所述步骤5包括以下内容:
步骤501: 对知识抽取中抽取得到的空值进行处理,使读取出来的空值是空字符串,将处理后的知识抽取结果和步骤3中的结构化数据进行合并,称合并结果为实体表;
步骤502: 将实体表中与人员有关的实体、语义关系以及实体属性导入图形数据库,创建人员知识图谱的实体节点及实体关系;将实体表中与区域作业有关的实体、语义关系以及实体属性导入另外一个图形数据库,创建区域作业知识图谱的实体节点及实体关系;
依据步骤2构建的知识模型,实体节点对应知识模型中的实体;实体关系对应知识模型中实体间的关联关系;构建知识图谱的过程中,实体和实体属性以节点形式存在,语义关系以连接两节点的有向边形式存在。
10.根据权利要求9所述的安全知识图谱构建方法,其特征在于:
所述图形数据库包括Neo4j以及GraphDB。
11.根据权利要求9或10所述的安全知识图谱构建方法,其特征在于:
在所述步骤6中,所述应用场景包括知识图谱的关联分析场景、识别预警风险场景、智能画像场景、深层关系推理场景和信息展示与推送场景;
所述知识图谱的关联分析场景通过把知识映射到图谱的实体节点之间形成节点之间的关联,实现从一个实体出发,寻找其各项语义及场景下的关联实例,从而构建人员相关和区域作业相关的关联关系;通过实体抽取的员工姓名得到人员节点,通过实体抽取的区域名称得到区域节点;
所述识别预警风险场景分为人员安全预警场景和区域风险预警场景;基于人员知识图谱和区域作业知识图谱,通过对各个人员节点和区域节点中人员状态、区域状态属性值的实时监测,实现对人员的工作情况和作业区域的使用情况进行监控;在区域风险预警场景中,当有人员进入高风险区域时进行风险预警,对不符合区域安全权限的人员进入区域进行作业时也进行预警;
所述智能画像场景对电厂各项数据进行整理与分类,分别构建人员画像和区域画像,基于人员知识图谱和区域作业知识图谱,以键值对的形式,分别从图谱中提炼电厂核心人员信息和区域信息,集中对电厂核心人员信息和区域信息进行展示;
所述深层关系推理场景运用人员知识图谱通过员工的部门和岗位关系实现人员关系的推理,可以在事故发生的时候,找到承担责任的上级领导;该场景运用区域作业知识图谱分析目前该区域的安全情况,推理该区域需要预警的作业或活动;
所述信息展示与推送场景根据区域作业知识图谱中的实体节点与实体关系,在相关人员进入作业区域时,推送区域的危险风险、操作规程、安全规程、安全隐患;当人员进入该区域后,如果安全权限不够,则向区域的负责人推送预警信息。
12.根据权利要求1-11任意一项所述的安全知识图谱构建方法的安全知识图谱构建系统,包括原始文本数据采集模块、知识模型构建模块、原始文本数据预处理模块、数据存储模块、知识抽取模块、知识图谱构建模块以及知识图谱应用模块,其特征在于:
所述原始文本数据采集模块采集人员信息的原始文本数据以及区域作业的原始文本数据,并将所采集到的数据输入至原始文本数据预处理模块;
所述知识模型构建模块根据实体与实体间的关系构建知识模型;
所述原始文本数据预处理模块根据知识模型构建模块构建好的知识模型对输入的原始文本数据进行分类、清洗,清洗后的数据分为结构化数据与非结构化数据并将它们存入数据存储模块中对应的数据库;
所述数据存储模块将结构化数据与非结构化数据存入多种数据源;
所述知识抽取模块从数据存储模块中读取非结构化数据,并从中进行实体抽取、关系抽取以及属性抽取,并将抽取后的结果输入至知识图谱构建模块;
所述知识图谱构建模块根据知识抽取模块的抽取结果以及数据存储模块中的结构化数据进行知识图谱构建,并将构建好的知识图谱输入至知识图谱应用模块;
所述知识图谱应用模块将知识图谱构建模块构建出的知识图谱应用于关联分析场景、识别预警风险场景、智能画像场景、深层关系推理场景和信息展示与推送场景中。
CN202110683084.3A 2021-06-21 2021-06-21 一种面向智慧电厂的安全知识图谱构建方法及系统 Active CN113254594B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110683084.3A CN113254594B (zh) 2021-06-21 2021-06-21 一种面向智慧电厂的安全知识图谱构建方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110683084.3A CN113254594B (zh) 2021-06-21 2021-06-21 一种面向智慧电厂的安全知识图谱构建方法及系统

Publications (2)

Publication Number Publication Date
CN113254594A CN113254594A (zh) 2021-08-13
CN113254594B true CN113254594B (zh) 2022-01-14

Family

ID=77188839

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110683084.3A Active CN113254594B (zh) 2021-06-21 2021-06-21 一种面向智慧电厂的安全知识图谱构建方法及系统

Country Status (1)

Country Link
CN (1) CN113254594B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113823371A (zh) * 2021-09-18 2021-12-21 上海保链科技有限公司 医疗数据结构化处理方法、装置及设备
CN113836940B (zh) * 2021-09-26 2024-04-12 南方电网数字电网研究院股份有限公司 电力计量领域的知识融合方法、装置和计算机设备
CN114648419B (zh) * 2022-03-30 2022-10-21 云智慧(北京)科技有限公司 基于智慧变电站数字孪生系统知识图谱的创建和使用方法
CN114694098A (zh) * 2022-04-02 2022-07-01 四川大学 基于图像识别与知识图谱的电网基建施工风险管控方法
CN115114458B (zh) * 2022-08-29 2022-11-11 北京北投智慧城市科技有限公司 一种基于智慧建筑知识图谱的设备控制方法及系统
CN116882495B (zh) * 2023-02-27 2024-02-09 中央民族大学 一种基于动态知识图谱的前沿基因技术安全画像方法
CN116562852A (zh) * 2023-05-17 2023-08-08 国网安徽省电力有限公司黄山供电公司 基于知识图谱的配网停电信息管理系统
CN117009589B (zh) * 2023-08-03 2024-05-03 上海南洋宏优智能科技有限公司 一种基于多模态智能服务的安全检查管理方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110598203A (zh) * 2019-07-19 2019-12-20 中国人民解放军国防科技大学 一种结合词典的军事想定文书实体信息抽取方法及装置
CN110674274A (zh) * 2019-09-23 2020-01-10 中国农业大学 一种针对食品安全法规问答系统的知识图谱构建方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180159876A1 (en) * 2016-12-05 2018-06-07 International Business Machines Corporation Consolidating structured and unstructured security and threat intelligence with knowledge graphs
CN110929042B (zh) * 2019-11-26 2022-09-30 昆明能讯科技有限责任公司 一种基于电力企业的知识图谱构建和查询方法
CN111737495B (zh) * 2020-06-28 2022-12-06 福州数据技术研究院有限公司 基于领域自分类的中高端人才智能推荐系统及其方法
CN112131275B (zh) * 2020-09-23 2023-07-25 长三角信息智能创新研究院 全息城市大数据模型和知识图谱的企业画像构建方法
CN112379653B (zh) * 2020-12-01 2023-10-27 国能信控互联技术有限公司 一种基于微服务架构的智慧电厂管控系统
CN112612902B (zh) * 2020-12-23 2023-07-14 国网浙江省电力有限公司电力科学研究院 一种电网主设备的知识图谱构建方法及设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110598203A (zh) * 2019-07-19 2019-12-20 中国人民解放军国防科技大学 一种结合词典的军事想定文书实体信息抽取方法及装置
CN110674274A (zh) * 2019-09-23 2020-01-10 中国农业大学 一种针对食品安全法规问答系统的知识图谱构建方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于知识图谱的企业知识服务模型构建研究;张肃 等;《情报科学》;20200731;第38卷(第08期);68-73 *

Also Published As

Publication number Publication date
CN113254594A (zh) 2021-08-13

Similar Documents

Publication Publication Date Title
CN113254594B (zh) 一种面向智慧电厂的安全知识图谱构建方法及系统
CN115018214B (zh) 一种基于认知图谱的企业风险分析预测方法、系统和介质
CN113239130A (zh) 一种基于刑事司法文书的知识图谱的构建方法、装置和电子设备、存储介质
CN112883286A (zh) 基于bert的新冠肺炎疫情微博情感分析方法、设备、介质
KR102396771B1 (ko) 재난원인 정보 자동 추출 방법
CN113326358B (zh) 基于知识图谱语义匹配的地震灾害信息服务方法和系统
CN112084240B (zh) 一种群租房智能识别、联动治理方法及系统
CN115330268A (zh) 一种应对矿山灾难的综合性应急指挥方法及系统
CN113688169A (zh) 基于大数据分析的矿山安全隐患辨识与预警系统
Lu et al. Using cased based reasoning for automated safety risk management in construction industry
CN113268370B (zh) 一种根因告警分析方法、系统、设备及存储介质
CN110414753A (zh) 一种知识产权价值评估系统及其方法
CN115544272A (zh) 基于注意力机制的化工事故原因知识图谱构建方法
CN116205350A (zh) 基于法律文书的再犯人身危险性分析预测系统和方法
Liao et al. CBR respond and preparedness system development for environmental emergency
CN114091462B (zh) 基于案件事实混合编码面向刑事案件风险互学习评估方法
CN113688870B (zh) 一种采用混合算法的基于用户用电行为的群租房识别方法
Chen et al. Research on the construction of intelligent community emergency service platform based on convolutional neural network
CN114266472A (zh) 基于Spark的地铁站疏散风险分析方法
Nitsure et al. Unlocking new york city crime insights using relational database embeddings
Xu et al. Intelligent Exploration of Construction Accidents Based on Knowledge Graph
SAöLAM CHAPTER SEVEN ARTIFICIAL INTELLIGENCE AND DATA ANALYSIS IN DISASTERS HILAL KÜBRA SAöLAM
CN117668259B (zh) 基于知识图谱的内外规数据联动分析方法及装置
Razouk Integrating Domain Knowledge for the Analysis of Urban Blight Indicators Using NLP and Causal Data Science
Hara et al. Finding Tipping Points in Web Text Data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant